双子座人工智能

双子座人工智能
Gemini AI

原始链接: https://deepmind.google/technologies/gemini/

双子座时代简介：人工智能如何改善日常生活的革命性飞跃 Gemini 是 DeepMind（Alphabet Inc. 谷歌母公司旗下的子公司）的最新产品，彻底改变了人工智能如何帮助改善日常生活。 Gemini 在理解涉及文本、图像、视频、音频甚至代码等各种模式的复杂场景的能力方面取得了相当大的进步。其综合性使其具有独特的优势，能够以传统方法无法达到的精度提供解决方案。凭借 coT@32* 等先进技术，Gemini 现在拥有世界上最好的语言模型的称号，在大规模多用途多测试学习 (mmlu) 方面显着优于人类专家。它还通过展示对多个基准的掌握而树立了杰出的榜样，包括自然语言推理、一般交换任务、数学测验、信息图表和文档。此外，Gemini 在多语言语音翻译和自动语音识别测试方面都提供了令人印象深刻的结果。这些成果均经过全球顶尖研究机构的内部评估和第三方评估工作的独立验证。 Gemini 通过其在多种格式上有效集成和运营的内在能力提供了独特的销售主张。 Gemini 的多模式特性允许用户将图像或视频与语言数据结合起来，从而能够生成创新概念，而以前需要相互依赖的团队之间进行繁琐的协作。此外，通过选择任何格式作为输入并使用宝石作为输出，Gemini 提供了无与伦比的效率和灵活性，允许多种现实世界的实现，同时还确保资源限制保持在可接受的范围内。受 Starling Murmurations 的启发，Gemini 通过自动化算法实现编码，生成根据特定要求精确定制的输出。同时，凭借处理整张音乐作品的能力，双子座可以进行创造性的解释和概念化，为未来的努力制定新的视角。由于其在处理和传达外语听力图含义方面的卓越能力，双子座可以为有抱负的艺术家寻找灵感提供批判性的指导和方向，增强他们构思新颖的作曲框架和激发原创旋律的能力。双子座背后的团队

根据关于 Gemini 和 Bard 的讨论，您能否总结一下这两种工具之间的主要区别，并强调与传统语言模型相比的优点或缺点？

Image

Multi-discipline college-level reasoning problems

59.4%0-shot pass@1
Gemini Ultra (pixel only*)

56.8%0-shot pass@1
GPT-4V

Natural image understanding

77.8%0-shot
Gemini Ultra (pixel only*)

77.2%0-shot
GPT-4V

OCR on natural images

82.3%0-shot
Gemini Ultra (pixel only*)

78%0-shot
GPT-4V

Document understanding

90.9%0-shot
Gemini Ultra (pixel only*)

88.4%0-shot
GPT-4V (pixel only)

Infographic understanding

80.3%0-shot
Gemini Ultra (pixel only*)

75.1%0-shot
GPT-4V (pixel only)

Mathematical reasoning in visual contexts

53%0-shot
Gemini Ultra (pixel only*)

49.9%0-shot
GPT-4V

Video

English video captioning
(CIDEr)

62.74-shot
Gemini Ultra

564-shot
DeepMind Flamingo

Video question answering

54.7%0-shot
Gemini Ultra

46.3%0-shot
SeViLA

Audio

Automatic speech translation
(BLEU score)

40.1Gemini Pro

29.1Whisper v2

Automatic speech recognition
(based on word error rate, lower is better)

7.6%Gemini Pro

17.6%Whisper v3

双子座人工智能 Gemini AI

双子座人工智能
Gemini AI