产品资讯

试用谷歌的Gemini之后我只想说GPT-4有点菜

2024-03-05

　　今日清晨，在 AI 范畴沉寂良久的谷歌，总算有了大动作，推出了最新的人工智能模型 Gemini（双子座）。

　　这个被谷歌称为尖端规划、才干最强的人工智能模型，假如只看官方的演示视频，那确实是杀手等级的强。

　　在视频中，Gemini 不只秒辨认演示者画的画、放的视频、做的戏法小把戏，并且整一个完好的过程中对答如流，各种语气助词熟练得飞起。

　　这次发布的 Gemini 其实是一个家族式大模型，分别是 Gemini Nano、Gemini Pro 和 Gemini Ultra，三种模型将应用于各种不同场景，才干顺次增强，能够了解成 “ 移动版 ”、“ 家庭版 ”、“ 企业版 ”。

　　从官方放出的数据剖析来看，尽管每个版别都有自己适宜的环境，但不同版别间，功能仍是有着显着差异的。

　　乃至在 MMLU（大规划多任务言语了解）测验里，Gemini Ultra 逾越 GPT-4 还不行，还逾越了人类专家，成为了第一个在该方面逾越人类的模型。

　　除了在惯例才干上的全面逾越 GPT-4，Gemini 最特别的一点是，它是谷歌带来的首个多模态大模型，也便是能不光能打字互动，也能进行语音、视频、图片的互动。

　　依照谷歌的说法，现有的所谓多模态大模型，都是独自练习了文本、视觉和音频等模型，再把这几个拼接起来。

　　这样出来的“ 散装 ”多模态大模型，在遇到图片、文字、语音或许视频一同出现时，只会分解出不同模块各自答复，然后汇总每个部分的答复最终构成答案。

　　而 Gemini 从根上便是个多模态模型，然后又经过很多多模态数据练习，它能够一开始就同步了解多模态。

　　这就比方遇到一个中日韩英稠浊的旅游团，以往都是找懂对应言语的导游组成导游团去带队。

　　而 Gemini 的做法是找了一个知晓中日韩英四门言语的导游，一个人就能无缝组织一切游客。

　　不过，Gemini 也在网上招来不少质疑。比方有人吐槽分明 90.0% 和 89.8% 就差了千分之二，成果图里看起来像是巨大提高。并且，很多人发现，谷歌用了不止一次这样的 “ 春秋办法 ”。

　　比方，Gemini Ultra 和 GPT-4 运用的测验办法并不相同，却放在一同比：

　　假如换成相同的规范，那他的得分是 83.7，还不如 GPT-4 的 86.4。

　　所以，详细强不强，可能要实测才干给出中肯的答案。 Gemini 的 Pro 版别模型现已集成在谷歌的 Bard 里了，下面咱们就来实践试一试。

　　首先要阐明的是，因为 Gemini 官方表明现在 Bard 搭载的 Gemini 仅支撑英语，所以咱们都会选用英语来测验，一同这次主打的是 “ 多模态 ”，所以咱们首要测验多模态场景（文字+图片）。

　　咱们先给它发了一张长城的相片曩昔，它立刻给出了精准答案，乃至能说出是其间哪一段：

　　而 GPT-4 这边，却有点底气不足，只给了个长城的答案，至所以哪段，它没详细说，介绍的也不多。

　　随后，咱们又给了一张车的图片，让他们猜猜车，他们都给出了正确答案：雪佛兰科尔维特。

　　不过，细节上仍是搭载了 Gemini Pro 的 Bard 要稍稍详尽些，发动机的类型、马力以及起步状况都写出来了，咱们查了下也都对的上，没胡言乱语。

　　Bard 不只读出了人们厌烦周一的意思，还认出了这是 2012 年火的一只网红猫：

　　咱们又从美国财政部的官网随意找了张柱状图丢给它们，看看它们能读出多少信息。

　　这块儿，Bard 和 GPT-4 也是难分手足，给出的信息点大差不差，都精确读出了美国会加大对低一级基础设施州的出资力度。

　　但，你要理解，Bard 是免费的，而 GPT-4 是收费的，免费版能跟收费版不相手足乃至偶然体现更好，仍是很香的。

　　最终，咱们还拿出了 “ 大模型的噩梦 ”，也便是数学题，来对他们进行测验。

　　Bard 很简单明晰地判别出了三角形 ABO 是等边三角形，得到角 ABO 是 60° 的正确答案：

　　总的来讲，结合才干强弱和付费与否，在 Gemini Pro 面前，GPT-4 显得有一点菜了。

　　而在几天之后的 13 号，开发者和企业用户，也将直接能够调用 Gemini Pro 的 API 了。

　　在接下来的几个月中，Gemini 还会相继与谷歌的查找、广告、Chrome 等服务和产品结合。

　　谷歌的 AI 从遥遥领先，到沦为 OpenAI 追逐者的故事，一度成了科技圈的 “ 伤仲永 ”，被我们当成了典型。

　　究竟，不要忘了，当年奥特曼、马斯克等人兴办 OpenAI 的意图之一，就为了打破谷歌在 AI 范畴的独占。

　　乃至，“ GPT ” 中的 “ T ”，也便是 Transformer，最早也是谷歌团队提出来的。

　　祖师爷一发力，或许谁也招架不住，Open AI 的神坛，看起来也不一定安定。

以下内容你可能感兴趣