试用谷歌的Gemini之后我只想说GPT-4有点菜

2024-03-05

  今日清晨,在 AI 范畴沉寂良久的谷歌,总算有了大动作,推出了最新的人工智能模型 Gemini( 双子座 )。

  这个被谷歌称为尖端规划、才干最强的人工智能模型,假如只看官方的演示视频,那确实是杀手等级的强。

  在视频中,Gemini 不只秒辨认演示者画的画、放的视频、做的戏法小把戏,并且整一个完好的过程中对答如流,各种语气助词熟练得飞起。

  这次发布的 Gemini 其实是一个家族式大模型,分别是 Gemini Nano、Gemini Pro 和 Gemini Ultra,三种模型将应用于各种不同场景,才干顺次增强,能够了解成 “ 移动版 ”、“ 家庭版 ”、“ 企业版 ”。

  从官方放出的数据剖析来看,尽管每个版别都有自己适宜的环境,但不同版别间,功能仍是有着显着差异的。

  乃至在 MMLU( 大规划多任务言语了解 )测验里,Gemini Ultra 逾越 GPT-4 还不行,还逾越了人类专家,成为了第一个在该方面逾越人类的模型。

  除了在惯例才干上的全面逾越 GPT-4,Gemini 最特别的一点是,它是谷歌带来的首个多模态大模型,也便是能不光能打字互动,也能进行语音、视频、图片的互动。

  依照谷歌的说法,现有的所谓多模态大模型,都是独自练习了文本、视觉和音频等模型,再把这几个拼接起来。

  这样出来的“ 散装 ”多模态大模型,在遇到图片、文字、语音或许视频一同出现时,只会分解出不同模块各自答复,然后汇总每个部分的答复最终构成答案。

  而 Gemini 从根上便是个多模态模型,然后又经过很多多模态数据练习,它能够一开始就同步了解多模态。

  这就比方遇到一个中日韩英稠浊的旅游团,以往都是找懂对应言语的导游组成导游团去带队。

  而 Gemini 的做法是找了一个知晓中日韩英四门言语的导游,一个人就能无缝组织一切游客。

  不过,Gemini 也在网上招来不少质疑。比方有人吐槽分明 90.0% 和 89.8% 就差了千分之二,成果图里看起来像是巨大提高。并且,很多人发现,谷歌用了不止一次这样的 “ 春秋办法 ”。

  比方,Gemini Ultra 和 GPT-4 运用的测验办法并不相同,却放在一同比:

  假如换成相同的规范,那他的得分是 83.7,还不如 GPT-4 的 86.4。

  所以,详细强不强,可能要实测才干给出中肯的答案。 Gemini 的 Pro 版别模型现已集成在谷歌的 Bard 里了,下面咱们就来实践试一试。

  首先要阐明的是,因为 Gemini 官方表明现在 Bard 搭载的 Gemini 仅支撑英语,所以咱们都会选用英语来测验,一同这次主打的是 “ 多模态 ”,所以咱们首要测验多模态场景( 文字+图片 )。

  咱们先给它发了一张长城的相片曩昔,它立刻给出了精准答案,乃至能说出是其间哪一段:

  而 GPT-4 这边,却有点底气不足,只给了个长城的答案,至所以哪段,它没详细说,介绍的也不多。

  随后,咱们又给了一张车的图片,让他们猜猜车,他们都给出了正确答案:雪佛兰科尔维特。

  不过,细节上仍是搭载了 Gemini Pro 的 Bard 要稍稍详尽些,发动机的类型、马力以及起步状况都写出来了,咱们查了下也都对的上,没胡言乱语。

  Bard 不只读出了人们厌烦周一的意思,还认出了这是 2012 年火的一只网红猫:

  咱们又从美国财政部的官网随意找了张柱状图丢给它们,看看它们能读出多少信息。

  这块儿,Bard 和 GPT-4 也是难分手足,给出的信息点大差不差,都精确读出了美国会加大对低一级基础设施州的出资力度。

  但,你要理解,Bard 是免费的,而 GPT-4 是收费的,免费版能跟收费版不相手足乃至偶然体现更好,仍是很香的。

  最终,咱们还拿出了 “ 大模型的噩梦 ”,也便是数学题,来对他们进行测验。

  Bard 很简单明晰地判别出了三角形 ABO 是等边三角形,得到角 ABO 是 60° 的正确答案:

  总的来讲,结合才干强弱和付费与否,在 Gemini Pro 面前,GPT-4 显得有一点菜了。

  而在几天之后的 13 号,开发者和企业用户,也将直接能够调用 Gemini Pro 的 API 了。

  在接下来的几个月中,Gemini 还会相继与谷歌的查找、广告、Chrome 等服务和产品结合。

  谷歌的 AI 从遥遥领先,到沦为 OpenAI 追逐者的故事,一度成了科技圈的 “ 伤仲永 ”,被我们当成了典型。

  究竟,不要忘了,当年奥特曼、马斯克等人兴办 OpenAI 的意图之一,就为了打破谷歌在 AI 范畴的独占。

  乃至,“ GPT ” 中的 “ T ”,也便是 Transformer,最早也是谷歌团队提出来的。

  祖师爷一发力,或许谁也招架不住,Open AI 的神坛,看起来也不一定安定。