一个GPT的幽灵在Gemini上空徘徊

币圈资讯 1 年前 7.0K

首码项目微信群，加微信：WX-93588 （加微信时备注散户/团队长）⬅️此处为全站广告位，与正文项目无关
注册并登录App即可领取高达 60,000 元的数字货币盲盒：点击此处注册OKX

作者：骆轶航

每次Google在生成式人工智能范畴祭出大招，都能让人感到一种隐秘且巨大的情绪力量：隐忍、不甘与比赛。
在5月的Google I/O上，Google发布PaLM系列模型，即被视为是对彼时风头正盛的GPT-4的微弱挑战。年末毫无预警地祭出Gemini系列大言语模型（包含移动版Nano、基础版Pro和高级版Ultra），在要害功用和基准评测指标上针对GPT的意图愈加直接。
Google官方声称：在被大型言语模型研讨和开发广泛运用的 32 项学术基准中，Gemini Ultra 的功用有 30 项逾越了现在GPT–4代表的最先进水平。Gemini标榜“原生多模态”，这让它一开端就在文本、图画、音频、视频和代码等组合模态上进行预练习，故而可能在杂乱理解和推理方面有更强表现，特别是处理数学和物理问题。
Google不遗余力地强调上述优势——OpenAI走的是“渐进式多模态”的路，先根据文本语料，代码跟进，再图画视频音频，最后把这些才干组合在一同练习。而Gemini从一开端就在多模态语料上练习，再用多模态数据调优，比OpenAI练习GPT的办法“先进”一些。
“先进”的多模态练习，理论上能带来更微弱的功用。发布的Gemini Ultra学术基准评测成果大面积逾越GPT-4的细节似可说明。但学术基准测验本身便是理论的一部分，并不能真实表现使用的效果。不少人挤兑我国一些大言语模型热衷于基准测验“刷分”，咱们该天公地道，Google的做法与国内大模型冲着逾越GPT刷分，本质上没有什么不同。
现在交际渠道X上实测Gemini Pro（Bard谈天机器人现在只支持Pro版）的用户现已贡献了不少吐槽。比如它混杂了2023年和2022年的奥斯卡奖获得者，也不会用Python写入两个多边形的交集这种简略函数。咱们还发现它识别不出叶子的数量，以及做不对简略的求锐角几何题。即便Gemini Pro对标的是GPT-3.5，它也仍是差了点意思。
被人们指出的另一个突出问题是Gemini的宣传视频“造假”：Gemini Ultra对一组手势动作很快做出反响，说这是一个石头剪子布的游戏，但它未被视频显示的功用文档却给出了至少两条提示：“我在做什么？”，“提示，这是一个游戏”。其它的一些测验甚至需求更多的提示问题辅助生成成果，但这个进程在Gemini的官方视频里被省略掉了。以至于大多数不太较真的人高估Gemini的理解才干和反响速度，这不能不说是个误导。
我到现在都记住2017年我在Google I/O的现场，台上的Google员工演示怎样通过Google Assistant语音帮手直接预定一家餐厅，下面掌声雷动，我也跟着拍巴掌，觉得太棒了。但一个月后即传出这是一个事先准备好的桥段。Google没有造假，但它一般太期望展现其AI才干的无与伦比，太急切地出现自己的AI乐观主义，以至于常常缩略出现了背后的进程，也就现实上夸大了效果。
说白了，Gemini视频的夸大出现，仅仅说明Google太在意Gemini比GPT强了。它很着急，加上人们对任何跟ChatGPT较劲的任何大模型，特别是巨头的“杰作”，一般都比较严苛。当然，人们对Google是最严苛的——究竟OpenAI挑选用Google发明的Transformer架构搞出了划时代的GPT模型，动机之一便是脱节Google无所不在的AI压制，那谁还不期望看见Google露怯呢。
某种程度上，Google是OpenAI在这个星球上唯一的孪生。包括Meta的LLamA架构都是开源的，以马斯克老师对开源的偏心，Grok未来大概率也得开源。我国的大言语模型也在不同程度上都走了开源道路。只有OpenAI和Google是坚决闭源的，这就让Google在大言语模型上的进展，本能地与OpenAI形成了强绑定关系。
还有一个戏剧性的张力：每次OpenAI有环绕GPT的大动作，言论都会喊Google出来挨一回落后就要挨的打。然后Google差不多必定会在OpenAI出招之后的一到两个月，祭出一个新的大招，证明一下你大爷仍是你大爷。然后再憋几个月，OpenAI再出招，Google再被喊出来挨揍。格式真就会因而改变么？
某种程度看，Google在生态建设上仍是比OpenAI落后了一个身位。究竟这个世界上现已有几百万个开发者自己做的GPTs了。而Google最早要到明年初才干向开发者和企业客户提供强化练习反馈后的Gemini Ultra，让人们在上面开发自己的使用。到那时恐怕GPT Store都现已正式推出来了。我一向有点困惑，Google当年难道不是靠Android的开源夺得苹果半壁河山的么？这次怎样把这个角色让给Meta了？
我真的不是要怪Google，我更期待Google证明自己。咱们这群在1990年代末接触互联网的人，对Google是有一些很微妙的特殊感情的。而Google也必须证明自己的AI First战略能结出真实的果实。仅仅GPT的鬼魂在Google徜徉，是一个现实。谁都可以试图脱节这个鬼魂，唯独Google不可，这是它无可挑选的对手。
其实Google今日环绕Gemini所做的全部，某种程度上能让咱们我国的大言语模型开发者心有共鸣：咱们的头顶上都徜徉着GPT的鬼魂，这就让咱们都试图通过某些尽力，证明自己在某些方面比GPT做得更好。
Google在Gemini基准测验中采用了全部小“技巧”（采用更杂乱的思想链提示和成果选优，而测验GPT只用5次反馈且无提示词）获得了碾压GPT的成绩，类似的测验办法咱们是不是听起来很了解？我国的大言语模型研发者有没有一种老乡见到了老乡的戚戚然的感觉？
咱们常常喜爱将智谱、百度和Minimax的尽力与OpenAI做对比，但换一个思路，其实大言语模型的比赛，何尝不是百度、智谱、Minimax、Google、Meta、Anthropic和Grox们一同在围攻OpenAI的光明顶？从这个意义上，我国大模型和美国除OpenAI之外的大模型在一个阵营一个壕沟里，是报团也是互相学习的对象。大模型的百草咱们这些神农尝多了，就发现咱们我国的大模型不是比美国的大模型差，仅仅不如ChatGPT，就这样。
Google这次练习Gemini另一个值得圈点的地方，是它彻底采用了自家的芯片集群——TPU进行的练习。Google官宣TPUs v4和 v5e在通过AI优化过的基础设施上完成了这一大规模练习，可扩展性强且推理最高效。这恐怕是咱们听说的一款功用还算微弱的大言语模型，不依赖英伟达的算力和软硬件架构而修成正果的。当然人家TPU是自产自销的，但我看到了“替代英伟达”这件事在大模型练习实操上的可能性和可行性。这对我国的大言语模型练习意味着什么，不言自明。
此外，Gemini Nano也是一个亮点，这是一款尺度最小的Gemini模型，优先用于G家自产的Pixel 8手机上。“端侧大模型”是近期的一个论题，其实它更挨近“小模型”。我国智能手机厂商OPPO、vivo和小米近期都有发布自己的端侧模型，联想则从AI PC的维度也切进了现实上的同一个范畴。这次Google加入了这个阵营，应该是一个信号，这件事值得尽力，有的做。
其实很奇特。从Google这次Gemini模型的发布，我看到了Google与一众咱们了解的我国大言语模型开发者同样的境遇和尽力：那种隐忍、不甘和比赛，那种偶然展露的在一些基准测验要害指标上跟OpenAI较劲的小手法和小心思，那些试图树立自己生态的稳扎稳打，那种试图脱节英伟达算力的测验，以及根据移动优势在端侧模型的尽力……面临OpenAI，咱们都是一样的。
一个GPT的鬼魂，在Gemini的上空徜徉，也在咱们每一个我国大言语模型的上空徜徉。