据The Information报导,微软这厢高调将GPT-4融入自家各种招牌产品里,那厢背地里却现已开端密谋Plan B,想要经过自研对话式AI(人工智能)大言语模型,来做到媲美OpenAI模型的体现。

据一名现任职工和另一位最近脱离微软的人泄漏,最近几周,领导微软1500名研讨人员的Peter Lee指示他们中的许多人开发对话式AI。这些AI可能体现不及OpenAI的大模型那么好,但胜在规划较小,运营本钱也低得多。

这些知情人士说,微软旗下搜索引擎必应(Bing)的产品组正试图将微软的自研模型整合到必应谈天(Bing Chat)中。

一位微软现任职工称,微软研讨人员正在分配他们大约2000个GPU中的大部分,用于制造更低本钱、规划更小的模型。

01.GPT-4太烧钱,微软正在拟定Plan B

微软将AI归入其软件的推动简直彻底取决于OpenAI,以交换运用其顶尖技术的权力。但跟着运转先进AI模型的本钱上升,The Information报导称,微软研讨人员和产品团队正在拟定Plan B。

跟着AI本钱的飙升,微柔和谷歌等其他大型AI开发人员正想办法从对话式AI软件和运转它的服务器芯片中省钱。此前微软现已承诺向OpenAI出资100多亿美元,部分用于获取其知识产权。

尽管有这项出资,但微软在推出OpenAI支撑的功用时依然有必要控制本钱,包括自动生成PowerPoint演示文稿、转录Teams会议以及依据客户告知他们想要查看的应用程序创立Excel电子表格的功用。假如超越10亿人最终运用这些功用,微软将不得不缩小其规划和复杂性,以防止破产。

微软还希望这样做将释放更多求过于供的AI服务器芯片资源。

尽管微软的尽力仍处于早期阶段,但这展示了微软CEO萨提亚·纳德拉(Satya Nadella)怎么为微软的AI产品开辟一条不彻底经过OpenAI运转的道路。多年来,这两家公司将保持密不可分的联络,但跟着它们越来越多地竞赛向相同的企业客户出售AI软件,它们之间的联系日益严重。

“这最终有必要发生,”企业软件公司Databricks的高管Naveen Rao在谈到微软的内部AI工作时说。

他谈道:“微软是一家智能企业公司,他们需求高效,当你布置运用这些大型类型的产品时,如(OpenAI的)GPT-4......这就像说,「我需求一个有医学博士和两个博士学位的人来接听Nerf枪支公司的客户服务热线。」这不是可行的经济学。”

02.不盼望开发GPT-4,想添加更多商洽筹码

微软的研讨小组对开发像GPT-4这样的大型AI没有梦想。该团队没有与OpenAI相同的核算资源,也没有大批人类谈论员来反应他们的大言语模型怎么答复问题,以便工程师能够改进这些问题。

不可否认,OpenAI、谷歌以及周一从亚马逊云科技(AWS)取得40亿美元出资的另一家明星大言语模型创企Anthropic,在开发先进大言语模型方面都领先于微软。

但微软可能能够以本钱的一小部分,在构建模仿OpenAI软件质量的AI模型的竞赛中竞赛,正如微软在6月份发布的一个称为Orca的内部模型时所标明的那样。

大言语模型是ChatGPT等对话式AI的基础。关于微软来说,在没有OpenAI直接协助的情况下开发高质量的大言语模型,能够在公司讨论在未来几年更新协作同伴联系时为其供给更多的商洽筹码。

现在的买卖似乎是互惠互利的:作为对OpenAI资金的回报,微软取得了永久运用OpenAI在微软产品中现有知识产权的独家权力。在归还初始出资之前,它还取得OpenAI理论运营赢利的75%,并在到达必定上限之前取得49%的赢利。

微软盼望其与OpenAI以及其他AI企业的现有联盟,在未指定时期内添加至少100亿美元的新收入。Office 365生产力应用程序中新的AI功用出现了收入牵引的早期痕迹。其云核算竞赛对手AWS的至少一个主要客户在Azure OpenAI云服务上花费了大量资金。微软还在7月泄漏称,超越27000家公司现已为代码编程东西GitHub Copilot支付了费用,该东西由OpenAI软件供给支撑。

不过,纳德拉或微软研讨主管的任何愿望,在没有OpenAI的情况下开发复杂的AI,都可能是一厢情愿的想法。

自从竭尽全力地运用OpenAI以来,微软的研讨部门在很大程度上被降级为调整OpenAI的模型以用于微软产品,而不是开发自己的模型。曩昔一年,跟着几波研讨人员的脱离,以及一些人进入微软内部产品团队,该部门失去了一些人才。

03.投入上千块GPU‍,开发更低本钱的“精简”模型

但在OpenAI的暗影下呆了一年后,一些微软研讨人员发现了一个新的目的:制造AI工程师所谓的“精简(distilled)”模型,这些模型模仿GPT-4等大型模型,但规划更小,操作本钱低得多。

挖苦的是,微软与OpenAI的买卖条款,正在协助微软尽力打破对OpenAI的依赖。当微软客户运用必应谈天机器人时,微软能够对OpenAI模型发生的成果拥有独特的访问权限。

微软现在正在运用这些数据来创立更小的模型。其研讨人员发现,这些模型能够用更少的核算资源发生相似的成果。谷歌、Databricks等许多其他AI开发人员也专心于开发更小的模型来处理特定使命。

为了创立其Orca模型,微软研讨人员将GPT-4发生的数百万个答案输入一个更根本的开源模型,以教它模仿GPT-4。

最终,研讨人员表明,Orca模型在一系列使命上的体现,比他们练习的开源模型根本版Meta Llama 2要好得多,简直和GPT-4一样,例如解说怎么解决数学问题或总结会议记录。

他们称,在某些情况下,Orca与OpenAI的ChatGPT的免费版一样好。Orca能够用不到GPT-4运用的1/10的核算能力做到这一点。

在本月宣布的另一篇论文中,微软研讨人员公布了Phi,他们彻底依据“教科书质量”信息对其进行了练习。Phi的参数量不到GPT-4参数量的1%。研讨标明,由于高质量的练习数据,Phi在数学和逻辑问题上通晓的开源模型是其规划的5倍

现在还不清楚像Orca和Phi这样的精简模型在长期内是否有用,微软之外的研讨人员剧烈争辩,这些论文是否真的证明了较小的精简模型以任何办法与GPT-4等更大的先进模型具有可比性。但他们的本钱优势给了微软一个继续前进的动力。

一位微软现任职工说,在公布Phi后,Peter Lee本月早些时候告知职工,验证此类模型的质量将是团队的首要使命。他还谈道,研讨人员正在分配他们大约2000个GPU中的大部分,用于制造精简模型。

当然了,与微软供给给OpenAI的核算资源相比,这点芯片集群规划能够说是微乎其微。

一篇即将宣布的论文将要点重视一种被称为对比学习的办法,其中工程师教授模型以区分高质量和低质量的呼应,怎么改进Orca。这个人谈道,其他微软研讨人员正在开发一个能够解说和生成图文的多模态大言语模型。

微柔和OpenAI的发言人拒肯定这篇论文宣布谈论,微软不会让Lee或Orca背后的研讨人员承受采访。

像Orca和Phi这样的模型能够协助微软降低与它为客户供给的AI功用相关的核算本钱。一位现任职工称,微软产品司理现已在测验怎么处理一些用户的必应谈天机器人对Orca和Phi的查询,而不是运用OpenAI的模型。这些办法包括运用更简单的查询来总结小段文本或答复是或否的问题,不需求多步推理的更长查询。

微软还在权衡是否向Azure云客户供给Orca版别。对它的需求可能现已完成了。

据知情人士泄漏,在微软发布Orca论文后,微软研讨院的司理告知同事,一些Azure客户询问了他们何时能够运用它。鉴于Meta对公司将其开源大言语模型商业化的约束,现在还不清楚微软是否需求Meta的许可。

04.结语:微软与OpenAI裂缝渐显,正积极接收其他大模型同伴

华盛顿大学教授、向AI开发人员销售软件的Snorkel AI的联合创始人Alex Ratner谈道:“越来越多的企业正在运转小模型。”GPT-4是“吸引眼球的东西,能够作为你开端的基础......但当涉及到微软为其产品供给动力所需的专业用例时,咱们将继续看到这种多样化。”

微软还经过Azure供给其他大言语模型,包括Meta的Llama 2,对冲了对OpenAI的赌注。据The Information此前报导,微软正在与Databricks协作,向Azure客户销售软件,以便他们能够运用开源大言语模型而不是OpenAI的闭源应用程序来构建应用程序。

此时快讯

【CZ:根本原因是一些新代码造成的,预计2小时解决】金色财经报道,CZ表示,BTCUSDT合约插针根本原因已确定,是一些新代码造成的。需要恢复和修复数据。工程师表示预计1小时即可修复。所以预计2小时左右能恢复正常。这是一个显示问题。交易不受影响。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注