Nvidia、Hugging Face 和 ServiceNow 正在通过 StarCoder2(一个新的敞开拜访大型语言模型 (LLM) 系列)推动 AI 代码生成的规范。

这些模型现已供给三种不同的规划,已经接受了 600 多种编程语言(包含低资源语言)的培训,以协助企业加快其开发作业流程中的各种与代码相关的使命。

它们是在敞开的 BigCode 项目下开发的,该项目是 ServiceNow 和 Hugging Face 的共同努力,旨在保证负责任地开发和运用大型代码语言模型。

它们依据敞开负责任的人工智能许可证 (OpenRAIL) 免版税供给。

“StarCoder2 证明了敞开科学合作和负责任的人工智能实践与道德数据供应链的归纳力量。

最先进的敞开拜访模型改进了先前的生成式人工智能功能,以提高开发人员的作业功率,并使开发人员可以平等地享用代码生成人工智能的优点,然后使任何规划的组织都能更轻松地满意其全部事务需求ServiceNow 的 StarCoder2 开发团队负责人兼 BigCode 联合负责人 Harm de Vries 在一份声明中表明。

StarCoder2:三种模型满意三种不同需求

尽管 BigCode 开始的 StarCoder LLM 以一种 15B 参数巨细初次亮相,并接受了大约 80 种编程语言的练习,但最新一代的模型超越了它,具有三种不同巨细(3B、7B 和 15B)的模型,并接受了 619 种编程语言的练习。

据 BigCode 称,新模型的练习数据(称为 The Stack)比前次运用的数据大七倍多。

更重要的是,BigCode 社区为最新一代运用了新的练习技术,以保证模型可以了解并生成 COBOL、数学和程序源代码评论等低资源编程语言。

最小的 30 亿参数模型是运用 ServiceNow 的 Fast LLM 结构进行练习的,而 7B 模型是运用 Hugging Face 的 nanotron 结构开发的。

两者都旨在供给高功能的文本到代码和文本到作业流生成,一起需求更少的核算。

与此一起,最大的 150 亿参数模型已运用端到端 Nvidia NeMo 云原生结构和 Nvidia TensorRT-LLM 软件进行了练习和优化。

尽管这些模型在不同编码场景中的表现怎么还有待观察,但这些公司的确注意到,最小的 3B 模型的功能与原始 15B StarCoder LLM 的功能相当。

依据需求,企业团队可以运用这些模型中的任何一个,并依据不同用例的组织数据进一步微调它们。

这可以是从应用程序源代码生成、作业流生成和文本摘要等专门使命到代码完结、高档代码摘要和代码片段检索的任何使命。

两家公司强调,这些模型通过更广泛、更深化的练习,供给存储库上下文,然后完成精确和上下文感知的猜测。

最终,一切这些都为加快开发铺平了道路,一起节省了工程师和开发人员的时间来专注于更关键的使命。

Nvidia 应用研究副总裁乔纳森·科恩 (Jonathan Cohen) 在新闻声明中表明:“由于每个软件生态系统都有专有的编程语言,因而代码法学硕士可以推动每个职业在功率和立异方面取得打破。”

“Nvidia 与 ServiceNow 和 Hugging Face 的合作引入了安全、负责任地开发的模型,并支撑更广泛地运用负责任的生成式人工智能,我们希望这将使全球社区获益,”他弥补道。

怎么开始运用 StarCoder2?

如前所述,StarCoder2 系列中的一切型号均在 Open RAIL-M 许可下供给,可免版税拜访和运用。

支撑代码可在 BigCode 项目的 GitHub 存储库中找到。

作为替代计划,团队还可以下载并运用 Hugging Face 的一切三个模型。

也就是说,由 Nvidia 练习的 15B 模型也将出现在 Nvidia AI Foundation 上,使开发人员可以直接从浏览器或通过 API 端点进行实验。

尽管 StarCoder 并不是人工智能驱动的代码生成领域的第一个进入者,但该项目最新一代带来的多种选项无疑使企业可以在应用程序开发中使用法学硕士,一起节省核算资源。

该领域的其他著名参与者包含 OpenAI 和亚马逊。

前者供给 Codex,为 GitHub 副驾驶服务供给支撑,而后者则供给 CodeWhisper 东西。

还有来自 Replit 和 Codenium 的激烈竞赛,Replit 在 Hugging Face 上拥有一些小型人工智能编码模型,Codenium 最近以 5 亿美元的估值获得了 6500 万美元的 B 轮融资。

此时快讯

【Gemini:Earn用户有望在两个月内收到约97%的实物资产】金色财经报道,Gemini信托发文称,今天,我们很高兴地宣布,我们终于与Genesis和Genesis破产案中的其他债权人达成原则和解,如果破产法院批准,所有Earn用户将获得100%的数字资产以实物方式返还。这意味着,例如,如果您在赚取计划中借出了一枚比特币,那么您将在本次结算中收到一枚比特币。这意味着自从您将资产借入赚取计划以来,您将获得资产的全部增值。如果获得批准,我们将返还超过18亿美元的价值(按今天的价格计算),比2022年11月16日Genesis停止提款时多出7亿美元。
展望未来,如果破产法院原则上批准今天宣布的和解方案,Earn用户可以预计在大约两个月内收到大约97%的实物资产。有望在未来12个月内收到剩余的资产。
原则上,和解以最终文件为准。所需的破产法庭程序可能需要长达两个月的时间才能完成,我们将在此过程中随时向Earn用户通报情况。Gemini感谢纽约金融服务部 (DFS) 在此次和解中发挥的作用,为Earn用户提供了币对币的追偿。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注