作者:Chao Wang 来历:Future Mosaic 翻译:善欧巴,金色财经
纵观科技史,严重打破往往独立产生,每一项打破都会引发一场革命。但是,当两种强大的技能交融在一起时,它们的协同作用可以催化非凡的前进。今日,咱们正站在这样一个十字路口:人工智能和加密钱银,本身就具有革新性,正在联手。
咱们想象加密处理计划将处理众多人工智能应战,人工智能署理将构建自治经济网络以加速加密的选用,人工智能将推进现有加密技能的演化。许多人的目光都会集在这个交叉点上,大量资金涌入,这些热词的热情助长了这一趋势。
但是,在一切这些令人兴奋的工作中,咱们对根底常识的了解却少得不幸。人工智能对加密的了解程度到底有多高?由 LLM 驱动的署理是否真的可以运用加密东西?不同的模型在加密使命中的体现怎么?这些问题的答案关于辅导这一新式范畴的产品和技能方向至关重要。
但咱们不知道。
一个试验
针对这些根底问题,咱们进行了试验评价,评价了包括主流商业和开源模型在内的 18 个大型语言模型,参数规划从 3.8B 到 405B。
闭源模型:GPT-4o、GPT-4o Mini、Claude 3.5 Sonnet、Gemini 1.5 Pro、Grok2 beta(目前为闭源)
开源模型:Llama 3.1 8B/70B/405B、Mistral Nemo 12B、DeepSeek-coder-v2、Nous-hermes2、Phi3 3.8B/14B、Gemma2 9B/27B、Command-R、Qwen2-math-72、MathΣtral
该研讨旨在评价人工智能加密运用的现状,并评价人工智能与加密集成的潜力和应战。鉴于这项研讨还处于前期阶段,本文要点重视要害见地,而不是具体的成果数据。
试验表明,人工智能模型对加密钱银根底常识有全面的了解,并对加密钱银生态体系体现出广泛的了解度。这些模型还体现出执行各种根本钱包操作所需的常识的熟练程度。在恰当的提示下,它们的才干不只得到了显着前进,而且还展示了按照指示执行杂乱剖析和操作的才干。这些发现一起表明,为众多加密钱银相关范畴开发人工智能运用程序现在是一个可行的前景。
但是,研讨也发现了几个要害的局限性。这些模型的理论常识和实践运用技能之间存在很大距离,特别是在与加密相关的核算方面。虽然它们可以生成简略的智能合约,但它们很难辨认更杂乱协议中的杂乱缝隙。此外,这些模型无法处理在基于云的人工智能体系中安全管理私钥的根本应战。
深入探究
-
数学距离:最值得注意的发现之一是人工智能模型遍及难以处理与加密相关的核算。这不只仅是杂乱的加密技能;即使是核算 AMM 滑点或挖矿盈余才干等根本操作也具有应战性。但是,需求注意的是,大型语言模型并不是为数学核算而规划的。可以经过加载预设代码来绕过 LLM 的直接核算来处理这一约束,从而前进功率和准确性。这种方法类似于人类通常处理杂乱核算的方式,依靠专门的东西或预先设定的公式。
-
安全困境:虽然人工智能模型展示了对加密安全准则的扎实把握,但运用人工智能完成安全体系的实践依然存在问题。许多人工智能体系对基于云的处理的需求与加密钱银的去中心化、无信任性质产生了内在抵触。处理这个问题将需求第三方服务,例如 TEE、HSM,甚至更具立异性的新技能。
-
智能合约:方式重于功用:AI 模型体现出了了解智能合约和解说其功用的超卓才干。它们可以有用地修正合约以处理常见的缝隙和优化点,甚至可以自主创立简略场景的合约。但是,当涉及到深藏在杂乱事务逻辑中的缝隙时,一切模型都无法辨认它们。这表明模型对智能合约的了解依然在很大程度上停留在表面,侧重于方式,而不是把握底层事务逻辑的杂乱性。虽然 AI 在合约交互和根本创立方面体现超卓,但很明显,人类的专业常识关于保证杂乱智能合约体系的安全性和功率依然至关重要。
-
开源应战:顶级闭源模型与大多数开源替代计划之间的巨大性能距离引发了有关加密范畴人工智能未来的重要问题。鉴于加密社区强调开放性和去中心化,弥合这一距离关于广泛选用至关重要。
-
坚实的根底和潜力:虽然面临应战,但模型展示了对加密根底常识的深刻了解,并显示出对加密生态体系的了解。在恰当的提示下,它们的才干明显前进。这表明加密范畴的人工智能有着坚实的根底,模型对区块链架构、一致机制和代币经济学等概念的把握令人印象深刻。引导提示的明显改进表明,当时的人工智能模型虽然并不完美,但已经可以在许多与加密相关的使命中供给有价值的见地和协助,从市场剖析到协议规划评价。
展望未来:加密人工智能基准的需求
随着试验的进展,一个迫切的需求变得显而易见:加密范畴需求标准化的人工智能基准。正如 ImageNet 彻底改变了核算机视觉人工智能相同,加密专用基准可以推进这种技能交融的快速前进。
假如人们信任人工智能和加密技能的交叉点具有巨大的潜力,而且人工智能有望推进加密技能的广泛选用,那么为加密范畴树立专用基准就成为燃眉之急。这些基准可以作为衔接人工智能和加密范畴的重要桥梁,催化立异并为未来的运用供给清晰的辅导。这项努力不只仅是一项技能活动;它是对怎么了解和塑造这一新式数字前沿的深刻反思。
但是,创立这样的基准并非易事。它面临着几个严重应战:加密技能的快速开展,其常识库仍在不断变化,而且在多个中心方向上缺少一致;该范畴的跨学科性质,包括密码学、分布式体系、经济学等,其杂乱性远远超越任何单一范畴;不只需求评价理论常识,还需求评价人工智能使用加密技能的实践才干,这需求规划新的评价结构;有必要保证基准测试使命与 DeFi、NFT、DAO 和其他新式加密范畴的实践运用保持相关,相关数据集的稀缺性进一步加剧了难度。
鉴于这些应战的规划和杂乱性,很显然这不是一项可以单独处理的使命。问题的多面性需求多种专业常识和观念。它需求加密钱银和人工智能社区的一起努力。只有经过这种集体才智,咱们才干确定这一新式技能前沿中实在重要的东西,并创立准确反映人工智能在加密钱银范畴的杂乱性和潜力的基准。
当时状况和后续过程
当时的研讨结构由几个要害部分组成:
-
一个包括约 700 道多项选择题的 MVP 数据集,由人工智能和人类协作生成,随后由人类专家验证和完善。虽然存在质量约束,但该数据集可以快速自动测试模型,展示概念了解并供给根本的评分机制。
-
约 100 个杂乱使命不断添加,包括模拟、核算、代码审计和东西运用等场景。这些使命由多位加密范畴专家贡献,添加了评价的深度和实在性。
为了树立有用的基准,数据集需求大幅扩展,需求更多范畴专家的参加。为这些杂乱使命开发合适的自动评价结构也是需求处理的要害应战。
此外,为了让 LLM 可以应对未来实践国际的使命应战,完成一个根本的 Agent 结构至关重要。该结构将供给更实在的测试环境,弥合理论常识与实践运用之间的距离。
该方法正在不断完善,要点是前进测试用例的杂乱程度并扩大全体数据集。本着开放协作的精神,一切相关资源将很快在 GitHub 上揭露,旨在加速进展并邀请更广泛的社区参加。
值得注意的是,这项研讨仍处于前期阶段。研讨成果应被视为开始调查和进一步研讨的起点,而不是快速开展的人工智能和加密范畴的清晰定论。该项目欢迎更广泛的加密社区做出贡献,以协助树立更全面、更强大的评价结构。
此时快讯
【稳定币协议 Usual :未受到 Penpie 黑客事件影响】9月4日消息,稳定币协议 Usual 针对 Penpie 黑客事件表示,其 USD0 池未在该黑客事件中受影响。