Key Insights
-
AI Agent 是依据 LLM 通用大模型的东西,供开发者和用户直接构建可自主交互的运用。
-
AI 赛道未来的首要格局或许是:“通用大模型 + 垂类运用”;AI Agent 的生态位是连接通用大模型和Dapp的中间件,所以 AI Agent 护城河较低,需靠打造网络效应和提高用户粘性提高长时间竞争力。
-
本文梳理了“通用大模型、垂类运用Agent、以及 Generative AI 运用”在 Web3 游戏赛道的开展状况。其间,结合 Generative AI 技能,十分有潜力在短期内出爆款游戏。
01 技能简介
本年爆火的人工通用智能 AGI(Artificial General Intelligence)技能中,大型言语模型(Large Language Model - LLM)是肯定的主角。OpenAI 中心技能人员 Andrej Karpathy 和 Lilian Weng 也表达过依据 LLM 的 AI Agents 是 AGI 范畴接下来重要的开展方向,很多团队也在开发依据 LLM 驱动的人工智能署理( AI-Agents)体系。简略来说,AI Agent 是一种核算机程序,它运用很多数据和杂乱的算法来模仿人类的思维和决议计划进程,以便执行各种使命和交互,例如主动驾驶、语音辨认和游戏战略等。Abacus.ai 的图片清晰的介绍了AI Agent的基本原理,进程如下:
-
感知和数据采集:数据输入,或许AI Agent 经过感知体系(传感器、摄像头、麦克风等设备)获取信息和数据,比方游戏状况、图像、声响等。
-
状况表明:数据需要被处理和表明成 Agent 能够了解的方式,如转换为向量或张量,以便于输入到神经网络中。
-
神经网络模型:通常运用深度神经网络模型来进行决议计划和学习,比方运用卷积神经网络(CNN)用于图像处理、循环神经网络(RNN)用于序列数据处理,或许更高档的模型如自注意力机制(Transformer)等。
-
强化学习:Agent 经过与环境的互动来学习最佳举动战略。除此以外,Agent 的运作原理还包含战略网络、价值网络、操练和优化,以及探究与利用等。比方在游戏场景下,战略网络能够输入游戏状况,然后输出举动概率散布;价值网络能够估量状况价值;Agent 则能够经过与环境互动不断强化学习算法以优化战略和价值网络,输出更完美的结果。
总归,AI-Agents 是一种能够了解、决议计划和举动的智能实体,它们能够在各种范畴中发挥重要作用,包含游戏范畴。OpenAI 中心技能人员 Lilian Weng 编撰的《LLM Powered Autonomous Agents 》十分全面的介绍了 AI-Agents 原理,其间,文中说到一个十分风趣的试验:Generative Agents。
Generative Agents (简称GA)的创意来自于《模仿人生》游戏,其运用 LLM 技能生成了 25 个虚拟人物,每个人物都由 LLM 支持的 Agent 操控,在沙盒环境中生活和交互。GA 的规划很聪明,它将LLM与记忆、规划和反思功用结合在一起,这使得Agent程序能够依据以前的经历来做出决议计划,并与其他Agent互动。
文章具体介绍了Agent 怎么依据战略网络、价值网络以及和环境的互动来不断操练和优化决议计划途径。
原理如下:其间,记忆流(Memory Stram)是一个长时间记忆模块,记载了Agent的所有交互经历。检索模型(Retrieve)依据相关性、新鲜度和重要性来供给经历(Retrived Memories),协助 Agent 做出决议计划(Plan)。反思机制(Reflect)则总结过去的事情,指导 Agent 未来的举动。Plan 和 Reflect 则一起协助Agent将反思和环境信息转化为实际举动 Act 。
这种风趣的试验向咱们展现了 AI Agent 的能力,比方发生新的交际行为、信息传播、关系记忆(比方两个虚拟人物持续评论话题)和交际活动的和谐(比方举办聚会并约请其他虚拟人物)等等。总归,AI-Agent 是一个十分风趣的东西,而且其在游戏中的运用也值得深入探究。
02 技能趋势
2.1 AI 赛道趋势
ABCDE的投研合伙人LaoBai曾总结过硅谷创投圈对 AI 下一步开展的判别:
-
没有垂类模型,只有大模型 + 垂类运用;
-
边际设备比方手机端的数据或许会是个壁垒,依据边际设备的 AI 或许也是个时机;
-
Context 的长度未来或许引发突变(现在用向量数据库作为 AI 记忆体,但上下文长度仍是不行)。
即从职业一般开展规律来看,由于大型通用模型方式太重,且具有较强的普适性,所以没必要在大型通用模型范畴不断造轮子,而应更多侧重于将大型通用模型运用于垂类范畴。
一起,边际设备指通常不依赖于云核算中心或远程服务器,而是在本地进行数据处理和决议计划的终端设备。由于边际设备的多样性,所以怎么将 AI Agent 布置到设备上运行并合理获取设备数据便是一个应战,但一起也是新的时机。
最终,关于 Context 的问题也备受关注。简略来说,在LLM布景下的 Context 能够了解为信息数量,Context 长度能够了解为数据有多少维度。假设现在有一个电子商务网站的大数据模型,该模型用于猜测用户购买某个产品的或许性。在这种状况下,Context 能够包含用户的阅读前史、购买前史、查找记载、用户特点等信息。Context 长度则指特征信息叠加的维度,比方上海30岁男性用户的竞品购买前史,叠加最近购买的频率,再叠加最近的阅读记载等。Context 长度的添加能够协助模型更全面地了解用户购买决议计划的影响要素。
现在的一致以为,尽管现在运用向量数据库作为 AI 的记忆体使得 Context 长度不行,但未来 Context 长度会发生质的改变,而后 LLM 模型能够寻求更高档的方法来处理和了解更长、更杂乱的 Context 信息。进一步涌现出更多超出幻想的运用场景。
2.2 AI Agent 趋势
Folius Ventures总结过 AI Agent 在游戏赛道中的运用方式,如下图:
图中的 1 是 LLM 模型,其首要担任将用户意图从传统的键盘/点击输入转化成自然言语输入,下降用户进入门槛。
图中的 2 是集成了 AI Agent 的前端 Dapp,为用户供给功用服务的一起,也能够从终端收集用户习气和数据。
图中的 3 是各类 AI Agent,能够直接以运用内功用、Bot 等方式存在。
总的来说,AI Agent 作为依据代码的东西,能够充任 Dapp 扩展运用功用的底层程序以及渠道的增长催化剂,即链接大模型和垂类运用的中间件。
从用户场景来说,最有或许集成 AI Agent 的 Dapp 大概率是足够敞开的 Social app, Chatbot 和游戏;或许把现有Web2 流量进口经过 AI Agent 改形成更简便亲民的 AI+web3进口;即职业界一直在讨论的下降Web3的用户门槛。
依据职业开展规律,AI Agent 所处的中间件层往往会成为一个高度竞争的赛道,几乎没有护城河。所以,AI Agent除了不断的提高体会以匹配B2C的需求以外,能够经过制作网络效应或发明用户粘性的来提高自己的护城河。
03 赛道地图
AI在Web3游戏范畴的运用现已呈现了多种不同测验,这些测验能够分为以下几种类别:
-
通用模型:一些项目专心于构建通用AI模型,针对Web3项意图需求,找到适用的神经网络架构和通用模型。
-
垂直运用:垂类运用旨在解决游戏中的特定问题或为供给特定服务,通常以Agent、Bot和BotKits的方式呈现。
-
Generative AI 运用:大模型对应的最直接的运用便是内容生成,而游戏赛道自身便是内容职业,所以游戏范畴的 Generative AI 运用十分值得关注。从主动生成虚拟国际中的元素、人物、使命或故事情节等,再到主动生成游戏战略、决议计划乃至是游戏内生态的主动演变都成为了或许,使游戏更具多样性和深度。
-
AI 游戏:现在,现已有许多游戏集成了 AI 技能,运用场景各不相同,后文将举例说明。
3.1 通用大模型
现在,Web3 现已有针对经济模型规划和经济生态开展的模仿模型了,比方 QTM 量化代币模型。Outlier Venture 的 Dr. Achim Struve 在 ETHCC 的演讲中有说到一些经济模型规划的观念。比方考虑到经济体系的稳健型,项目方能够经过 LLM 模型创立一个数字双胞胎 Digital Twin,对整个生态体系进行 1:1 的模仿。
下图的 QTM(量化代币模型)便是一个 AI 驱动的推理模型。QTM 采用了 10 年的固定模仿时间,每个时间步长为一个月。在每个时间步长的开端,代币会被排放到生态体系中,因此模型中有鼓励模块、代币归属模块、空投模块等。随后,这些代币将被投放到到几个元桶(meta buckets)中,从这些元桶中再次进行更细化的广义效用再分配。然后,从这些效用东西中界说奖励付出等。还有像链下事务方面,这也考虑了事务的一般资金状况,例如能够进行销毁或回购,还能够衡量用户采用率或许界说用户采用状况。
当然,该模型的输出质量取决于输入质量,所以在运用 QTM 之前,必须进行充沛的市场研究,以获取更准确的输入信息。不过QTM模型现已是AI驱动模型在Web3 经济模型里十分落地的运用了,也有许多项目方依据QTM模型做操作难度更低的2C/2B端运用,下降项目方的运用门槛。
3.2 垂类运用Agent
垂类运用首要以 Agent 的方式存在,Agent 或许是 Bot、BotKits、虚拟助手、智能决议计划支持体系、各类主动化数据处理东西等等不同的方式。一般来说,AI Agent 拿 OpenAI 的通用模型为底层,结合其他开源或自研技能,如文本转语音(TTS)等,并加入特定的数据进行 FineTune(机器学习和深度学习范畴中的一种操练技能,首要意图是将一个现已在大规模数据上预操练过的模型进一步优化),以创立在某一特定范畴体现优于 ChatGPT 的 AI Agent。
现在 Web3 游戏赛道运用最成熟的是 NFT Agent。游戏赛道的一致是 NFT 一定是 Web3 游戏的重要组成部分。
跟着以太坊生态体系中关于元数据管理技能的开展,可编程的动态NFTs 呈现了。关于NFT的创立者而言,它们能够经过算法使 NFT 功用更灵敏。关于用户而言,用户与NFT之间能够有更多的互动,发生的交互数据更是成为了一种信息来源。AI Agent 则能够优化交互进程,并扩展交互数据的运用场景,为NFT生态体系注入了更多的立异和价值。
事例一:比方 Gelato 的开发结构答应开发者自界说逻辑,依据链下事情或特定时间距离来更新 NFT 的元数据。Gelato节点将在满意特定条件时触发元数据的更改,然后实现链上NFT的主动更新。例如,这种技能能够用于从体育API获取实时竞赛数据,并在特定条件下,例如运动员赢得竞赛时,主动晋级NFT的技能特征。
事例二:Paima 也为 Dynamic NFT 供给了运用类 Agent。Paima 的 NFT 紧缩协议在 L1 上铸造了一组最小的NFT,然后依据L2 上的游戏状况对其进行演化,为玩家供给更具深度和互动性的游戏体会。比方 NFT 能够依据人物的经历值、使命完结状况、装备等要素而发生改变。
事例三:Mudulas Labs 是十分闻名的ZKML项目,其在NFT赛道也有布局。Mudulas 推出了NFT 系列 zkMon,答应经过 AI 生成 NFT 并发布至链上,一起生成一个 zkp,用户能够经过 zkp 查验自己的 NFT 是否生成自对应的 AI 模型。更全面的信息能够参考:Chapter 7.2: The World’s 1st zkGAN NFTs。
3.3 Generative AI 运用
前文说到,由于游戏自身是内容职业,AI-Agent能够在短时间内、低成本地生成很多内容,包含发明具有不确定性、动态的游戏人物等等。所以 Generative AI 十分合适在游戏运用。现在,在游戏范畴中 Generative AI 的运用能够总结为以下几种首要类型:
-
AI 生成游戏人物类:比方和 AI 对战,或许由 AI 担任模仿和操控游戏中的 NPC,乃至直接用AI生成人物等。
-
AI 生成游戏内容类:直接由 AI 各种内容,如使命、故事情节、道具、地图等。
-
AI 生成游戏场景类:支持用 AI 主动生成、优化或扩展游戏国际的地形、景观和气氛等。
3.3.1 AI 生成人物
事例一:MyShell
MyShell 是一个 Bot 创立渠道,用户能够依据自己的需求,创立专属 Bot 用于聊天、操练口语、玩游戏、乃至寻求心理咨询等等。一起,Myshell 运用了文本转语音(TTS)技能,只需几秒钟的语音样本,就能够模仿任何人的声响主动创立 Bot。除此以外,MyShell 运用了AutoPrompt,答运用户仅经过描绘自己的主意去给 LLM 模型宣布指令,为私家大型言语模型(LLM)打下了根底。
有 Myshell 的用户表明,其语音聊天功用十分流畅,响应速度比 GPT 的语音聊天还要快,而且还有 Live2D。
事例二:AI Arena
AI Arena 是一款AI对战游戏,用户能够运用 LLM 模型不断的操练自己的对战精灵(NFT),然后将操练好的对战精灵送往PvP/PvE战场对战。对战方式和任天堂明星大乱斗类似,但经过AI操练添加了更多的竞技趣味性。
Paradigm 领投了AI Arena,现在公测阶段已开端,玩家能够免费进入游戏,也能够购买NFT提高操练强度。
事例三:链上国际象棋游戏 Leela vs the World
Leela vs the World 是Mudulas Labs开发的一款国际象棋游戏。游戏里游戏双方是 AI 和人,棋局状况放在合约里。玩家经过钱包进行操作(与合约交互)。而 AI 读取新的棋局状况,做出判别,并为整个核算进程生成 zkp ,这两步都是在 AWS 云上完结,而 zkp 交由链上的合约验证,验证成功后调用棋局合约“下棋”。
3.3.2 AI生成游戏内容
事例一:AI Town
AI Town是 a16z 与其投资组合公司 Convex Dev 的合作效果,创意来自斯坦福大学的《Generative Agent》论文。AI Town是一座虚拟城镇,城镇内的每个AI都能够依据互动和经历构建自己的故事。
其间,运用 Convex 后端无服务器结构、Pinecone 矢量存储、Clerk 身份验证、OpenAI 自然言语文本生成以及 Fly 布置等技能堆栈。除此以外,AI Town 悉数开源,支持游戏内开发者自界说各种组件,包含特征数据、精灵表、Tilemap 的视觉环境、文本生成提示、游戏规矩和逻辑等等。除了一般玩家能够体会 AI Town,开发者也能够运用源代码在游戏内乃至游戏外开发各种功用,这种灵敏性使AI Town 适用于各种不同类型的运用。
所以, AI Town 自身是一个 AI 生成内容类游戏,但也是一个开发生态,乃至是一个开发东西。
事例二:Paul
Paul 是一个AI故事生成器,其专门为全链游戏供给了一个 AI 故事生成并直接上链的解决途径。其实现逻辑是给LLM输入了一大堆先验规矩,然后玩家能够主动依据规矩生成次生内容。
现在有游戏 Straylight protocol 运用Paul Seidler发行了游戏,Straylight 是一款多人的NFT游戏,中心玩法便是全链游戏版本的“Minecraft”,玩家能够主动Mint NFT,然后依据模型输入的基本规矩构造自己的国际。
3.3.3 AI 生成游戏场景
事例一:Pahdo Labs
Pahdo Labs 是一家游戏开发工作室,现在正在开发 Halcyon Zero,这是一款依据 Godot 引擎构建的动漫奇幻人物扮演游戏和在线游戏创立渠道。游戏发生在一个空灵的梦想国际中,以作为交际中心的繁华城镇为中心。
这款游戏十分特别的地方在于,玩家能够运用游戏方供给的 AI 创造东西快速创造更多的3D效果布景以及把自己喜爱的人物带入游戏,真正为大众游戏UGC供给了东西和游戏场景。
事例二:Kaedim
Kaedim 针对游戏 Studio 开发了一个依据 Generative AI 的 3D model generation 东西,能够快速的协助游戏 Studio 批量生成符合他们需求的游戏内3D场景/财物。现在 Kaedim 的通用产品还在开发中,预计 2024 年敞开给游戏 Studio 运用。
Kaedim 产品的中心逻辑和 AI-Agent 是完全相同的,运用通用大模型为根底,然后团队内部的艺术家会不断输入好的数据,然后给Agent的输出进行反馈,不断的经过机器学习操练这个Model,最终让 AI-Agent能够输出符合要求的3D场景。
04 总结
在本文中,咱们对AI在游戏范畴的运用进行了具体的分析和总结。总的来说,未来通用模型以及 Generative AI 在游戏的运用一定会呈现明星独角兽项目。垂类运用尽管护城河较低,但先发优势强,如果能靠先发优势制作网络效应和提高用户粘性,则幻想空间巨大。除此以外,生成式 AI 天然合适游戏这个内容职业,现在现已有十分多的团队在测验 GA 在游戏的运用,这个周期就十分有或许呈现运用 GA 的爆款游戏。
除了文中说到的一些方向,未来还有其他的探究角度。比方:
(1)数据赛道 + 运用层:AI数据赛道现已孕育出了一些估值达数十亿美元的独角兽项目,而数据 + 运用层的联动相同充溢幻想空间。
(2) 与 Socialfi 结合:比方供给立异的交际互动方式;用 AI Agent 优化社区身份认证、社区管理;或许愈加智能的个性化引荐等。
(3) 跟着Agent的主动化和成熟化,今后 Autonomous World 的首要参与者到底是人仍是Bot?链上的自治国际是否有或许能像 Uniswap 那样,80%+ 的 DAU 都是 Bot?如果是,那结合 Web3 管理概念的管理 Agent 相同值得探究。
此时快讯
【欧盟数据保护监管机构敦促为数字欧元的小额交易提供匿名服务】金色财经报道,欧洲数据保护委员会(EDPB)和欧洲数据保护监督员(EDPS)就欧盟委员会于2023年7月提出的"数字欧元"监管问题发布了一份联合意见书。监管机构提出了若干建议,以加强欧洲中央银行数字货币(CBDC)的个人数据保护标准。EDPB和EDPS“强烈建议”为在线交易设立“隐私门槛”,低于该门槛的线下和线上小额交易不受反洗钱和打击资助恐怖主义(AML/CFT)的追踪。