作者:戴老板/何律衡

2017年6月,Google宣布了一篇名为Attention Is All You Need(注意力是你需求的全部)的论文。

这篇论文由8名发量茂盛的AI科学家联合编撰,他们在论文里创造性地提出了一种“注意力机制”,并依据此开发一个名叫Transformer(变形金刚)的深度学习模型——一位作者以为叫“注意力模型”过于无聊,就用玩梗的心态起了这个姓名。

特斯拉的AI野心:向人类预警 给硅基带路

8名作者大都离开Google,选择创业

从Transformer模型被提出的那一刻起,人工智能的历史进程被骤然加快了。研讨者发现Transformer在天然言语处理(NLP)范畴的功率奇高,比较传统RNN(循环神经网络)优势显着,所以很快便成为NLP研讨者们推崇的首选模型。

Google的重大进展,却让OpenAI的工程师们彻夜难眠。OpenAI当年建立的初衷,便是打破Google在人工智能范畴的独占,而面对这只横空出世的“变形金刚”,他们做了一个重大决议:爽性就用Transformer这件敌人的兵器,来跟Google正面硬刚。

2018年6月,在“变形金刚”诞生一周年之际,OpenAI推出了依据Transformer模型的GPT-1,其间GPT里面的“T”,便是Transformer的首字母。尔后,OpenAI沿着这条道路把GPT-1继续迭代到本周刚发布的GPT-4,并让ChatGPT火遍了全球。

特斯拉的AI野心:向人类预警 给硅基带路

Transformer家族谱系,量子学派[7]

标杆旗帜一出,全球科技巨子就蜂拥而至,纷繁推出了自家依据Transformer的大模型,如Google的BERT,微软的Turing-NLG,英伟达的Megatron、国内华为的鹏程盘古、阿里的M6、百度的文心一言等大模型都是依据Transformer来构建。

更进一步,研讨者发现Transformer不只可以处理言语,处理图画才能也很猛,远胜于传统CNN(卷积神经网络)模型。2020年,Google科学家提出了Vision Transformer ( ViT )概念[1],给核算机视觉范畴的人工智能也装上了火箭助推器。

到本文开端编撰时,Attention Is All You Need这篇论文现已被引用了68,147次,成为人工智能历史上被引数量第三高的论文。应该说,Transformer的呈现扣动了此轮人工智能热潮的板机,你在朋友圈刷到的一切AI热点,简直都跟这个“变形金刚”有关。

站在Transformer模型上,OpenAI成为全球最耀眼的明星,而发明人Google也让国际在AlphaGo之后再次敬畏起了它的实力,两家公司一度打起了大模型的军备竞赛,而全球其他科技巨子也不想只做围观者,要么现已躬身入局,要么正在跃跃欲试。

其实,受Transformer启示,把它运用到登峰造极并点着另一场AI改造的公司还有一家,便是特斯拉。

01借船:马斯克的“人工智能恐惧症”

在整理特斯拉的AI轨迹之前,让咱们先来了解一下伊隆马斯克的“人工智能恐惧症”

这个星球上仅有能让马斯克做噩梦的,不是贝索斯的光头,也不是薛定谔的刹车片,而是人工智能。2014年他就在推特上写道:“咱们要对人工智能分外小心,它或许比核兵器更危险。”在之后的一次访谈中,他又危言耸听道:“当人工智能成为不死的独裁者时,国际将永久无法挣脱(它的操控)。”

或许是觉得原子弹的类比还不行震慑,马斯克在2017年把人工智能的要挟进一步比做北朝鲜[2]——他在twitter表明人工智能“Vastly more risk than North Korea”。随后又激烈宣称“人类应该像监管食物、药物、飞机和轿车相同来监管人工智能。”

为何如此惧怕?马斯克2018年在“西南偏南”大会上对话《西部国际》编剧乔纳森诺兰时解释道[3]:我一般不提倡监管,并且倾向于减少这种桎梏,但是“人工智能把我吓坏了,它的才能比简直任何人知道的都要强,并且进化速度是指数级的。”

特斯拉的AI野心:向人类预警 给硅基带路

在《西部国际》里,马斯克的前妻Riley扮演一个高档AI

不过,马斯克一方面维持着“最恐人工智能的碳基生物”这一人设,一方面却在大干快上地出资AI。

2013年,马斯克个人出资了DeepMind;2015年他参加了OpenAI的众筹发起和Vicarious的B轮融资;2016年,马斯克又创办了脑机接口公司NeuraLink;而特斯拉也经过收购把DeepScale、GrokStyle、Perceptive Automata等人工智能公司纳入囊中。

特斯拉更是很早就开端布局人工智能。2013年特斯拉凭借Model S的热售市值打破100亿美元,马上开端筹划进军主动驾驭。在5月份马斯克跟Google创始人的一次对谈中这样讲:“飞机的主动驾驭仪(Autopilot)是一件很棒的东西,轿车也应该拥有它。”

在其时,“主动驾驭”对传统轿车厂商来说更像是一个科幻概念。1970年代全球轿车巨子们定义了DAS(驾驭员辅佐体系),然后沿着这条道路谨慎推进,“主动驾驭”一方面大厂们不想干(会带来无量的法令噩梦),另一方面也的确是干不了。

2014年,国际轿车工程师学会(SAE)把广义上的“主动驾驭”分成了6类。可以看到,传统车企在曩昔几十年根本上都在L0~L1级之间原地踏步,假如要到达L2级乃至更高,轿车就必须借助人工智能,而想要做到这一点,就要把轿车变得更像一台核算机,而非一个单纯的机械电子部件组合体。

特斯拉的AI野心:向人类预警 给硅基带路

主动驾驭6个等级,未来智库[4]

而特斯拉在Model S上,就现已完成的电子电气架构改造,让轿车更像一台“四个轮子的核算机”。这种理念后来被前华为苏菁用大白话总结了出来:传统车厂以为车的基座是车,然后把核算机嵌进去;咱们则以为轿车的基座是核算机,然后把车挂上去。

特斯拉的AI野心:向人类预警 给硅基带路

Modle S改电子电气架构初衷是为了降本钱,比方减少又贵又沉的轿车线束,但新架构至少能让轿车的各部分遵从“大脑”的一致指挥(详细怎样做的详见咱们之前的文章[12][13]),等于为人工智能的落地搭了一套毛胚房(但还算不上精装修)。

毛胚房预备了,但要让AI真实“拎包入住”——完成L2级以上的“主动驾驭”,还需求什么东西?

咱们一般知道的“主动驾驭”,便是轿车运用各种传感器,搜集周围环境数据,然后轿车的大脑(中心是芯片)依据算法来解析这些数据,从而操控车辆行为。比方摄像头看到前方突然窜出一条狗,大脑解析后宣告紧急刹车的指令,让轿车停下来。

在这个进程中,辨认出前方窜出来的到底是一条德国牧羊犬,仍是一只黑色垃圾袋,就需求一套“算法”了。这些算法,需求提早载入到轿车的“大脑”里,输入轿车各类传感器收集到的数据,然后作出实时的判别,从而操控轿车的行为。

轿车要在行进进程中收集数据、加载算法、敏捷作出判别,自身的核算功用也不能掉链子,尤其是高速行进时,决议计划晚1ms都或许会酿成大祸,假如“卡机”更是灾祸。因而,轿车上搭载的芯片功用也不能欺骗,要有满足的算力。

而那些事前载入轿车大脑的算法从何而来?在前期,碳基程序员们用if-else句子来编撰算法,但在机器学习面世之后,科技公司们开端构建核算渠道,汇聚了从终端提取和模仿生成的海量数据,在更高算力的芯片驱动下,不断练习,形成算法。

特斯拉的AI野心:向人类预警 给硅基带路

图片来历:aionlinecourse

到这儿,主动驾驭“四要素”就很清晰了:1. 感知数据 2. 中心算法 3. 终端芯片 4. 核算渠道。

但2013年的特斯拉仍是一个当之无愧的“小厂”,在四座大山面前根本上毫无堆集,尤其是芯片和算法需求投入很多研制经费。马斯克此时的战略也很务实:造不如买。其时能进入特斯拉视野的供货商有且只要一家——以色列公司Mobileye。

Mobileye的姓名包含“移动”和“眼睛”两个词,这家公司由声称“中东哈佛”的以色列希伯来大学教授Amnon Shashua于创立。自1999年建立之后,专心于开发主动/辅佐驾驭技能,2014年在纽交所上市,2017年被英特尔以153亿美金的天价并购。

在上文说到的主动驾驭“四要素”中,Mobileye最拿手什么?中心算法。

跟近些年“算力论英雄”的景象不同,初期的主动/辅佐驾驭对算力的要求并不高。与如今L4级主动驾驭动辄400 TOPS、L5级更是到达4000 TOPS的算力要求不同,L1级的主动驾驭所需算力乃至不到1 TOPS,L2级也仅仅是在2 TOPS邻近徜徉。

L1级主动驾驭跟“主动驾驭”相隔十万八千里,根本上便是“驾驭员辅佐”,比方自适应巡航、主动刹车、车道坚持等功用,完成起来的确不用很强的核算才能,只需求廉价的摄像头雷达合作先进的图画辨认算法,而这也正是Mobileye的强项。

在创立的前10年,Mobileye仅仅靠纯软件计划的视觉算法就完成了盈亏平衡。一向到2008年,Mobileye才推出了第一代主动驾驭芯片EyeQ1,由台积电代工,选用ARM内核和180nm工艺,而同期初代iPhone搭载的三星S5L8900芯片现已用上了90nm工艺。

到了2014年,Eye系列现已迭代至Q3,截至2013年年底,产品累计销量打破100万台。尽管Q3算力仍然是不幸的0.25 TOPS,但其绑缚销售的算法够香,关于急于上车智能驾驭、又苦于没有软件和算法开发才能的厂商来说,归于瞌睡遇到枕头。

特斯拉的AI野心:向人类预警 给硅基带路

MobileyeEyeQ3芯片

马斯克不喜爱Mobileye,尤其是后者将算法直接封装进芯片里,交付客户的是一个“黑盒”,里面的算法无法更改。但不喜爱也没办法,Mobileye市场份额接近独占,你爱买不买,宝马奔驰福特都得垂头,特斯拉也只好乖乖地接受这种“店大欺客”。

2014年10月,特斯拉发布了第一个主动驾驭计划——Autopilot1.0版别,其间的硬件模块称之为Hardware 1.0(简称HW1.0)。这个计划把Mobileye EyeQ3作为硬件模块的大脑,其他还装备一个前置摄像头、12个超声波雷达和1个毫米波雷达。

自此,2014年10月之后出产的新车都会默认搭载HW1.0硬件,但用户此时还不能直接用——特斯拉选用的是“硬件先行,软件更新”的办法,先装硬件,再OTA晋级,因而一向到2015年10月特斯拉v7.0版更新后,Autopilot1.0才正式被“点亮”。

特斯拉的AI野心:向人类预警 给硅基带路

前期的Autopilot1.0界面

在Mobileye“上车”的那一刻,马斯克就暗中预备自研主动驾驭的算法、芯片和核算渠道。

2015年马斯克试图撮合硅谷著名黑客George Hotz来特斯拉搞无人驾驭,承诺假如成功代替Mobileye,特斯拉会一次性给他“数百万美元奖金”,但被对方拒绝,随后Bloomberg的一篇报道将两人的邮件宣布出来[5],立马引来了Mobileye的责问。

被Mobileye“卡脖子”的特斯拉只好在官方网站上发了一份声明,表明Mobileye供给的芯片和算法仍然是“全国际最好”,特斯拉还会继续运用。然后马斯克亲自在twitter上转发了这份声明,才打消了Mobileye的怒火,避免了特斯拉被“断供”。

事件平息后,马斯克加快推进“自主可控”计划。2016年1月,传奇的AMD首席架构师Jim Keller被挖到了特斯拉,他的长时刻战友Peter Bannon也在1个月之后来到马斯克的阵营——特斯拉跟Mobileye“脱钩”现已仅仅一个时刻问题。

分手的决计如此激烈,马斯克就差一个官样文章的理由和一个暂年代替Mobileye的备胎。很快,它们都来了。

02过渡:一段跟黄仁勋的塑料友谊

2016年5月,一辆敞开主动驾驭形式的Model S在佛罗里达州撞车,40岁的司机Joshua Brown当场逝世。

这辆Model S撞上的是一辆货车的白色车厢。当后者横穿马路时,特斯拉的Autopilot体系尽管经过毫米波雷达检测到了车厢,但误把蓝天映衬下的白色车厢当成一块路牌,AEB(主动紧急制动体系)所以没有做任何的反响,车就径直撞上去了。

特斯拉的AI野心:向人类预警 给硅基带路

惨烈的Model S事端现场

这是人类历史上已知的第一同主动驾驭事端,天然引起全球舆论关注,美国国家运送安全委员会(NTSB)发布了足足500页的报告。调查人员发现司机Joshua Brown在驾驭进程中也不厚道,90%的时刻双手离开方向盘,并忽视了七次体系正告。

司机虽有错,但企业也得背锅。特斯拉发现假如要跟横穿马路的车辆相撞,Mobileye的EyeQ3芯片无法供给满足的算力,要等到两年后发布的EyeQ4才行,而Mobileye在事端的声明里又暗搓搓地甩锅特斯拉,这让马斯克愈加坚定了踢开Mobileye的决计。

5个月后,特斯拉发布了Autopilot 2.0和硬件模块HW 2.0,完全跟Mobileye各奔前程。接替它的是黄仁勋的英伟达。

这儿插一下:特斯拉主动驾驭计划的姓名眼花缭乱,最开端就叫做Autopilot,后来引入一个高档选配计划FSD(Full Self-Driving),两者便是同一套体系的两档产品,用户多花钱,就可以激活更多功用,背面的硬件叫做Hardware(1.0→4.0)。

英伟达在主动驾驭方面其实也是一枚新兵蛋子。在2015年1月,黄仁勋向国际发布第一代了NVIDIA Drive渠道,这个渠道由两部分组成:数字座舱(CX)和主动驾驭(PX),两者都运用英伟达Tegra X1——任天堂switch的同款芯片。

Tegra是英伟达移动芯片家族的姓名,当年坑了不少厂商,比方HTC和小米,一向被高通摁着摩擦。后来老黄爽性放飞自我,把在显卡范畴练就的“砌算力”大法发挥到极致,功耗发热陡增,根本退出手机市场,但在主动驾驭范畴却重获重生。

以Tegra X1为例,其选用标准的CPU+GPU架构,CPU部分选用4颗Arm A57内核和4颗A53 内核,中心数总计8颗;而GPU部分则选用Maxwell架构,中心数高达256颗。这种“暴力堆砌”下,单颗Tegra X1的算力居然攀到了1 TFlops。

特斯拉的AI野心:向人类预警 给硅基带路

Tegra X1 图片来历:英伟达

1 TFlops是什么概念呢?TFlops指的是“每秒万亿次浮点运算才能”,1996年英特尔帮美国能源部Sandia国家实验室制作了一台名叫“ASCI Red”的超级核算机,占地1600平方英尺耗电500千瓦,用来模仿核弹头,它的算力便是1.06 TFlops。

英伟达的“算力大法”,正好是主动驾驭由L1向L2、L3演进时急需的东西。

比方L1级的“单车道定速巡航”功用下,车载芯片只需求处理有限的数据量,但一旦进化到L2等级的“主动变道”,车辆不只要辨认车道和周围车辆,还要实时算出最优变道决议计划,算力需求提升了一个数量级。比较单纯地用CPU来供给算力,英伟达“CPU+GPU”形式能更好地匹配主动驾驭的需求。

为什么?简略说,CPU(中央处理器)和GPU(图形处理器)均由操控单元(Control)、运算单元(ALU)、存储单元(DRAM)、缓存(Cache)等几个部分构成,两者区别首要在于各个单元的数量配比,尤其是运算单元的数量配比。

运算单元是芯片数据核算的中心,由算术逻辑部件(ALU)组成,ALU即大家口中的“核”,所谓8核CPU指的便是有8个核算单元。为图画处理和矩阵核算而生的GPU,与CPU的最大不同在于可以暴力叠加成千上万个ALU进行并行运算。

特斯拉的AI野心:向人类预警 给硅基带路

简略类比,CPU像一位数学系教授,才能全面,GPU则像他手下的一年级本科生,偏科严重,只会管用。教授平时拿手统筹全局,指挥若定,他自己尽管也会管用,乃至抵得上两三个本科生,但明显比不过100个本科生叠加在一同的“算力”。

当GPU遇到人工智能后,开端大放异彩。2006年,英伟达推出依据GPU的CUDA开发渠道,开发者可以经过这一渠道,运用C言语编写程序以处理杂乱的核算问题,换言之,本来只用做3D渲染的GPU变得愈加通用,可执行的使命愈加多样。

2009年,斯坦福大学的Raina、Madhavan及吴恩达在一篇论文中论述了GPU在深度学习方面相对CPU的大幅优势[6],将AI练习时刻从几周缩短至几小时。这篇论文为人工智能的硬件完成指明晰方向。GPU大大加快了AI从论文走向实际的进程。

因而,特斯拉从Mobileye切换到英伟达不只仅换供货商这么简略,而是把人工智能硬件完成的利器——GPU装上了车,等于把“毛胚房”换成了“精装房”,完成了AI算法的拎包入住,一同也把“电动车”和“人工智能”两大年代主题连接在了一同。

特斯拉在2016年10月发布的HW 2.0硬件渠道,包含8个摄像头、1个毫米波雷达、12个超声波雷达,以及英伟达DRIVE PX2定制主板,主板上面搭载了Tegra X2 CPU和晋级为Pascal架构的GPU,算力是10 TOPS,大概是Mobileye EyeQ3的整整40倍。

“新女友”看起来貌美如花,但特斯拉为了这次分手其实付出了不小的价值。

HW 2.0的硬件功用尽管优胜,但软件上却是短板,特斯拉内部团队和英伟达在算法上都还达不到Mobileye的水准。比方一向道HW 2.0发布的3个月后,特斯拉才把自适应巡航操控、前方磕碰预警和方向盘主动转向等根本功用给匆忙地做出来。

因而,尽管特斯拉自2016年10月后出厂的车都标配了HW 2.0,但一向到2017年上半年才把Autopilot 1.0的功用都完成出来。因而有用户调侃道:“搭载了更强劲硬件的新车车主们等了足足半年,总算可以享受跟老车主相同的辅佐驾驭功用了。”

但顶着客户丢失的危险,特斯拉也要把Mobileye换成英伟达。除了爱情因素之外,更重要的是NVIDIA Drive是一个敞开渠道,自由度很高,特斯拉可以一边在英伟达的渠道上练手,一边堆集自己的软件和算法才能,为最终的自研铺平道路。

对“渣男”来说,一切的「现任」都将是「上一任」。在拥抱英伟达的一同,特斯拉的自研讨也在紧锣密鼓地进行着。

03自研:吃着碗里的,看着锅里的

当马斯克开端搞AI时一定会有感受:比较于制作业,美国的AI和芯片人才实在是太多了。

随从1980年代开端就逐渐外迁的制作业不同,美国在核算机科学的三大应用范畴——互联网、软件、芯片规划上一向保有雄厚的人才储藏。以ACM图灵奖获得者为代表的顶尖科学家在高校、工业和研讨机构里打破前沿,而数不清的高档工程师则在Google、苹果、微软、Intel等Top公司之间频频流转。

特斯拉2015年筹备自研无人驾驭时,已是科技圈的当红炸子鸡,马斯克有资本从硅谷大厂里撬走各路牛人和大神。从2015年至今,特斯拉无人驾驭团队的架构历经多次调整,人员也熙来攘往,但无论是硬件仍是软件,马斯克选择的各个团队负责人,根本上都是国际最尖端的科学家或工程师。

咱们可以从几个大牛的简历中窥探到特斯拉Autopilot团队极高的人才密度:AMD K7/K8/Zen架构的开拓者Jim Keller、苹果芯片团队的中心成员Pete Bannon、Swift编程言语的发明人Chris Lattner、OpenAI首席科学家Andrej Karpathy……

特斯拉的AI野心:向人类预警 给硅基带路

特斯拉团队(左起):硬件总监及Dojo负责人Ganesh Venkataramanan;工程总监Milan Kovac;人工智能总监Andrej Karpathy;软件总监Ashok Elluswamy;总忽悠师Elon Musk ,2021 Tesla AI Day

这儿要点提一下Andrej Karpathy。这位出生于1986年的小哥是斯洛伐克人,15岁随父母移民加拿大,2015年获得斯坦福大学博士,导师是核算机大神李飞飞,在读博期间他现已是人工智能届的超级明星,毕业后直接参加创办了OpenAI。

2017年,他被马斯克厚着脸皮挖到了特斯拉,而从2017年到2022年,Andrej Karpathy一向担任特斯拉人工智能总监,并直接向马斯克报告,直到2022年离任重返OpenAI。客观地说,他是特斯拉人工智能团队的最重要的缔造者之一。

特斯拉的AI野心:向人类预警 给硅基带路

发量相对稠密时期的Andrej Karpathy

而在顶峰时,特斯拉Autopilot团队拥有300多名尖端工程师(不包含1000多名数据标示员),其间200人专攻软件,100人专攻硬件和芯片,马斯克在一次采访中说[8]:这些精英“人家随便去哪儿都能找到工作,没有谁是他们真实的老板。

在硅谷人才和自身光环的加持下,特斯拉不预备去抄英伟达和Mobileye的作业,那他们想怎样干?

主动驾驭的详细完成非常杂乱,并且作为一门崭新的科学,新技能、新道路、新打破层出不穷,但沿着咱们前文说到主动驾驭的“四要素”(1. 感知数据 2. 中心算法 3. 终端芯片 4. 核算渠道)来动身,根本上就能理清马斯克规划的巨大蓝图。

首要,在「感知数据」方面,特斯拉选择了“纯视觉感知”计划,放弃了逐渐成熟的激光雷达、毫米波雷达等非视觉传感器。这一做法在业内别出心裁,难度比较其他主流计划直接拉高了一个数量级,在业界也引起热烈的评论乃至争议。

特斯拉的AI野心:向人类预警 给硅基带路

特斯拉8个摄像头覆盖范围

主动驾驭范畴大多数专家都以为“纯视觉”计划不可取,不少用户也颇有微词,以为在技能不成熟的情况下就放弃雷达是对用户安全的不负责任。马斯克对这些批评置之不理,并揭露嘲讽业界对高精度地图和激光雷达等计划的依靠。

其次,在「中心算法」方面,简略来说便是特斯拉经过8个摄像头收集的2D图画,运用杂乱的感知神经网络架构进行加工,构建出一个可以表征真实国际的3D向量空间,这个空间里拥有主动驾驭决议计划场景里所需求的简直一切信息,比方车道、行人、建筑物等。

特斯拉的AI野心:向人类预警 给硅基带路从8个摄像头到3D向量空间,2021 Tesla AI Day

依据这个3D向量空间,特斯拉规划了一个HydraNet架构——Hydra是希腊神话中“九头蛇”的姓名,意思是这套架构同享一个数据“躯干”(BackBone),为1000多个使命的“头”(Head)供给支撑,比方物体检测、交通灯辨认、车道线猜测等。

这些使命的算法大都由云端的核算渠道在吞噬了巨大数据量后练习而来。因而,特斯拉的主动驾驭其实不存在“中心算法”的概念,搭载在轿车终端上的是一个杂乱的依据神经网络的体系,由很多个模块组合而成,宛如一座巨大的迷宫。

第三,在「终端芯片」方面,因为需求实时构建巨大的3D向量空间,每一辆敞开FSD的特斯拉轿车都需求极强的算力来消化海量数据。马斯克的应对思路非常清晰:招募团队,自己从头开端研制主动驾驭的终端芯片,代替掉英伟达的计划。

这儿需求区别的是:咱们一般说的车载中心芯片一般有两类,一类是给智能座舱供给算力的芯片,这一类特斯拉根本都外购成熟的消费级CPU,历代车型用过英伟达Tegra3(2012-2018)、Intel A3950(2018-2021)和AMD 的Ryzen(2021-至今)。

另一类则是给主动驾驭供给算力的芯片,算力要求更高,Mobileye和英伟达Drive PX2供给的是这类,特斯拉要自研的也是这类。思路大致是:在“CPU+GPU”的根底架构上再增添专门的AISC(专用集成电路),来处理潜在的算力瓶颈。

最终,在「核算渠道」方面,特斯拉之前是购买英伟达的板卡来搭建数据中心,但已然决议要自研车载终端芯片,爽性把练习算法的核算渠道也一并自研。2019年4月,马斯克在特斯拉Autonomy Day上初次公布了超级核算机Dojo的研制计划。

归纳来看,马斯克试图吃透无人驾驭的每一个环节,这是一个充溢野心和张狂的计划。

特斯拉跟英伟达“分手”实属必然。一方面马斯克笃信“纯视觉”计划,试图跟其他厂商摆开距离,英伟达的通用硬件计划就无法满足需求了;另一方面,Drive PX2的价格高达10000美元+,这对本钱敏感体质的马斯克来说是一个难以安眠的数字。

英伟达对特斯拉其实相当有诚心,除了在定价方面给予了很大扣头之外,黄仁勋还在交际媒体上晒出自己的特斯拉座驾以及和马斯克的合照,让人似乎梦回2005年苹果与Intel的世纪牵手。但特斯拉根本上也在重复苹果扔掉Intel的故事。

特斯拉的AI野心:向人类预警 给硅基带路

黄仁勋在交际媒体上共享自己的Model X

黄仁勋或许低估了特斯拉的决计和实力,在2018年8月的一次业绩电话会议中,一位分析师问及特斯拉自研芯片的影响时,黄仁勋先是谈了一下自研芯片的难度,然后说:“假如他们没搞出成果,给我打电话,我会很乐意帮助的。”

电话会议完毕后,马斯克立即在twitter上回应,措辞的塑料友谊感十足:“Nvidia制作了很棒的硬件,高度尊重黄总的公司。”一同又很司马昭地表明:“咱们的硬件需求是很共同的,需求跟咱们的软件紧密匹配。”

特斯拉的AI野心:向人类预警 给硅基带路

2018年是特斯拉Autopilot自研的冲刺节点:人工智能总监Andrej Karpathy领导团队经过大型神经网络来练习算法;硬件大神Jim Keller和接班人Pete Bannon主持终端FSD芯片的研制;元老级高管David Lau则带领近百人的团队改进数据收集和车机交互……

特斯拉能不能交出一张满足答卷?不只英伟达想知道,全国际想抄作业的人也都在等待着。

04答案:特斯拉是轿车公司,仍是AI公司?

2021年8月19日,当Andrej Karpathy在特斯拉AI Day上展现Transformer时,全国际的友商都瞪大了眼睛。

如前文所述,特斯拉“纯视觉”计划的第一步,便是把8个摄像头收集的图画提取特征,融组成一个一致的三维向量空间。这个idea很符合“第一性原理”,是根底中的根底,但完成起来极难,传统的依据2D图画的CNN卷积根本处理不了问题。

特斯拉的AI野心:向人类预警 给硅基带路

极其杂乱的3D向量空间

特斯拉的做法是用上了新鲜出炉的Transformer。在开头咱们讲过,Transformer不只处理天然言语在行,处理核算机视觉同样是神器,在Google和OpenAI都工作过的Andrej Karpathy天然不会放过,在第一时刻就带领团队将其用在3D向量空间的创立上了。

这是一个巨大的打破。客观说只要处理了这个问题,特斯拉才有扔掉激光雷达的底气。

详细完成的办法,感兴趣的读者可以详读参考文献[15]。特斯拉首要运用Transformer之后,全球同行们纷繁跟随。应该说,Transformer除了把GPT大模型送到全球聚光灯之下外,它还在每一台具有主动/辅佐驾驭功用的轿车里默默发挥着作用。

当然,Transformer模型也仅仅特斯拉主动驾驭算法体系的一个“零部件”,跟它一同发挥作用的还有很多新老技能。并且要注意:人工智能是一门日行千里、乃至在不断加快的科学,今日的“神器”到了明天,或许就会被更好的算法和模型代替掉。

Karpathy的展现仅仅特斯拉“全栈自研”的一小部分,因为不同团队进度的差异,面纱是逐渐被揭开的。

首要露脸的其实是硬件。2019年4月,特斯拉终于发布了“自主可控”的主动驾驭硬件渠道HW 3.0。全球科技圈对此期盼已久:老车主们要点关注能否免费晋级,友商们纷繁掏出放大镜预备认真“学习”,而对冲基金和相似System Plus这样的咨询公司则敏捷行动,在第一时刻对HW 3.0进行了拆解。

特斯拉的AI野心:向人类预警 给硅基带路

HW3.0和HW2.5(HW2.0的简略晋级)板卡对比图

HW3.0总共包含4746个零件,其间两颗刻有Tesla标记的银色FSD芯片最引人瞩目。这款芯片是特斯拉硬件自研的最大成果,由三星在得克萨斯州奥斯汀的工厂代工,选用14nm FinFET工艺,面积大约为260平方毫米,集成了60亿晶体管。

随后,在2019年8月的IEEE的Hot Chips会议(高功用处理器顶会)上,特斯拉芯片负责人Pete Bannon(Jim Keller已离任)展现了FSD的内部结构,可以看到特斯拉没有选用英伟达一般的CPU+GPU架构,而是选用高度定制的CPU+GPU+ASIC架构。

特斯拉的AI野心:向人类预警 给硅基带路

特斯拉第一代FSD芯片架构

这儿的ASIC指的便是占有整块芯片最大面积的两颗神经网络处理单元(NNA),即NPU。每颗NPU核的峰值功用可以到达每秒36.86万亿次运算(TOPS),功耗却只要7.5W。与之比较,GPU内核只供给0.6TOPS的算力,成为副角。

咱们之前把CPU比做数学系教授,把GPU比做一年级本科生,那NPU便是CPU手下的在读博士,无需手把手指导,就能快速的进行卷积运算和矩阵乘法运算。简略来说便是:NPU成为供给算力输出的主力,CPU和GPU退居辅佐位置。

HW3.0渠道上装备了两颗FSD芯片,相互校对,相互冗余,整个体系的算力便是144TOPS,是前一代HW 2.5的7倍多(20TOPS)。而凭借颠覆性的架构规划,整个体系的功耗下降到了220W,功耗比则从0.067TOPS/W跃升至0.65TOPS/W。

FSD芯片让特斯拉完成了芯片的“独当一面”,此时离他们第一次购买Mobileye的产品只曩昔了短短5年。

而围绕主动驾驭“四要素”,特斯拉的打破还在继续。在2021年8月19日举办的特斯拉AI Day上,除了人工智能总监Andrej Karpathy详细阐述了依据视觉的神经网络计划外,「核算渠道」的打破成果也被展现出来,即特斯拉Dojo ExaPOD超级核算机。

Dojo ExaPOD由120个练习模块组成,每一个练习模块包含25块特斯拉自研的D1芯片,总芯片数量到达了3000块。D1芯片由台积电代工,选用7nm工艺,3000块D1芯片叠加起来,直接让Dojo以1.1 EFLOP的算力成为全球第五大算力规模的核算机。

特斯拉的AI野心:向人类预警 给硅基带路Dojo负责人Ganesh展现D1芯片,2021 AI Day

客观点评,特斯拉毕竟是芯片范畴的“新兵”,自研的芯片未必真的能比美半导体巨子,尤其是研制Dojo的本钱比从英伟达直接买还要高。但考虑到特斯拉在简直时零根底的情况下挤进了AI芯片第一梯队,这份成绩单仍是满足优秀的。

自此“自己动手,锦衣玉食”,马斯克对“四要素”的全链条掌控现已根本成型:

选用“纯视觉计划”,中心算法依据深度神经网络,在云端由自己研制的Dojo超级核算机进行练习,终端上自研的FSD芯片实时处理周围环境数据,辨认对象,猜测行为,作出判别,最终操控车辆动作,完成主动或半主动的“智能驾驭”。

为了加快主动驾驭的成熟速度,特斯拉在2020年10月启动了FSD Beta的内测,面向的人群是一小部分乐意把实际国际的行进数据上传给特斯拉来进行算法练习和干山的车主,而收集到的很多数据则会被喂给“云端”的超级核算机来练习模型和算法。

很多花了15000美元选配FSD服务的车主乐意“自带干粮”给特斯拉充任“无人驾驭测验员”。2021年有2000多位车主参加了FSD Beta的内测;到2022年10月,这一数字飙升到了16万;之后FSD Beta向北美地区全部敞开,参加车主数量到达36万。

特斯拉的AI野心:向人类预警 给硅基带路一名北美用户正在运用FSD Beta,2022年

海量的数据投喂给日夜不停的超级核算机,带来了主动驾驭的快速迭代。在2022年的AI Day上,特斯拉给出了一组数据:收集了480万段数据,练习了75778个神经网络模型,其间有281个模型被实际用到特斯拉车上,推进FSD迭代了35个版别。

在宣布这些数据前,马斯克在开场白中讲了一句话:根本上我以为,咱们是人工智能在实际国际应用的无可争议的领导者。

在ChatGPT火爆全球之后,这句话的可信度明显打了不小的扣头。不过从2013年开端,特斯拉用了9年就吃透了人工智能的玩法,把AI搬上了数百万台轿车,从算法、芯片再到核算渠道全部完成自研,根本上抢先一切的竞争对手,包含卖铲子的英伟达。

特斯拉的AI野心:向人类预警 给硅基带路

马斯克曾在微博称特斯拉的AI实力被“低估”

当然,争议一直伴随着特斯拉。一方面,L4级的主动驾驭难度过高,很多厂商被卡在L2级~L3级这一地带,即使特斯拉的FSD更新到v11版别,也仍然没有摆脱“Beta”的后缀。在今年2月初,特斯拉更是宣告召回了36万辆装备有FSD的轿车。

另一方面,特斯拉在营销「主动驾驭」时的急进也少不了被口诛笔伐,马斯克在推销自家的主动驾驭技能方面不只接地气,并且接地府,吹牛、撕逼、PUA同行、期货当现货卖……无所不用其极。这种「扮演」,有时候反而会让人疏忽了特斯拉的真实实力。

但众所周知,特斯拉轿车在全球的畅销,目前跟主动驾驭联系不是很大,尤其在中国,FSD注册率只要不幸的2%不到,全球范围也只要10%~20%的水平。用户选择特斯拉轿车,更多的是因为品牌光环以及其在规划、制作、价格方面的优势。

而特斯拉之所以继续出资人工智能,除了自身主动驾驭是一大营销卖点外,还有一个原因:人工智能将是未来20年人类最重要的科技主线。

电动车工业尽管坐拥风口,但本质上仍然是制作业,功率曲线的改进会逐渐趋缓。比方,动力电池的容量不会每年翻一番,一体化压铸的本钱也不会每年下降50%,特斯拉在制作环节的优势在渡过红利期之后,早晚会被更卷的厂商追上。

但人工智能却像火箭相同在加快,并极有或许引爆一场像工业改造相同的浪潮。假如特斯拉可以从一家单纯的轿车公司,变成一家拥有两大落地场景(轿车和机器人)的人工智能公司,那么今日投入的每一分钱,未来都将是跟竞争者的巨大优势。

不过特斯拉在AI范畴的狂飙,常常被一些戏谑性的场景所减弱。2022年10月,被业界期待已久的Tesla Bot发布,但三名吃力抬着机器人上台的壮汉让局面一度尴尬。两个月后ChatGPT引爆全球,Tesla Bot完全成为全球AI狂欢的布景板。

特斯拉的AI野心:向人类预警 给硅基带路

被工作人员“抬”上来的Tesla Bot

OpenAI用ChatGPT告诉咱们:人工智能的开展总是呈现非线性的,一旦“奇点”接近,爆发就会以难以想象的速度降临。谁都不敢妄言特斯拉测验两年多的FSD Beta不会在不远的未来取得打破,这台装了FSD芯片的机器人,也是相同。

从这视点动身,特斯拉这台电线暴露的Bot,是不是越看越像《复联2》的奥创或许施瓦辛格?

05结尾:向老乡预警,给硅基领路

在2003年上映的电影《终结者3》里,毁灭人类的超级核算机——天网的算力是60 TFlops

二十年曩昔了,游戏玩家手上的一张RTX 4090显卡,就能到达100 TFlops,相当于1.67个天网;一张英伟达A100的算力(FP16)可以到达156TFlops,相当于2.6个天网,而ChatGPT背面的数据中心里,至少有2万张英伟达A100和功用更强的H100。

特斯拉的AI野心:向人类预警 给硅基带路

《终结者3》里启动的SkyNet,2000年

人类在科技树的某一个枝桠上「狂飙」时,想象力或许都无法跟不上步伐。现在是2023年,Google宣布那篇阐述“注意力机制”的论文,距今只要5年;AlphaGo击败李世石,距今只要7年;而OpenAI这家公司建立,距今也才不到8年时刻。

特斯拉研制无人驾驭的时刻线,跟人工智能这门科学在近10年的突飞猛进密不可分的,而人工智能的演进速度会越来越快。OpenAI创始人Sam Altman刚提了一个新的理论:新的摩尔定律将会敞开,宇宙中的智能生命每隔18个月将会翻一倍。

特斯拉的AI野心:向人类预警 给硅基带路

在特斯拉出资者日公布的Master Plan 3(宏愿3)中,马斯克预期特斯拉未来每年可以出产2000万辆车——这也意味着,每年把2000万个拥有极强算力的硅基生命送到碳基人类的千家万户,一同这些终端的“智力”正在昼夜不停地进化。

电影《教父》里柯里昂说过说:离自己的朋友要近,离自己的敌人要更近。马斯克明显明白无法阻挠激流,干脆为硅基的崛起助力。至于这种“助力”,究竟是碳基通往自由之路上的砖石,仍是绞刑架上的绳索,马斯克或许管不了那么多了。

一边向碳基老乡预警,一边给硅基皇军领路,马教师现已做出了自己的选择。咱们呢?

全文完,总长1.2万字,感谢您的耐性阅读。

本文编撰得到了ChatGPT的大力协助,特此鞠躬。

参考资料

[1].An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale, 2020

[2].Elon Musk @twittter,2014-2018

[3]. South by Southwest Tech Conference, 2018

[4]. 轿车主动驾驭开展途径和工业链全景图, 未来智库

[5]. George Hotz Is Taking on Tesla by Himself, Bloomberg

[6]. Large-scale Deep Unsupervised Learning using Graphics Processors

[7]. Tesla AI Day, 2021-2022

[8]. 一个年代有一个年代的核算架构,量子位

[9]. 与时刻赛跑,特斯拉Autopilot进化史,轿车之心

[10]. AI Chips: Challenges and Opportunities

[11]. ChatGPT暗地的真实大佬,量子学派

[12]. Meet The 'Jedi Engineers' Responsible For Tesla Autopilot

[13].新能源轿车的联发科时刻,远川研讨所

[14]. 鸿蒙座舱是怎样炼成的,饭统戴老板

[15]. Deep Understanding Tesla FSD: Vector Space,Jason Zhang

此时快讯

【2023-03-20 02:29】【比特币NFT协议Ordinals GAS费用收入突破100 BTC】金色财经报道,据Dune Analytics最新数据显示,比特币NFT协议Ordinals GAS费用收入已突破100BTC,本文撰写时达到100.3498 BTC,约合2,739,562.87美元,截至目前Ordinals累计铭文NFT铸造量为534,253个。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注