加速装置

没有HW40特斯拉AIDAY2022

发布时间:2023/6/20 22:32:42   
白癜风能治疗好吗 http://pf.39.net/bdfyy/dbfzl/160319/4793212.html

在经历了半年的“跳票”之后,特斯拉AIDAY终于来了。事实证明,特斯拉不会让人失望,话不多说,直接切入主题:

AIDAY核心信息:

1.TeslaBot亮相;2.FSD最新进展;3.Dojo超算Q1推出;4.没有HW4.0。

TeslaBot亮相

在此之前就有不少人猜测,这次AIDAY上特斯拉可能会有很多大动作,尤其是特斯拉机器人(TeslaBot)“擎天柱(Optimus)”可能会首次亮相。

现在,它来了:

与上一届AIDAY中推出的概念机不同,Optimus原型机明显更大且更粗犷一些,胸前的两个散热风扇很醒目。同时根据现场的演示来看,它的行走也显得有些“步履蹒跚”,直观上不如波士顿动力的双足机器人。

核心在于,Optimus采用了与汽车相同的FSD(自动驾驶计算机),它的行走、动作、执行指令等,不是按照既定程序按部就班执行的,而是通过AI模型学习得来的。

跟人一样,它感知世界的方式也是画面和声音,通过头部的摄像头采集周围视频,通过FSD视觉识别算法可识别出周围环境、分辨物体,并计算行走路线、抓取力度等等。

上图为Optimus结构示意图,其中橙色是驱动装置、蓝色是主控。搭载了容量2.3kWh的电池包,系统电压52V;主控板搭载特斯拉自研Soc、支持wifi、4G等模块。

Optimus全身有28个关节,也就需要28个驱动装置。为了实现人一样自然的动作,特斯拉做了大量的开发。比如说,人在抓取、搬运时所需的力是不一样的,如果用力过猛可能会把手里的东西甩飞。

因此,特斯拉针对每个关节所需的力量/扭矩,做了仿真建模,找到了各自关节/驱动器的最佳参数,并研据此发了6种专用电机,采用与特斯拉汽车电机同源的滚珠电机技术。

FSD最新进展

本届AIDAY的另一个重头戏则是FSD,这套系统目前正在飞速发展,目前FSDBeta的早鸟用户已经超过了16万。

技术方面,我们不妨先思考一下:什么样的自动驾驶是优秀的?是在各种极限条件下依然可用吗?

是,但不完全是。

特斯拉举了个例子:在无保护左转时,即便没有危险,如果从行人面前近距离通过,也可能会导致行人受到惊吓,或者导致行人做出不可预料的动作。

可见,减少“极限操作”对于车主和行人来说都是更好的。

FSD的策略则是从安全角度出发,提前预测行人及其他车辆的运动轨迹,找准时机来生成相对慢速但更高效的行车路线,慢速从行人身后通过。

要实现这种效果,感知、规控、训练,缺一不可。

例如,在感知方面,特斯拉提到了Occupancynetworks(占据网络)模型的应用和进化。通过占据网络,可以让模型获得预测物体所占据空间的能力,并在BEV内生成由一个个立方体组成的环境。

在规控中,这些“立方体”都将刻意避开,车辆可以在不识别具体的障碍物是什么的情况下做出避让动作。此外,FSD还可以据此识别道路坡度/曲率,这样就可以让车辆根据实际道路情况提前预测加速/减速,进一步提高安全性和舒适度。

而在训练方面,由于需要处理大量视频数据,因此特斯拉专门开发了“视频图书馆”。

它可以存储大量由用户采集的原始视频文件,并直接供给训练服务器。相比普通的存储服务器,它可以让训练速度提升30%,并且存储的文件更省空间(小了11%),读取速度也更快,最小每秒读写次数提升了4倍。

此外,特斯拉也在搞虚拟现实(仿真模拟)的自动生成。基于数字孪生,可以在虚拟世界中训练模型,据说效率比之前“提升了倍”。

该功能隔壁英伟达早就在搞,它的重要性在很多特定场景中都有体现。例如,自动驾驶在路口时的判断往往是有挑战性的,尤其是在路口有车辆时。

这是因为,系统需要判断这辆车是真的是“停止”了,还是在“低速行驶”。如果无法快速确认,就容易导致车辆的决策更谨慎,反映出来就是车辆在转弯或者路口时会主动减慢速度甚至停车。

那么,要对此进行改善,就需要进行大量的训练,以涵盖尽量多的情况。而对于这种特定场景,在虚拟世界中进行仿真模拟的效率就会更高。

Dojo超算

既然多次提到训练,那么专门用于模型训练的超算“Dojo”就该出场了。

在AIDAY上,Dojo开发人员提到,Dojo是专门用来进行模型训练的超级计算机,它往往要面对规模极大的模型,包含数以亿计的数据、参数,因此,保证高带宽、低延迟就成了关键。

而Dojo提高算力的方式,则是将25个D1芯片集成在一个“训练瓦片(Tile)”上,让每个“Tile”都具备54P算力和13.4TB/S对分带宽。

为了保证多个“Tile”间的通讯,特斯拉还开发了名为“Dojo接口处理器”的PCIE板卡,具备GB/s内存带宽、32G高带宽内存、TB/STTP带宽,PCIE4.0带宽为32G/s。

然后,特斯拉还将6个Tile、20片接口处理器组成一个托盘(Tray),而Dojo超算的每一个机柜(ExaPOD)则由至少两个托盘构成,有种套娃的感觉。

但这种方式显然是有效的,每台ExaPOD的训练性能都非常夸张,具备1.1E算力、1.3T高速内存、13TB高带宽内存,4台即相当72个GPU机柜的训练性能。

但这种方式面临一个问题:供电。

每个“Tile”内建25个D1芯片,而每颗芯片的功耗就高达W,单25颗芯片的功耗即高达10kW。而每个托盘具备6个Tile和20片接口处理器,功耗直奔+kW。

为此,研发人员自研了功率密度非常高的垂直堆叠的电源模块,同时相比对外采购成本更低。

在AIDAY现场,展出了Dojo机柜的实物,可证明其研发已基本结束。特斯拉也表示,第一台ExaPOD将于年Q1推出,届时特斯拉的AI训练能力将迎来提升。

HW4.0鸽了

由于AIDAY的跳票,很多人猜测,是不是在为下一代车载计算机硬件HW4.0做准备,而且在推特上也有人爆料,HW4.0将在今天推出。

但HW4.0,它鸽了。

在活动现场,当人们问马斯克HW4.0将何时发布时,他回答道:“IfItoldyoui’dhavetokillyou!”

显然短期内我们不太可能见到HW4.0了,不过我们也可以因此对它抱有更多期待,比如7nm的第二代FSD芯片?针对Transformer模型推理的特化架构?万像素甚至万像素的摄像头?或者是,前不久刚刚曝光的高分辨率雷达?

不过,按照HW3.0上线时的操作来看,如果特斯拉公布了HW4.0,可能意味着HW4.0已经开始了量产,甚至已经开始批量装车,相信到那时会有更多直接信息的曝光。

谁知道呢?我们拭目以待吧!



转载请注明:http://www.aideyishus.com/lkyy/5039.html
------分隔线----------------------------