历時7年,特斯拉自動駕驶寫了一篇逆袭爽文

admin · 發表於 2024-8-21 18:07:00

特斯拉主動駕驶的重大彩蛋呈現了。

外洋黑客大神 GreenTheOnly 在特斯拉 FSD Beta 的代码中發明了一段暗藏代码。据领會，這段代码可以開启一個全新的模式「Elon Mode」（埃隆模式，代码以马斯克名字定名）。

若是車辆時速在 60km/h 如下，開启這一模式，車辆可以實現 L3 级主動駕驶，無需雙手独霸標的目的盘。

可以说，特斯拉在技能上已有能力實現 L3 级主動駕驶。只是，今朝其仍没有拿到當局的相干核准。

在主動駕驶范畴，特斯拉一骑绝尘。

可是，领先职位地方的铸就并不是旦夕。

复盘特斯拉主動駕驶成长進程，現實上不亚於看了一篇逆袭「爽文」。即便是特斯拉，也履历了從後進，到追逐超出，再到称王加冕，自我超出的五個時代。

2016 年，在 Mobileye 起首官宣「分離」後，特斯拉便起頭自研算法。時代有一段時候，其算法表示乃至不如 Mobileye。

直到 2020 年，重構算法後，特斯拉才确立了行業领頭羊的职位地方。

在這一時代出現的 BEV、Transfomer、主動標注等技能，現現在已成為現在行業廣泛延用的技能線路。

但特斯拉并未止步，又對算法举行了進级，好比時序信息的参加，進级到占用收集。

自始至终，特斯拉寻求的就不是「武林第一」的頭衔。

特斯拉的方针只有一個：在纯視觉方案下，若何用算法刻劃真正的物理世界，以實現主動駕驶。

总结来看，對峙視觉方案，特斯拉從「第一性原則」動身，针對算法問题举行延续迭代，使算法更趋势於理解真實世界。

0一、自研算法出生前夕，特斯拉與 Mobileye 分離

2016 年 5 月 7 日，一場產生於美國的車祸引發了全世界的存眷。

一辆 Model S（2015 年款）在利用 Autopilot 状况下，拦腰撞向了一辆垂直標的目的開来的白色挂車，變乱致使了一人灭亡。

彼時，這起變乱被媒體冠以「全世界首宗主動駕驶致命變乱」的题目經大举報导。

在遮天蔽日的報导之下，特斯拉的 Autopilot 成為了眾矢之的。

特斯拉和 Mobileye 的互助起頭於2014 年。

2014 年 10 月，特斯拉公布第一代硬件 Hardware 1.0，軟硬件均由 Mobileye 供给，主動駕驶芯片是 Mobileye 的 EyeQ3。

而在上述變乱產生的两個月後，2016 年 7 月，Mobileye 颁布發表了和特斯拉终止互助。供给商争先声明两邊互助决裂，這在汽車市場来讲很是罕有。

對付分離缘由，彼時两邊各不相谋。

在特斯拉看来，Mobileye 的黑盒模式是两邊分離的缘由地點。

特斯拉曾在一份文件中直言：黑盒模式之下，Mobileye 難以跟上特斯拉產物的成长步调。

而 Mobileye 則暗示：由於特斯拉的主動駕驶功效「跨越了平安的底線」，是以才终止了两邊的互助。

現實上，两邊的分離早有前兆。

2015 年，特斯拉就起頭结構自研主動駕驶軟硬件，Mobileye 被弃用只是時候問题。

2015 年 4 月，特斯拉组建了基於计较機視觉感知的軟件算法小组 Vision，筹备自研軟件。

同年，特斯拉還從 AMD 挖来了傳奇芯片設計師 Jim Keller。随後，在 2016 年，特斯拉起頭组建芯片研發l團队，并由 Jim Keller 担當 Autopilot 賣力人。

和浩繁俗套的情爱故事同样，與 Mobileye 分離以後，特斯拉也履历了短暂的低谷和掉。

但在随後的日子里，失意的特斯拉终极發展為主動駕驶范畴领頭羊。

0二、2016 年-2018 年特斯拉初出茅庐

在辞别了 Mobileye 以後，特斯拉選擇全栈自研主動駕驶算法，自主自强。

在主動駕驶軟硬件成长思绪上，马斯克為特斯拉制订了「硬件先行，軟件更新」的思绪。

硬件方面，2016 年 10 月，特斯拉還公布了第二代硬件 Hardware 2.0。主動駕驶芯片由英伟达供给，設置装备摆設 8 個摄像頭+12 個长途超声波雷达+1 個前置毫米波雷达，而且這一套設置装备摆設持续到了 Hardware3.0。

算法方面，特斯拉延用了業内通例的主干網布局；利用 2D 檢測器举行特性提取；以人工對数据举行標注。

总體来看，這一套主動駕驶算法還比力原始，相對於傳统。

值得一提的是，在這一時代，特斯拉主動駕驶算法仍處於技能追逐阶段。

從硬件設置装备摆設来看，虽然 HW2.0 優於此前 Mobileye 供给的的 HW1.0，但受限於軟件算法，彼時特斯拉的主動駕驶能力和 Mobileye 有着较大差距。

虽然2016 年 10 月，特斯拉推出了 HW2.0，但在空跑了泰半年後，直到2017 年 3 月，Model3/Y 才起頭可以或许真正用上 Autopilot 功效。

在算法能力追上 Mobileye 後，特斯拉發明，當前利用的算法存在着诸多不足。此中，最為较着的是效力問题。

在那一時代，主動駕驶的方针檢測廣泛遵守一個通用的收集布局：

Input → backbone → neck → head → Output

骨干收集 backbone 為特性提取收集，重要用於辨認图象中的多個工具；

neck 則重要賣力提取更加邃密的特性；

而在颠末特性提取以後，檢測頭 head 則為供给了输入的特性图暗示，好比檢測工具，實例朋分等。

值得一提的是，那時業内主動駕驶視觉神經收集都只有一個 head。

可是，在主動駕驶的場景中，常常必要在一個神經收集中同時完成多項使命，好比車道線檢測，人物檢測與追踪，旌旗灯号灯檢測等。

這就使得原有算法呈現了「脑壳不敷用」的環境。

是以，在 2018 年，特斯拉起頭了對主動駕驶算法的第一次改造，對准主動駕驶收集布局及效力。

0三、2018 年-2019 年算法芒刃初成

在此次算法改造中，特斯拉構建了多使命進修神經收集架構 HydraNet，并利用了特性提取收集 BiFPN。

這使得特斯拉算法效力获得了晋升。此中，最具特點的為 HydraNet。

Hydra 一词源於傳说中的生物「九頭蛇」，因此 HydraNet 也被称為「九頭蛇收集」。

以「九頭蛇」定名的缘由在於，HydraNet 布局可以或许完成多頭使命，而非此前的单一檢測。

相较於此前算法，HydraNet 可以或许削减反复的卷积计较，削减骨干收集计较数目，還可以或许将特定使命從骨干中解耦出来，举行零丁微调。

不外，這次改造更可能是一次算法的「微调」，并無到达重谈判超過性的水平。

在交融方法上，特斯拉采纳的還是後交融计谋，数据举行人工標注，且主動駕驶算法仿照照旧是小模子，與後续算法改造比拟，并無太大的冲破。

這一時代，在改進了傳统算法以後，特斯拉還對硬件举行了新一轮的更新。

在历經四年研發後，2019 年 4 月，特斯拉公布了 Hardware 3.0 體系。此中最大的亮點是特斯拉采纳了自研的 FSD 芯片。

特斯拉 FSD 芯片算力达 72TOPS，远高於那時市道市情上的主動駕驶芯片。同時，FSD 芯片以两块 NUD 為主，图片處置效力更高，且不装置激光雷达。

新硬件的公布，為特斯拉算法的下一次迭代供给了可能。

在完成硬件筹备的前期事情以後，特斯拉起頭了對主動駕驶算法的史诗级重構。

0四、2020 年特斯拉主動駕驶一骑绝尘

2020 年 8 月，马斯克在推特上發文称，Autopilot l團队正對軟件的底层代码举行重寫和深度神經收集重構；全新的練習计较機 Dojo 正在開辟。

马斯克的一封推文激發浪千重。市場對特斯拉主動駕驶算法的成长標的目的投以存眷。

在他眼里，對 AP 的重寫，不是對現有布局的優化，而是一場「量子式跃迁」。

纵览特斯拉自研算法近十年進程，2020 年可以说是其最為璀璨的一年。

在這一場行業重構中，特斯拉带来的一系列技能標的目的被主動駕驶行業延用至今，如 BEV+Transformer 的组合，DIY手鍊,特性级交融代替了後交融，数据自我標注代替人工標注等。

若是说 2020 年主動駕驶江湖是群雄逐鹿時代，那末，自 2020 年以後，這片江湖便進入了特斯拉期間。

(1）BEV+Transformer，主動駕驶進入大模子期間

在特斯拉的這場技能重構中，最為惹人注目標即是於 2020 年引入的 BEV+Transfomer 架構。

在特斯拉看来，曩昔主動駕驶寄托「2D 图象+ CNN」便诡计實現全主動駕驶是不太可能的。

重要缘由在於，摄像頭收集的数据是 2D 图象，但主動駕驶必要面临的倒是三维真實世界。

以二维数据解决三维問题，不大實際。

纯視觉線路之下，摄像頭拍摄的 2D 图象若何「升维」到 3D，成為了特斯拉必要思虑的問题。

在特斯拉看来，2D 图象「升维」的最好表达方法是：BEV（俯瞰图）。

BEV 視角，構成車身自坐標系的益處在於两方面：

一是将分歧視角在 BEV 下同一表达是很天然的描寫，有益於後续计劃節制模块使命；

二是 BEV 視角解决了图象視角下的標准和遮挡問题。

但紧接着問题就来了：若何實現 2D 向 3D 的转換，以引入 BEV？

2D 图象是照片，存在近大远小的問题。而解决「近大远小」問题的傳统變化法子是寄托 IPM（逆透視幻化），举行先 2D 再 3D 的正向開辟。

IPM，简而言之，就是操纵拍照機成像進程中坐標转換的公式，在已知照片的光圈，焦距等前提下，去「算出」3D 坐標数据，對 2D 的图象举行「3D 回复复兴」。

可是，和讲堂上的算数题同样，如许的计较必要以各類「完善」假如為条件。好比，地面是「完善」程度的，相機和地面不存在相對於活動等。

也便是说，只要車辆有任何一點波動，門路有一點不服，就會冲破這個假如，致使终极的成像成果失真。

此外，在一系列卷积，提取特性，交融以後，获得的感知成果，再投影到 BEV 空間中，精度很差，特别是远間隔的區域。

以此来看，操纵傳统法子，實現從 2D 到 3D 的「升维」，很難實現。

在如许的環境下，特斯拉引入大模子 Transformer，举行 3D 到 2D 的逆向開辟。

在這一方法中，特斯拉先在 BEV 空間层中初始化特性，再通過量层的 Transformer 和 2D 图象特性举行交互交融，终极获得 BEV 特性，也就是先 3D 再 2D，反向開辟，實現 BEV 的转換。

Transformer 是一種基於注重力機制（Attention）的神經收集模子。與傳统神經收集 RNN 和 CNN 分歧，Transformer 不會依照串行次序来處置数据，而是經由過程注重力機制，去發掘序列中分歧元素的接洽及相干性。

這類機制暗地里，使得 Transformer 可以顺應分歧长度和分歧布局的输入。

Transformer 的引入，使得 BEV 視角在主動駕驶范畴得以實現。

而 3D 空間的引入，使得主動駕驶的思惟方法，更靠近於真實世界。

可是，在這一阶段，BEV 空間還是對瞬時的图象片断举行感知，缺少時候序列信息，主動駕驶仍未進入 4D 空間。

（2）特性级交融代替後交融成為主流

BEV 即俯瞰图，「天主視角」，車身自坐標系。

若仅從界说来看，BEV 也许是特斯拉各種「烧脑」術语中最轻易理解的。但這丝绝不影响 BEV 對主動駕驶行業的价值和意义。

引入 BEV 視角後，给主動駕驶带来最直觀的變革是，鞭策 2D 图象向 3D 車身自坐標系的變化，便利後续的决议计劃和節制。

但除此以外，BEV 還使得主動駕驶從後交融（或称「决议计劃层交融」）向特性级交融（或称「中交融」）標的目的迈進。

统一物體在分歧傳感器視角中的状况

主動駕驶的每個傳感器，都在對方圆世界举行感知。

每一個摄像頭、雷达都包括了其對真實世界的理解，但因為角度，傳感器類型的分歧，使得車辆没法子寄托一個傳感器完成對方圆世界的熟悉。

是以，每一個傳感器所感知的只是實際世界的此中一块拼图，要實現主動駕驶，便必要完成拼图拼集。

而傳感器数据的交融則可以當作是拼图的拼集步调。

所谓的後交融，即是由决议计劃层域節制器举行拼图的拼集。

後交融的益處很是较着，傳感器「即插即用」，交融在域節制器决议计劃层，對芯片算力请求较低。

後交融计谋對車端算力请求仅在 100TOPS 之内，作為参考，前交融却必要 500-1000TOPS 算力。

而特性级交融介於二者之間，约莫必要 300-400TOPS。

是以，在主動駕驶的初期，因為門坎低，後交融计谋遭到了主動駕驶供给商、車企的接待。

可是，後交融计谋轻易發生信息失真，造成毛病决议计劃。

後交融计谋下，低置信度信息會被過滤掉，發生原始数据的丢失，而且可能偏差叠加，致使信息「失真」。

特别是在卑劣氣候下，如许的環境更加较着。這就有可能造成决议计劃层毛病决议计劃。

相较於後交融计谋，特性级交融本色上更靠近於傳感器的原始数据。是以，其正确度必定會更高。

除此以外，在 BEV 空間层举行特性级交融，還具备多種益處，更是後续行業改造的標的目的：

跨摄像頭交融和多模交融更容易實現。大大都行業公司采纳的是异構傳感器（摄像頭、激光雷达、毫米波雷达等）的感知方案。而 BEV 空間可以或许同一傳感器数据维度，更易實現特性交融。

時序交融更容易實現。

可「脑补」出遮挡區域的方针。

更便利端到端做優化。

得益於此，BEV 架構也成為了海内主動駕驶公司延用的根基標的目的。

（3）数据從人工標注转向自我標注

在主動駕驶圈，有一句名言：数据决议了算法的上限，模子只是不绝的迫近這個上限。

数据燃料在主動駕驶算法練習中的职位地方可見一斑。

為了确保投喂给算法的数据准确而有利，曩昔主動駕驶行業常常都采纳人工標注的方法。

特斯拉也不破例。

在 2018 年時，特斯拉選擇和第三方公司互助，但如许的方法標注效力很低，而且沟通的本錢很高。

為了實現標注效力和質量的晋升，特斯拉自建了標注l團队，职員范围一度跨越 1000 人。

2D 图象的人工標注

可是，自建標注l團队也随之带来了新問题。

跟着主動駕驶数据的進一步扩展，所需的標注职員数目也在進一步增加，這象征着本錢水长船高。

鉴於高本錢，低效力的属性，人工標注天然地成了特斯拉的「眼中刺」。

在 BEV+Transfomer 引入後，特斯拉的数据標注效力获得了必定晋升。在引入 BEV 空間层前，標注职員必要標识表記標帜 8 张 2D 图象，而在 BEV 空間层下，仅必要举行一次 3D 空間中的標注即可完成。

可是，因為人類標注員對付语义信息更长於，而计较機對几何，重修，三角化，跟踪加倍长於。

這使得 BEV 下，数据標注是一種「半主動」状况，必要人工和计较機举行协作。

同時，虽然標注的效力有所增长，但在数据的指数级增加下，仿照照旧左支右绌。

明显，主動標注才是效力、结果、本錢三方抵牾的终极破局法子。

為此，在 2020 年起頭，特斯拉研發并利用了数据主動標注體系。

特斯拉数据標注的思绪很是简略：用更多的数据練習更大的模子，再用「大模子」的数据練習車端「小模子」。

在車辆行驶進程中，摄像頭采集的路面信息，打包上傳到辦事器的離線神經@收%OolZ6%集大模%73l25%子@，由大模子举行展望性標注，再反馈给車端各個傳感器。

因為傳感器視角分歧，當展望的標注成果在 8 個傳感器均显現一致時，則這一標注樂成。

而這一進程，也便是車载@模%73l25%子對辦%6a8Xu%事@器的大模子举行主動標注體系的蒸馏。

同時，車辆也在充任特斯拉「眾包舆图」收集車的脚色。

當分歧的車辆走在统一段路時，離線大模子将記實统一段路分歧的標注成果。

當数据標注體系将分歧車辆，分歧時候，分歧氣候状态下的標注成果叠加後，获得了一個具有高度一致性的標注成果，這也象征着，特斯拉获得了本身的「高精舆图」。

0五、2021 年-2022 年剑指端到端大模子

BEV+Transfomer 架構的引入，可以说是一場行業重構。

這一「黄金组合」在主動駕驶范畴有着诸多上風，是曩昔算法所不具有的。

可是，BEV+Transfomer 在推出之初，也并不是完善無瑕。

跟着主動駕驶的進一步成长，面對場景逐步多样化，coner case 愈来愈多，這便對主動駕驶算法的泛化能力提出了新的请求。

在随後的两年時候里，為了讓算法更靠近人類的思虑方法，特斯拉對 BEV+Transformer 架構举行了改進。

此中，最重要的两個改進是時序信息的增长和占用收集的利用。

固然 2020 年，特斯拉操纵 BEV 解决了 2D 向 3D 转換的空間問题，但却仍未引入時序信息。

也便是说，在上一個版本中，BEV 依然是對瞬時的图象片断举行感知，缺少時空影象力，汽車只能按照當前時刻感知到的信息举行果断。

時序信息的缺席，讓主動駕驶躲藏了极大的平安危害。

比方在行車進程中，若是有行人正在穿過马路，進程中被静止的停滞物遮挡，若是汽車唯一瞬時感知能力，因為在感知時刻行人正好被汽車遮挡，則没法辨認到行人，可能威逼駕乘职員和行人的平安。

人類司機在面临雷同場景時，則會按照以前時刻看到行人在穿越马路的影象，可以或许意想到行人被車辆遮挡，且有继续穿越马路的用意，從而選擇减速或刹車躲避。

若何给主動駕驶增长「影象」功效便显得尤其關頭。

是以，主動駕驶感知收集也必要具有雷同的影象能力，可以或许記着以前某一時候段的数据特性，從而推演今朝場景下可能性最大的成果，而不但仅是基於當前時刻看到的場景举行果断。

為领會决這一問题，特斯拉感知收集架構引入了時空序列特性层，利用視频片断，而不是图象来練習神經收集，為主動駕驶增加了短時影象能力。

除引入時序收集外，在 2022 年，特斯拉對 BEV 举行了進级——引入占用收集。

在曩昔，主動駕驶算法和人作比力，常常显得板滞、過於機器。

在傳统的主動駕驶算法中，大可能是寄托大数据豢養，得出「履历」，然後辨認物體，再举行决议计劃。

也便是说，算法必要履历，感知，辨识，决议计劃，履行如许的思虑流程。

但在實際世界里，真正的路况下，現實環境是扑朔迷離的，存在着大量的极度環境（corner case），要讓算法認全所有事物，明显不太實際，且效力不高。

以「二仙桥大爷」為例，若主動駕驶赶上了如斯「超载」的車辆，算法将其辨認為一般的三轮車，并果断路况，但對車後拖载的貨品，既不显示，也不辨認。

當主動駕驶的車辆举行超車變道時，就轻易產生剐蹭等變乱，躲藏必定危害。

為领會决這種問题，特斯拉将 BEV 進级到了占用收集（occupancy network）。

在 2D 图象世界中，一個物體由無数個像素點構成。

而在占用收集之下，3D 的真實世界則是由無数個细小立方體——體素重叠構成。

占用收集，将本来的 BEV 空間，朋分成無数的體素，再經由過程展望每個别素是是不是被占用。

简略来讲，不斟酌這個物體究竟是甚麼，只斟酌體素是不是被占用。這使得非典范但却存在的事物可以或许直接暗示出来，增长了算法的泛化能力和對實際世界的認知。

現實上，占用收集的體素，充任了激光雷达點阵的感化。而占用收集最直接的结果即是實現了「伪激光雷达」的结果。

時序信息的增长，進级占用收集，使得特斯拉主動駕驶算法的泛化能力获得了晋升。

而借助於算法晋升，特斯拉 FSD 更能刻劃真正的物理世界，進而才有可能實現端到端模子。

0六、将来，主動駕驶将走向何方

在主動駕驶范畴，特斯拉毫無疑難是领頭羊。

在肯定纯視觉線路後，特斯拉在主動駕驶算法长進行了四次迭代更新。除第一次是為追逐行業成长之外，其余更新均引领行業的成长。

特斯拉可以或许走在行業前列，除優异的l團队之外，更在於总體的思绪設計秉承「第一性道理思惟」。

所谓的「第一性道理思惟」，即一種寻根究底、究查最原始假如和最根赋性纪律的思惟習氣。

「物理學教會你按照第一性道理做出推理，而不是經由過程類比举行推理。類比式推理就是几近丝绝不差地仿照或摹拟别人。」马斯克曾如斯说到。

在特斯拉主動駕驶迭代思惟上，第一性道理思惟浸透在了各個方面：

计较效力不高，HEAD 部門不敷用？開辟了九頭蛇收集布局；

小模子没法履行并行计较，泛化能力不强，BEV 没法切确實現？引入大模子 Transfomer，逆向開辟；

現有芯片的组成冗余，不适配纯視觉線路需求，且本錢高？自研 FSD 芯片；

数据標注本錢高，数据練習量不足？扶植超算中間 DOJO，實現数据自我標注，同時虚拟場景練習算法，提高主動駕驶能力等等。

在锚定纯視觉線路後，特斯拉均在算法迭代中，针對各類問题，發明短板，并加以解决。

而這，恰是特斯拉执盟主的關頭。

同時，鉴於特斯拉的行業带领职位地方，鑽研其主動駕驶算法迭代進程後，也能讓外界窥見主動駕驶行業的将来。

（1）「轻舆图，重感知」成行業主流標的目的

在曩昔，主動駕驶行業，常常采纳高精舆图方案，辅助實現主動駕驶。

高精舆图可以或许供给超視距、厘米级相對於定位及导航信息，在数据和算法還没有成熟到脱图以前，可以或许成為整機廠的「手杖」，帮忙主動駕驶的落地。

可是，和其长處同样，高精舆图的错误谬误也很是较着：

必要图商收集更新，没法及時更新；

制图天資遭到严酷辦理，信息收集面對必定律例危害；

本錢昂贵昂扬。

在如许的環境下，特斯拉構建了本身的「高精舆图」。

經由過程 BEV 空間层，特斯拉将分歧視角的摄像頭收集到 2D 图象同一转換到 BEV 視角，車辆構成自車坐標系。

同時，引入辦事器的離線神經收集，實現数据主動標注，确保標注结果，且在無数「眾包收集車」的帮忙下，叠加標注成果，得出門路信息標注的「独一解」。

BEV、Transfomer、引入時序信息、数据主動標注等等，一系列技能加持之下，特斯拉才得以實現「無图」。

海内市場，「轻舆图，重感知」也成了行業成长的主流標的目的。

2022 年 4 月，毫末智行提出要做「重感知、轻舆图」的都會智能駕驶，起頭低落方案中高精舆图的权重，甚至做到無需高精舆图；

2022 年年末，小鹏公布了第二代智能辅助駕驶體系 XNGP，并對外颁布發表将解脱高精舆图限定；

2022 年下半年，华為余承东暗示：

「主動駕驶将来不该過度依靠於高精舆图、車路协同。」

本年 5 月，蔚来公布了 Banyan 2.0.0 體系，完成為了向 BEV 感知線路的切換；

海内一眾廠商深受特斯拉線路影响，延用 BEV 架構，起頭對高精舆图動刀，「重感知，轻舆图」線路成了市場主流成长標的目的。

特斯拉的 BEV+Transformer 方案為行業的「脱图」供给了技能上的可行性。

從特斯拉線路履历来看，若是要以纯算法，實現摆「脱图」，也许必要車企同時具有如下两個前提：

引入 BEV 架構，實現异構傳感器的交融，天生活舆图；

具有超算中間，或離線辦事器的大模子，可以或许實現主動標注及仿真練習；

今朝，「轻舆图」線路大多還是經由過程軟硬件連系的方法，低落高精舆图需求，本色上依然是「多傳感器+高精舆图」線路。

從行業成长趋向来看，海内車企也在向「云端大模子+BEV」的線路挨近，以期實現「脱图」。

6 月 17 日，在抱负汽車家庭科技日上，抱负副总裁兼主動駕驶賣力人郎咸朋便對外颁布了抱负汽車的 NPN 收集。

郎咸朋先容称，在車辆行經一段路時，NPN 收集将門路信息特性举行提取後，存储於云端。

而當車辆再次行驶到该路口時，再将贮存的門路特性拿出来，與車端模子举行特性层交融，以此解决門路信息的遮挡問题。

當 NPN @收%OolZ6%集對统%Jl9zd%一@路段重叠大量標注成果後，终极便到达了「高精舆图」的结果。

抱负汽車的「NPN 收集+BEV」現實上延用的就是特斯拉的「離線大模子+BEV」的技能線路。

（2） 進级到占用收集，實現去「激光雷达」

在 2022 年的 AI day 上，特斯拉将 BEV 進级到了占用收集。

占用收集显著的特色是，丢弃了曩昔算法必要先辨認、果断物體，再举行决议计劃的思绪。

在面临練習中没有呈現過的物體時，如侧翻的白色大卡車，垃圾桶呈現在路中心，傳统視觉算法是没法檢測的。

而占用收集，則用體素的觀點，仅仅是果断该空間有無物體，而不去穷究物體是甚麼。

這大幅晋升了模子的泛化能力，有助於都會 NOA 的實現。

從特斯拉 AI Day 演示结果来看，特斯拉經由過程俯瞰图、占用檢測和體素分類使纯視觉方案已到达「伪激光雷达」结果。

值得注重的是，在特斯拉公布的最新硬件 HW4.0 中，预留了 4D 毫米波雷达接口。這预示着特斯拉或将重启毫米波雷达，以补充纯視觉算法在高程信息感知上的不足。

從成原本看，公然報导显示，4D 毫米波雷达代价仅约為高線束激光雷达的 1/10。

（3）AI 大模子卷入主動駕驶，超算中間成標配

本年 5 月，马斯克發推文称，FSD11.流露称，FSD V12 版本将彻底實現端到端。

甚麼是端到端？

今朝，主動駕驶模子架構将駕驶方针分為感知、计劃、節制三大模块。

可是，這和人類駕驶举動有着底子的分歧。

人類司機在看到視觉信息後，不會對所看到的物體举行数据阐發，而是基於履历，在「黑盒」状况下完成駕驶决议计劃，并和谐手、脚履行使命。

而端到端模子更加切近人的駕驶决议计劃举動。

摄像頭收集到外界的視频数据後，算法直接输出的是標的疤痕去除方法,目的盘转角几多度的節制决议计劃，不存在零丁的「图象辨認檢測」使命。

端到端模子的决议计劃在「黑盒」状况下举行，經由過程付與数据，使算法积攒「履历」，使得其决议计劃和履行同步举行。

在抱负状况下，「黑盒」状况下的端到端大模子現實比基於法則設定的傳统小模子更加平安。

比起傳统的設定例則，参数對算法布局举行「补钉」式改正，只要投喂的准确案例足够多，那末 AI 大模子模子所必要的時候必定小於傳统法則。

而颠末足够的数据和案例的投喂，端到端模子的泛化能力也必定强於傳统的主動駕驶算法。

為了使得大模子落地，海量的数据投喂成為了廠商必定選擇。

毫末智行 CEO 顾维灏就曾公然暗示，要使由数据驱動的 Transformer 大模子量變引發質變必要 1 亿千米的里程数据。

這一海量数据明显没法零丁寄托某個廠家經由過程贩賣車辆完成。在如许的環境下，超算中間便成為了 AI 大模子落地的標配。

超算中間對大模子的助力重要體如今数据標注和仿真練習上。

特斯拉 2022 年公布的超算中間 Dojo 即是如斯。

特斯拉 Dojo 的功效，可以或许操纵海量的視频数据，做「無人羁系」的標注和仿真練習。

特斯拉打样在前，海内很多廠商也紧随厥後。在 2022 年今後，超算中間起頭活泼在主動駕驶范畴。

2022 年 8 月，基於阿里云智能计较平台，小鹏推出了扶摇超算中間，每秒浮點運算达 60 亿次，專用於主動駕驶摹拟練習。

同時，小鹏還推出了全主動標注體系，将標注效力晋升近 4.5 万倍，之前 2000 人一年的標注量，如今 16.7 天可以完成。

本年 1 月，毫末智行和火山引擎结合打造了 MANA OASIS 智算中間，用於主動標注及仿真練習。

据悉，MANA OASIS 智算中間，每秒浮點運算达 67 亿次，存储带宽每秒 2T，通讯带宽每秒 800G。

除小鹏和毫末之外，跟從特斯拉步调，海内車企設立的超算中間另有：吉祥設立了星瑞智算中間；智己汽車的云上数据超等工場等。

可以说，在主動駕驶范畴，特斯拉引领着行業的成长標的目的。

自 2020 年以来，特斯拉率先利用了 BEV、Transfomer 架構、離線@收%OolZ6%集大模%73l25%子@，随後，海内浩繁車企才起頭纷繁跟進。

而近一段時候，「FSD 入华」的话题經常激發市場會商。

在热议的暗地里，有概念認為，FSD 将是那条引發主動駕驶行業優越劣汰的鲶鱼。弦外之音尽是對行業赛道介入者的担心。

這倒也不消過度忧愁。

正如前文所言，特斯拉也并不是一起頭就是「江湖第一」。

在履历「被分離」後，特斯拉主動駕驶算法履历了後進，到追逐，再到引领的分歧時代，更可能是带有逆袭成份。

而逆袭的關頭點在於：選好方针，勇於「一条道走到黑」。

在曩昔一段時候里，市場對付特斯拉的纯視觉方案其實不看好。很多業内概念認為，激光雷达是平安件，纯視觉方案的主動駕驶其實不具有可行性。

但在肯定纯視觉線路今後，针對纯視觉方案的各類問题，特斯拉從第一性道理動身，思虑切當問题的底子，并提出解决方法。

终极的成果是，特斯拉成為主動駕驶领頭羊。防鏽漆種類,

今朝，主動駕驶也并未到决赛阶段。對付海内這一赛道的介入者，市場要有足够信念。

究竟结果，特斯拉 FSD 仍未入华，而赛道介入者的较劲仍未真正起頭。

		自動登錄	找回密碼
密碼			立即註冊

历時7年,特斯拉自動駕驶寫了一篇逆袭爽文

瀏覽過的版塊