Discuz! Board

 找回密碼
 立即註冊
搜索
熱搜: 活動 交友 discuz
查看: 357|回復: 0
打印 上一主題 下一主題

Sora會改變自動駕驶的终局嗎?

[複製鏈接]

1116

主題

1116

帖子

3353

積分

管理員

Rank: 9Rank: 9Rank: 9

積分
3353
跳轉到指定樓層
樓主
發表於 2024-4-24 18:25:34 | 只看該作者 回帖獎勵 |正序瀏覽 |閱讀模式
今朝,视频天生法子重要分為两類:基于Transformer和基于分散模子。

前者源于大型说话模子方案,凡是是采纳對下一個Token的自回归展望或對masked Token的并行解码来天生视频。

操纵Transformer举行Token展望可以高效進修到视频旌旗灯号的動态信電動清潔刷,息,并可以复用大说话模子范畴的@履%MBk妹妹%历@,是以,基于Transformer的方案是進修通用世界模子的一種有用路子。

分散模子是近两年来视频天生范畴的鑽研热門,是“文生图”的代表,相干鑽研功效也有很多。好比在2D分散模子潜伏空間的根本上引入時候维度,并利用视频数据举行微调,有用地将图象天生器變化為视频天生器,實现高辨别率视频合成;有基于預練習的2D分散模子構建了级联视频分散模子;也有基于Transformer的分散模子改良了视频天生。

不外,基于分散模子的法子難以在单一模子内整合多種模态。别的,基于分散模子的方案難以拓展到更大参数,是以很難進修到通用世界的變革和活動纪律。

Sora则是连系了Transformer 和 Diffusion 两個模子,在曩昔DALL.E和GPT的鑽研根本上,采纳了DALL.E 3中的重述技能。是以能更好遵守用户的文本描写,而且有极强的扩大性。

再简略些,OpenAI用GPT驅蚊凝膠,的能力做视频文本對齐,經由過程将多個高辨别率视频素材举行降维處置,然後密集練習,最後就是咱們認識的鼎力出古迹。

陽光底下無新颖事,固然没有收集巨细、用了哪些数据、详细怎男性保健品,样練習等细節,但從OpenAI颁布的陈述中,并無“武功秘笈”般的存在,思绪和法子都是大師認識的工具。

但AI热與明星公司OpenAI的连系,再加之关于技能自己以外的會商,讓Sora的热度来到了极高的位置,也引出了大師對主動駕驶結局的會商。

2月18日,马斯克在科技主播 @Dr.KnowItAll 一条主题為“OpenAI 的重磅炸弹證明了特斯拉的理论”的视频下留言,暗示“特斯拉已可以或许用切确物理道理建造真實世界视频约莫一年了”。

随後马斯克在 X 上轉發了一条 2023 年的视频,内容是特斯拉主動駕驶总监 Ashok Elluswamy 向外界先容特斯拉若何用 AI 摹拟真實世界駕驶。

練習 AI 理解和天生一個真正的場景或世界,是特斯拉與Sora一致的練習思绪。

曩昔十几年,固然技能在不竭迭代,但主動駕驶的本色仍然是經由過程海量数据教會體系開車,即使今朝在很多环節已有大模子参加,也只是加快了進程,并無解决主動駕驶研發進程中碰见的問题。

“可是主動駕驶從世界感知進入到通用認知今後,主動駕驶的本色极可能就會產生變革,那就是Al Agent——LLM+Memory+Tool+Planning。主動駕驶就酿成了怎样教一個通用伶俐體開車的問题,@經%auJTx%由%auJTx%過%auJTx%程大模%d4tRs%子@的預練習去學會推理、影象等能力和門路駕驶等通用常識,經由過程SFT去强化場景駕驶举動,經由過程RL把数据闭环酿成嘉奖模子。這跟當前依靠海量数生髮精油,据和Corner Case的思绪彻底分歧。” 杨继峰说道。

“(主動駕驶)终极可能就是一個说话模子加世界模子。”黄冠也提出了雷同概念。

可以说,對付主動駕驶,Sora此次的小试牛刀,不但頭皮癬藥膏,展现出了相干技能在主動駕驶仿真范畴的利用潜力,更是讓行業看到大模子對真實世界有了理解和摹拟以後,激發了對付主動駕驶成长標的目的的思虑。

這場AI热给主動駕驶带来的新课题,已然摆在面前。
回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

Archiver|手機版|小黑屋|新北市學車交流論壇  

跨境電商, 加盟創業, 國際旅遊鞋工廠, 廢棄物處理公司, 品牌設計,

GMT+8, 2024-12-5 10:42 , Processed in 0.154401 second(s), 5 queries , File On.

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

快速回復 返回頂部 返回列表