国产日韩欧美在线_日韩精品中文在线_成人图片综合在线网站_911亚洲清品青草衣衣麻豆_综合国产日本影视_中文字幕日韓视频_亚洲av无码成人h动漫无遮_k频道欧美成人午夜视频综合_欧美日韩一中文字幕精品_无码?V不卡在线看DVD

快捷導(dǎo)航

AI浪潮下的數(shù)據(jù):自動駕駛需要何種標(biāo)注?

2024-5-31 15:57| 發(fā)布者: admin| 查看: 184| 評論: 0
摘要: 自動駕駛是人工智能時代里最令人興奮的科技之一。過去大約十年來,自動駕駛技術(shù)開始起步并得到一定程度發(fā)展,但目前仍然在等待里程碑式的突破,以期未來真正實現(xiàn)規(guī)模化應(yīng)用。Holger Caesar是荷蘭代爾夫特理工大學(xué)智 ...
自動駕駛是人工智能時代里最令人興奮的科技之一。過去大約十年來,自動駕駛技術(shù)開始起步并得到一定程度發(fā)展,但目前仍然在等待里程碑式的突破,以期未來真正實現(xiàn)規(guī)?;瘧?yīng)用。

Holger Caesar是荷蘭代爾夫特理工大學(xué)智能車輛組助理教授,他的學(xué)術(shù)生涯幾乎和這一代自動駕駛浪潮同步啟程,因此,他將過去約10年的時光專注在了這個領(lǐng)域的技術(shù)研究。其間,他在自動駕駛明星公司Motional作為項目負(fù)責(zé)人主導(dǎo)開發(fā)了自動駕駛數(shù)據(jù)集nuScenes和nuPlan,自2019年以來,這兩個數(shù)據(jù)集也位居全球范圍內(nèi)最為使用廣泛的開源自動駕駛數(shù)據(jù)集前列。

事實上,數(shù)據(jù)是算法、算力之外第三駕驅(qū)動人工智能發(fā)展的馬車,不少行業(yè)人士都認(rèn)為,好的數(shù)據(jù)集十分難得,甚至是算力和算法發(fā)揮價值的前提條件。

在人工智能新一輪浪潮來臨時,Holger Caesar正致力于將自動駕駛數(shù)據(jù)集帶向第三代。他告訴南方財經(jīng)全媒體記者:“自動駕駛數(shù)據(jù)集的標(biāo)注量可以縮小至目前水平的1/20至1/100,未來可能覆蓋全球場景。”其中,基礎(chǔ)模型的迅速發(fā)展帶來了更便利的自動化,但帶來的行業(yè)格局演變也正引起從業(yè)者的警惕。

數(shù)據(jù)標(biāo)注進入自動化的第三代



“基于模型訓(xùn)練、減少人工標(biāo)注,數(shù)據(jù)集應(yīng)該是更加可拓展(scalable)、成本可負(fù)擔(dān)(affordable)的?!?月末在上海,Holger向南方財經(jīng)全媒體記者講述了他開發(fā)三代自動駕駛數(shù)據(jù)集的經(jīng)歷。

在自動駕駛數(shù)據(jù)集起步之初,數(shù)據(jù)采集的小時數(shù)、車輛行駛區(qū)域等均受到限制,而且所有的標(biāo)注全由人力操作。第一代數(shù)據(jù)集nuScenes正是如此,它采樣于波士頓和新加坡,總時長僅有5.5小時。

盡管如此,這已經(jīng)包含大量信息。這短短數(shù)小時的素材獲取了1000個場景,同時涵蓋北美洲和亞洲城市不同的路況和天氣,也同時覆蓋了左行和右行交通規(guī)則,其中,多雨的新加坡給數(shù)據(jù)標(biāo)注帶來了相當(dāng)大的挑戰(zhàn)。

nuScenes也是全球首個全感應(yīng)的數(shù)據(jù)集,這意味著它并非僅依靠相機或激光雷達采集數(shù)據(jù),而是結(jié)合了二者以及雷達、GPS和IMU(慣性測量單元)數(shù)據(jù)。這個數(shù)據(jù)集最終包括140萬張圖片,其中在4萬張關(guān)鍵圖片中包含140萬個標(biāo)注框。

從2016年到2019年,全球不同機構(gòu)采集均使用人工方法為自動駕駛數(shù)據(jù)集進行標(biāo)注,nuScenes的標(biāo)注量已經(jīng)足夠說明,人工方法下的數(shù)據(jù)集建立有場景數(shù)量天花板(通常不超過1000個),而且開發(fā)時間長、人工培訓(xùn)成本高。盡管如此,初代數(shù)據(jù)集的開發(fā)令自動駕駛研發(fā)打開了局面。

第二代數(shù)據(jù)集nuPlan是全球第一個大規(guī)模的規(guī)劃型數(shù)據(jù)集,這一代數(shù)據(jù)加強了標(biāo)注階段的自動化,將數(shù)據(jù)集的小時數(shù)從5小時水平提升到1000小時以上。數(shù)據(jù)最終采集自波士頓、匹茲堡、拉斯維加斯和新加坡,包含1282個小時的行車數(shù)據(jù)。使用如此大的訓(xùn)練量,將數(shù)據(jù)集能力從感知(perception)提升到了規(guī)劃(planning),也意味著將自動駕駛技術(shù)從低等級的輔助駕駛進一步提升到了自動駕駛能力。

和上一代數(shù)據(jù)集不同的是,nuPlan將離線和實時數(shù)據(jù)進行了結(jié)合,利用離線感知(offline perception)進行了場景標(biāo)記和交通燈模擬,更適合用于自動駕駛規(guī)劃(planning)和預(yù)測(Prediction)。

然而,底層離線感知系統(tǒng)仍然需要人力標(biāo)注,這仍然導(dǎo)致數(shù)據(jù)集昂貴且耗時。

目前,Holger設(shè)想第三代數(shù)據(jù)集將幾乎不需要人類標(biāo)注工作,這樣可以極大降低數(shù)據(jù)集開發(fā)成本,并進一步提升可拓展性。“目前,全球僅有少數(shù)超大公司可以負(fù)擔(dān)自動駕駛數(shù)據(jù)集開發(fā),我希望能將AI開發(fā)進一步普及化,激發(fā)小公司和創(chuàng)新公司利用AI的能力。”Holger稱。

第三代數(shù)據(jù)集利用主動學(xué)習(xí)(active learning)、自監(jiān)督學(xué)習(xí)(self supervised learning)、基礎(chǔ)模型(foundation model)和語言模型(language model)等技術(shù),這些方法可以將人力標(biāo)注工作降低數(shù)個數(shù)量級,大約是上一代技術(shù)標(biāo)注量的1/20至1/100。它還能靈活地適應(yīng)新車輛、新城市等變量,未來可以開發(fā)有關(guān)自行車、火車和船只的新數(shù)據(jù)集。

“未來,數(shù)據(jù)集開發(fā)方法還可以進一步應(yīng)用到機器人、無人機、衛(wèi)星、安防等領(lǐng)域?!盚olger表示,這意味著自動駕駛領(lǐng)域的又一新技術(shù)將帶來新的行業(yè)革命。

人工智能令從業(yè)者興奮



人工智能為自動駕駛解決了一個又一個難題,令后者不再只是一個封閉場景里的幻想,而更可能在未來于廣闊世界里成為現(xiàn)實。作為從業(yè)者,從2022年下半年開始的人工智能浪潮令他感到興奮,同時新格局變化也令他產(chǎn)生了一些警惕。

首先是基礎(chǔ)模型經(jīng)由“轉(zhuǎn)換器(transformer)”改造以來,變得更加強大,適應(yīng)大規(guī)模的神經(jīng)網(wǎng)絡(luò)模型建立,并產(chǎn)生了不少震撼市場的大語言模型和多模態(tài)模型。“Transformer的到來讓人驚嘆,它把數(shù)據(jù)集提升到了一個高得多的量級,分析能力也更強勁了?!盚olger指出。

Transformer是一種新型神經(jīng)網(wǎng)絡(luò),大眾熟知的ChatGPT、GPT系列模型、BERT模型等正是基于transformer開發(fā)的。

目前,全球基礎(chǔ)模型仍在不斷開發(fā),而這給數(shù)據(jù)標(biāo)注帶來了更多便利。Holger表示,這是因為基礎(chǔ)模型能讓圖片訓(xùn)練適用于所有條件,也就是說,當(dāng)天氣、城市、攝像頭等條件變化時,模型仍能自動訓(xùn)練。

隨著大語言模型在全球范圍的流行,Holger認(rèn)為這也可以給數(shù)據(jù)標(biāo)注行業(yè)帶來更多便利?!霸O(shè)想使用自然語言進行數(shù)據(jù)標(biāo)注,例如對一張圖片進行所有車輛標(biāo)注,還能進一步修改標(biāo)注目標(biāo),例如將圖片中的卡車排除標(biāo)注,這會令數(shù)據(jù)標(biāo)注更加方便?!盚olger稱。

除此以外,數(shù)據(jù)集訓(xùn)練也在更趨人道、環(huán)保和節(jié)能。由于在第三代數(shù)據(jù)集中使用自監(jiān)督學(xué)習(xí)和主動學(xué)習(xí),標(biāo)注量成倍縮小?!皬乃懔Φ慕嵌龋@更加高效,也意味著更節(jié)能環(huán)保?!盚olger稱,另外,數(shù)據(jù)標(biāo)注行業(yè)從前幾乎等同于“低薪高壓”工作的代名詞,未來也可能縮小這種工作量,轉(zhuǎn)而增強職業(yè)訓(xùn)練技能。

此外,新的模型訓(xùn)練也將覆蓋更多的“邊界情況(corner case)”,即那些不常見但對自動駕駛安全至關(guān)重要的場景,令自動駕駛真正從實驗室里走到現(xiàn)實道路中。“在第三代技術(shù)中,我們正試圖通過結(jié)合無監(jiān)督學(xué)習(xí)去抓捕混合的車輛等,從而覆蓋更多的‘邊界’?!盚olger稱。

不過,部分人工智能科技的發(fā)展正在悄然改變行業(yè)格局,這給從業(yè)者帶來了一些關(guān)于未來的隱憂。

算力硬件設(shè)備明顯變得更加昂貴、供不應(yīng)求,這是因為超大型人工智能公司正在囤積算力芯片,而部分公司擁有供應(yīng)相關(guān)芯片的壟斷地位。“未來的算力市場上,應(yīng)該有更多公司供應(yīng)算力芯片,而非只有一兩家?!盚olger表示。

此外,“盡管基礎(chǔ)模型的通用性非常強大,但這可能導(dǎo)致技術(shù)掌握在個別超大公司手中,這對于其他也在開發(fā)基礎(chǔ)模型的創(chuàng)新機構(gòu)不利?!盚olger稱。

不過,Holger對大學(xué)和創(chuàng)新型研究機構(gòu)在人工智能中的角色保持信心?!按笮蜕虡I(yè)機構(gòu)并不總是關(guān)心人工智能技術(shù)發(fā)展,因此這是我們(大學(xué))發(fā)揮創(chuàng)新之處,我們也將把現(xiàn)有商用人工智能變得更加高效節(jié)能?!盚olger稱。

商用AI可能會追逐周期浪潮,資金總是在行業(yè)高峰期進行堆積,但在行業(yè)低谷期撤退。Holger認(rèn)為,人工智能發(fā)展也應(yīng)該更加理性,一些熱潮還需要時間驗證。

更多內(nèi)容請下載21財經(jīng)APP

鮮花

握手

雷人

路過

雞蛋

關(guān)注我們:東遠物聯(lián)

抖音

微信咨詢

咨詢電話:

199-2833-9866

D-Think | 廣州東遠智能科技有限公司

地址:廣州市白云區(qū)北太路1633號廣州民營科技園科創(chuàng)中心2棟16樓

電話:+86 020-87227952 Email:iot@D-Think.cn

Copyright  ©2020  東遠科技  粵ICP備2024254589號

免責(zé)申明:部分圖文表述來自于網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系作者刪除!