ChatGPT的火爆,讓AI大模型成為各大科技巨頭爭相布局的重點。
無論是國外的微軟、谷歌、Meta,還是國內的百度、華為、阿里、商湯等企業,都已經涉足AI大模型的研究與探索。
如同2016年AlphaGo的橫空出世一般,AI大模型的爆發也是引發AI變革的劃時代里程碑。阿里巴巴集團董事會主席兼CEO張勇甚至認為,所有行業、所有應用、所有軟件、所有服務都值得基于新型人工智能技術以及大模型支撐重做一遍。
英偉達CEO黃仁勛也曾表達過同樣的觀點,他認為AI產業迎來“iPhone”時刻,AI技術爆炸、產業爆發的趨勢已經勢不可擋,甚至將撬動涵蓋交通醫療、運輸、零售及物流在內的百萬億美金的市場。
正如毫末智行董事長張凱在4月11日舉辦的第八屆HAOMO AI DAY的演講中所形容的,“距離上一屆HAOMO AI DAY剛剛過去三個月,卻仿佛跨入了一個新周期”,一系列AI大模型的陸續發布,讓更多人相信人工智能技術迎來從量變到質變的重大節點。
在第八屆HAOMO AI DAY上,毫末智行也發布了業內首個自動駕駛生成式大模型DriveGPT,中文名“雪湖·海若”。
△毫末智行董事長張凱、CEO顧維灝、COO侯軍、CIO甄龍豹在HAOMO AI DAY現場
對于大模型,毫末并不陌生。此次發布自動駕駛生成式大模型DriveGPT雪湖·海若,既不是毫末的跟風之舉,也不是為了蹭GPT的熱點。
早在兩年前,毫末就已經開始關注并投入到AI大模型技術的研發之中。在AI自動駕駛領域,毫末可以說是大模型研發和應用的先行者。
毫末為什么要研發DriveGPT雪湖·海若?
毫末智行CEO顧維灝說,他在這段時間經常會被問到這個問題。在毫末看來,DriveGPT雪湖·海若將會重塑汽車智能化技術路線,讓輔助駕駛進化更快,讓自動駕駛更早到來。
張凱判斷,2023年智駕產品將進入全線爆發期,“生成式大模型將成為自動駕駛系統進化的關鍵”。
接下來,基于 Transformer 大模型訓練的感知、認知算法會逐步在車端進行落地部署,而隨著大模型開啟在車端的落地應用,車主的使用頻率和滿意度成為產品競爭力的重要衡量標準。張凱表示,“毫末不斷進步的數據驅動的六大閉環能力,將進一步加速毫末進入自動駕駛3.0時代的步伐,并形成相應的護城河”。
01
業內首個自動駕駛生成式大模型
最近一段時間,關于自動駕駛的未來,行業內出現了截然不同的觀點。
樂觀派認為到2030年之前L3級自動駕駛將會批量落地;悲觀派斷定,“十年內L3自動駕駛技術都不會到來”;唱衰派則稱自動駕駛“都是扯淡...都是忽悠,就是一場皇帝的新裝……最終就是一個高級輔助駕駛而已”。
無論哪一派觀點,一個不容忽視的現實是,自動駕駛技術的變革才剛剛開始。特別是AI大模型引發的產業應用和變革,更是為自動駕駛技術發展注入全新的動力。
同濟大學教授、汽車安全技術研究所所長朱西產也在第八屆HAOMO AI DAY上分享了自己的觀點:自動駕駛不能長期停留在L2+,還是要去做到L3、L4,最終走向終局的無人駕駛。
毫末也一直相信,AI大模型已成為自動駕駛技術進化的核心動力之一。在今年1月的第七屆HAOMO AI DAY上,顧維灝就分享了其智算中心,以及從感知到認知以及仿真的五大大模型,包括視覺自監督大模型、3D重建大模型、多模態互監督大模型、動態環境大模型、人駕自監督認知大模型。
毫末這五大大模型,與如今爆火的AI大模型有很多共同之處。
據顧維灝介紹,DriveGPT雪湖·海若通過引入駕駛數據建立RLHF(人類反饋強化學習)技術,對自動駕駛認知決策模型進行持續優化。
現階段,DriveGPT雪湖·海若主要用于解決自動駕駛的認知決策問題,后續持續會將毫末多個大模型的能力整合到DriveGPT,但最終目標是實現端到端自動駕駛。
目前,毫末DriveGPT雪湖·海若實現了模型架構與參數規模的升級,參數規模達到1200億,預訓練階段引入4000萬公里量產車駕駛數據,RLHF階段引入 5萬段人工精選的困難場景接管Clips。
DriveGPT雪湖·海若的底層模型采用GPT(Generative Pre-trained Transformer)生成式預訓練大模型,不過與ChatGPT使用自然語言進行輸入與輸出不同,DriveGPT輸入是感知融合后的文本序列,輸出是自動駕駛場景文本序列,即將自動駕駛場景Token化,形成“Drive Language”,最終完成自車的決策規控、障礙物預測以及決策邏輯鏈的輸出等任務。
在實現過程上,DriveGPT雪湖·海若首先在預訓練階段通過引入量產駕駛數據,訓練初始模型,再通過引入駕駛接管Clips數據完成反饋模型(Reward Model)的訓練,然后再通過強化學習的方式,使用反饋模型去不斷優化迭代初始模型,形成對自動駕駛認知決策模型的持續優化。
同時,DriveGPT雪湖·海若還會根據輸入端的提示語以及毫末CSS自動駕駛場景庫的決策樣本去訓練模型,讓模型學習推理關系,從而將完整駕駛策略拆分為自動駕駛場景的動態識別過程,完成可理解、可解釋的推理邏輯鏈生成。
隨著技術不斷優化,DriveGPT雪湖·海若將逐步應用到城市NOH、捷徑推薦、智能陪練以及脫困場景中。
從用戶可感知的角度來看,有了DriveGPT雪湖·海若的加持,車輛行駛會更安全;動作更人性、更絲滑,并有合理的邏輯告訴駕駛者,車輛為何選擇這樣的決策動作。也就是說車輛的智能駕駛系統會越來越像老司機,從而加強用戶對智能產品的信任感。
顧維灝透露,DriveGPT雪湖·海若的首發車型是新摩卡DHT-PHEV,即將量產上市。
值得一提的是,毫末DriveGPT雪湖·海若已正式對外開放,開啟對限量首批客戶的合作,除了魏牌新能源,北京交通大學計算機與信息技術學院、高通、火山引擎、華為云、京東科技、四維圖新、英特爾等已經加入。
毫末DriveGPT雪湖·海若將攜手生態伙伴率先探索四大應用能力,包括智能駕駛、駕駛場景識別、駕駛行為驗證、困難場景脫困。
這將有效促進自動駕駛從業者和研究機構快速構建基礎能力。
02
數據驅動技術升級
毫末一直堅信數據是人工智能最大的驅動力,并一直以數據驅動的方式來推動自動駕駛產品的升級。
截止到2023月4月,毫末輔助駕駛用戶行駛里程已經突破4000萬公里,小魔駝的配送量也超過了16萬單,MANA的學習時長超過56萬小時,虛擬駕齡相當于人類司機6.8萬年。
顧維灝表示,這些數據每時每刻都在增長變化,2023年將迎來指數級增長。
在對數據的大量應用過程中,毫末已經逐步建立起一套基于4D Clips駕駛場景識別方案,并將逐步向行業開放使用。
毫末這套場景識別方案具備極高性價比。比如,給出正確的場景識別標注結果,行業內普遍的價格是一張圖片約5元;而使用DriveGPT雪湖·海若的場景識別服務,一張圖片的價格將下降到0.5元。
此前有業內人士提到,自動駕駛一年要做大概1000萬幀圖像人工標定,如果單幀圖片整體標注成本降低到行業的1/10,這將極大地降低自動駕駛使用數據的成本,并且提高數據質量和效率,從而加速自動駕駛技術的快速發展。
毫末打造的中國首個自動駕駛數據智能體系MANA,在經過一年多的應用迭代后,本次AI DAY也迎來了全面的升級,并正式對外開放賦能。
顧維灝介紹,MANA計算基礎服務針對大模型訓練在參數規模、穩定性和效率方面做了專項優化,并集成到OASIS中;其次,MANA感知和認知相關大模型能力統一整合到DriveGPT雪湖·海若中;第三,增加了使用NeRF技術的數據合成服務,降低Corner Case數據的獲取成本。
與此同時,針對多種芯片和多種車型的快速交付難題,MANA優化了異構部署工具和車型適配工具。
此外,MANA的視覺感知能力持續提升,一方面可同時學習三維空間結構和圖片紋理,并將純視覺測距精度超過了超聲波雷達,BEV方案也擁有了更強的通用性和適配性;另一方面可實現單趟和多趟純視覺NeRF三維重建,道路場景更逼真,肉眼幾乎看不出差異。
通過NeRF進行場景重建后,可以編輯合成真實環境難以收集到的Corner Case。在原有的全局視角修改、添加光照/天氣效果的基礎上,新增合成虛擬動態物體的能力,可以在原有設定的運動軌跡上,合成各種Hard Case,模擬城市復雜交通環境,用更低成本測試提升城市NOH能力邊界,更好提升應對城市復雜交通環境。
值得一提的是,面對目前行業里最難的視覺任務之一——單目視覺測量,繼特斯拉后,毫末也在中國率先開始驗證能否使用魚眼相機代替超聲波雷達進行測距,以滿足泊車要求。
毫末把視覺BEV感知框架引入到了車端魚眼相機,做到了在15米范圍內達到30cm的測量精度,2米內精度高于10cm的視覺精度效果。泊車場景使用純視覺測距來取代超聲波雷達,將進一步降低整體智駕成本。
03
四大戰役全面突圍,拿下三大主機廠定點
作為中國唯一聚焦自動駕駛 AI 技術的盛宴,每屆HAOMO AI DAY,毫末都會分享最前沿的自動駕駛行業趨勢,發布最新的技術和產品進展。
這一次也不例外。
張凱以《HAOMO SPEED,AI SPEED》為題,分享了對于2023年自動駕駛發展宏觀趨勢的判斷,以及毫末四大戰役及商業化發展的最新進展。
張凱認為,智駕產品正在進入快速增長的全線爆發期,2023年將是智能駕駛沖刺之年、大考之年。
首先,城市導航輔助駕駛產品在2023年將圍繞量產上車發力,主要玩家的城市導航輔助駕駛產品進入到真實用戶覆蓋和多城市落地的比拼。
其次,行泊一體和末端物流自動配送產業商業化將成為自動駕駛公司深耕的重點。
在乘用車領域,搭載行泊一體功能的智駕產品將迎來前裝量產潮;在末端物流自動配送領域,末端物流自動配送車在商超、快遞等場景迎來爆發,2023年將在這些場景實現可持續商業化閉環。
在第七屆HAOMO AI DAY上,毫末提出要打響“2023 年四大戰役”。如今這四大戰役在短短三個多月時間內已經取得了快速進展。
首先,在“智能駕駛裝機量王者之戰”上,據張凱介紹,首款搭載HPilot3.0的新摩卡DHT-PHEV即將重磅上市,第二款搭載毫末HPilot3.0的車型魏牌藍山也將在今年發布。
截至目前,毫末HPilot整體已搭載近20款車型。用戶輔助駕駛行駛里程突破4000萬公里,HPilot2.0輔助駕駛日均行駛里程使用率達到了12.6%,而且這一比例也在隨著用戶認可度的提高不斷增加。
在海外布局方面,搭載毫末HPilot的車輛已運往歐盟、以色列等地區和國家,陸續交付到用戶手中,接下來將在中東、南非、澳大利亞等市場陸續投放;同時,毫末HPilot即將量產墨西哥版本及俄羅斯版本。
今年3月,高工智能汽車研究院基于前裝量產數據庫及定點車型庫數據進行的年度綜合評估中,毫末憑借前裝近20款車輛的優異表現,獲頒年度高階智能駕駛系統量產份額領軍獎。第三方數據佐證毫末是中國量產自動駕駛絕對領軍者,毫末持續引領中國自動駕駛第一名。
其次是“MANA大模型巔峰之戰”,中國首個自動駕駛數據智能體系MANA架構已迎來全線升級。到2023年4月,MANA學習時長超56萬小時,相當于人類司機6.8萬年。毫末DriveGPT雪湖·海若,已經完成基于4000萬公里駕駛數據的訓練,參數規模達1200億。
第三是“城市NOH百城大戰”,中國首款可大規模量產落地、重感知城市NOH,已在北京、保定、 標簽:模型商湯華為阿里各大毫末DriveGPT雪湖海若讓自動駕駛更早到來
上一篇
下一篇
制作趣味龍舟模型、慢嘆非遺休閑驛站、齊玩真人龍舟棋……來自廣州、珠海、惠州、汕尾、東莞、江門、肇慶七個市的非遺項目及傳承人,與景區游客共度端午。記者在現場看到,本次節慶“嘆”非遺活動體現了濃郁的嶺南端午特色。包粽子和賽龍舟是嶺南端午不可缺少
1、活動內容今年遺產日活動的重頭戲非遺扶貧,是四川省在阿里京東拼多多東家快手美團蘇寧等10余家電商平臺舉辦首屆“四川非遺購物節”非遺扶貧,匯聚非遺扶貧了全省100余位非遺傳承人139個非遺扶貧就業工坊500余家非遺店鋪及相關企業5000;三
是的,從宏觀經濟學的角度來說,ChatGPT可能引發的失業屬于典型的技術性失業,即原來由人完成的工作被搭沒跡機器來代替完成。一、采用ChatGPT和其他類似的語言模型,可能會導致某些行業出現失業或變化。一些領域的自動化、以及語言模型分析大量
chatgpt是OpenAI開發的一個大型預訓練語言模型,通俗一點說就是一個聊天機器人。它是GPT-3模型的變體,ChatGPT經過了訓練,可以根據接收到的輸入生成類似人類的文本響應,具有更自然、更多樣化的特點。用戶可以向它提出無數問題,而
Chat GPT要怎么用?給你搞明白了!Chat GPT要怎么用?如下圖是Chat GPT的網頁, 登錄進入后點擊10開始一個新對話,點擊20選擇對話的模型后在30輸入你的問題, 就可以開始對話使用Chat GPT!現在我們了解了Chat