2024云棲大會如期結束,AI大模型仍是今年大會的主角。 此次大會上,阿里云通義旗艦模型Qwen-Max再次升級,性能已接近GPT-4o。阿里云同時宣布,正以AI為中心,全面重構底層硬件、計算、存儲、網絡、數據庫、大數據,打造一個AI時代的最強AI基建。 全面投入AI的背后,是阿里云深信生成式AI具有“逐漸滲透數字世界,接管數字世界,改變物理世界”的龐大想象空間。 當前,大模型在物理、化學和生物等多個學科的能力已接近博士水平。另一方面,大模型不僅具備持續(xù)可用性,還擁有在記憶、泛化上的舉一反三能力,對復雜知識、數據的總結能力,以及在音視頻等方面的多模態(tài)能力。 這使得大模型已經能在一定程度上幫助人類解決各種問題。目前,阿里云正與各方開展合作,讓AI在各個行業(yè)場景中落地,其中不可或缺的一部分是,讓大模型智能向善,賦能可持續(xù)發(fā)展、教育和科學研究,為國計民生謀求更多福祉。 在經濟社會領域,由自然資源部信息中心與阿里云聯合研發(fā)的后土大模型,正在賦能自然資源的數字化治理;在天文研究領域,基于通義打造的星語3.0天文大模型已接入望遠鏡集群,助力天文發(fā)現;在教育領域,高教社正在利用AI技術加速教育變革、推進教育公平...... 加速向社會各行各業(yè)滲透的AI,于許多人“看不見”的地方,正在產生深遠的影響和無法計算的價值。 “后土”量地 據了解,在自然資源部信息中心(下稱“信息中心”)與阿里云的密切合作下,自然資源行業(yè)大模型后土已取得的初步進展包括: 構建自然資源行業(yè)大模型總體技術路線;開展自然資源行業(yè)知識收集和加工處理,采集自然資源基礎知識、政策法規(guī)、標準規(guī)范等7大類、70多萬份文檔語料;組織自然資源行業(yè)大模型關鍵技術研發(fā)。 在研發(fā)富模態(tài)知識文檔解析加工技術上,文字OCR(光學字符識別)、段落、表格、圖片、公式等識別準確率超過90%。 基于Qwen系列通用大模型+RAG(檢索增強生成)及微調,為大模型注入自然資源領域專業(yè)知識,共同打造自然資源行業(yè)大模型智能體。 信息中心副主任兼工程師吳洪濤在云棲大會上介紹,后土大模型的命名源于中國古神話中的神明“后土”,其職責就是自然資源管理和國土空間治理。 目前,后土大模型已初步落地在國土變更調查工作中。一直以來,這項工作對于全面及時準確掌握我國國土利用狀況,保護耕地、節(jié)約集約用地,保護生態(tài)環(huán)境和國家糧食安全等都具有重要意義。 國土變更調查主要分為調查取證和核查兩個階段。在調查階段,調研人員需親自前往調查地點進行走訪、測繪;在核查階段,工作人員需對海量衛(wèi)星影像、測繪數據,以及實地拍攝圖片、視頻進行識別,核對土地用地類別。 問題在于,我國每天都會新增大量的國土資源調查圖片和視頻,難以全部完成人工核查。為了減輕調查人員的工作量,提高調查、核查的準確率,去年,自然資源部信息中心與阿里云展開合作,基于通義基模共同打造了后土自然資源行業(yè)大模型。 以農用地變更調查場景為例,在外調查時,調研人員可使用基于后土大模型開發(fā)的AI工具對目標地塊進行拍攝,大模型能精準識別農用地占地面積、用地類型等信息,輔助工作人員作業(yè),避免多拍、錯拍和漏拍。 在核查階段,大模型會根據已有實地拍攝圖片識別地類和屬性,自動輸出核查結論,輔助工作人員提升核查準確度和效率。 以人為本的大模型,正在將人從繁瑣、重復的工作中解脫出來。據悉,未來后土大模型也將在耕地、園地、林地、草地、商服用地等其他地類調查工作中應用,助力自然資源可持續(xù)發(fā)展。 吳洪濤還提到,過去一年以來,信息中心也在探索后土大模型在空間規(guī)劃和用途管制、資源保護、地質災害防治等場景的應用,“大模型基礎底座和應用場景的雙向奔赴”,將“全面支撐自然資源數字化治理能力的提升,來回答自然資源數字化治理過程中的必答題”。 望向天空的大模型 測量大地的同時,AI大模型也在望向天空。 今年4月,中國科學院國家天文臺人工智能工作組發(fā)布了新一代天文大模型星語3.0,這是大模型在天文觀測領域的首次應用。 星語3.0基于阿里云通義千問開源模型打造,當前已成功接入國家天文臺興隆觀測站望遠鏡陣列Mini司天,可實現自主控制望遠鏡進行觀測、分析觀測結果,智能地給出下一步觀測建議。 天文望遠鏡是人類探索宇宙的“照相機”。相比單體望遠鏡,大型望遠鏡陣列能更有效地整合高性能望遠鏡資源,成本更低,觀測效率更高。但隨著望遠鏡數量的不斷增加,如何控制大型望遠鏡陣列已成為當今天文界共同面臨的挑戰(zhàn)。 過去,天文觀測主要依賴觀測助手和科研人員的配合,科研人員常常需要根據觀測所在地氣象情況修改觀測計劃,在觀測室等待數據返回并實時分析數據,再根據結果修改觀測計劃。重要觀測目標的每個環(huán)節(jié)都需要人工參與,效率低且難以同時控制多個望遠鏡。 星語3.0嘗試解決這一難題。依托阿里云通義千問底模和百煉平臺,星語3.0基于超30萬專家訂正數據完成訓練,在天文物理等專業(yè)能力上表現突出。 在觀測星體時,星語3.0首先會查詢某星體的坐標信息,反饋給觀測人員;當得到確認后,星語3.0將按照觀測人員輸入的計劃進行自動觀測;單次曝光完成后,大模型將回收并處理數據,根據結果判斷目標源的觀測價值,推薦接下來的觀測計劃。 相比以往,星語3.0自主完成了天文觀測中一些原本需要人力完成的任務,提高了天文觀測的效率,讓研究者能夠回歸到天文研究上。 除了輔助天文觀測,國家天文臺還與阿里云合作開發(fā)了國際首個太陽垂直Sora模型,可用來探測耀斑,以及用于磁場、演化實時分割等相關研究。 另一方面,大模型在海量數據處理方面的能力也被天文領域所需要。據中國科學院國家天文臺研究員羅阿理表示,天文觀測的數據量增加非常快,現在每天會產生幾十TB數據,未來10年,天文領域的數據總量會從PB走向EB的量級。為了更好地挖掘這些天文數據,國家天文臺在2016年就和阿里云簽署了戰(zhàn)略合作協(xié)議。 羅阿理透露,在沒有大數據和機器學習等方法之前,天文領域每年新增的全球成果大概是1000多個,有了這些新的工具、數據和方法后,每年新增成果已經翻倍。 未來,星語大模型將接入國家天文臺大型望遠鏡陣列司天(Mini司天即為司天的一部分),這是我國天文學家面向時域天文學提出的國家級重大天文基礎設施項目,項目預期至2030年米級望遠鏡數量達到72架,每晚產生約140TB處理后數據,成為全球巡天效率最高的項目。 AI的“有教無類 2500年前,思想家、教育家孔子提出了他理想的教育——“有教無類”“因材施教”,前者講的是教育普惠,后者則希望進一步實現個性化教育。而大模型的出現,正逐漸推動著這種理想教育成為現實。 當前,我國城鄉(xiāng)和地區(qū)之間的教育資源分布不平衡,教育質量存在很大差異。如何應用先進技術,推動優(yōu)質教育資源的共建共享是推進教育公平的重要任務。 高等教育出版社(下稱“高教社”)社長劉超在云棲大會上提到,過去高教社在教育公平1.0的實踐是,通過信息技術賦能教育資源的普及,實現優(yōu)質教育資源的共享。 據了解,高教社已建成了全世界最大的在線開放課程平臺愛課程、最大的職業(yè)教育數字教學資源共享平臺和在線教學服務平臺智慧職教等教育資源平臺。高教社各教學平臺的一億多用戶,可以通過一根網線直接連通名校名師的課堂,共享優(yōu)質資源。 進入到新的時代,劉超認為,人才培養(yǎng)正以知識為重轉向以能力培養(yǎng)為重,人們對于自主性學習、個性化學習和終身學習的現實需求日漸強烈。自然語言模型能實現對話式學習,在教育領域具有無限的潛力和廣泛的前景。他深信,教育公平的2.0一定是有人工智能賦能的教育的公平。 基于這一思想,高教社正基于阿里云通義千問等大模型打造AI底座。其中高教社擁有70年來積累的4500TB的高質量教育語料,包括優(yōu)質的教材文本、豐富的多模態(tài)資源、習題題庫等,阿里云的通義大模型性能則位于國產大模型前列。 此前,高教社與阿里云、浙江大學等已聯合發(fā)布了基于通義千問7B(70億參數)模型訓練的“智海-三樂”教育垂直大模型,并應用于14所高校的101計劃核心課程《人工智能引論》教學課堂。據悉,該模型可為相關課程提供智能化、個性化學習,服務人才培養(yǎng)。 在劉超看來,理想的教育大模型需要集成四個特點:更正確的答案,分布式的輸出,情緒的提供和資源的推薦。 其中,分布式的輸出被稱為是蘇格拉底式的啟發(fā)式教學,劉超說,浙江大學吳飛教授的團隊今年特意在蘇格拉底式的教學智能體的研發(fā)下做了大量的工作,讓AI能把一個復雜的問題拆解成若干相關簡單的問題,分布式地問給學生,這樣才能夠啟發(fā)學生真正掌握學習的邏輯和推理過程。 不同的學生往往即使上同一年級,在學習的進展上也不一樣,對知識點的掌握程度也不一致,而具有記憶、泛化能力的大模型,能夠做到“千人千面”,推動個性化學習的實現,讓教育真正走向“有教無類”。 無法計算的價值 不只是上述領域,一直以來,阿里云堅持開源大模型,作為千行百業(yè)應用開發(fā)的基礎,通義之上已長出AI應用的“熱帶雨林”。 截至2024年9月中旬,通義千問開源模型下載量突破4000萬,Qwen系列衍生模型總數超過5萬個,成為僅次于Llama的世界級模型群。 2024云棲大會上,阿里云CTO周靖人最新發(fā)布了通義千問新一代開源模型Qwen2.5,旗艦模型Qwen2.5-72B性能超越Llama 405B,再登全球開源大模型王座。 基于成為“AI時代最開放的云”的愿景,阿里云希望用AI技術賦能社會可持續(xù)發(fā)展,正如阿里云副總裁、中國可持續(xù)發(fā)展研究會理事劉湘雯所言,人工智能和云計算相結合,從數字世界進入到物理世界,將為整個社會帶來無法計算的價值。 中國可持續(xù)發(fā)展研究會理事長李萌認為,人工智能賦能可持續(xù)發(fā)展,將成為推進經濟社會綠色轉型的關鍵支撐。作為新興技術力量,人工智能在中國助力資源優(yōu)化、提升效率,推動產業(yè)轉型、環(huán)境保護、消除貧困、教育公平,以及加速實現可持續(xù)發(fā)展的目標中將發(fā)揮不可替代的作用。 |
19款電子扎帶
電路板識別電子標簽