2023年國內大模型發展盤點(一)——大模型發展趨勢
(本文作者王鵬為北京市社會科學院研究員,數據資產化研究院執行院長)
“十四五”期間,國家出臺了針對人工智能的未來發展相關指導方案和激勵政策,涵蓋“新型基礎設施”建設、人工智能標準化與法規以及AI安全體系建設等。過去的2023年作為承上啟下之年,如何總結評估前期成果并調整優化策略將成為規劃實施的重要一環。而大語言模型作為人工智能領域最引人注目的成果之一,近年來已經經歷了迅速崛起的歷程,2020年Open AI GPT3模型的發布更是極大推動了公眾對于大語言模型的關注度。本系列文章將分別回顧2023年國內大模型發展重要趨勢,比對中美大模型發展水平明確自身缺陷及劣勢,并針對未來國內大模型發展給出針對性建議。本文將概括2023年國內大模型發展重點趨勢,分別從模型規模、應用場景、技術創新、跨模態大模型以及產業化角度介紹年度發展。
一、模型規模快速增長
2023年國內大模型規模呈現快速增長趨勢。從模型數量上看,據中新網報道,2023年1至5月間,國內共推出了19個10億級參數規模的大語言模型,2020至2022全年推出的相同參數規模大模型分別為2個、30個與28個;從模型參數數量上來說,根據Info Q發布的《大語言模型綜合能力測評報告2023》,發布大于百億級別參數規模的模型的國內企業已達到15家,其中包括百度ERNiE 3.0模型、華為盤古模型,以及阿里遵義模型等。該參數規模級別模型在多個自然語言處理任務上取得了顯著的性能提升。
二、應用場景多元化
國內大模型應用場景不斷擴展并趨向多樣化。大模型產品百花齊放的當下,模型實現了計算機能力從“搜索”到“認知與學習”,再以進一步發展為“行動與解決方案”層面。除常見的智能客服、智能推薦、情感分析等應用領域以外,大模型逐步于教育、醫療、金融等垂直領域得到了廣泛應用,為各行各業提供了智能化的解決方案。例如學而思旗下的MathGPT模型旨在解決大型語言模型在解決數學問題時的準確性、穩定性和清晰度方面的問題,并可以提供穩定且清晰的解題步驟,提供個性化的解釋;百川智能以平均28天的速度不斷優化模型,專注于探索人工智能在醫療問診領域的應用,并計劃于明年推出首款應用產品。
三、技術創新不斷涌現
由于大模型依附于云計算實現模型迭代升級,而大模型算力的提升方式包含直接囤積GPU以及打造場景專屬DSA(Domain Specific Architecture)架構芯片。國內大模型開發過程中技術創新不斷涌現以實現模型規模縮小、模型性能提升。針對大模型訓練過程中的效率問題,研究人員提出了多種優化算法和并行計算技術,顯著提高了訓練速度和效率。年末百度發布的分別基于自研昆侖芯以及華為昇騰打造的兩款AI實例,升級AI異構計算平臺百舸3.0,適配國內外主流AI芯片等舉措極大推動了有效訓練時間的進步。同時,針對大模型的推理速度問題,諸如模型壓縮以及模型蒸餾技術的出現實現了減小模型大小和計算需求的目標,并從而提高模型的部署速度和實時性能。類似技術將不斷互相補充,相關技術創新將進一步促進大語言模型發展。
四、跨模態大模型深入發展
伴隨計算機視覺、語音識別等技術的不斷發展,跨模態大模型也逐漸成為研究熱點。這類模型能夠處理不同模態的數據(如文本、圖像、語音等),實現多模態信息的融合和交互,為人工智能應用提供了更加豐富的可能性。相關企業包含具備云計算與技術積累的互聯網大廠以及AI1.0時代的科技公司。對于前者,諸如騰訊、百度以及阿里云,分別在CogView2、M6以及ERINE 4.0模型上實現特定任務的突破性進展,展現了在文本與圖像生成方面的創新潛力。針對后者,商湯繼承CV方面的優勢發布了日日新大模型,云知聲延續其在語言方面的優勢,發布山海大模型進一步開拓醫療問診的具體應用。
五、產業化商業化加速
隨著大模型技術的不斷成熟和應用場景的擴展,產業化和商業化進程不斷加速。其一,越來越多的企業將大模型技術應用于實際業務中,推動了人工智能技術的落地和普及。大模型廠商中,對比Open AI在11月召開的首屆開發者大會中連續推出GPTs與Assistant API,百度發布了App Builder,旨在簡化大模型應用的開發流程。App Builder平臺提供了一系列核心組件,例如原子化構件、RAG(檢索生成增強框架)以及Agent機制,并以完整模版和框架的形式向開發者提供以促進開發效率。其二,國內也涌現出一批專注于大模型技術研發和應用的創業公司,為大模型產業的發展注入了新的活力。例如3月,百度推出全球首個企業級一站式大模型平臺千帆;10月,阿里云發布了阿里云百煉大模型服務平臺。國內大模型領域商業化的加速為產業發展注入全新活力。
2023年對于國內大語言模型發展而言,是一個充滿活力和變革的一年。從模型的規模化、多樣化的應用場景、先進的技術創新,到跨模態大模型的深入發展,再到產業化和商業化的快速推進,這些趨勢和成果不僅體現了中國在人工智能領域取得的巨大進步,也預示著未來大模型技術將在更多領域展現其獨特的價值和能力。在國家政策的指導和市場需求的雙重推動下,中國的AI企業和研究機構正迅速適應和引領人工智能的新浪潮。展望未來,隨著技術的不斷進步和更深層次的跨行業融合,我們有理由相信大語言模型將在推動社會發展和創新各個方面扮演更加關鍵的角色。本系列文章將繼續介紹中美大模型發展差異,在對比中明確自身發展瓶頸并嘗試給出對策建議。歡迎廣大讀者持續關注并批評指正。
本文僅代表作者觀點。
- 冰箱壓縮機86AA(如何判斷是否故障)04-23
-
怎么拆彩電顯像管管座(拆解彩電顯像管管座技巧——30字以內)
2025-06-07
-
壁掛爐一天多少方氣(壁掛爐每天消耗幾方氣能?)
2025-06-07
-
烤肉串的燃氣灶維修(如何自行維修故障)。
2025-06-07
-
三菱重工故障代碼e5(解析三菱重工故障代碼E5)
2025-06-07
-
美的定頻故障代碼e5(美的定頻故障代碼E5:解讀與解決方案)
2025-06-07


