為創意插上羽翼 百度文心大模型產業落地加速
摘要:百度集團副總裁吳甜在接受媒體記者采訪時預言:“今年將是文心大模型產業落地關鍵年?!彼f,大模型已成為AI發展的新方向,百度文心大模型源于產業、服務于產業,是真正的產業級知識增強大模型。百度通過大模型與國產深度學習框架融合發展,打造了自主創新的AI底座,真正發揮大模型驅動AI規?;瘧玫漠a業價值。
中國經濟導報、中國發展網訊 記者王曉濤報道 “海鷗掠過 蔚藍的天空 它告訴我 這個夏季 有一種思念無法釋懷”,透過《海浪的呼吸》的歌詞,你能在空曠的恬靜中隱約感到夾雜著一絲幽傷。不過,歌詞的作者并非是人,而是百度文心大模型基于“海灘”“閨蜜”“歡樂”三個詞自動生成的。
隨著數據井噴、算法進步和算力突破,效果好、泛化能力強、通用性強的預訓練大模型(以下簡稱“大模型”),成為人工智能(AI)發展的關鍵方向與AI產業應用的基礎底座。4月16日,2021百度認知AI創意賽“AI創意派”決賽正式舉行,這是業內首次將先進的AI大模型能力開放給公眾使用。
當天,在位于北京市海淀區的百度科技園,百度集團副總裁吳甜在接受媒體記者采訪時預言:“今年將是文心大模型產業落地關鍵年。”她說,大模型已成為AI發展的新方向,百度文心大模型源于產業、服務于產業,是真正的產業級知識增強大模型。百度通過大模型與國產深度學習框架融合發展,打造了自主創新的AI底座,真正發揮大模型驅動AI規?;瘧玫漠a業價值。
大模型助力創意應用 讓更多人發揮創造力
元宇宙虛擬人生、AI版“反詐App”、續寫一本小說、神奇植物都有啥……這些趣味DEMO(演示)和落地方案,均是由AI創意派參賽選手基于百度飛槳文心大模型開發創造的。據統計,本次AI創意賽共吸引了全國各地近2000名不同年齡、不同技術基礎的選手參與其中,收集超過300份創意方案,作品覆蓋教育、醫療、金融、娛樂、科技、心理健康等多個領域。最終,開發創意組9組選手脫穎而出闖入決賽,最終“說文”“圖言”“AI起論文標題”等項目摘得大獎。
“創意在民間。AI和大模型要面向公眾開放,只有門檻低到了所有人都可方便地用起來,才能真正大規模爆發出各種創意。這是文心大模型的努力方向。”吳甜在比賽現場表示,文心源于產業實踐,也將在產業中廣泛落地。本次創意賽中,選手展現了基于文心大模型的豐富創意,讓我們看到了大模型廣泛應用的前景。
大模型相當于解決AI模型的通識教育。以前的模型訓練需要標注數據,由于AI落地場景很多,每個場景都要采數據、標數據,在標注的數量和質量上,存在很大的瓶頸問題。吳甜認為,有了大模型的機制之后,很多無標注數據都可以用來學習,模型學習的數據越來越多,同時模型也越來越大。
吳甜強調,現在AI落地,已經不再局限于只是面向一些技術人員和開發人員,而是要面向公眾了。她解釋說:“世界上有技術背景的人開發人員只是少數,AI跟場景結合空間巨大,各個場景的相關人群非常廣泛。創意在民間,只有技術門檻低到了所有的人都可以用,創意才會真正大規模爆發出來,這是必然趨勢。”
攀登技術新高地 深耕產業級大模型
近年來,國內外科技巨頭如谷歌、微軟、英偉達、百度等,相繼在AI大模型領域展開探索。大模型的重要性在于——AI要真正發揮對產業升級轉型的驅動力,需要與各行各業的特異性場景深度融合,而大模型正是支持AI低門檻應用于不同場景的通用力量。
大模型的出現,大幅降低了人工智能的應用門檻。其通過集中提供通用算法模型,打造技術底座,讓大多數企業能夠“站在巨人的肩膀上”,使標注數據更少、開發效率更高、應用成本更低。
據了解,負責百度AI技術平臺與生態建設的吳甜,同時兼任深度學習技術及應用國家工程實驗室副主任,實驗室主任則是百度首席技術官王海峰。這個由百度公司牽頭的實驗室,2017年初由國家發展和改革委正式批復。去年7月,實驗室通過了專家驗收。
資料顯示,百度自2019年開始深耕預訓練模型研發。同年3月,百度率先發布中國首個正式開放的預訓練模型ERNIE1.0,并持續投入于大模型的研發升級;2021年12月,ERNIE 3.0升級為全球首個知識增強千億大模型——鵬城-百度·文心。目前,百度已成功打造文心大模型家族,多個大模型達到世界領先水平。
超大規模模型的訓練和推理,給深度學習框架帶來很大考驗。依托百度飛槳平臺,文心大模型解決了大模型訓練過程中多個世界性難題,使大模型訓練速度提升、模型效果更優。
基于百度飛槳平臺與百舸集群,文心大模型在算法、框架、算力層面實現完全自主創新,百度通過大模型與國產深度學習框架融合發展,為中國產業智能化轉型打造AI大底座。
大幅降低應用門檻 助力產業規模化應用
隨著大模型的價值凸顯,由國內外科技巨頭主導開發的大模型正在大量涌現。吳甜認為,大模型未來的發展趨勢,一方面會繼續出現技術創新,另一方面會在產業實用上有更多價值產生。
文心大模型作為產業級知識增強大模型,核心價值在于驅動AI的規?;瘧?。而對于其產業級的定位,吳甜解釋說:“這有兩重含義:一方面是模型產生的過程,跟產業應用緊密相關;另一方面是模型使用的時候,要有面向產業應用的配套工具和平臺。”據介紹,為進一步降低AI應用難度,文心大模型為開發者提供了工具平臺,配套易上手的大模型開發、輕量化、部署工具,通過降低門檻,讓各行各業的開發者都能實現AI的應用。
文心大模型堅持一邊做技術創新,一邊做落地應用。目前,文心大模型已大規模應用于百度內部的各類產品,包括搜索、信息流、小度智能屏、百度地圖等,顯著提升了產品智能化體驗?;谖男牡拈_放能力,對外的日調量也超過了5000萬次。
吳甜闡釋了百度推進企業AI商業化的基本思路,即三個“賦能”:平臺賦能、場景賦能和人才賦能。例如,在百度AI開放平臺上,現在已經有近1400項AI能力開放給中小企業使用。以飛槳為代表的平臺積累了大量的案例和示范,可以幫助企業進行場景挖掘。
據了解,文心大模型已通過飛槳開源開放平臺、百度智能云等賦能工業、能源、金融、通信、媒體、教育等行業,個人、企業開發者數量超過6萬。在保險領域應用中,文心大模型的智能解析能力,能使文本處理效率提升30倍;在人力資源領域應用中,文心大模型能實現候選人信息智能分類,模型識別準確率達到99%;在醫療領域應用中,文心大模型將每份病歷的檢查時間,從30分鐘縮短到了秒級別。
而對于智能制造,吳甜表示大模型應用的場景主要有兩大類:一是視覺場景,二是自然語言處理場景。前者主要是以計算機視覺技術為主的質檢、巡檢場景應用,后者主要是在數據積累和設備運維場景中要用到對語義的理解。
最后,吳甜表示,從AI核心技術到AI基礎平臺,百度將繼續堅持技術創新及開放生態,不斷降低AI技術開發和應用的門檻,并通過云平臺、AI框架、大模型的融合發展,為各行各業的數字化、智能化轉型打造厚實的基礎設施。
責任編輯:王曉濤