阿里巴巴通義實驗室周暢:普惠終端用戶,讓大模型在PC等終端設備上跑起來
摘要:人工智能已經在云端跑了許久,而未來應是云端大模型和端側大模型的雙向奔赴,AI PC的時代已經來臨。
中國經濟導報、中國發展網 記者崔立勇報道
以“AI新生態 智啟新元年”為主題的首屆AI PC產業創新論壇日前在北京聯想集團總部舉辦。阿里巴巴-通義實驗室、通義千問大模型負責人周暢受邀出席分享關于端側大模型的技術進展,以及終端設備與AI結合的發展前景。
周暢表示,大模型技術的快速迭代已經讓其具備理解世界的基本能力,接下則需要想辦法讓大模型能力在各種環境和場景下被充分使用起來。“讓大模型在PC等終端設備上跑起來,正是普惠終端用戶的第一步,阿里巴巴-通義實驗室將與聯想集團攜手合作,在AI PC生態領域共同探索端云協同的解決方案,為個人和企業提供更加精準的AI服務。”
阿里巴巴-通義實驗室、通義千問大模型負責人周暢
“看《流浪地球2》《鋼鐵俠》這類科幻片的時候,可能人人都會幻想自己要有一個人工智能助手。自ChatGPT出現后,特別是今年,AI發展特別快,很多功能都開始從幻想慢慢變成現實。”他說,開發者社區現在也非常關注大模型在端側的具體表現。
而從端側落地出發,在周暢看來需要做好兩件事。第一,模型水平的提升。端側通用AI助手需要能夠理解用戶的語言語義、并具備圖像理解能力,同時也要能夠使用各種常用軟件的API,即可以使用各種各樣的工具來幫助用戶完成任何事情,這需要不斷提升模型的水平。第二,發揮這類助手的能力,既可以通過端云協同結合云側模型的強大功能,也可以通過在端側靈活便捷的部署,使得大模型能力在離線的狀態下也能使用。
他介紹,從8月份到10月份,通義千問已陸續開放從18億到720億參數的語言模型,并達到千億參數模型全尺寸、全模態開源。阿里云希望通過開源不同尺寸的模型,助力業界大模型的生態發展,也希望通過全尺寸的開源來助力模型的落地。
經過壓縮和微調的AI模型適合在端側進行部署。“當前,端側的開發者群體比較關心的是主流7B或14B這類小尺寸模型的表現和云端大模型的差異。”周暢稱,端側助手關心的核心能力是工具使用,而通義千問小尺寸系列的語言模型,在推出時就非常重視這類能力的優化。
其數據顯示,18億參數的通義千問小模型在簡單工具的使用上,可以達到大模型85%的水平,70億和140億的模型在這方面的表現與720億大模型可以十分接近。毫無疑問,通義千問模型的實測為AI大模型的端側應用鋪平了道路,將加速AI能力的普及。
針對模型的任務分解和工具調用能力,周暢在論壇上分享了一系列演示案例,來說明通用大模型已經能夠勝任在離線的PC等終端上運行,并可對基礎數字、圖標、公式以及圖片等內容進行輕度處理。
識別數字、圖表等能力,對于AI PC的發展十分重要,周暢進一步強調。聯想前不久率先對外展示的全球首款AI PC及其高水準的能力,進一步印證了在AI普惠的道路上,AI PC將成為首選終端。
值得注意的是,在AI PC產業創新論壇上發布的業內首份《AI PC產業(中國)白皮書》,已經將AI PC產業生態范圍參與方擴大到了5個,包括用戶、終端廠商、AI技術(模型)廠商、應用廠商和算力(芯片)廠商。其中,AI技術(模型)廠商是新引入者。
面對即將開啟的AI PC元年,周暢認為,端云協同發展的解決方案在未來擁有巨大想象空間。人工智能已經在云端跑了許久,而未來應是云端大模型和端側大模型的雙向奔赴,AI PC的時代已經來臨。
責任編輯:崔立勇