首頁 導報現場 正文

北京通用人工智能研究院發布研究成果

2025-03-31 15:40 中國發展網

中國發展網訊 在3月29日召開的2025中關村論壇通用人工智能論壇上,北京通用人工智能研究院重磅發布北京通用人工智能研究院研究成果,覆蓋通用智能體+行業智能體+社會智能體三大智能體矩陣。其成果以“原創技術-產業賦能-社會智能”三級聯動模式,推動人工智能從單一智能向社會智能轉變。

全球首個通用智能人“通通”2.0升級迭代

“通通”2.0在大會上重磅發布。相較于通通1.0版本,“通通”2.0在語言、認知、動作、學習、情緒、交互方面實現了多種核心能力的升級:

1、價值與心智驅動的多輪對話

當前,國內外諸多大語言模型通過指令微調和強化學習下的人機價值對齊等技術手段,雖然能夠較好地完成人機多輪對話任務,但此類對話更多的是圍繞用戶的需求及觀點進行,本質上缺乏自身相對連貫的價值觀、世界觀以及據此演繹出來的對話內容。

“通通”2.0版本實現了一個有自身價值觀、世界觀的小女孩,在理解對話目標意圖的基礎上,遵循自身價值和人格,利用對話策略來引導對話的走向,從而達到自身的目的。在價值調控對話生成、消除模型幻覺、保持對話前后連貫性以及“言行一致”等方面取得突破。

例如,當媽媽要求“通通”睡覺,或者吃她不喜歡的食物時,“通通”可以向媽媽耍賴,找理由磨蹭,并試圖要求媽媽給予獎勵,在多輪協商達成一致后才會實施對應任務。

2、基于交互反饋的推理和學習

通通生活在高度仿真的復雜、動態三維虛擬場景中,1.0版本的“通通”在任務執行過程中,如果周圍環境時刻在發生變化,會導致她原本規劃的任務無法順利完成。但“通通”2.0可以實時響應外界場景的變化,進行反思和重新規劃,對已有任務進行掛起、恢復、修改或取消等處理,同時動態生成新的任務規劃,從而以更靈活、智能、多變的方式完成指令。

不僅如此,不同于當前大語言模型普遍采用的離線數據驅動的學習模式,通通在和場景交互(自主學)及與人類的多模態對話(他人教)過程中,能動態更新自身的知識庫,價值函數和技能,使得它初步具備類人的持續反思和成長的能力。

例如,當通通想打開空調時,研究人員利用VR手多次改變遙控器位置,讓她無法輕易拿到,通通進行了一系列嘗試:先是脫鞋上沙發,然后再利用沙發上的靠墊,增加自身高度后最終拿到放在墻架上的遙控器;在按下遙控器,空調仍未打開時,我們可以教導她“電器需要插上插頭才能使用”,通通在遵循教導,成功打開空調的同時能夠更新自己的技能庫,使得該項技能、知識被長期存儲。

3、多智能體交互

研究人員為“通通”打造了幼兒園、六口之家等多智能體場景,并在場景中設置了各自獨立,具備自身價值、能力、人設、狀態的多個智能體,使通通擁有了自己的家人和朋友。

在這種多智能體場景中,通通不僅需要理解周圍環境,還需要理解環境中其他智能體,識別他們的身份、性格和自身的關系、彼此之間的關系和物品的關系、當前動作、意圖、氣氛等,并在此基礎之上進行自身的任務規劃,包括發起和響應對話,實施幫助、搗亂等復雜行為交互。

例如:通通在做任務遇到困難時,能主動開口尋求幫助,并解釋自己的困難;在和弟弟一起打掃房間時,她會實時觀察弟弟,并根據弟弟的行為來調整自己的任務規劃,從而完成合作。

隨著“通通”的持續迭代,她的能力也在穩步提升,目前研究人員正利用認知心理學定義的5-6歲兒童應掌握的經典任務對她進行測試,通通已經通過了多項綜合性強、復雜度高的任務考核。未來它將成為通用底座支撐各類垂直應用場景,進一步學習行業特定的知識和技能,形成千萬個“通用智能人”賦能千行百業,同時與具身智能機器人相結合,為智能制造、智慧城市、養老陪護、數字助理、家用機器人等領域帶來革命性的變化,更好地服務居民日常生活。

通智大腦聯盟成立:“大腦”與“身體”協同研發,賦能生活與產業服務升級

2025年全國兩會《政府工作報告》首次將“具身智能”納入國家未來產業戰略。報告明確提出,要加快具身智能技術的研發與應用,推動其在智能制造、智慧醫療、無人駕駛、智能家居等領域的深度融合。在北京市發布的《北京具身智能科技創新與產業培育行動計劃(2025-2027年)》中指出,加速具身智能技術與產業的深度融合,推動形成具有國際競爭力的產業生態,為經濟社會高質量發展提供有力支撐。如何賦予具身智能體完備的認知架構與價值體系,即為機器立“心”?為此,通研院積極鏈接具身機器人行業伙伴,將“通通”的技術優勢,即人形機器人的“大腦”賦能到機器人本體上。

會上,通研院聯合樂聚、宇樹等多家人形機器人公司共同發起成立“通智大腦聯盟”。該聯盟通過打破技術壁壘,聚焦垂域場景的通智大腦和具身本體協同研發及應用,將實現在物理空間上具身智能體從感知到決策、從學習到執行的閉環,加速核心技術突破與成果轉化。

聯盟擬建設機器人數據采集工廠,并將企業研發中積累的建設經驗、機器人集群運維經驗及管理平臺等相關技術,整合為技術服務,提供給制造業、服務業等多個行業。

此外,聯盟致力于構建首個能從多模態人——機器人交互數據中在線學習豐富具身技能的智能體,技能涵蓋具身推理、常識學習、偏好學習、導航操作學習等。相關技術作為“具身大腦”,可與通用機器人產業對接,為機器人提供更智能、更靈活的決策支持。

責任編輯:張洽棠


返回首頁
相關新聞
返回頂部
国产福利一区二区麻豆