首頁 導報現場 正文

訊飛星火4.0Turbo底座能力升級 做“最懂行業的大模型”

2025-01-17 16:59 中國經濟導報-中國發展網
科大訊飛 大模型 算力 人工智能 數字經濟

摘要:在發布會上,科大訊飛相關負責人指出,基于“技術+應用”的不斷正向循環,訊飛星火4.0 Turbo的行業能力全面提升,金融、油氣、能源、電力、鋼鐵、航空等領域綜合能力提升超過10%,成為“最懂行業的大模型”。

1月15日,科大訊飛發布了當前全國產算力平臺上唯一的深度推理大模型——訊飛星火X1。同時,訊飛星火4.0 Turbo底座能力再次迎來全新升級,圖文、數學和長文本能力顯著提升,并首發混域知識搜索技術,進一步解決行業、企業痛點。

本次訊飛星火4.0 Turbo的升級結合了來自不同行業龍頭企業的落地訴求、C端2億多用戶的真實反饋,致力讓大模型能夠支撐更長的文本、理解更復雜的圖文、減少幻覺,同時讓大模型在行業的理解能力上有更大的提升。

圖片1

七大核心能力全面提升

底層模型的能力高度決定了應用層的發展上限,這一過程離不開充足算力的有力支撐。然而,當前算力不足已成為多數公司在大模型領域發展的主要瓶頸之一。

在大模型領域,為實現完全的國產化,科大訊飛與華為決定攜手自研算力底座,并于2023年10月24日,聯合發布了國內首個全國產算力平臺“飛星一號”,常態化支持萬億參數的大模型訓練,為后續技術迭代筑牢根基。

2024年10月24日,基于“飛星一號”平臺,經過數次迭代升級,訊飛星火大模型升級為4.0 Turbo版本。根據真實數據背靠背的測試,其七項核心能力在中文領域全面超過GPT-4 Turbo,數學和代碼能力超越GPT-4o。與此同時,科大訊飛與華為、合肥市大數據資產運營有限公司聯合打造的國產超大規模智算平臺“飛星二號”,將實現新模型新算法的持續適配和智算集群規模的再次躍遷。

在由艾倫人工智能研究所、OpenAI等國內外權威機構發布的14項主流測試集中,涵蓋了理解與推理、綜合考試、數學與科學、代碼編程等多種任務類型。訊飛星火4.0 Turbo在其中9項測試集中超越了美國三大主流模型(GPT-4o、Claude 3.5 Sonnet、Gemini 1.5pro),整體效率提升了50%。

圖片2

在2024年6月訊飛星火的升級發布會上,科大訊飛董事長劉慶峰就曾強調:“中國通用人工智能的發展,離不開強大的大模型底座能力。國家必須擁有自主可控的通用大模型底座,這是決定我國在本輪通用人工智能競賽中能走多遠的關鍵因素。”

此次發布會,訊飛星火4.0 Turbo底座能力實現了全新升級,七大核心能力全面提升,全面對標OpenAI最新版的GPT-4o。本次升級的一大突出亮點在于,針對行業與企業在實際應用中面臨的痛點問題,在數學能力、行業知識、圖文識別、長文本能力等能力上實現了提升。

大模型的不斷進階催生出一系列精細化、場景化的小應用。數學能力一直是訊飛星火的強項,此次基于訊飛星火X1的高質量合成數據,訊飛星火4.0 Turbo可以在數學教學、金融分析和科研推演等工作中更好的幫助用戶。

圖文識別能力直接關乎著企業能否高效地采編和利用行業、私域數據,是大模型“學習”的基礎。在各行各業的實際工作中,經常面臨圖文識別的“疑難雜癥”:如醫療的體檢報告、法院的文書、學術論文、企業合同等,還有復雜長表格、雜亂板式、手寫公式、印章手寫合同、傾斜少線等情況,訊飛星火4.0 Turbo圖文識別能力升級,使得通用文檔版面分析、文字識別的準確率相對提升了40%,復雜表格結構、潦草手寫文字等方面的錯誤率下降了40%,可以解決上述難題、大幅提升高價值數據的獲取能力。

此次升級還針對性地提升了文檔要素檢測能力,在知識切分和構建的粒度上更加精細、準確,能有效防止大模型幻覺,同時發布了掃描文檔解析的極速版本,文檔理解速度提升了10倍以上。對于一份500頁的項目文件,從掃描、識別到解析的全過程,僅需2分鐘即可全部完成。

值得注意的是,本次發布會上,訊飛星火行業首發了混域知識搜索技術。該技術能夠實現對個人知識、企業知識、業務系統數據、精品行業數據以及互聯網信息的綜合搜索,單次提問即可獲得綜合搜索后的結果,大大提升信息搜索效率。

圖片3

“通專結合”合力打造央國企解決方案

大模型底座能力正以前所未有的深度和廣度,全方位推動各行業的變革與發展。

圖片4

2024年11月28日,由中國石油、中國移動、華為、科大訊飛共建的昆侖大模型又有突破:700億參數昆侖大模型建設成果發布會在北京舉辦。繼2024年5月28日啟動建設、8月28日發布330億參數大模型階段性成果后,昆侖大模型本次升級發布除尺寸參數大增外,還帶來了43個石油行業的專業應用和通用應用創新場景。據悉,昆侖大模型已于2024年8月23日通過了國家生成式人工智能服務備案,是中國能源化工行業首個通過備案的大模型。

2024年10月,中國海油攜手科大訊飛、中國電信打造的“海能”人工智能模型正式發布,同時推出具有海油特色的5個專業場景模型和6個通用場景模型。在訊飛星火大模型底座和一系列“AI助手”應用的加持下,一個個人工智能模型應運而生,化身“AI行業專家”和“AI專屬助理”。

2024年9月22日,中國綠發和科大訊飛共同發布更懂綠色產業的泰山大模型。基于泰山大模型,致力于打造在央國企具有引領意義的首個央企AI總部。在泰山大模型的賦能下,面向綠發的統一知識門戶,為每位綠發員工配備一位專屬AI助手,“即插即用”的智能體平臺可以讓員工根據實際需求創建屬于自己的專屬智能體,覆蓋的辦公場景更加廣泛。

2024年8月,科大訊飛中標了華潤大模型服務框架和華潤數科私域大模型合作伙伴項目。在華潤數科與科大訊飛的全力合作下,2024年8月30日,華潤數科私域大模型及其平臺正式上線,形成“云+大模型”的智能底座,訊飛星火大模型未來將深度賦能華潤集團的數智化轉型。

根據第三方數據顯示,在2024年,無論是大模型招投標的全年總盤還是在央國企領域,科大訊飛的中標數量和中標金額均居第一,成為2024年度大模型中標項目的“標王”。具體而言,在科大訊飛的中標項目中,涵蓋了通信、金融、能源、教科、政務、醫療等多個行業,主要以央國企客戶為主。

科大訊飛方面表示,大模型商業化落地這場仗,不僅考驗算力,還有對算法的透徹理解、算力和數據的平衡等要素,在許多專業領域中,高質量的數據可能比算力更重要。

在“通用大模型+專業大模型”合力打造央國企解決方案的探索上,科大訊飛如今已摸索出一條成本低、效率高的商業化落地路徑。相較于單純依賴一個超大規模的萬億級大模型,“通專結合”模式能夠充分融合1個通用大模型的強大語義理解能力,同時靈活調用幾億、幾十億乃至幾百億參數規模的大模型,組合完成復雜任務,為央國企及各行業提供高性價比的定制化解決方案。

科大訊飛方面表示,預計未來幾年,科大訊飛將持續探索AGI(通用人工智能)過程中各個階段的大模型成果,并通過蒸餾、裁剪等各種技術手段沿途產出,落地到訊飛星火各個尺寸的大模型中,助力訊飛星火在商業化競爭的過程中不斷提升市場競爭力。

綜合能力提升率超過10%

賽迪顧問研究數據顯示,截至2024年11月30日,中國數字經濟核心產業企業總量已達到457.41萬家,與2023年底相比實現了17.99%的顯著增長。隨著數實融合深入推進,企業數字化轉型成為推動數字經濟發展的重要力量。

日前召開的全國數據工作會議將“著力推動數字經濟和數字社會高質量發展”列入2025年數據九大工作之一,并表示要深入實施數字化轉型工程,推動構建數字產業集群梯次布局體系,推動數實深度融合。

如何更高效助力企業實現數字化升級?科大訊飛方面表示,企業可以選擇“建算力、理數據、訓模型、落場景、保安全、精運營”的全套解決方案私有化部署;也可以應用星火智能體平臺、星火飛碼iFlyCode、星火智算平臺等多項工具,以零代碼、低代碼的方式完成場景應用開發,定制專屬大模型助理。

截至2024年12月,科大訊飛已經與中石油、中海油、國家能源、華潤、綠發等央國企及20多個行業的頭部企業一起發布行業大模型,覆蓋300多個應用場景。

在發布會上,科大訊飛相關負責人指出,基于“技術+應用”的不斷正向循環,訊飛星火4.0 Turbo的行業能力全面提升,金融、油氣、能源、電力、鋼鐵、航空等領域綜合能力提升超過10%,成為“最懂行業的大模型”。

責任編輯:潘曉娟


返回首頁
相關新聞
返回頂部
国产福利一区二区麻豆