助力數據和AI普惠,亞馬遜云科技積極擁抱生成式AI新時代
摘要:日前,亞馬遜云科技在北京召開了生成式AI構建者大會,亞馬遜云科技大中華區產品部總經理陳曉建在大會上進行了題為“賦能生成式AI新時代,助力數據和AI普惠”的演講。
中國發展網訊 記者成靜報道 日前,亞馬遜云科技在北京召開了生成式AI構建者大會,亞馬遜云科技大中華區產品部總經理陳曉建在大會上進行了題為“賦能生成式AI新時代,助力數據和AI普惠”的演講。陳曉建表示,亞馬遜云科技正在圍繞應用場景、工具和基礎設施、數據基座、AI原生應用構建和生成式AI服務這五個層面,不斷助力企業和開發者全面釋放生成式AI的潛力。西門子集團、金山辦公軟件以及科思創中國作為亞馬遜云科技中國區生成式AI創新的代表客戶,也分享了各自的創新案例。大會還設立了三大分會場,探討應用基座、數據戰略和AI原生等生成式AI領域的熱門話題,同時設立開發者論壇和動力訓練營幫助更多的開發者上手體驗生成式AI時代開發的速度與激情。
“生成式AI正在重塑各行各業,亞馬遜云科技在生成式AI的使命之一就是‘普惠’。” 陳曉建表示,亞馬遜云科技提供了完整的端到端的生成式AI技術堆棧,從底層的加速層如加速芯片、存儲優化,到中間層模型構建工具和服務,再到最上層的生成式AI相關應用,每一層都在針對客戶的不同需求持續創新。“生成式AI到達了轉折點。”
亞馬遜CEO Andy Jassy曾經這樣說:“我們的目標是讓任何人都能夠獲得和大型企業一樣先進的基礎設施和成本來實現自己的創新。在生成式AI領域,我們同樣希望借助于亞馬遜云科技的產品和服務,實現生成式AI技術的普惠化,賦能更多的企業和個人開發者加速創新。”
陳曉建表示,開發生成式AI應用是一個充滿挑戰的系統工程,并不是單純的產品和服務拼接,因此,如何加速客戶最終應用的商業化落地,除了亞馬遜本身的資源以外,同樣需要構建強大的合作伙伴生態,與它們一起助力解決生成式AI應用構建中的各種技術問題,加速應用落地。除了云服務之外,亞馬遜云科技還提供解決方案架構師、產品技術專家、人工智能實驗、數據實驗室、快速原型團隊、專業服務團隊、培訓與認證部門等多個資源共同助力客戶成功,同時我們還攜手生態合作伙伴與初創圈構建生成式AI的完整體系,進一步助力生成式AI技術的落地。
根據麥肯錫咨詢2023年6月發布的生成式AI生產力前沿技術報告,在生成式AI技術帶來的經濟效益中,大約3/4來自四類主要的職能:營銷與銷售、產品與研發、軟件工程和客戶運營。而亞馬遜云科技借助專門構建的生成式AI工具和基礎設施,快速構建高性價比的生成式AI應用。
基礎模型的發展和迭代速度正超越以外任何一項技術,基本以月甚至天為單位持續迭代,而新出現的每一個大模型都在性能和特定領域有著獨特的優勢。在眾多的基礎模型中,應該如何便捷安全的選擇最適合自己業務場景的基礎模型,是每一家企業在構建生成式AI應用時面臨的挑戰。
對此,亞馬遜云科技正式推出了Amazon Bedrock,該服務與Amazon SageMaker Jumpstart結合,助力對基礎模型有著不同需求的客戶輕松、安全地選擇基礎模型。
高性價比的基礎設施是生成式AI應用構建的關鍵。陳曉建介紹說,10多年來,亞馬遜云科技對全球基礎設施進行深度投資,能夠為客戶提供廣泛的加速器選擇,包括強大而靈活的基于GPU的解決方案。“OPPO、Airbnb、Sprinklr和 Autodesk等客戶都在使用我們的專用加速器來處理要求苛刻的機器學習工作負載。”
面向生成式AI構建強大的數據“基座”,需要一套全面的服務,以便能夠存儲用于構建和微調模型的各種類型的數據;還需要服務間的集成,以打破數據孤島,確保能夠隨時訪問所有數據;還需要在構建生成式AI應用程序的整個生命周期中,確保數據安全并對其進行管理。
在全面的服務方面,亞馬遜云科技針對生成式AI領域的用戶個人信息、會話信息管理、私域知識庫等應用場景都提供了專門構建的數據庫。在數據集成方面,ETL(數據的抽取Extract,轉換Transform,加載 Load)是端到端數據旅程迫切需要解決的問題,亞馬遜云科技提出“Zero-ETL”的愿景,并采用了相應的創新,如推出的Aurora Zero ETL for Redshift Integration, 允許存儲在Amazon Aurora中實時產生的業務數據,無需ETL工具,以自動的方式同步到數據倉庫Amazon Redshift中,以供近實時的進行海量數據的聚合分析。在數據治理方面,亞馬遜云科技提供Amazon DataZone這一全新的數據治理服務,讓客戶能夠跨組織邊界發現、訪問、共享和治理大規模數據,并減少企業內部成員訪問數據和使用分析工具時繁重的工作量。
亞馬遜云科技在服務百萬客戶無數次變化的現代化應用轉型過程中,積累了一些不變的經驗,以分享給生成式AI時代的構建者:以微服務化和事件驅動架構為核心的設計框架,松耦合的去處理每個功能模塊之間的互相依賴;Serverless First簡化運維,提升效率;數據決策優先,像資產一樣重視數據,數據能力作為應用的核心競爭壁壘加入到生成式AI應用的設計理念中來;安全圍欄,影響面控制,減小爆炸半徑,將安全與數據的合規與保護放在前所未有的重要地位;避免重復造輪子,除了技術本身,在DevOps,基礎設施即服務,自動化等現代應用治理理念持續投入,促進企業內部的應用資產與實踐的分享,構建高效敏捷的構建者文化。
編程將是生成式AI技術得到快速應用的領域之一。軟件開發者需要花費大量時間編寫相當淺顯和無差別的代碼,真正用于創新的時間少之又少。從網上復制代碼片段則可能無意中復制無效代碼或有安全隱患的代碼,或對開源代碼的使用沒有進行有效追溯。對此,亞馬遜云科技的解決方案是Amazon CodeWhisperer。它是一款人工智能編碼伙伴,在基礎模型高級選項中使用,可以實時生成代碼建議,從根本上提高開發人員的生產力。
亞馬遜云科技最近還推出了Amazon Whisperer自定義功能,能夠生成優于之前的代碼建議,因為它允許客戶使用私有代碼庫安全地定制CodeWhisperer代碼建議,這些私有代碼庫可涵蓋內部API、數據庫、最佳實踐和架構模式等。
“亞馬遜云科技通過開箱即用的生成式AI服務及工具,已幫助1000多家中小企業和初創公司快速實現生成式AI創新,已賦能10萬多家中國開發者。”陳曉建表示。
西門子股份公司專注于工業、基礎設施、交通和醫療領域,并與亞馬遜云科技在多個項目上有著緊密合作,此前亞馬遜云科技的一些產品和功能已被運用到西門子中國成都燈塔工廠,用于廢料分揀、產品自檢等關鍵的生產制造環節。出于企業戰略考慮,在結合業務具體需求的前提下,西門子中國與亞馬遜云科技合作開發了基于生成式人工智能技術的智能會話機器人“小禹”,它采用了“檢索增強生成RAG架構+向量數據庫”設計,大大縮短了整體開發與部署的時間,僅用三個月就圓滿完成了。
相對于傳統機器人,“小禹”的回答內容不僅生成速度更快,其對搜索關鍵詞的命中率也更高,整體使用體驗遠超傳統機器人。西門子中國專屬智能知識庫上線后,首周就有超過4000位內部用戶參與使用,超過12000個問題被提出并解答。作為智能知識庫,它不但解決了各業務部門之間需求相似、重復開發的問題,更以云上彈性資源和托管的 Amazon OpenSearch Service 、Amazon SageMaker 等服務節約了系統在運維和擴展方面的投入成本。
“未來西門子將不斷擴展機器人‘小禹’服務于各個應用領域,比如40%的IT支持問題可以利用小禹的知識查詢和問答快速解決;產品研發中大約30%跟編碼,測試,調試和文檔編制相關的任務也可以利用小禹加速完成。”西門子 IT經理李朝明表示。
責任編輯:成靜