首頁社會正文

AI創業，追逐風口但別輕信“紅利”

2024-05-24 17:12 揚子晚報

AI 創業

摘要：AI無法創造奢侈品，也很難觸及高頻需求，我們的日常生活中，出門吃飯買菜，回家刷短視頻睡覺，很少需要創造圖像，因此傳統商業意義的高客單價和高頻都是不可取的。

AI創業，追逐風口但別輕信“紅利”

——專訪AI人機交互專家季嘯白

自2023年以Stable Diffusion為主的開源圖像生成AI以來，AI在圖像和視頻兩個方向均有了質的突破。從語音AI到成為創新前沿的AI視頻大模型，經歷了六十年風雨的人工智能逐漸迎來了產業化的臨界點。

季嘯白目前在全球頭部互聯網社交媒體公司工作，同時也是長期的圖像生成AI方向創業者。從全球頂級名校碩士畢業后，季嘯白一直投身于圖像生成AI產品化的研究和創業，作品也多次獲獎。AI如何轉化為新質生產力？紫牛新聞記者采訪了人機交互專家季嘯白。

一

紫牛新聞：無論是蘋果手機的Siri，還是小愛同學、天貓精靈，語音助手從一出生開始就被人們視作AI技術的落地產品，但它為何沒被多數用戶高頻使用？

季嘯白：我覺得主要有兩大原因：使用場景有限和效率不高。語音AI最早可以追溯到20世紀50年代，很長的時間段里，它是依賴人類維護來回答問題。近幾年語音AI實現了質的飛躍，比如ChatGPT所提供的語音AI不僅能夠回答用戶的問題，還能引導對話向更有價值的方向發展。但作為信息傳遞的載體，語音的信息密度常常低于圖像，在很多場景下，單憑語音很難完整表達復雜的信息。此外，語音AI個性化能力有著先天不足，它很難從你的語氣和用詞中感知你的喜好，無法獲得你的使用數據，也無法高效向你推薦內容。圖形化界面的先天優勢在于，無論是淘寶還是抖音，你點進去看了多久，查看哪一類商品比較多，這些數據都能作為推薦給你視頻和商品的依據。

紫牛新聞：但語音AI仍然是人工智能競逐的重要戰場，比如2024北京車展，車內AI語音交互便是很多新能源車的亮點。語音AI還有哪些發展方向？

季嘯白：如今基于大模型智駕技術的企業非常多，但即便是業界領先的語音識別算法，在嘈雜環境、口音差異、速度變化等情況下，轉錄準確率很難達到100%。但人類在機器時代已養成了這樣的慣性：對人類犯錯習以為常，但不能接受機器犯錯，這正是車內AI語音交互發展的限制。此外，在車內場景下，用戶對語音AI的訴求不算高頻需求，變現方式也頗為單一，大多打包在車機訂閱服務中。對于普通AI創業者來說，成功的機會很小。相比之下，語音AI在情感陪伴方面，賽道更寬。獨居老人常常缺乏人際交流，情感陪伴型語音助手可以通過自然對話，為老人提供情感支持；陪伴兒童時，語音助手可以與孩子進行有趣的互動游戲；有些年輕人希望和喜歡的動漫角色談戀愛，和自己崇拜的偶像交流，和喜歡的虛擬角色交流，這些都是語音AI可能應用的空間。

二

紫牛新聞：去年底英國《自然》雜志刊文預測的2024年十大科學進展中，人工智能的進步和ChatGPT人工智能占據前兩位。人類如何對待可能擁有意識的人工智能，也成了關注的話題。

季嘯白：有研究者預測，人工智能產生意識將在5-20年內實現。但我知道的是，2023年沒有一項資助是用于“研究人工智能產生意識”的。我認為，AI的發展仍然在早期。在當下，人們仿佛對AI有些不切實際的幻想，總認為AI已經進化出了人類的思維，有感情、有思考，能代替人類寫論文，甚至能和人類談戀愛。這有些一廂情愿了。

紫牛新聞：2023年1月，美國多名藝術家集體起訴三家生成式AI商業應用公司作圖軟件以他們作品的風格生成圖像，法院審理認為AI生成后的圖片本來就不享有著作權，并不違反著作權法。今年，谷歌又面臨著三位漫畫家和一位攝影師提出的集體訴訟。你如何看待這些訴訟？

季嘯白：這也印證了當下AI是沒有人類思維的。目前，你讓AI寫生物醫藥論文、畫一幅抽象主義繪畫，而AI本質上只是學習過去人們寫過的論文、畫過的繪畫，然后按照人類當下的需求重新雜糅并輸出。AI是沒有創造性的，特別是圖像領域。圖像生成AI經常出現的版權糾紛，是因為人類對AI的輸出結果不能很好地控制。由此可見，探索更有效的人機交互方式，空間很大。

紫牛新聞：當下，越來越多的創業者涌入AI領域，在圖像生成方面，可謂是老中青三代齊上陣，但進去后卻發現并不輕松。你如何看待？

季嘯白：當前圖像生成AI的人機交互方式，從渠道上來說分為用文字生成圖像、用“文字+圖像”生成圖像、用“文字+圖像+風格傾向”生成圖像、用“文字+圖像+標注重點部位”生成圖像；從輪次上來說也分為單次和多次。設計合理且簡化的人機交互，更能幫助面向普通用戶的C端產品獲得成功。如何幫圖像生成式AI做好人機交互體驗，幫助人們合理準確表達訴求的同時，降低上手難度和門檻，是創業者和普通用戶的需求，也是我重點研究的方向。

紫牛新聞：很多創業者認為，C端(個人用戶端)需求大，尋求C端擴張更容易成功。

季嘯白：美國硅谷早期的一些圖像生成AI都是面向普通消費者的，用戶按次付費，或通過訂閱制包月使用。大部分消費者抱著嘗鮮的目的而來，用戶增長很快，但留存和付費轉化很低，本質上是因為通用型圖像生成AI的天花板太低。當下，圖像生成AI的重點正在從C端向著面向企業的B端轉移。

紫牛新聞：面向B端的產品和面向C端的產品，有什么明顯不同？

季嘯白：B端消費者不喜歡隨機，無法接受太高的自由度。B端用戶是要生成圖片拿來干活的，不能天馬行空的任由AI發揮。因此，對B端產品需要深入淺出地提供更豐富的多輪生成調優能力，這一點在人機交互的設計上一定要考慮到。

紫牛新聞：那C端產品的落地方向在哪？

季嘯白：C端產品的商業空間肯定存在。短期內圖像生成AI在C端產品的落地方向，是低客單價的普遍需求。千萬不能陷入追求高客單價，AI的本質是替代人類的重復勞動和昂貴勞動力，追求高客單價是個誤區。AI無法創造奢侈品，也很難觸及高頻需求，我們的日常生活中，出門吃飯買菜，回家刷短視頻睡覺，很少需要創造圖像，因此傳統商業意義的高客單價和高頻都是不可取的。C端創業者，一定要著眼普遍的多個需求，比如做AI圖像集成工具，連帶AI美妝，AI一鍵換背景，AI一鍵改光線，AI生成證件照、藝術照，雖然對單個用戶而言不算高頻需求，但對于整個社會而言，累計使用次數會相當可觀。

紫牛新聞：B端用戶中，電商是龐大的群體，也是普通AI創業者重點關注的對象。面向電商的AI創業，你有什么建議？

季嘯白：電商行業其實是最早開始接觸圖片生成AI技術的行業，因為行業本身信息敏感度高，也有大量圖片處理需求。我們工作中也經常有電商行業的從業者來聊，他們的需求太大了，無論是圖像生成、圖像批量后期處理，還是一鍵換衣等需求，本質上就是用AI的低成本去換重拍圖片的成本。但是，他們的需求非常雜，相當定制化，具體到每一類需求量，其實不大，所以圖片生成AI反而服務不好這個行業。之前有個老板來找我們，希望把帽子、圍巾、手套等物品的平鋪圖能直接生成到模特的身上。從技術角度，我們要對物品做定制化的開發，有一定人工成本。電商核算后，發現找模特快速拍一下效率更高，成本更低。這一個項目最終沒有成功，但能管中窺豹一個行業。

三

紫牛新聞：2月15日， OpenAI發布了“文生視頻”大模型Sora，并附帶發布了由它生成的48段視頻，引發了社會高度關注。從中長期看，圖像生成AI的發展方向是什么？

季嘯白：我認為視頻生成正處于破曉時分。視頻的商業前景比圖片大得多，這也是抖音、TikTok等產品成功的原因。經過互聯網20年的發展，人們對消費視頻已經習以為常，使用習慣也從閱讀靜態媒體向消費動態內容轉變。視頻生成大約在2025年達到可商用的成熟度。視頻生成技術一旦成熟，OpenAI可能會建立自己的視頻平臺，和抖音、TikTok直接競爭視頻消費者，同時給影視行業帶來變革。影視行業不一定喜歡從0開始生成視頻，但會對修復拍攝的穿幫細節、虛擬布景AI生成宏大背景、生成無法拍攝的視覺效果等感興趣。影視行業的付費意愿高，和影視行業緊密合作，會是這個10年下半場的重要機會。

紫牛新聞：AI會取代人類的攝影和圖像創作嗎？

季嘯白：從長期來說，圖像生成AI一定是和人類大腦協作，而不是取代人類的攝影和圖像創作。攝影是對客觀事物的捕捉，也是拍攝者情緒和思考的表達。我很喜歡畫畫和攝影，AI技術雖然在不斷演進，但人類主動創作的主觀表達是永遠無法替代的。

揚子晚報/紫牛新聞記者王塞塞

責任編輯：宋璟

(原標題：AI創業，追逐風口但別輕信“紅利”)

相關新聞

AI 創業

返回首頁

相關新聞

返回頂部

国产福利一区二区麻豆