首頁 社會 正文

AI創業,追逐風口但別輕信“紅利”

2024-05-24 17:12 揚子晚報
AI 創業

摘要:AI無法創造奢侈品,也很難觸及高頻需求,我們的日常生活中,出門吃飯買菜,回家刷短視頻睡覺,很少需要創造圖像,因此傳統商業意義的高客單價和高頻都是不可取的。

AI創業,追逐風口但別輕信“紅利”

——專訪AI人機交互專家季嘯白

自2023年以Stable Diffusion為主的開源圖像生成AI以來,AI在圖像和視頻兩個方向均有了質的突破。從語音AI到成為創新前沿的AI視頻大模型,經歷了六十年風雨的人工智能逐漸迎來了產業化的臨界點。

季嘯白目前在全球頭部互聯網社交媒體公司工作,同時也是長期的圖像生成AI方向創業者。從全球頂級名校碩士畢業后,季嘯白一直投身于圖像生成AI產品化的研究和創業,作品也多次獲獎。AI如何轉化為新質生產力?紫牛新聞記者采訪了人機交互專家季嘯白。

紫牛新聞:無論是蘋果手機的Siri,還是小愛同學、天貓精靈,語音助手從一出生開始就被人們視作AI技術的落地產品,但它為何沒被多數用戶高頻使用?

季嘯白:我覺得主要有兩大原因:使用場景有限和效率不高。語音AI最早可以追溯到20世紀50年代,很長的時間段里,它是依賴人類維護來回答問題。近幾年語音AI實現了質的飛躍,比如ChatGPT所提供的語音AI不僅能夠回答用戶的問題,還能引導對話向更有價值的方向發展。但作為信息傳遞的載體,語音的信息密度常常低于圖像,在很多場景下,單憑語音很難完整表達復雜的信息。此外,語音AI個性化能力有著先天不足,它很難從你的語氣和用詞中感知你的喜好,無法獲得你的使用數據,也無法高效向你推薦內容。圖形化界面的先天優勢在于,無論是淘寶還是抖音,你點進去看了多久,查看哪一類商品比較多,這些數據都能作為推薦給你視頻和商品的依據。

紫牛新聞:但語音AI仍然是人工智能競逐的重要戰場,比如2024北京車展,車內AI語音交互便是很多新能源車的亮點。語音AI還有哪些發展方向?

季嘯白:如今基于大模型智駕技術的企業非常多,但即便是業界領先的語音識別算法,在嘈雜環境、口音差異、速度變化等情況下,轉錄準確率很難達到100%。但人類在機器時代已養成了這樣的慣性:對人類犯錯習以為常,但不能接受機器犯錯,這正是車內AI語音交互發展的限制。此外,在車內場景下,用戶對語音AI的訴求不算高頻需求,變現方式也頗為單一,大多打包在車機訂閱服務中。對于普通AI創業者來說,成功的機會很小。相比之下,語音AI在情感陪伴方面,賽道更寬。獨居老人常常缺乏人際交流,情感陪伴型語音助手可以通過自然對話,為老人提供情感支持;陪伴兒童時,語音助手可以與孩子進行有趣的互動游戲;有些年輕人希望和喜歡的動漫角色談戀愛,和自己崇拜的偶像交流,和喜歡的虛擬角色交流,這些都是語音AI可能應用的空間。

紫牛新聞:去年底英國《自然》雜志刊文預測的2024年十大科學進展中,人工智能的進步和ChatGPT人工智能占據前兩位。人類如何對待可能擁有意識的人工智能,也成了關注的話題。

季嘯白:有研究者預測,人工智能產生意識將在5-20年內實現。但我知道的是,2023年沒有一項資助是用于“研究人工智能產生意識”的。我認為,AI的發展仍然在早期。在當下,人們仿佛對AI有些不切實際的幻想,總認為AI已經進化出了人類的思維,有感情、有思考,能代替人類寫論文,甚至能和人類談戀愛。這有些一廂情愿了。

紫牛新聞:2023年1月,美國多名藝術家集體起訴三家生成式AI商業應用公司作圖軟件以他們作品的風格生成圖像,法院審理認為AI生成后的圖片本來就不享有著作權,并不違反著作權法。今年,谷歌又面臨著三位漫畫家和一位攝影師提出的集體訴訟。你如何看待這些訴訟?

季嘯白:這也印證了當下AI是沒有人類思維的。目前,你讓AI寫生物醫藥論文、畫一幅抽象主義繪畫,而AI本質上只是學習過去人們寫過的論文、畫過的繪畫,然后按照人類當下的需求重新雜糅并輸出。AI是沒有創造性的,特別是圖像領域。圖像生成AI經常出現的版權糾紛,是因為人類對AI的輸出結果不能很好地控制。由此可見,探索更有效的人機交互方式,空間很大。

紫牛新聞:當下,越來越多的創業者涌入AI領域,在圖像生成方面,可謂是老中青三代齊上陣,但進去后卻發現并不輕松。你如何看待?

季嘯白:當前圖像生成AI的人機交互方式,從渠道上來說分為用文字生成圖像、用“文字+圖像”生成圖像、用“文字+圖像+風格傾向”生成圖像、用“文字+圖像+標注重點部位”生成圖像;從輪次上來說也分為單次和多次。設計合理且簡化的人機交互,更能幫助面向普通用戶的C端產品獲得成功。如何幫圖像生成式AI做好人機交互體驗,幫助人們合理準確表達訴求的同時,降低上手難度和門檻,是創業者和普通用戶的需求,也是我重點研究的方向。

紫牛新聞:很多創業者認為,C端(個人用戶端)需求大,尋求C端擴張更容易成功。

季嘯白:美國硅谷早期的一些圖像生成AI都是面向普通消費者的,用戶按次付費,或通過訂閱制包月使用。大部分消費者抱著嘗鮮的目的而來,用戶增長很快,但留存和付費轉化很低,本質上是因為通用型圖像生成AI的天花板太低。當下,圖像生成AI的重點正在從C端向著面向企業的B端轉移。

紫牛新聞:面向B端的產品和面向C端的產品,有什么明顯不同?

季嘯白:B端消費者不喜歡隨機,無法接受太高的自由度。B端用戶是要生成圖片拿來干活的,不能天馬行空的任由AI發揮。因此,對B端產品需要深入淺出地提供更豐富的多輪生成調優能力,這一點在人機交互的設計上一定要考慮到。

紫牛新聞:那C端產品的落地方向在哪?

季嘯白:C端產品的商業空間肯定存在。短期內圖像生成AI在C端產品的落地方向,是低客單價的普遍需求。千萬不能陷入追求高客單價,AI的本質是替代人類的重復勞動和昂貴勞動力,追求高客單價是個誤區。AI無法創造奢侈品,也很難觸及高頻需求,我們的日常生活中,出門吃飯買菜,回家刷短視頻睡覺,很少需要創造圖像,因此傳統商業意義的高客單價和高頻都是不可取的。C端創業者,一定要著眼普遍的多個需求,比如做AI圖像集成工具,連帶AI美妝,AI一鍵換背景,AI一鍵改光線,AI生成證件照、藝術照,雖然對單個用戶而言不算高頻需求,但對于整個社會而言,累計使用次數會相當可觀。

紫牛新聞:B端用戶中,電商是龐大的群體,也是普通AI創業者重點關注的對象。面向電商的AI創業,你有什么建議?

季嘯白:電商行業其實是最早開始接觸圖片生成AI技術的行業,因為行業本身信息敏感度高,也有大量圖片處理需求。我們工作中也經常有電商行業的從業者來聊,他們的需求太大了,無論是圖像生成、圖像批量后期處理,還是一鍵換衣等需求,本質上就是用AI的低成本去換重拍圖片的成本。但是,他們的需求非常雜,相當定制化,具體到每一類需求量,其實不大,所以圖片生成AI反而服務不好這個行業。之前有個老板來找我們,希望把帽子、圍巾、手套等物品的平鋪圖能直接生成到模特的身上。從技術角度,我們要對物品做定制化的開發,有一定人工成本。電商核算后,發現找模特快速拍一下效率更高,成本更低。這一個項目最終沒有成功,但能管中窺豹一個行業。

紫牛新聞:2月15日, OpenAI發布了“文生視頻”大模型Sora,并附帶發布了由它生成的48段視頻,引發了社會高度關注。從中長期看,圖像生成AI的發展方向是什么?

季嘯白:我認為視頻生成正處于破曉時分。視頻的商業前景比圖片大得多,這也是抖音、TikTok等產品成功的原因。經過互聯網20年的發展,人們對消費視頻已經習以為常,使用習慣也從閱讀靜態媒體向消費動態內容轉變。視頻生成大約在2025年達到可商用的成熟度。視頻生成技術一旦成熟,OpenAI可能會建立自己的視頻平臺,和抖音、TikTok直接競爭視頻消費者,同時給影視行業帶來變革。影視行業不一定喜歡從0開始生成視頻,但會對修復拍攝的穿幫細節、虛擬布景AI生成宏大背景、生成無法拍攝的視覺效果等感興趣。影視行業的付費意愿高,和影視行業緊密合作,會是這個10年下半場的重要機會。

紫牛新聞:AI會取代人類的攝影和圖像創作嗎?

季嘯白:從長期來說,圖像生成AI一定是和人類大腦協作,而不是取代人類的攝影和圖像創作。攝影是對客觀事物的捕捉,也是拍攝者情緒和思考的表達。我很喜歡畫畫和攝影,AI技術雖然在不斷演進,但人類主動創作的主觀表達是永遠無法替代的。

揚子晚報/紫牛新聞記者 王塞塞

責任編輯:宋璟

(原標題:AI創業,追逐風口但別輕信“紅利”)


返回首頁
相關新聞
返回頂部
国产福利一区二区麻豆