在AI深度滲透內(nèi)容行業(yè)的2025年,數(shù)字人逐漸成為各大平臺戰(zhàn)略能力的一部分,百度率先交出了一份具有說服力的答卷。
6月15日,百度電商直播間迎來特別來賓:數(shù)字人羅永浩與數(shù)字人助播朱蕭木配合主持,整場直播持續(xù)超過6小時,完成了從內(nèi)容生成、控場互動、商品講解到情緒管理的完整閉環(huán)。這是“頭部主播首次以數(shù)字人身份開播”。
據(jù)官方數(shù)據(jù)顯示,直播上線26分鐘,數(shù)字人直播GMV即超過了真人1小時的數(shù)據(jù);整場直播觀看人次突破1300萬,GMV超5000萬元。這些數(shù)據(jù)表明,AI驅動的數(shù)字人直播已不再是實驗室技術展示,而是具備初步商業(yè)閉環(huán)能力的生產(chǎn)力工具。
更深層的意義在于,一位頂級IP主播主動選擇以數(shù)字分身的形式進行商業(yè)化直播,并將其植入以AI為核心能力的百度優(yōu)選為代表的新型電商平臺,標志著數(shù)字人技術已走出“試驗田”,進入可驗證、可放大的場景正循環(huán)。這背后既是平臺運營效率的提升,也預示著直播內(nèi)容供給模式正在發(fā)生較大的變化。
百度創(chuàng)始人李彥宏曾在Create 2025開發(fā)者大會上提出“高說服力數(shù)字人”概念,強調(diào)其為AI最具應用潛力的方向之一。本次直播正是其首次全面展示,回應了市場對數(shù)字人“真實可用性”的考量,也為平臺層技術落地提供了開創(chuàng)價值。
從“會說”到“會帶”:數(shù)字人進化的技術之路
此前,數(shù)字人帶貨更多局限于中腰部品牌或平臺測試賬號,動作僵硬、口播生硬、互動遲鈍是用戶的主要觀感。但百度這次完成了“業(yè)內(nèi)首次”由頂流主播真身授權的數(shù)字人直播——不僅聲音、語調(diào)和神態(tài)高度還原,更重要的是,其直播表現(xiàn)實現(xiàn)了技術到商業(yè)的閉環(huán)。
這一代數(shù)字人由百度電商“慧播星”平臺打造,依托文心4.5大模型,結合腳本智能創(chuàng)作、多模態(tài)融合、自主決策思考和智能體調(diào)度技術,實現(xiàn)“超擬真、能思考、會協(xié)同”的表達與操作能力。目前,慧播星平臺已累計生成超過10萬個數(shù)字人主播,整體轉化率提升31%,在教育、圖書等場景中的部分直播間表現(xiàn)超過真人。
過去一年百度優(yōu)選開播主播數(shù)量上漲371%,訂單量上漲148%,月銷百萬商家數(shù)也實現(xiàn)了幾乎翻倍的增長; 24年數(shù)字人直播GMV年同比上漲了十一倍。
與以往“腳本播報—視頻生成—內(nèi)容播放”的線性流程不同,百度構建的是“理解—生成—執(zhí)行—反饋”的閉環(huán)引擎。平臺引入“劇本驅動”機制,不僅決定“說什么”,還實時控制“怎么說”與“如何動”。一段3分鐘的視頻素材即可快速生成語調(diào)自然、動作流暢、唇動匹配的擬真數(shù)字人,有效降低創(chuàng)作門檻。
此外,直播過程中,雙數(shù)字人搭檔(羅永浩與助播朱蕭木)配合完成 8300 余個精準動作,AI系統(tǒng)調(diào)用知識庫超1.3萬次,自動生成約9.7萬字商品講解內(nèi)容,支持用戶提問響應、價格調(diào)整、優(yōu)惠策略推送等功能。這些能力由文心大模型、AI大腦與多智能體調(diào)度系統(tǒng)協(xié)同完成,體現(xiàn)了平臺在“語義理解—內(nèi)容生成—行為執(zhí)行”上的全鏈路控制力。
百度數(shù)字人直播展現(xiàn)的能力,并不僅限于還原語音、姿態(tài),更在于情緒調(diào)動、交互邏輯與表達節(jié)奏的真實流動性。核心優(yōu)勢包括以下三點:
一是形神還原:通過語音模擬、動作匹配、神態(tài)控制等模塊,數(shù)字人羅永浩在語言風格與表達節(jié)奏上的還原度已接近真人水平。
二是智能交互:本場直播也是行業(yè)首次實現(xiàn)雙數(shù)字人協(xié)同帶貨。老羅與朱蕭木在話術接續(xù)、表情配合等方面展現(xiàn)出較高默契,支持“打斷說”“同時說”“引導交替”等自然交互方式。
三是動作細節(jié):直播中數(shù)字人可完成喝奶茶、舉起商品、開盒展示等細節(jié)動作,均由動作生成系統(tǒng)與直播腳本實時聯(lián)動生成,提升用戶沉浸感。
這些能力共同構成“高說服力”的技術支撐,也正是數(shù)字人從“展示型內(nèi)容”向“參與型運營”邁進的關鍵跳板。
從直播內(nèi)容到轉化閉環(huán):AI驅動下的電商重塑邏輯
數(shù)字人直播的價值,并非單純?nèi)〈肆Γ谟谥貥嫛皟?nèi)容—轉化”鏈條,推動直播從“表達型”向“運營型”遷移:
首先,數(shù)字人屬于高頻可復制的資產(chǎn):數(shù)字人可實現(xiàn)24小時無間斷直播,突破主播精力與時間瓶頸。平臺數(shù)據(jù)顯示,其可為商家節(jié)省80%以上的人力成本。
其次,系統(tǒng)支持多點并發(fā)能力:通過腳本裂變與主播克隆,同一IP可在多個直播間并行復用,構建“內(nèi)容矩陣”效應,增強GMV增長彈性。
最后,平臺支持數(shù)據(jù)閉環(huán),并且增強推薦邏輯:每一場直播中,數(shù)字人均可實時記錄用戶行為,并通過智能投放工具反饋給產(chǎn)品推薦與腳本生成邏輯,實現(xiàn)內(nèi)容優(yōu)化的持續(xù)迭代。
平臺方面,百度正在將“高說服力數(shù)字人+搜索導購系統(tǒng)+內(nèi)容運營工具”打造成電商新中臺,試圖用更高效、更可信、更易規(guī)模化的表達手段重構人貨場邏輯。此次百度數(shù)字人直播,打破了“內(nèi)容生成工具”的刻板印象,驗證了“表達—互動—轉化”的AI閉環(huán)模型。在數(shù)字人產(chǎn)業(yè)邁入2.0階段之際,這場直播不是終點,而是更大技術體系中的一個前奏。
過往數(shù)字人常被質(zhì)疑為“技術展示物”或“虛擬花瓶”。動作僵化、腳本單一、缺乏情感互動等,限制了其在商業(yè)環(huán)境中的持續(xù)應用能力。
此次百度的高說服力數(shù)字人直播完成了三項關鍵突破:
內(nèi)容可控:基于文心大模型的腳本引擎可根據(jù)人設、品類與用戶行為自動生成定制化話術;
情緒真實:劇本驅動機制實現(xiàn)語言語調(diào)、面部情緒、動作節(jié)奏一致性,提升用戶信任感;
結果驗證:通過GMV數(shù)據(jù)、停留時長、互動頻率等指標,直播效果具備清晰可量化的評估路徑。
這些能力共同推動數(shù)字人完成從“內(nèi)容演示工具”向“運營系統(tǒng)角色”的轉變。百度在此次直播中完成的不只是一次營銷事件,而是系統(tǒng)能力的一次實證演練。
未來的電商平臺競爭,將越來越多地聚焦于“表達效率”與“內(nèi)容說服力”之間的平衡。在AI能力主導內(nèi)容入口的時代,誰掌握了更可信、更穩(wěn)定、更具持續(xù)演化能力的表達系統(tǒng),誰就可能在新平臺范式中掌握主動。
AI不是替代個體,而是平臺系統(tǒng)的升級器官。數(shù)字人則是AI觸達用戶、參與交易、影響轉化的前端接口。它既代表著內(nèi)容的生產(chǎn)方式,也逐步塑造平臺的溝通結構與商業(yè)肌理。
百度的探索,提供了一個值得行業(yè)持續(xù)觀察的樣本。
【免責聲明】【廣告】本文僅代表作者本人觀點,與和訊網(wǎng)無關。和訊網(wǎng)站對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。郵箱:news_center@staff.hexun.com
最新評論