7月26日,在WAIC世界人工智能大會期間,百度公司對外展示了其在數字人領域的最新研發成果——新一代數字人技術NOVA。該技術依托百度慧播星平臺發布,旨在顯著提升數字人在直播場景下的綜合表現力與互動能力。
NOVA技術核心優勢體現在三個方面。首先,該技術基于文心大模型4.5構建的大師級劇本模式,能夠自動生成高質量直播腳本,通過多模態技術協同實現數字人在直播環境中的形態、神情、聲音和容貌的精準統一。
在智能交互層面,NOVA配備的AI決策系統能夠實時分析直播數據流,通過多智能體調度機制完成觀眾問答互動,同時結合實時熱點生成具有個性化風格的直播內容。
技術復刻效率成為該方案的突出亮點。根據百度介紹,NOVA僅需采集10分鐘的真人樣本數據,即可完成對目標對象聲音特征、動作習慣以及表達氛圍的全面復刻,實現高度還原的數字人形象。
該技術此前已在商業場景中得到驗證。羅永浩數字人直播間運用該技術創造了5500萬元的商品交易總額,展現了數字人直播的商業潛力。
百度方面透露,NOVA技術計劃于今年10月面向全行業開放使用。屆時,普通商家和個人用戶將能夠獲得專業級的數字人直播能力。目前,該技術已啟動邀請測試階段,率先在教育培訓、健康醫療等十余個垂直行業的內容創作者和商家中進行應用試點。