【資料圖】
【太平洋科技資訊】在2023年華為云數(shù)字文娛AI創(chuàng)新峰會上,華為云全球Marketing與銷售服務(wù)總裁石冀琳宣布,華為云將推出盤古數(shù)字人大模型,幫助用戶在12小時內(nèi)完成數(shù)字人生成,實現(xiàn)個性化數(shù)字人自由。
據(jù)華為云開發(fā)者聯(lián)盟介紹,盤古數(shù)字人通用大模型由華為云MetaStudio數(shù)字內(nèi)容生產(chǎn)線構(gòu)建,基于華為云盤古基礎(chǔ)大模型能力、渲染引擎和實時音視頻能力,使用PB級音視頻數(shù)據(jù)進行訓練構(gòu)建。
盤古數(shù)字人大模型涵蓋數(shù)字人形象、動作、表情、口型、聲音等要素,用戶可結(jié)合個人數(shù)據(jù)對數(shù)字人進行訓練,構(gòu)建個性化大模型。生成的數(shù)字人可通過文字、語音、視頻等方式驅(qū)動,生成高清視頻。
據(jù)稱,用戶可在10秒內(nèi)通過輸入文字生成數(shù)字人模型,上傳照片則在30秒內(nèi)生成不同類型的數(shù)字人模型。用戶還可以通過拍攝一段5分鐘的視頻,在一個小時內(nèi)訓練生成數(shù)字人,并完成二次編輯和背景融合,如發(fā)型、配飾、服裝等。
盤古大模型 3.0 于 2023 年 7 月 7 日的 2023 年華為開發(fā)者大會上正式發(fā)布,可在礦山、鐵路、氣象、金融、代碼開發(fā)、數(shù)字內(nèi)容生成等領(lǐng)域發(fā)揮作用。
數(shù)字人技術(shù)的不斷創(chuàng)新讓我們仿佛走進了科幻電影中的未來世界,可以構(gòu)建個性化的數(shù)字人模型,通過文字、語音、視頻等方式與其進行互動。你期待真正體驗這一技術(shù)嗎?
關(guān)鍵詞: