文|游戲茶館 小豬
近日,進入飛速發(fā)展階段的AI可謂是科技行業(yè)新晉“當紅炸子雞”,稍微一點風(fēng)吹雨動,就能輕松登上熱搜榜單。但是我們今天要聊的,不是人們熱議的ChatGPT和AI繪圖,而是早已以更加成熟的姿態(tài)進入商業(yè)市場的AI配音。
盡管在短視頻平臺上,影視解說賬號開頭的吟唱魔音罐耳,深入人心,但AI能說的,早已不止“注意看,這個女孩叫小美……”
尤其是在游戲市場,AI配音已經(jīng)得到了相當不錯的玩家反饋。3月20日,網(wǎng)易旗下的乙女游戲《時空中的繪旅人》就發(fā)布微博表示,游戲角色葉瑄采用的AI新聲音模型得到了更多玩家的好評,游戲內(nèi)問卷調(diào)查結(jié)果顯示,新配音實裝后的用戶評價均高于早期AI配音(2022年與卿書版本)。
01 聲優(yōu)塌房,AI救場
聊到乙女游戲使用AI配音,我們就不得不提前幾天剛上熱搜的配音圈大佬姜廣濤對此做出的“貢獻”。
姜廣濤這個名字你可能沒聽說過,但是他的聲音你一定不會陌生。經(jīng)典影視劇《小魚兒與花無缺》里面的花無缺、《泰坦尼克號》中的Jack、《宮鎖心玉》里的八阿哥,用的都是他的配音。在游戲領(lǐng)域,他配過的角色有《時空中的繪旅人》中的葉瑄、《未定事件簿》中的莫弈、《花亦山心之月》的玉澤、《陰陽師》帝釋天(CG)、《仙劍奇?zhèn)b傳五》姜云凡和《奇跡暖暖》鐘離梓等等。
去年7月,網(wǎng)上出現(xiàn)爆料稱姜廣濤被警方帶走,隨即姜廣濤旗下工作室光合積木發(fā)表聲明,說是因為商業(yè)糾紛正在配合調(diào)查。在線下活動取消、配音項目停更的同時,有“知情人”出面爆料,姜被帶走的真實原因是因為以職務(wù)之便騙錢,藏賬目,藏公章,藏營業(yè)執(zhí)照,涉及了刑事犯罪。不久后,網(wǎng)友查到反饋回復(fù)信息是職務(wù)侵占2000萬元,再次證實了這一消息。
瓜還沒吃完,網(wǎng)易的《時空中的繪旅人》和米哈游《未定事件簿》就前后腳宣布,游戲中姜廣濤配音的角色,后續(xù)將更換為AI配音。
而這次AI的出場,也著實讓人驚艷了一把。下面是網(wǎng)友整理的聲優(yōu)與AI配音的對比,大家可以淺淺感受一下。
我們從視頻下方的評論風(fēng)向也不難看出,實裝的AI配音效果超出了大多數(shù)玩家的預(yù)期。盡管AI的聲音還不“完美”,但是其表現(xiàn)“一點也不AI”,相對自然的聲音效果和永遠不會塌房的優(yōu)勢讓不少玩家直呼“太牛了”!
當然,還是有少部分玩家不太能接受AI,認為某些語句的語調(diào)、氣息和情感仍能聽出瑕疵,也有玩家認為沒有人類聲音情感支撐的純紙片人,就等于失去了靈魂。
但整體來看,大多數(shù)玩家對于剛進入游戲的AI配音仍抱以相對寬容的態(tài)度。
3月17日,吼浪工作室發(fā)布通告表示,姜廣濤等人因?qū)嵤┲卮笄趾?,涉嫌刑事犯罪被公安和檢察機關(guān)處理。官方發(fā)聲后,姜廣濤事件的性質(zhì)終于有了最終定論,而已經(jīng)上線了半年多的AI配音,也已有了顯著的進步。
3月20日,《時空中的繪旅人》官博發(fā)文,表示2023年2月游戲內(nèi)的問卷調(diào)查結(jié)果顯示,葉瑄新聲音模型實裝后的用戶評價均高于早期AI配音,未來游戲官方計劃逐漸迭代并替換掉初代技術(shù)方案的配音內(nèi)容。
至此,AI配音在游戲市場的首輪嘗試已經(jīng)取得了喜聞樂見的成果。
02 AI聲音背后的技術(shù)支持
AI配音效果迭代的背后當然是技術(shù)的發(fā)展。而站在《未定事件簿》莫弈和《時空中的繪旅人》葉瑄的AI聲帶背后,提供主要技術(shù)支持的,分別是逆熵科技和網(wǎng)易互娛AI Lab。
早在2019年,大偉哥就曾在上海交大的一次演講中分享過,逆熵AI的目標是通過深度學(xué)習(xí)某一個聲優(yōu)的音色和情感,做到輸入文字自動得到該聲優(yōu)的配音結(jié)果。以避免檔期不足等情況,還能將該聲音塑造成IP,永久保留,甚至出售聲音版權(quán)。
或是這一想法的推動,組建于2018年的逆熵研究部門,在2020年正式升級為主攻DeepLearning等AI技術(shù)的逆熵科技。
在工作室正式成立后,逆熵AI很快就開始了炫技。2021年2月,米哈游旗下的虛擬偶像@yoyo鹿鳴_Lumi(下稱鹿鳴)發(fā)布了一則名為“想聽我講野豬公主的故事嗎?”的視頻,簡介中明確標注聲音由逆熵AI生成。
這次成果展示驚呆了不少觀眾,原來AI的聲音已經(jīng)發(fā)展到了遠超“Hi,Siri”的程度。斷句流暢自然、語氣活潑、難辨AI痕跡的聽覺效果,讓粉絲們狂喜:老婆終于有聲音了!黑科技賽高!
2022年7月,鹿鳴在B站開啟首次直播。時長半小時的直播吸引了超66萬用戶觀看,收獲了322位艦長(折合收入約6萬多元)。在直播結(jié)束后,該直播錄屏播放量突破了200萬次,鹿鳴的B站關(guān)注人數(shù)也很快超過了150萬。而在此次直播內(nèi)容中,獲得粉絲們最多討論的除了精細的動作與畫面外,還有明確標注由“逆熵AI生成”的聲音。
在直播結(jié)束的兩個月后,受姜廣濤事件影響,《未定事件簿》正式宣布將為莫弈裝上AI聲帶,積累的數(shù)年時間的逆熵AI配音能力,終于正式進入游戲應(yīng)用階段的探索。
網(wǎng)易對于AI語音的技術(shù)探索也開始得很早。2017年,專攻計算機視覺、自然語言處理、語音信號處理、游戲AI等技術(shù)的網(wǎng)易AI Lab成立。
2020年,網(wǎng)易AI Lab在全球最大的語音會議INTERSPEECH上,拿到了與文本相關(guān)聲紋識別賽道的雙料大獎,展示了網(wǎng)易 AI Lab 在在聲紋識別技術(shù)探索上的領(lǐng)先成果。
但在早期階段,網(wǎng)易 AI Lab 的聲紋識別技術(shù)似乎并未進入配音場景,而是主要被應(yīng)用于身份驗證、針對音色對玩家進行分類等場景。
甚至在2021年,與《羊城晚報》合作推出廣東媒體首個視頻類AI合成主播“羊小晚”和“羊小派”的時候,網(wǎng)易AI Lab的語音識別技術(shù),也僅被用于與實現(xiàn)與語音適配的唇動效果,其中的配音部分,則采用了科大訊飛的語音合成技術(shù)。
據(jù)《羊城晚報》報道,該AI主播系統(tǒng)只需輸入文本或音頻,即可在幾分鐘內(nèi)快速生成AI合成主播的新聞播報視頻。從最終呈現(xiàn)效果來看,科大訊飛的語音合成技術(shù),在當時已基本能夠滿足吐字清晰、音色自然、蘊含感情等新聞播報等基礎(chǔ)需求。
2022年8月,《時空中的繪旅人》游戲官方宣布將與網(wǎng)易互娛AI Lab合作,分析提取葉瑄角色原有配音聲紋特征,錄制新的語音,網(wǎng)易AI Lab終于開啟了為游戲角色配音的新旅程。
03 悶聲發(fā)大財?shù)腁I語音
除了以上兩個AI工作室,還有更多人工智能團隊在不斷探索AI語音的應(yīng)用可能性。而且,可能出乎你預(yù)料的是,AI語音目前已經(jīng)創(chuàng)造出了十分可觀的商業(yè)化效益。相對于高調(diào)來襲、不斷引起廣泛討論的AI繪畫,AI語音可以說是“悶聲發(fā)大財”的典型。
據(jù)Market.us統(tǒng)計,2022年全球Ai語音生成市場規(guī)模約達12.1億美元,預(yù)計在2032年,該數(shù)據(jù)將增長至48.89億美元,復(fù)合年增長度達15.4%。
相當能掙錢的AI語音生成技術(shù)落地到配音,主要有以下幾種應(yīng)用形式。一是聲音克隆,讓AI學(xué)習(xí)已有聲紋特征,在用戶輸入目標文本后,模仿合成相應(yīng)的聲音效果?!稌r空中的繪旅人》葉瑄的配音就是這一類,再比如2018年,央視九套推出的全球首部AI配音紀錄片《創(chuàng)新中國》也屬此類。據(jù)了解,該紀錄片合成模仿的是“配音大師”李易的聲音。目前,該紀錄片依然在豆瓣上保持著9.0的高分。
二是聲音合成,在大量聲音數(shù)據(jù)的基礎(chǔ)上,根據(jù)輸入文本,直接產(chǎn)出AI合成音色的效果。今年年初,科大訊飛發(fā)布的雨水節(jié)氣短片,也是由AI合成聲演繹的,該視頻呈現(xiàn)出的“以假亂真”的配音效果,引起了大量用戶的主動傳播。
三是音色轉(zhuǎn)換,利用聲紋技術(shù),將輸入的音頻內(nèi)容,替換成目標音色。有粉絲猜測,米哈游鹿鳴的聲音就是這種情況。這類玩法技術(shù)相對更加成熟,門檻更低,因此被網(wǎng)友們普遍應(yīng)用于視頻配音與整活。在視頻網(wǎng)站上常見的“拜登教奧巴馬玩源氏”、“美國總統(tǒng)給魂系游戲排名”等整活視頻,都是通過這種方式產(chǎn)出的。
盡管AI配音的應(yīng)用方式多樣、適用場景廣泛,且在游戲市場上已有案例可供參考。但實際上,在目前要將該技術(shù)大規(guī)模應(yīng)用于游戲開發(fā)依然不太現(xiàn)實。
有嘗試過AI配音的開發(fā)者告訴茶館,AI配音和單純的電子書朗讀不同,想要AI呈現(xiàn)出類似聲優(yōu)一樣的、貼合角色的表達效果,需要耗費大量的時間對聲音模型進行訓(xùn)練,這個時間成本相較于演員配音,高達數(shù)十倍不止;而且由于對白文本承載的情感理解量過高,最終呈現(xiàn)出來的效果基本無法達到完美,細節(jié)處的切分和語氣轉(zhuǎn)換總會與真人有所差異,這些微小差異很有可能會對游戲的沉浸感造成負面影響。
因此,目前真正將AI配音用進游戲中的廠商仍是少數(shù),畢竟不是每個游戲廠商都有網(wǎng)易和米哈游一樣的票子和技術(shù)。盡管如此,面對迎頭打來的新浪潮,茶館發(fā)現(xiàn)身邊有越來越多同行開始積極關(guān)注和研究AI配音??梢?,積極迎接技術(shù)變化,正在成為業(yè)內(nèi)常態(tài)。