《聲臨其境》節(jié)目里,張含韻用不同情緒模仿皮卡丘的超萌配音,讓人印象深刻。網(wǎng)友坦言,"太可愛(ài)了!真想把張含韻抱回家。"
誰(shuí)的童年記憶里沒(méi)有一只皮卡丘呢?
這個(gè)擁有軟萌叫聲,萌萌噠外表的黃色大老鼠,可謂征服了無(wú)數(shù)觀(guān)眾,不但被周深、楊超越、宋茜等明星紛紛模仿,化身明星界的動(dòng)漫寵兒,就連很多抖音玩家也喜歡為皮卡丘配音,不同的情感表達(dá),盡顯靈動(dòng)可愛(ài)。
相信大家也看過(guò)不少皮卡丘聲音配音秀,如果換成人工智能,讓 AI 用不同情感的聲音來(lái)演繹皮卡丘的叫聲,會(huì)是怎樣的 "皮卡~皮卡" 呢?
讓我們來(lái)一同感受下~
(以上視頻僅用于情感合成技術(shù)應(yīng)用示意)
影視來(lái)源:《皮卡丘大偵探》
bgm | Pen Pineapple Apple Pen -DJ Rikituki
視頻中皮卡丘所發(fā)出的喜、怒、哀、懼配音都是由人工智能完成?梢悦黠@感受到 AI 版皮卡丘 "說(shuō)" 的每一句聲音情感的變化,當(dāng)想要表達(dá)高興的情緒時(shí),AI 則會(huì)展現(xiàn)歡快喜悅的聲音;表達(dá)悲傷的情緒時(shí),則顯現(xiàn)憂(yōu)愁凄涼的聲音;表達(dá)憤怒的情緒時(shí),則是郁悶生氣的聲音;表達(dá)害怕的情緒時(shí),則是慌張?bào)@恐的聲音。
這背后運(yùn)用的技術(shù)就是 AI 情感合成技術(shù)。
什么是情感合成?可以簡(jiǎn)單理解為,賦予機(jī)器語(yǔ)音情感與表現(xiàn)力,讓機(jī)器具有人情味。我們可以想象一下,當(dāng)我們與智能家具、車(chē)載、機(jī)器人、語(yǔ)音助手等智能體交流時(shí),它不僅說(shuō)話(huà)效果接近真人,而且富有情感。
比如它可以用高興的聲音、悲傷等不同情緒起伏的聲音來(lái)和你交流,你會(huì)明顯感覺(jué)到,它今天心情挺不錯(cuò),它好像微微有些不高興,你還會(huì)覺(jué)得它是冷冰冰的機(jī)器嗎?會(huì)不會(huì)更加愿意和這些人工智能進(jìn)一步互動(dòng)與相處呢?
上述皮卡丘配音視頻中,為大家展示的是情感合成技術(shù)在泛娛樂(lè)場(chǎng)景下的應(yīng)用,如今短視頻的火爆,更是推動(dòng)了 UGC+ 時(shí)代的到來(lái),當(dāng)大量的內(nèi)容制作需要配音完成時(shí),有許多創(chuàng)作者開(kāi)始將語(yǔ)音合成結(jié)合到內(nèi)容創(chuàng)作中,高效提高內(nèi)容制作效率,當(dāng)語(yǔ)音具有一定情感表達(dá)能力后,內(nèi)容也會(huì)變得更加生動(dòng)和有趣。
此外,虛擬形象近年來(lái)發(fā)展勢(shì)頭也逐漸迅猛,例如虛擬主持人、虛擬偶像,能夠具有一定的情感表現(xiàn)能力,相信也會(huì)為虛擬形象市場(chǎng)帶來(lái)很大的改變。
另外,有聲讀物的廣泛應(yīng)用,由于故事、小說(shuō)等文本素材包含大量角色人物,通過(guò)不同情感合成聲音配合文本內(nèi)容,在展現(xiàn)文學(xué)小說(shuō)人物的的特點(diǎn)同時(shí),給用戶(hù)營(yíng)造引人入勝沉浸感體驗(yàn)。比如下面這段故事《老鼠去海邊》。
讓我們來(lái)聽(tīng)下 AI 用不同情感閱讀:
。ㄒ陨衔谋鹃喿x僅用于情感合成技術(shù)應(yīng)用示意)
不同的情感表達(dá)是存在明顯差別的,我們能從聲音里明顯感受到情緒的變化。
目前,標(biāo)貝科技已推出可商業(yè)化落地的 AI情感合成技術(shù)解決方案,主打高音質(zhì)、高自然度與多情感,可以呈現(xiàn)出高興、憤怒、恐懼、哀嘆、悲傷等六大經(jīng)典情感類(lèi)型,支持客戶(hù)定制化情感語(yǔ)音合成解決方案需求。
情感合成作為一項(xiàng)技術(shù),離不開(kāi)神經(jīng)網(wǎng)絡(luò)的三要素:算法、算力和數(shù)據(jù),其中數(shù)據(jù)是打造自然、高表現(xiàn)力的聲音效果重要臂力之一。
在數(shù)據(jù)方面,標(biāo)貝擁有包括識(shí)別自有庫(kù),合成自有庫(kù),歌曲音庫(kù)、明星 IP 音庫(kù)、以及方言音庫(kù)等在內(nèi)的多種不同類(lèi)型的語(yǔ)音數(shù)據(jù)庫(kù),語(yǔ)音數(shù)據(jù)時(shí)長(zhǎng)累計(jì)超過(guò)十萬(wàn)小時(shí),這些數(shù)據(jù)有很多應(yīng)用到了我們的情感合成實(shí)踐當(dāng)中。(點(diǎn)擊了解標(biāo)貝情感數(shù)據(jù)庫(kù))

標(biāo)貝科技致力于為智能客服、智能機(jī)器人、智能家居、車(chē)載導(dǎo)航、有聲讀物等相關(guān)應(yīng)用場(chǎng)景提供更加優(yōu)質(zhì)的語(yǔ)音技術(shù)服務(wù),為用戶(hù)提供高質(zhì)量的智能交互體驗(yàn)。
歡迎對(duì)以上情感合成技術(shù)解決方案感興趣的行業(yè)伙伴與我們聯(lián)系marketing@data-baker.com