合成語音技術(shù)初創(chuàng)公司Resemble AI首次推出了一種新工具,用于根據(jù)一些稱為Resemble Clone的簡短錄音創(chuàng)建數(shù)字語音。使用“類似克隆”,可以使用某人的幾分鐘的聲音來制作自定義語音,聽起來像錄音中的人或虛擬的變體。
語音克隆
酷似AI開發(fā)語音軟件來復(fù)制或合成語音以用于許多潛在目的??崴瓶寺?Resemble Clone)專門針對娛樂業(yè),該公司認(rèn)為這可能是其技術(shù)的主要受益者。該軟件工具僅需要有人發(fā)出聲音至少三分鐘即可開始創(chuàng)建人工配置文件。根據(jù)創(chuàng)始人在今年早些時(shí)候的采訪中對Voicebot所說,錄音時(shí)間越長,聽起來越自然。語音甚至不必現(xiàn)場直播,可以使用任何錄音。
“這是[所有]聲音表演范式的轉(zhuǎn)變。就像視覺技術(shù)的進(jìn)步,演員的工作量減少了。” Resemble AI聯(lián)合創(chuàng)始人Zohaib Ahmed在接受采訪時(shí)告訴Voicebot。“對這種技術(shù)以及對[合成]語音技術(shù)的需求只會越來越大。”
最終結(jié)果聽起來確實(shí)像人,但仍可以與真實(shí)聲音區(qū)分開。很難辨別出非常高端的假貨。這就是為什么這家位于多倫多和舊金山的初創(chuàng)公司還為Resemblyzer提供開放源代碼工具的原因,該工具可用于從真實(shí)音頻中挑選出深造的東西。
真實(shí)市場的綜合演講
Resemble AI是一家年輕的初創(chuàng)公司,是今年紐約Betaworks Ventures Synthetic Camp加速器計(jì)劃的一部分,該計(jì)劃獲得了20萬美元的投資。然而,看到聲音聽起來像人為的人工產(chǎn)生語音的方式并不是唯一的。其他初創(chuàng)公司以及科技巨頭都在追求類似的想法。
在啟動(dòng)方面,澳大利亞出生的語音合成啟動(dòng)副本影城最近關(guān)閉的一個(gè)$ 2.5萬種子資金,由該企業(yè)現(xiàn)實(shí)基金圓形LED。同時(shí),最初是語音假體開發(fā)人員的VocaliD現(xiàn)在為全球的呼叫中心和語音應(yīng)用程序提供合成語音。
知名人士也沒有忽略這個(gè)空間。亞馬遜和谷歌都在致力于人工語音生成的變體。Google助理正在試驗(yàn)WaveNet技術(shù),而Alexa使用神經(jīng)文本語音轉(zhuǎn)換(NTTS)是亞馬遜使Alexa模仿塞繆爾·杰克遜(Samuel L. Jackson)聲音的方式。中國百度公司也在發(fā)展自己的聲音克隆。類似于AI的公司和其他初創(chuàng)公司將需要提供獨(dú)特的功能,以與大型公司的產(chǎn)品脫穎而出。類似于克隆之類的工具至少可以幫助人們更加了解市場的發(fā)展趨勢。人們將需要盡可能多的靈活性和自定義選項(xiàng),Resemble AI將成為人們在制作下一個(gè)電影,視頻游戲或語音應(yīng)用程序時(shí)想到的名字。