AI合成技術(shù)正在通過(guò)各種智能設(shè)備實(shí)現(xiàn)并應(yīng)用

2019-09-20 16:49:30    來(lái)源:人工智能網(wǎng)    作者:

近日,百度地圖推出了定制化語(yǔ)音導(dǎo)航功能,簡(jiǎn)單說(shuō)就是用戶(hù)根據(jù)提示采集原聲,十幾分鐘后你將獲得屬于自己定制化的語(yǔ)音導(dǎo)航音頻包。所以說(shuō)用戶(hù)除了郭德綱、林志玲、羅振宇……這一票人之外還有更多選擇。其實(shí)我們?cè)谑褂妹餍菍?dǎo)航音頻包時(shí)會(huì)發(fā)現(xiàn),除了很多“左轉(zhuǎn)”“紅綠燈路口”這類(lèi)常規(guī)交通詞匯外,很多涉及地名的、地標(biāo)的詞是可以聽(tīng)的出是合成的。而現(xiàn)在“語(yǔ)音合成”技術(shù)推向普通用戶(hù),就有了這些AI定制化合成服務(wù)。

單從使用AI合成的相關(guān)App來(lái)看,不禁聯(lián)想到那個(gè)“一夜而紅”的ZAO,還有國(guó)外的Deepfake,AI脫衣軟件DeepNude等等。而國(guó)內(nèi)專(zhuān)注于人工智能領(lǐng)域的企業(yè)越來(lái)越多,例如:商湯科技、曠視科技這兩艘“AI巨輪”的業(yè)務(wù)主要是對(duì)政府及企業(yè)的;而科大訊飛、大疆、華為、小米、優(yōu)必選科技的部分硬件類(lèi)業(yè)務(wù)是to C類(lèi)的;極鏈科技是專(zhuān)注于視頻領(lǐng)域的人工智能企業(yè),業(yè)務(wù)面向品牌主及流量方,也就是to B類(lèi)的。

對(duì)于廣大 C端 用戶(hù)來(lái)說(shuō),AI合成技術(shù)正在通過(guò)各種智能設(shè)備實(shí)現(xiàn)并應(yīng)用。比如地圖AR增強(qiáng),定制化音頻服務(wù)、定制化視頻服務(wù)、專(zhuān)屬智能客服等。

其實(shí)剛才提到過(guò)的曾經(jīng)爆火的這些App應(yīng)用,“ZAO”、“Deepfake”、“DeepNude”技術(shù)上有些共同之處,但是娛樂(lè)的點(diǎn)不同。“DeepNude”涉及色情內(nèi)容,并上升到人身攻擊最終被禁止。網(wǎng)友用“Deepfake”在網(wǎng)上大量惡搞政府首腦,比如特朗普的惡搞視頻眾多。

而離我們最近的“ZAO”,在有了前車(chē)之鑒后,看的出在盡可能規(guī)避可能產(chǎn)生的負(fù)面效果,視頻素材內(nèi)容由平臺(tái)方把控。但不可避免的是在用戶(hù)對(duì)照片進(jìn)行授權(quán)所涉及的隱私問(wèn)題,因?yàn)椴粏渭兪巧蟼髡掌纯?,而是需要用?hù)多角度的認(rèn)證,有些“恐慌”確實(shí)不可避免,因?yàn)閽吣樦Ц?、掃臉登陸等功能已?jīng)被廣泛應(yīng)用,這是用戶(hù)最直接的對(duì)“ZAO”開(kāi)發(fā)者的質(zhì)疑。隨后不久背后的公司陌陌科技被有關(guān)部門(mén)談話(huà)并要求整改,目前來(lái)看在ios的熱度及下載量仍然穩(wěn)定在前三名。

不再處于風(fēng)口浪尖,“ZAO”進(jìn)入了平穩(wěn)期,而大家對(duì)其盈利模式以及產(chǎn)品定位仍有疑問(wèn),似乎并沒(méi)看到一個(gè)清晰的變現(xiàn)方式。雖說(shuō)當(dāng)前“視頻社交”火爆,但是僅憑陌陌的用戶(hù)帶動(dòng)還是比較乏力的。App自身沒(méi)有社交屬性,只是單純的內(nèi)容產(chǎn)出,和其他的分發(fā)渠道聯(lián)合顯得很必要。而問(wèn)題又來(lái)了,這些內(nèi)容只適合小范圍內(nèi)私域傳播,用戶(hù)不愿意擴(kuò)散是關(guān)鍵。沒(méi)有爆炸傳播的潛質(zhì),所以營(yíng)銷(xiāo)能力也被削弱?;蛟S只是曇花一現(xiàn),但是對(duì)于用戶(hù)來(lái)說(shuō),拍照合成視頻的趣味性還是非常強(qiáng)的,但關(guān)于變現(xiàn)場(chǎng)景仍需要一段較長(zhǎng)的摸索期。

工具類(lèi)軟件更能被大家接受認(rèn)可,微信中音頻轉(zhuǎn)文字功能用起來(lái)很方便,并且通過(guò)計(jì)算機(jī)的學(xué)習(xí),準(zhǔn)確度也在不斷提高。而科大訊飛推出的「訊飛聽(tīng)見(jiàn)」是目前將音頻轉(zhuǎn)文字業(yè)務(wù)做的較為成熟的平臺(tái)。業(yè)務(wù)細(xì)分為機(jī)器快轉(zhuǎn)和中文人工精轉(zhuǎn)兩種服務(wù),可直接收費(fèi)變現(xiàn)。和百度地圖的定制版語(yǔ)音導(dǎo)航類(lèi)似,屬于上傳后的AI處理,非在線(xiàn)轉(zhuǎn)化。

地圖app,作為一個(gè)相對(duì)高頻使用的工具類(lèi)應(yīng)用,除了在滿(mǎn)足常規(guī)通行服務(wù)外,正在發(fā)現(xiàn)更多的To C服務(wù)場(chǎng)景。比如google地圖推出的AR導(dǎo)航功能,已經(jīng)開(kāi)始測(cè)試應(yīng)用,用于幫助用戶(hù)以在線(xiàn)實(shí)景增強(qiáng)的方式判斷方向及路線(xiàn)。華為也正在布局地圖服務(wù),在Cyberverse數(shù)據(jù)平臺(tái)上發(fā)了Map Kit,而相關(guān)AR技術(shù)的應(yīng)用是在景區(qū)、博物館之類(lèi)的場(chǎng)景做實(shí)景增強(qiáng)標(biāo)注和講解服務(wù)。在2017年高德地圖就推出了景區(qū)語(yǔ)音導(dǎo)游服務(wù),發(fā)展至今已經(jīng)比較成熟。

AI+音樂(lè),在線(xiàn)音頻也一直被關(guān)注。今年7月抖音對(duì)外宣布了收購(gòu)英國(guó)AI初創(chuàng)公司Jukedeck,這家公司正在研發(fā)一種技術(shù),將用人工智能創(chuàng)作音樂(lè),對(duì)歌詞自動(dòng)配樂(lè)等方面。通過(guò)AI對(duì)音樂(lè)的深度學(xué)習(xí),滿(mǎn)足用戶(hù)自由選擇音樂(lè)類(lèi)型、曲風(fēng)、時(shí)長(zhǎng)等要求,讓每一個(gè)用戶(hù)都能體驗(yàn)到音樂(lè)創(chuàng)作的樂(lè)趣。

可以發(fā)現(xiàn),相比5年前,AI合成技術(shù)已經(jīng)不再那么神秘。而那些曾經(jīng)“紅”極一時(shí)的深度偽造類(lèi)App,通常在道德、隱私、風(fēng)險(xiǎn)等方面游走規(guī)則的邊緣,似乎滿(mǎn)足人們?cè)?ldquo;窺視”、“色情”、“臆想”需求的功能成了火熱表相之下的底色,或許這并不是開(kāi)發(fā)者的初心,但是從環(huán)節(jié)上把控內(nèi)容的方向,依舊很有必要。

另外隱私問(wèn)題開(kāi)始被用戶(hù)所注重,但是隨著智能手機(jī)的普及應(yīng)用,智能化的服務(wù)的增多,包括面部解鎖、刷臉交易、刷臉登陸等。過(guò)去很長(zhǎng)一段時(shí)間用戶(hù)對(duì)App應(yīng)用上的用戶(hù)數(shù)據(jù)留痕,可能無(wú)暇顧及,但是當(dāng)下面部信息已經(jīng)成為了個(gè)人服務(wù)的入口,并且直接關(guān)聯(lián)用戶(hù)隱私、數(shù)據(jù)信息以及財(cái)產(chǎn)的安全性。

總體來(lái)看,AI合成技術(shù)的工具類(lèi)應(yīng)用是比較被用戶(hù)認(rèn)可的,無(wú)論是功能性還是體驗(yàn)度,相對(duì)傳統(tǒng)服務(wù)有了較大提升。專(zhuān)業(yè)技術(shù)對(duì)普通用戶(hù)的門(mén)檻正在降低,服務(wù)、效率、準(zhǔn)確率、費(fèi)用等因素會(huì)成為工具類(lèi)應(yīng)用的競(jìng)爭(zhēng)點(diǎn)。

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。