市場上有一百萬和一個語音轉(zhuǎn)錄服務(wù)。 但即使只有一項工作要做,我從來沒有見過一個服務(wù),可以處理長尾詞匯在現(xiàn)實世界中使用。 這是特別具有挑戰(zhàn)性的,如果你是一個創(chuàng)業(yè)公司,試圖出售你的服務(wù)給企業(yè),依靠準(zhǔn)確的轉(zhuǎn)錄為他們的業(yè)務(wù)。
語音轉(zhuǎn)錄創(chuàng)業(yè)公司Tetra的聯(lián)合創(chuàng)始人喬恩·戈德史密斯(Jon Goldsmith)理解這一挑戰(zhàn)——事實上,他甚至愿意承認(rèn)自己沒有百分之百地解決這個問題。 但戈德史密斯認(rèn)為,答案在于深度學(xué)習(xí),他準(zhǔn)備用由Amplify Partners領(lǐng)導(dǎo)的150萬種子輪來證明這一點,YCombinator和一些天使的參與。
我順便去Tetra辦公室看看戈德史密斯,他的聯(lián)合創(chuàng)始人NikLiolios和另一位工程師創(chuàng)造了什么。 戈德史密斯給我打了個電話,用他的智能手機安裝了Tetra應(yīng)用程序。 當(dāng)他和在后臺運行的深度學(xué)習(xí)模型傾聽時,我對轉(zhuǎn)錄服務(wù)提出了一連串的挑戰(zhàn)。
以不同的速度說話,拋出數(shù)字,初創(chuàng)公司名稱和其他強硬的詞在某種程度上確實讓利樂感到沮喪-但公平地說,沒有我沒有打破的人工智能。 考慮到Tetra的使用是多么容易,我可以看到它被用作備份參考或記錄保存-打開它,忘記它,然后用它搜索筆記。
如果需要99或100%的準(zhǔn)確性,Tetra提供人類轉(zhuǎn)錄的費用和24小時等待。 這實際上幫助了客戶和Tetra,因為準(zhǔn)確的轉(zhuǎn)錄可以作為培訓(xùn)數(shù)據(jù)反饋,以提高未來的性能。
戈德史密斯告訴我,他正在尋找牽引力出售給投資者,經(jīng)常打勤奮電話。 這些客戶希望Tetra創(chuàng)建一個與行業(yè)專家對話的永久記錄。 其他更傳統(tǒng)的企業(yè)用例也存在,比如在銷售中。
這對公司來說似乎是相當(dāng)好的結(jié)果。 而且,隨著三人Tetra團隊在一個設(shè)計為商業(yè)用途的住宅公寓中工作,情況仍然相當(dāng)糟糕。 在工程方面,許多基礎(chǔ)設(shè)施正由現(xiàn)成的API供電。
這實際上是一件好事,因為這意味著Tetra不會浪費時間來構(gòu)建市場上已經(jīng)存在的東西,而是專注于收集大量的轉(zhuǎn)錄數(shù)據(jù)集,這只會繼續(xù)提高服務(wù)質(zhì)量。
該團隊的方法在很大程度上依賴于能夠優(yōu)化哪些部分的對話被發(fā)送到哪個云API。 例如,一些NLP服務(wù)提供商更好地理解與電影、音樂和媒體有關(guān)的演講,而另一些服務(wù)提供商更擅長數(shù)字等。
種子融資150萬將用于擴大工程團隊,改善機器學(xué)習(xí)管道。 Tetra包括搜索功能,這樣用戶就可以在傳統(tǒng)上不可檢索的語音記錄中快速找到特定的句子。 我可以看到這在未來變得更加積極主動-例如自動標(biāo)記名稱和日期。