深度學(xué)習(xí)是機器學(xué)習(xí)的一個子領(lǐng)域,(一般來說)是受人類大腦及其功能啟發(fā)的技術(shù)。在20世紀50年代首次引入,機器學(xué)習(xí)通過所謂的人工神經(jīng)網(wǎng)絡(luò)累積起來,人工神經(jīng)網(wǎng)絡(luò)是大量相互連接的數(shù)據(jù)節(jié)點,它們共同構(gòu)成了人工智能的基礎(chǔ)。
機器學(xué)習(xí)本質(zhì)上允許計算機程序在外部數(shù)據(jù)或編程提示時自行改變。從本質(zhì)上講,它能夠在沒有人為干預(yù)的情況下實現(xiàn)這一點。它與數(shù)據(jù)挖掘具有相似的功能,但挖掘的結(jié)果由機器而不是人類處理。它分為兩大類:有監(jiān)督和無監(jiān)督的學(xué)習(xí)。
監(jiān)督機器學(xué)習(xí)涉及通過標記的訓(xùn)練數(shù)據(jù)推斷預(yù)定操作。換句話說,監(jiān)督結(jié)果事先由(人類)程序員知道,但推斷結(jié)果的系統(tǒng)被訓(xùn)練為“學(xué)習(xí)”它們。相比之下,無監(jiān)督機器學(xué)習(xí)從未標記的輸入數(shù)據(jù)中得出推論,通常作為檢測未知模式的手段。
與機器學(xué)習(xí)的線性算法相反,深度學(xué)習(xí)在通過分層算法訓(xùn)練自身的能力方面是獨一無二的。深度學(xué)習(xí)層次結(jié)構(gòu)越來越復(fù)雜和抽象,因為它們發(fā)展(或“學(xué)習(xí)”)并且不依賴于監(jiān)督邏輯。簡而言之,深度學(xué)習(xí)是一種非常先進,準確和自動化的機器學(xué)習(xí)形式,并且處于人工智能技術(shù)的最前沿。
深度學(xué)習(xí)的商業(yè)應(yīng)用
機器學(xué)習(xí)已經(jīng)在幾個不同的行業(yè)中普遍使用。例如,社交媒體使用它來策劃用戶時間線中的內(nèi)容供稿。Google Brain成立于幾年前,旨在隨著技術(shù)的發(fā)展,在Google的各種服務(wù)中實現(xiàn)產(chǎn)品化深度學(xué)習(xí)。
由于其專注于預(yù)測分析,營銷領(lǐng)域特別投資于深度學(xué)習(xí)創(chuàng)新。由于數(shù)據(jù)積累是推動技術(shù)發(fā)展的動力,因此銷售和客戶支持等行業(yè)(已經(jīng)擁有豐富多樣的客戶數(shù)據(jù))具有獨特的優(yōu)勢,可以在地面采用。
早期適應(yīng)深度學(xué)習(xí)很可能是特定部門從技術(shù)中獲益的關(guān)鍵決定因素,特別是在其最早階段。然而,一些具體的痛點使許多企業(yè)無法投入深度學(xué)習(xí)技術(shù)投資。
大數(shù)據(jù)和深度學(xué)習(xí)的V
2001年,META集團(現(xiàn)為Gartner)的分析師Doug Laney概述了研究人員認為大數(shù)據(jù)的三大挑戰(zhàn):數(shù)量,種類和速度。十多年后,互聯(lián)網(wǎng)接入點的快速增長(主要是由于移動設(shè)備的激增和物聯(lián)網(wǎng)技術(shù)的興起)使這些問題成為主要科技公司和小型企業(yè)的首要問題。和初創(chuàng)公司一樣。
最近有關(guān)全球數(shù)據(jù)使用情況的統(tǒng)計數(shù)字令人震驚。研究表明,世界上大約90%的數(shù)據(jù)僅在過去幾年內(nèi)創(chuàng)建。根據(jù)一項估計,2016年全球移動流量約為每月7 艾字節(jié),預(yù)計這一數(shù)字將在未來五年內(nèi)增加約7倍。
超越數(shù)量,多樣化(隨著新媒體的發(fā)展和擴展,數(shù)據(jù)類型的快速增長)和速度(電子媒體發(fā)送到數(shù)據(jù)中心和集線器的速度)也是企業(yè)如何適應(yīng)新興領(lǐng)域的主要因素深度學(xué)習(xí)。為了擴展助記設(shè)備,近年來在大數(shù)據(jù)痛點列表中添加了其他幾個v-words,包括:
有效性:大數(shù)據(jù)系統(tǒng)中輸入數(shù)據(jù)準確度的測量。未檢測到的無效數(shù)據(jù)可能會導(dǎo)致嚴重的問題以及機器學(xué)習(xí)環(huán)境中的連鎖反應(yīng)。
漏洞:大數(shù)據(jù)自然會引起安全問題,僅僅是因為它的規(guī)模。雖然通過機器學(xué)習(xí)在安全系統(tǒng)中看到了很大的潛力,但是他們當(dāng)前化身的那些系統(tǒng)因其缺乏效率而受到關(guān)注,特別是由于它們傾向于產(chǎn)生錯誤警報。
價值:由于各種原因,證明大數(shù)據(jù)(在商業(yè)或其他地方)的潛在價值可能是一項重大挑戰(zhàn)。如果此列表中的任何其他痛點無法有效解決,那么它們實際上可能會給任何系統(tǒng)或組織帶來負面價值,甚至可能帶來災(zāi)難性后果。
列表中添加的其他痛點包括可變性,準確性,波動性和可視化 - 所有這些都為大數(shù)據(jù)系統(tǒng)帶來了獨特的挑戰(zhàn)。隨著現(xiàn)有列表(可能)逐漸減少,可能仍會添加更多內(nèi)容。雖然對某些人來說似乎有點做作,但助記符“v”列表包含了大數(shù)據(jù)所面臨的嚴重問題,這些問題在深度學(xué)習(xí)的未來中發(fā)揮著重要作用。
黑匣子困境
深度學(xué)習(xí)和人工智能最具吸引力的特征之一是兩者都旨在解決人類無法解決的問題。然而,應(yīng)該允許的相同現(xiàn)象也呈現(xiàn)出一種有趣的困境,其形式為所謂的“黑匣子”。
通過深度學(xué)習(xí)過程創(chuàng)建的神經(jīng)網(wǎng)絡(luò)是如此龐大和復(fù)雜,其復(fù)雜的功能基本上是人類觀察的不可理解的。數(shù)據(jù)科學(xué)家和工程師可能對深入學(xué)習(xí)系統(tǒng)的內(nèi)容有了透徹的了解,但是他們?nèi)绾胃l繁地得出他們的輸出決策是完全無法解釋的。
雖然這可能不是營銷人員或銷售人員的重要問題(取決于他們的營銷或銷售),但其他行業(yè)需要一定數(shù)量的流程驗證和推理才能從結(jié)果中獲得任何用途。例如,金融服務(wù)公司可能會使用深度學(xué)習(xí)來建立高效的信用評分機制。但是,信用評分通常必須帶有某種口頭或書面解釋,如果實際的信用評分方程完全不透明且無法解釋,則難以形成。
這個問題也擴展到許多其他領(lǐng)域,特別是在健康和安全領(lǐng)域。醫(yī)學(xué)和交通運輸本身可以從深度學(xué)習(xí)中獲益,但也面臨著黑匣子形式的重大障礙。任何輸出導(dǎo)致這些字段,無論多么有益,都可以完全丟棄,因為它們的底層算法是完全默默無聞的。這給我們帶來了他們所有人中最具爭議的痛點......
規(guī)
2016年春季,歐盟通過了“ 通用數(shù)據(jù)保護條例”(GDPR),該條例(除其他事項外)授予公民對機器學(xué)習(xí)系統(tǒng)產(chǎn)生的“顯著影響”自動決策的“解釋權(quán)”。該法規(guī)計劃于2018年生效,引起了對由于其難以穿透的黑匣子而投資于深度學(xué)習(xí)的科技公司的擔(dān)憂,這在很多情況下會妨礙GDPR規(guī)定的解釋。
GDPR打算限制的“自動化個人決策”是深度學(xué)習(xí)的基本特征。但是,當(dāng)歧視的可能性如此之高且透明度如此之低時,對這種技術(shù)的擔(dān)憂是不可避免的(并且在很大程度上是有效的)在美國,食品和藥物管理局同樣通過要求這些過程保持可審計來規(guī)范藥物的測試和營銷。這給制藥行業(yè)帶來了障礙,據(jù)報道,總部位于馬薩諸塞州的生物技術(shù)公司Biogen就是這種情況,由于FDA的規(guī)定,該公司已被禁止使用無法解釋的深度學(xué)習(xí)方法。
深度學(xué)習(xí)(道德,實踐和超越)的含義是前所未有的,坦率地說,是非常深刻的。對技術(shù)的大量擔(dān)憂在很大程度上歸功于其破壞性潛力與其不透明的邏輯和功能的結(jié)合。如果企業(yè)可以證明在深度學(xué)習(xí)中存在超過任何可能的威脅或危害的有形價值,那么它們可以幫助我們完成人工智能的下一個關(guān)鍵階段。