這是我基于Lomit Patel的“精益AI”(O'Reilly,ISBN:978-1-492-05931-8)的系列文章的第二部分。首先討論的業(yè)務(wù)應(yīng)用程序可以從監(jiān)督學(xué)習(xí)中受益。本文將討論無監(jiān)督學(xué)習(xí)。同樣,請(qǐng)參閱下面包含的本書的圖5-1,以概述在機(jī)器學(xué)習(xí)(ML)中利用的四種主要人工智能(AI)類型。
大多數(shù)經(jīng)理,包括生產(chǎn)線甚至是IT經(jīng)理,都不需要了解機(jī)器學(xué)習(xí)的復(fù)雜性。但是,高水平的知識(shí)將幫助他們的組織理解AI是一種工具,并且必須與實(shí)際的業(yè)務(wù)問題聯(lián)系起來。了解ML的高級(jí)分類如何與現(xiàn)實(shí)世界相關(guān)聯(lián),可以幫助技術(shù)人員和業(yè)務(wù)人員集中精力提供有效的解決方案。
快速提醒一下,有監(jiān)督的學(xué)習(xí)是我們了解要確定的結(jié)果。然后可以選擇我們需要的功能(參數(shù),變量等等),并適當(dāng)標(biāo)記數(shù)據(jù)。這樣一來,分析就可以檢查數(shù)據(jù),以了解它們?cè)谝阎Y(jié)果模式中的適合位置。
這并不總是可能的,也不是可取的。有時(shí)會(huì)有新的關(guān)系,這是意料之外的事情。在許多商業(yè)領(lǐng)域,尤其是在消費(fèi)市場(chǎng),要在競(jìng)爭(zhēng)對(duì)手認(rèn)識(shí)到相同的關(guān)系之前找出大量的數(shù)據(jù)來確定鏈接,從而提供至關(guān)重要的競(jìng)爭(zhēng)優(yōu)勢(shì)。“無監(jiān)督學(xué)習(xí)非常適合探索幾乎不了解數(shù)據(jù)代表什么的數(shù)據(jù)。當(dāng)您可能不確切知道要查找的內(nèi)容時(shí),這對(duì)于在原始數(shù)據(jù)中查找模式很有幫助。” Lomit Patel說。
讓我們看幾個(gè)例子。
客戶細(xì)分
客戶細(xì)分是核心的營銷工具。目的是了解不同類型的買家,了解根據(jù)特征將個(gè)人群體聯(lián)系起來的內(nèi)容,然后建立可準(zhǔn)確滿足每個(gè)群體或客戶群需求的營銷活動(dòng)。
乍一看,這似乎可以使用監(jiān)督學(xué)習(xí)。畢竟,我們知道根據(jù)性別,年齡,收入以及我們可以定義的其他細(xì)分,并且可以將客戶分類的特征。這種細(xì)分顯然很適合監(jiān)督學(xué)習(xí),我們不應(yīng)該忽略我們擁有的任何工具。
變化的是,我們擁有的有關(guān)個(gè)人,團(tuán)體甚至公司的數(shù)據(jù)呈指數(shù)級(jí)增長。因此,例如,最終可能會(huì)導(dǎo)致在商店A購物的人們無論年齡如何都更有可能購買商品X。分析繼續(xù)尋找基于數(shù)據(jù)對(duì)人員進(jìn)行聚類的新方法,這些方法是我們從未想過的,而分類卻無法進(jìn)行。
這就是分類和聚類之間的區(qū)別,它們?cè)谳^高的層次上聽起來是一樣的。監(jiān)督學(xué)習(xí)是針對(duì)我們知道分類(癌癥與無癌)的情況,而無監(jiān)督學(xué)習(xí)則可以基于可能沒有先前鏈接的變量對(duì)數(shù)據(jù)點(diǎn)進(jìn)行聚類。借助無人監(jiān)督的學(xué)習(xí),客戶細(xì)分正在變得更加先進(jìn)。
協(xié)會(huì)
電子商務(wù)中每天都使用這一代碼。每個(gè)人都看過購物,電影和其他網(wǎng)站,這些網(wǎng)站都在暗示“喜歡X的人也喜歡Z”。那就是聯(lián)想。有監(jiān)督的學(xué)習(xí)是行不通的,因?yàn)樵诒磉_(dá)出喜歡之前,我們不知道人們喜歡什么。通過構(gòu)建可以分析那些喜歡的神經(jīng)網(wǎng)絡(luò),無監(jiān)督的訓(xùn)練可以導(dǎo)致系統(tǒng)從數(shù)據(jù)中學(xué)習(xí)以提出建議。這比基于當(dāng)前的偏好來訓(xùn)練機(jī)器要好得多,因?yàn)檎缑總€(gè)營銷人員都知道的那樣,偏好并不是恒定不變的。
最后一句話很關(guān)鍵。癌癥就是癌癥。我們可能會(huì)發(fā)現(xiàn)新的癌癥,或者找到一種新的檢測(cè)現(xiàn)有癌癥的方法。到那時(shí),可以更新算法,但是我們?nèi)栽谑褂霉潭üδ芗_切指定機(jī)器應(yīng)識(shí)別的內(nèi)容。
關(guān)聯(lián),產(chǎn)品之間的關(guān)系,喜好等等通常是文化的一部分,并且該文化正在不斷發(fā)生變化。一個(gè)強(qiáng)大的ML系統(tǒng)受過訓(xùn)練,可以查看所有數(shù)據(jù)并注意到以前未知的關(guān)系,甚至可以放松以前強(qiáng)大的關(guān)系。無監(jiān)督學(xué)習(xí)使系統(tǒng)不受我們已經(jīng)認(rèn)為的了解的限制。
無監(jiān)督學(xué)習(xí):當(dāng)您不知道會(huì)得到什么時(shí)
當(dāng)您知道需要獲得的結(jié)果時(shí),有條理的學(xué)習(xí)是必經(jīng)之路。但是,借助現(xiàn)代數(shù)據(jù)量,組織可以從看似無關(guān)的數(shù)據(jù)點(diǎn)獲得新的出乎意料的見解。無監(jiān)督學(xué)習(xí)是一種工具,可以幫助您找到那些可以在許多業(yè)務(wù)領(lǐng)域中獲得洞察力的新關(guān)系,新模式和鏈接。
您可能已經(jīng)注意到,世界上并非所有事物都是黑白的。好吧,有監(jiān)督和無監(jiān)督的學(xué)習(xí)并不是完全獨(dú)立的。盡管上面的某些討論暗示了這一點(diǎn),但是本管理AI系列的下一篇文章將僅討論–為什么混合系統(tǒng)有用。