人工智能(AI)有潛力幫助經(jīng)濟(jì)的各個(gè)領(lǐng)域。但是,在分析模糊且具有可能繼續(xù)人為偏見的數(shù)據(jù)進(jìn)行訓(xùn)練的行業(yè)中,這是一個(gè)挑戰(zhàn)。幾年前,我在一篇有關(guān)適用于刑事累犯的機(jī)器學(xué)習(xí)(ML)的文章中描述了帶有偏見的問題。隨著時(shí)間的推移,應(yīng)對(duì)偏見的方式已經(jīng)發(fā)生了變化,值得重新審視該行業(yè)。一種方法是著眼于法律專業(yè)中偏見較小的領(lǐng)域。
與許多刑法相比,稅法具有更明確的規(guī)則。機(jī)器學(xué)習(xí)應(yīng)用于人力資源系統(tǒng)(亞馬遜取消了人力資源系統(tǒng))已經(jīng)有很多問題,而就業(yè)法則是州和國(guó)家制定明確規(guī)則的另一個(gè)領(lǐng)域。選擇正確法律區(qū)域的關(guān)鍵。根據(jù)與Blue J Legal的人們的交談,似乎重點(diǎn)是將重點(diǎn)放在具有嚴(yán)格規(guī)則而非標(biāo)準(zhǔn)的領(lǐng)域。前者提供了具有清晰特征工程的能力,而后者則沒有訓(xùn)練準(zhǔn)確模型的特異性。”
Blue J Legal來自創(chuàng)始人創(chuàng)辦的多倫多大學(xué)課程,結(jié)合法律和計(jì)算機(jī)科學(xué)技能來嘗試預(yù)測(cè)案件。像往常一樣,挑戰(zhàn)在于如何正確地分析問題所需的詳細(xì)信息,以了解數(shù)據(jù)集的功能。如前所述,稅收制度的選擇是第一要?jiǎng)?wù)。稅法有很多可以設(shè)計(jì)的規(guī)則。然后可以對(duì)數(shù)據(jù)進(jìn)行適當(dāng)?shù)臉?biāo)記。在他們?cè)缙趶氖露愂展ぷ髦?,他們開始工作。
該產(chǎn)品面向正在評(píng)估其案件的律師。目的是為每個(gè)案件的優(yōu)勢(shì)和劣勢(shì)提供律師統(tǒng)計(jì)分析。
特征工程挑戰(zhàn)
重要的是要注意,“就業(yè)”是一類法律問題。每個(gè)問題都必須分開查看,并且每個(gè)問題都有其自己的功能。例如,在當(dāng)今的零工經(jīng)濟(jì)中,“工人是承包商還是雇員?” 是一個(gè)問題。Blue J Legal團(tuán)隊(duì)提到,他們針對(duì)每個(gè)已解決的問題發(fā)現(xiàn)了20至70個(gè)特征。
這清楚地表明,與ML系統(tǒng)的培訓(xùn)相比,特征工程是更大的挑戰(zhàn)。這已經(jīng)被很多人提到,但是仍然有很多人專注于推理引擎,因?yàn)樗芸?。將?shù)據(jù)轉(zhuǎn)化為信息是ML挑戰(zhàn)中更為關(guān)鍵的部分。
一旦對(duì)系統(tǒng)進(jìn)行了培訓(xùn),下一個(gè)挑戰(zhàn)就是讓律師提供正確的信息以分析其當(dāng)前案件。他們必須輸入(或他們的文員必須輸入...)有關(guān)要分析的特征的每種情況的信息。
從技術(shù)上講,他們的模型使用決策樹。他們確實(shí)嘗試了其他領(lǐng)域感興趣的隨機(jī)森林模型,但發(fā)現(xiàn)其準(zhǔn)確性下降了。
Blue J Legal聲稱其早期版本可提供80-90%的準(zhǔn)確性。
消除偏差:加號(hào)和減號(hào)
通過刪除可能導(dǎo)致偏見的變量(例如男性對(duì)女性),他們可以訓(xùn)練更通用的系統(tǒng)。從純粹的法律角度來看,這很好,但是與上述假釋制度不同,這可能會(huì)導(dǎo)致律師對(duì)問題的分析產(chǎn)生問題。例如,如果少數(shù)派候選人在法律制度中受到的待遇較差,律師應(yīng)該知道這一點(diǎn)。Blue J Legal團(tuán)隊(duì)表示,他們確實(shí)在加拿大和美國(guó)法律數(shù)據(jù)中都存在偏見,但是指出,他們要解決的兩個(gè)領(lǐng)域并沒有偏見會(huì)嚴(yán)重改變結(jié)果。
由于與上述相同的原因,他們也忽略了偏見??的一個(gè)領(lǐng)域。我敢肯定,由于營(yíng)銷原因,它也被忽略了。隨著他們轉(zhuǎn)移到法規(guī)更少,標(biāo)準(zhǔn)更高的法律領(lǐng)域,我可以看到律師具有很強(qiáng)的價(jià)值,因?yàn)樗麄冎腊讣环峙浣o的法官是否根據(jù)案件或原告的特征有強(qiáng)烈的偏見。不過,如果他們分析了法官,我可能會(huì)看到其他偏見增加了,因?yàn)榉ü倏赡軙?huì)對(duì)使用該系統(tǒng)的律師產(chǎn)生偏見。這是一個(gè)有趣的難題,將來必須解決。
律師應(yīng)如何使用該系統(tǒng)
無論偏見如何,律師面前都面臨著明顯的道德挑戰(zhàn)。例如,如果系統(tǒng)返回并告訴律師,類似案件中有70%是針對(duì)原告的,律師是否應(yīng)該受理此案?法律是一個(gè)不穩(wěn)定的行業(yè),許多情況是相似的但不完全相同。律師如何確定特定客戶是70%還是30%?系統(tǒng)如何提供信息以幫助律師決定以較低的概率受理案件或以較高的概率拒絕案件?與其他職業(yè)一樣,希望律師會(huì)仔細(xì)評(píng)估結(jié)果。但是,就像在所有行業(yè)中一樣,忙碌的人們會(huì)走捷徑,而太多的人采用了GIGO的舊縮寫,不再意味著“垃圾進(jìn)來,垃圾出去”,而是“垃圾進(jìn)去,福音出去”。
幫助的一種方法是提供法律備忘錄。Blue J Legal系統(tǒng)提供了律師提供的答案列表以及每個(gè)答案的類似案例。不是律師,我不能說這做得如何,但這是系統(tǒng)的關(guān)鍵部分。就像太多的開發(fā)人員專注于引擎而不是功能工程一樣,他們專注于引擎,同時(shí)最大限度地減少了解釋引擎的需求。在應(yīng)用了機(jī)器學(xué)習(xí)的所有領(lǐng)域,特別是在專業(yè)領(lǐng)域,黑匣子系統(tǒng)都不可信賴。必須支持分析,以便律師理解和評(píng)估通用決定如何影響其具體案件。
法律是測(cè)試AI與人之間融合的有趣途徑。自動(dòng)化不會(huì)很快取代律師,但是隨著AI的發(fā)展,自動(dòng)化將能夠越來越多地為行業(yè)內(nèi)的人們提供幫助,使他們對(duì)選擇權(quán)有更多的了解,并更有效地利用他們的時(shí)間。值得關(guān)注的是兩者之間的平衡。