人工智能遇到文件和人員障礙:數(shù)字化和數(shù)字化

2020-06-24 13:01:40    來源:新經(jīng)網(wǎng)    作者:馮思韻

人工智能已經(jīng)得到了驚人的應(yīng)用,為識別,模式和異常檢測,預(yù)測分析,自治系統(tǒng),超個性化和目標(biāo)驅(qū)動系統(tǒng)提供了強大的功能。但是,如果不訪問數(shù)據(jù)來訓(xùn)練機器學(xué)習(xí)模型,人工智能系統(tǒng)將無法做任何事情。而且,大部分?jǐn)?shù)據(jù)都以紙質(zhì)或電子形式或人工控制的形式鎖定在文檔中。

通常,實現(xiàn)任何AI項目的必要的第一步就是簡單地將這些文檔和流程從紙本和基于人的形式中提取出來,并轉(zhuǎn)換成機器可以理解的數(shù)字形式。將這些模擬資產(chǎn)轉(zhuǎn)換為數(shù)字形式的概念在文檔和信息的上下文中稱為數(shù)字化,在流程和基于人的活動的上下文中稱為數(shù)字化。根據(jù)分析公司Cognilytica的報告,毫不奇怪,數(shù)字化和數(shù)字化工作正在AI支持系統(tǒng)的背景下看到了一些最強勁的活動。

數(shù)字化

數(shù)字化的總體思路是將信息轉(zhuǎn)換為計算機可讀的數(shù)字格式的過程。為了從您的數(shù)據(jù)和信息中獲得真正的見解,它需要以數(shù)字格式而不是紙質(zhì)形式并存儲在物理文件柜中。數(shù)據(jù)是收集信息,理解和見解的基礎(chǔ)層。文檔數(shù)字化是將計算機無法處理的信息獲取為可以處理的格式的想法。

通過數(shù)字化數(shù)據(jù),組織和機構(gòu)可以從資產(chǎn)中獲取更多價值,而這些資產(chǎn)實際上是在收集灰塵并占用空間。為了從包括執(zhí)行分析,自動執(zhí)行各種任務(wù)以及合并更多智能和認(rèn)知過程的數(shù)據(jù)中獲得更高層次的理解,信息需要從非數(shù)字形式轉(zhuǎn)換為計算機可以理解的形式。

數(shù)字化信息的示例包括:

將印刷文本和手寫文本轉(zhuǎn)換為數(shù)字格式

將模擬格式的音頻記錄轉(zhuǎn)換為數(shù)字格式

將檔案文件轉(zhuǎn)換為數(shù)字格式

將視頻和電影內(nèi)容轉(zhuǎn)換為數(shù)字格式

對于與文檔有關(guān)的信息,文檔數(shù)字化的概念也稱為文檔捕獲。 文檔捕獲和文檔數(shù)字化的目標(biāo)是獲取非數(shù)字信息并將其以數(shù)字方式表示以進行進一步處理之一。許多文檔捕獲系統(tǒng)會獲取數(shù)字圖像或打印文檔,視頻,膠片或其他非數(shù)字資產(chǎn)的樣本。然后可以將生成的數(shù)字格式電子存儲以進行進一步的處理和分析。以下是文本數(shù)字化的示例。

人工智能遇到文件和人員障礙:數(shù)字化和數(shù)字化

正如文檔可以數(shù)字化一樣,音頻和視頻資產(chǎn)也可以數(shù)字化。模擬視頻或音頻必須轉(zhuǎn)換為數(shù)字格式,組織才能以有意義的方式使用它,例如發(fā)布到Internet或網(wǎng)站上,或通過電子郵件或數(shù)字文件共享傳輸給某人。

音頻和視頻數(shù)字化的示例包括:

將電影和磁性視頻轉(zhuǎn)換為數(shù)字格式

將音樂和磁性音頻轉(zhuǎn)換為數(shù)字格式

將模擬音頻和視頻制作轉(zhuǎn)換為數(shù)字格式

一旦捕獲到文檔,便可以對其進行進一步處理和分析,以獲取更多價值。除簡單的掃描和存儲外,后處理活動還涉及內(nèi)容分析和文檔處理,包括以下內(nèi)容:

光學(xué)字符識別(OCR),用于識別打印的文本并將其轉(zhuǎn)換為機器文本表示形式

智能字符識別(ICR),可以處理手寫,手寫標(biāo)記(例如首字母縮寫),劃線和手工填寫的自由格式信息。

光學(xué)標(biāo)記識別(OMR)識別有意義的文本或手寫指示,例如打勾的復(fù)選框,填充的氣泡和其他指示標(biāo)記,這些標(biāo)記在自動評分,考試處理,選舉投票等方面很有用。

光學(xué)條形碼識別(OBR),可以識別條形碼,索引和其他標(biāo)記以實現(xiàn)高速數(shù)據(jù)收集。

數(shù)字化與數(shù)字化

通過解決以前依賴于非數(shù)字信息的過程,數(shù)字化擴展了數(shù)字化的思想。數(shù)字化專注于捕獲以前基于非數(shù)字信息的過程,并以數(shù)字為中心的方式對其進行編碼。下圖顯示了數(shù)字化,數(shù)字化和數(shù)字轉(zhuǎn)換之間的區(qū)別。

人工智能遇到文件和人員障礙:數(shù)字化和數(shù)字化

數(shù)字化流程使公司和政府都可以增強服務(wù),節(jié)省資金并改善公民的生活質(zhì)量。在銀行,抵押和保險行業(yè)中向數(shù)字簽名的轉(zhuǎn)變?yōu)榱鞒虜?shù)字化提供了一個很好的例子。稅收文件的電子歸檔和數(shù)字銀行及移動銀行支票掃描的發(fā)展是通過使用數(shù)字文件交換實現(xiàn)了數(shù)字化處理的其他示例。

數(shù)字化的示例包括:

將現(xiàn)有的基于人員和文檔的工作流“捕獲”為這些工作流的基于計算機的表示形式,以便以后進行自動化或分析

現(xiàn)有的基于人的流程的自動化

可以提供工作流程步驟的有效性和效率的可見性的過程分析和過程管理工具

將高級分析和增值技術(shù)應(yīng)用于基于文檔的多步驟交互

以前手動進行的流程的改進以信息的數(shù)字交換(即數(shù)字簽名)為中心

處理紙質(zhì)流程和基于人的流程向數(shù)字流程的一種方法是捕獲和自動化現(xiàn)有流程。機器人流程自動化(RPA) 技術(shù)在這里具有優(yōu)勢,它可以通過計算機接口獲取以前需要手動操作的現(xiàn)有流程,并將其轉(zhuǎn)換為完成重復(fù)任務(wù)的基于軟件的自動化流程。盡管RPA解決方案的主要目的不是修改現(xiàn)有工作流程,但它們確實有助于從公式中刪除人為因素,從而使這些流程更加高效。

除了流程自動化之外,希望將流程數(shù)字化的公司還可以使用流程挖掘和發(fā)現(xiàn)軟件來分析現(xiàn)有工作流程,深入了解改進和提高這些工作流程的機會,并在基于人的工作流程中添加更多的監(jiān)視和管理功能存在。這些“ 流程捕獲 ”工具能夠?qū)F(xiàn)有的基于人的工作流記錄和記錄為機器可理解的格式,以供以后進行自動化或分析。

數(shù)字化與數(shù)字化轉(zhuǎn)型之間的關(guān)系

除了數(shù)字化和數(shù)字化的概念外,還有一個經(jīng)常被包裹和混淆的術(shù)語:數(shù)字轉(zhuǎn)換。數(shù)字化轉(zhuǎn)型是一個廣泛的想法,已經(jīng)存在了幾十年。數(shù)字化轉(zhuǎn)型的概念是組織運營的戰(zhàn)略和根本變革,以數(shù)字化流程,技術(shù)和方法為驅(qū)動力,以實現(xiàn)高效率和高運營率。具有遠見卓識的組織正在利用計算,存儲和軟件技術(shù)的巨大進步來數(shù)字化其員工隊伍,并在此過程中實現(xiàn)顯著的生產(chǎn)力,節(jié)省時間并提高公民或客戶滿意度。

數(shù)字化轉(zhuǎn)型基于數(shù)字信息(數(shù)字化)和數(shù)字過程(數(shù)字化)的基礎(chǔ)。它基于這些來改變操作的本質(zhì),從而超越了簡單地存儲更多數(shù)據(jù)并通過向其策略添加智能來使現(xiàn)有系統(tǒng)和流程自動化的功能,并使認(rèn)知技術(shù)的力量能夠應(yīng)對其工作環(huán)境中更為復(fù)雜的挑戰(zhàn),簡單的自動化將無法實現(xiàn)。成功實現(xiàn)數(shù)字化運營的組織減少了客戶和利益相關(guān)者需求之間的摩擦,并降低了組織有效滿足這些需求的能力。

數(shù)字化是許多AI項目必不可少的第一步

乍一看,數(shù)字化似乎與AI無關(guān)。但是,數(shù)字化是從鎖定在非數(shù)字資產(chǎn)或基于人的過程中的數(shù)據(jù)中提取價值的必要的第一步。通過首先對流程和文檔進行數(shù)字化然后再數(shù)字化,可以將更大的價值應(yīng)用于業(yè)務(wù)組織,從而使它們能夠解決越來越困難,業(yè)務(wù)價值越來越高的業(yè)務(wù)問題。沒有數(shù)字化的基礎(chǔ)層,組織就無法應(yīng)用AI和ML等高級技術(shù)來獲取附加價值。畢竟,數(shù)據(jù)是收集信息,理解和見解的基礎(chǔ)層。

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。