專家觀點:AI應(yīng)用中寬數(shù)據(jù)比大數(shù)據(jù)更有價值

時間:2022-05-11

來源:千家網(wǎng)

導(dǎo)語:對于企業(yè)來說,為了實現(xiàn)人工智能的預(yù)測目的,必須有效地使用他們的數(shù)據(jù),必須使用各種數(shù)據(jù),特別是廣泛的數(shù)據(jù)。

  在當(dāng)今快節(jié)奏的數(shù)字世界中,數(shù)據(jù)的使用不斷發(fā)展,以幫助企業(yè)更好地理解來自大量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)存儲庫的見解。然而,雖然大數(shù)據(jù)可以提供對業(yè)務(wù)至關(guān)重要的分析,但這些數(shù)據(jù)主要是用來展示過去時態(tài)發(fā)生了什么。在執(zhí)行預(yù)測性和說明性分析時,越來越多地必須考慮廣泛的數(shù)據(jù)。

  這就是人工智能可以發(fā)揮作用的地方,也是大數(shù)據(jù)對人工智能的需求出現(xiàn)分歧的地方。大數(shù)據(jù)被定義為三個因素:容量、速度和多樣性。體積是指可用數(shù)據(jù)的大小,速度是指數(shù)據(jù)到達和處理的速度。

  然而,企業(yè)要想有效地將數(shù)據(jù)用于人工智能的預(yù)測目的,就需要各種數(shù)據(jù)。隨著人工智能在各個領(lǐng)域的應(yīng)用日益普及,訪問不同數(shù)據(jù)集的能力至關(guān)重要,也是人工智能算法的催化劑。換句話說,不要讓數(shù)據(jù)太過平淡無奇,而要讓它更多樣化。

  我們將這種數(shù)據(jù)稱為各種各樣的“寬數(shù)據(jù)”(Wide Data),這些數(shù)據(jù)來自組織的內(nèi)部、外部、結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。這一點至關(guān)重要,因為在全球化經(jīng)濟中,企業(yè)業(yè)績?nèi)Q于許多參數(shù)。

  大數(shù)據(jù)應(yīng)用的一個例子是看看在美國不同地區(qū)設(shè)計產(chǎn)品的兩個制造工廠。這兩家工廠的地理位置會對生產(chǎn)產(chǎn)生影響,尤其是在發(fā)生暴風(fēng)雪等自然災(zāi)害的情況下??紤]天氣和其他幾個不同的外部因素,再結(jié)合內(nèi)部數(shù)據(jù)來為人工智能算法提供數(shù)據(jù),將會對每個制造組織的庫存、供應(yīng)鏈和需求做出更準確的預(yù)測。數(shù)據(jù)的多樣性提供了更多的相關(guān)性,因此AI算法可以更好地學(xué)習(xí),從而提供準確的結(jié)果。

  為什么不是數(shù)據(jù)容量?

  由于缺乏不同的因變量,數(shù)據(jù)量并不一定意味著算法的學(xué)習(xí)效果更好。雖然從理論上講,擁有大量數(shù)據(jù)對人工智能應(yīng)用很重要,但對于高效的算法而言,數(shù)據(jù)的多樣性比數(shù)據(jù)的大小更重要。

  舉個例子,我們正在做一個預(yù)測癌癥患者數(shù)據(jù)的項目。研究對象并不多,只生成了150行數(shù)據(jù)。這產(chǎn)生了相對較少的數(shù)據(jù)來篩選,它不被認為是大數(shù)據(jù)。這就提出了一個問題——人工智能算法是否有足夠的數(shù)據(jù)來學(xué)習(xí)和預(yù)測癌癥患者的后續(xù)情況?在這種情況下,答案是肯定的。因為雖然只有150行,但生物識別、生物傳感器和癥狀數(shù)據(jù)卻構(gòu)成了數(shù)千列,這使它成為一個廣泛的數(shù)據(jù)。

  關(guān)鍵在于,對于人工智能應(yīng)用而言,數(shù)據(jù)的多樣性比數(shù)據(jù)量更重要。

  寬數(shù)據(jù)的類型

  如前所述,有不同類型的數(shù)據(jù),當(dāng)組合時,使其成為一個寬數(shù)據(jù),如:

  內(nèi)部結(jié)構(gòu)化數(shù)據(jù):位于軟件應(yīng)用程序(如 ERP、CRM 系統(tǒng)甚至財務(wù)系統(tǒng))中的數(shù)據(jù)。

  內(nèi)部非結(jié)構(gòu)化數(shù)據(jù):作為內(nèi)部非結(jié)構(gòu)化數(shù)據(jù)一部分的文檔、圖像、報告、圖表和圖表。

  外部數(shù)據(jù):來自外部來源的數(shù)據(jù),如天氣、社會、經(jīng)濟數(shù)據(jù)、人口普查數(shù)據(jù)、證券交易所數(shù)據(jù)等。

  外部非結(jié)構(gòu)化數(shù)據(jù):來自組織防火墻外部的新聞、圖像、視頻等。

  CUPP 框架:提供數(shù)據(jù)策略

  為了成功采用人工智能,擁有最佳人工智能實踐非常重要。一個這樣的框架是 CUPP,它代表收集、統(tǒng)一、處理和呈現(xiàn)。部署這四個步驟是組織開始其 AI 之旅的典型方式。

  可能沒有數(shù)據(jù)戰(zhàn)略或數(shù)據(jù)平臺的傳統(tǒng)企業(yè)將受益于創(chuàng)建像 CUPP 這樣的框架。在確保準確性或數(shù)據(jù)準確性方面,框架也很重要。組織需要干凈、高質(zhì)量的數(shù)據(jù)來確定理想的結(jié)果,而準確性會顯著加快這一過程。

  以下是組織使用 CUPP 框架所經(jīng)歷的基本步驟:

  1. 從數(shù)據(jù)普查開始

  利用數(shù)據(jù)普查方法來發(fā)現(xiàn)組織內(nèi)部和外部擁有的數(shù)據(jù)資產(chǎn)。

  此規(guī)劃過程的一部分是定位結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的來源。許多組織可能會對他們擁有多少非結(jié)構(gòu)化數(shù)據(jù)感到驚訝,并且進行數(shù)據(jù)普查可以讓他們盤點所有數(shù)據(jù)資產(chǎn)。

  2. 了解您的數(shù)據(jù)資產(chǎn)

  在建模之前,重要的是要了解組織已經(jīng)擁有什么。這有助于開發(fā) AI 最佳實踐,但需要一點耐心。這將作為AI 應(yīng)用采用的基礎(chǔ)并提供能力投資回報率。

  企業(yè)還需要研究其內(nèi)部-外部結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的收集和統(tǒng)一策略。

  3. 使用機器學(xué)習(xí)和自然語言處理以及機器學(xué)習(xí)來轉(zhuǎn)換和理解非結(jié)構(gòu)化內(nèi)容

  組織可以獲取他們獲取的非結(jié)構(gòu)化數(shù)據(jù)并利用自然語言處理將其轉(zhuǎn)換為結(jié)構(gòu)化內(nèi)容以訓(xùn)練您的數(shù)據(jù)。

  組織也應(yīng)該對非結(jié)構(gòu)化內(nèi)容感到鼓舞,而不是害怕它,因為現(xiàn)在有幾種技術(shù)可用于對這些內(nèi)容進行非常有意義的使用。

  關(guān)于需要使用寬數(shù)據(jù)的關(guān)鍵要點

  廣泛的數(shù)據(jù)可以更快地啟動 AI 之旅,并且對于幫助組織將來自各種大小、非結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)源的見解情境化至關(guān)重要。隨著技術(shù)的發(fā)展和發(fā)展,沒有企業(yè)可以忽視數(shù)據(jù)的作用和價值,都需要圍繞獲取和分析各種數(shù)據(jù)來制定數(shù)據(jù)策略。


中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(m.u63ivq3.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0