人工智能驅(qū)動(dòng)的機(jī)器視覺每天都變得越來越強(qiáng)大和廣泛。機(jī)器視覺和人工智能的新應(yīng)用正在快速發(fā)展,尤其是在醫(yī)療保健、自動(dòng)駕駛汽車、制造、農(nóng)業(yè)和安全等領(lǐng)域。
在醫(yī)療保健領(lǐng)域,機(jī)器視覺用于快速分析數(shù)以千計(jì)的 X 射線、CAT 掃描和其他醫(yī)學(xué)圖像。它通過優(yōu)先考慮醫(yī) 院急診室的患者治療來挽救生命。在交通運(yùn)輸行業(yè),人工智能驅(qū)動(dòng)的機(jī)器視覺系統(tǒng)使自動(dòng)駕駛汽車能夠發(fā)現(xiàn)障礙物并安全地在道路上行駛。
機(jī)器視覺也通過自動(dòng)缺陷檢測在制造業(yè)中發(fā)揮著關(guān)鍵作用,數(shù)字農(nóng)業(yè)的快速擴(kuò)展領(lǐng)域部署了計(jì)算機(jī)視覺系統(tǒng)來限制甚至消除農(nóng)藥的使用,同時(shí)可持續(xù)地增加產(chǎn)量。
與機(jī)器視覺系統(tǒng)一樣有用,它們是大量非結(jié)構(gòu)化數(shù)據(jù)的來源。根據(jù) IDC 的研究,它們的日益普及是推動(dòng)全球收集的數(shù)據(jù)量爆 炸式增長的一個(gè)重要因素。
有了所有這些用途以及用于人工智能機(jī)器視覺的所有這些數(shù)據(jù),它對企業(yè)產(chǎn)生了許多數(shù)據(jù)管理影響。今天,大多數(shù)組織都面臨著相互沖 突的數(shù)據(jù)管理需求。
大多數(shù)數(shù)據(jù)源自邊緣,但計(jì)算和存儲(chǔ)基礎(chǔ)設(shè)施通常集中在幾個(gè)大型數(shù)據(jù)中心或公共云上。將數(shù)據(jù)移動(dòng)到集中位置會(huì)帶來與傳輸和存儲(chǔ)數(shù)據(jù)相關(guān)的大量延遲和成本。
據(jù)Gartner 稱,到 2025 年,大約 75% 的企業(yè)生成數(shù)據(jù)將在傳統(tǒng)數(shù)據(jù)中心或云之外創(chuàng)建和處理。在邊緣捕獲的大多數(shù)數(shù)據(jù)目前都轉(zhuǎn)移到集中位置進(jìn)行處理,用于人工智能模型開發(fā)。
在實(shí)施機(jī)器視覺技術(shù)時(shí)必須考慮這一點(diǎn)。對于捕獲和集中 PB 級(jí)非結(jié)構(gòu)化數(shù)據(jù)的任何企業(yè)而言,這些負(fù)載都會(huì)顯著減慢機(jī)器學(xué)習(xí)算法的訓(xùn)練過程。這種集中式數(shù)據(jù)處理方法延遲了 AI 開發(fā)管道和生產(chǎn)模型調(diào)整。在工業(yè)環(huán)境中,這可能會(huì)導(dǎo)致遺漏產(chǎn)品缺陷,從而可能給企業(yè)造成巨額損失,甚至危及生命。
為了解決這個(gè)問題,越來越多的企業(yè)開始轉(zhuǎn)向分布式、去中心化的架構(gòu)。這意味著大多數(shù)數(shù)據(jù)都在邊緣保存和處理,以解決延遲和延遲挑戰(zhàn),并解決與數(shù)據(jù)處理速度相關(guān)的問題。邊緣分析和聯(lián)合機(jī)器學(xué)習(xí)技術(shù)的部署帶來了顯著的好處,同時(shí)解決了集中式系統(tǒng)固有的安全和隱私缺陷。
一個(gè)不斷捕獲視頻片段的大型監(jiān)控網(wǎng)絡(luò)會(huì)編譯大量原始數(shù)據(jù)以供以后分析。為了從素材中有效地訓(xùn)練 ML 模型意味著必須對其進(jìn)行審查以區(qū)分視頻中的特定對象。只需要檢測到新事物的鏡頭,而不需要可能捕獲空建筑物或街道的無變化視頻的乏味時(shí)間。通過在邊緣預(yù)先分析數(shù)據(jù)并將必要的鏡頭移動(dòng)到一個(gè)集中點(diǎn),企業(yè)可以節(jié)省時(shí)間、帶寬和成本。
雖然分布式架構(gòu)有許多優(yōu)點(diǎn),但它們也引入了額外的復(fù)雜性。在邊緣選擇和部署適當(dāng)?shù)拇鎯?chǔ)和計(jì)算基礎(chǔ)設(shè)施以及集中管理至關(guān)重要,并且會(huì)顯著影響整體系統(tǒng)效率和擁有成本。
許多收集的主要用于 AI 模型訓(xùn)練的圖像和視頻應(yīng)該永久存儲(chǔ)用于不同的目的。
例如,在高級(jí)駕駛員輔助系統(tǒng)和自動(dòng)駕駛汽車中,人工智能根據(jù)其實(shí)時(shí)收集的數(shù)據(jù)做出決策。但是,如果出現(xiàn)問題:可能是幾個(gè)月或幾年后,企業(yè)需要能夠回過頭來分析發(fā)生了什么。盡管對安全性至關(guān)重要,但這種存儲(chǔ)的成本很高。據(jù) Gartner 稱,平均每年每 TB 為 3,351 美元。當(dāng)您考慮到平均自動(dòng)測試車輛每小時(shí)捕獲 2 TB 的數(shù)據(jù)時(shí),很容易看出成本是如何增加的。
許多存儲(chǔ)大量非結(jié)構(gòu)化數(shù)據(jù)的企業(yè)通常依賴于網(wǎng)絡(luò)附加存儲(chǔ)設(shè)備或公共云存儲(chǔ)。但是,采用分層數(shù)據(jù)存儲(chǔ)架構(gòu)可以顯著節(jié)省成本。
在分層系統(tǒng)中,在處理和分析數(shù)據(jù)的活動(dòng)期間,內(nèi)容被放置在快速存儲(chǔ)中,而備份副本則存儲(chǔ)和存檔在成本較低的存儲(chǔ)上,例如磁帶或?qū)ο蟠鎯?chǔ)。大規(guī)模的低成本存儲(chǔ)可低至每 TB 50 美元。在包括自動(dòng)駕駛汽車在內(nèi)的許多行業(yè)中,大多數(shù)收集的數(shù)據(jù)需要無限期保存,但很少使用,可以存儲(chǔ)在最低成本層。
非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)解決方案和邊緣分析的新發(fā)展不斷沖擊市場。為了利用這些優(yōu)勢,企業(yè)應(yīng)該從頭到尾專注于實(shí)施模塊化數(shù)據(jù)管理,以便在發(fā)布時(shí)將元素替換為更先進(jìn)的技術(shù)。
使用機(jī)器視覺尋找新機(jī)會(huì)
即使擁有最好的技術(shù)和服務(wù),成功傳輸、處理和存儲(chǔ)為機(jī)器視覺用例捕獲的大量數(shù)據(jù)仍將繼續(xù)挑戰(zhàn)各種垂直領(lǐng)域的企業(yè)。
然而,存儲(chǔ)的數(shù)據(jù)也提供了一個(gè)新興的機(jī)會(huì)。例如,可以重復(fù)使用圖像和視頻來開發(fā)新的用例。
因此,存儲(chǔ)數(shù)據(jù)將成為企業(yè)新的收入來源,而不是成本。同樣,當(dāng)更先進(jìn)的分析技術(shù)投入使用時(shí),許多企業(yè)可以重用現(xiàn)有的存檔數(shù)據(jù)來開發(fā)自己的新產(chǎn)品。一些尤其是汽車制造商,已經(jīng)開始意識(shí)到這種潛力。這些潛在的新收入流和數(shù)據(jù)使用是當(dāng)今開始優(yōu)先考慮智能高效處理和存儲(chǔ)數(shù)據(jù)的絕佳理由。