深度學(xué)習(xí)在目標(biāo)視覺檢測中的應(yīng)用進(jìn)展與展望
目標(biāo)視覺檢測是計算機視覺領(lǐng)域的一個重要問題,在視頻監(jiān)控、自主駕駛、人機交互等方面具有重要的研究意義和應(yīng)用價值.近年來,深度學(xué)習(xí)在圖像分類研究中取得了突破性進(jìn)展,也帶動著目標(biāo)視覺檢測取得突飛猛進(jìn)的發(fā)展.
目標(biāo)視覺檢測是計算機視覺領(lǐng)域的一個重要問題,在視頻監(jiān)控、自主駕駛、、電子產(chǎn)品檢測(手機中框平面度檢測)人機交互等方面具有重要的研究意義和應(yīng)用價值.近年來,深度學(xué)習(xí)在圖像分類研究中取得了突破性進(jìn)展,也帶動著目標(biāo)視覺檢測取得突飛猛進(jìn)的發(fā)展。
目標(biāo)視覺檢測具有巨大的實用價值和應(yīng)用前景.應(yīng)用領(lǐng)域包括智能視頻監(jiān)控、汽車連接器Pin針高度檢測、數(shù)碼相機中自動定位和聚焦人臉的技術(shù)、飛機航拍或衛(wèi)星圖像中道路的檢測、車載攝像機圖像中的障礙物檢測等.同時, 目標(biāo)視覺檢測也是眾多高層視覺處理和分析任務(wù)的重要前提, 例如行為分析、事件檢測、場景語義理解等都要求利用圖像處理和模式識別技術(shù), 檢測出圖像中存在的目標(biāo), 確定這些目標(biāo)對象的語義類型, 并且標(biāo)出目標(biāo)對象在圖像中的具體區(qū)域。
目標(biāo)視覺檢測的計算復(fù)雜性主要來自于待檢測目標(biāo)類型的數(shù)量、特征描述子的維度和大規(guī)模標(biāo)記數(shù)據(jù)集的獲取.由于在真實世界中存在大量的目標(biāo)類型, 每種類型都包含大量的圖像, 同時識別每種類型需要很多視覺特征, 這導(dǎo)致高維空間稀疏的特征描述[4].另外, 目標(biāo)模型經(jīng)常從大規(guī)模標(biāo)記數(shù)據(jù)集中學(xué)習(xí)得到, 在許多情況下, 數(shù)據(jù)采集和標(biāo)注很困難, 需要耗費大量的人力物力.這些情況導(dǎo)致目標(biāo)檢測的計算復(fù)雜性很高, 需要設(shè)計高效的目標(biāo)檢測算法.同時, 在動態(tài)變化的環(huán)境中, 為了提高目標(biāo)檢測精度, 還需要探索合適的機制來自動更新視覺模型, 提高模型對復(fù)雜環(huán)境的自適應(yīng)能力。
文章轉(zhuǎn)載自人工智能學(xué)家微信公眾號,如有問題,請及時聯(lián)系刪除。