物件偵測演算法YOLO,發明人Joseph Redmon提出一張有趣的照片,機器人要能完成煎餅的任務,它必須知道煎餅的所在位置,才能夠將餅翻面,如果有兩張以上的餅,還需知道要翻哪一張,這就是物件偵測的應用。

其他領域也會用到物件偵測,譬如:

  1. 自駕車(Self-driving Car):需要即時掌握前方路況及閃避障礙物。
  2. 智慧交通:車輛偵測,利用一輛車在兩個時間點的位置,計算車速,進而可以推算道路壅塞的狀況,也可以用來偵測違規車輛。
  3. 玩具、無人機、飛彈…等都可以作類似的應用。
  4. 異常偵測(Anomaly Detection):可以在生產線上架設攝影機,即時偵測異常的瑕疵,像是印刷電路板、產品外觀…等。
  5. 無人商店的購物籃掃描,自動結帳。

 

國內近幾年也看到許多則新聞報導相關的應用,例如:

  1. 農委會開發AI判圖系統,速揪秋行軍蟲(https://news.ltn.com.tw/news/life/paper/1295336)。
  2. 是痣還是癌/台大拍照上傳,秒讀知結果(https://news.ltn.com.tw/news/life/paper/1298835)。
  3. AI診斷黃斑部病變,準確率逾95%(https://news.ltn.com.tw/news/life/paper/1308494)。

 

物件偵測要能夠同時辨識物件的類別與位置,如果拆開來看就是兩項任務:

  1. 分類(Classification):辨識物件的類別。
  2. 迴歸(Regression):找到物件的位置,包括物件左上角的座標和寬度/高度。

圖1. 物件偵測示意圖

傳統的方式就是結合影像金字塔、方向梯度直方圖(HOG),以滑動視窗的方式逐一視窗檢查是否有物件在其中,不過,這種方式太費時了,因此,有學者就導入深度學習演算法,進行物件偵測,目前最夯的演算法就屬YOLO了,不僅辨識速度快,準確率也提高不少。

圖2. 影像金字塔

圖3. 物件偵測導入深度學習演算法的發展趨勢

相關實作可參閱『深度學習-最佳入門邁向AI專題實戰』一書說明。