ZSYL 2021-08-15 14:00:44 阅读数:312
在正式介紹YOLO之前,我們來看一張圖:
可以看出YOLO的最大特點是速度快。
一個網絡搞定一切,GoogleNet + 4個卷積+2個全連接層
以圖示的方式演示:
2、默認7 * 7個單元格,這裏用3 * 3的單元格圖演示
3、每個單元格預測兩個bbox框
4、進行NMS篩選,篩選概率以及IoU
最後網絡輸出的7 * 7 * 30的特征圖怎麼理解?7 * 7=49個像素值,理解成49個單元格,每個單元格可以代錶原圖的一個方塊。單元格需要做的兩件事:
1.每個單元格負責預測一個物體類別,並且直接預測物體的概率值
2.每個單元格預測兩個(默認)bbox比特置,兩個bbox置信度(confidence) 7 * 7 * 2=98個bbox
一個網格會預測兩個Bbox,在訓練時我們只有一個Bbox專門負責(一個Object 一個Bbox)
怎麼進行篩選?
每個bounding box都對應一個confidence score
注:所以如何判斷一個grid cell中是否包含object呢?如果一個object的ground truth的中心點坐標在一個grid cell中,那麼這個grid cell就是包含這個object,也就是說這個object的預測就由該grid cell負責。
這個概率可以理解為不屬於任何一個bbox,而是屬於這個單元格所預測的類別。
每個Bbox的Class-Specific Confidence Score以後,設置閾值,濾掉概率的低的bbox,對每個類別過濾IoU,就得到最終的檢測結果
怎麼理解這個過程?
同樣以分類那種形式來對應,假設以一個單元格的預測值為結果,如下圖:
Faster R-CNN利用RPN網絡與真實值調整了候選區域,然後再進行候選區域和卷積特征結果映射的特征向量的處理來通過與真實值優化網絡預測結果。而這兩步在YOLO當中合並成了一個步驟,直接網絡輸出預測結果進行優化。
所以經常也會稱之為YOLO算法為直接回歸法代錶。YOLO的特點就是快
版权声明:本文为[ZSYL]所创,转载请带上原文链接,感谢。 https://gsmany.com/2021/08/20210815140041018i.html