摘要: 為了解決違禁品帶入公共場合的問題,本文對違禁品的識別進行了研究。在安檢儀中,加入改進的YOLOv3網絡檢測算法,使其能夠檢測出違禁品,而在基礎網絡上,引入多維輸入圖和多分辨率輸入圖,增加了樣本的多樣性,有效解決了模型的適應性差的問題。在端到端的網絡上,用分層方法進行特征提取和分類,獲得不同尺度的特征圖,以此來提高網絡測試的精度,并采用聚類算法確定目標輪廓,使其能夠精準定位。實驗結果表明,改進的網絡識別目標精度在90%以上,高于原網絡的精準度。本網絡效果好,具有較高的識別率,且封裝在模塊中,操作簡單。該研究可有效提醒安檢員防止違禁品帶入公共場合,造成公共事故。
關鍵詞: YOLOv3; 端到端; 特征提取; 聚類算法
隨著人口的不斷增多,公共場所的人口密度變得越來越大,一旦發生事故就后會產生擁堵的情況,逃離的可能性很小,因此,嚴禁違禁品帶入人口密度大的場合[1]是解決問題的關鍵。2011年,在河南信陽段高速上,因車廂內違法裝載易燃危險化學品突然發生爆燃,導致客車起火燃燒,造成人員的死亡和受傷。目前,安全檢查主要包括行李物品檢查、旅客證件檢查、手提行李物品檢查和旅客身體檢查。其中,旅客證件檢查主要是確定乘客基本信息,其它三項檢查均是防止乘客攜帶刀、槍、易燃易爆品等危險物品,以確保公共場所及交通的安全。但在春運或法定假期期間,由于客流量較大,排隊安檢會發生擁堵情況,而且工作量的增加,也會使工作人員觀察不仔細,導致違禁品帶入公共場合,危害公共安全[2]。因此,針對這種狀況,本文比較了你只看一次[35](you only look once version 3,YOLOv3)、單一多盒檢測器[67](single shot multibox detector,SSD)、快速區域卷積神經網絡[89](fast regionbased convolutional neural network,Fast RCNN)等網絡的區別,最終選擇了基于卷積結構的YOLOv3網絡,對其進行改進,優化網絡架構及層數,使其在計算過程中減少計算量。同時,根據樣本信息,更改先驗框維度大小,提高對目標的精準定位,對樣本進行多樣化處理,并進行多尺度訓練,以保證算法能夠快速準確的識別和定位出目標物體。該研究為工作人員減輕了工作負擔,同時也降低了公共場合事故的發生率。
1YOLOv3相關理論
1.1基礎層
1.1.1Darknet53
0~74層是YOLOv3主結構,其含有53層卷積層,故叫做Darknet53。YOLOv3結構、DBL模塊結構和res unit模塊結構如圖1所示。Darknet53是由多個殘差層組成,殘差模塊和殘差層見圖1中的res unit和res n,并用卷積層替代池化層,控制梯度的傳播,在訓練過程中,有效解決了迭代次數增多而產生的梯度消失或爆炸問題。
1.1.2多尺度訓練
75~105層是3個尺度的特征層,在每個尺度中,通過卷積操作和上采樣操作,將相同尺寸的特征圖合成一個特征圖,經過卷積處理得到新的特征圖。在原YOLOv3中,歸一化尺度為416×416,在darknet53之后,進行卷積操作得到13×13特征圖,作為最小尺度y1。將79層的13×13特征圖進行卷積和上采樣操作,得到的特征圖與61層的26×26特征圖合并,得到中尺度y2。將91層的26×26特征圖進行卷積和上采樣操作,得到的特征圖與36層的52×52特征圖合并,得到最大尺度y3(見圖1)。多尺度訓練[10]可以更好地識別大小不一的目標,提高目標識別率,小尺度可檢測小目標,大尺度可檢測大目標,可以提高網絡精度。本文中的樣本縮放比例太大,會造成圖片像素重疊,進而識別不出目標。因此,將歸一化尺度更改為608×608,3個尺度設置為19×19,38×38,76×76。
1.2回歸及改進
1.2.1分類方法
YOLOv3的分類方法,由單標簽多分類的Softmax函數更換為多標簽多分類的邏輯回歸。邏輯回歸分類步驟分為3步,分別是線性函數、數值到概率的轉換及概率到標簽的轉換。
輸入為X,邏輯回歸采用sigmoid函數,將決策邊界轉換成值,保持在0~1之間的概率函數,用概率確定樣本標簽是某一類別的可能性。
為防止概率函數hθX過擬合,需在損失函數后加一項,則損失函數為
式中,m是樣本個數;y是真實值;λ是正則化公式強度參數;hθX是輸出結果。
損失函數梯度為
其中,λ為正則化的強度。
通過學習率對特征系數的迭代,得出某一值,就可算出特征向量系數θ。
1.2.2邊框預測
邊框預測是YOLOv3的方法,使用先驗框的定義,即用Kmeans++算法對訓練集上的目標尺寸大小進行聚類分析,使之有相似特征目標歸為一類,并根據尺寸大小確定anchor box的維度。
YOLOv3運用與特征金字塔網絡[11](feature pyramid networks,FPN)相近的上采樣和融合思想,將輸入圖像分為多個尺寸不同的特征圖,然后進行檢測。YOLOv3中分成3個尺度,并將每個尺度輸入圖像的網格單元(grid cell)中,預測3個bounding box,且每個bounding box有5個基本參數,分別是x,y,w,h,confidence。
推薦閱讀:中國公共安全(學術版)
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >