工程機(jī)械廠家自動識別系統(tǒng)研究
時間:2022-09-25 11:30:17
導(dǎo)語:工程機(jī)械廠家自動識別系統(tǒng)研究一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:工程機(jī)械在施工的過程中,需要加強(qiáng)機(jī)械設(shè)備的統(tǒng)一管理,因而建立和健全機(jī)械設(shè)備的統(tǒng)計管理制度至關(guān)重要。對此,本文設(shè)計研究了一種用于工程機(jī)械廠家的圖像識別系統(tǒng),該系統(tǒng)使用matlab構(gòu)建alexnet遷移學(xué)習(xí)模型對工程機(jī)械廠家數(shù)據(jù)集進(jìn)行訓(xùn)練,通過對工程機(jī)械目標(biāo)的外觀和標(biāo)志為特征進(jìn)行訓(xùn)練,以達(dá)到提高施工現(xiàn)場機(jī)械設(shè)備調(diào)度效率的目的。
關(guān)鍵詞:深度學(xué)習(xí);系統(tǒng)開發(fā);工程機(jī)械
工程機(jī)械行業(yè)的產(chǎn)業(yè)升級對國家基礎(chǔ)建設(shè)的發(fā)展至關(guān)重要。但是,現(xiàn)在存在的問題就是現(xiàn)在有的工程項目在施工時,當(dāng)參與建設(shè)的施工設(shè)備過多時,就會產(chǎn)生設(shè)備調(diào)度和管理無序的情況。因此,設(shè)計一套用于工程機(jī)械廠家的圖像識別系統(tǒng),對于實現(xiàn)我國工程機(jī)械的施工統(tǒng)一管理具有重要的意義。對此,本文選定alexnet深度學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過不斷調(diào)試深度學(xué)習(xí)模型的層次、丟失層丟失率、學(xué)習(xí)率、訓(xùn)練步數(shù)等參數(shù),探討不同深度的特征提取網(wǎng)絡(luò)對識別效果的影響。
1圖像識別網(wǎng)絡(luò)模型的選用
合適的識別網(wǎng)絡(luò)對于系統(tǒng)的構(gòu)建極為重要,由于本文所使用的工程機(jī)械的圖像數(shù)據(jù)集規(guī)模較小,所以要求網(wǎng)絡(luò)具有良好的特征學(xué)習(xí)能力。對此針對實驗的實際的情況和識別算法的可行性在經(jīng)過對現(xiàn)有主流的圖像分類方法分析后,發(fā)現(xiàn)Alexnet和vgg16網(wǎng)絡(luò)在訓(xùn)練速度和精度方面都有著不俗的效果。本文主要以Alexnet作為實驗的基礎(chǔ)框架,并將其與層次較深的vgg16網(wǎng)絡(luò)進(jìn)行了簡單對比。
2圖像樣本數(shù)據(jù)集建立
良好的圖像樣本數(shù)據(jù)庫對于圖像識別網(wǎng)絡(luò)的分析極為重要,在進(jìn)行數(shù)據(jù)庫構(gòu)建時,其中主要有數(shù)據(jù)集的構(gòu)建、圖像數(shù)據(jù)集的標(biāo)簽化處理、圖像數(shù)據(jù)集歸一化、圖像數(shù)據(jù)集擴(kuò)充、圖像數(shù)據(jù)集的劃分。(1)數(shù)據(jù)集構(gòu)建。數(shù)據(jù)集共含有18家工程機(jī)械廠家,共計900張,基本涵蓋了目前市面上的常見主流工程機(jī)械廠家。為了保證識別的精度,每個圖像中僅有一或兩輛工程機(jī)械,并且圖像中的廠家特征沒有重疊或損壞。(2)圖像數(shù)據(jù)集的標(biāo)簽化處理。由于深度學(xué)習(xí)算法需要采用有標(biāo)簽的樣本圖片進(jìn)行訓(xùn)練,而本文采集的工程機(jī)械圖像是無標(biāo)簽的,因此,需要對樣本圖像進(jìn)行打標(biāo)簽處理。使用matlab內(nèi)置的app“imagelabeler”對廠家圖像進(jìn)行人工標(biāo)定,將標(biāo)定完的含有標(biāo)簽信息的mat文件保存在特定的文件夾,隨后批量將mat文件導(dǎo)出為.jpg標(biāo)簽圖片,保存訓(xùn)練樣本圖片用于廠家識別網(wǎng)絡(luò)的訓(xùn)練。(3)圖像數(shù)據(jù)集歸一化。在深度學(xué)習(xí)模型中的輸入樣本來自imagelabeler裁剪出來的圖像,因此,存在裁剪的圖像大小不一致的問題,而因為AlexNet模型要求圖像的輸入尺寸為227×227×3,VGG16的要求為224×224×3,所以需要進(jìn)行歸一化處理,將數(shù)據(jù)集的圖像尺寸統(tǒng)一。(4)圖像數(shù)據(jù)集擴(kuò)充。為了獲得更好的訓(xùn)練效果,提高識別精度,應(yīng)使數(shù)據(jù)集的規(guī)模盡可能地大,這樣網(wǎng)絡(luò)能學(xué)習(xí)到更多的特征,訓(xùn)練出的模型效果更好,因此,數(shù)據(jù)增強(qiáng)成為一種非常便捷的數(shù)據(jù)集擴(kuò)充途徑。本文采取的數(shù)據(jù)增強(qiáng)途徑有旋轉(zhuǎn)、鏡像、添加噪聲,以此通過較小的人工采集工作量獲得大量的數(shù)據(jù)樣本。(5)圖像數(shù)據(jù)集的劃分。按照網(wǎng)絡(luò)的訓(xùn)練步驟,在訓(xùn)練開始前,需要將樣本數(shù)據(jù)集劃分為訓(xùn)練集和測試集兩部分,由于樣本數(shù)據(jù)集較小,為了保證訓(xùn)練效果將訓(xùn)練集的比例增大,測試集的比例減小,將訓(xùn)練集和測試集按照4:1的比例進(jìn)行劃分,規(guī)定每種廠家的樣本圖片中4/5為訓(xùn)練集,1/5為測試集。其中,訓(xùn)練集作為網(wǎng)絡(luò)的訓(xùn)練提供數(shù)據(jù)支持,測試集用于在訓(xùn)練完成后對模型的識別精度進(jìn)行檢測和自我評估。
3模型訓(xùn)練以及數(shù)據(jù)對比
(1)模型的訓(xùn)練結(jié)果。對模型的訓(xùn)練選擇使用遷移學(xué)習(xí),采用ImageNet數(shù)據(jù)集上進(jìn)行過預(yù)訓(xùn)練的AlexNet網(wǎng)絡(luò)模型,將自建的樣本數(shù)據(jù)集輸入網(wǎng)絡(luò)的最后三層,新模型預(yù)訓(xùn)練后其收斂速度得到了極大提升。采用遷移學(xué)習(xí)方法訓(xùn)練得到網(wǎng)絡(luò)模型的識別精度更高,訓(xùn)練效果更好。通過對alexnet遷移學(xué)習(xí)后的網(wǎng)絡(luò)進(jìn)行主要參數(shù)的不斷對比調(diào)試,得到了11組不同參數(shù)下的網(wǎng)絡(luò)模型,第一組為訓(xùn)練網(wǎng)絡(luò)的最佳結(jié)果,準(zhǔn)確率為87.89%。具體如表1所示。(2)使用不同網(wǎng)絡(luò)模型的對比實驗,本節(jié)中分別使用alexnet和vgg16模型進(jìn)行訓(xùn)練,為防止訓(xùn)練參數(shù)變化以及不同數(shù)據(jù)集對訓(xùn)練結(jié)果的影響,在對比實驗中,兩次的訓(xùn)練學(xué)習(xí)使用了相同的參數(shù)和數(shù)據(jù)集,訓(xùn)練結(jié)果如圖1所示。圖1由實驗結(jié)果可知,使用相同網(wǎng)絡(luò)和參數(shù)的情況下,使用alexnet模型訓(xùn)練的網(wǎng)絡(luò)識別精度為87.89%,訓(xùn)練時間為23min10s,使用vgg16模型訓(xùn)練網(wǎng)絡(luò)的識別精度為86.11%,訓(xùn)練時長為160min53s。alexnet模型的層數(shù)較少,訓(xùn)練速度較快,且識別效果較好,vgg16模型的層數(shù)較多,訓(xùn)練速度明顯減慢,且識別精度未有明顯提升。實驗結(jié)果表明,alexnet模型的訓(xùn)練速度更快,且訓(xùn)練效果與更深層次的vgg16相似,因此,本文選用alexnet模型進(jìn)行訓(xùn)練更加合適。(3)樣本集擴(kuò)充效果對比實驗。本節(jié)中分別在原始數(shù)據(jù)集和擴(kuò)充數(shù)據(jù)集上進(jìn)行網(wǎng)絡(luò)的訓(xùn)練,原始數(shù)據(jù)集為未經(jīng)過數(shù)據(jù)擴(kuò)充的圖像,擴(kuò)充數(shù)據(jù)集為經(jīng)過加噪聲、鏡像、翻轉(zhuǎn)處理后擴(kuò)大五倍的樣本集,使用相同的測試集比例,驗證數(shù)據(jù)集擴(kuò)充對網(wǎng)絡(luò)模型識別精度的影響。為防止訓(xùn)練參數(shù)變化對訓(xùn)練結(jié)果的影響,在對比實驗中,兩次的訓(xùn)練學(xué)習(xí)使用了相同的參數(shù),由實驗結(jié)果可知,使用相同網(wǎng)絡(luò)和參數(shù)的情況下,使用擴(kuò)充的數(shù)據(jù)集訓(xùn)練網(wǎng)絡(luò)模型可以得到87.89%的識別精度,訓(xùn)練時間為23min10s,使用未擴(kuò)充的數(shù)據(jù)集訓(xùn)練網(wǎng)絡(luò)得到的識別效果大打折扣,只有60.56%的準(zhǔn)確率,訓(xùn)練時長為2min31s。雖然數(shù)據(jù)集的擴(kuò)充使得訓(xùn)練時長有所增加,但是在分類較多而樣本數(shù)據(jù)集較小的情況下,使用數(shù)據(jù)集擴(kuò)充的方法,可以極大地提高網(wǎng)絡(luò)的識別效果。實驗結(jié)果表明,數(shù)據(jù)集的擴(kuò)充會增加訓(xùn)練時長,但可以有效提高網(wǎng)絡(luò)準(zhǔn)確率,彌補(bǔ)樣本數(shù)據(jù)集較小的不足。
4結(jié)語
本文主要介紹了工程機(jī)械識別系統(tǒng)建立的每個過程,從數(shù)據(jù)集的收集整理,到工程機(jī)械圖像數(shù)據(jù)集的擴(kuò)充、打標(biāo)簽處理,以及網(wǎng)絡(luò)模型的建立結(jié)果對比。詳細(xì)地闡述了基于alexnet網(wǎng)絡(luò)實現(xiàn)工程機(jī)械廠家識別任務(wù)的整個流程。從網(wǎng)絡(luò)對工程機(jī)械廠家的識別率和實時性來看,本算法能滿足實際工程生產(chǎn)時的準(zhǔn)確率和實時性要求。
參考文獻(xiàn):
[1]李新葉,朱婧,麻麗娜.基于深度學(xué)習(xí)的場景識別方法綜述[J/OL].計算機(jī)工程與應(yīng)用:1-14[2020-02-13].
[2].MathWorks2018b版本的MATLAB和Simulink中擴(kuò)展深度學(xué)習(xí)功能[J].單片機(jī)與嵌入式系統(tǒng)應(yīng)用,2018,18(11):95.
[3]楚翔宇.基于深度學(xué)習(xí)的交通視頻檢測及車型分類研究[D].哈爾濱工業(yè)大學(xué),2017.
[4]趙振興.基于深度學(xué)習(xí)的車牌識別技術(shù)研究[D].青島科技大學(xué),2017.
作者:魏建昊 靳浩偉 王祥澳 傅雋翰 葉敏 單位:長安大學(xué)工程機(jī)械學(xué)院