摘 要:高分辨率遙感圖像分割在軍事、民用等領域具有良好的應用前景,但由于復雜的背景條件以及干擾物的遮擋,導致現有算法無法較好地從遙感影像中提取道路細節信息。研究基于改進 U-Net 網絡模型,提出了 MDAU-Net(multi dimension attention U-Net)網絡結構模型:通過對 U-Net 網絡結構加深至七層結構來提升精細分割道路的能力;并提出了一種多維注意力模塊 MD-MECA(Multi Dimension Modified Efficient Channel Attention)模塊,將其添加至編碼部分的特征傳遞步驟中,以達到對編碼部分的特征傳遞進行優化的目的;其中利用 DropBlock 與 Batch Normalization 解決網絡訓練過程中出現的過擬合。實驗結果表明:改進后算法可以有效提升道路的提取效果,在測試集上的準確率達到了 97.04%。
孔嘉嫄; 張和生, 中國空間科學技術 發表時間:2021-08-02
關鍵詞:遙感影像;道路提取;U-Net 網絡;多維注意力;特征傳遞
近年來,我國遙感衛星事業高速發展,對于遙感影像的獲取日益簡便快捷。由于高分辨率圖像的廣泛覆蓋和高精度,它已成為地理信息數據的重要來源。從這些圖像中提取的道路網絡信息具有廣泛的適用性,包括在導航、制圖,城市規劃和地理條件監視中的應用。道路是重要的人工建筑物、現代交通基礎設施的主體和地理信息系統中的基本數據。因此,及時更新道路信息將對依賴于這些系統的所有事物產生影響:如制圖、路線分析和緊急響應。利用遙感影像,大范圍自動提取道路數據吸引了全世界的廣泛關注。眾多學者經過多年的研究,提出并改進了多種道路提取方法。如張永宏等[1]全面總結分析了現有的道路提取方法,將其分為三類: 1)基于像元的道路提取方法。如羅慶洲等[2]提出了用光譜特征與形狀特征相結合的方法提取道路,林祥國等[3]使用角度紋理特征和灰度最小二乘匹配進行最佳量算提取陰影下帶狀道路。該類方法主要利用道路本身波譜特征的差異進行道路提取,對于背景簡單清晰、目標較少的遙感圖像提取效果較好,但對于背景信息較為復雜的遙感圖像道路提取效果不佳,需要大量后續處理。2)面向對象的道路提取方法。如陳立福等[4]提出的將馬爾可夫隨機場分割與數學形態學處理融合的方法,曹云剛等[5]提出的融合像元多尺度對象級特征的高分辨率遙感影像道路中心線提取方法。該類方法主要將圖像作為整體,將其分割為小像元,再進行道路提取。適用于信息量豐富、特征分明的遙感影像,而對于相似地物容易混分產生粘連現象。3)基于深度學習的道路提取方法。如 Cheng 等 [6]通過將兩個卷積網絡級聯到一個框架中,提出了級聯的端到端卷積神經網絡(CasNet)的方法。Liu 等 [7]提出的深度解析網絡(DPN)將卷積神經網絡(CNN)與馬爾可夫隨機場(MRF)相結合對道路進行提取。這類方法具有高效的學習能力和特征表達能力,在區別道路與其他非道路地物方面有突出優勢,但仍存在道路斷點,提取效果有待進一步提升。
隨著計算機技術不斷發展進步,不少學者對深度學習方法做出了許多改進,以此提高遙感影像道路的識別精度。其中 U-Net 網絡[8]的跨越連接結構實現了多尺度圖像信息的融合,在保留了高級的語義信息的同時顧及了低級的細節信息,因其改造性強且訓練速度快,目前在圖像分割領域最為常用。如袁偉等[9]提出一種新的形態損失函數有效提高道路分割精度。金飛等[10]用雙 U-Net 網絡聯合訓練和形態學后處理方式取得不錯效果。王卓等[11]通過在 U-Net 網絡中利用 Batch Normalization、ELU 與 Dropout 較好地解決了過擬合問題。
針對以上分析,研究采用 U-Net 網絡模型作為基礎結構,提出了一種基于改進 U-Net 的多維度監督特征優化的網絡模型 MDAU-Net:通過對 U-Net 進行加深結構處理,采用 7 層卷積和下采樣模塊進行特征提取;同時,為了優化建筑物目標的淺層細節特征和深層的語義特征,設計了模塊 MD-MECA 并將其添加至編碼部分到解碼部分的特征傳遞步驟中;并引入Batch Normalization[12] 和DropBlock[13] 解決網絡訓練過程中出現的過擬合問題。在遙感影像上進行道路提取試驗,有效減少了提取中的斷裂問題,較好提取細小道路,實現遙感影像道路完整提取。
1 網絡結構
1.1 U-Net 結構
U-Net 結構于 2015 年 5 月由 Ronneberger 等 [8] 提出,最初廣泛應用于醫學圖像分割領域。作為一種非常經典的全卷積網絡模型,目前在遙感影像分割領域中被廣泛采用,其網絡結構如圖 1 所示。
U-Net 分為兩部分,左邊為特征提取部分也稱下采樣部分,右邊為上采樣部分。特征提取部分通過卷積以及池化的計算方式提取圖像的深層語義特征,每次過程包括:將圖像經過兩次卷積后變為通道數增加 64 的矩陣,接著進行最大池化操作,圖像長寬縮小至原來的一半。依照相同的過程,經過4次下采樣之后,圖像變為 32×32×512 的矩陣,再經過兩次 3×3 的卷積操作得到最終的特征圖。而對于上采樣部分,從網絡底層信息開始計算,每經過一次 2×2 的反卷積后與同一層的下采樣特征圖進行拼接,和特征提取部分對應的通道數相同尺度融合,再經過兩次 3×3 的卷積操作完成 1 次上采樣。通過不斷結合特征提取而得到的特征圖,來進行信息補充,從而優化分割結果。
1.2 MECA 與 MD-MECA
受最近提出的 CAR-UNet(Channel Attention Residual U-Net)[14]的啟發,研究改進了 CAR-UNet 中的 MECA(Modified Efficient Channel Attention)模塊,MECA 模塊結構如圖 2 所示,該模塊在保持性能的同時大大降低了圖像分類、對象檢測和實例分割中的網絡復雜性。本文將優化后的模塊命名為多 維 度 監 督 機 制 MD-MECA ( multi dimension Modified Efficient Channel Attention ), 通 過 將 MD-MECA 添加到 U-Net 架構的編碼傳遞特征到解碼模塊,相比于原始的 U-Net,結構在特征圖傳遞的過程中,進行了特征圖優化,將編碼部分的特征圖進行不同方式的信息監督,然后傳遞到解碼部分進行信息補充。
通 道 注 意 力 機 制 CA(Channel Attention mechanism)最初被用作分類中的特征壓縮激勵網絡塊 (Squeeze-and-Excitation Networks) [15],它通過對通道間的依賴關系進行建模,可以自適應的調整各通道的特征響應值。最近研究表明,通道注意力在提高深度卷積神經網絡的性能方面有很大的潛力。近來,Guo 等人[14]提出了一種改進高效通道注意力(MECA)模塊應用于視網膜血管分割,取得較好效果,MECA 模塊利用卷積來避免在 SE 網絡塊中的降維操作,從而在保持優越性能的同時大大降低了模型的復雜度。MECA 模塊是可嵌入的通道監督模塊,通過使用不同的全局池化計算來提取全局特征:平均池化計算可以提取空間信息,同時最大值池化可以獲取獨特的對象特征,從而可以吸引更多精細的通道注意。因此,MECA 模塊通過組合兩者提取的全局特征來獲得更精細的通道監督權重,并且以 C 通道為基礎進行通道注意監控,獲取不同通道之間的權重參數。
MECA 模塊中特征圖具有不同維度 H、W 和 C,分別代表輸入特征的高(height)、寬(width)和通道 (channels)數量,因而可以通過多角度全方面進行監督來強化 MECA 模塊,使得特征圖能代表更加精細的道路信息。基于特征圖的維度特點,本文設計的一種多維度監督機制 MD-MECA(multi dimension Modified Efficient Channel Attention):在 C 通道維度的基礎上,增加 H 維度和 W 維度通道,并分別設計了相同的注意力監督模塊,得到不同維度的監督權重參數。
本文設計的 MD-MECA 模塊結構如圖 3 所示, MD-MECA 模塊結構:以 MECA 的監督結構,分別提取基于各維度的監督權重。以 C 通道為例,首先,輸入特征圖 F ∈
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >