基于位置編碼重疊切塊嵌入和多尺度通道交互注意力的魚類圖像分類
計算機應用
頁數(shù): 8 2024-03-12
摘要: 水下魚類圖像分類是一項極具挑戰(zhàn)性的任務。傳統(tǒng)Vision Transformer (ViT)網(wǎng)絡骨干的局限性較大,難以處理局部連續(xù)特征,在圖像質(zhì)量較低的魚類分類中效果表現(xiàn)不佳。為解決此問題,提出一種基于位置編碼的重疊切塊嵌入(OPE)和多尺度通道交互注意力(MCIA)的Transformer圖像分類網(wǎng)絡PIFormer (Positional overlapping and I... (共8頁)
開通會員,享受整站包年服務