論文の概要: DenseSwinV2: Channel Attentive Dual Branch CNN Transformer Learning for Cassava Leaf Disease Classification
- arxiv url: http://arxiv.org/abs/2603.25935v1
- Date: Thu, 26 Mar 2026 22:03:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.296295
- Title: DenseSwinV2: Channel Attentive Dual Branch CNN Transformer Learning for Cassava Leaf Disease Classification
- Title(参考訳): DenseSwinV2:CNN Transformer Learning for Cassava Leaf Disease Classification
- Authors: Shah Saood, Saddam Hussain Khan,
- Abstract要約: Hybrid Dense SwinV2は、密結合した畳み込み特徴と階層的にカスタマイズされたSwing Transformer V2表現を併用して、キャッサバ病の分類を行う2ブランチフレームワークである。
提案するフレームワークは、DenseNetブランチを通じて高解像度のローカル機能をキャプチャし、微細な構造的キューを保存し、効果的な勾配流を可能にする。
提案されたDense SwinV2の分類精度は98.02パーセントで、F1スコアは97.81パーセントであり、確立された畳み込みモデルやトランスフォーマーモデルよりも優れていた。
- 参考スコア(独自算出の注目度): 0.7857499581522376
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This work presents a new Hybrid Dense SwinV2, a two-branch framework that jointly leverages densely connected convolutional features and hierarchical customized Swin Transformer V2 (SwinV2) representations for cassava disease classification. The proposed framework captures high resolution local features through its DenseNet branch, preserving the fine structural cues and also allowing for effective gradient flow. Concurrently, the customized SwinV2 models global contextual dependencies through the idea of shifted-window self attention, which enables the capture of long range interactions critical in distinguishing between visually similar lesions. Moreover, an attention channel-squeeze module is employed for each CNN Transformer stream independently to emphasize discriminative disease related responses and suppress redundant or background driven activations. Finally, these discriminative channels are fused to achieve refined representations from the dense local and SwinV2 global correlated strengthened feature maps, respectively. The proposed Dense SwinV2 utilized a public cassava leaf disease dataset of 31000 images, comprised of five diseases, including brown streak, mosaic, green mottle, bacterial blight, and normal leaf conditions. The proposed Dense SwinV2 demonstrates a significant classification accuracy of 98.02 percent with an F1 score of 97.81 percent, outperforming well-established convolutional and transformer models. These results underline the fact that Hybrid Dense SwinV2 offers robustness and practicality in the field level diagnosis of cassava disease and real world challenges related to occlusion, noise, and complex backgrounds.
- Abstract(参考訳): この研究は、2分岐フレームワークであるHybrid Dense SwinV2を新たに発表した。これは、密結合した畳み込み特徴と階層的にカスタマイズされたSwin Transformer V2(SwinV2)表現を併用して、キャッサバ病の分類を行う。
提案するフレームワークは、DenseNetブランチを通じて高解像度のローカル機能をキャプチャし、微細な構造的キューを保存し、効果的な勾配流を可能にする。
同時に、カスタマイズされたSwinV2は、シフトウインドウの自己注意というアイデアを通じて、グローバルなコンテキスト依存をモデル化する。
さらに、CNNトランスフォーマーストリーム毎にアテンションチャネルキューズモジュールを独立して使用し、識別性疾患関連応答を強調し、冗長またはバックグラウンド駆動のアクティベーションを抑制する。
最後に、これらの識別チャネルを融合させて、密集局所およびSwinV2大域的相関強化特徴写像からの洗練された表現をそれぞれ達成する。
提案されたDense SwinV2は、ブラウンストリーク、モザイク、グリーンモトル、細菌の光、正常な葉の状態を含む5つの疾患からなる31000枚の画像からなる公共のカッサバ葉病データセットを使用していた。
提案されたDense SwinV2の分類精度は98.02パーセントで、F1スコアは97.81パーセントであり、確立された畳み込みモデルやトランスフォーマーモデルよりも優れていた。
これらの結果は、Hybrid Dense SwinV2が、カッサバ病の現場レベルでの診断と、閉塞、ノイズ、複雑な背景に関連する現実世界の課題において、堅牢性と実用性を提供するという事実を裏付けるものである。
関連論文リスト
- RSwinV2-MD: An Enhanced Residual SwinV2 Transformer for Monkeypox Detection from Skin Images [0.7857499581522376]
本稿では,RSwinV2 (Customized Residual SwinTransformerV2) と呼ばれるMpox診断のための深層学習手法を提案する。
このRSwinV2アプローチでは、入力画像を非重複パッチに分割し、シフトウィンドウを用いて処理し、これらのパッチに注意を払う。
RSwinV2はさらにSwinTransformerをベースとして開発され、トランスフォーマーのグローバルリンク機能を利用するためのパッチと位置埋め込みが含まれている。
論文 参考訳(メタデータ) (2026-01-05T06:57:26Z) - A Graph-Augmented knowledge Distillation based Dual-Stream Vision Transformer with Region-Aware Attention for Gastrointestinal Disease Classification with Explainable AI [0.06372261626436675]
本研究は,教師-学生の知識蒸留に基づくハイブリッド二流深層学習フレームワークを提案する。
教師のセマンティックな知識と形態的知識を継承するコンパクトなTiny-ViT構造として学生ネットワークが実装された。
主要なGI疾患クラスを含む2つの注意深くキュレートされたWireless Capsule Endoscopyデータセットを使用して、バランスの取れた表現を保証した。
論文 参考訳(メタデータ) (2025-12-24T07:51:54Z) - Hide-and-Seek Attribution: Weakly Supervised Segmentation of Vertebral Metastases in CT [68.09387763135236]
脊椎レベルの健康・悪性のラベルにのみ、病変マスクを伴わずに訓練を施した弱い指導方法を提案する。
マスクの監視がないにも関わらず,強い爆発・解析性能を達成する。
論文 参考訳(メタデータ) (2025-12-07T14:03:28Z) - PSScreen V2: Partially Supervised Multiple Retinal Disease Screening [6.181991548659357]
PSScreen V2は、複数の網膜疾患スクリーニングのための部分的に制御された自己学習フレームワークである。
ラベルの欠如とドメインシフトの課題に対処するため、異なる分布を持つ複数のラベル付きデータセットから学習する。
最先端の性能と優れたドメイン一般化能力を実現する。
論文 参考訳(メタデータ) (2025-10-26T09:09:52Z) - Seeing the Trees for the Forest: Rethinking Weakly-Supervised Medical Visual Grounding [45.248265283405004]
現在のモデルは、非効率な注意機構ときめ細かいトークン表現の欠如により、テキスト記述と病気領域を関連付けるのに苦労している。
本稿では、VLMの説明可能性マップを用いて、適切な画像特徴を識別する病原体認識プロンプト(DAP)を提案する。
DAPは3つの主要な胸部X線データセットの最先端手法と比較して、視覚的接地精度を20.74%向上させる。
論文 参考訳(メタデータ) (2025-05-21T05:16:45Z) - Boundary Guided Semantic Learning for Real-time COVID-19 Lung Infection
Segmentation System [69.40329819373954]
新型コロナウイルス(COVID-19)は、世界中の医療システムに悪影響を及ぼし続けている。
現段階では、新型コロナウイルスの診断と治療には、CT画像から肺感染症領域を自動的に分離することが不可欠である。
本稿では,境界案内型セマンティックラーニングネットワーク(BSNet)を提案する。
論文 参考訳(メタデータ) (2022-09-07T05:01:38Z) - Bilateral-ViT for Robust Fovea Localization [6.754429047600573]
本稿では,葉の内側と外側の情報を統合した視覚変換器(ViT)を提案する。
包括的実験により, 提案手法は疾患画像に対して有意に堅牢であることが示された。
論文 参考訳(メタデータ) (2021-10-19T11:26:04Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z) - Dual-Consistency Semi-Supervised Learning with Uncertainty
Quantification for COVID-19 Lesion Segmentation from CT Images [49.1861463923357]
CT画像を用いた半監視型COVID-19病変分割のための不確実性誘導型二重一貫性学習ネットワーク(UDC-Net)を提案する。
提案した UDC-Net は,Dice の完全教師方式を 6.3% 向上させ,他の競合的半監督方式を有意なマージンで上回っている。
論文 参考訳(メタデータ) (2021-04-07T16:23:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。