論文の概要: BB-GCN: A Bi-modal Bridged Graph Convolutional Network for Multi-label
Chest X-Ray Recognition
- arxiv url: http://arxiv.org/abs/2302.11082v1
- Date: Wed, 22 Feb 2023 01:03:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-23 16:34:39.204768
- Title: BB-GCN: A Bi-modal Bridged Graph Convolutional Network for Multi-label
Chest X-Ray Recognition
- Title(参考訳): BB-GCN:マルチラベル胸部X線認識のためのバイモーダルブリッジグラフ畳み込みネットワーク
- Authors: Guoli Wang, Pingping Wang, Jinyu Cong, Kunmeng Liu, Benzheng Wei
- Abstract要約: マルチラベル胸部X線(英語版)(CXR)認識は、異なる病理の複数のラベルを同時に診断し識別する。
従来の手法は、ローカルラベル情報をモデル化するために、状態変数の符号化とアテンションメカニズムに頼っていた。
Bi-modal Bridged Graph Convolutional Network (BB-GCN) モデルを提案する。
- 参考スコア(独自算出の注目度): 7.110986667249555
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-label chest X-ray (CXR) recognition involves simultaneously diagnosing
and identifying multiple labels for different pathologies. Since pathological
labels have rich information about their relationship to each other, modeling
the co-occurrence dependencies between pathological labels is essential to
improve recognition performance. However, previous methods rely on state
variable coding and attention mechanisms-oriented to model local label
information, and lack learning of global co-occurrence relationships between
labels. Furthermore, these methods roughly integrate image features and label
embedding, ignoring the alignment and compactness problems in cross-modal
vector fusion.To solve these problems, a Bi-modal Bridged Graph Convolutional
Network (BB-GCN) model is proposed. This model mainly consists of a backbone
module, a pathology Label Co-occurrence relationship Embedding (LCE) module,
and a Transformer Bridge Graph (TBG) module. Specifically, the backbone module
obtains image visual feature representation. The LCE module utilizes a graph to
model the global co-occurrence relationship between multiple labels and employs
graph convolutional networks for learning inference. The TBG module bridges the
cross-modal vectors more compactly and efficiently through the GroupSum
method.We have evaluated the effectiveness of the proposed BB-GCN in two
large-scale CXR datasets (ChestX-Ray14 and CheXpert). Our model achieved
state-of-the-art performance: the mean AUC scores for the 14 pathologies were
0.835 and 0.813, respectively.The proposed LCE and TBG modules can jointly
effectively improve the recognition performance of BB-GCN. Our model also
achieves satisfactory results in multi-label chest X-ray recognition and
exhibits highly competitive generalization performance.
- Abstract(参考訳): CXR(Multi-label chest X-ray)は、診断と診断を同時に行う。
病理ラベルは相互関係に関する豊富な情報を持っているため,認識性能を向上させるためには,病理ラベル間の共起依存性のモデル化が不可欠である。
しかしながら、以前の方法は、ローカルラベル情報をモデル化することを目的とした状態変数符号化と注意機構に依存しており、ラベル間のグローバルな共起関係の学習を欠いている。
さらに, クロスモーダルベクトル融合におけるアライメント問題やコンパクト性問題を無視して, 画像特徴とラベル埋め込みを大まかに統合し, これらの問題を解決するために, bi-modal bridged graph convolutional network (bb-gcn) モデルを提案する。
このモデルは、主にバックボーンモジュール、病理ラベル共起関係埋め込み(LCE)モジュール、トランスフォーマーブリッジグラフ(TBG)モジュールで構成されている。
具体的には、バックボーンモジュールが画像視覚特徴表現を取得する。
LCEモジュールはグラフを用いて複数のラベル間のグローバルな共起関係をモデル化し、グラフ畳み込みネットワークを用いて推論を学習する。
TBGモジュールは,グループSum法によりよりコンパクトかつ効率的にクロスモーダルベクトルをブリッジし,大規模CXRデータセット(ChestX-Ray14とCheXpert)におけるBB-GCNの有効性を評価した。
提案したLCEモジュールとTBGモジュールはBB-GCNの認識性能を効果的に向上させることができる。
また,マルチラベル胸部X線認識において良好な結果が得られ,高い競争力を持つ一般化性能を示す。
関連論文リスト
- Robust Pseudo-label Learning with Neighbor Relation for Unsupervised Visible-Infrared Person Re-Identification [33.50249784731248]
UVI-ReID (unsupervised Visible-Infrared Person Re-identification) は、視覚的および赤外線モダリティにまたがる歩行者像をアノテーションなしでマッチングすることを目的としている。
近年、擬似ラベル法はUSVI-ReIDにおいて主流となっているが、擬似ラベル法固有のノイズは大きな障害となる。
我々は,雑音の多い擬似ラベルを補正するRPNRフレームワークを設計する。
SYSU-MM01とRegDBの2つの広く知られているベンチマークで実施された総合的な実験は、RPNRが現在最先端のGURを平均で上回っていることを実証している。
論文 参考訳(メタデータ) (2024-05-09T08:17:06Z) - Semi-supervised Medical Image Segmentation Method Based on Cross-pseudo
Labeling Leveraging Strong and Weak Data Augmentation Strategies [2.8246591681333024]
本稿では,Fixmatch の概念を革新的に取り入れた半教師付きモデル DFCPS を提案する。
整合性学習と自己学習を統合したクロス擬似スーパービジョンが導入された。
我々のモデルは、ラベルなしデータの比率が異なる4つの区分全てにおいて、常に優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-17T13:07:44Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Correlation-Aware Mutual Learning for Semi-supervised Medical Image
Segmentation [5.045813144375637]
既存の半教師付きセグメンテーション手法の多くは、ラベルのないデータから情報を取り出すことのみに焦点を当てている。
本稿では,ラベル付きデータを利用してラベル付きデータから情報を抽出する相関学習フレームワークを提案する。
提案手法は,CMA(Cross-sample Mutual Attention Module)とOCC(Omni-Correlation Consistency Module)の2つのモジュールを組み込んだ相互学習戦略に基づいている。
論文 参考訳(メタデータ) (2023-07-12T17:20:05Z) - Efficient Bilateral Cross-Modality Cluster Matching for Unsupervised Visible-Infrared Person ReID [56.573905143954015]
本稿では, クラスタ間マッチングによるモダリティギャップを低減するための, クラスタマッチングに基づく新たな学習フレームワークを提案する。
このような監視信号の下では、クラスタレベルで特徴を協調的に整列させるために、モダリティ・特定・モダリティ・非依存(MSMA)コントラスト学習フレームワークが提案されている。
公開SYSU-MM01とRegDBデータセットの実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-05-22T03:27:46Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - CaEGCN: Cross-Attention Fusion based Enhanced Graph Convolutional
Network for Clustering [51.62959830761789]
クロスアテンションに基づくディープクラスタリングフレームワークCross-Attention Fusion based Enhanced Graph Convolutional Network (CaEGCN)を提案する。
CaEGCNには、クロスアテンション融合、Content Auto-Encoder、Graph Convolutional Auto-Encoder、および自己監視モデルという4つの主要なモジュールが含まれている。
異なるタイプのデータセットに対する実験結果は、提案したCaEGCNの優位性とロバスト性を証明する。
論文 参考訳(メタデータ) (2021-01-18T05:21:59Z) - Attention-Driven Dynamic Graph Convolutional Network for Multi-Label
Image Recognition [53.17837649440601]
本稿では,各画像の特定のグラフを動的に生成するアテンション駆動型動的グラフ畳み込みネットワーク(ADD-GCN)を提案する。
パブリックなマルチラベルベンチマーク実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-12-05T10:10:12Z) - Instance-Aware Graph Convolutional Network for Multi-Label
Classification [55.131166957803345]
グラフ畳み込みニューラルネットワーク(GCN)は、マルチラベル画像認識タスクを効果的に強化した。
マルチラベル分類のための事例対応グラフ畳み込みニューラルネットワーク(IA-GCN)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-19T12:49:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。