論文の概要: CGF-DETR: Cross-Gated Fusion DETR for Enhanced Pneumonia Detection in Chest X-rays
- arxiv url: http://arxiv.org/abs/2511.01730v2
- Date: Tue, 04 Nov 2025 10:11:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:27.329363
- Title: CGF-DETR: Cross-Gated Fusion DETR for Enhanced Pneumonia Detection in Chest X-rays
- Title(参考訳): CGF-DETR:胸部X線による肺炎検出のためのクロスゲート核融合型DETR
- Authors: Yefeng Wu, Yuchen Song, Ling Wu, Shan Wan, Yecheng Zhao,
- Abstract要約: CGF-DETRは、肺炎検出に特化した拡張リアルタイム検出変換器である。
背骨にXFABlockを導入し、CSPアーキテクチャと統合された畳み込みアテンション機構によるマルチスケール特徴抽出を改善する。
本研究では,標準的なマルチヘッドアテンションを動的ゲーティング機構とシングルヘッド自己アテンションに置き換えるSPGAモジュールを提案する。
- 参考スコア(独自算出の注目度): 5.006101181794508
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pneumonia remains a leading cause of morbidity and mortality worldwide, necessitating accurate and efficient automated detection systems. While recent transformer-based detectors like RT-DETR have shown promise in object detection tasks, their application to medical imaging, particularly pneumonia detection in chest X-rays, remains underexplored. This paper presents CGF-DETR, an enhanced real-time detection transformer specifically designed for pneumonia detection. We introduce XFABlock in the backbone to improve multi-scale feature extraction through convolutional attention mechanisms integrated with CSP architecture. To achieve efficient feature aggregation, we propose SPGA module that replaces standard multi-head attention with dynamic gating mechanisms and single-head self-attention. Additionally, GCFC3 is designed for the neck to enhance feature representation through multi-path convolution fusion while maintaining real-time performance via structural re-parameterization. Extensive experiments on the RSNA Pneumonia Detection dataset demonstrate that CGF-DETR achieves 82.2% mAP@0.5, outperforming the baseline RT-DETR-l by 3.7% while maintaining comparable inference speed at 48.1 FPS. Our ablation studies confirm that each proposed module contributes meaningfully to the overall performance improvement, with the complete model achieving 50.4% mAP@[0.5:0.95]
- Abstract(参考訳): 肺炎は世界中で致死率と死亡率の主要な原因であり、正確かつ効率的な自動検出システムを必要としている。
RT-DETRのような最近のトランスフォーマーベースの検出器は、物体検出タスクにおいて有望であることを示しているが、医療画像、特に胸部X線における肺炎検出への応用は、いまだ研究されていない。
本稿では,CGF-DETR(CGF-DETR)について述べる。
背骨にXFABlockを導入し、CSPアーキテクチャと統合された畳み込みアテンション機構によるマルチスケール特徴抽出を改善する。
効率的な特徴集約を実現するために,標準的なマルチヘッドアテンションを動的ゲーティング機構とシングルヘッド自己アテンションに置き換えるSPGAモジュールを提案する。
さらに、GCFC3は、構造的再パラメータ化によるリアルタイム性能を維持しながら、マルチパス畳み込み融合による特徴表現を強化するために設計されている。
RSNA肺炎検出データセットの大規模な実験により、CGF-DETRは82.2%のmAP@0.5を達成し、ベースラインRT-DETR-lを3.7%上回った。
我々のアブレーション研究は,提案モジュールが50.4%のmAP@[0.5:0.95]を達成し,全体的な性能向上に有意な貢献をすることを確認した。
関連論文リスト
- Enhancing ECG Classification Robustness with Lightweight Unsupervised Anomaly Detection Filters [39.9470953186283]
ウェアラブルを用いた連続心電図(ECG)モニタリングは、早期心血管疾患(CVD)検出に有意な可能性を秘めている。
リソース制約のある環境での自動分析のためのディープラーニングモデルをデプロイすることは、アウト・オブ・ディストリビューション(Out-of-Distribution)データによる信頼性上の課題に直面します。
本稿では,非教師付き異常検出(UAD)を,ロバスト性向上のための独立な上流フィルタリング機構として検討する。
論文 参考訳(メタデータ) (2025-10-30T13:54:37Z) - RT-DETRv4: Painlessly Furthering Real-Time Object Detection with Vision Foundation Models [48.91205564876609]
軽量物体検出器の高効率化を目的とした,コスト効率・高適合性蒸留フレームワークを提案する。
当社のアプローチは、さまざまなDETRベースのモデルに対して、目立って一貫したパフォーマンス向上を実現しています。
我々の新しいモデルファミリーRT-DETRv4はCOCOの最先端結果を達成し、APスコアは49.7/53.5/55.4/57.0で、対応する速度は273/169/124/78 FPSである。
論文 参考訳(メタデータ) (2025-10-29T08:13:17Z) - Source-Free Object Detection with Detection Transformer [59.33653163035064]
Source-Free Object Detection (SFOD) は、ソースデータにアクセスすることなく、ソースドメインから教師なしのターゲットドメインへの知識転送を可能にする。
ほとんどの既存のSFODアプローチは、より高速なR-CNNのような従来のオブジェクト検出(OD)モデルに限られるか、新しいODアーキテクチャ、特に検出変換器(DETR)に適合しない一般的なソリューションとして設計されている。
本稿では,DTRのクエリ中心の機能強化を特化して設計された新しいSFODフレームワークであるFeature Reweighting ANd Contrastive Learning NetworK(FRANCK)を紹介する。
論文 参考訳(メタデータ) (2025-10-13T07:35:04Z) - CPLOYO: A Pulmonary Nodule Detection Model with Multi-Scale Feature Fusion and Nonlinear Feature Learning [8.128072264076822]
多型検出は、肺がん全体の検出率の向上と治療率の向上に寄与する。
高感度の結節検出を実現するため、YOLOv8モデルにターゲット改良が加えられた。
C2f_RepViTCAMFモジュールは、バックボーン内のC2fモジュールを増強するために導入された。
MSCAFモジュールはモデルの特徴融合部を再構築するために組み込まれた。
論文 参考訳(メタデータ) (2025-03-13T04:51:57Z) - Frequency Domain Enhanced U-Net for Low-Frequency Information-Rich Image Segmentation in Surgical and Deep-Sea Exploration Robots [34.28684917337352]
CNNと人間の視覚系における周波数帯域感度の差について検討する。
本稿では、生体視覚機構にインスパイアされたウェーブレット適応スペクトル融合(WASF)法を提案する。
我々は SAM2 のバックボーンネットワークを利用する FE-UNet モデルを開発し, セグメンテーション精度を確保するために細調整した Hiera-Large モジュールを組み込んだ。
論文 参考訳(メタデータ) (2025-02-06T07:24:34Z) - RespDiff: An End-to-End Multi-scale RNN Diffusion Model for Respiratory Waveform Estimation from PPG Signals [3.306437812367815]
PPG信号からの呼吸波形推定のためのエンドツーエンドマルチスケールRNNモデルであるRespDiffを提案する。
モデルはマルチスケールエンコーダを使用し、異なる解像度で特徴を抽出し、双方向RNNを使用してPSG信号を処理し、呼吸波形を抽出する。
BIDMCデータセットで行った実験では、RespDiffはRR推定の1.18bpmの平均絶対誤差(MAE)を達成し、先行研究よりも優れていた。
論文 参考訳(メタデータ) (2024-10-06T05:54:49Z) - Efficient and Accurate Pneumonia Detection Using a Novel Multi-Scale Transformer Approach [0.7183613290627339]
肺炎検出のための新しいマルチスケールトランスフォーマー手法を提案する。
本手法は肺の分節と分類を統一的な枠組みに統合する。
我々の手法は、"Kermany"データセットで93.75%の精度、"Cohen"データセットで96.04%の精度を実現している。
論文 参考訳(メタデータ) (2024-08-08T08:06:42Z) - Recurrent Glimpse-based Decoder for Detection with Transformer [85.64521612986456]
本稿では,Recurrent Glimpse-based deoder (REGO)について紹介する。
特に、REGOは多段階のリカレント処理構造を用いて、DETRの注目が徐々に前景オブジェクトに焦点を合わせるのを助ける。
REGOは、異なるDETR検出器の性能を最大7%向上させる。
論文 参考訳(メタデータ) (2021-12-09T00:29:19Z) - SCPM-Net: An Anchor-free 3D Lung Nodule Detection Network using Sphere
Representation and Center Points Matching [47.79483848496141]
3次元球面表現に基づく中心点マッチング検出ネットワーク(SCPM-Net)を提案する。
アンカーフリーで、nodule/anchorパラメータを手動で設計することなく、nodulesの位置、半径、オフセットを自動的に予測する。
提案するSCPM-Netフレームワークは,既存のアンカーベースおよびアンカーフリーの肺結節検出法と比較して,優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2021-04-12T05:51:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。