論文の概要: Reinforced Medical Report Generation with X-Linear Attention and
Repetition Penalty
- arxiv url: http://arxiv.org/abs/2011.07680v1
- Date: Mon, 16 Nov 2020 01:44:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-24 23:22:29.556732
- Title: Reinforced Medical Report Generation with X-Linear Attention and
Repetition Penalty
- Title(参考訳): X線留置と繰り返し罰を併用した強化医療報告
- Authors: Wenting Xu, Chang Qi, Zhenghua Xu and Thomas Lukasiewicz
- Abstract要約: 我々は,x線的注意と繰り返しペナルティ機構を備えた強化医療報告生成ソリューションを提案する。
x-線型アテンションモジュールは高次特徴相互作用を探索し、マルチモーダル推論を実現するために使用される。
ReMRG-XRは、すべての指標において最先端のベースラインを大幅に上回る。
- 参考スコア(独自算出の注目度): 46.51332238677608
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To reduce doctors' workload, deep-learning-based automatic medical report
generation has recently attracted more and more research efforts, where
attention mechanisms and reinforcement learning are integrated with the classic
encoder-decoder architecture to enhance the performance of deep models.
However, these state-of-the-art solutions mainly suffer from two shortcomings:
(i) their attention mechanisms cannot utilize high-order feature interactions,
and (ii) due to the use of TF-IDF-based reward functions, these methods are
fragile with generating repeated terms. Therefore, in this work, we propose a
reinforced medical report generation solution with x-linear attention and
repetition penalty mechanisms (ReMRG-XR) to overcome these problems.
Specifically, x-linear attention modules are used to explore high-order feature
interactions and achieve multi-modal reasoning, while repetition penalty is
used to apply penalties to repeated terms during the model's training process.
Extensive experimental studies have been conducted on two public datasets, and
the results show that ReMRG-XR greatly outperforms the state-of-the-art
baselines in terms of all metrics.
- Abstract(参考訳): 近年,医師の負担を軽減するため,深層学習に基づく自動医療レポート生成は,注目機構と強化学習を従来のエンコーダ・デコーダアーキテクチャに統合し,深層モデルの性能向上に寄与する研究努力が増えている。
しかし、これらの最先端のソリューションは主に2つの欠点に悩まされている。
(i)その注意機構は高次特徴相互作用を利用することができず、
(II)TF-IDFに基づく報酬関数を用いることで、繰り返し項を生成すると脆弱である。
そこで本研究では,これらの問題を克服するために,X線的注意と繰り返しペナルティ機構(ReMRG-XR)を備えた強化医療報告生成ソリューションを提案する。
特に、x-線形注意モジュールは高階特徴の相互作用を探索し、マルチモーダル推論を達成するのに使われ、反復ペナルティはモデルのトレーニングプロセス中に繰り返しの項にペナルティを適用するために使用される。
2つの公開データセットに関する広範な実験研究が行われており、remrg-xrがすべてのメトリクスで最先端のベースラインを大きく上回っていることが示されている。
関連論文リスト
- FgC2F-UDiff: Frequency-guided and Coarse-to-fine Unified Diffusion Model for Multi-modality Missing MRI Synthesis [6.475175425060296]
我々は、周波数誘導および粗粒拡散モデル(FgC2F-UDiff)という新しい統合合成モデルを提案する。
論文 参考訳(メタデータ) (2025-01-07T04:42:45Z) - A Multi-Resolution Mutual Learning Network for Multi-Label ECG Classification [11.105845244103506]
本稿では,Multi-Resolution Mutual Learning Network (MRM-Net)を提案する。
MRM-Netはデュアルレゾリューションアテンションアーキテクチャと機能補完機構を備えている。
マルチラベルのECG分類性能において、既存の手法よりも大幅に優れています。
論文 参考訳(メタデータ) (2024-06-12T13:40:03Z) - Bag of Tricks for Long-Tailed Multi-Label Classification on Chest X-Rays [40.11576642444264]
本報告では,ICCV CVAMD 2023 CXR-LT コンペティションにおけるソリューションの概要について述べる。
我々は,CXR診断の有効性を,いくつかの先進的な設計を統合することで実証的に検討した。
私たちのフレームワークは最終的に、競争テストセットで0.349 mAPを獲得し、トップ5にランクインしました。
論文 参考訳(メタデータ) (2023-08-17T08:25:55Z) - Learning Through Guidance: Knowledge Distillation for Endoscopic Image
Classification [40.366659911178964]
内視鏡は消化管(GI)の根底にある異常を同定する上で重要な役割を担っている。
ディープラーニング、特にCNN(Convolution Neural Networks)は、従来の機能エンジニアリングを使わずに自動機能学習を実行するように設計されている。
KDに基づく3つの学習フレームワーク、応答ベース、特徴ベース、関係ベースメカニズムについて検討し、関係ベース学習を支援するために、新しい多面的注意型特徴融合機構を導入する。
論文 参考訳(メタデータ) (2023-08-17T02:02:11Z) - Semantic Latent Space Regression of Diffusion Autoencoders for Vertebral
Fracture Grading [72.45699658852304]
本稿では,教師なし特徴抽出器として生成拡散オートエンコーダモデルを訓練するための新しい手法を提案する。
フラクチャーグレーディングを連続回帰としてモデル化し, フラクチャーのスムーズな進行を反映した。
重要なことに,本手法の創成特性は,与えられた脊椎の様々な段階を可視化し,自動グルーピングに寄与する特徴を解釈し,洞察することを可能にする。
論文 参考訳(メタデータ) (2023-03-21T17:16:01Z) - Cross-Modal Causal Intervention for Medical Report Generation [109.83549148448469]
医療報告生成(MRG)は、コンピュータ支援診断と治療指導に不可欠である。
視覚的および言語的バイアスによって引き起こされる画像テキストデータ内の素早い相関のため、病変領域を確実に記述した正確なレポートを生成することは困難である。
本稿では,視覚分解モジュール (VDM) と言語分解モジュール (LDM) からなるMRGのための新しい視覚言語因果干渉 (VLCI) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-16T07:23:55Z) - Hybrid Reinforced Medical Report Generation with M-Linear Attention and
Repetition Penalty [45.92216112110279]
そこで本研究では,m-linear attentionと繰り返しペナルティ機構を備えたハイブリッド型医療報告生成手法を提案する。
具体的には、異なる重みを持つハイブリッド報酬を用いて、シングルメトリックベースの報酬の制限を緩和する。
また,最適な重みの組み合わせを近似するために,線形複雑度をもつ探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-14T15:27:34Z) - Factored Attention and Embedding for Unstructured-view Topic-related
Ultrasound Report Generation [70.7778938191405]
本研究では,非構造的トピック関連超音波レポート生成のための新しい因子的注意・埋め込みモデル(FAE-Gen)を提案する。
提案したFAE-Genは主に2つのモジュール、すなわちビュー誘導因子の注意とトピック指向因子の埋め込みから構成されており、異なるビューで均質および不均一な形態的特徴を捉えている。
論文 参考訳(メタデータ) (2022-03-12T15:24:03Z) - Untangling tradeoffs between recurrence and self-attention in neural
networks [81.30894993852813]
本稿では,再帰的ネットワークにおける自己注意が勾配伝播に与える影響を公式に分析する。
長期的な依存関係を捉えようとするとき、勾配をなくすことの問題を緩和することを証明する。
本稿では,スパース自己アテンションを反復的にスケーラブルに利用するための関連性スクリーニング機構を提案する。
論文 参考訳(メタデータ) (2020-06-16T19:24:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。