論文の概要: PneumoLLM: Harnessing the Power of Large Language Model for
Pneumoconiosis Diagnosis
- arxiv url: http://arxiv.org/abs/2312.03490v2
- Date: Fri, 8 Dec 2023 08:32:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-11 12:26:16.586408
- Title: PneumoLLM: Harnessing the Power of Large Language Model for
Pneumoconiosis Diagnosis
- Title(参考訳): 気腫 : 大言語モデルの力を利用した気腫症の診断
- Authors: Meiyue Song, Zhihua Yu, Jiaxin Wang, Jiarui Wang, Yuting Lu, Baicun
Li, Xiaoxu Wang, Qinghua Huang, Zhijun Li, Nikolaos I.Kanellakis, Jiangfeng
Liu, Jing Wang, Binglu Wang, Juntao Yang
- Abstract要約: 大規模言語モデル(LLM)は対話において複数のタスクを実行する際、前例のない能力を示す。
学習可能なパラメータの少ない診断において,LSMを効果的に活用する手法を提案する。
本稿では,コンテキスト型マルチトークンエンジンと情報エミッタモジュールを紹介する。
- 参考スコア(独自算出の注目度): 17.287768854699685
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The conventional pretraining-and-finetuning paradigm, while effective for
common diseases with ample data, faces challenges in diagnosing data-scarce
occupational diseases like pneumoconiosis. Recently, large language models
(LLMs) have exhibits unprecedented ability when conducting multiple tasks in
dialogue, bringing opportunities to diagnosis. A common strategy might involve
using adapter layers for vision-language alignment and diagnosis in a dialogic
manner. Yet, this approach often requires optimization of extensive learnable
parameters in the text branch and the dialogue head, potentially diminishing
the LLMs' efficacy, especially with limited training data. In our work, we
innovate by eliminating the text branch and substituting the dialogue head with
a classification head. This approach presents a more effective method for
harnessing LLMs in diagnosis with fewer learnable parameters. Furthermore, to
balance the retention of detailed image information with progression towards
accurate diagnosis, we introduce the contextual multi-token engine. This engine
is specialized in adaptively generating diagnostic tokens. Additionally, we
propose the information emitter module, which unidirectionally emits
information from image tokens to diagnosis tokens. Comprehensive experiments
validate the superiority of our methods and the effectiveness of proposed
modules. Our codes can be found at
https://github.com/CodeMonsterPHD/PneumoLLM/tree/main.
- Abstract(参考訳): 従来のプレトレーニングとファインタニングのパラダイムは、十分なデータを持つ一般的な疾患に対して有効であるが、肺炎のようなデータスカースな職業疾患の診断における課題に直面している。
近年,大規模言語モデル (LLM) は対話における複数のタスクの実行において前例のない能力を示し,診断の機会をもたらしている。
一般的な戦略は、視覚言語によるアライメントと診断にアダプタ層を使用することである。
しかし、このアプローチでは、テキストブランチと対話ヘッドの広範な学習可能なパラメータの最適化が必要となり、特に限られたトレーニングデータではllmsの有効性が低下する可能性がある。
本研究では,テキスト分岐を除去し,対話ヘッドを分類ヘッドで置換することで革新を行う。
本手法は, 学習可能なパラメータが少ない診断において, LLMを効果的に活用する方法を提案する。
さらに, 詳細な画像情報の保持と正確な診断に向けた進捗のバランスをとるため, コンテクストマルチトケンエンジンを導入する。
このエンジンは、適応的に診断トークンを生成する。
さらに,画像トークンから診断トークンへ一方向的に情報を発信する情報エミッタモジュールを提案する。
総合実験により提案手法の優位性と提案モジュールの有効性が検証された。
私たちのコードはhttps://github.com/CodeMonsterPHD/PneumoLLM/tree/mainで確認できます。
関連論文リスト
- FOCUS: Knowledge-enhanced Adaptive Visual Compression for Few-shot Whole Slide Image Classification [4.148491257542209]
少ないショット学習は、計算病理学における癌診断の重要な解決策である。
このパラダイムにおける重要な課題は、スライド画像全体(WSI)の限られたトレーニングセットと膨大な数のパッチとの間の固有の相違に起因する。
我々は、診断関連領域の集中分析を可能にするために、知識強化型適応型視覚圧縮フレームワーク、FOCUSを紹介した。
論文 参考訳(メタデータ) (2024-11-22T05:36:38Z) - Mitigating Hallucinations of Large Language Models in Medical Information Extraction via Contrastive Decoding [92.32881381717594]
医療情報抽出タスクにおける幻覚の問題を解決するために,ALCD(ALternate Contrastive Decoding)を導入する。
ALCDは, 従来の復号法に比べて幻覚の解消に有意な改善が見られた。
論文 参考訳(メタデータ) (2024-10-21T07:19:19Z) - RaDialog: A Large Vision-Language Model for Radiology Report Generation
and Conversational Assistance [53.20640629352422]
会話型AIツールは、所定の医療画像に対して臨床的に正しい放射線学レポートを生成し、議論することができる。
RaDialogは、ラジオロジーレポート生成と対話ダイアログのための、初めて徹底的に評価され、公開された大きな視覚言語モデルである。
本手法は,報告生成における最先端の臨床的正確性を実現し,報告の修正や質問への回答などのインタラクティブなタスクにおいて,印象的な能力を示す。
論文 参考訳(メタデータ) (2023-11-30T16:28:40Z) - Deep Reinforcement Learning Framework for Thoracic Diseases
Classification via Prior Knowledge Guidance [49.87607548975686]
関連疾患に対するラベル付きデータの不足は、正確な診断にとって大きな課題となる。
本稿では,診断エージェントの学習を指導するための事前知識を導入する,新しい深層強化学習フレームワークを提案する。
提案手法の性能はNIHX-ray 14とCheXpertデータセットを用いて実証した。
論文 参考訳(メタデータ) (2023-06-02T01:46:31Z) - Meta Learning for Few-Shot Medical Text Classification [1.2617078020344619]
ベンチマークテキストと医療データの幅広いコーパスにおけるメタラーニングとロバストネス技術の利用について検討する。
テキストによるメタラーニングはテキストベースのデータに適したフレームワークであり、より優れたデータ効率と、少数ショット言語モデルに匹敵するパフォーマンスを提供する。
論文 参考訳(メタデータ) (2022-12-03T06:46:52Z) - Scalable Online Disease Diagnosis via Multi-Model-Fused Actor-Critic
Reinforcement Learning [9.274138493400436]
医療のアドバイスをオンラインで求めている人にとっては、患者と対話して自動的に疾患を診断できるAIベースの対話エージェントが有効な選択肢だ。
これは、強化学習(RL)アプローチを自然解として提案した逐次的特徴(症状)選択と分類の問題として定式化することができる。
生成的アクターネットワークと診断批評家ネットワークから構成されるMMF-AC(Multi-Model-Fused Actor-Critic)フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-08T03:06:16Z) - MMLN: Leveraging Domain Knowledge for Multimodal Diagnosis [10.133715767542386]
肺疾患診断のための知識駆動型およびデータ駆動型フレームワークを提案する。
本研究は, 臨床医学ガイドラインに従って診断規則を定式化し, テキストデータから規則の重みを学習する。
テキストと画像データからなるマルチモーダル融合は、肺疾患の限界確率を推定するために設計されている。
論文 参考訳(メタデータ) (2022-02-09T04:12:30Z) - Detecting Dementia from Speech and Transcripts using Transformers [0.0]
アルツハイマー病(英語: Alzheimer's disease, AD)は、治療法がないため早期に診断されない場合、日常生活に深刻な影響を与える神経変性疾患である。
現在の研究は、自然発声から認知症を診断することに焦点を当てている。
論文 参考訳(メタデータ) (2021-10-27T21:00:01Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z) - Graph-Evolving Meta-Learning for Low-Resource Medical Dialogue
Generation [150.52617238140868]
ソース疾患からターゲット疾患へ診断経験を移すために、低リソースの医療対話生成を提案します。
また,新しい疾患の症状相関を推論するためのコモンセンスグラフの進化を学習するグラフ進化メタラーニングフレームワークを開発した。
論文 参考訳(メタデータ) (2020-12-22T13:20:23Z) - Hierarchical Reinforcement Learning for Automatic Disease Diagnosis [52.111516253474285]
政策学習のための対話システムに2段階の階層的な政策構造を統合することを提案する。
提案した政策構造は,多くの疾患や症状を含む診断問題に対処することができる。
論文 参考訳(メタデータ) (2020-04-29T15:02:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。