論文の概要: MGA: Medical generalist agent through text-guided knowledge
transformation
- arxiv url: http://arxiv.org/abs/2303.08562v1
- Date: Wed, 15 Mar 2023 12:28:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-16 14:01:53.944103
- Title: MGA: Medical generalist agent through text-guided knowledge
transformation
- Title(参考訳): mga : テキスト案内知識変換による医療ジェネラリストエージェント
- Authors: Weijian Huang, Hao Yang, Cheng Li, Mingtong Dai, Rui Yang, Shanshan
Wang
- Abstract要約: 本稿では,3種類の共通臨床課題に対処できる新しい医用ジェネラリストエージェントであるMGAを提案する。
既存のメソッドとは異なり、MGAは対応するアノテーションが欠落している場合に特定の下流ブランチなしで、さまざまなタスクに容易に適応できる。
我々は,医療専門家の言語指導を伝達媒体として利用し,エージェントの行動指導を行う最初の試みである。
- 参考スコア(独自算出の注目度): 21.151898451246062
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-modal representation methods have achieved advanced performance in
medical applications by extracting more robust features from multi-domain data.
However, existing methods usually need to train additional branches for
downstream tasks, which may increase the model complexities in clinical
applications as well as introduce additional human inductive bias. Besides,
very few studies exploit the rich clinical knowledge embedded in clinical daily
reports. To this end, we propose a novel medical generalist agent, MGA, that
can address three kinds of common clinical tasks via clinical reports knowledge
transformation. Unlike the existing methods, MGA can easily adapt to different
tasks without specific downstream branches when their corresponding annotations
are missing. More importantly, we are the first attempt to use medical
professional language guidance as a transmission medium to guide the agent's
behavior. The proposed method is implemented on four well-known X-ray
open-source datasets, MIMIC-CXR, CheXpert, MIMIC-CXR-JPG, and MIMIC-CXR-MS.
Promising results are obtained, which validate the effectiveness of our
proposed MGA. Code is available at: https://github.com/SZUHvern/MGA
- Abstract(参考訳): マルチモーダル表現法は、マルチドメインデータからより堅牢な特徴を抽出することにより、医療応用における高度な性能を実現している。
しかし、既存の手法では、通常、下流タスクのために追加のブランチを訓練する必要があるため、臨床応用におけるモデルの複雑さが増大し、追加の人為的帰納バイアスがもたらされる可能性がある。
さらに、臨床報告に埋め込まれた豊富な臨床知識を活用する研究はほとんどない。
そこで本研究では,臨床報告の知識転換を通じて,3種類の共通臨床課題に対処できる新しい医療ジェネリストエージェントであるMGAを提案する。
既存のメソッドとは異なり、MGAは対応するアノテーションが欠けている場合に特定の下流ブランチなしで、さまざまなタスクに容易に適応できる。
さらに重要なことに、我々は医療専門家の言語指導を伝達媒体として使用し、エージェントの行動を誘導する最初の試みである。
提案手法は,MIMIC-CXR,CheXpert,MIMIC-CXR-JPG,MIMIC-CXR-MSの4つのオープンソースデータセット上に実装されている。
その結果,提案したMGAの有効性が検証された。
コードは、https://github.com/SZUHvern/MGAで入手できる。
関連論文リスト
- Natural Language-Assisted Multi-modal Medication Recommendation [97.07805345563348]
NLA-MMR(Natural Language-Assisted Multi-modal Medication Recommendation)を紹介する。
NLA-MMRは、患者視点から知識を学習し、医薬視点を共同で学習するために設計されたマルチモーダルアライメントフレームワークである。
本稿では,プレトレーニング言語モデル(PLM)を用いて,患者や医薬品に関するドメイン内知識を抽出する。
論文 参考訳(メタデータ) (2025-01-13T09:51:50Z) - Medchain: Bridging the Gap Between LLM Agents and Clinical Practice through Interactive Sequential Benchmarking [58.25862290294702]
臨床ワークフローの5つの重要な段階をカバーする12,163の臨床症例のデータセットであるMedChainを提示する。
フィードバック機構とMCase-RAGモジュールを統合したAIシステムであるMedChain-Agentも提案する。
論文 参考訳(メタデータ) (2024-12-02T15:25:02Z) - Medical Report Generation Is A Multi-label Classification Problem [38.64929236412092]
本稿では,医療報告生成を多ラベル分類問題として再考する。
機密鍵ノードと統合されたBLIPに基づく新たなレポート生成フレームワークを提案する。
我々の実験は、キーノードの活用が2つのベンチマークデータセットにまたがる既存のアプローチを越え、最先端(SOTA)のパフォーマンスを実現することを実証している。
論文 参考訳(メタデータ) (2024-08-30T20:43:35Z) - Med-MoE: Mixture of Domain-Specific Experts for Lightweight Medical Vision-Language Models [17.643421997037514]
差別的, 生成的両マルチモーダル医療課題に対処する新しい枠組みを提案する。
Med-MoEの学習は、マルチモーダル医療アライメント、命令チューニングとルーティング、ドメイン固有のMoEチューニングの3つのステップで構成されている。
我々のモデルは最先端のベースラインに匹敵する性能を達成できる。
論文 参考訳(メタデータ) (2024-04-16T02:35:17Z) - REALM: RAG-Driven Enhancement of Multimodal Electronic Health Records
Analysis via Large Language Models [19.62552013839689]
既存のモデルは、しばしば臨床上の課題に医学的文脈を欠いているため、外部知識の組み入れが促される。
本稿では、マルチモーダルEHR表現を強化するためのRAG(Retrieval-Augmented Generation)駆動フレームワークREALMを提案する。
MIMIC-III 死亡率と可読化タスクに関する実験は,ベースラインよりもREALM フレームワークの優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-10T18:27:28Z) - Towards Generalist Biomedical AI [28.68106423175678]
我々は,汎用バイオメディカルAIシステムの概念実証であるMed-PaLM Multimodal(Med-PaLM M)を紹介する。
Med-PaLM Mは、バイオメディカルデータを柔軟にエンコードし解釈する大規模なマルチモーダル生成モデルである。
モデル生成(およびヒト)胸部X線検査の放射線学的評価を行い, モデルスケールでの性能向上を観察した。
論文 参考訳(メタデータ) (2023-07-26T17:52:22Z) - Towards Medical Artificial General Intelligence via Knowledge-Enhanced
Multimodal Pretraining [121.89793208683625]
医療人工知能(MAGI)は、1つの基礎モデルで異なる医療課題を解くことができる。
我々は、Micical-knedge-enhanced mulTimOdal pretRaining (motoR)と呼ばれる新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-04-26T01:26:19Z) - Cross-modal Clinical Graph Transformer for Ophthalmic Report Generation [116.87918100031153]
眼科報告生成(ORG)のためのクロスモーダルな臨床グラフ変換器(CGT)を提案する。
CGTは、デコード手順を駆動する事前知識として、臨床関係を視覚特徴に注入する。
大規模FFA-IRベンチマークの実験は、提案したCGTが従来のベンチマーク手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-06-04T13:16:30Z) - Scientific Language Models for Biomedical Knowledge Base Completion: An
Empirical Study [62.376800537374024]
我々は,KG の完成に向けた科学的 LM の研究を行い,生物医学的リンク予測を強化するために,その潜在知識を活用できるかどうかを探る。
LMモデルとKG埋め込みモデルを統合し,各入力例をいずれかのモデルに割り当てることを学ぶルータ法を用いて,性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-17T17:55:33Z) - SumGNN: Multi-typed Drug Interaction Prediction via Efficient Knowledge
Graph Summarization [64.56399911605286]
本稿では,サブグラフ抽出モジュールによって実現された知識要約グラフニューラルネットワークSumGNNを提案する。
SumGNNは5.54%まで最高のベースラインを上回り、データ関係の低いタイプでは特にパフォーマンスの向上が顕著である。
論文 参考訳(メタデータ) (2020-10-04T00:14:57Z) - Multi-Perspective Semantic Information Retrieval in the Biomedical
Domain [0.0]
情報検索(Information Retrieval、IR)とは、特定のクエリやニーズに関連するデータ(ドキュメントなど)を取得するタスクである。
現代のニューラルアプローチは、古典的なアプローチと比べて一定の利点がある。
この研究は、バイオメディカルセマンティック情報検索ドメインのいくつかの側面に貢献する。
論文 参考訳(メタデータ) (2020-07-17T21:05:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。