論文の概要: Schema-Adaptive Tabular Representation Learning with LLMs for Generalizable Multimodal Clinical Reasoning
- arxiv url: http://arxiv.org/abs/2604.11835v1
- Date: Sun, 12 Apr 2026 07:19:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.013227
- Title: Schema-Adaptive Tabular Representation Learning with LLMs for Generalizable Multimodal Clinical Reasoning
- Title(参考訳): 一般化可能な多モード臨床推論のためのLLMを用いたスキーマ適応型タブラリ表現学習
- Authors: Hongxi Mao, Wei Zhou, Mengting Jia, Tao Fang, Huan Gao, Bin Zhang, Shangyang Li,
- Abstract要約: 本稿では,大規模言語モデル(LLM)を利用して,構造化変数の移動可能な埋め込みを生成する手法を提案する。
当社のアプローチでは,手作業による機能エンジニアリングや再トレーニングを必要とせずに,目に見えないスキーマ間のゼロショットアライメントを実現しています。
NACCとADNIデータセットの実験では、最先端のパフォーマンスと、目に見えないスキーマへのゼロショット転送が成功している。
- 参考スコア(独自算出の注目度): 17.319659567119768
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning for tabular data remains constrained by poor schema generalization, a challenge rooted in the lack of semantic understanding of structured variables. This challenge is particularly acute in domains like clinical medicine, where electronic health record (EHR) schemas vary significantly. To solve this problem, we propose Schema-Adaptive Tabular Representation Learning, a novel method that leverages large language models (LLMs) to create transferable tabular embeddings. By transforming structured variables into semantic natural language statements and encoding them with a pretrained LLM, our approach enables zero-shot alignment across unseen schemas without manual feature engineering or retraining. We integrate our encoder into a multimodal framework for dementia diagnosis, combining tabular and MRI data. Experiments on NACC and ADNI datasets demonstrate state-of-the-art performance and successful zero-shot transfer to unseen schemas, significantly outperforming clinical baselines, including board-certified neurologists, in retrospective diagnostic tasks. These results validate our LLM-driven approach as a scalable, robust solution for heterogeneous real-world data, offering a pathway to extend LLM-based reasoning to structured domains.
- Abstract(参考訳): 表形式のデータの機械学習は、構造化変数の意味的理解の欠如に根ざした、スキーマの一般化の貧弱さに制約されているままである。
この課題は、電子健康記録(EHR)スキーマが著しく異なる臨床医学のような分野において特に深刻である。
この問題を解決するために,大きな言語モデル(LLM)を活用して変換可能な表層埋め込みを生成する新しい手法であるSchema-Adaptive Tabular Representation Learningを提案する。
構造化された変数を意味のある自然言語文に変換し、事前訓練されたLLMで符号化することにより、手動による特徴工学や再訓練なしに、未知のスキーマ間のゼロショットアライメントを可能にする。
我々は,認知症診断のためのマルチモーダルフレームワークにエンコーダを統合する。
NACCおよびADNIデータセットの実験では、振り返り診断タスクにおいて、最先端のパフォーマンスとゼロショットのスキーマへの転送が成功し、ボード認証された神経科医を含む臨床ベースラインを著しく上回っている。
これらの結果は、LLMベースの推論を構造化ドメインに拡張するための経路を提供する、異種実世界のデータに対するスケーラブルで堅牢なソリューションとして、LLM駆動のアプローチを検証する。
関連論文リスト
- A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。
ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。
本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T18:48:21Z) - Unleashing the Power of Image-Tabular Self-Supervised Learning via Breaking Cross-Tabular Barriers [18.773799048193826]
CITabは、強力なマルチモーダルな特徴表現を多言語的に学習するように設計されている。
我々は3つの公開データコホートにまたがってアルツハイマー病診断タスクの評価を行った。
論文 参考訳(メタデータ) (2025-12-16T02:47:08Z) - CANDLE: A Cross-Modal Agentic Knowledge Distillation Framework for Interpretable Sarcopenia Diagnosis [3.0245458192729466]
CANDLEは、解釈可能性と性能のトレードオフを緩和し、予測精度を高め、高い決定一貫性を維持する。
このフレームワークは、TMLモデルの知識アセット化に対するスケーラブルなアプローチを提供し、サルコピアおよび潜在的に広い医療領域における解釈可能、再現可能、および臨床的に整合した意思決定支援を可能にする。
論文 参考訳(メタデータ) (2025-07-26T15:50:08Z) - SAFT: Structure-Aware Fine-Tuning of LLMs for AMR-to-Text Generation [50.277959544420455]
SAFTは、事前訓練された言語モデルにグラフトポロジーを注入する構造対応の微調整手法である。
変換されたAMRの磁気ラプラシアンから方向感応的な位置エンコーディングを計算する。
SAFTはAMR 3.0に新しい最先端を設定、ベースラインを3.5BLEU改善した。
論文 参考訳(メタデータ) (2025-07-15T18:12:57Z) - LLM-Symbolic Integration for Robust Temporal Tabular Reasoning [69.27153114778748]
本研究では,システムおよび制御された評価のための合成データセットであるTempTabQA-Cを紹介する。
この構造化アプローチにより、LLM(Large Language Models)はsqlクエリの生成と実行を可能にし、一般化とバイアス軽減の強化を行う。
論文 参考訳(メタデータ) (2025-06-06T05:14:04Z) - Mitigating Hallucinations of Large Language Models in Medical Information Extraction via Contrastive Decoding [92.32881381717594]
医療情報抽出タスクにおける幻覚の問題を解決するために,ALCD(ALternate Contrastive Decoding)を導入する。
ALCDは, 従来の復号法に比べて幻覚の解消に有意な改善が見られた。
論文 参考訳(メタデータ) (2024-10-21T07:19:19Z) - Small Models are LLM Knowledge Triggers on Medical Tabular Prediction [39.78560996984352]
小モデルを用いたシナジー学習による汎用的な自己プロンプト手法SERSALを提案する。
本研究は,SERSALが言語的プロンプト法に比べて大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2024-03-03T17:35:52Z) - Emergency Department Decision Support using Clinical Pseudo-notes [0.4487265603408873]
EHR (Multiple Embedding Model for EHR) について紹介する。
MEMEは、臨床テキスト生成を模倣する擬似メモを用いて、マルチモーダルEHRデータをテキストにシリアライズする。
複数の病院システムにまたがる救急部門における意思決定支援業務にMEMEを適用することで,その効果を実証する。
論文 参考訳(メタデータ) (2024-01-31T20:31:56Z) - Coupling Symbolic Reasoning with Language Modeling for Efficient
Longitudinal Understanding of Unstructured Electronic Medical Records [0.9003755151302328]
言語モデルとシンボリック推論の結合による非構造的臨床テキストの理解向上効果について検討する。
このような組み合わせは、非構造化レコードからのいくつかの医学変数の抽出を改善することを示す。
論文 参考訳(メタデータ) (2023-08-07T07:29:49Z) - Interpretable Medical Diagnostics with Structured Data Extraction by
Large Language Models [59.89454513692417]
タブラルデータはしばしばテキストに隠され、特に医学的診断報告に使用される。
本稿では,TEMED-LLM と呼ばれるテキスト医療報告から構造化表状データを抽出する手法を提案する。
本手法は,医学診断における最先端のテキスト分類モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-08T09:12:28Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。