論文の概要: Effects of Cross-lingual Evidence in Multilingual Medical Question Answering
- arxiv url: http://arxiv.org/abs/2604.20531v1
- Date: Wed, 22 Apr 2026 13:09:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:11.136353
- Title: Effects of Cross-lingual Evidence in Multilingual Medical Question Answering
- Title(参考訳): 多言語医療質問応答における言語間エビデンスの効果
- Authors: Anar Yeginbergen, Maite Oronoz, Rodrigo Agerri,
- Abstract要約: 本稿では,ハイリソース(英語,スペイン語,フランス語,イタリア語)と低リソース(バスク語,カザフ語)にまたがる多言語医療質問応答について検討する。
異なる大きさのモデルを対象とした3種類の外部証拠源の評価を行った。
- 参考スコア(独自算出の注目度): 14.325363876249972
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper investigates Multilingual Medical Question Answering across high-resource (English, Spanish, French, Italian) and low-resource (Basque, Kazakh) languages. We evaluate three types of external evidence sources across models of varying size: curated repositories of specialized medical knowledge, web-retrieved content, and explanations from LLM's parametric knowledge. Moreover, we conduct experiments with multilingual, monolingual and cross-lingual retrieval. Our results demonstrate that larger models consistently achieve superior performance in English across baseline evaluations. When incorporating external knowledge, web-retrieved data in English proves most beneficial for high-resource languages. Conversely, for low-resource languages, the most effective strategy combines retrieval in both English and the target language, achieving comparable accuracy to high-resource language results. These findings challenge the assumption that external knowledge systematically improves performance and reveal that effective strategies depend on both the source of language resources and on model scale. Furthermore, specialized medical knowledge sources such as PubMed are limited: while they provide authoritative expert knowledge, they lack adequate multilingual coverage
- Abstract(参考訳): 本稿では,ハイリソース(英語,スペイン語,フランス語,イタリア語)と低リソース(バスク語,カザフ語)にまたがる多言語医療質問応答について検討する。
我々は,専門知識の収集されたリポジトリ,Web検索コンテンツ,LCMのパラメトリック知識からの説明の3種類の外部エビデンスソースを,様々なサイズのモデルで評価した。
さらに,多言語・単言語・多言語検索実験を行った。
本結果より, 大規模モデルはベースライン評価において, 英語の優れた性能を保ち続けることが示唆された。
外部知識を取り入れた場合、Webで検索したデータは、高リソース言語にとって最も有益であることが証明されている。
逆に、低リソース言語では、最も効果的な戦略は、英語とターゲット言語の両方での検索を組み合わせ、高リソース言語の結果に匹敵する精度を達成することである。
これらの知見は、外部知識が性能を体系的に改善し、効果的な戦略が言語資源の源泉とモデルスケールの両方に依存するという仮定に挑戦する。
さらに、PubMedのような専門的な医療知識ソースは限られており、権威的な専門家の知識を提供する一方で、十分な多言語カバレッジが欠如している。
関連論文リスト
- Grounded Multilingual Medical Reasoning for Question Answering with Large Language Models [15.135129023906138]
本稿では,現実の医療知識に基づく多言語推論トレースを生成する手法を提案する。
我々は、ウィキペディアの医療情報に対する検索強化された世代アプローチを用いて、英語、イタリア語、スペイン語で500kのトレースを生成する。
論文 参考訳(メタデータ) (2025-12-05T12:05:46Z) - How and Where to Translate? The Impact of Translation Strategies in Cross-lingual LLM Prompting [15.388822834013599]
多言語検索強化世代(RAG)ベースのシステムでは、知識ベース(KB)は高リソース言語(例えば英語)から低リソース言語(英語版)にしばしば共有される。
2つの一般的なプラクティスは、単言語的なプロンプトを生成するための事前翻訳と、直接推論のための言語間プロンプトである。
最適化されたプロンプト戦略は、言語間の知識共有を大幅に改善し、下流分類タスクの性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2025-07-21T19:37:15Z) - Multilingual Information Retrieval with a Monolingual Knowledge Base [2.419638771866955]
強調学習のための重み付きサンプリングによる多言語埋め込みモデルを微調整する新しい手法を提案する。
重み付きサンプリング方式では,MRRでは最大31.03%,Recall@3では最大33.98%の性能向上が見られた。
論文 参考訳(メタデータ) (2025-06-03T07:05:49Z) - How does a Multilingual LM Handle Multiple Languages? [0.0]
本研究では,多言語理解,意味表現,言語間知識伝達の能力について批判的に検討する。
コサイン類似性を用いた一貫性のための多言語単語埋め込みの分析により意味的類似性を評価する。
BLOOM-1.7B と Qwen2 を Named Entity Recognition と文類似性タスクを通して調べ、それらの言語構造を理解する。
論文 参考訳(メタデータ) (2025-02-06T18:08:14Z) - Bridging Language Barriers in Healthcare: A Study on Arabic LLMs [1.2006896500048552]
本稿では,多言語理解と医学知識の両方に熟練した大規模言語モデルを開発する上での課題について考察する。
言語比率を慎重に調整した大規模モデルは、母国語の臨床課題において優れた性能を発揮することが判明した。
論文 参考訳(メタデータ) (2025-01-16T20:24:56Z) - Extracting and Combining Abilities For Building Multi-lingual Ability-enhanced Large Language Models [109.60937659029076]
我々は,MAEC という名称の多言語抽出と組み合わせ手法を提案する。
我々のキーとなる考え方は、大きな言語モデルから言語に依存しない能力に関する重みを分解し抽出することである。
実験の結果,MAECは高度能力の抽出と組み合わせを効果的に効果的に行うことができることがわかった。
論文 参考訳(メタデータ) (2024-10-10T11:23:18Z) - LLMs Are Few-Shot In-Context Low-Resource Language Learners [59.74451570590808]
In-context Learning (ICL) は、大規模言語モデル(LLM)に、表現不足の言語で多様なタスクを実行する権限を与える。
ICLとその言語間変動(X-ICL)を25の低リソース言語と7の比較的高リソース言語で検討した。
本研究は,LLMの低リソース理解品質向上における文脈内情報の重要性を論じる。
論文 参考訳(メタデータ) (2024-03-25T07:55:29Z) - Zero-shot Sentiment Analysis in Low-Resource Languages Using a
Multilingual Sentiment Lexicon [78.12363425794214]
私たちは、34の言語にまたがるゼロショットの感情分析タスクに重点を置いています。
文レベルの感情データを使用しない多言語語彙を用いた事前学習は、英語の感情データセットに微調整されたモデルと比較して、ゼロショット性能が優れていることを示す。
論文 参考訳(メタデータ) (2024-02-03T10:41:05Z) - High-resource Language-specific Training for Multilingual Neural Machine
Translation [109.31892935605192]
負の干渉を軽減するために,HLT-MT(High-Resource Language-specific Training)を用いた多言語翻訳モデルを提案する。
具体的には、まずマルチ言語モデルを高リソースペアでトレーニングし、デコーダの上部にある言語固有のモジュールを選択する。
HLT-MTは、高リソース言語から低リソース言語への知識伝達のために、利用可能なすべてのコーパスでさらに訓練されている。
論文 参考訳(メタデータ) (2022-07-11T14:33:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。