論文の概要: HiMed: Incentivizing Hindi Reasoning in Medical LLMs
- arxiv url: http://arxiv.org/abs/2605.24635v1
- Date: Sat, 23 May 2026 15:51:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.286943
- Title: HiMed: Incentivizing Hindi Reasoning in Medical LLMs
- Title(参考訳): HiMed:医療用LLMにおけるヒンディー語推論のインセンティブ
- Authors: Dingfeng Jiang, Han Yan, Chenze Ma, Amit Kumar Jaiswal, Ang Li, Yunxiang Jiang, Xinlei Xiong, Juhao Liang, Hongru Xiao, Xiang Li, Fan Bu, Jiale Han, Ruchir Gupta, Prayag Tiwari, Benyou Wang,
- Abstract要約: 医療用大言語モデルは、医療格差を減らすという約束を持っているが、ヒンディー語は依然として過小評価されている。
ヒンディー語理化医療コーパスであるHiMedと、西洋医学とインド医学の両方をカバーするベンチマークスイートについて紹介する。
実験では、ヒンディー語の医学的推論性能の向上と、英語の-ヒンディー語の精度ギャップの低減が示されている。
- 参考スコア(独自算出の注目度): 42.00331304544721
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Medical large language models hold promise for reducing healthcare disparities, yet Hindi remains severely underrepresented. While medical LLMs excel in high-resource languages, their performance degrades sharply in Hindi, particularly on Indian systems of medicine. We argue that robust cross-lingual medical transfer requires Hindi reasoning. To this end, we introduce HiMed, a Hindi reasoning medical corpus and benchmark suite covering both Western and Indian medicine. We further propose HiMed-8B, a Hindi-form medical reasoning LLM, through the design of decaying scaffolding reward. Extensive experiments demonstrate improvement in Hindi medical reasoning performance and reduction in the English--Hindi accuracy gap. Ablation studies validate the contribution of each training stage and reward component. All data and code are available on GitHub: https://github.com/FreedomIntelligence/HiMed.
- Abstract(参考訳): 医療用大言語モデルは、医療格差を減らすという約束を持っているが、ヒンディー語は依然として過小評価されている。
医療用LLMは高資源言語で優れているが、その性能はヒンディー語、特にインドの医療システムにおいて著しく低下している。
我々は、頑健な言語間医療移行にはヒンディー語による推論が必要であると主張している。
この目的のために、ヒンディー語推論医療コーパスと、西洋医学とインド医学の両方をカバーするベンチマークスイートであるHiMedを紹介した。
さらに,ヒンズー式医療推論LLMであるHiMed-8Bを提案する。
大規模な実験は、ヒンディー語の医学的推論性能の向上と英語における-ヒンディー語の精度ギャップの低減を実証している。
アブレーション研究は、各トレーニングステージと報酬コンポーネントの貢献を検証する。
すべてのデータとコードはGitHubで入手できる。
関連論文リスト
- CURE-Med: Curriculum-Informed Reinforcement Learning for Multilingual Medical Reasoning [38.90826150840053]
我々はCUREMED-BENCHを紹介した。CUREMED-BENCHは、高品質な多言語医療推論データセットであり、単一の検証可能な答えを持つオープンエンド推論クエリである。
本稿では,コードスイッチング・アウェア・教師付き微調整を統合したカリキュラムインフォームド強化学習フレームワークCURE-MEDを提案する。
13言語にまたがって、我々のアプローチは一貫して強いベースラインを上回り、効果的にスケールする。
論文 参考訳(メタデータ) (2026-01-19T17:51:00Z) - AMANDA: Agentic Medical Knowledge Augmentation for Data-Efficient Medical Visual Question Answering [34.90463380394591]
LLMエージェントを介して医療知識を増強するトレーニングフリーエージェントフレームワークであるAMANDAを提案する。
8つのMed-VQAベンチマークの実験では、ゼロショットと少数ショットのMed-VQA設定の両方で大幅に改善されている。
論文 参考訳(メタデータ) (2025-09-26T01:22:25Z) - Fact or Guesswork? Evaluating Large Language Models' Medical Knowledge with Structured One-Hop Judgments [108.55277188617035]
大規模言語モデル(LLM)は、様々な下流タスクドメインで広く採用されているが、実際の医学的知識を直接呼び起こし、適用する能力は、まだ探索されていない。
標準化された語彙と知識グラフの包括的なリポジトリであるUMLS(Unified Medical Language System)から派生したデータセットであるMKJ(Messical Knowledge Judgment dataset)を紹介する。
バイナリ分類フレームワークを通じて、MKJは、簡潔なワンホップ文の妥当性を評価することによって、LCMが基本的な医学的事実を把握できることを評価する。
論文 参考訳(メタデータ) (2025-02-20T05:27:51Z) - MedExpQA: Multilingual Benchmarking of Large Language Models for Medical Question Answering [8.110978727364397]
大規模言語モデル(LLM)は、人工知能技術の発展を促進する可能性を秘めている。
本稿では,MedExpQAについて述べる。MedExpQAは,医学質問応答におけるLSMを評価するための,医学試験に基づく最初の多言語ベンチマークである。
論文 参考訳(メタデータ) (2024-04-08T15:03:57Z) - ChiMed-GPT: A Chinese Medical Large Language Model with Full Training Regime and Better Alignment to Human Preferences [51.66185471742271]
我々は中国医学領域向けに明示的に設計されたベンチマークLSMであるChiMed-GPTを提案する。
ChiMed-GPTは、事前訓練、SFT、RLHFを含む総合的な訓練体制を実施。
我々は,ChiMed-GPTを患者識別に関する態度尺度の実行を促すことによって,潜在的なバイアスを分析した。
論文 参考訳(メタデータ) (2023-11-10T12:25:32Z) - CMB: A Comprehensive Medical Benchmark in Chinese [67.69800156990952]
そこで我々は,中国語の包括的医療ベンチマークであるCMB(Comprehensive Medical Benchmark)を提案する。
伝統的な中国医学はこの評価に欠かせないものであるが、全体としては成り立たない。
われわれは,ChatGPT,GPT-4,中国専用LSM,医療分野に特化したLSMなど,いくつかの大規模LSMを評価した。
論文 参考訳(メタデータ) (2023-08-17T07:51:23Z) - Intent Identification and Entity Extraction for Healthcare Queries in
Indic Languages [16.39183257795811]
インドのような先進国では、データとリソース不足言語の技術的な制限が、医療のための高度なNLUシステムの開発に脅威をもたらしている。
本稿では、2つの異なるヘルスケアデータセットを提案する。
我々の目標は、クエリインテントを検出し、対応するエンティティを抽出することである。
論文 参考訳(メタデータ) (2023-02-19T22:53:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。