論文の概要: A Severity-Based Curriculum Learning Strategy for Arabic Medical Text Generation
- arxiv url: http://arxiv.org/abs/2604.06365v1
- Date: Tue, 07 Apr 2026 18:41:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.186596
- Title: A Severity-Based Curriculum Learning Strategy for Arabic Medical Text Generation
- Title(参考訳): アラビア語医学テキスト生成のための重症度に基づくカリキュラム学習戦略
- Authors: Ahmed Alansary, Molham Mohamed, Ali Hamdi,
- Abstract要約: 本研究は、アラビア医学テキスト生成のための重症度に基づくカリキュラム学習戦略を導入する。
トレーニングプロセスは、より厳しい状態からより重要な医療条件へと徐々に移動するように構成されている。
提案手法は,医療用アラビア質問回答データセットのサブセットを用いて評価する。
- 参考スコア(独自算出の注目度): 0.25489046505746704
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Arabic medical text generation is increasingly needed to help users interpret symptoms and access general health guidance in their native language. Nevertheless, many existing methods assume uniform importance across training samples, overlooking differences in clinical severity. This simplification can hinder the model's ability to properly capture complex or high-risk cases. To overcome this issue, this work introduces a Severity-based Curriculum Learning Strategy for Arabic Medical Text Generation, where the training process is structured to move gradually from less severe to more critical medical conditions. The approach divides the dataset into ordered stages based on severity and incrementally exposes the model to more challenging cases during fine-tuning, allowing it to first learn basic medical patterns before addressing more complex scenarios. The proposed method is evaluated on a subset of the Medical Arabic Question Answering (MAQA) dataset, which includes Arabic medical questions describing symptoms alongside corresponding responses. In addition, the dataset is annotated with three severity levels (Mild, Moderate, and Critical) using a rule-based method developed in this study. The results demonstrate that incorporating severity-aware curriculum learning leads to consistent performance improvements across all tested models, with gains of around +4% to +7% over baseline models and +3% to +6% compared with conventional fine-tuning approaches.
- Abstract(参考訳): アラビア語の医療用テキスト生成は、ユーザが症状を解釈し、母国語で一般的な健康指導にアクセスするのを助けるためにますます必要になっている。
それにもかかわらず、多くの既存の手法は、臨床の重症度の違いを見越して、トレーニングサンプル全体で均一に重要であると仮定している。
この単純化は、複雑なケースやリスクの高いケースを適切にキャプチャするモデルの能力を阻害する可能性がある。
この問題を克服するため、本研究では、アラビア語医学テキスト生成のための重症度に基づくカリキュラム学習戦略を導入し、トレーニングプロセスは、より厳しい状態からより重要な医療条件へと徐々に移行するように構成されている。
このアプローチでは、データセットを重大度に基づいて順序付けられたステージに分割し、微調整中にモデルをより困難なケースに段階的に公開することで、より複雑なシナリオに対処する前に、まず基本的な医療パターンを学習することができる。
提案手法は,医療用アラビア質問応答(MAQA)データセットのサブセットで評価され,症状を記述したアラビア医療用質問応答を含む。
さらに、本研究で開発されたルールベースの手法を用いて、3つの重度レベル(マイルド、モデレート、クリティカル)でアノテートする。
その結果, 厳密なカリキュラム学習の導入は, 従来の微調整手法と比較して, ベースラインモデルよりも+4%から+7%向上し, +3%から+6%向上した。
関連論文リスト
- MedForget: Hierarchy-Aware Multimodal Unlearning Testbed for Medical AI [66.0701326117134]
MedForgetは、階層型を意識したマルチモーダルなアンラーニングテストベッドで、準拠する医療AIシステムを構築する。
既存の手法は,診断性能を低下させることなく,完全かつ階層性に配慮した忘れの解決に苦慮していることを示す。
階層レベルのコンテキストをプロンプトに徐々に追加する再構成攻撃を導入する。
論文 参考訳(メタデータ) (2025-12-10T17:55:06Z) - TACL: Threshold-Adaptive Curriculum Learning Strategy for Enhancing Medical Text Understanding [8.188646882370792]
TACL(Threshold-Adaptive Curriculum Learning)は、トレーニング中にモデルが医療用テキストとどのように相互作用するかを再考する新しいフレームワークである。
データを難易度に分類し、トレーニングの初期段階でより単純なケースを優先順位付けすることで、TACLはより複雑なレコードに取り組む前に強力な基盤を構築する。
自動ICD符号化, 寛解予測, TCM 症候群の鑑別など, 様々な臨床課題にまたがる顕著な改善が観察された。
論文 参考訳(メタデータ) (2025-10-17T03:16:51Z) - An Ensemble Classification Approach in A Multi-Layered Large Language Model Framework for Disease Prediction [0.4666493857924357]
社会的遠隔医療は、患者が症状を投稿し、遠隔で医療相談に参加することを可能にすることで、医療において顕著な進歩を遂げてきた。
ユーザーはしばしばソーシャルメディアやオンライン健康プラットフォームに症状を投稿し、医療データの巨大なリポジトリを作成する。
大規模言語モデル(LLM)は、複雑な医療テキストを処理する上で強力な能力を示している。
論文 参考訳(メタデータ) (2025-09-02T15:53:51Z) - Leveraging Language Models and Machine Learning in Verbal Autopsy Analysis [0.0]
市民登録や生命統計のない国では、口頭解剖(VA)は死因を推定するための重要なツールである。
既存のVAの自動分類アルゴリズムは疑問のみを使用し、物語の情報を無視する。
本研究では,プレトレーニング言語モデル(PLM)と機械学習(ML)技術を用いて,VAナラティブをCODの自動分類に利用する方法を検討する。
論文 参考訳(メタデータ) (2025-08-22T21:40:54Z) - Adapting Mental Health Prediction Tasks for Cross-lingual Learning via Meta-Training and In-context Learning with Large Language Model [3.3590922002216193]
モデルに依存しないメタラーニングと,このギャップに対処するために大規模言語モデル(LLM)を活用する。
まず,自己超越型メタラーニングモデルを適用し,迅速な適応と言語間移動のためのモデル初期化を改良する。
並行して、LLMのインコンテキスト学習機能を用いて、スワヒリのメンタルヘルス予測タスクにおけるパフォーマンスの精度を評価する。
論文 参考訳(メタデータ) (2024-04-13T17:11:35Z) - Optimizing Skin Lesion Classification via Multimodal Data and Auxiliary
Task Integration [54.76511683427566]
本研究は, スマートフォンで撮影した画像と本質的な臨床および人口統計情報を統合することで, 皮膚病変を分類する新しいマルチモーダル手法を提案する。
この手法の特徴は、超高解像度画像予測に焦点を当てた補助的なタスクの統合である。
PAD-UFES20データセットを用いて,様々なディープラーニングアーキテクチャを用いて実験を行った。
論文 参考訳(メタデータ) (2024-02-16T05:16:20Z) - Improving Imbalanced Text Classification with Dynamic Curriculum
Learning [32.731900584216724]
不均衡テキスト分類のための自己評価動的カリキュラム学習手法を提案する。
我々のSPDCLは、適応的なペースからハードペースに適応することで、トレーニングデータの再注文と再サンプル化が困難である。
いくつかの分類タスクの実験は、SPDCL戦略、特に不均衡データセットの有効性を示している。
論文 参考訳(メタデータ) (2022-10-25T07:57:59Z) - LifeLonger: A Benchmark for Continual Disease Classification [59.13735398630546]
MedMNISTコレクションの連続的な疾患分類のためのベンチマークであるLifeLongerを紹介する。
タスクとクラスでの病気の漸進的な学習は、モデルをスクラッチから再トレーニングすることなく、新しいサンプルを分類する問題に対処する。
クロスドメインインクリメンタル学習は、これまで得られた知識を維持しながら、異なる機関から派生したデータセットを扱う問題に対処する。
論文 参考訳(メタデータ) (2022-04-12T12:25:05Z) - Towards Lifelong Learning of Multilingual Text-To-Speech Synthesis [87.75833205560406]
本研究は,多言語テキスト音声(TTS)システムを学習するための生涯学習手法を提案する。
すべての言語からプールされたデータを必要としないため、ストレージと計算の負担が軽減される。
論文 参考訳(メタデータ) (2021-10-09T07:00:38Z) - Self Context and Shape Prior for Sensorless Freehand 3D Ultrasound
Reconstruction [61.62191904755521]
3DフリーハンドUSは、幅広い範囲とフリーフォームスキャンを提供することで、この問題に対処することを約束している。
既存のディープラーニングベースの手法は、スキルシーケンスの基本ケースのみに焦点を当てている。
複雑なスキルシーケンスを考慮したセンサレスフリーハンドUS再構成手法を提案する。
論文 参考訳(メタデータ) (2021-07-31T16:06:50Z) - Benchmarking Automated Clinical Language Simplification: Dataset,
Algorithm, and Evaluation [48.87254340298189]
我々はMedLaneという名の新しいデータセットを構築し、自動化された臨床言語簡易化手法の開発と評価を支援する。
我々は,人間のアノテーションの手順に従い,最先端のパフォーマンスを実現するDECLAREと呼ばれる新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-12-04T06:09:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。