論文の概要: Error-Aware Curriculum Learning for Biomedical Relation Classification
- arxiv url: http://arxiv.org/abs/2507.14374v1
- Date: Fri, 18 Jul 2025 21:41:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:31.863737
- Title: Error-Aware Curriculum Learning for Biomedical Relation Classification
- Title(参考訳): バイオメディカルリレーション分類のためのエラー対応カリキュラム学習
- Authors: Sinchani Chakraborty, Sudeshna Sarkar, Pawan Goyal,
- Abstract要約: バイオメディカルテキストにおける関係分類(RC)は知識グラフの構築に不可欠である。
本稿では,大規模言語モデルからの構造化ガイダンスによってRCを改善する誤り認識フレームワークを提案する。
提案手法は,5つのPPIデータセットとDDIデータセットの4つに対して,最先端のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 8.49400705714144
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Relation Classification (RC) in biomedical texts is essential for constructing knowledge graphs and enabling applications such as drug repurposing and clinical decision-making. We propose an error-aware teacher--student framework that improves RC through structured guidance from a large language model (GPT-4o). Prediction failures from a baseline student model are analyzed by the teacher to classify error types, assign difficulty scores, and generate targeted remediations, including sentence rewrites and suggestions for KG-based enrichment. These enriched annotations are used to train a first student model via instruction tuning. This model then annotates a broader dataset with difficulty scores and remediation-enhanced inputs. A second student is subsequently trained via curriculum learning on this dataset, ordered by difficulty, to promote robust and progressive learning. We also construct a heterogeneous biomedical knowledge graph from PubMed abstracts to support context-aware RC. Our approach achieves new state-of-the-art performance on 4 of 5 PPI datasets and the DDI dataset, while remaining competitive on ChemProt.
- Abstract(参考訳): バイオメディカルテキストにおける関係分類(RC)は、知識グラフの構築と薬物再資源化や臨床的意思決定などの応用に不可欠である。
本稿では,大規模言語モデル(GPT-4o)からの構造化ガイダンスによってRCを改善する誤り認識型教師学習フレームワークを提案する。
ベースライン学生モデルからの予測失敗を教師が分析し、エラータイプを分類し、難易度スコアを割り当て、文の書き直しやKGに基づくエンリッチメントの提案を含む目的の修正を生成する。
これらの豊富なアノテーションは、インストラクションチューニングを通じて最初の学生モデルをトレーニングするために使用される。
このモデルは、難易度スコアと修復強化インプットでより広いデータセットに注釈を付ける。
その後、第2の学生は、頑健で進歩的な学習を促進するために、難易度によって命令されたこのデータセットのカリキュラム学習によって訓練される。
また、コンテキスト対応RCをサポートするために、PubMed抽象から異種生物医学知識グラフを構築した。
提案手法は,5つのPPIデータセットとDDIデータセットの4つに対して,ChemProt上での競争力を維持しながら,最先端の新たなパフォーマンスを実現する。
関連論文リスト
- Iterative Misclassification Error Training (IMET): An Optimized Neural Network Training Technique for Image Classification [0.5115559623386964]
カリキュラム学習とコアセット選択に触発された新しいフレームワークであるIMET(Iterative Misclassification Error Training)を紹介する。
IMETは、トレーニングプロセスの合理化を図りつつ、エッジケースに対するモデルの注意を先入観的かつ稀な結果に優先順位付けしながら、誤分類されたサンプルを特定することを目的としている。
本稿では,最新のResNetアーキテクチャに対するベンチマーク医用画像分類データセット上でのIMETの性能を評価する。
論文 参考訳(メタデータ) (2025-07-01T04:14:16Z) - Cost-effective Instruction Learning for Pathology Vision and Language Analysis [23.330914902014527]
CLOVER という名称の会話病理学のための費用対効果学習フレームワークを提案する。
CLOVERは軽量モジュールのみをトレーニングし、大きな言語モデルのパラメータを凍結しながら命令チューニングを使用する。
そこで我々は,デジタル病理学の文脈において,高品質なテンプレートベースの命令セットを構築する。
論文 参考訳(メタデータ) (2024-07-25T03:12:57Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - GIMLET: A Unified Graph-Text Model for Instruction-Based Molecule
Zero-Shot Learning [71.89623260998934]
本研究は,ゼロショット環境下での分子関連タスクの実現に自然言語命令を用いることの実現可能性について検討する。
既存の分子テキストモデルは、命令の不十分な処理とグラフの限られた容量のために、この設定では性能が良くない。
グラフデータとテキストデータの両方の言語モデルを統合するGIMLETを提案する。
論文 参考訳(メタデータ) (2023-05-28T18:27:59Z) - Dynamic Graph Enhanced Contrastive Learning for Chest X-ray Report
Generation [92.73584302508907]
コントラスト学習を用いた医療レポート作成を支援するために,動的構造とノードを持つ知識グラフを提案する。
詳しくは、グラフの基本構造は一般知識から事前構築される。
各イメージ機能は、レポート生成のためにデコーダモジュールに入力する前に、独自の更新グラフに統合される。
論文 参考訳(メタデータ) (2023-03-18T03:53:43Z) - Textual Data Augmentation for Patient Outcomes Prediction [67.72545656557858]
本稿では,患者の電子カルテに人工的な臨床ノートを作成するための新しいデータ拡張手法を提案する。
生成言語モデルGPT-2を微調整し、ラベル付きテキストを元のトレーニングデータで合成する。
今回,最も多い患者,すなわち30日間の寛解率について検討した。
論文 参考訳(メタデータ) (2022-11-13T01:07:23Z) - Competence-based Multimodal Curriculum Learning for Medical Report
Generation [98.10763792453925]
本稿では,コンピテンスベースのマルチモーダルカリキュラム学習フレームワーク(CMCL)を提案する。
具体的には、CMCLは放射線学者の学習過程をシミュレートし、段階的にモデルを最適化する。
パブリックIU-XrayとMIMIC-CXRデータセットの実験は、CMCLを既存のモデルに組み込んでパフォーマンスを向上させることができることを示している。
論文 参考訳(メタデータ) (2022-06-24T08:16:01Z) - NuCLS: A scalable crowdsourcing, deep learning approach and dataset for
nucleus classification, localization and segmentation [0.0]
ディープラーニングアルゴリズムは、トレーニングと検証のために多数のラベル付きインスタンスを与えられた正確なマッピングを提供することができる。
十分な量の品質ラベルを生成することは 計算病理学において 重要な障壁として現れています
弱いアルゴリズムが生成するアノテーションは、非専門家が生成するアノテーションの精度をいかに向上させるかを示す。
論文 参考訳(メタデータ) (2021-02-18T01:17:17Z) - Text Mining to Identify and Extract Novel Disease Treatments From
Unstructured Datasets [56.38623317907416]
Google Cloudを使って、NPRラジオ番組のポッドキャストのエピソードを書き起こします。
次に、テキストを体系的に前処理するためのパイプラインを構築します。
我々のモデルは、Omeprazoleが心臓熱傷の治療に役立てることに成功しました。
論文 参考訳(メタデータ) (2020-10-22T19:52:49Z) - A Self-ensembling Framework for Semi-supervised Knee Cartilage Defects
Assessment with Dual-Consistency [40.67137486295487]
本研究は, 重症度分類と病変局所化を含む, 膝軟骨欠損評価のための新しいアプローチを提案する。
自己理解フレームワークは、学生ネットワークと、同じ構造を持つ教師ネットワークとから構成される。
実験により, 膝軟骨欠損の分類と局所化の双方において, 提案手法は自己認識性能を著しく向上させることができることが示された。
論文 参考訳(メタデータ) (2020-05-19T04:47:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。