論文の概要: Robust Biomedical Publication Type and Study Design Classification with Knowledge-Guided Perturbations
- arxiv url: http://arxiv.org/abs/2605.11502v1
- Date: Tue, 12 May 2026 04:22:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.57238
- Title: Robust Biomedical Publication Type and Study Design Classification with Knowledge-Guided Perturbations
- Title(参考訳): 知識誘導摂動を用いたロバストバイオメディカルパブリケーションタイプと学習設計分類
- Authors: Shufan Ming, Joe D. Menke, Neil R. Smalheiser, Halil Kilicoglu,
- Abstract要約: 出版型分類器のロバスト性を評価するために,制御された意味摂動に基づく評価フレームワークを提案する。
本稿では,実体マスキングとドメイン・アドリアル・トレーニングを組み合わせたロバストネス指向のトレーニング戦略について検討する。
これらの知見は,出版型および研究設計分類における特徴レベルのロバスト性分析の重要性を浮き彫りにした。
- 参考スコア(独自算出の注目度): 2.502407331311937
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurately and consistently indexing biomedical literature by publication type and study design is essential for supporting evidence synthesis and knowledge discovery. Prior work on automated publication type and study design indexing has primarily focused on expanding label coverage, enriching feature representations, and improving in-domain accuracy, with evaluation typically conducted on data drawn from the same distribution as training. Although pretrained biomedical language models achieve strong performance under these settings, models optimized for in-domain accuracy may rely on superficial lexical or dataset-specific cues, resulting in reduced robustness under distributional shift. In this study, we introduce an evaluation framework based on controlled semantic perturbations to assess the robustness of a publication type classifier and investigate robustness-oriented training strategies that combine entity masking and domain-adversarial training to mitigate reliance on spurious topical correlations. Our results show that the commonly observed trade-off between robustness and in-domain accuracy can be mitigated when robustness objectives are designed to selectively suppress non-task-defining features while preserving salient methodological signals. We find that these improvements arise from two complementary mechanisms: (1) increased reliance on explicit methodological cues when such cues are present in the input, and (2) reduced reliance on spurious domain-specific topical features. These findings highlight the importance of feature-level robustness analysis for publication type and study design classification and suggest that refining masking and adversarial objectives to more selectively suppress topical information may further improve robustness. Data, code, and models are available at: https://github.com/ScienceNLP-Lab/MultiTagger-v2/tree/main/ICHI
- Abstract(参考訳): バイオメディカル文献の出版タイプと研究デザインによる正確な索引付けは、証拠合成と知識発見を支援するために不可欠である。
自動パブリッシュタイプと研究デザインインデクシングに関する以前の研究は、主にラベルカバレッジの拡大、特徴表現の強化、ドメイン内精度の向上に重点を置いており、トレーニングと同じ分布から抽出されたデータに対して評価が行われるのが一般的である。
事前訓練されたバイオメディカル言語モデルは、これらの設定下で強い性能を達成するが、ドメイン内精度に最適化されたモデルは、表面的語彙やデータセット固有の手がかりに依存し、分散シフトの下で堅牢性が低下する可能性がある。
本研究では,出版型分類器のロバスト性を評価するために,制御された意味摂動に基づく評価フレームワークを導入し,エンティティマスキングとドメイン・アドバイザリー・トレーニングを組み合わせたロバストネス指向のトレーニング戦略について検討する。
この結果から,ロバスト性とドメイン内精度のトレードオフは,健全な方法論的信号を保持しつつ,非タスク定義の特徴を選択的に抑えるために,ロバスト性目標を設計する場合に緩和できることが示された。
これらの改善は,(1)入力にそのような手がかりが存在する場合の明示的な方法論的手がかりへの依存度が増大し,(2)ドメイン固有のトピック的特徴への依存度が低下する,という2つの相補的なメカニズムから生じる。
これらの知見は,出版型および研究設計分類における特徴レベルのロバスト性分析の重要性を強調し,トピック情報のより選択的に抑制するためのマスクの精製と敵の目的が,ロバスト性をさらに向上させる可能性があることを示唆している。
https://github.com/ScienceNLP-Lab/MultiTagger-v2/tree/main/ICHI
関連論文リスト
- Delving Aleatoric Uncertainty in Medical Image Segmentation via Vision Foundation Models [56.29123284262618]
本研究は,視覚基盤モデルの普遍的表現能力を生かして固有データ不確実性を推定することを提案する。
モデルのデコード表現の特徴の多様性を分析し,その特異値エネルギーを定量化し,各クラスに対する意味知覚尺度を定義する。
この基礎に基づいて,本研究は,(1)潜在的にノイズの多いサンプルを排除し,モデル学習品質を向上させるためのアレータリック不確実性認識データフィルタリング機構,(2)意味認識尺度に基づくトレーニング中にクラス固有の損失重みを適応的に調整する動的不確実性認識最適化戦略,およびトレーニング安定性を向上させるラベル認知機構の2つの不確実性駆動型アプリケーション戦略を設計する。
論文 参考訳(メタデータ) (2026-04-13T03:59:54Z) - Adaptive-CaRe: Adaptive Causal Regularization for Robust Outcome Prediction [16.391352325575763]
監視された機械学習アルゴリズムは、医療領域における結果予測に一般的に使用される。
本稿では,医療領域における一般結果予測のためのモデル非依存型正規化戦略であるAdaptive-CaReを提案する。
論文 参考訳(メタデータ) (2026-02-06T11:14:03Z) - Unlocking Biomedical Insights: Hierarchical Attention Networks for High-Dimensional Data Interpretation [0.3821469577674901]
Hierarchical Attention-based Interpretable Network (HAIN) は、多段階の注意機構、次元減少、説明駆動損失関数を統一する新しいアーキテクチャである。
がんゲノムアトラスデータセットの包括的な評価は、HAINが94.3%の分類精度を達成したことを示している。
HAINは生物学的に関連するがんバイオマーカーを効果的に同定し、臨床および研究用途に有用である。
論文 参考訳(メタデータ) (2025-10-21T20:08:50Z) - Clinical NLP with Attention-Based Deep Learning for Multi-Disease Prediction [44.0876796031468]
本稿では,電子健康記録テキストの非構造的性質と高次元意味論的複雑さがもたらす課題について論じる。
情報抽出と多ラベル病予測のための統合モデリングを実現するために,注意機構に基づく深層学習手法を提案する。
論文 参考訳(メタデータ) (2025-07-02T07:45:22Z) - On the Interconnections of Calibration, Quantification, and Classifier Accuracy Prediction under Dataset Shift [58.91436551466064]
本稿では,データセットシフト条件下でのキャリブレーションと定量化の3つの基本問題間の相互接続について検討する。
これらのタスクのいずれか1つに対するオラクルへのアクセスは、他の2つのタスクの解決を可能にすることを示す。
本稿では,他の分野から借用した高度に確立された手法の直接適応に基づく各問題に対する新しい手法を提案する。
論文 参考訳(メタデータ) (2025-05-16T15:42:55Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Deployment of Image Analysis Algorithms under Prevalence Shifts [6.373765910269204]
領域ギャップは、医療画像解析のための機械学習(ML)ベースのソリューションの臨床的翻訳において、最も関連する障害の一つである。
そこで本研究では,トレーニング済みの分類器を新しい環境に適応させるために,推定したデプロイメントの頻度を利用して精度の高い画像分類を行うワークフローを提案する。
論文 参考訳(メタデータ) (2023-03-22T13:16:37Z) - Improving robustness of jet tagging algorithms with adversarial training [56.79800815519762]
本研究では,フレーバータグ付けアルゴリズムの脆弱性について,敵攻撃による検証を行った。
シミュレーション攻撃の影響を緩和する対人訓練戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T19:57:19Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。