論文の概要: Interpretable Self-supervised Multi-task Learning for COVID-19
Information Retrieval and Extraction
- arxiv url: http://arxiv.org/abs/2106.08252v1
- Date: Tue, 15 Jun 2021 16:01:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-16 19:38:34.145778
- Title: Interpretable Self-supervised Multi-task Learning for COVID-19
Information Retrieval and Extraction
- Title(参考訳): 新型コロナウイルス情報検索と抽出のための自己指導型マルチタスク学習の解釈
- Authors: Nima Ebadi and Peyman Najafirad
- Abstract要約: 本研究では,情報検索(IR)と抽出(IE)の課題に対処する自己指導型マルチタスク学習モデルを提案する。
その結果,本モデルではマルチタスクと自己教師型学習を効果的に活用し,データセットシフト問題に対する一般化,データ効率,堅牢性の向上を実現している。
- 参考スコア(独自算出の注目度): 0.6345523830122166
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapidly evolving literature of COVID-19 related articles makes it
challenging for NLP models to be effectively trained for information retrieval
and extraction with the corresponding labeled data that follows the current
distribution of the pandemic. On the other hand, due to the uncertainty of the
situation, human experts' supervision would always be required to double check
the decision making of these models highlighting the importance of
interpretability. In the light of these challenges, this study proposes an
interpretable self-supervised multi-task learning model to jointly and
effectively tackle the tasks of information retrieval (IR) and extraction (IE)
during the current emergency health crisis situation. Our results show that our
model effectively leverage the multi-task and self-supervised learning to
improve generalization, data efficiency and robustness to the ongoing dataset
shift problem. Our model outperforms baselines in IE and IR tasks, respectively
by micro-f score of 0.08 (LCA-F score of 0.05), and MAP of 0.05 on average. In
IE the zero- and few-shot learning performances are on average 0.32 and 0.19
micro-f score higher than those of the baselines.
- Abstract(参考訳): 新型コロナウイルス関連記事の急速に発展している文献は、現在のパンデミックの分布に従うラベル付きデータを用いて、NLPモデルを情報検索と抽出のために効果的に訓練することが困難である。
一方で、状況の不確実性から、人間の専門家の監督は、解釈可能性の重要性を強調するこれらのモデルの意思決定を二重にチェックする必要がある。
本研究は,これらの課題を踏まえ,情報検索(ir)と抽出(ie)の課題を,現在の危機時の協調的かつ効果的に取り組むための,解釈可能な自己教師付きマルチタスク学習モデルを提案する。
その結果,本モデルではマルチタスクと自己教師型学習を効果的に活用し,データセットシフト問題に対する一般化,データ効率,堅牢性の向上を実現している。
このモデルでは,IE および IR タスクのベースラインをそれぞれ0.08(LCA-F スコア0.05),MAP 平均0.05 で上回っている。
IEでは、ゼロショットと少数ショットの学習性能は平均0.32と0.19マイクロフのスコアがベースラインよりも高い。
関連論文リスト
- Impact of Missing Values in Machine Learning: A Comprehensive Analysis [0.0]
本稿では,機械学習(ML)モデルにおける欠落値の影響について検討する。
分析では、バイアス付き推論、予測能力の低下、計算負荷の増大など、欠落した値による課題に焦点を当てた。
この研究は、欠落した値に対処する実践的な意味を説明するためにケーススタディと実例を用いている。
論文 参考訳(メタデータ) (2024-10-10T18:31:44Z) - Enhancing Training Data Attribution for Large Language Models with Fitting Error Consideration [74.09687562334682]
Debias and Denoise Attribution (DDA) と呼ばれる新しいトレーニングデータ属性法を導入する。
提案手法は既存のアプローチよりも優れており,平均91.64%のAUCを実現している。
DDAは、様々なソースとLLaMA2、QWEN2、Mistralのような異なるスケールのモデルに対して、強力な汎用性とスケーラビリティを示す。
論文 参考訳(メタデータ) (2024-10-02T07:14:26Z) - Forgetting, Ignorance or Myopia: Revisiting Key Challenges in Online Continual Learning [29.65600202138321]
高速なデータストリーム環境では、遅いモデルに対応するためにデータが停止しない。
モデルの無知: OCLのシングルパスの性質は、制約付きトレーニング時間内で効果的な機能を学ぶためにモデルに挑戦する。
モデルのミオピア:OCLの局所的な学習特性は、過度に単純化されたタスク固有の機能を採用するモデルに導かれる。
論文 参考訳(メタデータ) (2024-09-28T05:24:56Z) - Uncertainty Aware Learning for Language Model Alignment [97.36361196793929]
異なるタスクシナリオのモデルアライメントを改善するために,不確実性認識学習(UAL)を提案する。
トレーニングのラベルの平滑化値を個々のサンプルの不確実性に応じて適応的に設定する。
広く使われているベンチマーク実験では、我々のUALは標準教師あり微調整よりも著しく優れています。
論文 参考訳(メタデータ) (2024-06-07T11:37:45Z) - Evaluating the Fairness of the MIMIC-IV Dataset and a Baseline
Algorithm: Application to the ICU Length of Stay Prediction [65.268245109828]
本稿では、MIMIC-IVデータセットを用いて、滞在時間を予測するXGBoostバイナリ分類モデルにおける公平性とバイアスについて検討する。
この研究は、人口統計属性にわたるデータセットのクラス不均衡を明らかにし、データ前処理と特徴抽出を採用する。
この論文は、偏見を緩和するための公正な機械学習技術と、医療専門家とデータサイエンティストの協力的な努力の必要性について結論付けている。
論文 参考訳(メタデータ) (2023-12-31T16:01:48Z) - Towards Better Modeling with Missing Data: A Contrastive Learning-based
Visual Analytics Perspective [7.577040836988683]
データ不足は機械学習(ML)モデリングの課題となる可能性がある。
現在のアプローチは、特徴計算とラベル予測に分類される。
本研究は、観測データに欠落した値でモデル化するコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T13:16:24Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Causal Deep Reinforcement Learning Using Observational Data [11.790171301328158]
深部強化学習(DRL)における2つの解答法を提案する。
提案手法はまず, 因果推論法に基づいて異なる試料の重要度を算出し, 損失関数に対する異なる試料の影響を調整する。
本手法の有効性を実証し,実験的に検証する。
論文 参考訳(メタデータ) (2022-11-28T14:34:39Z) - Diverse Distributions of Self-Supervised Tasks for Meta-Learning in NLP [39.457091182683406]
非ラベルテキストから自動的に提案される自己教師型タスクを考慮し,メタラーニングのためのタスク分布の提供を目指す。
分析の結果,これらすべての要因がタスク分布を有意に変化させることが示され,メタ学習モデルの下流における数ショット精度の大幅な改善がもたらされた。
論文 参考訳(メタデータ) (2021-11-02T01:50:09Z) - Accurate and Robust Feature Importance Estimation under Distribution
Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。
忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-09-30T05:29:01Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。