論文の概要: Rethinking the Objectives of Extractive Question Answering
- arxiv url: http://arxiv.org/abs/2008.12804v4
- Date: Tue, 12 Oct 2021 07:43:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 01:22:18.135339
- Title: Rethinking the Objectives of Extractive Question Answering
- Title(参考訳): 抜粋的質問応答の目的の再検討
- Authors: Martin Fajcik, Josef Jon, Pavel Smrz
- Abstract要約: 結合確率$P(a_s,a_e)$を直接モデル化する複数の手法を提案する。
複合目的は、厳密なマッチングにおいて、他の仮定よりも一貫して優れているか、同等であることがわかった。
- 参考スコア(独自算出の注目度): 5.694151938123703
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This work demonstrates that using the objective with independence assumption
for modelling the span probability $P(a_s,a_e) = P(a_s)P(a_e)$ of span starting
at position $a_s$ and ending at position $a_e$ has adverse effects. Therefore
we propose multiple approaches to modelling joint probability $P(a_s,a_e)$
directly. Among those, we propose a compound objective, composed from the joint
probability while still keeping the objective with independence assumption as
an auxiliary objective. We find that the compound objective is consistently
superior or equal to other assumptions in exact match. Additionally, we
identified common errors caused by the assumption of independence and manually
checked the counterpart predictions, demonstrating the impact of the compound
objective on the real examples. Our findings are supported via experiments with
three extractive QA models (BIDAF, BERT, ALBERT) over six datasets and our
code, individual results and manual analysis are available online.
- Abstract(参考訳): この研究は、独立仮定を用いてスパン確率をモデル化する目的を$P(a_s,a_e) = P(a_s)P(a_e)$ で開始し、位置$a_s$ で終了する目的が悪影響を持つことを示す。
したがって、結合確率$P(a_s,a_e)$を直接モデル化する複数のアプローチを提案する。
それらの中で, 共起確率から構成した複合目的を, 独立を前提とした目標を補助目的として維持する。
我々は、複合目的が、完全に一致する他の仮定よりも一貫して優れているか、あるいは等しいことを見出している。
さらに,独立性の仮定による一般的な誤りを特定し,実例に複合目的が与える影響を実例で示すとともに,その予測を手作業で検証した。
本研究は,6つのデータセットを対象とした3つの抽出QAモデル(BIDAF,BERT,ALBERT)による実験により支援された。
関連論文リスト
- Covariate Assisted Entity Ranking with Sparse Intrinsic Scores [3.2839905453386162]
我々は,新しいモデル同定条件を導入し,正規化された最大推定値の統計率について検討する。
また,本手法を潜在固有スコアを持たないモデルに対する適合性テストに適用する。
論文 参考訳(メタデータ) (2024-07-09T19:58:54Z) - Reinterpreting causal discovery as the task of predicting unobserved
joint statistics [15.088547731564782]
我々は因果発見が、観測されていない関節分布の性質を推測するのに役立つと論じている。
入力が変数のサブセットであり、ラベルがそのサブセットの統計的性質である学習シナリオを定義する。
論文 参考訳(メタデータ) (2023-05-11T15:30:54Z) - Think Twice: Measuring the Efficiency of Eliminating Prediction
Shortcuts of Question Answering Models [3.9052860539161918]
そこで本研究では,任意の特徴量に対するモデルのスケール依存度を簡易に測定する手法を提案する。
質問回答(QA: Question Answering)における各種事前学習モデルとデバイアス法について、既知の予測バイアスと新たに発見された予測バイアスの集合に対するロバスト性を評価する。
既存のデバイアス法は、選択された刺激的特徴への依存を軽減することができるが、これらの手法のOOD性能向上は、偏りのある特徴への依存を緩和することによって説明できない。
論文 参考訳(メタデータ) (2023-05-11T14:35:00Z) - Alternating Objectives Generates Stronger PGD-Based Adversarial Attacks [78.2700757742992]
Projected Gradient Descent (PGD) は、そのような敵を生成するための最も効果的で概念的にシンプルなアルゴリズムの1つである。
この主張を合成データの例で実験的に検証し、提案手法を25の$ell_infty$-robustモデルと3つのデータセットで評価した。
私たちの最強の敵攻撃は、AutoAttackアンサンブルのすべてのホワイトボックスコンポーネントより優れています。
論文 参考訳(メタデータ) (2022-12-15T17:44:31Z) - Revealing Unobservables by Deep Learning: Generative Element Extraction
Networks (GEEN) [5.3028918247347585]
本稿では,ランダムサンプル中の潜伏変数$X*$を推定する新しい手法を提案する。
我々の知る限りでは、この論文は観測においてそのような識別を初めて提供するものである。
論文 参考訳(メタデータ) (2022-10-04T01:09:05Z) - Probabilistic Warp Consistency for Weakly-Supervised Semantic
Correspondences [118.6018141306409]
本稿では,セマンティックマッチングのための弱教師付き学習目標である確率ワープ一貫性を提案する。
まず、同じオブジェクトクラスの異なるインスタンスを表現したペアで、既知のワープを画像の1つに適用することで、画像トリプルを構築する。
我々の目的はまた、キーポイントアノテーションと組み合わせることで、強く監督された体制を大幅に改善する。
論文 参考訳(メタデータ) (2022-03-08T18:55:11Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Disentangling Observed Causal Effects from Latent Confounders using
Method of Moments [67.27068846108047]
我々は、軽度の仮定の下で、識別性と学習可能性に関する保証を提供する。
我々は,線形制約付き結合テンソル分解に基づく効率的なアルゴリズムを開発し,スケーラブルで保証可能な解を得る。
論文 参考訳(メタデータ) (2021-01-17T07:48:45Z) - A Self-Penalizing Objective Function for Scalable Interaction Detection [2.208242292882514]
本研究では,変数間の相互作用を発見するための計算により,非パラメトリックな変数選択の問題に取り組む。
トリックは、メトリック学習目標と呼ばれるパラメトリック非パラメトリック依存度を最大化することである。
論文 参考訳(メタデータ) (2020-11-24T17:07:49Z) - A Weaker Faithfulness Assumption based on Triple Interactions [89.59955143854556]
より弱い仮定として, 2$-adjacency faithfulness を提案します。
より弱い仮定の下で適用可能な因果発見のための音方向規則を提案する。
論文 参考訳(メタデータ) (2020-10-27T13:04:08Z) - Decision-Making with Auto-Encoding Variational Bayes [71.44735417472043]
変分分布とは異なる後部近似を用いて意思決定を行うことが示唆された。
これらの理論的な結果から,最適モデルに関するいくつかの近似的提案を学習することを提案する。
おもちゃの例に加えて,単細胞RNAシークエンシングのケーススタディも紹介する。
論文 参考訳(メタデータ) (2020-02-17T19:23:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。