論文の概要: Are Training Resources Insufficient? Predict First Then Explain!
- arxiv url: http://arxiv.org/abs/2110.02056v1
- Date: Sun, 29 Aug 2021 07:04:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-16 21:09:59.217005
- Title: Are Training Resources Insufficient? Predict First Then Explain!
- Title(参考訳): トレーニングリソースは不十分か?
まず予測して 説明しろ!
- Authors: Myeongjun Jang and Thomas Lukasiewicz
- Abstract要約: 我々は、予測理論(PtE)アーキテクチャはモデリングの観点からより効率的なアプローチであると主張している。
PtE構造は説明データが欠如している場合に最もデータ効率のよい手法であることを示す。
- 参考スコア(独自算出の注目度): 54.184609286094044
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Natural language free-text explanation generation is an efficient approach to
train explainable language processing models for
commonsense-knowledge-requiring tasks. The most predominant form of these
models is the explain-then-predict (EtP) structure, which first generates
explanations and uses them for making decisions. The performance of EtP models
is highly dependent on that of the explainer by the nature of their structure.
Therefore, large-sized explanation data are required to train a good explainer
model. However, annotating explanations is expensive. Also, recent works reveal
that free-text explanations might not convey sufficient information for
decision making. These facts cast doubts on the effectiveness of EtP models. In
this paper, we argue that the predict-then-explain (PtE) architecture is a more
efficient approach in terms of the modelling perspective. Our main contribution
is twofold. First, we show that the PtE structure is the most data-efficient
approach when explanation data are lacking. Second, we reveal that the PtE
structure is always more training-efficient than the EtP structure. We also
provide experimental results that confirm the theoretical advantages.
- Abstract(参考訳): 自然言語自由テキスト説明生成は、コモンセンス知識要求タスクのための説明可能な言語処理モデルを訓練するための効率的なアプローチである。
これらのモデルの最も重要な形式は、まず説明を生成し、意思決定に使用する説明-then-predict(EtP)構造である。
EtPモデルの性能は、その構造の性質によって説明器の性能に大きく依存する。
そのため,適切な説明モデルを構築するためには,大規模な説明データが必要となる。
しかし、注釈付きの説明は高価である。
また、近年の研究では、自由テキストの説明が意思決定に十分な情報を提供していないことが示されている。
これらの事実はEtPモデルの有効性に疑問を投げかけた。
本稿では,pte(predicter-then-explain)アーキテクチャはモデリングの観点からより効率的なアプローチであると主張する。
私たちの主な貢献は2つです。
まず、PtE構造は説明データが不足している場合に最もデータ効率のよい手法であることを示す。
第2に,PtE構造はEtP構造よりもトレーニング効率が良いことを明らかにする。
また,理論上の利点を確認する実験結果を提供する。
関連論文リスト
- XForecast: Evaluating Natural Language Explanations for Time Series Forecasting [72.57427992446698]
時系列予測は、特に正確な予測に依存するステークホルダーにとって、意思決定を支援する。
伝統的に説明可能なAI(XAI)メソッドは、機能や時間的重要性を基盤とするものであり、専門家の知識を必要とすることが多い。
時系列データにおける複雑な因果関係のため,予測NLEの評価は困難である。
論文 参考訳(メタデータ) (2024-10-18T05:16:39Z) - Explainability for Machine Learning Models: From Data Adaptability to
User Perception [0.8702432681310401]
この論文は、すでにデプロイされた機械学習モデルに対する局所的な説明の生成を探求する。
データとユーザ要件の両方を考慮して、意味のある説明を生み出すための最適な条件を特定することを目的としている。
論文 参考訳(メタデータ) (2024-02-16T18:44:37Z) - Show Me How It's Done: The Role of Explanations in Fine-Tuning Language
Models [0.45060992929802207]
言語モデルの性能を向上させるために,説明付き微調整を用いることによる重要な利点を示す。
私たちは、6000万のパラメータしか持たない小さな言語モデルでさえ、このアプローチからかなり恩恵を受けていることに気付きました。
論文 参考訳(メタデータ) (2024-02-12T10:11:50Z) - Explaining the Model and Feature Dependencies by Decomposition of the
Shapley Value [3.0655581300025996]
共有値は、複雑なモデルをエンドユーザに説明するためのゴートメソッドの1つになっています。
欠点の1つは、いくつかの機能が欠けている場合、常にモデルの出力を必要とすることである。
しかし、これは非自明な選択をもたらす: 未知の機能に条件を付けるか、しないか?
本稿では,両説明を組み合わせ,選択の負担を軽減し,シェープリー値の説明力を高めるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-19T12:20:23Z) - Robust Ante-hoc Graph Explainer using Bilevel Optimization [0.7999703756441758]
グラフニューラルネットワークのための新鮮でフレキシブルなアンテホック説明器 RAGE を提案する。
RAGEは、予測に必要な完全な情報を含む分子サブ構造を効果的に識別することができる。
種々の分子分類タスクに関する実験により、RAGEの説明は既存のポストホック法やアンテホック法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-05-25T05:50:38Z) - BELLA: Black box model Explanations by Local Linear Approximations [10.05944106581306]
我々は、回帰ブラックボックスモデルの個々の予測を説明するために、決定論的モデルに依存しないポストホックアプローチであるBELLAを提案する。
BELLAは特徴空間で訓練された線形モデルという形で説明を提供する。
BELLAは事実と反事実の両方を説明することができる。
論文 参考訳(メタデータ) (2023-05-18T21:22:23Z) - Learning to Scaffold: Optimizing Model Explanations for Teaching [74.25464914078826]
我々は3つの自然言語処理とコンピュータビジョンタスクのモデルを訓練する。
筆者らは,本フレームワークで抽出した説明文を学習した学生が,従来の手法よりもはるかに効果的に教師をシミュレートできることを発見した。
論文 参考訳(メタデータ) (2022-04-22T16:43:39Z) - Towards Interpretable Natural Language Understanding with Explanations
as Latent Variables [146.83882632854485]
そこで本研究では,人間に注釈付き説明文の小さなセットだけを必要とする自然言語理解の枠組みを構築した。
我々のフレームワークは、ニューラルネットワークの基本的な推論過程をモデル化する潜在変数として、自然言語の説明を扱う。
論文 参考訳(メタデータ) (2020-10-24T02:05:56Z) - Leakage-Adjusted Simulatability: Can Models Generate Non-Trivial
Explanations of Their Behavior in Natural Language? [86.60613602337246]
我々はNL説明を評価するためのリーク調整シミュラビリティ(LAS)指標を提案する。
LASは、どのように説明が直接アウトプットをリークするかを制御しながら、オブザーバがモデルのアウトプットを予測するのに役立つかを計測する。
マルチエージェントゲームとしての説明文生成を行い、ラベルリークをペナライズしながら、シミュラビリティの説明を最適化する。
論文 参考訳(メタデータ) (2020-10-08T16:59:07Z) - The Struggles of Feature-Based Explanations: Shapley Values vs. Minimal
Sufficient Subsets [61.66584140190247]
機能に基づく説明は、自明なモデルでも問題を引き起こすことを示す。
そこで本研究では,2つの一般的な説明書クラスであるシェープリー説明書と十分最小限の部分集合説明書が,基本的に異なる基底的説明書のタイプをターゲットにしていることを示す。
論文 参考訳(メタデータ) (2020-09-23T09:45:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。