Fugu-MT 論文翻訳(概要): Benchmarking Machine Reading Comprehension: A Psychological Perspective

論文の概要: Benchmarking Machine Reading Comprehension: A Psychological Perspective

arxiv url: http://arxiv.org/abs/2004.01912v2
Date: Tue, 26 Jan 2021 12:06:28 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-16 23:00:41.120390
Title: Benchmarking Machine Reading Comprehension: A Psychological Perspective
Title（参考訳）: ベンチマークマシン読解 : 心理学的視点
Authors: Saku Sugawara, Pontus Stenetorp, Akiko Aizawa
Abstract要約: 機械学習理解(MRC)は自然言語理解のベンチマークとして注目されている。 MRCの従来のタスク設計は、モデル解釈以上の説明可能性に欠けていた。本稿では,心理学と心理指標に基づくMRCデータセットの設計に関する理論的基礎を提供する。
参考スコア（独自算出の注目度）: 45.85089157315507
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Machine reading comprehension (MRC) has received considerable attention as a benchmark for natural language understanding. However, the conventional task design of MRC lacks explainability beyond the model interpretation, i.e., reading comprehension by a model cannot be explained in human terms. To this end, this position paper provides a theoretical basis for the design of MRC datasets based on psychology as well as psychometrics, and summarizes it in terms of the prerequisites for benchmarking MRC. We conclude that future datasets should (i) evaluate the capability of the model for constructing a coherent and grounded representation to understand context-dependent situations and (ii) ensure substantive validity by shortcut-proof questions and explanation as a part of the task design.
Abstract（参考訳）: 機械学習理解(MRC)は自然言語理解のベンチマークとして注目されている。しかし、従来のRCのタスク設計では、モデル解釈以外の説明可能性、すなわちモデルによる理解を読むことは人間の言葉では説明できない。この目的のために,本稿では,心理学と心理指標に基づくMRCデータセットの設計に関する理論的基礎を提供し,MCCベンチマークの前提条件として要約する。将来のデータセットは、 (i)文脈依存の状況を理解するためのコヒーレントかつ接地表現の構築におけるモデルの能力の評価二タスク設計の一環として、ショートカット型質問及び説明による実体的妥当性を確保すること。

関連論文リスト

Modeling Open-World Cognition as On-Demand Synthesis of Probabilistic Models [93.1043186636177]
我々は、人々が分散表現と象徴表現の組み合わせを使って、新しい状況に合わせた見知らぬ精神モデルを構築するという仮説を探求する。モデル合成アーキテクチャ」という概念の計算的実装を提案する。我々は、新しい推論データセットに基づく人間の判断のモデルとして、MSAを評価した。
論文参考訳（メタデータ） (2025-07-16T18:01:03Z)
Information Science Principles of Machine Learning: A Causal Chain Meta-Framework Based on Formalized Information Mapping [1.145820303039203]
本研究は、機械学習における統一的な論理的枠組みの欠如に対処することに焦点を当てる。モデル解釈可能性と倫理的安全性に関する普遍的な定義が提案されている。 3つの重要な定理は、モデル解釈可能性と情報回復可能性の等価性、倫理的安全性の保証、一般化誤差の推定である。
論文参考訳（メタデータ） (2025-05-19T14:39:41Z)
The Foundations of Tokenization: Statistical and Computational Concerns [51.370165245628975]
トークン化は、NLPパイプラインにおける重要なステップである。 NLPにおける標準表現法としての重要性は認識されているが、トークン化の理論的基盤はまだ完全には理解されていない。本稿では,トークン化モデルの表現と解析のための統一的な形式的枠組みを提案することによって,この理論的ギャップに対処することに貢献している。
論文参考訳（メタデータ） (2024-07-16T11:12:28Z)
Self-supervised Interpretable Concept-based Models for Text Classification [9.340843984411137]
本稿では,自己教師型解釈可能な概念埋め込みモデル(ICEM)を提案する。我々は,大規模言語モデルの一般化能力を活用し,概念ラベルを自己管理的に予測する。 ICEMは、完全に教師されたコンセプトベースモデルやエンドツーエンドのブラックボックスモデルと同じようなパフォーマンスを達成するために、自己管理的な方法でトレーニングすることができる。
論文参考訳（メタデータ） (2024-06-20T14:04:53Z)
Towards a Unified Framework for Evaluating Explanations [0.6138671548064356]
我々は、モデルと利害関係者の間の仲介者として、本質的に解釈可能なモデルであれ、不透明なブラックボックスモデルであれ、説明が役立ちます。本稿では,学習者の行動を予測するための解釈可能なニューラルネットワークの例を用いて,これらの基準と具体的な評価手法について述べる。
論文参考訳（メタデータ） (2024-05-22T21:49:28Z)
Interpreting Pretrained Language Models via Concept Bottlenecks [55.47515772358389]
事前訓練された言語モデル(PLM)は、様々な自然言語処理タスクにおいて大きな進歩を遂げてきた。ブラックボックスの性質による解釈可能性の欠如は、責任ある実装に課題をもたらす。本研究では,人間にとって理解しやすい高レベルで有意義な概念を用いて,PLMを解釈する新しい手法を提案する。
論文参考訳（メタデータ） (2023-11-08T20:41:18Z)
Explainability for Large Language Models: A Survey [59.67574757137078]
大規模言語モデル(LLM)は、自然言語処理における印象的な能力を示している。本稿では,トランスフォーマーに基づく言語モデルを記述する手法について,説明可能性の分類法を紹介した。
論文参考訳（メタデータ） (2023-09-02T22:14:26Z)
Relational Concept Bottleneck Models [13.311396882130033]
概念ボトルネックモデル(CBM)は問題を解決するために設計されていない。 R-CBMは標準CBMとリレーショナルGNNの両方を表現できる。特に,R-CBMが概念に基づく説明の生成を支援することを示す。
論文参考訳（メタデータ） (2023-08-23T08:25:33Z)
ExSum: From Local Explanations to Model Understanding [6.23934576145261]
ブラックボックスモデルの動作メカニズムを理解するために,解釈可能性法を開発した。この目標をフルフィルするには、これらのメソッドによって生成された説明が正しいことと、人々が容易に確実に理解できることの両方が必要である。本稿では,モデル理解の定量化のための数学的枠組みである説明要約(ExSum)を紹介する。
論文参考訳（メタデータ） (2022-04-30T02:07:20Z)
Explainability in Process Outcome Prediction: Guidelines to Obtain Interpretable and Faithful Models [77.34726150561087]
本稿では、プロセス結果予測の分野における説明可能性モデルと説明可能性モデルの忠実性を通して、説明可能性を定義する。本稿では,イベントログの仕様に基づいて適切なモデルを選択することのできる,X-MOPというガイドラインのセットを提案する。
論文参考訳（メタデータ） (2022-03-30T05:59:50Z)
Multilingual Multi-Aspect Explainability Analyses on Machine Reading Comprehension Models [76.48370548802464]
本稿では,マルチヘッド自己注意と最終MRCシステム性能の関係を検討するために,一連の解析実験を実施することに焦点を当てる。問合せ及び問合せ理解の注意が問合せプロセスにおいて最も重要なものであることが判明した。包括的可視化とケーススタディを通じて、注意マップに関するいくつかの一般的な知見も観察し、これらのモデルがどのように問題を解くかを理解するのに役立ちます。
論文参考訳（メタデータ） (2021-08-26T04:23:57Z)
Understanding Interpretability by generalized distillation in Supervised Classification [3.5473853445215897]
最近の解釈戦略は、複雑な機械学習モデルの根底にある決定メカニズムの人間の理解に焦点を当てている。本稿では,他のMLモデルと相対的に定義される解釈・蒸留式を提案する。 MNIST、Fashion-MNIST、Stanford40データセットに関する提案フレームワークの評価を行った。
論文参考訳（メタデータ） (2020-12-05T17:42:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。