論文の概要: A Survey of Machine Narrative Reading Comprehension Assessments
- arxiv url: http://arxiv.org/abs/2205.00299v1
- Date: Sat, 30 Apr 2022 16:06:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-03 15:25:41.058783
- Title: A Survey of Machine Narrative Reading Comprehension Assessments
- Title(参考訳): 機械物語読解の包括的評価に関する調査
- Authors: Yisi Sang, Xiangyang Mou, Jing Li, Jeffrey Stanton, Mo Yu
- Abstract要約: 評価課題の主な類似点と相違点を抽出する類型論を提案する。
本稿では,新しいタスクデザインにおけるタイポロジーの影響と,物語読解の課題について論じる。
- 参考スコア(独自算出の注目度): 20.33600275496604
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As the body of research on machine narrative comprehension grows, there is a
critical need for consideration of performance assessment strategies as well as
the depth and scope of different benchmark tasks. Based on narrative theories,
reading comprehension theories, as well as existing machine narrative reading
comprehension tasks and datasets, we propose a typology that captures the main
similarities and differences among assessment tasks; and discuss the
implications of our typology for new task design and the challenges of
narrative reading comprehension.
- Abstract(参考訳): 機械物語理解研究の主体が拡大するにつれて、様々なベンチマークタスクの深さと範囲だけでなく、性能評価戦略について考慮する必要がある。
物語理論,読み解き理論,および既存の機械物語読解タスクとデータセットに基づいて,評価課題の主な類似点と相違点を捉え,新たなタスク設計における私たちのタイプがもたらす意味と,物語読解の課題について議論する。
関連論文リスト
- Argumentation and Machine Learning [4.064849471241967]
本章では,計算論と機械学習のクロス・フェーティフィケーションのある程度のアプローチを提示する研究の概要を紹介する。
これら2つの領域間の相互作用の目的を表す2つの広いテーマが同定された。
我々は,学習の種類や議論フレームワークの形式など,様々な次元にわたる作品のスペクトルを評価する。
論文 参考訳(メタデータ) (2024-10-31T08:19:58Z) - What Makes a Good Story and How Can We Measure It? A Comprehensive Survey of Story Evaluation [57.550045763103334]
ストーリーを評価することは、他の世代の評価タスクよりも難しい場合があります。
まず、テキスト・トゥ・テキスト、ビジュアル・トゥ・テキスト、テキスト・トゥ・ビジュアルといった既存のストーリーテリングタスクを要約する。
本研究では,これまで開発されてきた,あるいはストーリー評価に応用可能な評価指標を整理する分類法を提案する。
論文 参考訳(メタデータ) (2024-08-26T20:35:42Z) - Narrative Action Evaluation with Prompt-Guided Multimodal Interaction [60.281405999483]
ナラティブ・アクション・アセスメント(NAE)は、行動の実行を評価する専門家のコメントを作成することを目的としている。
NAEは、物語の柔軟性と評価の厳格さの両方を必要とするため、より困難なタスクです。
本稿では,様々な情報モダリティ間のインタラクションを容易にするための,プロンプト誘導型マルチモーダルインタラクションフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-22T17:55:07Z) - DiPlomat: A Dialogue Dataset for Situated Pragmatic Reasoning [89.92601337474954]
プラグマティック推論は、実生活における会話でしばしば起こる暗黙の意味を解読する上で重要な役割を担っている。
そこで我々は,現実的な推論と会話理解の場所に関するマシンの能力のベンチマークを目的とした,新しい挑戦であるDiPlomatを紹介した。
論文 参考訳(メタデータ) (2023-06-15T10:41:23Z) - DeltaScore: Fine-Grained Story Evaluation with Perturbations [69.33536214124878]
DELTASCOREは,ニュアンスストーリーの側面の評価に摂動技術を用いた新しい手法である。
私たちの中心的な命題は、物語が特定の側面(例えば、流感)で興奮する程度は、特定の摂動に対するその感受性の大きさと相関している、と仮定している。
事前学習言語モデルを用いて,前摂動状態と後摂動状態の確率差を計算することにより,アスペクトの品質を測定する。
論文 参考訳(メタデータ) (2023-03-15T23:45:54Z) - M-SENSE: Modeling Narrative Structure in Short Personal Narratives Using
Protagonist's Mental Representations [14.64546899992196]
本研究では,登場人物の心的状態の推測を解析し,物語構造の顕著な要素を自動的に検出するタスクを提案する。
本稿では,物語構造の主要な要素,特にクライマックスと解像度のマニュアルアノテーションを含む,短い個人物語のSTORIESデータセットを紹介する。
我々のモデルは、クライマックスと解像度を識別するタスクにおいて、大幅な改善を達成できる。
論文 参考訳(メタデータ) (2023-02-18T20:48:02Z) - Interpretability and Explainability: A Machine Learning Zoo Mini-tour [4.56877715768796]
解釈可能性と説明可能性は、医学、経済学、法学、自然科学における多くの機械学習および統計応用の中核にある。
本稿では,解釈可能性と説明可能性の相違を強調し,これら2つの研究方向について,その具体例を示す。
論文 参考訳(メタデータ) (2020-12-03T10:11:52Z) - Counterfactual Explanations for Machine Learning: A Review [5.908471365011942]
機械学習における対実的説明に関する研究をレビューし、分類する。
機械学習における対実的説明可能性に対する現代のアプローチは、多くの国で確立された法的教義と結びついている。
論文 参考訳(メタデータ) (2020-10-20T20:08:42Z) - Survey on Visual Sentiment Analysis [87.20223213370004]
本稿では、関連する出版物をレビューし、視覚知覚分析の分野の概要を概観する。
また,3つの視点から一般的な視覚知覚分析システムの設計原理について述べる。
様々なレベルの粒度と、異なる方法でイメージに対する感情に影響を与えるコンポーネントを考慮し、問題の定式化について論じる。
論文 参考訳(メタデータ) (2020-04-24T10:15:22Z) - Salience Estimation with Multi-Attention Learning for Abstractive Text
Summarization [86.45110800123216]
テキスト要約のタスクでは、単語、フレーズ、文のサリエンス推定が重要な要素である。
本稿では,サラレンス推定のための2つの新しい注目学習要素を含むマルチアテンション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-07T02:38:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。