論文の概要: Graph Representation of Narrative Context: Coherence Dependency via
Retrospective Questions
- arxiv url: http://arxiv.org/abs/2402.13551v1
- Date: Wed, 21 Feb 2024 06:14:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-22 16:42:23.110616
- Title: Graph Representation of Narrative Context: Coherence Dependency via
Retrospective Questions
- Title(参考訳): ナラティブコンテキストのグラフ表現:ふりかえり質問によるコヒーレンス依存性
- Authors: Liyan Xu, Jiangnan Li, Mo Yu, Jie Zhou
- Abstract要約: NARCOと呼ばれる物語にグラフを定式化し、コンテキスト全体のタスク非依存のコヒーレンス依存性を記述する。
本稿では,その実用性について3つの研究を行い,リキャップ識別によるエッジの有効性,プロット検索によるローカルコンテキスト拡張,長期文書QAで実証された広範囲なアプリケーションについて検討する。
- 参考スコア(独自算出の注目度): 52.639576570257404
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work introduces a novel and practical paradigm for narrative
comprehension, stemming from the observation that individual passages within
narratives are often cohesively related than being isolated. We therefore
propose to formulate a graph upon narratives dubbed NARCO that depicts a
task-agnostic coherence dependency of the entire context. Especially, edges in
NARCO encompass retrospective free-form questions between two context snippets
reflecting high-level coherent relations, inspired by the cognitive perception
of humans who constantly reinstate relevant events from prior context.
Importantly, our graph is instantiated through our designed two-stage LLM
prompting, thereby without reliance on human annotations. We present three
unique studies on its practical utility, examining the edge efficacy via recap
identification, local context augmentation via plot retrieval, and broader
applications exemplified by long document QA. Experiments suggest that our
approaches leveraging NARCO yield performance boost across all three tasks.
- Abstract(参考訳): この本は、物語の中の個々の節はしばしば孤立するよりも結合的に関連しているという観察から生まれた、物語理解のための新奇で実践的なパラダイムを紹介している。
そこで本研究では,NARCOと呼ばれる,タスクに依存しないコンテキスト全体のコヒーレンス依存性を記述したナラティブにグラフを定式化することを提案する。
特に、narcoのエッジは、2つのコンテキストスニペットがハイレベルなコヒーレントな関係を反映した自由形式の質問を包含している。
重要なのは、当社のグラフが設計した2段階のllmプロンプトを通じてインスタンス化されることです。
本稿では,その実用性について,再カプセル識別によるエッジの有効性,プロット検索によるローカルコンテキスト拡張,長期文書QAで実証された広範なアプリケーションについて検討する。
実験の結果,NARCOを活用することで,3つのタスクにまたがって性能が向上することが示唆された。
関連論文リスト
- Large Language Models Fall Short: Understanding Complex Relationships in
Detective Narratives [21.297972871264744]
我々は,刑事談話から複雑な文字関係グラフを抽出し,解析するための新しいベンチマークであるConanを導入する。
具体的には、階層的な関係カテゴリを設計し、様々なキャラクターの視点から手動で役割指向関係を抽出し、注釈付けした。
GPT-3.5やGPT-4、Llama2といった先進言語モデル(LLM)を用いた実験は、複雑な関係を推論し、より長い物語を扱う際の限界を明らかにします。
論文 参考訳(メタデータ) (2024-02-16T19:59:45Z) - Improving Vision-and-Language Reasoning via Spatial Relations Modeling [30.477235227733928]
ビジュアルコモンセンス推論(VCR)は、難しいマルチモーダルタスクである。
提案手法は,より空間的な文脈を維持するために表現を導くことができる。
VCRと他の2つの視覚・言語推論タスクであるVQAとNLVRについて、最先端の結果を得る。
論文 参考訳(メタデータ) (2023-11-09T11:54:55Z) - DiPlomat: A Dialogue Dataset for Situated Pragmatic Reasoning [89.92601337474954]
プラグマティック推論は、実生活における会話でしばしば起こる暗黙の意味を解読する上で重要な役割を担っている。
そこで我々は,現実的な推論と会話理解の場所に関するマシンの能力のベンチマークを目的とした,新しい挑戦であるDiPlomatを紹介した。
論文 参考訳(メタデータ) (2023-06-15T10:41:23Z) - Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual
Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。
既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。
本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文 参考訳(メタデータ) (2023-05-12T00:13:17Z) - elBERto: Self-supervised Commonsense Learning for Question Answering [131.51059870970616]
本稿では、市販QAモデルアーキテクチャと互換性のあるコモンセンスフレームワークの自己教師型双方向表現学習を提案する。
このフレームワークは5つの自己教師型タスクから構成されており、リッチコモンセンスを含むコンテキストから追加のトレーニング信号を完全に活用するようモデルに強制する。
elBERtoは、単純な語彙的類似性比較が役に立たないような、アウト・オブ・パラグラフや非エフェクトな問題に対して、大幅に改善されている。
論文 参考訳(メタデータ) (2022-03-17T16:23:45Z) - Self-supervised Contrastive Cross-Modality Representation Learning for
Spoken Question Answering [29.545937716796082]
音声質問応答 (SQA) は、音声文書と質問の両方をきめ細かな理解を必要とする。
本稿では,自己指導型学習段階とコントラッシブな表現学習段階を併用した音声質問応答のための新しい学習手法を提案する。
本モデルでは,3つのSQAベンチマークの最先端結果が得られた。
論文 参考訳(メタデータ) (2021-09-08T01:13:14Z) - Aspect Sentiment Triplet Extraction Using Reinforcement Learning [14.21689018940387]
本稿では、表現された感情の議論として、アスペクトと意見項に関する新しいパラダイムASTE-RLを提案する。
まず、文章で表現された感情に注目し、その感情に対する対象的側面と意見条件を特定します。
このことは、探索とサンプル効率を改善しながら、三重項の成分間の相互相互作用を考慮に入れている。
論文 参考訳(メタデータ) (2021-08-13T07:38:48Z) - Weakly-Supervised Spatio-Temporal Anomaly Detection in Surveillance
Video [128.41392860714635]
Weakly-Supervised Snoma-Temporally Detection (WSSTAD) を監視ビデオに導入する。
WSSTADは異常事象を封止する時空間管(すなわち連続する境界ボックスのシーケンス)をローカライズすることを目的としている。
本稿では,空間的・時間的領域に複数粒度を持つ入力提案を行うデュアルブランチネットワークを提案する。
論文 参考訳(メタデータ) (2021-08-09T06:11:14Z) - Narrative Maps: An Algorithmic Approach to Represent and Extract
Information Narratives [6.85316573653194]
本稿では、物語表現の理論と現代のオンラインシステムのデータを組み合わせる。
物語地図の表現は、物語の中の出来事と物語を、地図上のランドマークとルートのシリーズとして描いている。
我々の発見は、情報アナリスト、計算ジャーナリスト、誤情報研究者に影響を及ぼす。
論文 参考訳(メタデータ) (2020-09-09T18:30:44Z) - A Novel Attention-based Aggregation Function to Combine Vision and
Language [55.7633883960205]
本稿では,視覚と言語のための新しい完全適応型還元法を提案する。
具体的には,各モータリティの各要素のスコアの集合を,クロスアテンションの新たな変種を用いて計算する。
我々は、画像テキストマッチングと視覚的質問応答のアプローチを試行し、他の縮小選択と公正な比較を構築した。
論文 参考訳(メタデータ) (2020-04-27T18:09:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。