論文の概要: RELIC: Retrieving Evidence for Literary Claims
- arxiv url: http://arxiv.org/abs/2203.10053v1
- Date: Fri, 18 Mar 2022 16:56:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-21 14:22:57.826248
- Title: RELIC: Retrieving Evidence for Literary Claims
- Title(参考訳): Relic: 文学的主張の証拠を取得する
- Authors: Katherine Thai, Yapei Chang, Kalpesh Krishna, and Mohit Iyyer
- Abstract要約: 文献証拠検索の新たな課題を定式化するために,78Kの文献引用の大規模データセットを用いた。
本稿では,既存の事前学習情報検索基準よりも優れたRoBERTaを用いた高密度経路検索手法を提案する。
- 参考スコア(独自算出の注目度): 29.762552250403544
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humanities scholars commonly provide evidence for claims that they make about
a work of literature (e.g., a novel) in the form of quotations from the work.
We collect a large-scale dataset (RELiC) of 78K literary quotations and
surrounding critical analysis and use it to formulate the novel task of
literary evidence retrieval, in which models are given an excerpt of literary
analysis surrounding a masked quotation and asked to retrieve the quoted
passage from the set of all passages in the work. Solving this retrieval task
requires a deep understanding of complex literary and linguistic phenomena,
which proves challenging to methods that overwhelmingly rely on lexical and
semantic similarity matching. We implement a RoBERTa-based dense passage
retriever for this task that outperforms existing pretrained information
retrieval baselines; however, experiments and analysis by human domain experts
indicate that there is substantial room for improvement over our dense
retriever.
- Abstract(参考訳): 人文科学の学者は一般的に、作品からの引用の形で文学作品(例:小説)に関する主張の証拠を提供している。
78kの文学的引用とその周辺における批判的分析の大規模データセット(relic)を収集し,それを用いて文学的証拠検索の新たなタスクを定式化し,マスキングされた引用を取り囲む文学的分析の抜粋をモデルに与え,引用文を作品中の全節の組から取り出すように求めた。
この検索課題を解決するには、複雑な文学現象と言語現象の深い理解が必要であり、語彙的および意味的類似性マッチングに圧倒的に依存する手法に挑戦することが証明されている。
本稿では,既存の事前学習情報検索ベースラインよりも優れたRoBERTaを用いた高密度パスレトリバーを実装するが,人間ドメインの専門家による実験と分析により,高密度検索よりも大幅に改善の余地があることが示唆された。
関連論文リスト
- CERD: A Comprehensive Chinese Rhetoric Dataset for Rhetorical Understanding and Generation in Essays [30.728539221991188]
既存の修辞的データセットやコーパスは主に単一の粗いカテゴリや細かいカテゴリに焦点を当てている。
提案手法は,4つの大まかなカテゴリからなる中国エッセイレトリックデータセット(CERD)を提案する。
CERDは、手動で注釈付きで包括的な中国の修辞的データセットで、5つの相互関連サブタスクがある。
論文 参考訳(メタデータ) (2024-09-29T12:47:25Z) - Says Who? Effective Zero-Shot Annotation of Focalization [0.0]
物語が提示される視点であるフォカライゼーションは、幅広い語彙文法的特徴を通じて符号化される。
本研究では,同時代のLarge Language Models (LLMs) が,文章のアノテート時にいかに機能するかを検証する実験を行う。
論文 参考訳(メタデータ) (2024-09-17T17:50:15Z) - Analysis of Plan-based Retrieval for Grounded Text Generation [78.89478272104739]
幻覚は、言語モデルがそのパラメトリック知識の外で生成タスクが与えられるときに起こる。
この制限に対処するための一般的な戦略は、言語モデルに検索メカニズムを注入することである。
我々は,幻覚の頻度をさらに減少させるために,探索のガイドとして計画をどのように利用できるかを分析する。
論文 参考訳(メタデータ) (2024-08-20T02:19:35Z) - CADS: A Systematic Literature Review on the Challenges of Abstractive Dialogue Summarization [7.234196390284036]
本稿では、英語対話におけるトランスフォーマーに基づく抽象要約に関する研究を要約する。
ダイアログ要約における主な課題(言語、構造、理解、話者、サリエンス、事実)をカバーします。
言語などいくつかの課題がかなりの進歩を遂げているのに対して、理解、事実性、サリエンスといった課題は依然として困難であり、重要な研究機会を持っている。
論文 参考訳(メタデータ) (2024-06-11T17:30:22Z) - ChatCite: LLM Agent with Human Workflow Guidance for Comparative
Literature Summary [30.409552944905915]
ChatCiteは、人間によるワークフローガイダンスを備えたLLMエージェントで、比較文学の要約を提供する。
ChatCiteエージェントは実験において様々な次元で他のモデルよりも優れていた。
ChatCiteが生成した文献要約は、文学レビューの起草にも直接使用することができる。
論文 参考訳(メタデータ) (2024-03-05T01:13:56Z) - Revisiting the Roles of "Text" in Text Games [102.22750109468652]
本稿では,強化学習におけるテキストの役割について検討する。
本稿では,関連するコンテキスト情報を近似状態ハッシュに抽出する簡単な手法を提案する。
このような軽量なプラグインは最先端のテキストエージェントとの競合性能を実現する。
論文 参考訳(メタデータ) (2022-10-15T21:52:39Z) - A Latent-Variable Model for Intrinsic Probing [93.62808331764072]
固有プローブ構築のための新しい潜在変数定式化を提案する。
我々は、事前訓練された表現が言語間交互に絡み合ったモルフォシンタクスの概念を発達させる経験的証拠を見出した。
論文 参考訳(メタデータ) (2022-01-20T15:01:12Z) - Phrase Retrieval Learns Passage Retrieval, Too [77.57208968326422]
文節検索が,文節や文書を含む粗いレベルの検索の基盤となるかを検討する。
句検索システムでは,句検索の精度が向上し,句検索の精度が向上していることを示す。
また,句のフィルタリングやベクトル量子化により,インデックスのサイズを4~10倍に削減できることを示す。
論文 参考訳(メタデータ) (2021-09-16T17:42:45Z) - Sensing Ambiguity in Henry James' "The Turn of the Screw" [0.8528384027684192]
この研究は、計算テキスト分析と文芸分析を組み合わせて、特定のテキストにおけるあいまいさが意味を形成する上で重要な役割を担っているかを示す。
我々は、ヘンリー・ジェームズの19世紀の小説『ザ・ターン・オブ・ザ・スクリュー』におけるあいまいさの役割について、人文科学でよく知られた議論を再考する。
我々は,コサインの類似性と単語移動者の距離が,最も微妙な文体におけるあいまいさを検出するのに十分敏感であることを示す。
論文 参考訳(メタデータ) (2020-11-21T17:53:41Z) - Positioning yourself in the maze of Neural Text Generation: A
Task-Agnostic Survey [54.34370423151014]
本稿では, ストーリーテリング, 要約, 翻訳など, 世代ごとのタスクインパクトをリレーする手法の構成要素について検討する。
本稿では,学習パラダイム,事前学習,モデリングアプローチ,復号化,各分野における重要な課題について,命令的手法の抽象化を提案する。
論文 参考訳(メタデータ) (2020-10-14T17:54:42Z) - Explaining Relationships Between Scientific Documents [55.23390424044378]
本稿では,2つの学術文書間の関係を自然言語テキストを用いて記述する課題に対処する。
本稿では154K文書から622Kサンプルのデータセットを作成する。
論文 参考訳(メタデータ) (2020-02-02T03:54:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。