論文の概要: RELIC: Retrieving Evidence for Literary Claims
- arxiv url: http://arxiv.org/abs/2203.10053v1
- Date: Fri, 18 Mar 2022 16:56:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-21 14:22:57.826248
- Title: RELIC: Retrieving Evidence for Literary Claims
- Title(参考訳): Relic: 文学的主張の証拠を取得する
- Authors: Katherine Thai, Yapei Chang, Kalpesh Krishna, and Mohit Iyyer
- Abstract要約: 文献証拠検索の新たな課題を定式化するために,78Kの文献引用の大規模データセットを用いた。
本稿では,既存の事前学習情報検索基準よりも優れたRoBERTaを用いた高密度経路検索手法を提案する。
- 参考スコア(独自算出の注目度): 29.762552250403544
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humanities scholars commonly provide evidence for claims that they make about
a work of literature (e.g., a novel) in the form of quotations from the work.
We collect a large-scale dataset (RELiC) of 78K literary quotations and
surrounding critical analysis and use it to formulate the novel task of
literary evidence retrieval, in which models are given an excerpt of literary
analysis surrounding a masked quotation and asked to retrieve the quoted
passage from the set of all passages in the work. Solving this retrieval task
requires a deep understanding of complex literary and linguistic phenomena,
which proves challenging to methods that overwhelmingly rely on lexical and
semantic similarity matching. We implement a RoBERTa-based dense passage
retriever for this task that outperforms existing pretrained information
retrieval baselines; however, experiments and analysis by human domain experts
indicate that there is substantial room for improvement over our dense
retriever.
- Abstract(参考訳): 人文科学の学者は一般的に、作品からの引用の形で文学作品(例:小説)に関する主張の証拠を提供している。
78kの文学的引用とその周辺における批判的分析の大規模データセット(relic)を収集し,それを用いて文学的証拠検索の新たなタスクを定式化し,マスキングされた引用を取り囲む文学的分析の抜粋をモデルに与え,引用文を作品中の全節の組から取り出すように求めた。
この検索課題を解決するには、複雑な文学現象と言語現象の深い理解が必要であり、語彙的および意味的類似性マッチングに圧倒的に依存する手法に挑戦することが証明されている。
本稿では,既存の事前学習情報検索ベースラインよりも優れたRoBERTaを用いた高密度パスレトリバーを実装するが,人間ドメインの専門家による実験と分析により,高密度検索よりも大幅に改善の余地があることが示唆された。
関連論文リスト
- ChatCite: LLM Agent with Human Workflow Guidance for Comparative
Literature Summary [30.409552944905915]
ChatCiteは、人間によるワークフローガイダンスを備えたLLMエージェントで、比較文学の要約を提供する。
ChatCiteエージェントは実験において様々な次元で他のモデルよりも優れていた。
ChatCiteが生成した文献要約は、文学レビューの起草にも直接使用することができる。
論文 参考訳(メタデータ) (2024-03-05T01:13:56Z) - Explaining Relationships Among Research Papers [14.223038413516685]
本稿では,よりリッチな引用テキストを生成するための機能ベースのLLMプロンプト手法を提案する。
人間の好みと統合的書き方の間には強い相関関係がみられ,高いレベルの抽象的引用を好むことが示唆された。
論文 参考訳(メタデータ) (2024-02-20T23:38:39Z) - Plot Retrieval as an Assessment of Abstract Semantic Association [131.58819293115124]
Plot Retrievalのテキストペアは単語の重複を少なくし、より抽象的なセマンティックアソシエーションを持つ。
Plot Retrievalは、IRモデルのセマンティックアソシエーションモデリング能力に関するさらなる研究のベンチマークとなる。
論文 参考訳(メタデータ) (2023-11-03T02:02:43Z) - Finding Already Debunked Narratives via Multistage Retrieval: Enabling
Cross-Lingual, Cross-Dataset and Zero-Shot Learning [6.094795148759833]
本稿では,物語の言語横断的検索を可能にする新しいデータセットを作成する。
このタスクのために、細調整およびオフザシェルフの多言語事前訓練トランスフォーマーモデルをベンチマークする実験を提示する。
また、この言語横断的なデバンク検索タスクを洗練と再格付けの段階に分割する新しい多段階フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-10T16:33:17Z) - Revisiting the Roles of "Text" in Text Games [102.22750109468652]
本稿では,強化学習におけるテキストの役割について検討する。
本稿では,関連するコンテキスト情報を近似状態ハッシュに抽出する簡単な手法を提案する。
このような軽量なプラグインは最先端のテキストエージェントとの競合性能を実現する。
論文 参考訳(メタデータ) (2022-10-15T21:52:39Z) - A Latent-Variable Model for Intrinsic Probing [94.61336186402615]
固有プローブ構築のための新しい潜在変数定式化を提案する。
我々は、事前訓練された表現が言語間交互に絡み合ったモルフォシンタクスの概念を発達させる経験的証拠を見出した。
論文 参考訳(メタデータ) (2022-01-20T15:01:12Z) - Phrase Retrieval Learns Passage Retrieval, Too [77.57208968326422]
文節検索が,文節や文書を含む粗いレベルの検索の基盤となるかを検討する。
句検索システムでは,句検索の精度が向上し,句検索の精度が向上していることを示す。
また,句のフィルタリングやベクトル量子化により,インデックスのサイズを4~10倍に削減できることを示す。
論文 参考訳(メタデータ) (2021-09-16T17:42:45Z) - Sensing Ambiguity in Henry James' "The Turn of the Screw" [0.8528384027684192]
この研究は、計算テキスト分析と文芸分析を組み合わせて、特定のテキストにおけるあいまいさが意味を形成する上で重要な役割を担っているかを示す。
我々は、ヘンリー・ジェームズの19世紀の小説『ザ・ターン・オブ・ザ・スクリュー』におけるあいまいさの役割について、人文科学でよく知られた議論を再考する。
我々は,コサインの類似性と単語移動者の距離が,最も微妙な文体におけるあいまいさを検出するのに十分敏感であることを示す。
論文 参考訳(メタデータ) (2020-11-21T17:53:41Z) - Positioning yourself in the maze of Neural Text Generation: A
Task-Agnostic Survey [54.34370423151014]
本稿では, ストーリーテリング, 要約, 翻訳など, 世代ごとのタスクインパクトをリレーする手法の構成要素について検討する。
本稿では,学習パラダイム,事前学習,モデリングアプローチ,復号化,各分野における重要な課題について,命令的手法の抽象化を提案する。
論文 参考訳(メタデータ) (2020-10-14T17:54:42Z) - Explaining Relationships Between Scientific Documents [55.23390424044378]
本稿では,2つの学術文書間の関係を自然言語テキストを用いて記述する課題に対処する。
本稿では154K文書から622Kサンプルのデータセットを作成する。
論文 参考訳(メタデータ) (2020-02-02T03:54:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。