Fugu-MT 論文翻訳(概要): RELIC: Retrieving Evidence for Literary Claims

論文の概要: RELIC: Retrieving Evidence for Literary Claims

arxiv url: http://arxiv.org/abs/2203.10053v1
Date: Fri, 18 Mar 2022 16:56:08 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-21 14:22:57.826248
Title: RELIC: Retrieving Evidence for Literary Claims
Title（参考訳）: Relic: 文学的主張の証拠を取得する
Authors: Katherine Thai, Yapei Chang, Kalpesh Krishna, and Mohit Iyyer
Abstract要約: 文献証拠検索の新たな課題を定式化するために,78Kの文献引用の大規模データセットを用いた。本稿では,既存の事前学習情報検索基準よりも優れたRoBERTaを用いた高密度経路検索手法を提案する。
参考スコア（独自算出の注目度）: 29.762552250403544
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Humanities scholars commonly provide evidence for claims that they make about a work of literature (e.g., a novel) in the form of quotations from the work. We collect a large-scale dataset (RELiC) of 78K literary quotations and surrounding critical analysis and use it to formulate the novel task of literary evidence retrieval, in which models are given an excerpt of literary analysis surrounding a masked quotation and asked to retrieve the quoted passage from the set of all passages in the work. Solving this retrieval task requires a deep understanding of complex literary and linguistic phenomena, which proves challenging to methods that overwhelmingly rely on lexical and semantic similarity matching. We implement a RoBERTa-based dense passage retriever for this task that outperforms existing pretrained information retrieval baselines; however, experiments and analysis by human domain experts indicate that there is substantial room for improvement over our dense retriever.
Abstract（参考訳）: 人文科学の学者は一般的に、作品からの引用の形で文学作品(例:小説)に関する主張の証拠を提供している。 78kの文学的引用とその周辺における批判的分析の大規模データセット(relic)を収集し,それを用いて文学的証拠検索の新たなタスクを定式化し,マスキングされた引用を取り囲む文学的分析の抜粋をモデルに与え,引用文を作品中の全節の組から取り出すように求めた。この検索課題を解決するには、複雑な文学現象と言語現象の深い理解が必要であり、語彙的および意味的類似性マッチングに圧倒的に依存する手法に挑戦することが証明されている。本稿では,既存の事前学習情報検索ベースラインよりも優れたRoBERTaを用いた高密度パスレトリバーを実装するが,人間ドメインの専門家による実験と分析により,高密度検索よりも大幅に改善の余地があることが示唆された。

関連論文リスト

WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research [73.58638285105971]
本稿では,AIエージェントが膨大なWebスケール情報を洞察に富むレポートに合成しなければならない複雑な課題であるtextbfopen-ended Deep Research (OEDR) に取り組む。人間の研究プロセスをエミュレートする新しいデュアルエージェントフレームワークである textbfWebWeaver を紹介する。私たちのフレームワークは、DeepResearch Bench、DeepConsult、DeepResearchGymなど、主要なOEDRベンチマークにまたがる最先端の新たなベンチマークを確立しています。
論文参考訳（メタデータ） (2025-09-16T17:57:21Z)
CASPER: Concept-integrated Sparse Representation for Scientific Retrieval [17.680327408224237]
本稿では,トークンとキーフレーズを表現単位とする科学検索のためのスパース検索モデルであるCASPERを提案する。 CASPERはキーフレーズ生成タスクに効果的に利用でき、確立されたCopyRNNとの競合性能を実現する。
論文参考訳（メタデータ） (2025-08-18T23:00:57Z)
Structuralist Approach to AI Literary Criticism: Leveraging Greimas Semiotic Square for Large Language Models [2.7323591332394166]
GLASS (Greimas Literary Analysis via Semiotic Square) は、Greimas Semiotic Square (GSS) に基づく構造化分析フレームワークである。 GLASSは物語構造と物語作品における深い意味の素早い分離を促進する。この研究は、文芸研究と教育のためのAIベースのツールを提供し、文芸エンゲージメントの基礎となる認知メカニズムに関する洞察を提供する。
論文参考訳（メタデータ） (2025-06-26T15:10:24Z)
Literary Evidence Retrieval via Long-Context Language Models [39.174955595897366]
現代長文言語モデルは、文学的フィクションをどの程度理解しているか? 一次資料の全文をLCMに提供し,その著作からの引用を欠いた文芸的批判を伴って評価するベンチマークを構築した。この設定は、グローバルな物語推論と密接なテキスト検定の両方を行うモデルを必要とすることによって、文学的分析の人間の過程を反映している。
論文参考訳（メタデータ） (2025-06-03T17:19:45Z)
Tell, Don't Show: Leveraging Language Models' Abstractive Retellings to Model Literary Themes [9.471374217162843]
本稿では,文学のためのシンプルなトピックモデリング手法であるRetellを提案する。我々は,資源効率のよい生成言語モデル(LM)に,どのパスを示すかを示すよう促す。
論文参考訳（メタデータ） (2025-05-29T06:59:21Z)
Patience is all you need! An agentic system for performing scientific literature review [0.0]
大規模言語モデル(LLM)は、様々な分野にわたる質問応答のサポートを提供するために、その利用が増加している。我々は、科学文献にカプセル化された情報の検索と蒸留を行うLLMベースのシステムを構築した。提案するキーワードに基づく検索・情報蒸留システムについて, 生物関連質問の集合に対して, 先行する文献ベンチマークを用いて評価を行った。
論文参考訳（メタデータ） (2025-03-28T08:08:46Z)
CERD: A Comprehensive Chinese Rhetoric Dataset for Rhetorical Understanding and Generation in Essays [30.728539221991188]
既存の修辞的データセットやコーパスは主に単一の粗いカテゴリや細かいカテゴリに焦点を当てている。提案手法は,4つの大まかなカテゴリからなる中国エッセイレトリックデータセット(CERD)を提案する。 CERDは、手動で注釈付きで包括的な中国の修辞的データセットで、5つの相互関連サブタスクがある。
論文参考訳（メタデータ） (2024-09-29T12:47:25Z)
Says Who? Effective Zero-Shot Annotation of Focalization [0.0]
物語が提示される視点であるフォカライゼーションは、幅広い語彙文法的特徴を通じて符号化される。本研究では,同時代のLarge Language Models (LLMs) が,文章のアノテート時にいかに機能するかを検証する実験を行う。
論文参考訳（メタデータ） (2024-09-17T17:50:15Z)
Analysis of Plan-based Retrieval for Grounded Text Generation [78.89478272104739]
幻覚は、言語モデルがそのパラメトリック知識の外で生成タスクが与えられるときに起こる。この制限に対処するための一般的な戦略は、言語モデルに検索メカニズムを注入することである。我々は,幻覚の頻度をさらに減少させるために,探索のガイドとして計画をどのように利用できるかを分析する。
論文参考訳（メタデータ） (2024-08-20T02:19:35Z)
CADS: A Systematic Literature Review on the Challenges of Abstractive Dialogue Summarization [7.234196390284036]
本稿では、英語対話におけるトランスフォーマーに基づく抽象要約に関する研究を要約する。ダイアログ要約における主な課題(言語、構造、理解、話者、サリエンス、事実)をカバーします。言語などいくつかの課題がかなりの進歩を遂げているのに対して、理解、事実性、サリエンスといった課題は依然として困難であり、重要な研究機会を持っている。
論文参考訳（メタデータ） (2024-06-11T17:30:22Z)
ChatCite: LLM Agent with Human Workflow Guidance for Comparative Literature Summary [30.409552944905915]
ChatCiteは、人間によるワークフローガイダンスを備えたLLMエージェントで、比較文学の要約を提供する。 ChatCiteエージェントは実験において様々な次元で他のモデルよりも優れていた。 ChatCiteが生成した文献要約は、文学レビューの起草にも直接使用することができる。
論文参考訳（メタデータ） (2024-03-05T01:13:56Z)
Revisiting the Roles of "Text" in Text Games [102.22750109468652]
本稿では,強化学習におけるテキストの役割について検討する。本稿では,関連するコンテキスト情報を近似状態ハッシュに抽出する簡単な手法を提案する。このような軽量なプラグインは最先端のテキストエージェントとの競合性能を実現する。
論文参考訳（メタデータ） (2022-10-15T21:52:39Z)
A Latent-Variable Model for Intrinsic Probing [93.62808331764072]
固有プローブ構築のための新しい潜在変数定式化を提案する。我々は、事前訓練された表現が言語間交互に絡み合ったモルフォシンタクスの概念を発達させる経験的証拠を見出した。
論文参考訳（メタデータ） (2022-01-20T15:01:12Z)
Phrase Retrieval Learns Passage Retrieval, Too [77.57208968326422]
文節検索が,文節や文書を含む粗いレベルの検索の基盤となるかを検討する。句検索システムでは,句検索の精度が向上し,句検索の精度が向上していることを示す。また,句のフィルタリングやベクトル量子化により,インデックスのサイズを4～10倍に削減できることを示す。
論文参考訳（メタデータ） (2021-09-16T17:42:45Z)
Sensing Ambiguity in Henry James' "The Turn of the Screw" [0.8528384027684192]
この研究は、計算テキスト分析と文芸分析を組み合わせて、特定のテキストにおけるあいまいさが意味を形成する上で重要な役割を担っているかを示す。我々は、ヘンリー・ジェームズの19世紀の小説『ザ・ターン・オブ・ザ・スクリュー』におけるあいまいさの役割について、人文科学でよく知られた議論を再考する。我々は,コサインの類似性と単語移動者の距離が,最も微妙な文体におけるあいまいさを検出するのに十分敏感であることを示す。
論文参考訳（メタデータ） (2020-11-21T17:53:41Z)
Positioning yourself in the maze of Neural Text Generation: A Task-Agnostic Survey [54.34370423151014]
本稿では, ストーリーテリング, 要約, 翻訳など, 世代ごとのタスクインパクトをリレーする手法の構成要素について検討する。本稿では,学習パラダイム,事前学習,モデリングアプローチ,復号化,各分野における重要な課題について,命令的手法の抽象化を提案する。
論文参考訳（メタデータ） (2020-10-14T17:54:42Z)
Explaining Relationships Between Scientific Documents [55.23390424044378]
本稿では,2つの学術文書間の関係を自然言語テキストを用いて記述する課題に対処する。本稿では154K文書から622Kサンプルのデータセットを作成する。
論文参考訳（メタデータ） (2020-02-02T03:54:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。