論文の概要: 'The Order in the Horse's Heart': A Case Study in LLM-Assisted Stylometry for the Discovery of Biblical Allusion in Modern Literary Fiction
- arxiv url: http://arxiv.org/abs/2604.19447v1
- Date: Tue, 21 Apr 2026 13:26:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.783147
- Title: 'The Order in the Horse's Heart': A Case Study in LLM-Assisted Stylometry for the Discovery of Biblical Allusion in Modern Literary Fiction
- Title(参考訳): 「馬の心の秩序」 : 現代文学における聖書の暗示の発見のためのLCM支援スティロメトリーの事例研究
- Authors: Ewan Cameron,
- Abstract要約: 本稿では,コーマック・マッカーシー(Cormac McCarthy)の小説に適用する。
ボトムアップ埋め込みトラックは、逆文書周波数を使用して、キングジェームズ聖書と共有される稀な語彙を識別する。
トップダウンレジスタトラックは、比較のために、マッカーシーの散文を特定の聖書の通路で読み取るようLLMに要求する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a dual-track pipeline for detecting biblical allusions in literary fiction and apply it to the novels of Cormac McCarthy. A bottom-up embedding track uses inverse document frequency to identify rare vocabulary shared with the King James Bible, embeds occurrences in their local context for sense disambiguation, and passes candidate passage pairs through cascaded LLM review. A top-down register track asks an LLM to read McCarthy's prose undirected to any specific biblical passage for comparison, catching allusions not distinguished by word or phrase rarity. Both tracks are cross-validated by a long-context model that holds entire novels alongside the KJV in a single pass, and every finding is checked against published scholarship. Restricting attention to allusions that carry a textual echo--shared phrasing, reworked vocabulary, or transplanted cadence--and distinguishing literary allusions proper from signposted biblical references (similes naming biblical figures, characters overtly citing scripture), the pipeline surfaces 349 allusions across the corpus. Among a target set of 115 previously documented allusions retrieved through human review of the academic literature, the pipeline independently recovers 62 (54% recall), with recall varying by connection type from 30% (transformed imagery) to 80% (register collisions). We contextualise these results with respect to the value-add from LLMs as assistants to mechanical stylometric analyses, and their potential to facilitate the statistical study of intertextuality in massive literary corpora.
- Abstract(参考訳): 本稿では,コーマック・マッカーシー(Cormac McCarthy)の小説に適用する。
ボトムアップ埋め込みトラックは、逆文書周波数を用いて、キングジェームズ聖書と共有される稀な語彙を識別し、その局所的な文脈にその事象を埋め込んで曖昧さを識別し、カスケードされたLLMレビューを通して候補パスペアを通過させる。
トップダウンレジスタトラックは、比較のために、マッカーシーの散文を特定の聖書の通路で読み取るようLLMに要求する。
どちらのトラックも、KJVと共に小説全体を単一のパスで保存する長いコンテキストモデルによって相互に検証され、すべての発見は出版奨学金に対してチェックされる。
テキストのエコー(resred phrasing)、リワークされた語彙(reworked vocabulary)、または移植されたケイデンス(deplanted cadence)といった言い訳に注意を向ける。
学術文献の人間によるレビューによって得られた115件の資料のターゲットセットのうち、パイプラインは62件(54%のリコール)を独立に回収し、接続タイプによって30%(変換画像)から80%(登録衝突)にリコールする。
本研究は,LLMから機械的テクスチャ解析への補助としての価値付加と,大規模文学コーパスにおけるテクスチュアリティの統計的研究を促進する可能性について,これらの結果を文脈的に分析する。
関連論文リスト
- Literary Evidence Retrieval via Long-Context Language Models [39.174955595897366]
現代長文言語モデルは、文学的フィクションをどの程度理解しているか?
一次資料の全文をLCMに提供し,その著作からの引用を欠いた文芸的批判を伴って評価するベンチマークを構築した。
この設定は、グローバルな物語推論と密接なテキスト検定の両方を行うモデルを必要とすることによって、文学的分析の人間の過程を反映している。
論文 参考訳(メタデータ) (2025-06-03T17:19:45Z) - Critical biblical studies via word frequency analysis: unveiling text authorship [7.2762881851201255]
私たちは、聖書の最初の9冊にまたがる多くの章にまたがる3つの異なる著者を区別することを目指しています。
我々の分析は、最初の2人の著者(DとDtrH)が、専門家の評価と一致した事実であるPよりもはるかに密接な関係があることを示唆している。
論文 参考訳(メタデータ) (2024-10-24T22:08:38Z) - WikiContradict: A Benchmark for Evaluating LLMs on Real-World Knowledge Conflicts from Wikipedia [59.96425443250666]
Retrieval-augmented Generation (RAG) は,大規模言語モデル(LLM)の限界を緩和する,有望なソリューションとして登場した。
本研究では,ウィキペディアからの矛盾文に基づく質問に対するLLM生成回答の総合評価を行う。
我々は、単一のパスを持つRAGと2つの矛盾するパスを持つRAGを含む、様々なQAシナリオ下で、クローズドおよびオープンソース両方のLSMをベンチマークする。
論文 参考訳(メタデータ) (2024-06-19T20:13:42Z) - Evaluating LLMs for Quotation Attribution in Literary Texts: A Case Study of LLaMa3 [11.259583037191772]
小説における直接音声の発声におけるLlama-3の有効性について検討した。
LLMは28の小説のコーパスで印象的な結果を示し、ChatGPTとエンコーダベースのベースラインを大きなマージンで上回った。
論文 参考訳(メタデータ) (2024-06-17T09:56:46Z) - (Perhaps) Beyond Human Translation: Harnessing Multi-Agent Collaboration for Translating Ultra-Long Literary Texts [56.7988577327046]
翻訳企業の役割と協調の実践をシミュレートする,新しいマルチエージェントフレームワークであるTransAgentsを紹介する。
本研究は,翻訳品質の向上,特にテキストの長文化におけるマルチエージェント協調の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2024-05-20T05:55:08Z) - LFED: A Literary Fiction Evaluation Dataset for Large Language Models [58.85989777743013]
元々は中国語で書かれたか、中国語に翻訳された95の文学小説を収集し、数世紀にわたって幅広い話題を扱っている。
質問分類を8つのカテゴリーで定義し,1,304の質問の作成を導く。
我々は、小説の特定の属性(小説の種類、文字番号、出版年など)がLLMのパフォーマンスに与える影響を詳細に分析する。
論文 参考訳(メタデータ) (2024-05-16T15:02:24Z) - FABLES: Evaluating faithfulness and content selection in book-length summarization [55.50680057160788]
本稿では,本書の忠実度と内容選択の大規模評価を行う。
LLMが生成した26冊のサマリーで作成した3,158冊の注釈のデータセットであるFABLESを5.2KUSDで収集する。
注釈の分析によると、ほとんどの不誠実な主張は出来事や登場人物の状態に関係しており、物語を無効にするために間接的推論を必要とする。
論文 参考訳(メタデータ) (2024-04-01T17:33:38Z) - Plot Retrieval as an Assessment of Abstract Semantic Association [131.58819293115124]
Plot Retrievalのテキストペアは単語の重複を少なくし、より抽象的なセマンティックアソシエーションを持つ。
Plot Retrievalは、IRモデルのセマンティックアソシエーションモデリング能力に関するさらなる研究のベンチマークとなる。
論文 参考訳(メタデータ) (2023-11-03T02:02:43Z) - RELIC: Retrieving Evidence for Literary Claims [29.762552250403544]
文献証拠検索の新たな課題を定式化するために,78Kの文献引用の大規模データセットを用いた。
本稿では,既存の事前学習情報検索基準よりも優れたRoBERTaを用いた高密度経路検索手法を提案する。
論文 参考訳(メタデータ) (2022-03-18T16:56:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。