論文の概要: CHIRON: Rich Character Representations in Long-Form Narratives
- arxiv url: http://arxiv.org/abs/2406.10190v2
- Date: Wed, 26 Jun 2024 14:22:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-27 18:16:00.755504
- Title: CHIRON: Rich Character Representations in Long-Form Narratives
- Title(参考訳): 千論:長文物語におけるリッチキャラクタ表現
- Authors: Alexander Gurung, Mirella Lapata,
- Abstract要約: 文字のテキスト情報を整理・フィルタリングする新しい文字シートの表現であるCHIRONを提案する。
実験の結果,CHIRONは類似の要約に基づくベースラインよりも優れ,柔軟であることが判明した。
CHIRONから派生したメトリクスは、ストーリーのキャラクター中心性を自動的に推測するために使用することができ、これらのメトリクスは人間の判断と一致している。
- 参考スコア(独自算出の注目度): 98.273323001781
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Characters are integral to long-form narratives, but are poorly understood by existing story analysis and generation systems. While prior work has simplified characters via graph-based methods and brief character descriptions, we aim to better tackle the problem of representing complex characters by taking inspiration from advice given to professional writers. We propose CHIRON, a new `character sheet' based representation that organizes and filters textual information about characters. We construct CHIRON sheets in two steps: a Generation Module that prompts an LLM for character information via question-answering and a Validation Module that uses automated reasoning and a domain-specific entailment model to eliminate false facts about a character. We validate CHIRON via the downstream task of masked-character prediction, where our experiments show CHIRON is better and more flexible than comparable summary-based baselines. We also show that metrics derived from CHIRON can be used to automatically infer character-centricity in stories, and that these metrics align with human judgments.
- Abstract(参考訳): キャラクタは長文物語に不可欠なものであるが、既存の物語分析・生成システムでは理解されていない。
従来の作業では,グラフベースの手法や簡単な文字記述による文字の簡略化が見られたが,プロのライターへのアドバイスからヒントを得て,複雑な文字を表現するという課題に対処することを目的としている。
文字に関するテキスト情報を整理・フィルタリングする「文字シート」に基づく表現であるCHIRONを提案する。
質問応答による文字情報にLLMを誘導するジェネレーションモジュールと,自動推論とドメイン固有包絡モデルを用いて文字に関する偽事実を除去するバリデーションモジュールの2つのステップで構築する。
実験の結果,CHIRONは類似の要約に基づくベースラインよりも優れ,柔軟であることが判明した。
また,CHIRONから派生した指標を用いて,物語のキャラクター中心性を自動的に推定し,これらの指標が人間の判断と一致することを示す。
関連論文リスト
- Improving Quotation Attribution with Fictional Character Embeddings [11.259583037191772]
我々は,文字のグローバルな情報をエンコードする文字埋め込みを用いた,人気のある引用帰属システムであるBookNLPを提案する。
提案するグローバルキャラクタ埋め込みにより,アナフォリックおよび暗黙的引用に対する話者識別が向上し,最先端のパフォーマンスに達することを示す。
論文 参考訳(メタデータ) (2024-06-17T09:46:35Z) - Evolving Storytelling: Benchmarks and Methods for New Character Customization with Diffusion Models [79.21968152209193]
ニューエピソード・ベンチマークを導入し、新しいキャラクターで新しいストーリーを生成する際の生成モデルの適応性を評価する。
EpicEvoは,新しいキャラクタをシームレスに統合した単一ストーリーで,拡散に基づくビジュアルストーリー生成モデルをカスタマイズする手法である。
論文 参考訳(メタデータ) (2024-05-20T07:54:03Z) - StoryGPT-V: Large Language Models as Consistent Story Visualizers [39.790319429455856]
生成モデルは、テキストのプロンプトに基づいて、現実的で視覚的に喜ばしい画像を生成する素晴らしい能力を示しています。
しかし、新興のLarge Language Model(LLM)はあいまいな参照をナビゲートする堅牢な推論能力を示している。
遅延拡散(LDM)とLDMの利点を生かしたtextbfStoryGPT-V を導入し,一貫した高品質な画像を生成する。
論文 参考訳(メタデータ) (2023-12-04T18:14:29Z) - Personality Understanding of Fictional Characters during Book Reading [81.68515671674301]
この問題に対する最初のラベル付きデータセットPersoNetを提示する。
当社の新たなアノテーション戦略では,オリジナル書籍のプロキシとして,オンライン読書アプリからユーザノートを注釈付けします。
実験と人間の研究は、データセットの構築が効率的かつ正確であることを示している。
論文 参考訳(メタデータ) (2023-05-17T12:19:11Z) - Detecting and Grounding Important Characters in Visual Stories [18.870236356616907]
本稿では,リッチな文字中心アノテーションを提供するVIST-Characterデータセットを紹介する。
このデータセットに基づいて,重要な文字の検出と,視覚的ストーリーにおける文字のグラウンド化という,2つの新しいタスクを提案する。
本研究では,分布類似性と事前学習された視覚・言語モデルに基づく,シンプルで教師なしのモデルを開発する。
論文 参考訳(メタデータ) (2023-03-30T18:24:06Z) - MBTI Personality Prediction for Fictional Characters Using Movie Scripts [34.24896499537589]
我々は,映画キャラクタのMBTIやビッグ5の性格タイプを予測するために,Story2Personalityというベンチマークを構築した。
実験の結果,既存のテキスト分類モデルでは作業が困難であることが確認された。
言語記述と非言語記述の両方を用いた人格予測のための多視点モデルを提案する。
論文 参考訳(メタデータ) (2022-10-20T03:41:07Z) - "Let Your Characters Tell Their Story": A Dataset for Character-Centric
Narrative Understanding [31.803481510886378]
文芸作品の新しいデータセットLiSCUとその要約を、それらに現れる文字の記述と組み合わせて紹介する。
また、LiSCUにおける文字識別と文字記述生成という2つの新しいタスクについても紹介する。
これらの課題に適応した事前学習型言語モデルを用いた実験により,より優れた物語理解モデルの必要性が示された。
論文 参考訳(メタデータ) (2021-09-12T06:12:55Z) - SummScreen: A Dataset for Abstractive Screenplay Summarization [52.56760815805357]
SummScreenは、テレビシリーズトランスクリプトと人間の書かれたリキャップのペアで構成されたデータセットです。
プロットの詳細はしばしば文字対話で間接的に表現され、書き起こしの全体にわたって散らばることがある。
キャラクタはテレビシリーズの基本であるため,2つのエンティティ中心評価指標も提案する。
論文 参考訳(メタデータ) (2021-04-14T19:37:40Z) - Character Matters: Video Story Understanding with Character-Aware
Relations [47.69347058141917]
ビデオストーリー質問回答(VSQA)は、モデルのより高度な理解能力をベンチマークする効果的な方法を提供する。
現在のVSQAメソッドは、単にシーンから一般的な視覚的特徴を抽出するだけである。
本稿では,文字認識関係を改良する新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-05-09T06:51:13Z) - PlotMachines: Outline-Conditioned Generation with Dynamic Plot State
Tracking [128.76063992147016]
PlotMachinesは、動的プロット状態を追跡することによってアウトラインをコヒーレントなストーリーに変換することを学習する、ニューラルな物語モデルである。
さらに,PlotMachinesを高レベルな談話構造で強化し,モデルが物語の異なる部分に対応する筆記スタイルを学習できるようにした。
論文 参考訳(メタデータ) (2020-04-30T17:16:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。