論文の概要: Towards Human-Level Book-Writing Capability
- arxiv url: http://arxiv.org/abs/2605.17064v1
- Date: Sat, 16 May 2026 16:10:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.517248
- Title: Towards Human-Level Book-Writing Capability
- Title(参考訳): 書籍の書字能力向上に向けて
- Authors: Jan Zierstek, Matteo Batelic, Maya Medjad, Tim Schönenberger,
- Abstract要約: 本報告では,書籍スケールのクリエイティブ・ライティングのためのデータセット構築とトレーニングのフレームワークを提案する。
我々は,各書籍を段階的に細かなレベルで要約することで,多段階の計画足場を導出する。
そして、トレーニング中にこの階層を反転させます。モデルは、プロンプトをより詳細な計画へと拡張し、最終的にオリジナルの人間による書籍テキストへと拡張することを学びます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models optimized for instruction following and agentic tasks remain poorly aligned with the requirements of high-quality creative writing. Fiction frequently depends on behaviors that assistant-tuned models are explicitly trained to avoid, particularly deception, moral ambiguity, and unreliable narration. As a result, generated stories often appear structurally correct while remaining stylistically generic, overly explanatory, or weakly grounded in human literary behavior. We present a dataset construction and training framework for book-scale creative writing that reframes supervised fine-tuning as a prompt-to-book generation task grounded in human-authored fiction. Starting from public-domain novels, we derive a multi-resolution planning scaffold by summarizing each book at progressively finer levels, from a high-level premise to chapter- and scene-level structure. We then invert this hierarchy during training: the model learns to expand a prompt into increasingly detailed plans and finally into the original human-authored book text. This formulation preserves human prose as the final supervised target while using intermediate summaries to make book-scale generation learnable. We train a long-context language model on these prompt-to-book trajectories and study whether this objective shifts generation away from assistant-style prose and toward human literary writing.
- Abstract(参考訳): 命令追従やエージェントタスクに最適化された大規模言語モデルは、高品質な創造的記述の要求と整合性に乏しいままである。
フィクションは、アシスタントチューニングされたモデルが、特に詐欺、道徳的曖昧さ、信頼できないナレーションを避けるために明示的に訓練されている行動にしばしば依存する。
結果として、生成された物語はしばしば構造的に正しいように見えるが、スタイリスティックにジェネリックであり、過剰に説明的であり、人間の文学的行動に弱く根ざしている。
そこで本研究では,人手によるフィクションをベースとした書籍作成タスクとして,微調整を監督する書籍スケール創作のためのデータセット構築とトレーニングフレームワークを提案する。
パブリックドメインの小説から始まり、各書籍を段階的に細部まで、高レベルな前提から章やシーンレベルの構造にまとめることで、多段階的な計画足場を導き出す。
そして、トレーニング中にこの階層を反転させます。モデルは、プロンプトをより詳細な計画へと拡張し、最終的にオリジナルの人間による書籍テキストへと拡張することを学びます。
この定式化は、中間要約を用いて書籍スケール生成を学習可能にしながら、人間の散文を最終教師対象として保存する。
本研究は,これらの速書軌道上の長文言語モデルを訓練し,その目的が助文文から人文文へと世代を移すかどうかを考察する。
関連論文リスト
- Living the Novel: A System for Generating Self-Training Timeline-Aware Conversational Agents from Novels [50.43968216132018]
文芸作品が没入的で多文字の会話体験に変換されるエンド・ツー・エンドシステムを提案する。
このシステムはLLM駆動文字の2つの基本的な課題を解決するために設計されている。
論文 参考訳(メタデータ) (2025-12-08T11:57:46Z) - Learning to Reason for Long-Form Story Generation [84.09733333295338]
一般的なストーリー生成タスク(Next-Chapter Prediction)と報酬定式化(Completion Likelihood Improvementによる検証リワード)を提案する。
私たちは、物語の凝縮した情報を推論し、次の章の詳細な計画を作成することを学びます。
私たちの推論は、ストーリージェネレータ作成を支援する章を通じて評価され、トレーニングされていない、教師なしの微調整(SFT)ベースラインと比較されます。
論文 参考訳(メタデータ) (2025-03-28T18:48:26Z) - Pastiche Novel Generation Creating: Fan Fiction You Love in Your Favorite Author's Style [48.08453439104245]
文芸パスティッシュの中核的な側面を習得する新しい世代システムであるWriterAgentを提案する。
WriterAgentは、低レベルのスタイリスティックな熟達から高レベルの物語コヒーレンスまで、カリキュラム学習パラダイムを通じて訓練されている。
我々は、ハリー・ポッターやドリーム・オブ・ザ・レッドチェンバーといった多言語古典のWriterAgentを評価し、ベースラインよりも優れていることを示した。
論文 参考訳(メタデータ) (2025-02-21T17:40:42Z) - Agents' Room: Narrative Generation through Multi-step Collaboration [54.98886593802834]
本稿では,物語の執筆を特殊エージェントが取り組んだサブタスクに分解する,物語理論に触発された世代フレームワークを提案する。
エージェントの部屋は,専門的評価者が好むストーリーをベースラインシステムより生成することを示す。
論文 参考訳(メタデータ) (2024-10-03T15:44:42Z) - Leveraging Natural Supervision for Language Representation Learning and
Generation [8.083109555490475]
自然発生型監視を用いて,ニューラルネットワークのトレーニングと評価を改善するための3行の作業について述べる。
まず,NLPタスクに対する事前学習言語モデルの性能向上を支援するために,自己指導型学習損失について検討する。
文表現における意味論と構文のアンタングル化にパラフレーズペアを用いるフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-21T17:26:03Z) - Long Text Generation by Modeling Sentence-Level and Discourse-Level
Coherence [59.51720326054546]
本稿では,デコード処理における文レベルと談話レベルにおけるプレフィックス文を表現可能な長文生成モデルを提案する。
我々のモデルは最先端のベースラインよりも一貫性のあるテキストを生成することができる。
論文 参考訳(メタデータ) (2021-05-19T07:29:08Z) - Content Planning for Neural Story Generation with Aristotelian Rescoring [39.07607377794395]
長文の物語テキストは、人間の文章の流動的な偽造を管理するが、局所的な文レベルでのみ行われ、構造や大域的な結束が欠如している。
本稿では,高品質なコンテンツプランニングによってストーリー生成の問題の多くに対処できると仮定し,ストーリー生成をガイドする優れたプロット構造を学習する方法に焦点を当てたシステムを提案する。
論文 参考訳(メタデータ) (2020-09-21T13:41:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。