論文の概要: Story2Proposal: A Scaffold for Structured Scientific Paper Writing
- arxiv url: http://arxiv.org/abs/2603.27065v1
- Date: Sat, 28 Mar 2026 00:46:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.764683
- Title: Story2Proposal: A Scaffold for Structured Scientific Paper Writing
- Title(参考訳): Story2 Proposal: 構造化された科学論文を書くためのシナリオ
- Authors: Zhuoyang Qian, Wei Shi, Xu Lin, Li Ling, Meng Luo, Ziming Wang, Zhiwei Zhang, Tengyue Xu, Gaoge Liu, Zhentao Zhang, Shuo Zhang, Ziqi Wang, Zheng Feng, Yan Luo, Shu Xu, Yongjin Chen, Zhibo Feng, Zhuo Chen, Bruce Yuan, Biao Wu, Harry Wang, Kris Chen,
- Abstract要約: 既存の生成パイプラインは、生成後にのみ適用される検証を伴う制約のないテキスト合成に依存している。
本稿では,研究ストーリを構造化原稿に変換する契約統治型マルチエージェントフレームワークであるStory2Proposalを紹介する。
Jericho Research Corpusから派生したタスクの実験によると、Story2ProposalはDirectChatで6.145対3.963のエキスパート評価スコアを達成した。
- 参考スコア(独自算出の注目度): 31.015082559144588
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating scientific manuscripts requires maintaining alignment between narrative reasoning, experimental evidence, and visual artifacts across the document lifecycle. Existing language-model generation pipelines rely on unconstrained text synthesis with validation applied only after generation, often producing structural drift, missing figures or tables, and cross-section inconsistencies. We introduce Story2Proposal, a contract-governed multi-agent framework that converts a research story into a structured manuscript through coordinated agents operating under a persistent shared visual contract. The system organizes architect, writer, refiner, and renderer agents around a contract state that tracks section structure and registered visual elements, while evaluation agents supply feedback in a generate evaluate adapt loop that updates the contract during generation. Experiments on tasks derived from the Jericho research corpus show that Story2Proposal achieved an expert evaluation score of 6.145 versus 3.963 for DirectChat (+2.182) across GPT, Claude, Gemini, and Qwen backbones. Compared with the structured generation baseline Fars, Story2Proposal obtained an average score of 5.705 versus 5.197, indicating improved structural consistency and visual alignment.
- Abstract(参考訳): 科学写本の生成には、物語的推論、実験的な証拠、文書ライフサイクル全体にわたる視覚的アーティファクトの整合性を維持する必要がある。
既存の言語モデル生成パイプラインは、生成後にのみ適用される検証による制約のないテキスト合成に依存しており、しばしば構造的なドリフト、欠落した数字や表、断面積の不整合を生成する。
本稿では,契約管理型マルチエージェントフレームワークであるStory2Proposalについて紹介する。
システムは、セクション構造と登録された視覚要素を追跡する契約状態の周囲にアーキテクト、ライター、リファインダー、レンダラーエージェントを配置し、評価エージェントは、生成時に契約を更新する評価適応ループを生成する。
Jericho Research Corpus から派生したタスクの実験によると、Story2Proposal は GPT, Claude, Gemini, Qwen のバックボーンで DirectChat (+2.182) に対して 6.145 対 3.963 のエキスパート評価スコアを達成した。
構造化された世代ベースラインのFarsと比較すると、Story2 Proposalの平均スコアは5.705対5.197で、構造整合性と視覚的アライメントが改善された。
関連論文リスト
- SciFig: Towards Automating Scientific Figure Generation [41.73701976318102]
SciFigは研究論文のテキストから直接出版可能なパイプライン図を生成するエンドツーエンドのAIエージェントシステムである。
本稿では,2,219個の実科学図を解析し,評価ルーブを抽出するルーブリックに基づく評価フレームワークを提案する。
SciFigは、データセットレベルの評価で70.1$%、紙固有の評価で66.2$%の全体的な品質を達成した。
論文 参考訳(メタデータ) (2026-01-07T20:56:58Z) - DeepSynth-Eval: Objectively Evaluating Information Consolidation in Deep Survey Writing [53.85037373860246]
本稿では,情報統合能力を客観的に評価するためのベンチマークであるDeep Synth-Evalを紹介する。
一般チェックリスト(実例)と制約チェックリスト(構造体)を用いたきめ細かい評価プロトコルを提案する。
その結果,エージェント型プラン・アンド・ライトは単ターン生成よりも大幅に優れていた。
論文 参考訳(メタデータ) (2026-01-07T03:07:52Z) - Deep Literature Survey Automation with an Iterative Workflow [30.923568155892184]
我々のフレームワークは 再帰的なアウトライン生成に基づく 探索とコヒーレンスの両方を保証する
忠実な紙レベル接地を実現するため,各紙をその寄与,方法,発見に蒸留する紙カードを設計する。
確立されたトピックと新興トピックの両方の実験では、コンテンツカバレッジ、構造的コヒーレンス、引用品質の最先端のベースラインを大きく上回っている。
論文 参考訳(メタデータ) (2025-10-24T14:41:26Z) - CreAgentive: An Agent Workflow Driven Multi-Category Creative Generation Engine [4.644735042881366]
CreAgentiveは、物語、ドラマ、その他のクリエイティブのカテゴリを書く際に、現代の大きな言語モデルの4つの重要な制限に対処する。
CreAgentiveは、ジャンルに依存しない知識グラフに基づく物語表現であるStory Prototypeを採用している。
大規模な実験では、CreAgentiveは安定した品質と低コストで何千もの章を生成する。
論文 参考訳(メタデータ) (2025-09-30T16:12:32Z) - Unstructured Evidence Attribution for Long Context Query Focused Summarization [53.08341620504465]
固定粒度の場合よりも、より関連性が高く一貫した証拠を得るために、非構造的(すなわち任意の長さのスパン)な証拠を抽出することを提案する。
既存のシステムが、非構造的証拠をコピーし、適切に引用するのにどのように苦労しているかを示す。
論文 参考訳(メタデータ) (2025-02-20T09:57:42Z) - Agents' Room: Narrative Generation through Multi-step Collaboration [54.98886593802834]
本稿では,物語の執筆を特殊エージェントが取り組んだサブタスクに分解する,物語理論に触発された世代フレームワークを提案する。
エージェントの部屋は,専門的評価者が好むストーリーをベースラインシステムより生成することを示す。
論文 参考訳(メタデータ) (2024-10-03T15:44:42Z) - Document Structure in Long Document Transformers [64.76981299465885]
長い文書は、しばしばセクションヘッダーや段落のような異なる機能で階層的に整理された要素を持つ構造を示す。
文書構造の不明瞭さにもかかわらず、自然言語処理(NLP)におけるその役割はいまだに不透明である。
長期文書変換モデルは事前学習中に文書構造の内部表現を取得するか?
事前トレーニング後に構造情報をモデルに伝達するにはどうすればよいのか、下流のパフォーマンスにどのように影響するのか?
論文 参考訳(メタデータ) (2024-01-31T08:28:06Z) - ATLANTIC: Structure-Aware Retrieval-Augmented Language Model for
Interdisciplinary Science [0.0]
大きな言語モデルは、多くの自然言語処理タスクで印象的なパフォーマンスを記録します。
Retrieval augmentationは、外部の知識ソースからコンテキストを取得することで、効果的なソリューションを提供する。
本稿では,検索強化時に文書構造に対応する構造対応検索言語モデルを提案する。
論文 参考訳(メタデータ) (2023-11-21T02:02:46Z) - Summarizing Multiple Documents with Conversational Structure for
Meta-Review Generation [45.9443710073576]
学術論文のメタレビューを作成するための新しいデータセットであるPeerSumを提示する。
Rammerは、会話構造に基づくスパースアテンションと、メタデータ機能を予測するトレーニング目標を利用するモデルである。
論文 参考訳(メタデータ) (2023-05-02T15:18:18Z) - Model Criticism for Long-Form Text Generation [113.13900836015122]
我々は,テキストの高レベル構造を評価するために,潜在空間におけるモデル批判という統計ツールを適用した。
我々は,コヒーレンス,コア,トピックスという,ハイレベルな談話の3つの代表的な側面について実験を行った。
トランスフォーマーベースの言語モデルでは、トピック構造をキャプチャできるが、構造コヒーレンスやモデリングコアスを維持するのが難しくなる。
論文 参考訳(メタデータ) (2022-10-16T04:35:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。