論文の概要: PaperOrchestra: A Multi-Agent Framework for Automated AI Research Paper Writing
- arxiv url: http://arxiv.org/abs/2604.05018v1
- Date: Mon, 06 Apr 2026 18:00:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-08 17:42:09.411051
- Title: PaperOrchestra: A Multi-Agent Framework for Automated AI Research Paper Writing
- Title(参考訳): PaperOrchestra: 自動AI研究論文作成のためのマルチエージェントフレームワーク
- Authors: Yiwen Song, Yale Song, Tomas Pfister, Jinsung Yoon,
- Abstract要約: PaperOrchestraは、自動AI研究論文作成のためのマルチエージェントフレームワークである。
制約のない事前制約された資料を提出可能な原稿に変換する。
PaperWritingBenchは、200の上位階層のAIカンファレンス論文から、リバースエンジニアリングされた原料の最初の標準ベンチマークである。
- 参考スコア(独自算出の注目度): 43.290959385976414
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Synthesizing unstructured research materials into manuscripts is an essential yet under-explored challenge in AI-driven scientific discovery. Existing autonomous writers are rigidly coupled to specific experimental pipelines, and produce superficial literature reviews. We introduce PaperOrchestra, a multi-agent framework for automated AI research paper writing. It flexibly transforms unconstrained pre-writing materials into submission-ready LaTeX manuscripts, including comprehensive literature synthesis and generated visuals, such as plots and conceptual diagrams. To evaluate performance, we present PaperWritingBench, the first standardized benchmark of reverse-engineered raw materials from 200 top-tier AI conference papers, alongside a comprehensive suite of automated evaluators. In side-by-side human evaluations, PaperOrchestra significantly outperforms autonomous baselines, achieving an absolute win rate margin of 50%-68% in literature review quality, and 14%-38% in overall manuscript quality.
- Abstract(参考訳): 構造化されていない研究資料を原稿に合成することは、AIによる科学的発見において不可欠だが未発見の課題である。
既存の自律的なライターは、特定の実験パイプラインと厳密に結合し、表面的な文献レビューを生成する。
自動AI研究論文作成のためのマルチエージェントフレームワークであるPaperOrchestraを紹介する。
これは、制約のない前書き材料を、包括的な文献合成やプロットや概念図のような生成された視覚を含む、提出可能なLaTeX原稿に柔軟に変換する。
性能を評価するため、200の上位階層のAI会議論文からリバースエンジニアリングされた原材料の最初の標準ベンチマークであるPaperWritingBenchと、自動化評価ツールの包括的なスイートを紹介する。
左右の人間による評価では、PaperOrchestraは自律的ベースラインを著しく上回り、文学レビュー品質の50%-68%、全体の原稿品質の14%-38%という絶対的な勝利率のマージンを達成している。
関連論文リスト
- AutoSOTA: An End-to-End Automated Research System for State-of-the-Art AI Model Discovery [49.77172027295716]
AutoSOTAは、トップレベルのAI論文で発表された最新のState-Of-The-Art(SOTA)モデルを進化させるエンドツーエンドの自動研究システムである。
報告された方法を超える新しい105種類のSOTAモデルを発見し、平均して1紙あたり平均5時間である。
論文 参考訳(メタデータ) (2026-04-07T07:52:01Z) - Paper Reconstruction Evaluation: Evaluating Presentation and Hallucination in AI-written Papers [41.637398542914816]
本稿では,現代のコーディングエージェントによって書かれた論文の品質とリスクを定量化するための,最初の体系的評価フレームワークを紹介する。
PaperReconは、AIで書かれた論文の評価を、プレゼンテーションと幻覚の2つの次元に分割する。
評価のために,2025年以降に出版された多種多様なドメインを対象とした51の論文をベンチマークしたPaperWrite-Benchを紹介する。
論文 参考訳(メタデータ) (2026-04-01T16:48:04Z) - ARISE: Agentic Rubric-Guided Iterative Survey Engine for Automated Scholarly Paper Generation [7.437989615069771]
ARISEは、学術調査論文の自動生成と継続的改善のためのエージェント誘導反復調査エンジンである。
ARISEは、特定の大規模言語モデルエージェントで構成されたモジュラーアーキテクチャを採用し、それぞれがトピック拡張、引用キュレーション、文学要約、原稿の草稿作成、ピアレビューに基づく評価などの学術的な役割を反映している。
ARISEは、包括性、正確性、フォーマッティング、総合的な学術的厳密さの指標にまたがる基準的手法を一貫して超越している。
論文 参考訳(メタデータ) (2025-11-21T14:14:35Z) - Paper2Web: Let's Make Your Paper Alive! [51.75896846964824]
学術Webページ生成を評価するためのベンチマークデータセットとフレームワークであるPaper2Webを紹介する。
PWAgentは、科学論文をインタラクティブでマルチメディアに富んだ学術ホームページに変換する自律パイプラインである。
論文 参考訳(メタデータ) (2025-10-17T17:35:58Z) - LiRA: A Multi-Agent Framework for Reliable and Readable Literature Review Generation [66.09346158850308]
文献レビュープロセスをエミュレートする多エージェント協調ワークフローLiRA(Literature Review Agents)を提案する。
LiRAは、コンテンツアウトライン、サブセクションの執筆、編集、レビュー、コヒーシブで包括的なレビュー記事の作成に特殊エージェントを使用している。
実世界のシナリオにおいて文書検索を用いてLiRAを評価し,そのロバスト性を評価する。
論文 参考訳(メタデータ) (2025-10-01T12:14:28Z) - AutoReproduce: Automatic AI Experiment Reproduction with Paper Lineage [62.049868205196425]
AutoReproduceは、研究論文に記載された実験をエンドツーエンドで自動再生できるフレームワークである。
結果は、AutoReproduceが平均的なパフォーマンスギャップを22.1%$で達成していることを示している。
論文 参考訳(メタデータ) (2025-05-27T03:15:21Z) - PaperBench: Evaluating AI's Ability to Replicate AI Research [3.4567792239799133]
PaperBenchは、AIエージェントが最先端のAI研究を複製する能力を評価するベンチマークである。
エージェントは、スクラッチから20個のICML 2024 SpotlightとOralの文書を複製する必要がある。
PaperBenchには8,316の個別の段階的なタスクが含まれている。
論文 参考訳(メタデータ) (2025-04-02T15:55:24Z) - The ICML 2023 Ranking Experiment: Examining Author Self-Assessment in ML/AI Peer Review [49.43514488610211]
著者が提供するランキングは、機械学習カンファレンスでのピアレビュープロセスを改善するために利用することができる。
著者が提示したランキングを用いて生のレビュースコアを校正するイソトニックメカニズムに注目した。
本稿では,アイソトニック機構の慎重かつリスクの低いいくつかの応用と著者が提案する格付けをピアレビューで提案する。
論文 参考訳(メタデータ) (2024-08-24T01:51:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。