論文の概要: PosterForest: Hierarchical Multi-Agent Collaboration for Scientific Poster Generation
- arxiv url: http://arxiv.org/abs/2508.21720v1
- Date: Fri, 29 Aug 2025 15:36:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-01 19:45:11.098979
- Title: PosterForest: Hierarchical Multi-Agent Collaboration for Scientific Poster Generation
- Title(参考訳): PosterForest:科学ポスター生成のための階層的マルチエージェントコラボレーション
- Authors: Jiho Choi, Seojeong Park, Seongjong Song, Hyunjung Shim,
- Abstract要約: 文書構造と視覚的・テキスト的関係を共同で符号化する階層型中間表現であるtextitPoster Tree を導入する。
本フレームワークでは,コンテンツ要約とレイアウト計画を専門とするエージェントが反復的に協調し,相互にフィードバックを提供するマルチエージェント協調戦略を採用している。
- 参考スコア(独自算出の注目度): 28.02969134846803
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a novel training-free framework, \textit{PosterForest}, for automated scientific poster generation. Unlike prior approaches, which largely neglect the hierarchical structure of scientific documents and the semantic integration of textual and visual elements, our method addresses both challenges directly. We introduce the \textit{Poster Tree}, a hierarchical intermediate representation that jointly encodes document structure and visual-textual relationships at multiple levels. Our framework employs a multi-agent collaboration strategy, where agents specializing in content summarization and layout planning iteratively coordinate and provide mutual feedback. This approach enables the joint optimization of logical consistency, content fidelity, and visual coherence. Extensive experiments on multiple academic domains show that our method outperforms existing baselines in both qualitative and quantitative evaluations. The resulting posters achieve quality closest to expert-designed ground truth and deliver superior information preservation, structural clarity, and user preference.
- Abstract(参考訳): 学術ポスターの自動作成のための新しいトレーニングフリーフレームワークである「textit{PosterForest}」を提案する。
科学文書の階層構造やテキストと視覚要素のセマンティックな統合をほとんど無視する従来の手法とは異なり,本手法は両課題に直接対処する。
文書構造と視覚的・テクスチュア関係を複数のレベルで共同でエンコードする階層型中間表現である。
本フレームワークでは,コンテンツ要約とレイアウト計画を専門とするエージェントが反復的に協調し,相互にフィードバックを提供するマルチエージェント協調戦略を採用している。
このアプローチは論理的整合性、内容の忠実性、視覚的コヒーレンスを共同で最適化することを可能にする。
複数の学術領域における大規模な実験により,本手法は定性評価と定量的評価の両方において,既存のベースラインよりも優れていることが示された。
得られたポスターは、専門家が設計した真実に最も近い品質を達成し、優れた情報保存、構造的明快さ、ユーザの好みを提供する。
関連論文リスト
- Real-Time Intuitive AI Drawing System for Collaboration: Enhancing Human Creativity through Formal and Contextual Intent Integration [26.920087528015205]
本稿では,形式的意図と文脈的意図の両方を解釈・統合するリアルタイム生成システムを提案する。
このシステムは,共有キャンバス上でのマルチユーザコラボレーションをサポートしながら,低レイテンシで2段階の変換を実現する。
論文 参考訳(メタデータ) (2025-08-12T01:34:23Z) - CAL-RAG: Retrieval-Augmented Multi-Agent Generation for Content-Aware Layout Design [6.830055289299306]
CAL-RAGは、コンテンツ対応レイアウト生成のための検索拡張エージェントフレームワークである。
我々は、LangGraphを使ってフレームワークを実装し、セマンティック変数に富んだベンチマークで評価する。
その結果,検索強化とエージェント的多段階推論を組み合わせることで,拡張性,解釈性,高忠実度な解が得られることがわかった。
論文 参考訳(メタデータ) (2025-06-27T06:09:56Z) - DISRetrieval: Harnessing Discourse Structure for Long Document Retrieval [51.89673002051528]
DISRetrievalは、言語談話構造を利用して長い文書理解を強化する新しい階層的検索フレームワークである。
本研究は,談話構造が文書の長さや問合せの種類によって検索効率を著しく向上することを確認する。
論文 参考訳(メタデータ) (2025-05-26T14:45:12Z) - Enhancing Abstractive Summarization of Scientific Papers Using Structure Information [6.414732533433283]
本稿では,学術論文における構造的機能の自動認識を活用する2段階の抽象的要約フレームワークを提案する。
第1段階では,多くの学術論文から章題を標準化し,構造関数認識のための大規模データセットを構築した。
第2段階では、Longformerを用いて、セクション間のリッチなコンテキスト関係をキャプチャし、コンテキスト対応の要約を生成する。
論文 参考訳(メタデータ) (2025-05-20T10:34:45Z) - Bridging Textual-Collaborative Gap through Semantic Codes for Sequential Recommendation [91.13055384151897]
CCFRecは、シーケンシャルレコメンデーションのための新しいコードベースのテキストおよび協調的セマンティックフュージョン法である。
ベクトル量子化手法を用いて,多視点テキスト埋め込みから細粒度セマンティックコードを生成する。
テキスト・コラボレーティブ・セマンティクスの融合をさらに促進するために,最適化戦略を導入する。
論文 参考訳(メタデータ) (2025-03-15T15:54:44Z) - PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides [51.88536367177796]
そこで本研究では,人案に触発された2段階の編集手法を提案し,プレゼンテーションを自動的に生成する。
PWTAgentはまず参照を分析し、スライドレベルの関数型とコンテンツスキーマを抽出し、選択した参照スライドに基づいて編集アクションを生成する。
PWTAgentは、既存の3次元のプレゼンテーション生成方法よりも大幅に優れています。
論文 参考訳(メタデータ) (2025-01-07T16:53:01Z) - HIP: Hierarchical Point Modeling and Pre-training for Visual Information Extraction [24.46493675079128]
OCRに依存した手法はオフラインのOCRエンジンに依存し、OCRに依存しない手法は解釈性に欠ける出力や幻覚的内容を含む出力を生成する。
我々は, 階層的視点をモデルとしたHIPを提案し, エンドツーエンドのVIEタスクの階層的性質をよりよく適合させる。
具体的には、このような階層的な点は柔軟に符号化され、その後所望のテキスト書き起こし、地域の中心、エンティティのカテゴリにデコードされる。
論文 参考訳(メタデータ) (2024-11-02T05:00:13Z) - ReSel: N-ary Relation Extraction from Scientific Text and Tables by
Learning to Retrieve and Select [53.071352033539526]
学術論文からN-ary関係を抽出する問題について考察する。
提案手法であるReSelは,このタスクを2段階のプロシージャに分解する。
3つの科学的情報抽出データセットに対する実験により、ReSelは最先端のベースラインを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2022-10-26T02:28:02Z) - Multilevel Text Alignment with Cross-Document Attention [59.76351805607481]
既存のアライメントメソッドは、1つの事前定義されたレベルで動作します。
本稿では,文書を文書間注目要素で表現するための階層的アテンションエンコーダを予め確立した新しい学習手法を提案する。
論文 参考訳(メタデータ) (2020-10-03T02:52:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。