論文の概要: APEX: Academic Poster Editing Agentic Expert
- arxiv url: http://arxiv.org/abs/2601.04794v1
- Date: Thu, 08 Jan 2026 10:21:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:53.155071
- Title: APEX: Academic Poster Editing Agentic Expert
- Title(参考訳): APEX:Academic Poster Editing Agentic Expert
- Authors: Chengxin Shi, Qinnan Cai, Zeyuan Chen, Long Zeng, Yibo Zhao, Jing Yu, Jianxiang Yu, Xiang Li,
- Abstract要約: APEXはインタラクティブな学術的ポスター編集のための最初のエージェントフレームワークである。
APEXは、堅牢なマルチレベルAPIベースの編集による微調整制御をサポートする。
APEX-Benchは、514の学術的ポスター編集命令からなる最初の体系的なベンチマークである。
- 参考スコア(独自算出の注目度): 14.933976965223716
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Designing academic posters is a labor-intensive process requiring the precise balance of high-density content and sophisticated layout. While existing paper-to-poster generation methods automate initial drafting, they are typically single-pass and non-interactive, often fail to align with complex, subjective user intent. To bridge this gap, we propose APEX (Academic Poster Editing agentic eXpert), the first agentic framework for interactive academic poster editing, supporting fine-grained control with robust multi-level API-based editing and a review-and-adjustment Mechanism. In addition, we introduce APEX-Bench, the first systematic benchmark comprising 514 academic poster editing instructions, categorized by a multi-dimensional taxonomy including operation type, difficulty, and abstraction level, constructed via reference-guided and reference-free strategies to ensure realism and diversity. We further establish a multi-dimensional VLM-as-a-judge evaluation protocol to assess instruction fulfillment, modification scope, and visual consistency & harmony. Experimental results demonstrate that APEX significantly outperforms baseline methods. Our implementation is available at https://github.com/Breesiu/APEX.
- Abstract(参考訳): 学術ポスターのデザインは、高密度コンテンツと洗練されたレイアウトの正確なバランスを必要とする労働集約的なプロセスである。
既存のペーパー・ツー・ポスト生成手法は初期ドラフトを自動化するが、通常はシングルパスで非対話的であり、複雑で主観的なユーザー意図と整合しないことが多い。
このギャップを埋めるために、インタラクティブな学術的ポスター編集のための最初のエージェントフレームワークであるAPEX(Academic Poster Editing Agentic eXpert)を提案する。
さらに,514の学術的ポスター編集命令からなる最初の体系的ベンチマークであるAPEX-Benchを導入し,操作タイプ,難易度,抽象化レベルを含む多次元分類で分類し,レファレンスと多様性を確保するために参照誘導および参照不要戦略を用いて構築した。
さらに,多次元VLM-as-a-judge評価プロトコルを構築し,命令充足,修正範囲,視覚的一貫性と調和性を評価する。
実験の結果,APEXはベースライン法よりも有意に優れていた。
私たちの実装はhttps://github.com/Breesiu/APEX.comで公開されています。
関連論文リスト
- Improving Alignment Between Human and Machine Codes: An Empirical Assessment of Prompt Engineering for Construct Identification in Psychology [0.0]
本稿では,テキスト中のコンストラクタをインシデントエンジニアリングで識別するために,インシデント性能を最適化するための実証的フレームワークを提案する。
提案手法は,コードブックによる経験的プロンプト選択,自動プロンプトエンジニアリング,ペルソナプロンプト,チェーンオブ思考推論,説明的プロンプトという5つのプロンプト戦略を実験的に評価した。
3つの構成と2つのモデルで、分類は専門家の判断に最も適しており、コードブックに誘導された経験的プロンプト選択と自動プロンプトエンジニアリングを組み合わせた数発のプロンプトから生まれた。
論文 参考訳(メタデータ) (2025-12-03T14:07:42Z) - Multimodal Peer Review Simulation with Actionable To-Do Recommendations for Community-Aware Manuscript Revisions [16.556181117253473]
論文提出前の効果的な原稿改訂を実現するために,マルチモーダル・コミュニティ対応のピアレビューシミュレーションのための対話型Webベースシステムを提案する。
本フレームワークは,マルチモーダル LLM を用いてテキスト情報と視覚情報を統合し,Web スケールの OpenReview データに基づく検索拡張生成 (RAG) によるレビュー品質を向上させる。
このシステムは既存の学術書記プラットフォームにシームレスに統合され、リアルタイムフィードバックとリビジョントラッキングのためのインタラクティブインターフェースを提供する。
論文 参考訳(メタデータ) (2025-11-14T02:29:23Z) - Paper2Web: Let's Make Your Paper Alive! [51.75896846964824]
学術Webページ生成を評価するためのベンチマークデータセットとフレームワークであるPaper2Webを紹介する。
PWAgentは、科学論文をインタラクティブでマルチメディアに富んだ学術ホームページに変換する自律パイプラインである。
論文 参考訳(メタデータ) (2025-10-17T17:35:58Z) - PosterForest: Hierarchical Multi-Agent Collaboration for Scientific Poster Generation [28.02969134846803]
文書構造と視覚的・テキスト的関係を共同で符号化する階層型中間表現であるtextitPoster Tree を導入する。
本フレームワークでは,コンテンツ要約とレイアウト計画を専門とするエージェントが反復的に協調し,相互にフィードバックを提供するマルチエージェント協調戦略を採用している。
論文 参考訳(メタデータ) (2025-08-29T15:36:06Z) - Visual Document Understanding and Question Answering: A Multi-Agent Collaboration Framework with Test-Time Scaling [83.78874399606379]
テスト時間スケーリングを備えたマルチエージェント協調フレームワークであるMACTを提案する。
4つの異なる小規模エージェントから構成され、明確に定義された役割と効果的なコラボレーションがある。
一般および数学的タスクの能力を犠牲にすることなく、より小さなパラメータスケールで優れた性能を示す。
論文 参考訳(メタデータ) (2025-08-05T12:52:09Z) - Image Editing As Programs with Diffusion Models [69.05164729625052]
本稿では,Diffusion Transformer (DiT) アーキテクチャ上に構築された統合画像編集フレームワークである IEAP (Image Editing As Programs) を紹介する。
IEAPは、複雑な編集命令を原子操作のシーケンスに分解して、リダミストレンズによる命令編集にアプローチする。
我々のフレームワークは、特に複雑なマルチステップ命令に対して、より優れた精度とセマンティック忠実度を提供する。
論文 参考訳(メタデータ) (2025-06-04T16:57:24Z) - P2P: Automated Paper-to-Poster Generation and Fine-Grained Benchmark [27.57464219790922]
高品質なHTMLレンダリングの学術ポスターを生成するLLMベースのマルチエージェントフレームワークであるP2Pを紹介する。
P2Pは、ビジュアル要素処理、コンテンツ生成、および専用のチェッカーモジュールと統合された最後のポスターアセンブリーの3つの特殊エージェントを使用している。
P2PEvalは121枚の紙とポストのペアと2つの評価手法を組み合わせた総合的なベンチマークである。
論文 参考訳(メタデータ) (2025-05-21T09:06:05Z) - Structured Agent Distillation for Large Language Model [56.38279355868093]
本研究では,LLMをベースとした大規模エージェントを小さな学生モデルに圧縮するフレームワークであるStructured Agent Distillationを提案する。
提案手法は, [REASON] と [ACT] にトラジェクトリを分割し, 各コンポーネントを教師の行動に合わせるためにセグメント特異的な損失を適用した。
ALFWorld、HotPotQA-ReAct、WebShopの実験は、我々のアプローチがトークンレベルと模倣学習のベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-05-20T02:01:55Z) - XtraGPT: Context-Aware and Controllable Academic Paper Revision [43.263488839387584]
本稿では,基準誘導型意図アライメントと文脈認識モデリングを中心とした学術論文改訂のための人間-AI協調フレームワークを提案する。
XtraGPTは,コンテクスト対応,命令誘導型書き込み支援のためのオープンソースのLLMスイートである。
論文 参考訳(メタデータ) (2025-05-16T15:02:19Z) - Beyond the Prototype: Divide-and-conquer Proxies for Few-shot
Segmentation [63.910211095033596]
少ないショットのセグメンテーションは、少数の濃密なラベル付けされたサンプルのみを与えられた、目に見えないクラスオブジェクトをセグメンテーションすることを目的としている。
分割・分散の精神において, 単純かつ多目的な枠組みを提案する。
提案手法は、DCP(disvision-and-conquer proxies)と呼ばれるもので、適切な信頼性のある情報の開発を可能にする。
論文 参考訳(メタデータ) (2022-04-21T06:21:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。