論文の概要: AutoLayout: Closed-Loop Layout Synthesis via Slow-Fast Collaborative Reasoning
- arxiv url: http://arxiv.org/abs/2507.04293v1
- Date: Sun, 06 Jul 2025 08:35:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:35.104845
- Title: AutoLayout: Closed-Loop Layout Synthesis via Slow-Fast Collaborative Reasoning
- Title(参考訳): AutoLayout: Slow-Fast Collaborative Reasoningによる閉ループレイアウト合成
- Authors: Weixing Chen, Dafeng Chi, Yang Liu, Yuxi Yang, Yexin Zhang, Yuzheng Zhuang, Xingyue Quan, Jianye Hao, Guanbin Li, Liang Lin,
- Abstract要約: Autoは、クローズドループの自己検証プロセスをデュアルシステムフレームワークに統合する、完全に自動化された方法である。
Autoの有効性は8つの異なるシナリオで検証され、SOTA法よりも10.1%改善された。
- 参考スコア(独自算出の注目度): 102.71841660031065
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The automated generation of layouts is vital for embodied intelligence and autonomous systems, supporting applications from virtual environment construction to home robot deployment. Current approaches, however, suffer from spatial hallucination and struggle with balancing semantic fidelity and physical plausibility, often producing layouts with deficits such as floating or overlapping objects and misaligned stacking relation. In this paper, we propose AutoLayout, a fully automated method that integrates a closed-loop self-validation process within a dual-system framework. Specifically, a slow system harnesses detailed reasoning with a Reasoning-Reflection-Generation (RRG) pipeline to extract object attributes and spatial constraints. Then, a fast system generates discrete coordinate sets and a topological relation set that are jointly validated. To mitigate the limitations of handcrafted rules, we further introduce an LLM-based Adaptive Relation Library (ARL) for generating and evaluating layouts. Through the implementation of Slow-Fast Collaborative Reasoning, the AutoLayout efficiently generates layouts after thorough deliberation, effectively mitigating spatial hallucination. Its self-validation mechanism establishes a closed-loop process that iteratively corrects potential errors, achieving a balance between physical stability and semantic consistency. The effectiveness of AutoLayout was validated across 8 distinct scenarios, where it demonstrated a significant 10.1% improvement over SOTA methods in terms of physical plausibility, semantic consistency, and functional completeness.
- Abstract(参考訳): レイアウトの自動生成はインテリジェンスと自律システムにとって不可欠であり、仮想環境の構築からホームロボットの展開までアプリケーションをサポートする。
しかし、現在のアプローチは空間的幻覚と意味的忠実さと物理的妥当性のバランスのバランスに苦慮しており、しばしば浮動小数点や重なり合っている物体や不整合な積み重ね関係のような欠陥のあるレイアウトを生み出している。
本稿では,閉ループ自己バリデーションプロセスを統合する完全自動化手法であるAutoLayoutを提案する。
具体的には、スローシステムは、Reasoning-Reflection-Generation (RRG)パイプラインによる詳細な推論を利用して、オブジェクト属性と空間的制約を抽出する。
そして、高速システムは、連立検証された離散座標集合と位相関係集合を生成する。
さらに,手作りルールの限界を緩和するために,レイアウトの生成と評価を行うためのLLMベースの適応関係ライブラリ(ARL)を導入する。
Slow-Fast Collaborative Reasoningの実装を通じて、AutoLayoutは徹底的な検討を経てレイアウトを効率よく生成し、空間幻覚を効果的に緩和する。
その自己検証機構は、物理的安定性とセマンティック一貫性のバランスを保ちながら、潜在的なエラーを反復的に修正する閉ループプロセスを確立する。
AutoLayoutの有効性は8つの異なるシナリオで検証され、物理的妥当性、セマンティック一貫性、機能完全性の観点から、SOTA法よりも10.1%大きな改善が示された。
関連論文リスト
- Leveraging Large Language Model for Intelligent Log Processing and Autonomous Debugging in Cloud AI Platforms [1.819979627431298]
本稿では,Large Language Model (LLM) に基づくインテリジェントログ処理と自動デバッグフレームワークである Intelligent Debugger (LLM-ID) を提案する。
クラウドプラットフォームログデータセットの実験では、LLM-IDは障害位置の精度を16.2%向上させており、これは現在の主流メソッドよりも大幅に向上している。
論文 参考訳(メタデータ) (2025-06-22T04:58:37Z) - InVDriver: Intra-Instance Aware Vectorized Query-Based Autonomous Driving Transformer [12.441180142943328]
InVDriverは、インスタンス内空間依存のための新しいベクトル化クエリベースのシステムである。
InVDriverは最先端の性能を達成し,精度と安全性の両面で従来の手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-02-25T08:20:16Z) - Cross Space and Time: A Spatio-Temporal Unitized Model for Traffic Flow Forecasting [16.782154479264126]
時間的要因間の複雑な相互作用により、バックボーン・時間的トラフィックフローを予測することが課題となる。
既存のアプローチでは、これらの次元を分離し、重要な相互依存を無視している。
本稿では,空間的および時間的依存関係の両方をキャプチャする統合フレームワークであるSanonymous-Temporal Unitized Unitized Cell (ASTUC)を紹介する。
論文 参考訳(メタデータ) (2024-11-14T07:34:31Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - LLM-A*: Large Language Model Enhanced Incremental Heuristic Search on Path Planning [91.95362946266577]
経路計画はロボット工学と自律航法における基本的な科学的問題である。
A*やその変種のような伝統的なアルゴリズムは、パスの妥当性を保証することができるが、状態空間が大きくなるにつれて、計算とメモリの非効率が著しく低下する。
本稿では, A* の正確なパスフィニング能力と LLM のグローバルな推論能力とを相乗的に組み合わせた LLM ベースの経路計画法を提案する。
このハイブリッドアプローチは、特に大規模シナリオにおいて、パス妥当性の完全性を維持しながら、時間と空間の複雑さの観点からパスフィニング効率を向上させることを目的としている。
論文 参考訳(メタデータ) (2024-06-20T01:24:30Z) - LoRA-Ensemble: Efficient Uncertainty Modelling for Self-Attention Networks [52.46420522934253]
本稿では,自己注意ネットワークのためのパラメータ効率のよいアンサンブル手法であるLoRA-Ensembleを紹介する。
この方法は、BatchEnsembleのような最先端の暗黙のテクニックを上回るだけでなく、Explicit Ensembleの正確さにマッチするか超える。
論文 参考訳(メタデータ) (2024-05-23T11:10:32Z) - Responsible Composition and Optimization of Integration Processes under
Correctness Preserving Guarantees [0.7366405857677227]
エンタープライズアプリケーション統合(Enterprise Application Integration)は、異種アプリケーションを接続する問題を扱う。
我々はそれらの特徴に基づいて積分パターンの構成を定式化する。
モデル複雑性の低減に役立つ最適化戦略について述べる。
論文 参考訳(メタデータ) (2023-05-30T16:40:18Z) - A Cooperative Perception System Robust to Localization Errors [8.65435011972241]
我々はOptiMatchと呼ばれる分散オブジェクトレベルの協調認識システムを提案する。
検出された3Dバウンディングボックスと局所状態情報は、接続された車両間で共有される。
実験の結果,提案手法は最先端のベンチマーク融合方式よりも優れていた。
論文 参考訳(メタデータ) (2022-10-12T15:07:24Z) - Higher Performance Visual Tracking with Dual-Modal Localization [106.91097443275035]
Visual Object Tracking (VOT)は、堅牢性と正確性の両方に同期性を必要とする。
ONRによるロバストなローカリゼーション抑制器とOFCによるターゲットセンターへの正確なローカリゼーションにより、ターゲットローカリゼーションのためのデュアルモーダルフレームワークを提案します。
論文 参考訳(メタデータ) (2021-03-18T08:47:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。