論文の概要: Hylos: Operability Contracts for Model-Native Spatial Intelligence
- arxiv url: http://arxiv.org/abs/2605.24728v1
- Date: Sat, 23 May 2026 20:47:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.351191
- Title: Hylos: Operability Contracts for Model-Native Spatial Intelligence
- Title(参考訳): Hylos: モデルNative空間知能のための運用契約
- Authors: Christopher Da Silva,
- Abstract要約: 本稿では,契約境界空間知能のためのシステムアーキテクチャであるHylosを紹介する。
Hylosは、オブジェクト、アセンブリ、アセット、サーフェスアンカー、アサーション、アクション候補、ソルバジョブ、共有アクチュエータ呼び出し、能力ギャップ、エフェクト差といった、シーンスケールの操作性状態を維持している。
この研究は、因果修復について検討し、視覚的不整合が依存部品に現れるのに対して、支持された修復はそれを制御する配置構造に上流に置かれている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Foundation models can increasingly describe, reconstruct, and generate 3D objects, assemblies, scenes, and environments, but visually plausible spatial output is not yet operable 3D. A generated object or environment becomes useful to an agent only when the system can identify its entities, frames, surfaces, constraints, provenance, admissible actions, expected effects, and validation failures. This paper introduces Hylos, a systems architecture for contract-bounded spatial intelligence. Hylos maintains scene-scale operability state over objects, assemblies, assets, surface anchors, assertions, action candidates, solver jobs, shared actuator invocations, capability gaps, and effect diffs. Durable spatial changes are routed through a SpatialTransaction: a commit boundary that resolves references, checks admissibility, protects invariants, projects effects, and returns commit, review, rollback, deferral, or capability-gap outcomes. The paper is framed as a systems/position preprint with a focused artifact study rather than a broad benchmark. The study examines causal repair: a visible misalignment appears on a dependent component, while the supported repair lies upstream in the placement structure that controls it. The successful interaction traces the symptom through scene dependencies, selects a supported upstream interaction, and applies a validated change instead of directly editing visible geometry. The broader claim is that spatial AI should be evaluated not only by visual quality, but by whether generated or edited 3D can become reliable substrate for CAD, robotics, simulation, inspection, manufacturing, and interactive world authoring.
- Abstract(参考訳): ファンデーションモデルは、アセンブリ、シーン、環境といった3Dオブジェクトを記述、再構築し、生成することができるが、視覚的に可視な空間出力はまだオペラブルな3Dではない。
生成されたオブジェクトや環境は、システムがエンティティ、フレーム、表面、制約、証明、許容可能なアクション、期待された効果、検証失敗を識別できる場合にのみ、エージェントに役立ちます。
本稿では,契約境界空間知能のためのシステムアーキテクチャであるHylosを紹介する。
Hylosは、オブジェクト、アセンブリ、アセット、サーフェスアンカー、アサーション、アクション候補、ソルバジョブ、共有アクチュエータ呼び出し、能力ギャップ、エフェクト差といった、シーンスケールの操作性状態を維持している。
参照を解決し、許容性を確認し、不変性を保護し、エフェクトを計画し、コミット、レビュー、ロールバック、デフェラル、あるいは機能ギャップの結果を返すコミット境界。
この論文は、幅広いベンチマークではなく、焦点を絞ったアーティファクトスタディを備えたシステム/ポジションプレプリントとしてフレーム化されている。
この研究は、因果修復について検討し、視覚的不整合が依存部品に現れるのに対して、支持された修復はそれを制御する配置構造に上流に置かれている。
成功したインタラクションは、シーン依存を通じて症状をトレースし、サポート対象の上流でのインタラクションを選択し、目に見える幾何学を直接編集する代わりに、検証された変更を適用する。
より広範な主張は、空間AIは視覚的品質だけでなく、CAD、ロボティクス、シミュレーション、検査、製造、インタラクティブな世界オーサリングの信頼性の高い基盤となる3Dの生成または編集によって評価されるべきである。
関連論文リスト
- Beyond Spatial Compression: Interface-Centric Generative States for Open-World 3D Structure [55.17771962316751]
現在の3Dトークンは、表現を空間圧縮として扱うが、コンポーネントの所有権とアタッチメントの妥当性は暗黙的に残す。
我々は、トークン化がパッシブ圧縮コードではなく操作状態を構成する、インターフェイス中心の生成状態という別の視点を定式化する。
我々は、この定式化を、C2LT-3D(Component-Conditioned Canonical Local Tokens)でインスタンス化し、表現を標準局所幾何学、パーティション条件付きコンテキスト、およびリレーショナルシーム変数に分解する。
論文 参考訳(メタデータ) (2026-05-11T12:09:28Z) - Securing Computer-Use Agents: A Unified Architecture-Lifecycle Framework for Deployment-Grounded Reliability [21.333731425525205]
この記事では、CUAのデプロイメント基盤信頼性のためのアーキテクチャライフサイクルフレームワークを開発する。
この分析は、代表システム、ベンチマーク、およびセキュリティ/プライバシー研究を合成する。
論文 参考訳(メタデータ) (2026-05-08T01:38:46Z) - SceneTeract: Agentic Functional Affordances and VLM Grounding in 3D Scenes [49.117927512531715]
我々はエージェント固有の制約の下で3Dシーン機能を検証するフレームワークであるSceneTeractを紹介する。
SceneTeractは複雑なアクティビティをアトミックアクションのシーケンスに分解し、アクセシビリティ要求に対して各ステップを検証する。
具体化された3Dシーン理解における知覚と身体的現実を橋渡しするSceneTeract検証スイートとデータをリリースする。
論文 参考訳(メタデータ) (2026-03-31T14:31:18Z) - From Perception to Action: An Interactive Benchmark for Vision Reasoning [51.11355591375073]
Causal Hierarchy of Actions and Interactions (CHAIN)ベンチマークは、モデルが物理的制約に基づいて構造化されたアクションシーケンスを理解し、計画し、実行できるかを評価するために設計された。
CHAINは、受動的知覚からアクティブな問題解決、機械パズルのインターロックや3D積み重ね、パッキングといったタスクへと評価をシフトする。
以上の結果から,トップパフォーマンスモデルでは,物理構造や因果制約の内在化に苦慮し,信頼性の高い長期計画の作成に失敗することが多く,認識された構造を効果的に翻訳することができないことが示唆された。
論文 参考訳(メタデータ) (2026-02-24T15:33:02Z) - PhyScensis: Physics-Augmented LLM Agents for Complex Physical Scene Arrangement [89.35154754765502]
PhyScensisは物理エンジンを動力とするエージェントベースのフレームワークで、物理的に可視なシーン構成を生成する。
本フレームワークは,微粒なテキスト記述や数値パラメータに対する強い制御性を保っている。
実験の結果,本手法はシーンの複雑さ,視覚的品質,身体的精度において,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2026-02-16T17:55:25Z) - The Meeseeks Mesh: Spatially Consistent 3D Adversarial Objects for BEV Detector [37.74333887056029]
3Dオブジェクト検出は、自律運転システムにおいて重要な要素である。
本稿では,3次元物体検出モデルの3次元敵攻撃に対する脆弱性について検討する。
実世界の攻撃シナリオに適した非侵襲的な3次元対向オブジェクトを生成する。
論文 参考訳(メタデータ) (2025-05-28T15:49:54Z) - IAAO: Interactive Affordance Learning for Articulated Objects in 3D Environments [56.85804719947]
IAAOは知的エージェントのための明示的な3Dモデルを構築するフレームワークで,対話を通して環境内の明瞭な物体の理解を得る。
マスク特徴とビュー一貫性ラベルを多視点画像から抽出し,まず3次元ガウススティング(3DGS)を用いて各オブジェクト状態の階層的特徴とラベルフィールドを構築する。
次に、3Dガウスプリミティブ上でオブジェクトと部分レベルのクエリを実行し、静的および明瞭な要素を識別し、大域的な変換と局所的な調音パラメータをアベイランスとともに推定する。
論文 参考訳(メタデータ) (2025-04-09T12:36:48Z) - Robust Change Detection Based on Neural Descriptor Fields [53.111397800478294]
我々は、部分的に重なり合う観測結果とノイズのある局所化結果に頑健なオブジェクトレベルのオンライン変化検出手法を開発した。
形状符号の類似性を利用して物体を連想させ, 局所的な物体近傍の空間配置を比較することにより, 観測重複や局所雑音に対する頑健性を示す。
論文 参考訳(メタデータ) (2022-08-01T17:45:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。