論文の概要: System Design for Maintaining Internal State Consistency in Long-Horizon Robotic Tabletop Games
- arxiv url: http://arxiv.org/abs/2603.25405v1
- Date: Thu, 26 Mar 2026 12:54:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.300348
- Title: System Design for Maintaining Internal State Consistency in Long-Horizon Robotic Tabletop Games
- Title(参考訳): 長距離ロボットテーブルトップゲームにおける内部状態の整合性維持のためのシステム設計
- Authors: Guangyu Zhao, Ceyao Zhang, Chengdong Ma, Tao Wu, Yiyang Song, Haoxuan Ru, Yifan Zhong, Ruilin Yan, Lingfeng Li, Ruochong Li, Yu Li, Xuyuan Han, Yun Ding, Ruizhang Jiang, Xiaochuan Zhang, Yichao Li, Yuanpei Chen, Yaodong Yang, Yitao Liang,
- Abstract要約: ロングホライゾンのテーブルトップゲームは、ロボティクスに固有のシステムに挑戦する。
知覚的あるいは実行上の小さなエラーは、蓄積されたタスク状態の無効化、意思決定モジュール間の伝搬、および脱線処理を可能とします。
本稿では,ターン型マルチロボットテーブルトップゲームにおける内部状態の整合性を維持する方法について検討する。
- 参考スコア(独自算出の注目度): 29.25150598992781
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Long-horizon tabletop games pose a distinct systems challenge for robotics: small perceptual or execution errors can invalidate accumulated task state, propagate across decision-making modules, and ultimately derail interaction. This paper studies how to maintain internal state consistency in turn-based, multi-human robotic tabletop games through deliberate system design rather than isolated component improvement. Using Mahjong as a representative long-horizon setting, we present an integrated architecture that explicitly maintains perceptual, execution, and interaction state, partitions high-level semantic reasoning from time-critical perception and control, and incorporates verified action primitives with tactile-triggered recovery to prevent premature state corruption. We further introduce interaction-level monitoring mechanisms to detect turn violations and hidden-information breaches that threaten execution assumptions. Beyond demonstrating complete-game operation, we provide an empirical characterization of failure modes, recovery effectiveness, cross-module error propagation, and hardware-algorithm trade-offs observed during deployment. Our results show that explicit partitioning, monitored state transitions, and recovery mechanisms are critical for sustaining executable consistency over extended play, whereas monolithic or unverified pipelines lead to measurable degradation in end-to-end reliability. The proposed system serves as an empirical platform for studying system-level design principles in long-horizon, turn-based interaction.
- Abstract(参考訳): 小さな知覚的または実行エラーは、蓄積したタスク状態を無効にし、意思決定モジュールを伝播し、最終的に相互作用を脱線させる。
本稿では,ターン型マルチヒューマン・ロボット・テーブルトップゲームにおける内部状態の整合性を維持するためのシステム設計手法について述べる。
マフジョンを代表的なロングホライゾン設定として用いて、知覚、実行、相互作用状態を明確に維持し、時間的クリティカルな知覚と制御から高レベルの意味論的推論を分割し、実証されたアクションプリミティブを触覚的にトリガーしたリカバリに組み込んで、早期状態の腐敗を防ぐ統合アーキテクチャを提案する。
さらに、ターン違反や隠れ情報漏洩を検知し、実行仮定を脅かすインタラクションレベル監視機構を導入する。
完全ゲーム動作の実証に加えて,障害モード,回復効率,モジュール間エラーの伝搬,デプロイメント中に観測されるハードウェアとアルゴリズムのトレードオフを実証的に評価する。
その結果、明示的なパーティショニング、監視された状態遷移、リカバリメカニズムは、拡張プレイよりも持続的な一貫性を維持する上で重要である一方で、モノリシックあるいは未検証パイプラインは、エンドツーエンドの信頼性の計測不能な低下をもたらすことがわかった。
提案システムは,長期のターンベースインタラクションにおいて,システムレベルの設計原則を研究するための経験的プラットフォームとして機能する。
関連論文リスト
- Mechanistic Foundations of Goal-Directed Control [0.0]
本研究では,基礎バイアスが因果制御回路を生じさせ,理論上動機付けられた不確実性しきい値に収束する学習ゲーティング機構を示す。
この研究は、認知発達の機械的説明を強化し、解釈可能なエンボディードエージェントの設計のための原則化されたガイダンスを提供する。
論文 参考訳(メタデータ) (2026-03-16T13:19:34Z) - State-Dependent Safety Failures in Multi-Turn Language Model Interaction [70.52906620450847]
我々は、状態空間の観点から安全性障害を研究し、多くのマルチターン障害が構造化状態の進化から生じることを示す。
本稿では,対話履歴を状態遷移演算子として扱う状態指向診断フレームワークSTARを紹介する。
静的な評価の下で頑健なように見えるシステムは、構造化されたマルチターン相互作用の下で、迅速かつ再現可能な安全破壊を受けることができる。
論文 参考訳(メタデータ) (2026-03-15T12:13:01Z) - Pro-HOI: Perceptive Root-guided Humanoid-Object Interaction [57.252599851031505]
本稿では,知覚根誘導型ヒューマノイドオブジェクトインタラクション,Pro-HOIを紹介する。
Pro-HOIは、堅牢なヒューマノイドロコ操作のための一般化可能なフレームワークである。
ユニツリーG1ロボットの実証検証は、Pro-HOIが一般化と堅牢性においてベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2026-03-01T14:19:59Z) - From Perception to Action: An Interactive Benchmark for Vision Reasoning [51.11355591375073]
Causal Hierarchy of Actions and Interactions (CHAIN)ベンチマークは、モデルが物理的制約に基づいて構造化されたアクションシーケンスを理解し、計画し、実行できるかを評価するために設計された。
CHAINは、受動的知覚からアクティブな問題解決、機械パズルのインターロックや3D積み重ね、パッキングといったタスクへと評価をシフトする。
以上の結果から,トップパフォーマンスモデルでは,物理構造や因果制約の内在化に苦慮し,信頼性の高い長期計画の作成に失敗することが多く,認識された構造を効果的に翻訳することができないことが示唆された。
論文 参考訳(メタデータ) (2026-02-24T15:33:02Z) - Transformer-Based Reinforcement Learning for Autonomous Orbital Collision Avoidance in Partially Observable Environments [0.3093890460224435]
自律軌道衝突回避のためのトランスフォーマーに基づく強化学習フレームワークを提案する。
この研究の中心的な貢献は、トランスフォーマーベースのPartially Observable Markov Decision Processアーキテクチャの利用である。
この統合は、不完全な監視環境下でより確実に動作可能な衝突回避エージェントを訓練するための基盤を提供する。
論文 参考訳(メタデータ) (2026-02-05T04:57:58Z) - MEMBOT: Memory-Based Robot in Intermittent POMDP [0.0]
MEMBOTは、ロボット制御タスクにおける間欠的な部分的可観測性に対処するために設計されたメモリベースのアーキテクチャである。
我々はMetaWorldとRoomimicの10のロボット操作ベンチマークタスクでMEMBOTをトレーニングし評価する。
その結果,MEMBOTはメモリレスベースラインと鼻リカレントベースラインの両方を一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2025-09-14T12:00:52Z) - Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection [56.66677293607114]
オープンセットのリアクティブかつアクティブな障害検出のためのCode-as-Monitor(CaM)を提案する。
モニタリングの精度と効率を高めるために,制約関連エンティティを抽象化する制約要素を導入する。
実験により、CaMは28.7%高い成功率を達成し、厳しい乱れの下で実行時間を31.8%短縮することが示された。
論文 参考訳(メタデータ) (2024-12-05T18:58:27Z) - Monitoring and Diagnosability of Perception Systems [21.25149064251918]
知覚は、ロボット工学や自動運転車などの自律システムの高統合的応用において重要な要素である。
知覚システムの重要さにもかかわらず、システムレベルのモニタリングには正式なアプローチは存在しない。
本稿では,認識システムの実行時モニタリングと故障検出のための数学的モデルを提案する。
論文 参考訳(メタデータ) (2020-05-24T18:09:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。