論文の概要: VehicleWorld: A Highly Integrated Multi-Device Environment for Intelligent Vehicle Interaction
- arxiv url: http://arxiv.org/abs/2509.06736v1
- Date: Mon, 08 Sep 2025 14:28:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:04.188153
- Title: VehicleWorld: A Highly Integrated Multi-Device Environment for Intelligent Vehicle Interaction
- Title(参考訳): VehicleWorld: インテリジェントな車両インタラクションのための高統合マルチデバイス環境
- Authors: Jie Yang, Jiajun Chen, Zhangyue Yin, Shuo Chen, Yuxin Wang, Yiran Guo, Yuan Li, Yining Zheng, Xuanjing Huang, Xipeng Qiu,
- Abstract要約: VehicleWorldは、30のモジュール、250のAPI、680のプロパティを備えた、自動車ドメインのための最初の包括的な環境である。
本研究では,システム状態認識を明示的に維持し,目標条件を達成するために直接状態遷移を実装する新しい手法であるState-based Function Call (SFC)を提案する。
- 参考スコア(独自算出の注目度): 78.34534983766973
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intelligent vehicle cockpits present unique challenges for API Agents, requiring coordination across tightly-coupled subsystems that exceed typical task environments' complexity. Traditional Function Calling (FC) approaches operate statelessly, requiring multiple exploratory calls to build environmental awareness before execution, leading to inefficiency and limited error recovery. We introduce VehicleWorld, the first comprehensive environment for the automotive domain, featuring 30 modules, 250 APIs, and 680 properties with fully executable implementations that provide real-time state information during agent execution. This environment enables precise evaluation of vehicle agent behaviors across diverse, challenging scenarios. Through systematic analysis, we discovered that direct state prediction outperforms function calling for environmental control. Building on this insight, we propose State-based Function Call (SFC), a novel approach that maintains explicit system state awareness and implements direct state transitions to achieve target conditions. Experimental results demonstrate that SFC significantly outperforms traditional FC approaches, achieving superior execution accuracy and reduced latency. We have made all implementation code publicly available on Github https://github.com/OpenMOSS/VehicleWorld.
- Abstract(参考訳): インテリジェントな車両コックピットは、典型的なタスク環境の複雑さを超える密結合されたサブシステム間の調整を必要とする、APIエージェントにユニークな課題を提示する。
従来のFC(Function Calling)アプローチはステートレスに動作し、実行前に環境意識を構築するために複数の探索的な呼び出しを必要とする。
エージェント実行中にリアルタイムの状態情報を提供する完全実行可能な実装を備えた30のモジュール,250のAPI,680のプロパティを備える。
この環境は、多様な挑戦的なシナリオにわたる車両エージェントの挙動を正確に評価することを可能にする。
組織的な分析により、直接状態予測は環境制御を呼び起こす機能より優れていることが判明した。
この知見に基づいて,システム状態の明示的な認識を維持し,目標条件を達成するための直接状態遷移を実装する新しいアプローチであるState-based Function Call (SFC)を提案する。
実験結果から,SFCは従来のFCアプローチよりも大幅に優れ,実行精度が向上し,レイテンシが低減された。
我々は、すべての実装コードをGithub https://github.com/OpenMOSS/VehicleWorldで公開しました。
関連論文リスト
- Unlocking Smarter Device Control: Foresighted Planning with a World Model-Driven Code Execution Approach [82.27842884709378]
本研究では,自然言語理解と構造化推論を優先し,エージェントの環境に対するグローバルな理解を高める枠組みを提案する。
本手法は,従来の手法,特にタスク成功率の44.4%向上を達成している。
論文 参考訳(メタデータ) (2025-05-22T09:08:47Z) - DriveTransformer: Unified Transformer for Scalable End-to-End Autonomous Driving [62.62464518137153]
DriveTransformerは、スケールアップを簡単にするためのシンプルなE2E-ADフレームワークである。
タスク・セルフ・アテンション、センサー・クロス・アテンション、時間的クロス・アテンションという3つの統合された操作で構成されている。
シミュレーションされたクローズドループベンチマークBench2Driveと、FPSの高い実世界のオープンループベンチマークnuScenesの両方で、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-03-07T11:41:18Z) - EI-Drive: A Platform for Cooperative Perception with Realistic Communication Models [16.023748778830562]
EI-DriveはエッジAIベースの自動運転シミュレーションプラットフォームである。
高度な協調認識とより現実的なコミュニケーションモデルを統合する。
EI-Driveを用いた実験では、車両の安全性と性能が大幅に向上した。
論文 参考訳(メタデータ) (2024-12-13T01:37:44Z) - You Only Look at Screens: Multimodal Chain-of-Action Agents [37.118034745972956]
Auto-GUIは、インターフェースと直接対話するマルチモーダルソリューションである。
そこで本研究では,エージェントが実行すべきアクションを決定するためのチェーン・オブ・アクション手法を提案する。
我々は,30$Kのユニークな命令を持つ新しいデバイス制御ベンチマークAITWに対するアプローチを評価した。
論文 参考訳(メタデータ) (2023-09-20T16:12:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。