Fugu-MT 論文翻訳(概要): WHALES: A Multi-agent Scheduling Dataset for Enhanced Cooperation in Autonomous Driving

論文の概要: WHALES: A Multi-agent Scheduling Dataset for Enhanced Cooperation in Autonomous Driving

arxiv url: http://arxiv.org/abs/2411.13340v2
Date: Tue, 17 Jun 2025 03:01:23 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-18 17:34:59.063895
Title: WHALES: A Multi-agent Scheduling Dataset for Enhanced Cooperation in Autonomous Driving
Title（参考訳）: WHALES: 自律運転における協調強化のためのマルチエージェントスケジューリングデータセット
Authors: Richard Wang, Siwei Chen, Ziyi Song, Sheng Zhou,
Abstract要約: We present WHALES, a first large-scale V2X dataset designed for benchmark communication-aware agent scheduling and scalable collaborative perception。 WHALESは、シーン当たり平均8.4の協調エージェントと、さまざまなトラフィックシナリオにまたがる2.01百万の注釈付き3Dオブジェクトを備えた、最先端のSOTA(State-of-the-art)標準を確立している。そこで本研究では,歴史的視点に基づくエージェントの優先順位付けを行う新しいスケジューリングベースラインであるCoverage-Aware Historical Scheduler(CAHS)を提案する。
参考スコア（独自算出の注目度）: 13.290191462007668
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Cooperative perception research is constrained by the scarcity of datasets that capture the complexity of real-world Vehicle-to-Everything (V2X) interactions, particularly under dynamic communication constraints. To address this, we present WHALES (Wireless enhanced Autonomous vehicles with Large number of Engaged agents), the first large-scale V2X dataset specifically designed to benchmark communication-aware agent scheduling and scalable cooperative perception. WHALES establishes a new state-of-the-art (SOTA) standard with an average of 8.4 cooperative agents per scene and 2.01 million annotated 3D objects spanning diverse traffic scenarios. It integrates communication metadata to simulate real-world communication bottlenecks, enabling rigorous evaluation of scheduling strategies. To further advance the field, we propose the Coverage-Aware Historical Scheduler (CAHS), a novel scheduling baseline that prioritizes agents based on historical viewpoint coverage, improving perception performance over existing SOTA methods. WHALES bridges the gap between simulated and real-world V2X challenges, offering a robust framework to explore perception-scheduling co-design, cross-data generalization, and scalability limits. The WHALES dataset and code are available at: https://github.com/chensiweiTHU/WHALES.
Abstract（参考訳）: 協調知覚研究は、特に動的通信の制約の下で、現実世界のV2X(Var-to-Everything)相互作用の複雑さを捉えるデータセットの不足に制約されている。この問題を解決するために、通信対応エージェントのスケジューリングとスケーラブルな協調認識をベンチマークするために設計された、最初の大規模V2XデータセットであるWHALES(Wireless enhanced Autonomous Vehicle with Large Number of Engaged Agent)を提案する。 WHALESは、シーン当たり平均8.4の協調エージェントと、さまざまなトラフィックシナリオにまたがる2.01百万の注釈付き3Dオブジェクトを備えた、最先端のSOTA(State-of-the-art)標準を確立している。通信メタデータを統合し、実世界の通信ボトルネックをシミュレートし、スケジューリング戦略の厳密な評価を可能にする。そこで本研究では,従来のSOTA手法よりも認知性能を向上し,歴史的視点のカバレッジに基づいてエージェントを優先順位付けする新しいスケジューリングベースラインであるCoverage-Aware Historical Scheduler(CAHS)を提案する。 WHALESは、シミュレートされたV2X課題と実世界のV2X課題のギャップを埋め、知覚スケジューリングの共設計、データ間の一般化、スケーラビリティの限界を探求する堅牢なフレームワークを提供する。 WHALESデータセットとコードは、https://github.com/chensiweiTHU/WHALESで公開されている。

関連論文リスト

Scaling Up Occupancy-centric Driving Scene Generation: Dataset and Method [54.461213497603154]
作業中心の手法は、最近、フレームとモダリティをまたいだ一貫した条件付けを提供することで、最先端の結果を得た。 Nuplan-Occは、広く使われているNuplanベンチマークから構築された、これまでで最大の占有率データセットである。高品質な占有、多視点ビデオ、LiDAR点雲を共同で合成する統合フレームワークを開発した。
論文参考訳（メタデータ） (2025-10-27T03:52:45Z)
MCOP: Multi-UAV Collaborative Occupancy Prediction [40.58729551462363]
Current Bird's Eye View (BEV)ベースのアプローチには2つの大きな制限がある。本稿では,複数UAV共同占有予測フレームワークを提案する。提案手法は最先端の精度を達成し,既存の協調手法を著しく上回っている。
論文参考訳（メタデータ） (2025-10-14T16:17:42Z)
INSTINCT: Instance-Level Interaction Architecture for Query-Based Collaborative Perception [6.018757656052237]
協調認識システムは、マルチエージェントの知覚データを統合し、精度と安全性を向上させることで、単一車両の制限を克服する。これまでの研究は、クエリベースのインスタンスレベルのインタラクションが帯域幅の要求と手作業による事前処理を減らすことを証明してきたが、協調認識におけるLiDARによる実装は未開発のままである。 InSTINCTは,(1)高品質なインスタンス特徴選択のための品質認識型フィルタリング機構,2)協調関連インスタンスと協調関連インスタンスを分離するデュアルブランチ検出ルーティングスキーム,3)クロスエージェントローカルインスタンスフュージョンモジュール,の3つのコアコンポーネントを特徴とする新しい協調認識フレームワークを提案する。
論文参考訳（メタデータ） (2025-09-28T07:16:32Z)
World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks [53.98633183204453]
本稿では,車載ネットワークにおけるパケット完全性認識情報(CAoI)の年齢を最小化するために,新しい世界モデルに基づく学習フレームワークを提案する。 mmWave V2X環境の動的モデルを共同で学習し、リンクスケジューリングの方法を学ぶための軌跡を想像するために使用する世界モデルフレームワークを提案する。特に、長期的な政策は環境相互作用の代わりに、異なる想像軌道で学習される。
論文参考訳（メタデータ） (2025-05-03T06:23:18Z)
V2X-ReaLO: An Open Online Framework and Dataset for Cooperative Perception in Reality [13.68645389910716]
V2X-ReaLOは,実車およびスマートインフラストラクチャ上にデプロイされたオープンオンライン協調認識フレームワークである。本稿では,オンライン協調認識システムの性能を評価するために,オープンなベンチマークデータセットを提案する。
論文参考訳（メタデータ） (2025-03-13T04:31:20Z)
V2V-LLM: Vehicle-to-Vehicle Cooperative Autonomous Driving with Multi-Modal Large Language Models [31.537045261401666]
本稿では,多モード大規模言語モデルと協調自律運転を統合した新しい問題設定を提案する。また,V2V-LLM(V2V-LLM)のベースライン手法を提案する。実験結果から,提案するV2V-LLMは,協調運転における様々なタスクを遂行する上で,有望な統一モデルアーキテクチャとなる可能性が示唆された。
論文参考訳（メタデータ） (2025-02-14T08:05:41Z)
Deep Reinforcement Learning-Based User Scheduling for Collaborative Perception [24.300126250046894]
車両間通信(V2X)を用いて、協調的知覚が知覚精度を向上させることを想定する。通信資源が限られているため、すべてのユニットが点雲や高精細ビデオなどのセンシングデータを送信するのは現実的ではない。協調認識のための深層強化学習に基づくV2Xユーザスケジューリングアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-02-12T04:45:00Z)
V2XPnP: Vehicle-to-Everything Spatio-Temporal Fusion for Multi-Agent Perception and Prediction [44.40410127660706]
V2X(Valby-to-everything)技術は、単一車両システムにおける制限された可観測性の制限を提供する。我々は,1段階,複数段階の通信戦略(送信時)に焦点を当て,その統合を3つの融合戦略で検討する。我々のフレームワークは、認識タスクと予測タスクの両方において最先端の手法より優れています。
論文参考訳（メタデータ） (2024-12-02T18:55:34Z)
Self-Supervised State Space Model for Real-Time Traffic Accident Prediction Using eKAN Networks [18.385759762991896]
SSL-eKambaは、交通事故予測のための効率的な自己組織化フレームワークである。一般化を促進するために,交通パターン表現を適応的に改善する2つの自己教師付き補助タスクを設計する。 2つの実世界のデータセットの実験では、SSL-eKambaは最先端のベースラインを一貫して上回っている。
論文参考訳（メタデータ） (2024-09-09T14:25:51Z)
Scaling Large Language Model-based Multi-Agent Collaboration [72.8998796426346]
近年の大規模言語モデル駆動型自律エージェントのブレークスルーにより、複数エージェントのコラボレーションが集団的推論を通じて各個人を上回ることが判明している。本研究は、協調剤の連続的な添加が同様の利益をもたらすかどうかを考察する。
論文参考訳（メタデータ） (2024-06-11T11:02:04Z)
AutoAct: Automatic Agent Learning from Scratch for QA via Self-Planning [54.47116888545878]
AutoActはQAのための自動エージェント学習フレームワークである。大規模アノテートデータやクローズドソースモデルからの合成計画軌道は依存していない。
論文参考訳（メタデータ） (2024-01-10T16:57:24Z)
AutoAgents: A Framework for Automatic Agent Generation [27.74332323317923]
AutoAgentsは、さまざまなタスクに応じてAIチームを構築するために、複数の専門エージェントを適応的に生成し、コーディネートする革新的なフレームワークである。各種ベンチマーク実験により,AutoAgentsは既存のマルチエージェント手法よりも一貫性と正確な解を生成することが示された。
論文参考訳（メタデータ） (2023-09-29T14:46:30Z)
End-to-end Autonomous Driving: Challenges and Frontiers [45.391430626264764]
エンドツーエンドの自動運転におけるモチベーション、ロードマップ、方法論、課題、今後のトレンドについて、270以上の論文を包括的に分析する。マルチモダリティ、解釈可能性、因果的混乱、堅牢性、世界モデルなど、いくつかの重要な課題を掘り下げます。基礎モデルと視覚前訓練の現在の進歩と、これらの技術をエンドツーエンドの駆動フレームワークに組み込む方法について論じる。
論文参考訳（メタデータ） (2023-06-29T14:17:24Z)
Visual Exemplar Driven Task-Prompting for Unified Perception in Autonomous Driving [100.3848723827869]
本稿では,タスク固有のプロンプトを通じて視覚的見本を提示する,効果的なマルチタスクフレームワークVE-Promptを提案する。具体的には、境界ボックスと色に基づくマーカーに基づいて視覚的な例を生成し、ターゲットカテゴリの正確な視覚的外観を提供する。我々は変圧器をベースとしたエンコーダと畳み込み層を橋渡しし、自律運転における効率的かつ正確な統合認識を実現する。
論文参考訳（メタデータ） (2023-03-03T08:54:06Z)
DOLPHINS: Dataset for Collaborative Perception enabled Harmonious and Interconnected Self-driving [19.66714697653504]
V2Xネットワークは、自動運転における協調的な認識を可能にしている。データセットの欠如は、協調認識アルゴリズムの開発を著しく妨げている。 DOLPHINS: cOllaborative Perception を実現するためのデータセットである Harmonious と Inter connected Self-driving をリリースする。
論文参考訳（メタデータ） (2022-07-15T17:07:07Z)
COOPERNAUT: End-to-End Driving with Cooperative Perception for Networked Vehicles [54.61668577827041]
本稿では,車間認識を用いたエンドツーエンド学習モデルであるCOOPERNAUTを紹介する。われわれのAutoCastSim実験は、我々の協調知覚駆動モデルが平均成功率を40%向上させることを示唆している。
論文参考訳（メタデータ） (2022-05-04T17:55:12Z)
Fully End-to-end Autonomous Driving with Semantic Depth Cloud Mapping and Multi-Agent [2.512827436728378]
本稿では,エンド・ツー・エンドとマルチタスクの学習方法を用いて学習した新しいディープラーニングモデルを提案する。このモデルは,CARLAシミュレータ上で,現実の環境を模倣するために,通常の状況と異なる天候のシナリオを用いて評価する。
論文参考訳（メタデータ） (2022-04-12T03:57:01Z)
V2X-ViT: Vehicle-to-Everything Cooperative Perception with Vision Transformer [58.71845618090022]
我々は、道路上のエージェント間で情報を融合するために、V2X-ViTという全体論的アテンションモデルを構築した。 V2X-ViTは異質なマルチエージェント自己アテンションとマルチスケールウィンドウ自己アテンションの交互層から構成される。我々のアプローチを検証するために、我々は大規模なV2X知覚データセットを作成します。
論文参考訳（メタデータ） (2022-03-20T20:18:25Z)
Towards Scale Consistent Monocular Visual Odometry by Learning from the Virtual World [83.36195426897768]
仮想データから絶対スケールを取得するための新しいフレームワークであるVRVOを提案する。まず、モノクロ実画像とステレオ仮想データの両方を用いて、スケール対応の異種ネットワークをトレーニングする。結果として生じるスケール一貫性の相違は、直接VOシステムと統合される。
論文参考訳（メタデータ） (2022-03-11T01:51:54Z)
Anomaly Detection in Multi-Agent Trajectories for Automated Driving [2.5211566369910967]
人間と同様、自動走行車は異常検出を行う。私たちの革新は、動的エージェントの複数の軌道を共同で学習する能力です。
論文参考訳（メタデータ） (2021-10-15T08:07:31Z)
Cross-modal Consensus Network for Weakly Supervised Temporal Action Localization [74.34699679568818]
時間的行動局所化 (WS-TAL) は、ビデオレベルの分類的監督によって、ビデオ内のアクションインスタンスをローカライズすることを目的とした課題である。この問題に対処するためのクロスモーダルコンセンサスネットワーク(CO2-Net)を提案する。
論文参考訳（メタデータ） (2021-07-27T04:21:01Z)
Value Function is All You Need: A Unified Learning Framework for Ride Hailing Platforms [57.21078336887961]
DiDi、Uber、Lyftなどの大型配車プラットフォームは、都市内の数万台の車両を1日中数百万の乗車要求に接続している。両課題に対処するための統合価値に基づく動的学習フレームワーク(V1D3)を提案する。
論文参考訳（メタデータ） (2021-05-18T19:22:24Z)
SMARTS: Scalable Multi-Agent Reinforcement Learning Training School for Autonomous Driving [96.50297622371457]
マルチエージェントインタラクションは、現実の世界における自律運転の基本的な側面である。研究と開発が10年以上続いたにもかかわらず、様々なシナリオで多様な道路ユーザーと対話する方法の問題は未解決のままである。 SMARTSと呼ばれる,多種多様な運転インタラクションを生成する専用シミュレーションプラットフォームを開発した。
論文参考訳（メタデータ） (2020-10-19T18:26:10Z)
Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文参考訳（メタデータ） (2020-05-27T01:10:41Z)
Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文参考訳（メタデータ） (2020-03-09T17:05:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。