論文の概要: Practical Collaborative Perception: A Framework for Asynchronous and
Multi-Agent 3D Object Detection
- arxiv url: http://arxiv.org/abs/2307.01462v3
- Date: Tue, 19 Sep 2023 07:45:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-20 19:30:53.180426
- Title: Practical Collaborative Perception: A Framework for Asynchronous and
Multi-Agent 3D Object Detection
- Title(参考訳): 実用的なコラボレーティブ知覚:非同期およびマルチエージェント3dオブジェクト検出のためのフレームワーク
- Authors: Minh-Quan Dao, Julie Stephany Berrio, Vincent Fr\'emont, Mao Shan,
Elwan H\'ery, and Stewart Worrall
- Abstract要約: 咬合は、LiDARベースのオブジェクト検出方法において大きな課題である。
最先端のV2X手法は、中間協調手法を用いて性能帯域幅のトレードオフを解消する。
我々は,従来の方法よりも帯域幅と性能のトレードオフを向上する,シンプルで効果的な協調手法を考案した。
- 参考スコア(独自算出の注目度): 9.967263440745432
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Occlusion is a major challenge for LiDAR-based object detection methods. This
challenge becomes safety-critical in urban traffic where the ego vehicle must
have reliable object detection to avoid collision while its field of view is
severely reduced due to the obstruction posed by a large number of road users.
Collaborative perception via Vehicle-to-Everything (V2X) communication, which
leverages the diverse perspective thanks to the presence at multiple locations
of connected agents to form a complete scene representation, is an appealing
solution. State-of-the-art V2X methods resolve the performance-bandwidth
tradeoff using a mid-collaboration approach where the Bird-Eye View images of
point clouds are exchanged so that the bandwidth consumption is lower than
communicating point clouds as in early collaboration, and the detection
performance is higher than late collaboration, which fuses agents' output,
thanks to a deeper interaction among connected agents. While achieving strong
performance, the real-world deployment of most mid-collaboration approaches is
hindered by their overly complicated architectures, involving learnable
collaboration graphs and autoencoder-based compressor/ decompressor, and
unrealistic assumptions about inter-agent synchronization. In this work, we
devise a simple yet effective collaboration method that achieves a better
bandwidth-performance tradeoff than prior state-of-the-art methods while
minimizing changes made to the single-vehicle detection models and relaxing
unrealistic assumptions on inter-agent synchronization. Experiments on the
V2X-Sim dataset show that our collaboration method achieves 98\% of the
performance of an early-collaboration method, while only consuming the
equivalent bandwidth of a late-collaboration method.
- Abstract(参考訳): 咬合は、LiDARベースのオブジェクト検出方法において大きな課題である。
この課題は、多数の道路利用者による障害により視野が著しく低下する一方、衝突を避けるため、エゴ車両が信頼性の高い物体検出を行う必要がある都市交通において、安全上重要となる。
車間コミュニケーション(V2X)による協調的知覚は、接続されたエージェントが複数存在することで様々な視点を生かし、完全なシーン表現を形成することで、魅力的な解決法である。
最先端のV2X方式では,早期の協調作業において,点雲のバードアイビューイメージを交換し,通信点雲よりも通信点雲の帯域消費が低く,また,接続エージェント間の深い相互作用によりエージェントの出力を融合させる遅延協調よりも検出性能が高いという,中間協調方式を用いて,性能帯域幅のトレードオフを解消する。
強力なパフォーマンスを実現する一方で、ほとんどの中途半端なアプローチの実際の展開は、学習可能なコラボレーショングラフやオートエンコーダベースの圧縮/圧縮機、エージェント間の同期に関する非現実的な仮定など、非常に複雑なアーキテクチャによって妨げられている。
本研究では,単一車両検出モデルの変更を最小限に抑えつつ,エージェント間同期における非現実的な仮定を緩和しつつ,従来手法よりも優れた帯域幅性能のトレードオフを実現する,シンプルかつ効果的な協調手法を提案する。
v2x-simデータセットを用いた実験により,提案手法は,遅延コラボレーション法と同等の帯域幅のみを消費しながら,早期コラボレーション法の性能の98\%を達成した。
関連論文リスト
- Semantic Communication for Cooperative Perception using HARQ [51.148203799109304]
我々は重要セマンティック情報を抽出するために重要地図を活用し、協調的な知覚セマンティックコミュニケーションフレームワークを導入する。
周波数分割多重化(OFDM)とチャネル推定と等化戦略を併用して,時間変化によるマルチパスフェーディングによる課題に対処する。
我々は,ハイブリッド自動繰り返し要求(HARQ)の精神において,我々の意味コミュニケーションフレームワークと統合された新しい意味エラー検出手法を提案する。
論文 参考訳(メタデータ) (2024-08-29T08:53:26Z) - HEAD: A Bandwidth-Efficient Cooperative Perception Approach for Heterogeneous Connected and Autonomous Vehicles [9.10239345027499]
HEADは3次元物体検出ネットワークにおける分類と回帰ヘッドの特徴を融合する手法である。
実験の結果,HEADは通信帯域幅と知覚性能を効果的にバランスさせる融合法であることがわかった。
論文 参考訳(メタデータ) (2024-08-27T22:05:44Z) - RoCo:Robust Collaborative Perception By Iterative Object Matching and Pose Adjustment [9.817492112784674]
複数の車両との協調自動運転は通常、複数のモードからのデータ融合を必要とする。
協調的な知覚では、モダリティに基づく物体検出の品質は、エージェント間の相対的なポーズ誤差に非常に敏感である。
反復的なオブジェクトマッチングとエージェントポーズ調整を行うための新しい教師なしフレームワークであるRoCoを提案する。
論文 参考訳(メタデータ) (2024-08-01T03:29:33Z) - Self-Localized Collaborative Perception [49.86110931859302]
我々は,新しい自己局在型協調認識システムであるMathttCoBEVGlue$を提案する。
$mathttCoBEVGlue$は、エージェント間の相対的なポーズを提供する新しい空間アライメントモジュールである。
$mathttCoBEVGlue$は任意のローカライゼーションノイズとアタックの下で最先端の検出性能を達成する。
論文 参考訳(メタデータ) (2024-06-18T15:26:54Z) - Mutual Information-driven Triple Interaction Network for Efficient Image
Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。
振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。
第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文 参考訳(メタデータ) (2023-08-14T08:23:58Z) - Attention Based Feature Fusion For Multi-Agent Collaborative Perception [4.120288148198388]
グラフアテンションネットワーク(GAT)の形での中間的協調認識ソリューションを提案する。
提案手法は,複数の連結エージェント間で交換される中間表現を融合するアテンションベースのアグリゲーション戦略を開発する。
このアプローチは、チャネルレベルと空間レベルの中間特徴写像における重要な領域を適応的に強調することにより、オブジェクト検出精度が向上する。
論文 参考訳(メタデータ) (2023-05-03T12:06:11Z) - Interruption-Aware Cooperative Perception for V2X Communication-Aided
Autonomous Driving [49.42873226593071]
本稿では,V2X通信支援自律運転のためのV2X通信入出力対応協調知覚(V2X-INCOP)を提案する。
我々は、過去の協力情報を用いて、割り込みによる行方不明情報を復元し、割り込み問題の影響を軽減する。
3つの公的な協調認識データセットの実験から,コミュニケーション中断が協調知覚に与える影響を緩和するために提案手法が有効であることが示された。
論文 参考訳(メタデータ) (2023-04-24T04:59:13Z) - DOAD: Decoupled One Stage Action Detection Network [77.14883592642782]
人々をローカライズし、ビデオからアクションを認識することは、ハイレベルなビデオ理解にとって難しい課題だ。
既存の手法は主に2段階ベースで、1段階は人物境界ボックス生成、もう1段階は行動認識を行う。
本稿では、時間的行動検出の効率を向上させるために、DOADと呼ばれる分離したワンステージネットワークを提案する。
論文 参考訳(メタデータ) (2023-04-01T08:06:43Z) - CoPEM: Cooperative Perception Error Models for Autonomous Driving [20.60246432605745]
我々は、隠蔽対象の誤検知エラーとして現れる自律走行車(AV)の(車載)知覚に焦点を当てる。
本稿では,仮想テスト環境におけるV2Xソリューションの効果的な統合を実現するために,協調知覚誤りモデル(coPEM)の概念を導入する。
論文 参考訳(メタデータ) (2022-11-21T04:40:27Z) - Online V2X Scheduling for Raw-Level Cooperative Perception [21.099819062731463]
視界が単独の知性を制限すると、コネクテッドカーの協調的な認識が救助にやってくる。
本稿では,センサ共有スケジューリングのエネルギー最小化問題を定式化して生レベルの協調認識モデルを提案する。
本稿では,対数的性能損失を伴うオンライン学習に基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-12T15:16:45Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。