論文の概要: Robust Collaborative 3D Object Detection in Presence of Pose Errors
- arxiv url: http://arxiv.org/abs/2211.07214v1
- Date: Mon, 14 Nov 2022 09:11:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 20:20:41.694806
- Title: Robust Collaborative 3D Object Detection in Presence of Pose Errors
- Title(参考訳): ポーズ誤りを考慮したロバストな3次元物体検出
- Authors: Yifan Lu, Quanhao Li, Baoan Liu, Mehrdad Dianat, Chen Feng, Siheng
Chen, Yanfeng Wang
- Abstract要約: 協調的な3Dオブジェクト検出は、複数のエージェント間の情報交換を利用して精度を高める。
実際には、不完全局所化によるポーズ推定誤差は、空間的メッセージの不整合を引き起こす。
未知のポーズエラーに対して堅牢な新しいハイブリッドコラボレーションフレームワークであるCoAlignを提案する。
- 参考スコア(独自算出の注目度): 29.18633175936039
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Collaborative 3D object detection exploits information exchange among
multiple agents to enhance accuracy of object detection in presence of sensor
impairments such as occlusion. However, in practice, pose estimation errors due
to imperfect localization would cause spatial message misalignment and
significantly reduce the performance of collaboration. To alleviate adverse
impacts of pose errors, we propose CoAlign, a novel hybrid collaboration
framework that is robust to unknown pose errors. The proposed solution relies
on a novel agent-object pose graph modeling to enhance pose consistency among
collaborating agents. Furthermore, we adopt a multi-scale data fusion strategy
to aggregate intermediate features at multiple spatial resolutions. Comparing
with previous works, which require ground-truth pose for training supervision,
our proposed CoAlign is more practical since it doesn't require any
ground-truth pose supervision in the training and makes no specific assumptions
on pose errors. Extensive evaluation of the proposed method is carried out on
multiple datasets, certifying that CoAlign significantly reduce relative
localization error and achieving the state of art detection performance when
pose errors exist. Code are made available for the use of the research
community at https://github.com/yifanlu0227/CoAlign.
- Abstract(参考訳): コラボレーティブな3dオブジェクト検出は、複数のエージェント間の情報交換を利用して、咬合などのセンサ障害の存在下でのオブジェクト検出の精度を高める。
しかし、実際には、不完全局所化によるポーズ推定誤差は、空間的メッセージの不整合を引き起こし、協調性能を著しく低下させる。
ポーズエラーの悪影響を軽減するために,未知のポーズエラーに対して堅牢な新しいハイブリッド協調フレームワークであるCoAlignを提案する。
提案手法は,協調エージェント間のポーズ一貫性を高めるために,新たなエージェント・オブジェクトポーズグラフモデリングに依存している。
さらに,複数の空間解像度で中間特徴を集約するマルチスケールデータ融合戦略を採用した。
訓練指導のための基礎的姿勢を必要とする先行研究と比較すると,本提案手法は訓練において基礎的姿勢の監督を必要とせず,ポーズ誤りの具体的な仮定をもたらさないため,より実用的である。
提案手法の大規模評価を複数のデータセットで行い,CoAlignが相対的な局所化誤差を著しく低減し,ポーズ誤差が存在する場合の美術検出性能の達成を証明した。
コードはhttps://github.com/yifanlu0227/CoAlign.comで研究コミュニティが利用できる。
関連論文リスト
- RoCo:Robust Collaborative Perception By Iterative Object Matching and Pose Adjustment [9.817492112784674]
複数の車両との協調自動運転は通常、複数のモードからのデータ融合を必要とする。
協調的な知覚では、モダリティに基づく物体検出の品質は、エージェント間の相対的なポーズ誤差に非常に敏感である。
反復的なオブジェクトマッチングとエージェントポーズ調整を行うための新しい教師なしフレームワークであるRoCoを提案する。
論文 参考訳(メタデータ) (2024-08-01T03:29:33Z) - Self-Localized Collaborative Perception [49.86110931859302]
我々は,新しい自己局在型協調認識システムであるMathttCoBEVGlue$を提案する。
$mathttCoBEVGlue$は、エージェント間の相対的なポーズを提供する新しい空間アライメントモジュールである。
$mathttCoBEVGlue$は任意のローカライゼーションノイズとアタックの下で最先端の検出性能を達成する。
論文 参考訳(メタデータ) (2024-06-18T15:26:54Z) - SplatPose & Detect: Pose-Agnostic 3D Anomaly Detection [18.796625355398252]
最先端のアルゴリズムは、ますます困難な設定やデータモダリティの欠陥を検出することができる。
本稿では,3次元ガウススプラッティングに基づくフレームワークSplatPoseを提案する。
競合手法に比べてトレーニングデータが少ない場合でも,トレーニング速度と推論速度,検出性能の両面で最先端の成果が得られている。
論文 参考訳(メタデータ) (2024-04-10T08:48:09Z) - Non-Local Latent Relation Distillation for Self-Adaptive 3D Human Pose
Estimation [63.199549837604444]
3次元ポーズ推定アプローチは、強い(2D/3Dポーズ)または弱い(複数ビューまたは深さ)ペアによる監督の異なる形態を利用する。
我々は3Dポーズ学習を,ラベル付きソースドメインから完全に損なわれないターゲットへのタスク知識の転送を目的とした,自己指導型適応問題として捉えた。
我々は、異なる自己適応設定を評価し、標準ベンチマークで最先端の3Dポーズ推定性能を示す。
論文 参考訳(メタデータ) (2022-04-05T03:52:57Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Delving into Localization Errors for Monocular 3D Object Detection [85.77319416168362]
単眼画像から3Dバウンディングボックスを推定することは、自動運転に不可欠な要素です。
本研究では, 各サブタスクがもたらす影響を定量化し, 局所化誤差を求めることが, モノクロ3次元検出の抑制に欠かせない要因である。
論文 参考訳(メタデータ) (2021-03-30T10:38:01Z) - MonoRUn: Monocular 3D Object Detection by Reconstruction and Uncertainty
Propagation [4.202461384355329]
我々は,高密度な対応や幾何学を自己教師型で学習する,新しい3次元オブジェクト検出フレームワークMonoRUnを提案する。
提案手法は,KITTIベンチマークの最先端手法より優れている。
論文 参考訳(メタデータ) (2021-03-23T15:03:08Z) - Learning to Communicate and Correct Pose Errors [75.03747122616605]
本稿では、V2VNetで提案された設定について検討し、近くにある自動運転車が共同で物体検出と動き予測を協調的に行う方法を提案する。
本稿では,コミュニケーションを学習し,潜在的な誤りを推定し,それらの誤りについてコンセンサスを得るための新しいニューラルネットワーク推論フレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-10T18:19:40Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。