論文の概要: Mutual Information-calibrated Conformal Feature Fusion for
Uncertainty-Aware Multimodal 3D Object Detection at the Edge
- arxiv url: http://arxiv.org/abs/2309.09593v1
- Date: Mon, 18 Sep 2023 09:02:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 14:22:16.337626
- Title: Mutual Information-calibrated Conformal Feature Fusion for
Uncertainty-Aware Multimodal 3D Object Detection at the Edge
- Title(参考訳): エッジにおける不確実性を考慮したマルチモーダル3次元物体検出のための相互情報校正整形特徴融合
- Authors: Alex C. Stutts, Danilo Erricolo, Sathya Ravi, Theja Tulabandhula, Amit
Ranjan Trivedi
- Abstract要約: 3次元(3D)物体検出は、重要なロボティクスの操作であり、大きな進歩を遂げている。
本研究は,共形推論の原理と情報理論測度を統合し,モンテカルロ自由な不確実性推定を行う。
このフレームワークは、KITTIの3Dオブジェクト検出ベンチマークにおいて、不確実性に気付かない類似のメソッドと同等またはより良いパフォーマンスを示す。
- 参考スコア(独自算出の注目度): 1.7898305876314982
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the expanding landscape of AI-enabled robotics, robust quantification of
predictive uncertainties is of great importance. Three-dimensional (3D) object
detection, a critical robotics operation, has seen significant advancements;
however, the majority of current works focus only on accuracy and ignore
uncertainty quantification. Addressing this gap, our novel study integrates the
principles of conformal inference (CI) with information theoretic measures to
perform lightweight, Monte Carlo-free uncertainty estimation within a
multimodal framework. Through a multivariate Gaussian product of the latent
variables in a Variational Autoencoder (VAE), features from RGB camera and
LiDAR sensor data are fused to improve the prediction accuracy. Normalized
mutual information (NMI) is leveraged as a modulator for calibrating
uncertainty bounds derived from CI based on a weighted loss function. Our
simulation results show an inverse correlation between inherent predictive
uncertainty and NMI throughout the model's training. The framework demonstrates
comparable or better performance in KITTI 3D object detection benchmarks to
similar methods that are not uncertainty-aware, making it suitable for
real-time edge robotics.
- Abstract(参考訳): AI対応ロボットの分野では、予測の不確実性の堅牢な定量化が非常に重要である。
3次元(3d)物体検出はロボット工学の重要な操作であるが、現在の研究の大部分は精度だけに焦点を当て、不確かさの定量化を無視している。
このギャップに対処するため,本研究では,共形推論(CI)の原理を情報理論の尺度と統合し,モンテカルロ自由不確実性評価をマルチモーダルフレームワーク内で行う。
変分オートコーダ(VAE)における潜伏変数の多変量ガウス積を通じて、RGBカメラとLiDARセンサデータの特徴を融合させて予測精度を向上させる。
重み付き損失関数に基づいてCIから導出される不確実性境界を校正するための変調器として正規化相互情報(NMI)を利用する。
シミュレーションの結果,本モデルにおける予測不確かさとNMIとの逆相関が得られた。
このフレームワークは、KITTIの3Dオブジェクト検出ベンチマークにおいて、不確実性を認識しない類似の手法と同等またはより良いパフォーマンスを示し、リアルタイムエッジロボティクスに適している。
関連論文リスト
- Uncertainty Estimation for 3D Object Detection via Evidential Learning [63.61283174146648]
本稿では,3次元検出器における鳥の視線表示における明らかな学習損失を利用して,3次元物体検出の不確かさを定量化するためのフレームワークを提案する。
本研究では,これらの不確実性評価の有効性と重要性を,分布外シーンの特定,局所化の不十分な物体の発見,および(偽陰性)検出の欠如について示す。
論文 参考訳(メタデータ) (2024-10-31T13:13:32Z) - Toward Reliable Human Pose Forecasting with Uncertainty [51.628234388046195]
我々は、複数のモデルを含む人間のポーズ予測のためのオープンソースのライブラリを開発し、複数のデータセットをサポートする。
我々は、パフォーマンスを高め、より良い信頼をもたらすために、問題の2つの不確実性を考案する。
論文 参考訳(メタデータ) (2023-04-13T17:56:08Z) - Lightweight, Uncertainty-Aware Conformalized Visual Odometry [2.429910016019183]
データ駆動型ビジュアルオドメトリー(VO)は、自律エッジロボティクスにとって重要なサブルーチンである。
昆虫スケールドローンや外科ロボットのような最先端ロボットデバイスは、VOの予測の不確実性を推定する計算的に効率的な枠組みを欠いている。
本稿では,共形推論(CI)を利用してVOの不確実な帯域を抽出する,新しい,軽量で統計的に堅牢なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-03T20:37:55Z) - Uncertainty-Aware AB3DMOT by Variational 3D Object Detection [74.8441634948334]
不確実性推定は統計的に正確な予測を提供する効果的なツールである。
本稿では,変分ニューラルネットワークを用いたTANet 3Dオブジェクト検出器を提案し,不確実性のある3Dオブジェクト検出を行う。
論文 参考訳(メタデータ) (2023-02-12T14:30:03Z) - Variational Voxel Pseudo Image Tracking [127.46919555100543]
不確実性推定は、ロボット工学や自律運転といった重要な問題にとって重要なタスクである。
本稿では,3次元物体追跡のためのVoxel Pseudo Image Tracking (VPIT) の変分ニューラルネットワークによるバージョンを提案する。
論文 参考訳(メタデータ) (2023-02-12T13:34:50Z) - GLENet: Boosting 3D Object Detectors with Generative Label Uncertainty Estimation [70.75100533512021]
本稿では,対象物の潜在的可算有界箱の多様性として,ラベルの不確実性問題を定式化する。
本稿では,条件付き変分オートエンコーダを応用した生成フレームワークであるGLENetを提案する。
GLENetが生成するラベルの不確実性はプラグアンドプレイモジュールであり、既存のディープ3D検出器に便利に統合することができる。
論文 参考訳(メタデータ) (2022-07-06T06:26:17Z) - LiDAR-MIMO: Efficient Uncertainty Estimation for LiDAR-based 3D Object
Detection [7.9533170503170565]
LiDAR-MIMOは、マルチインプット・マルチアウトプット(MIMO)不確実性推定法をLiDARベースの3Dオブジェクト検出タスクに適応させる手法である。
少数の出力ヘッドしか持たない同等の不確実性推定結果を示す。
論文 参考訳(メタデータ) (2022-06-01T03:47:32Z) - CertainNet: Sampling-free Uncertainty Estimation for Object Detection [65.28989536741658]
ニューラルネットワークの不確実性を推定することは、安全クリティカルな設定において基本的な役割を果たす。
本研究では,オブジェクト検出のための新しいサンプリング不要不確実性推定法を提案する。
私たちはそれをCertainNetと呼び、各出力信号に対して、オブジェクト性、クラス、位置、サイズという、別の不確実性を提供するのは、これが初めてです。
論文 参考訳(メタデータ) (2021-10-04T17:59:31Z) - Gradient-Based Quantification of Epistemic Uncertainty for Deep Object
Detectors [8.029049649310213]
本稿では,新しい勾配に基づく不確実性指標を導入し,異なる物体検出アーキテクチャについて検討する。
実験では、真の肯定的/偽の正の判別と、結合上の交叉の予測において顕著な改善が示された。
また,モンテカルロのドロップアウト不確実性指標に対する改善や,さまざまな不確実性指標のソースを集約することで,さらなる大幅な向上が期待できる。
論文 参考訳(メタデータ) (2021-07-09T16:04:11Z) - Leveraging Uncertainties for Deep Multi-modal Object Detection in
Autonomous Driving [12.310862288230075]
この研究は、LiDAR点雲とRGBカメラ画像を組み合わせて、堅牢で正確な3Dオブジェクト検出を行う確率論的ディープニューラルネットワークを提案する。
分類および回帰作業における不確実性を明示的にモデル化し、不確実性を活用してサンプリング機構を用いて核融合ネットワークを訓練する。
論文 参考訳(メタデータ) (2020-02-01T14:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。