論文の概要: Test-time Correction with Human Feedback: An Online 3D Detection System via Visual Prompting
- arxiv url: http://arxiv.org/abs/2412.07768v1
- Date: Tue, 10 Dec 2024 18:59:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-11 14:36:45.052708
- Title: Test-time Correction with Human Feedback: An Online 3D Detection System via Visual Prompting
- Title(参考訳): 人のフィードバックによるテスト時間補正:ビジュアルプロンプトによるオンライン3D検出システム
- Authors: Zetong Yang, Hanxue Zhang, Yanan Sun, Li Chen, Fei Xia, Fatma Guney, Hongyang Li,
- Abstract要約: TTC(Test-time Correction)システムは、人間のフィードバックによるテストタイムエラーのオンライン修正のために指定された、新しいオンライン3D検出システムである。
フレーム上で対話的なプロンプトでユーザフィードバックを活用することで、TTCは、将来のストリーミング入力に対する対応する検出結果を即座に更新できる。
- 参考スコア(独自算出の注目度): 37.251280029366065
- License:
- Abstract: This paper introduces Test-time Correction (TTC) system, a novel online 3D detection system designated for online correction of test-time errors via human feedback, to guarantee the safety of deployed autonomous driving systems. Unlike well-studied offline 3D detectors frozen at inference, TTC explores the capability of instant online error rectification. By leveraging user feedback with interactive prompts at a frame, e.g., a simple click or draw of boxes, TTC could immediately update the corresponding detection results for future streaming inputs, even though the model is deployed with fixed parameters. This enables autonomous driving systems to adapt to new scenarios immediately and decrease deployment risks reliably without additional expensive training. To achieve such TTC system, we equip existing 3D detectors with Online Adapter (OA) module, a prompt-driven query generator for online correction. At the core of OA module are visual prompts, images of missed object-of-interest for guiding the corresponding detection and subsequent tracking. Those visual prompts, belonging to missed objects through online inference, are maintained by the visual prompt buffer for continuous error correction in subsequent frames. By doing so, TTC consistently detects online missed objects and immediately lowers driving risks. It achieves reliable, versatile, and adaptive driving autonomy. Extensive experiments demonstrate significant gain on instant error rectification over pre-trained 3D detectors, even in challenging scenarios with limited labels, zero-shot detection, and adverse conditions. We hope this work would inspire the community to investigate online rectification systems for autonomous driving post-deployment. Code would be publicly shared.
- Abstract(参考訳): 本稿では,人的フィードバックによるテストタイムエラーのオンライン修正を目的とした,新しいオンライン3次元検出システムであるTTCシステムを紹介し,自律運転システムの安全性を保証する。
TTCは、よく研究されているオフライン3D検出器と異なり、オンラインエラーの即時修正の可能性を探求している。
フレーム,例えばボックスのクリックや描画などのインタラクティブなプロンプトでユーザフィードバックを活用することで,TTCはモデルが固定パラメータでデプロイされている場合でも,将来のストリーミング入力に対する対応する検出結果を即座に更新することができる。
これにより、自律運転システムは、新たなシナリオに即座に適応し、追加の高価なトレーニングを必要とせずに、デプロイメントのリスクを確実に低減することができる。
このようなTTCシステムを実現するために、既存の3D検出器にオンライン修正のためのプロンプト駆動クエリジェネレータであるオンラインアダプタ(OA)モジュールを装備する。
OAモジュールのコアには、視覚的なプロンプト、対応する検出とその後の追跡を導くための関心の欠如の画像がある。
これらの視覚的プロンプトは、オンライン推論によって欠落したオブジェクトに属し、視覚的プロンプトバッファによって維持され、その後のフレームで連続的なエラー訂正が行われる。
これにより、TTCはオンラインの欠落したオブジェクトを常に検出し、即座に運転リスクを下げる。
信頼性があり、汎用性があり、適応的な自動運転を実現する。
広範囲な実験により、ラベルの制限、ゼロショット検出、悪条件による挑戦シナリオにおいても、事前訓練された3D検出器に対する即時エラー修正が大幅に向上した。
この取り組みが、自律走行後におけるオンラインの是正システムの調査をコミュニティに促すことを願っている。
コードは公開される。
関連論文リスト
- TeVAE: A Variational Autoencoder Approach for Discrete Online Anomaly Detection in Variable-state Multivariate Time-series Data [0.017476232824732776]
本研究では,時間変動型オートエンコーダ(TeVAE)を提案する。
適切に設定された場合、TeVAEは異常を6%だけ間違ったタイミングでフラグし、65%の異常を検知する。
論文 参考訳(メタデータ) (2024-07-09T13:32:33Z) - DARTH: Holistic Test-time Adaptation for Multiple Object Tracking [87.72019733473562]
複数物体追跡(MOT)は、自律運転における知覚システムの基本的構成要素である。
運転システムの安全性の追求にもかかわらず、テスト時間条件における領域シフトに対するMOT適応問題に対する解決策は提案されていない。
我々はMOTの総合的なテスト時間適応フレームワークであるDARTHを紹介する。
論文 参考訳(メタデータ) (2023-10-03T10:10:42Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Multi-Modal 3D Object Detection by Box Matching [109.43430123791684]
マルチモーダル3次元検出のためのボックスマッチング(FBMNet)による新しいフュージョンネットワークを提案する。
3Dオブジェクトと2Dオブジェクトの提案を学習することで、ROI特徴を組み合わせることで、検出のための融合を効果的に行うことができる。
論文 参考訳(メタデータ) (2023-05-12T18:08:51Z) - Exploiting Playbacks in Unsupervised Domain Adaptation for 3D Object
Detection [55.12894776039135]
ディープラーニングに基づく最先端の3Dオブジェクト検出器は、有望な精度を示しているが、ドメインの慣用性に過度に適合する傾向がある。
対象領域の擬似ラベルの検出器を微調整することで,このギャップを大幅に削減する新たな学習手法を提案する。
5つの自律運転データセットにおいて、これらの擬似ラベル上の検出器を微調整することで、新しい運転環境への領域ギャップを大幅に減らすことを示す。
論文 参考訳(メタデータ) (2021-03-26T01:18:11Z) - Training-free Monocular 3D Event Detection System for Traffic
Surveillance [93.65240041833319]
既存のイベント検出システムは、主に学習ベースであり、大量のトレーニングデータが利用可能な場合、十分なパフォーマンスを実現している。
現実のシナリオでは、十分なラベル付きトレーニングデータの収集は高価であり、時には不可能である。
本稿では,交通監視のためのトレーニング不要な単眼3Dイベント検出システムを提案する。
論文 参考訳(メタデータ) (2020-02-01T04:42:57Z) - Real-time Out-of-distribution Detection in Learning-Enabled
Cyber-Physical Systems [1.4213973379473654]
サイバー物理システムは、現実世界の不確実性と可変性を処理できる機械学習コンポーネントを使用することで恩恵を受ける。
しかし、ディープニューラルネットワークは、システムの安全性に影響を及ぼす可能性のある、新しいタイプのハザードを導入している。
アウト・オブ・ディストリビューションデータは大きなエラーを引き起こし、安全性を損なう可能性がある。
論文 参考訳(メタデータ) (2020-01-28T17:51:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。