論文の概要: Identifying Systematic Errors in Object Detectors with the SCROD
Pipeline
- arxiv url: http://arxiv.org/abs/2309.13489v1
- Date: Sat, 23 Sep 2023 22:41:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-26 19:35:51.270644
- Title: Identifying Systematic Errors in Object Detectors with the SCROD
Pipeline
- Title(参考訳): SCRODパイプラインを用いた物体検出器の系統誤差の同定
- Authors: Valentyn Boreiko, Matthias Hein, Jan Hendrik Metzen
- Abstract要約: オブジェクト検出器における系統的エラーの識別と除去は、安全クリティカルなアプリケーションへの展開の前提条件となる。
粒度制御による合成画像の生成により,この制限を克服する。
両手法の強みを組み合わせた新しい枠組みを提案する。
- 参考スコア(独自算出の注目度): 46.52729366461028
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The identification and removal of systematic errors in object detectors can
be a prerequisite for their deployment in safety-critical applications like
automated driving and robotics. Such systematic errors can for instance occur
under very specific object poses (location, scale, orientation), object
colors/textures, and backgrounds. Real images alone are unlikely to cover all
relevant combinations. We overcome this limitation by generating synthetic
images with fine-granular control. While generating synthetic images with
physical simulators and hand-designed 3D assets allows fine-grained control
over generated images, this approach is resource-intensive and has limited
scalability. In contrast, using generative models is more scalable but less
reliable in terms of fine-grained control. In this paper, we propose a novel
framework that combines the strengths of both approaches. Our meticulously
designed pipeline along with custom models enables us to generate street scenes
with fine-grained control in a fully automated and scalable manner. Moreover,
our framework introduces an evaluation setting that can serve as a benchmark
for similar pipelines. This evaluation setting will contribute to advancing the
field and promoting standardized testing procedures.
- Abstract(参考訳): 物体検出装置における系統的エラーの同定と除去は、自動運転やロボット工学のような安全クリティカルなアプリケーションへの展開の前提条件となる。
このような体系的なエラーは、例えば、非常に特定のオブジェクトのポーズ(位置、スケール、方向)、オブジェクトの色/テクスチャ、バックグラウンドで起こりうる。
実際の画像だけでは、すべての関連する組み合わせをカバーできない。
粒度制御による合成画像の生成により,この制限を克服する。
物理シミュレータと手作りの3dアセットで合成画像を生成すると、生成された画像に対するきめ細かい制御が可能になるが、このアプローチはリソース集約的でスケーラビリティに制限がある。
対照的に、生成モデルの使用はよりスケーラブルだが、きめ細かい制御では信頼性が低い。
本稿では,両アプローチの強みを組み合わせた新しい枠組みを提案する。
念入りに設計されたパイプラインとカスタムモデルにより、完全に自動化されたスケーラブルな方法で、きめ細かい制御でストリートシーンを生成することができます。
さらに,同様のパイプラインのベンチマークとして機能する評価設定を導入する。
この評価設定は、フィールドの前進と標準化されたテスト手順の促進に寄与する。
関連論文リスト
- RANRAC: Robust Neural Scene Representations via Random Ray Consensus [13.047834122698765]
本稿では,3次元物体を隠蔽・散逸した画像を扱う頑健な再構成アルゴリズムRANRACを紹介する。
本ソリューションは,光フィールドネットワークによる単一ショット再構成を支援する。
本研究は,8dBPSNRをベースラインと比較し,包括的シナリオにおける新規ビュー合成の大幅な改善を報告した。
論文 参考訳(メタデータ) (2023-12-15T13:33:09Z) - Training-Free Location-Aware Text-to-Image Synthesis [8.503001932363704]
安定拡散モデルの生成機構を解析し,新しい対話型生成パラダイムを提案する。
本手法は,制御能力と画質の両面において最先端の手法より優れる。
論文 参考訳(メタデータ) (2023-04-26T10:25:15Z) - RISP: Rendering-Invariant State Predictor with Differentiable Simulation
and Rendering for Cross-Domain Parameter Estimation [110.4255414234771]
既存のソリューションでは、大量のトレーニングデータが必要か、未知のレンダリング設定への一般化性が欠如している。
本稿では、ドメインのランダム化と微分可能なレンダリング勾配を併用してこの問題に対処する手法を提案する。
提案手法は, 再構成誤差を大幅に低減し, 未知のレンダリング構成間の一般化性が向上する。
論文 参考訳(メタデータ) (2022-05-11T17:59:51Z) - Multitask AET with Orthogonal Tangent Regularity for Dark Object
Detection [84.52197307286681]
暗黒環境下でのオブジェクト検出を強化するために,新しいマルチタスク自動符号化変換(MAET)モデルを提案する。
自己超越的な方法で、MAETは、現実的な照明劣化変換を符号化して復号することで、本質的な視覚構造を学習する。
我々は,合成および実世界のデータセットを用いて最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2022-05-06T16:27:14Z) - Self-Supervised Object Detection via Generative Image Synthesis [106.65384648377349]
本稿では,自己教師対象検出のための制御可能なGANを用いたエンドツーエンド分析合成フレームワークを提案する。
オブジェクトの合成と検出を学習するために、ボックスアノテーションを使用せずに、実世界のイメージのコレクションを使用します。
我々の研究は、制御可能なGAN画像合成という新しいパラダイムを導入することで、自己教師対象検出の分野を前進させる。
論文 参考訳(メタデータ) (2021-10-19T11:04:05Z) - Fast Image-Anomaly Mitigation for Autonomous Mobile Robots [27.049498074025088]
雨やほこりのようなカメラの異常は、画像の品質と関連するタスクを著しく低下させる可能性がある。
本研究では,これらのアーティファクトをリアルタイムに効果的に緩和する前処理ステップを実装することで,この問題に対処する。
論文 参考訳(メタデータ) (2021-09-04T15:39:42Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - Counterfactual Explanation and Causal Inference in Service of Robustness
in Robot Control [15.104159722499366]
我々は「事象AがCの代わりにBを引き起こすように変更できるか?」という形式の逆実数条件の生成モデルを訓練するためのアーキテクチャを提案する。
従来の制御設計手法とは対照的に、ノイズを除去する能力の観点から頑健さを定量化する手法では、ある要件に違反する可能性のある反事実の空間を探索する。
論文 参考訳(メタデータ) (2020-09-18T14:22:47Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。