論文の概要: Causal Scene BERT: Improving object detection by searching for
challenging groups of data
- arxiv url: http://arxiv.org/abs/2202.03651v1
- Date: Tue, 8 Feb 2022 05:14:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-10 02:34:12.018983
- Title: Causal Scene BERT: Improving object detection by searching for
challenging groups of data
- Title(参考訳): Causal Scene BERT: 挑戦的なデータのグループ探索によるオブジェクト検出の改善
- Authors: Cinjon Resnick, Or Litany, Amlan Kar, Karsten Kreis, James Lucas,
Kyunghyun Cho, Sanja Fidler
- Abstract要約: コンピュータビジョンアプリケーションは、物体検出のようなタスクのためにニューラルネットワークでパラメータ化された学習ベースの知覚モジュールに依存している。
これらのモジュールは、トレーニングプロセスに固有のバイアスのため、予想される誤差が低いが、データの非定型的なグループに対して高い誤差を持つことが多い。
本研究の主な貢献は,シミュレートされたシーンに対して因果的介入を行うことにより,前向きにそのようなグループを発見する擬似オートマチック手法である。
- 参考スコア(独自算出の注目度): 125.40669814080047
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern computer vision applications rely on learning-based perception modules
parameterized with neural networks for tasks like object detection. These
modules frequently have low expected error overall but high error on atypical
groups of data due to biases inherent in the training process. In building
autonomous vehicles (AV), this problem is an especially important challenge
because their perception modules are crucial to the overall system performance.
After identifying failures in AV, a human team will comb through the associated
data to group perception failures that share common causes. More data from
these groups is then collected and annotated before retraining the model to fix
the issue. In other words, error groups are found and addressed in hindsight.
Our main contribution is a pseudo-automatic method to discover such groups in
foresight by performing causal interventions on simulated scenes. To keep our
interventions on the data manifold, we utilize masked language models. We
verify that the prioritized groups found via intervention are challenging for
the object detector and show that retraining with data collected from these
groups helps inordinately compared to adding more IID data. We also plan to
release software to run interventions in simulated scenes, which we hope will
benefit the causality community.
- Abstract(参考訳): 現代のコンピュータビジョンアプリケーションは、オブジェクト検出のようなタスクのためにニューラルネットワークでパラメータ化された学習ベースの知覚モジュールに依存している。
これらのモジュールは、トレーニングプロセスに固有のバイアスのため、予想される誤差が低いが、データの非定型的なグループに対して高い誤差を持つことが多い。
自律走行車(AV)の構築において、認識モジュールはシステム全体の性能に不可欠であるため、この問題は特に重要な課題である。
AVの障害を特定した後、人間チームは関連するデータをマージして、共通の原因を共有するグループ認識障害を発生させる。
これらのグループからより多くのデータが収集され、問題を修正するためにモデルを再トレーニングする前に注釈付けされる。
言い換えると、エラー群が発見され、後から対処される。
本研究の主な貢献は,シミュレーションシーンで因果的介入を行うことで,このような群を先見的に発見する擬似自動的手法である。
データ多様体への介入を維持するために、マスキング言語モデルを利用する。
また,これらのグループから収集したデータを用いて再トレーニングを行うことは,より多くの iid データを追加することに比べ,無秩序に有用であることを示す。
また、シミュレーションされたシーンで介入を実行するソフトウェアをリリースする予定です。
関連論文リスト
- Revisiting Multi-Granularity Representation via Group Contrastive Learning for Unsupervised Vehicle Re-identification [2.4822156881137367]
教師なし車両用ReIDフレームワーク(MGR-GCL)を提案する。
識別可能な特徴を学習するために、多粒度CNN表現を統合する。
ターゲットデータセットの擬似ラベルを生成し、ドメイン適応プロセスを容易にする。
論文 参考訳(メタデータ) (2024-10-29T02:24:36Z) - A Plug-and-Play Method for Rare Human-Object Interactions Detection by Bridging Domain Gap [50.079224604394]
textbfContext-textbfEnhanced textbfFeature textbfAment (CEFA) と呼ばれる新しいモデルに依存しないフレームワークを提案する。
CEFAは機能アライメントモジュールとコンテキスト拡張モジュールで構成される。
本手法は, 稀なカテゴリにおけるHOIモデルの検出性能を向上させるために, プラグアンドプレイモジュールとして機能する。
論文 参考訳(メタデータ) (2024-07-31T08:42:48Z) - Adaptive Testing of Computer Vision Models [22.213542525825144]
AdaVisionは、ユーザがコヒーレントな障害モードを特定し、修正するのに役立つビジョンモデルをテストするインタラクティブなプロセスである。
我々は,AdaVisionのユーザスタディにおいて,最先端の分類,オブジェクト検出,画像キャプションモデルに重大なバグが見つかった場合の有用性と汎用性を実証する。
論文 参考訳(メタデータ) (2022-12-06T05:52:31Z) - Unpaired Referring Expression Grounding via Bidirectional Cross-Modal
Matching [53.27673119360868]
表現基盤の参照はコンピュータビジョンにおいて重要かつ困難な課題である。
本稿では,これらの課題に対処する新しい双方向クロスモーダルマッチング(BiCM)フレームワークを提案する。
私たちのフレームワークは、2つの一般的なグラウンドデータセットで、以前の作業の6.55%と9.94%を上回っています。
論文 参考訳(メタデータ) (2022-01-18T01:13:19Z) - Towards Group Robustness in the presence of Partial Group Labels [61.33713547766866]
入力サンプルとターゲットラベルの間に 急激な相関関係がある ニューラルネットワークの予測を誤った方向に導く
本稿では,制約セットから最悪のグループ割り当てを最適化するアルゴリズムを提案する。
グループ間で総合的な集計精度を維持しつつ,少数集団のパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2022-01-10T22:04:48Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - Unsupervised Domain Adaption of Object Detectors: A Survey [87.08473838767235]
近年のディープラーニングの進歩は、様々なコンピュータビジョンアプリケーションのための正確で効率的なモデルの開発につながっている。
高度に正確なモデルを学ぶには、大量の注釈付きイメージを持つデータセットの可用性に依存する。
このため、ラベルスカースデータセットに視覚的に異なる画像がある場合、モデルの性能は大幅に低下する。
論文 参考訳(メタデータ) (2021-05-27T23:34:06Z) - Learning data association without data association: An EM approach to
neural assignment prediction [12.970250708769708]
本稿では,データアソシエーションのためのニューラルモデルをトレーニングするための予測最大化手法を提案する。
オブジェクト認識のモデルをトレーニングするためにラベル情報を必要としない。
重要なことに、提案手法を用いてトレーニングされたネットワークは、下流追跡アプリケーションで再利用することができる。
論文 参考訳(メタデータ) (2021-05-02T01:11:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。