論文の概要: Interactron: Embodied Adaptive Object Detection
- arxiv url: http://arxiv.org/abs/2202.00660v1
- Date: Tue, 1 Feb 2022 18:56:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-02 15:38:35.167541
- Title: Interactron: Embodied Adaptive Object Detection
- Title(参考訳): Interactron: 身体的適応オブジェクト検出
- Authors: Klemen Kotar, Roozbeh Mottaghi
- Abstract要約: インタラクティブな環境下での適応オブジェクト検出手法であるInteractronを提案する。
私たちの考えは、推論中のトレーニングを継続し、環境との対話を通じて明確な監督なしに、テスト時にモデルを適応させることです。
- 参考スコア(独自算出の注目度): 18.644357684104662
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Over the years various methods have been proposed for the problem of object
detection. Recently, we have witnessed great strides in this domain owing to
the emergence of powerful deep neural networks. However, there are typically
two main assumptions common among these approaches. First, the model is trained
on a fixed training set and is evaluated on a pre-recorded test set. Second,
the model is kept frozen after the training phase, so no further updates are
performed after the training is finished. These two assumptions limit the
applicability of these methods to real-world settings. In this paper, we
propose Interactron, a method for adaptive object detection in an interactive
setting, where the goal is to perform object detection in images observed by an
embodied agent navigating in different environments. Our idea is to continue
training during inference and adapt the model at test time without any explicit
supervision via interacting with the environment. Our adaptive object detection
model provides a 11.8 point improvement in AP (and 19.1 points in AP50) over
DETR, a recent, high-performance object detector. Moreover, we show that our
object detection model adapts to environments with completely different
appearance characteristics, and its performance is on par with a model trained
with full supervision for those environments.
- Abstract(参考訳): 近年,物体検出問題に対する様々な手法が提案されている。
最近我々は、強力なディープニューラルネットワークの出現により、この領域で大きな進歩を目の当たりにしている。
しかし、一般的にこれらのアプローチには2つの主要な仮定がある。
まず、モデルが一定のトレーニングセットでトレーニングされ、予め記録されたテストセットで評価される。
第2に、トレーニングフェーズ終了後はモデルが凍結されるため、トレーニング終了後にさらなる更新は行われない。
これら2つの仮定は、実世界の設定に適用性を制限する。
本稿では,インタラクティブな環境下での適応物体検出手法であるInteractronを提案する。
私たちのアイデアは、推論中のトレーニングを継続し、環境とのインタラクションを通じて明示的な監督なしにテスト時にモデルを適用することです。
我々の適応物体検出モデルは、最近の高性能物体検出器DETRよりもAP(およびAP50の19.1点)を11.8点改善する。
さらに, 物体検出モデルは, 外観特性が全く異なる環境に適応し, その性能は, その環境を十分に監視する訓練されたモデルと同等であることを示した。
関連論文リスト
- Weakly Supervised Test-Time Domain Adaptation for Object Detection [23.89166024655107]
監視などの応用では、通常は人間のオペレーターがシステムの操作を監督する。
完全自動適応により達成可能な範囲を超えて、オブジェクト検出の性能を高めるために、テスト時間領域適応に演算子を関与させることを提案する。
提案手法は既存の手法よりも優れており, ループ内テスト時間領域適応の優れた利点を示す。
論文 参考訳(メタデータ) (2024-07-08T04:44:42Z) - Adaptive Rentention & Correction for Continual Learning [114.5656325514408]
連続学習における一般的な問題は、最新のタスクに対する分類層のバイアスである。
アダプティブ・リテンション・アンド・コレクション (ARC) のアプローチを例に挙げる。
ARCはCIFAR-100とImagenet-Rのデータセットで平均2.7%と2.6%のパフォーマンス向上を達成した。
論文 参考訳(メタデータ) (2024-05-23T08:43:09Z) - STFAR: Improving Object Detection Robustness at Test-Time by
Self-Training with Feature Alignment Regularization [35.16122933158808]
ドメイン適応は、分散シフトを伴うドメインデータをターゲットにするオブジェクト検出モデルを一般化するのに役立ちます。
テスト時,すなわちテスト時適応(TTAOD)におけるオブジェクト検出モデルの適用について検討する。
提案手法は,テスト時間適応オブジェクト検出タスクに最先端を設定できる。
論文 参考訳(メタデータ) (2023-03-31T10:04:44Z) - TTA-COPE: Test-Time Adaptation for Category-Level Object Pose Estimation [86.80589902825196]
TTA-COPEと呼ばれるカテゴリレベルのオブジェクトポーズ推定のためのテスト時間適応法を提案する。
ポーズ認識信頼度を用いて、自己学習損失を伴うポーズアンサンブルアプローチを設計する。
当社のアプローチでは,テストデータを逐次的かつオンライン的に処理し,実行時にソースドメインにアクセスする必要はない。
論文 参考訳(メタデータ) (2023-03-29T14:34:54Z) - Self-improving object detection via disagreement reconciliation [30.971936386281275]
本稿では,既存の物体検出装置を探索し,新たな環境下で画像を取得しながら自動的に微調整する方法について検討する。
同一対象に対する擬似ラベルは、異なる視点で一貫性を持たなければならないと仮定することにより、観察間のコンセンサスから洗練された予測を生成する新しいメカニズムを考案する。
提案手法では, 既製の物体検出装置をmAPで2.66%改善し, 地平線アノテーションに頼らずに現状を上回っている。
論文 参考訳(メタデータ) (2023-02-21T12:20:46Z) - Suspected Object Matters: Rethinking Model's Prediction for One-stage
Visual Grounding [93.82542533426766]
疑似オブジェクト間の対象オブジェクト選択を促進するため,疑似オブジェクト変換機構(SOT)を提案する。
SOTは既存のCNNとTransformerベースのワンステージ視覚グラウンドにシームレスに統合できる。
実験の結果,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-03-10T06:41:07Z) - Robust Object Detection via Instance-Level Temporal Cycle Confusion [89.1027433760578]
物体検出器の分布外一般化を改善するための補助的自己監視タスクの有効性を検討する。
最大エントロピーの原理に触発されて,新しい自己監督タスクであるインスタンスレベル時間サイクル混乱(cycconf)を導入する。
それぞれのオブジェクトに対して、タスクは、ビデオ内の隣接するフレームで最も異なるオブジェクトの提案を見つけ、自己スーパービジョンのために自分自身にサイクルバックすることです。
論文 参考訳(メタデータ) (2021-04-16T21:35:08Z) - Reformulating HOI Detection as Adaptive Set Prediction [25.44630995307787]
我々は適応セット予測問題としてHOI検出を再構成する。
本稿では,並列インスタンスとインタラクションブランチを備えた適応型セットベースワンステージフレームワーク(as-net)を提案する。
この手法は、人間のポーズや言語的特徴を必要とせず、従来の最先端の手法を上回ります。
論文 参考訳(メタデータ) (2021-03-10T10:40:33Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - Unsupervised Domain Adaptation for Spatio-Temporal Action Localization [69.12982544509427]
S時間動作の局所化はコンピュータビジョンにおいて重要な問題である。
本稿では、エンドツーエンドの教師なしドメイン適応アルゴリズムを提案する。
空間的特徴と時間的特徴を別々にあるいは共同的に適応した場合に,顕著な性能向上が達成できることを示す。
論文 参考訳(メタデータ) (2020-10-19T04:25:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。