論文の概要: Track, Check, Repeat: An EM Approach to Unsupervised Tracking
- arxiv url: http://arxiv.org/abs/2104.03424v1
- Date: Wed, 7 Apr 2021 22:51:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-09 13:09:18.513078
- Title: Track, Check, Repeat: An EM Approach to Unsupervised Tracking
- Title(参考訳): track, check, repeat: 教師なし追跡のためのemアプローチ
- Authors: Adam W. Harley, Yiming Zuo, Jing Wen, Ayush Mangal, Shubhankar Potdar,
Ritwick Chaudhry, Katerina Fragkiadaki
- Abstract要約: 本研究では, 移動物体を3Dで検出・追跡する非監視手法を, RGB-D動画で提案する。
重度データ拡張により,外観に基づく2次元および3次元検出器のアンサンブルを学習する。
CATERとKITTIの挑戦的なビデオを使用して、既存の監視されていないオブジェクト発見と追跡方法と比較します。
- 参考スコア(独自算出の注目度): 20.19397660306534
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose an unsupervised method for detecting and tracking moving objects
in 3D, in unlabelled RGB-D videos. The method begins with classic handcrafted
techniques for segmenting objects using motion cues: we estimate optical flow
and camera motion, and conservatively segment regions that appear to be moving
independently of the background. Treating these initial segments as
pseudo-labels, we learn an ensemble of appearance-based 2D and 3D detectors,
under heavy data augmentation. We use this ensemble to detect new instances of
the "moving" type, even if they are not moving, and add these as new
pseudo-labels. Our method is an expectation-maximization algorithm, where in
the expectation step we fire all modules and look for agreement among them, and
in the maximization step we re-train the modules to improve this agreement. The
constraint of ensemble agreement helps combat contamination of the generated
pseudo-labels (during the E step), and data augmentation helps the modules
generalize to yet-unlabelled data (during the M step). We compare against
existing unsupervised object discovery and tracking methods, using challenging
videos from CATER and KITTI, and show strong improvements over the
state-of-the-art.
- Abstract(参考訳): 本稿では,RGB-Dビデオにおける3次元移動物体の検出と追跡のための教師なし手法を提案する。
この手法は、光学的流れとカメラの動きを推定し、背景から独立して動くように見える領域を保存的に分割する、モーションキューを用いた物体のセグメンテーションのための古典的な手作り技術から始まります。
これらの初期セグメントを擬似ラベルとして扱うことで、重データ拡張の下で外観に基づく2Dおよび3D検出器のアンサンブルを学習する。
このアンサンブルを使用して、移動していない場合でも“移動”型の新しいインスタンスを検出し、新しい擬似ラベルとして追加します。
提案手法は期待最大化アルゴリズムであり,期待ステップでは全てのモジュールを発射し,各モジュール間の合意を求める。
アンサンブル合意の制約は、生成された擬似ラベル(eステップ中)の汚染と戦うのに役立ち、データ拡張は、モジュールが未ラベルデータ(mステップ中)に一般化するのに役立つ。
既存の教師なしのオブジェクト発見と追跡手法と比較し,caterとkittiによる挑戦的なビデオを用いて,最先端よりも強力な改善を示す。
関連論文リスト
- TrajSSL: Trajectory-Enhanced Semi-Supervised 3D Object Detection [59.498894868956306]
Pseudo-labeling approach to semi-supervised learning は教師-学生の枠組みを採用する。
我々は、事前学習した動き予測モデルを活用し、擬似ラベル付きデータに基づいて物体軌跡を生成する。
提案手法は2つの異なる方法で擬似ラベル品質を向上する。
論文 参考訳(メタデータ) (2024-09-17T05:35:00Z) - CSAD: Unsupervised Component Segmentation for Logical Anomaly Detection [10.716585855033347]
我々は,人間のラベル付けを伴わない軽量セグメンテーションネットワークのためのトレーニングラベルを生成する,教師なしコンポーネントセグメンテーション手法を開発した。
我々は,従来のSOTA法を超越したMVTec LOCO ADデータセットにおいて,95.3%のAUROC検出を実現する。
論文 参考訳(メタデータ) (2024-08-28T08:27:41Z) - Decoupled Pseudo-labeling for Semi-Supervised Monocular 3D Object Detection [108.672972439282]
SSM3ODに対するDPL(decoupled pseudo-labeling)アプローチを提案する。
提案手法は,擬似ラベルを効率的に生成するためのDPGモジュールを特徴とする。
また,擬似ラベルの雑音深度監視による最適化競合を軽減するために,DGPモジュールを提案する。
論文 参考訳(メタデータ) (2024-03-26T05:12:18Z) - SeMoLi: What Moves Together Belongs Together [51.72754014130369]
動作手がかりに基づく半教師付き物体検出に挑戦する。
近年,移動物体の擬似ラベルインスタンスに対して,動きに基づくクラスタリング手法が適用可能であることが示唆された。
我々は、このアプローチを再考し、オブジェクト検出とモーションインスパイアされた擬似ラベルの両方が、データ駆動方式で取り組めることを示唆する。
論文 参考訳(メタデータ) (2024-02-29T18:54:53Z) - Improving Unsupervised Video Object Segmentation with Motion-Appearance
Synergy [52.03068246508119]
IMASは、トレーニングや推論において手動のアノテーションを使わずに、主要オブジェクトをビデオに分割する手法である。
IMASはMotion-Appearance Synergyによる改良されたUVOSを実現する。
人間のアノテーションや手作りハイパーパラム特有のメトリクスで調整された重要なハイパーパラムのチューニングにおいて、その効果を実証する。
論文 参考訳(メタデータ) (2022-12-17T06:47:30Z) - Image Understands Point Cloud: Weakly Supervised 3D Semantic
Segmentation via Association Learning [59.64695628433855]
ラベルのない画像から補完的な情報を取り入れた3次元セグメンテーションのための新しいクロスモダリティ弱教師付き手法を提案する。
基本的に、ラベルの小さな部分のパワーを最大化するために、アクティブなラベリング戦略を備えたデュアルブランチネットワークを設計する。
提案手法は,1%未満のアクティブなアノテーションで,最先端の完全教師付き競合よりも優れていた。
論文 参考訳(メタデータ) (2022-09-16T07:59:04Z) - A two-stage data association approach for 3D Multi-object Tracking [0.0]
画像に基づくトラッキングを3D環境に適応させる2段階データアソシエーション手法を開発した。
提案手法は,NuScenes 検証セットにおいて0.587 AMOTA を達成し,データアソシエーションのための一段二部マッチングを用いてベースラインより優れる。
論文 参考訳(メタデータ) (2021-01-21T15:50:17Z) - "What's This?" -- Learning to Segment Unknown Objects from Manipulation
Sequences [27.915309216800125]
本稿では,ロボットマニピュレータを用いた自己教師型把握対象セグメンテーションのための新しいフレームワークを提案する。
本稿では,モーションキューとセマンティック知識を共同で組み込んだ,エンドツーエンドのトレーニング可能な単一アーキテクチャを提案する。
我々の手法は、運動ロボットや3Dオブジェクトモデルの視覚的登録にも、正確な手眼の校正や追加センサーデータにも依存しない。
論文 参考訳(メタデータ) (2020-11-06T10:55:28Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。