論文の概要: Weakly-Supervised Domain Adaptation of Deep Regression Trackers via
Reinforced Knowledge Distillation
- arxiv url: http://arxiv.org/abs/2103.14496v1
- Date: Fri, 26 Mar 2021 14:37:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-29 12:32:30.773728
- Title: Weakly-Supervised Domain Adaptation of Deep Regression Trackers via
Reinforced Knowledge Distillation
- Title(参考訳): 強化知識蒸留による深部回帰トラッカーの弱改善ドメイン適応
- Authors: Matteo Dunnhofer, Niki Martinel, Christian Micheloni
- Abstract要約: このようなトラッカーのクラスをドメイン適応するための最初の方法論を示す。
本研究では,強化学習を弱監督の表現に用いる,弱監督型適応戦略を提案する。
5つの異なるロボットビジョン領域の実験は、我々の方法論の妥当性を実証している。
- 参考スコア(独自算出の注目度): 27.00282405409842
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep regression trackers are among the fastest tracking algorithms available,
and therefore suitable for real-time robotic applications. However, their
accuracy is inadequate in many domains due to distribution shift and
overfitting. In this paper we overcome such limitations by presenting the first
methodology for domain adaption of such a class of trackers. To reduce the
labeling effort we propose a weakly-supervised adaptation strategy, in which
reinforcement learning is used to express weak supervision as a scalar
application-dependent and temporally-delayed feedback. At the same time,
knowledge distillation is employed to guarantee learning stability and to
compress and transfer knowledge from more powerful but slower trackers.
Extensive experiments on five different robotic vision domains demonstrate the
relevance of our methodology. Real-time speed is achieved on embedded devices
and on machines without GPUs, while accuracy reaches significant results.
- Abstract(参考訳): ディープレグレッショントラッカは、利用可能な最速トラッキングアルゴリズムの1つであり、したがってリアルタイムロボットアプリケーションに適している。
しかし、分布シフトや過剰フィッティングのため、多くの領域で精度が不十分である。
本稿では,このようなトラッカのクラスに対するドメイン適応のための第1の手法を提示することで,このような制限を克服する。
ラベル付け作業を減らすために,強化学習を用いて,スカラーアプリケーションに依存した時間的遅延フィードバックとして弱い監督を表現する弱教師付き適応戦略を提案する。
同時に、知識蒸留は学習安定性を保証し、より強力だが遅いトラッカーからの知識を圧縮し伝達するために用いられる。
5つの異なるロボットビジョン領域に関する大規模な実験は、我々の方法論の意義を実証している。
リアルタイムのスピードは、組み込みデバイスやGPUのないマシンで達成されるが、精度は大幅に向上する。
関連論文リスト
- PNAS-MOT: Multi-Modal Object Tracking with Pareto Neural Architecture Search [64.28335667655129]
複数の物体追跡は、自律運転において重要な課題である。
トラッキングの精度が向上するにつれて、ニューラルネットワークはますます複雑になり、レイテンシが高いため、実際の運転シナリオにおける実践的な応用に課題が生じる。
本稿では,ニューラル・アーキテクチャ・サーチ(NAS)手法を用いて追跡のための効率的なアーキテクチャを探索し,比較的高い精度を維持しつつ,低リアルタイム遅延を実現することを目的とした。
論文 参考訳(メタデータ) (2024-03-23T04:18:49Z) - DTC: Deep Tracking Control [16.2850135844455]
本研究では,両世界の強靭性,フット配置精度,地形の一般化を両世界の利点と組み合わせたハイブリッド制御アーキテクチャを提案する。
深層ニューラルネットワークポリシは、最適化された足場を追跡することを目的として、シミュレーションでトレーニングされている。
モデルベースに比べて滑りやすい地盤や変形可能な地盤が存在する場合の強靭性を示す。
論文 参考訳(メタデータ) (2023-09-27T07:57:37Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Efficient Concept Drift Handling for Batch Android Malware Detection
Models [0.0]
我々は、リトレーニング技術が検知能力を時間とともに維持できることを示す。
実験により, ドリフト検出とサンプル選択機構は, 極めて効率的な再学習戦略をもたらすことが示された。
論文 参考訳(メタデータ) (2023-09-18T14:28:18Z) - Temporal Patience: Efficient Adaptive Deep Learning for Embedded Radar
Data Processing [4.359030177348051]
本稿では,ストリーミングレーダデータに存在する時間相関を利用して,組込みデバイス上でのディープラーニング推論のための早期排他ニューラルネットワークの効率を向上させる手法を提案する。
以上の結果から,提案手法は単一排他ネットワーク上での推論当たりの演算量の最大26%を削減し,信頼度に基づく早期排他バージョンで12%を削減できることがわかった。
このような効率向上により、リソース制約のあるプラットフォーム上でリアルタイムなレーダデータ処理が可能になり、スマートホーム、インターネット・オブ・シング、人間とコンピュータのインタラクションといったコンテキストにおける新しいアプリケーションが可能になる。
論文 参考訳(メタデータ) (2023-09-11T12:38:01Z) - Actively Learning Costly Reward Functions for Reinforcement Learning [56.34005280792013]
複雑な実世界の環境でエージェントを訓練することは、桁違いに高速であることを示す。
強化学習の手法を新しい領域に適用することにより、興味深く非自明な解を見つけることができることを示す。
論文 参考訳(メタデータ) (2022-11-23T19:17:20Z) - Recursive Least-Squares Estimator-Aided Online Learning for Visual
Tracking [58.14267480293575]
オフライン学習を必要とせず、簡単な効果的なオンライン学習手法を提案する。
これは、モデルが以前見たオブジェクトに関する知識を記憶するための、内蔵されたメモリ保持メカニズムを可能にする。
我々は、RT-MDNetにおける多層パーセプトロンと、DiMPにおける畳み込みニューラルネットワークの追跡のためのオンライン学習ファミリーにおける2つのネットワークに基づくアプローチを評価する。
論文 参考訳(メタデータ) (2021-12-28T06:51:18Z) - Adversarial Imitation Learning with Trajectorial Augmentation and
Correction [61.924411952657756]
本稿では,拡張軌道の成功を保った新しい拡張手法を提案する。
我々は, 合成専門家を用いた模倣エージェントの訓練を行うために, 逆データ拡張模倣アーキテクチャを開発した。
実験により,我々のデータ拡張戦略は,敵対的模倣の精度と収束時間を向上できることが示された。
論文 参考訳(メタデータ) (2021-03-25T14:49:32Z) - Domain Adaptive Robotic Gesture Recognition with Unsupervised
Kinematic-Visual Data Alignment [60.31418655784291]
本稿では,マルチモダリティ知識,すなわちキネマティックデータとビジュアルデータを同時にシミュレータから実ロボットに伝達できる,教師なしドメイン適応フレームワークを提案する。
ビデオの時間的手がかりと、ジェスチャー認識に対するマルチモーダル固有の相関を用いて、トランスファー可能な機能を強化したドメインギャップを修復する。
その結果, 本手法は, ACCでは最大12.91%, F1scoreでは20.16%と, 実際のロボットではアノテーションを使わずに性能を回復する。
論文 参考訳(メタデータ) (2021-03-06T09:10:03Z) - Confidence Trigger Detection: Accelerating Real-time Tracking-by-detection Systems [1.6037469030022993]
信頼強化検出(CTD)は、中間状態によく似たフレームのオブジェクト検出を戦略的に回避する革新的な手法である。
CTDは追跡速度を向上するだけでなく、既存の追跡アルゴリズムを超越して精度も維持する。
本実験はCTDフレームワークの堅牢性と汎用性を実証し,資源制約環境におけるリアルタイムトラッキングの実現の可能性を示した。
論文 参考訳(メタデータ) (2019-02-02T01:52:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。