論文の概要: Weakly-Supervised Domain Adaptation of Deep Regression Trackers via
Reinforced Knowledge Distillation
- arxiv url: http://arxiv.org/abs/2103.14496v1
- Date: Fri, 26 Mar 2021 14:37:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-29 12:32:30.773728
- Title: Weakly-Supervised Domain Adaptation of Deep Regression Trackers via
Reinforced Knowledge Distillation
- Title(参考訳): 強化知識蒸留による深部回帰トラッカーの弱改善ドメイン適応
- Authors: Matteo Dunnhofer, Niki Martinel, Christian Micheloni
- Abstract要約: このようなトラッカーのクラスをドメイン適応するための最初の方法論を示す。
本研究では,強化学習を弱監督の表現に用いる,弱監督型適応戦略を提案する。
5つの異なるロボットビジョン領域の実験は、我々の方法論の妥当性を実証している。
- 参考スコア(独自算出の注目度): 27.00282405409842
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep regression trackers are among the fastest tracking algorithms available,
and therefore suitable for real-time robotic applications. However, their
accuracy is inadequate in many domains due to distribution shift and
overfitting. In this paper we overcome such limitations by presenting the first
methodology for domain adaption of such a class of trackers. To reduce the
labeling effort we propose a weakly-supervised adaptation strategy, in which
reinforcement learning is used to express weak supervision as a scalar
application-dependent and temporally-delayed feedback. At the same time,
knowledge distillation is employed to guarantee learning stability and to
compress and transfer knowledge from more powerful but slower trackers.
Extensive experiments on five different robotic vision domains demonstrate the
relevance of our methodology. Real-time speed is achieved on embedded devices
and on machines without GPUs, while accuracy reaches significant results.
- Abstract(参考訳): ディープレグレッショントラッカは、利用可能な最速トラッキングアルゴリズムの1つであり、したがってリアルタイムロボットアプリケーションに適している。
しかし、分布シフトや過剰フィッティングのため、多くの領域で精度が不十分である。
本稿では,このようなトラッカのクラスに対するドメイン適応のための第1の手法を提示することで,このような制限を克服する。
ラベル付け作業を減らすために,強化学習を用いて,スカラーアプリケーションに依存した時間的遅延フィードバックとして弱い監督を表現する弱教師付き適応戦略を提案する。
同時に、知識蒸留は学習安定性を保証し、より強力だが遅いトラッカーからの知識を圧縮し伝達するために用いられる。
5つの異なるロボットビジョン領域に関する大規模な実験は、我々の方法論の意義を実証している。
リアルタイムのスピードは、組み込みデバイスやGPUのないマシンで達成されるが、精度は大幅に向上する。
関連論文リスト
- DTC: Deep Tracking Control [16.2850135844455]
本研究では,両世界の強靭性,フット配置精度,地形の一般化を両世界の利点と組み合わせたハイブリッド制御アーキテクチャを提案する。
深層ニューラルネットワークポリシは、最適化された足場を追跡することを目的として、シミュレーションでトレーニングされている。
モデルベースに比べて滑りやすい地盤や変形可能な地盤が存在する場合の強靭性を示す。
論文 参考訳(メタデータ) (2023-09-27T07:57:37Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Efficient Concept Drift Handling for Batch Android Malware Detection
Models [0.0]
我々は、リトレーニング技術が検知能力を時間とともに維持できることを示す。
実験により, ドリフト検出とサンプル選択機構は, 極めて効率的な再学習戦略をもたらすことが示された。
論文 参考訳(メタデータ) (2023-09-18T14:28:18Z) - Temporal Patience: Efficient Adaptive Deep Learning for Embedded Radar
Data Processing [4.359030177348051]
本稿では,ストリーミングレーダデータに存在する時間相関を利用して,組込みデバイス上でのディープラーニング推論のための早期排他ニューラルネットワークの効率を向上させる手法を提案する。
以上の結果から,提案手法は単一排他ネットワーク上での推論当たりの演算量の最大26%を削減し,信頼度に基づく早期排他バージョンで12%を削減できることがわかった。
このような効率向上により、リソース制約のあるプラットフォーム上でリアルタイムなレーダデータ処理が可能になり、スマートホーム、インターネット・オブ・シング、人間とコンピュータのインタラクションといったコンテキストにおける新しいアプリケーションが可能になる。
論文 参考訳(メタデータ) (2023-09-11T12:38:01Z) - Actively Learning Costly Reward Functions for Reinforcement Learning [56.34005280792013]
複雑な実世界の環境でエージェントを訓練することは、桁違いに高速であることを示す。
強化学習の手法を新しい領域に適用することにより、興味深く非自明な解を見つけることができることを示す。
論文 参考訳(メタデータ) (2022-11-23T19:17:20Z) - Recursive Least-Squares Estimator-Aided Online Learning for Visual
Tracking [58.14267480293575]
オフライン学習を必要とせず、簡単な効果的なオンライン学習手法を提案する。
これは、モデルが以前見たオブジェクトに関する知識を記憶するための、内蔵されたメモリ保持メカニズムを可能にする。
我々は、RT-MDNetにおける多層パーセプトロンと、DiMPにおける畳み込みニューラルネットワークの追跡のためのオンライン学習ファミリーにおける2つのネットワークに基づくアプローチを評価する。
論文 参考訳(メタデータ) (2021-12-28T06:51:18Z) - Improving Variational Autoencoder based Out-of-Distribution Detection
for Embedded Real-time Applications [2.9327503320877457]
アウト・オブ・ディストリビューション(OD)検出は、リアルタイムにアウト・オブ・ディストリビューションを検出するという課題に対処する新しいアプローチである。
本稿では,自律走行エージェントの周囲の有害な動きを頑健に検出する方法について述べる。
提案手法は,OoD因子の検出能力を一意に改善し,最先端手法よりも42%向上した。
また,本モデルでは,実験した実世界およびシミュレーション駆動データに対して,最先端技術よりも97%の精度でほぼ完璧に一般化した。
論文 参考訳(メタデータ) (2021-07-25T07:52:53Z) - Adversarial Imitation Learning with Trajectorial Augmentation and
Correction [61.924411952657756]
本稿では,拡張軌道の成功を保った新しい拡張手法を提案する。
我々は, 合成専門家を用いた模倣エージェントの訓練を行うために, 逆データ拡張模倣アーキテクチャを開発した。
実験により,我々のデータ拡張戦略は,敵対的模倣の精度と収束時間を向上できることが示された。
論文 参考訳(メタデータ) (2021-03-25T14:49:32Z) - Domain Adaptive Robotic Gesture Recognition with Unsupervised
Kinematic-Visual Data Alignment [60.31418655784291]
本稿では,マルチモダリティ知識,すなわちキネマティックデータとビジュアルデータを同時にシミュレータから実ロボットに伝達できる,教師なしドメイン適応フレームワークを提案する。
ビデオの時間的手がかりと、ジェスチャー認識に対するマルチモーダル固有の相関を用いて、トランスファー可能な機能を強化したドメインギャップを修復する。
その結果, 本手法は, ACCでは最大12.91%, F1scoreでは20.16%と, 実際のロボットではアノテーションを使わずに性能を回復する。
論文 参考訳(メタデータ) (2021-03-06T09:10:03Z) - Data-efficient Weakly-supervised Learning for On-line Object Detection
under Domain Shift in Robotics [24.878465999976594]
文献では、Deep Convolutional Neural Networks (DCNNs)に基づく多数のオブジェクト検出方法が提案されている。
これらの手法はロボティクスに重要な制限がある:オフラインデータのみに学習するとバイアスが発生し、新しいタスクへの適応を防ぐことができる。
本研究では,弱い教師付き学習がこれらの問題にどのように対処できるかを検討する。
論文 参考訳(メタデータ) (2020-12-28T16:36:11Z) - Understanding Self-Training for Gradual Domain Adaptation [107.37869221297687]
段階的なドメイン適応は、対象領域へ徐々にシフトするラベルのないデータのみを与えられたソースドメインで訓練された初期分類器を適応させることが目的である。
目標領域への直接適応が非有界誤差をもたらすような設定下において、段階的なシフトを伴う自己学習の誤差に対する最初の非無空上界を証明した。
この理論解析はアルゴリズムの洞察を導き、無限のデータを持つ場合でも正規化とラベルのシャープ化が不可欠であることを強調し、より小さなワッサーシュタイン無限距離のシフトに対して自己学習が特にうまく働くことを示唆している。
論文 参考訳(メタデータ) (2020-02-26T08:59:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。