論文の概要: Developing efficient transfer learning strategies for robust scene
recognition in mobile robotics using pre-trained convolutional neural
networks
- arxiv url: http://arxiv.org/abs/2107.11187v1
- Date: Fri, 23 Jul 2021 12:48:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-26 14:16:27.192548
- Title: Developing efficient transfer learning strategies for robust scene
recognition in mobile robotics using pre-trained convolutional neural
networks
- Title(参考訳): 事前学習畳み込みニューラルネットワークを用いた移動ロボットのロバストシーン認識のための効率的な転送学習戦略の開発
- Authors: Hermann Baumgartl and Ricardo Buettner
- Abstract要約: 本研究では,ロバストな移動シーン認識のための4種類の頑健な移動学習とデータ拡張戦略を提案する。
我々は,様々なベースライン畳み込みニューラルネットワークを用いて最先端の成果を達成し,照明や視点の変化に対する堅牢性を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present four different robust transfer learning and data augmentation
strategies for robust mobile scene recognition. By training three mobile-ready
(EfficientNetB0, MobileNetV2, MobileNetV3) and two large-scale baseline (VGG16,
ResNet50) convolutional neural network architectures on the widely available
Event8, Scene15, Stanford40, and MIT67 datasets, we show the generalization
ability of our transfer learning strategies. Furthermore, we tested the
robustness of our transfer learning strategies under viewpoint and lighting
changes using the KTH-Idol2 database. Also, the impact of inference
optimization techniques on the general performance and the robustness under
different transfer learning strategies is evaluated. Experimental results show
that when employing transfer learning, Fine-Tuning in combination with
extensive data augmentation improves the general accuracy and robustness in
mobile scene recognition. We achieved state-of-the-art results using various
baseline convolutional neural networks and showed the robustness against
lighting and viewpoint changes in challenging mobile robot place recognition.
- Abstract(参考訳): 本稿では,ロバストな移動シーン認識のための4種類のロバスト転送学習とデータ拡張戦略を提案する。
広く利用可能なEvent8、Scene15、Stanford40、MIT67データセット上で、3つのモバイル対応(EfficientNetB0、MobileNetV2、MobileNetV3)と2つの大規模なベースライン(VGG16、ResNet50)の畳み込みニューラルネットワークアーキテクチャをトレーニングすることにより、移行学習戦略の一般化能力を示す。
さらに,KTH-Idol2データベースを用いて,視点および照明変化下での移動学習戦略の堅牢性を検証した。
また, 予測最適化手法が一般化性能および異なる移動学習戦略下での堅牢性に及ぼす影響を評価する。
実験結果から,移動シーン認識におけるファインチューニングと拡張データの組み合わせは,移動シーン認識における一般的な精度と堅牢性を向上させることが示された。
我々は,様々なベースライン畳み込みニューラルネットワークを用いて最先端の成果を達成し,移動ロボットの位置認識に挑戦する際の照明や視点変化に対する頑健さを示した。
関連論文リスト
- T2V-Turbo-v2: Enhancing Video Generation Model Post-Training through Data, Reward, and Conditional Guidance Design [79.7289790249621]
提案手法であるT2V-Turbo-v2は、様々な監視信号を統合することにより、大幅な進歩をもたらす。
特定の学習目標に対するデータセットの調整の重要性を強調した。
トレーニングデータセットから動作ガイダンスを抽出し,ODEソルバに組み込むことにより,このアプローチの可能性を示す。
論文 参考訳(メタデータ) (2024-10-08T04:30:06Z) - Lightweight Object Detection: A Study Based on YOLOv7 Integrated with
ShuffleNetv2 and Vision Transformer [0.0]
本研究は、モバイルプラットフォーム上での運用効率と速度を向上させるために、YOLOv7アルゴリズムの最適化をゼロにする。
実験結果から, 改良されたYOLOモデルは優れた性能を示した。
論文 参考訳(メタデータ) (2024-03-04T05:29:32Z) - Leveraging the Power of Data Augmentation for Transformer-based Tracking [64.46371987827312]
トラッキング用にカスタマイズされた2つのデータ拡張手法を提案する。
まず、動的探索半径機構と境界サンプルのシミュレーションにより、既存のランダムトリミングを最適化する。
第2に,背景干渉などの問題に対するモデルを可能にする,トークンレベルの機能混在強化戦略を提案する。
論文 参考訳(メタデータ) (2023-09-15T09:18:54Z) - Theater Aid System for the Visually Impaired Through Transfer Learning
of Spatio-Temporal Graph Convolution Networks [1.52292571922932]
本研究の目的は、視覚障害者や視覚障害者を支援するためにステージで行う人間の行動を認識することである。
我々は,深度画像で捉えた骨格データを入力として利用する演劇人間行動認識システムを開発した。
トランスファーラーニングの使用は、劇場の文脈における人間の行動システムの性能向上に寄与した。
論文 参考訳(メタデータ) (2023-06-28T16:40:52Z) - Deep Augmentation: Self-Supervised Learning with Transformations in Activation Space [19.495587566796278]
我々は、Deep Augmentationを導入し、DropoutまたはPCAを使用して暗黙のデータ拡張を行い、ニューラルネットワーク内のターゲット層を変換し、パフォーマンスと一般化を改善する。
我々は、NLP、コンピュータビジョン、グラフ学習におけるコントラスト学習タスクに関する広範な実験を通して、Deep Augmentationを実証する。
論文 参考訳(メタデータ) (2023-03-25T19:03:57Z) - Multi-agent Reinforcement Learning with Graph Q-Networks for Antenna
Tuning [60.94661435297309]
モバイルネットワークの規模は、手作業による介入や手作業による戦略を使ってアンテナパラメータの最適化を困難にしている。
本研究では,モバイルネットワーク構成をグローバルに最適化するマルチエージェント強化学習アルゴリズムを提案する。
シミュレーション環境におけるアンテナ傾き調整問題とジョイント傾き・電力制御問題に対するアルゴリズムの性能を実証的に示す。
論文 参考訳(メタデータ) (2023-01-20T17:06:34Z) - Frozen Overparameterization: A Double Descent Perspective on Transfer
Learning of Deep Neural Networks [27.17697714584768]
ディープニューラルネットワーク(DNN)の伝達学習の一般化挙動について検討する。
目標トレーニング中のテストエラーの進化は、目標トレーニングデータセットが十分に大きい場合、より顕著な二重降下効果を有することを示す。
また、二重降下現象は、より関連するソースタスクからの転送よりも、関連するソースタスクからの転送をより良くする可能性があることを示す。
論文 参考訳(メタデータ) (2022-11-20T20:26:23Z) - Multi-dataset Training of Transformers for Robust Action Recognition [75.5695991766902]
動作認識のための複数のデータセットをうまく一般化することを目的として,ロバストな特徴表現の課題について検討する。
本稿では、情報損失と投影損失という2つの新しい損失項を設計した、新しいマルチデータセットトレーニングパラダイムであるMultiTrainを提案する。
本研究では,Kineetics-400,Kineetics-700,Moments-in-Time,Activitynet,Some-something-v2の5つの課題データセットに対して,本手法の有効性を検証する。
論文 参考訳(メタデータ) (2022-09-26T01:30:43Z) - Improving Sample Efficiency of Value Based Models Using Attention and
Vision Transformers [52.30336730712544]
性能を犠牲にすることなくサンプル効率を向上させることを目的とした深層強化学習アーキテクチャを提案する。
状態表現の特徴マップ上の自己注意機構を変換器を用いて学習する視覚的注意モデルを提案する。
我々は,このアーキテクチャがいくつかのAtari環境におけるサンプルの複雑さを向上すると同時に,いくつかのゲームにおいて優れたパフォーマンスを実現することを実証的に実証した。
論文 参考訳(メタデータ) (2022-02-01T19:03:03Z) - Activation Map Adaptation for Effective Knowledge Distillation [5.064184148440531]
汎用的な視覚表現学習のための知識蒸留戦略を提案する。
それは、よく設計されたアクティベーションマップ適応モジュールを使用して、教師ネットワークのいくつかのブロックを置き換える。
その結果,学生ネットワークの精度は0.6%向上し,損失の6.5%が減少し,トレーニング速度が大幅に向上した。
論文 参考訳(メタデータ) (2020-10-26T11:55:13Z) - Never Stop Learning: The Effectiveness of Fine-Tuning in Robotic
Reinforcement Learning [109.77163932886413]
本稿では,ロボットによるロボット操作ポリシーを,政治以外の強化学習を通じて微調整することで,新たなバリエーションに適応する方法を示す。
この適応は、タスクをゼロから学習するために必要なデータの0.2%未満を使用する。
事前訓練されたポリシーを適用するという私たちのアプローチは、微調整の過程で大きなパフォーマンス向上につながります。
論文 参考訳(メタデータ) (2020-04-21T17:57:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。