論文の概要: Grow-Prune-Freeze Networks: Adaptive & Continual Learning Technique for Olfactory Navigation
- arxiv url: http://arxiv.org/abs/2605.25170v1
- Date: Sun, 24 May 2026 17:03:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.935304
- Title: Grow-Prune-Freeze Networks: Adaptive & Continual Learning Technique for Olfactory Navigation
- Title(参考訳): 成長段階のフリーズネットワーク:嗅覚ナビゲーションのための適応的・連続的学習技術
- Authors: Kordel K. France, Ovidiu Daescu,
- Abstract要約: 我々はGPF(Grow-Prune-Freeze)ネットワークを導入し、エージェントがそのポリシーの初期層を成長、刈り上げ、凍結することで継続的に学習できるようにする。
SARSAに基づくGPFは、部分的に観測可能な非定常作業である乱流噴流航法において、94%の成功率を達成した。
さらなる実験では、GPFがAtariの強化学習、画像分類、自動回帰言語モデルなどの他の機械学習タスクによく当てはまる可能性があるという証拠を蓄積している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Training data for olfaction is scattered through disparate, non-standardized datasets that limit the ability to build representative world models. Olfactory navigation is a highly dynamic and non-stationary task that benefits from real-time continual learning. We introduce an adaptive framework called Grow-Prune-Freeze (GPF) networks that enable an agent to continually learn through growing, pruning, and freezing early layers of its policy in response to world complexity. Grounding GPFs in non-linear random matrix theory, we show that the work of Pennington & Worth (2017) can be extended from single hidden layers to n-layer continual-learning models, and that eigenvalue composition of network weights is preserved as successive layers are added. We show that GPFs based on Expected SARSA achieve a 94% success rate on turbulent plume navigation - a partially observable, non-stationary task representative of the "big world" challenges that motivate adaptive learning in robotics - and provide supporting methodology for applying GPFs in other world models. Further experiments amount evidence that GPFs may generalize well to other machine learning tasks such as reinforcement learning in Atari, image classification, and autoregressive language models. We open source all code and data to encourage improvements on and more research in olfactory robotics.
- Abstract(参考訳): ウルフアクションのトレーニングデータは、代表的世界モデルを構築する能力を制限する、異質で標準化されていないデータセットを通して散在する。
嗅覚ナビゲーションは、リアルタイム連続学習の恩恵を受ける、非常にダイナミックで非定常的なタスクである。
我々はGPF(Grow-Prune-Freeze)ネットワークと呼ばれる適応型フレームワークを導入し、エージェントは世界の複雑さに応えて、そのポリシーの初期層の成長、刈り取り、凍結を通じて継続的に学習することができる。
非線型ランダム行列理論におけるGPFのグラウンド化は、ペニントン・アンド・ワース(2017)の作用が単一の隠れ層からn層連続学習モデルに拡張可能であることを示し、ネットワーク重みの固有値合成が連続層として保存されることを示す。
予測SARSAに基づくGPFは,ロボット工学における適応学習を動機づける「ビッグワールド」課題を部分的に観察可能な非定常タスクとして,乱流プルームナビゲーションにおいて94%の成功率を達成するとともに,GPFを他の世界モデルに適用するための支援手法を提供する。
さらなる実験では、GPFがAtariの強化学習、画像分類、自動回帰言語モデルなどの他の機械学習タスクによく当てはまる可能性があるという証拠を蓄積している。
われわれはすべてのコードとデータをオープンソース化し、嗅覚ロボティクスのさらなる研究を奨励しています。
関連論文リスト
- Forget to Generalize: Iterative Adaptation for Generalization in Federated Learning [1.2559585990041289]
我々は、異種環境における一般化を促進する新しい訓練パラダイム、IFA(Iterative Federated Adaptation)を提案する。
CIFAR-10、MIT-Indoors、Stanford Dogsのデータセットに対する実験は、提案手法がグローバルな精度を改善することを示している。
論文 参考訳(メタデータ) (2026-02-04T13:27:15Z) - Global Convergence and Rich Feature Learning in $L$-Layer Infinite-Width Neural Networks under $μ$P Parametrization [66.03821840425539]
本稿では, テンソル勾配プログラム(SGD)フレームワークを用いた$L$層ニューラルネットワークのトレーニング力学について検討する。
SGDにより、これらのネットワークが初期値から大きく逸脱する線形独立な特徴を学習できることを示す。
このリッチな特徴空間は、関連するデータ情報をキャプチャし、トレーニングプロセスの収束点が世界最小であることを保証する。
論文 参考訳(メタデータ) (2025-03-12T17:33:13Z) - DFRD: Data-Free Robustness Distillation for Heterogeneous Federated
Learning [20.135235291912185]
Federated Learning(FL)は、プライバシに制約のある分散機械学習パラダイムである。
本研究では,データヘテロジニアスおよびモデルヘテロジニアスFLシナリオにおいて,ロバストなグローバルモデルを学習するための新しいFL法(DFRD)を提案する。
論文 参考訳(メタデータ) (2023-09-24T04:29:22Z) - Fine-tuning Global Model via Data-Free Knowledge Distillation for
Non-IID Federated Learning [86.59588262014456]
フェデレートラーニング(Federated Learning, FL)は、プライバシ制約下での分散学習パラダイムである。
サーバ内のグローバルモデル(FedFTG)を微調整するデータフリー知識蒸留法を提案する。
私たちのFedFTGは最先端(SOTA)のFLアルゴリズムよりも優れており、FedAvg、FedProx、FedDyn、SCAFFOLDの強化のための強力なプラグインとして機能します。
論文 参考訳(メタデータ) (2022-03-17T11:18:17Z) - Global Filter Networks for Image Classification [90.81352483076323]
本稿では,対数線形複雑度を持つ周波数領域における長期空間依存性を学習する,概念的に単純だが計算効率のよいアーキテクチャを提案する。
この結果から,GFNetはトランスフォーマー型モデルやCNNの効率,一般化能力,堅牢性において,非常に競争力のある代替手段となる可能性が示唆された。
論文 参考訳(メタデータ) (2021-07-01T17:58:16Z) - Efficient Feature Transformations for Discriminative and Generative
Continual Learning [98.10425163678082]
継続的学習のための簡易タスク特化機能マップ変換戦略を提案する。
これらは新しいタスクを学習するための強力な柔軟性を提供し、ベースアーキテクチャに最小パラメータを追加することで実現される。
本手法の有効性と効率を,判別(cifar-100およびimagenet-1k)および生成的タスクの一連の実験を用いて実証する。
論文 参考訳(メタデータ) (2021-03-25T01:48:14Z) - Meta-Learning with Variational Bayes [0.0]
生成メタ学習のより一般的な問題に対処する新しいアプローチを提案する。
我々の貢献は、AEVBフレームワークと平均場変動ベイズを活用し、高速適応潜在空間生成モデルを作成する。
我々の貢献の核心は新たな成果であり、広範囲の深層生成潜在変数モデルにおいて、関連するVB更新は生成ニューラルネットワークに依存しないことを示している。
論文 参考訳(メタデータ) (2021-03-03T09:02:01Z) - FG-Net: Fast Large-Scale LiDAR Point CloudsUnderstanding Network
Leveraging CorrelatedFeature Mining and Geometric-Aware Modelling [15.059508985699575]
FG-Netは、Voxelizationなしで大規模ポイントクラウドを理解するための一般的なディープラーニングフレームワークです。
相関型特徴マイニングと変形性畳み込みに基づく幾何認識モデルを用いた深層畳み込みニューラルネットワークを提案する。
我々のアプローチは精度と効率の点で最先端のアプローチを上回っている。
論文 参考訳(メタデータ) (2020-12-17T08:20:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。