論文の概要: The Effect of Training Schedules on Morphological Robustness and Generalization
- arxiv url: http://arxiv.org/abs/2407.13965v1
- Date: Fri, 19 Jul 2024 00:55:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-22 19:13:08.095259
- Title: The Effect of Training Schedules on Morphological Robustness and Generalization
- Title(参考訳): 学習スケジュールが形態的ロバスト性および一般化に及ぼす影響
- Authors: Edoardo Barba, Anil Yaman, Giovanni Iacca,
- Abstract要約: ロバスト性と一般化性は、人工知能ニューラルネットワーク(ANN)ベースのコントローラの重要な特性である。
本稿では,ANNをベースとした制御器の物理的変動範囲における十分な性能を実現することを目的とした,形態的ロバスト性と一般化性に着目した。
- 参考スコア(独自算出の注目度): 11.068618445120508
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robustness and generalizability are the key properties of artificial neural network (ANN)-based controllers for maintaining a reliable performance in case of changes. It is demonstrated that exposing the ANNs to variations during training processes can improve their robustness and generalization capabilities. However, the way in which this variation is introduced can have a significant impact. In this paper, we define various training schedules to specify how these variations are introduced during an evolutionary learning process. In particular, we focus on morphological robustness and generalizability concerned with finding an ANN-based controller that can provide sufficient performance on a range of physical variations. Then, we perform an extensive analysis of the effect of these training schedules on morphological generalization. Furthermore, we formalize the process of training sample selection (i.e., morphological variations) to improve generalization as a reinforcement learning problem. Overall, our results provide deeper insights into the role of variability and the ways of enhancing the generalization property of evolved ANN-based controllers.
- Abstract(参考訳): ロバスト性と一般化性は、変更時に信頼性の高いパフォーマンスを維持するために、人工知能(ANN)ベースのコントローラの鍵となる特性である。
トレーニングプロセス中にANNをバラツキにすることで、堅牢性と一般化能力を向上できることが実証された。
しかし、このバリエーションを導入する方法が大きな影響を与える可能性がある。
本稿では,進化的学習過程において,これらの変化がどのように導入されたかを特定するために,様々なトレーニングスケジュールを定義する。
特に,ANNをベースとした制御器の物理的変動範囲における十分な性能を実現することを目的とした,形態的堅牢性と一般化性に着目した。
そして、これらのトレーニングスケジュールが形態的一般化に与える影響を広範囲に分析する。
さらに,サンプル選択(形態的変化)の学習過程を形式化し,強化学習問題として一般化を改善する。
本研究の結果は, 可変性の役割と, 進化したANN制御器の一般化特性を向上する方法について, より深い知見を提供するものである。
関連論文リスト
- REACT: Revealing Evolutionary Action Consequence Trajectories for Interpretable Reinforcement Learning [7.889696505137217]
強化学習の解釈可能性を高めるために,Revealing Evolutionary Action Consequence Trajectories (REACT)を提案する。
トレーニング中に学習した最適な振る舞いに基づくRLモデルの一般的な実践とは対照的に、エッジケースの軌跡の範囲を考慮すると、それらの固有の振る舞いをより包括的に理解することができると仮定する。
本研究は,RLモデルの動作の微妙な側面を最適性能を超えて明らかにし,解釈可能性の向上に寄与することを示す。
論文 参考訳(メタデータ) (2024-04-04T10:56:30Z) - Revisiting Dynamic Evaluation: Online Adaptation for Large Language
Models [88.47454470043552]
我々は、動的評価(動的評価)としても知られる、テスト時の言語モデルのパラメータをオンラインで微調整する問題を考察する。
オンライン適応はパラメータを時間的に変化する状態に変換し、メモリを重み付けしたコンテキスト長拡張の形式を提供する。
論文 参考訳(メタデータ) (2024-03-03T14:03:48Z) - Task adaption by biologically inspired stochastic comodulation [8.59194778459436]
我々は、利得変調による微調整畳み込みネットワークが、決定論的利得変調を改善することを示す。
この結果から,コモディレーション表現はマルチタスク学習における学習効率と性能を向上させることが示唆された。
論文 参考訳(メタデータ) (2023-11-25T15:21:03Z) - Evolving generalist controllers to handle a wide range of morphological variations [1.4425878137951238]
人工ニューラルネットワーク(ANN)の堅牢性と一般化性の研究は、いまだに限られている。
予期せぬ形態変化や環境変化は、ANNコントローラがこれらの変化を処理できなければ失敗する可能性がある。
本稿では,制御器の堅牢性と一般化性を高めることを目的としたアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-18T23:06:19Z) - NormAUG: Normalization-guided Augmentation for Domain Generalization [60.159546669021346]
ディープラーニングのためのNormAUG(Normalization-guided Augmentation)と呼ばれるシンプルで効果的な手法を提案する。
本手法は特徴レベルで多様な情報を導入し,主経路の一般化を改善する。
テスト段階では、アンサンブル戦略を利用して、モデルの補助経路からの予測を組み合わせ、さらなる性能向上を図る。
論文 参考訳(メタデータ) (2023-07-25T13:35:45Z) - TANGOS: Regularizing Tabular Neural Networks through Gradient
Orthogonalization and Specialization [69.80141512683254]
TANGOS(Tbular Neural Gradient Orthogonalization and gradient)を紹介する。
TANGOSは、潜在ユニット属性上に構築された表の設定を正規化するための新しいフレームワークである。
提案手法は,他の一般的な正規化手法よりも優れ,サンプル外一般化性能の向上につながることを実証する。
論文 参考訳(メタデータ) (2023-03-09T18:57:13Z) - Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。
状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。
特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-17T00:26:31Z) - The Role of Morphological Variation in Evolutionary Robotics: Maximizing
Performance and Robustness [0.0]
形態変化の影響を計測する手法を提案する。
我々は,変化の振幅,それらが導入されたモダリティ,および進化するエージェントの性能とロバスト性の関係を解析した。
以上の結果から, 形態的変動は, 様々な条件および非変動条件において, より優れた結果をもたらすことが示唆された。
論文 参考訳(メタデータ) (2022-08-04T17:58:15Z) - Data Augmentation vs. Equivariant Networks: A Theory of Generalization
on Dynamics Forecasting [24.363954435050264]
力学系における対称性の爆発は、ディープラーニングの一般化を改善する強力な方法である。
データ拡張と同変ネットワークは、学習に対称性を注入する2つの主要なアプローチである。
データ拡張と同変ネットワークの一般化境界を導出し、統一されたフレームワークにおける学習に対するそれらの効果を特徴づける。
論文 参考訳(メタデータ) (2022-06-19T17:00:12Z) - Trajectory-wise Multiple Choice Learning for Dynamics Generalization in
Reinforcement Learning [137.39196753245105]
本稿では,動的一般化のためのマルチヘッドダイナミックスモデルを学習するモデルベース強化学習アルゴリズムを提案する。
文脈学習は,過去の経験から得られる動的情報からコンテキスト潜在ベクトルにエンコードする。
提案手法は,最先端のRL法と比較して,様々な制御タスクにおいて優れたゼロショット一般化性能を示す。
論文 参考訳(メタデータ) (2020-10-26T03:20:42Z) - Dynamics Generalization via Information Bottleneck in Deep Reinforcement
Learning [90.93035276307239]
本稿では,RLエージェントのより優れた一般化を実現するために,情報理論正則化目標とアニーリングに基づく最適化手法を提案する。
迷路ナビゲーションからロボットタスクまで、さまざまな領域において、我々のアプローチの極端な一般化の利点を実証する。
この研究は、タスク解決のために冗長な情報を徐々に取り除き、RLの一般化を改善するための原則化された方法を提供する。
論文 参考訳(メタデータ) (2020-08-03T02:24:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。