論文の概要: Distributionally robust minimization in meta-learning for system identification
- arxiv url: http://arxiv.org/abs/2506.18074v1
- Date: Sun, 22 Jun 2025 15:41:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.732346
- Title: Distributionally robust minimization in meta-learning for system identification
- Title(参考訳): システム識別のためのメタラーニングにおける分布的ロバスト化
- Authors: Matteo Rufolo, Dario Piga, Marco Forgione,
- Abstract要約: 本研究は,システム識別のためのメタ学習における分布的ロバストな最小化について検討する。
我々は、分散的に堅牢な最適化パラダイムを採用し、高コストタスクを優先順位付けし、最悪のシナリオにおけるパフォーマンスを向上させる、別のアプローチを用いる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Meta learning aims at learning how to solve tasks, and thus it allows to estimate models that can be quickly adapted to new scenarios. This work explores distributionally robust minimization in meta learning for system identification. Standard meta learning approaches optimize the expected loss, overlooking task variability. We use an alternative approach, adopting a distributionally robust optimization paradigm that prioritizes high-loss tasks, enhancing performance in worst-case scenarios. Evaluated on a meta model trained on a class of synthetic dynamical systems and tested in both in-distribution and out-of-distribution settings, the proposed approach allows to reduce failures in safety-critical applications.
- Abstract(参考訳): メタ学習はタスクの解決方法を学ぶことを目的としており、それによって新しいシナリオに迅速に適応可能なモデルを見積もることができる。
本研究は,システム識別のためのメタ学習における分布的ロバストな最小化について検討する。
標準的なメタ学習アプローチは、タスクの可変性を見越して、期待される損失を最適化する。
我々は、分散的に堅牢な最適化パラダイムを採用し、高コストタスクを優先順位付けし、最悪のシナリオにおけるパフォーマンスを向上させる、別のアプローチを用いる。
合成力学系のクラスで訓練されたメタモデルを用いて, 分散状態と分布外状態の両方でテストし, 提案手法により, 安全クリティカルなアプリケーションにおける障害を低減することができる。
関連論文リスト
- Task-Distributionally Robust Data-Free Meta-Learning [99.56612787882334]
Data-Free Meta-Learning (DFML)は、複数の事前学習モデルを活用することで、独自のトレーニングデータを必要とせずに、新しいタスクを効率的に学習することを目的としている。
TDS(Task-Distribution Shift)とTDC(Task-Distribution Corruption)の2つの大きな課題を初めて明らかにした。
論文 参考訳(メタデータ) (2023-11-23T15:46:54Z) - A Simple Yet Effective Strategy to Robustify the Meta Learning Paradigm [16.159983226725565]
本稿では,ある確率レベルで最悪の適応ケースを制御するための2段階戦略を提案する。
実験結果から,本手法はタスク分布に対するメタラーニングの堅牢性を向上させることができることがわかった。
論文 参考訳(メタデータ) (2023-10-01T15:54:45Z) - Algorithm Design for Online Meta-Learning with Task Boundary Detection [63.284263611646]
非定常環境におけるタスクに依存しないオンラインメタ学習のための新しいアルゴリズムを提案する。
まず,タスクスイッチと分散シフトの簡易かつ効果的な2つの検出機構を提案する。
軽度条件下では,線形タスク平均的後悔がアルゴリズムに対して達成可能であることを示す。
論文 参考訳(メタデータ) (2023-02-02T04:02:49Z) - Task Weighting in Meta-learning with Trajectory Optimisation [37.32107678838193]
本稿では,メタ学習のためのタスク重み付けアルゴリズムを提案する。
動作と同一のミニバッチ内のタスクの重みを考慮し,タスク重み付けメタ学習問題を軌跡最適化に投入した。
提案手法は,2つの数ショット学習ベンチマークにおいて,手動重み付け法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-01-04T01:36:09Z) - Distributionally Adaptive Meta Reinforcement Learning [85.17284589483536]
テスト時間分布シフトの下で適切に振る舞うメタRLアルゴリズムのフレームワークを開発する。
我々の枠組みは、分布のロバスト性に対する適応的なアプローチを中心とし、様々なレベルの分布シフトに対してロバストであるようメタポリスの人口を訓練する。
本研究は, 分散シフト下での後悔を改善するための枠組みを示し, シミュレーションロボティクス問題に対する効果を実証的に示す。
論文 参考訳(メタデータ) (2022-10-06T17:55:09Z) - Model-based Meta Reinforcement Learning using Graph Structured Surrogate
Models [40.08137765886609]
グラフ構造化サーロゲートモデル (GSSM) と呼ばれるモデルが, 環境ダイナミクス予測における最先端の手法を上回っていることを示した。
当社のアプローチでは,テスト時間ポリシの勾配最適化を回避して,デプロイメント中の高速実行を実現しつつ,高いリターンを得ることができる。
論文 参考訳(メタデータ) (2021-02-16T17:21:55Z) - Model-based Adversarial Meta-Reinforcement Learning [38.28304764312512]
モデルに基づく対向メタ強化学習(AdMRL)を提案する。
AdMRLは、タスクファミリ内のすべてのタスク間の最悪の部分最適化ギャップを最小限にすることを目的としている。
本手法をいくつかの連続制御ベンチマークで評価し,全てのタスクに対して最悪の性能を示す。
論文 参考訳(メタデータ) (2020-06-16T02:21:49Z) - Learning Diverse Representations for Fast Adaptation to Distribution
Shift [78.83747601814669]
本稿では,複数のモデルを学習する手法を提案する。
分散シフトへの迅速な適応を促進するフレームワークの能力を実証する。
論文 参考訳(メタデータ) (2020-06-12T12:23:50Z) - Structured Prediction for Conditional Meta-Learning [44.30857707980074]
構造化予測を用いた条件付きメタラーニングの新しい視点を提案する。
タスク適応型構造化メタラーニング(TASML: Task-Adaptive Structured Meta-learning)は,タスク固有目的関数を生成する基本的フレームワークである。
実験により,TASMLは既存のメタラーニングモデルの性能を向上し,ベンチマークデータセットの最先端性を上回った。
論文 参考訳(メタデータ) (2020-02-20T15:24:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。