論文の概要: Adaptation to Unknown Situations as the Holy Grail of Learning-Based
Self-Adaptive Systems: Research Directions
- arxiv url: http://arxiv.org/abs/2103.06908v1
- Date: Thu, 11 Mar 2021 19:07:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-16 03:13:01.930999
- Title: Adaptation to Unknown Situations as the Holy Grail of Learning-Based
Self-Adaptive Systems: Research Directions
- Title(参考訳): 学習に基づく自己適応システムの聖杯としての未知の状況への適応:研究方向
- Authors: Ivana Dusparic, Nicolas Cardozo
- Abstract要約: 我々は、未知の状況への適応は自己適応システムにとって究極の課題であると主張する。
我々は、可能であったとしても、人間の監督を伴わずに、自分たちの行動を定義し、彼らの目標に適応するシステムを構築するべきかどうかを議論を締めくくった。
- 参考スコア(独自算出の注目度): 3.7311680121118345
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-adaptive systems continuously adapt to changes in their execution
environment. Capturing all possible changes to define suitable behaviour
beforehand is unfeasible, or even impossible in the case of unknown changes,
hence human intervention may be required. We argue that adapting to unknown
situations is the ultimate challenge for self-adaptive systems. Learning-based
approaches are used to learn the suitable behaviour to exhibit in the case of
unknown situations, to minimize or fully remove human intervention. While such
approaches can, to a certain extent, generalize existing adaptations to new
situations, there is a number of breakthroughs that need to be achieved before
systems can adapt to general unknown and unforeseen situations. We posit the
research directions that need to be explored to achieve unanticipated
adaptation from the perspective of learning-based self-adaptive systems. At
minimum, systems need to define internal representations of previously unseen
situations on-the-fly, extrapolate the relationship to the previously
encountered situations to evolve existing adaptations, and reason about the
feasibility of achieving their intrinsic goals in the new set of conditions. We
close discussing whether, even when we can, we should indeed build systems that
define their own behaviour and adapt their goals, without involving a human
supervisor.
- Abstract(参考訳): 自己適応型システムは、実行環境の変化に継続的に適応する。
事前に適切な行動を定義するために可能なすべての変更をキャプチャすることは不可能であり、未知の変化の場合は不可能である。
我々は、未知の状況への適応は自己適応システムにとって究極の課題であると主張する。
学習に基づくアプローチは、未知の状況において提示する適切な振る舞いを学習し、人間の介入を最小化または完全に排除するために使用される。
そのようなアプローチは、新しい状況への既存の適応をある程度一般化することができるが、システムが一般的な未知および予期しない状況に適応する前に達成する必要がある多くのブレークスルーがある。
学習に基づく自己適応システムの観点から,予期せぬ適応を実現するために検討すべき研究方向を示す。
最低限、システムは、未確認の状況の内的表現を定義し、既存の適応を進化させるために、それまで遭遇した状況との関係を外挿し、新しい状況における本質的な目標を達成する可能性について考える必要がある。
我々は、可能であったとしても、人間の監督を伴わずに、自分たちの行動を定義し、彼らの目標に適応するシステムを構築するべきかどうかを議論を締めくくった。
関連論文リスト
- Adapt On-the-Go: Behavior Modulation for Single-Life Robot Deployment [92.48012013825988]
展開中のシナリオにオンザフライで適応する問題について検討する。
ROAM(RObust Autonomous Modulation)は,事前学習した行動の知覚値に基づくメカニズムを提案する。
ROAMによりロボットはシミュレーションと実Go1の四足歩行の両方の動的変化に迅速に適応できることを示す。
論文 参考訳(メタデータ) (2023-11-02T08:22:28Z) - "One-size-fits-all"? Observations and Expectations of NLG Systems Across
Identity-Related Language Features [61.07254514062558]
適応のためのモチベーションには,社会的規範,文化的相違,特徴特化情報,宿泊が含まれる。
本研究は, 公正なNLGシステム動作を構成するものの定義に関して, オープンな課題を浮き彫りにした。
論文 参考訳(メタデータ) (2023-10-23T23:00:34Z) - From Self-Adaptation to Self-Evolution Leveraging the Operational Design
Domain [15.705888799637506]
自己適応は、変化する状況に対処するための実行可能なアプローチであることが示されている。
自己適応システムの能力は、その運用設計領域(ODD)によって制約される
ODDの定義を提供し、それを自己適応システムに適用する。
論文 参考訳(メタデータ) (2023-03-27T14:49:07Z) - A Domain-Agnostic Approach for Characterization of Lifelong Learning
Systems [128.63953314853327]
「生涯学習」システムには,1)継続的学習,2)伝達と適応,3)拡張性があります。
この一連のメトリクスは、様々な複雑な生涯学習システムの開発に役立てることができることを示す。
論文 参考訳(メタデータ) (2023-01-18T21:58:54Z) - Dealing with Drift of Adaptation Spaces in Learning-based Self-Adaptive
Systems using Lifelong Self-Adaptation [10.852698169509006]
我々は、学習に基づく自己適応システムにおいて特に重要な課題である適応空間のドリフトに焦点を当てる。
適応空間のドリフトは不確実性に起因し、適応オプションの品質に影響を及ぼす。
本稿では、生涯ML層を用いた学習に基づく自己適応システムを強化するための、新しい自己適応手法を提案する。
論文 参考訳(メタデータ) (2022-11-04T07:45:48Z) - Safer Autonomous Driving in a Stochastic, Partially-Observable
Environment by Hierarchical Contingency Planning [10.971411555103574]
知的エージェントは、環境状態に対する信念の変化を予想する準備をすべきである。
これは特に、安全が最重要となる現実の状況をナビゲートする自動運転車(AV)に当てはまる。
また,本手法により,部分的に観察可能な安全な環境下での堅牢で安全な行動が得られ,トレーニング中に見えない環境に対して良好に一般化できることが示唆された。
論文 参考訳(メタデータ) (2022-04-13T16:47:00Z) - Deep Learning for Effective and Efficient Reduction of Large Adaptation
Spaces in Self-Adaptive Systems [12.341380735802568]
本稿では、DLASeR+を略して「適応空間削減のための深層学習」を提案する。
DLASeR+は、オンライン適応スペース削減のための拡張可能な学習フレームワークを提供する。
3種類の適応目標(しきい値、最適化、セットポイント目標)をサポートする。
その結果, DLASeR+は適応目標の実現に無視できる効果を有することがわかった。
論文 参考訳(メタデータ) (2022-04-13T08:51:06Z) - One Solution is Not All You Need: Few-Shot Extrapolation via Structured
MaxEnt RL [142.36621929739707]
課題を達成するために多様な行動を学ぶことは、様々な環境に一般化する行動を引き起こす可能性があることを示す。
トレーニング中の1つの環境でタスクの複数のソリューションを識別することにより、我々のアプローチは新たな状況に一般化できる。
論文 参考訳(メタデータ) (2020-10-27T17:41:57Z) - Importance Weighted Policy Learning and Adaptation [89.46467771037054]
政治外学習の最近の進歩の上に構築された,概念的にシンプルで,汎用的で,モジュール的な補完的アプローチについて検討する。
このフレームワークは確率論的推論文学のアイデアにインスパイアされ、堅牢な非政治学習と事前の行動を組み合わせる。
提案手法は,メタ強化学習ベースラインと比較して,ホールドアウトタスクにおける競合適応性能を実現し,複雑なスパース・リワードシナリオにスケールすることができる。
論文 参考訳(メタデータ) (2020-09-10T14:16:58Z) - Never Stop Learning: The Effectiveness of Fine-Tuning in Robotic
Reinforcement Learning [109.77163932886413]
本稿では,ロボットによるロボット操作ポリシーを,政治以外の強化学習を通じて微調整することで,新たなバリエーションに適応する方法を示す。
この適応は、タスクをゼロから学習するために必要なデータの0.2%未満を使用する。
事前訓練されたポリシーを適用するという私たちのアプローチは、微調整の過程で大きなパフォーマンス向上につながります。
論文 参考訳(メタデータ) (2020-04-21T17:57:04Z) - Neuro-evolutionary Frameworks for Generalized Learning Agents [1.2691047660244335]
近年のディープラーニングと深層強化学習の成功は、最先端の人工知能技術としての地位を確固たるものにしている。
これらのアプローチの長年の欠点は、そのようなシステムが設計され、デプロイされる方法を再考する必要性を示している。
このような神経進化の枠組みから期待される改善と関連する課題について論じる。
論文 参考訳(メタデータ) (2020-02-04T02:11:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。