論文の概要: On limitations of learning algorithms in competitive environments
- arxiv url: http://arxiv.org/abs/2011.12728v2
- Date: Fri, 18 Jun 2021 07:07:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 02:47:12.910443
- Title: On limitations of learning algorithms in competitive environments
- Title(参考訳): 競争環境における学習アルゴリズムの限界について
- Authors: Alexander Y Klimenko and Dimitri A Klimenko
- Abstract要約: 本稿では,競争環境における対戦目標を追求する汎用学習アルゴリズムの概念的限界について論じる。
これらの制限は、競争環境において一般的に存在する不透過性と関連している。
- 参考スコア(独自算出の注目度): 77.34726150561087
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We discuss conceptual limitations of generic learning algorithms pursuing
adversarial goals in competitive environments, and prove that they are subject
to limitations that are analogous to the constraints on knowledge imposed by
the famous theorems of G\"odel and Turing. These limitations are shown to be
related to intransitivity, which is commonly present in competitive
environments.
- Abstract(参考訳): 本稿では,競争環境における対向目標を追求する汎用学習アルゴリズムの概念的限界について論じるとともに,G\"odel and Turing の有名な定理によって課される知識に関する制約に類似した制約が存在することを証明する。
これらの制限は、競争環境において一般的に存在する不透過性と関連している。
関連論文リスト
- Computability of Classification and Deep Learning: From Theoretical Limits to Practical Feasibility through Quantization [53.15874572081944]
ディープラーニングフレームワークにおける計算可能性について,2つの観点から検討する。
根底にある問題が十分に解決された場合でも、ディープニューラルネットワークを訓練する際のアルゴリズム上の制限を示す。
最後に、分類と深層ネットワークトレーニングの定量化バージョンにおいて、計算可能性の制限は発生せず、一定の程度まで克服可能であることを示す。
論文 参考訳(メタデータ) (2024-08-12T15:02:26Z) - Joint Learning of Policy with Unknown Temporal Constraints for Safe
Reinforcement Learning [0.0]
安全制約と最適なRLポリシーを同時に学習するフレームワークを提案する。
この枠組みは、我々の共同学習プロセスの収束を確立する定理によって支えられている。
当社のフレームワークをグリッド環境で紹介し、許容される安全性制約とRLポリシーの両方をうまく識別した。
論文 参考訳(メタデータ) (2023-04-30T21:15:07Z) - Computational-level Analysis of Constraint Compliance for General
Intelligence [4.383011485317949]
ルール、法則、道徳的命令は人間の行動を管理する制約の類の一例である。
このような混乱にもかかわらず、人間は決定に制約をしっかりと迅速に組み込む。
一般に、人工的な知性エージェントは、現実世界の制約のシステムの混乱をナビゲートできなければならない。
論文 参考訳(メタデータ) (2023-03-08T03:25:24Z) - Reinforcement Learning with Stepwise Fairness Constraints [50.538878453547966]
本稿では,段階的公正性制約を伴う強化学習について紹介する。
我々は、ポリシーの最適性と公正性違反に関して、強力な理論的保証を持つ学習アルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-11-08T04:06:23Z) - On Rate-Distortion Theory in Capacity-Limited Cognition & Reinforcement
Learning [43.19983737333797]
現実世界の意思決定エージェントは、限られた情報処理能力の下で、認知や計算資源にアクセスできない。
本稿では,生物エージェントと人工エージェントの容量制限意思決定に関する情報理論モデルに関する簡単な調査を行う。
論文 参考訳(メタデータ) (2022-10-30T16:39:40Z) - Constrained Learning with Non-Convex Losses [119.8736858597118]
学習は現代の情報処理の中核技術になっているが、バイアス、安全でない、偏見のあるソリューションにつながるという証拠はたくさんある。
論文 参考訳(メタデータ) (2021-03-08T23:10:33Z) - Constrained episodic reinforcement learning in concave-convex and
knapsack settings [81.08055425644037]
コンケーブ報酬と凸制約のある設定に対して、強力な理論的保証を持つモジュラー解析を提供する。
実験により,提案アルゴリズムは既存の制約付きエピソード環境において,これらの手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2020-06-09T05:02:44Z) - Lagrangian Duality for Constrained Deep Learning [51.2216183850835]
本稿では,複雑な制約を特徴とする学習アプリケーションにおけるラグランジアン双対性の可能性について検討する。
エネルギー領域において、ラグランジアン双対性とディープラーニングの組み合わせは、最先端の結果を得るために用いられる。
翻訳計算において、ラグランジュ双対性は、予測子に単調性制約を課すためにディープラーニングを補完することができる。
論文 参考訳(メタデータ) (2020-01-26T03:38:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。