論文の概要: On limitations of learning algorithms in competitive environments
- arxiv url: http://arxiv.org/abs/2011.12728v2
- Date: Fri, 18 Jun 2021 07:07:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 02:47:12.910443
- Title: On limitations of learning algorithms in competitive environments
- Title(参考訳): 競争環境における学習アルゴリズムの限界について
- Authors: Alexander Y Klimenko and Dimitri A Klimenko
- Abstract要約: 本稿では,競争環境における対戦目標を追求する汎用学習アルゴリズムの概念的限界について論じる。
これらの制限は、競争環境において一般的に存在する不透過性と関連している。
- 参考スコア(独自算出の注目度): 77.34726150561087
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We discuss conceptual limitations of generic learning algorithms pursuing
adversarial goals in competitive environments, and prove that they are subject
to limitations that are analogous to the constraints on knowledge imposed by
the famous theorems of G\"odel and Turing. These limitations are shown to be
related to intransitivity, which is commonly present in competitive
environments.
- Abstract(参考訳): 本稿では,競争環境における対向目標を追求する汎用学習アルゴリズムの概念的限界について論じるとともに,G\"odel and Turing の有名な定理によって課される知識に関する制約に類似した制約が存在することを証明する。
これらの制限は、競争環境において一般的に存在する不透過性と関連している。
関連論文リスト
- Neural Fields with Hard Constraints of Arbitrary Differential Order [61.49418682745144]
我々は、ニューラルネットワークに厳しい制約を課すための一連のアプローチを開発する。
制約は、ニューラルネットワークとそのデリバティブに適用される線形作用素として指定することができる。
私たちのアプローチは、広範囲の現実世界のアプリケーションで実証されています。
論文 参考訳(メタデータ) (2023-06-15T08:33:52Z) - Joint Learning of Policy with Unknown Temporal Constraints for Safe
Reinforcement Learning [0.0]
安全制約と最適なRLポリシーを同時に学習するフレームワークを提案する。
この枠組みは、我々の共同学習プロセスの収束を確立する定理によって支えられている。
当社のフレームワークをグリッド環境で紹介し、許容される安全性制約とRLポリシーの両方をうまく識別した。
論文 参考訳(メタデータ) (2023-04-30T21:15:07Z) - Computational-level Analysis of Constraint Compliance for General
Intelligence [4.383011485317949]
ルール、法則、道徳的命令は人間の行動を管理する制約の類の一例である。
このような混乱にもかかわらず、人間は決定に制約をしっかりと迅速に組み込む。
一般に、人工的な知性エージェントは、現実世界の制約のシステムの混乱をナビゲートできなければならない。
論文 参考訳(メタデータ) (2023-03-08T03:25:24Z) - Reinforcement Learning with Stepwise Fairness Constraints [50.538878453547966]
本稿では,段階的公正性制約を伴う強化学習について紹介する。
我々は、ポリシーの最適性と公正性違反に関して、強力な理論的保証を持つ学習アルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-11-08T04:06:23Z) - On Rate-Distortion Theory in Capacity-Limited Cognition & Reinforcement
Learning [43.19983737333797]
現実世界の意思決定エージェントは、限られた情報処理能力の下で、認知や計算資源にアクセスできない。
本稿では,生物エージェントと人工エージェントの容量制限意思決定に関する情報理論モデルに関する簡単な調査を行う。
論文 参考訳(メタデータ) (2022-10-30T16:39:40Z) - Composable constraints [0.0]
任意の構成可能な制約符号化を用いて、制約付き圏の等価な概念を構築することができることを示す。
並列合成, コンパクト性, 時間対称性など, 対象のカテゴリ構造を付加して制約の整合性を表現する方法を示す。
論文 参考訳(メタデータ) (2021-12-13T17:24:47Z) - Constrained Learning with Non-Convex Losses [119.8736858597118]
学習は現代の情報処理の中核技術になっているが、バイアス、安全でない、偏見のあるソリューションにつながるという証拠はたくさんある。
論文 参考訳(メタデータ) (2021-03-08T23:10:33Z) - Constrained episodic reinforcement learning in concave-convex and
knapsack settings [81.08055425644037]
コンケーブ報酬と凸制約のある設定に対して、強力な理論的保証を持つモジュラー解析を提供する。
実験により,提案アルゴリズムは既存の制約付きエピソード環境において,これらの手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2020-06-09T05:02:44Z) - Lagrangian Duality for Constrained Deep Learning [51.2216183850835]
本稿では,複雑な制約を特徴とする学習アプリケーションにおけるラグランジアン双対性の可能性について検討する。
エネルギー領域において、ラグランジアン双対性とディープラーニングの組み合わせは、最先端の結果を得るために用いられる。
翻訳計算において、ラグランジュ双対性は、予測子に単調性制約を課すためにディープラーニングを補完することができる。
論文 参考訳(メタデータ) (2020-01-26T03:38:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。