Fugu-MT 論文翻訳(概要): On limitations of learning algorithms in competitive environments

論文の概要: On limitations of learning algorithms in competitive environments

arxiv url: http://arxiv.org/abs/2011.12728v2
Date: Fri, 18 Jun 2021 07:07:05 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-21 02:47:12.910443
Title: On limitations of learning algorithms in competitive environments
Title（参考訳）: 競争環境における学習アルゴリズムの限界について
Authors: Alexander Y Klimenko and Dimitri A Klimenko
Abstract要約: 本稿では,競争環境における対戦目標を追求する汎用学習アルゴリズムの概念的限界について論じる。これらの制限は、競争環境において一般的に存在する不透過性と関連している。
参考スコア（独自算出の注目度）: 77.34726150561087
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We discuss conceptual limitations of generic learning algorithms pursuing adversarial goals in competitive environments, and prove that they are subject to limitations that are analogous to the constraints on knowledge imposed by the famous theorems of G\"odel and Turing. These limitations are shown to be related to intransitivity, which is commonly present in competitive environments.
Abstract（参考訳）: 本稿では,競争環境における対向目標を追求する汎用学習アルゴリズムの概念的限界について論じるとともに,G\"odel and Turing の有名な定理によって課される知識に関する制約に類似した制約が存在することを証明する。これらの制限は、競争環境において一般的に存在する不透過性と関連している。

関連論文リスト

Algorithmic Fairness: Not a Purely Technical but Socio-Technical Property [4.2894701473635966]
公正さは純粋にモデルに関する技術的な制約に還元できないと我々は主張する。本研究では,既存の公正度尺度の限界について,概念分析と実証図面を用いて検討する。これらの発見は、技術的フォーマライゼーションと社会的現実のギャップを埋める助けになると考えています。
論文参考訳（メタデータ） (2025-06-14T15:54:45Z)
Constrained Online Decision-Making: A Unified Framework [14.465944215100746]
本稿では,段階的実現可能性制約による逐次意思決定の一般的な定式化について検討する。本稿では,既存の制約付き学習問題を抽出する統一的なアルゴリズムフレームワークを提案する。この結果は、理論と実践の両方において、制約付きシーケンシャルな意思決定のための原則化された基盤を提供する。
論文参考訳（メタデータ） (2025-05-11T19:22:04Z)
Computability of Classification and Deep Learning: From Theoretical Limits to Practical Feasibility through Quantization [53.15874572081944]
ディープラーニングフレームワークにおける計算可能性について,2つの観点から検討する。根底にある問題が十分に解決された場合でも、ディープニューラルネットワークを訓練する際のアルゴリズム上の制限を示す。最後に、分類と深層ネットワークトレーニングの定量化バージョンにおいて、計算可能性の制限は発生せず、一定の程度まで克服可能であることを示す。
論文参考訳（メタデータ） (2024-08-12T15:02:26Z)
Joint Learning of Policy with Unknown Temporal Constraints for Safe Reinforcement Learning [0.0]
安全制約と最適なRLポリシーを同時に学習するフレームワークを提案する。この枠組みは、我々の共同学習プロセスの収束を確立する定理によって支えられている。当社のフレームワークをグリッド環境で紹介し、許容される安全性制約とRLポリシーの両方をうまく識別した。
論文参考訳（メタデータ） (2023-04-30T21:15:07Z)
Computational-level Analysis of Constraint Compliance for General Intelligence [4.383011485317949]
ルール、法則、道徳的命令は人間の行動を管理する制約の類の一例である。このような混乱にもかかわらず、人間は決定に制約をしっかりと迅速に組み込む。一般に、人工的な知性エージェントは、現実世界の制約のシステムの混乱をナビゲートできなければならない。
論文参考訳（メタデータ） (2023-03-08T03:25:24Z)
Reinforcement Learning with Stepwise Fairness Constraints [50.538878453547966]
本稿では,段階的公正性制約を伴う強化学習について紹介する。我々は、ポリシーの最適性と公正性違反に関して、強力な理論的保証を持つ学習アルゴリズムを提供する。
論文参考訳（メタデータ） (2022-11-08T04:06:23Z)
On Rate-Distortion Theory in Capacity-Limited Cognition & Reinforcement Learning [43.19983737333797]
現実世界の意思決定エージェントは、限られた情報処理能力の下で、認知や計算資源にアクセスできない。本稿では,生物エージェントと人工エージェントの容量制限意思決定に関する情報理論モデルに関する簡単な調査を行う。
論文参考訳（メタデータ） (2022-10-30T16:39:40Z)
Constrained Learning with Non-Convex Losses [119.8736858597118]
学習は現代の情報処理の中核技術になっているが、バイアス、安全でない、偏見のあるソリューションにつながるという証拠はたくさんある。
論文参考訳（メタデータ） (2021-03-08T23:10:33Z)
Constrained episodic reinforcement learning in concave-convex and knapsack settings [81.08055425644037]
コンケーブ報酬と凸制約のある設定に対して、強力な理論的保証を持つモジュラー解析を提供する。実験により,提案アルゴリズムは既存の制約付きエピソード環境において,これらの手法を著しく上回ることを示した。
論文参考訳（メタデータ） (2020-06-09T05:02:44Z)
Lagrangian Duality for Constrained Deep Learning [51.2216183850835]
本稿では,複雑な制約を特徴とする学習アプリケーションにおけるラグランジアン双対性の可能性について検討する。エネルギー領域において、ラグランジアン双対性とディープラーニングの組み合わせは、最先端の結果を得るために用いられる。翻訳計算において、ラグランジュ双対性は、予測子に単調性制約を課すためにディープラーニングを補完することができる。
論文参考訳（メタデータ） (2020-01-26T03:38:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。