論文の概要: Reinforcement Learning and Life Cycle Assessment for a Circular Economy -- Towards Progressive Computer Science
- arxiv url: http://arxiv.org/abs/2503.10822v3
- Date: Mon, 05 May 2025 17:53:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 14:44:43.993145
- Title: Reinforcement Learning and Life Cycle Assessment for a Circular Economy -- Towards Progressive Computer Science
- Title(参考訳): 循環型経済のための強化学習とライフサイクルアセスメント -- 進歩型コンピュータ科学を目指して
- Authors: Johannes Buchner,
- Abstract要約: 本研究の目的は,循環型経済における強化学習によるライフサイクルアセスメントの可能性を検討することである。
コンピュータチェスにおける強化学習(Reinforcement Learning)の応用について説明する。
本稿の最終部では、経済パラダイムを持続可能性に転換するコンピュータサイエンス関連の課題について論じる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The aim of this paper is to discuss the potential of using methods from Reinforcement Learning for Life Cycle Assessment in a circular economy, and to present some new ideas in this direction. To give some context, we explain how Reinforcement Learning was successfully applied in computer chess (and beyond). As computer chess was historically called the "drosophila of AI", we start by describing a method for the board representation called 'rotated bitboards' that can potentially also be applied in the context of sustainability. In the first part of this paper, the concepts of the bitboard-representation and the advantages of (rotated) bitboards in move generation are explained. In order to illustrate those ideas practice, the concrete implementation of the move-generator in FUSc# (a chess engine developed at FU Berlin in C# some years ago) is described. In addition, rotated binary neural networks are discussed briefly. The second part deals with reinforcement learning in computer chess (and beyond). We exemplify the progress that has been made in this field in the last 15-20 years by comparing the "state of the art" from 2002-2008, when FUSc# was developed, with the ground-breaking innovations connected to "AlphaZero". We review some application of the ideas developed in AlphaZero in other domains, e.g. the "other Alphas" like AlphaFold, AlphaTensor, AlphaGeometry and AlphaProof. In the final part of the paper, we discuss the computer-science related challenges that changing the economic paradigm towards (absolute) sustainability poses and in how far what we call 'progressive computer science' needs to contribute. Concrete challenges include the closing of material loops in a circular economy with Life Cycle Assessment in order to optimize for (absolute) sustainability, and we present some new ideas in this direction.
- Abstract(参考訳): 本研究の目的は, 循環型経済における強化学習によるライフサイクルアセスメント手法の活用の可能性について考察し, 新たな考え方を提示することである。
いくつかの文脈で、強化学習がコンピュータチェス(およびそれ以上)にどのようにうまく適用されたかを説明します。
コンピュータチェスは歴史的に「AIのドロソフィラ」と呼ばれてきたので、サステナビリティの文脈にも適用可能な「回転ビットボード」と呼ばれるボード表現の方法を記述することから始める。
本稿では,移動生成におけるビットボード表現の概念と(回転)ビットボードの利点を説明する。
これらのアイデアの実践を説明するために、FUSc#(数年前にC#でFU Berlinで開発されたチェスエンジン)の移動ジェネレータの具体的な実装について説明する。
さらに、回転したバイナリニューラルネットワークについても簡単に議論する。
第2部では、コンピュータチェスの強化学習を扱っている。
FUSc#が開発された2002~2008年の"最先端"と、"アルファゼロ"に関連する画期的なイノベーションを比較して、この分野における過去15~20年間の進歩を例証する。
例えば、AlphaFold、AlphaTensor、AlphaGeometry、AlphaProofなど、AlphaZeroで開発されたアイデアの応用についてレビューする。
本稿の最終部では、(絶対的な)持続可能性への経済パラダイムの転換がもたらすコンピュータ科学関連の課題と、「進歩的コンピュータ科学」と呼ぶものがどの程度貢献する必要があるかについて論じる。
具体的な課題として, ライフサイクルアセスメントによる循環経済における材料循環の閉鎖, 持続可能性の最適化, そして, 新たな考え方を提示する。
関連論文リスト
- Playpen: An Environment for Exploring Learning Through Conversational Interaction [81.67330926729015]
ダイアログゲーム(Dialogue Games)と呼ばれる、人工的なインタラクションが、学習シグナルを提供することができるかを考察する。
このデータに対する教師付き微調整の効果について検討する。
我々は、この有望な新しい方向性の研究を促進することを期待して、フレームワークとベースライントレーニングのセットアップをリリースします。
論文 参考訳(メタデータ) (2025-04-11T14:49:33Z) - MiniZero: Comparative Analysis of AlphaZero and MuZero on Go, Othello, and Atari Games [9.339645051415115]
MiniZeroは、ゼロ知識学習フレームワークで、4つの最先端アルゴリズムをサポートする。
我々は,2つのボードゲーム,9x9 Go,8x8 Othello,57のAtariゲームにおいて,各アルゴリズムの性能を評価する。
論文 参考訳(メタデータ) (2023-10-17T14:29:25Z) - Accelerate Multi-Agent Reinforcement Learning in Zero-Sum Games with
Subgame Curriculum Learning [65.36326734799587]
ゼロサムゲームのための新しいサブゲームカリキュラム学習フレームワークを提案する。
エージェントを以前に訪れた状態にリセットすることで、適応的な初期状態分布を採用する。
我々は,2乗距離をNE値に近似するサブゲーム選択指標を導出する。
論文 参考訳(メタデータ) (2023-10-07T13:09:37Z) - AlphaZero Gomoku [9.434566356382529]
我々は、AlphaZeroを「Five in a Row」とも呼ばれる古くからのボードゲーム「Gomoku」に拡張する。
我々のテストは、Go以外のゲームに適応するAlphaZeroの汎用性を示している。
論文 参考訳(メタデータ) (2023-09-04T00:20:06Z) - Technical Challenges of Deploying Reinforcement Learning Agents for Game
Testing in AAA Games [58.720142291102135]
本稿では,既存の自動ゲームテストソリューションに,スクリプト型ボットをベースとして,実験的な強化学習システムを追加する取り組みについて述べる。
ゲーム制作において強化学習を活用するためのユースケースを示し、ゲームのために同じ旅をしたいと思う人なら誰でも遭遇する最大の時間をカバーしています。
我々は、機械学習、特にゲーム生産において効果的なツールである強化学習を作るのに価値があり、必要であると考えるいくつかの研究指針を提案する。
論文 参考訳(メタデータ) (2023-07-19T18:19:23Z) - Promptable Game Models: Text-Guided Game Simulation via Masked Diffusion
Models [68.85478477006178]
ニューラルビデオゲームシミュレータのためのPGM(Promptable Game Model)を提案する。
ユーザーは高レベルのアクションシーケンスと低レベルのアクションシーケンスでゲームを実行することができる。
私たちのPGMは、エージェントの目標をプロンプトの形で指定することで、ディレクターのモードをアンロックします。
提案手法は,既存のニューラルビデオゲームシミュレータのレンダリング品質を著しく上回り,現在の最先端の能力を超えたアプリケーションをアンロックする。
論文 参考訳(メタデータ) (2023-03-23T17:43:17Z) - Targeted Search Control in AlphaZero for Effective Policy Improvement [93.30151539224144]
我々はAlphaZeroの新しい検索制御戦略であるGo-Exploitを紹介する。
Go-Exploitは、関心のある状態のアーカイブからセルフプレイトラジェクトリの開始状態をサンプリングする。
Go-Exploitは、標準のAlphaZeroよりも優れたサンプル効率で学習する。
論文 参考訳(メタデータ) (2023-02-23T22:50:24Z) - Neural Networks for Chess [2.055949720959582]
AlphaZero、Leela Chess Zero、Stockfish NNUEはコンピュータチェスに革命をもたらした。
この本は、そのようなエンジンの技術的な内部動作について、完全な紹介を行っている。
論文 参考訳(メタデータ) (2022-09-03T22:17:16Z) - Impartial Games: A Challenge for Reinforcement Learning [0.0]
我々はAlphaZeroスタイルの強化学習アルゴリズムが、プレイヤーが駒を共有する公平なゲームにおいて課題に直面していることを示す。
Nimは小さなボード上で学習できるが、AlphaZeroスタイルのアルゴリズムの学習の進歩は、ボードのサイズが大きくなると劇的に遅くなる。
論文 参考訳(メタデータ) (2022-05-25T14:02:02Z) - Acquisition of Chess Knowledge in AlphaZero [14.41428465712717]
人間の知識がAlphaZeroニューラルネットワークによって獲得され、チェスのゲームでトレーニングされることを示す。
これらの概念がAlphaZeroネットワークでいつ、どこで表現されているかを示す。
チェスのグランドマスターであるウラジーミル・クラムニクの質的分析を含む、オープニングプレイに焦点を当てた行動分析も提供する。
論文 参考訳(メタデータ) (2021-11-17T17:46:19Z) - Combining Off and On-Policy Training in Model-Based Reinforcement
Learning [77.34726150561087]
MuZeroのシミュレートゲームから得られたデータを用いて、オフポリシターゲットの取得方法を提案する。
以上の結果から,これらの目標がトレーニングプロセスのスピードアップと,より高速な収束とより高い報酬につながることが示唆された。
論文 参考訳(メタデータ) (2021-02-24T10:47:26Z) - Teach me to play, gamer! Imitative learning in computer games via
linguistic description of complex phenomena and decision tree [55.41644538483948]
本稿では,複雑な現象の言語記述に基づく模倣による新しい機械学習モデルを提案する。
この手法は,ゲーム開発における知的エージェントの動作を設計し,実装するための優れた代替手段となる。
論文 参考訳(メタデータ) (2021-01-06T21:14:10Z) - LiveChess2FEN: a Framework for Classifying Chess Pieces based on CNNs [0.0]
我々は,1秒未満で画像からチェス位置を自動的にデジタル化する機能的フレームワークを実装した。
チェスの駒の分類と組込みプラットフォーム上で効率的にマップする方法について、さまざまな畳み込みニューラルネットワークを分析した。
論文 参考訳(メタデータ) (2020-12-12T16:48:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。