論文の概要: Reinforcement Learning and Life Cycle Assessment for a Circular Economy -- Towards Progressive Computer Science
- arxiv url: http://arxiv.org/abs/2503.10822v3
- Date: Mon, 05 May 2025 17:53:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 14:44:43.993145
- Title: Reinforcement Learning and Life Cycle Assessment for a Circular Economy -- Towards Progressive Computer Science
- Title(参考訳): 循環型経済のための強化学習とライフサイクルアセスメント -- 進歩型コンピュータ科学を目指して
- Authors: Johannes Buchner,
- Abstract要約: 本研究の目的は,循環型経済における強化学習によるライフサイクルアセスメントの可能性を検討することである。
コンピュータチェスにおける強化学習(Reinforcement Learning)の応用について説明する。
本稿の最終部では、経済パラダイムを持続可能性に転換するコンピュータサイエンス関連の課題について論じる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The aim of this paper is to discuss the potential of using methods from Reinforcement Learning for Life Cycle Assessment in a circular economy, and to present some new ideas in this direction. To give some context, we explain how Reinforcement Learning was successfully applied in computer chess (and beyond). As computer chess was historically called the "drosophila of AI", we start by describing a method for the board representation called 'rotated bitboards' that can potentially also be applied in the context of sustainability. In the first part of this paper, the concepts of the bitboard-representation and the advantages of (rotated) bitboards in move generation are explained. In order to illustrate those ideas practice, the concrete implementation of the move-generator in FUSc# (a chess engine developed at FU Berlin in C# some years ago) is described. In addition, rotated binary neural networks are discussed briefly. The second part deals with reinforcement learning in computer chess (and beyond). We exemplify the progress that has been made in this field in the last 15-20 years by comparing the "state of the art" from 2002-2008, when FUSc# was developed, with the ground-breaking innovations connected to "AlphaZero". We review some application of the ideas developed in AlphaZero in other domains, e.g. the "other Alphas" like AlphaFold, AlphaTensor, AlphaGeometry and AlphaProof. In the final part of the paper, we discuss the computer-science related challenges that changing the economic paradigm towards (absolute) sustainability poses and in how far what we call 'progressive computer science' needs to contribute. Concrete challenges include the closing of material loops in a circular economy with Life Cycle Assessment in order to optimize for (absolute) sustainability, and we present some new ideas in this direction.
- Abstract(参考訳): 本研究の目的は, 循環型経済における強化学習によるライフサイクルアセスメント手法の活用の可能性について考察し, 新たな考え方を提示することである。
いくつかの文脈で、強化学習がコンピュータチェス(およびそれ以上)にどのようにうまく適用されたかを説明します。
コンピュータチェスは歴史的に「AIのドロソフィラ」と呼ばれてきたので、サステナビリティの文脈にも適用可能な「回転ビットボード」と呼ばれるボード表現の方法を記述することから始める。
本稿では,移動生成におけるビットボード表現の概念と(回転)ビットボードの利点を説明する。
これらのアイデアの実践を説明するために、FUSc#(数年前にC#でFU Berlinで開発されたチェスエンジン)の移動ジェネレータの具体的な実装について説明する。
さらに、回転したバイナリニューラルネットワークについても簡単に議論する。
第2部では、コンピュータチェスの強化学習を扱っている。
FUSc#が開発された2002~2008年の"最先端"と、"アルファゼロ"に関連する画期的なイノベーションを比較して、この分野における過去15~20年間の進歩を例証する。
例えば、AlphaFold、AlphaTensor、AlphaGeometry、AlphaProofなど、AlphaZeroで開発されたアイデアの応用についてレビューする。
本稿の最終部では、(絶対的な)持続可能性への経済パラダイムの転換がもたらすコンピュータ科学関連の課題と、「進歩的コンピュータ科学」と呼ぶものがどの程度貢献する必要があるかについて論じる。
具体的な課題として, ライフサイクルアセスメントによる循環経済における材料循環の閉鎖, 持続可能性の最適化, そして, 新たな考え方を提示する。
関連論文リスト
- AI's Euclid's Elements Moment: From Language Models to Computable Thought [2.1142253753427402]
本稿では,人工知能の発展を理解するための包括的な5段階進化の枠組みを提案する。
AIは、それぞれが表現と推論の能力の革命的なシフトによって定義される、異なるエポックを通じて進歩していると仮定する。
論文 参考訳(メタデータ) (2025-06-29T04:14:19Z) - Neuro-Symbolic Concepts [72.94541757514396]
本稿では、連続的に学習し、柔軟に推論できるエージェントを構築するための概念中心のパラダイムについて述べる。
概念中心のエージェントは、ニューロシンボリックな概念の語彙を利用する。
このフレームワークには、データ効率、構成一般化、連続学習、ゼロショット転送など、いくつかの利点がある。
論文 参考訳(メタデータ) (2025-05-09T17:02:51Z) - Machine Learning: a Lecture Note [51.31735291774885]
この講義ノートは、データサイエンスの初等生と博士課程の学生、あるいは機械学習の基礎的アイデアに関する規律を準備することを目的としている。
それは、機械学習の基本的なアイデアから始まり、分類を主なターゲットタスクとする。
これらの基本的な考え方に基づいて、講義ノートは教師なし学習に対する確率論的アプローチを深く探求する。
論文 参考訳(メタデータ) (2025-05-06T16:03:41Z) - Playpen: An Environment for Exploring Learning Through Conversational Interaction [81.67330926729015]
ダイアログゲーム(Dialogue Games)と呼ばれる、人工的なインタラクションが、学習シグナルを提供することができるかを考察する。
このデータに対する教師付き微調整の効果について検討する。
我々は、この有望な新しい方向性の研究を促進することを期待して、フレームワークとベースライントレーニングのセットアップをリリースします。
論文 参考訳(メタデータ) (2025-04-11T14:49:33Z) - Machine learning and information theory concepts towards an AI
Mathematician [77.63761356203105]
人工知能の現在の最先端技術は、特に言語習得の点で印象的だが、数学的推論の点ではあまり重要ではない。
このエッセイは、現在のディープラーニングが主にシステム1の能力で成功するという考えに基づいている。
興味深い数学的ステートメントを構成するものについて質問するために、情報理論的な姿勢を取る。
論文 参考訳(メタデータ) (2024-03-07T15:12:06Z) - MiniZero: Comparative Analysis of AlphaZero and MuZero on Go, Othello, and Atari Games [9.339645051415115]
MiniZeroは、ゼロ知識学習フレームワークで、4つの最先端アルゴリズムをサポートする。
我々は,2つのボードゲーム,9x9 Go,8x8 Othello,57のAtariゲームにおいて,各アルゴリズムの性能を評価する。
論文 参考訳(メタデータ) (2023-10-17T14:29:25Z) - Accelerate Multi-Agent Reinforcement Learning in Zero-Sum Games with
Subgame Curriculum Learning [65.36326734799587]
ゼロサムゲームのための新しいサブゲームカリキュラム学習フレームワークを提案する。
エージェントを以前に訪れた状態にリセットすることで、適応的な初期状態分布を採用する。
我々は,2乗距離をNE値に近似するサブゲーム選択指標を導出する。
論文 参考訳(メタデータ) (2023-10-07T13:09:37Z) - A Survey of Imitation Learning: Algorithms, Recent Developments, and
Challenges [9.288673880680033]
模倣学習(英: mimicion learning、IL)とは、専門家の行動を模倣することによって望ましい行動が学習される過程である。
本稿では、ILの概要と、その基礎となる前提とアプローチの概要について述べる。
また、この分野における最近の進歩と新たな研究分野についても詳述している。
論文 参考訳(メタデータ) (2023-09-05T11:56:07Z) - AlphaZero Gomoku [9.434566356382529]
我々は、AlphaZeroを「Five in a Row」とも呼ばれる古くからのボードゲーム「Gomoku」に拡張する。
我々のテストは、Go以外のゲームに適応するAlphaZeroの汎用性を示している。
論文 参考訳(メタデータ) (2023-09-04T00:20:06Z) - Technical Challenges of Deploying Reinforcement Learning Agents for Game
Testing in AAA Games [58.720142291102135]
本稿では,既存の自動ゲームテストソリューションに,スクリプト型ボットをベースとして,実験的な強化学習システムを追加する取り組みについて述べる。
ゲーム制作において強化学習を活用するためのユースケースを示し、ゲームのために同じ旅をしたいと思う人なら誰でも遭遇する最大の時間をカバーしています。
我々は、機械学習、特にゲーム生産において効果的なツールである強化学習を作るのに価値があり、必要であると考えるいくつかの研究指針を提案する。
論文 参考訳(メタデータ) (2023-07-19T18:19:23Z) - Promptable Game Models: Text-Guided Game Simulation via Masked Diffusion
Models [68.85478477006178]
ニューラルビデオゲームシミュレータのためのPGM(Promptable Game Model)を提案する。
ユーザーは高レベルのアクションシーケンスと低レベルのアクションシーケンスでゲームを実行することができる。
私たちのPGMは、エージェントの目標をプロンプトの形で指定することで、ディレクターのモードをアンロックします。
提案手法は,既存のニューラルビデオゲームシミュレータのレンダリング品質を著しく上回り,現在の最先端の能力を超えたアプリケーションをアンロックする。
論文 参考訳(メタデータ) (2023-03-23T17:43:17Z) - Targeted Search Control in AlphaZero for Effective Policy Improvement [93.30151539224144]
我々はAlphaZeroの新しい検索制御戦略であるGo-Exploitを紹介する。
Go-Exploitは、関心のある状態のアーカイブからセルフプレイトラジェクトリの開始状態をサンプリングする。
Go-Exploitは、標準のAlphaZeroよりも優れたサンプル効率で学習する。
論文 参考訳(メタデータ) (2023-02-23T22:50:24Z) - AI2: The next leap toward native language based and explainable machine
learning framework [1.827510863075184]
提案されたフレームワークは、AI$2$と名付けられ、自然言語インターフェースを使用して、非スペシャリストが機械学習アルゴリズムの恩恵を受けることができる。
AI$2$フレームワークの主なコントリビューションは、ユーザーが機械学習アルゴリズムを英語で呼び出すことで、インターフェースの使用が容易になる。
もうひとつのコントリビューションは、データの適切な記述とロードを支援する前処理モジュールだ。
論文 参考訳(メタデータ) (2023-01-09T14:48:35Z) - Evaluation Beyond Task Performance: Analyzing Concepts in AlphaZero in
Hex [39.001544338346655]
我々は,HexゲームにおけるAlphaZeroの内部表現について,自然言語処理(NLP)による2つの評価手法を用いて検討する。
短期的なエンドゲーム計画に関する概念はモデルの最終層に最もよくエンコードされているのに対し、長期計画に関する概念はモデルの中層に最もよくエンコードされている。
論文 参考訳(メタデータ) (2022-11-26T21:59:11Z) - Neural Networks for Chess [2.055949720959582]
AlphaZero、Leela Chess Zero、Stockfish NNUEはコンピュータチェスに革命をもたらした。
この本は、そのようなエンジンの技術的な内部動作について、完全な紹介を行っている。
論文 参考訳(メタデータ) (2022-09-03T22:17:16Z) - Impartial Games: A Challenge for Reinforcement Learning [0.0]
我々はAlphaZeroスタイルの強化学習アルゴリズムが、プレイヤーが駒を共有する公平なゲームにおいて課題に直面していることを示す。
Nimは小さなボード上で学習できるが、AlphaZeroスタイルのアルゴリズムの学習の進歩は、ボードのサイズが大きくなると劇的に遅くなる。
論文 参考訳(メタデータ) (2022-05-25T14:02:02Z) - Neurocompositional computing: From the Central Paradox of Cognition to a
new generation of AI systems [120.297940190903]
AIの最近の進歩は、限られた形態のニューロコンフォメーションコンピューティングの使用によってもたらされている。
ニューロコンポジションコンピューティングの新しい形式は、より堅牢で正確で理解しやすいAIシステムを生み出します。
論文 参考訳(メタデータ) (2022-05-02T18:00:10Z) - FALCON: Fast Visual Concept Learning by Integrating Images, Linguistic
descriptions, and Conceptual Relations [99.54048050189971]
自然に発生する複数のデータストリームによってガイドされる新しい視覚概念を素早く学習するフレームワークを提案する。
学習された概念は、未知の画像について推論することで質問に答えるなど、下流のアプリケーションをサポートする。
合成と実世界の両方のデータセットにおけるモデルの有効性を実証する。
論文 参考訳(メタデータ) (2022-03-30T19:45:00Z) - Acquisition of Chess Knowledge in AlphaZero [14.41428465712717]
人間の知識がAlphaZeroニューラルネットワークによって獲得され、チェスのゲームでトレーニングされることを示す。
これらの概念がAlphaZeroネットワークでいつ、どこで表現されているかを示す。
チェスのグランドマスターであるウラジーミル・クラムニクの質的分析を含む、オープニングプレイに焦点を当てた行動分析も提供する。
論文 参考訳(メタデータ) (2021-11-17T17:46:19Z) - Combining Off and On-Policy Training in Model-Based Reinforcement
Learning [77.34726150561087]
MuZeroのシミュレートゲームから得られたデータを用いて、オフポリシターゲットの取得方法を提案する。
以上の結果から,これらの目標がトレーニングプロセスのスピードアップと,より高速な収束とより高い報酬につながることが示唆された。
論文 参考訳(メタデータ) (2021-02-24T10:47:26Z) - Formalising Concepts as Grounded Abstractions [68.24080871981869]
このレポートは、表現学習が生データから概念を誘導する方法を示しています。
このレポートの主な技術的目標は、表現学習のテクニックが概念空間の格子理論的定式化とどのように結婚できるかを示すことである。
論文 参考訳(メタデータ) (2021-01-13T15:22:01Z) - Teach me to play, gamer! Imitative learning in computer games via
linguistic description of complex phenomena and decision tree [55.41644538483948]
本稿では,複雑な現象の言語記述に基づく模倣による新しい機械学習モデルを提案する。
この手法は,ゲーム開発における知的エージェントの動作を設計し,実装するための優れた代替手段となる。
論文 参考訳(メタデータ) (2021-01-06T21:14:10Z) - LiveChess2FEN: a Framework for Classifying Chess Pieces based on CNNs [0.0]
我々は,1秒未満で画像からチェス位置を自動的にデジタル化する機能的フレームワークを実装した。
チェスの駒の分類と組込みプラットフォーム上で効率的にマップする方法について、さまざまな畳み込みニューラルネットワークを分析した。
論文 参考訳(メタデータ) (2020-12-12T16:48:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。