Fugu-MT 論文翻訳(概要): Artificial Generational Intelligence: Cultural Accumulation in Reinforcement Learning

論文の概要: Artificial Generational Intelligence: Cultural Accumulation in Reinforcement Learning

arxiv url: http://arxiv.org/abs/2406.00392v1
Date: Sat, 1 Jun 2024 10:33:32 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-06 07:15:00.932487
Title: Artificial Generational Intelligence: Cultural Accumulation in Reinforcement Learning
Title（参考訳）: 人工知能 : 強化学習における文化集積
Authors: Jonathan Cook, Chris Lu, Edward Hughes, Joel Z. Leibo, Jakob Foerster,
Abstract要約: 社会的学習と独立学習のバランスをとる訓練が文化的な蓄積をもたらすことを示す。 In-contextとIn-weightsの文化的な蓄積は、それぞれ知識とスキルの蓄積に類似していると解釈できる。この研究は、強化学習における創発的な文化的蓄積を実現するための一般的なモデルを初めて提示するものである。
参考スコア（独自算出の注目度）: 5.930456214333413
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Cultural accumulation drives the open-ended and diverse progress in capabilities spanning human history. It builds an expanding body of knowledge and skills by combining individual exploration with inter-generational information transmission. Despite its widespread success among humans, the capacity for artificial learning agents to accumulate culture remains under-explored. In particular, approaches to reinforcement learning typically strive for improvements over only a single lifetime. Generational algorithms that do exist fail to capture the open-ended, emergent nature of cultural accumulation, which allows individuals to trade-off innovation and imitation. Building on the previously demonstrated ability for reinforcement learning agents to perform social learning, we find that training setups which balance this with independent learning give rise to cultural accumulation. These accumulating agents outperform those trained for a single lifetime with the same cumulative experience. We explore this accumulation by constructing two models under two distinct notions of a generation: episodic generations, in which accumulation occurs via in-context learning and train-time generations, in which accumulation occurs via in-weights learning. In-context and in-weights cultural accumulation can be interpreted as analogous to knowledge and skill accumulation, respectively. To the best of our knowledge, this work is the first to present general models that achieve emergent cultural accumulation in reinforcement learning, opening up new avenues towards more open-ended learning systems, as well as presenting new opportunities for modelling human culture.
Abstract（参考訳）: 文化の蓄積は、人類の歴史にまたがる、オープンで多様な能力の進歩を促進する。個々の探索と世代間情報伝達を組み合わせることで、知識とスキルの拡充を図っている。人間の間で広く成功しているにもかかわらず、人工学習エージェントが文化を蓄積する能力はいまだ探索されていない。特に、強化学習へのアプローチは、通常、たった一生で改善しようと努力する。現存する世代別アルゴリズムは、個人の革新と模倣のトレードオフを可能にする、オープンで創発的な文化的蓄積の性質を捉えられない。従来の強化学習エージェントが社会学習を行う能力に基づいて、これと独立学習のバランスをとる訓練装置が文化的な蓄積をもたらすことが判明した。これらの蓄積剤は、同じ累積経験を持つ一生の訓練者より優れています。本研究では,この蓄積を,2つの異なる世代概念に基づいて構築することで検討する。すなわち,蓄積は文脈内学習によって起こる,エピソード世代と,重み付き学習によって発生する列車時世代である。 In-contextとIn-weightsの文化的な蓄積は、それぞれ知識とスキルの蓄積に類似していると解釈できる。我々の知る限り、この研究は、強化学習における創発的な文化的蓄積を実現し、よりオープンな学習システムへの新たな道を開くとともに、人間の文化をモデル化する新たな機会を提示する、最初の一般的なモデルである。

関連論文リスト

CultureMERT: Continual Pre-Training for Cross-Cultural Music Representation Learning [55.80320947983555]
CultureMERT-95Mは、異文化間の音楽表現学習を強化するために開発された多文化的な基礎モデルである。 650時間のマルチカルチャーデータ混合のトレーニングは、様々な西洋音楽のオートタグタスクにおいて、ROC-AUCとAPの平均4.9%の改善をもたらす。タスク算術は、西欧以外の自動タグタスクの多文化的に訓練されたモデルと同等に機能し、西洋のデータセットに回帰しない。
論文参考訳（メタデータ） (2025-06-21T21:16:39Z)
Unveiling the Learning Mind of Language Models: A Cognitive Framework and Empirical Study [50.065744358362345]
大規模言語モデル(LLM)は、数学、コーディング、推論といったタスクにまたがる印象的な機能を示している。しかし、彼らの学習能力は、動的環境に適応し、新しい知識を得るのに不可欠であり、まだ過小評価されていない。
論文参考訳（メタデータ） (2025-06-16T13:24:50Z)
CAReDiO: Cultural Alignment of LLM via Representativeness and Distinctiveness Guided Data Optimization [50.90288681622152]
大規模言語モデル(LLM)は、より深く様々な地域における人間の生活に統合される。既存のアプローチは、文化固有のコーパスを微調整することで、文化的に整合したLCMを開発する。本稿では,新しい文化データ構築フレームワークであるCAReDiOを紹介する。
論文参考訳（メタデータ） (2025-04-09T13:40:13Z)
How Do LLMs Acquire New Knowledge? A Knowledge Circuits Perspective on Continual Pre-Training [92.88889953768455]
大きな言語モデル(LLM)は、どのようにして新しい知識を内部化するかを理解する上で、重大なギャップに直面します。知識記憶と処理を容易にする計算サブグラフを同定する。
論文参考訳（メタデータ） (2025-02-16T16:55:43Z)
Multi-Stage Knowledge Integration of Vision-Language Models for Continual Learning [79.46570165281084]
蒸留法における人間の学習過程をエミュレートするマルチステージ知識統合ネットワーク(MulKI)を提案する。 Mulkiは、イデオロギーの排除、新しいイデオロギーの追加、イデオロギーの排除、コネクティクスの作りという4つの段階を通じてこれを達成している。提案手法は,下流タスク間の連続学習をサポートしながら,ゼロショット能力の維持における大幅な改善を示す。
論文参考訳（メタデータ） (2024-11-11T07:36:19Z)
Self-Tuning: Instructing LLMs to Effectively Acquire New Knowledge through Self-Teaching [67.11497198002165]
大きな言語モデル(LLM)は、一度のトレーニングのために最新の情報を提供するのに苦労することが多い。効率的なヒューマンラーニングにおけるFeynman Techniqueの顕著な成功に感銘を受け、セルフチューニングを紹介した。
論文参考訳（メタデータ） (2024-06-10T14:42:20Z)
Conserving Human Creativity with Evolutionary Generative Algorithms: A Case Study in Music Generation [0.0]
本研究では,音楽制作における進化的生成アルゴリズムの適用について検討し,人間の創造性を保ち,向上させる。人間のフィードバックを微分進化アルゴリズムに組み込むことで、国際レコードレーベルに提出された6曲を制作しました。
論文参考訳（メタデータ） (2024-06-09T18:11:05Z)
Cultural evolution in populations of Large Language Models [15.012901178522874]
本研究では,人間の振る舞いを模倣する大規模言語モデルの能力を利用することで,このギャップに対処できる可能性が示唆された。人工エージェントは、文化の進化にますます参加することが求められているため、機械生成文化の進化のダイナミクスをより深く理解することが不可欠である。本稿では, LLMの人口の文化的進化をシミュレーションする枠組みを提案し, 文化的進化において重要な変数の操作を可能にする。
論文参考訳（メタデータ） (2024-03-13T18:11:17Z)
Anti-Retroactive Interference for Lifelong Learning [65.50683752919089]
我々は脳のメタラーニングと連想機構に基づく生涯学習のパラダイムを設計する。知識の抽出と知識の記憶という2つの側面から問題に取り組む。提案した学習パラダイムが,異なるタスクのモデルを同じ最適に収束させることができることを理論的に分析した。
論文参考訳（メタデータ） (2022-08-27T09:27:36Z)
Cumulative culture spontaneously emerges in artificial navigators who are social and memory-guided [0.0]
累積的な文化的進化は、適応的な革新が社会学習を通じて連続的に受け継がれるときに起こる。このプロセスは人間の技術革新を形成するが、人間以外の種にも起こる。累積的文化は、目標指向、社会的近接性、ルート記憶の最小限の認知的アーキテクチャでナビゲートする人工エージェントに自然に現れます。
論文参考訳（メタデータ） (2022-06-13T16:10:39Z)
A Unified Continuous Learning Framework for Multi-modal Knowledge Discovery and Pre-training [73.7507857547549]
本稿では,継続的学習フレームワークにおける知識発見とマルチモーダル事前学習の統合を提案する。知識発見のために、事前訓練されたモデルを用いてグラフ上のクロスモーダルリンクを識別する。モデル事前トレーニングでは、モデル更新をガイドする外部知識として知識グラフが使用される。
論文参考訳（メタデータ） (2022-06-11T16:05:06Z)
Learning Robust Real-Time Cultural Transmission without Human Data [82.05222093231566]
人工知能エージェントにおけるゼロショット、高リコール文化伝達を生成する方法を提案する。我々のエージェントは、事前に収集された人間のデータを使わずに、新しい文脈で人間からリアルタイムの文化的伝達に成功した。これは、人工知能を開発するアルゴリズムとしての文化進化の道を開くものである。
論文参考訳（メタデータ） (2022-03-01T19:32:27Z)
Growing knowledge culturally across generations to solve novel, complex tasks [29.579223105173217]
言語による文化学習をリバースエンジニアリングする第一歩を踏み出します。我々は,ミニマリスト型ビデオゲームという形で,複雑なハイテイクタスクのスイートを開発する。知識は世代によって徐々に蓄積され、その後の世代はゲームでさらに前進した。
論文参考訳（メタデータ） (2021-07-28T14:09:40Z)
Language Generation with Multi-Hop Reasoning on Commonsense Knowledge Graph [124.45799297285083]
知識グラフの構造的情報と意味的情報の両方を活用することで、コモンセンスを意識したテキスト生成が促進されると主張している。本稿では,外部コモンセンス知識グラフから抽出したマルチリレーショナルパスに基づいて,動的マルチホップ推論を用いた事前学習モデルを実現するマルチホップ推論フロー(GRF)の生成を提案する。
論文参考訳（メタデータ） (2020-09-24T13:55:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。