論文の概要: Mindstorms in Natural Language-Based Societies of Mind
- arxiv url: http://arxiv.org/abs/2305.17066v1
- Date: Fri, 26 May 2023 16:21:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-29 13:39:01.957468
- Title: Mindstorms in Natural Language-Based Societies of Mind
- Title(参考訳): 自然言語社会におけるマインドストーム
- Authors: Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley,
R\'obert Csord\'as, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader
Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li,
Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag,
Weimin Shi, Aleksandar Stani\'c, Wenyi Wang, Yuhui Wang, Mengmeng Xu,
Deng-Ping Fan, Bernard Ghanem, J\"urgen Schmidhuber
- Abstract要約: ミンスキーの「心の社会」とシュミットフーバーの「思考の学習」は、大規模なマルチモーダルニューラルネットワーク(NN)の多様な社会に刺激を与えた。
最近のNNベースの心の社会の実装は、大きな言語モデル(LLM)と、自然言語インタフェースを介してコミュニケーションする他のNNベースの専門家で構成されている。
これらの自然言語に基づく心の社会(NLSOMs)では、新しいエージェント(全員が同じ普遍的なシンボル言語を介して通信する)がモジュール化された方法で簡単に追加される。
- 参考スコア(独自算出の注目度): 110.05229611910478
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Both Minsky's "society of mind" and Schmidhuber's "learning to think" inspire
diverse societies of large multimodal neural networks (NNs) that solve problems
by interviewing each other in a "mindstorm." Recent implementations of NN-based
societies of minds consist of large language models (LLMs) and other NN-based
experts communicating through a natural language interface. In doing so, they
overcome the limitations of single LLMs, improving multimodal zero-shot
reasoning. In these natural language-based societies of mind (NLSOMs), new
agents -- all communicating through the same universal symbolic language -- are
easily added in a modular fashion. To demonstrate the power of NLSOMs, we
assemble and experiment with several of them (having up to 129 members),
leveraging mindstorms in them to solve some practical AI tasks: visual question
answering, image captioning, text-to-image synthesis, 3D generation, egocentric
retrieval, embodied AI, and general language-based task solving. We view this
as a starting point towards much larger NLSOMs with billions of agents-some of
which may be humans. And with this emergence of great societies of
heterogeneous minds, many new research questions have suddenly become paramount
to the future of artificial intelligence. What should be the social structure
of an NLSOM? What would be the (dis)advantages of having a monarchical rather
than a democratic structure? How can principles of NN economies be used to
maximize the total reward of a reinforcement learning NLSOM? In this work, we
identify, discuss, and try to answer some of these questions.
- Abstract(参考訳): ミンスキーの "society of mind" と schmidhuber の "learning to think" は、"mindstorm" で互いにインタビューすることで問題を解決する大規模マルチモーダルニューラルネットワーク (nns) の多様な社会を刺激している。
最近のnn-based society of mindsの実装は、大言語モデル(llms)や他のnn-based expertが自然言語インターフェイスを介してコミュニケーションしている。
そのため、単一のLLMの制限を克服し、マルチモーダルなゼロショット推論を改善した。
これらの自然言語に基づく心の社会(nlsoms)では、同じ普遍的なシンボリック言語を介してコミュニケーションする新しいエージェントがモジュール化された方法で簡単に追加される。
NLSOMのパワーを実証するために、私たちはこれらのいくつか(最大129人のメンバ)を組み立てて、マインドストームを活用して、視覚的質問応答、画像キャプション、テキスト・ツー・イメージ合成、3D生成、エゴセントリック検索、エボデードAI、一般言語ベースのタスク解決といった、いくつかの実用的なAIタスクを解く。
私たちはこれを、何十億ものエージェントを持つより大きなNLSOMへの出発点と捉えています。
そして、異種精神の偉大な社会が出現するにつれ、多くの新しい研究課題が人工知能の未来にとって突然最重要になっている。
NLSOMの社会的構造とは何か?
民主的な構造というよりは君主制を持つという利点は何だろうか?
NNエコノミーの原則は、強化学習NLSOMの総報酬を最大化するにはどうすればよいのか?
この作業では、これらの質問のいくつかを識別し、議論し、答えようと試みます。
関連論文リスト
- From Frege to chatGPT: Compositionality in language, cognition, and deep neural networks [0.0]
我々は、哲学、認知科学、神経科学の幅広い読者のために、機械学習による最近の経験的研究をレビューする。
特に,我々は,合成一般化機能を備えたニューラルネットワークを実現するための2つのアプローチを強調した。
これらの発見が人間の認知における構成性の研究にもたらす意味について論じる。
論文 参考訳(メタデータ) (2024-05-24T02:36:07Z) - Sphere Neural-Networks for Rational Reasoning [24.591858077975548]
ベクトルから球面への計算ビルディングブロックの一般化による新しい拡張を提案する。
モデル構築と検査を通して人間のような推論を行うための球ニューラルネット(SphNN)を提案する。
SphNNは、合理性-時間的推論、否定と解離を伴う論理的推論、イベント推論、ニューロシンボリック統一、ユーモア理解など、様々なタイプの推論に進化することができる。
論文 参考訳(メタデータ) (2024-03-22T15:44:59Z) - Brain in a Vat: On Missing Pieces Towards Artificial General
Intelligence in Large Language Models [83.63242931107638]
本稿では,知的エージェントの4つの特徴について述べる。
実世界の物体との活発な関わりは、概念的表現を形成するためのより堅牢な信号をもたらすと我々は主張する。
我々は、人工知能分野における将来的な研究の方向性を概説して結論付ける。
論文 参考訳(メタデータ) (2023-07-07T13:58:16Z) - Understanding Natural Language Understanding Systems. A Critical
Analysis [91.81211519327161]
自然言語理解システム(Natural Language Understanding (NLU) system)としても知られる usguillemotright(英語版) のようなギユモトレフトークを持つ機械の開発は、人工知能の聖杯(英語版) (AI) である。
しかし、Gillemottalking machineguillemotrightを構築することができるという信頼は、次世代のNLUシステムによってもたらされたものよりも強かった。
私たちは新しい時代の夜明けに、ついに砂利が我々に近づいたのか?
論文 参考訳(メタデータ) (2023-03-01T08:32:55Z) - Communication Drives the Emergence of Language Universals in Neural
Agents: Evidence from the Word-order/Case-marking Trade-off [3.631024220680066]
ニューラルエージェント言語学習通信フレームワーク(NeLLCom)を提案する。
我々はエージェントに特定のバイアスをハードコーディングすることなく、新しいフレームワークでトレードオフを複製することに成功しました。
論文 参考訳(メタデータ) (2023-01-30T17:22:33Z) - Neural Theory-of-Mind? On the Limits of Social Intelligence in Large LMs [77.88043871260466]
私たちは、今日の最大の言語モデルのひとつに、このようなソーシャルインテリジェンスを最初から欠いていることを示しています。
我々は、人中心のNLPアプローチは、マインドの神経理論に対してより効果的であるかもしれないと結論づける。
論文 参考訳(メタデータ) (2022-10-24T14:58:58Z) - Human-guided Collaborative Problem Solving: A Natural Language based
Framework [74.27063862727849]
私たちのフレームワークは3つのコンポーネントで構成されています - 自然言語エンジンが言語発話を形式表現と逆変換に解析します。
このフレームワークが、Minecraftベースのブロックワールドドメインにおける協調的なビルディングタスクにおいて、協調的な問題解決の鍵となる課題に対処する能力について説明する。
論文 参考訳(メタデータ) (2022-07-19T21:52:37Z) - Emergence of Machine Language: Towards Symbolic Intelligence with Neural
Networks [73.94290462239061]
本稿では、ニューラルネットワークを用いてシンボルとコネクショナリズムの原理を組み合わせることで、離散表現を導出することを提案する。
対話型環境とタスクを設計することにより、機械が自発的で柔軟でセマンティックな言語を生成できることを実証した。
論文 参考訳(メタデータ) (2022-01-14T14:54:58Z) - SocialAI 0.1: Towards a Benchmark to Stimulate Research on
Socio-Cognitive Abilities in Deep Reinforcement Learning Agents [23.719833581321033]
人間との社会的相互作用に参加できる体型自律エージェントを構築することは、AIの主要な課題の1つです。
現在のアプローチは、非常に単純で非多様な社会状況におけるコミュニケーションツールとして言語に焦点を当てています。
人間レベルのAIを目指すためには、より広範な社会的スキルが必要であると私たちは主張します。
論文 参考訳(メタデータ) (2021-04-27T14:16:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。