論文の概要: Harnessing the Collective Intelligence of AI Agents in the Wild for New Discoveries
- arxiv url: http://arxiv.org/abs/2606.10402v1
- Date: Tue, 09 Jun 2026 04:25:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.320582
- Title: Harnessing the Collective Intelligence of AI Agents in the Wild for New Discoveries
- Title(参考訳): 新たな発見に向けたAIエージェントの集団的知性へのハーネス
- Authors: Federico Bianchi, Yongchan Kwon, Aneesh Pappu, James Zou,
- Abstract要約: EinsteinArenaは、オープンな分散研究と発見のためのエージェントネイティブプラットフォームである。
2026年5月時点で、EinsteinArenaのエージェントは、これまでの人間やAIソリューションよりも、12の最先端の結果を発見した。
- 参考スコア(独自算出の注目度): 35.87396515951979
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scientific discovery is often a collective process: researchers share partial results, inspect failed attempts, and build on each other's ideas over long time horizons. Recent AI systems have shown that language-model-based agents can make meaningful progress on open scientific problems, but most existing systems operate in isolation. In this paper, we present EinsteinArena, an agent-native platform for open distributed research and discovery. EinsteinArena provides agents with a live set of open problems, each with a solid verifier, public leaderboard, and problem-specific discussion forum where agents can ask questions and share insights. We focus on mathematical tasks that have garnered substantial research interest, where progress can be measured unambiguously. As of May 2026, agents on EinsteinArena have discovered 12 new state-of-the-art results better than any previous human or AI solutions. One notable example is the kissing number problem in dimension 11, where the platform improved the best known lower bound from 593 to 604. This advance did not come from a single agent or isolated run. Rather it arose through a sequence of submissions, public discussion, verifier refinement, and subsequent agent-to-agent borrowing of ideas. These results provide evidence that decentralized scientific discovery can emerge from open interaction among autonomous agents in the wild, demonstrating a new paradigm for collective AI-driven research.
- Abstract(参考訳): 研究者は部分的な結果を共有し、失敗した試みを検査し、長い間の地平線上で互いの考えを構築している。
最近のAIシステムでは、言語モデルに基づくエージェントがオープンな科学的問題に有意義な進展をもたらすことが示されているが、既存のシステムのほとんどは独立して運用されている。
本稿では,オープン分散研究・発見のためのエージェントネイティブプラットフォームであるEinsteinArenaを紹介する。
EinsteinArenaは、エージェントに対して、しっかりとした検証、公開リーダボード、問題固有のディスカッションフォーラムを備えた、オープンな問題のライブセットを提供し、エージェントは質問や洞察を共有することができる。
我々は、研究の関心をかなり集めてきた数学的なタスクに焦点を合わせ、進展を不明瞭に測定することができる。
2026年5月時点で、EinsteinArenaのエージェントは、これまでの人間やAIソリューションよりも、12の最先端の結果を発見した。
注目すべき例として、11次元のキス数問題があり、ここではプラットフォームが593から604までの最もよく知られた下界を改善した。
この前進は単一のエージェントや孤立した実行から来なかった。
むしろ、一連の提出、公開討論、検証者の洗練、そしてその後のエージェント・ツー・エージェントによるアイデアの借用によって生じた。
これらの結果は、分散された科学的発見が、野生の自律エージェント間のオープンな相互作用から出現し、AI駆動の研究のための新しいパラダイムを示す証拠となる。
関連論文リスト
- AI Research Agents Narrow Scientific Exploration [12.949322198287417]
我々は、AIと機械学習の引用定義研究領域にまたがって、共有されたシード文献から37,802の科学的アイデアを生成する。
得られたAIのアイデアを、同じ研究分野の人間による論文、同じシード文学から生まれてくる人間研究、そしてシード文学自体と比較する。
全体として、現在のAI研究エージェントは、科学的探索を広げるよりも、局所的な実験に適しているように見える。
論文 参考訳(メタデータ) (2026-05-27T03:26:43Z) - Superminds Test: Actively Evaluating Collective Intelligence of Agent Society via Probing Agents [44.28040661008415]
大規模言語モデルエージェントが数百万の人口に拡大するにつれ、重要な疑問が浮かび上がってくる。
大規模自律エージェント社会において,この問題に対する最初の経験的評価を提示する。
社会は複雑な推論タスクにおいて、個々のフロンティアモデルを上回り、分散情報を滅多に合成せず、さらに簡単な調整タスクを失敗することが多い。
論文 参考訳(メタデータ) (2026-04-24T11:11:36Z) - CORAL: Towards Autonomous Multi-Agent Evolution for Open-Ended Discovery [67.47220507982522]
大規模言語モデル(LLM)ベースの進化は、オープンな発見のための有望なアプローチである。
オープンエンド問題における自律的マルチエージェント進化のための最初のフレームワークであるCORALを紹介する。
コーラルは、厳格な制御を長期にわたるエージェントに置き換え、探索し、反射し、協力する。
論文 参考訳(メタデータ) (2026-04-02T05:59:06Z) - Accelerating Scientific Research with Gemini: Case Studies and Common Techniques [105.15622072347811]
大規模言語モデル(LLM)は、科学研究を加速するための新たな道を開いた。
先進的なAIモデルとどのように協力したかを示すケーススタディのコレクションを提示する。
論文 参考訳(メタデータ) (2026-02-03T18:56:17Z) - The Station: An Open-World Environment for AI-Driven Discovery [14.556758955830796]
ミニチュア科学エコシステムをモデル化するオープンワールドマルチエージェント環境STATIONを紹介する。
ステーションのエージェントは、同僚から論文を読み、仮説を定式化し、コードを提出し、分析を行い、結果を公表するなど、長い科学的な旅をすることができる。
実験によると、ステーションのAIエージェントは、数学から計算生物学、機械学習まで、幅広いベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-11-09T10:13:00Z) - AstaBench: Rigorous Benchmarking of AI Agents with a Scientific Research Suite [75.58737079136942]
本稿では,AstaBenchについて紹介する。AstaBenchは,科学的研究を行うためのエージェント能力の総合的な測定を行うスイートである。
私たちのスイートには、プロダクショングレードの検索ツールを備えた、最初の科学研究環境が付属しています。
22のエージェントクラスで57のエージェントを評価したところ,いくつかの興味深い結果が得られた。
論文 参考訳(メタデータ) (2025-10-24T17:10:26Z) - AgentRxiv: Towards Collaborative Autonomous Research [3.583084119066612]
AgentRxivは、エージェントが研究目標に向けて協力し、研究者が発見を加速できるようにする。
最高のパフォーマンス戦略が他の領域のベンチマークに一般化されることが分かりました。
これらの結果は、自律エージェントが未来のAIシステムを人間と一緒に設計する役割を担っていることを示唆している。
論文 参考訳(メタデータ) (2025-03-23T15:16:42Z) - AIGS: Generating Science from AI-Powered Automated Falsification [17.50867181053229]
本稿では,重要な研究プロセスを代表する役割を担ったマルチエージェントシステムである,フルプロセスAIGSシステムのベビーステップとして,Baby-AIGSを提案する。
3つのタスクの実験では、Baby-AIGSは経験豊富な人間の研究者と同等ではないが、有意義な科学的発見を産み出すことができた。
論文 参考訳(メタデータ) (2024-11-17T13:40:35Z) - Many Heads Are Better Than One: Improved Scientific Idea Generation by A LLM-Based Multi-Agent System [62.832818186789545]
Virtual Scientists (VirSci) は、科学研究に固有のチームワークを模倣するために設計されたマルチエージェントシステムである。
VirSciは研究のアイデアを共同で生成し、評価し、洗練するエージェントのチームを組織している。
このマルチエージェントアプローチは、新しい科学的アイデアを生み出す上で、最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-12T07:16:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。