論文の概要: DeepScientist: Advancing Frontier-Pushing Scientific Findings Progressively
- arxiv url: http://arxiv.org/abs/2509.26603v1
- Date: Tue, 30 Sep 2025 17:49:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 17:09:04.648627
- Title: DeepScientist: Advancing Frontier-Pushing Scientific Findings Progressively
- Title(参考訳): DeepScientist:フロンティアプッシュの科学的発見の進歩
- Authors: Yixuan Weng, Minjun Zhu, Qiujie Xie, Qiyao Sun, Zhen Lin, Sifan Liu, Yue Zhang,
- Abstract要約: DeepScientistは、科学的な発見を1ヶ月のタイムラインで行うように設計されたシステムだ。
このシステムは5,000のユニークな科学的アイデアを生み出し、その約1100を実験的に検証した。
この研究は、科学的タスクにおいて人間のSOTAを徐々に上回る発見を達成するためのAIの大規模な証拠として、初めてのものである。
- 参考スコア(独自算出の注目度): 23.839869341008107
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: While previous AI Scientist systems can generate novel findings, they often lack the focus to produce scientifically valuable contributions that address pressing human-defined challenges. We introduce DeepScientist, a system designed to overcome this by conducting goal-oriented, fully autonomous scientific discovery over month-long timelines. It formalizes discovery as a Bayesian Optimization problem, operationalized through a hierarchical evaluation process consisting of "hypothesize, verify, and analyze". Leveraging a cumulative Findings Memory, this loop intelligently balances the exploration of novel hypotheses with exploitation, selectively promoting the most promising findings to higher-fidelity levels of validation. Consuming over 20,000 GPU hours, the system generated about 5,000 unique scientific ideas and experimentally validated approximately 1100 of them, ultimately surpassing human-designed state-of-the-art (SOTA) methods on three frontier AI tasks by 183.7\%, 1.9\%, and 7.9\%. This work provides the first large-scale evidence of an AI achieving discoveries that progressively surpass human SOTA on scientific tasks, producing valuable findings that genuinely push the frontier of scientific discovery. To facilitate further research into this process, we will open-source all experimental logs and system code at https://github.com/ResearAI/DeepScientist/.
- Abstract(参考訳): 従来のAI Scientistシステムは、新しい発見を生み出すことができるが、人間の定義する課題に対処する科学的に価値のあるコントリビューションを生み出すことに焦点を当てていないことが多い。
DeepScientistは、ゴール指向で完全に自律的な科学的発見を1ヶ月のタイムライン上で行うことによって、これを克服するためのシステムだ。
ベイズ最適化問題として発見を形式化し、「仮説化、検証、分析」からなる階層的評価プロセスを通じて運用される。
累積的なFindings Memoryを活用することで、このループは新たな仮説の探索と利用のバランスを保ち、最も有望な発見を高忠実な検証レベルに選択的に促進する。
2万時間を超えるGPU時間と仮定して、約5,000のユニークな科学的アイデアを生成し、その約1100を実験的に検証し、最終的に3つのフロンティアAIタスクに関する人間設計の最先端技術(SOTA)メソッドを183.7\%、1.9\%、および7.9\%に上回った。
この研究は、科学的なタスクにおいて人間のSOTAを徐々に上回る発見をAIが達成し、科学的な発見のフロンティアを真に推し進める貴重な発見を生み出すという、初めての大規模な証拠を提供する。
このプロセスのさらなる研究を促進するため、実験的なログとシステムコードをhttps://github.com/ResearAI/DeepScientist/.comでオープンソース化します。
関連論文リスト
- Virtuous Machines: Towards Artificial General Science [0.0]
ドメインに依存しないエージェント型AIシステムが、科学的なワークフローを独立してナビゲートできることを示します。
このシステムは視覚的作業記憶、精神的な回転、イメージの鮮明さに関する3つの心理学的研究を自律的に設計し実行した。
論文 参考訳(メタデータ) (2025-08-19T00:35:56Z) - Open-ended Scientific Discovery via Bayesian Surprise [63.26412847240136]
AutoDSは、ベイジアン・サプライズを用いた科学探査を駆動する、オープンエンドの科学的発見の方法である。
我々はAutoDSを、生物学、経済学、金融学、行動科学といった21の領域にまたがる実世界のデータセットにまたがるデータ駆動ディスカバリの設定で評価する。
論文 参考訳(メタデータ) (2025-06-30T22:53:59Z) - AI Scientists Fail Without Strong Implementation Capability [33.232300349142285]
人工知能(AI)科学者の出現は、科学的発見のパラダイムシフトを表している。
最近のAI Scientist研究は、独立した科学的発見のための十分な能力を示している。
この大きな進歩にもかかわらず、AI Scientistはコンピュータ科学の分野における画期的な成果をまだ生み出していない。
論文 参考訳(メタデータ) (2025-06-02T06:59:10Z) - Scaling Laws in Scientific Discovery with AI and Robot Scientists [72.3420699173245]
自律的なジェネラリスト科学者(AGS)の概念は、エージェントAIとエンボディロボットを組み合わせて、研究ライフサイクル全体を自動化している。
AGSは科学的発見に必要な時間と資源を大幅に削減することを目指している。
これらの自律的なシステムが研究プロセスにますます統合されるにつれて、科学的な発見が新しいスケーリング法則に従うかもしれないという仮説を立てる。
論文 参考訳(メタデータ) (2025-03-28T14:00:27Z) - Unlocking the Potential of AI Researchers in Scientific Discovery: What Is Missing? [17.606243765807964]
AI4Scienceの総出版物のシェアは2024年の2.72%から2050年までに約20%に増加すると予測している。
これらのジャーナルにおけるAIによる研究の95%近くは、実験科学者が主導している。
我々は、AI研究者を科学的発見の最前線に配置するための構造的かつ戦略的介入を提案する。
論文 参考訳(メタデータ) (2025-03-05T09:29:05Z) - Many Heads Are Better Than One: Improved Scientific Idea Generation by A LLM-Based Multi-Agent System [62.832818186789545]
Virtual Scientists (VirSci) は、科学研究に固有のチームワークを模倣するために設計されたマルチエージェントシステムである。
VirSciは研究のアイデアを共同で生成し、評価し、洗練するエージェントのチームを組織している。
このマルチエージェントアプローチは、新しい科学的アイデアを生み出す上で、最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-12T07:16:22Z) - DeepSpeed4Science Initiative: Enabling Large-Scale Scientific Discovery
through Sophisticated AI System Technologies [116.09762105379241]
DeepSpeed4Scienceは、AIシステム技術革新を通じてユニークな機能を構築することを目指している。
我々は、構造生物学研究における2つの重要なシステム課題に対処するために、DeepSpeed4Scienceで行った初期の進歩を紹介した。
論文 参考訳(メタデータ) (2023-10-06T22:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。