論文の概要: Open-ended Scientific Discovery via Bayesian Surprise
- arxiv url: http://arxiv.org/abs/2507.00310v1
- Date: Mon, 30 Jun 2025 22:53:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:59.050026
- Title: Open-ended Scientific Discovery via Bayesian Surprise
- Title(参考訳): ベイジアンサプライズによるオープンエンド科学発見
- Authors: Dhruv Agarwal, Bodhisattwa Prasad Majumder, Reece Adamson, Megha Chakravorty, Satvika Reddy Gavireddy, Aditya Parashar, Harshit Surana, Bhavana Dalvi Mishra, Andrew McCallum, Ashish Sabharwal, Peter Clark,
- Abstract要約: AutoDSは、ベイジアン・サプライズを用いた科学探査を駆動する、オープンエンドの科学的発見の方法である。
我々はAutoDSを、生物学、経済学、金融学、行動科学といった21の領域にまたがる実世界のデータセットにまたがるデータ駆動ディスカバリの設定で評価する。
- 参考スコア(独自算出の注目度): 63.26412847240136
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The promise of autonomous scientific discovery (ASD) hinges not only on answering questions, but also on knowing which questions to ask. Most recent works in ASD explore the use of large language models (LLMs) in goal-driven settings, relying on human-specified research questions to guide hypothesis generation. However, scientific discovery may be accelerated further by allowing the AI system to drive exploration by its own criteria. The few existing approaches in open-ended ASD select hypotheses based on diversity heuristics or subjective proxies for human interestingness, but the former struggles to meaningfully navigate the typically vast hypothesis space, and the latter suffers from imprecise definitions. This paper presents AutoDS -- a method for open-ended ASD that instead drives scientific exploration using Bayesian surprise. Here, we quantify the epistemic shift from the LLM's prior beliefs about a hypothesis to its posterior beliefs after gathering experimental results. To efficiently explore the space of nested hypotheses, our method employs a Monte Carlo tree search (MCTS) strategy with progressive widening using surprisal as the reward function. We evaluate AutoDS in the setting of data-driven discovery across 21 real-world datasets spanning domains such as biology, economics, finance, and behavioral science. Our results demonstrate that under a fixed budget, AutoDS substantially outperforms competitors by producing 5--29\% more discoveries deemed surprising by the LLM. Our human evaluation further finds that two-thirds of AutoDS discoveries are surprising to the domain experts, suggesting this is an important step forward towards building open-ended ASD systems.
- Abstract(参考訳): 自律的な科学的発見(ASD)の約束は、質問に答えるだけでなく、どの質問に答えるべきかを知ることに集中している。
ASDにおける最近の研究は、仮説生成を導くための人間特有の研究質問に頼って、目標駆動型設定における大規模言語モデル(LLM)の使用を探求している。
しかし、科学的な発見は、AIシステムが独自の基準で探索を促進することによってさらに加速される可能性がある。
オープンエンド ASD における数少ないアプローチは、多様性のヒューリスティックや人間の興味を引く主観的プロキシに基づく仮説を選択するが、前者は典型的に広大な仮説空間を有意義にナビゲートするのに苦労し、後者は不正確な定義に苦しむ。
本稿では,ベイジアン・サプライズを用いた科学探査を駆動するオープンエンドASD手法であるAutoDSを提案する。
ここでは, LLMの仮説に関する以前の信念から, 実験結果の収集後の過去の信念への認識のシフトを定量化する。
ネスト仮説の空間を効率的に探索するために,提案手法はモンテカルロ木探索(MCTS)戦略を用いて,確率を報酬関数としてプログレッシブ展開する。
我々はAutoDSを、生物学、経済学、金融学、行動科学といった21の領域にまたがる実世界のデータセットにまたがるデータ駆動ディスカバリの設定で評価する。
以上の結果から, AutoDS は, 固定予算下では, LLM が予想する5~29 % 以上の発見を生み出すことにより, 競争相手を著しく上回る結果となった。
我々の人間による評価では、AutoDSの発見の3分の2がドメインの専門家にとって驚きであり、これはオープンエンドのSDシステムを構築するための重要な一歩であることを示している。
関連論文リスト
- ResearchBench: Benchmarking LLMs in Scientific Discovery via Inspiration-Based Task Decomposition [67.26124739345332]
大規模言語モデル(LLM)は科学的研究を支援する可能性を示しているが、高品質な研究仮説を発見する能力はいまだ検討されていない。
我々は,LLMを科学的発見のサブタスクのほぼ十分セットで評価するための,最初の大規模ベンチマークを紹介する。
学術論文から重要コンポーネント(研究質問、背景調査、インスピレーション、仮説)を抽出する自動フレームワークを開発する。
論文 参考訳(メタデータ) (2025-03-27T08:09:15Z) - Large Language Models are Zero Shot Hypothesis Proposers [17.612235393984744]
大規模言語モデル(LLM)は、情報障壁を断ち切ることを約束する、グローバルかつ学際的な知識の豊富なものである。
バイオメディカル文献から背景知識と仮説ペアからなるデータセットを構築した。
ゼロショット, 少数ショット, 微調整設定において, 最上位モデルの仮説生成能力を評価する。
論文 参考訳(メタデータ) (2023-11-10T10:03:49Z) - Large Language Models for Automated Open-domain Scientific Hypotheses Discovery [50.40483334131271]
本研究は,社会科学の学術的仮説発見のための最初のデータセットを提案する。
従来のデータセットとは異なり、新しいデータセットには、(1)オープンドメインデータ(RAW Webコーパス)を観察として使用すること、(2)人間性にさらに新しい仮説を提案することが必要である。
パフォーマンス向上のための3つのフィードバック機構を含む,タスクのためのマルチモジュールフレームワークが開発されている。
論文 参考訳(メタデータ) (2023-09-06T05:19:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。