Fugu-MT 論文翻訳(概要): Open-ended Scientific Discovery via Bayesian Surprise

論文の概要: Open-ended Scientific Discovery via Bayesian Surprise

arxiv url: http://arxiv.org/abs/2507.00310v1
Date: Mon, 30 Jun 2025 22:53:59 GMT
ステータス: 翻訳完了
システム内更新日: 2025-07-03 14:22:59.050026
Title: Open-ended Scientific Discovery via Bayesian Surprise
Title（参考訳）: ベイジアンサプライズによるオープンエンド科学発見
Authors: Dhruv Agarwal, Bodhisattwa Prasad Majumder, Reece Adamson, Megha Chakravorty, Satvika Reddy Gavireddy, Aditya Parashar, Harshit Surana, Bhavana Dalvi Mishra, Andrew McCallum, Ashish Sabharwal, Peter Clark,
Abstract要約: AutoDSは、ベイジアン・サプライズを用いた科学探査を駆動する、オープンエンドの科学的発見の方法である。我々はAutoDSを、生物学、経済学、金融学、行動科学といった21の領域にまたがる実世界のデータセットにまたがるデータ駆動ディスカバリの設定で評価する。
参考スコア（独自算出の注目度）: 63.26412847240136
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The promise of autonomous scientific discovery (ASD) hinges not only on answering questions, but also on knowing which questions to ask. Most recent works in ASD explore the use of large language models (LLMs) in goal-driven settings, relying on human-specified research questions to guide hypothesis generation. However, scientific discovery may be accelerated further by allowing the AI system to drive exploration by its own criteria. The few existing approaches in open-ended ASD select hypotheses based on diversity heuristics or subjective proxies for human interestingness, but the former struggles to meaningfully navigate the typically vast hypothesis space, and the latter suffers from imprecise definitions. This paper presents AutoDS -- a method for open-ended ASD that instead drives scientific exploration using Bayesian surprise. Here, we quantify the epistemic shift from the LLM's prior beliefs about a hypothesis to its posterior beliefs after gathering experimental results. To efficiently explore the space of nested hypotheses, our method employs a Monte Carlo tree search (MCTS) strategy with progressive widening using surprisal as the reward function. We evaluate AutoDS in the setting of data-driven discovery across 21 real-world datasets spanning domains such as biology, economics, finance, and behavioral science. Our results demonstrate that under a fixed budget, AutoDS substantially outperforms competitors by producing 5--29\% more discoveries deemed surprising by the LLM. Our human evaluation further finds that two-thirds of AutoDS discoveries are surprising to the domain experts, suggesting this is an important step forward towards building open-ended ASD systems.
Abstract（参考訳）: 自律的な科学的発見(ASD)の約束は、質問に答えるだけでなく、どの質問に答えるべきかを知ることに集中している。 ASDにおける最近の研究は、仮説生成を導くための人間特有の研究質問に頼って、目標駆動型設定における大規模言語モデル(LLM)の使用を探求している。しかし、科学的な発見は、AIシステムが独自の基準で探索を促進することによってさらに加速される可能性がある。オープンエンド ASD における数少ないアプローチは、多様性のヒューリスティックや人間の興味を引く主観的プロキシに基づく仮説を選択するが、前者は典型的に広大な仮説空間を有意義にナビゲートするのに苦労し、後者は不正確な定義に苦しむ。本稿では,ベイジアン・サプライズを用いた科学探査を駆動するオープンエンドASD手法であるAutoDSを提案する。ここでは, LLMの仮説に関する以前の信念から, 実験結果の収集後の過去の信念への認識のシフトを定量化する。ネスト仮説の空間を効率的に探索するために,提案手法はモンテカルロ木探索(MCTS)戦略を用いて,確率を報酬関数としてプログレッシブ展開する。我々はAutoDSを、生物学、経済学、金融学、行動科学といった21の領域にまたがる実世界のデータセットにまたがるデータ駆動ディスカバリの設定で評価する。以上の結果から, AutoDS は, 固定予算下では, LLM が予想する5～29 % 以上の発見を生み出すことにより, 競争相手を著しく上回る結果となった。我々の人間による評価では、AutoDSの発見の3分の2がドメインの専門家にとって驚きであり、これはオープンエンドのSDシステムを構築するための重要な一歩であることを示している。

関連論文リスト

HypoChainer: A Collaborative System Combining LLMs and Knowledge Graphs for Hypothesis-Driven Scientific Discovery [4.020865072189471]
人間の専門知識、知識グラフ、推論を統合した可視化フレームワークであるPhyChainerを提案する。 hypoChainerは3つの段階で機能する: 第一、探索、文脈化 -- 専門家は検索強化LLM(RAG)と次元縮小を使用する。第2に、仮説連鎖の形成 -- 専門家は予測と意味論的に関連付けられたエンティティに関するKG関係を反復的に検討する。第三に、検証の優先順位付け -- 洗練された仮説は、KGが支持する証拠に基づいてフィルタリングされ、実験のための優先度の高い候補を特定する。
論文参考訳（メタデータ） (2025-07-23T05:02:54Z)
MOOSE-Chem2: Exploring LLM Limits in Fine-Grained Scientific Hypothesis Discovery via Hierarchical Search [93.64235254640967]
大規模言語モデル (LLM) は科学的仮説生成の自動化において有望であることを示している。詳細な科学的仮説発見の新たな課題を定めている。本稿では,仮説に詳細を漸進的に提案・統合する階層探索手法を提案する。
論文参考訳（メタデータ） (2025-05-25T16:13:46Z)
IRIS: Interactive Research Ideation System for Accelerating Scientific Discovery [27.218896203253987]
IRISは、研究者が大規模言語モデル(LLM)を補助する科学的概念を活用するために設計されたオープンソースのプラットフォームである。 IRISは、モンテカルロ木探索(MCTS)による適応的なテスト時間計算拡張、きめ細かいフィードバック機構、クエリベースの文献合成など、アイデアを強化する革新的な機能を備えている。我々は様々な分野の研究者とユーザスタディを行い、システムの有効性を検証し、アイデアの充実を図っている。
論文参考訳（メタデータ） (2025-04-23T14:01:36Z)
ResearchBench: Benchmarking LLMs in Scientific Discovery via Inspiration-Based Task Decomposition [67.26124739345332]
大規模言語モデル(LLM)は科学的研究を支援する可能性を示しているが、高品質な研究仮説を発見する能力はいまだ検討されていない。我々は,LLMを科学的発見のサブタスクのほぼ十分セットで評価するための,最初の大規模ベンチマークを紹介する。学術論文から重要コンポーネント(研究質問、背景調査、インスピレーション、仮説)を抽出する自動フレームワークを開発する。
論文参考訳（メタデータ） (2025-03-27T08:09:15Z)
CodeScientist: End-to-End Semi-Automated Scientific Discovery with Code-based Experimentation [48.12054700748627]
CodeScientistは、遺伝的検索の形式として、アイデアと実験を共同で行う新しいASDシステムである。我々はこのパラダイムを用いて、エージェントと仮想環境の領域において、機械生成のアイデアを幅広く数百もの自動実験する。
論文参考訳（メタデータ） (2025-03-20T22:37:17Z)
Can Large Language Models Help Experimental Design for Causal Discovery? [94.66802142727883]
Large Language Model Guided Intervention Targeting (LeGIT) は、LLMを効果的に組み込んだ堅牢なフレームワークであり、因果発見のための介入のための既存の数値的アプローチを強化する。 LeGITは、既存の方法よりも大幅な改善と堅牢性を示し、人間を超越している。
論文参考訳（メタデータ） (2025-03-03T03:43:05Z)
Large Language Models are Zero Shot Hypothesis Proposers [17.612235393984744]
大規模言語モデル(LLM)は、情報障壁を断ち切ることを約束する、グローバルかつ学際的な知識の豊富なものである。バイオメディカル文献から背景知識と仮説ペアからなるデータセットを構築した。ゼロショット, 少数ショット, 微調整設定において, 最上位モデルの仮説生成能力を評価する。
論文参考訳（メタデータ） (2023-11-10T10:03:49Z)
Large Language Models for Automated Open-domain Scientific Hypotheses Discovery [50.40483334131271]
本研究は,社会科学の学術的仮説発見のための最初のデータセットを提案する。従来のデータセットとは異なり、新しいデータセットには、(1)オープンドメインデータ(RAW Webコーパス)を観察として使用すること、(2)人間性にさらに新しい仮説を提案することが必要である。パフォーマンス向上のための3つのフィードバック機構を含む,タスクのためのマルチモジュールフレームワークが開発されている。
論文参考訳（メタデータ） (2023-09-06T05:19:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。