Fugu-MT 論文翻訳(概要): Hypothesis-Driven Deep Research with Large Language Models: A Structured Methodology for Automated Knowledge Discovery

論文の概要: Hypothesis-Driven Deep Research with Large Language Models: A Structured Methodology for Automated Knowledge Discovery

arxiv url: http://arxiv.org/abs/2605.10224v1
Date: Mon, 11 May 2026 09:04:09 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-12 23:28:50.674416
Title: Hypothesis-Driven Deep Research with Large Language Models: A Structured Methodology for Automated Knowledge Discovery
Title（参考訳）: 大規模言語モデルを用いた仮説駆動型深層研究:知識発見の自動化のための構造化手法
Authors: Michael Chin,
Abstract要約: 現在のAIによる研究システムは、仮説を科学的発見の終末産物として扱う、直接的な探索テーマの要約パラダイムを採用している。仮説は、研究プロセス自体を構成する組織的なマッチング手段として、はるかに強力な役割を果たす可能性があります。本稿では,仮説駆動型深層研究(I)パイプライン手法を提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Current AI-powered research systems adopt a direct search-then-summarize paradigm that treats hypotheses as end products of scientific discovery. We argue this leaves a critical gap: hypotheses can serve a far more powerful role as organizational instruments that structure the research process itself. We propose the Hypothesis-Driven Deep Research (HDRI) methodology - the first framework using hypotheses to organize general-purpose deep research across arbitrary domains, rather than merely validating claims within specific domains. This transforms research from reactive information retrieval into proactive, verifiable, and iterative knowledge discovery. HDRI is formalized with six core principles and an eight-stage pipeline. A central innovation is the gap-driven iterative research mechanism - a closed-loop quality assurance system that automatically identifies informational and logical gaps, triggering targeted supplementary investigation. We further introduce a fact reasoning framework with traceable reasoning chains and quantified confidence propagation, a subject locking mechanism to prevent entity confusion, and a multi-dimensional quality assessment scheme. The methodology is realized in the INFOMINER system. Experiments demonstrate improvements of 22.4% in fact density, 90% subject matching accuracy, 0.92 multi-source verification confidence, and 14% completeness gain from gap-driven supplementation. Five case studies validate its practical applicability, achieving an average quality rating of 4.46/5.0.
Abstract（参考訳）: 現在のAIによる研究システムは、仮説を科学的発見の終末産物として扱う、直接的な探索テーマの要約パラダイムを採用している。仮説は研究プロセス自体を構成する組織機器として、はるかに強力な役割を果たす可能性がある。仮説駆動型ディープリサーチ(HDRI)手法は,特定のドメイン内のクレームを単に検証するのではなく,任意のドメインにまたがる汎用ディープリサーチを組織化するための仮説を用いた最初のフレームワークである。これは、反応性情報検索から、積極的な、検証可能な、反復的な知識発見へと研究を変換する。 HDRIは6つのコア原則と8ステージパイプラインで形式化されている。情報的および論理的ギャップを自動的に識別するクローズドループ品質保証システムで、目標とする補足的な調査を引き起こす。さらに、トレース可能な推論チェーンと定量化された信頼度伝播を備えた事実推論フレームワーク、エンティティの混乱を防止する主観的ロック機構、多次元品質評価手法を導入する。この手法はINFOMINERシステムで実現されている。実験では、22.4%の事実密度、90%の被験者マッチング精度、0.92のマルチソース信頼性、ギャップ駆動補充による14%の完全性向上が示されている。 5つのケーススタディは、その実用性を評価し、4.46/5.0の平均品質評価を達成している。

関連論文リスト

SciResearcher: Scaling Deep Research Agents for Frontier Scientific Reasoning [54.194672921128785]
我々は、フロンティア科学データ構築のための完全に自動化されたエージェントフレームワークであるSciResearcherを紹介する。 SciResearcherは、学術的証拠に基づく様々な概念的および計算的なタスクを合成する。我々は,HLE-Bio/Chem-Goldベンチマークで19.46%を達成できるエージェント基盤モデルであるSciResearcher-8Bを開発した。
論文参考訳（メタデータ） (2026-05-02T15:26:45Z)
AutoResearchBench: Benchmarking AI Agents on Complex Scientific Literature Discovery [55.70879973230979]
AutoResearchBenchは、自律的な科学文献発見のためのベンチマークである。エージェントWebブラウジングに関する以前のベンチマークと比較すると、AutoResearchBenchは研究指向である。最も強力なLCMでさえ、BrowseCompのような一般的なエージェントによるWebブラウジングベンチマークをほとんど征服したにもかかわらず、Deep Researchでは9.39%、Wide Researchでは9.31%の精度しか達成していない。
論文参考訳（メタデータ） (2026-04-28T06:05:17Z)
Agentic Discovery with Active Hypothesis Exploration for Visual Recognition [22.895961870906405]
hypoExploreは、仮説駆動の科学的調査として視覚認識のためのニューラルネットワーク発見を定式化している。新しい仮説は、二重戦略によって導かれる、構築する親仮説を選択することで、大きな言語モデルを用いて作成される。仮説の信頼性スコアは証拠が蓄積するにつれてますます予測的になり、学習された原理が独立した進化の系統間で伝達されることを示す。
論文参考訳（メタデータ） (2026-04-14T17:34:05Z)
Seeing as Experts Do: A Knowledge-Augmented Agent for Open-Set Fine-Grained Visual Understanding [30.498502211349386]
KFRA(Knowledge-Augmented Fine-Grained Reasoning Agent)について紹介する。 KFRAは、専門家分析をエミュレートする3段階のクローズド推論ループを通している。まずオープン語彙の検出とWebスケールの検索を行い、カテゴリ仮説を生成する。その後、テキスト知識を視覚的証拠と整合させることにより、識別領域のローカライゼーションを行う。
論文参考訳（メタデータ） (2026-03-04T06:18:45Z)
Understanding DeepResearch via Reports [41.60038455664918]
DeepResearchは、高度な推論とマルチツール統合を通じて専門家レベルの研究を行う、変革的なAIパラダイムである。これらのシステムを評価することは、オープンな研究シナリオと、独立した機能に焦点を当てた既存のベンチマークのため、依然として極めて難しい。 DeepResearch-ReportEvalは、DeepResearchシステムを最も代表的なアウトプットで評価するための総合的なフレームワークである。
論文参考訳（メタデータ） (2025-10-09T07:03:43Z)
Hypothesis Hunting with Evolving Networks of Autonomous Scientific Agents [52.50038914857797]
この過程を仮説探索と呼び、膨大な複雑な仮説空間を横断する持続的な探索を通して洞察を累積的に探索する。本稿では、エージェント、ネットワーク、評価規範の相互作用としてフレームワークモデリングディスカバリであるAScienceを紹介し、ASCollabとして実装する。実験により、このような社会的ダイナミクスは、多様性-品質-ノーベルティフロンティアに沿った専門家評価結果の蓄積を可能にすることが示された。
論文参考訳（メタデータ） (2025-10-08T08:47:07Z)
Bayes-Entropy Collaborative Driven Agents for Research Hypotheses Generation and Optimization [4.469102316542763]
本稿では,HypoAgentsと呼ばれるマルチエージェント協調フレームワークを提案する。多様性のサンプリングを通じて仮説を生成し、事前の信念を確立する。その後、外部文献の証拠収集にRAG(erieval-augmented generation)を採用している。情報エントロピー$H = - sum p_ilog p_i$ を用いて高不確かさ仮説を特定し、それらを積極的に洗練する。
論文参考訳（メタデータ） (2025-08-03T13:05:32Z)
AI4Research: A Survey of Artificial Intelligence for Scientific Research [55.5452803680643]
我々はAI for Research(AI4Research)に関する総合的な調査を行う。まず、AI4Researchの5つの主要なタスクを分類する系統分類を導入する。主要な研究ギャップを特定し、将来有望な方向性を明らかにする。
論文参考訳（メタデータ） (2025-07-02T17:19:20Z)
Open-ended Scientific Discovery via Bayesian Surprise [63.26412847240136]
AutoDSは、ベイジアン・サプライズを用いた科学探査を駆動する、オープンエンドの科学的発見の方法である。我々はAutoDSを、生物学、経済学、金融学、行動科学といった21の領域にまたがる実世界のデータセットにまたがるデータ駆動ディスカバリの設定で評価する。
論文参考訳（メタデータ） (2025-06-30T22:53:59Z)
PiFlow: Principle-aware Scientific Discovery with Multi-Agent Collaboration [9.216546947535244]
自動科学的発見のための情報理論フレームワークPiFlowを紹介する。提案手法は,曲線下面積の73.55%増加を反映して,発見効率を著しく向上させる。全体として、PiFlowはPlug-and-Playメソッドとして機能し、高度に効率的な自動科学的発見における新しいパラダイムシフトを確立する。
論文参考訳（メタデータ） (2025-05-21T03:09:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。