論文の概要: FlowPIE: Test-Time Scientific Idea Evolution with Flow-Guided Literature Exploration
- arxiv url: http://arxiv.org/abs/2603.29557v1
- Date: Tue, 31 Mar 2026 10:37:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.555482
- Title: FlowPIE: Test-Time Scientific Idea Evolution with Flow-Guided Literature Exploration
- Title(参考訳): FlowPIE: Flow-Guided Literature Explorationによるテストタイム科学的アイデア進化
- Authors: Qiyao Wang, Hongbo Wang, Longze Chen, Zhihao Yang, Guhong Chen, Hamid Alinejad-Rokny, Hui Li, Yuan Lin, Min Yang,
- Abstract要約: FlowPIEは、文献探索とアイデア生成を共同進化のプロセスとして扱う。
FlowPIEは、新規性、実現可能性、多様性のあるアイデアを一貫して生成していることを示す。
- 参考スコア(独自算出の注目度): 27.617408084179246
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scientific idea generation (SIG) is critical to AI-driven autonomous research, yet existing approaches are often constrained by a static retrieval-then-generation paradigm, leading to homogeneous and insufficiently divergent ideas. In this work, we propose FlowPIE, a tightly coupled retrieval-generation framework that treats literature exploration and idea generation as a co-evolving process. FlowPIE expands literature trajectories via a flow-guided Monte Carlo Tree Search (MCTS) inspired by GFlowNets, using the quality of current ideas assessed by an LLM-based generative reward model (GRM) as a supervised signal to guide adaptive retrieval and construct a diverse, high-quality initial population. Based on this population, FlowPIE models idea generation as a test-time idea evolution process, applying selection, crossover, and mutation with the isolation island paradigm and GRM-based fitness computation to incorporate cross-domain knowledge. It effectively mitigates the information cocoons arising from over-reliance on parametric knowledge and static literature. Extensive evaluations demonstrate that FlowPIE consistently produces ideas with higher novelty, feasibility and diversity compared to strong LLM-based and agent-based frameworks, while enabling reward scaling during test time.
- Abstract(参考訳): 科学的なアイデア生成(SIG)はAI駆動の自律的な研究に不可欠であるが、既存のアプローチは静的な検索理論によって制約されることが多く、均質で不十分なアイデアを生み出す。
本研究では,文献探索とアイデア生成を共進化過程として扱う,緊密に結合した検索生成フレームワークであるFlowPIEを提案する。
FlowPIEは、GFlowNetsにインスパイアされたフロー誘導モンテカルロ木探索(MCTS)を通じて、LLMベースの生成報酬モデル(GRM)によって評価される現在のアイデアの質を利用して、適応的検索を誘導し、多様な高品質な初期集団を構築するための教師付き信号として、文学の軌跡を拡張する。
この人口に基づいて、FlowPIEはアイデア生成をテストタイムのアイデア進化プロセスとしてモデル化し、分離島パラダイムとGRMベースのフィットネス計算を用いて選択、クロスオーバー、突然変異を適用し、クロスドメイン知識を組み込む。
パラメトリックな知識と静的な文学に対する過度な信頼から生じる情報コークスを効果的に緩和する。
大規模な評価では、FlowPIEは強力なLCMベースのフレームワークやエージェントベースのフレームワークと比較して、新規性、実現可能性、多様性の高いアイデアを一貫して生成し、テスト期間中に報酬のスケーリングを可能にしている。
関連論文リスト
- OR-Agent: Bridging Evolutionary Search and Structured Research for Automated Algorithm Discovery [10.217363774023033]
OR-Agentは、リッチな実験環境における自動探査のために設計されたマルチエージェントの研究フレームワークである。
本稿では,研究開始点の進化的選択,総合的な研究計画生成,研究ツリー内の協調探索を統一する進化的システム機構を提案する。
我々は古典的最適化ベンチマーク(走行セールスマン、静電容量化車両ルーティング、ビンパッキング、オリエンテーリング、および複数のクナップサック問題を含む)およびシミュレーションに基づく協調運転シナリオを含む実験を行う。
論文 参考訳(メタデータ) (2026-02-14T13:32:03Z) - PACEvolve: Enabling Long-Horizon Progress-Aware Consistent Evolution [64.15555230987222]
PACEvolveはエージェントのコンテキストと検索ダイナミクスを堅牢に管理するように設計されたフレームワークである。
PACEvolveは、一貫性のある長期自己改善のための体系的なパスを提供する。
論文 参考訳(メタデータ) (2026-01-15T18:25:23Z) - PROMISE: Process Reward Models Unlock Test-Time Scaling Laws in Generative Recommendations [52.67948063133533]
生成レコメンデーションは有望なパラダイムとして現れ、階層的なセマンティックIDよりもシーケンス・ツー・シーケンス生成タスクとしてレコメンデーションを改革している。
既存の手法は、セマンティックドリフト(Semantic Drift)と呼ばれる重要な問題に悩まされ、初期、高レベルのトークンのエラーは、生成軌道を無関係な意味部分空間に不可逆的に分散させる。
本稿では,高密度なステップバイステップ検証を生成モデルに統合する新しいフレームワークPromiseを提案する。
論文 参考訳(メタデータ) (2026-01-08T07:38:46Z) - LoongFlow: Directed Evolutionary Search via a Cognitive Plan-Execute-Summarize Paradigm [8.050281821865978]
LoongFlowは、最先端のソリューション品質を実現し、計算コストを大幅に削減するセルフ進化エージェントフレームワークである。
ブレンド」突然変異演算子とは異なり、LoongFlowはLarge Language Modelsを認知的なPlan-Execute-Summarize(PES)パラダイムに統合している。
長期的アーキテクチャコヒーレンスを維持するため、我々はハイブリッド進化記憶システムを組み込んだ。
論文 参考訳(メタデータ) (2025-12-30T08:39:28Z) - Graph Your Way to Inspiration: Integrating Co-Author Graphs with Retrieval-Augmented Generation for Large Language Model Based Scientific Idea Generation [1.2232326171442904]
本稿では,GYWIと呼ばれる科学的アイデア生成システムを提案する。
著者の知識グラフと検索強化世代(RAG)を組み合わせることで、外部知識基盤を形成する。
生成したアイデアは, 新規性, 実現可能性, 明確性, 妥当性, 重要性の5つの側面から評価される。
論文 参考訳(メタデータ) (2025-12-05T03:38:23Z) - STARec: An Efficient Agent Framework for Recommender Systems via Autonomous Deliberate Reasoning [54.28691219536054]
我々は、自律的な熟考的推論機能を備えたレコメンデータシステムを支援する、ゆっくり考えられた拡張エージェントフレームワークSTARecを紹介する。
我々は,先進的推論モデルと嗜好整合型報酬形成から構造化知識の蒸留を組み合わせた2段階のパラダイムであるアンカー強化訓練を開発する。
MovieLens 1MとAmazon CDsベンチマークの実験では、STARecは最先端のベースラインと比較して、大幅なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-08-26T08:47:58Z) - Will Pre-Training Ever End? A First Step Toward Next-Generation Foundation MLLMs via Self-Improving Systematic Cognition [89.50068130832635]
自己改善認知 (SIcog) は、マルチモーダル知識によって次世代のMLLMを構築するための自己学習フレームワークである。
ステップバイステップの視覚的理解のためのChain-of-Descriptionを提案し、詳細なマルチモーダル推論をサポートするために構造化されたChain-of-Thought(CoT)推論を統合する。
実験は、マルチモーダル認知を増強したMLLMの開発におけるSIcogの有効性を示す。
論文 参考訳(メタデータ) (2025-03-16T00:25:13Z) - Flow-based generative models as iterative algorithms in probability space [20.890922389987676]
フローベースの生成モデルは、正確な推定、効率的なサンプリング、決定論的変換を提供する。
本チュートリアルでは,フローベース生成モデルのための直感的な数学的枠組みを提案する。
我々は,信号処理や機械学習にフローベース生成モデルを効果的に適用するために必要なツールを研究者や実践者に提供することを目的としている。
論文 参考訳(メタデータ) (2025-02-19T03:09:18Z) - Learning to Generate Research Idea with Dynamic Control [21.30777644522451]
大規模言語モデル (LLM) は仮説や研究のアイデアを生み出すことを約束している。
SFT(Supervised Fine-Tuning)とRL(Reinforcement Learning)を組み合わせた2段階のアプローチによる新しいフレームワークを提案する。
本フレームワークは, 新規性, 実現可能性, 有効性の間のトレードオフを動的にナビゲートすることで, 高品質な成果を達成し, 研究アイデアに対するバランスのとれたアプローチを提供する。
論文 参考訳(メタデータ) (2024-12-19T08:28:18Z) - Let's reward step by step: Step-Level reward model as the Navigators for
Reasoning [64.27898739929734]
Process-Supervised Reward Model (PRM)は、トレーニングフェーズ中にステップバイステップのフィードバックをLLMに提供する。
LLMの探索経路を最適化するために,PRMからのステップレベルのフィードバックを応用した欲求探索アルゴリズムを提案する。
提案手法の汎用性を探るため,コーディングタスクのステップレベル報酬データセットを自動生成する手法を開発し,コード生成タスクにおける同様の性能向上を観察する。
論文 参考訳(メタデータ) (2023-10-16T05:21:50Z) - Learning to Rank in Generative Retrieval [62.91492903161522]
生成的検索は、検索対象として関連する通路の識別子文字列を生成することを目的としている。
我々はLTRGRと呼ばれる生成検索のための学習 torankフレームワークを提案する。
このフレームワークは、現在の生成的検索システムを強化するために、追加の学習からランクまでのトレーニングフェーズのみを必要とする。
論文 参考訳(メタデータ) (2023-06-27T05:48:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。