Fugu-MT 論文翻訳(概要): DeepInnovator: Triggering the Innovative Capabilities of LLMs

論文の概要: DeepInnovator: Triggering the Innovative Capabilities of LLMs

arxiv url: http://arxiv.org/abs/2602.18920v1
Date: Sat, 21 Feb 2026 18:07:18 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-24 17:42:02.39729
Title: DeepInnovator: Triggering the Innovative Capabilities of LLMs
Title（参考訳）: Deep Innovator: LLMの革新的能力の追求
Authors: Tianyu Fan, Fengji Zhang, Yuxiang Zheng, Bei Chen, Xinyao Niu, Chengen Huang, Junyang Lin, Chao Huang,
Abstract要約: DeepInnovatorは、大規模言語モデル(LLM)の革新的な機能を引き出すために設計されたトレーニングフレームワークである。我々は、未ラベルの学術文献の膨大なコーパスから構造化された研究知識を抽出するために、自動データ抽出パイプラインを構築した。本稿では,研究アイデアを連続的に予測し,評価し,改良する反復的なプロセスとして,研究アイデアの生成をモデル化する,次世代のアイデア予測のトレーニングパラダイムを紹介する。
参考スコア（独自算出の注目度）: 41.60038455664918
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The application of Large Language Models (LLMs) in accelerating scientific discovery has garnered increasing attention, with a key focus on constructing research agents endowed with innovative capability, i.e., the ability to autonomously generate novel and significant research ideas. Existing approaches predominantly rely on sophisticated prompt engineering and lack a systematic training paradigm. To address this, we propose DeepInnovator, a training framework designed to trigger the innovative capability of LLMs. Our approach comprises two core components. (1) ``Standing on the shoulders of giants''. We construct an automated data extraction pipeline to extract and organize structured research knowledge from a vast corpus of unlabeled scientific literature. (2) ``Conjectures and refutations''. We introduce a ``Next Idea Prediction'' training paradigm, which models the generation of research ideas as an iterative process of continuously predicting, evaluating, and refining plausible and novel next idea. Both automatic and expert evaluations demonstrate that our DeepInnovator-14B significantly outperforms untrained baselines, achieving win rates of 80.53\%-93.81\%, and attains performance comparable to that of current leading LLMs. This work provides a scalable training pathway toward building research agents with genuine, originative innovative capability, and will open-source the dataset to foster community advancement. Source code and data are available at: https://github.com/HKUDS/DeepInnovator.
Abstract（参考訳）: 科学的発見の加速にLarge Language Models(LLM)の応用が注目され、革新的な能力、すなわち新規で重要な研究アイデアを自律的に生成する能力を備えた研究エージェントの構築に焦点が当てられている。既存のアプローチは主に高度なプロンプトエンジニアリングに依存しており、体系的なトレーニングパラダイムが欠如している。そこで本研究では,LLMの革新的な機能を実現するためのトレーニングフレームワークであるDeepInnovatorを提案する。このアプローチは2つのコアコンポーネントで構成されます。 (1)『巨人の肩に掛かる』我々は、未ラベルの学術文献の膨大なコーパスから構造化された研究知識を抽出し、整理するために、自動データ抽出パイプラインを構築した。 2) ``Conjectures and Refutations''' このパラダイムは、研究のアイデアを連続的に予測し、評価し、精査する反復的なプロセスとしてモデル化するものである。我々のDeepInnovator-14Bは、自動評価と専門家評価の両方で、トレーニングされていないベースラインを著しく上回り、80.53\%-93.81\%の勝利率を達成し、現在のLLMに匹敵するパフォーマンスを達成した。この作業は、真の、起源の革新的な能力を持つ研究エージェントを構築するためのスケーラブルなトレーニングパスを提供し、コミュニティの発展を促進するために、データセットをオープンソース化する。ソースコードとデータは、https://github.com/HKUDS/DeepInnovator.comで入手できる。

関連論文リスト

Step-DeepResearch Technical Report [90.50586290399683]
コスト効率のよいエンドツーエンドエージェントである Step-DeepResearch を紹介する。我々は、計画とレポート作成を強化するために、アトミック能力に基づくデータ合成戦略を提案する。中国における評価ギャップを埋めるため,現実的な深層研究シナリオのためのADR-Benchを構築した。
論文参考訳（メタデータ） (2025-12-23T16:32:27Z)
WebResearcher: Unleashing unbounded reasoning capability in Long-Horizon Agents [72.28593628378991]
WebResearcherは、マルコフ決定プロセスとしてディープリサーチを再構築する反復的なディープリサーチパラダイムである。 WebResearcherは最先端のパフォーマンスを実現し、フロンティアのプロプライエタリシステムを超えています。
論文参考訳（メタデータ） (2025-09-16T17:57:17Z)
SFR-DeepResearch: Towards Effective Reinforcement Learning for Autonomously Reasoning Single Agents [93.26456498576181]
本稿では,ディープリサーチのためのネイティブ自律単エージェントモデルの開発に焦点をあてる。我々の最良の変種であるSFR-DR-20Bは、HumanityのLast Examベンチマークで28.7%に達する。
論文参考訳（メタデータ） (2025-09-08T02:07:09Z)
The Budget AI Researcher and the Power of RAG Chains [4.797627592793464]
研究アイデア生成への現在のアプローチは、しばしばジェネリック・大型言語モデル(LLM)に依存している。私たちのフレームワークであるThe Budget AI Researcherは、検索強化ジェネレーションチェーン、ベクトルデータベース、トピック誘導ペアリングを使用して、数百の機械学習論文の概念を再結合します。このシステムは、機械学習の広大なサブフィールドにまたがる9つの主要なAIカンファレンスから論文を取り込み、それらを階層的なトピックツリーに整理する。
論文参考訳（メタデータ） (2025-06-14T02:40:35Z)
Harnessing Large Language Models for Scientific Novelty Detection [49.10608128661251]
科学的ノベルティ検出(ND)のための大規模言語モデル(LLM)を提案する。そこで本研究では,LLMからアイデアレベルの知識を抽出し,ライトウェイトなレトリバーを訓練することを提案する。実験の結果,提案手法は,アイデア検索やNDタスクのためのベンチマークデータセットにおいて,常に他よりも優れていた。
論文参考訳（メタデータ） (2025-05-30T14:08:13Z)
IRIS: Interactive Research Ideation System for Accelerating Scientific Discovery [27.218896203253987]
IRISは、研究者が大規模言語モデル(LLM)を補助する科学的概念を活用するために設計されたオープンソースのプラットフォームである。 IRISは、モンテカルロ木探索(MCTS)による適応的なテスト時間計算拡張、きめ細かいフィードバック機構、クエリベースの文献合成など、アイデアを強化する革新的な機能を備えている。我々は様々な分野の研究者とユーザスタディを行い、システムの有効性を検証し、アイデアの充実を図っている。
論文参考訳（メタデータ） (2025-04-23T14:01:36Z)
Learning to Generate Research Idea with Dynamic Control [21.30777644522451]
大規模言語モデル (LLM) は仮説や研究のアイデアを生み出すことを約束している。 SFT(Supervised Fine-Tuning)とRL(Reinforcement Learning)を組み合わせた2段階のアプローチによる新しいフレームワークを提案する。本フレームワークは, 新規性, 実現可能性, 有効性の間のトレードオフを動的にナビゲートすることで, 高品質な成果を達成し, 研究アイデアに対するバランスのとれたアプローチを提供する。
論文参考訳（メタデータ） (2024-12-19T08:28:18Z)
SciPIP: An LLM-based Scientific Paper Idea Proposer [30.670219064905677]
SciPIPは,文献検索とアイデア生成の両面での改善を通じて,科学的アイデアの提案を強化するために設計された,革新的なフレームワークである。自然言語処理やコンピュータビジョンなど,さまざまな領域で実施した実験では,SciPIPが革新的で有用なアイデアを多数生成する能力を示した。
論文参考訳（メタデータ） (2024-10-30T16:18:22Z)
Nova: An Iterative Planning and Search Approach to Enhance Novelty and Diversity of LLM Generated Ideas [30.3756058589173]
我々は,大規模言語モデル(LLM)の創造的可能性を高めるために,拡張計画と探索手法を導入する。我々の枠組みは、特に新規性と多様性において、生成したアイデアの質を大幅に高める。本手法は,スイスのトーナメント評価において,170枚のシード論文に基づいて,少なくとも2.5倍以上の上位のアイデアを生成する。
論文参考訳（メタデータ） (2024-10-18T08:04:36Z)
Chain of Ideas: Revolutionizing Research Via Novel Idea Development with LLM Agents [64.64280477958283]
科学文献の急激な増加は、研究者が最近の進歩と意義ある研究方向を見極めるのを困難にしている。大規模言語モデル(LLM)の最近の発展は、新しい研究のアイデアを自動生成するための有望な道のりを示唆している。本研究では, チェーン構造に関連文献を整理し, 研究領域の進展を効果的に反映する, LLMベースのエージェントであるChain-of-Ideas(CoI)エージェントを提案する。
論文参考訳（メタデータ） (2024-10-17T03:26:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。