論文の概要: NovelSeek: When Agent Becomes the Scientist -- Building Closed-Loop System from Hypothesis to Verification
- arxiv url: http://arxiv.org/abs/2505.16938v2
- Date: Sun, 25 May 2025 02:35:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 14:32:55.643202
- Title: NovelSeek: When Agent Becomes the Scientist -- Building Closed-Loop System from Hypothesis to Verification
- Title(参考訳): NovelSeek: エージェントが科学者になるとき - 仮説から検証まで、クローズドループシステムを構築する
- Authors: NovelSeek Team, Bo Zhang, Shiyang Feng, Xiangchao Yan, Jiakang Yuan, Zhiyin Yu, Xiaohan He, Songtao Huang, Shaowei Hou, Zheng Nie, Zhilong Wang, Jinyao Liu, Runmin Ma, Tianshuo Peng, Peng Ye, Dongzhan Zhou, Shufei Zhang, Xiaosong Wang, Yilan Zhang, Meng Li, Zhongying Tu, Xiangyu Yue, Wangli Ouyang, Bowen Zhou, Lei Bai,
- Abstract要約: NovelSeekは、自律科学研究を行うための統合クローズドループマルチエージェントフレームワークである。
NovelSeekは12の科学研究課題にまたがってその汎用性を実証した。
複数の科学分野において有望な性能向上を達成し、人的努力に比べて大幅にコストを削減した。
- 参考スコア(独自算出の注目度): 24.350656439362123
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artificial Intelligence (AI) is accelerating the transformation of scientific research paradigms, not only enhancing research efficiency but also driving innovation. We introduce NovelSeek, a unified closed-loop multi-agent framework to conduct Autonomous Scientific Research (ASR) across various scientific research fields, enabling researchers to tackle complicated problems in these fields with unprecedented speed and precision. NovelSeek highlights three key advantages: 1) Scalability: NovelSeek has demonstrated its versatility across 12 scientific research tasks, capable of generating innovative ideas to enhance the performance of baseline code. 2) Interactivity: NovelSeek provides an interface for human expert feedback and multi-agent interaction in automated end-to-end processes, allowing for the seamless integration of domain expert knowledge. 3) Efficiency: NovelSeek has achieved promising performance gains in several scientific fields with significantly less time cost compared to human efforts. For instance, in reaction yield prediction, it increased from 27.6% to 35.4% in just 12 hours; in enhancer activity prediction, accuracy rose from 0.65 to 0.79 with only 4 hours of processing; and in 2D semantic segmentation, precision advanced from 78.8% to 81.0% in a mere 30 hours.
- Abstract(参考訳): 人工知能(AI)は科学研究パラダイムの変革を加速し、研究効率を向上するだけでなく、イノベーションを推進している。
我々は,様々な科学分野にまたがって自律科学研究(ASR)を行うための,統一されたクローズドループマルチエージェントフレームワークであるNovellSeekを紹介した。
NovelSeekは3つの大きな利点を強調している。
1) スケーラビリティ: NovelSeekは12の科学研究課題にまたがってその汎用性を実証した。
2) 対話性: NovelSeekは、自動化されたエンドツーエンドプロセスにおける人間の専門家のフィードバックとマルチエージェントのインタラクションのためのインターフェースを提供し、ドメイン専門家の知識をシームレスに統合することを可能にする。
3)効率性:NovellSeekは、いくつかの科学分野で有望なパフォーマンス向上を達成した。
例えば、反応収率予測では、わずか12時間で27.6%から35.4%に増加し、エンハンサー活性予測では、わずか4時間の処理で精度が0.65から0.79に上昇し、2Dセマンティックセグメンテーションでは、わずか30時間で78.8%から81.0%に向上した。
関連論文リスト
- EvolveSearch: An Iterative Self-Evolving Search Agent [98.18686493123785]
大規模言語モデル(LLM)は、検索エンジンやWebブラウザなどのツールを統合することで、エージェント情報検索機能を変革した。
本研究では,SFTとRLを組み合わせた新たな反復的自己進化フレームワークであるEvolveSearchを提案する。
論文 参考訳(メタデータ) (2025-05-28T15:50:48Z) - ScienceBoard: Evaluating Multimodal Autonomous Agents in Realistic Scientific Workflows [82.07367406991678]
大規模言語モデル(LLM)は自然言語処理を超えてその影響を拡大している。
これらのうち、コンピュータ利用エージェントは、人間がしているようにオペレーティングシステムと対話することができる。
我々はScienceBoardを紹介し、ダイナミックで視覚的にリッチな科学ソフトウェアを特徴とする現実的でマルチドメイン環境を包含する。
論文 参考訳(メタデータ) (2025-05-26T12:27:27Z) - WebAgent-R1: Training Web Agents via End-to-End Multi-Turn Reinforcement Learning [37.89715280583421]
WebAgent-R1は、Webエージェントをトレーニングするためのエンドツーエンドのマルチターン強化学習フレームワークである。
WebArena-Liteベンチマークの実験は、WebAgent-R1の有効性を示し、Qwen-2.5-3Bのタスク成功率を6.1%から33.9%に向上させた。
In-depth Analysis revealed the effect of the thinking-based prompting strategy and test-time scaling through increase interaction for web task。
論文 参考訳(メタデータ) (2025-05-22T09:07:43Z) - R&D-Agent: Automating Data-Driven AI Solution Building Through LLM-Powered Automated Research, Development, and Evolution [60.80016554091364]
R&D-Agentは反復探索のための二重エージェントフレームワークである。
Researcherエージェントはパフォーマンスフィードバックを使用してアイデアを生成し、Developerエージェントはエラーフィードバックに基づいてコードを洗練する。
R&D-AgentはMLE-Benchで評価され、最高のパフォーマンスの機械学習エンジニアリングエージェントとして登場した。
論文 参考訳(メタデータ) (2025-05-20T06:07:00Z) - IRIS: Interactive Research Ideation System for Accelerating Scientific Discovery [27.218896203253987]
IRISは、研究者が大規模言語モデル(LLM)を補助する科学的概念を活用するために設計されたオープンソースのプラットフォームである。
IRISは、モンテカルロ木探索(MCTS)による適応的なテスト時間計算拡張、きめ細かいフィードバック機構、クエリベースの文献合成など、アイデアを強化する革新的な機能を備えている。
我々は様々な分野の研究者とユーザスタディを行い、システムの有効性を検証し、アイデアの充実を図っている。
論文 参考訳(メタデータ) (2025-04-23T14:01:36Z) - Completing A Systematic Review in Hours instead of Months with Interactive AI Agents [21.934330935124866]
我々は、大規模な言語モデルを利用した人間中心の対話型AIエージェントInsightAgentを紹介する。
InsightAgentは意味論に基づく大規模な文献コーパスを分割し、より焦点を絞った処理にマルチエージェント設計を採用する。
9人の医療専門家によるユーザスタディでは、可視化と相互作用機構が合成SRの品質を効果的に向上することを示した。
論文 参考訳(メタデータ) (2025-04-21T02:57:23Z) - AgentRxiv: Towards Collaborative Autonomous Research [3.583084119066612]
AgentRxivは、エージェントが研究目標に向けて協力し、研究者が発見を加速できるようにする。
最高のパフォーマンス戦略が他の領域のベンチマークに一般化されることが分かりました。
これらの結果は、自律エージェントが未来のAIシステムを人間と一緒に設計する役割を担っていることを示唆している。
論文 参考訳(メタデータ) (2025-03-23T15:16:42Z) - Collaborative Expert LLMs Guided Multi-Objective Molecular Optimization [51.104444856052204]
我々は,多目的分子最適化のための協調型大規模言語モデル(LLM)システムであるMultiMolを提案する。
6つの多目的最適化タスクに対する評価において、MultiMolは既存の手法を著しく上回り、82.30%の成功率を達成した。
論文 参考訳(メタデータ) (2025-03-05T13:47:55Z) - Towards an AI co-scientist [48.11351101913404]
Gemini 2.0上に構築されたマルチエージェントシステムであるAIコサイシストを紹介する。
このAIの共同科学者は、新しい独創的な知識を解明し、明らかに新しい研究仮説を定式化することを目的としている。
システムの設計には、科学的手法にインスパイアされた仮説生成への生成、議論、進化のアプローチが組み込まれている。
論文 参考訳(メタデータ) (2025-02-26T06:17:13Z) - From Intention To Implementation: Automating Biomedical Research via LLMs [30.32209981487504]
本稿では,バイオメディカル研究プロセス全体を合理化するために設計された,初のエンドツーエンド自動システムであるBioResearcherを紹介する。
複雑なタスクを論理的に関連するサブタスクに分解することで、BioResearcherは多分野要求と論理複雑性の課題を効果的に解決する。
BioResearcherは8つの未測定研究目標に対して平均実行成功率63.07%を達成している。
論文 参考訳(メタデータ) (2024-12-12T16:35:05Z) - AI Expands Scientists' Impact but Contracts Science's Focus [11.634306888037273]
検証された言語モデルを用いて、6つの分野にわたる6790万の研究論文を分析した。
AIツールを採用する科学者は67.37%以上の論文を公開し、3.16倍の引用を受け取り、非ドローンよりも4年早くチームリーダーになる。
論文 参考訳(メタデータ) (2024-12-10T18:24:17Z) - CORE-Bench: Fostering the Credibility of Published Research Through a Computational Reproducibility Agent Benchmark [11.794931453828974]
CORE-Benchは3つの分野(コンピュータ科学、社会科学、医学)にわたる90の科学論文に基づく270のタスクからなるベンチマークである。
エージェントの精度を高速かつ並列に測定する評価システムを提案する。
最高のエージェントは、最も難しいタスクにおいて21%の精度を達成した。
論文 参考訳(メタデータ) (2024-09-17T17:13:19Z) - Tree Search for Language Model Agents [69.43007235771383]
対話型Web環境での探索と多段階計画を行うために,LMエージェントの推論時探索アルゴリズムを提案する。
我々のアプローチは、実環境空間内で機能する最優先木探索の一形態である。
現実的なWebタスクにおいて有効性を示すLMエージェントのための最初の木探索アルゴリズムである。
論文 参考訳(メタデータ) (2024-07-01T17:07:55Z) - DISCOVERYWORLD: A Virtual Environment for Developing and Evaluating Automated Scientific Discovery Agents [49.74065769505137]
本研究では,新しい科学的発見の完全なサイクルを実行するエージェントの能力を開発し,ベンチマークする最初の仮想環境であるDiscoVERYWORLDを紹介する。
8つのトピックにまたがる120の異なる課題タスクが含まれており、3レベルの難易度といくつかのパラメトリックなバリエーションがある。
従来の環境においてよく機能する強力なベースラインエージェントが、ほとんどのdiscoVERYWORLDタスクに苦労していることがわかった。
論文 参考訳(メタデータ) (2024-06-10T20:08:44Z) - BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。
BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。
6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文 参考訳(メタデータ) (2024-05-27T19:57:17Z) - ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language Models [56.08917291606421]
ResearchAgentは、新しい作品のアイデアと運用のためのAIベースのシステムである。
ResearchAgentは、新しい問題を自動で定義し、手法と設計実験を提案し、繰り返し修正する。
我々は、複数の分野にわたる科学論文に関するResearchAgentを実験的に検証した。
論文 参考訳(メタデータ) (2024-04-11T13:36:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。