論文の概要: Dolphin: Moving Towards Closed-loop Auto-research through Thinking, Practice, and Feedback
- arxiv url: http://arxiv.org/abs/2501.03916v3
- Date: Wed, 09 Apr 2025 16:27:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-10 13:05:07.706757
- Title: Dolphin: Moving Towards Closed-loop Auto-research through Thinking, Practice, and Feedback
- Title(参考訳): Dolphin: 思考,実践,フィードバックを通じて,クローズドループのオートリリサーチを目指す
- Authors: Jiakang Yuan, Xiangchao Yan, Shiyang Feng, Bo Zhang, Tao Chen, Botian Shi, Wanli Ouyang, Yu Qiao, Lei Bai, Bowen Zhou,
- Abstract要約: ドルフィンは科学研究の自動化レベルを高めるための枠組みである。
ドルフィンは最初、以前の実験からのフィードバックに基づいて新しいアイデアを生み出した。
Dolphinは各アイデアの結果を自動的に分析し、その結果を次のアイデア生成ラウンドに戻す。
- 参考スコア(独自算出の注目度): 69.57617563853822
- License:
- Abstract: The scientific research paradigm is undergoing a profound transformation owing to the development of Artificial Intelligence (AI). Recent works demonstrate that various AI-assisted research methods can largely improve research efficiency by improving data analysis, accelerating computation, and fostering novel idea generation. To further move towards the ultimate goal (i.e., automatic scientific research), in this paper, we introduce Dolphin, a closed-loop LLM-driven framework to enhance the automation level of scientific research. Dolphin first generates novel ideas based on feedback from previous experiments and relevant papers ranked by the topic and task attributes. Then, the generated ideas can be implemented using a code template refined and debugged with the designed exception-traceback-guided local code structure. Finally, Dolphin automatically analyzes the results of each idea and feeds the results back to the next round of idea generation. Experiments are conducted on the benchmark datasets of different topics and a subset of MLE-bench. Results show that Dolphin can continuously improve the performance of the input topic in a loop. We highlight that Dolphin can automatically propose methods that are comparable to the state-of-the-art in some tasks such as 3D point classification.
- Abstract(参考訳): 科学研究パラダイムは、人工知能(AI)の発展により、大きな変革を遂げている。
近年の研究では、データ分析の改善、計算の高速化、新しいアイデア生成の促進により、AIによる様々な研究手法が研究効率を大幅に改善できることが示されている。
本稿では, 最終目標(すなわち, 自動科学的研究)に向けて, 科学研究の自動化レベルを高めるために, 閉ループLCM駆動のフレームワークであるドルフィンを紹介する。
Dolphinは最初に、以前の実験やトピックやタスク属性によってランク付けされた関連論文からのフィードバックに基づいて、新しいアイデアを生成する。
そして、生成されたアイデアは、設計された例外トレースバック誘導のローカルコード構造で洗練されデバッグされたコードテンプレートを使って実装することができる。
最後に、Dolphinは各アイデアの結果を自動的に分析し、その結果を次のアイデア生成ラウンドに戻す。
異なるトピックのベンチマークデータセットとMLE-benchのサブセットで実験を行う。
その結果、Dolphinはループ内の入力トピックのパフォーマンスを継続的に改善できることがわかった。
我々は,Dolphinが3Dポイント分類などのタスクにおいて,最先端の手法に匹敵する手法を自動提案できることを強調した。
関連論文リスト
- DiSciPLE: Learning Interpretable Programs for Scientific Visual Discovery [61.02102713094486]
優れた意思決定を可能にするため、科学的推論において優れた解釈が重要である。
本稿では,ニューラルネットワークをインターリーブする学習プログラムを用いて,そのような解釈可能な設計モデルを得るための自動手法を提案する。
本稿では,大言語モデル (LLM) の常識と事前知識を活用する進化的アルゴリズムであるDiSciPLEを提案し,視覚データを説明するPythonプログラムを作成する。
論文 参考訳(メタデータ) (2025-02-14T10:26:14Z) - ORS: A novel Olive Ridley Survival inspired Meta-heuristic Optimization Algorithm [2.4343652794054487]
オリーブ・リドリー・サバイバル(Olive Ridley Survival、ORS)は、オリーブ・リドリーウミガメのハッチリングが直面する生存課題から着想を得たものである。
ORSには、環境因子によるハッチリングと、その生存に対する運動軌道の影響の2つの主要な段階がある。
このアルゴリズムを検証するために、標準CECテストスイートから14の数学的ベンチマーク関数を評価し、統計的に検証した。
論文 参考訳(メタデータ) (2024-09-13T21:48:05Z) - The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery [14.465756130099091]
本稿では,完全自動科学的発見のための最初の包括的枠組みについて述べる。
我々は、新しい研究アイデアを生成し、コードを書き、実験を実行し、結果を視覚化し、その結果を説明するThe AI Scientistを紹介します。
原則として、このプロセスは、人間の科学コミュニティのように行動しながら、オープンな方法でアイデアを反復的に発展させることができる。
論文 参考訳(メタデータ) (2024-08-12T16:58:11Z) - DISCOVERYWORLD: A Virtual Environment for Developing and Evaluating Automated Scientific Discovery Agents [49.74065769505137]
本研究では,新しい科学的発見の完全なサイクルを実行するエージェントの能力を開発し,ベンチマークする最初の仮想環境であるDiscoVERYWORLDを紹介する。
8つのトピックにまたがる120の異なる課題タスクが含まれており、3レベルの難易度といくつかのパラメトリックなバリエーションがある。
従来の環境においてよく機能する強力なベースラインエージェントが、ほとんどのdiscoVERYWORLDタスクに苦労していることがわかった。
論文 参考訳(メタデータ) (2024-06-10T20:08:44Z) - Autonomous LLM-driven research from data to human-verifiable research papers [0.0]
完全なステップワイズプロセスを通じてインタラクションをガイドする自動化プラットフォームを構築しています。
注釈付きデータのみを提供するモードでは、データペーパーは仮説を立て、計画を立て、分析コードを書き、解釈し、結果を生成し、解釈した。
我々は、トレーサビリティ、透明性、妥当性を高めながら、AIによる科学的発見の加速の可能性を示す。
論文 参考訳(メタデータ) (2024-04-24T23:15:49Z) - Dolphins: Multimodal Language Model for Driving [42.14069594700448]
対話型運転支援システムDolphinsを紹介する。
ドルフィンは、ビデオ(または画像)データ、テキスト命令、履歴制御信号からなるマルチモーダル入力を処理するのに適している。
論文 参考訳(メタデータ) (2023-12-01T09:10:33Z) - SciMON: Scientific Inspiration Machines Optimized for Novelty [68.46036589035539]
文献に基づく新たな科学的方向を生成するために,ニューラルランゲージモデルを探索し,拡張する。
モデルが入力背景コンテキストとして使用される新しい設定で、劇的な出発をとっています。
本稿では,過去の科学的論文から「吸入」を抽出するモデリングフレームワークであるSciMONを紹介する。
論文 参考訳(メタデータ) (2023-05-23T17:12:08Z) - Deep Depth Completion: A Survey [26.09557446012222]
我々は、読者が研究動向をよりよく把握し、現在の進歩を明確に理解するのに役立つ総合的な文献レビューを提供する。
ネットワークアーキテクチャ,損失関数,ベンチマークデータセット,学習戦略の設計面から,関連する研究について検討する。
室内および屋外のデータセットを含む,広く使用されている2つのベンチマークデータセットに対して,モデル性能の定量的比較を行った。
論文 参考訳(メタデータ) (2022-05-11T08:24:00Z) - Recovering 3D Human Mesh from Monocular Images: A Survey [49.00136388529404]
単眼画像から人間のポーズと形状を推定することは、コンピュータビジョンにおける長年の問題である。
本調査は, 単分子型3次元メッシュ回収の課題に焦点を当てた。
論文 参考訳(メタデータ) (2022-03-03T18:56:08Z) - RoboTHOR: An Open Simulation-to-Real Embodied AI Platform [56.50243383294621]
インタラクティブで具体化された視覚AIの研究を民主化するためにRoboTHORを導入する。
シミュレーションで訓練されたモデルの性能は,シミュレーションと慎重に構築された物理アナログの両方で試験される場合,大きな差があることが示される。
論文 参考訳(メタデータ) (2020-04-14T20:52:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。