論文の概要: Dolphin: Moving Towards Closed-loop Auto-research through Thinking, Practice, and Feedback
- arxiv url: http://arxiv.org/abs/2501.03916v3
- Date: Wed, 09 Apr 2025 16:27:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-10 16:25:04.113621
- Title: Dolphin: Moving Towards Closed-loop Auto-research through Thinking, Practice, and Feedback
- Title(参考訳): Dolphin: 思考,実践,フィードバックを通じて,クローズドループのオートリリサーチを目指す
- Authors: Jiakang Yuan, Xiangchao Yan, Shiyang Feng, Bo Zhang, Tao Chen, Botian Shi, Wanli Ouyang, Yu Qiao, Lei Bai, Bowen Zhou,
- Abstract要約: ドルフィンは科学研究の自動化レベルを高めるための枠組みである。
ドルフィンは最初、以前の実験からのフィードバックに基づいて新しいアイデアを生み出した。
Dolphinは各アイデアの結果を自動的に分析し、その結果を次のアイデア生成ラウンドに戻す。
- 参考スコア(独自算出の注目度): 69.57617563853822
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The scientific research paradigm is undergoing a profound transformation owing to the development of Artificial Intelligence (AI). Recent works demonstrate that various AI-assisted research methods can largely improve research efficiency by improving data analysis, accelerating computation, and fostering novel idea generation. To further move towards the ultimate goal (i.e., automatic scientific research), in this paper, we introduce Dolphin, a closed-loop LLM-driven framework to enhance the automation level of scientific research. Dolphin first generates novel ideas based on feedback from previous experiments and relevant papers ranked by the topic and task attributes. Then, the generated ideas can be implemented using a code template refined and debugged with the designed exception-traceback-guided local code structure. Finally, Dolphin automatically analyzes the results of each idea and feeds the results back to the next round of idea generation. Experiments are conducted on the benchmark datasets of different topics and a subset of MLE-bench. Results show that Dolphin can continuously improve the performance of the input topic in a loop. We highlight that Dolphin can automatically propose methods that are comparable to the state-of-the-art in some tasks such as 3D point classification.
- Abstract(参考訳): 科学研究パラダイムは、人工知能(AI)の発展により、大きな変革を遂げている。
近年の研究では、データ分析の改善、計算の高速化、新しいアイデア生成の促進により、AIによる様々な研究手法が研究効率を大幅に改善できることが示されている。
本稿では, 最終目標(すなわち, 自動科学的研究)に向けて, 科学研究の自動化レベルを高めるために, 閉ループLCM駆動のフレームワークであるドルフィンを紹介する。
Dolphinは最初に、以前の実験やトピックやタスク属性によってランク付けされた関連論文からのフィードバックに基づいて、新しいアイデアを生成する。
そして、生成されたアイデアは、設計された例外トレースバック誘導のローカルコード構造で洗練されデバッグされたコードテンプレートを使って実装することができる。
最後に、Dolphinは各アイデアの結果を自動的に分析し、その結果を次のアイデア生成ラウンドに戻す。
異なるトピックのベンチマークデータセットとMLE-benchのサブセットで実験を行う。
その結果、Dolphinはループ内の入力トピックのパフォーマンスを継続的に改善できることがわかった。
我々は,Dolphinが3Dポイント分類などのタスクにおいて,最先端の手法に匹敵する手法を自動提案できることを強調した。
関連論文リスト
- DiSciPLE: Learning Interpretable Programs for Scientific Visual Discovery [61.02102713094486]
優れた意思決定を可能にするため、科学的推論において優れた解釈が重要である。
本稿では,ニューラルネットワークをインターリーブする学習プログラムを用いて,そのような解釈可能な設計モデルを得るための自動手法を提案する。
本稿では,大言語モデル (LLM) の常識と事前知識を活用する進化的アルゴリズムであるDiSciPLEを提案し,視覚データを説明するPythonプログラムを作成する。
論文 参考訳(メタデータ) (2025-02-14T10:26:14Z) - O1 Embedder: Let Retrievers Think Before Action [28.583031173137428]
我々は,対象文書の検索に先立って,入力クエリに有用な思考を生成するO1 Embedderを提案する。
私たちのアプローチは、12の一般的なデータセットで大幅に改善される包括的な実験によって評価されます。
これらの結果は、O1 Embedderの顕著な精度と一般化性を強調し、次世代IR基盤モデルの開発への道を開いた。
論文 参考訳(メタデータ) (2025-02-11T13:48:10Z) - Dolphin: A Programmable Framework for Scalable Neurosymbolic Learning [18.50192747078987]
本稿では,シンボルプログラムの前方連鎖と後方勾配の伝播をベクトル化計算にマッピングすることにより,ニューロシンボリック学習を基本レベルでスケールする枠組みを提案する。
Dolphin氏は、PyTorchのような高性能なディープラーニングフレームワークの上に構築された一連の抽象化とプリミティブを紹介した。
我々はDolphinを、テキスト、画像、ビデオ処理のディープラーニングモデルとシンボリックプログラムを組み合わせた5つのニューロシンボリックタスクの13のベンチマークスイートで評価した。
論文 参考訳(メタデータ) (2024-10-04T12:12:36Z) - ORS: A novel Olive Ridley Survival inspired Meta-heuristic Optimization Algorithm [2.4343652794054487]
オリーブ・リドリー・サバイバル(Olive Ridley Survival、ORS)は、オリーブ・リドリーウミガメのハッチリングが直面する生存課題から着想を得たものである。
ORSには、環境因子によるハッチリングと、その生存に対する運動軌道の影響の2つの主要な段階がある。
このアルゴリズムを検証するために、標準CECテストスイートから14の数学的ベンチマーク関数を評価し、統計的に検証した。
論文 参考訳(メタデータ) (2024-09-13T21:48:05Z) - Recent Advances on Machine Learning for Computational Fluid Dynamics: A Survey [51.87875066383221]
本稿では、基本概念、従来の手法、ベンチマークデータセットを紹介し、CFDを改善する上で機械学習が果たす様々な役割について検討する。
我々は,空気力学,燃焼,大気・海洋科学,生物流体,プラズマ,記号回帰,秩序の低減など,CFDにおけるMLの現実的な応用を強調した。
シミュレーションの精度を向上し、計算時間を短縮し、流体力学のより複雑な解析を可能にすることにより、MLはCFD研究を大きく変革する可能性があるという結論を導いた。
論文 参考訳(メタデータ) (2024-08-22T07:33:11Z) - The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery [14.465756130099091]
本稿では,完全自動科学的発見のための最初の包括的枠組みについて述べる。
我々は、新しい研究アイデアを生成し、コードを書き、実験を実行し、結果を視覚化し、その結果を説明するThe AI Scientistを紹介します。
原則として、このプロセスは、人間の科学コミュニティのように行動しながら、オープンな方法でアイデアを反復的に発展させることができる。
論文 参考訳(メタデータ) (2024-08-12T16:58:11Z) - Autonomous LLM-driven research from data to human-verifiable research papers [0.0]
完全なステップワイズプロセスを通じてインタラクションをガイドする自動化プラットフォームを構築しています。
注釈付きデータのみを提供するモードでは、データペーパーは仮説を立て、計画を立て、分析コードを書き、解釈し、結果を生成し、解釈した。
我々は、トレーサビリティ、透明性、妥当性を高めながら、AIによる科学的発見の加速の可能性を示す。
論文 参考訳(メタデータ) (2024-04-24T23:15:49Z) - DataDreamer: A Tool for Synthetic Data Generation and Reproducible LLM Workflows [72.40917624485822]
我々は、研究者が強力な大規模言語モデルを実装することができるオープンソースのPythonライブラリであるDataDreamerを紹介した。
DataDreamerはまた、オープンサイエンスを促進するために提案するベストプラクティスに研究者が従うのを助ける。
論文 参考訳(メタデータ) (2024-02-16T00:10:26Z) - Dolphins: Multimodal Language Model for Driving [42.14069594700448]
対話型運転支援システムDolphinsを紹介する。
ドルフィンは、ビデオ(または画像)データ、テキスト命令、履歴制御信号からなるマルチモーダル入力を処理するのに適している。
論文 参考訳(メタデータ) (2023-12-01T09:10:33Z) - Novel Applications for VAE-based Anomaly Detection Systems [5.065947993017157]
深層生成モデリング(DGM)は、与えられたデータセットから始まり、新規で見えないデータを生成することができる。
この技術が有望な応用を示すにつれて、多くの倫理的問題がもたらされる。
研究は、異なるバイアスが深層学習モデルに影響を与え、誤った表現のような社会的問題を引き起こすことを示している。
論文 参考訳(メタデータ) (2022-04-26T20:30:37Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z) - Recovering 3D Human Mesh from Monocular Images: A Survey [49.00136388529404]
単眼画像から人間のポーズと形状を推定することは、コンピュータビジョンにおける長年の問題である。
本調査は, 単分子型3次元メッシュ回収の課題に焦点を当てた。
論文 参考訳(メタデータ) (2022-03-03T18:56:08Z) - PlasticineLab: A Soft-Body Manipulation Benchmark with Differentiable
Physics [89.81550748680245]
PasticineLabと呼ばれる新しい微分可能な物理ベンチマークを導入する。
各タスクにおいて、エージェントはマニピュレータを使用して、プラスチックを所望の構成に変形させる。
本稿では,既存の強化学習(RL)手法と勾配に基づく手法について評価する。
論文 参考訳(メタデータ) (2021-04-07T17:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。