論文の概要: TusoAI: Agentic Optimization for Scientific Methods
- arxiv url: http://arxiv.org/abs/2509.23986v1
- Date: Sun, 28 Sep 2025 17:30:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.572192
- Title: TusoAI: Agentic Optimization for Scientific Methods
- Title(参考訳): TusoAI: 科学的手法のエージェント最適化
- Authors: Alistair Turcan, Kexin Huang, Lei Li, Martin Jinye Zhang,
- Abstract要約: 大規模言語モデル(LLM)は、文学の合成、経験的データによる推論、ドメイン固有コードの生成において強力な能力を示している。
本稿では,評価機能を備えた科学的タスク記述を行うエージェントAIシステムであるTusoAIを紹介する。
TusoAIはドメイン知識を知識ツリー表現に統合し、反復的でドメイン固有の最適化とモデル診断を行う。
- 参考スコア(独自算出の注目度): 16.268579802762247
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scientific discovery is often slowed by the manual development of computational tools needed to analyze complex experimental data. Building such tools is costly and time-consuming because scientists must iteratively review literature, test modeling and scientific assumptions against empirical data, and implement these insights into efficient software. Large language models (LLMs) have demonstrated strong capabilities in synthesizing literature, reasoning with empirical data, and generating domain-specific code, offering new opportunities to accelerate computational method development. Existing LLM-based systems either focus on performing scientific analyses using existing computational methods or on developing computational methods or models for general machine learning without effectively integrating the often unstructured knowledge specific to scientific domains. Here, we introduce TusoAI , an agentic AI system that takes a scientific task description with an evaluation function and autonomously develops and optimizes computational methods for the application. TusoAI integrates domain knowledge into a knowledge tree representation and performs iterative, domain-specific optimization and model diagnosis, improving performance over a pool of candidate solutions. We conducted comprehensive benchmark evaluations demonstrating that TusoAI outperforms state-of-the-art expert methods, MLE agents, and scientific AI agents across diverse tasks, such as single-cell RNA-seq data denoising and satellite-based earth monitoring. Applying TusoAI to two key open problems in genetics improved existing computational methods and uncovered novel biology, including 9 new associations between autoimmune diseases and T cell subtypes and 7 previously unreported links between disease variants linked to their target genes. Our code is publicly available at https://github.com/Alistair-Turcan/TusoAI.
- Abstract(参考訳): 科学的な発見は、複雑な実験データを分析するのに必要な計算ツールのマニュアル開発によってしばしば遅くなる。
科学者は、文献、テストモデリング、経験的データに対する科学的仮定を反復的にレビューし、これらの洞察を効率的なソフトウェアに実装する必要がある。
大規模言語モデル(LLM)は、文学の合成、経験的データによる推論、ドメイン固有コードの生成において強力な能力を示し、計算手法の開発を加速する新たな機会を提供している。
既存のLLMベースのシステムは、既存の計算手法を使った科学分析や、科学領域に特有のしばしば構造化されていない知識を効果的に統合することなく、一般的な機械学習のための計算方法やモデルの開発に焦点をあてている。
本稿では,評価関数を用いて科学的タスク記述を行い,アプリケーションのための計算手法を自律的に開発・最適化するエージェントAIシステムであるTusoAIを紹介する。
TusoAIは、ドメイン知識を知識ツリー表現に統合し、反復的でドメイン固有の最適化とモデル診断を実行し、候補とするソリューションのプールのパフォーマンスを改善します。
我々は、TusoAIが、シングルセルRNA-seqデータデノナイズや衛星ベースの地球モニタリングなど、さまざまなタスクにおいて、最先端の専門家メソッド、MLEエージェント、科学AIエージェントより優れていることを示す総合的なベンチマーク評価を行った。
T細胞サブタイプと自己免疫疾患の9つの新たな関連や、対象遺伝子に関連づけられた疾患の亜型と7つの未報告のリンクを含む、既存の計算方法の改善と新しい生物学の発見を含む、遺伝学における2つの重要なオープンな問題にTusoAIを適用した。
私たちのコードはhttps://github.com/Alistair-Turcan/TusoAI.comで公開されています。
関連論文リスト
- An AI system to help scientists write expert-level empirical software [25.01900335784437]
品質基準を最大化するために,専門家レベルの科学ソフトウェアを作成するAIシステムを提案する。
このシステムは、外部ソースから複雑な研究アイデアを探求し、統合する際に、専門家レベルの結果を得る。
バイオインフォマティクスでは、公共のリーダーボード上で人間が開発した最上位の手法よりも優れた、40の新しい単一セルデータ解析法が発見された。
疫学では、新型コロナウイルス(COVID-19)の入院を予測するためのCDCアンサンブルやその他の全ての個人モデルを上回る14のモデルを作成した。
論文 参考訳(メタデータ) (2025-09-08T10:08:36Z) - A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers [221.34650992288505]
科学大規模言語モデル(Sci-LLMs)は、科学研究において、知識の表現、統合、適用の方法を変えつつある。
この調査は、モデルとその基盤となるデータ基板の共進化として、Sci-LLMの開発を再考する。
我々は、科学的データの統一された分類法と、科学的知識の階層的なモデルを定式化する。
論文 参考訳(メタデータ) (2025-08-28T18:30:52Z) - Operationalizing Serendipity: Multi-Agent AI Workflows for Enhanced Materials Characterization with Theory-in-the-Loop [0.0]
SciLinkは、材料研究におけるセレンディピティーを運用するために設計された、オープンソースのマルチエージェント人工知能フレームワークである。
実験観察、新規性評価、理論シミュレーションの直接的な自動リンクを生成する。
本稿では,原子分解能およびハイパースペクトルデータへの応用,リアルタイムな人間専門家指導の統合能力,研究ループを閉じる能力について述べる。
論文 参考訳(メタデータ) (2025-08-07T04:59:17Z) - PyTDC: A multimodal machine learning training, evaluation, and inference platform for biomedical foundation models [59.17570021208177]
PyTDCは、マルチモーダルな生物学的AIモデルのための合理化されたトレーニング、評価、推論ソフトウェアを提供する機械学習プラットフォームである。
本稿では、PyTDCのアーキテクチャの構成要素と、我々の知る限り、導入したシングルセルドラッグターゲットMLタスクにおける第一種ケーススタディについて論じる。
論文 参考訳(メタデータ) (2025-05-08T18:15:38Z) - MLGym: A New Framework and Benchmark for Advancing AI Research Agents [51.9387884953294]
我々はMeta MLGymとMLGym-Benchを紹介した。これはAI研究タスクにおける大規模言語モデルの評価と開発のための新しいフレームワークとベンチマークである。
これは機械学習(ML)タスクのための最初のGym環境であり、そのようなエージェントをトレーニングするための強化学習(RL)アルゴリズムの研究を可能にする。
我々は、Claude-3.5-Sonnet、Llama-3.1 405B、GPT-4o、o1-preview、Gemini-1.5 Proなどのベンチマークで、多くのフロンティア大言語モデル(LLM)を評価した。
論文 参考訳(メタデータ) (2025-02-20T12:28:23Z) - STRICTA: Structured Reasoning in Critical Text Assessment for Peer Review and Beyond [68.47402386668846]
本研究では,テキストアセスメントをステップワイド推論プロセスとしてモデル化するために,Structured Reasoning In Critical Text Assessment (STRICTA)を導入する。
STRICTAは、因果性理論に基づく相互接続推論ステップのグラフに評価を分解する。
約40人のバイオメディカル専門家が20以上の論文について4000以上の推論ステップのデータセットにSTRICTAを適用した。
論文 参考訳(メタデータ) (2024-09-09T06:55:37Z) - EndToEndML: An Open-Source End-to-End Pipeline for Machine Learning Applications [0.2826977330147589]
機械学習モデルの事前処理、トレーニング、評価、可視化が可能なWebベースのエンドツーエンドパイプラインを提案する。
本ライブラリは,マルチモーダル・マルチセンサ・データセットの認識,分類,クラスタリング,および予測を支援する。
論文 参考訳(メタデータ) (2024-03-27T02:24:38Z) - PETScML: Second-order solvers for training regression problems in Scientific Machine Learning [0.22499166814992438]
近年、分析のためのデータ駆動ツールとして、科学機械学習の出現を目撃している。
我々は、ディープラーニングソフトウェアと従来の機械学習技術とのギャップを埋めるために、Portable and Extensible Toolkit for Scientific計算上に構築されたソフトウェアを紹介します。
論文 参考訳(メタデータ) (2024-03-18T18:59:42Z) - ChemMiner: A Large Language Model Agent System for Chemical Literature Data Mining [56.15126714863963]
ChemMinerは、文学から化学データを抽出するエンドツーエンドのフレームワークである。
ChemMinerには、コア参照マッピングのためのテキスト分析エージェント、非テキスト情報抽出のためのマルチモーダルエージェント、データ生成のための合成分析エージェントの3つの特殊エージェントが組み込まれている。
実験の結果,ヒト化学者に匹敵する反応同定率を示すとともに,高い精度,リコール,F1スコアで処理時間を著しく短縮した。
論文 参考訳(メタデータ) (2024-02-20T13:21:46Z) - Simulation Intelligence: Towards a New Generation of Scientific Methods [81.75565391122751]
シミュレーション知能の9つのモチーフ」は、科学計算、科学シミュレーション、人工知能の融合に必要な重要なアルゴリズムの開発と統合のためのロードマップである。
シミュレーションインテリジェンスのモチーフは、オペレーティングシステムのレイヤ内のコンポーネントとよく似ています。
我々は、モチーフ間の協調的な努力が科学的な発見を加速する大きな機会をもたらすと信じている。
論文 参考訳(メタデータ) (2021-12-06T18:45:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。