論文の概要: CVEvolve: Autonomous Algorithm Discovery for Unstructured Scientific Data Processing
- arxiv url: http://arxiv.org/abs/2605.11359v1
- Date: Tue, 12 May 2026 00:24:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.490869
- Title: CVEvolve: Autonomous Algorithm Discovery for Unstructured Scientific Data Processing
- Title(参考訳): CVEvolve: 構造化されていない科学データ処理のための自動アルゴリズムディスカバリ
- Authors: Ming Du, Xiangyu Yin, Yanqi Luo, Dishant Beniwal, Songyuan Tang, Hemant Sharma, Mathew J. Cherukara,
- Abstract要約: CVEvolveは、科学データ処理アルゴリズム発見のためのゼロコードインタフェースを備えた自律エージェントハーネスである。
我々は、X線蛍光画像登録、ブラッグピーク検出、高エネルギー回折顕微鏡画像分割についてCVEvolveを実証した。
- 参考スコア(独自算出の注目度): 3.688332891975275
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scientific data processing often requires task-specific algorithms or AI models, creating a barrier for domain scientists who need to analyze their data but may not have extensive computing or image-processing expertise. This barrier is especially pronounced when data are noisy, have a high dynamic range, are sparsely labeled, or are only loosely specified. We introduce CVEvolve, an autonomous agentic harness with a zero-code interface for scientific data-processing algorithm discovery. CVEvolve combines a multi-round search strategy with tools for code execution, evaluation implementation, history management, holdout testing, and optional inspection of scientific data and visual outputs. The search alternates between discovery and improvement actions, and uses lineage-aware stochastic candidate sampling to balance exploration and exploitation. We demonstrate CVEvolve on x-ray fluorescence microscopy image registration, Bragg peak detection, and high-energy diffraction microscopy image segmentation. Across these tasks, CVEvolve discovers algorithms that improve over baseline methods, while holdout test tracking helps identify candidates that generalize better than later over-optimized alternatives. These results show that zero-code, autonomous LLM-powered algorithm development can help domain scientists turn unstructured scientific image data into practical algorithms and downstream scientific discoveries.
- Abstract(参考訳): 科学データ処理は、しばしばタスク固有のアルゴリズムやAIモデルを必要とし、データを分析する必要があるが、広範なコンピューティングや画像処理の専門知識を持たないドメイン科学者にとって障壁となる。
この障壁は、データが騒々しく、高いダイナミックレンジを持ち、わずかにラベル付けされているか、緩やかに指定されている場合に特に顕著である。
我々は、科学データ処理アルゴリズム発見のためのゼロコードインタフェースを備えた自律型エージェントハーネスであるCVEvolveを紹介する。
CVEvolveは、多ラウンド検索戦略と、コード実行、評価実装、履歴管理、ホールドアウトテスト、科学データとビジュアルアウトプットの任意検査ツールを組み合わせる。
探索は発見と改善のアクションを交互に行い、探索と搾取のバランスをとるために系統認識確率的候補サンプリングを使用する。
我々は、X線顕微鏡画像の登録、ブラッグピーク検出、高エネルギー回折顕微鏡画像のセグメンテーションについてCVEvolveを実証した。
これらのタスク全体で、CVEvolveはベースラインメソッドよりも優れたアルゴリズムを発見し、ホールドアウトテストトラッキングは、後続の過度に最適化された代替手段よりも優れた一般化候補を特定するのに役立つ。
これらの結果は、ゼロコードで自律的なLSMによるアルゴリズム開発は、ドメイン科学者が構造化されていない科学画像データを実用的なアルゴリズムや下流の科学的発見に変換するのに役立つことを示している。
関連論文リスト
- SciML Agents: Write the Solver, Not the Solution [69.5021018644143]
敵の"ミスリーディング"問題の診断データセットと,1,000種類のODEタスクの大規模ベンチマークという,2つの新しいデータセットを紹介した。
オープンおよびクローズドソース LLM モデルについて, (i) 誘導型とガイド型, (ii) オフ・ザ・シェルフ対微調整型という2つの軸に沿って評価した。
予備的な結果は、慎重なプロンプトと微調整により、単純なODE問題を確実に解決できる特殊なLLMエージェントが得られることを示唆している。
論文 参考訳(メタデータ) (2025-09-12T02:53:57Z) - An AI system to help scientists write expert-level empirical software [25.01900335784437]
品質基準を最大化するために,専門家レベルの科学ソフトウェアを作成するAIシステムを提案する。
このシステムは、外部ソースから複雑な研究アイデアを探求し、統合する際に、専門家レベルの結果を得る。
バイオインフォマティクスでは、公共のリーダーボード上で人間が開発した最上位の手法よりも優れた、40の新しい単一セルデータ解析法が発見された。
疫学では、新型コロナウイルス(COVID-19)の入院を予測するためのCDCアンサンブルやその他の全ての個人モデルを上回る14のモデルを作成した。
論文 参考訳(メタデータ) (2025-09-08T10:08:36Z) - Detecting AI Assistance in Abstract Complex Tasks [2.249916681499244]
アシスタント検出は、特に抽象的なタスクデータを見る場合、人間にとって困難である。
我々は,そのようなデータを適切に前処理した場合に,共通モデルが効果的に分類できることを示す。
3つの古典的なディープラーニングアーキテクチャにおける画像定式化の質をベンチマークする。
論文 参考訳(メタデータ) (2025-07-14T19:37:36Z) - Using Machine Learning To Identify Software Weaknesses From Software
Requirement Specifications [49.1574468325115]
本研究は、要求仕様からソフトウェア弱点を特定するための効率的な機械学習アルゴリズムを見つけることに焦点を当てる。
ProMISE_exp. Naive Bayes、サポートベクターマシン(SVM)、決定木、ニューラルネットワーク、畳み込みニューラルネットワーク(CNN)アルゴリズムをテストした。
論文 参考訳(メタデータ) (2023-08-10T13:19:10Z) - IM-IAD: Industrial Image Anomaly Detection Benchmark in Manufacturing [88.35145788575348]
画像異常検出(英: Image Anomaly Detection、IAD)は、産業用コンピュータビジョンの課題である。
統一IMベンチマークの欠如は、現実世界のアプリケーションにおけるIADメソッドの開発と利用を妨げる。
7つの主要なデータセットに19のアルゴリズムを含む包括的画像異常検出ベンチマーク(IM-IAD)を構築した。
論文 参考訳(メタデータ) (2023-01-31T01:24:45Z) - Random projections and Kernelised Leave One Cluster Out
Cross-Validation: Universal baselines and evaluation tools for supervised
machine learning for materials properties [10.962094053749093]
1つのクラスタ・アウト・クロス・バリデーション(LOCO-CV)は、これまで目に見えない材料群を予測するアルゴリズムの性能を測定する方法として導入された。
コンポジションベース表現の徹底的な比較を行い,カーネル近似関数を用いてLOCO-CVアプリケーションの拡張を行う方法について検討する。
テストされたほとんどのタスクにおいて、ドメイン知識は機械学習のパフォーマンスを向上しないが、バンドギャップ予測は例外である。
論文 参考訳(メタデータ) (2022-06-17T15:39:39Z) - Inducing Gaussian Process Networks [80.40892394020797]
本稿では,特徴空間と誘導点を同時に学習するシンプルなフレームワークであるGaussian Process Network (IGN)を提案する。
特に誘導点は特徴空間で直接学習され、複雑な構造化領域のシームレスな表現を可能にする。
実世界のデータセットに対する実験結果から,IGNは最先端の手法よりも大幅に進歩していることを示す。
論文 参考訳(メタデータ) (2022-04-21T05:27:09Z) - Ultrafast Focus Detection for Automated Microscopy [0.0]
連続的に収集した電子顕微鏡画像に対する高速な焦点検出アルゴリズムを提案する。
本手法は, 従来のコンピュータビジョン技術に適応し, 様々な微細な組織学的特徴を検出する手法である。
アウト・オブ・フォーカス条件をほぼリアルタイムに検出するテストが実施されている。
論文 参考訳(メタデータ) (2021-08-26T22:24:41Z) - A parameter refinement method for Ptychography based on Deep Learning
concepts [55.41644538483948]
伝播距離、位置誤差、部分的コヒーレンスにおける粗いパラメトリゼーションは、しばしば実験の生存性を脅かす。
最新のDeep Learningフレームワークは、セットアップの不整合を自律的に補正するために使用され、ポチコグラフィーの再構築の質が向上する。
我々は,elettra シンクロトロン施設のツインミックビームラインで取得した合成データセットと実データの両方でシステムをテストした。
論文 参考訳(メタデータ) (2021-05-18T10:15:17Z) - Extracting the main trend in a dataset: the Sequencer algorithm [0.0]
一次元の傾向は、しばしば列と呼ばれ、単純な現象についての洞察を与える。
本稿では,データセットの主なトレンドを汎用的に識別するアルゴリズムであるSequencerを提案する。
多くのケースにおいて、一般的なt-SNEおよびUMAP次元減少技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-24T18:00:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。