論文の概要: A collaborative digital twin built on FAIR data and compute infrastructure
- arxiv url: http://arxiv.org/abs/2507.00048v1
- Date: Tue, 24 Jun 2025 18:13:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:58.13495
- Title: A collaborative digital twin built on FAIR data and compute infrastructure
- Title(参考訳): FAIRデータと計算インフラを用いた協調型デジタルツイン
- Authors: Thomas M. Deucher, Juan C. Verduzco, Michael Titus, Alejandro Strachan,
- Abstract要約: 本研究は,nanoHUBサービス上に構築された分散SDL実装をオンラインシミュレーションとFAIRデータ管理のために提案する。
研究者と学生は、独自の実験をセットアップし、協力者とデータを共有し、FAIRデータ、予測MLモデル、シーケンシャルな最適化の組み合わせを探索することができる。
- 参考スコア(独自算出の注目度): 41.94295877935867
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The integration of machine learning with automated experimentation in self-driving laboratories (SDL) offers a powerful approach to accelerate discovery and optimization tasks in science and engineering applications. When supported by findable, accessible, interoperable, and reusable (FAIR) data infrastructure, SDLs with overlapping interests can collaborate more effectively. This work presents a distributed SDL implementation built on nanoHUB services for online simulation and FAIR data management. In this framework, geographically dispersed collaborators conducting independent optimization tasks contribute raw experimental data to a shared central database. These researchers can then benefit from analysis tools and machine learning models that automatically update as additional data become available. New data points are submitted through a simple web interface and automatically processed using a nanoHUB Sim2L, which extracts derived quantities and indexes all inputs and outputs in a FAIR data repository called ResultsDB. A separate nanoHUB workflow enables sequential optimization using active learning, where researchers define the optimization objective, and machine learning models are trained on-the-fly with all existing data, guiding the selection of future experiments. Inspired by the concept of ``frugal twin", the optimization task seeks to find the optimal recipe to combine food dyes to achieve the desired target color. With easily accessible and inexpensive materials, researchers and students can set up their own experiments, share data with collaborators, and explore the combination of FAIR data, predictive ML models, and sequential optimization. The tools introduced are generally applicable and can easily be extended to other optimization problems.
- Abstract(参考訳): 自動運転研究所(SDL)における機械学習と自動実験の統合は、科学と工学のアプリケーションにおける発見と最適化タスクを加速するための強力なアプローチを提供する。
検索可能で、アクセス可能で、相互運用可能で、再利用可能な(FAIR)データインフラストラクチャによってサポートされた場合、重複する関心を持つSDLはより効果的に協力できる。
本研究は,nanoHUBサービス上に構築された分散SDL実装をオンラインシミュレーションとFAIRデータ管理のために提案する。
本フレームワークでは,独立最適化タスクを行う地理的に分散した共同作業者が,実験データを共有中央データベースにコントリビュートする。
これらの研究者は分析ツールや機械学習モデルの恩恵を受けることができる。
新しいデータポイントは単純なWebインターフェースを通じて送信され、nanoHUB Sim2Lを使用して自動的に処理される。
独立したnanoHUBワークフローは、研究者が最適化目標を定義し、機械学習モデルが既存のすべてのデータをオンザフライでトレーニングし、将来の実験の選択を導く、アクティブな学習を用いたシーケンシャルな最適化を可能にする。
Frugal twin"という概念にインスパイアされたこの最適化タスクは、食べ物の色素を組み合わせ、目的とする色を目標とする最適なレシピを見つけ出そうとする。
簡単にアクセスしやすく安価な素材で、研究者や学生は独自の実験をセットアップし、協力者とデータを共有し、FAIRデータ、予測MLモデル、シーケンシャルな最適化の組み合わせを探索することができる。
導入されたツールは一般に適用でき、他の最適化問題にも容易に拡張できる。
関連論文リスト
- Procedural Environment Generation for Tool-Use Agents [55.417058694785325]
我々はRandomWorldを紹介した。これは対話型ツールと合成ツール利用データの手続き的生成のためのパイプラインである。
我々は,SFTとRLによるRandomWorldの合成データによるモデル調整により,様々なツール使用ベンチマークが改良されたことを示す。
論文 参考訳(メタデータ) (2025-05-21T14:10:06Z) - LAMBDA: A Large Model Based Data Agent [7.240586338370509]
本稿では,LArge Model Based Data Agent (LAMBDA)を紹介する。
LAMBDAは、データ駆動アプリケーションにおけるデータ分析の課題に対処するように設計されている。
それは、人間と人工知能をシームレスに統合することで、データ分析パラダイムを強化する可能性がある。
論文 参考訳(メタデータ) (2024-07-24T06:26:36Z) - LESS: Selecting Influential Data for Targeted Instruction Tuning [64.78894228923619]
本稿では,データの影響を推定し,命令データ選択のための低ランクグレーディエント類似度探索を行うアルゴリズムであるLESSを提案する。
LESS選択したデータの5%のトレーニングは、さまざまなダウンストリームタスクにわたる完全なデータセットでのトレーニングよりも優れています。
我々の方法は、意図した下流アプリケーションに必要な推論スキルを識別するために、表面的なフォームキューを超えています。
論文 参考訳(メタデータ) (2024-02-06T19:18:04Z) - Enhancing Multi-Objective Optimization through Machine Learning-Supported Multiphysics Simulation [1.6685829157403116]
本稿では,訓練,自己最適化,自己組織的代理モデルのための方法論的枠組みを提案する。
シュロゲートモデルを比較的少量のデータで訓練し、基礎となるシミュレーションを正確に近似できることを示す。
論文 参考訳(メタデータ) (2023-09-22T20:52:50Z) - Towards Lightweight Data Integration using Multi-workflow Provenance and
Data Observability [0.2517763905487249]
統合データ分析は、特に現在のAI時代において、科学的発見において重要な役割を果たす。
軽量ランタイム向けマルチワークフロー統合データ分析手法MIDAを提案する。
Summitスーパーコンピュータの1,680個のCPUコア上で,最大10000のタスクを実行するほぼゼロのオーバーヘッドを示す。
論文 参考訳(メタデータ) (2023-08-17T14:20:29Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - PHOTONAI -- A Python API for Rapid Machine Learning Model Development [2.414341608751139]
PHOTONAIは、機械学習モデル開発の簡素化と高速化を目的とした、ハイレベルなPython APIである。
これは統一フレームワークとして機能し、ユーザーは異なるツールボックスからのアルゴリズムをカスタムのアルゴリズムシーケンスに簡単にアクセスし、組み合わせることができる。
論文 参考訳(メタデータ) (2020-02-13T10:33:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。