論文の概要: DataScribe: An AI-Native, Policy-Aligned Web Platform for Multi-Objective Materials Design and Discovery
- arxiv url: http://arxiv.org/abs/2601.07966v1
- Date: Mon, 12 Jan 2026 19:59:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:18.927009
- Title: DataScribe: An AI-Native, Policy-Aligned Web Platform for Multi-Objective Materials Design and Discovery
- Title(参考訳): DataScribe: 多目的材料設計と発見のためのAI指向でポリシー指向のWebプラットフォーム
- Authors: Divyanshu Singh, Doguhan Sarıtürk, Cameron Lea, Md Shafiqul Islam, Raymundo Arroyave, Vahid Attari,
- Abstract要約: DataScribeは、AIネイティブでクラウドベースの材料発見プラットフォームである。
実験データと計算データを機械処理可能な知識グラフで統一する。
データインフラストラクチャに直接最適化エンジン、機械学習、パブリックおよびプライベートな科学データへの統一されたアクセスを組み込むことで、DataScribeはあらゆる規模の研究所のための汎用アプリケーション層バックボーンとして機能する。
- 参考スコア(独自算出の注目度): 1.0713846107735632
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The acceleration of materials discovery requires digital platforms that go beyond data repositories to embed learning, optimization, and decision-making directly into research workflows. We introduce DataScribe, an AI-native, cloud-based materials discovery platform that unifies heterogeneous experimental and computational data through ontology-backed ingestion and machine-actionable knowledge graphs. The platform integrates FAIR-compliant metadata capture, schema and unit harmonization, uncertainty-aware surrogate modeling, and native multi-objective multi-fidelity Bayesian optimization, enabling closed-loop propose-measure-learn workflows across experimental and computational pipelines. DataScribe functions as an application-layer intelligence stack, coupling data governance, optimization, and explainability rather than treating them as downstream add-ons. We validate the platform through case studies in electrochemical materials and high-entropy alloys, demonstrating end-to-end data fusion, real-time optimization, and reproducible exploration of multi-objective trade spaces. By embedding optimization engines, machine learning, and unified access to public and private scientific data directly within the data infrastructure, and by supporting open, free use for academic and non-profit researchers, DataScribe functions as a general-purpose application-layer backbone for laboratories of any scale, including self-driving laboratories and geographically distributed materials acceleration platforms, with built-in support for performance, sustainability, and supply-chain-aware objectives.
- Abstract(参考訳): 材料発見の加速は、学習、最適化、意思決定を直接研究ワークフローに組み込むために、データレポジトリを超えるデジタルプラットフォームを必要とします。
我々は、オントロジーに支援された摂取とマシン操作可能な知識グラフを通じて、異質な実験データと計算データを統一する、AIネイティブなクラウドベースの材料発見プラットフォームであるDataScribeを紹介する。
このプラットフォームは、FAIRに準拠したメタデータキャプチャ、スキーマとユニットの調和、不確実性を認識したサロゲートモデリング、およびネイティブな多目的多目的ベイズ最適化を統合し、実験パイプラインと計算パイプラインをまたいだクローズドループ提案-計測-学習ワークフローを可能にする。
DataScribeはアプリケーション層インテリジェンススタックとして機能し、下流のアドオンとして扱うのではなく、データガバナンス、最適化、説明責任を結合します。
本研究では, 電気化学材料と高エントロピー合金のケーススタディにより, エンドツーエンドのデータ融合, リアルタイム最適化, 多目的貿易空間の再現可能な探索を実証し, プラットフォームを検証した。
データインフラストラクチャに直接最適化エンジン、機械学習、およびパブリックおよびプライベートな科学データへの統合アクセスを組み込むことにより、学術的および非営利の研究者にとってオープンで無料な利用をサポートすることで、DataScribeは、自動運転ラボや地理的に分散した材料加速プラットフォームを含むあらゆる規模の研究所のための汎用アプリケーション層バックボーンとして機能し、パフォーマンス、サステナビリティ、サプライチェーン対応の目的を組み込む。
関連論文リスト
- A Survey of AI for Materials Science: Foundation Models, LLM Agents, Datasets, and Tools [15.928285656168422]
ファンデーションモデル(FM)は、科学的発見のためにスケーラブルで汎用的でマルチモーダルなAIシステムを実現する。
この調査は、この成長分野をサポートする基盤モデル、エージェントシステム、データセット、計算ツールの包括的概要を提供する。
論文 参考訳(メタデータ) (2025-06-25T18:10:30Z) - A collaborative digital twin built on FAIR data and compute infrastructure [41.94295877935867]
本研究は,nanoHUBサービス上に構築された分散SDL実装をオンラインシミュレーションとFAIRデータ管理のために提案する。
研究者と学生は、独自の実験をセットアップし、協力者とデータを共有し、FAIRデータ、予測MLモデル、シーケンシャルな最適化の組み合わせを探索することができる。
論文 参考訳(メタデータ) (2025-06-24T18:13:52Z) - Data Scaling Laws for End-to-End Autonomous Driving [83.85463296830743]
16時間から8192時間に及ぶ内部駆動データセット上での簡易エンド・ツー・エンド駆動アーキテクチャの性能評価を行った。
具体的には、目標の性能向上を達成するために、どの程度のトレーニングデータが必要かを調査する。
論文 参考訳(メタデータ) (2025-04-06T03:23:48Z) - Data-Juicer 2.0: Cloud-Scale Adaptive Data Processing for and with Foundation Models [83.65386456026441]
Data-Juicer 2.0は、テキスト、画像、ビデオ、オーディオのモダリティにまたがる100以上のデータ処理オペレータがバックアップするデータ処理システムである。
データ分析、合成、アノテーション、基礎モデルのポストトレーニングなど、より重要なタスクをサポートする。
このシステムは公開されており、さまざまな研究分野やAlibaba Cloud PAIのような現実世界の製品で広く採用されている。
論文 参考訳(メタデータ) (2024-12-23T08:29:57Z) - Enabling High Data Throughput Reinforcement Learning on GPUs: A Domain Agnostic Framework for Data-Driven Scientific Research [90.91438597133211]
我々は、強化学習の適用において重要なシステムのボトルネックを克服するために設計されたフレームワークであるWarpSciを紹介する。
我々は、CPUとGPU間のデータ転送の必要性を排除し、数千のシミュレーションを同時実行可能にする。
論文 参考訳(メタデータ) (2024-08-01T21:38:09Z) - Towards an Integrated Performance Framework for Fire Science and Management Workflows [0.0]
本稿では,人工知能と機械学習(AI/ML)による性能評価と最適化手法を提案する。
パフォーマンスデータ収集、予測、最適化を対象とする、関連するAI/MLフレームワークが、ワイルドファイアサイエンスアプリケーションに適用される。
論文 参考訳(メタデータ) (2024-07-30T22:37:25Z) - Towards Lightweight Data Integration using Multi-workflow Provenance and
Data Observability [0.2517763905487249]
統合データ分析は、特に現在のAI時代において、科学的発見において重要な役割を果たす。
軽量ランタイム向けマルチワークフロー統合データ分析手法MIDAを提案する。
Summitスーパーコンピュータの1,680個のCPUコア上で,最大10000のタスクを実行するほぼゼロのオーバーヘッドを示す。
論文 参考訳(メタデータ) (2023-08-17T14:20:29Z) - Distributed intelligence on the Edge-to-Cloud Continuum: A systematic
literature review [62.997667081978825]
このレビューは、現在利用可能な機械学習とデータ分析のための最先端ライブラリとフレームワークに関する包括的なビジョンを提供することを目的としている。
現在利用可能なEdge-to-Cloud Continuumに関する実験的な研究のための、主要なシミュレーション、エミュレーション、デプロイメントシステム、テストベッドも調査されている。
論文 参考訳(メタデータ) (2022-04-29T08:06:05Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - From Data to Actions in Intelligent Transportation Systems: a
Prescription of Functional Requirements for Model Actionability [10.27718355111707]
この研究は、多種多様なソースから得られたデータが、その資産やシステム、プロセスの効率的な運用のために、データ駆動モデルを学び、適応するためにどのように使用できるかを説明することを目的としている。
ITSのデータモデリングパイプラインでは、データ融合、適応学習、モデル評価という3つの複合ステージに対して、特性、エンジニアリング要件、本質的な課題を定義します。
論文 参考訳(メタデータ) (2020-02-06T12:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。