論文の概要: DataJoint 2.0: A Computational Substrate for Agentic Scientific Workflows
- arxiv url: http://arxiv.org/abs/2602.16585v1
- Date: Wed, 18 Feb 2026 16:35:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 15:58:30.650653
- Title: DataJoint 2.0: A Computational Substrate for Agentic Scientific Workflows
- Title(参考訳): DataJoint 2.0: エージェント科学ワークフローのための計算基板
- Authors: Dimitri Yatsenko, Thinh T. Nguyen,
- Abstract要約: DataJointはSciOpsの基盤を作り、エージェントはデータ破損のリスクを冒さずに科学的変換に参加できる。
テーブルはワークフローステップを表し、行はアーティファクトを表し、外部キーは実行順序を規定する。
データ構造、計算依存、整合性の制約がすべてクエリ可能、強制可能、機械可読である単一形式システム。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Operational rigor determines whether human-agent collaboration succeeds or fails. Scientific data pipelines need the equivalent of DevOps -- SciOps -- yet common approaches fragment provenance across disconnected systems without transactional guarantees. DataJoint 2.0 addresses this gap through the relational workflow model: tables represent workflow steps, rows represent artifacts, foreign keys prescribe execution order. The schema specifies not only what data exists but how it is derived -- a single formal system where data structure, computational dependencies, and integrity constraints are all queryable, enforceable, and machine-readable. Four technical innovations extend this foundation: object-augmented schemas integrating relational metadata with scalable object storage, semantic matching using attribute lineage to prevent erroneous joins, an extensible type system for domain-specific formats, and distributed job coordination designed for composability with external orchestration. By unifying data structure, data, and computational transformations, DataJoint creates a substrate for SciOps where agents can participate in scientific workflows without risking data corruption.
- Abstract(参考訳): 操作厳密さは、人間とエージェントのコラボレーションが成功するか失敗するかを決定する。
科学データパイプラインには、DevOps -- SciOps -- と同じものが必要です。
テーブルはワークフローステップを表し、行はアーティファクトを表し、外部キーは実行順序を規定する。
データ構造、計算依存、整合性の制約がすべてクエリ可能、強制可能、機械可読である単一の形式システムである。
4つの技術革新は、リレーショナルメタデータとスケーラブルなオブジェクトストレージを統合するオブジェクト拡張スキーマ、誤った結合を防ぐための属性ラインを使用したセマンティックマッチング、ドメイン固有のフォーマットの拡張可能な型システム、外部オーケストレーションとのコンポーザビリティのために設計された分散ジョブ調整である。
データ構造、データ、計算変換を統合することで、DataJointはSciOpsの基盤を作り、エージェントはデータ破損のリスクを冒さずに科学的ワークフローに参加できる。
関連論文リスト
- AgentSkiller: Scaling Generalist Agent Intelligence through Semantically Integrated Cross-Domain Data Synthesis [30.512393568258105]
大規模言語モデルエージェントは、ツールを介して現実世界の問題を解決する可能性を実証するが、汎用的な知性は、質の低い長期データによってボトルネックとなる。
本稿では,現実的なセマンティックなドメイン間でのマルチターンインタラクションデータを合成する,完全に自動化されたフレームワークであるAgentSkillerを提案する。
論文 参考訳(メタデータ) (2026-02-10T03:21:42Z) - DataCross: A Unified Benchmark and Agent Framework for Cross-Modal Heterogeneous Data Analysis [8.171937411588015]
我々は、統合された洞察駆動分析のための新しいベンチマークと協調エージェントフレームワークであるDataCrossを紹介する。
DataCrossBenchには、ファイナンス、ヘルスケア、その他のドメインにわたる200のエンドツーエンド分析タスクが含まれている。
また、人間アナリストの「分割合成」ワークフローにインスパイアされたDataCrossAgentフレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T08:40:45Z) - Operon: Incremental Construction of Ragged Data via Named Dimensions [1.6212518002538465]
既存のワークフローエンジンには、タグ付けされたデータ固有の形状と依存関係を追跡するネイティブサポートがない。
我々はRustベースのワークフローエンジンであるOperonを紹介します。
論文 参考訳(メタデータ) (2025-11-20T06:16:31Z) - Kernel Representation and Similarity Measure for Incomplete Data [55.62595187178638]
不完全データの類似性を測定することは、Webマイニング、レコメンデーションシステム、ユーザー行動分析において基本的な課題である。
従来のアプローチでは、不完全なデータを破棄するか、事前処理のステップとして計算を実行するかのいずれかであり、情報損失と類似性のバイアスが生じる。
本稿では,カーネルの特徴空間における不完全データ間の類似性を,元の空間における明示的な計算なしで直接計算する,新しい類似度尺度を提案する。
論文 参考訳(メタデータ) (2025-10-15T09:41:23Z) - Transduction is All You Need for Structured Data Workflows [8.178153196011028]
本稿では,構造化データワークフローパイプライン構築のためのエージェント型AIフレームワークであるAgenticsを紹介する。
研究と実践の両方のために設計されたAgenticsは、エージェントがデータタイプに埋め込まれる新しいデータ中心のパラダイムを提供する。
本稿では,本手法の有効性を実証した,構造化データワークフロータスクと実証的エビデンスについて述べる。
論文 参考訳(メタデータ) (2025-08-21T14:35:47Z) - Data Dependency-Aware Code Generation from Enhanced UML Sequence Diagrams [54.528185120850274]
本稿では,API2Depという新しいステップバイステップコード生成フレームワークを提案する。
まず、サービス指向アーキテクチャに適した拡張Unified Modeling Language (UML) APIダイアグラムを紹介します。
次に、データフローの重要な役割を認識し、専用のデータ依存推論タスクを導入する。
論文 参考訳(メタデータ) (2025-08-05T12:28:23Z) - RelDiff: Relational Data Generative Modeling with Graph-Based Diffusion Models [83.6013616017646]
RelDiffは、外部キーグラフ構造を明示的にモデル化することによって完全な関係データベースを合成する新しい拡散生成モデルである。
RelDiffは、現実的で一貫性のある合成リレーショナルデータベースの作成において、従来手法よりも一貫して優れている。
論文 参考訳(メタデータ) (2025-05-31T21:01:02Z) - ToolACE: Winning the Points of LLM Function Calling [139.07157814653638]
ToolACEは、正確で複雑で多様なツール学習データを生成するように設計された自動エージェントパイプラインである。
我々は、合成データに基づいてトレーニングされたモデルが、8Bパラメータだけで、バークレー・ファンクション・カリング・リーダーボード上で最先端のパフォーマンスを達成することを実証した。
論文 参考訳(メタデータ) (2024-09-02T03:19:56Z) - Accessing and Interpreting OPC UA Event Traces based on Semantic Process
Descriptions [69.9674326582747]
本稿では、イベントデータのコンテキストに基づいて、プロダクションシステムのイベントデータにアクセスするアプローチを提案する。
本手法は,1)生産システムの階層構造の意味モデル,2)形式化されたプロセス記述,3)OPC UA情報モデルを組み合わせることによって,データベースシステムからフィルタリングイベントログを抽出する。
論文 参考訳(メタデータ) (2022-07-25T15:13:44Z) - Partially-Aligned Data-to-Text Generation with Distant Supervision [69.15410325679635]
我々はPADTG(Partially-Aligned Data-to-Text Generation)と呼ばれる新しい生成タスクを提案する。
自動的にアノテートされたデータをトレーニングに利用し、アプリケーションドメインを大幅に拡張するため、より実用的です。
我々のフレームワークは、全てのベースラインモデルより優れており、部分整合データの利用の可能性を検証する。
論文 参考訳(メタデータ) (2020-10-03T03:18:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。