論文の概要: The Data Fusion Labeler (dFL): Challenges and Solutions to Data Harmonization, Labeling, and Provenance in Fusion Energy
- arxiv url: http://arxiv.org/abs/2511.09725v1
- Date: Fri, 14 Nov 2025 01:06:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.442631
- Title: The Data Fusion Labeler (dFL): Challenges and Solutions to Data Harmonization, Labeling, and Provenance in Fusion Energy
- Title(参考訳): Data Fusion Labeler (dFL):データ調和、ラベリング、核融合エネルギーへの挑戦と解決
- Authors: Craig Michoski, Matthew Waller, Brian Sammuli, Zeyu Li, Tapan Ganatma Nakkina, Raffi Nazikian, Sterling Smith, David Orozco, Dongyang Kuang, Martin Foltin, Erik Olofsson, Mike Fredrickson, Jerry Louis-Jeune, David R. Hatch, Todd A. Oliver, Mitchell Clark, Steph-Yves Louis,
- Abstract要約: 核融合エネルギー研究は、異質なマルチモーダルデータセットを統合する能力にますます依存している。
Data Fusion Labeler (dFL) は、不確実性を認識したデータ調和、スキーマに準拠したデータ融合、および大規模な手動および自動ラベリングを実行する。
- 参考スコア(独自算出の注目度): 3.476400092654536
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fusion energy research increasingly depends on the ability to integrate heterogeneous, multimodal datasets from high-resolution diagnostics, control systems, and multiscale simulations. The sheer volume and complexity of these datasets demand the development of new tools capable of systematically harmonizing and extracting knowledge across diverse modalities. The Data Fusion Labeler (dFL) is introduced as a unified workflow instrument that performs uncertainty-aware data harmonization, schema-compliant data fusion, and provenance-rich manual and automated labeling at scale. By embedding alignment, normalization, and labeling within a reproducible, operator-order-aware framework, dFL reduces time-to-analysis by greater than 50X (e.g., enabling >200 shots/hour to be consistently labeled rather than a handful per day), enhances label (and subsequently training) quality, and enables cross-device comparability. Case studies from DIII-D demonstrate its application to automated ELM detection and confinement regime classification, illustrating its potential as a core component of data-driven discovery, model validation, and real-time control in future burning plasma devices.
- Abstract(参考訳): 核融合エネルギー研究は、高分解能診断、制御システム、マルチスケールシミュレーションから異質なマルチモーダルデータセットを統合する能力にますます依存している。
これらのデータセットの量と複雑さは、様々なモダリティの知識を体系的に調和させ、抽出できる新しいツールの開発を要求する。
Data Fusion Labeler (dFL)は、不確実性を認識したデータ調和、スキーマに準拠したデータ融合、大規模な手動および自動ラベリングを実行する統合ワークフロー機器として導入された。
アライメント、正規化、ラベリングを再現可能なオペレータ-オーダー対応フレームワークに埋め込むことで、dFLは50X(eg)以上の時間と分析を削減し、200ショット/時間以上を1日当たり数秒ではなく一貫してラベル付けできるようにし、ラベル(とその後のトレーニング)の品質を高め、デバイス間互換性を可能にします。
DIII-Dのケーススタディは、将来燃えるプラズマデバイスにおけるデータ駆動検出、モデル検証、およびリアルタイム制御のコアコンポーネントとしての可能性を示す、自動EMM検出および閉じ込め体制分類へのその応用を実証している。
関連論文リスト
- DeepFeatIoT: Unifying Deep Learned, Randomized, and LLM Features for Enhanced IoT Time Series Sensor Data Classification in Smart Industries [2.2120045208641184]
IoT(Internet of Things)センサーは、スマートシティ、産業サイト、医療システムにまたがるユビキタス技術である。
我々は、学習したローカル機能とグローバル機能を非学習ランダム化されたカーネルベースの機能に統合する新しいディープラーニングモデルDeepFeatIoTを提案する。
我々のモデルの有効性は、複数の実世界のIoTセンサーデータセットにまたがる一貫性と一般化されたパフォーマンスによって実証される。
論文 参考訳(メタデータ) (2025-08-13T03:47:33Z) - Evaluating Language Models as Synthetic Data Generators [99.16334775127875]
AgoraBenchは、LMのデータ生成能力を評価するための標準化された設定とメトリクスを提供するベンチマークである。
6つのLMを使って126万のトレーニングインスタンスを合成し、99の学生モデルをトレーニングすることで、LMのデータ生成能力に関する重要な洞察を明らかにする。
論文 参考訳(メタデータ) (2024-12-04T19:20:32Z) - Unsupervised Multimodal Fusion of In-process Sensor Data for Advanced Manufacturing Process Monitoring [0.0]
本稿では,製造プロセスにおけるマルチモーダルセンサデータ融合に対する新しいアプローチを提案する。
我々は、ラベル付きデータなしで異なるデータモダリティを相関付けるために、対照的な学習手法を活用している。
本手法は,プロセス制御,異常検出,品質保証などの下流タスクを容易にする。
論文 参考訳(メタデータ) (2024-10-29T21:52:04Z) - EnergyDiff: Universal Time-Series Energy Data Generation using Diffusion Models [2.677325229270716]
高解像度時系列データはエネルギーシステムの運用と計画に不可欠である。
高分解能時系列データは、その固有の高次元と複雑な時間的依存関係のためにモデル化が難しい。
本稿では,エネルギー時系列データのための汎用データ生成フレームワークであるEnergyDiffを提案する。
論文 参考訳(メタデータ) (2024-07-18T14:10:50Z) - Filling the Missing: Exploring Generative AI for Enhanced Federated
Learning over Heterogeneous Mobile Edge Devices [72.61177465035031]
ローカルデータのFIMI(FIlling the MIssing)部分を活用することにより,これらの課題に対処する,AIを活用した創発的なフェデレーション学習を提案する。
実験の結果,FIMIはデバイス側エネルギーの最大50%を節約し,目標とするグローバルテスト精度を達成できることがわかった。
論文 参考訳(メタデータ) (2023-10-21T12:07:04Z) - Convolutional Monge Mapping Normalization for learning on sleep data [63.22081662149488]
我々は、CMMN(Convolutional Monge Mapping Normalization)と呼ばれる新しい手法を提案する。
CMMNは、そのパワースペクトル密度(PSD)をトレーニングデータに基づいて推定されるワッサーシュタインバリセンタに適応させるために、信号をフィルタリングする。
睡眠脳波データに関する数値実験により、CMMNはニューラルネットワークアーキテクチャから独立して、顕著で一貫したパフォーマンス向上をもたらすことが示された。
論文 参考訳(メタデータ) (2023-05-30T08:24:01Z) - Scalable Modular Synthetic Data Generation for Advancing Aerial Autonomy [2.9005223064604078]
本稿では,自律飛行に適したスケーラブルなAerial Synthetic Data Augmentation (ASDA) フレームワークを提案する。
ASDAは、シーンとデータ拡張を自動的に実行する2つのスクリプト可能なパイプラインを備えた中央データ収集エンジンを拡張している。
多様なデータセットを自動生成する手法の有効性を実証する。
論文 参考訳(メタデータ) (2022-11-10T04:37:41Z) - Fault Detection and Diagnosis with Imbalanced and Noisy Data: A Hybrid
Framework for Rotating Machinery [2.580765958706854]
回転機械製造システムの保守コスト低減には, 故障診断が重要な役割を担っている。
従来のフォールト検出および診断(FDD)フレームワークは、現実の状況に対処する際のパフォーマンスが劣っている。
本稿では、上記の3つのコンポーネントを用いて、効果的な信号ベースFDDシステムを実現するハイブリッドフレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-09T01:09:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。