論文の概要: TokaMark: A Comprehensive Benchmark for MAST Tokamak Plasma Models
- arxiv url: http://arxiv.org/abs/2602.10132v2
- Date: Thu, 12 Feb 2026 09:55:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 14:31:53.455726
- Title: TokaMark: A Comprehensive Benchmark for MAST Tokamak Plasma Models
- Title(参考訳): TokaMark: MAST Tokamakプラズマモデルのための総合ベンチマーク
- Authors: Cécile Rousseau, Samuel Jackson, Rodrigo H. Ordonez-Hurtado, Nicola C. Amorisco, Tobia Boschi, George K. Holt, Andrea Loreti, Eszter Székely, Alexander Whittle, Adriano Agnello, Stanislas Pamela, Alessandra Pascale, Robert Akers, Juan Bernabe Moreno, Sue Thorne, Mykhaylo Zayats,
- Abstract要約: TokaMarkは、Mega Ampere Spherical Tokamak (MAST)から収集された実実験データに基づいてAIモデルを評価するための構造化ベンチマークである。
TokaMarkは、データ駆動型AIベースのプラズマモデリングの進歩を加速することを目的としている。
- 参考スコア(独自算出の注目度): 56.94569090844015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Development and operation of commercially viable fusion energy reactors such as tokamaks require accurate predictions of plasma dynamics from sparse, noisy, and incomplete sensors readings. The complexity of the underlying physics and the heterogeneity of experimental data pose formidable challenges for conventional numerical methods, while simultaneously highlight the promise of modern data-native AI approaches. A major obstacle in realizing this potential is, however, the lack of curated, openly available datasets and standardized benchmarks. Existing fusion datasets are scarce, fragmented across institutions, facility-specific, and inconsistently annotated, which limits reproducibility and prevents a fair and scalable comparison of AI approaches. In this paper, we introduce TokaMark, a structured benchmark to evaluate AI models on real experimental data collected from the Mega Ampere Spherical Tokamak (MAST). TokaMark provides a comprehensive suite of tools designed to (i) unify access to multi-modal heterogeneous fusion data, and (ii) harmonize formats, metadata, temporal alignment and evaluation protocols to enable consistent cross-model and cross-task comparisons. The benchmark includes a curated list of 14 tasks spanning a range of physical mechanisms, exploiting a variety of diagnostics and covering multiple operational use cases. A baseline model is provided to facilitate transparent comparison and validation within a unified framework. By establishing a unified benchmark for both the fusion and AI-for-science communities, TokaMark aims to accelerate progress in data-driven AI-based plasma modeling, contributing to the broader goal of achieving sustainable and stable fusion energy. The benchmark, documentation, and tooling will be fully open sourced upon acceptance to encourage community adoption and contribution.
- Abstract(参考訳): トカマクのような商業的に利用可能な核融合エネルギー炉の開発と運用には、スパース、ノイズ、不完全なセンサーによるプラズマ力学の正確な予測が必要である。
基礎となる物理の複雑さと実験データの異質性は、従来の数値手法に重大な課題をもたらし、同時に現代のデータネイティブなAIアプローチの約束を強調している。
しかし、この可能性を実現する上での大きな障害は、キュレートされた公開データセットと標準ベンチマークの欠如である。
既存の融合データセットは、機関間で断片化され、施設特化され、矛盾なく注釈付けされるため、再現性が制限され、AIアプローチの公平かつスケーラブルな比較が防止される。
本稿では,Mega Ampere Spherical Tokamak(MAST)から収集した実実験データに基づいて,AIモデルを評価するための構造化ベンチマークであるTokaMarkを紹介する。
TokaMarkは、デザインされた包括的なツールスイートを提供する
(i)多モード不均質核融合データへのアクセスを統一し、
(2)フォーマット,メタデータ,時間的アライメント,評価プロトコルを調和させて,一貫したクロスモデルとクロスタスクの比較を可能にする。
ベンチマークには、さまざまな物理メカニズムにまたがる14のタスクのキュレートされたリスト、さまざまな診断の活用、複数の運用ユースケースのカバーが含まれている。
統一されたフレームワーク内での透過的な比較と検証を容易にするベースラインモデルが提供される。
融合と科学のためのAIコミュニティの両方のための統一されたベンチマークを確立することで、TokaMarkは、データ駆動型AIベースのプラズマモデリングの進歩を加速し、持続的で安定した核融合エネルギーを達成するというより広い目標に寄与することを目指している。
ベンチマーク、ドキュメンテーション、ツーリングは、コミュニティの採用とコントリビューションを促進するために、受け入れ時に完全にオープンソースになる。
関連論文リスト
- Beyond Raw Detection Scores: Markov-Informed Calibration for Boosting Machine-Generated Text Detection [105.14032334647932]
機械生成テキスト(MGT)は偽情報やフィッシングなどのリスクを生じさせ、信頼性の高い検出の必要性を強調している。
MGTの統計的に区別可能な特徴を抽出するメトリックベース法は、オーバーフィットしがちな複雑なモデルベース法よりも実用的であることが多い。
本稿では,2つのコンテキスト検出スコアの関係をモデル化したマルコフ情報を用いたスコアキャリブレーション手法を提案する。
論文 参考訳(メタデータ) (2026-02-08T16:06:12Z) - SERM: Self-Evolving Relevance Model with Agent-Driven Learning from Massive Query Streams [53.78257200138774]
本稿では,2つの相補的マルチエージェントモジュールからなる自己進化関連モデル(SERM)を提案する。
我々はSERMを大規模産業環境で評価し、毎日数十億のユーザリクエストを処理している。
論文 参考訳(メタデータ) (2026-01-14T14:31:16Z) - The Data Fusion Labeler (dFL): Challenges and Solutions to Data Harmonization, Labeling, and Provenance in Fusion Energy [3.476400092654536]
核融合エネルギー研究は、異質なマルチモーダルデータセットを統合する能力にますます依存している。
Data Fusion Labeler (dFL) は、不確実性を認識したデータ調和、スキーマに準拠したデータ融合、および大規模な手動および自動ラベリングを実行する。
論文 参考訳(メタデータ) (2025-11-12T20:33:40Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - Single Domain Generalization with Model-aware Parametric Batch-wise Mixup [22.709796153794507]
単一ドメインの一般化は、マシンラーニングの分野において、依然として深刻な課題である。
本稿では,モデル認識型パラメトリックバッチ・ワイド・ミックスアップ(Parametric Batch-wise Mixup)と呼ばれる新しいデータ拡張手法を提案する。
機能間相関を利用することで、パラメータ化されたミックスアップジェネレータは、複数のインスタンスにまたがる機能の組み合わせにおいて、さらなる汎用性を導入する。
論文 参考訳(メタデータ) (2025-02-22T03:45:18Z) - Energy-based Automated Model Evaluation [19.90797626200033]
本稿では,AutoEvalフレームワークをより効率的かつ効果的にするための新しい手段として,Meta-Distribution Energy(MDE)を提案する。
MDEは、個々のサンプルに関連する情報(エネルギー)に基づいて、メタ分布統計を確立し、エネルギーベースの学習によってよりスムーズな表現を提供する。
我々は、MDEの有効性を検証するために、モダリティ、データセット、異なるアーキテクチャのバックボーンにわたる広範な実験を提供する。
論文 参考訳(メタデータ) (2024-01-23T11:54:09Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。