論文の概要: Benchmarking machine learning models for multi-class state recognition in double quantum dot data
- arxiv url: http://arxiv.org/abs/2511.22451v2
- Date: Mon, 01 Dec 2025 17:47:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 15:37:38.43011
- Title: Benchmarking machine learning models for multi-class state recognition in double quantum dot data
- Title(参考訳): 二重量子ドットデータにおけるマルチクラス状態認識のための機械学習モデルのベンチマーク
- Authors: Valeria Díaz Moreno, Ryan P Khalili, Daniel Schug, Patrick J. Walsh, Justyna P. Zwolak,
- Abstract要約: 本稿では,Double-QD CSDにおけるマルチクラス状態認識のための4つのモダン機械学習(ML)アーキテクチャのベンチマーク研究を行う。
よりリソース集約的なモデルであるU-Netとビジュアルトランスフォーマー(ViT)は、合成データ上で最高のMSEスコア(1-mathrmMSE$と定義される)を得る。
CNN は実験用 CSD 上で最も好ましいトレードオフを提供し、U-Net や ViT よりも2桁少ないパラメータで高い精度を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semiconductor quantum dots (QDs) are a leading platform for scalable quantum processors. However, scaling to large arrays requires reliable, automated tuning strategies for devices' bootstrapping, calibration, and operation, with many tuning aspects depending on accurately identifying QD device states from charge-stability diagrams (CSDs). In this work, we present a comprehensive benchmarking study of four modern machine learning (ML) architectures for multi-class state recognition in double-QD CSDs. We evaluate their performance across different data budgets and normalization schemes using both synthetic and experimental data. We find that the more resource-intensive models -- U-Nets and visual transformers (ViTs) -- achieve the highest MSE score (defined as $1-\mathrm{MSE}$) on synthetic data (over $0.98$) but fail to generalize to experimental data. MDNs are the most computationally efficient and exhibit highly stable training, but with substantially lower peak performance. CNNs offer the most favorable trade-off on experimental CSDs, achieving strong accuracy with two orders of magnitude fewer parameters than the U-Nets and ViTs. Normalization plays a nontrivial role: min-max scaling generally yields higher MSE scores but less stable convergence, whereas z-score normalization produces more predictable training dynamics but at reduced accuracy for most models. Overall, our study shows that CNNs with min-max normalization are a practical approach for QD CSDs.
- Abstract(参考訳): 量子ドット(QD)はスケーラブルな量子プロセッサのための主要なプラットフォームである。
しかし、大規模な配列へのスケーリングには、デバイスのブートストラップ、キャリブレーション、操作のための信頼性の高い自動チューニング戦略が必要である。
本研究では,2D CSDにおけるマルチクラス状態認識のための4つのモダン機械学習(ML)アーキテクチャの総合的なベンチマーク研究を行う。
合成データと実験データの両方を用いて、異なるデータ予算と正規化スキームでそれらの性能を評価する。
より資源集約的なモデルであるU-Netとビジュアルトランスフォーマー(ViTs)は、合成データ(0.98ドル以上)の最高MSEスコア(1-\mathrm{MSE}$)を得るが、実験データへの一般化には失敗する。
MDNは最も計算効率が良く、非常に安定したトレーニングを示すが、ピーク性能はかなり低い。
CNN は実験用 CSD 上で最も好ましいトレードオフを提供し、U-Net や ViT よりも2桁少ないパラメータで高い精度を達成する。
min-maxスケーリングは一般的により高いMSEスコアを得るが、安定収束は少ないが、z-score正規化はより予測可能なトレーニングダイナミクスを生成するが、ほとんどのモデルでは精度は低下する。
本研究は, min-max 正規化 CNN がQD CSD の実践的アプローチであることを示す。
関連論文リスト
- Generalizable and Fast Surrogates: Model Predictive Control of Articulated Soft Robots using Physics-Informed Neural Networks [4.146337610044239]
本研究では,データ効率を重視した音声ソフトロボット(ASR)のための物理インフォームドニューラルネットワーク(PINN)を提案する。
リカレントニューラルネットワークとは対照的に、PINNは高い一般化性を提供する。
精度の高いFPモデルの予測速度は、PINNで最大467倍、わずかに精度が低下する。
論文 参考訳(メタデータ) (2025-02-04T01:16:33Z) - Efficient Model Adaptation for Continual Learning at the Edge [15.334881190102895]
ほとんどの機械学習(ML)システムは、トレーニングとデプロイメントの間、定常的で一致したデータ分散を前提としている。
データ分布は、環境要因、センサー特性、タスク・オブ・関心などの変化により、時間とともに変化することが多い。
本稿では,ドメインシフト下での効率的な連続学習のためのアダプタ・リコンフィグレータ(EAR)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T23:55:17Z) - Incremental Online Learning Algorithms Comparison for Gesture and Visual
Smart Sensors [68.8204255655161]
本稿では,加速度センサデータに基づくジェスチャー認識と画像分類の2つの実例として,最先端の4つのアルゴリズムを比較した。
以上の結果から,これらのシステムの信頼性と小型メモリMCUへのデプロイの可能性が確認された。
論文 参考訳(メタデータ) (2022-09-01T17:05:20Z) - Automatic Machine Learning for Multi-Receiver CNN Technology Classifiers [16.244541005112747]
畳み込みニューラルネットワーク(CNN)は、信号分類のための最も研究されているディープラーニングモデルの1つである。
我々は、複数の同期受信機から収集した生のI/Qサンプルに基づく技術分類に焦点を当てた。
論文 参考訳(メタデータ) (2022-04-28T23:41:38Z) - Characterizing and Understanding the Behavior of Quantized Models for
Reliable Deployment [32.01355605506855]
量子化対応トレーニングは、標準、逆数、ミックスアップトレーニングよりも安定したモデルを生成することができる。
診断は、しばしばトップ1とトップ2の出力確率に近づき、$Margin$は、相違点を区別する他の不確実性指標よりも優れた指標である。
我々は、量子化されたモデルをさらに研究するための新しいベンチマークとして、コードとモデルをオープンソース化した。
論文 参考訳(メタデータ) (2022-04-08T11:19:16Z) - Adaptive Anomaly Detection for Internet of Things in Hierarchical Edge
Computing: A Contextual-Bandit Approach [81.5261621619557]
階層エッジコンピューティング(HEC)を用いた適応型異常検出手法を提案する。
まず,複雑性を増した複数のDNNモデルを構築し,それぞれを対応するHEC層に関連付ける。
そこで我々は、文脈帯域問題として定式化され、強化学習ポリシーネットワークを用いて解決される適応モデル選択スキームを設計する。
論文 参考訳(メタデータ) (2021-08-09T08:45:47Z) - When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。
精度を向上させるために,2つの軽量モジュールを提案する。
DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。
QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文 参考訳(メタデータ) (2021-05-27T13:51:42Z) - Rank-R FNN: A Tensor-Based Learning Model for High-Order Data
Classification [69.26747803963907]
Rank-R Feedforward Neural Network (FNN)は、そのパラメータにCanonical/Polyadic分解を課すテンソルベースの非線形学習モデルである。
まず、入力をマルチリニアアレイとして扱い、ベクトル化の必要性を回避し、すべてのデータ次元に沿って構造情報を十分に活用することができる。
Rank-R FNNの普遍的な近似と学習性の特性を確立し、実世界のハイパースペクトルデータセットのパフォーマンスを検証する。
論文 参考訳(メタデータ) (2021-04-11T16:37:32Z) - Solving Mixed Integer Programs Using Neural Networks [57.683491412480635]
本稿では,mipソルバの2つのキーサブタスクに学習を適用し,高品質なジョイント変数割当を生成し,その割当と最適課題との客観的値の差を限定する。
提案手法は,ニューラルネットワークに基づく2つのコンポーネントであるニューラルダイバーディングとニューラルブランチを構築し,SCIPなどのベースMIPソルバで使用する。
2つのGoogle生産データセットとMIPLIBを含む6つの現実世界データセットに対するアプローチを評価し、それぞれに別々のニューラルネットワークをトレーニングする。
論文 参考訳(メタデータ) (2020-12-23T09:33:11Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。