論文の概要: Image Data Augmentation for the TAIGA-IACT Experiment with Conditional Generative Adversarial Networks
- arxiv url: http://arxiv.org/abs/2503.03982v1
- Date: Thu, 06 Mar 2025 00:09:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-07 17:59:00.624843
- Title: Image Data Augmentation for the TAIGA-IACT Experiment with Conditional Generative Adversarial Networks
- Title(参考訳): 条件付き生成逆ネットワークを用いたTAIGA-IACT実験のための画像データ拡張
- Authors: Yu. Yu. Dubenskaya, A. P. Kryukov, E. O. Gres, S. P. Polyakov, E. B. Postnikov, P. A. Volchugov, A. A. Vlaskina, D. P. Zhurov,
- Abstract要約: 現代の画像型大気圧チェレンコフ望遠鏡(IACT)は、大量のデータを自動で、理想的にはリアルタイムで分類しなければならない。
実際のIACTデータ上でニューラルネットワークをトレーニングする際の問題は、これらのデータが事前にラベル付けされる必要があるのに対して、そのようなラベル付けは困難であり、その結果が推定されることだ。
我々は,条件付き生成逆数ネットワーク(cGAN)を用いて,所望の型とエネルギーの人工的に生成されたイベントを用いてデータ拡張を行うことを提案する。
本稿では,cGANを用いてバランスの取れたデータセットを生成するための簡単なアルゴリズムについて述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Modern Imaging Atmospheric Cherenkov Telescopes (IACTs) generate a huge amount of data that must be classified automatically, ideally in real time. Currently, machine learning-based solutions are increasingly being used to solve classification problems. However, these classifiers require proper training data sets to work correctly. The problem with training neural networks on real IACT data is that these data need to be pre-labeled, whereas such labeling is difficult and its results are estimates. In addition, the distribution of incoming events is highly imbalanced. Firstly, there is an imbalance in the types of events, since the number of detected gamma quanta is significantly less than the number of protons. Secondly, the energy distribution of particles of the same type is also imbalanced, since high-energy particles are extremely rare. This imbalance results in poorly trained classifiers that, once trained, do not handle rare events correctly. Using only conventional Monte Carlo event simulation methods to solve this problem is possible, but extremely resource-intensive and time-consuming. To address this issue, we propose to perform data augmentation with artificially generated events of the desired type and energy using conditional generative adversarial networks (cGANs), distinguishing classes by energy values. In the paper, we describe a simple algorithm for generating balanced data sets using cGANs. Thus, the proposed neural network model produces both imbalanced data sets for physical analysis as well as balanced data sets suitable for training other neural networks.
- Abstract(参考訳): 現代の画像型大気圧チェレンコフ望遠鏡(IACT)は、大量のデータを自動で、理想的にはリアルタイムで分類しなければならない。
現在、分類問題の解決に機械学習ベースのソリューションがますます使われている。
しかし、これらの分類器は適切なトレーニングデータセットを正しく動作させる必要がある。
実際のIACTデータ上でニューラルネットワークをトレーニングする際の問題は、これらのデータが事前にラベル付けされる必要があるのに対して、そのようなラベル付けは困難であり、その結果が推定されることだ。
さらに、入ってくる事象の分布は極めて不均衡である。
第一に、検出されたガンマ量子の数はプロトンの数よりも著しく少ないため、イベントの種類には不均衡がある。
第二に、高エネルギー粒子は極めて稀であるため、同じタイプの粒子のエネルギー分布も不均衡である。
この不均衡は、訓練済みの希少事象を正しく扱わない、訓練の不十分な分類器をもたらす。
この問題を解決するために従来のモンテカルロのイベントシミュレーション法のみを用いることは可能であるが、資源集約的で時間を要する。
この問題に対処するために,条件付き生成逆数ネットワーク(cGAN)を用いて,所望の型とエネルギーの人工的に生成されたイベントを用いてデータ拡張を行い,クラスをエネルギー値で識別する手法を提案する。
本稿では,cGANを用いてバランスの取れたデータセットを生成するための簡単なアルゴリズムについて述べる。
このように、提案したニューラルネットワークモデルは、物理解析のための不均衡データセットと、他のニューラルネットワークのトレーニングに適したバランスの取れたデータセットの両方を生成する。
関連論文リスト
- Diffusion-Based Neural Network Weights Generation [80.89706112736353]
D2NWGは拡散に基づくニューラルネットワーク重み生成技術であり、転送学習のために高性能な重みを効率よく生成する。
本稿では,ニューラルネットワーク重み生成のための遅延拡散パラダイムを再放送するために,生成的ハイパー表現学習を拡張した。
我々のアプローチは大規模言語モデル(LLM)のような大規模アーキテクチャにスケーラブルであり、現在のパラメータ生成技術の限界を克服しています。
論文 参考訳(メタデータ) (2024-02-28T08:34:23Z) - Skew-Probabilistic Neural Networks for Learning from Imbalanced Data [3.233103072575564]
本稿では,確率論的ニューラルネットワーク(PNN)とスキューノーマルカーネル関数を用いた不均衡なデータ指向分類器を提案する。
柔軟性を向上するスキュー正規分布を利用することで、提案したスキュー確率ニューラルネットワーク(SkewPNN)は、下層のクラス密度をよりよく表現できる。
いくつかのデータセットにおける実データ解析により、SkiwPNNとBA-SkewPNNは、バランスの取れたデータセットと不均衡なデータセットの両方において、最先端の機械学習手法よりも大幅に優れていることが示されている。
論文 参考訳(メタデータ) (2023-12-10T13:12:55Z) - Machine Learning Force Fields with Data Cost Aware Training [94.78998399180519]
分子動力学(MD)シミュレーションを加速するために機械学習力場(MLFF)が提案されている。
最もデータ効率のよいMLFFであっても、化学精度に達するには数百フレームの力とエネルギーのラベルが必要になる。
我々は、安価な不正確なデータと高価な正確なデータの組み合わせを利用して、MLFFのデータコストを下げる多段階計算フレームワークASTEROIDを提案する。
論文 参考訳(メタデータ) (2023-06-05T04:34:54Z) - Class-Balancing Diffusion Models [57.38599989220613]
クラスバランシング拡散モデル(CBDM)は、分散調整正規化器をソリューションとして訓練する。
提案手法は,CIFAR100/CIFAR100LTデータセットで生成結果をベンチマークし,下流認識タスクにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2023-04-30T20:00:14Z) - Effective Class-Imbalance learning based on SMOTE and Convolutional
Neural Networks [0.1074267520911262]
不均衡データ(ID)は、機械学習(ML)モデルから満足な結果を得るための問題である。
本稿では,Deep Neural Networks(DNN)とConvolutional Neural Networks(CNN)に基づく手法の有効性を検討する。
信頼性の高い結果を得るために,ランダムにシャッフルしたデータ分布を用いて100回実験を行った。
論文 参考訳(メタデータ) (2022-09-01T07:42:16Z) - Effect of Balancing Data Using Synthetic Data on the Performance of
Machine Learning Classifiers for Intrusion Detection in Computer Networks [3.233545237942899]
アカデミックと産業の研究者たちは、コンピュータネットワークのための侵入検知システム(IDSe)の設計と実装に機械学習(ML)技術を使用した。
このようなシステムで使用される多くのデータセットでは、データは不均衡である(つまり、すべてのクラスが同じ量のサンプルを持っているわけではない)。
また,CTGANが生成した合成試料とバランスの取れたデータセット上でのMLモデルのトレーニングにより,予測精度が最大8%向上した。
論文 参考訳(メタデータ) (2022-04-01T00:25:11Z) - A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data [71.9573352891936]
本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。
楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
論文 参考訳(メタデータ) (2022-01-28T10:01:37Z) - Convolutional generative adversarial imputation networks for
spatio-temporal missing data in storm surge simulations [86.5302150777089]
GAN(Generative Adversarial Imputation Nets)とGANベースの技術は、教師なし機械学習手法として注目されている。
提案手法を Con Conval Generative Adversarial Imputation Nets (Conv-GAIN) と呼ぶ。
論文 参考訳(メタデータ) (2021-11-03T03:50:48Z) - Distributionally Robust Semi-Supervised Learning Over Graphs [68.29280230284712]
グラフ構造化データに対する半教師付き学習(SSL)は、多くのネットワークサイエンスアプリケーションに現れる。
グラフ上の学習を効率的に管理するために,近年,グラフニューラルネットワーク(GNN)の変種が開発されている。
実際に成功したにも拘わらず、既存の手法のほとんどは、不確実な結節属性を持つグラフを扱うことができない。
ノイズ測定によって得られたデータに関連する分布の不確実性によっても問題が発生する。
分散ロバストな学習フレームワークを開発し,摂動に対する定量的ロバスト性を示すモデルを訓練する。
論文 参考訳(メタデータ) (2021-10-20T14:23:54Z) - Balanced-MixUp for Highly Imbalanced Medical Image Classification [19.338350044289736]
そこで本研究では,MixUp正則化手法に基づくトレーニングデータをサンプリングする新しいメカニズムを提案する。
我々は、高不均衡な網膜画像のデータセットと、胃腸内ビデオフレームの長いテールデータセットを実験した。
論文 参考訳(メタデータ) (2021-09-20T21:31:31Z) - Class Balancing GAN with a Classifier in the Loop [58.29090045399214]
本稿では,GANを学習するための理論的動機付けクラスバランス正則化器を提案する。
我々の正規化器は、訓練済みの分類器からの知識を利用して、データセット内のすべてのクラスのバランスの取れた学習を確実にします。
複数のデータセットにまたがる既存手法よりも優れた性能を達成し,長期分布の学習表現における正規化器の有用性を実証する。
論文 参考訳(メタデータ) (2021-06-17T11:41:30Z) - Improving Uncertainty Calibration via Prior Augmented Data [56.88185136509654]
ニューラルネットワークは、普遍関数近似器として機能することで、複雑なデータ分布から学習することに成功した。
彼らはしばしば予測に自信過剰であり、不正確で誤った確率的予測に繋がる。
本稿では,モデルが不当に過信である特徴空間の領域を探索し,それらの予測のエントロピーをラベルの以前の分布に対して条件的に高める手法を提案する。
論文 参考訳(メタデータ) (2021-02-22T07:02:37Z) - The Gaussian equivalence of generative models for learning with shallow
neural networks [30.47878306277163]
本研究では,事前学習した生成モデルから得られたデータに基づいて学習したニューラルネットワークの性能について検討する。
この等価性を裏付ける厳密で解析的で数値的な証拠を3本提供します。
これらの結果は、現実的なデータを持つ機械学習モデルの理論研究への有効な道を開く。
論文 参考訳(メタデータ) (2020-06-25T21:20:09Z) - Imbalanced Data Learning by Minority Class Augmentation using Capsule
Adversarial Networks [31.073558420480964]
本稿では,2つの同時手法を合体させて,不均衡な画像のバランスを回復する手法を提案する。
我々のモデルでは、生成的および識別的ネットワークは、新しい競争力のあるゲームをする。
カプセルGANの合体は、畳み込みGANと比較して非常に少ないパラメータで重なり合うクラスを認識するのに効果的である。
論文 参考訳(メタデータ) (2020-04-05T12:36:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。