論文の概要: Training Data Augmentation for Deep Learning Radio Frequency Systems
- arxiv url: http://arxiv.org/abs/2010.00178v4
- Date: Mon, 4 Jan 2021 15:50:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 08:46:05.536329
- Title: Training Data Augmentation for Deep Learning Radio Frequency Systems
- Title(参考訳): 深層学習無線周波数システムのためのトレーニングデータ強化
- Authors: William H. Clark IV, Steven Hauser, William C. Headley, and Alan J.
Michaels
- Abstract要約: この研究は、トレーニング中に使用されるデータに焦点を当てている。
一般に、検査されたデータ型はそれぞれ、最終アプリケーションに有用なコントリビューションを持っている。
キャプチャーデータの利点にもかかわらず、ライブコレクションから生じる困難さとコストは、ピークパフォーマンスを達成するのに必要なデータ量を非現実的にすることが多い。
- 参考スコア(独自算出の注目度): 1.1199585259018459
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Applications of machine learning are subject to three major components that
contribute to the final performance metrics. Within the category of neural
networks, and deep learning specifically, the first two are the architecture
for the model being trained and the training approach used. This work focuses
on the third component, the data used during training. The primary questions
that arise are ``what is in the data'' and ``what within the data matters?''
Looking into the Radio Frequency Machine Learning (RFML) field of Automatic
Modulation Classification (AMC) as an example of a tool used for situational
awareness, the use of synthetic, captured, and augmented data are examined and
compared to provide insights about the quantity and quality of the available
data necessary to achieve desired performance levels. There are three questions
discussed within this work: (1) how useful a synthetically trained system is
expected to be when deployed without considering the environment within the
synthesis, (2) how can augmentation be leveraged within the RFML domain, and
lastly, (3) what impact knowledge of degradations to the signal caused by the
transmission channel contributes to the performance of a system. In general,
the examined data types each have useful contributions to a final application,
but captured data germane to the intended use case will always provide more
significant information and enable the greatest performance. Despite the
benefit of captured data, the difficulties and costs that arise from live
collection often make the quantity of data needed to achieve peak performance
impractical. This paper helps quantify the balance between real and synthetic
data, offering concrete examples where training data is parametrically varied
in size and source.
- Abstract(参考訳): 機械学習の応用には、最終的なパフォーマンス指標に寄与する3つの主要なコンポーネントがある。
ニューラルネットワークと特にディープラーニングのカテゴリの中で、最初の2つは、トレーニングされるモデルのアーキテクチャと、使用されるトレーニングアプローチである。
この作業は、トレーニングで使用されるデータである第3のコンポーネントに焦点を当てている。
主な質問は、状況把握のためのツールの例として、自動変調分類(amc)の高周波機械学習(rfml)分野を考察した「データに何があるのか」と「データに何があるのか」であり、合成、キャプチャ、拡張データの使用を調べて比較し、所望の性能レベルを達成するために必要な利用可能なデータの量と品質に関する洞察を提供する。
本研究では,(1)合成中の環境を考慮せずにデプロイする場合に,合成訓練されたシステムがどの程度有用か,(2)rfmlドメイン内で拡張をどのように活用できるか,(3)伝送路に起因する信号の劣化の知識がシステムの性能にどのような影響を与えるか,という3つの疑問が議論されている。
一般に、検査されたデータ型はそれぞれ最終アプリケーションに有用なコントリビューションを持っているが、意図されたユースケースに対するキャプチャされたデータは常により重要な情報を提供し、最大のパフォーマンスを実現する。
キャプチャーデータの利点にもかかわらず、ライブコレクションから生じる困難さとコストは、ピークパフォーマンスを達成するために必要なデータ量を非現実的にすることが多い。
本稿では,実データと合成データのバランスを定量化し,トレーニングデータのサイズとソースがパラメトリックに変化する具体的な例を示す。
関連論文リスト
- Data Augmentation for Traffic Classification [54.92823760790628]
Data Augmentation (DA) はコンピュータビジョン(CV)と自然言語処理(NLP)に広く採用されている技術である。
DAはネットワークのコンテキスト、特にトラフィック分類(TC)タスクにおいて、牽引力を得るのに苦労しています。
論文 参考訳(メタデータ) (2024-01-19T15:25:09Z) - D3A-TS: Denoising-Driven Data Augmentation in Time Series [0.0]
本研究は,分類と回帰問題に対する時系列におけるデータ拡張のための異なる手法の研究と分析に焦点をあてる。
提案手法は拡散確率モデルを用いており、近年画像処理の分野で成功している。
その結果、この手法が、分類と回帰モデルを訓練するための合成データを作成する上で、高い有用性を示している。
論文 参考訳(メタデータ) (2023-12-09T11:37:07Z) - A New Benchmark: On the Utility of Synthetic Data with Blender for Bare
Supervised Learning and Downstream Domain Adaptation [42.2398858786125]
コンピュータビジョンにおけるディープラーニングは、大規模ラベル付きトレーニングデータの価格で大きな成功を収めた。
制御不能なデータ収集プロセスは、望ましくない重複が存在する可能性のある非IIDトレーニングおよびテストデータを生成する。
これを回避するために、ドメインランダム化による3Dレンダリングによる合成データを生成する方法がある。
論文 参考訳(メタデータ) (2023-03-16T09:03:52Z) - Automatic Data Augmentation via Invariance-Constrained Learning [94.27081585149836]
下位のデータ構造は、しばしば学習タスクのソリューションを改善するために利用される。
データ拡張は、入力データに複数の変換を適用することで、トレーニング中にこれらの対称性を誘導する。
この作業は、学習タスクを解決しながらデータ拡張を自動的に適応することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2022-09-29T18:11:01Z) - Online Data Selection for Federated Learning with Limited Storage [53.46789303416799]
ネットワークデバイス間での分散機械学習を実現するために、フェデレートラーニング(FL)が提案されている。
デバイス上のストレージがFLの性能に与える影響はまだ調査されていない。
本研究では,デバイス上のストレージを限定したFLのオンラインデータ選択について検討する。
論文 参考訳(メタデータ) (2022-09-01T03:27:33Z) - Deep Feature Learning for Medical Acoustics [78.56998585396421]
本研究の目的は,医療音響の課題における学習内容の比較である。
ヒトの呼吸音と心臓の鼓動を健康的または病態の影響の2つのカテゴリに分類する枠組みが実装されている。
論文 参考訳(メタデータ) (2022-08-05T10:39:37Z) - Training from Zero: Radio Frequency Machine Learning Data Quantity Forecasting [0.0]
任意のアプリケーション空間でトレーニング中に使用されるデータは、一度デプロイされたシステムのパフォーマンスに直接関連している。
機械学習の分野で使われている親指の基本的なルールの1つは、より多くのデータがより良いモデルにつながることだ。
本研究では,電波周波数領域における変調分類問題について検討する。
論文 参考訳(メタデータ) (2022-05-07T18:45:06Z) - Pushing the Limits of Simple Pipelines for Few-Shot Learning: External
Data and Fine-Tuning Make a Difference [74.80730361332711]
コンピュータビジョンにおいて、ほとんどショット学習は重要かつトピック的な問題である。
単純なトランスフォーマーベースのパイプラインは、標準ベンチマークで驚くほど優れたパフォーマンスが得られることを示す。
論文 参考訳(メタデータ) (2022-04-15T02:55:58Z) - Deep Reinforcement Learning Assisted Federated Learning Algorithm for
Data Management of IIoT [82.33080550378068]
産業用IoT(Industrial Internet of Things)の継続的な拡大により、IIoT機器は毎回大量のユーザデータを生成する。
IIoTの分野で、これらの時系列データを効率的かつ安全な方法で管理する方法は、依然として未解決の問題である。
本稿では,無線ネットワーク環境におけるIIoT機器データ管理におけるFL技術の適用について検討する。
論文 参考訳(メタデータ) (2022-02-03T07:12:36Z) - MLReal: Bridging the gap between training on synthetic data and real
data applications in machine learning [1.9852463786440129]
本稿では,実際のデータ特徴を持つ合成データの教師付きトレーニングを強化するための新しいアプローチについて述べる。
トレーニング段階では、入力データは合成ドメインから、自動相関データは実ドメインからである。
推論/アプリケーション段階では、入力データは実サブセットドメインからであり、自己相関区間の平均は合成データサブセットドメインからである。
論文 参考訳(メタデータ) (2021-09-11T14:43:34Z) - Improving the Performance of Fine-Grain Image Classifiers via Generative
Data Augmentation [0.5161531917413706]
我々は、ロバスト生成アドリアルネットワーク(DAPPER GAN)の熟練した事前学習からデータ拡張を開発する。
DAPPER GANは、トレーニングイメージの新しいビューを自動的に生成するML分析支援ツールである。
本手法をStanford Carsデータセット上で実験的に評価し,車体形状とモデル分類精度の向上を実証した。
論文 参考訳(メタデータ) (2020-08-12T15:29:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。