論文の概要: Data Augmentation with Manifold Barycenters
- arxiv url: http://arxiv.org/abs/2104.00925v1
- Date: Fri, 2 Apr 2021 08:07:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 13:49:03.711208
- Title: Data Augmentation with Manifold Barycenters
- Title(参考訳): Manifold Barycentersによるデータ拡張
- Authors: Iaroslav Bespalov, Nazar Buzun, Oleg Kachan and Dmitry V. Dylov
- Abstract要約: データバリーセンタの多様体における利用可能な知識を表現する新しい方法を提案する。
このアプローチをランドマーク検出の問題に適用し、データセット内の利用可能なランドマークデータを強化します。
提案手法は,従来の拡張手法で得られた結果よりも,元のデータ結果に留まらず,品質指標のオーバーフィッティングを低減し,改善する。
- 参考スコア(独自算出の注目度): 8.201100713224003
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The training of Generative Adversarial Networks (GANs) requires a large
amount of data, stimulating the development of new data augmentation methods to
alleviate the challenge. Oftentimes, these methods either fail to produce
enough new data or expand the dataset beyond the original knowledge domain. In
this paper, we propose a new way of representing the available knowledge in the
manifold of data barycenters. Such a representation allows performing data
augmentation based on interpolation between the nearest data elements using
Wasserstein distance. The proposed method finds cliques in the
nearest-neighbors graph and, at each sampling iteration, randomly draws one
clique to compute the Wasserstein barycenter with random uniform weights. These
barycenters then become the new natural-looking elements that one could add to
the dataset. We apply this approach to the problem of landmarks detection and
augment the available landmarks data within the dataset. Additionally, the idea
is validated on cardiac data for the task of medical segmentation. Our approach
reduces the overfitting and improves the quality metrics both beyond the
original data outcome and beyond the result obtained with classical
augmentation methods.
- Abstract(参考訳): generative adversarial networks (gans) のトレーニングには大量のデータが必要であり、課題を緩和するための新しいデータ拡張手法の開発を刺激している。
多くの場合、これらのメソッドは十分な新しいデータの生成に失敗するか、データセットを元の知識ドメインを超えて拡張する。
本稿では,データバリセンタの多様体において利用可能な知識を表現する新しい方法を提案する。
このような表現は、ワッサーシュタイン距離を用いて最も近いデータ要素間の補間に基づくデータ拡張を可能にする。
提案手法は最寄りのグラフからクランクを見つけ、各サンプリングイテレーションでランダムに1つのクランクを描画し、ランダムな一様重みでワッサースタイン・バリセンタを計算する。
これらのバリセンターは、データセットに追加できる新しい自然な要素になる。
このアプローチをランドマーク検出の問題に適用し、データセット内の利用可能なランドマークデータを拡張します。
さらに、このアイデアは、医学的セグメンテーションのタスクの心臓データで検証される。
提案手法は,従来の拡張手法で得られた結果よりも,元のデータ結果よりも品質指標のオーバーフィットを低減し,改善する。
関連論文リスト
- Personalized Federated Learning via Active Sampling [50.456464838807115]
本稿では,類似した(あるいは関連する)データジェネレータを逐次同定する手法を提案する。
本手法は,局所的なデータセットを用いて勾配ステップの効果を評価することにより,データ生成の関連性を評価する。
データ生成器が提供する局所的データセットを用いて仮説を更新するために、勾配ステップの適切な一般化により、この手法を非パラメトリックモデルに拡張する。
論文 参考訳(メタデータ) (2024-09-03T17:12:21Z) - Data Augmentations in Deep Weight Spaces [89.45272760013928]
そこで本研究では,Mixup法に基づく新しい拡張手法を提案する。
既存のベンチマークと新しいベンチマークでこれらのテクニックのパフォーマンスを評価する。
論文 参考訳(メタデータ) (2023-11-15T10:43:13Z) - Exploring Data Redundancy in Real-world Image Classification through
Data Selection [20.389636181891515]
ディープラーニングモデルはトレーニングに大量のデータを必要とすることが多く、結果としてコストが増大する。
実世界の画像データの冗長性を調べるために,シナプスインテリジェンスと勾配ノルムに基づく2つのデータ評価指標を提案する。
オンラインおよびオフラインのデータ選択アルゴリズムは、検査されたデータ値に基づいてクラスタリングとグループ化によって提案される。
論文 参考訳(メタデータ) (2023-06-25T03:31:05Z) - Dataset Distillation via Factorization [58.8114016318593]
既存のデータセット蒸留(DD)ベースラインに移植可能なプラグ・アンド・プレイ戦略であるEmphHaBaと呼ばれるEmphdataset Factorizationアプローチを導入する。
emphHaBaは、データセットをデータemphHallucinationネットワークとemphBaseの2つのコンポーネントに分解する方法を探っている。
提案手法は, 圧縮パラメータの総数を最大65%削減しつつ, 下流の分類タスクを従来に比べて大幅に改善することができる。
論文 参考訳(メタデータ) (2022-10-30T08:36:19Z) - Invariance Learning in Deep Neural Networks with Differentiable Laplace
Approximations [76.82124752950148]
我々はデータ拡張を選択するための便利な勾配法を開発した。
我々はKronecker-factored Laplace近似を我々の目的とする限界確率に近似する。
論文 参考訳(メタデータ) (2022-02-22T02:51:11Z) - Feature transforms for image data augmentation [74.12025519234153]
画像分類において、多くの拡張アプローチは単純な画像操作アルゴリズムを利用する。
本研究では,14種類の拡張アプローチを組み合わせて生成した画像を追加することで,データレベルでのアンサンブルを構築する。
事前トレーニングされたResNet50ネットワークは、各拡張メソッドから派生した画像を含むトレーニングセットに基づいて微調整される。
論文 参考訳(メタデータ) (2022-01-24T14:12:29Z) - Weakly Supervised Change Detection Using Guided Anisotropic Difusion [97.43170678509478]
我々は、このようなデータセットを変更検出の文脈で活用するのに役立つ独自のアイデアを提案する。
まず,意味的セグメンテーション結果を改善する誘導異方性拡散(GAD)アルゴリズムを提案する。
次に、変化検出に適した2つの弱い教師付き学習戦略の可能性を示す。
論文 参考訳(メタデータ) (2021-12-31T10:03:47Z) - Uniform-in-Phase-Space Data Selection with Iterative Normalizing Flows [0.0]
データの位相空間を均一に分散するようにデータポイントを選択する戦略が提案されている。
データセットの小さなサブセットのみを使用して確率マップを構築する場合、レアデータポイントの確率を正確に推定するために反復法が用いられる。
提案フレームワークは、豊富なデータが利用可能であれば、データ効率のよい機械学習を可能にするための実行可能な経路として実証されている。
論文 参考訳(メタデータ) (2021-12-28T20:06:28Z) - Complex Wavelet SSIM based Image Data Augmentation [0.0]
我々は,MNIST手書き画像データセットを数値認識に用いる画像データセットとして検討する。
このデータセットの弾性変形に最もよく用いられる拡張手法の1つを詳細に検討する。
本稿では、複雑なウェーブレット構造類似度指標(CWSSIM)と呼ばれる類似度尺度を用いて、無関係なデータを選択的にフィルタリングする手法を提案する。
論文 参考訳(メタデータ) (2020-07-11T21:11:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。