論文の概要: Neural Network Characterization and Entropy Regulated Data Balancing
through Principal Component Analysis
- arxiv url: http://arxiv.org/abs/2312.01392v1
- Date: Sun, 3 Dec 2023 13:39:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-12-05 17:31:34.228938
- Title: Neural Network Characterization and Entropy Regulated Data Balancing
through Principal Component Analysis
- Title(参考訳): 主成分分析によるニューラルネットワーク特性とエントロピー制御データバランシング
- Authors: David Yevick and Karolina Hutchison
- Abstract要約: 本稿では,ニューラルネットワークの動作と,トレーニングデータの低次主成分による空間へのデータレコードの投影から形成される分布との関係について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper examines the relationship between the behavior of a neural network
and the distribution formed from the projections of the data records into the
space spanned by the low-order principal components of the training data. For
example, in a benchmark calculation involving rotated and unrotated MNIST
digits, classes (digits) that are mapped far from the origin in a
low-dimensional principal component space and that overlap minimally with other
digits converge rapidly and exhibit high degrees of accuracy in neural network
calculations that employ the associated components of each data record as
inputs. Further, if the space spanned by these low-order principal components
is divided into bins and the input data records that are mapped into a given
bin averaged, the resulting pattern can be distinguished by its geometric
features which interpolate between those of adjacent bins in an analogous
manner to variational autoencoders. Based on this observation, a simply
realized data balancing procedure can be realized by evaluating the entropy
associated with each histogram bin and subsequently repeating the original
image data associated with the bin by a number of times that is determined from
this entropy.
- Abstract(参考訳): 本稿では,ニューラルネットワークの動作と,トレーニングデータの低次主成分による空間へのデータレコードの投影から形成される分布との関係について検討する。
例えば、回転したmnist桁と回転しないmnist桁を含むベンチマーク計算では、低次元の主成分空間の原点から遠く離れ、他の桁と最小に重なるクラス(digits)が急速に収束し、各データレコードの関連成分を入力として使用するニューラルネットワーク計算において高い精度を示す。
さらに、これらの低次主成分にまたがる空間をビンに分割し、入力データレコードを所定のビン平均値にマップすると、そのパターンは、隣接するビンの空間を変分オートエンコーダに類似した方法で補間する幾何学的特徴によって区別することができる。
この観察に基づいて、各ヒストグラムビンに関連付けられたエントロピーを評価し、その後、このエントロピーから決定されるビンに関連付けられた元の画像データを何回繰り返すことで、簡易に実現されたデータバランス手順を実現することができる。
関連論文リスト
- Robust Tangent Space Estimation via Laplacian Eigenvector Gradient Orthogonalization [48.25304391127552]
データ多様体の接空間を推定することは、データ解析の基本的な問題である。
局所接空間推定を導くために,データのグローバル構造を利用したラプラシアン固有ベクトル勾配直交化法(LEGO)を提案する。
論文 参考訳(メタデータ) (2025-10-02T17:59:45Z) - Mixed precision accumulation for neural network inference guided by componentwise forward error analysis [2.4374097382908477]
ニューラルネットワークの推論のための数学的に確立された混合精度蓄積戦略を提案する。
我々の戦略は、ニューラルネットワークの前方通過におけるエラーの伝播を説明する新しいコンポーネントワイズ・フォワード・エラー分析に基づいている。
論文 参考訳(メタデータ) (2025-03-19T09:19:11Z) - Steinmetz Neural Networks for Complex-Valued Data [23.80312814400945]
並列実値デッツワークと結合出力からなるDNNを用いて複素値データを処理する新しい手法を提案する。
提案するアーキテクチャのクラスは、Steinmetz Neural Networksと呼ばれ、多視点学習を利用して、潜在空間内でより解釈可能な表現を構築する。
提案手法は,これらのネットワークがベンチマーク・データセットや合成例で実現した改良性能と付加雑音を示す数値実験である。
論文 参考訳(メタデータ) (2024-09-16T08:26:06Z) - Resampling and averaging coordinates on data [1.660242118349614]
点雲上の固有座標を頑健に計算するアルゴリズムを導入する。
候補座標の集合をクラスタリングし、位相データ解析から形状記述子を用いて代表埋め込みのサブセットを同定する。
最終的な出力は、一般化されたProcrustes解析を用いて代表埋め込みの平均として得られる埋め込みである。
論文 参考訳(メタデータ) (2024-08-02T16:37:33Z) - Message-Passing Monte Carlo: Generating low-discrepancy point sets via Graph Neural Networks [64.39488944424095]
本稿では,Message-Passing Monte Carlo という低差点集合を生成する機械学習手法を提案する。
MPMC点は、低次元と少数の点との差に関して、最適かほぼ最適であることが実証的に示されている。
論文 参考訳(メタデータ) (2024-05-23T21:17:20Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Multilayer Multiset Neuronal Networks -- MMNNs [55.2480439325792]
本研究は,2層以上の類似性ニューロンを組み込んだ多層神経回路網について述べる。
また,回避すべき画像領域に割り当てられる反プロトタイプ点の利用についても検討した。
論文 参考訳(メタデータ) (2023-08-28T12:55:13Z) - A Recursively Recurrent Neural Network (R2N2) Architecture for Learning
Iterative Algorithms [64.3064050603721]
本研究では,リカレントニューラルネットワーク (R2N2) にランゲ・クッタニューラルネットワークを一般化し,リカレントニューラルネットワークを最適化した反復アルゴリズムの設計を行う。
本稿では, 線形方程式系に対するクリロフ解法, 非線形方程式系に対するニュートン・クリロフ解法, 常微分方程式に対するルンゲ・クッタ解法と類似の繰り返しを計算問題クラスの入力・出力データに対して提案した超構造内における重みパラメータの正規化について述べる。
論文 参考訳(メタデータ) (2022-11-22T16:30:33Z) - Intrinsic dimension estimation for discrete metrics [65.5438227932088]
本稿では,離散空間に埋め込まれたデータセットの内在次元(ID)を推定するアルゴリズムを提案する。
我々は,その精度をベンチマークデータセットで示すとともに,種鑑定のためのメダゲノミクスデータセットの分析に応用する。
このことは、列の空間の高次元性にもかかわらず、蒸発圧が低次元多様体に作用することを示唆している。
論文 参考訳(メタデータ) (2022-07-20T06:38:36Z) - The Mean Dimension of Neural Networks -- What causes the interaction
effects? [0.9208007322096533]
Owen氏とHoyt氏は先日、この有効次元が、人工ニューラルネットワークの基盤となる入出力マッピングに関する重要な構造情報を提供することを示した。
本研究は,与えられたデータセットからの平均次元を計算可能な推定手順を提案する。
論文 参考訳(メタデータ) (2022-07-11T14:00:06Z) - Information Entropy Initialized Concrete Autoencoder for Optimal Sensor
Placement and Reconstruction of Geophysical Fields [58.720142291102135]
そこで本稿では,スパーク計測による地場再構成のためのセンサ配置の最適化について提案する。
本研究では, (a) 温度と (b) バレンツ海周辺の塩分濃度場とスバルバルド諸島群を例に示す。
得られた最適センサ位置は, 物理的解釈が明確であり, 海流の境界に対応することが判明した。
論文 参考訳(メタデータ) (2022-06-28T12:43:38Z) - Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。
データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文 参考訳(メタデータ) (2022-02-01T17:11:13Z) - Eigen Analysis of Self-Attention and its Reconstruction from Partial
Computation [58.80806716024701]
ドット積に基づく自己注意を用いて計算した注意点のグローバルな構造について検討する。
注意点の変動の大部分は低次元固有空間にあることがわかった。
トークンペアの部分的な部分集合に対してのみスコアを計算し、それを用いて残りのペアのスコアを推定する。
論文 参考訳(メタデータ) (2021-06-16T14:38:42Z) - SignalNet: A Low Resolution Sinusoid Decomposition and Estimation
Network [79.04274563889548]
本稿では,正弦波数を検出するニューラルネットワークアーキテクチャであるSignalNetを提案する。
基礎となるデータ分布と比較して,ネットワークの結果を比較するための最悪の学習しきい値を導入する。
シミュレーションでは、我々のアルゴリズムは常に3ビットデータのしきい値を超えることができるが、しばしば1ビットデータのしきい値を超えることはできない。
論文 参考訳(メタデータ) (2021-06-10T04:21:20Z) - Learning Optical Flow from a Few Matches [67.83633948984954]
密な相関体積表現は冗長であり、その中の要素のほんの一部で正確なフロー推定が達成できることを示した。
実験により,高い精度を維持しつつ計算コストとメモリ使用量を大幅に削減できることを示した。
論文 参考訳(メタデータ) (2021-04-05T21:44:00Z) - Tensor Laplacian Regularized Low-Rank Representation for Non-uniformly
Distributed Data Subspace Clustering [2.578242050187029]
低ランク表現(LRR)は、サブスペースクラスタリングにおけるデータポイントの局所性情報を破棄する。
本稿では,隣接ノードの変動数を容易にし,データの局所性情報を組み込むハイパーグラフモデルを提案する。
人工および実データを用いた実験により,提案手法の精度と精度が向上した。
論文 参考訳(メタデータ) (2021-03-06T08:22:24Z) - A Linearly Convergent Algorithm for Distributed Principal Component
Analysis [12.91948651812873]
本稿では,1時間スケール分散pcaアルゴリズムである分散sanger's algorithm(dsa)を提案する。
提案アルゴリズムは真の解の近傍に線形収束することを示した。
論文 参考訳(メタデータ) (2021-01-05T00:51:14Z) - Artificial Neural Networks to Impute Rounded Zeros in Compositional Data [0.0]
近年, 深層学習の手法が普及しているが, 構成データ分析には至っていない。
本稿では,人工ニューラルネットワークに基づく円周零点のインプット法を提案する。
annは、適度なサイズで丸められたゼロのデータセットを暗示するときに、競争力があるか、あるいはパフォーマンスが良いことを示すことができる。
論文 参考訳(メタデータ) (2020-12-18T15:31:23Z) - A Point-Cloud Deep Learning Framework for Prediction of Fluid Flow
Fields on Irregular Geometries [62.28265459308354]
ネットワークは空間位置とCFD量のエンドツーエンドマッピングを学習する。
断面形状の異なるシリンダーを過ぎる非圧縮層状定常流を考察する。
ネットワークは従来のCFDの数百倍の速さで流れ場を予測する。
論文 参考訳(メタデータ) (2020-10-15T12:15:02Z) - Learning a Deep Part-based Representation by Preserving Data
Distribution [21.13421736154956]
教師なし次元減少は、高次元データ認識問題において一般的に用いられる技法の1つである。
本稿では,データ分布を保存することにより,深部部分に基づく表現を学習し,新しいアルゴリズムを分散保存ネットワーク埋め込みと呼ぶ。
実世界のデータセットにおける実験結果から,提案アルゴリズムはクラスタ精度とAMIの点で優れた性能を示した。
論文 参考訳(メタデータ) (2020-09-17T12:49:36Z) - Optimal Structured Principal Subspace Estimation: Metric Entropy and
Minimax Rates [6.00362077400694]
本稿では,一般構造主部分空間推定問題の統計的解析のための統一的な枠組みを提案する。
非負のPCA/SVD、スパースPCA/SVD、サブスペース制約PCA/SVD、スペクトルクラスタリングなどである。
一般的な結果を特定の設定に適用すると、それらの問題に対する収束の最小値が得られる。
論文 参考訳(メタデータ) (2020-02-18T15:02:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。