論文の概要: Joint NMF for Identification of Shared Features in Datasets and a
Dataset Distance Measure
- arxiv url: http://arxiv.org/abs/2207.05112v1
- Date: Mon, 11 Jul 2022 18:08:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-13 14:28:35.314420
- Title: Joint NMF for Identification of Shared Features in Datasets and a
Dataset Distance Measure
- Title(参考訳): データセットにおける共有特徴の識別のためのジョイントnmfとデータセット距離測定
- Authors: Hannah Friedman, Amani R. Maina-Kilaas, Julianna Schalkwyk, Hina
Ahmed, Jamie Haddock
- Abstract要約: 連立非負行列因数分解を用いてデータセットの共有特徴を決定する新しい手法を導出する。
本手法は,画像とテキストのデータセットにおける構造的差異の識別に成功している。
- 参考スコア(独自算出の注目度): 1.6099403809839032
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we derive a new method for determining shared features of
datasets by employing joint non-negative matrix factorization and analyzing the
resulting factorizations. Our approach uses the joint factorization of two
dataset matrices $X_1,X_2$ into non-negative matrices $X_1 = AS_1, X_2 = AS_2$
to derive a similarity measure that determines how well a shared basis for
$X_1, X_2$ approximates each dataset. We also propose a dataset distance
measure built upon this method and the learned factorization. Our method is
able to successfully identity differences in structure in both image and text
datasets. Potential applications include classification, detecting plagiarism
or other manipulation, and learning relationships between data sets.
- Abstract(参考訳): 本稿では,非負行列因子分解を併用し,結果の因子分解を分析することにより,データセットの共有特徴を決定する新しい手法を提案する。
x_1,x_2$ を非負行列 $x_1 = as_1, x_2 = as_2$ に結合分解し、共有基底の $x_1, x_2$ が各データセットにどの程度近いかを決定する類似度尺度を導出する。
また,本手法と学習因子化に基づくデータセット距離測定法を提案する。
本手法は画像とテキストのデータセットにおける構造的差異の識別に成功している。
潜在的な応用としては、分類、盗作などの操作の検出、データセット間の関係の学習などがある。
関連論文リスト
- Induced Covariance for Causal Discovery in Linear Sparse Structures [55.2480439325792]
因果モデルでは、観測データから変数間の因果関係を解き明かそうとしている。
本稿では,変数が線形に疎結合な関係を示す設定のための新しい因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-02T04:01:38Z) - A Closer Look at Deep Learning on Tabular Data [52.50778536274327]
タブラルデータは、機械学習の様々な領域で広く使われている。
Deep Neural Network(DNN)ベースの手法は、ツリーベースに匹敵する有望なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-07-01T04:24:07Z) - Interpetable Target-Feature Aggregation for Multi-Task Learning based on Bias-Variance Analysis [53.38518232934096]
マルチタスク学習(MTL)は、タスク間の共有知識を活用し、一般化とパフォーマンスを改善するために設計された強力な機械学習パラダイムである。
本稿では,タスククラスタリングと特徴変換の交点におけるMTL手法を提案する。
両段階において、鍵となる側面は減った目標と特徴の解釈可能性を維持することである。
論文 参考訳(メタデータ) (2024-06-12T08:30:16Z) - Preserving correlations: A statistical method for generating synthetic data [0.0]
与えられたデータセットから統計的に代表的な合成データを生成する手法を提案する。
本手法の主な目的は,生成したデータに対して,元のデータに存在する特徴相関を模倣することである。
統計的マップの構築と、このマップを用いて合成観測を生成する方法の両方において、我々のアルゴリズムを詳細に記述する。
論文 参考訳(メタデータ) (2024-03-03T10:35:46Z) - Multi-modal Multi-view Clustering based on Non-negative Matrix
Factorization [0.0]
本稿では,マルチモーダルクラスタリングアルゴリズムについて検討し,マルチモーダル・マルチビュー非負行列分解法を提案する。
実験の結果,様々なデータセットを用いて評価した提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-08-09T08:06:03Z) - Non-Negative Matrix Factorization with Scale Data Structure Preservation [23.31865419578237]
本稿では,データ表現と次元縮小のために設計された非負行列分解法に属するモデルについて述べる。
この考え方は、NMFコスト関数に、元のデータポイントと変換されたデータポイントのペアの類似度行列のスケール関係を課すペナルティ項を追加することである。
提案したクラスタリングアルゴリズムは,既存のNMFベースのアルゴリズムや,実際のデータセットに適用した場合の多様体学習ベースのアルゴリズムと比較される。
論文 参考訳(メタデータ) (2022-09-22T09:32:18Z) - Comparative Study of Inference Methods for Interpolative Decomposition [4.913248451323163]
補間分解(ID)学習のための自動関係決定(ARD)を用いた確率モデルを提案する。
CCLE $EC50$, CCLE $IC50$, Gene Body Methylation, promoteder Methylation datasets with different size, and dimensions。
論文 参考訳(メタデータ) (2022-06-29T11:37:05Z) - Robust Trimmed k-means [70.88503833248159]
本稿では,外乱点とクラスタポイントを同時に識別するRobust Trimmed k-means (RTKM)を提案する。
RTKMは他の方法と競合することを示す。
論文 参考訳(メタデータ) (2021-08-16T15:49:40Z) - Feature Weighted Non-negative Matrix Factorization [92.45013716097753]
本稿では,FNMF(Feature weighted Non- negative Matrix Factorization)を提案する。
FNMFはその重要性に応じて特徴の重みを適応的に学習する。
提案する最適化アルゴリズムを用いて効率的に解くことができる。
論文 参考訳(メタデータ) (2021-03-24T21:17:17Z) - Applications of Online Nonnegative Matrix Factorization to Image and
Time-Series Data [7.554605806396426]
オンライン非負行列分解アルゴリズムを用いて相関データセットのアンサンブルから共同辞書原子を学習する方法を示す。
OnMFアルゴリズムに基づく時系列データセットの時間辞書学習方式を提案する。
論文 参考訳(メタデータ) (2020-11-10T20:33:20Z) - Supervised Quantile Normalization for Low-rank Matrix Approximation [50.445371939523305]
我々は、$X$ の値と $UV$ の値を行ワイズで操作できる量子正規化演算子のパラメータを学習し、$X$ の低ランク表現の質を改善する。
本稿では,これらの手法が合成およびゲノムデータセットに適用可能であることを実証する。
論文 参考訳(メタデータ) (2020-02-08T21:06:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。