論文の概要: Joint NMF for Identification of Shared Features in Datasets and a
Dataset Distance Measure
- arxiv url: http://arxiv.org/abs/2207.05112v1
- Date: Mon, 11 Jul 2022 18:08:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-13 14:28:35.314420
- Title: Joint NMF for Identification of Shared Features in Datasets and a
Dataset Distance Measure
- Title(参考訳): データセットにおける共有特徴の識別のためのジョイントnmfとデータセット距離測定
- Authors: Hannah Friedman, Amani R. Maina-Kilaas, Julianna Schalkwyk, Hina
Ahmed, Jamie Haddock
- Abstract要約: 連立非負行列因数分解を用いてデータセットの共有特徴を決定する新しい手法を導出する。
本手法は,画像とテキストのデータセットにおける構造的差異の識別に成功している。
- 参考スコア(独自算出の注目度): 1.6099403809839032
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we derive a new method for determining shared features of
datasets by employing joint non-negative matrix factorization and analyzing the
resulting factorizations. Our approach uses the joint factorization of two
dataset matrices $X_1,X_2$ into non-negative matrices $X_1 = AS_1, X_2 = AS_2$
to derive a similarity measure that determines how well a shared basis for
$X_1, X_2$ approximates each dataset. We also propose a dataset distance
measure built upon this method and the learned factorization. Our method is
able to successfully identity differences in structure in both image and text
datasets. Potential applications include classification, detecting plagiarism
or other manipulation, and learning relationships between data sets.
- Abstract(参考訳): 本稿では,非負行列因子分解を併用し,結果の因子分解を分析することにより,データセットの共有特徴を決定する新しい手法を提案する。
x_1,x_2$ を非負行列 $x_1 = as_1, x_2 = as_2$ に結合分解し、共有基底の $x_1, x_2$ が各データセットにどの程度近いかを決定する類似度尺度を導出する。
また,本手法と学習因子化に基づくデータセット距離測定法を提案する。
本手法は画像とテキストのデータセットにおける構造的差異の識別に成功している。
潜在的な応用としては、分類、盗作などの操作の検出、データセット間の関係の学習などがある。
関連論文リスト
- Multi-modal Multi-view Clustering based on Non-negative Matrix
Factorization [0.0]
本稿では,マルチモーダルクラスタリングアルゴリズムについて検討し,マルチモーダル・マルチビュー非負行列分解法を提案する。
実験の結果,様々なデータセットを用いて評価した提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-08-09T08:06:03Z) - Non-Negative Matrix Factorization with Scale Data Structure Preservation [23.31865419578237]
本稿では,データ表現と次元縮小のために設計された非負行列分解法に属するモデルについて述べる。
この考え方は、NMFコスト関数に、元のデータポイントと変換されたデータポイントのペアの類似度行列のスケール関係を課すペナルティ項を追加することである。
提案したクラスタリングアルゴリズムは,既存のNMFベースのアルゴリズムや,実際のデータセットに適用した場合の多様体学習ベースのアルゴリズムと比較される。
論文 参考訳(メタデータ) (2022-09-22T09:32:18Z) - Comparative Study of Inference Methods for Interpolative Decomposition [4.913248451323163]
補間分解(ID)学習のための自動関係決定(ARD)を用いた確率モデルを提案する。
CCLE $EC50$, CCLE $IC50$, Gene Body Methylation, promoteder Methylation datasets with different size, and dimensions。
論文 参考訳(メタデータ) (2022-06-29T11:37:05Z) - Detection Hub: Unifying Object Detection Datasets via Query Adaptation
on Language Embedding [137.3719377780593]
新しいデザイン(De Detection Hubという名前)は、データセット認識とカテゴリ整列である。
データセットの不整合を緩和し、検出器が複数のデータセットをまたいで学習するための一貫性のあるガイダンスを提供する。
データセット間のカテゴリは、ワンホットなカテゴリ表現を単語埋め込みに置き換えることで、意味的に統一された空間に整列される。
論文 参考訳(メタデータ) (2022-06-07T17:59:44Z) - Adaptive Attribute and Structure Subspace Clustering Network [49.040136530379094]
自己表現型サブスペースクラスタリングネットワークを提案する。
まず、入力データサンプルを表現する自動エンコーダについて検討する。
そこで我々は, 局所的な幾何学的構造を捉えるために, 混合符号と対称構造行列を構築した。
構築された属性構造と行列に対して自己表現を行い、親和性グラフを学習する。
論文 参考訳(メタデータ) (2021-09-28T14:00:57Z) - Robust Trimmed k-means [70.88503833248159]
本稿では,外乱点とクラスタポイントを同時に識別するRobust Trimmed k-means (RTKM)を提案する。
RTKMは他の方法と競合することを示す。
論文 参考訳(メタデータ) (2021-08-16T15:49:40Z) - Feature Weighted Non-negative Matrix Factorization [92.45013716097753]
本稿では,FNMF(Feature weighted Non- negative Matrix Factorization)を提案する。
FNMFはその重要性に応じて特徴の重みを適応的に学習する。
提案する最適化アルゴリズムを用いて効率的に解くことができる。
論文 参考訳(メタデータ) (2021-03-24T21:17:17Z) - Applications of Online Nonnegative Matrix Factorization to Image and
Time-Series Data [7.554605806396426]
オンライン非負行列分解アルゴリズムを用いて相関データセットのアンサンブルから共同辞書原子を学習する方法を示す。
OnMFアルゴリズムに基づく時系列データセットの時間辞書学習方式を提案する。
論文 参考訳(メタデータ) (2020-11-10T20:33:20Z) - Supervised Quantile Normalization for Low-rank Matrix Approximation [50.445371939523305]
我々は、$X$ の値と $UV$ の値を行ワイズで操作できる量子正規化演算子のパラメータを学習し、$X$ の低ランク表現の質を改善する。
本稿では,これらの手法が合成およびゲノムデータセットに適用可能であることを実証する。
論文 参考訳(メタデータ) (2020-02-08T21:06:02Z) - Conjoined Dirichlet Process [63.89763375457853]
我々はディリクレ過程に基づく新しい非パラメトリック確率的ビクラスタリング法を開発し、列と列の双方に強い共起を持つビクラスタを同定する。
本手法はテキストマイニングと遺伝子発現解析の2つの異なる応用に適用し,既存の手法に比べて多くの設定でビクラスタ抽出を改善することを示す。
論文 参考訳(メタデータ) (2020-02-08T19:41:23Z) - Heterogeneous Transfer Learning in Ensemble Clustering [0.0]
類似したラベル付きデータが利用できるクラスタリング問題を考える。
本手法は,データの構造的特徴を記述したメタ機能の構築に基づく。
モンテカルロモデルを用いた実験により,その効率性が確認された。
論文 参考訳(メタデータ) (2020-01-20T16:03:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。