Fugu-MT 論文翻訳(概要): Joint NMF for Identification of Shared Features in Datasets and a Dataset Distance Measure

論文の概要: Joint NMF for Identification of Shared Features in Datasets and a Dataset Distance Measure

arxiv url: http://arxiv.org/abs/2207.05112v1
Date: Mon, 11 Jul 2022 18:08:11 GMT
ステータス: 翻訳完了
システム内更新日: 2022-07-13 14:28:35.314420
Title: Joint NMF for Identification of Shared Features in Datasets and a Dataset Distance Measure
Title（参考訳）: データセットにおける共有特徴の識別のためのジョイントnmfとデータセット距離測定
Authors: Hannah Friedman, Amani R. Maina-Kilaas, Julianna Schalkwyk, Hina Ahmed, Jamie Haddock
Abstract要約: 連立非負行列因数分解を用いてデータセットの共有特徴を決定する新しい手法を導出する。本手法は,画像とテキストのデータセットにおける構造的差異の識別に成功している。
参考スコア（独自算出の注目度）: 1.6099403809839032
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper, we derive a new method for determining shared features of datasets by employing joint non-negative matrix factorization and analyzing the resulting factorizations. Our approach uses the joint factorization of two dataset matrices $X_1,X_2$ into non-negative matrices $X_1 = AS_1, X_2 = AS_2$ to derive a similarity measure that determines how well a shared basis for $X_1, X_2$ approximates each dataset. We also propose a dataset distance measure built upon this method and the learned factorization. Our method is able to successfully identity differences in structure in both image and text datasets. Potential applications include classification, detecting plagiarism or other manipulation, and learning relationships between data sets.
Abstract（参考訳）: 本稿では,非負行列因子分解を併用し,結果の因子分解を分析することにより,データセットの共有特徴を決定する新しい手法を提案する。 x_1,x_2$ を非負行列 $x_1 = as_1, x_2 = as_2$ に結合分解し、共有基底の $x_1, x_2$ が各データセットにどの程度近いかを決定する類似度尺度を導出する。また,本手法と学習因子化に基づくデータセット距離測定法を提案する。本手法は画像とテキストのデータセットにおける構造的差異の識別に成功している。潜在的な応用としては、分類、盗作などの操作の検出、データセット間の関係の学習などがある。

関連論文リスト

Personalized Coupled Tensor Decomposition for Multimodal Data Fusion: Uniqueness and Algorithms [15.520496676392955]
データ融合の課題に対処するパーソナライズされたCTDフレームワークを提案する。各データセットを2つのコンポーネントの和として表現するフレキシブルモデルが提案されている。共通成分と異なる成分を計算するための2つのアルゴリズムが提案されている。
論文参考訳（メタデータ） (2024-12-02T04:19:47Z)
Induced Covariance for Causal Discovery in Linear Sparse Structures [55.2480439325792]
因果モデルでは、観測データから変数間の因果関係を解き明かそうとしている。本稿では,変数が線形に疎結合な関係を示す設定のための新しい因果探索アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-10-02T04:01:38Z)
A Closer Look at Deep Learning on Tabular Data [52.50778536274327]
タブラルデータは、機械学習の様々な領域で広く使われている。 Deep Neural Network(DNN)ベースの手法は、ツリーベースに匹敵する有望なパフォーマンスを示している。
論文参考訳（メタデータ） (2024-07-01T04:24:07Z)
Interpetable Target-Feature Aggregation for Multi-Task Learning based on Bias-Variance Analysis [53.38518232934096]
マルチタスク学習(MTL)は、タスク間の共有知識を活用し、一般化とパフォーマンスを改善するために設計された強力な機械学習パラダイムである。本稿では,タスククラスタリングと特徴変換の交点におけるMTL手法を提案する。両段階において、鍵となる側面は減った目標と特徴の解釈可能性を維持することである。
論文参考訳（メタデータ） (2024-06-12T08:30:16Z)
Preserving correlations: A statistical method for generating synthetic data [0.0]
与えられたデータセットから統計的に代表的な合成データを生成する手法を提案する。本手法の主な目的は,生成したデータに対して,元のデータに存在する特徴相関を模倣することである。統計的マップの構築と、このマップを用いて合成観測を生成する方法の両方において、我々のアルゴリズムを詳細に記述する。
論文参考訳（メタデータ） (2024-03-03T10:35:46Z)
Multi-modal Multi-view Clustering based on Non-negative Matrix Factorization [0.0]
本稿では,マルチモーダルクラスタリングアルゴリズムについて検討し,マルチモーダル・マルチビュー非負行列分解法を提案する。実験の結果,様々なデータセットを用いて評価した提案手法の有効性が示された。
論文参考訳（メタデータ） (2023-08-09T08:06:03Z)
Non-Negative Matrix Factorization with Scale Data Structure Preservation [23.31865419578237]
本稿では,データ表現と次元縮小のために設計された非負行列分解法に属するモデルについて述べる。この考え方は、NMFコスト関数に、元のデータポイントと変換されたデータポイントのペアの類似度行列のスケール関係を課すペナルティ項を追加することである。提案したクラスタリングアルゴリズムは,既存のNMFベースのアルゴリズムや,実際のデータセットに適用した場合の多様体学習ベースのアルゴリズムと比較される。
論文参考訳（メタデータ） (2022-09-22T09:32:18Z)
Comparative Study of Inference Methods for Interpolative Decomposition [4.913248451323163]
補間分解(ID)学習のための自動関係決定(ARD)を用いた確率モデルを提案する。 CCLE $EC50$, CCLE $IC50$, Gene Body Methylation, promoteder Methylation datasets with different size, and dimensions。
論文参考訳（メタデータ） (2022-06-29T11:37:05Z)
Robust Trimmed k-means [70.88503833248159]
本稿では,外乱点とクラスタポイントを同時に識別するRobust Trimmed k-means (RTKM)を提案する。 RTKMは他の方法と競合することを示す。
論文参考訳（メタデータ） (2021-08-16T15:49:40Z)
Feature Weighted Non-negative Matrix Factorization [92.45013716097753]
本稿では,FNMF(Feature weighted Non- negative Matrix Factorization)を提案する。 FNMFはその重要性に応じて特徴の重みを適応的に学習する。提案する最適化アルゴリズムを用いて効率的に解くことができる。
論文参考訳（メタデータ） (2021-03-24T21:17:17Z)
Applications of Online Nonnegative Matrix Factorization to Image and Time-Series Data [7.554605806396426]
オンライン非負行列分解アルゴリズムを用いて相関データセットのアンサンブルから共同辞書原子を学習する方法を示す。 OnMFアルゴリズムに基づく時系列データセットの時間辞書学習方式を提案する。
論文参考訳（メタデータ） (2020-11-10T20:33:20Z)
Supervised Quantile Normalization for Low-rank Matrix Approximation [50.445371939523305]
我々は、$X$ の値と $UV$ の値を行ワイズで操作できる量子正規化演算子のパラメータを学習し、$X$ の低ランク表現の質を改善する。本稿では,これらの手法が合成およびゲノムデータセットに適用可能であることを実証する。
論文参考訳（メタデータ） (2020-02-08T21:06:02Z)
Conjoined Dirichlet Process [63.89763375457853]
我々はディリクレ過程に基づく新しい非パラメトリック確率的ビクラスタリング法を開発し、列と列の双方に強い共起を持つビクラスタを同定する。本手法はテキストマイニングと遺伝子発現解析の2つの異なる応用に適用し,既存の手法に比べて多くの設定でビクラスタ抽出を改善することを示す。
論文参考訳（メタデータ） (2020-02-08T19:41:23Z)
RelDenClu: A Relative Density based Biclustering Method for identifying non-linear feature relations [0.1843404256219181]
提案手法であるRelDenCluは,各特徴量の辺密度と接合密度の局所的変動を利用して観測のサブセットを求める。その後、共通の観測によって繋がった一連の特徴を発見し、結果として双クラスターとなる。 15種類のシミュレーションデータセットと6つの実生活データセットで実験が行われた。
論文参考訳（メタデータ） (2018-11-12T11:11:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。