論文の概要、ライセンス

# (参考訳) 非負の補助最適化によるブール行列分解 [全文訳有]

Boolean Matrix Factorization via Nonnegative Auxiliary Optimization ( http://arxiv.org/abs/2106.04708v1 )

ライセンス: CC BY 4.0
Duc P. Truong, Erik Skau, Derek Desantis, Boian Alexandrov(参考訳) ブール行列分解(BMF)に対する新しいアプローチを示す。 bmf問題を直接解く代わりに、このアプローチは、初期ブールデータとブール構造が同一である補助行列上の制約を持つ非負最適化問題を解く。 そして、非負の補助最適化問題の解をしきい値にし、BMF問題の解を提供する。 二つの解空間の同値性の証明を、厳密な解の存在下で提供する。 さらに,アルゴリズムの非増加特性も証明されている。 合成および実データセットの実験を行い、他の手法と比較してアルゴリズムの有効性と複雑さを示す。

A novel approach to Boolean matrix factorization (BMF) is presented. Instead of solving the BMF problem directly, this approach solves a nonnegative optimization problem with the constraint over an auxiliary matrix whose Boolean structure is identical to the initial Boolean data. Then the solution of the nonnegative auxiliary optimization problem is thresholded to provide a solution for the BMF problem. We provide the proofs for the equivalencies of the two solution spaces under the existence of an exact solution. Moreover, the nonincreasing property of the algorithm is also proven. Experiments on synthetic and real datasets are conducted to show the effectiveness and complexity of the algorithm compared to other current methods.
公開日: Tue, 8 Jun 2021 21:55:49 GMT

※ 翻訳結果を表に示しています。PDFがオリジナルの論文です。翻訳結果のライセンスはCC BY-SA 4.0です。詳細はトップページをご参照ください。

翻訳結果

    Page: /      
英語(論文から抽出)日本語訳スコア
1 2 0 2 n u J 1 2 0 2 n u J 0.85
8 ] S D . s c [ 8 ] S D。 sc [ 0.69
1 v 8 0 7 4 0 1 v 8 0 7 4 0 0.85
. 6 0 1 2 : v i X r a . 6 0 1 2 : v i X r a 0.85
BOOLEAN MATRIX FACTORIZATION VIA NONNEGATIVE 新規なブールマトリクス分解反応 0.40
AUXILIARY OPTIMIZATION A PREPRINT 補助最適化 プレプリント 0.50
Computer, Computational and Statistics Division 計算機・計算・統計部門 0.80
Los Alamos National Laboratory, USA ロスアラモス国立研究所 0.43
Duc P. Truong Duc P. Truong 0.94
Computer, Computational and Statistics Division 計算機・計算・統計部門 0.80
Los Alamos National Laboratory, USA ロスアラモス国立研究所 0.43
Erik Skau erik skau氏 0.56
dptruong@lanl.gov dptruong@lanl.gov 0.78
email Derek Desantis メール デレク・デサンティス 0.61
Theoretical Division Los Alamos National Laboratory, USA 理論部門 ロスアラモス国立研究所 0.58
email Boian Alexandrov Theoretical Division メール Boian Alexandrov理論部門 0.75
Los Alamos National Laboratory, USA ロスアラモス国立研究所 0.43
email June 10, 2021 メール 2021年6月10日 0.72
ABSTRACT A novel approach to Boolean matrix factorization (BMF) is presented. ABSTRACT ブール行列分解(BMF)に対する新しいアプローチを示す。 0.72
Instead of solving the BMF problem directly, this approach solves a nonnegative optimization problem with the constraint over an auxiliary matrix whose Boolean structure is identical to the initial Boolean data. bmf問題を直接解く代わりに、このアプローチは、初期ブールデータとブール構造が同一である補助行列上の制約を持つ非負最適化問題を解く。 0.67
Then the solution of the nonnegative auxiliary optimization problem is thresholded to provide a solution for the BMF problem. そして、非負の補助最適化問題の解をしきい値にし、BMF問題の解を提供する。 0.69
We provide the proofs for the equivalencies of the two solution spaces under the existence of an exact solution. 二つの解空間の同値性の証明を、厳密な解の存在下で提供する。 0.61
Moreover, the nonincreasing property of the algorithm is also proven. さらに,アルゴリズムの非増加特性も証明されている。 0.79
Experiments on synthetic and real datasets are conducted to show the effectiveness and complexity of the algorithm compared to other current methods. 合成および実データセットの実験を行い、他の手法と比較してアルゴリズムの有効性と複雑さを示す。 0.87
1 Introduction Many research fields, such as personalized medicine, space research, social sciences, climate research, nonproliferation, emergency response, finances, etc. 1 はじめに パーソナライズされた医学、宇宙研究、社会科学、気候研究、非増殖、緊急対応、財政など、多くの研究分野がある。 0.71
collect and generate large-scale datasets. 大規模なデータセットを収集し、生成する。 0.52
Analysis of such datasets is difficult, since often the underlying fundamental processes (or features) remain hidden or latent (i.e., not directly observable) [4]. 基礎となる基本プロセス(あるいは機能)は隠れているか、潜んでいる(すなわち直接観測できない) [4] ため、このようなデータセットの分析は難しい。 0.76
Extracting such latent features reveals valuable information and hidden causality and relations. そのような潜在的な特徴を抽出することは、貴重な情報と隠れた因果関係と関係を明らかにする。 0.43
One of the most powerful tools for extracting latent (hidden) features from data is factor analysis [13]. データから潜在(隠された)特徴を抽出する最も強力なツールの1つは因子分析です [13]。 0.85
Traditionally, factor analysis approximates a data-matrix X ∈ Rn×m by a product of two low-rank (factor) matrices, X ≈ W H, where W ∈ Rn×k, H ∈ Rk×m, and k (cid:28) n, m. Various types of factorizations can be obtained by imposing different constraints. 伝統的に、因子分析はデータ行列 x ∈ rn×m を、w ∈ rn×k, h ∈ rk×m, k (cid:28) n, m という二つの低ランク(因子)行列の積によって近似する。
訳抜け防止モード: 伝統的に、因子分析は2つの低い階数(因子)行列の積によるデータ-行列 X ∈ Rn×m を近似する。 ここで W ∈ Rn×k, H ∈ Rk×m である。 k ( cid:28 ) n, m. 様々な種類の分解は、異なる制約を課すことで得られる。
0.78
For instance, imposing orthogonality on the factors leads to the singular value decomposition (SVD) [14], while the nonnegativity constraint leads to non-negative matrix factorization (NMF) [5]. 例えば、因子に直交性を与えると特異値分解(SVD) [14] となり、一方非負性制約は非負行列分解(NMF) [5] につながる。 0.77
In a lot of investigations, the variables are simple dichotomies, {false, true}, that is, the data contains only binary values, {0, 1}. 多くの調査において、変数は単純な二コトミー {false, true} であり、つまりデータは二進値 {0, 1} のみを含む。 0.70
For example, in relational databases, an object-attribute relation is represented by a Boolean variable, which takes value {1}-true, if the object has this attribute, or {0}-false, otherwise. 例えば、リレーショナルデータベースでは、オブジェクト-属性関係はboolean変数で表現され、もしオブジェクトがこの属性を持つなら{1}-true、そうでない場合は {0}-false、という値を取る。 0.82
In this case, all the values of the factors have to be 0 or 1. この場合、因子のすべての値は 0 または 1 でなければならない。 0.85
In this case, instead of simple arithmetic we also need to use Boolean algebra: instead of “plus” and “times” we need the logical operations of “or” with “and”, which results in a Boolean factorization [8]. この場合、単純な算術の代わりにブール代数を使う必要がある: “plus” と “times” の代わりに、“or” と “and” の論理演算が必要である。
訳抜け防止モード: この場合、単純な算術の代わりにブール代数を使う必要がある: “ plus ” と “ times ” の代わりに、“論理演算” が必要である。 or ” と “ and ” はブール因子化 [8 ] になる。
0.74
To be precise, letting B = {0, 1}, and assuming the input data is a matrix X ∈ Bn×m, where B = {0, 1}, Boolean matrix factorization (BMF) is looking for two binary matrices W ∈ Bn×k, H ∈ Bk×m such that X ≈ W ⊗B H, where (W ⊗B H)ij = ∨k l=1Wil ∧ Hlj ∈ B and ∨ and ∧ are the logical ”or” and ”and” operations. 正確に言うと、B = {0, 1} とし、入力データを行列 X ∈ Bn×m と仮定すると、B = {0, 1} に対してブール行列分解 (BMF) は 2つの二項行列 W ∈ Bn×k, H ∈ Bk×m を求めており、X は (W >B H)ij = .k l=1Wil . Hlj ∈ B と . . . . . . . . . . . . . . . . . 0.77
The Boolean rank of X is the smallest k for which such an exact representation, X = W ⊗B H, exists. X のブールランク (Boolean rank) は、そのような正確な表現 X = W >B H が存在する最小の k である。 0.75
Interestingly, in contrast to the non-negative rank, the Boolean rank can be not only bigger or equal, but also smaller than the real rank [2, 10]. 興味深いことに、非負のランクとは対照的に、ブールのランクは、より大きいか等しいかだけでなく、実際のランク [2, 10] よりも小さい。 0.62
英語(論文から抽出)日本語訳スコア
BANMF A PREPRINT BANMF プレプリント 0.66
In this paper, we propose a new algorithm for BMF, we call Boolean Auxiliary Non-negative Matrix Factorization (BANMF). 本稿では,Boolean Auxiliary Non- negative Matrix Factorization (BANMF) と呼ぶBMFの新しいアルゴリズムを提案する。 0.81
Here, we consider a specific constrained optimization over an auxiliary matrix Y related to the initial binary data matrix X. 本稿では,初期二元データ行列 x に関連する補助行列 y 上の特定の制約付き最適化を考える。 0.79
By performing the constrained optimization over the auxiliary matrix we are able to simulate a Boolean matrix product by enforcing the support of the matrix product and disregarding the exact matrix values. 補助行列上で制約付き最適化を行うことで、行列積のサポートを強制し、正確な行列値を無視してブール行列積をシミュレートすることができる。 0.67
From the solution of our relaxed problem we apply thresholding to our solution matrices W and H to arrive at the BMF solution. 緩和された問題の解から、解行列 W と H にしきい値を適用し、BMF に到達する。
訳抜け防止モード: 緩和された問題の解から、解行列 W と H にしきい値を適用する。 BMFソリューションに到達します。
0.64
We demonstrate that our method outperforms other state-of-the-art methods for the BMF problem when there exists a discrepancy between the nonnegative and Boolean rank. 我々は,非負ランクとブールランクの相違点が存在する場合に,BMF問題に対する他の最先端手法よりも優れていることを示す。 0.55
Moreover, BANMF has superior performance under corruption by Bernoulli noise and at various density levels. さらに、BANMFはベルヌーイノイズや様々な密度レベルでの汚損下での優れた性能を有する。
訳抜け防止モード: さらに、BANMFはベルヌーイノイズによる汚損下での優れた性能を有する 様々な密度で
0.75
Furthermore BANMF is shown to have faster run times than PNL-PF, a competitor algorithm, for large datasets. さらに、BANMFは、大規模データセットの競合アルゴリズムであるPNL-PFよりも高速に実行可能である。 0.73
2 Related Work The BMF problem is NP-hard [8], leading to the development of a variety of strategies to approximate a solution. 2 関連作業 BMF問題はNPハード[8]であり、解を近似する様々な戦略の開発につながる。
訳抜け防止モード: 2 関連作業 BMF問題はNP-hard [8 ]である。 解決策を近似する様々な戦略の開発につながります
0.80
Greedy algorithms were some of the first proposed methods to solving BMF [1, 7, 8]. グリーディアルゴリズムはBMF [1, 7, 8] の解法として最初に提案された手法の一つである。 0.72
There is also a family of Bayesian methods. ベイズ的方法の家系もある。 0.42
For example, the authors in [12] use a probabilistic generative model and derive a sampling method to accelerate the optimization for BMF. 例えば、[12] の著者は確率的生成モデルを用いて、BMF の最適化を高速化するためにサンプリング法を導出する。 0.83
In [11] they use a Bayesian framework to consider the BMF problem as a maximum log likelihood problem and use a message passing procedure to approximate the MAP assignment. 11]では、BMF問題を最大ログ可能性問題とみなすためにベイズフレームワークを使用し、MAP割り当てを近似するためにメッセージパッシング手順を使用する。 0.77
An alternative approach to BMF is to relax the Boolean constraint into a non-negativity constraint. BMFの別のアプローチは、ブール制約を非負性制約に緩和することである。 0.71
Several different methods to relax BMF to a NMF problem exist. BMFをNMF問題に緩和するいくつかの異なる方法が存在する。 0.74
The thresholding method in [15] attempts take an NMF solution to a binary matrix factorization solution. 15] の試行におけるしきい値は NMF の解を 2 つの行列分解解へ取り込む。 0.72
This idea can easily be modified to search for a BMF solution by searching for a optimal thresholding values. このアイデアは最適しきい値を求めることでBMFソリューションを探すために容易に修正できる。 0.74
The Post Nonlinear Penalty Function Algorithm (PNLPF) [9] attempts to improve the relaxation by putting a nonlinear function on the product WH. ポスト非線形ペナルティ関数アルゴリズム (PNLPF) [9] は, 積 WH 上に非線形関数を配置することにより緩和性を向上させる。 0.82
The nonlinear Heaviside function clips arbitrarily large numbers in the product WH back to the [0,1] interval. 非線形 Heaviside 関数は積 WH の任意の数の数を [0,1] 間隔にクリップする。 0.81
This composition of regular matrix product and the nonlinear function approximates a Boolean matrix product resulting in a BMF estimation algorithm. この正規行列積と非線形関数の合成は、BMF推定アルゴリズムをもたらすブール行列積を近似する。 0.70
3 Proposed Approach Given a Boolean matrix X ∈ BM×N , the BMF optimization problem is ||X − W ⊗B H||F 3 ブール行列 X ∈ BM×N が与えられたとき、BMF 最適化問題は ||X − W >B H|F である。 0.68
W,H minimize subject to W ∈ BM×k, H ∈ Bk×N , W,H W ∈ BM×k, H ∈ Bk×N を最小化する。 0.83
(1) where ⊗B denotes Boolean matrix product (W ⊗B H)ij = ∨k (1) ここで、B はブール行列積 (W >B H)ij = .k を表す。 0.71
l=1Wil ∧ Hlj, and ||...||F is the Frobenius norm. l=1Wil は Hlj であり、||...|F はフロベニウスノルムである。 0.49
3.1 Nonnegative auxiliary optimization for BMF 3.1 BMFの非負の補助最適化 0.64
Here we propose an alternative nonnegative optimization problem to solve the BMF problem (1) which is comprised of two steps. 本稿では,2つのステップからなるBMF問題(1)を解決するために,別の非負最適化問題を提案する。 0.76
The first step is based on NMF optimization with additional constrains on an auxiliary matrix Y . 最初のステップは、補助行列 Y 上の追加制約を持つ NMF 最適化に基づいている。 0.68
Given a solution to the first step, the second step consists of thresholding to obtain a Boolean factors. 第1段階の解が与えられると、第2段階はブール因子を得るためのしきい値からなる。 0.71
We now describe the nonnegative auxiliary optimization problem. 現在、非負の補助最適化問題を記述している。 0.52
Given a binary matrix X, we search for a rank k Boolean decomposition by solving the optimization, バイナリ行列 x が与えられたとき、最適化を解いてランク k のブール分解を探索する。 0.64
minimize subject to 1 ≤ Yi,j ≤ k, if Xi,j = 1 Xi,j = 1 であれば 1 ≤ Yi,j ≤ k の対象を最小化する 0.90
||Y − W H||F ||Y − W H||F 0.59
Y,W,H Yi,j = 0, if Xi,j = 0 W ∈ RN×k + , H ∈ Rk×M . Y,W,H Yi,j = 0 であれば、Xi,j = 0 W ∈ RN×k + , H ∈ Rk×M となる。 0.88
+ (2) The solution (Y, W, H) of problem (2) is not necessarily Boolean. + (2) 問題 (2) の解 (Y, W, H) は必ずしもブールではない。 0.78
For the second step, we convert the non-negative (W, H) to Boolean matrices ( ˆW , ˆH) according to a thresholding function. 2番目のステップでは、しきい値関数に従って非負(W, H) をブール行列(英語版)(ブーリアン行列)に変換する。 0.68
Given threshold parameter δ ≥ 0, we define 閾値パラメータ δ ≥ 0 が与えられたとき、 0.77
(3) ˆCij = (3) 聖Cij = 0.68
if Cij > δ if Cij ≤ δ Cij > δ ならば Cij ≤ δ 0.79
(cid:26)1 0 (cid:26)1 0 0.85
2 2 0.85
英語(論文から抽出)日本語訳スコア
BANMF A PREPRINT BANMF プレプリント 0.66
In theory, we use δ = 0. 理論的には δ = 0 を用いる。 0.84
However as will be discussed in Algorithm 2, δ > 0 in practice. しかし、実際にはアルゴリズム2で議論されるようにδ > 0 である。 0.71
Our method can be viewed as an NMF approach for BMF problem similar to the other relaxation approaches in the literature [9, 15]. 本手法は, BMF問題に対するNMF法として, 文献 [9, 15] の他の緩和法と類似していると考えられる。 0.81
However, by adding the auxiliary matrix constraint, the BANMF approach forces the support of NMF to adhere to that of a BMF while disregarding the exact values. しかし、補助行列制約を加えることで、BANMFアプローチはNMFのサポートをBMFのそれに従うように強制し、正確な値を無視する。 0.72
The subsequent results establish this. 以下の結果が確定する。 0.62
Under the existence of an exact decomposition, below we prove the equivalencies of the two solution spaces. 正確な分解の存在下では、以下の2つの解空間の同値性を証明する。 0.75
This will be done with two theorems, one theorem showing containment in each direction. これは2つの定理で行われ、1つの定理は各方向の封じ込めを示す。 0.65
The following theorem proves that an exact decomposition solution of BMF problem (1) is also a solution of our relaxed nonnegative optimization problem (2). 以下の定理は、BMF問題(1)の正確な分解解が、緩和された非負の最適化問題の解でもあることを証明している。 0.66
Theorem 1. Given an exact decomposition solution (W, H) to problem (1) such that X = W ⊗B H, there exists Y ∈ RN×M 理論1。 問題 (1) に対する正確な分解解 (W, H) が与えられたとき、X = W, B H が存在し、Y ∈ RN×M が存在する。 0.69
such that (Y, W, H) is an exact decomposition solution for the optimization problem (2). y, w, h) が最適化問題 (2) の厳密な分解解となるように。 0.68
+ Proof. Given an an exact solution (W, H) such that X = W ⊗B H, we construct a N × M nonnegative matrix Y = W H. Now we need to show that (Y, W, H) is an exact solution for the optimization problem (2). + 証明。 X = W {\displaystyle X} の完全解 (W, H) が与えられたとき、 N × M {\displaystyle Y} の非負行列 Y = W H {\displaystyle Y} を構成する。
訳抜け防止モード: + 証明。 厳密な解 (W, H ) が与えられたとき、X = W, B H となる。 ここで ( Y, W, H ) が最適化問題 ( 2 ) の正確な解であることを示す必要がある。
0.70
First, by construction, the optimized value is already zero. まず、構成上、最適化された値は既にゼロである。 0.68
Next, we need to show that the solution satisfies the constraints. 次に、ソリューションが制約を満たすことを示す必要があります。 0.73
(a) W ∈ BN×k ⇒ W ∈ RN×k (b) H ∈ Bk×M ⇒ H ∈ Rk×M (c) For (i, j) /∈ support(X), which means Xij = 0 ⇒ Wil = Hlj = 0 ∀l = 1, . (a) W ∈ BN×k の W ∈ RN×k (b) H ∈ Bk×M の H ∈ Rk×M (c) for (i, j) /∂ support(X) つまり Xij = 0 , Wil = Hlj = 0 ,l = 1 である。 0.83
. . , k. by the definition of Boolean matrix product in Equation 1 (d) For (i, j) ∈ support(X), which means Xij = 1 ⇒ ∃l ∈ {1, . . . 方程式 1 (d) におけるブール行列積の定義により、 (i, j) ∈ support(X) が成り立つので、Xij = 1 {\displaystyle Xij=1\,\,} となる。 0.80
. . , k} such that Wil = Hlj = 1. . . , k を Wil = Hlj = 1 とする。 0.82
Since Wi,:, H:,j ∈ Rk, we have 1 ≤ (W H)ij ≤ k ⇒ 1 ≤ Yij = (W H)ij ≤ k Therefore, from (a),(b),(c), (d) and the fact that the optimized value is zero, we have shown that Y = W H is an exact solution for the optimization problem (2) as needed. Wi,:, H:,j ∈ Rk は 1 ≤ (W H)ij ≤ k ≤ 1 ≤ Yij = (W H)ij ≤ k を持つので、 (a,(b),(c), (d) から、最適化された値が 0 であるという事実から、Y = W H は必要ならば最適化問題 (2) の正確な解であることが示されている。 0.82
⇒ Yij = (W H)ij =(cid:80)k Yij = (W H)ij = (cid:80)k 0.80
l=1(W )il(H)lj = 0 l=1(W )il(H)lj = 0 0.99
+ + This proves that the BMF solution set is contained in the BANMF solution set when there exists an exact decomposition. + + このことは、BMF の解集合が正確な分解が存在するときに BANMF の解集合に含まれることを証明している。 0.78
The next theorem proves containment the other direction, that the BANMF solution set, after Booleanizing the solutions, is contained in the BMF solution set when there exists an exact decomposition. 次の定理は、BANMF の解集合は、解をブール化した後、正確な分解が存在するときにBMF の解集合に含まれることを証明している。 0.65
Theorem 2. Given an exact solution Y = W H for the BANMF problem (2), and ˆW and ˆH are the Booleanized matrices of W and H with threshold δ = 0, then X = ˆW ⊗B ˆH is an exact solution for the BMF problem (1). 定理2。 BANMF 問題 (2) に対する正確な解 Y = W H と、しきい値 δ = 0 の W と H のブール化行列 を与えられると、X は BMF 問題 (1) の正確な解である。
訳抜け防止モード: 定理2。 正確な解 Y = W H を BANMF 問題 (2 ) に対して与えられる。 W と H はしきい値 δ = 0 のブール化行列である。 すると、X は BMF 問題 ( 1 ) {\displaystyle (1)} の正確な解である。
0.65
Proof. Suppose that Y , W , and H is an exact solution for the BANMF problem, and that ˆW and ˆH are the Booleanized matrix of W and H with threshold δ = 0. 証明。 Y , W , H が BANMF 問題に対する厳密な解と仮定し、W と H のブール化行列はしきい値 δ = 0 であるとする。 0.66
We show that X = ˆW ⊗B ˆH. X は X の次数である。 0.43
First, following the logic in the proof of Theorem 1, we have that: まず、定理 1 の証明の論理に従うと、次のようになる。 0.70
( ˆW ⊗B ˆH)ij = (~W・B・H)ij= 0.61
if (W H)ij = 0 if (W H)ij > 0 w h)ij = 0 ならば (w h)ij > 0 である。 0.80
(cid:26)0 (cid:26)0。 0.71
1 Second, by the constraint of the optimization and the assumption that Y = W H, we also have: 1 第二に、最適化の制約と y = w h の仮定により、以下も成り立つ。 0.74
(cid:26)0 (cid:26)0。 0.71
1 Xij = if Yij = (W H)ij = 0 if Yij = (W H)ij > 0 1 Xij = yij = (w h)ij = 0 ならば、yij = (w h)ij > 0 である。 0.86
These two above facts imply that X = ˆW ⊗B ˆH or that ˆW and ˆH is an exact solution for the BMF problem. これら2つの事実は、X = >W >B >H あるいは >W > H が BMF 問題の正確な解であることを示している。 0.63
3.2 Algorithm Our implementation of the BANMF algorithm cycles between updating the NMF factors W , H, and the corresponding auxiliary matrix Y . 3.2アルゴリズム NMF 因子 W , H および対応する補助行列 Y を更新する間における BANMF アルゴリズムのサイクルの実装を行った。 0.73
We use the multiplicative update method introduced by Lee and Seung [6] for the W and H updates, but any other alternating NMF algorithms are also suitable. We use the multiplicative update method introduced by Lee and Seung [6] for the W and H update, but any other alternating NMF algorithm is suitable。 0.74
For the update of the auxiliary variable Y , we project Y onto the feasible set defined by the constraints. 補助変数 Y の更新のために、Y を制約によって定義される実現可能な集合に射影する。 0.68
Algorithm 1 is an outline of a procedure to solve the BANMF problem (2). アルゴリズム1は、BANMF問題を解く手順の概要である((2))。 0.76
To find the appropriate threshold parameters δW and δH, and the corresponding Boolean matrices, ˆW and ˆH, we employ Algorithm 2. 適切なしきい値パラメータ δw と δh と対応するブール行列 sw と sh を見つけるためにアルゴリズム 2 を用いる。 0.66
3 (4) (5) 3 (4) (5) 0.85
英語(論文から抽出)日本語訳スコア
BANMF A PREPRINT BANMF プレプリント 0.66
Algorithm 1: BANMF Input: Boolean matrix X, latent dimension k, maximum iteration N iter Result: Y, W, H Initialization: W = rand(N, k), H = rand(k, M ), Y = X while iter ≤ Niter do (1) Update W using NMF multiplicative update アルゴリズム1: BANMF 入力: Boolean matrix X, latent dimension k, maximum iteration N iter Result: Y, W, H Initialization: W = rund(N, k), H = rund(k, M ), Y = X while iter ≤ Niter do (1) Update W using NMF multiplicative update 0.76
Wij = Wij (2) Update H using NMF multiplicative update Wij = Wij (2) NMF乗算更新を用いた更新H 0.88
(Y H T )ij (W HH T )ij (Y H T )ij(W H H T )ij) 0.92
Hij = Hij (3) Update Yij for (i, j) ∈ support(X) Hij = Hij (3) Update Yij for (i, j) ∈ support(X) 0.85
(W T Y )ij (W T W H)ij (W T Y )ij(W T W H)ij 0.85
1 Yij = 1 Yij = 0.82
endwhile; if (W H)ij k if 終止符: もし (W H)ij k if 0.68
(W H)ij < 1 (W H)ij ≥ k (W H)ij < 1 (W H)ij ≥ k 0.85
if 1 ≤ (W H)ij ≤ k もし 1 ≤ (W H)ij ≤ k 0.79
Algorithm 2: Booleanization Input: Boolean matrix X, nonnegative matrices W and H, number of points npoint Result: ˆW , ˆH Wpoint = linspace(min(W), max(W), npoint) Hpoint = linspace(min(H), max(H), npoint) δ∗ W , δ∗ H = ˆW = ˆW δ∗ ˆH = ˆH δ∗ アルゴリズム2: ブール化 入力: ブール行列 X, 非負行列 W と H, 点数 npoint 結果: >W , >H Wpoint = linspace(min(W), max(W), npoint) Hpoint = linspace(min(H), max(H), npoint) δ∗ W , δ∗ H = >W = >H δ∗ である。 0.79
|X − ˆW δW ⊗ ˆH δH| |X − ~W δW ~ ~H δH| 0.63
δW ∈Wpoint,δH∈Hpoint δW ∈ Wpoint,δH∂Hpoint 0.52
argmin W H 3.2.1 Convergence アルグミン W H 3.2.1 収束 0.63
We now discuss the convergence of our implementation of the BANMF algorithm. 本稿では,BANMFアルゴリズムの実装の収束について論じる。 0.76
We show that Algorithm 1 results in a non-increasing updates to the objective function: Theorem 3 (Nonincreasing property of BANMF algorithm). 我々は,アルゴリズム1が目的関数を非増加的に更新することを示す: Theorem 3 (BANMFアルゴリズムのNonincreasing特性)。 0.86
The objective function ||Y − W H||F in the boolean auxiliary nonnegative matrix factorization (2) is non-increasing under the BANMF update rules. ブール補助非負行列因子分解 (2) における目的関数 ||y − w h|f は、banmf 更新規則の下では非拡大である。 0.65
Proof. Here we just need to show that ||Yt−1 − Wt−1Ht−1|| ≥ ||Yt − WtHt|| at an arbitrary iteration t. As shown in [6], the distance ||X − W H||F is non-increasing under the multiplicative update rules. 証明。 ここで、任意の反復 t において ||yt−1 − wt−1ht−1|| ≥ ||yt − wtht||| であることを示す必要がある。
訳抜け防止モード: 証明。 ここでは ||Yt−1 − Wt−1Ht−1| ≥ ||Yt − WtHt|| を任意の反復 t で示す必要がある。 距離 ||X − W H||F は乗法更新規則の下で非増加である。
0.68
Applying this to the updated Wt, Ht at the iteration t, we have: これを更新されたWt、Htに適用すると、次のようになります。 0.63
||Yt−1 − Wt−1Ht−1|| ≥ ||Yt−1 − WtHt||. ||Yt−1 − Wt−1Ht−1| ≥ ||Yt−1 − WtHt||。 0.42
(6) The next step is updating the elements of Yt−1 using the update rule in step 3 of Algorithm 1. (6) 次のステップはアルゴリズム1のステップ3の更新ルールを使ってYt−1の要素を更新する。 0.87
Note that the update rule minimizes the entry-wise error of |(Yt)ij − (WtHt)ij| within the solution space for Y . 更新規則は、Y の解空間内の |(Yt)ij − (WtHt)ij| のエントリーワイズ誤差を最小化する。 0.70
Indeed, each matrix entry for Yt either has zero error (for 1 ≤ (W H)ij ≤ k) or has minimal error (for (W H)ij ≤ 1 and (W H)ij ≥ k) which is an improvement over |(Yt−1)ij − (WtHt)ij|. 実際、Yt に対する各行列エントリはゼロ誤差(1 ≤ (W H)ij ≤ k) または最小誤差(1 ≤ (W H)ij ≤ 1 と (W H)ij ≥ k) に対して、|(Yt−1)ij − (WtHt)ij| に対する改善となる。 0.90
Hence, this step produces Yt which further reduces the error したがって、このステップはytを生成し、さらにエラーを低減します。 0.62
(7) From inequality (6) and (7), we get ||Yt−1−Wt−1Ht−1|| ≥ ||Yt−WtHt|| as needed. (7) 不等式 (6) と (7) から ||Yt−1−Wt−1Ht−1| ≥ ||Yt−WtHt|| を得る。 0.63
Therefore, the objective function of the problem (2) is non-increasing under BANMF update rules. したがって、問題(2)の目的関数は、BANMF更新規則の下では増加しない。 0.75
||Yt−1 − WtHt|| ≥ ||Yt − WtHt|| ||Yt−1 − WtHt|| ≥ ||Yt − WtHt|| 0.52
3.2.2 Regularized BANMF 3.2.2 正規化BANMF 0.50
Additionally, to aid in the Booleanization procedure, the factors W and H can be guided to be binary factors with an additional regularization during the optimization. さらに、ブール化手順を支援するために、w と h は最適化中に追加の正規化を伴う二元因子として導かれる。 0.71
Here we incorporate the x2 − x based regularization used in [9,15]. ここでは [9,15] で使われる x2 − x ベースの正則化を組み込む。 0.69
4 4 0.85
英語(論文から抽出)日本語訳スコア
BANMF A PREPRINT BANMF プレプリント 0.66
Figure 1: Convergence of regularized BANMF on a synthetic dataset. 図1: 合成データセット上の正規化BANMFの収束性。 0.84
Our regularized problem is formed as follows: 我々の正規化問題は以下の通りである。 0.56
minimize Y,W,H ||Y − W H||F + 1 2 λ||H 2 − H||2 最小化 Y,W,H ||Y − W H||F + 1 2 λ||H 2 − H||2 0.71
+ F 1 2 λ||W 2 − W||2 + F 1 2 λ|w2 − w||2 0.78
F subject to 1 ≤ Yi,j ≤ k, if Xi,j = 1 F Xi,j = 1 であれば 1 ≤ Yi,j ≤ k となる 0.84
(8) Yi,j = 0, if Xi,j = 0 W ∈ RN×k + , H ∈ Rk×M . (8) Yi,j = 0 であれば、Xi,j = 0 W ∈ RN×k + , H ∈ Rk×M となる。 0.88
+ Notice that under the exact solution, the regularization terms will be zeros. + 正確な解の下では、正規化項は 0 となる。 0.76
Therefore, Theorem 1 and Theorem 2 are also true for the regularized problem (8). したがって、定理 1 と定理 2 は正規化問題 (8) にも当てはまる。 0.65
With regularization, the update rules do not have the non-increasing property anymore, but empirically we observe reasonable convergence in practice. 正規化では、更新規則はもはや増加しない性質を持たないが、実証的に我々は実際に妥当な収束を観察する。 0.60
Figure 1 shows the convergence of the regularized BANMF on a synthetic dataset. 図1は、正規化されたBANMFの合成データセットへの収束を示す。 0.73
Our implementation of the regularized BANMF is described in Algorithm 3. 正規化BANMFの実装について,アルゴリズム3で述べる。 0.64
Algorithm 3: Regularized BANMF Input: Boolean matrix X, latent dimension k, maximum iteration N iter, regularization parameter λ Result: ˆW (δW ), ˆH (δH ) Initialization: W = rand(N, k), H = rand(k, M ), Y = X while iter ≤ Niter do (1) Update W and H using NMF multiplicative update アルゴリズム3: 正規化 BANMF 入力: ブール行列 X, 潜在次元 k, 最大繰り返し N 反復, 正則化パラメータ λ 結果: >W (δW ), >H (δH ) 初期化: W = rund(N, k), H = rund(k, M ), Y = X かつ iter ≤ Niter do (1) 乗法更新による更新 W と H 0.79
Wij = Wij (Y H T )ij + 3λW 2 ij Wij = Wij (Y H T )ij + 3λW 2ij 0.92
(W HH T )ij + 2λW 3 (W HH T )ij + 2λW 3 0.98
ij + λW 2 ij ij + λW 2 ij 0.99
Hij = Hij ij + λH 2 ij (2) Update Yij for (i, j) ∈ support(X) hij = hij ij + λh 2 ij (2) (i, j) ∈ support(x) の yij を更新する。 0.91
(W T W H)ij + 2λH 3 (W T W H)ij + 2λH 3 1.00
(W T Y )ij + 3λH 2 ij (W T Y )ij + 3λH 2ij 0.98
if (W H)ij k if もし (W H)ij k if 0.79
(W H)ij < 1 (W H)ij ≥ k (W H)ij < 1 (W H)ij ≥ k 0.85
if 1 ≤ (W H)ij ≤ k もし 1 ≤ (W H)ij ≤ k 0.79
1 Yij = 1 Yij = 0.82
endwhile; Boolean algorithm is applied to identify δW and δH for ˆW (δW ), ˆH (δH ) ブールアルゴリズムは δW (δW ) と δH (δH ) の δW と δH を識別するために用いられる。 0.77
5 02004006008001000Ite ration0.00.10.20.30. 4||Y-WH||Convergence of reg-BANMF 5 02004006006001000Ite ration0.00.10.20.30. 4|Y-WH|Reg-BANMFの収束 0.52
英語(論文から抽出)日本語訳スコア
BANMF A PREPRINT BANMF プレプリント 0.66
Figure 2: Performance on synthetic datasets at different density levels. 図2: 異なる密度レベルでの合成データセットのパフォーマンス。 0.87
4 Experimental Results In this section, we experimentally evaluate the performance of the BANMF algorithm. 4 実験結果 本稿では,BANMFアルゴリズムの性能を実験的に評価する。 0.80
For comparison we employ ASSO [8], NMF [6], and post nonlinear penalty function (PNL-PF) [9] where the solutions are thresholded using Booleanization Algorithm 2 to be binary. 比較にはASSO [8], NMF [6], ポスト非線形ペナルティ関数 (PNL-PF) [9] を用いる。
訳抜け防止モード: 比較のためにASSO [8 ], NMF [6 ] を用いる。 非線形ペナルティ関数 (PNL - PF ) [9 ] 解はブール化アルゴリズム2を用いて閾値付けされ、バイナリとなる。
0.85
First, we demonstrate that if the non-negative rank and the Boolean rank are different, then BANMF, and in particular Regularized BANMF, outperform the other methods. まず,非負のランクとブールのランクが異なる場合,banmf,特に正規化banmfが他の手法よりも優れていることを示す。 0.62
Next, we investigate how methods perform with regard to different noise and density levels. 次に,ノイズや密度の異なる手法について検討する。 0.60
We then show that BANMF outperforms its strongest contender, PNL-PF, in execution time for random matrices. 次に、BANMFは、ランダム行列の実行時間において、最強の競合であるPNL-PFより優れていることを示す。 0.56
Lastly, the methods are evaluated when applied to three real datasets: (1) UCI Zoo, (2) Congressional voting records, and (3) Lung cancer with probes. 最後に,(1)UCI動物園,(2)議会投票記録,(3)プローブを用いた肺癌の3つの実データに適用して評価を行った。 0.70
4.1 Generating Boolean synthetic data 4.1 ブール合成データの生成 0.70
First, we briefly describe our process for generating Boolean synthetic data. まず,ブール合成データを生成するプロセスについて概説する。 0.70
For each experiment, we will generate random matrices 各実験で ランダムな行列を生成します 0.73
X N×M = W M×k ⊗B H k×m X N×M = W M×k >B H k×m 0.91
where Wij, Hij ∼ Bernoulli(p). どこに ベルヌーイ (Bernoulli) の略称。 0.49
This stochastic process generates data with different features which probabilistically depend on the parameters. この確率過程は、確率的にパラメータに依存する異なる特徴を持つデータを生成する。 0.74
In each experiment, this process will be augmented to analyze statistical performance across various data constraints. 各実験において、このプロセスは様々なデータ制約の統計的性能を分析するために拡張される。 0.73
To construct a Boolean rank k data matrix with a desired density d, we compute the probability that any given entry l=1Wil ∧ Hlj = 1) = 1 − (1 − P (Wil = 1) ∗ P (Hlj = 1))k. By imposing that the of X is one, P (Xij = 1) = P (∨k densities of W and H are the same, and inverting the probability formula, we arrive with the equation for the density of W and H that correspond to the desired density of X, 所望密度 d でブール階数 k のデータ行列を構成するためには、任意の入力 l=1Wil > Hlj = 1) = 1 − (1 − P (Wil = 1) ∗ P (Hlj = 1))k が成り立つ確率を計算する。
訳抜け防止モード: 所望密度dのブールランクkデータ行列を構築する。 任意の入力 l=1Wil > Hlj = 1 ) = 1 − ( 1 − P ( Wil = 1 ) ∗ P ( Hlj = 1))k の確率を計算する。 X が 1 であることを示すことによって、P(Xij = 1 ) = P(W と H の密度)は同じであり、確率公式を反転させる。 我々は、所望の X の密度に対応する W と H の密度の方程式にたどり着く。
0.83
1 − (1 − d) 1 k . 1 − (1 − d) 1 k である。 0.91
(cid:113) 4.2 Different density levels (cid:113) 4.2 異なる密度レベル 0.80
In the first experiment, we investigated the performance of the methods on random Boolean matrices with different density levels. 最初の実験では, 密度の異なるランダムブール行列に対する手法の性能について検討した。 0.78
Here 100 different 50 × 50 matrices with k = 5 were generated for each of three different density levels: 20%, 50% and 80%. ここでは, 20%, 50%, 80%の3種類の密度レベルに対して, k = 5の50×50の行列をそれぞれ100種類生成した。 0.83
Figure 2 shows ASSO performs rather poorly across all density levels. 図2は、ASSOが全ての密度レベルにわたってかなり低い性能を示す。 0.65
For sparse matrices, BANMF and REGBANMF perform quite well. スパース行列の場合、BANMFとREGBANMFは非常によく機能する。 0.64
However for dense matrices, PNLPF outperforms every method. しかし、高密度行列の場合、PNLPFは全ての方法より優れる。 0.51
Overall, (regularized) BANMF consistently performs well across different sparsity levels. 全体として、(正規化)BANMFは、異なるスパーシティレベルにわたって、一貫して良好に機能する。 0.41
4.3 Different noise levels The next experiment is to investigate the performance of all methods under the effect of noise. 4.3 騒音レベル 次の実験は、ノイズの影響下で全ての手法の性能を調べることである。 0.80
Here 100 different 50 × 50 matrices with 50% density and latent space k = 5 are generated with no noise. ここで、50%の密度と潜在空間k = 5の異なる50×50行列100個をノイズなく生成する。 0.83
Then Bernoulli noise is added to the synthetic data according to different noise thresholds. 次に、異なる雑音閾値に応じて合成データにベルヌーイノイズを付加する。 0.79
Concretely, X 50×50 = W 50×5 ⊗B H 5×50 +f E 具体的には X 50×50 = W 50×5 >B H 5×50 +f E 0.51
6 20% dense50% dense80% dense10 −310 −210 −1Average of Boolean relative errorassonmfreg-nmfb anmfreg-banmfpnlpf 6 20% 密度50% 密度80% 密度10 −310 −210 −1 average of boolean relative errorassonmfreg-nmfb anmfreg-banmfpnlpf 0.74
英語(論文から抽出)日本語訳スコア
BANMF A PREPRINT BANMF プレプリント 0.66
Figure 3: Mean and standard deviation of Boolean relative error of four methods under three noise levels across 100 datasets. 図3:100のデータセットにまたがる3つのノイズレベルの下での4つのメソッドのブール相対誤差の平均と標準偏差。 0.71
(Regularized) BANMF are consistently outperform ASSO and PNL-PF. (正規化)BANMFは、ASSOおよびPNL−PFを一貫して上回る。 0.58
where and the flipping operation +f is defined as どこに フリップ操作 +f は 0.52
Wij, Hij ∼ Bernoulli(p) Ei,j ∼ Bernoulli(pE) Wij, Hij > Bernoulli(p) Ei,j > Bernoulli(pE) 0.75
(cid:26)Xij (cid:26)xij 0.84
¬Xij Xij = 聖Xij Xij = 0.59
if Eij = 0 if Eij = 1. eij = 0 ならば、eij = 1 である。 0.80
(9) Each of the 100 matrices dataset is corrupted with noise levels (0%, 1% and 5%). (9) 100の行列データセットのそれぞれがノイズレベル(0%、1%、5%)で破損する。 0.79
Figure 3 shows the mean and standard deviation of relative error across the 100 datasets, in which regularized BANMF consistently outperform ASSO and PNLPF. 図3は、100データセットにわたる相対誤差の平均と標準偏差を示し、正規化されたBANMFはASSOとPNLPFを一貫して上回る。 0.72
Moreover, BANMF outperforms PNLPF at lower noise thresholds. さらに、BANMFは低雑音閾値でPNLPFより優れる。 0.74
4.4 BANMF and NMF on different-rank data 4.4 異なるランクデータに基づくBANMF および NMF 0.71
The NMF algorithm searches for a best nonnegative rank approximation to X = W H. With BANMF being algorithmically similar to NMF, we are naturally interested in the performance when there is a gap between the Boolean rank and the nonnegative rank. BANMF はアルゴリズム的に NMF に類似しているので、ブールランクと非負ランクの間にギャップがある場合に自然にパフォーマンスに興味がある。
訳抜け防止モード: NMFアルゴリズムは、X = W H に対する最良の非負ランク近似を探索する。 私たちは自然にパフォーマンスに興味があります ブール位と非負位の間にはギャップがある。
0.63
Theoretically, it is known that the nonnegative rank is greater than or equal to the Boolean rank [2]. 理論的には、非負階数はブール階数 [2] より大きいか等しいことが知られている。
訳抜け防止モード: 理論的には、そのことが知られている。 非負のランクは Boolean rank [ 2 ] より大きいか等しい。
0.74
To empirically investigate the effect of a gap between the ranks, we generate a suite of Boolean matrices where a gap between rank+(X) and rankB(X) exists. ランク間のギャップの効果を実験的に検討するために、rank+(x) と rankb(x) の間のギャップが存在するブール行列の組を生成する。 0.63
This is done as follows. これは以下の通りである。 0.68
For each N, M = 10, 11, . 各 N に対して M = 10, 11 である。 0.86
. . , 50, k = 2, 3, . . . , 50, k = 2, 3, . 0.85
. . 6, and density levels 25%, 50%, 75%, we generate 5 Boolean matrices. . . 6であり,密度は25%,50%,75%であり,5つのブール行列を生成する。 0.80
We then want to measure the difference rank+(X)−rankB(X) for each Boolean matrix X. すると、各ブール行列 X に対する差分ランク+(X)−rankB(X) を測りたい。 0.73
Unfortunately, computing either the nonnegative or Boolean rank is NP hard. 残念ながら、非負ランクまたはブールランクの計算はNP困難である。 0.59
However we can efficiently estimate a lower bound on the rank gap. しかし、ランクギャップの低い境界を効率的に推定できる。 0.59
Indeed by construction, rankB(X) ≤ k and rank(X) ≤ rank+(X). 実際、構成上、ランクB(X) ≤ k とランク(X) ≤ rank+(X) である。 0.84
Thus if k ≤ rank(X), then したがって、k ≤ rank(x) であれば 0.91
rank+(X) − rankB(X) ≥ rank(X) − k. rank+(x) − rankb(x) ≥ rank(x) − k である。 0.93
Thus for each generated matrix, we check that k ≤ rank(X). したがって、生成された行列ごとに k ≤ rank(X) をチェックする。 0.80
If this check fails, we generate a new Boolean matrix with the same parameters. このチェックが失敗した場合、同じパラメータを持つ新しいBoolean行列を生成します。 0.76
We then compute rank(X) − k to estimate the lower bound on the gap. 次にランク(X) − k を計算し、ギャップ上の下界を推定する。 0.68
Figure 4 depicts the average error of each method as a function of the lower bound estimation of the rank gap. 図4は、各メソッドの平均誤差をランクギャップの下位境界推定関数として描いている。 0.75
For lower rank gap, many of the methods are comparable. より低いランクのギャップに対しては、多くの方法が同等である。 0.53
However the error in using NMF grows as the gap between the nonnegative and Boolean ranks grows, while the regularized BANMF algorithm is constant and low, and the unregularized BANMF falls somewhere in between. しかし、非負ランクとブールランクの差が大きくなるにつれてNMFの誤差は増大し、正規化BANMFアルゴリズムは一定かつ低値であり、非正規化BANMFは中間に位置する。 0.77
The regularized NMF’s error also grows with the rank gap, while PNLPF seems to stay constant with a higher error level compared to regularized BANMF. 正規化NMFの誤差はランクギャップとともに増大する一方、PNLPFは正規化BANMFよりも高いエラーレベルを維持しているように見える。 0.78
4.5 Execution time Since PNLPF’s performance is comparable with BANMF in some previous cases, we further compare the complexity between PNLPF and BANMF. 4.5 実行時間 PNLPFの性能はBANMFと同等であるため、PNLPFとBANMFの複雑さをさらに比較する。
訳抜け防止モード: 4.5 実行時間 PNLPFのパフォーマンスは、以前のケースではBANMFと同等である。 さらにPNLPFとBANMFの複雑性を比較した。
0.75
Given the high level of nonlinearity of PNLPF, it is expected to be more computationally expensive than BANMF algorithm. PNLPFの高レベルの非線形性を考えると、BANMFアルゴリズムよりも計算コストが高いことが期待される。 0.82
In the first comparison, the execution times of 1000 iterations for datasets of different data sizes are measured. 最初の比較では、異なるデータサイズのデータセットに対する1000回のイテレーションの実行時間を測定する。 0.77
Figure 5 shows the execution time in log-scale of PNLPF and BANMF. 図5は、PNLPFとBANMFのログスケールの実行時間を示しています。 0.70
The results show that when the data size is getting larger, PNLPF is increasingly more expensive. その結果、データサイズが大きくなると、PNLPFはますます高価になることがわかった。 0.71
For example, at the data size of 500 × 500, the execution time of PNLPF is about 24 = 16 times longer than of BANMF. 例えば、500 × 500のデータサイズでは、pnlpfの実行時間はbanmfの約24 = 16倍である。 0.63
In the second comparison, Figure 6 shows the time that each method converges in Boolean error rate for different datasets. 第2の比較では、図6は、各メソッドが異なるデータセットに対するブール誤差率に収束する時間を示しています。 0.70
The result shows that as the data size increases, PNLPF takes a longer time to converge. その結果、データサイズが大きくなると、PNLPFは収束するのに長い時間がかかることがわかった。
訳抜け防止モード: その結果は データサイズが大きくなると、PNLPFは収束するのに長い時間がかかる。
0.78
In the conclusion, BANMF is less computationally expensive compared to PNLPF. 結論として、BANMFはPNLPFに比べて計算コストが低い。 0.79
7 0% noise1% noise5% noise10 −410 −310 −210 −1Average of Boolean relative errorassonmfreg-nmfb anmfreg-banmfpnlpf 7 0%ノイズ1%ノイズ10 −410 −310 −210 −1ブール相対誤差fbanmfreg-nmfbanmfre g-banmfpnlpfの平均値 0.73
英語(論文から抽出)日本語訳スコア
BANMF A PREPRINT BANMF プレプリント 0.66
Figure 4: Performance of algorithms on Boolean/nonnegative rank gap dataset. 図4: ブール/非負のランクギャップデータセット上のアルゴリズムのパフォーマンス。 0.81
Figure 5: Execution time in log-scale of BANMF and PNLPF for 5 different size datasets. 図5: 5つの異なるサイズのデータセットに対するBANMFとPNLPFのログスケールの実行時間。 0.81
Overall, PNLPF is more expensive than BANMF, and even more expensive when the data size is larger. 全体として、PNLPFはBANMFよりも高価であり、データサイズが大きい場合にはさらに高価である。 0.76
4.6 Application in real data 4.6 実データへのアプリケーション 0.72
In this section, we demonstrate the performance of (regularized) BANMF and the other methods on three real datasets: UCI Zoo, Congressional voting records and Lung cancer with probes LUCAP0. 本稿では,UCI Zoo,議会投票記録,肺がんに対するLUCAP0を用いて,BANMFと他の3つの実際のデータセットの性能を実証する。
訳抜け防止モード: 本稿では,(正規化)BANMFの性能を示す。 その他の3つの実際のデータセット上の方法:UCI Zoo, 議員投票記録と肺がん : LUCAP0による検討
0.76
4.6.1 UCI zoo dataset 4.6.1 UCI動物園データセット 0.49
We first study the performance of BNMF-MC on decomposing the UCI zoo dataset 1 [3]. まず,UCI動物園データセット1[3]の分解におけるBNMF-MCの性能について検討する。 0.60
This dataset consists of 101 animals and 14 binary features, which results in a 101 × 14 Boolean matrix. このデータセットは101の動物と14のバイナリー特徴から構成され、結果として101×14のブール行列となる。 0.69
Figure 7 shows that regularized BANMF and NMF have the best performance, especially with higher latent dimensions. 図7は、正規化banmfとnmfは、特に高い潜在次元において、最高の性能を示す。
訳抜け防止モード: 図7は 正規化されたBANMFとNMFは、特に高い潜在次元で最高の性能を持つ。
0.73
Furthermore, Figure 8 shows the original data and reconstructed data from rank-3 decompositions. さらに、図8は、ランク3分解から元のデータと再構成されたデータを示す。 0.67
All methods seem to capture the Boolean structure of the data. すべてのメソッドはデータのブール構造をキャプチャするように見える。 0.71
1https://archive.ics .uci.edu/ml/datasets /Zoo 1https://archive.ics .uci.edu/ml/datasets /Zoo 0.25
8 0510152010 −310 −210 −1average relative errorassonmfreg-nmfb anmfreg-banmfpnlpflo wer bound of gap, rank+(X) - rankB(X)100150200250 300350400450500Data size n x n−101234Execution time (s) - logscalebanmfpnlpf 8 0510152010 −310 −210 −1average relative errorsonmfreg-nmfban mfreg-banmfpnlpflowe r bound of gap, rank+(X) - rankB(X)100150200250 300350500500500Data size n x n −101234Execution time (s) - logscalebanmfpnlpf 0.81
英語(論文から抽出)日本語訳スコア
BANMF A PREPRINT BANMF プレプリント 0.66
Figure 6: Convergence time in Boolean error rate of BANMF and PNLPF. 図6:banmfとpnlpfのブール誤差率における収束時間。 0.79
As the data is larger, PNLPF takes increasingly longer time to converge. データが大きくなるにつれて、PNLPFはより長い時間をかけて収束する。 0.71
Figure 7: UCI Zoo dataset. 図7: UCI Zooデータセット。 0.85
Regularized BANMF and NMF have the best performances, especially with higher latent dimensions. 正規化されたBANMFとNMFは、特に高い遅延次元で最高の性能を持つ。 0.60
9 0.00.10.20.30.060.08 0.100.120.1450x50ban mfpnlpf0.000.250.500 .751.001.251.500.060 .080.100.120.140.161 00x100banmfpnlpf0.00 .51.01.52.02.50.060. 080.100.120.140.1615 0x150banmfpnlpf01234 0.060.080.100.120.14 0.160.18200x200banmf pnlpfBoolean error ratetime (s)time (s)2468101214k0.000. 050.100.150.200.25Er ror rateUCI Zooassonmfreg-nmfban mfreg-banmfpnlpf 9 0.00.10.00.00.00.000 .080.100.120.1450xfp nlpf0.000.250.751.00 1.251.500.060.080.10 0.120.140.16100x100b anmfpnlpf0.00.51.02. 02.02.02.00.060.080. 100.140.16150x150ban mfpnlpf012340.060.08 0.100.160.18200x200b anmfpnlpfboolean error ratetime (s)time (s)2468101214k0.000. 050.100.25error rateuci zooassonmfreg-nmfban mfreg-banmfreg-banmf pnlpffpnlpf.1500.080 0.49
英語(論文から抽出)日本語訳スコア
BANMF A PREPRINT BANMF プレプリント 0.66
Figure 8: Original data versus reconstructed data from a rank-3 decomposition of (regularized) BANMF and other methods. 図8: オリジナルのデータ対再構成されたデータ ランク3によるbanmfや他の方法の分解。 0.83
All methods seem to capture the Boolean structure of the data. すべてのメソッドはデータのブール構造をキャプチャするように見える。 0.71
Figure 9: Congressional voting records dataset - (regularized) NMF has the lowest errors with (regularized) BANMF are slightly behind. 図9: 議会投票記録データセット - (正規化) NMF は (正規化) BANMF がわずかに遅れている最小のエラーを持つ。 0.78
4.6.2 Congressional voting records dataset 4.6.2 議会投票記録データセット 0.52
The second experiment uses the Congressional Voting Records Dataset from UCI dataset [3]. 第2の実験では、uciデータセットから議会投票記録データセットを使用する[3]。 0.67
This data includes the votes of the U.S. House of Representatives Congressmen on the 16 key votes. このデータには16の主要投票に関するアメリカ合衆国下院議員の投票が含まれている。 0.74
After removing samples with missing data, the Boolean data matrix has the dimension of 232 × 16. データの欠落でサンプルを除去した後、Boolean データマトリックスは寸法が232×16である。 0.79
Figure 9 shows that (regularized) NMF are better with (regularized) BANMF are slightly behind. 図9は、(正規化) NMF が(正規化) BANMF が少し遅れていることを示しています。 0.67
10 Original dataBANMF Reg-BANMFPNLPFNMF Reg-NMF2468101214k0. 000.050.100.150.200. 250.300.350.40Error ratehousevotesassonm freg-nmfbanmfreg-ban mfpnlpf 10 原データBANMF Reg-BANMFPNLPFNMF Reg-NMF2468101214k0. 000.050.100.150.250. 250.350.40Error ratehousevotesassonm freg-nmfbanmfreg-ban mfpnlpf 0.52
英語(論文から抽出)日本語訳スコア
BANMF A PREPRINT BANMF プレプリント 0.66
Figure 10: Lung cancer with probes dataset. 図10:プローブデータセットによる肺癌。 0.79
(Regularized) NMF has the lowest error with higher latent dimension. (正規化) NMF は高い潜時次元を持つ最小誤差を持つ。 0.77
4.6.3 Lung cancer with probes dataset (LUCAP0) プローブデータセット(lucap0)を用いた4.6.3肺癌 0.57
The third data set is the LUCAP0 (Lung Cancer with Probes) data which contains toy data generated artificially by causal Bayesian networks with binary variables, which being used in [9]. 第3のデータセットはLUCAP0(Lung Cancer with Probes)データであり、[9]で使用されるバイナリ変数を持つ因果ベイズネットワークによって人工的に生成されたおもちゃのデータを含んでいる。 0.78
This model is a medical application for diagnosing lung cancer.2. このモデルは肺癌の診断のための医学的応用である。 0.77
The dimensions of the data are 2000 × 143. データの寸法は 2000 × 143 である。 0.75
For this dataset, Figure 10 shows that (regularized) NMF are slightly better here. このデータセットでは、図10は(正規化された)NMFがここで少し改善されていることを示している。 0.56
Additionally, PNLPF performs well with low latent dimension, but is outperformed by regularized BANMF when the latent dimension gets larger. さらに、PNLPFは低潜伏次元でよく機能するが、潜伏次元が大きくなると正規化BANMFにより性能が向上する。 0.65
This PNLPF’s behavior can also be observed from previous datasets. このPNLPFの挙動は、以前のデータセットから観察することもできる。 0.76
Moreover, given this size of the data, PNLPF is more computationally expensive than BANMF and NMF (see subsection 4.5 for the execution time comparison.) さらに、このデータの大きさを考えると、PNLPF は BANMF や NMF よりも計算コストが高い(実行時間比較の 4.5 の部分参照)。 0.86
5 Discussion In this paper, we propose an approach to solve the Boolean matrix factorization problem using a nonnegative optimization with the constraint over an auxiliary matrix. 5 討論 本稿では,補助行列上の制約を伴う非負最適化を用いたブール行列分解問題の解法を提案する。 0.69
With this constraint, the algorithm can overcome the difference between Boolean algebra and normal algebra to capture the Boolean structure of the data. この制約により、アルゴリズムはブール代数と正規代数の違いを克服し、データのブール構造を捉えることができる。 0.69
The solution is then thresholded to give a solution for BMF problem. その後、解をしきい値にし、BMF問題の解を与える。 0.62
We show that the exact solution spaces of the two problem are equivalent, and that the BANMF algorithm has the nonincreasing property. 2つの問題の正確な解空間は等価であり、BANMFアルゴリズムは増加しない性質を持つことを示す。 0.74
The (regularized) BANMF algorithm is shown to be on outperform other methods in experiments on synthetic examples at particular density, and noisy regimes. 正規化された)BANMFアルゴリズムは、特定の密度およびノイズレジームにおける合成例の実験において、他の方法よりも優れていることが示されている。 0.63
Furthermore, these algorithms prove to be superior methods when there is a gap between Boolean rank and nonnegative rank. さらに、これらのアルゴリズムはブールランクと非負ランクの間にギャップがある場合に優れた手法であることが証明されている。
訳抜け防止モード: さらにこれらのアルゴリズムは 優れた方法である ブール位と非負位の間にギャップがある場合。
0.75
Outside these regimes, the (regularized) BANMF are still competitive with other state-of-the-art algorithms. これらの体制以外では、(正規化された)BANMFは依然として最先端のアルゴリズムと競合している。 0.50
References [1] Radim Belohlavek and Vilem Vychodil. 参考文献 [1]radim belohlavekとvilem vychodil。 0.63
Discovery of optimal factors in binary data via a novel method of matrix 行列の新しい手法による二元データにおける最適因子の発見 0.78
decomposition. Journal of Computer and System Sciences, 76(1):3–20, 2010. 分解 Journal of Computer and System Sciences, 76(1):3–20, 2010 0.65
[2] Derek DeSantis, Erik Skau, and Boian Alexandrov. デレク・デサンティス、エリック・スカウ、ブアン・アレクサンドロフ。 0.47
Factorizations of binary matrices–rank relations and the 二項行列の因子化–ランク関係と等式 0.59
uniqueness of boolean decompositions. ブール分解の独特さです 0.57
arXiv preprint arXiv:2012.10496, 2020. arXiv preprint arXiv:2012.10496, 2020 0.81
[3] Dheeru Dua and Casey Graff. [3]Dheeru DuaとCasey Graff。 0.75
UCI machine learning repository, 2017. UCI機械学習レポジトリ、2017年。 0.79
[4] B Everett. エヴァレット (Everett) の略。 0.35
An introduction to latent variable models. 潜在変数モデルの導入。 0.57
Springer Science & Business Media, 2013. スプリンガー・サイエンス&ビジネス・メディア、2013年。 0.46
[5] Daniel D Lee and H Sebastian Seung. 5]Daniel D LeeとH Sebastian Seung。 0.71
Learning the parts of objects by non-negative matrix factorization. 非負行列分解によるオブジェクトの部分の学習。 0.73
Nature, 401(6755):788–791, 1999. 自然だ 401(6755):788–791, 1999. 0.75
[6] Daniel D Lee and H Sebastian Seung. 6]Daniel D LeeとH Sebastian Seung。 0.70
Algorithms for non-negative matrix factorization. 非負行列分解のアルゴリズム。 0.71
In Advances in neural information processing systems, pages 556–562, 2001. 神経の進歩において 情報処理システム、2001年556-562頁。 0.74
2http://www.causalit y.inf.ethz.ch/data/L UCAS.html 2http://www.causalit y.inf.ethz.ch/data/L UCAS.html 0.22
11 20406080100k0.050.10 0.150.200.250.30Erro r ratelucap0assonmfreg -nmfbanmfreg-banmfpn lpf 11 20406080100k0.050.10 0.150.250.250.30Erro r ratelucap0assonmfreg -nmfbanmfreg-banmfpn lpf 0.50
英語(論文から抽出)日本語訳スコア
BANMF A PREPRINT BANMF プレプリント 0.66
[7] Claudio Lucchese, Salvatore Orlando, and Raffaele Perego. Claudio Lucchese, Salvatore Orlando, Raffaele Perego 0.45
Mining top-k patterns from binary datasets in presIn Proceedings of the 2010 SIAM International Conference on Data Mining, pages 165–176. バイナリデータセットからトップkパターンをマイニングする PresIn 2010 SIAM International Conference on Data Mining, page 165–176。 0.75
ence of noise. SIAM, 2010. 騒音のセンス。 2010年、SIAM。 0.62
[8] Pauli Miettinen, Taneli Mielik¨ainen, Aristides Gionis, Gautam Das, and Heikki Mannila. [8]パウリ・ミエティネン、タネリ・ミエリク・シャイネン、アリスティデス・ギオニス、ゴータム・ダス、ヘッキ・マニラ。 0.42
The discrete basis problem. 離散的な基礎 問題よ 0.70
IEEE transactions on knowledge and data engineering, 20(10):1348–1362, 2008. IEEEによる知識とデータエンジニアリングのトランザクション、20(10):1348–1362, 2008 0.85
[9] Sebastian Miron, Mamadou Diop, Anthony Larue, Eddy Robin, and David Brie. 9]Sebastian Miron、Mamadou Diop、Anthony Larue、Eddy Robin、David Brie。 0.61
Boolean decomposition of binary matrices using a post-nonlinear mixture approach. ブール分解 ポスト非線形混合法による二元行列 0.59
Signal Processing, 178:107809, 2021. 信号処理 178:107809, 2021。 0.85
[10] S. D. Monson, N. J. Pullman, and R. Rees. 10] s. d. monson, n. j. pullman, r. rees. 0.80
A Survey of Clique and Biclique Coverings and Factorizations of 斜め・斜め被覆の実態調査と要因 0.39
(0,1)-Matrices. Bull. (0,1)-行列。 ブル。 0.63
ICA, 14:17–86, 1995. ICA, 14:17-86, 1995。 0.68
[11] Siamak Ravanbakhsh, Barnab´as P´oczos, and Russell Greiner. 9]Siamak Ravanbakhsh、Barnab ́as P ́oczos、Russell Greiner。 0.64
Boolean matrix factorization and noisy completion ブール行列分解とノイズ完全化 0.55
via message passing. メッセージ・パッシング経由。 0.68
In ICML, volume 69, pages 945–954, 2016. ICML』69頁、945-954頁、2016年。 0.76
[12] Tammo Rukat, Chris C Holmes, Michalis K Titsias, and Christopher Yau. Tammo Rukat氏、Chris C Holmes氏、Michalis K Titsias氏、Christopher Yau氏。 0.64
Bayesian boolean matrix factorisation. Bayesian boolean matrix factorisation の略。 0.76
arXiv preprint arXiv:1702.06166, 2017. arXiv preprint arXiv:1702.06166, 2017 0.80
[13] Charles Spearman. チャールズ・スピアマン(Charles Spearman)。 0.72
“General intelligence,” objectively determined and measured. 客観的に決定し測定する「一般知性」。 0.68
The American Journal of The American Journal(英語) 0.75
Psychology, 15, 1961. 1961年、心理学博士。 0.77
[14] G. W. Stewart. G.W.スチュワート [14] 0.69
On the early history of the singular value decomposition. 特異値分解の初期の歴史について 0.60
SIAM review, 35(4):551–566, 1993. SIAM Review, 35(4):551–566, 1993。 0.89
[15] Zhongyuan Zhang, Tao Li, Chris Ding, and Xiangsun Zhang. [15]Zhongyuan Zhang、Tao Li、Chris Ding、Xiangsun Zhang。 0.68
Binary matrix factorization with applications. In 二元行列分解と応用 院 0.43
Seventh IEEE international conference on data mining (ICDM 2007), pages 391–400. 第7回ieee international conference on data mining (icdm 2007) 391-400頁。 0.75
IEEE, 2007. 2007年、IEEE。 0.65
12 12 0.85
                         ページの最初に戻る

翻訳にはFugu-Machine Translatorを利用しています。