論文の概要: Archetypal Analysis for Binary Data
- arxiv url: http://arxiv.org/abs/2502.04172v1
- Date: Thu, 06 Feb 2025 16:05:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-07 14:34:36.886969
- Title: Archetypal Analysis for Binary Data
- Title(参考訳): バイナリデータのアーチティパル解析
- Authors: A. Emilie J. Wedenborg, Morten Mørup,
- Abstract要約: Archetypal analysis (AA) は、アーチタイプを示すデータポイントの凸結合を用いて、異なるパターンを識別する行列分解法である。
AAの既存のほとんどのメソッドは連続データ用に設計されており、データ分散の構造を利用していない。
本稿では,2進データに対するアーキティパル解析のための2つの新しい最適化フレームワークを提案する。
- 参考スコア(独自算出の注目度): 1.9221715284876513
- License:
- Abstract: Archetypal analysis (AA) is a matrix decomposition method that identifies distinct patterns using convex combinations of the data points denoted archetypes with each data point in turn reconstructed as convex combinations of the archetypes. AA thereby forms a polytope representing trade-offs of the distinct aspects in the data. Most existing methods for AA are designed for continuous data and do not exploit the structure of the data distribution. In this paper, we propose two new optimization frameworks for archetypal analysis for binary data. i) A second order approximation of the AA likelihood based on the Bernoulli distribution with efficient closed-form updates using an active set procedure for learning the convex combinations defining the archetypes, and a sequential minimal optimization strategy for learning the observation specific reconstructions. ii) A Bernoulli likelihood based version of the principal convex hull analysis (PCHA) algorithm originally developed for least squares optimization. We compare these approaches with the only existing binary AA procedure relying on multiplicative updates and demonstrate their superiority on both synthetic and real binary data. Notably, the proposed optimization frameworks for AA can easily be extended to other data distributions providing generic efficient optimization frameworks for AA based on tailored likelihood functions reflecting the underlying data distribution.
- Abstract(参考訳): Archetypal analysis (AA) は、データポイントと各データポイントとの凸結合を用いて、各データポイントの凸結合として再構成されたデータポイントの凸結合を用いて、異なるパターンを識別する行列分解法である。
これにより、AAはデータの異なる側面のトレードオフを表すポリトープを形成する。
AAの既存のほとんどのメソッドは連続データ用に設計されており、データ分散の構造を利用していない。
本稿では,2進データに対する古文字解析のための2つの新しい最適化フレームワークを提案する。
一 アーチェタイプを定義する凸組合せを学習するためのアクティブセット手順と、観測特定再構成を学習するための逐次最小限の最適化戦略を用いて、ベルヌーイ分布に基づくAA可能性の2次近似を効率的なクローズドフォーム更新により行うこと。
二 主凸船体解析(PCHA)アルゴリズムのベルヌーイ確率に基づくバージョンは、もともと最小二乗最適化のために開発されたものである。
これらのアプローチを,乗法的更新に依存する唯一のバイナリAA手順と比較し,合成データと実データの両方に優位性を示す。
特に、提案したAAの最適化フレームワークは、基礎となるデータ分布を反映した調整された可能性関数に基づいて、AAの汎用的な効率的な最適化フレームワークを提供する他のデータ分散にも容易に拡張できる。
関連論文リスト
- Induced Covariance for Causal Discovery in Linear Sparse Structures [55.2480439325792]
因果モデルでは、観測データから変数間の因果関係を解き明かそうとしている。
本稿では,変数が線形に疎結合な関係を示す設定のための新しい因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-02T04:01:38Z) - Regularized Projection Matrix Approximation with Applications to Community Detection [1.3761665705201904]
本稿では,アフィニティ行列からクラスタ情報を復元するための正規化プロジェクション行列近似フレームワークを提案する。
3つの異なるペナルティ関数について検討し, それぞれが有界, 正, スパースシナリオに対応するように調整した。
合成および実世界の両方のデータセットで行った数値実験により、我々の正規化射影行列近似アプローチはクラスタリング性能において最先端の手法を著しく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2024-05-26T15:18:22Z) - Simulation Based Bayesian Optimization [0.5524804393257919]
本稿では,獲得関数を最適化するための新しいアプローチとして,シミュレーションベースベイズ最適化(SBBO)を提案する。
GPは後続予測分布への解析的アクセスを提供するため、サロゲートモデルとして一般的に使用される。
本研究では,SBBOの有効性を種々の代理モデルを用いて実証的に実証する。
論文 参考訳(メタデータ) (2024-01-19T16:56:11Z) - Mode-wise Principal Subspace Pursuit and Matrix Spiked Covariance Model [13.082805815235975]
行列データに対して行次元と列次元の両方に隠れたバリエーションを抽出するために,モードワイド・プリンシパル・サブスペース・スーツ (MOP-UP) と呼ばれる新しいフレームワークを導入する。
提案フレームワークの有効性と実用性は、シミュレーションと実データの両方の実験を通して実証される。
論文 参考訳(メタデータ) (2023-07-02T13:59:47Z) - DAG Learning on the Permutahedron [33.523216907730216]
本稿では,観測データから潜在有向非巡回グラフ(DAG)を発見するための連続最適化フレームワークを提案する。
提案手法は、置換ベクトル(いわゆるペルムタヘドロン)のポリトープを最適化し、位相的順序付けを学習する。
論文 参考訳(メタデータ) (2023-01-27T18:22:25Z) - Learning Discrete Directed Acyclic Graphs via Backpropagation [16.823075878437493]
近年, バックプロパゲーションによるデータからDAG(Directed Acyclic Graphs)を学習するために, 連続緩和法が提案されている。
離散バックプロパゲーションによるDAG学習フレームワークであるDAG-DBを提案する。
論文 参考訳(メタデータ) (2022-10-27T12:03:55Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Random extrapolation for primal-dual coordinate descent [61.55967255151027]
本稿では,データ行列の疎度と目的関数の好適な構造に適応する,ランダムに外挿した原始-双対座標降下法を提案する。
一般凸凹の場合, 主対差と目的値に対するシーケンスのほぼ確実に収束と最適サブ線形収束率を示す。
論文 参考訳(メタデータ) (2020-07-13T17:39:35Z) - Model Fusion with Kullback--Leibler Divergence [58.20269014662046]
異種データセットから学習した後続分布を融合する手法を提案する。
我々のアルゴリズムは、融合モデルと個々のデータセット後部の両方に対する平均場仮定に依存している。
論文 参考訳(メタデータ) (2020-07-13T03:27:45Z) - Two-Dimensional Semi-Nonnegative Matrix Factorization for Clustering [50.43424130281065]
TS-NMFと呼ばれる2次元(2次元)データに対する新しい半負行列分解法を提案する。
前処理ステップで2次元データをベクトルに変換することで、データの空間情報に深刻なダメージを与える既存の手法の欠点を克服する。
論文 参考訳(メタデータ) (2020-05-19T05:54:14Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。