論文の概要: SO(3)-invariant PCA with application to molecular data
- arxiv url: http://arxiv.org/abs/2510.18827v1
- Date: Tue, 21 Oct 2025 17:23:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:14.028813
- Title: SO(3)-invariant PCA with application to molecular data
- Title(参考訳): SO(3)-不変PCAと分子データへの応用
- Authors: Michael Fraiman, Paulina Hoyos, Tamir Bendory, Joe Kileel, Oscar Mickelin, Nir Sharon, Amit Singer,
- Abstract要約: ナイーブなアプローチでは、データセットを各サンプルの多くの回転コピーで拡張し、不当な計算コストを発生させる必要がある。
明示的なデータ拡張を伴わずに全回転を暗黙的に説明できるSO(3)不変PCAの効率的で原則化されたフレームワークを開発する。
本手法を実世界の分子データセット上で検証し,その有効性を実証し,大規模・高次元再構成問題への新たな可能性を開く。
- 参考スコア(独自算出の注目度): 6.809315864458212
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Principal component analysis (PCA) is a fundamental technique for dimensionality reduction and denoising; however, its application to three-dimensional data with arbitrary orientations -- common in structural biology -- presents significant challenges. A naive approach requires augmenting the dataset with many rotated copies of each sample, incurring prohibitive computational costs. In this paper, we extend PCA to 3D volumetric datasets with unknown orientations by developing an efficient and principled framework for SO(3)-invariant PCA that implicitly accounts for all rotations without explicit data augmentation. By exploiting underlying algebraic structure, we demonstrate that the computation involves only the square root of the total number of covariance entries, resulting in a substantial reduction in complexity. We validate the method on real-world molecular datasets, demonstrating its effectiveness and opening up new possibilities for large-scale, high-dimensional reconstruction problems.
- Abstract(参考訳): 主成分分析(PCA)は次元の減少と分解の基本的な手法であるが、構造生物学に共通する任意の向きを持つ3次元データへの適用は重大な課題を呈している。
ナイーブなアプローチでは、データセットを各サンプルの多くの回転コピーで拡張し、不当な計算コストを発生させる必要がある。
本稿では,SO(3)不変なPCAに対して,明示的なデータ拡張を伴わずに全回転を暗黙的に説明できる,効率的かつ原則化されたフレームワークを開発することにより,PCAを未知の向きで3次元ボリュームデータセットに拡張する。
基礎となる代数的構造を利用することで、計算は共分散成分の総数の平方根のみを伴い、結果として複雑性が大幅に減少することを示した。
本手法を実世界の分子データセット上で検証し,その有効性を実証し,大規模・高次元再構成問題への新たな可能性を開く。
関連論文リスト
- Rotational Sampling: A Plug-and-Play Encoder for Rotation-Invariant 3D Molecular GNNs [5.558678875187018]
グラフニューラルネットワーク(GNN)は分子特性予測において顕著な成功を収めた。
従来のグラフ表現は、分子の固有の3次元空間構造を効果的に符号化するのに苦労する。
本稿では,回転サンプリングを利用した新しい3D符号化モジュールを提案する。
論文 参考訳(メタデータ) (2025-07-01T08:58:12Z) - Solve sparse PCA problem by employing Hamiltonian system and leapfrog method [0.0]
そこで本研究では,スムーズなL1ペナルティを通したスパースPCAアルゴリズムを提案する。
k-アネレスト近傍とカーネルリッジ回帰の両方を用いた顔認識データセットの実験的評価-提案したスパースPCA法は従来のPCA法よりも高い分類精度を一貫して達成している。
論文 参考訳(メタデータ) (2025-03-30T06:39:11Z) - Adversarial Dependence Minimization [78.36795688238155]
この研究は、線形対のデコリレーションを超越した依存最小化のための微分可能でスケーラブルなアルゴリズムを提供する。
我々は,PCAを非線形デコリレーションに拡張し,画像分類法の一般化を改良し,自己教師あり表現学習における次元的崩壊を防止する3つのアプリケーションでその実用性を実証する。
論文 参考訳(メタデータ) (2025-02-05T14:43:40Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - Gradient-Based Feature Learning under Structured Data [57.76552698981579]
異方性設定では、一般的に使用される球面勾配力学は真の方向を回復できないことがある。
バッチ正規化を連想させる適切な重み正規化は、この問題を軽減することができることを示す。
特に、スパイクモデルの下では、勾配に基づくトレーニングのサンプルの複雑さは情報指数とは独立にできる。
論文 参考訳(メタデータ) (2023-09-07T16:55:50Z) - Local manifold learning and its link to domain-based physics knowledge [53.15471241298841]
多くの反応系では、熱化学状態空間は低次元多様体(LDM)に近く進化すると仮定される。
局所的データクラスタ(ローカルPCA)に適用されたPCAは,熱化学状態空間の固有パラメータ化を検出することができることを示す。
論文 参考訳(メタデータ) (2022-07-01T09:06:25Z) - PCA-Boosted Autoencoders for Nonlinear Dimensionality Reduction in Low
Data Regimes [0.2925461470287228]
そこで本研究では,PCAを利用して少ない非線形データによく対応できるオートエンコーダを提案する。
まず, データの非線形性とサイズが提案手法の性能に及ぼす影響について検討した。
論文 参考訳(メタデータ) (2022-05-23T23:46:52Z) - Relative Pose from SIFT Features [50.81749304115036]
基本行列の未知元と向きとスケールに関する新しい線形制約を導出する。
提案した制約は、合成環境における多くの問題と、80000以上の画像ペア上で公開されている実世界のデータセットでテストされる。
論文 参考訳(メタデータ) (2022-03-15T14:16:39Z) - A Linearly Convergent Algorithm for Distributed Principal Component
Analysis [12.91948651812873]
本稿では,1時間スケール分散pcaアルゴリズムである分散sanger's algorithm(dsa)を提案する。
提案アルゴリズムは真の解の近傍に線形収束することを示した。
論文 参考訳(メタデータ) (2021-01-05T00:51:14Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Principal Ellipsoid Analysis (PEA): Efficient non-linear dimension
reduction & clustering [9.042239247913642]
本稿では,データとより柔軟なクラスタ形状の非線形関係を実現することにより,PCAとk平均の改善に焦点を当てる。
鍵となる貢献は、PCAに代わる単純で効率的な代替品を定義する、PEA(Principal Analysis)の新しいフレームワークである。
さまざまな実際のデータクラスタリングアプリケーションにおいて、PEAは単純なデータセットのためのk-meansと同様に機能し、より複雑な設定でパフォーマンスを劇的に改善する。
論文 参考訳(メタデータ) (2020-08-17T06:25:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。