論文の概要: A Vectorization Method Induced By Maximal Margin Classification For Persistent Diagrams
- arxiv url: http://arxiv.org/abs/2407.21298v1
- Date: Wed, 31 Jul 2024 02:55:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-01 18:51:29.085228
- Title: A Vectorization Method Induced By Maximal Margin Classification For Persistent Diagrams
- Title(参考訳): 永続図形における最大マージン分類によるベクトル化法
- Authors: An Wu, Yu Pan, Fuqi Zhou, Jinghui Yan, Chuanlu Liu,
- Abstract要約: バナッハ空間の最大辺分類に基づく永続図形のより幾何学的なベクトル化法を提案する。
我々の手法は頑健さと精度の両方において統計的手法を超越している。
- 参考スコア(独自算出の注目度): 1.1273557174557782
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Persistent homology is an effective method for extracting topological information, represented as persistent diagrams, of spatial structure data. Hence it is well-suited for the study of protein structures. Attempts to incorporate Persistent homology in machine learning methods of protein function prediction have resulted in several techniques for vectorizing persistent diagrams. However, current vectorization methods are excessively artificial and cannot ensure the effective utilization of information or the rationality of the methods. To address this problem, we propose a more geometrical vectorization method of persistent diagrams based on maximal margin classification for Banach space, and additionaly propose a framework that utilizes topological data analysis to identify proteins with specific functions. We evaluated our vectorization method using a binary classification task on proteins and compared it with the statistical methods that exhibit the best performance among thirteen commonly used vectorization methods. The experimental results indicate that our approach surpasses the statistical methods in both robustness and precision.
- Abstract(参考訳): 永続ホモロジー(Persistent homology)は、空間構造データの永続図として表される位相情報を抽出する効果的な方法である。
したがって、タンパク質構造の研究には適している。
タンパク質機能予測の機械学習手法に永続ホモロジーを組み込もうとする試みは、永続図のベクトル化にいくつかの技術をもたらした。
しかし、現在のベクトル化法は過度に人工的であり、情報の有効利用や方法の合理性を保証することはできない。
この問題に対処するために,バナッハ空間の最大マージン分類に基づく永続図のより幾何学的なベクトル化法を提案し,また,トポロジ的データ解析を用いて特定の機能を持つタンパク質を同定するフレームワークを提案する。
タンパク質のバイナリ分類タスクを用いてベクター化法を評価し,13種類のベクター化法の中で最高の性能を示す統計的手法と比較した。
実験結果から,本手法はロバスト性および精度の両方において統計的手法を超越していることが示唆された。
関連論文リスト
- Topograph: An efficient Graph-Based Framework for Strictly Topology Preserving Image Segmentation [78.54656076915565]
位相的正しさは多くの画像分割タスクにおいて重要な役割を果たす。
ほとんどのネットワークは、Diceのようなピクセル単位の損失関数を使って、トポロジカルな精度を無視して訓練されている。
トポロジ的に正確な画像セグメンテーションのための新しいグラフベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-05T16:20:14Z) - Efficient Trajectory Inference in Wasserstein Space Using Consecutive Averaging [3.8623569699070353]
軌道推論は、そのような観測から連続的な過程を再構築する挑戦を扱う。
ワッサーシュタイン空間に直交する連続平均化による点雲のB-スプライン近似法を提案する。
コンバージェンス保証を提供し、シミュレーションセルデータ上でテストすることで、我々の手法を厳格に評価する。
論文 参考訳(メタデータ) (2024-05-30T04:19:20Z) - Generalizing Backpropagation for Gradient-Based Interpretability [103.2998254573497]
モデルの勾配は、半環を用いたより一般的な定式化の特別な場合であることを示す。
この観測により、バックプロパゲーションアルゴリズムを一般化し、他の解釈可能な統計を効率的に計算することができる。
論文 参考訳(メタデータ) (2023-07-06T15:19:53Z) - Natural Gradient Methods: Perspectives, Efficient-Scalable
Approximations, and Analysis [0.0]
Natural Gradient Descentは、情報幾何学によって動機付けられた2次最適化手法である。
一般的に使用されるヘッセン語の代わりにフィッシャー情報マトリックスを使用している。
2階法であることは、膨大な数のパラメータとデータを扱う問題で直接使用されることが不可能である。
論文 参考訳(メタデータ) (2023-03-06T04:03:56Z) - A Segmentation Method for fluorescence images without a machine learning
approach [0.0]
本研究では,細胞と核を同定するための決定論的計算神経科学アプローチについて述べる。
この方法は、正式に正しい関数に基づいて堅牢であり、特定のデータセットのチューニングに支障を来さない。
論文 参考訳(メタデータ) (2022-12-28T16:47:05Z) - Multivariate feature ranking of gene expression data [62.997667081978825]
ペアワイズ相関とペアワイズ整合性に基づく2つの新しい多変量特徴ランキング手法を提案する。
提案手法は, クラスタリング変動, チ・スクエアド, 相関, 情報ゲイン, ReliefF および Significance の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-03T17:19:53Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Spectral Methods for Data Science: A Statistical Perspective [37.2486912080998]
スペクトル法は、巨大でノイズの多い不完全なデータから情報を抽出するための単純で驚くほど効果的な手法として登場した。
この本は、現代の統計学的観点から、体系的で包括的でアクセスしやすいスペクトル法の導入を意図している。
論文 参考訳(メタデータ) (2020-12-15T18:40:56Z) - A Fast and Robust Method for Global Topological Functional Optimization [70.11080854486953]
本稿では, より高速で, より安定で, より堅牢なバックプロパゲーション手法を提案する。
このスキームは、永続化ダイアグラム内のドットの安定な可視化を、データ構造におけるクリティカルでほぼクリティカルな簡易な分布として作成するためにも使用できる。
論文 参考訳(メタデータ) (2020-09-17T18:46:16Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z) - Topological Machine Learning for Mixed Numeric and Categorical Data [0.0]
トポロジカルデータ分析は、高次元データの研究において優れた機械学習の新しい分野である。
混合数値と分類属性を持つ混合データオブジェクトは、現実世界のアプリケーションではユビキタスである。
混合データ分類のための新しいトポロジカル機械学習手法を提案する。
論文 参考訳(メタデータ) (2020-03-10T08:50:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。