論文の概要: Tropical Support Vector Machine and its Applications to Phylogenomics
- arxiv url: http://arxiv.org/abs/2003.00677v2
- Date: Tue, 24 Mar 2020 18:24:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 05:42:55.439139
- Title: Tropical Support Vector Machine and its Applications to Phylogenomics
- Title(参考訳): 熱帯サポートベクターマシンとその系統解析への応用
- Authors: Xiaoxian Tang, Houjie Wang, Ruriko Yoshida
- Abstract要約: 系統解析のための多点データセットを分類するための熱帯支援ベクトルマシン(SVM)を提案する。
ハードマージン熱帯SVMとソフトマージン熱帯SVMの両方を線形プログラミング問題として定式化することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most data in genome-wide phylogenetic analysis (phylogenomics) is essentially
multidimensional, posing a major challenge to human comprehension and
computational analysis. Also, we can not directly apply statistical learning
models in data science to a set of phylogenetic trees since the space of
phylogenetic trees is not Euclidean. In fact, the space of phylogenetic trees
is a tropical Grassmannian in terms of max-plus algebra. Therefore, to classify
multi-locus data sets for phylogenetic analysis, we propose tropical support
vector machines (SVMs). Like classical SVMs, a tropical SVM is a discriminative
classifier defined by the tropical hyperplane which maximizes the minimum
tropical distance from data points to itself in order to separate these data
points into sectors (half-spaces) in the tropical projective torus. Both hard
margin tropical SVMs and soft margin tropical SVMs can be formulated as linear
programming problems. We focus on classifying two categories of data, and we
study a simpler case by assuming the data points from the same category ideally
stay in the same sector of a tropical separating hyperplane. For hard margin
tropical SVMs, we prove the necessary and sufficient conditions for two
categories of data points to be separated, and we show an explicit formula for
the optimal value of the feasible linear programming problem. For soft margin
tropical SVMs, we develop novel methods to compute an optimal tropical
separating hyperplane. Computational experiments show our methods work well. We
end this paper with open problems.
- Abstract(参考訳): ゲノム全体の系統解析(phylogenomics)のほとんどのデータは本質的に多次元であり、人間の理解と計算分析にとって大きな課題となっている。
また,系統樹の空間はユークリッド的ではないため,データサイエンスにおける統計的学習モデルを直接系統樹に適用することはできない。
実際、系統樹の空間は、マックスプラス代数(max-plus algebra)という観点から熱帯グラスマン多様体である。
そこで,系統解析のためのマルチロケーションデータセットを分類するために,熱帯サポートベクターマシン (svms) を提案する。
古典的なSVMと同様に、熱帯SVMは熱帯の超平面によって定義される識別的分類器であり、これらのデータポイントを熱帯の射影トーラス内のセクター(半空間)に分けるために、データポイントからそれ自身への最小の熱帯距離を最大化する。
ハードマージン熱帯SVMとソフトマージン熱帯SVMの両方を線形プログラミング問題として定式化することができる。
我々は2つのカテゴリのデータを分類することに集中し、同じカテゴリのデータポイントが熱帯分離超平面の同じセクタに理想的に残ると仮定することで、より単純なケースを考察する。
ハードマージンの熱帯SVMに対して、2つのカテゴリのデータポイントを分離するための必要十分条件を証明し、実現可能な線形計画問題の最適値について明示的な公式を示す。
ソフトマージン熱帯svmに対して, 最適な熱帯分離超平面を計算する新しい手法を開発した。
計算実験は、我々の手法がうまく動作することを示す。
この論文はオープンな問題で締めくくります。
関連論文リスト
- Optimal Mixed Integer Linear Optimization Trained Multivariate Classification Trees [0.0]
最適二分分類木を設計するための2つのカットベース混合整数線形最適化(MILO)法を提案する。
我々のモデルは、最小限の実用不可能なサブシステム(MIS)をオンザフライで識別し、パッケージング制約の形をとる切断平面を導出する。
論文 参考訳(メタデータ) (2024-08-02T14:37:28Z) - Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。
LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。
LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文 参考訳(メタデータ) (2024-03-11T05:35:38Z) - Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Matrix Factorization in Tropical and Mixed Tropical-Linear Algebras [27.680519297540535]
熱帯代数上の行列分解に関わる2つの問題について検討する。
まず,局所最適化の多くを回避する改良アルゴリズムを提案する。
第2の定式化は、与えられた行列を3つの行列の積に近似的に分解することを考える。
論文 参考訳(メタデータ) (2023-09-25T07:29:59Z) - Large-scale gradient-based training of Mixtures of Factor Analyzers [67.21722742907981]
本稿では,勾配降下による高次元学習を効果的に行うための理論解析と新しい手法の両立に寄与する。
MFAトレーニングと推論/サンプリングは,学習終了後の行列逆変換を必要としない精度行列に基づいて行うことができることを示す。
理論解析と行列の他に,SVHNやMNISTなどの画像データセットにMFAを適用し,サンプル生成と外乱検出を行う能力を示す。
論文 参考訳(メタデータ) (2023-08-26T06:12:33Z) - VaiPhy: a Variational Inference Based Algorithm for Phylogeny [2.2499166814992435]
拡張木空間における近似後部推論のための驚くほど高速な VI ベースのアルゴリズムである VaiPhy を提案する。
VaiPhyは、実データ上の最先端の手法と同等に辺りのログのような推定をし、自動微分を必要としないため、かなり高速である。
論文 参考訳(メタデータ) (2022-03-01T13:55:56Z) - Highly Scalable and Provably Accurate Classification in Poincare Balls [40.82908295137667]
我々は、スケーラブルで単純な双曲型線形分類器を証明可能な性能保証で学習するための統一的なフレームワークを構築した。
提案手法は,新しい双曲型および二階型パーセプトロンアルゴリズムと,双曲型サポートベクトルマシン分類器の効率的かつ高精度な凸最適化設定を含む。
数百万の点からなる合成データセットと、シングルセルRNA-seq式測定、CIFAR10、Fashion-MNIST、mini-ImageNetのような複雑な実世界のデータセットの性能評価を行う。
論文 参考訳(メタデータ) (2021-09-08T16:59:39Z) - Tropical Support Vector Machines: Evaluations and Extension to Function
Spaces [0.0]
熱帯SVMは、最大プラス代数で熱帯計量の下で熱帯超平面を使用してデータポイントを分類する。
理論的には、データポイントを分類する熱帯SVMは次元の呪いに対してかなり堅牢であることを示す。
論文 参考訳(メタデータ) (2021-01-27T16:35:34Z) - Two-step penalised logistic regression for multi-omic data with an
application to cardiometabolic syndrome [62.997667081978825]
我々は,各層で変数選択を行うマルチオミックロジスティック回帰に対する2段階のアプローチを実装した。
私たちのアプローチは、可能な限り多くの関連する予測子を選択することを目標とすべきです。
提案手法により,分子レベルでの心筋メタボリックシンドロームの特徴を同定することができる。
論文 参考訳(メタデータ) (2020-08-01T10:36:27Z) - Learning Bijective Feature Maps for Linear ICA [73.85904548374575]
画像データに適した既存の確率的深層生成モデル (DGM) は, 非線形ICAタスクでは不十分であることを示す。
そこで本研究では,2次元特徴写像と線形ICAモデルを組み合わせることで,高次元データに対する解釈可能な潜在構造を学習するDGMを提案する。
画像上のフローベースモデルや線形ICA、変分オートエンコーダよりも、高速に収束し、訓練が容易なモデルを作成し、教師なしの潜在因子発見を実現する。
論文 参考訳(メタデータ) (2020-02-18T17:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。