論文の概要: Neural Distance Embeddings for Biological Sequences
- arxiv url: http://arxiv.org/abs/2109.09740v1
- Date: Mon, 20 Sep 2021 17:30:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-22 14:10:57.221672
- Title: Neural Distance Embeddings for Biological Sequences
- Title(参考訳): 生物配列のための神経距離埋め込み
- Authors: Gabriele Corso, Rex Ying, Michal P\'andy, Petar Veli\v{c}kovi\'c, Jure
Leskovec, Pietro Li\`o
- Abstract要約: 幾何ベクトル空間に配列を埋め込むためのフレームワークであるNeuroSEEDを提案する。
階層構造を捉えた双曲空間の有効性を示し, RMSEの埋め込みにおける平均22%の還元効果を示す。
提案手法は,実世界のデータセットに対して,大幅な精度向上と実行時改善を示す。
- 参考スコア(独自算出の注目度): 43.07977514121458
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The development of data-dependent heuristics and representations for
biological sequences that reflect their evolutionary distance is critical for
large-scale biological research. However, popular machine learning approaches,
based on continuous Euclidean spaces, have struggled with the discrete
combinatorial formulation of the edit distance that models evolution and the
hierarchical relationship that characterises real-world datasets. We present
Neural Distance Embeddings (NeuroSEED), a general framework to embed sequences
in geometric vector spaces, and illustrate the effectiveness of the hyperbolic
space that captures the hierarchical structure and provides an average 22%
reduction in embedding RMSE against the best competing geometry. The capacity
of the framework and the significance of these improvements are then
demonstrated devising supervised and unsupervised NeuroSEED approaches to
multiple core tasks in bioinformatics. Benchmarked with common baselines, the
proposed approaches display significant accuracy and/or runtime improvements on
real-world datasets. As an example for hierarchical clustering, the proposed
pretrained and from-scratch methods match the quality of competing baselines
with 30x and 15x runtime reduction, respectively.
- Abstract(参考訳): データ依存的ヒューリスティックの開発と進化距離を反映する生物学的配列の表現は、大規模な生物学的研究において重要である。
しかしながら、連続ユークリッド空間に基づく一般的な機械学習アプローチは、モデルの進化と現実世界のデータセットを特徴づける階層的関係をモデルとする編集距離の離散的な組合せ定式化に苦慮している。
本稿では,幾何学的ベクトル空間にシーケンスを埋め込む汎用フレームワークであるニューラル距離埋め込み(neuroseed)を提案し,階層構造をキャプチャする双曲空間の有効性を示し,最良な空間に対して平均22%のrmse埋め込み削減を提供する。
このフレームワークの能力とこれらの改善の意義は、バイオインフォマティクスにおける複数のコアタスクに対する教師付きおよび教師なしのNeuroSEEDアプローチを考案した。
一般的なベースラインとベンチマークして、提案手法は現実世界のデータセットに対して、大幅な精度と実行時の改善を示す。
階層的クラスタリングの例として,提案手法は,30倍,15倍のランタイム削減と競合するベースラインの品質に適合する。
関連論文リスト
- Towards Spatially-Lucid AI Classification in Non-Euclidean Space: An
Application for MxIF Oncology Data [3.0566763412020714]
異なる場所タイプの複数カテゴリの点集合が与えられた場合、我々のゴールは空間分解型分類器を開発することである。
この問題は、腫瘍と腫瘍の関係を解析し、新しい免疫療法を設計するために、腫瘍学などの多くの応用において重要である。
我々は、重み付き距離学習率や空間領域適応など、異なるトレーニング戦略を明示的に用いた空間アンサンブルフレームワークを探索する。
論文 参考訳(メタデータ) (2024-02-22T21:22:21Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Interpretable statistical representations of neural population dynamics
and geometry [4.867247349906909]
非線型力学系を表現するための教師なし幾何学的深層学習フレームワークを提案する。
本手法は,計測軌跡に基づく力学の非バイアス比較に対して,ロバストな幾何認識あるいは幾何非依存表現を提供する。
論文 参考訳(メタデータ) (2023-04-06T21:11:04Z) - Kernel Biclustering algorithm in Hilbert Spaces [8.303238963864885]
我々は,エネルギー距離と平均誤差の最大値という概念を用いて,抽象空間における新しいモデルフリー・ビクラスタリングアルゴリズムを開発した。
提案手法は,既存の文献よりも一般的で複雑なクラスタ形状を学習することができる。
提案手法は,カーネルの適切な選択を前提として,その最適シナリオにおける最先端手法と類似している。
論文 参考訳(メタデータ) (2022-08-07T08:41:46Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Interpolation-based Correlation Reduction Network for Semi-Supervised
Graph Learning [49.94816548023729]
補間型相関低減ネットワーク(ICRN)と呼ばれる新しいグラフコントラスト学習手法を提案する。
提案手法では,決定境界のマージンを大きくすることで,潜在特徴の識別能力を向上させる。
この2つの設定を組み合わせることで、豊富なラベル付きノードと稀に価値あるラベル付きノードから豊富な監視情報を抽出し、離散表現学習を行う。
論文 参考訳(メタデータ) (2022-06-06T14:26:34Z) - IGAN: Inferent and Generative Adversarial Networks [0.0]
IGANは複雑な高次元データ分布における生成モデルと推論モデルの両方を学習する。
画像と潜伏空間の両方で敵の戦略を書き換えることで、従来のGANフレームワークを推論で拡張する。
論文 参考訳(メタデータ) (2021-09-27T21:48:35Z) - Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。
本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。
シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-06T13:10:37Z) - UNIK: A Unified Framework for Real-world Skeleton-based Action
Recognition [11.81043814295441]
UNIKは、データセットをまたいで一般化できる新しい骨格に基づく行動認識手法である。
実世界のビデオにおける行動認識のクロスドメイン一般化可能性について検討するため,提案したUNIKと同様に最先端のアプローチを再評価する。
その結果,提案したUNIKは,Poseticsを事前学習した上で,4つのターゲットアクション分類データセットに転送した場合に,最先端の処理性能を向上することがわかった。
論文 参考訳(メタデータ) (2021-07-19T02:00:28Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。