論文の概要: Neural Distance Embeddings for Biological Sequences
- arxiv url: http://arxiv.org/abs/2109.09740v1
- Date: Mon, 20 Sep 2021 17:30:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-22 14:10:57.221672
- Title: Neural Distance Embeddings for Biological Sequences
- Title(参考訳): 生物配列のための神経距離埋め込み
- Authors: Gabriele Corso, Rex Ying, Michal P\'andy, Petar Veli\v{c}kovi\'c, Jure
Leskovec, Pietro Li\`o
- Abstract要約: 幾何ベクトル空間に配列を埋め込むためのフレームワークであるNeuroSEEDを提案する。
階層構造を捉えた双曲空間の有効性を示し, RMSEの埋め込みにおける平均22%の還元効果を示す。
提案手法は,実世界のデータセットに対して,大幅な精度向上と実行時改善を示す。
- 参考スコア(独自算出の注目度): 43.07977514121458
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The development of data-dependent heuristics and representations for
biological sequences that reflect their evolutionary distance is critical for
large-scale biological research. However, popular machine learning approaches,
based on continuous Euclidean spaces, have struggled with the discrete
combinatorial formulation of the edit distance that models evolution and the
hierarchical relationship that characterises real-world datasets. We present
Neural Distance Embeddings (NeuroSEED), a general framework to embed sequences
in geometric vector spaces, and illustrate the effectiveness of the hyperbolic
space that captures the hierarchical structure and provides an average 22%
reduction in embedding RMSE against the best competing geometry. The capacity
of the framework and the significance of these improvements are then
demonstrated devising supervised and unsupervised NeuroSEED approaches to
multiple core tasks in bioinformatics. Benchmarked with common baselines, the
proposed approaches display significant accuracy and/or runtime improvements on
real-world datasets. As an example for hierarchical clustering, the proposed
pretrained and from-scratch methods match the quality of competing baselines
with 30x and 15x runtime reduction, respectively.
- Abstract(参考訳): データ依存的ヒューリスティックの開発と進化距離を反映する生物学的配列の表現は、大規模な生物学的研究において重要である。
しかしながら、連続ユークリッド空間に基づく一般的な機械学習アプローチは、モデルの進化と現実世界のデータセットを特徴づける階層的関係をモデルとする編集距離の離散的な組合せ定式化に苦慮している。
本稿では,幾何学的ベクトル空間にシーケンスを埋め込む汎用フレームワークであるニューラル距離埋め込み(neuroseed)を提案し,階層構造をキャプチャする双曲空間の有効性を示し,最良な空間に対して平均22%のrmse埋め込み削減を提供する。
このフレームワークの能力とこれらの改善の意義は、バイオインフォマティクスにおける複数のコアタスクに対する教師付きおよび教師なしのNeuroSEEDアプローチを考案した。
一般的なベースラインとベンチマークして、提案手法は現実世界のデータセットに対して、大幅な精度と実行時の改善を示す。
階層的クラスタリングの例として,提案手法は,30倍,15倍のランタイム削減と競合するベースラインの品質に適合する。
関連論文リスト
- How to Bridge Spatial and Temporal Heterogeneity in Link Prediction? A Contrastive Method [11.719027225797037]
我々は,新しいtextbfContrastive Learning-based textbfLink textbfPrediction model, textbfCLPを提案する。
我々のマイモデルは最先端モデルよりも一貫して優れており、AUCとAPで平均10.10%、13.44%の改善が示されている。
論文 参考訳(メタデータ) (2024-11-01T14:20:53Z) - PRAGA: Prototype-aware Graph Adaptive Aggregation for Spatial Multi-modal Omics Analysis [1.1619559582563954]
空間多モードオミクス解析(PRAGA)のための空間多モードオミクス解決フレームワークPRototype-Aware Graph Adaptative Aggregationを提案する。
PRAGAは動的グラフを構築し、潜在意味関係を捉え、空間情報と特徴意味論を包括的に統合する。
学習可能なグラフ構造は、クロスモーダルな知識を学習することで摂動を損なうこともできる。
論文 参考訳(メタデータ) (2024-09-19T12:53:29Z) - Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - Injecting Hierarchical Biological Priors into Graph Neural Networks for Flow Cytometry Prediction [1.7709249262395883]
本研究では、単一セルのマルチクラス分類のためのグラフニューラルネットワーク(GNN)に階層的な事前知識を注入することを検討する。
本稿では,複数のGNNモデル,すなわちFCHC-GNNに適用可能な階層的なプラグイン手法を提案する。
論文 参考訳(メタデータ) (2024-05-28T18:24:16Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Interpolation-based Correlation Reduction Network for Semi-Supervised
Graph Learning [49.94816548023729]
補間型相関低減ネットワーク(ICRN)と呼ばれる新しいグラフコントラスト学習手法を提案する。
提案手法では,決定境界のマージンを大きくすることで,潜在特徴の識別能力を向上させる。
この2つの設定を組み合わせることで、豊富なラベル付きノードと稀に価値あるラベル付きノードから豊富な監視情報を抽出し、離散表現学習を行う。
論文 参考訳(メタデータ) (2022-06-06T14:26:34Z) - Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。
本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。
シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-06T13:10:37Z) - UNIK: A Unified Framework for Real-world Skeleton-based Action
Recognition [11.81043814295441]
UNIKは、データセットをまたいで一般化できる新しい骨格に基づく行動認識手法である。
実世界のビデオにおける行動認識のクロスドメイン一般化可能性について検討するため,提案したUNIKと同様に最先端のアプローチを再評価する。
その結果,提案したUNIKは,Poseticsを事前学習した上で,4つのターゲットアクション分類データセットに転送した場合に,最先端の処理性能を向上することがわかった。
論文 参考訳(メタデータ) (2021-07-19T02:00:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。