論文の概要: Learned Indexing in Proteins: Substituting Complex Distance Calculations
with Embedding and Clustering Techniques
- arxiv url: http://arxiv.org/abs/2208.08910v1
- Date: Thu, 18 Aug 2022 15:22:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-19 14:16:05.352082
- Title: Learned Indexing in Proteins: Substituting Complex Distance Calculations
with Embedding and Clustering Techniques
- Title(参考訳): タンパク質の学習インデクシング:埋め込みとクラスタリングによる複素距離計算の構成
- Authors: Jaroslav O\v{l}ha, Ter\'ezia Slanin\'akov\'a, Martin Gendiar, Matej
Antol, Vlastislav Dohnal
- Abstract要約: 著者らは3次元タンパク質構造探索の複雑な問題に対する軽量な解法を提案する。
この解は、(i)3次元タンパク質の構造情報の非常にコンパクトなベクトルへの変換、(ii)これらのベクトルをグループ化し、類似したオブジェクトの所定の個数を返すことでクエリに応答する確率モデルの使用、(iii)基本ベクトル距離関数を適用して結果を洗練する最終的なフィルタリングステップからなる。
- 参考スコア(独自算出の注目度): 2.239917051803691
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite the constant evolution of similarity searching research, it continues
to face the same challenges stemming from the complexity of the data, such as
the curse of dimensionality and computationally expensive distance functions.
Various machine learning techniques have proven capable of replacing elaborate
mathematical models with combinations of simple linear functions, often gaining
speed and simplicity at the cost of formal guarantees of accuracy and
correctness of querying.
The authors explore the potential of this research trend by presenting a
lightweight solution for the complex problem of 3D protein structure search.
The solution consists of three steps -- (i) transformation of 3D protein
structural information into very compact vectors, (ii) use of a probabilistic
model to group these vectors and respond to queries by returning a given number
of similar objects, and (iii) a final filtering step which applies basic vector
distance functions to refine the result.
- Abstract(参考訳): 類似性探索研究の絶え間ない進化にもかかわらず、次元性の呪いや計算コストのかかる距離関数など、データの複雑さに起因する同じ課題に直面し続けている。
様々な機械学習技術は、複雑な数学的モデルを単純な線形関数の組み合わせに置き換えることが証明されており、クエリの正確さと正確さの保証を犠牲にして、しばしばスピードと単純さを得る。
著者らは3次元タンパク質構造探索の複雑な問題に対する軽量な解を提示することにより,この研究動向の可能性を探る。
解法は3つのステップからなる。
i) 3次元タンパク質構造情報の非常にコンパクトなベクトルへの変換
(ii)これらのベクトルをグループ化し、所定の数の類似オブジェクトを返してクエリに応答するための確率モデルの使用、及び
(iii) 基礎ベクトル距離関数を適用して結果を洗練する最終フィルタリングステップ。
関連論文リスト
- Equivariant amortized inference of poses for cryo-EM [5.141137421503899]
低温EMは、タンパク質やウイルスなどの生体分子の3次元構造を決定する重要な技術である。
高ノイズレベル、粒子のポーズの欠如、大規模データセット処理の計算要求などにより、Creo-EM再構成問題は困難である。
これらの課題に対する有望な解決策は、大規模なデータセットのポーズ推定において特に有効である、償却推論手法を使用することである。
論文 参考訳(メタデータ) (2024-06-01T11:36:29Z) - ComboStoc: Combinatorial Stochasticity for Diffusion Generative Models [65.82630283336051]
拡散生成モデルの既存のトレーニングスキームにより,次元と属性の組み合わせによって区切られた空間が十分に標本化されていないことを示す。
構造を完全に活用するプロセスを構築し,ComboStocという名前でこの問題に対処する。
論文 参考訳(メタデータ) (2024-05-22T15:23:10Z) - Amortized Inference for Causal Structure Learning [72.84105256353801]
因果構造を学習することは、通常、スコアまたは独立テストを使用して構造を評価することを伴う探索問題を引き起こす。
本研究では,観測・干渉データから因果構造を予測するため,変分推論モデルを訓練する。
我々のモデルは、実質的な分布シフトの下で頑健な一般化能力を示す。
論文 参考訳(メタデータ) (2022-05-25T17:37:08Z) - Relative Pose from SIFT Features [50.81749304115036]
基本行列の未知元と向きとスケールに関する新しい線形制約を導出する。
提案した制約は、合成環境における多くの問題と、80000以上の画像ペア上で公開されている実世界のデータセットでテストされる。
論文 参考訳(メタデータ) (2022-03-15T14:16:39Z) - Complexity Measures for Multi-objective Symbolic Regression [2.4087148947930634]
多目的的シンボリック回帰は、学習したモデルの精度が最大化される一方で、その複雑さが自動的に適応されるという利点がある。
NSGA-IIを用いて多目的最適化を行う場合, シンボリック回帰においてどの複雑性尺度が最適に使用されるかを検討する。
論文 参考訳(メタデータ) (2021-09-01T08:22:41Z) - Fold2Seq: A Joint Sequence(1D)-Fold(3D) Embedding-based Generative Model
for Protein Design [70.27706384570723]
Fold2Seqは特定の標的に条件付きタンパク質配列を設計するための新しいフレームワークである。
Fold2Seqの性能は, シーケンス設計の速度, カバレッジ, 信頼性において向上したか, 同等であったかを示す。
フォールドベースのFold2Seqの独特な利点は、構造ベースのディープモデルやRosettaDesignと比較して、3つの現実世界の課題においてより明確になる。
論文 参考訳(メタデータ) (2021-06-24T14:34:24Z) - Analysis of Truncated Orthogonal Iteration for Sparse Eigenvector
Problems [78.95866278697777]
本研究では,多元的固有ベクトルを分散制約で同時に計算するTruncated Orthogonal Iterationの2つの変種を提案する。
次に,我々のアルゴリズムを適用して,幅広いテストデータセットに対するスパース原理成分分析問題を解く。
論文 参考訳(メタデータ) (2021-03-24T23:11:32Z) - Isometric Multi-Shape Matching [50.86135294068138]
形状間の対応を見つけることは、コンピュータビジョンとグラフィックスの基本的な問題である。
アイソメトリーは形状対応問題においてしばしば研究されるが、マルチマッチング環境では明確には考慮されていない。
定式化を解くのに適した最適化アルゴリズムを提案し,コンバージェンスと複雑性解析を提供する。
論文 参考訳(メタデータ) (2020-12-04T15:58:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。