論文の概要: Adaptive Learning of Rank-One Models for Efficient Pairwise Sequence
Alignment
- arxiv url: http://arxiv.org/abs/2011.04832v2
- Date: Sat, 13 Feb 2021 02:01:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 00:51:11.950488
- Title: Adaptive Learning of Rank-One Models for Efficient Pairwise Sequence
Alignment
- Title(参考訳): 効率の良いペアワイズ配列アライメントのためのランクワンモデルの適応学習
- Authors: Govinda M. Kamath and Tavor Z. Baharav and Ilan Shomorony
- Abstract要約: 本稿では,2つの鍵となる新しい成分に基づいて,ペアのアライメントを推定する手法を提案する。
第1の要素は、ランクワンのクラウドソーシングモデルの一般的な枠組みの下で、ペアのアライメント推定の問題をキャストすることである。
第2の要素は、多腕バンディットアルゴリズムを使用して、このスペクトル推定器を適応的に洗練し、大きなアライメントを持つ可能性のあるリードペアにのみ利用することである。
- 参考スコア(独自算出の注目度): 20.243497164051824
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pairwise alignment of DNA sequencing data is a ubiquitous task in
bioinformatics and typically represents a heavy computational burden.
State-of-the-art approaches to speed up this task use hashing to identify short
segments (k-mers) that are shared by pairs of reads, which can then be used to
estimate alignment scores. However, when the number of reads is large,
accurately estimating alignment scores for all pairs is still very costly.
Moreover, in practice, one is only interested in identifying pairs of reads
with large alignment scores. In this work, we propose a new approach to
pairwise alignment estimation based on two key new ingredients. The first
ingredient is to cast the problem of pairwise alignment estimation under a
general framework of rank-one crowdsourcing models, where the workers'
responses correspond to k-mer hash collisions. These models can be accurately
solved via a spectral decomposition of the response matrix. The second
ingredient is to utilise a multi-armed bandit algorithm to adaptively refine
this spectral estimator only for read pairs that are likely to have large
alignments. The resulting algorithm iteratively performs a spectral
decomposition of the response matrix for adaptively chosen subsets of the read
pairs.
- Abstract(参考訳): DNAシークエンシングデータのペアワイズアライメントはバイオインフォマティクスにおいてユビキタスなタスクであり、典型的には計算負荷が大きい。
このタスクをスピードアップするための最先端のアプローチでは、リードのペアで共有される短いセグメント(k-mer)をハッシュ化することで、アライメントスコアの見積に使用することができる。
しかし、読み取り数が大きければ、すべてのペアのアライメントスコアを正確に見積もることは依然として非常にコストがかかる。
さらに、実際には、大きなアライメントスコアを持つ読み手のペアを識別することだけに関心がある。
そこで本研究では,2つの鍵となる新しい成分に基づくペアアライメント推定手法を提案する。
第1の要素は、労働者の応答がk-merハッシュ衝突に対応するランクワンクラウドソーシングモデルの一般的な枠組みの下で、ペアアライメント推定の問題をキャストすることである。
これらのモデルは応答行列のスペクトル分解によって正確に解くことができる。
第2の要素は、このスペクトル推定器を適応的に洗練するために、多武装のバンディットアルゴリズムを利用することである。
結果のアルゴリズムは、リードペアの適応的に選択されたサブセットに対する応答行列のスペクトル分解を反復的に行う。
関連論文リスト
- Optimizing Contextual Speech Recognition Using Vector Quantization for Efficient Retrieval [18.333752341467083]
バイアス機構は典型的には、オーディオとバイアスのエントリのカタログの間のクロスアテンションモジュールに基づいている。
本研究では,ベクトル量子化に基づくクロスアテンションスコアリングに対する近似を提案する。
検索に基づくショートリスト化により,数千のエントリのバイアス付けカタログを効率よく活用できることを示す。
論文 参考訳(メタデータ) (2024-11-01T15:28:03Z) - Semisupervised score based matching algorithm to evaluate the effect of public health interventions [3.221788913179251]
1対1のマッチングアルゴリズムでは、マッチする多数の"ペア"は、大きなサンプルからの情報と多数のタスクの両方を意味する可能性がある。
本稿では,2次スコア関数 $S_beta(x_i,x_j)= betaT (x_i-x_j)(x_i-x_j)T beta$ に基づく新しい1対1マッチングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-19T02:24:16Z) - Efficient distributed representations with linear-time attention scores normalization [3.8673630752805437]
本研究では,有界ノルムを持つ埋め込みベクトルに対するアテンションスコア正規化定数の線形時間近似を提案する。
推定公式の精度は、競合するカーネルメソッドを桁違いに上回る。
提案アルゴリズムは高度に解釈可能であり,任意の埋め込み問題に容易に適応できる。
論文 参考訳(メタデータ) (2023-03-30T15:48:26Z) - Optimal Clustering with Bandit Feedback [57.672609011609886]
本稿では,バンディットフィードバックを用いたオンラインクラスタリングの問題点について考察する。
これは、NPハード重み付きクラスタリング問題をサブルーチンとして解決する必要性を回避するための、シーケンシャルなテストのための新しい停止規則を含む。
合成および実世界のデータセットの広範なシミュレーションを通して、BOCの性能は下界と一致し、非適応的ベースラインアルゴリズムよりも大幅に優れることを示す。
論文 参考訳(メタデータ) (2022-02-09T06:05:05Z) - Deep Probabilistic Graph Matching [72.6690550634166]
本稿では,マッチング制約を伴わずに,元のQAPに適合する深層学習ベースのグラフマッチングフレームワークを提案する。
提案手法は,一般的な3つのベンチマーク(Pascal VOC,Wilow Object,SPair-71k)で評価され,すべてのベンチマークにおいて過去の最先端よりも優れていた。
論文 参考訳(メタデータ) (2022-01-05T13:37:27Z) - Regularization for Shuffled Data Problems via Exponential Family Priors
on the Permutation Group [8.40077201352607]
シャッフルデータ(Shuffled data)とは、(X, Y)ペアの正しいペアリングが未知のインデックス置換によって表現されるデータである。
この目的のために、置換群に先立ってフレキシブル指数族を提案する。
推論は、抽出可能なEステップをFisher-Yatesアルゴリズムで近似するEMアルゴリズムに基づいている。
論文 参考訳(メタデータ) (2021-11-02T17:43:28Z) - Adaptive Sampling for Heterogeneous Rank Aggregation from Noisy Pairwise
Comparisons [85.5955376526419]
ランキングアグリゲーション問題では、各項目を比較する際に、様々な精度レベルが示される。
本稿では,ノイズのあるペアワイズ比較によってアイテムのランクを推定する,除去に基づくアクティブサンプリング戦略を提案する。
提案アルゴリズムは,商品の真のランキングを高い確率で返却できることを示す。
論文 参考訳(メタデータ) (2021-10-08T13:51:55Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Learning to Accelerate Heuristic Searching for Large-Scale Maximum
Weighted b-Matching Problems in Online Advertising [51.97494906131859]
バイパルタイトbマッチングはアルゴリズム設計の基本であり、経済市場や労働市場などに広く適用されている。
既存の正確で近似的なアルゴリズムは、通常そのような設定で失敗する。
我々は、以前の事例から学んだ知識を活用して、新しい問題インスタンスを解決するtextttNeuSearcherを提案する。
論文 参考訳(メタデータ) (2020-05-09T02:48:23Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。