論文の概要: MREC: a fast and versatile framework for aligning and matching point
clouds with applications to single cell molecular data
- arxiv url: http://arxiv.org/abs/2001.01666v3
- Date: Thu, 20 Feb 2020 22:17:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-14 02:20:21.849301
- Title: MREC: a fast and versatile framework for aligning and matching point
clouds with applications to single cell molecular data
- Title(参考訳): MREC:単一細胞分子データへの応用と点雲の整合と整合のための高速で汎用的なフレームワーク
- Authors: Andrew J. Blumberg and Mathieu Carriere and Michael A. Mandell and
Raul Rabadan and Soledad Villar
- Abstract要約: 我々は,データセット間のマッチングを計算するための分解アルゴリズムであるMRECを紹介し,研究する。
このフレームワークは、マッチングの品質の絶対値を用いて、パーティショニング手順やマッチングアルゴリズムを含むパラメータの最適化をサポートする。
単細胞分子データの解析において生じる多数のアライメント問題に適用することにより、いつうまく機能するかを記述し、その柔軟性とパワーを実証する手順を解析する。
- 参考スコア(独自算出の注目度): 9.127253863263773
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Comparing and aligning large datasets is a pervasive problem occurring across
many different knowledge domains. We introduce and study MREC, a recursive
decomposition algorithm for computing matchings between data sets. The basic
idea is to partition the data, match the partitions, and then recursively match
the points within each pair of identified partitions. The matching itself is
done using black box matching procedures that are too expensive to run on the
entire data set. Using an absolute measure of the quality of a matching, the
framework supports optimization over parameters including partitioning
procedures and matching algorithms. By design, MREC can be applied to extremely
large data sets. We analyze the procedure to describe when we can expect it to
work well and demonstrate its flexibility and power by applying it to a number
of alignment problems arising in the analysis of single cell molecular data.
- Abstract(参考訳): 大規模なデータセットの比較と調整は、多くの異なる知識領域で発生する広範な問題である。
本稿では,データセット間のマッチングを計算するための再帰的分解アルゴリズムMRECを紹介する。
基本的な考え方は、データを分割し、パーティションにマッチさせ、識別されたパーティションのペア内のポイントを再帰的にマッチさせることである。
マッチング自体は、データセット全体を実行するには高価すぎるブラックボックスマッチングプロシージャを使用して行われる。
このフレームワークはマッチングの品質の絶対値を用いて、分割手順やマッチングアルゴリズムを含むパラメータの最適化をサポートする。
設計上、MRECは極めて大きなデータセットに適用できる。
単細胞分子データの解析において生じる多数のアライメント問題に適用することにより、いつうまく機能するかを記述し、その柔軟性とパワーを実証する手順を解析する。
関連論文リスト
- Data Aggregation for Hierarchical Clustering [0.3626013617212666]
BETULAは、よく知られたBIRCHデータ集約アルゴリズムの数値的に安定したバージョンである。
これは、クラスタリングの品質に小さな損失しか与えずに、制約のあるリソースを持つシステムでHACを実行可能なものにするために使用できる。
論文 参考訳(メタデータ) (2023-09-05T19:39:43Z) - Achieving Long-term Fairness in Submodular Maximization through
Randomization [16.33001220320682]
人種や性別などのセンシティブな属性を含む可能性のあるデータアイテムを扱う場合、公平性を意識したアルゴリズムを実装することが重要です。
群フェアネス制約を満たしながら単調部分モジュラ函数を最大化する問題について検討する。
論文 参考訳(メタデータ) (2023-04-10T16:39:19Z) - Scalable Batch Acquisition for Deep Bayesian Active Learning [70.68403899432198]
ディープラーニングでは、各ステップでマークアップする複数の例を選択することが重要です。
BatchBALDのような既存のソリューションでは、多くの例を選択する際に大きな制限がある。
本稿では,より計算効率のよいLarge BatchBALDアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-13T11:45:17Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Late Fusion Multi-view Clustering via Global and Local Alignment
Maximization [61.89218392703043]
マルチビュークラスタリング(MVC)は、異なるビューからの補完情報を最適に統合し、クラスタリング性能を改善する。
既存のアプローチの多くは、クラスタリングに最適な類似性行列を学ぶために、複数の事前定義された類似性を直接融合する。
これらの問題に対処するために、アライメントを通してレイトフュージョンMVCを提案する。
論文 参考訳(メタデータ) (2022-08-02T01:49:31Z) - Parallel Instance Filtering for Malware Detection [0.0]
この研究は、Parallel Instance Filtering (PIF)と呼ばれる新しい並列インスタンス選択アルゴリズムを提案する。
このアルゴリズムの主な考え方は、データセット全体をカバーしているインスタンスの重複しないサブセットにデータセットを分割し、各サブセットにフィルタリングプロセスを適用することである。
我々はPIFアルゴリズムと、50,000の悪意あるサンプルからなる大規模なデータセット上で、最先端のインスタンス選択アルゴリズムを比較した。
論文 参考訳(メタデータ) (2022-06-28T11:14:20Z) - Multidimensional Assignment Problem for multipartite entity resolution [69.48568967931608]
Multipartiteエンティティ解決は、複数のデータセットから1つのエンティティにレコードを統合することを目的としている。
代入問題を解くために、グリーディアルゴリズムと大規模近傍探索という2つの手順を適用する。
データベースのサイズが大きくなるにつれて、設計ベースのマルチスタートがより効率的であることを示す。
論文 参考訳(メタデータ) (2021-12-06T20:34:55Z) - Multi-view Clustering via Deep Matrix Factorization and Partition
Alignment [43.56334737599984]
本稿では,深層行列分解と分割アライメントによる新しいマルチビュークラスタリングアルゴリズムを提案する。
収束性が証明された最適化問題を解くために交互最適化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-05-01T15:06:57Z) - New advances in enumerative biclustering algorithms with online
partitioning [80.22629846165306]
さらに、数値データセットの列に定数値を持つ最大二クラスタの効率的で完全で正しい非冗長列挙を実現できる二クラスタリングアルゴリズムであるRIn-Close_CVCを拡張した。
改良されたアルゴリズムはRIn-Close_CVC3と呼ばれ、RIn-Close_CVCの魅力的な特性を保ちます。
論文 参考訳(メタデータ) (2020-03-07T14:54:26Z) - Supervised Hyperalignment for multi-subject fMRI data alignment [81.8694682249097]
本稿では,MVP解析における機能的アライメントを改善するために,SHA(Supervised Hyperalignment)手法を提案する。
マルチオブジェクトデータセットの実験では、SHA法は最大19%の性能がマルチクラス問題に対して達成されている。
論文 参考訳(メタデータ) (2020-01-09T09:17:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。