論文の概要: DBSCAN in domains with periodic boundary conditions
- arxiv url: http://arxiv.org/abs/2501.16894v1
- Date: Tue, 28 Jan 2025 12:26:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-29 16:40:01.946298
- Title: DBSCAN in domains with periodic boundary conditions
- Title(参考訳): 周期境界条件を持つ領域におけるDBSCAN
- Authors: Xander M. de Wit, Alessandro Gabbana,
- Abstract要約: 本稿では,DBSCANアルゴリズムに基づく周期領域に埋め込まれたデータにクラスタリングアルゴリズムを適用する手法を提案する。
本研究では, 1次元, 2次元, 3次元の合成データを用いた提案手法の動作を実例に適用し, 乱流中の気泡のクラスター化を含む実例に適用する。
- 参考スコア(独自算出の注目度): 44.99833362998488
- License:
- Abstract: Many scientific problems involve data that is embedded in a space with periodic boundary conditions. This can for instance be related to an inherent cyclic or rotational symmetry in the data or a spatially extended periodicity. When analyzing such data, well-tailored methods are needed to obtain efficient approaches that obey the periodic boundary conditions of the problem. In this work, we present a method for applying a clustering algorithm to data embedded in a periodic domain based on the DBSCAN algorithm, a widely used unsupervised machine learning method that identifies clusters in data. The proposed method internally leverages the conventional DBSCAN algorithm for domains with open boundaries, such that it remains compatible with all optimized implementations for neighborhood searches in open domains. In this way, it retains the same optimized runtime complexity of $O(N\log N)$. We demonstrate the workings of the proposed method using synthetic data in one, two and three dimensions and also apply it to a real-world example involving the clustering of bubbles in a turbulent flow. The proposed approach is implemented in a ready-to-use Python package that we make publicly available.
- Abstract(参考訳): 多くの科学的問題は、周期的な境界条件を持つ空間に埋め込まれたデータを含む。
これは例えば、データ中の固有の循環対称性や回転対称性、あるいは空間的に拡張された周期性と関連付けられる。
このようなデータを解析するには、問題の周期的境界条件に従う効率的なアプローチを得るために、適切な方法が必要である。
本研究では,DBSCANアルゴリズムに基づいて周期領域に埋め込まれたデータにクラスタリングアルゴリズムを適用する手法を提案する。
提案手法は,従来のDBSCANアルゴリズムをオープン境界を持つ領域に対して内部的に活用する。
このようにして、$O(N\log N)$と同じ最適化されたランタイム複雑性を保持します。
本研究では, 1次元, 2次元, 3次元の合成データを用いた提案手法の動作を実例に適用し, 乱流中の気泡の凝集を含む実例に適用する。
提案されたアプローチは、私たちが公開しているPythonパッケージで実装されています。
関連論文リスト
- Boundary Detection Algorithm Inspired by Locally Linear Embedding [8.259071011958254]
本稿では,広く使用されている局所的線形埋め込みアルゴリズムにインスパイアされた境界点検出手法を提案する。
本手法は,2つの近傍探索スキーム($epsilon$-radius ball scheme)と$K$-nearest neighbor scheme($K$-nearest neighbor scheme)を用いて実装する。
論文 参考訳(メタデータ) (2024-06-26T16:05:57Z) - Faithful Density-Peaks Clustering via Matrix Computations on MPI Parallelization System [7.594123537718585]
密度ピーククラスタリング(DP)は任意の形状のクラスタを検出し、非ユークリッド空間データをクラスタリングする能力を持つ。
本稿では,2種類のベクトル状距離行列と逆前ノードファイリングポリシを併用した忠実かつ並列なDP法を提案する。
本手法は,コミュニティ検出などの非ユークリッドデータをクラスタリングすると同時に,大規模ユークリッドデータをクラスタリングする場合の精度において,最先端の手法よりも優れる。
論文 参考訳(メタデータ) (2024-06-18T06:05:45Z) - Efficient Trajectory Inference in Wasserstein Space Using Consecutive Averaging [3.8623569699070353]
軌道推論は、そのような観測から連続的な過程を再構築する挑戦を扱う。
ワッサーシュタイン空間に直交する連続平均化による点雲のB-スプライン近似法を提案する。
コンバージェンス保証を提供し、シミュレーションセルデータ上でテストすることで、我々の手法を厳格に評価する。
論文 参考訳(メタデータ) (2024-05-30T04:19:20Z) - AcceleratedLiNGAM: Learning Causal DAGs at the speed of GPUs [57.12929098407975]
既存の因果探索法を効率的に並列化することにより,数千次元まで拡張可能であることを示す。
具体的には、DirectLiNGAMの因果順序付けサブプロデューサに着目し、GPUカーネルを実装して高速化する。
これにより、遺伝子介入による大規模遺伝子発現データに対する因果推論にDirectLiNGAMを適用することで、競争結果が得られる。
論文 参考訳(メタデータ) (2024-03-06T15:06:11Z) - Circular Clustering with Polar Coordinate Reconstruction [6.598049778463762]
伝統的なクラスタリングアルゴリズムは、周期成分の違いを区別する能力が限られているため、しばしば不十分である。
そこで本研究では,円筒座標系への射影を利用した新たな解析フレームワークを提案し,偏座標系における物体の表現性を向上する。
我々のアプローチは一般に適用可能であり、ほとんどの最先端のクラスタリングアルゴリズムに組み込むことができる。
論文 参考訳(メタデータ) (2023-09-15T20:56:01Z) - Approximating a RUM from Distributions on k-Slates [88.32814292632675]
与えられた分布を平均で最もよく近似するRUMを求める一般化時間アルゴリズムを求める。
我々の理論的結果は、実世界のデータセットに効果的でスケール可能なものを得るという、実践的な結果も得られます。
論文 参考訳(メタデータ) (2023-05-22T17:43:34Z) - Score-based Diffusion Models in Function Space [137.70916238028306]
拡散モデルは、最近、生成モデリングの強力なフレームワークとして登場した。
この研究は、関数空間における拡散モデルをトレーニングするためのDDO(Denoising Diffusion Operators)と呼ばれる数学的に厳密なフレームワークを導入する。
データ解像度に依存しない固定コストで、対応する離散化アルゴリズムが正確なサンプルを生成することを示す。
論文 参考訳(メタデータ) (2023-02-14T23:50:53Z) - Scalable Differentially Private Clustering via Hierarchically Separated
Trees [82.69664595378869]
我々は,最大$O(d3/2log n)cdot OPT + O(k d2 log2 n / epsilon2)$,$epsilon$はプライバシ保証であることを示す。
最悪の場合の保証は、最先端のプライベートクラスタリング手法よりも悪いが、提案するアルゴリズムは実用的である。
論文 参考訳(メタデータ) (2022-06-17T09:24:41Z) - Combining Pseudo-Point and State Space Approximations for Sum-Separable
Gaussian Processes [48.64129867897491]
我々は,擬似点法と状態空間GP近似フレームワークを組み合わせて両世界の長所を得る,シンプルでエレガントな方法が存在することを示す。
組み合わせたアプローチは、どちらの方法よりも拡張性が高く、時間的問題にも適用可能であることを実証する。
論文 参考訳(メタデータ) (2021-06-18T16:30:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。