論文の概要: Clustering data by reordering them
- arxiv url: http://arxiv.org/abs/2503.19067v1
- Date: Mon, 24 Mar 2025 18:54:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-26 16:54:18.961853
- Title: Clustering data by reordering them
- Title(参考訳): データを並べ替えてクラスタ化する
- Authors: Axel Descamps, Sélène Forget, Aliénor Lahlou, Claire Lavergne, Camille Berthelot, Guillaume Stirnemann, Rodolphe Vuilleumier, Nicolas Chéron,
- Abstract要約: 要素を別々に分析するために家族にグループ化することは、科学の多くの分野において標準的な分析手順である。
本研究では,家族同士が互いに似ており,家族以外の要素に似ていないという単純な考え方に基づく新しいアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Grouping elements into families to analyse them separately is a standard analysis procedure in many areas of sciences. We propose herein a new algorithm based on the simple idea that members from a family look like each other, and don't resemble elements foreign to the family. After reordering the data according to the distance between elements, the analysis is automatically performed with easily-understandable parameters. Noise is explicitly taken into account to deal with the variety of problems of a data-driven world. We applied the algorithm to sort biomolecules conformations, gene sequences, cells, images, and experimental conditions.
- Abstract(参考訳): 要素を別々に分析するために家族にグループ化することは、科学の多くの分野において標準的な分析手順である。
ここでは、家族のメンバー同士が互いに似ていて、家族以外の要素と似ていないという単純な考え方に基づく新しいアルゴリズムを提案する。
要素間の距離に応じてデータを並べ替えた後、分析は容易に理解可能なパラメータで自動的に実行される。
ノイズは、データ駆動の世界の様々な問題に対処するために明示的に考慮される。
本アルゴリズムを用いて, 生体分子のコンフォーメーション, 遺伝子配列, 細胞, 画像, 実験条件のソートを行った。
関連論文リスト
- Frequency-domain alignment of heterogeneous, multidimensional separations data through complex orthogonal Procrustes analysis [0.0]
多次元分離データには、複雑な生物学的サンプルに関する詳細な情報を明らかにする能力がある。
データ分析は、化学因子を表わすピークが、いくつかの分析実行の過程で漂流する可能性があるため、この分野で進行中の課題である。
この研究は、合成多次元分離データの周波数領域表現のProcrustes解析を通じて、アライメント問題に対する非常に単純な解を提供する。
論文 参考訳(メタデータ) (2025-02-18T12:14:14Z) - Applying language models to algebraic topology: generating simplicial
cycles using multi-labeling in Wu's formula [0.0]
我々は,機械学習の力を活用して,ホモトピー群の生成者の群論的構造を理解するという目標に向けて一歩踏み出した。
本稿では,入力シーケンスにマルチラベル情報を利用する言語モデリング手法と,必要なグループ理論ツールキットと非線形ベースラインを提案する。
論文 参考訳(メタデータ) (2023-06-01T12:23:14Z) - Composite Feature Selection using Deep Ensembles [130.72015919510605]
本研究では,事前定義されたグループ化を伴わない予測的特徴群発見の問題について検討する。
本稿では,特徴選択モデルのアンサンブルを用いて予測グループを探索する,新しいディープラーニングアーキテクチャを提案する。
発見群と基底真理の類似性を測定するための新しい尺度を提案する。
論文 参考訳(メタデータ) (2022-11-01T17:49:40Z) - Consistency between ordering and clustering methods for graphs [0.8594140167290096]
本稿では,複数のクラスタリングと順序付け手法の方法論的関係について検討する。
本稿では,ラベル連続度誤差と呼ばれる尺度を提案し,シーケンスとパーティション間の一貫性の度合いを一般化的に定量化する。
合成および実世界のデータセットに基づいて,オーダリング手法がモジュール構造を識別する範囲を評価する。
論文 参考訳(メタデータ) (2022-08-27T05:55:26Z) - Natural language processing for clusterization of genes according to
their functions [62.997667081978825]
本稿では,数千の遺伝子の解析を減らし,複数のクラスタの解析を行うアプローチを提案する。
これらの記述は、事前訓練された言語モデル(BERT)といくつかのテキスト処理アプローチを用いてベクトルとして符号化される。
論文 参考訳(メタデータ) (2022-07-17T12:59:34Z) - Amortized Inference for Causal Structure Learning [72.84105256353801]
因果構造を学習することは、通常、スコアまたは独立テストを使用して構造を評価することを伴う探索問題を引き起こす。
本研究では,観測・干渉データから因果構造を予測するため,変分推論モデルを訓練する。
我々のモデルは、実質的な分布シフトの下で頑健な一般化能力を示す。
論文 参考訳(メタデータ) (2022-05-25T17:37:08Z) - Fast and explainable clustering based on sorting [0.0]
我々はCLASSIXと呼ばれる高速で説明可能なクラスタリング手法を提案する。
このアルゴリズムは2つのスカラーパラメータ、すなわちアグリゲーションのための距離パラメータと、最小クラスタサイズを制御する別のパラメータによって制御される。
実験により, CLASSIXは最先端クラスタリングアルゴリズムと競合することを示した。
論文 参考訳(メタデータ) (2022-02-03T08:24:21Z) - Differentially-Private Clustering of Easy Instances [67.04951703461657]
異なるプライベートクラスタリングでは、個々のデータポイントに関する情報を公開せずに、$k$のクラスタセンターを特定することが目標だ。
我々は、データが"簡単"である場合にユーティリティを提供する実装可能な差分プライベートクラスタリングアルゴリズムを提供する。
我々は、非プライベートクラスタリングアルゴリズムを簡単なインスタンスに適用し、結果をプライベートに組み合わせることのできるフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-29T08:13:56Z) - Adversarial Examples for $k$-Nearest Neighbor Classifiers Based on
Higher-Order Voronoi Diagrams [69.4411417775822]
逆例は機械学習モデルにおいて広く研究されている現象である。
そこで本研究では,$k$-nearest 近傍分類の逆ロバスト性を評価するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-19T08:49:10Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。