論文の概要: Unsupervised hierarchical clustering using the learning dynamics of RBMs
- arxiv url: http://arxiv.org/abs/2302.01851v3
- Date: Fri, 9 Jun 2023 17:05:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-12 17:35:25.295710
- Title: Unsupervised hierarchical clustering using the learning dynamics of RBMs
- Title(参考訳): rbmsの学習ダイナミクスを用いた教師なし階層クラスタリング
- Authors: Aur\'elien Decelle, Lorenzo Rosset, Beatriz Seoane
- Abstract要約: Restricted Boltzmann Machine (RBM) の学習力学を利用した関係データツリー構築のための新しい汎用的手法を提案する。
提案手法は,Plefka拡張から派生した平均場アプローチに基づいて,無秩序なシステムの文脈で開発された。
人工的に階層的なデータセットと3つの異なる実世界のデータセット(桁のイメージ、ヒトゲノムの突然変異、タンパク質のファミリー)でテストした。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Datasets in the real world are often complex and to some degree hierarchical,
with groups and sub-groups of data sharing common characteristics at different
levels of abstraction. Understanding and uncovering the hidden structure of
these datasets is an important task that has many practical applications. To
address this challenge, we present a new and general method for building
relational data trees by exploiting the learning dynamics of the Restricted
Boltzmann Machine (RBM). Our method is based on the mean-field approach,
derived from the Plefka expansion, and developed in the context of disordered
systems. It is designed to be easily interpretable. We tested our method in an
artificially created hierarchical dataset and on three different real-world
datasets (images of digits, mutations in the human genome, and a homologous
family of proteins). The method is able to automatically identify the
hierarchical structure of the data. This could be useful in the study of
homologous protein sequences, where the relationships between proteins are
critical for understanding their function and evolution.
- Abstract(参考訳): 実世界のデータセットは、しばしば複雑である程度階層的であり、異なる抽象レベルで共通の特徴を共有するデータのグループとサブグループがある。
これらのデータセットの隠れた構造を理解し、解明することは、多くの実用的応用を持つ重要なタスクである。
本稿では,制約付きボルツマンマシン(rbm)の学習ダイナミクスを活用し,リレーショナル・データ・ツリーを構築するための新しい汎用的手法を提案する。
提案手法は,Plefka展開から派生した平均場アプローチに基づいて,無秩序なシステムの文脈で開発された。
容易に解釈できるように設計されている。
本手法を人工的に作成した階層型データセットと3つの異なる実世界のデータセット(桁の画像、ヒトゲノムの変異、相同なタンパク質群)で検証した。
この手法はデータの階層構造を自動的に識別することができる。
これは、タンパク質間の関係がそれらの機能と進化を理解するために重要である相同性タンパク質配列の研究に有用である。
関連論文リスト
- Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - Homological Convolutional Neural Networks [4.615338063719135]
本稿では,トポロジ的に制約されたネットワーク表現を通じて,データ構造構造を利用した新しいディープラーニングアーキテクチャを提案する。
5つの古典的な機械学習モデルと3つのディープラーニングモデルに対して、18のベンチマークデータセットでモデルをテストします。
論文 参考訳(メタデータ) (2023-08-26T08:48:51Z) - Hierarchical clustering with dot products recovers hidden tree structure [53.68551192799585]
本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。
クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。
このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文 参考訳(メタデータ) (2023-05-24T11:05:12Z) - Topological Learning in Multi-Class Data Sets [0.3050152425444477]
フィードフォワードディープニューラルネットワーク(DNN)の学習におけるトポロジカル複雑度の影響について検討する。
我々は,複数の構築およびオープンソースデータセットに対するトポロジ的分類アルゴリズムの評価を行った。
論文 参考訳(メタデータ) (2023-01-23T21:54:25Z) - Amortized Inference for Causal Structure Learning [72.84105256353801]
因果構造を学習することは、通常、スコアまたは独立テストを使用して構造を評価することを伴う探索問題を引き起こす。
本研究では,観測・干渉データから因果構造を予測するため,変分推論モデルを訓練する。
我々のモデルは、実質的な分布シフトの下で頑健な一般化能力を示す。
論文 参考訳(メタデータ) (2022-05-25T17:37:08Z) - Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。
本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。
シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-06T13:10:37Z) - Joint Geometric and Topological Analysis of Hierarchical Datasets [7.098759778181621]
本稿では,複数の階層的データセットに整理された高次元データに注目する。
この研究の主な新規性は、トポロジカルデータ分析と幾何多様体学習という、2つの強力なデータ分析アプローチの組み合わせにある。
本手法は, 最新手法と比較して優れた分類結果をもたらすことを示した。
論文 参考訳(メタデータ) (2021-04-03T13:02:00Z) - Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。
私たちのフレームワークは、サンプル間の関係をよく保存します。
サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文 参考訳(メタデータ) (2020-07-11T10:57:45Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z) - Knowledge Elicitation using Deep Metric Learning and Psychometric
Testing [15.989397781243225]
画像やビデオなどの高次元データを扱う専門家から,効率的な階層的知識の抽出方法を提案する。
開発されたモデルは、距離が意味論的に意味のある距離空間に高次元データを埋め込み、データは階層構造で整理することができる。
論文 参考訳(メタデータ) (2020-04-14T08:33:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。