論文の概要: Factoring out prior knowledge from low-dimensional embeddings
- arxiv url: http://arxiv.org/abs/2103.01828v1
- Date: Tue, 2 Mar 2021 16:10:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-03 17:15:35.051901
- Title: Factoring out prior knowledge from low-dimensional embeddings
- Title(参考訳): 低次元埋め込みによる事前知識の分解
- Authors: Edith Heiter, Jonas Fischer, Jilles Vreeken
- Abstract要約: 低次元埋め込みから距離行列の形で事前知識を分解する2つの方法を提案する。
合成データと実世界データの両方の実験は、両方の方法がうまく機能することを示しています。
- 参考スコア(独自算出の注目度): 21.960176662468026
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Low-dimensional embedding techniques such as tSNE and UMAP allow visualizing
high-dimensional data and therewith facilitate the discovery of interesting
structure. Although they are widely used, they visualize data as is, rather
than in light of the background knowledge we have about the data. What we
already know, however, strongly determines what is novel and hence interesting.
In this paper we propose two methods for factoring out prior knowledge in the
form of distance matrices from low-dimensional embeddings. To factor out prior
knowledge from tSNE embeddings, we propose JEDI that adapts the tSNE objective
in a principled way using Jensen-Shannon divergence. To factor out prior
knowledge from any downstream embedding approach, we propose CONFETTI, in which
we directly operate on the input distance matrices. Extensive experiments on
both synthetic and real world data show that both methods work well, providing
embeddings that exhibit meaningful structure that would otherwise remain
hidden.
- Abstract(参考訳): tSNEやUMAPのような低次元埋め込み技術は、高次元データを可視化し、興味深い構造の発見を促進する。
これらは広く使われているが、データに関する背景知識に照らしてではなく、そのままデータを視覚化する。
しかし、我々がすでに知っていることは、何が新しく、それゆえ興味深いかを強く決定する。
本稿では,低次元埋め込みから距離行列の形で事前知識を分解する2つの手法を提案する。
tSNE埋め込みから事前知識を抽出するために,Jensen-Shannon分散を用いた原則的手法でtSNEの目的を適応するJEDIを提案する。
下流の組込み手法の事前知識を評価するために、入力距離行列上で直接操作するCONFETTIを提案します。
合成データと実世界のデータの両方に関する広範囲な実験は、両方の方法がうまく機能していることを示し、それ以外は隠れている有意義な構造を示す埋め込みを提供する。
関連論文リスト
- Simple Ingredients for Offline Reinforcement Learning [86.1988266277766]
オフライン強化学習アルゴリズムは、ターゲット下流タスクに高度に接続されたデータセットに有効であることが証明された。
既存の手法が多様なデータと競合することを示す。その性能は、関連するデータ収集によって著しく悪化するが、オフラインバッファに異なるタスクを追加するだけでよい。
アルゴリズム的な考慮以上のスケールが、パフォーマンスに影響を及ぼす重要な要因であることを示す。
論文 参考訳(メタデータ) (2024-03-19T18:57:53Z) - ExaRanker-Open: Synthetic Explanation for IR using Open-Source LLMs [60.81649785463651]
ExaRanker-Openを導入し、オープンソース言語モデルを適用して、説明を生成する。
以上の結果から,LLMのサイズが大きくなるにつれて,説明の組み込みが神経ランク付けを継続的に促進することが明らかとなった。
論文 参考訳(メタデータ) (2024-02-09T11:23:14Z) - Cluster Exploration using Informative Manifold Projections [0.0]
次元減少(DR)は、高次元データの視覚的探索の鍵となるツールの1つである。
本稿では,様々な事前知識に関連付けられた構造を抽出する情報埋め込みを生成する手法を提案する。
論文 参考訳(メタデータ) (2023-09-26T11:35:25Z) - A Dimensional Structure based Knowledge Distillation Method for
Cross-Modal Learning [15.544134849816528]
簡単な作業から抽出した特徴を解析・観察することで特徴識別性と次元構造(DS)の相関を見いだす。
クロスモーダル・ナレッジ・蒸留法 (CMKD) を提案し, 教師付きクロスモーダル・ラーニング (CML) の性能向上を図る。
提案手法は, チャネル的に独立して, 中間的な特徴を均一に分散させることで, その精度を高めるために, 難易度から意味的に無関係な特徴を学習する。
論文 参考訳(メタデータ) (2023-06-28T07:29:26Z) - A Heat Diffusion Perspective on Geodesic Preserving Dimensionality
Reduction [66.21060114843202]
熱測地線埋め込みと呼ばれるより一般的な熱カーネルベースの多様体埋め込み法を提案する。
その結果,本手法は,地中真理多様体距離の保存において,既存の技術よりも優れていることがわかった。
また,連続体とクラスタ構造を併用した単一セルRNAシークエンシングデータセットに本手法を適用した。
論文 参考訳(メタデータ) (2023-05-30T13:58:50Z) - Deep Recursive Embedding for High-Dimensional Data [9.611123249318126]
本稿では,DNN(Deep Neural Network)と高次元データ埋め込みのための数学誘導埋め込みルールを組み合わせることを提案する。
本稿では,高次元空間から低次元空間へのパラメトリックマッピングを学習可能な汎用ディープ埋め込みネットワーク(DEN)フレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-31T23:22:33Z) - Deep Magnification-Flexible Upsampling over 3D Point Clouds [103.09504572409449]
本稿では,高密度点雲を生成するためのエンドツーエンド学習ベースのフレームワークを提案する。
まずこの問題を明示的に定式化し、重みと高次近似誤差を判定する。
そこで我々は,高次改良とともに,統一重みとソート重みを適応的に学習する軽量ニューラルネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-25T14:00:18Z) - Kernel Two-Dimensional Ridge Regression for Subspace Clustering [45.651770340521786]
本稿では,2次元データに対する新しいサブスペースクラスタリング手法を提案する。
2Dデータを入力として直接使用するので、表現の学習はデータ固有の構造や関係から恩恵を受ける。
論文 参考訳(メタデータ) (2020-11-03T04:52:46Z) - Two-Dimensional Semi-Nonnegative Matrix Factorization for Clustering [50.43424130281065]
TS-NMFと呼ばれる2次元(2次元)データに対する新しい半負行列分解法を提案する。
前処理ステップで2次元データをベクトルに変換することで、データの空間情報に深刻なダメージを与える既存の手法の欠点を克服する。
論文 参考訳(メタデータ) (2020-05-19T05:54:14Z) - NCVis: Noise Contrastive Approach for Scalable Visualization [79.44177623781043]
NCVisはノイズコントラスト推定の音響統計的基礎の上に構築された高性能次元減少法である。
NCVisは,他の手法の表現品質を保ちながら,速度の観点から最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-01-30T15:43:50Z) - Multi-Objective Genetic Programming for Manifold Learning: Balancing
Quality and Dimensionality [4.4181317696554325]
最先端の多様体学習アルゴリズムはこの変換の実行方法において不透明である。
多様体の品質と次元の競合する目的を自動的にバランスさせる多目的アプローチを導入する。
提案手法は,基礎および最先端の多様体学習手法と競合する。
論文 参考訳(メタデータ) (2020-01-05T23:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。