論文の概要: Minimum-Distortion Embedding
- arxiv url: http://arxiv.org/abs/2103.02559v1
- Date: Wed, 3 Mar 2021 17:52:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-04 15:05:26.921452
- Title: Minimum-Distortion Embedding
- Title(参考訳): 最小歪み埋め込み
- Authors: Akshay Agrawal, Alnur Ali, Stephen Boyd
- Abstract要約: 有限な項目集合におけるベクトル埋め込み問題を考える。
いくつかの項目に対して定義された歪み関数を導入することでこれを定式化する。
私たちの目標は、制約に応じて、総歪みを最小限に抑える埋め込みを選択することです。
提案手法は,MDE問題と大規模データセットへのスケールを概略的に解決する準ニュートン法である。
- 参考スコア(独自算出の注目度): 5.0283393318082155
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the vector embedding problem. We are given a finite set of items,
with the goal of assigning a representative vector to each one, possibly under
some constraints (such as the collection of vectors being standardized, i.e.,
have zero mean and unit covariance). We are given data indicating that some
pairs of items are similar, and optionally, some other pairs are dissimilar.
For pairs of similar items, we want the corresponding vectors to be near each
other, and for dissimilar pairs, we want the corresponding vectors to not be
near each other, measured in Euclidean distance. We formalize this by
introducing distortion functions, defined for some pairs of the items. Our goal
is to choose an embedding that minimizes the total distortion, subject to the
constraints. We call this the minimum-distortion embedding (MDE) problem. The
MDE framework is simple but general. It includes a wide variety of embedding
methods, such as spectral embedding, principal component analysis,
multidimensional scaling, dimensionality reduction methods (like Isomap and
UMAP), force-directed layout, and others. It also includes new embeddings, and
provides principled ways of validating historical and new embeddings alike. We
develop a projected quasi-Newton method that approximately solves MDE problems
and scales to large data sets. We implement this method in PyMDE, an
open-source Python package. In PyMDE, users can select from a library of
distortion functions and constraints or specify custom ones, making it easy to
rapidly experiment with different embeddings. Our software scales to data sets
with millions of items and tens of millions of distortion functions. To
demonstrate our method, we compute embeddings for several real-world data sets,
including images, an academic co-author network, US county demographic data,
and single-cell mRNA transcriptomes.
- Abstract(参考訳): ベクトル埋め込み問題を検討する。
有限個の項目が与えられ、ある制約の下で代表ベクトルを各ベクトルに割り当てること(例えば、標準となるベクトルの集合、すなわち平均と単位の共変性)を目標としている。
我々は、いくつかのペアのアイテムが類似していることを示すデータを与えられています。
類似した項目のペアに対しては、対応するベクトルを互いに近接させ、異なるペアに対しては、対応するベクトルをユークリッド距離で測定して、互いに近接しないことを望みます。
いくつかの項目に対して定義された歪み関数を導入することでこれを定式化する。
私たちの目標は、制約に応じて、総歪みを最小限に抑える埋め込みを選択することです。
これを最小歪み埋め込み(MDE)問題と呼びます。
MDEフレームワークは単純だが一般的である。
これには、スペクトル埋め込み、主成分分析、多次元スケーリング、(IsomapやUMAPのような)次元削減方法、力によるレイアウトなど、幅広い種類の埋め込み方法が含まれる。
また、新しい埋め込みも含み、歴史的および新しい埋め込みを同様に検証する原則的な方法を提供します。
提案手法は,MDE問題と大規模データセットへのスケールを概略的に解決する準ニュートン法である。
この手法をオープンソースのPythonパッケージであるPyMDEに実装する。
pymdeでは、歪み関数と制約のライブラリから選択したり、カスタム関数を指定することで、異なる埋め込みを簡単に試すことができる。
私たちのソフトウェアは、数百万のアイテムと何千万の歪み関数を持つデータセットにスケールします。
本研究では,画像,学術共著者ネットワーク,米国郡人口統計データ,単一細胞mRNAトランスクリプトームなどの実世界のデータセットの埋め込みを計算する。
関連論文リスト
- OPDR: Order-Preserving Dimension Reduction for Semantic Embedding of Multimodal Scientific Data [0.888375168590583]
マルチモーダルな科学データ管理における最も一般的な操作の1つは、$k$の類似アイテムを探すことである。
結果として得られる埋め込みベクトルの次元は、通常数百から数千のオーダーであり、時間に敏感な科学的応用には不可分に高い。
この研究は、出力埋め込みベクトルの次元性を減らし、トップ=k$近辺の集合が低次元空間において変化しないようにすることを提案する。
論文 参考訳(メタデータ) (2024-08-15T22:30:44Z) - DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses [59.51874686414509]
現在のアプローチは、多数の離散的なポーズ仮説を持つ連続的なポーズ表現を近似している。
本稿では,DVMNet(Deep Voxel Matching Network)を提案する。
提案手法は,最先端の手法に比べて計算コストの低い新しいオブジェクトに対して,より正確なポーズ推定を行う。
論文 参考訳(メタデータ) (2024-03-20T15:41:32Z) - Sparse Gaussian Graphical Models with Discrete Optimization:
Computational and Statistical Perspectives [8.403841349300103]
本研究では,無向ガウス図形モデルに基づくスパースグラフの学習問題を考察する。
擬似微分関数の $ell_0$-penalized バージョンに基づく新しい推定器 GraphL0BnB を提案する。
実/合成データセットに関する数値実験により,本手法がほぼ最適に,p = 104$の問題を解けることが示唆された。
論文 参考訳(メタデータ) (2023-07-18T15:49:02Z) - ProbVLM: Probabilistic Adapter for Frozen Vision-Language Models [69.50316788263433]
本稿では,事前学習された視覚言語モデルの埋め込みに対する確率分布を推定する確率的アダプタProbVLMを提案する。
本稿では,検索タスクにおける不確実性埋め込みのキャリブレーションを定量化し,ProbVLMが他の手法よりも優れていることを示す。
本稿では,大規模な事前学習型潜伏拡散モデルを用いて,埋め込み分布を可視化する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-07-01T18:16:06Z) - Multi-Task Learning for Sparsity Pattern Heterogeneity: Statistical and Computational Perspectives [10.514866749547558]
マルチタスク学習(MTL)において、複数の線形モデルがデータセットの集合上で協調的に訓練される問題を考える。
我々のフレームワークの重要な特徴は、回帰係数のスパーシティパターンと非ゼロ係数の値がタスク間で異なることである。
提案手法は,1) 係数のサポートを個別に促進し,2) 非ゼロ係数の値を類似させることにより,タスク間の情報共有を奨励する。
これにより、非ゼロ係数値がタスク間で異なる場合でも、モデルが可変選択中に強度を借りることができる。
論文 参考訳(メタデータ) (2022-12-16T19:52:25Z) - Hyperbolic Vision Transformers: Combining Improvements in Metric
Learning [116.13290702262248]
計量学習のための新しい双曲型モデルを提案する。
本手法のコアとなるのは、双曲空間にマッピングされた出力埋め込みを備えた視覚変換器である。
4つのデータセットに6つの異なる定式化を施したモデルの評価を行った。
論文 参考訳(メタデータ) (2022-03-21T09:48:23Z) - Robust Ellipsoid-specific Fitting via Expectation Maximization [0.0]
楕円体フィッティングは、物体の検出や形状近似などのマシンビジョンに一般的に関心がある。
騒音に富んだ3次元環境下でのエリプシドフィッティングの新規でロバストな手法を提案する。
本手法は楕円体固有であり, パラメータフリーであり, 騒音, 外れ値, 大軸比に対して頑健である。
論文 参考訳(メタデータ) (2021-10-26T00:43:02Z) - Cherry-Picking Gradients: Learning Low-Rank Embeddings of Visual Data
via Differentiable Cross-Approximation [53.95297550117153]
本稿では,大規模な視覚データテンソルの処理を行うエンドツーエンドのトレーニング可能なフレームワークを提案する。
提案手法は大規模多次元グリッドデータや,大規模受容領域上のコンテキストを必要とするタスクに特に有用である。
論文 参考訳(メタデータ) (2021-05-29T08:39:57Z) - Analysis of Truncated Orthogonal Iteration for Sparse Eigenvector
Problems [78.95866278697777]
本研究では,多元的固有ベクトルを分散制約で同時に計算するTruncated Orthogonal Iterationの2つの変種を提案する。
次に,我々のアルゴリズムを適用して,幅広いテストデータセットに対するスパース原理成分分析問題を解く。
論文 参考訳(メタデータ) (2021-03-24T23:11:32Z) - FANOK: Knockoffs in Linear Time [73.5154025911318]
本稿では,ガウスモデル-Xノックオフを効率的に実装し,大規模特徴選択問題における誤発見率を制御するアルゴリズムについて述べる。
当社のメソッドは、最大50,000ドルという問題でテストしています。
論文 参考訳(メタデータ) (2020-06-15T21:55:34Z) - Multiple Metric Learning for Structured Data [0.0]
構造化データからメトリクスを学習しながらグラフと特徴空間情報を融合する問題に対処する。
本稿では,距離制約下での最適化のためのグラフベースの新しい手法を提案する。
論文 参考訳(メタデータ) (2020-02-13T19:11:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。