論文の概要: On PyTorch Implementation of Density Estimators for von Mises-Fisher and
Its Mixture
- arxiv url: http://arxiv.org/abs/2102.05340v1
- Date: Wed, 10 Feb 2021 09:26:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-11 14:26:00.670359
- Title: On PyTorch Implementation of Density Estimators for von Mises-Fisher and
Its Mixture
- Title(参考訳): von Mises-Fisherの密度推定器のPyTorch実装とその混合について
- Authors: Minyoung Kim
- Abstract要約: 我々は、vMFモデルとその混合物をレビューし、Python/PyTorchでモデルをトレーニングする方法の詳細なレシピを提供する。
混合学習には,ミニバッチに基づく大規模SGD学習と,全バッチ推定器であるEMアルゴリズムの両方を提供する。
- 参考スコア(独自算出の注目度): 15.522964295287425
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The von Mises-Fisher (vMF) is a well-known density model for directional
random variables. The recent surge of the deep embedding methodologies for
high-dimensional structured data such as images or texts, aimed at extracting
salient directional information, can make the vMF model even more popular. In
this article, we will review the vMF model and its mixture, provide detailed
recipes of how to train the models, focusing on the maximum likelihood
estimators, in Python/PyTorch. In particular, implementation of vMF typically
suffers from the notorious numerical issue of the Bessel function evaluation in
the density normalizer, especially when the dimensionality is high, and we
address the issue using the MPMath library that supports arbitrary precision.
For the mixture learning, we provide both minibatch-based large-scale SGD
learning, as well as the EM algorithm which is a full batch estimator. For each
estimator/methodology, we test our implementation on some synthetic data, while
we also demonstrate the use case in a more realistic scenario of image
clustering. Our code is publicly available in
https://github.com/minyoungkim21/vmf-lib.
- Abstract(参考訳): von Mises-Fisher (vMF) は方向性ランダム変数のよく知られた密度モデルである。
近年,画像やテキストなどの高次元構造化データに対する深層埋め込み手法の急増により,高次指向性情報抽出が進み,vMFモデルがさらに普及している。
この記事では、vMFモデルとその混合をレビューし、Python/PyTorchで、最大の可能性推定者に焦点を当てて、モデルをトレーニングする方法の詳細なレシピを提供します。
特に,vmfの実装は,密度正規化器におけるベッセル関数評価の悪名高い数値的問題,特に次元が高い場合には問題となり,任意の精度をサポートするmpmathライブラリを用いてこの問題に対処する。
混合学習には,ミニバッチに基づく大規模SGD学習と,全バッチ推定器であるEMアルゴリズムの両方を提供する。
それぞれの推定器/手法について、我々は合成データ上で実装をテストすると同時に、より現実的な画像クラスタリングのシナリオでユースケースを実証する。
私たちのコードはhttps://github.com/minyoungkim21/vmf-libで公開しています。
関連論文リスト
- Metric3Dv2: A Versatile Monocular Geometric Foundation Model for Zero-shot Metric Depth and Surface Normal Estimation [74.28509379811084]
Metric3D v2は、ゼロショット距離深さと1枚の画像からの表面正規推定のための幾何学的基礎モデルである。
距離深度推定と表面正規度推定の両方の解を提案する。
本手法は, ランダムに収集したインターネット画像上での計測3次元構造の正確な復元を可能にする。
論文 参考訳(メタデータ) (2024-03-22T02:30:46Z) - Metrically Scaled Monocular Depth Estimation through Sparse Priors for
Underwater Robots [0.0]
三角特徴量からのスパース深度測定を融合して深度予測を改善する深度学習モデルを定式化する。
このネットワークは、前方に見える水中データセットFLSeaで教師ありの方法で訓練されている。
この方法は、ラップトップGPUで160FPS、単一のCPUコアで7FPSで実行することで、リアルタイムのパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-10-25T16:32:31Z) - Probabilistic Classification by Density Estimation Using Gaussian
Mixture Model and Masked Autoregressive Flow [1.3706331473063882]
データ分布を推定する密度推定は確率論的機械学習の重要なカテゴリである。
本稿では,密度推定器を用いて分類するが,データの分布を推定するためによく用いられる。
我々は,GMMとMAFを用いて,密度推定によるデータクラスの可能性のモデル化を行う。
論文 参考訳(メタデータ) (2023-10-16T21:37:22Z) - Delving Deeper into Data Scaling in Masked Image Modeling [145.36501330782357]
視覚認識のためのマスク付き画像モデリング(MIM)手法のスケーリング能力に関する実証的研究を行った。
具体的には、Webで収集したCoyo-700Mデータセットを利用する。
我々のゴールは、データとモデルのサイズの異なるスケールでダウンストリームタスクのパフォーマンスがどのように変化するかを調べることです。
論文 参考訳(メタデータ) (2023-05-24T15:33:46Z) - Single Image Depth Prediction Made Better: A Multivariate Gaussian Take [163.14849753700682]
本稿では,画素ごとの深度を連続的にモデル化する手法を提案する。
提案手法の精度(MG)は,KITTI深度予測ベンチマークリーダーボードの上位に位置する。
論文 参考訳(メタデータ) (2023-03-31T16:01:03Z) - Deep Measurement Updates for Bayes Filters [5.059735037931382]
本稿では,多種多様なシステムに対する一般的な更新ルールとして,Deep Measurement Update (DMU)を提案する。
DMUは、深度画像を生の入力として処理する条件付きエンコーダ・デコーダニューラルネットワーク構造を持つ。
情報ボトルネックに頼らずに条件変数に敏感なDMUモデルを効率的に訓練する方法を実証する。
論文 参考訳(メタデータ) (2021-12-01T10:00:37Z) - The Power of Log-Sum-Exp: Sequential Density Ratio Matrix Estimation for
Speed-Accuracy Optimization [0.0]
本稿では,時系列のマルチクラス分類モデルを提案する。
早期分類のためのアーキテクチャ MSPRT-TANDEM は、4つのデータセットのベースラインモデルよりも統計的に有意に優れている。
論文 参考訳(メタデータ) (2021-05-28T07:21:58Z) - Learning Optical Flow from a Few Matches [67.83633948984954]
密な相関体積表現は冗長であり、その中の要素のほんの一部で正確なフロー推定が達成できることを示した。
実験により,高い精度を維持しつつ計算コストとメモリ使用量を大幅に削減できることを示した。
論文 参考訳(メタデータ) (2021-04-05T21:44:00Z) - Shaping Deep Feature Space towards Gaussian Mixture for Visual
Classification [74.48695037007306]
視覚分類のためのディープニューラルネットワークのためのガウス混合損失関数(GM)を提案する。
分類マージンと可能性正規化により、GM損失は高い分類性能と特徴分布の正確なモデリングの両方を促進する。
提案したモデルは、追加のトレーニング可能なパラメータを使わずに、簡単かつ効率的に実装できる。
論文 参考訳(メタデータ) (2020-11-18T03:32:27Z) - Adaptive Mixture Regression Network with Local Counting Map for Crowd
Counting [16.816382549827214]
そこで我々は,密度マップに基づくアプローチよりも正確な結果を得るために,LCM (Local counting map) という新しいターゲットを導入する。
また、3つのモジュールからなる適応型混合回帰フレームワークを粗大な方法で提案し、群衆推定の精度をさらに向上させる。
論文 参考訳(メタデータ) (2020-05-12T13:54:05Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。