論文の概要: Probabilistic Tracking with Deep Factors
- arxiv url: http://arxiv.org/abs/2112.01609v1
- Date: Thu, 2 Dec 2021 21:31:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-06 15:55:30.243398
- Title: Probabilistic Tracking with Deep Factors
- Title(参考訳): 深い要因による確率的追跡
- Authors: Fan Jiang, Andrew Marmon, Ildebrando De Courten, Marc Rasi, Frank
Dellaert
- Abstract要約: 因子グラフに基づく確率的追跡フレームワークにおける特徴量に対する生成密度と組み合わせたディープ・フィーチャー・エンコーディングの使い方を示す。
本稿では,学習した特徴エンコーダと生成密度を組み合わせる可能性モデルを提案する。
- 参考スコア(独自算出の注目度): 8.030212474745879
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In many applications of computer vision it is important to accurately
estimate the trajectory of an object over time by fusing data from a number of
sources, of which 2D and 3D imagery is only one. In this paper, we show how to
use a deep feature encoding in conjunction with generative densities over the
features in a factor-graph based, probabilistic tracking framework. We present
a likelihood model that combines a learned feature encoder with generative
densities over them, both trained in a supervised manner. We also experiment
with directly inferring probability through the use of image classification
models that feed into the likelihood formulation. These models are used to
implement deep factors that are added to the factor graph to complement other
factors that represent domain-specific knowledge such as motion models and/or
other prior information. Factors are then optimized together in a non-linear
least-squares tracking framework that takes the form of an Extended Kalman
Smoother with a Gaussian prior. A key feature of our likelihood model is that
it leverages the Lie group properties of the tracked target's pose to apply the
feature encoding on an image patch, extracted through a differentiable warp
function inspired by spatial transformer networks. To illustrate the proposed
approach we evaluate it on a challenging social insect behavior dataset, and
show that using deep features does outperform these earlier linear appearance
models used in this setting.
- Abstract(参考訳): コンピュータビジョンの多くの応用において、2D画像と3D画像が1つしかない複数のソースからのデータを融合することにより、物体の軌跡を時間とともに正確に推定することが重要である。
本稿では,因子グラフに基づく確率的追跡フレームワークにおける特徴量に対する生成密度と組み合わせたディープ・フィーチャー・エンコーディングの使い方を示す。
我々は,学習した特徴エンコーダと生成密度を組み合わせた確率モデルを提案する。
また,画像分類モデルを用いて確率を直接推定する実験を行った。
これらのモデルは、因子グラフに追加される深い要素を実装するために使用され、運動モデルやその他の先行情報のようなドメイン固有の知識を表す他の要素を補完する。
因子は、ガウス前駆を持つ拡張カルマン平滑化の形式をとる非線形最小二乗追跡フレームワークで一緒に最適化される。
我々の可能性モデルの重要な特徴は、追跡対象のポーズのリー群特性を利用して、空間変換器ネットワークにインスパイアされた可変ワープ関数によって抽出された画像パッチに特徴符号化を適用することである。
提案手法を,課題となる社会昆虫行動データセットを用いて評価し,より深い特徴を用いた場合,これらの初期の線形外観モデルよりも優れていることを示す。
関連論文リスト
- Localized Gaussians as Self-Attention Weights for Point Clouds Correspondence [92.07601770031236]
本稿では,エンコーダのみのトランスフォーマーアーキテクチャのアテンションヘッドにおける意味的意味パターンについて検討する。
注意重みの修正はトレーニングプロセスの促進だけでなく,最適化の安定性の向上にも寄与する。
論文 参考訳(メタデータ) (2024-09-20T07:41:47Z) - Sub-graph Based Diffusion Model for Link Prediction [43.15741675617231]
拡散確率モデル(Denoising Diffusion Probabilistic Models, DDPM)は、例外的な品質を持つ同時代の生成モデルである。
本研究では,ベイズ式による確率推定過程を分解するために,専用設計を用いたリンク予測のための新しい生成モデルを構築した。
提案手法は,(1)再トレーニングを伴わないデータセット間の転送可能性,(2)限られたトレーニングデータに対する有望な一般化,(3)グラフ敵攻撃に対する堅牢性など,多くの利点を示す。
論文 参考訳(メタデータ) (2024-09-13T02:23:55Z) - Bayesian Inverse Graphics for Few-Shot Concept Learning [3.475273727432576]
最小限のデータのみを用いて学習するベイズ的知覚モデルを提案する。
本稿では、この表現が、数ショットの分類や推定などの下流タスクにどのように使用できるかを示す。
論文 参考訳(メタデータ) (2024-09-12T18:30:41Z) - DiffPose: SpatioTemporal Diffusion Model for Video-Based Human Pose
Estimation [16.32910684198013]
本稿では、条件付きヒートマップ生成問題として、ビデオに基づく人間のポーズ推定を定式化する新しい拡散アーキテクチャDiffPoseを提案する。
ポーズ推定タスクにおけるDiffPoseの特徴として,(i)複数のポーズ推定を組み合わせて予測精度を向上させる能力,(ii)モデルを再訓練することなく特徴改善のための反復的なステップ数を調整する能力,の2点を挙げる。
論文 参考訳(メタデータ) (2023-07-31T14:00:23Z) - Learning Active Subspaces and Discovering Important Features with Gaussian Radial Basis Functions Neural Networks [0.0]
モデルの訓練が完了すると抽出できる精度行列のスペクトルに含まれる貴重な情報を示す。
回帰,分類,特徴選択タスクの数値実験を行った。
その結果,提案モデルが競合モデルに比べて魅力的な予測性能が得られるだけでなく,予測性能も向上することが示唆された。
論文 参考訳(メタデータ) (2023-07-11T09:54:30Z) - ChiroDiff: Modelling chirographic data with Diffusion Models [132.5223191478268]
チャーログラフィーデータのための強力なモデルクラスである「拡散確率モデル(Denoising Diffusion Probabilistic Models)」やDDPMを導入している。
我々のモデルは「ChiroDiff」と呼ばれ、非自己回帰的であり、全体論的概念を捉えることを学び、したがって高い時間的サンプリングレートに回復する。
論文 参考訳(メタデータ) (2023-04-07T15:17:48Z) - DeepDC: Deep Distance Correlation as a Perceptual Image Quality
Evaluator [53.57431705309919]
ImageNet Pre-trained Deep Neural Network (DNN)は、効果的な画像品質評価(IQA)モデルを構築するための顕著な転送性を示す。
我々は,事前学習DNN機能のみに基づく新しいフル参照IQA(FR-IQA)モデルを開発した。
5つの標準IQAデータセット上で,提案した品質モデルの優位性を示すため,包括的実験を行った。
論文 参考訳(メタデータ) (2022-11-09T14:57:27Z) - Probabilistic Modeling for Human Mesh Recovery [73.11532990173441]
本稿では,2次元の証拠から3次元の人体復元の問題に焦点を当てた。
我々は,この問題を,入力から3Dポーズの分布へのマッピング学習として再考した。
論文 参考訳(メタデータ) (2021-08-26T17:55:11Z) - Flow-based Generative Models for Learning Manifold to Manifold Mappings [39.60406116984869]
本稿では,フローベース生成モデルに類似した,多様体値データに対する可逆層を3種類導入する。
配向分布関数の分野の脳画像を確実にかつ正確に再構築できる有望な結果を示します。
論文 参考訳(メタデータ) (2020-12-18T02:19:18Z) - A Flexible Framework for Designing Trainable Priors with Adaptive
Smoothing and Game Encoding [57.1077544780653]
我々は、前方通過を非滑らかな凸最適化問題として解釈できるニューラルネットワーク層の設計とトレーニングのための一般的なフレームワークを紹介する。
グラフのノードに代表されるローカルエージェントによって解決され、正規化関数を介して相互作用する凸ゲームに焦点を当てる。
このアプローチは、訓練可能なエンドツーエンドのディープモデル内で、古典的な画像の事前使用を可能にするため、画像の問題を解決するために魅力的である。
論文 参考訳(メタデータ) (2020-06-26T08:34:54Z) - Bayesian Sparse Factor Analysis with Kernelized Observations [67.60224656603823]
多視点問題は潜在変数モデルに直面することができる。
高次元問題と非線形問題は伝統的にカーネルメソッドによって扱われる。
両アプローチを単一モデルにマージすることを提案する。
論文 参考訳(メタデータ) (2020-06-01T14:25:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。