論文の概要: Probabilistic Contrastive Learning Recovers the Correct Aleatoric
Uncertainty of Ambiguous Inputs
- arxiv url: http://arxiv.org/abs/2302.02865v1
- Date: Mon, 6 Feb 2023 15:30:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-07 16:21:37.603325
- Title: Probabilistic Contrastive Learning Recovers the Correct Aleatoric
Uncertainty of Ambiguous Inputs
- Title(参考訳): 確率的コントラスト学習はあいまいな入力の正解不確かさを回復する
- Authors: Michael Kirchhof, Enkelejda Kasneci, Seong Joon Oh
- Abstract要約: 我々は、共通InfoNCEの目的とエンコーダを拡張して、ポイントの代わりに潜在分布を予測する。
これらの分布がデータ生成過程の正しい後部を復元することを証明する。
キャリブレーションされた不確実性推定を提供することに加えて、これらの後部は画像検索における信頼区間の計算を可能にする。
- 参考スコア(独自算出の注目度): 21.38099300190815
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Contrastively trained encoders have recently been proven to invert the
data-generating process: they encode each input, e.g., an image, into the true
latent vector that generated the image (Zimmermann et al., 2021). However,
real-world observations often have inherent ambiguities. For instance, images
may be blurred or only show a 2D view of a 3D object, so multiple latents could
have generated them. This makes the true posterior for the latent vector
probabilistic with heteroscedastic uncertainty. In this setup, we extend the
common InfoNCE objective and encoders to predict latent distributions instead
of points. We prove that these distributions recover the correct posteriors of
the data-generating process, including its level of aleatoric uncertainty, up
to a rotation of the latent space. In addition to providing calibrated
uncertainty estimates, these posteriors allow the computation of credible
intervals in image retrieval. They comprise images with the same latent as a
given query, subject to its uncertainty.
- Abstract(参考訳): 対照的に訓練されたエンコーダは、最近データ生成過程を反転させることが証明されており、例えば、イメージを生成した真の潜在ベクトルに各入力をエンコードする(Zimmermann et al., 2021)。
しかし、実世界の観測には固有の曖昧さがしばしばある。
例えば、画像はぼやけているか、3Dオブジェクトの2Dビューのみを表示するため、複数の潜伏者がそれらを生成できた可能性がある。
これにより、非定常不確実性を伴う潜在ベクトルの真の後部確率が成立する。
この設定では、共通InfoNCEの目的とエンコーダを拡張して、ポイントの代わりに遅延分布を予測する。
これらの分布は, 滞留空間の回転に至るまでのアレータティック不確実性のレベルを含む, データ生成過程の正しい後部を復元することを示す。
不確実性の推定を校正することに加えて、これらの後方は画像検索における信頼できる間隔の計算を可能にする。
それらは、あるクエリと同じ潜在性を持つ画像で構成されており、その不確実性がある。
関連論文リスト
- Utilizing Uncertainty in 2D Pose Detectors for Probabilistic 3D Human Mesh Recovery [23.473909489868454]
確率論的アプローチは 有望な3次元メッシュ上の分布を学習する
この目的関数だけでは、全分布を捉えるのに十分ではないことを示す。
トレーニング中,被験者のセグメンテーションマスクを利用することで,不正なサンプルの数を著しく削減できることを実証した。
論文 参考訳(メタデータ) (2024-11-25T11:13:12Z) - Modeling Uncertainty in 3D Gaussian Splatting through Continuous Semantic Splatting [12.698075520631411]
3次元ガウススプラッティングにおける意味マップの確率的更新のための新しいアルゴリズム(3D-GS)を提案する。
従来の手法では3D-GSの特徴を学習してシーン理解を強化するアルゴリズムが導入されたが、3D-GSは警告なしで失敗する可能性があるため、安全クリティカルなロボット応用の課題が提示される。
本稿では,3D-GSの正確な構造と確率論的ロボットマップの不確実性の定量化機能を組み合わせた,ボクセルから楕円体への連続的意味マッピングの文献化手法を提案する。
論文 参考訳(メタデータ) (2024-11-04T19:31:03Z) - No Pose, No Problem: Surprisingly Simple 3D Gaussian Splats from Sparse Unposed Images [100.80376573969045]
NoPoSplatは、多視点画像から3Dガウスアンによってパラメータ化された3Dシーンを再構成できるフィードフォワードモデルである。
提案手法は,推定時にリアルタイムな3次元ガウス再構成を実現する。
この研究は、ポーズフリーの一般化可能な3次元再構成において大きな進歩をもたらし、実世界のシナリオに適用可能であることを示す。
論文 参考訳(メタデータ) (2024-10-31T17:58:22Z) - Probabilistic and Semantic Descriptions of Image Manifolds and Their
Applications [28.554065677506966]
画像は高次元空間の低次元多様体上にあると言うのが一般的である。
画像は多様体上に不均一に分布し、この分布を確率分布としてモデル化する方法を考案する。
多様体上の点を記述するために意味論的解釈がどのように用いられるかを示す。
論文 参考訳(メタデータ) (2023-07-06T09:36:45Z) - SparseFusion: Distilling View-conditioned Diffusion for 3D
Reconstruction [26.165314261806603]
ニューラルレンダリングと確率的画像生成の最近の進歩を統一したスパースビュー3次元再構成手法であるスパースフュージョンを提案する。
既存のアプローチは、通常、再プロジェクションされた機能を持つニューラルレンダリングの上に構築されるが、目に見えない領域を生成したり、大きな視点の変化の下で不確実性に対処できない。
論文 参考訳(メタデータ) (2022-12-01T18:59:55Z) - What can we learn about a generated image corrupting its latent
representation? [57.1841740328509]
GANのボトルネックにおける潜在表現に基づいて画像品質を予測できるという仮説を考察する。
遅延表現を雑音で破壊し、複数の出力を生成することでこれを実現できる。
論文 参考訳(メタデータ) (2022-10-12T14:40:32Z) - Semantic uncertainty intervals for disentangled latent spaces [30.254614465166245]
基本生成モデルに対する真の意味的要素を含むことが保証される原則付き不確実区間を提供する。
この技術は、画像の超解像や画像補完といった逆問題において、意味論的、原則的、インスタンス適応的な不確実性を確実に伝達する。
論文 参考訳(メタデータ) (2022-07-20T17:58:10Z) - PDC-Net+: Enhanced Probabilistic Dense Correspondence Network [161.76275845530964]
高度確率密度対応ネットワーク(PDC-Net+)は、精度の高い高密度対応を推定できる。
我々は、堅牢で一般化可能な不確実性予測に適したアーキテクチャと強化されたトレーニング戦略を開発する。
提案手法は,複数の挑戦的幾何マッチングと光学的フローデータセットに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-09-28T17:56:41Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - Learning Accurate Dense Correspondences and When to Trust Them [161.76275845530964]
2つの画像に関連する密度の高い流れ場と、堅牢な画素方向の信頼度マップの推定を目指しています。
フロー予測とその不確実性を共同で学習するフレキシブルな確率的アプローチを開発する。
本手法は,幾何学的マッチングと光フローデータセットに挑戦する最新の結果を得る。
論文 参考訳(メタデータ) (2021-01-05T18:54:11Z) - Uncertainty Inspired RGB-D Saliency Detection [70.50583438784571]
本稿では,データラベリングプロセスから学習することで,RGB-D値検出の不確実性を利用した最初のフレームワークを提案する。
そこで本研究では,確率的RGB-Dサリエンシ検出を実現するために,サリエンシデータラベリングプロセスにインスパイアされた生成アーキテクチャを提案する。
6つの挑戦的RGB-Dベンチマークデータセットの結果から,サリエンシマップの分布を学習する際のアプローチの優れた性能が示された。
論文 参考訳(メタデータ) (2020-09-07T13:01:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。