論文の概要: Adaptive Geodesic Conformal Prediction for Egocentric Camera Pose Estimation
- arxiv url: http://arxiv.org/abs/2605.00233v1
- Date: Thu, 30 Apr 2026 21:09:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.75548
- Title: Adaptive Geodesic Conformal Prediction for Egocentric Camera Pose Estimation
- Title(参考訳): エゴセントリックカメラポス推定のための適応測地等角予測
- Authors: Aishani Pathak, Hasti Seifi,
- Abstract要約: 標準共形予測(CP)は、最も難しい25%のフレーム(Q4)を60%しかカバーしていないが、名目上90%の全体カバレッジを実現している。
そこで我々は,DINOv2-Bridge適応CPを提案する。DINOv2-Bridge適応CPは,テスト時にイメージを使わずに参加者間を移動させる,単一のソース参加者に訓練された2段階の難易度推定器である。
- 参考スコア(独自算出の注目度): 15.199350753007339
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Egocentric pose estimation for Augmented Reality (AR) and assistive devices requires not just accurate predictions but guaranteed uncertainty regions. Conformal prediction (CP) provides such guarantees without retraining, but we show that standard CP with a single fixed threshold achieves nominal 90% overall coverage while covering only ~60% of the hardest 25% of frames (Q4) -- a ~30 percentage-point conditional coverage gap consistent across 12 participants, 3 predictors, and 3 horizons (108 evaluations) on EPIC-Fields. We further show that a geodesic SE(3) nonconformity score identifies physically harder frames than Euclidean scoring, with only 15-26% Q4 overlap and 2-3x higher ground-truth camera displacement for geodesic Q4 frames. To close the coverage gap, we propose DINOv2-Bridge adaptive CP: a two-stage difficulty estimator trained on a single source participant that transfers cross-participant without any images at test time, improving Q4 coverage from ~0.75 to ~0.93 while maintaining overall coverage at the 90% target.
- Abstract(参考訳): 拡張現実(Augmented Reality, AR)と補助装置の自己中心的なポーズ推定には、正確な予測だけでなく、不確実性領域の保証が必要である。
コンフォーマル予測(CP)は,1つの固定しきい値を持つ標準CPが,EPIC-Fieldsにおいて,12人の参加者,3人の予測者,3つの地平線(108評価)に対して,最も難しい25%(Q4)の約60%をカバーし,名目上の90%のカバレッジを達成することを示す。
さらに, ジオデシックSE(3)非整合度スコアはユークリッドのスコアよりも物理的に難しいフレームを識別し, Q4のオーバーラップは15~26%, Q4の2~3倍であった。
そこで我々は,DINOv2-Bridge適応CPを提案する。DINOv2-Bridge適応CPは,テスト時に画像なしで参加者間を移動し,Q4のカバレッジを ~0.75 から ~0.93 に改善し,全体のカバレッジを90%の目標で維持する,単一ソース参加者を対象とした2段階の難易度推定器である。
関連論文リスト
- SPLICE: Latent Diffusion over JEPA Embeddings for Conformal Time-Series Inpainting [0.5076419064097734]
時系列計算のための生成モデルは、強い復元精度を実現するが、有限サンプル信頼性保証は提供しない。
SPLICEは分散のないオンライン適応予測区間と遅延生成計算を結合したモジュラーフレームワークである。
プールされたJEPAエンコーダは、9つのフィードでトレーニングされ、4つの見えないドメインに転送される。
論文 参考訳(メタデータ) (2026-04-30T18:27:08Z) - Claw-Eval: Toward Trustworthy Evaluation of Autonomous Agents [66.97968363332465]
エージェントベンチマークの3つのギャップに対処するエンドツーエンド評価スイートであるClaw-Evalを紹介した。
Claw-Evalは3つのグループにまたがる9つのカテゴリにまたがる300の人間検証タスクで構成されている。
すべてのエージェントアクションは、3つの独立したエビデンスチャネルを通じて記録される。
論文 参考訳(メタデータ) (2026-04-07T17:43:18Z) - BiRQA: Bidirectional Robust Quality Assessment for Images [49.74447451098852]
フル参照画像品質評価(FR IQA)は、画像圧縮、復元、生成モデリングにおいて重要である。
本稿では、双方向の多スケールピラミッド内で4つの高速補完特徴を処理するコンパクトFR IQA計量モデルであるBiRQAを提案する。
5つのパブリックFR IQAベンチマークでは、BiRQAは以前のSOTAモデルよりも3倍高速で動作しながら、以前の状態(SOTA)より優れ、あるいは一致している。
論文 参考訳(メタデータ) (2026-02-23T20:52:56Z) - BadCLIP++: Stealthy and Persistent Backdoors in Multimodal Contrastive Learning [73.46118996284888]
マルチモーダル・コントラスト学習モデルに対するバックドア攻撃の研究は、ステルスネスと永続性という2つの大きな課題に直面している。
両課題に対処する統合フレームワークであるBadCLIP++を提案する。
ステルスネスのために,タスク関連領域付近に知覚不可能なパターンを埋め込むセマンティックフュージョンQRマイクロトリガーを導入する。
持続性については、半径縮小とセントロイドアライメントによるトリガ埋め込みを安定化する。
論文 参考訳(メタデータ) (2026-02-19T08:31:16Z) - Predicting When to Trust Vision-Language Models for Spatial Reasoning [2.984679075401059]
VLM(Vision-Language Models)は、マルチモーダルタスクにまたがる印象的な機能を示すが、体系的な空間的推論の失敗を示す。
独立な幾何学的検証によってVLM予測を検証可能な視覚に基づく信頼度推定フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-14T22:00:28Z) - CalPro: Prior-Aware Evidential--Conformal Prediction with Structure-Aware Guarantees for Protein Structures [6.908972852063454]
CalProは、シフト・ロバスト不確実性定量化のための事前認識の明らかなコンフォーマルなフレームワークである。
アンビグニティ集合上のPAC-ベイジアン境界を用いた分布シフトによる構造認識カバレッジ保証を導出する。
また,CalProは,事前情報のある地域では,標準のコンフォメーション手法よりも厳密な間隔を保ちながら,ほぼ最小のカバレッジを維持していることを示す。
論文 参考訳(メタデータ) (2026-01-12T04:49:32Z) - Causal Judge Evaluation: Calibrated Surrogate Metrics for LLM Systems [0.29465623430708904]
未校正スコアは選好を逆転させることができ、未校正スコアに対するナイーブな信頼区間は、ほぼ0%のカバレッジを獲得し、重要度重み付け推定器は、限られた重複の下で崩壊する。
3つの障害を全て解決するフレームワークであるCausal Judge Evaluationを紹介します。
論文 参考訳(メタデータ) (2025-12-11T22:16:24Z) - Learnable Conformal Prediction with Context-Aware Nonconformity Functions for Robotic Planning and Perception [4.694504497452662]
Learnable Conformal Predictionは、固定スコアを軽量なニューラル関数に置き換えて、コンテキスト認識の不確実性セットを生成する。
CPの理論的保証を維持しつつ、予測セットのサイズを18%減らし、検出間隔を52%減らし、経路計画の安全性を72%から91%に改善し、オーバーヘッドを最小限に抑えている。
ハードウェア評価では、LCPは1%未満のメモリと15.9%の推論オーバーヘッドを追加したが、検出タスクでは39 FPSを維持し、アンサンブルの7.4倍のエネルギー効率を保っている。
論文 参考訳(メタデータ) (2025-09-26T06:44:58Z) - Conformal Prediction for Privacy-Preserving Machine Learning [83.88591755871734]
AESで暗号化されたMNISTデータセットの変種を用いて、暗号化されたドメインに直接適用しても、コンフォーマル予測法が有効であることを示す。
我々の研究は、安全でプライバシーに配慮した学習システムにおける原則的不確実性定量化の基礎を定めている。
論文 参考訳(メタデータ) (2025-07-13T15:29:14Z) - The Fourth Monocular Depth Estimation Challenge [100.38910331027051]
本報告では, 単眼深度推定チャレンジ(MDEC)の第4版の結果について述べる。
SynS-Patchesベンチマークへのゼロショットの一般化に焦点を当てており、自然環境と屋内環境の両方で挑戦的な環境を特徴とするデータセットである。
この挑戦は合計24件の応募を受け、テストセットのベースラインを上回りました。
優勝者は3D F-Scoreを22.58%から23.05%に引き上げた。
論文 参考訳(メタデータ) (2025-04-24T17:59:52Z) - (Certified!!) Adversarial Robustness for Free! [116.6052628829344]
逆方向の摂動が0.5の2ノルム以内であることに制約された場合,ImageNetでは71%の精度が証明された。
これらの結果は,モデルパラメータの微調整や再学習を必要とせず,事前学習した拡散モデルと画像分類器のみを用いて得られる。
論文 参考訳(メタデータ) (2022-06-21T17:27:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。