Fugu-MT 論文翻訳(概要): Certifying Robustness of Learning-Based Keypoint Detection and Pose Estimation Methods

論文の概要: Certifying Robustness of Learning-Based Keypoint Detection and Pose Estimation Methods

arxiv url: http://arxiv.org/abs/2408.00117v1
Date: Wed, 31 Jul 2024 19:02:54 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-04 22:36:04.151214
Title: Certifying Robustness of Learning-Based Keypoint Detection and Pose Estimation Methods
Title（参考訳）: 学習に基づくキーポイント検出とポーズ推定のロバスト性認定
Authors: Xusheng Luo, Tianhao Wei, Simin Liu, Ziwei Wang, Luis Mattei-Mendez, Taylor Loper, Joshua Neighbor, Casidhe Hutchison, Changliu Liu,
Abstract要約: この研究は、視覚に基づく2段階の6次元オブジェクトポーズ推定の堅牢性の証明に対処する。中心となる考え方は、ローカルロバストネスの認定を、分類タスクのニューラルネットワーク検証に変換することである。
参考スコア（独自算出の注目度）: 9.953693315812995
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This work addresses the certification of the local robustness of vision-based two-stage 6D object pose estimation. The two-stage method for object pose estimation achieves superior accuracy by first employing deep neural network-driven keypoint regression and then applying a Perspective-n-Point (PnP) technique. Despite advancements, the certification of these methods' robustness remains scarce. This research aims to fill this gap with a focus on their local robustness on the system level--the capacity to maintain robust estimations amidst semantic input perturbations. The core idea is to transform the certification of local robustness into neural network verification for classification tasks. The challenge is to develop model, input, and output specifications that align with off-the-shelf verification tools. To facilitate verification, we modify the keypoint detection model by substituting nonlinear operations with those more amenable to the verification processes. Instead of injecting random noise into images, as is common, we employ a convex hull representation of images as input specifications to more accurately depict semantic perturbations. Furthermore, by conducting a sensitivity analysis, we propagate the robustness criteria from pose to keypoint accuracy, and then formulating an optimal error threshold allocation problem that allows for the setting of a maximally permissible keypoint deviation thresholds. Viewing each pixel as an individual class, these thresholds result in linear, classification-akin output specifications. Under certain conditions, we demonstrate that the main components of our certification framework are both sound and complete, and validate its effects through extensive evaluations on realistic perturbations. To our knowledge, this is the first study to certify the robustness of large-scale, keypoint-based pose estimation given images in real-world scenarios.
Abstract（参考訳）: この研究は、視覚に基づく2段階の6次元オブジェクトのポーズ推定における局所的ロバスト性の評価に対処する。オブジェクトポーズ推定のための2段階の手法は、まずディープニューラルネットワーク駆動のキーポイント回帰を用い、次にパースペクティブ-n-Point(PnP)技術を適用することにより、より優れた精度を実現する。進歩にも拘わらず、これらの方法の堅牢性の認定は依然として不十分である。本研究の目的は,システムレベルでの局所的ロバスト性(セマンティック入力摂動下でのロバストな推定能力)に着目し,このギャップを埋めることである。中心となる考え方は、ローカルロバストネスの認定を、分類タスクのニューラルネットワーク検証に変換することである。課題は、市販の検証ツールと一致したモデル、インプット、アウトプットの仕様を開発することです。検証を容易にするため,検証プロセスに適合する非線形操作を代用してキーポイント検出モデルを変更する。画像にランダムノイズを注入する代わりに、入力仕様として画像の凸殻表現を用いて、意味摂動をより正確に表現する。さらに、感度分析を行うことで、ポーズからキーポイント精度までロバスト性基準を伝播させ、最大許容キーポイント偏差閾値の設定を可能にする最適誤差閾値割り当て問題を定式化する。各ピクセルを個別のクラスと見なすと、これらの閾値は線形で分類なしの出力仕様となる。一定の条件下では,認証フレームワークの主な構成要素が健全かつ完全であることを実証し,現実的な摂動に対する広範囲な評価を通じてその効果を検証した。我々の知る限り、これは現実世界のシナリオで与えられた画像に対して、大規模でキーポイントベースのポーズ推定の堅牢性を証明する最初の研究である。

関連論文リスト

An Uncertainty-aware DETR Enhancement Framework for Object Detection [10.102900613370817]
本稿では,DETRを用いた物体検出のための不確実性認識フレームワークを提案する。我々はハイリスク情報をフィルタリングし、検出信頼性を向上させるベイズリスクの定式化を導出する。 COCOベンチマーク実験により,本手法を既存のDECR変種に効果的に統合できることが示唆された。
論文参考訳（メタデータ） (2025-07-20T07:53:04Z)
Pixel-level Certified Explanations via Randomized Smoothing [87.48628403354351]
ポストホック属性法は, 入力画素を強調することにより, 深層学習の予測を説明することを目的としている。小さい、知覚不能な入力摂動は、同じ予測を維持しながら、属性マップを劇的に変更することができる。ブラックボックス属性法における画素レベルのロバスト性を保証する最初の認証フレームワークを提案する。
論文参考訳（メタデータ） (2025-06-18T14:41:24Z)
Rethinking Contrastive Learning in Graph Anomaly Detection: A Clean-View Perspective [54.605073936695575]
グラフ異常検出は、Webセキュリティやファイナンシャル不正検出などの分野で広く応用されているグラフベースのデータにおいて、異常なパターンを特定することを目的としている。既存の手法は対照的な学習に依存しており、ノードとその局所部分グラフの間のより低い類似性は異常を示すと仮定する。干渉エッジの存在は、対照的な学習過程を損なう破壊的なノイズをもたらすため、この仮定を無効にする。コントラスト学習プロセスにおいて重要な干渉源を特定するために,複数スケールの異常認識モジュールを含むクリーンビュー拡張グラフ異常検出フレームワーク(CVGAD)を提案する。
論文参考訳（メタデータ） (2025-05-23T15:05:56Z)
A Dataset for Semantic Segmentation in the Presence of Unknowns [49.795683850385956]
既存のデータセットは、既知のものや未知のもののみの評価を可能にするが、両方ではない。乱雑な実環境からの多様な異常な入力を特徴とする,新しい異常セグメンテーションデータセットISSUを提案する。データセットは、既存の異常セグメンテーションデータセットの2倍大きい。
論文参考訳（メタデータ） (2025-03-28T10:31:01Z)
Privacy-Preserving Model and Preprocessing Verification for Machine Learning [9.4033740844828]
本稿では、機密データに基づいてトレーニングされたモデルに着目し、機械学習モデルのプライバシ保護検証のためのフレームワークを提案する。バイナリ分類は、適切な前処理ステップを適用してターゲットモデルが正しくトレーニングされたかどうかを検証し、特定の前処理エラーを特定するマルチクラス分類という2つの重要なタスクに対処する。その結果、検証精度はデータセットやノイズレベルによって異なるが、このフレームワークは、事前処理エラー、強力なプライバシ保証、機密データの保護のための実践的適用性を効果的に検出する。
論文参考訳（メタデータ） (2025-01-14T16:21:54Z)
A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。工業画像から抽出した55個の特徴を統計的手法を用いて解析した。これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文参考訳（メタデータ） (2024-12-11T22:12:21Z)
Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文参考訳（メタデータ） (2024-11-28T13:04:45Z)
Uncertainty Estimation for 3D Object Detection via Evidential Learning [63.61283174146648]
本稿では,3次元検出器における鳥の視線表示における明らかな学習損失を利用して,3次元物体検出の不確かさを定量化するためのフレームワークを提案する。本研究では,これらの不確実性評価の有効性と重要性を,分布外シーンの特定,局所化の不十分な物体の発見,および(偽陰性)検出の欠如について示す。
論文参考訳（メタデータ） (2024-10-31T13:13:32Z)
Open-Set Deepfake Detection: A Parameter-Efficient Adaptation Method with Forgery Style Mixture [58.60915132222421]
本稿では,顔偽造検出に汎用的かつパラメータ効率の高い手法を提案する。フォージェリー・ソース・ドメインの多様性を増大させるフォージェリー・ミックス・フォーミュレーションを設計する。設計したモデルは、トレーニング可能なパラメータを著しく減らし、最先端の一般化性を実現する。
論文参考訳（メタデータ） (2024-08-23T01:53:36Z)
UniForensics: Face Forgery Detection via General Facial Representation [60.5421627990707]
高レベルの意味的特徴は摂動の影響を受けにくく、フォージェリー固有の人工物に限らないため、より強い一般化がある。我々は、トランスフォーマーベースのビデオネットワークを活用する新しいディープフェイク検出フレームワークUniForensicsを導入し、顔の豊かな表現のためのメタファンクショナルな顔分類を行う。
論文参考訳（メタデータ） (2024-07-26T20:51:54Z)
Tailoring Adversarial Attacks on Deep Neural Networks for Targeted Class Manipulation Using DeepFool Algorithm [6.515472477685614]
敵対的攻撃に対するディープニューラルネットワーク(DNN)の感受性は、多くのアプリケーションにまたがる信頼性を損なう。本稿では,DeepFoolの進化であるET DeepFoolアルゴリズムを紹介する。我々の実証的研究は、画像の整合性を維持する上で、この洗練されたアプローチが優れていることを示すものである。
論文参考訳（メタデータ） (2023-10-18T18:50:39Z)
Self-Supervised Graph Transformer for Deepfake Detection [1.8133635752982105]
ディープフェイク検出手法は、与えられたデータセット内の偽造を認識できる有望な結果を示している。ディープフェイク検出システムは、一般的な検出性能を保証するために、偽造タイプ、外観、品質に欠かせないままでいなければならない。本研究では、自己教師付き事前学習モデルを利用して、例外的な一般化能力を実現するディープフェイク検出フレームワークを提案する。
論文参考訳（メタデータ） (2023-07-27T17:22:41Z)
EvCenterNet: Uncertainty Estimation for Object Detection using Evidential Learning [26.535329379980094]
EvCenterNetは、新しい不確実性を認識した2Dオブジェクト検出フレームワークである。分類と回帰の不確実性の両方を推定するために、顕在的学習を用いる。我々は、KITTIデータセット上でモデルをトレーニングし、配布外のデータセットに挑戦して評価する。
論文参考訳（メタデータ） (2023-03-06T11:07:11Z)
A Call to Reflect on Evaluation Practices for Failure Detection in Image Classification [0.491574468325115]
本稿では,信頼度評価関数のベンチマーク化を初めて実現した大規模実証的研究について述べる。簡便なソフトマックス応答ベースラインを全体の最高の実行方法として明らかにすることは、現在の評価の劇的な欠点を浮き彫りにする。
論文参考訳（メタデータ） (2022-11-28T12:25:27Z)
Toward Certified Robustness Against Real-World Distribution Shifts [65.66374339500025]
我々は、データから摂動を学ぶために生成モデルを訓練し、学習したモデルの出力に関して仕様を定義する。この設定から生じるユニークな挑戦は、既存の検証者がシグモイドの活性化を厳密に近似できないことである。本稿では,古典的な反例誘導的抽象的洗練の概念を活用するシグモイドアクティベーションを扱うための一般的なメタアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-06-08T04:09:13Z)
Robust and Precise Facial Landmark Detection by Self-Calibrated Pose Attention Network [73.56802915291917]
より堅牢で正確な顔のランドマーク検出を実現するための半教師付きフレームワークを提案する。より効果的な顔形状制約をモデル化するために,境界対応ランドマーク強度(BALI)フィールドを提案する。自己キャリブレーション・ポース・アテンション(SCPA)モデルは、中間的監督を強制する自己学習型目標関数を提供するように設計されている。
論文参考訳（メタデータ） (2021-12-23T02:51:08Z)
Uncertainty-Aware Model Adaptation for Unsupervised Cross-Domain Object Detection [12.807987076435928]
この研究は、教師なしのクロスドメインオブジェクト検出問題に取り組む。これは、事前訓練された物体検出器をラベルなしで新しいターゲットドメインに一般化することを目的としている。
論文参考訳（メタデータ） (2021-08-28T09:37:18Z)
Uncertainty-Aware Deep Calibrated Salient Object Detection [74.58153220370527]
既存のディープニューラルネットワークに基づくサルエントオブジェクト検出(SOD)手法は主に高いネットワーク精度の追求に重点を置いている。これらの手法は、信頼不均衡問題として知られるネットワーク精度と予測信頼の間のギャップを見落としている。我々は,不確実性を考慮した深部SODネットワークを導入し,深部SODネットワークの過信を防止するための2つの戦略を提案する。
論文参考訳（メタデータ） (2020-12-10T23:28:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。