論文の概要: Target-Guided Adversarial Point Cloud Transformer Towards Recognition Against Real-world Corruptions
- arxiv url: http://arxiv.org/abs/2411.00462v1
- Date: Fri, 01 Nov 2024 09:23:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 14:40:18.446048
- Title: Target-Guided Adversarial Point Cloud Transformer Towards Recognition Against Real-world Corruptions
- Title(参考訳): 実世界の崩壊に対する認識に向けての目標誘導逆向点雲変換器
- Authors: Jie Wang, Tingfa Xu, Lihe Ding, Jianan Li,
- Abstract要約: 本稿では、APCTと呼ばれるTarget-Guided Adversarial Point Cloud Transformerを紹介する。
APCTは, 対向的特徴消去機構を通じて, グローバルな構造キャプチャーを増大させるように設計された, 新規なアーキテクチャである。
提案手法は,複数の汚職評価ベンチマークにおける最先端結果を実現する。
- 参考スコア(独自算出の注目度): 17.805749608592794
- License:
- Abstract: Achieving robust 3D perception in the face of corrupted data presents an challenging hurdle within 3D vision research. Contemporary transformer-based point cloud recognition models, albeit advanced, tend to overfit to specific patterns, consequently undermining their robustness against corruption. In this work, we introduce the Target-Guided Adversarial Point Cloud Transformer, termed APCT, a novel architecture designed to augment global structure capture through an adversarial feature erasing mechanism predicated on patterns discerned at each step during training. Specifically, APCT integrates an Adversarial Significance Identifier and a Target-guided Promptor. The Adversarial Significance Identifier, is tasked with discerning token significance by integrating global contextual analysis, utilizing a structural salience index algorithm alongside an auxiliary supervisory mechanism. The Target-guided Promptor, is responsible for accentuating the propensity for token discard within the self-attention mechanism, utilizing the value derived above, consequently directing the model attention towards alternative segments in subsequent stages. By iteratively applying this strategy in multiple steps during training, the network progressively identifies and integrates an expanded array of object-associated patterns. Extensive experiments demonstrate that our method achieves state-of-the-art results on multiple corruption benchmarks.
- Abstract(参考訳): 破損したデータに直面して頑健な3D知覚を達成することは、3D視覚研究における挑戦的なハードルとなる。
現代のトランスフォーマーベースのポイントクラウド認識モデルは、先進的ではあるが、特定のパターンに過度に適合し、結果として腐敗に対する堅牢性を損なう傾向にある。
本研究では,学習中の各ステップで識別されるパターンを規定する対角的特徴消去機構を通じて,グローバルな構造を捕捉する新しいアーキテクチャであるAPCT(Target-Guided Adversarial Point Cloud Transformer)を紹介する。
具体的には、APCTはAdversarial Significance IdentifierとTarget-Guided Promptorを統合している。
副監督機構とともに構造的サリエンス指数アルゴリズムを用いて,グローバルな文脈分析を統合することにより,トークンの重要度を識別する。
ターゲット誘導型プロンプターは、自己保持機構内でトークンの破棄の正当性をアクセントし、上記の値を利用して、後続の段階でモデルの注意を代替セグメントに向ける。
トレーニング中の複数のステップでこの戦略を反復的に適用することにより、ネットワークは、拡張されたオブジェクト関連パターンの配列を段階的に識別し、統合する。
大規模な実験により,本手法は複数の汚損評価ベンチマークにおいて最先端の結果が得られた。
関連論文リスト
- Point Cloud Understanding via Attention-Driven Contrastive Learning [64.65145700121442]
トランスフォーマーベースのモデルは、自己認識機構を活用することにより、先進的なポイントクラウド理解を持つ。
PointACLは、これらの制限に対処するために設計された、注意駆動のコントラスト学習フレームワークである。
本手法では, 注意駆動型動的マスキング手法を用いて, モデルが非集中領域に集中するように誘導する。
論文 参考訳(メタデータ) (2024-11-22T05:41:00Z) - Integrity Monitoring of 3D Object Detection in Automated Driving Systems using Raw Activation Patterns and Spatial Filtering [12.384452095533396]
ディープニューラルネットワーク(DNN)モデルは、自動運転システム(ADS)における物体検出に広く利用されている。
しかし、そのようなモデルは、重大な安全性に影響を及ぼす可能性のあるエラーを起こしやすい。
このようなエラーを検知することを目的とした検査・自己評価モデルは、ADSの安全な配置において最重要となる。
論文 参考訳(メタデータ) (2024-05-13T10:03:03Z) - Sample-adaptive Augmentation for Point Cloud Recognition Against
Real-world Corruptions [20.95456179904285]
本稿では,サンプルの構造に基づくサンプル適応変換をAdaptPointと命名する手法を提案する。
判別器は、原データ分布から逸脱する過度な腐敗の発生を防止するために用いられる。
実験の結果,ModelNet-C,ScanObjectNN-C,ShapeNet-C など,複数の汚損評価ベンチマークにおいて,最先端の結果が得られた。
論文 参考訳(メタデータ) (2023-09-19T08:46:43Z) - Enhancing Infrared Small Target Detection Robustness with Bi-Level
Adversarial Framework [61.34862133870934]
本稿では,異なる汚職の存在下での検出の堅牢性を促進するために,二段階の対向的枠組みを提案する。
我々の手法は広範囲の汚職で21.96%のIOUを著しく改善し、特に一般ベンチマークで4.97%のIOUを推進している。
論文 参考訳(メタデータ) (2023-09-03T06:35:07Z) - FACADE: A Framework for Adversarial Circuit Anomaly Detection and
Evaluation [9.025997629442896]
FACADEは、ディープニューラルネットワークにおける教師なしの機械的異常検出のために設計されている。
我々のアプローチは、モデルの堅牢性を改善し、スケーラブルなモデル監視を強化し、現実のデプロイメント環境で有望なアプリケーションを実証することを目指している。
論文 参考訳(メタデータ) (2023-07-20T04:00:37Z) - Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual
Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。
既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。
本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文 参考訳(メタデータ) (2023-05-12T00:13:17Z) - Mitigating Adversarial Attacks in Deepfake Detection: An Exploration of
Perturbation and AI Techniques [1.0718756132502771]
敵の例は微妙な摂動で きれいな画像やビデオに 巧みに注入される
ディープフェイクは世論を操り、世論の評判を損なう強力なツールとして登場した。
この記事では、多面的な敵の例の世界を掘り下げ、ディープラーニングアルゴリズムを騙す能力の背後にある原則を解明する。
論文 参考訳(メタデータ) (2023-02-22T23:48:19Z) - PointCAT: Contrastive Adversarial Training for Robust Point Cloud
Recognition [111.55944556661626]
我々は、ポイントクラウド認識モデルの堅牢性を高めるために、PointCAT(Point-Cloud Contrastive Adversarial Training)を提案する。
我々は、教師付きコントラスト損失を利用して、認識モデルにより抽出された超球面特徴のアライメントと均一性を促進する。
より難易度の高い点雲を実現するため,認識モデルと逆向きにノイズ発生装置をスクラッチから訓練する。
論文 参考訳(メタデータ) (2022-09-16T08:33:04Z) - Unsupervised Domain Adaptation for Monocular 3D Object Detection via
Self-Training [57.25828870799331]
我々は、Mono3D上での教師なしドメイン適応のための新しい自己学習フレームワークSTMono3Dを提案する。
対象ドメイン上で適応的な擬似ラベルを生成するための教師学生パラダイムを開発する。
STMono3Dは、評価されたすべてのデータセットで顕著なパフォーマンスを達成し、KITTI 3Dオブジェクト検出データセットの完全な教師付き結果を超えています。
論文 参考訳(メタデータ) (2022-04-25T12:23:07Z) - Unsupervised Instance Segmentation in Microscopy Images via Panoptic
Domain Adaptation and Task Re-weighting [86.33696045574692]
病理組織像における教師なし核分割のためのCycle Consistency Panoptic Domain Adaptive Mask R-CNN(CyC-PDAM)アーキテクチャを提案する。
まず,合成画像中の補助的な生成物を除去するための核塗布機構を提案する。
第二に、ドメイン識別器を持つセマンティックブランチは、パンプトレベルのドメイン適応を実現するように設計されている。
論文 参考訳(メタデータ) (2020-05-05T11:08:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。