論文の概要: 3D Common Corruptions and Data Augmentation
- arxiv url: http://arxiv.org/abs/2203.01441v1
- Date: Wed, 2 Mar 2022 22:31:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-04 15:29:33.986533
- Title: 3D Common Corruptions and Data Augmentation
- Title(参考訳): 3次元共通破壊とデータ拡張
- Authors: O\u{g}uzhan Fatih Kar, Teresa Yeo, Andrei Atanov, Amir Zamir
- Abstract要約: モデルのロバスト性を評価するために、汚職として使用できる一連の画像変換を導入する。
これらの変換は効率的であること(オンザフライで計算可能)、拡張可能であること(実際の画像のほとんどのデータセットに適用可能)、既存のモデルの脆弱性を暴露すること、モデルをより堅牢にすることができることを示しています。
- 参考スコア(独自算出の注目度): 1.5341219865646296
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a set of image transformations that can be used as `corruptions'
to evaluate the robustness of models as well as `data augmentation' mechanisms
for training neural networks. The primary distinction of the proposed
transformations is that, unlike existing approaches such as Common Corruptions,
the geometry of the scene is incorporated in the transformations -- thus
leading to corruptions that are more likely to occur in the real world. We show
these transformations are `efficient' (can be computed on-the-fly),
`extendable' (can be applied on most datasets of real images), expose
vulnerability of existing models, and can effectively make models more robust
when employed as `3D data augmentation' mechanisms. Our evaluations performed
on several tasks and datasets suggest incorporating 3D information into
robustness benchmarking and training opens up a promising direction for
robustness research.
- Abstract(参考訳): ニューラルネットワークのトレーニングのための'データ拡張'機構と同様に,モデルの堅牢性を評価するために,‘破壊’として使用できる一連の画像変換を導入する。
提案された変換の主な違いは、共通崩壊のような既存のアプローチとは異なり、シーンの幾何学が変換に組み込まれていることである。
これらの変換は‘エフェクト’(オンザフライで計算可能)、‘extendable’(実際の画像のほとんどのデータセットに適用可能)、既存のモデルの脆弱性を露呈し、‘3Dデータ拡張’メカニズムとして使用すれば、モデルをより堅牢にすることができる。
いくつかのタスクやデータセットで実施した評価では、3D情報をロバストネスベンチマークに組み込むことが示唆され、トレーニングはロバストネス研究の有望な方向を開く。
関連論文リスト
- Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - Sample-adaptive Augmentation for Point Cloud Recognition Against
Real-world Corruptions [20.95456179904285]
本稿では,サンプルの構造に基づくサンプル適応変換をAdaptPointと命名する手法を提案する。
判別器は、原データ分布から逸脱する過度な腐敗の発生を防止するために用いられる。
実験の結果,ModelNet-C,ScanObjectNN-C,ShapeNet-C など,複数の汚損評価ベンチマークにおいて,最先端の結果が得られた。
論文 参考訳(メタデータ) (2023-09-19T08:46:43Z) - 3D Adversarial Augmentations for Robust Out-of-Domain Predictions [115.74319739738571]
ドメイン外データへの一般化の改善に注力する。
対象を逆向きに変形させるベクトルの集合を学習する。
本研究では,学習したサンプル非依存ベクトルをモデルトレーニング時に利用可能なオブジェクトに適用することにより,対数拡大を行う。
論文 参考訳(メタデータ) (2023-08-29T17:58:55Z) - A Survey on the Robustness of Computer Vision Models against Common Corruptions [3.6486148851646063]
コンピュータビジョンモデルは、センサーエラーや極端な撮像環境に起因する入力画像の変化に影響を受けやすい。
これらの破損は、現実のシナリオにデプロイする際のモデルの信頼性を著しく損なう可能性がある。
本稿では,コンピュータビジョンモデルの汎用汚職に対する堅牢性を改善する手法について概観する。
論文 参考訳(メタデータ) (2023-05-10T10:19:31Z) - Robo3D: Towards Robust and Reliable 3D Perception against Corruptions [58.306694836881235]
我々は,3次元検出器とセグメンタのロバスト性を,アウト・オブ・ディストリビューションのシナリオで検証するための,最初の総合的なベンチマークであるRobo3Dを紹介する。
気象条件の悪化,外乱,センサの故障などに起因する8種類の汚職について検討した。
本稿では,モデルレジリエンスを高めるための簡易なフレキシブルなボキセル化戦略とともに,密度に敏感なトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T17:59:17Z) - Advancing 3D Medical Image Analysis with Variable Dimension Transform
based Supervised 3D Pre-training [45.90045513731704]
本稿では,革新的でシンプルな3Dネットワーク事前学習フレームワークを再考する。
再設計された3Dネットワークアーキテクチャにより、データ不足の問題に対処するために、修正された自然画像が使用される。
4つのベンチマークデータセットに関する総合的な実験により、提案した事前学習モデルが収束を効果的に加速できることが示されている。
論文 参考訳(メタデータ) (2022-01-05T03:11:21Z) - Geometry-Contrastive Transformer for Generalized 3D Pose Transfer [95.56457218144983]
この研究の直感は、与えられたメッシュ間の幾何学的不整合を強力な自己認識機構で知覚することである。
本研究では,グローバルな幾何学的不整合に対する3次元構造的知覚能力を有する新しい幾何学コントラスト変換器を提案する。
本稿では, クロスデータセット3次元ポーズ伝達タスクのための半合成データセットとともに, 潜時等尺正則化モジュールを提案する。
論文 参考訳(メタデータ) (2021-12-14T13:14:24Z) - Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。
最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。
しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。
本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文 参考訳(メタデータ) (2021-01-18T03:24:48Z) - On Robustness and Transferability of Convolutional Neural Networks [147.71743081671508]
現代の深層畳み込みネットワーク(CNN)は、分散シフトの下で一般化しないとしてしばしば批判される。
現代画像分類CNNにおける分布外と転送性能の相互作用を初めて検討した。
トレーニングセットとモデルサイズを増大させることで、分散シフトロバスト性が著しく向上することがわかった。
論文 参考訳(メタデータ) (2020-07-16T18:39:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。