Fugu-MT 論文翻訳(概要): OOD-CV-v2: An extended Benchmark for Robustness to Out-of-Distribution Shifts of Individual Nuisances in Natural Images

論文の概要: OOD-CV-v2: An extended Benchmark for Robustness to Out-of-Distribution Shifts of Individual Nuisances in Natural Images

arxiv url: http://arxiv.org/abs/2304.10266v2
Date: Wed, 26 Jul 2023 18:01:25 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-31 15:50:48.565195
Title: OOD-CV-v2: An extended Benchmark for Robustness to Out-of-Distribution Shifts of Individual Nuisances in Natural Images
Title（参考訳）: ood-cv-v2: 自然画像における個々の迷惑の分散シフトに対するロバスト性の拡張ベンチマーク
Authors: Bingchen Zhao, Jiahao Wang, Wufei Ma, Artur Jesslen, Siwei Yang, Shaozuo Yu, Oliver Zendel, Christian Theobalt, Alan Yuille, Adam Kortylewski
Abstract要約: OOD-CV-v2は、ポーズ、形状、テクスチャ、コンテキスト、気象条件の10のオブジェクトカテゴリのアウト・オブ・ディストリビューションの例を含むベンチマークデータセットである。この新たなデータセットに加えて、一般的なベースライン手法を用いた広範な実験にも貢献する。
参考スコア（独自算出の注目度）: 59.51657161097337
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Enhancing the robustness of vision algorithms in real-world scenarios is challenging. One reason is that existing robustness benchmarks are limited, as they either rely on synthetic data or ignore the effects of individual nuisance factors. We introduce OOD-CV-v2, a benchmark dataset that includes out-of-distribution examples of 10 object categories in terms of pose, shape, texture, context and the weather conditions, and enables benchmarking of models for image classification, object detection, and 3D pose estimation. In addition to this novel dataset, we contribute extensive experiments using popular baseline methods, which reveal that: 1) Some nuisance factors have a much stronger negative effect on the performance compared to others, also depending on the vision task. 2) Current approaches to enhance robustness have only marginal effects, and can even reduce robustness. 3) We do not observe significant differences between convolutional and transformer architectures. We believe our dataset provides a rich test bed to study robustness and will help push forward research in this area. Our dataset can be accessed from https://bzhao.me/OOD-CV/
Abstract（参考訳）: 現実のシナリオにおけるビジョンアルゴリズムの堅牢性を高めることは難しい。一つの理由は、既存の堅牢性ベンチマークは、合成データに依存するか、個々のニュアンス要因の影響を無視しているため、制限されているからである。 ood-cv-v2は,ポーズ,形状,テクスチャ,コンテクスト,気象条件の10種類の対象カテゴリの分散例を含むベンチマークデータセットであり,画像分類,物体検出,3次元ポーズ推定のためのモデルのベンチマークを可能にする。この新たなデータセットに加えて、一般的なベースライン手法を用いた広範な実験にも貢献する。 1)一部のニュアンス要因は、視力タスクにもよるが、他の要因に比べてパフォーマンスに強い負の影響がある。 2) 強靭性向上への現在のアプローチは限界効果しか持たず, 強靭性も低減できる。 3) 畳み込みアーキテクチャと変圧器アーキテクチャでは大きな違いはみられない。当社のデータセットは、堅牢性を研究するための豊富なテストベッドを提供し、この分野の研究を進めるのに役立ちます。私たちのデータセットはhttps://bzhao.me/OOD-CV/からアクセスできます。

関連論文リスト

A Benchmark and Evaluation for Real-World Out-of-Distribution Detection Using Vision-Language Models [31.885470008881267]
Out-of-Distribution(OOD)検出は、推論中にサンプルを検出して、デプロイされたモデルの安全性を保証するタスクである。我々は3つの新しいOOD検出ベンチマークを導入し,手法特性のより深い理解と実環境の反映を可能にした。実験の結果、最近のCLIPベースのOOD検出手法は、提案された3つのベンチマークで様々な程度に困難であることが判明した。
論文参考訳（メタデータ） (2025-01-30T16:30:20Z)
PoseBench: Benchmarking the Robustness of Pose Estimation Models under Corruptions [57.871692507044344]
ポース推定は、単眼画像を用いて人や動物の解剖学的キーポイントを正確に同定することを目的としている。現在のモデルは一般的に、クリーンなデータに基づいてトレーニングされ、テストされる。実世界の腐敗に対するポーズ推定モデルの堅牢性を評価するためのベンチマークであるPoseBenchを紹介する。
論文参考訳（メタデータ） (2024-06-20T14:40:17Z)
Benchmarking and Improving Bird's Eye View Perception Robustness in Autonomous Driving [55.93813178692077]
本稿では,BEVアルゴリズムのレジリエンスを評価するためのベンチマークスイートであるRoboBEVを紹介する。検出,マップセグメンテーション,深さ推定,占有予測といったタスクにまたがる33の最先端のBEVベースの知覚モデルを評価する。また, 事前学習や深度自由なBEVトランスフォーメーションなどの戦略が, アウト・オブ・ディストリビューションデータに対するロバスト性を高める上で有効であることを示す。
論文参考訳（メタデータ） (2024-05-27T17:59:39Z)
When hard negative sampling meets supervised contrastive learning [17.173114048398947]
我々は、微調整フェーズ中にハードネガティブサンプリングを組み込んだ新しい教師付きコントラスト学習目標であるSCHaNeを導入する。 SchaNeは、様々なベンチマークで、トップ1の精度で強いベースラインBEiT-3を上回っている。提案手法は,ImageNet-1kのベースモデルに対して,86.14%の精度で新たな最先端技術を実現する。
論文参考訳（メタデータ） (2023-08-28T20:30:10Z)
Mind the Backbone: Minimizing Backbone Distortion for Robust Object Detection [52.355018626115346]
ドメインシフトに対して堅牢なオブジェクト検出器を構築することは、現実世界のアプリケーションにとって重要なことです。我々は,ゆがみを特徴付けるバックボーンの脆弱性を測定する手段として,相対勾配ノルム(Relative Gradient Norm)を提案する。両バックボーンのOOD堅牢性を高めるためのレシピを提案する。
論文参考訳（メタデータ） (2023-03-26T14:50:43Z)
Benchmarking and Analyzing 3D Human Pose and Shape Estimation Beyond Algorithms [31.2529724533643]
この研究は、アルゴリズム以外の3つの未探索視点からの最初の総合的なベンチマーク研究を示す。 31のデータセットの分析では、データサンプルの異なる影響が明らかになっている。比較的単純なモデルで3DPWテストセットで47.3mmのPA-MPJPEを実現する。
論文参考訳（メタデータ） (2022-09-21T17:39:53Z)
ROBIN : A Benchmark for Robustness to Individual Nuisances in Real-World Out-of-Distribution Shifts [12.825391710803894]
ROBINは、現実の画像における個々のニュアンスに対するビジョンアルゴリズムの堅牢性を診断するためのベンチマークデータセットである。 ROBINは、PASCAL VOC 2012とImageNetデータセットから10の厳格なカテゴリを構築する。いくつかの一般的なベースラインに対して結果を提供し、興味深い観察を行う。
論文参考訳（メタデータ） (2021-11-29T06:18:46Z)
Contemplating real-world object classification [53.10151901863263]
Barbuらが最近提案したObjectNetデータセットを再分析した。日常の状況に物を含むこと。分離されたオブジェクトにディープモデルを適用すると、元の論文のようにシーン全体ではなく、約20～30%の性能改善が得られます。
論文参考訳（メタデータ） (2021-03-08T23:29:59Z)
Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文参考訳（メタデータ） (2021-01-18T03:24:48Z)
Point Transformer for Shape Classification and Retrieval of 3D and ALS Roof PointClouds [3.3744638598036123]
本稿では,リッチポイントクラウド表現の導出を目的とした,完全注意モデルであるem Point Transformerを提案する。モデルの形状分類と検索性能は,大規模都市データセット - RoofN3D と標準ベンチマークデータセット ModelNet40 で評価される。提案手法は、RoofN3Dデータセットの他の最先端モデルよりも優れており、ModelNet40ベンチマークで競合する結果を与え、目に見えない点の破損に対して高い堅牢性を示す。
論文参考訳（メタデータ） (2020-11-08T08:11:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。