Fugu-MT 論文翻訳(概要): Exploring the Robustness of Human Parsers Towards Common Corruptions

論文の概要: Exploring the Robustness of Human Parsers Towards Common Corruptions

arxiv url: http://arxiv.org/abs/2309.00938v2
Date: Thu, 7 Sep 2023 02:30:16 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-08 15:58:28.098200
Title: Exploring the Robustness of Human Parsers Towards Common Corruptions
Title（参考訳）: 共通汚職に対するヒューマンパーサーのロバスト性の検討
Authors: Sanyi Zhang, Xiaochun Cao, Rui Wang, Guo-Jun Qi, Jie Zhou
Abstract要約: 我々は,LIP-C,ATR-C,Pascal-Person-Part-Cという3つの汚職堅牢性ベンチマークを構築し,人間の解析モデルのリスク許容度を評価する。データ強化戦略に触発されて、一般に破損した条件下で頑健性を高めるための新しい異種強化機構を提案する。
参考スコア（独自算出の注目度）: 99.89886010550836
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Human parsing aims to segment each pixel of the human image with fine-grained semantic categories. However, current human parsers trained with clean data are easily confused by numerous image corruptions such as blur and noise. To improve the robustness of human parsers, in this paper, we construct three corruption robustness benchmarks, termed LIP-C, ATR-C, and Pascal-Person-Part-C, to assist us in evaluating the risk tolerance of human parsing models. Inspired by the data augmentation strategy, we propose a novel heterogeneous augmentation-enhanced mechanism to bolster robustness under commonly corrupted conditions. Specifically, two types of data augmentations from different views, i.e., image-aware augmentation and model-aware image-to-image transformation, are integrated in a sequential manner for adapting to unforeseen image corruptions. The image-aware augmentation can enrich the high diversity of training images with the help of common image operations. The model-aware augmentation strategy that improves the diversity of input data by considering the model's randomness. The proposed method is model-agnostic, and it can plug and play into arbitrary state-of-the-art human parsing frameworks. The experimental results show that the proposed method demonstrates good universality which can improve the robustness of the human parsing models and even the semantic segmentation models when facing various image common corruptions. Meanwhile, it can still obtain approximate performance on clean data.
Abstract（参考訳）: human parseは、人間の画像の各ピクセルを、きめ細かなセマンティックカテゴリで分割することを目的としている。しかし、クリーンなデータで訓練された現在の人間のパーサーは、ぼやけやノイズといった多くの画像の破損によって容易に混乱する。本稿では,人間のパーサーのロバスト性を改善するために,llip-c,atr-c,pascal-person-part-cと呼ばれる3つの腐敗ロバスト性ベンチマークを構築し,人間の解析モデルのリスク許容性を評価する。本研究では,データ拡張戦略に触発されて,不均質な拡張強化機構を提案する。具体的には、異なるビューからの2種類のデータ拡張、すなわち、画像認識拡張とモデル認識画像から画像への変換を連続的に統合して、予期せぬ画像破損に対応させる。画像認識拡張は、一般的な画像操作の助けを借りて、トレーニング画像の多様性を高めることができる。モデルのランダム性を考慮して入力データの多様性を向上させるモデル認識強化戦略。提案されたメソッドはモデルに依存しず、任意の最先端のヒューマンパースフレームワークにプラグアンドプレイすることができる。実験の結果,提案手法は画像共通汚損に直面した場合に,人間のパースモデルや意味的セグメンテーションモデルの堅牢性を向上できる優れた普遍性を示すことが示された。一方で、クリーンデータに対する近似的なパフォーマンスも得ることができる。

関連論文リスト

On the Holistic Approach for Detecting Human Image Forgery [20.765860380888057]
本稿では,ヒト画像偽造検出のための総合的なフレームワークであるHuForDetを紹介する。コンテキスト化された偽造検出ブランチは、MLLM(Multi-Modal Large Language Model)を利用して、フルボディのセマンティック一貫性を分析する。我々のHuForDetは、最先端の偽造検出性能と、多様な画像偽造者に対して優れた堅牢性を実現している。
論文参考訳（メタデータ） (2026-01-08T08:33:22Z)
Stylized Synthetic Augmentation further improves Corruption Robustness [4.206961078715932]
本稿では,合成画像データとニューラルスタイル転送を組み合わせたトレーニングデータ拡張パイプラインを提案する。合成画像にスタイル転送を適用すると、一般的なFrechet Inception Distanceメトリックに対して品質が低下するが、これらの画像はモデルトレーニングに驚くほど有益であることを示す。
論文参考訳（メタデータ） (2025-12-17T18:28:04Z)
Decoupled Data Augmentation for Improving Image Classification [37.50690945158849]
Decoupled Data Augmentation (De-DA)を導入する。生成モデルを用いて、制御条件下での実際のCDPの修正を行い、セマンティック一貫性を保つ。また、画像のCIPをクラス間変種に置き換え、多様なCDP-CIPの組み合わせを作成します。
論文参考訳（メタデータ） (2024-10-29T06:27:09Z)
MMAR: Towards Lossless Multi-Modal Auto-Regressive Probabilistic Modeling [64.09238330331195]
本稿では,MMAR(Multi-Modal Auto-Regressive)確率モデルフレームワークを提案する。離散化の手法とは異なり、MMARは情報損失を避けるために連続的に評価された画像トークンを取り入れる。 MMARは他のジョイントマルチモーダルモデルよりもはるかに優れた性能を示す。
論文参考訳（メタデータ） (2024-10-14T17:57:18Z)
Are They the Same Picture? Adapting Concept Bottleneck Models for Human-AI Collaboration in Image Retrieval [3.2495565849970016]
textttCHAIRを使えば、人間が中間概念を修正できる。本手法は,外部介入を伴わずに,画像検索指標の類似モデルよりも優れた性能を示すことを示す。
論文参考訳（メタデータ） (2024-07-12T00:59:32Z)
Traditional Classification Neural Networks are Good Generators: They are Competitive with DDPMs and GANs [104.72108627191041]
従来のニューラルネットワーク分類器は、最先端の生成モデルに匹敵する高品質な画像を生成することができることを示す。マスクをベースとした再構成モジュールを提案し, 意味的勾配を意識し, 可視画像の合成を行う。また,本手法は,画像テキスト基盤モデルに関して,テキスト・画像生成にも適用可能であることを示す。
論文参考訳（メタデータ） (2022-11-27T11:25:35Z)
Person Image Synthesis via Denoising Diffusion Model [116.34633988927429]
本研究では,高忠実度人物画像合成に拡散モデルをいかに応用できるかを示す。 2つの大規模ベンチマークとユーザスタディの結果は、挑戦的なシナリオ下で提案したアプローチのフォトリアリズムを実証している。
論文参考訳（メタデータ） (2022-11-22T18:59:50Z)
Adaptive Clustering of Robust Semantic Representations for Adversarial Image Purification [0.9203366434753543]
我々は、モデルに依存しず、目に見えない敵に対して汎用可能な、敵対攻撃に対する堅牢な防御を提案します。本稿では,各クラスの潜在表現を抽出し,意味的類似性を持つ潜在表現を適応的にクラスタ化する。我々は、逆空間表現と真のクラスタ分布の間の距離を最小化するために、潜空間表現を制限する新しいモデルを逆向きに訓練する。
論文参考訳（メタデータ） (2021-04-05T21:07:04Z)
Improving robustness against common corruptions with frequency biased models [112.65717928060195]
目に見えない画像の腐敗は驚くほど大きなパフォーマンス低下を引き起こします画像の破損タイプは周波数スペクトルで異なる特性を持ち、ターゲットタイプのデータ拡張の恩恵を受けます。畳み込み特徴マップの総変動(TV)を最小限に抑え、高周波堅牢性を高める新しい正規化方式を提案する。
論文参考訳（メタデータ） (2021-03-30T10:44:50Z)
Contextual Fusion For Adversarial Robustness [0.0]
ディープニューラルネットワークは、通常、1つの特定の情報ストリームを処理し、様々な種類の敵の摂動に影響を受けやすいように設計されている。そこで我々はPlaces-CNNとImagenet-CNNから並列に抽出した背景特徴と前景特徴を組み合わせた融合モデルを開発した。グラデーションをベースとした攻撃では,フュージョンは乱れのないデータの性能を低下させることなく,分類の大幅な改善を可能にする。
論文参考訳（メタデータ） (2020-11-18T20:13:23Z)
Adversarial Semantic Data Augmentation for Human Pose Estimation [96.75411357541438]
本研究では,セマンティックデータ拡張法 (SDA) を提案する。また,適応的セマンティックデータ拡張 (ASDA) を提案する。最先端の結果は、挑戦的なベンチマークで得られます。
論文参考訳（メタデータ） (2020-08-03T07:56:04Z)
Learning Deformable Image Registration from Optimization: Perspective, Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文参考訳（メタデータ） (2020-04-30T03:23:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。