論文の概要: Robust Image Ordinal Regression with Controllable Image Generation
- arxiv url: http://arxiv.org/abs/2305.04213v3
- Date: Mon, 22 May 2023 02:38:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-24 02:53:41.645938
- Title: Robust Image Ordinal Regression with Controllable Image Generation
- Title(参考訳): 制御可能な画像生成によるロバスト画像規則回帰
- Authors: Yi Cheng, Haochao Ying, Renjun Hu, Jinhong Wang, Wenhao Zheng, Xiao
Zhang, Danny Chen and Jian Wu
- Abstract要約: 我々は、制御可能な画像生成に基づくCIGと呼ばれる新しいフレームワークを提案する。
私たちの基本的なアイデアは、カテゴリ境界に近い特定のラベルを持つ追加のトレーニングサンプルを生成することです。
我々は,新しいCIGアプローチの有効性を3つの異なる画像順序回帰シナリオで評価した。
- 参考スコア(独自算出の注目度): 12.787258917766005
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image ordinal regression has been mainly studied along the line of exploiting
the order of categories. However, the issues of class imbalance and category
overlap that are very common in ordinal regression were largely overlooked. As
a result, the performance on minority categories is often unsatisfactory. In
this paper, we propose a novel framework called CIG based on controllable image
generation to directly tackle these two issues. Our main idea is to generate
extra training samples with specific labels near category boundaries, and the
sample generation is biased toward the less-represented categories. To achieve
controllable image generation, we seek to separate structural and categorical
information of images based on structural similarity, categorical similarity,
and reconstruction constraints. We evaluate the effectiveness of our new CIG
approach in three different image ordinal regression scenarios. The results
demonstrate that CIG can be flexibly integrated with off-the-shelf image
encoders or ordinal regression models to achieve improvement, and further, the
improvement is more significant for minority categories.
- Abstract(参考訳): 画像の順序回帰は、主にカテゴリの順序を生かして研究されている。
しかし、序列回帰において非常に一般的なクラス不均衡とカテゴリー重複の問題はほとんど見過ごされた。
その結果、少数派でのパフォーマンスは不満足な場合が多い。
本稿では,これら2つの問題に直接対処するための,制御可能な画像生成に基づくCIGと呼ばれる新しいフレームワークを提案する。
我々の考えは、カテゴリ境界付近で特定のラベルを持つ追加のトレーニングサンプルを生成することであり、サンプル生成は、表現の少ないカテゴリに偏っている。
制御可能な画像生成を実現するために,画像の構造的類似性,カテゴリ的類似性,再構成制約に基づいて,画像の構造的およびカテゴリー的情報を分離する。
我々は3つの異なる画像順序回帰シナリオにおける新しいCIGアプローチの有効性を評価する。
その結果,CIGを市販画像エンコーダや順序回帰モデルと柔軟に統合して改善を達成できること,そしてマイノリティカテゴリにおいて改善がより重要であることが示された。
関連論文リスト
- GRIDS: Grouped Multiple-Degradation Restoration with Image Degradation Similarity [35.11349385659554]
Grouped Restoration with Image Degradation similarity (GRIDS) は、多重劣化修復に固有の競合対象を調和させる新しいアプローチである。
劣化類似性に基づいて、GRIDSは復元タスクを最適群の1つに分割する。
各グループのトレーニングモデルでは、シングルタスクの上限モデルよりも平均0.09dBの改善が見られた。
論文 参考訳(メタデータ) (2024-07-17T02:43:32Z) - Learning to Rank Patches for Unbiased Image Redundancy Reduction [80.93989115541966]
画像は、隣接する領域の画素が空間的に相関しているため、空間的冗長性に悩まされる。
既存のアプローチでは、意味の少ない画像領域を減らし、この制限を克服しようとしている。
本稿では,Learning to Rank Patchesと呼ばれる画像冗長性低減のための自己教師型フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-31T13:12:41Z) - PSCR: Patches Sampling-based Contrastive Regression for AIGC Image
Quality Assessment [1.1744028458220428]
本稿では,様々な画像の差を利用した表現空間の学習のためのコントラスト回帰フレームワークを提案する。
我々は、AGIQA-1K、AGIQA-3K、AIGCIQA2023を含む3つの主要なAIGCIQAデータベースについて広範な実験を行った。
その結果,提案したPSCRフレームワークの導入により,モデル性能が大幅に向上した。
論文 参考訳(メタデータ) (2023-12-10T14:18:53Z) - Balanced Classification: A Unified Framework for Long-Tailed Object
Detection [74.94216414011326]
従来の検出器は、分類バイアスによる長期データを扱う際の性能劣化に悩まされる。
本稿では,カテゴリ分布の格差に起因する不平等の適応的是正を可能にする,BAlanced CLassification (BACL) と呼ばれる統一フレームワークを提案する。
BACLは、さまざまなバックボーンとアーキテクチャを持つさまざまなデータセット間で、一貫してパフォーマンス改善を実現している。
論文 参考訳(メタデータ) (2023-08-04T09:11:07Z) - Incremental Generalized Category Discovery [26.028970894707204]
インクリメンタル一般化カテゴリー発見(IGCD)の課題を探る
これは、以前に見られたカテゴリから画像を正しく分類できるモデルを開発することを目的としている、挑戦的なカテゴリインクリメンタルな学習環境である。
本稿では,非パラメトリック分類と効率的な画像サンプリングを組み合わせたIGCDの新しい手法を提案する。
論文 参考訳(メタデータ) (2023-04-27T16:27:11Z) - Stable Attribute Group Editing for Reliable Few-shot Image Generation [88.59350889410794]
本稿では,編集ベースのフレームワークであるAttribute Group Editing (AGE) について述べる。
下流分類におけるGAN生成画像では,クラス不整合が一般的な問題であることがわかった。
我々は,SAGEの下流分類性能を,画素および周波数成分の増大により向上させることを提案する。
論文 参考訳(メタデータ) (2023-02-01T01:51:47Z) - Adaptive Fine-Grained Sketch-Based Image Retrieval [100.90633284767205]
最近のファイングレード・スケッチに基づく画像検索は、モデルから新しいカテゴリへの一般化へとシフトしている。
実世界のアプリケーションでは、トレーニングされたFG-SBIRモデルは、新しいカテゴリと異なる人間のスケッチラーの両方に適用されることが多い。
モデルに依存しないメタラーニング(MAML)に基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-04T21:07:20Z) - A Few Guidelines for Incremental Few-Shot Segmentation [57.34237650765928]
事前訓練されたセグメンテーションモデルと、新しいクラスを含む画像が少ないことを前提として、我々が目指すのは、以前に見たセグメンテーション能力を維持しながら、新しいクラスをセグメンテーションすることである。
このシナリオにおけるエンド・ツー・エンドのトレーニングの主な問題はどのようなものかを示します。
一 バッチ正規化統計を、バッチ正規化で修正できる新しいクラスへ向けての漂流すること。
二 旧クラスの忘れ物 正規化戦略で解決できるもの。
論文 参考訳(メタデータ) (2020-11-30T20:45:56Z) - C3VQG: Category Consistent Cyclic Visual Question Generation [51.339348810676896]
視覚質問生成(VQG)は、画像に基づいて自然な質問を生成するタスクである。
本稿では,画像内の様々な視覚的手がかりと概念を利用して,基底的答えを伴わずに,変分オートエンコーダ(VAE)を用いて質問を生成する。
提案手法は,既存のVQGシステムにおける2つの大きな欠点を解消する: (i) 監督レベルを最小化し, (ii) 一般的な質問をカテゴリ関連世代に置き換える。
論文 参考訳(メタデータ) (2020-05-15T20:25:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。