論文の概要: Learning Pseudo-Labeler beyond Noun Concepts for Open-Vocabulary Object
Detection
- arxiv url: http://arxiv.org/abs/2312.02103v1
- Date: Mon, 4 Dec 2023 18:29:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-05 14:19:58.847319
- Title: Learning Pseudo-Labeler beyond Noun Concepts for Open-Vocabulary Object
Detection
- Title(参考訳): オープンボキャブラリー物体検出のための名詞概念を超えた擬似ラベル学習
- Authors: Sunghun Kang, Junbum Cha, Jonghwan Mun, Byungseok Roh, Chang D. Yoo
- Abstract要約: 任意の概念の領域テキストアライメントをシンプルかつ効果的に学習する手法を提案する。
具体的には、任意の概念の擬似ラベル付けのための任意の画像とテキストのマッピング、Pseudo-Labeling for Arbitrary Concepts (PLAC) を学習することを目的としている。
提案手法は、名詞概念の標準OVODベンチマークにおける競合性能と、任意の概念の表現理解ベンチマークに対する大幅な改善を示す。
- 参考スコア(独自算出の注目度): 25.719940401040205
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open-vocabulary object detection (OVOD) has recently gained significant
attention as a crucial step toward achieving human-like visual intelligence.
Existing OVOD methods extend target vocabulary from pre-defined categories to
open-world by transferring knowledge of arbitrary concepts from vision-language
pre-training models to the detectors. While previous methods have shown
remarkable successes, they suffer from indirect supervision or limited
transferable concepts. In this paper, we propose a simple yet effective method
to directly learn region-text alignment for arbitrary concepts. Specifically,
the proposed method aims to learn arbitrary image-to-text mapping for
pseudo-labeling of arbitrary concepts, named Pseudo-Labeling for Arbitrary
Concepts (PLAC). The proposed method shows competitive performance on the
standard OVOD benchmark for noun concepts and a large improvement on referring
expression comprehension benchmark for arbitrary concepts.
- Abstract(参考訳): オープンボキャブラリオブジェクト検出(OVOD)は近年,人間の視覚的知性を達成するための重要なステップとして注目されている。
既存のovod法は、視覚言語事前学習モデルから検出器への任意の概念の知識を転送することで、予め定義されたカテゴリからオープンワールドへターゲット語彙を拡張する。
従来の手法は顕著な成功を収めたものの、間接的な監督や限定的な伝達可能な概念に悩まされている。
本稿では,任意の概念の領域テキストアライメントを直接学習する,シンプルで効果的な手法を提案する。
具体的には、任意の概念の擬似ラベル付けのための任意の画像からテキストへのマッピングを学習することを目的としている。
提案手法は、名詞概念の標準OVODベンチマークにおける競合性能と、任意の概念の表現理解ベンチマークに対する大幅な改善を示す。
関連論文リスト
- Discover-then-Name: Task-Agnostic Concept Bottlenecks via Automated Concept Discovery [52.498055901649025]
ディープニューラルネットワークの「ブラックボックス」問題に対処するために、概念ボトルネックモデル(CBM)が提案されている。
本稿では,典型的なパラダイムを逆転させる新しいCBMアプローチであるDiscover-then-Name-CBM(DN-CBM)を提案する。
我々の概念抽出戦略は、下流のタスクに非依存であり、既にそのモデルに知られている概念を使用するため、効率的である。
論文 参考訳(メタデータ) (2024-07-19T17:50:11Z) - Rewrite Caption Semantics: Bridging Semantic Gaps for
Language-Supervised Semantic Segmentation [100.81837601210597]
本研究では,事前学習データにおける視覚的意味論とテキスト的意味論のギャップを埋めるための概念キュレーション(CoCu)を提案する。
CoCuは、最高にゼロショット転送性能を達成し、言語教師ありセグメンテーションベースラインを大きなマージンで大幅に向上させる。
論文 参考訳(メタデータ) (2023-09-24T00:05:39Z) - Global Knowledge Calibration for Fast Open-Vocabulary Segmentation [124.74256749281625]
本稿では,各学習カテゴリの同義語群を生成するテキスト多様化戦略を提案する。
また,CLIPの汎用的な知識を維持するために,テキスト誘導型知識蒸留法を用いている。
提案手法は, 各種データセットに対して頑健な一般化性能を実現する。
論文 参考訳(メタデータ) (2023-03-16T09:51:41Z) - DetCLIP: Dictionary-Enriched Visual-Concept Paralleled Pre-training for
Open-world Detection [118.36746273425354]
本稿では,デザインされた概念辞書から知識の豊かさを生かして,オープンワールド検出のための並列視覚概念事前学習手法を提案する。
概念をそれらの記述で豊かにすることにより、オープンドメイン学習を促進するために、さまざまな概念間の関係を明確に構築する。
提案フレームワークは、例えばLVISデータセット上で、強力なゼロショット検出性能を示し、私たちのDetCLIP-TはGLIP-Tを9.9%向上させ、レアカテゴリで13.5%改善した。
論文 参考訳(メタデータ) (2022-09-20T02:01:01Z) - Toward a Visual Concept Vocabulary for GAN Latent Space [74.12447538049537]
本稿では,GANの潜在空間で表現される原始視覚概念のオープンエンド語彙を構築するための新しい手法を提案する。
提案手法は, 層選択性に基づく知覚的正当方向の自動識別, 自由形, 構成的自然言語記述による人為的アノテーションの3つの要素から構成される。
実験により、我々のアプローチで学んだ概念は信頼性があり、構成可能であることが示され、クラス、コンテキスト、オブザーバをまたいで一般化される。
論文 参考訳(メタデータ) (2021-10-08T17:58:19Z) - Corpus-level and Concept-based Explanations for Interpretable Document
Classification [23.194220621342254]
本稿では,キーワードとモデル予測の間の因果関係を捉えるためのコーパスレベルの説明手法を提案する。
また,より高レベルな概念を自動学習し,モデル予測タスクにおいて重要となる概念に基づく説明手法を提案する。
論文 参考訳(メタデータ) (2020-04-24T20:54:17Z) - Learning Representations by Predicting Bags of Visual Words [55.332200948110895]
自己教師付き表現学習ターゲットは、ラベルなしデータから畳み込みに基づく画像表現を学習する。
この分野におけるNLP手法の成功に触発された本研究では,空間的に高密度な画像記述に基づく自己教師型アプローチを提案する。
論文 参考訳(メタデータ) (2020-02-27T16:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。