論文の概要: Towards Few-Annotation Learning in Computer Vision: Application to Image
Classification and Object Detection tasks
- arxiv url: http://arxiv.org/abs/2311.04888v1
- Date: Wed, 8 Nov 2023 18:50:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-09 14:44:52.207058
- Title: Towards Few-Annotation Learning in Computer Vision: Application to Image
Classification and Object Detection tasks
- Title(参考訳): コンピュータビジョンにおけるFew-Annotation学習に向けて:画像分類とオブジェクト検出タスクへの応用
- Authors: Quentin Bouniot
- Abstract要約: 本論文では,限定ラベルを用いた機械学習の理論的,アルゴリズム的,実験的貢献について述べる。
最初のコントリビューションでは、Few-Shot分類で使われる人気のあるメタラーニングアルゴリズムの理論と実践のギャップを埋めることに興味がある。
トランスフォーマーアーキテクチャに基づくオブジェクト検出器のトレーニングにおいて,ラベルのないデータを活用するために,教師なし事前学習と半教師付き学習の両方を提案する。
- 参考スコア(独自算出の注目度): 3.5353632767823506
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this thesis, we develop theoretical, algorithmic and experimental
contributions for Machine Learning with limited labels, and more specifically
for the tasks of Image Classification and Object Detection in Computer Vision.
In a first contribution, we are interested in bridging the gap between theory
and practice for popular Meta-Learning algorithms used in Few-Shot
Classification. We make connections to Multi-Task Representation Learning,
which benefits from solid theoretical foundations, to verify the best
conditions for a more efficient meta-learning. Then, to leverage unlabeled data
when training object detectors based on the Transformer architecture, we
propose both an unsupervised pretraining and a semi-supervised learning method
in two other separate contributions. For pretraining, we improve Contrastive
Learning for object detectors by introducing the localization information.
Finally, our semi-supervised method is the first tailored to transformer-based
detectors.
- Abstract(参考訳): 本論文では,限定ラベルを用いた機械学習の理論的,アルゴリズム的,実験的コントリビューション,特にコンピュータビジョンにおける画像分類と物体検出のタスクについて述べる。
最初の貢献として、マイナショット分類で使われる一般的なメタ学習アルゴリズムの理論と実践のギャップを埋めることに興味があります。
我々は、より効率的なメタ学習のための最良の条件を検証するために、しっかりとした理論的基礎から恩恵を受けるマルチタスク表現学習と接続する。
そこで,Transformer アーキテクチャに基づくオブジェクト検出器のトレーニングにおいて,ラベルのないデータを活用するために,教師なし事前学習と半教師付き学習の2つの方法を提案する。
事前学習では,局所化情報の導入により,物体検出者のコントラスト学習を改善する。
最後に, 半教師方式はトランスフォーマー型検出器に適応した最初の手法である。
関連論文リスト
- Pre-training Multi-task Contrastive Learning Models for Scientific
Literature Understanding [52.723297744257536]
事前学習言語モデル(LM)は、科学文献理解タスクにおいて有効であることを示す。
文献理解タスク間の共通知識共有を容易にするために,マルチタスクのコントラスト学習フレームワークであるSciMultを提案する。
論文 参考訳(メタデータ) (2023-05-23T16:47:22Z) - A Unified Framework with Meta-dropout for Few-shot Learning [25.55782263169028]
本稿ではメタラーニングの考え方を用いて,2つの全く異なる2つのショットラーニングのストリームを説明する。
本稿では,メタドロップアウト(メタドロップアウト)というシンプルな手法を提案し,基本カテゴリから新しいカテゴリへ一般化された伝達可能な知識に適用する。
論文 参考訳(メタデータ) (2022-10-12T17:05:06Z) - CoDo: Contrastive Learning with Downstream Background Invariance for
Detection [10.608660802917214]
下流背景不変性(CoDo)を用いたコントラスト学習という,オブジェクトレベルの自己教師型学習手法を提案する。
プリテキストタスクは、さまざまなバックグラウンド、特に下流データセットのインスタンス位置モデリングに集中するように変換される。
MSCOCOの実験では、共通のバックボーンを持つCoDoであるResNet50-FPNが、オブジェクト検出に強力な転送学習結果をもたらすことを示した。
論文 参考訳(メタデータ) (2022-05-10T01:26:15Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Joint Inductive and Transductive Learning for Video Object Segmentation [107.32760625159301]
半教師付きオブジェクトセグメンテーションは、第1フレームのマスクだけを与えられたビデオシーケンスで対象オブジェクトをセグメンテーションするタスクである。
過去の最も優れた手法は、マッチングベースの帰納的推論やオンライン帰納的学習を採用していた。
本稿では,トランスダクティブ学習とインダクティブ学習を統合したフレームワークに統合し,それら間の補完を利用して,高精度かつ堅牢なビデオオブジェクトセグメンテーションを提案する。
論文 参考訳(メタデータ) (2021-08-08T16:25:48Z) - Aligning Pretraining for Detection via Object-Level Contrastive Learning [57.845286545603415]
画像レベルのコントラスト表現学習は、伝達学習の汎用モデルとして非常に有効であることが証明されている。
我々は、これは準最適である可能性があり、従って、自己教師付きプレテキストタスクと下流タスクのアライメントを促進する設計原則を提唱する。
Selective Object Contrastive Learning (SoCo) と呼ばれる本手法は,COCO検出における伝達性能の最先端化を実現する。
論文 参考訳(メタデータ) (2021-06-04T17:59:52Z) - Fast Few-Shot Classification by Few-Iteration Meta-Learning [173.32497326674775]
数ショット分類のための高速な最適化に基づくメタラーニング手法を提案する。
我々の戦略はメタ学習において学習すべき基礎学習者の目的の重要な側面を可能にする。
我々は、我々のアプローチの速度と効果を実証し、総合的な実験分析を行う。
論文 参考訳(メタデータ) (2020-10-01T15:59:31Z) - Concept Learners for Few-Shot Learning [76.08585517480807]
本研究では,人間の解釈可能な概念次元に沿って学習することで,一般化能力を向上させるメタ学習手法であるCOMETを提案する。
我々は,細粒度画像分類,文書分類,セルタイプアノテーションなど,さまざまな領域からの少数ショットタスクによるモデルの評価を行った。
論文 参考訳(メタデータ) (2020-07-14T22:04:17Z) - Building Robust Industrial Applicable Object Detection Models Using
Transfer Learning and Single Pass Deep Learning Architectures [1.1816942730023883]
我々は、オブジェクト検出のタスク専用の深層畳み込みニューラルネットワークが、産業指向のオブジェクト検出パイプラインをどのように改善するかを探求する。
地域提案や分類,確率推定をひとつの実行で統合したディープラーニングアーキテクチャを用いて,リアルタイムのパフォーマンス向上を目指す。
本稿では,これらのアルゴリズムを2つの産業関連アプリケーションに適用し,その1つはアイトラッキングデータにおけるプロモーションボードの検出と,もう1つは拡張現実広告のための倉庫製品のパッケージの検出と認識である。
論文 参考訳(メタデータ) (2020-07-09T09:50:45Z) - Interpolation-based semi-supervised learning for object detection [44.37685664440632]
オブジェクト検出のための補間に基づく半教師付き学習手法を提案する。
提案した損失は、半教師付き学習と教師付き学習の性能を劇的に向上させる。
論文 参考訳(メタデータ) (2020-06-03T10:53:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。