論文の概要: Efficient Image Annotation via Semi-Supervised Object Segmentation with Label Propagation
- arxiv url: http://arxiv.org/abs/2604.22992v1
- Date: Fri, 24 Apr 2026 20:16:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.088119
- Title: Efficient Image Annotation via Semi-Supervised Object Segmentation with Label Propagation
- Title(参考訳): ラベルプロパゲーションを用いた半教師付き物体分割による効率的な画像アノテーション
- Authors: Vitalii Tutevych, Raphael Memmesheimer, Luca Eichler, Dmytro Pavlichenko, Fynn Schilke, Rodja Krudewig, Sven Behnke,
- Abstract要約: 家庭オブジェクトセグメンテーションのための半教師付きラベル伝搬手法を提案する。
セグメントプロジェクタは、クラス非依存マスクを生成し、ホップフィールドネットワークのアンサンブルがラベルを割り当てる。
当社のアプローチでは、準備時間が厳しく制約されたRoboCup@Home設定で、データの60%を自動的にラベル付けすることが可能です。
- 参考スコア(独自算出の注目度): 13.419417079527756
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Reliable object perception is necessary for general-purpose service robots. Open-vocabulary detectors struggle to generalize beyond a few classes and fully supervised training of object detectors requires time-intensive annotations. We present a semi-supervised label propagation approach for household object segmentation. A segment proposer generates class-agnostic masks, and an ensemble of Hopfield networks assigns labels by learning representative embeddings in complementary foundation model embedding spaces (CLIP, ViT, Theia). Our approach scales to 50 object classes with limited annotation overhead and can automatically label 60% of the data in a RoboCup@Home setting, where preparation time is severely constrained. Dataset and code are publicly available at https://github.com/ais-bonn/label_propagation.
- Abstract(参考訳): 汎用サービスロボットには信頼性の高い物体認識が必要である。
オープンボキャブラリ検出器はいくつかのクラスを超えて一般化するのに苦労し、オブジェクト検出器の完全な教師付きトレーニングには時間集約アノテーションが必要である。
家庭オブジェクトセグメンテーションのための半教師付きラベル伝搬手法を提案する。
セグメントプロジェクタは、クラス非依存マスクを生成し、ホップフィールドネットワークのアンサンブルは、補足的基礎モデル埋め込み空間(CLIP、ViT、Theia)に代表埋め込みを学習することによりラベルを割り当てる。
私たちのアプローチでは、アノテーションのオーバーヘッドが制限された50のオブジェクトクラスにスケールし、準備時間が厳しく制約されたRoboCup@Home設定で、データの60%を自動的にラベル付けすることができます。
データセットとコードはhttps://github.com/ais-bonn/label_propagation.comで公開されている。
関連論文リスト
- Open-Vocabulary Camouflaged Object Segmentation [66.94945066779988]
OVCOS(Open-vocabulary camouflaged Object segmentation)を導入した。
我々は11,483個の手選択画像とそれに対応するオブジェクトクラスを含む大規模複合シーンデータセット(textbfOVCamo)を構築した。
クラスセマンティック知識の指導とエッジ情報と深度情報からの視覚構造的手がかりの補足を統合することにより、提案手法は効率よくカモフラージュされたオブジェクトを捕捉できる。
論文 参考訳(メタデータ) (2023-11-19T06:00:39Z) - SAF-IS: a Spatial Annotation Free Framework for Instance Segmentation of
Surgical Tools [10.295921059528636]
トレーニングに空間アノテーションを頼らずに,実例分割のためのフレームワークを開発する。
我々のソリューションはバイナリツールマスクのみを必要とし、最新の教師なしアプローチとバイナリツール存在ラベルを使って取得できる。
当社のフレームワークは、2017年と2018年のセグメンテーションデータセット上で検証しています。
論文 参考訳(メタデータ) (2023-09-04T17:13:06Z) - Learning Dense Object Descriptors from Multiple Views for Low-shot
Category Generalization [27.583517870047487]
本稿では、カテゴリやセマンティックなオブジェクト部分ラベルを使わずに、オブジェクトインスタンスの複数のビューからトレーニングできるDeep Object Patch rimis(DOPE)を提案する。
DOPEを訓練するために、物体の視界間の画素レベルの対応を得るために、スパースディープ、フォアグラウンドマスク、および既知のカメラへのアクセスを仮定する。
DOPEは, 局所的マッチングを用いて, 新規カテゴリーの低ショット分類に利用でき, 教師付き学習ベースラインや自己教師型学習ベースラインと競合し, 優れることがわかった。
論文 参考訳(メタデータ) (2022-11-28T04:31:53Z) - Exploiting Unlabeled Data with Vision and Language Models for Object
Detection [64.94365501586118]
堅牢で汎用的なオブジェクト検出フレームワークを構築するには、より大きなラベルスペースとより大きなトレーニングデータセットへのスケーリングが必要である。
本稿では,近年の視覚と言語モデルで利用可能なリッチなセマンティクスを利用して,未ラベル画像中のオブジェクトのローカライズと分類を行う手法を提案する。
生成した擬似ラベルの価値を,オープン語彙検出と半教師付きオブジェクト検出の2つのタスクで示す。
論文 参考訳(メタデータ) (2022-07-18T21:47:15Z) - Saliency Guided Inter- and Intra-Class Relation Constraints for Weakly
Supervised Semantic Segmentation [66.87777732230884]
本稿では,活性化対象領域の拡大を支援するために,Salliency Guided Inter-およびIntra-Class Relation Constrained (I$2$CRC) フレームワークを提案する。
また,オブジェクトガイド付きラベルリファインメントモジュールを導入し,セグメンテーション予測と初期ラベルをフル活用し,優れた擬似ラベルを得る。
論文 参考訳(メタデータ) (2022-06-20T03:40:56Z) - Learning Open-World Object Proposals without Learning to Classify [110.30191531975804]
本研究では,各領域の位置と形状がどの接地トラストオブジェクトとどのように重なり合うかによって,各領域の目的性を純粋に推定する,分類不要なオブジェクトローカライゼーションネットワークを提案する。
この単純な戦略は一般化可能な対象性を学び、クロスカテゴリの一般化に関する既存の提案より優れている。
論文 参考訳(メタデータ) (2021-08-15T14:36:02Z) - Semantics through Time: Semi-supervised Segmentation of Aerial Videos
with Iterative Label Propagation [16.478668565965243]
本稿では,SegPropの導入によって自動アノテーションへの重要な一歩を踏み出す。
SegPropは、空間と時間におけるスペクトルクラスタリングに直接接続する、新しい反復フローベースの手法である。
Ruralscapesは、50フレーム毎に高解像度(4K)イメージと手動で注釈付けされた高密度ラベルを備えた、新しいデータセットである。
われわれの小説『SegProp』は、残っていない98%のフレームを90%を超える精度で自動的に注釈付けする。
論文 参考訳(メタデータ) (2020-10-02T15:15:50Z) - UniT: Unified Knowledge Transfer for Any-shot Object Detection and
Segmentation [52.487469544343305]
オブジェクト検出とセグメンテーションの方法は、トレーニングのための大規模インスタンスレベルのアノテーションに依存します。
本稿では,直感的かつ統一的な半教師付きモデルを提案する。
論文 参考訳(メタデータ) (2020-06-12T22:45:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。