論文の概要: Toward Real-Time Image Annotation Using Marginalized Coupled Dictionary
Learning
- arxiv url: http://arxiv.org/abs/2304.06907v2
- Date: Mon, 17 Apr 2023 20:00:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-19 11:34:45.659261
- Title: Toward Real-Time Image Annotation Using Marginalized Coupled Dictionary
Learning
- Title(参考訳): Marginalized Coupled Dictionary Learning を用いたリアルタイム画像アノテーションの実現
- Authors: Seyed Mahdi Roostaiyan, Mohammad Mehdi Hosseini, Mahya Mohammadi
Kashani, S. Hamid Amiri
- Abstract要約: 限られた数の視覚的プロトタイプとそれに対応するセマンティクスを同時に学習するために,新しい統合辞書学習手法を提案する。
このアプローチはリアルタイムな画像アノテーションの手順につながる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In most image retrieval systems, images include various high-level semantics,
called tags or annotations. Virtually all the state-of-the-art image annotation
methods that handle imbalanced labeling are search-based techniques which are
time-consuming. In this paper, a novel coupled dictionary learning approach is
proposed to learn a limited number of visual prototypes and their corresponding
semantics simultaneously. This approach leads to a real-time image annotation
procedure. Another contribution of this paper is that utilizes a marginalized
loss function instead of the squared loss function that is inappropriate for
image annotation with imbalanced labels. We have employed a marginalized loss
function in our method to leverage a simple and effective method of prototype
updating. Meanwhile, we have introduced ${\ell}_1$ regularization on semantic
prototypes to preserve the sparse and imbalanced nature of labels in learned
semantic prototypes. Finally, comprehensive experimental results on various
datasets demonstrate the efficiency of the proposed method for image annotation
tasks in terms of accuracy and time. The reference implementation is publicly
available on https://github.com/hamid-amiri/MCDL-Image-Annotation.
- Abstract(参考訳): ほとんどの画像検索システムでは、画像にはタグやアノテーションと呼ばれる様々な高レベルセマンティクスが含まれている。
事実上、不均衡なラベルを扱う最先端の画像アノテーションメソッドはすべて、時間を要する検索ベースの技術です。
本稿では,限られた数のビジュアルプロトタイプとそれに対応するセマンティクスを同時に学習するために,新しい統合辞書学習手法を提案する。
このアプローチはリアルタイム画像アノテーションの手順につながる。
本稿では,不均衡ラベル付き画像アノテーションに不適当な二乗損失関数の代わりに,限界損失関数を用いる。
本手法では, 簡易かつ効率的なプロトタイプ更新手法を活用するために, 余剰損失関数を用いた。
一方,意味プロトタイプに${\ell}_1$正規化を導入し,学習した意味プロトタイプにおけるラベルのばらばらで不均衡な性質を保存した。
最後に、様々なデータセットに対する総合的な実験結果から、画像アノテーションタスクの精度と時間の観点から、提案手法の効率性を示す。
リファレンス実装はhttps://github.com/hamid-amiri/MCDL-Image-Annotationで公開されている。
関連論文リスト
- Discriminative Class Tokens for Text-to-Image Diffusion Models [107.98436819341592]
自由形式のテキストの表現可能性を利用した非侵襲的な微調整手法を提案する。
本手法は,従来の微調整法と比較して高速で,クラス内の画像の収集を必要としない。
i)標準拡散モデルよりも正確で高品質な生成画像,(ii)低リソース環境でのトレーニングデータの拡張,および(iii)誘導分類器の訓練に使用されるデータ情報を明らかにする。
論文 参考訳(メタデータ) (2023-03-30T05:25:20Z) - Rethinking Crowdsourcing Annotation: Partial Annotation with Salient
Labels for Multi-Label Image Classification [20.48996482670661]
本稿では,クラウドソーシングによる画像アノテーションの再考を提案する。
我々の仮説は、アノテータが有意なラベルを持つ複数ラベルの画像を部分的にアノテートするだけでは、アノテーションエラーが少なくなるというものである。
同じアノテーション予算で、有能なアノテーションを持つ画像で教師されるマルチラベル画像が、完全に注釈付けされた画像で教師されるモデルより優れていることを示す。
論文 参考訳(メタデータ) (2021-09-06T18:28:53Z) - Weakly Supervised Medical Image Segmentation [2.355970984550866]
スパースラベル付き画像を用いた数ショットセマンティックセマンティックセグメンテーションのための新しい手法を提案する。
メタテストでは,スパースラベルをメタトレーニングや高密度ラベルに使用することにより,スパースラベルから高密度ラベルを予測することができる。
論文 参考訳(メタデータ) (2021-08-12T00:15:47Z) - Mixed Supervision Learning for Whole Slide Image Classification [88.31842052998319]
超高解像度画像のための混合監視学習フレームワークを提案する。
パッチトレーニングの段階では、このフレームワークは、粗いイメージレベルのラベルを使用して、自己教師付き学習を洗練することができる。
画素レベルの偽陽性と偽陰性を抑制するための包括的な戦略が提案されている。
論文 参考訳(メタデータ) (2021-07-02T09:46:06Z) - Pseudo Pixel-level Labeling for Images with Evolving Content [5.573543601558405]
画像の手動アノテーションの労力を削減するために,擬似ピクセルレベルのラベル生成手法を提案する。
VGGとResNetのバックボーンを用いた2つのセマンティックセグメンテーションモデルを、擬似ラベリング法と最先端手法を用いてラベル付けした画像上で学習する。
以上の結果から, トレーニングプロセスにおいて, 最先端手法を用いて生成したデータの代わりに擬似ラベルを用いることで, VGGおよびResNetに基づくセマンティックセマンティックセグメンテーションモデルの平均IoUと周波数重み付きIoUを3.36%, 2.58%, 10倍改善することがわかった。
論文 参考訳(メタデータ) (2021-05-20T18:14:19Z) - Towards Good Practices for Efficiently Annotating Large-Scale Image
Classification Datasets [90.61266099147053]
多数の画像の分類ラベルを収集するための効率的なアノテーション戦略を検討する。
人間のラベリング作業を最小化するための修正とベストプラクティスを提案します。
ImageNet100の125kイメージサブセットのシミュレーション実験では、平均で0.35のアノテーションで80%のトップ-1の精度でアノテートできることが示されている。
論文 参考訳(メタデータ) (2021-04-26T16:29:32Z) - Seed the Views: Hierarchical Semantic Alignment for Contrastive
Representation Learning [116.91819311885166]
一つの画像から生成されたビューをtextbfCross-samples や Multi-level representation に拡張することで,階層的なセマンティックアライメント戦略を提案する。
提案手法はCsMlと呼ばれ,サンプル間の多層視覚表現を堅牢な方法で統合する機能を備えている。
論文 参考訳(メタデータ) (2020-12-04T17:26:24Z) - Grafit: Learning fine-grained image representations with coarse labels [114.17782143848315]
本稿では,学習ラベルの提供するものよりも細かな表現を学習する問題に対処する。
粗いラベルと下層の細粒度潜在空間を併用することにより、カテゴリレベルの検索手法の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2020-11-25T19:06:26Z) - Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。
現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。
本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T16:29:42Z) - Context Aware Image Annotation in Active Learning [0.38073142980733]
画像メタデータを類似度指標として用いたコンテキスト認識画像フレームワーク(CAIAF)を提案する。
実験により,CAIAFのアノテーションコストを従来のフレームワークと比較して低減し,高い分類性能を維持した。
論文 参考訳(メタデータ) (2020-02-06T16:57:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。