論文の概要: Learning to Detect Important People in Unlabelled Images for
Semi-supervised Important People Detection
- arxiv url: http://arxiv.org/abs/2004.07568v1
- Date: Thu, 16 Apr 2020 10:09:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 21:47:10.636763
- Title: Learning to Detect Important People in Unlabelled Images for
Semi-supervised Important People Detection
- Title(参考訳): 半教師付き重要人物検出のための非標識画像における重要人物検出の学習
- Authors: Fa-Ting Hong, Wei-Hong Li, Wei-Shi Zheng
- Abstract要約: 本稿では,部分的に注釈付けされた画像から重要な人物を検出することを提案する。
提案手法では,未注釈画像の個人に対して擬似ラベルを割り当てることが反復的に学習される。
評価のために2つの大規模データセットを収集した。
- 参考スコア(独自算出の注目度): 85.91577271918783
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Important people detection is to automatically detect the individuals who
play the most important roles in a social event image, which requires the
designed model to understand a high-level pattern. However, existing methods
rely heavily on supervised learning using large quantities of annotated image
samples, which are more costly to collect for important people detection than
for individual entity recognition (eg, object recognition). To overcome this
problem, we propose learning important people detection on partially annotated
images. Our approach iteratively learns to assign pseudo-labels to individuals
in un-annotated images and learns to update the important people detection
model based on data with both labels and pseudo-labels. To alleviate the
pseudo-labelling imbalance problem, we introduce a ranking strategy for
pseudo-label estimation, and also introduce two weighting strategies: one for
weighting the confidence that individuals are important people to strengthen
the learning on important people and the other for neglecting noisy unlabelled
images (ie, images without any important people). We have collected two
large-scale datasets for evaluation. The extensive experimental results clearly
confirm the efficacy of our method attained by leveraging unlabelled images for
improving the performance of important people detection.
- Abstract(参考訳): 重要な人物検出は、社会的イベントイメージにおいて最も重要な役割を演じる個人を自動的に検出することであり、高いレベルのパターンを理解するためにデザインされたモデルが必要である。
しかし,既存の手法は大量の注釈付き画像サンプルを用いた教師あり学習に大きく依存しており,個人認識(オブジェクト認識など)よりも重要人物の検出に費用がかかる。
そこで本研究では,一部注釈付き画像を用いた重要人物検出学習を提案する。
提案手法は,無注釈画像の個人に擬似ラベルを割り当てることを繰り返し,ラベルと擬似ラベルの両方のデータに基づいて重要人物検出モデルを更新することを学ぶ。
疑似ラベル不均衡問題を解決するために,疑似ラベル推定のためのランキング戦略を導入し,また,個人が重要人物であるという自信を重み付けて重要人物の学習を強化し,無音画像(重要人物のいない画像)を無視する2つの重み付け戦略を導入する。
評価のために2つの大規模データセットを収集した。
実験結果から,重要人物検出の性能向上のために,未ラベル画像を活用することにより,本手法の有効性が明らかとなった。
関連論文リスト
- Extracting Human Attention through Crowdsourced Patch Labeling [18.947126675569667]
画像分類では、データセットのバイアスから重大な問題が生じる。
このようなバイアスを軽減する1つのアプローチは、モデルが対象物の位置に注意を向けることである。
本稿では,画像から人の注意を捉えるために,クラウドソーシングとAI支援を統合した新しいパッチラベル手法を提案する。
論文 参考訳(メタデータ) (2024-03-22T07:57:27Z) - Unsupervised learning based object detection using Contrastive Learning [6.912349403119665]
本研究では,教師なし・自己教師型学習を通じて,単段階物体検出装置を訓練するための画期的な手法を提案する。
我々の最先端のアプローチはラベリングプロセスに革命をもたらす可能性を秘めており、手動アノテーションに関連する時間とコストを大幅に削減する。
我々は、画像間のコントラスト学習という概念を創始し、重要な位置情報の取得を可能にした。
論文 参考訳(メタデータ) (2024-02-21T01:44:15Z) - Self-similarity Driven Scale-invariant Learning for Weakly Supervised
Person Search [66.95134080902717]
自己相似性駆動型スケール不変学習(SSL)という新しいワンステップフレームワークを提案する。
本稿では,ネットワークを前景と学習スケール不変の機能に集中させるための,マルチスケール・エクステンプラー・ブランチを提案する。
PRWおよびCUHK-SYSUデータベースの実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-02-25T04:48:11Z) - Semi-supervised Ranking for Object Image Blur Assessment [37.778436378659656]
信頼性のあるラベルを用いた大規模現実的な顔画像ぼかし評価データセットを構築した。
本稿では,2つのランクラベルを監督としてのみ,ぼやけたスコアを得る手法を提案する。
性能向上のために,四重項ランキングの整合性に基づく自己教師手法を提案する。
論文 参考訳(メタデータ) (2022-07-13T09:49:22Z) - STAR: Noisy Semi-Supervised Transfer Learning for Visual Classification [0.8662293148437356]
半教師付き学習(SSL)は、大規模なラベルなしデータの活用に有効であることが証明されている。
最近のSSLメソッドは、数十億のスケールでラベル付けされていないイメージデータに依存している。
本稿では,移動学習と自己学習を統合した半教師あり半教師ありトランスファー学習を提案する。
論文 参考訳(メタデータ) (2021-08-18T19:35:05Z) - Automatic Main Character Recognition for Photographic Studies [78.88882860340797]
画像の主人公は、最初に見る人の注意を引く最も重要な人間である。
画像中の主文字の同定は,従来の写真研究やメディア分析において重要な役割を担っている。
機械学習に基づく人間のポーズ推定を用いて主文字を識別する手法を提案する。
論文 参考訳(メタデータ) (2021-06-16T18:14:45Z) - Towards Good Practices for Efficiently Annotating Large-Scale Image
Classification Datasets [90.61266099147053]
多数の画像の分類ラベルを収集するための効率的なアノテーション戦略を検討する。
人間のラベリング作業を最小化するための修正とベストプラクティスを提案します。
ImageNet100の125kイメージサブセットのシミュレーション実験では、平均で0.35のアノテーションで80%のトップ-1の精度でアノテートできることが示されている。
論文 参考訳(メタデータ) (2021-04-26T16:29:32Z) - Few-Cost Salient Object Detection with Adversarial-Paced Learning [95.0220555274653]
本稿では,少数のトレーニング画像にのみ手動アノテーションを応用して,効果的なサルエント物体検出モデルを学習することを提案する。
我々は,このタスクを,少額の有能な物体検出とみなし,少数のコストの学習シナリオを促進するために,APL(Adversarialpaced Learning)ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-05T14:15:49Z) - Attention-Aware Noisy Label Learning for Image Classification [97.26664962498887]
大規模ラベル付きサンプルで学習した深層畳み込みニューラルネットワーク(CNN)は、コンピュータビジョンにおいて顕著な進歩を遂げている。
大量のラベル付きビジュアルデータを取得する最も安価な方法は、Flickrのようなユーザーが提供するラベルでウェブサイトからクロールすることである。
本稿では,潜在的なラベルノイズのあるデータセットに基づいて学習したネットワークの識別能力を向上させるために,注目に敏感なラベル学習手法を提案する。
論文 参考訳(メタデータ) (2020-09-30T15:45:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。