論文の概要: Extracting Human Attention through Crowdsourced Patch Labeling
- arxiv url: http://arxiv.org/abs/2403.15013v1
- Date: Fri, 22 Mar 2024 07:57:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-25 18:18:01.703901
- Title: Extracting Human Attention through Crowdsourced Patch Labeling
- Title(参考訳): クラウドソーシング型パッチラベリングによる人間の注意抽出
- Authors: Minsuk Chang, Seokhyeon Park, Hyeon Jeon, Aeri Cho, Soohyun Lee, Jinwook Seo,
- Abstract要約: 画像分類では、データセットのバイアスから重大な問題が生じる。
このようなバイアスを軽減する1つのアプローチは、モデルが対象物の位置に注意を向けることである。
本稿では,画像から人の注意を捉えるために,クラウドソーシングとAI支援を統合した新しいパッチラベル手法を提案する。
- 参考スコア(独自算出の注目度): 18.947126675569667
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In image classification, a significant problem arises from bias in the datasets. When it contains only specific types of images, the classifier begins to rely on shortcuts - simplistic and erroneous rules for decision-making. This leads to high performance on the training dataset but inferior results on new, varied images, as the classifier's generalization capability is reduced. For example, if the images labeled as mustache consist solely of male figures, the model may inadvertently learn to classify images by gender rather than the presence of a mustache. One approach to mitigate such biases is to direct the model's attention toward the target object's location, usually marked using bounding boxes or polygons for annotation. However, collecting such annotations requires substantial time and human effort. Therefore, we propose a novel patch-labeling method that integrates AI assistance with crowdsourcing to capture human attention from images, which can be a viable solution for mitigating bias. Our method consists of two steps. First, we extract the approximate location of a target using a pre-trained saliency detection model supplemented by human verification for accuracy. Then, we determine the human-attentive area in the image by iteratively dividing the image into smaller patches and employing crowdsourcing to ascertain whether each patch can be classified as the target object. We demonstrated the effectiveness of our method in mitigating bias through improved classification accuracy and the refined focus of the model. Also, crowdsourced experiments validate that our method collects human annotation up to 3.4 times faster than annotating object locations with polygons, significantly reducing the need for human resources. We conclude the paper by discussing the advantages of our method in a crowdsourcing context, mainly focusing on aspects of human errors and accessibility.
- Abstract(参考訳): 画像分類では、データセットのバイアスから重大な問題が生じる。
特定のタイプの画像のみを含む場合、分類器は、意思決定の単純かつ誤った規則であるショートカットに依存するようになる。
これにより、トレーニングデータセットの性能は向上するが、分類器の一般化能力が低下するにつれて、新しい様々な画像に対して劣る結果が得られる。
例えば、口ひげとラベル付けされた画像が男性のみで構成されている場合、モデルが不注意に口ひげの存在ではなく、性別別に画像を分類することを学習する可能性がある。
このようなバイアスを軽減する1つのアプローチは、モデルが対象のオブジェクトの位置に注意を向けることであり、通常はアノテーションのためにバウンディングボックスやポリゴンを使ってマークされる。
しかし、こうした注釈の収集にはかなりの時間と人的労力を要する。
そこで我々は,画像から人の注意を捉えるために,AI支援とクラウドソーシングを統合したパッチラベル手法を提案する。
私たちの方法は2つのステップから成り立っている。
まず,人間による精度検証によって補足された訓練済みの精度検出モデルを用いて,目標の近似位置を抽出する。
そして,画像を小さなパッチに反復的に分割し,各パッチを対象オブジェクトとして分類できるかどうかを確認するために,クラウドソーシングを用いて画像中の人間の注意領域を決定する。
分類精度の向上とモデルの改良によるバイアス軽減における本手法の有効性を実証した。
また, クラウドソース実験により, アノテーションをポリゴンでアノテートするよりも最大3.4倍の速さで収集し, 人的資源の必要性を著しく低減することを確認した。
本稿では,クラウドソーシングにおける手法の利点を論じ,主にヒューマンエラーとアクセシビリティの観点から論じる。
関連論文リスト
- DiffUHaul: A Training-Free Method for Object Dragging in Images [78.93531472479202]
DiffUHaulと呼ばれるオブジェクトドラッグタスクのためのトレーニング不要な手法を提案する。
まず、各認知段階に注意マスキングを適用して、各生成を異なるオブジェクトにまたがってよりゆがみやすくする。
初期のデノナイジングステップでは、ソース画像とターゲット画像の注意特徴を補間して、新しいレイアウトを元の外観とスムーズに融合させる。
論文 参考訳(メタデータ) (2024-06-03T17:59:53Z) - Mitigating Bias Using Model-Agnostic Data Attribution [2.9868610316099335]
機械学習モデルにおけるバイアスの緩和は、公平性と公平性を保証するための重要な取り組みである。
本稿では, 画素画像の属性を利用して, バイアス属性を含む画像の領域を特定し, 正規化することで, バイアスに対処する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-05-08T13:00:56Z) - Multilevel Saliency-Guided Self-Supervised Learning for Image Anomaly
Detection [15.212031255539022]
異常検出(AD)はコンピュータビジョンの基本課題である。
そこで我々は,サリエンシガイダンスを活用して意味的手がかりを付加するCutSwapを提案する。
CutSwapは、2つの主流ADベンチマークデータセット上で最先端のADパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-11-30T08:03:53Z) - Addressing Weak Decision Boundaries in Image Classification by
Leveraging Web Search and Generative Models [14.732229124148596]
多くの大きな問題は、機械学習モデルが、表現不足なグループに対して等しくうまく機能しないことである。
本稿では,Web検索と生成モデルのパワーを活用して,識別モデルの欠点を緩和する手法を提案する。
本研究では, 脆弱な個体群に対して本手法を実証するが, 提案手法は幅広い問題や領域に拡張可能である。
論文 参考訳(メタデータ) (2023-10-30T20:04:50Z) - Self-similarity Driven Scale-invariant Learning for Weakly Supervised
Person Search [66.95134080902717]
自己相似性駆動型スケール不変学習(SSL)という新しいワンステップフレームワークを提案する。
本稿では,ネットワークを前景と学習スケール不変の機能に集中させるための,マルチスケール・エクステンプラー・ブランチを提案する。
PRWおよびCUHK-SYSUデータベースの実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-02-25T04:48:11Z) - An Experience-based Direct Generation approach to Automatic Image
Cropping [0.0]
画像美学を明示的にモデル化することなく,画像を直接収穫する新しい手法を提案する。
我々のモデルは、経験豊富な編集者が収集した画像の大規模なデータセットに基づいて訓練されている。
我々の戦略は2つの関連するタスクにおいて既存の手法と競合するか、あるいは性能が良いことを示す。
論文 参考訳(メタデータ) (2022-12-30T06:25:27Z) - Spuriosity Rankings: Sorting Data to Measure and Mitigate Biases [62.54519787811138]
本稿では,突発的手がかりに依存したモデルバイアスを簡易かつ効果的に測定・緩和する手法を提案する。
我々は,解釈可能なネットワークの深部神経的特徴をベースとして,それらのクラス内の画像のランク付けを行う。
以上の結果から,素早い特徴依存によるモデルバイアスは,モデルがどのようにトレーニングされたかよりも,モデルがトレーニングされていることの影響がはるかに大きいことが示唆された。
論文 参考訳(メタデータ) (2022-12-05T23:15:43Z) - Towards Good Practices for Efficiently Annotating Large-Scale Image
Classification Datasets [90.61266099147053]
多数の画像の分類ラベルを収集するための効率的なアノテーション戦略を検討する。
人間のラベリング作業を最小化するための修正とベストプラクティスを提案します。
ImageNet100の125kイメージサブセットのシミュレーション実験では、平均で0.35のアノテーションで80%のトップ-1の精度でアノテートできることが示されている。
論文 参考訳(メタデータ) (2021-04-26T16:29:32Z) - Learning to Detect Important People in Unlabelled Images for
Semi-supervised Important People Detection [85.91577271918783]
本稿では,部分的に注釈付けされた画像から重要な人物を検出することを提案する。
提案手法では,未注釈画像の個人に対して擬似ラベルを割り当てることが反復的に学習される。
評価のために2つの大規模データセットを収集した。
論文 参考訳(メタデータ) (2020-04-16T10:09:37Z) - Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。
現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。
本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T16:29:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。