論文の概要: Between Subjectivity and Imposition: Power Dynamics in Data Annotation
for Computer Vision
- arxiv url: http://arxiv.org/abs/2007.14886v2
- Date: Thu, 30 Jul 2020 11:03:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-05 20:09:08.855263
- Title: Between Subjectivity and Imposition: Power Dynamics in Data Annotation
for Computer Vision
- Title(参考訳): 主観性と意味:コンピュータビジョンのためのデータアノテーションにおけるパワーダイナミクス
- Authors: Milagros Miceli and Martin Schuessler and Tianling Yang
- Abstract要約: 本稿では,産業的文脈における画像データアノテーションの実践について検討する。
我々は、アノテータがラベルを使ってデータに意味を割り当てる、センスメイキングの実践としてデータアノテーションを定義します。
- 参考スコア(独自算出の注目度): 1.933681537640272
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The interpretation of data is fundamental to machine learning. This paper
investigates practices of image data annotation as performed in industrial
contexts. We define data annotation as a sense-making practice, where
annotators assign meaning to data through the use of labels. Previous
human-centered investigations have largely focused on annotators subjectivity
as a major cause for biased labels. We propose a wider view on this issue:
guided by constructivist grounded theory, we conducted several weeks of
fieldwork at two annotation companies. We analyzed which structures, power
relations, and naturalized impositions shape the interpretation of data. Our
results show that the work of annotators is profoundly informed by the
interests, values, and priorities of other actors above their station.
Arbitrary classifications are vertically imposed on annotators, and through
them, on data. This imposition is largely naturalized. Assigning meaning to
data is often presented as a technical matter. This paper shows it is, in fact,
an exercise of power with multiple implications for individuals and society.
- Abstract(参考訳): データの解釈は機械学習の基本である。
本稿では,産業における画像データアノテーションの実践について検討する。
私たちはデータアノテーションをセンスメイキングのプラクティスとして定義し、アノテーションはラベルを使ってデータに意味を割り当てる。
従来の人間中心の調査は、主にバイアスラベルの主要な原因としてアノテーターの主観性に焦点を当てていた。
構成主義的接地理論に導かれ、我々は2つのアノテーション会社で数週間のフィールドワークを行った。
データの解釈を形作る構造, 電力関係, 自然化配置を解析した。
その結果,アノテータの作業は,ステーション上の他のアクターの関心,価値観,優先順位に深く影響されていることがわかった。
任意分類は、データに対してアノテータ、およびそれらを通して垂直に課される。
主に自然化されている。
データに意味を割り当てることは、しばしば技術的な問題として提示される。
本稿は,実のところ,個人や社会に重きを置く力の行使であることを示している。
関連論文リスト
- Discipline and Label: A WEIRD Genealogy and Social Theory of Data
Annotation [11.48611587310938]
データアノテーションは、マシンラーニングやAIとは相変わらず無関係だ。
近年の実証研究は、公正性に対するレーダ多様性の重要性、モデル性能、ラベルに対するアノテータの主観性の役割を強調している。
本稿では,その心理的・知覚的側面から,データアノテーションの批判的系譜を概説する。
論文 参考訳(メタデータ) (2024-02-09T22:21:55Z) - Same or Different? Diff-Vectors for Authorship Analysis [78.83284164605473]
古典的な著作物分析において、特徴ベクトルは文書を表し、特徴の値は文書中の特徴の相対周波数(関数の増大)を表し、クラスラベルは文書の著者を表す。
筆者らの実験は共著者検証,著者検証,クローズドセットの著者帰属に取り組んでおり,DVは自然に第1の問題を解くのに向いているが,第2と第3の問題を解くための2つの新しい方法も提供している。
論文 参考訳(メタデータ) (2023-01-24T08:48:12Z) - Improving Fairness in Large-Scale Object Recognition by CrowdSourced
Demographic Information [7.968124582214686]
機械学習データセットでオブジェクトをかなり表現することは、特定の文化に対するバイアスの少ないモデルにつながるだろう。
コントリビュータの人口構成をクラウドソーシングした,シンプルで汎用的なアプローチを提案する。
既存のデータセットと比較して、より公平な世界カバレッジをもたらす分析結果を提示します。
論文 参考訳(メタデータ) (2022-06-02T22:55:10Z) - Whose AI Dream? In search of the aspiration in data annotation [12.454034525520497]
本稿では,インドにおける産業におけるデータアノテーションに関する業務実践について検討する。
以前の調査では、アノテータの主観性、偏見、効率性に主に焦点が当てられていた。
その結果,アノテータの作業は,ステーション上の他者の関心や優先順位,価値観によって決定されることがわかった。
論文 参考訳(メタデータ) (2022-03-21T06:28:54Z) - Studying Up Machine Learning Data: Why Talk About Bias When We Mean
Power? [0.0]
我々は、社会的問題を「バイアス」に減らすことは、文脈に基づくデータの性質を損なうと論じている。
MLデータセットを形作るデータワーカーの労働にかかわる企業力と市場衝動に注目します。
論文 参考訳(メタデータ) (2021-09-16T17:38:26Z) - Towards Measuring Bias in Image Classification [61.802949761385]
畳み込みニューラルネットワーク(CNN)は、主要なコンピュータビジョンタスクの最先端技術となっている。
しかし、複雑な構造のため、その決定は産業世界の何らかの文脈での使用を制限するかを理解することは困難である。
帰属マップによるデータのバイアスを明らかにするための体系的なアプローチを提案する。
論文 参考訳(メタデータ) (2021-07-01T10:50:39Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - REVISE: A Tool for Measuring and Mitigating Bias in Visual Datasets [64.76453161039973]
REVISE(Revealing VIsual biaSEs)は、視覚的データセットの調査を支援するツールである。
1)オブジェクトベース,(2)個人ベース,(3)地理ベースという3つの次元に沿った潜在的なバイアスを呈示する。
論文 参考訳(メタデータ) (2020-04-16T23:54:37Z) - A Philosophy of Data [91.3755431537592]
我々は、統計計算に必要な基本特性から統計データの定義まで研究する。
我々は、有用なデータの必要性は、プロパティを根本的にユニークか等しく理解することを規則化する必要があると論じている。
データとデータ技術への依存度が高まるにつれて、この2つの特徴は現実の集合概念に影響を与えます。
論文 参考訳(メタデータ) (2020-04-15T14:47:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。