論文の概要: Wisdom for the Crowd: Discoursive Power in Annotation Instructions for
Computer Vision
- arxiv url: http://arxiv.org/abs/2105.10990v1
- Date: Sun, 23 May 2021 18:20:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 14:59:19.533088
- Title: Wisdom for the Crowd: Discoursive Power in Annotation Instructions for
Computer Vision
- Title(参考訳): 群衆の知恵:コンピュータビジョンのためのアノテーション指導における反抗力
- Authors: Milagros Miceli and Julian Posada
- Abstract要約: 本稿ではアルゼンチンとベネズエラのデータアノテータの経験に焦点を当てる。
以上の結果から, 注視指示は, 労働者に課された世界観や, 労働力を通じて, データセットに課せられていることが示唆された。
この構成は、社会的不平等を補強しながら、パワー・アシンメトリーを永続させるコモディファイド・ワークの形式を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Developers of computer vision algorithms outsource some of the labor involved
in annotating training data through business process outsourcing companies and
crowdsourcing platforms. Many data annotators are situated in the Global South
and are considered independent contractors. This paper focuses on the
experiences of Argentinian and Venezuelan annotation workers. Through
qualitative methods, we explore the discourses encoded in the task instructions
that these workers follow to annotate computer vision datasets. Our preliminary
findings indicate that annotation instructions reflect worldviews imposed on
workers and, through their labor, on datasets. Moreover, we observe that
for-profit goals drive task instructions and that managers and algorithms make
sure annotations are done according to requesters' commands. This configuration
presents a form of commodified labor that perpetuates power asymmetries while
reinforcing social inequalities and is compelled to reproduce them into
datasets and, subsequently, in computer vision systems.
- Abstract(参考訳): コンピュータビジョンアルゴリズムの開発者は、ビジネスプロセスのアウトソーシング企業やクラウドソーシングプラットフォームを通じて、トレーニングデータをアノテートする作業の一部をアウトソーシングする。
多くのデータアノテータはグローバル・サウスにあり、独立した請負業者と見なされている。
本稿では,アルゼンチンとベネズエラのアノテーションワーカーの経験について述べる。
質的手法を通して,これらの作業者がコンピュータビジョンデータセットにアノテートするタスク命令にエンコードされた談話を調べる。
予備的な知見から, 注記指示は, 労働者に対する世界観を反映し, 労働力を通して, データセットを反映することが示唆された。
さらに,営利目的がタスク命令を駆動し,管理者やアルゴリズムが要求者の指示に従ってアノテーションを確実に実行することを観察する。
この構成は、社会的不平等を補強しながらパワー非対称性を持続させ、それらをデータセットに再生し、その後コンピュータビジョンシステムで再現するコモディファイド・ワークの形式である。
関連論文リスト
- Global Inequalities in the Production of Artificial Intelligence: A Four-Country Study on Data Work [0.0]
労働力は人工知能の発展において大きな役割を担っているが、ほとんど認識されていない。
オンラインプラットフォームと下請け業者のネットワークは、AI生産の影の中でタスクを実行するためにデータワーカーを募集する。
本研究は、ベネズエラ、ブラジル、マダガスカル、フランスの富裕国における労働条件とデータ労働者のプロフィールを比較して、結果として生じる複雑さを明らかにする。
論文 参考訳(メタデータ) (2024-10-18T07:23:17Z) - From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation Models [98.41645229835493]
グラフ形式のデータの可視化は、データ分析において重要な役割を担い、重要な洞察を提供し、情報的な意思決定を支援する。
大規模言語モデルのような大規模な基盤モデルは、様々な自然言語処理タスクに革命をもたらした。
本研究は,自然言語処理,コンピュータビジョン,データ解析の分野における研究者や実践者の包括的資源として機能する。
論文 参考訳(メタデータ) (2024-03-18T17:57:09Z) - Vision-Language Models Provide Promptable Representations for Reinforcement Learning [67.40524195671479]
視覚言語モデル(VLM)に符号化された多量の一般知識と索引可能な世界知識をインターネット規模で事前学習して具体的強化学習(RL)を行う新しい手法を提案する。
提案手法では,共通意味的推論の表現にチェーン・オブ・シントを用いることで,新規シーンのポリシー性能を1.5倍向上できることを示す。
論文 参考訳(メタデータ) (2024-02-05T00:48:56Z) - InstructCV: Instruction-Tuned Text-to-Image Diffusion Models as Vision Generalists [66.85125112199898]
我々は,タスク固有の設計選択を抽象化する,コンピュータビジョンタスクのための統一言語インタフェースを開発する。
InstructCVと呼ばれる我々のモデルは、他のジェネラリストやタスク固有の視覚モデルと比較して競合的に機能する。
論文 参考訳(メタデータ) (2023-09-30T14:26:43Z) - What and How of Machine Learning Transparency: Building Bespoke
Explainability Tools with Interoperable Algorithmic Components [77.87794937143511]
本稿では,データ駆動予測モデルを説明するためのハンズオントレーニング教材について紹介する。
これらのリソースは、解釈可能な表現合成、データサンプリング、説明生成の3つのコアビルディングブロックをカバーする。
論文 参考訳(メタデータ) (2022-09-08T13:33:25Z) - The Data-Production Dispositif [0.0]
本稿では,ベネズエラの3つのプラットフォームとアルゼンチンのBPOを調査し,ラテンアメリカにおける機械学習データワークのアウトソースについて検討する。
我々は、データ生産の処分を、データと労働の力と知識の関係を(再)生み出すために戦略的に配置された言論、行動、対象の集合として定義するために、フーカウルディアンの処分の概念に頼っている。
我々は、疎外化や先制化と戦ってデータ生産不備に対処することの重要性を強調し、データ労働者が高品質なデータを求めて資産になるよう促すことで、結論付ける。
論文 参考訳(メタデータ) (2022-05-24T10:51:05Z) - Re-Examining Human Annotations for Interpretable NLP [80.81532239566992]
我々は、Interpretable NLPで広く使われている2つのデータセット上で、クラウドソースのウェブサイトを用いて制御実験を行う。
我々は,異なる資格レベルを満たす人材の募集から得られた注釈結果を比較した。
以上の結果から,アノテーションの品質は労働者の資格に高い影響を受けており,労働者は指示によって特定のアノテーションを提供するように指導することができることがわかった。
論文 参考訳(メタデータ) (2022-04-10T02:27:30Z) - Do Datasets Have Politics? Disciplinary Values in Computer Vision
Dataset Development [6.182409582844314]
約500のコンピュータビジョンデータセットのコーパスを収集し、そこから異なるビジョンタスクで114のデータセットパブリッシュをサンプリングしました。
我々は、コンピュータビジョンデータセットの著者が、ケアを犠牲にして効率をどのように評価するか、コンテキストを犠牲にして普遍性、データ作業を犠牲にしてモデルワークをいかに評価するかについて議論する。
私たちは、沈黙された値をデータセットの生成とキュレーションプロセスにどのように組み込むか、という提案で締めくくります。
論文 参考訳(メタデータ) (2021-08-09T19:07:58Z) - Reinforcement Learning, Bit by Bit [27.66567077899924]
強化学習エージェントはシミュレーション環境において顕著な成果を示した。
データ効率は、この成功を現実の環境に運ぶ上で障害となる。
我々は、原則化されたガイダンスを提供する概念と後悔の分析について議論する。
論文 参考訳(メタデータ) (2021-03-06T06:37:46Z) - Reasoning over Vision and Language: Exploring the Benefits of
Supplemental Knowledge [59.87823082513752]
本稿では,汎用知識基盤(KB)から視覚言語変換器への知識の注入について検討する。
我々は複数のタスクやベンチマークに対する様々なkbの関連性を実証的に研究する。
この技術はモデルに依存しず、最小限の計算オーバーヘッドで任意の視覚言語変換器の適用可能性を拡張することができる。
論文 参考訳(メタデータ) (2021-01-15T08:37:55Z) - Bringing the People Back In: Contesting Benchmark Machine Learning
Datasets [11.00769651520502]
機械学習データの系譜である研究プログラムを概説し、これらのデータセットの作成方法と理由について検討する。
機械学習におけるベンチマークデータセットを基盤として運用する方法を解説し、これらのデータセットについて4つの研究課題を提起する。
論文 参考訳(メタデータ) (2020-07-14T23:22:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。