論文の概要: Global Inequalities in the Production of Artificial Intelligence: A Four-Country Study on Data Work
- arxiv url: http://arxiv.org/abs/2410.14230v1
- Date: Fri, 18 Oct 2024 07:23:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-21 14:26:13.380538
- Title: Global Inequalities in the Production of Artificial Intelligence: A Four-Country Study on Data Work
- Title(参考訳): 人工知能生産における世界的不平等--データ作業に関する4カウンタの研究
- Authors: Antonio A. Casilli, Paola Tubaro, Maxime Cornet, Clément Le Ludec, Juana Torres-Cierpe, Matheus Viana Braz,
- Abstract要約: 労働力は人工知能の発展において大きな役割を担っているが、ほとんど認識されていない。
オンラインプラットフォームと下請け業者のネットワークは、AI生産の影の中でタスクを実行するためにデータワーカーを募集する。
本研究は、ベネズエラ、ブラジル、マダガスカル、フランスの富裕国における労働条件とデータ労働者のプロフィールを比較して、結果として生じる複雑さを明らかにする。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Labor plays a major, albeit largely unrecognized role in the development of artificial intelligence. Machine learning algorithms are predicated on data-intensive processes that rely on humans to execute repetitive and difficult-to-automate, but no less essential, tasks such as labeling images, sorting items in lists, recording voice samples, and transcribing audio files. Online platforms and networks of subcontractors recruit data workers to execute such tasks in the shadow of AI production, often in lower-income countries with long-standing traditions of informality and lessregulated labor markets. This study unveils the resulting complexities by comparing the working conditions and the profiles of data workers in Venezuela, Brazil, Madagascar, and as an example of a richer country, France. By leveraging original data collected over the years 2018-2023 via a mixed-method design, we highlight how the cross-country supply chains that link data workers to core AI production sites are reminiscent of colonial relationships, maintain historical economic dependencies, and generate inequalities that compound with those inherited from the past. The results also point to the importance of less-researched, non-English speaking countries to understand key features of the production of AI solutions at planetary scale.
- Abstract(参考訳): 労働力は人工知能の発展において大きな役割を担っているが、ほとんど認識されていない。
機械学習アルゴリズムは、人間に依存するデータ集約プロセスに基づいて、反復的で自動化が難しいが、画像のラベル付け、リスト内のアイテムのソート、音声サンプルの記録、オーディオファイルの書き起こしといったタスクが必須である。
オンラインプラットフォームと下請け業者のネットワークは、AI生産の影の中でそのようなタスクを実行するためにデータワーカーを募集している。
本研究は、ベネズエラ、ブラジル、マダガスカル、フランスの富裕国における労働条件とデータ労働者のプロフィールを比較して、結果として生じる複雑さを明らかにした。
2018年から2023年にかけて収集されたオリジナルデータを混合メソッド設計を通じて活用することにより、データワーカーとコアAI生産サイトをリンクするクロスカントリーサプライチェーンが、植民地的関係を思い出し、歴史的経済的依存関係を維持し、過去から受け継いだものと混同する不平等を生成する方法について強調する。
この結果は、あまり研究されていない非英語圏の国々が、惑星スケールでのAIソリューション生産の重要な特徴を理解することが重要であることも示唆している。
関連論文リスト
- Towards the Terminator Economy: Assessing Job Exposure to AI through LLMs [10.844598404826355]
米国の雇用の3分の1はAIに強く依存している。
この露出は、2019年から2023年までの雇用と賃金の伸びと正の相関関係にある。
論文 参考訳(メタデータ) (2024-07-27T08:14:18Z) - Leveraging Data Augmentation for Process Information Extraction [0.0]
自然言語テキストデータに対するデータ拡張の適用について検討する。
データ拡張は、自然言語テキストからビジネスプロセスモデルを生成するタスクのための機械学習メソッドを実現する上で重要なコンポーネントである。
論文 参考訳(メタデータ) (2024-04-11T06:32:03Z) - STAR: Boosting Low-Resource Information Extraction by Structure-to-Text
Data Generation with Large Language Models [56.27786433792638]
STARは大規模言語モデル(LLM)を利用してデータインスタンスを合成するデータ生成手法である。
我々は、初期データインスタンスを取得するための詳細なステップバイステップ命令を設計する。
実験の結果,STARが生成したデータは,低リソースイベント抽出および関係抽出タスクの性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-05-24T12:15:19Z) - The Dimensions of Data Labor: A Road Map for Researchers, Activists, and
Policymakers to Empower Data Producers [14.392208044851976]
データプロデューサは、取得したデータ、使用方法、あるいはそのメリットについてはほとんど言及していません。
このデータにアクセスし、処理する能力を持つ組織、例えばOpenAIやGoogleは、テクノロジーのランドスケープを形成する上で大きな力を持っている。
研究者,政策立案者,活動家がデータ生産者に力を与える機会を概説する。
論文 参考訳(メタデータ) (2023-05-22T17:11:22Z) - Why is AI not a Panacea for Data Workers? An Interview Study on Human-AI
Collaboration in Data Storytelling [59.08591308749448]
業界と学界の18人のデータワーカーにインタビューして、AIとのコラボレーションの場所と方法を聞いた。
驚いたことに、参加者はAIとのコラボレーションに興奮を見せたが、彼らの多くは反感を表明し、曖昧な理由を指摘した。
論文 参考訳(メタデータ) (2023-04-17T15:30:05Z) - Human-Centric Multimodal Machine Learning: Recent Advances and Testbed
on AI-based Recruitment [66.91538273487379]
人間中心のアプローチでAIアプリケーションを開発する必要性には、ある程度のコンセンサスがある。
i)ユーティリティと社会的善、(ii)プライバシとデータ所有、(iii)透明性と説明責任、(iv)AIによる意思決定プロセスの公正性。
異種情報ソースに基づく現在のマルチモーダルアルゴリズムは、データ中の機密要素や内部バイアスによってどのように影響を受けるかを検討する。
論文 参考訳(メタデータ) (2023-02-13T16:44:44Z) - Data-centric AI: Perspectives and Challenges [51.70828802140165]
データ中心AI(DCAI)は、モデル進歩からデータ品質と信頼性の確保への根本的なシフトを提唱している。
データ開発、推論データ開発、データメンテナンスの3つの一般的なミッションをまとめます。
論文 参考訳(メタデータ) (2023-01-12T05:28:59Z) - Privacy Adhering Machine Un-learning in NLP [66.17039929803933]
現実の業界では、機械学習を使ってユーザデータに基づくモデルを構築します。
このような委任事項には、データだけでなく、モデルの再トレーニングにも労力が要る。
データの継続的な削除と モデル再訓練のステップはスケールしません
この課題に対処するために、textitMachine Unlearningを提案する。
論文 参考訳(メタデータ) (2022-12-19T16:06:45Z) - Deep Learning based pipeline for anomaly detection and quality
enhancement in industrial binder jetting processes [68.8204255655161]
異常検出は、通常の値空間とは異なる異常状態、インスタンス、あるいはデータポイントを検出する方法を記述する。
本稿では,産業生産における人工知能へのデータ中心のアプローチに寄与する。
論文 参考訳(メタデータ) (2022-09-21T08:14:34Z) - The Data-Production Dispositif [0.0]
本稿では,ベネズエラの3つのプラットフォームとアルゼンチンのBPOを調査し,ラテンアメリカにおける機械学習データワークのアウトソースについて検討する。
我々は、データ生産の処分を、データと労働の力と知識の関係を(再)生み出すために戦略的に配置された言論、行動、対象の集合として定義するために、フーカウルディアンの処分の概念に頼っている。
我々は、疎外化や先制化と戦ってデータ生産不備に対処することの重要性を強調し、データ労働者が高品質なデータを求めて資産になるよう促すことで、結論付ける。
論文 参考訳(メタデータ) (2022-05-24T10:51:05Z) - DataOps for Societal Intelligence: a Data Pipeline for Labor Market
Skills Extraction and Matching [5.842787579447653]
データOpsモデルを用いて,この問題を定式化し,解決する。
そして、履歴書からスキルを抽出する重要なタスクに焦点を合わせます。
実データに応用機械学習を適用した予備結果を示す。
論文 参考訳(メタデータ) (2021-04-05T15:37:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。