論文の概要: The Dimensions of Data Labor: A Road Map for Researchers, Activists, and
Policymakers to Empower Data Producers
- arxiv url: http://arxiv.org/abs/2305.13238v1
- Date: Mon, 22 May 2023 17:11:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-23 14:08:08.357087
- Title: The Dimensions of Data Labor: A Road Map for Researchers, Activists, and
Policymakers to Empower Data Producers
- Title(参考訳): データ労働の次元:データ生産者を支援する研究者、活動家、政策立案者のためのロードマップ
- Authors: Hanlin Li, Nicholas Vincent, Stevie Chancellor, Brent Hecht
- Abstract要約: データプロデューサは、取得したデータ、使用方法、あるいはそのメリットについてはほとんど言及していません。
このデータにアクセスし、処理する能力を持つ組織、例えばOpenAIやGoogleは、テクノロジーのランドスケープを形成する上で大きな力を持っている。
研究者,政策立案者,活動家がデータ生産者に力を与える機会を概説する。
- 参考スコア(独自算出の注目度): 14.392208044851976
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Many recent technological advances (e.g. ChatGPT and search engines) are
possible only because of massive amounts of user-generated data produced
through user interactions with computing systems or scraped from the web (e.g.
behavior logs, user-generated content, and artwork). However, data producers
have little say in what data is captured, how it is used, or who it benefits.
Organizations with the ability to access and process this data, e.g. OpenAI and
Google, possess immense power in shaping the technology landscape. By
synthesizing related literature that reconceptualizes the production of data
for computing as ``data labor'', we outline opportunities for researchers,
policymakers, and activists to empower data producers in their relationship
with tech companies, e.g advocating for transparency about data reuse, creating
feedback channels between data producers and companies, and potentially
developing mechanisms to share data's revenue more broadly. In doing so, we
characterize data labor with six important dimensions - legibility, end-use
awareness, collaboration requirement, openness, replaceability, and livelihood
overlap - based on the parallels between data labor and various other types of
labor in the computing literature.
- Abstract(参考訳): 最近の技術進歩(例えばChatGPTや検索エンジン)は、コンピュータシステムとのユーザインタラクションによって生成される大量のユーザ生成データや、Webから取り除かれた(例えば、振る舞いログ、ユーザ生成コンテンツ、アートワーク)ためにのみ可能である。
しかしながら、データプロデューサは、取得したデータ、使用方法、あるいはそのメリットについてはほとんど言及していない。
このデータにアクセスして処理する能力を持つ組織、例えばOpenAIやGoogleは、テクノロジーの展望を形成する上で大きな力を持っている。
計算用データ生産を「データ労働」として再認識する関連文献を合成することにより、研究者、政策立案者、活動家が、データ再利用に関する透明性の提唱、データ生産者と企業間のフィードバックチャネルの作成、データ収益をより広く共有するためのメカニズムの開発など、テック企業との関係においてデータ生産者を強化する機会を概説する。
その際、データ労働と計算文学における様々な種類の労働の並列性に基づいて、正当性、エンドユース意識、コラボレーション要件、オープン性、置き換え可能性、生活の重複といった、6つの重要な次元でデータ労働を特徴付ける。
関連論文リスト
- Efficient Data Collection for Robotic Manipulation via Compositional Generalization [70.76782930312746]
本研究では, 環境要因をデータから構成し, 未確認の要因の組み合わせに遭遇した場合に成功できることを示す。
コンポジションを利用したドメイン内データ収集手法を提案する。
ビデオはhttp://iliad.stanford.edu/robot-data-comp/で公開しています。
論文 参考訳(メタデータ) (2024-03-08T07:15:38Z) - From Data Creator to Data Reuser: Distance Matters [0.847136673632881]
オープンサイエンスの政策は再利用よりもデータ共有に重点を置いている。
データ再利用の価値は、クリエータと再利用者の関係にあります。
我々は,データ作成者とデータ再使用者の間の距離の理論的構成を開発する。
論文 参考訳(メタデータ) (2024-02-05T18:16:04Z) - Privacy-Preserving Graph Machine Learning from Data to Computation: A
Survey [67.7834898542701]
我々は,グラフ機械学習のプライバシ保護手法の見直しに重点を置いている。
まずプライバシ保護グラフデータを生成する方法を検討する。
次に,プライバシ保護情報を送信する方法について述べる。
論文 参考訳(メタデータ) (2023-07-10T04:30:23Z) - Beyond Privacy: Navigating the Opportunities and Challenges of Synthetic
Data [91.52783572568214]
合成データは、機械学習の世界において支配的な力となり、データセットを個々のニーズに合わせて調整できる未来を約束する。
合成データのより広範な妥当性と適用のために,コミュニティが克服すべき根本的な課題について論じる。
論文 参考訳(メタデータ) (2023-04-07T16:38:40Z) - Synthetic-to-Real Domain Adaptation for Action Recognition: A Dataset and Baseline Performances [76.34037366117234]
ロボット制御ジェスチャー(RoCoG-v2)と呼ばれる新しいデータセットを導入する。
データセットは7つのジェスチャークラスの実ビデオと合成ビデオの両方で構成されている。
我々は,最先端の行動認識とドメイン適応アルゴリズムを用いて結果を示す。
論文 参考訳(メタデータ) (2023-03-17T23:23:55Z) - Machine Learning for Synthetic Data Generation: A Review [23.073056971997715]
本稿では,合成データの生成を目的とした機械学習モデルを用いた既存研究についてレビューする。
このレビューは、合成データ生成、コンピュータビジョン、スピーチ、自然言語処理、ヘルスケア、ビジネスドメインの応用から始まる様々な視点を網羅している。
この論文は、合成データ生成に関するプライバシーと公平性に関する重要な側面についても論じている。
論文 参考訳(メタデータ) (2023-02-08T13:59:31Z) - Privacy-Preserving Machine Learning for Collaborative Data Sharing via
Auto-encoder Latent Space Embeddings [57.45332961252628]
データ共有プロセスにおけるプライバシ保護機械学習は、極めて重要なタスクである。
本稿では、オートエンコーダによる表現学習を用いて、プライバシーを保護した組込みデータを生成する革新的なフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-10T17:36:58Z) - The Role of Cross-Silo Federated Learning in Facilitating Data Sharing
in the Agri-Food Sector [5.219568203653523]
データ共有は、アグリフード分野における新興AI技術の採用に関して、依然として大きな障害となっている。
分散データを用いたフェデレーション学習に基づく技術ソリューションを提案する。
我々の手法は、個々のデータソースでトレーニングされた各モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-14T16:00:28Z) - Data Leverage: A Framework for Empowering the Public in its Relationship
with Technology Companies [13.174512123890015]
多くの強力なコンピューティング技術は、一般からの暗黙的かつ明示的なデータコントリビューションに依存している。
この依存は、テクノロジー企業との関係において、公衆にとって潜在的にレバレッジの源であることを示唆している。
我々は,企業行動を変える新たな機会を浮き彫りにする,データレバレッジを理解するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-12-18T00:46:26Z) - Synthetic Data: Opening the data floodgates to enable faster, more
directed development of machine learning methods [96.92041573661407]
機械学習における画期的な進歩の多くは、大量のリッチデータを利用できることに起因する。
多くの大規模データセットは、医療データなど高度に敏感であり、機械学習コミュニティでは広く利用できない。
プライバシー保証で合成データを生成することは、そのようなソリューションを提供します。
論文 参考訳(メタデータ) (2020-12-08T17:26:10Z) - From Data to Knowledge to Action: A Global Enabler for the 21st Century [26.32590947516587]
コンピュータと数理科学の進歩が相まって、真の証拠に基づく意思決定を可能にする前例のない能力がもたらされた。
これらの機能は、データの大規模なキャプチャと、そのデータの洞察とレコメンデーションへの変換を可能にする。
商業、科学、教育、芸術、エンターテイメントのWebへの移行により、人間の活動に関する構造化された、非構造化されたデータベースが、これまで例のない量で利用可能になった。
論文 参考訳(メタデータ) (2020-07-31T19:19:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。