論文の概要: Strategic Behavior and AI Training Data
- arxiv url: http://arxiv.org/abs/2404.18445v1
- Date: Mon, 29 Apr 2024 06:00:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-30 14:36:46.032865
- Title: Strategic Behavior and AI Training Data
- Title(参考訳): 戦略的行動とAIトレーニングデータ
- Authors: Christian Peukert, Florian Abeillon, Jérémie Haese, Franziska Kaiser, Alexander Staub,
- Abstract要約: 著者たちがAIのトレーニングデータになったときの行動変化について検討する。
Unsplashは人気の高い画像プラットフォームで、600万枚の高品質の写真やイラストが載っている。
我々はコントリビュータの反応を調査し、このデータセットに作品が含まれているコントリビュータと、その作品が含まれていないコントリビュータを比較した。
- 参考スコア(独自算出の注目度): 40.68270792140993
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human-created works represent critical data inputs to artificial intelligence (AI). Strategic behavior can play a major role for AI training datasets, be it in limiting access to existing works or in deciding which types of new works to create or whether to create new works at all. We examine creators' behavioral change when their works become training data for AI. Specifically, we focus on contributors on Unsplash, a popular stock image platform with about 6 million high-quality photos and illustrations. In the summer of 2020, Unsplash launched an AI research program by releasing a dataset of 25,000 images for commercial use. We study contributors' reactions, comparing contributors whose works were included in this dataset to contributors whose works were not included. Our results suggest that treated contributors left the platform at a higher-than-usual rate and substantially slowed down the rate of new uploads. Professional and more successful photographers react stronger than amateurs and less successful photographers. We also show that affected users changed the variety and novelty of contributions to the platform, with long-run implications for the stock of works potentially available for AI training. Taken together, our findings highlight the trade-off between interests of rightsholders and promoting innovation at the technological frontier. We discuss implications for copyright and AI policy.
- Abstract(参考訳): 人間による作品は、人工知能(AI)への重要なデータ入力を表す。
ストラテジックな振る舞いは、AIトレーニングデータセットにおいて、既存の作品へのアクセスを制限することや、どのタイプの新しい作品を作成するか、あるいは新しい作品を作るかどうかを決めることなど、大きな役割を果たす可能性がある。
著者たちがAIのトレーニングデータになったときの行動変化について検討する。
具体的には、人気の高いストック画像プラットフォームUnsplashのコントリビューターに焦点を合わせ、600万枚の高品質の写真とイラストを提供している。
2020年夏、Unsplashは商用利用のために25,000枚の画像のデータセットをリリースし、AI研究プログラムを開始した。
我々はコントリビュータの反応を調査し、このデータセットに作品が含まれているコントリビュータと、その作品が含まれていないコントリビュータを比較した。
以上の結果から,治療を受けたコントリビュータがプラットフォームを離れ,新たなアップロード率を大幅に低下させたことが示唆された。
プロでより成功した写真家は、アマチュアやあまり成功しない写真家よりも強く反応する。
また、影響を受けたユーザがプラットフォームへのコントリビューションの多様性とノベルティを変更したことも示しています。
この結果から,技術フロンティアにおける権利保有者の利益とイノベーションの促進とのトレードオフが浮き彫りになった。
著作権とAI政策の意義について論じる。
関連論文リスト
- The Influence of Generative AI on Content Platforms: Supply, Demand, and Welfare Impacts in Two-Sided Markets [3.4039202831583903]
本稿では、生成的人工知能が、人間とAIの両方がコンテンツを生成するオンラインプラットフォームにどのように影響するかを考察する。
我々は、生産的AIが供給と需要をどのように変化させ、交通分布に影響を与え、社会福祉に影響を及ぼすかを理解するためのモデルを開発する。
論文 参考訳(メタデータ) (2024-10-17T00:14:12Z) - Towards the Terminator Economy: Assessing Job Exposure to AI through LLMs [10.844598404826355]
米国の雇用の3分の1はAIに強く依存している。
この露出は、2019年から2023年までの雇用と賃金の伸びと正の相関関係にある。
論文 参考訳(メタデータ) (2024-07-27T08:14:18Z) - Now, Later, and Lasting: Ten Priorities for AI Research, Policy, and Practice [63.20307830884542]
今後数十年は、産業革命に匹敵する人類の転換点になるかもしれない。
10年前に立ち上げられたこのプロジェクトは、複数の専門分野の専門家による永続的な研究にコミットしている。
AI技術の短期的および長期的影響の両方に対処する、アクションのための10のレコメンデーションを提供します。
論文 参考訳(メタデータ) (2024-04-06T22:18:31Z) - AI-Generated Images as Data Source: The Dawn of Synthetic Era [61.879821573066216]
生成AIは、現実世界の写真によく似た合成画像を作成する可能性を解き放った。
本稿では、これらのAI生成画像を新しいデータソースとして活用するという革新的な概念を探求する。
実際のデータとは対照的に、AI生成データには、未整合のアブリダンスやスケーラビリティなど、大きなメリットがある。
論文 参考訳(メタデータ) (2023-10-03T06:55:19Z) - The Glamorisation of Unpaid Labour: AI and its Influencers [0.0]
デジタルバリューネットワーク(DVN)は、アフリカ、ラテンアメリカ、インドの労働者に不釣り合いに影響を及ぼす。
我々は、ギグワークプラットフォームによるヒューマン・インテリジェンス・タスク(HIT)の自動化と、ソーシャルメディアにおけるインフルエンサーを活用したデータ収集の資本化について論じる。
論文 参考訳(メタデータ) (2023-07-31T06:44:25Z) - Identifying Professional Photographers Through Image Quality and
Aesthetics in Flickr [0.0]
本研究では,写真とビデオの共有プラットフォームに適切なデータセットが存在しないことを明らかにする。
我々は、オープンソースのマルチモーダルデータを用いて、Flickrで最大のラベル付きデータセットの1つを作成しました。
画像の審美性と技術的品質と,その画像の社会的活動との関係について検討した。
論文 参考訳(メタデータ) (2023-07-04T14:55:37Z) - Seeing is not always believing: Benchmarking Human and Model Perception
of AI-Generated Images [66.20578637253831]
人工知能(AI)技術の進歩が偽写真を生み出すのではないかという懸念が高まっている。
本研究の目的は、最先端のAI生成視覚コンテンツを識別するためのエージェントを包括的に評価することである。
論文 参考訳(メタデータ) (2023-04-25T17:51:59Z) - Why is AI not a Panacea for Data Workers? An Interview Study on Human-AI
Collaboration in Data Storytelling [59.08591308749448]
業界と学界の18人のデータワーカーにインタビューして、AIとのコラボレーションの場所と方法を聞いた。
驚いたことに、参加者はAIとのコラボレーションに興奮を見せたが、彼らの多くは反感を表明し、曖昧な理由を指摘した。
論文 参考訳(メタデータ) (2023-04-17T15:30:05Z) - The MineRL BASALT Competition on Learning from Human Feedback [58.17897225617566]
MineRL BASALTコンペティションは、この重要な種類の技術の研究を促進することを目的としている。
Minecraftでは、ハードコードされた報酬関数を書くのが難しいと期待する4つのタスクのスイートを設計しています。
これら4つのタスクのそれぞれについて、人間のデモのデータセットを提供するとともに、模擬学習ベースラインを提供する。
論文 参考訳(メタデータ) (2021-07-05T12:18:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。