論文の概要: The Biased Journey of MSD_AUDIO.ZIP
- arxiv url: http://arxiv.org/abs/2308.16389v2
- Date: Sat, 2 Sep 2023 00:45:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-07 02:16:07.300632
- Title: The Biased Journey of MSD_AUDIO.ZIP
- Title(参考訳): MSD_AUDIO.ZIPのバイアスド・ジャーニー
- Authors: Haven Kim, Keunwoo Choi, Mateusz Modrzejewski, Cynthia C. S. Liem
- Abstract要約: Million Songデータセットへのアクセスは、ピアツーピアに接続された特定のアフィリエイト内のものに限定されている。
我々は、データにアクセスしようとしたり、その作成に関わった22人の経験から洞察を得る。
- 参考スコア(独自算出の注目度): 5.695436409400152
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The equitable distribution of academic data is crucial for ensuring equal
research opportunities, and ultimately further progress. Yet, due to the
complexity of using the API for audio data that corresponds to the Million Song
Dataset along with its misreporting (before 2016) and the discontinuation of
this API (after 2016), access to this data has become restricted to those
within certain affiliations that are connected peer-to-peer. In this paper, we
delve into this issue, drawing insights from the experiences of 22 individuals
who either attempted to access the data or played a role in its creation. With
this, we hope to initiate more critical dialogue and more thoughtful
consideration with regard to access privilege in the MIR community.
- Abstract(参考訳): 学術データの公平な分配は、研究機会の均等化、そして究極的にはさらなる進歩に不可欠である。
しかし、Million Song Datasetに対応するオーディオデータにAPIを使用することの複雑さ(2016年以前)と、このAPIの廃止(2016年以降)により、このデータへのアクセスはピアツーピアに接続された特定のアフィリエイト内のものに限定されている。
そこで本稿では,データにアクセスしようとしたか,あるいはその作成に役割を果たした22人の個人の経験から,この問題を考察する。
これにより、MIRコミュニティにおけるアクセス権限に関して、より批判的な対話とより思慮深い考察を開始したいと思っています。
関連論文リスト
- How to Drill Into Silos: Creating a Free-to-Use Dataset of Data Subject Access Packages [0.0]
欧州連合(EU)の一般データ保護規則は、個人データへのアクセス権を強化した。
コントローラが提供する被写体アクセス要求パッケージ(SARP)を実際に使用する可能性は非常に制限されている。
このデータセットは一般に提供され、将来、SARPの実用化に向けた新しいアプローチの研究および比較の出発点として機能する。
論文 参考訳(メタデータ) (2024-07-05T12:39:51Z) - Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - Data Acquisition: A New Frontier in Data-centric AI [65.90972015426274]
まず、現在のデータマーケットプレースを調査し、データセットに関する詳細な情報を提供するプラットフォームが不足していることを明らかにする。
次に、データプロバイダと取得者間のインタラクションをモデル化するベンチマークであるDAMチャレンジを紹介します。
提案手法の評価は,機械学習における効果的なデータ取得戦略の必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2023-11-22T22:15:17Z) - Assessing Scientific Contributions in Data Sharing Spaces [64.16762375635842]
本稿では、研究者の科学的貢献を測定するブロックチェーンベースのメトリクスであるSCIENCE-indexを紹介する。
研究者にデータ共有のインセンティブを与えるため、SCIENCE-indexはデータ共有パラメータを含むように拡張されている。
本モデルは, 地理的に多様な研究者の出力分布とh-indexの分布を比較して評価する。
論文 参考訳(メタデータ) (2023-03-18T19:17:47Z) - Contributing to Accessibility Datasets: Reflections on Sharing Study
Data by Blind People [14.625384963263327]
13人の盲目の被験者がデータ収集活動に従事している2つの研究結果を示す。
リスク・ベネフィットのトレードオフを評価する際に、異なる要因が被験者の学習データ共有意欲にどのような影響を及ぼすかを確認する。
大多数は、技術改善のためにデータの共有をサポートしますが、商用利用、関連するメタデータ、およびデータの影響に関する透明性の欠如に対する懸念を表明しています。
論文 参考訳(メタデータ) (2023-03-09T00:42:18Z) - Algorithmic Fairness Datasets: the Story so Far [68.45921483094705]
データ駆動アルゴリズムは、人々の幸福に直接影響し、批判的な決定をサポートするために、さまざまな領域で研究されている。
研究者のコミュニティは、既存のアルゴリズムの株式を調査し、新しいアルゴリズムを提案し、歴史的に不利な人口に対する自動意思決定のリスクと機会の理解を深めてきた。
公正な機械学習の進歩はデータに基づいており、適切に文書化された場合にのみ適切に使用できる。
残念なことに、アルゴリズムフェアネスコミュニティは、特定のリソース(オパシティ)に関する情報の不足と利用可能な情報の分散(スパーシティ)によって引き起こされる、集合的なデータドキュメント負債に悩まされている。
論文 参考訳(メタデータ) (2022-02-03T17:25:46Z) - Yes-Yes-Yes: Donation-based Peer Reviewing Data Collection for ACL
Rolling Review and Beyond [58.71736531356398]
本稿では、ピアレビューデータについて詳細な議論を行い、ピアレビューデータ収集のための倫理的・法的デシダータの概要を述べるとともに、最初の継続的な寄付ベースのデータ収集ワークフローを提案する。
本稿では、ACL Rolling Reviewにおいて、このワークフローの現在進行中の実装について報告し、新たに収集したデータから得られた最初の洞察を提供する。
論文 参考訳(メタデータ) (2022-01-27T11:02:43Z) - Retiring Adult: New Datasets for Fair Machine Learning [47.27417042497261]
UCIアダルトは、多くのアルゴリズム的公正な介入の開発と比較の基礎として機能している。
UCIアダルトデータのスーパーセットを米国国勢調査資料から再構築し、その外部妥当性を制限するUCIアダルトデータセットの慣用性を明らかにする。
私たちの主な貢献は、公正な機械学習の研究のために既存のデータエコシステムを拡張する、一連の新しいデータセットです。
論文 参考訳(メタデータ) (2021-08-10T19:19:41Z) - Digital trace data collection through data donation [0.4499833362998487]
EUの一般データ保護規則(General Data Protection Regulation: 2018)第15条では、個人が個人データへの電子的アクセスを義務付けている。
主要なデジタルプラットフォームはすべて,ユーザによる“データダウンロードパッケージ(DDP)”の法律に準拠している。
公共機関や民間機関が収集したすべてのデータを通じて、市民のデジタル生活を入手し、分析して社会科学的疑問に答えることができる。
DDPを用いたデジタルトレースデータ収集のための青写真を提供し、そのようなプロジェクトのための「Total error framework」を考案する。
論文 参考訳(メタデータ) (2020-11-13T11:19:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。