論文の概要: Augmented Datasheets for Speech Datasets and Ethical Decision-Making
- arxiv url: http://arxiv.org/abs/2305.04672v1
- Date: Mon, 8 May 2023 12:49:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-09 14:30:40.620593
- Title: Augmented Datasheets for Speech Datasets and Ethical Decision-Making
- Title(参考訳): 音声データセットと倫理的意思決定のための拡張データシート
- Authors: Orestis Papakyriakopoulos, Anna Seo Gyeong Choi, Jerone Andrews,
Rebecca Bourke, William Thong, Dora Zhao, Alice Xiang, Allison Koenecke
- Abstract要約: 音声データセットは音声言語技術(SLT)の訓練に不可欠である
基礎となるトレーニングデータの多様性の欠如は、公平で堅牢なSLT製品を構築する上で、深刻な制限につながる可能性がある。
このようなデータ収集の倫理に関して、基礎となるトレーニングデータに対する監視の欠如がしばしばある。
- 参考スコア(独自算出の注目度): 2.7106766103546236
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Speech datasets are crucial for training Speech Language Technologies (SLT);
however, the lack of diversity of the underlying training data can lead to
serious limitations in building equitable and robust SLT products, especially
along dimensions of language, accent, dialect, variety, and speech impairment -
and the intersectionality of speech features with socioeconomic and demographic
features. Furthermore, there is often a lack of oversight on the underlying
training data - commonly built on massive web-crawling and/or publicly
available speech - with regard to the ethics of such data collection. To
encourage standardized documentation of such speech data components, we
introduce an augmented datasheet for speech datasets, which can be used in
addition to "Datasheets for Datasets". We then exemplify the importance of each
question in our augmented datasheet based on in-depth literature reviews of
speech data used in domains such as machine learning, linguistics, and health.
Finally, we encourage practitioners - ranging from dataset creators to
researchers - to use our augmented datasheet to better define the scope,
properties, and limits of speech datasets, while also encouraging consideration
of data-subject protection and user community empowerment. Ethical dataset
creation is not a one-size-fits-all process, but dataset creators can use our
augmented datasheet to reflexively consider the social context of related SLT
applications and data sources in order to foster more inclusive SLT products
downstream.
- Abstract(参考訳): 音声データセットは、音声言語技術(SLT)の訓練に不可欠であるが、基礎となる訓練データの多様性の欠如は、特に言語、アクセント、方言、多様性、および音声障害の次元と、社会経済的・人口統計学的特徴による音声特徴の交叉性に深刻な制限をもたらす可能性がある。
さらに、そのようなデータ収集の倫理に関して、基礎となるトレーニングデータ(一般的には大規模なwebクローリングや一般公開された音声に基づいて構築されている)に対する監視の欠如がしばしばある。
このような音声データコンポーネントの標準化を奨励するために、音声データセット用の拡張データシートを導入し、「データセット用データシート」に加えて使用することができる。
次に、機械学習、言語学、健康といった領域で使われる音声データの詳細な文献レビューに基づいて、拡張データシートにおける各質問の重要性を例示する。
最後に、私たちは、データセットの作成者から研究者まで、実践者に対して、拡張データシートを使用して、音声データセットの範囲、プロパティ、制限をより明確に定義するように促します。
倫理的データセットの作成は、すべてに適合するプロセスではありませんが、データセットの作成者は、拡張データシートを使用して、関連するSLTアプリケーションとデータソースの社会的コンテキストを反射的に考慮し、より包括的なSLT製品を下流に育むことができます。
関連論文リスト
- SER_AMPEL: a multi-source dataset for speech emotion recognition of
Italian older adults [58.49386651361823]
SER_AMPELは、音声感情認識のためのマルチソースデータセットである。
イタリア人の高齢者の場合、音声による感情認識の基準を提供する目的で収集される。
このようなデータセットの必要性の証拠は、技術の現状の分析から生まれる。
論文 参考訳(メタデータ) (2023-11-24T13:47:25Z) - When a Language Question Is at Stake. A Revisited Approach to Label
Sensitive Content [0.0]
記事では、ロシアとウクライナの戦争を取り上げたウクライナのツイートの例について、疑似ラベル付き機密データのアプローチを再検討する。
得られたデータを統計的に解析し、擬似ラベリングに使用するモデルの評価を行い、さらにそのコーパスの活用方法についてのガイドラインを定めている。
論文 参考訳(メタデータ) (2023-11-17T13:35:10Z) - Multi-dimensional data refining strategy for effective fine-tuning LLMs [2.67766280323297]
本稿では,ベトナム語の微調整モデルに適したクロールおよび精錬時に学んだ教訓について述べる。
本稿では、既存のデータセットを英語で活用し、生成AIツールの助けを借りて、カスタマイズされたデータクローリングスクリプトを開発する多次元戦略を提案する。
論文 参考訳(メタデータ) (2023-11-02T07:50:43Z) - Deepfake audio as a data augmentation technique for training automatic
speech to text transcription models [55.2480439325792]
本稿では,ディープフェイク音声に基づくデータ拡張手法を提案する。
インド人(英語)が生成したデータセットが選択され、単一のアクセントの存在が保証された。
論文 参考訳(メタデータ) (2023-09-22T11:33:03Z) - AUGUST: an Automatic Generation Understudy for Synthesizing
Conversational Recommendation Datasets [56.052803235932686]
本稿では,大規模かつ高品質なレコメンデーションダイアログを生成する新しい自動データセット合成手法を提案する。
i)従来のレコメンデーションデータセットからの豊富なパーソナライズされたユーザプロファイル、(ii)知識グラフからの豊富な外部知識、(iii)人間対人間会話レコメンデーションデータセットに含まれる会話能力。
論文 参考訳(メタデータ) (2023-06-16T05:27:14Z) - Diversify Your Vision Datasets with Automatic Diffusion-Based
Augmentation [66.6546668043249]
ALIA(Automated Language-Guided Image Augmentation)は、大規模ビジョンと言語モデルを用いてデータセットのドメインの自然言語記述を自動的に生成する手法である。
データ整合性を維持するために、オリジナルのデータセットでトレーニングされたモデルは、最小限の画像編集とクラス関連情報を破損したデータをフィルタリングする。
そこで本研究では,ALIAが従来のデータ拡張や,詳細な分類作業におけるテキストから画像への変換を超越できることを示す。
論文 参考訳(メタデータ) (2023-05-25T17:43:05Z) - Considerations for Ethical Speech Recognition Datasets [0.799536002595393]
自動音声認識をケーススタディとして使用し、倫理的音声データセットが責任あるAIアプリケーションに対して持つべき特性について検討する。
トレーニングされたモデルを改善するために必要な多様性の問題、包括的プラクティス、必要な考慮事項を紹介します。
我々は、データ対象の法的・プライバシー保護、ユーザ人口統計とニーズに応じたターゲットデータサンプリング、モデル故障時の説明可能性と説明責任を保証する適切なメタデータについて論じる。
論文 参考訳(メタデータ) (2023-05-03T12:38:14Z) - Cross-Lingual Dialogue Dataset Creation via Outline-Based Generation [70.81596088969378]
言語間アウトラインに基づく対話データセット(COD)は、自然言語の理解を可能にする。
CODは、4つの異なる言語で対話状態の追跡とエンドツーエンドの対話モデリングと評価を可能にする。
論文 参考訳(メタデータ) (2022-01-31T18:11:21Z) - Multimodal datasets: misogyny, pornography, and malignant stereotypes [2.8682942808330703]
最近リリースされたLAION-400Mデータセットは、Common-Crawlデータセットから解析された画像-Alt-textペアのCLIPフィルタリングデータセットである。
このデータセットには、レイプ、ポルノグラフィー、悪性のステレオタイプ、人種差別的および民族的スラー、その他の非常に問題のあるコンテンツが含まれています。
論文 参考訳(メタデータ) (2021-10-05T11:47:27Z) - NISP: A Multi-lingual Multi-accent Dataset for Speaker Profiling [36.04737781943248]
そこで我々は,5つの異なる言語からの音声データと英語を用いた新しいデータセットを開発した。
また、言語情報、地域情報、話者の身体的特徴などの話者プロファイルアプリケーションのためのメタデータ情報も収集する。
我々はこのデータセットをNITK-IISc Multilingual Multi-accent Speaker Profiling (NISP) と呼ぶ。
論文 参考訳(メタデータ) (2020-07-12T15:46:57Z) - DeGAN : Data-Enriching GAN for Retrieving Representative Samples from a
Trained Classifier [58.979104709647295]
我々は、トレーニングされたネットワークの将来の学習タスクのために、利用可能なデータの豊富さと関連するデータの欠如の間のギャップを埋める。
利用可能なデータは、元のトレーニングデータセットまたは関連するドメインデータセットの不均衡なサブセットである可能性があるため、代表サンプルを検索するために使用します。
関連ドメインからのデータを活用して最先端のパフォーマンスを実現することを実証する。
論文 参考訳(メタデータ) (2019-12-27T02:05:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。