論文の概要: Understanding the Representation and Representativeness of Age in AI
Data Sets
- arxiv url: http://arxiv.org/abs/2103.09058v2
- Date: Thu, 6 May 2021 04:30:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-08 13:25:17.651093
- Title: Understanding the Representation and Representativeness of Age in AI
Data Sets
- Title(参考訳): AIデータセットにおける年齢の表現と表現の理解
- Authors: Joon Sung Park, Michael S. Bernstein, Robin N. Brewer, Ece Kamar,
Meredith Ringel Morris
- Abstract要約: 我々は、AIデータセットにおいて、高齢者が人口に比例するかどうかを問う。
5つのデータセットは被験者の閉じた年齢間隔を明示的に記録している。
ドキュメントやメタデータに年齢関連の情報を含むデータセットは,わずか24に過ぎません。
- 参考スコア(独自算出の注目度): 43.20868863618351
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A diverse representation of different demographic groups in AI training data
sets is important in ensuring that the models will work for a large range of
users. To this end, recent efforts in AI fairness and inclusion have advocated
for creating AI data sets that are well-balanced across race, gender,
socioeconomic status, and disability status. In this paper, we contribute to
this line of work by focusing on the representation of age by asking whether
older adults are represented proportionally to the population at large in AI
data sets. We examine publicly-available information about 92 face data sets to
understand how they codify age as a case study to investigate how the subjects'
ages are recorded and whether older generations are represented. We find that
older adults are very under-represented; five data sets in the study that
explicitly documented the closed age intervals of their subjects included older
adults (defined as older than 65 years), while only one included oldest-old
adults (defined as older than 85 years). Additionally, we find that only 24 of
the data sets include any age-related information in their documentation or
metadata, and that there is no consistent method followed across these data
sets to collect and record the subjects' ages. We recognize the unique
difficulties in creating representative data sets in terms of age, but raise it
as an important dimension that researchers and engineers interested in
inclusive AI should consider.
- Abstract(参考訳): aiトレーニングデータセットにおけるさまざまな人口集団の多様な表現は、モデルが幅広いユーザーのために機能することを保証する上で重要である。
この目的のために、aiフェアネスとインクルージョンにおける最近の取り組みは、人種、性別、社会経済的地位、障害ステータス間でバランスの取れたaiデータセットの作成を提唱している。
本稿では, 高齢者がAIデータセット全体において人口に比例するかどうかを問うことで, 年齢の表現に焦点をあてることで, この研究の行程に寄与する。
本研究は,92の顔データ集合に関する公開情報を用いて,年齢の体系化に関する事例研究を行い,対象者の年齢と年齢の表現方法について検討した。
対象者の閉じた年齢間隔を明示的に記録した研究の5つのデータセットには、65歳以上の高齢者(65歳以上)と85歳以上の高齢者(85歳以上)が含まれている。
さらに,24組のデータセットには,資料やメタデータに年齢関連情報が含まれていること,対象者の年齢を収集・記録するための一貫性のある方法が存在しないことが判明した。
私たちは、年齢の観点から代表的データセットを作成することの難しさを認識していますが、それを、包括的AIに関心のある研究者やエンジニアが考慮すべき重要な次元として挙げます。
関連論文リスト
- TextAge: A Curated and Diverse Text Dataset for Age Classification [1.4843200329335289]
年齢に関連する言語パターンは、言語の違いを理解し、年齢に合ったコミュニケーション戦略を開発する上で重要な役割を担っている。
著者の年齢・年齢グループに文章をマッピングするテキストデータセットであるTextAgeを提示する。
データセットは、データ品質と一貫性を保証するために、広範囲なクリーニングと前処理を行う。
論文 参考訳(メタデータ) (2024-05-02T23:37:03Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - Explaining machine learning models for age classification in human gait
analysis [10.570744839131775]
機械学習モデルではどの入力特徴が年齢による歩行パターンの違いを分類するために使用されるのか?
AIST Gait Database 2019のサブセットを用いて,健常者の裸足歩行において,1人あたり5つの地上反応力(GRF)の記録を収録した。
60.1%の平均分類精度は37.3%のゼロルールベースラインよりも明らかに高かった。
混乱行列は,CNNが若年層と高齢層をよく区別するが,中年層をモデル化することは困難であったことを示している。
論文 参考訳(メタデータ) (2022-10-16T13:53:51Z) - Data Representativeness in Accessibility Datasets: A Meta-Analysis [7.6597163467929805]
障害のある人と高齢者が作成したデータセットをレビューする。
アクセシビリティデータセットは様々な年齢を表すが、性別と人種の差がある。
われわれの努力が、AIに注入されたシステムに、余分なコミュニティをもっと取り入れる可能性の空間を広げることを願っている。
論文 参考訳(メタデータ) (2022-07-16T23:32:19Z) - LAE : Long-tailed Age Estimation [52.5745217752147]
まず、簡単な標準ベースラインを定式化し、事前トレーニング、データ拡張、モデルアーキテクチャなどのトリックを収集することで、はるかに強力なベースラインを構築します。
標準ベースラインと比較して,提案手法は推定誤差を著しく低減する。
本稿では,Long-tailed Age Estimation (LAE) という2段階の学習手法を提案する。
論文 参考訳(メタデータ) (2021-10-25T09:05:44Z) - Representative & Fair Synthetic Data [68.8204255655161]
公平性制約を自己監督学習プロセスに組み込むためのフレームワークを提示する。
私たちはuci成人国勢調査データセットの代表者および公正版を作成します。
我々は、代表的かつ公正な合成データを将来有望なビルディングブロックとみなし、歴史的世界ではなく、私たちが生きようとしている世界についてアルゴリズムを教える。
論文 参考訳(メタデータ) (2021-04-07T09:19:46Z) - Enhancing Facial Data Diversity with Style-based Face Aging [59.984134070735934]
特に、顔データセットは、通常、性別、年齢、人種などの属性の観点からバイアスされる。
本稿では, 細粒度の老化パターンをキャプチャするデータ拡張のための, 生成スタイルに基づく新しいアーキテクチャを提案する。
提案手法は, 年齢移動のための最先端アルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-06T21:53:44Z) - Investigating Bias in Deep Face Analysis: The KANFace Dataset and
Empirical Study [67.3961439193994]
現在までに最も包括的で大規模な顔画像とビデオのデータセットを導入している。
データは、アイデンティティ、正確な年齢、性別、親族関係の点で手動で注釈付けされる。
提案したベンチマークでネットワーク埋め込みをデバイアス化する手法を導入し,テストした。
論文 参考訳(メタデータ) (2020-05-15T00:14:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。