論文の概要: Mutual Information Scoring: Increasing Interpretability in Categorical
Clustering Tasks with Applications to Child Welfare Data
- arxiv url: http://arxiv.org/abs/2208.01802v1
- Date: Wed, 3 Aug 2022 01:11:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-19 10:17:27.664068
- Title: Mutual Information Scoring: Increasing Interpretability in Categorical
Clustering Tasks with Applications to Child Welfare Data
- Title(参考訳): 相互情報スコアリング:カテゴリークラスタリング課題における解釈可能性の向上と児童福祉データへの応用
- Authors: Pranav Sankhe, Seventy F. Hall, Melanie Sage, Maria Y. Rodriquez,
Varun Chandola, Kenneth Joseph
- Abstract要約: アメリカの里親制度の若者は、同僚よりも多くの否定的な人生の結果に直面する可能性がかなり高い。
これらの若さに関するデータは、より良い生活への道筋を見極めるのに役立つ洞察を提供する可能性がある。
本研究は、これらのデータを用いて、データバイアスと、追跡するシステムと若者の両方に関する洞察を提供するための、新しい規範的アプローチを提案する。
- 参考スコア(独自算出の注目度): 6.651036327739043
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Youth in the American foster care system are significantly more likely than
their peers to face a number of negative life outcomes, from homelessness to
incarceration. Administrative data on these youth have the potential to provide
insights that can help identify ways to improve their path towards a better
life. However, such data also suffer from a variety of biases, from missing
data to reflections of systemic inequality. The present work proposes a novel,
prescriptive approach to using these data to provide insights about both data
biases and the systems and youth they track. Specifically, we develop a novel
categorical clustering and cluster summarization methodology that allows us to
gain insights into subtle biases in existing data on foster youth, and to
provide insight into where further (often qualitative) research is needed to
identify potential ways of assisting youth.
- Abstract(参考訳): アメリカの養育制度の若者は、ホームレスから投獄まで、多くの否定的な人生の結果に直面している仲間よりもはるかに高い確率で存在している。
これらの若者の行政データには、より良い生活への道のりを改善する方法を見つけるのに役立つ洞察を提供する可能性がある。
しかし、そのようなデータは、欠落データから体系的不平等の反映まで、様々なバイアスに悩まされる。
本研究では、これらのデータを用いて、データバイアスと、追跡するシステムと若者の両方に関する洞察を提供する新しい規範的アプローチを提案する。
具体的には,青少年の養育に関する既存のデータの微妙なバイアスに対する洞察を得ることを可能にする新たなカテゴリクラスタリングとクラスタ要約手法を開発し,青少年を支援する潜在的な方法を特定するために,さらなる(しばしば質的)研究が必要となる場所に関する洞察を提供する。
関連論文リスト
- Granularity Matters in Long-Tail Learning [62.30734737735273]
より粒度の細かいデータセットは、データの不均衡の影響を受けにくい傾向があります。
既存のクラスと視覚的に類似したオープンセット補助クラスを導入し、頭と尾の両方の表現学習を強化することを目的とした。
補助授業の圧倒的な存在がトレーニングを混乱させるのを防ぐために,近隣のサイレンシング障害を導入する。
論文 参考訳(メタデータ) (2024-10-21T13:06:21Z) - The Generation Gap: Exploring Age Bias in the Value Systems of Large Language Models [26.485974783643464]
特に米国人口と比較して,若年層に対するLLM(Large Language Models)値の一般的な傾向を見出した。
一般的な傾きは観察できるが、若いグループに対するこの傾きは、異なる値のカテゴリで異なることが判明した。
論文 参考訳(メタデータ) (2024-04-12T18:36:20Z) - Deep Metric Learning for Computer Vision: A Brief Overview [4.980117530293724]
深層ニューラルネットワークを最適化する目的関数は、入力データの強化された特徴表現を作成する上で重要な役割を果たす。
Deep Metric Learningは、データサンプル間の類似度を測定する方法の開発を目指している。
本稿では、この領域における最近の進歩の概要と最先端のDeep Metric Learningアプローチについて論じる。
論文 参考訳(メタデータ) (2023-12-01T21:53:36Z) - Unveiling the Potential of Probabilistic Embeddings in Self-Supervised
Learning [4.124934010794795]
自己教師付き学習は、ラベルのないデータから意味のある表現をモデルが取得できるようにすることで、機械学習を前進させる上で重要な役割を担っている。
本稿では,情報ボトルネックに対する確率的モデリングの影響について検討し,情報圧縮と情報保存のトレードオフについて述べる。
以上の結果から,損失空間に新たなボトルネックを導入することにより,アウト・オブ・ディストリビューションの事例を検出する能力が著しく向上することが示唆された。
論文 参考訳(メタデータ) (2023-10-27T12:01:16Z) - A Survey of Learning on Small Data: Generalization, Optimization, and
Challenge [101.27154181792567]
ビッグデータの一般化能力を近似した小さなデータについて学ぶことは、AIの究極の目的の1つである。
この調査はPACフレームワークの下でのアクティブサンプリング理論に従い、小さなデータにおける学習の一般化誤差とラベルの複雑さを分析した。
効率的な小さなデータ表現の恩恵を受けるかもしれない複数のデータアプリケーションについて調査する。
論文 参考訳(メタデータ) (2022-07-29T02:34:19Z) - Novel Class Discovery without Forgetting [72.52222295216062]
我々は NCDwF: Novel Class Discovery without Forgetting の新たな実用的問題設定を特定し,定式化する。
ラベルのないデータから新しいカテゴリのインスタンスを段階的に発見する機械学習モデルを提案する。
CIFAR-10, CIFAR-100, ImageNet-1000に基づく実験プロトコルを導入し, 知識保持と新しいクラス発見のトレードオフを測定する。
論文 参考訳(メタデータ) (2022-07-21T17:54:36Z) - Data Representativeness in Accessibility Datasets: A Meta-Analysis [7.6597163467929805]
障害のある人と高齢者が作成したデータセットをレビューする。
アクセシビリティデータセットは様々な年齢を表すが、性別と人種の差がある。
われわれの努力が、AIに注入されたシステムに、余分なコミュニティをもっと取り入れる可能性の空間を広げることを願っている。
論文 参考訳(メタデータ) (2022-07-16T23:32:19Z) - Imagining new futures beyond predictive systems in child welfare: A
qualitative study with impacted stakeholders [89.6319385008397]
児童福祉システムに影響を及ぼした利害関係者35名を対象に,7つのデザインワークショップを開催した。
対象者は,現在のPRMが児童福祉における既存の問題を持続的又は悪化させることを懸念した。
参加者は、データとデータ駆動ツールを使って、影響のあるコミュニティをより良くサポートする方法を提案した。
論文 参考訳(メタデータ) (2022-05-18T13:49:55Z) - Enhancing Facial Data Diversity with Style-based Face Aging [59.984134070735934]
特に、顔データセットは、通常、性別、年齢、人種などの属性の観点からバイアスされる。
本稿では, 細粒度の老化パターンをキャプチャするデータ拡張のための, 生成スタイルに基づく新しいアーキテクチャを提案する。
提案手法は, 年齢移動のための最先端アルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-06T21:53:44Z) - Inclusive GAN: Improving Data and Minority Coverage in Generative Models [101.67587566218928]
データカバレッジの1つとしてマイノリティー・インクルージョンの問題を定式化する。
次に、再構成世代と敵対的トレーニングを調和させることにより、データカバレッジを改善することを提案する。
我々は、モデルが確実に含めるべきマイノリティサブグループを明示的に制御できる拡張を開発する。
論文 参考訳(メタデータ) (2020-04-07T13:31:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。