論文の概要: Why AI Harms Can't Be Fixed One Identity at a Time: What 5300 Incident Reports Reveal About Intersectionality
- arxiv url: http://arxiv.org/abs/2604.24519v1
- Date: Mon, 27 Apr 2026 14:20:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:08.079193
- Title: Why AI Harms Can't Be Fixed One Identity at a Time: What 5300 Incident Reports Reveal About Intersectionality
- Title(参考訳): AIが一度に1つのアイデンティティを修復できない理由:5300件のインシデントレポート
- Authors: Edyta Bogucka, Sanja Šćepanović, Daniele Quercia,
- Abstract要約: AIの害は、一度に1つのアイデンティティカテゴリが発生しないことを示す。
年齢と政治的アイデンティティは、文書化されたAIが人種や性別に匹敵する割合で害を与える。
交差するカテゴリーのレベルでは、特定の交差点で害が最大3倍に増幅される。
- 参考スコア(独自算出の注目度): 6.086189918143293
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: AI risk assessment is the primary tool for identifying harms caused by AI systems. These include intersectional harms, which arise from the interaction between identity categories (e.g., class and skin tone) and which do not occur, or occur differently, when those categories are considered separately. Yet existing AI risk assessments are still built around isolated identity categories, and when intersections are considered, they focus almost exclusively on race and gender. Drawing on a large-scale analysis of documented AI incidents, we show that AI harms do not occur one identity category at a time. Using a structured rubric applied with a Large Language Model (LLM), we analyze 5,300 reports from 1,200 documented incidents in the AI Incident Database, the most curated source of incident data. From these reports, we identify 1,513 harmed subjects and their associated identity categories, achieving 98% accuracy. At the level of individual categories, we find that age and political identity appear in documented AI harms at rates comparable to race and gender. At the level of intersecting categories, harm is amplified up to three times at specific intersections: adolescent girls, lower-class people of color, and upper-class political elites. We argue that intersectionality should be a core component of AI risk assessment to more accurately capture how harms are produced and distributed across social groups.
- Abstract(参考訳): AIリスクアセスメントは、AIシステムによって引き起こされる害を識別するための主要なツールである。
これらには、アイデンティティカテゴリ(例えば、クラスとスキンのトーン)間の相互作用から生じ、それらのカテゴリが別々に考慮された場合、発生しない、あるいは異なる方法で発生する交叉害が含まれる。
しかし、既存のAIリスクアセスメントは、分離されたアイデンティティカテゴリを中心に構築されており、交差点を考慮すると、ほとんどレースとジェンダーに重点を置いている。
文書化されたAIインシデントを大規模に分析した結果、AIの害は一度に1つのアイデンティティカテゴリが発生しないことが判明した。
LLM(Large Language Model)を応用した構造化ルーブリックを用いて,最もキュレートされたインシデントデータソースであるAI Incident Databaseにおいて,1200件のドキュメント化されたインシデントから5300件のレポートを分析した。
以上より, 被傷者1,513名とその関連アイデンティティカテゴリーを同定し, 98%の精度を得た。
個々のカテゴリーのレベルでは、文書化されたAIの中に年齢と政治的アイデンティティが出現し、人種や性別に匹敵する割合で害を受けていることが分かります。
交差するカテゴリーのレベルでは、青少年の少女、下層階級の有色人種、上流階級の政治エリートなど、特定の交差点で害が最大3倍に増幅される。
我々は、交叉性がAIリスクアセスメントのコアコンポーネントであり、社会グループ間での害の発生と分散をより正確に把握するべきだと論じている。
関連論文リスト
- Latent Profiles of AI Risk Perception and Their Differential Association with Community Driving Safety Concerns: A Person-Centered Analysis [0.9694940903078657]
本研究は、米国成人におけるAIリスク知覚の潜在プロファイルを特定する。
これらのプロファイルがコミュニティの運転安全上の懸念と相違するかどうかをテストする。
論文 参考訳(メタデータ) (2026-04-06T16:50:43Z) - PluriHarms: Benchmarking the Full Spectrum of Human Judgments on AI Harm [39.043933213898136]
現在のAI安全フレームワークは、有害性をバイナリとして扱うことが多いが、人間が同意しない境界的なケースを扱う柔軟性は欠如している。
PluriHarmsは、2つの重要な次元にわたる人間の害判定を研究するために設計されたベンチマークである。
我々のスケーラブルなフレームワークは、人間のデータによって検証された高い不一致率のケースをターゲットにしながら、多様なAIの害や人間の価値を捉えるプロンプトを生成する。
論文 参考訳(メタデータ) (2026-01-13T19:41:11Z) - Almost AI, Almost Human: The Challenge of Detecting AI-Polished Writing [55.2480439325792]
本研究では、AI-Polished-Text Evaluationデータセットを用いて、12の最先端AIテキスト検出器を体系的に評価する。
我々の発見によると、検出器は、最小限に洗練されたテキストをAI生成としてフラグ付けし、AIの関与度を区別し、古いモデルや小さなモデルに対するバイアスを示す。
論文 参考訳(メタデータ) (2025-02-21T18:45:37Z) - The Dark Side of AI Companionship: A Taxonomy of Harmful Algorithmic Behaviors in Human-AI Relationships [17.5741039825938]
我々は,AIコンパニオンであるReplikaが示す有害な行動の6つのカテゴリを特定した。
AIは、加害者、侮辱者、ファシリテーター、イネーブラーの4つの異なる役割を通じて、これらの害に貢献する。
論文 参考訳(メタデータ) (2024-10-26T09:18:17Z) - Insights on Disagreement Patterns in Multimodal Safety Perception across Diverse Rater Groups [29.720095331989064]
AIシステムは人間のレーティングに大きく依存するが、これらのレーティングはしばしば集約される。
これは、社会文化的文脈によって知覚と関連する害が著しく異なる、生成的AIの安全性を評価する場合に特に関係している。
人口統計学的に多彩な630人のレーダプールから,約1000文字対画像(T2I)の高並列安全性評価を用いた大規模研究を行った。
論文 参考訳(メタデータ) (2024-10-22T13:59:21Z) - Human Bias in the Face of AI: Examining Human Judgment Against Text Labeled as AI Generated [48.70176791365903]
本研究では、偏見がAIと人為的コンテンツの知覚をどう形成するかを考察する。
ラベル付きおよびラベルなしコンテンツに対するヒトのラッカーの反応について検討した。
論文 参考訳(メタデータ) (2024-09-29T04:31:45Z) - Factoring the Matrix of Domination: A Critical Review and Reimagination
of Intersectionality in AI Fairness [55.037030060643126]
間欠性は、社会的不平等の持続性を調べるための重要な枠組みである。
我々は、公平性を効果的に運用するために、交差性を分析的枠組みとして採用することが重要であると論じる。
論文 参考訳(メタデータ) (2023-03-16T21:02:09Z) - Indexing AI Risks with Incidents, Issues, and Variants [5.8010446129208155]
データベースのインシデント取り込み基準を満たしていない“イシュー”のバックログが蓄積されました。
航空やコンピュータセキュリティのデータベースと同様に、AIIDはAIインシデントをインデクシングするための2段階のシステムを採用することを提案している。
論文 参考訳(メタデータ) (2022-11-18T17:32:19Z) - One Label, One Billion Faces: Usage and Consistency of Racial Categories
in Computer Vision [75.82110684355979]
顔画像の分類的人種ラベルを提供するコンピュータビジョンデータセットによって符号化された人種システムについて検討する。
各データセットは、名目上等価な人種分類にもかかわらず、かなりユニークな人種体系をコードしている。
我々は、人種的カテゴリーがステレオタイプを符号化し、非整合性からステレオタイプへの分類から民族集団を除外する証拠を見出した。
論文 参考訳(メタデータ) (2021-02-03T22:50:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。