論文の概要: Harsher on Male? Evaluating LLMs on Gender-Asymmetric Moral Framing Across Diverse Conflict Scenarios
- arxiv url: http://arxiv.org/abs/2606.14068v1
- Date: Fri, 12 Jun 2026 03:29:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:42.730247
- Title: Harsher on Male? Evaluating LLMs on Gender-Asymmetric Moral Framing Across Diverse Conflict Scenarios
- Title(参考訳): Harsher on Male? : LLMs on Gender-Asymmetric Moral Framing Across Diverse Confenarios
- Authors: Guangzong Si, Dong Wang, Zhenhao Li, Yifan Yu, Panwang Pan, Wentao Zhu,
- Abstract要約: GAMA-Benchは、親密な関係と社会的対立を対象とする1,298のシナリオの性別ミラー付きベンチマークである。
コントロールグリッドとクロスモデルレビューを通じて性中立の誤ったテンプレートを構築し、マッチしたアクター-ジェンダーとロール-参照のバリエーションでペア化された1対のプロンプトにコンパイルする。
男性俳優は、より刺激的で、エスカレーション的で、非難中心のフレーミングを受け、女性俳優は、同じ不正行為に対してより治療的で共感指向のフレーミングを受ける。
- 参考スコア(独自算出の注目度): 14.290719241304012
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing studies on gender bias in LLMs have largely focused on stereotypes, occupational associations, or explicit harmful outputs. In this work, we ask whether LLMs apply consistent response standards to the same negative behavior under matched male-actor and female-actor conditions. We introduce GAMA-Bench, a gender-mirrored benchmark of 1,298 scenarios covering intimate relationship and public social conflicts. It constructs gender-neutral misconduct templates through controlled grids and cross-model review, then compiles them into paired first-person prompts with matched actor-gender and role-reference variations. We further design a structured response-framing protocol to measure how models allocate punishment, empathy, escalation, instruction, and blame. Experiments on 10 representative LLMs reveal a consistent male-disadvantaging asymmetry: male actors receive more punitive, escalatory, and blame-centered framing, whereas female actors receive more therapeutic and empathy-oriented framing for the same misconduct. Further analyses show that this pattern persists across model families, scenario tracks, model scale, and explicit thinking-style reasoning. The official code is available at https://github.com/xufeiqiong/GAMA-Bench.
- Abstract(参考訳): LLMにおけるジェンダーバイアスに関する既存の研究は、主にステレオタイプ、職業的関連、または明らかな有害なアウトプットに焦点を当てている。
本研究では,LLMが一致した男性・女性・俳優条件下で同じ負の挙動に一貫した応答標準を適用しているかどうかを問う。
GAMA-Benchは、親密な関係と社会的対立を対象とする1,298のシナリオの性別ミラー付きベンチマークである。
コントロールグリッドとクロスモデルレビューを通じて性中立の誤ったテンプレートを構築し、マッチしたアクター-ジェンダーとロール-参照のバリエーションでペア化された1対のプロンプトにコンパイルする。
さらに、モデルがどのように罰、共感、エスカレーション、命令、非難を割り当てるかを測定するために、構造化された応答フレーミングプロトコルを設計する。
男性俳優は、より刺激的で、エスカレーション的で、非難中心のフレーミングを受け、女性俳優は、同じ不正行為に対してより治療的で共感指向のフレーミングを受ける。
さらに分析したところ、このパターンはモデルファミリー、シナリオトラック、モデルスケール、明示的な思考スタイルの推論にまたがって持続することが示された。
公式コードはhttps://github.com/xufeiqiong/GAMA-Bench.comで公開されている。
関連論文リスト
- Gender Bias in LLMs: Preliminary Evidence from Shared Parenting Scenario in Czech Family Law [0.0]
本研究では,先行するLarge Language Models (LLM) が,現実的な家族法シナリオに対する性別バイアスを示すか否かを検討する。
チェコの家族法に基づく専門的な離婚シナリオを提示し、最先端のLPMであるGPT-5 nano、Claude Haiku 4.5、Gemini 2.5 Flash、Llama 3.3の4つを評価した。
予備的な結果は、モデル間の差異を強調し、いくつかのシステムによって生成された結果における性別に依存したパターンを提案する。
論文 参考訳(メタデータ) (2026-01-09T15:55:03Z) - Mitigating Gender Bias via Fostering Exploratory Thinking in LLMs [15.365993658296016]
大きな言語モデル(LLM)は、しばしば性別バイアスを示し、男女の扱いが不平等になる。
我々のアプローチは、構造的に同一で道徳的に曖昧なシナリオにおいて、男性と女性の主人公を特徴とするストーリーペアを生成するようモデルに促す。
不整合が発生すると、モデルはバランスのとれた性中立的な判断を生み出すように誘導される。
論文 参考訳(メタデータ) (2025-05-22T18:46:50Z) - More Women, Same Stereotypes: Unpacking the Gender Bias Paradox in Large Language Models [3.154053412440065]
大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、社会的偏見を反映または増幅する傾向について懸念が持たれている。
本研究では,LSMにおける性別バイアスを明らかにするための新しい評価枠組みを提案する。
10の著名なLSMの体系的な分析は、職業全体にわたって女性キャラクターを過剰に表現する一貫したパターンを示している。
論文 参考訳(メタデータ) (2025-03-20T07:15:45Z) - Disclosure and Mitigation of Gender Bias in LLMs [64.79319733514266]
大規模言語モデル(LLM)はバイアス応答を生成することができる。
条件生成に基づく間接探索フレームワークを提案する。
LLMにおける明示的・暗黙的な性バイアスを明らかにするための3つの戦略を探求する。
論文 参考訳(メタデータ) (2024-02-17T04:48:55Z) - Probing Explicit and Implicit Gender Bias through LLM Conditional Text
Generation [64.79319733514266]
大規模言語モデル(LLM)はバイアスと有害な応答を生成する。
本研究では,あらかじめ定義されたジェンダーフレーズやステレオタイプを必要としない条件付きテキスト生成機構を提案する。
論文 参考訳(メタデータ) (2023-11-01T05:31:46Z) - "Kelly is a Warm Person, Joseph is a Role Model": Gender Biases in
LLM-Generated Reference Letters [97.11173801187816]
大規模言語モデル(LLM)は、個人が様々な種類のコンテンツを書くのを支援する効果的なツールとして最近登場した。
本稿では, LLM 生成した参照文字の性別バイアスについて批判的に検討する。
論文 参考訳(メタデータ) (2023-10-13T16:12:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。