論文の概要: Omissive Bias in Religious Representation: Benchmarking LLM Answers to Everyday Ethical Decision-making
- arxiv url: http://arxiv.org/abs/2605.24319v1
- Date: Sat, 23 May 2026 00:55:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:17.929042
- Title: Omissive Bias in Religious Representation: Benchmarking LLM Answers to Everyday Ethical Decision-making
- Title(参考訳): 宗教表現におけるOmissive Bias: LLM Answers to Everyday Ethical Decision-making
- Authors: David Wingate, Sheryl Carty, Joshua Coates, Daniel Feldman, Nancy Fulda, Larry Howell, Brett Israelson, Dallin Jacobs, Jonathan Karr, John Paul Kimes, Elisabeth Kincaid, Paul Martens, Gavin Mobley, Suzana Pinheiro, Lindsay Slemboski, Peter Whiting,
- Abstract要約: LLMにおける価値アライメントとバイアスの次元としての宗教表現の欠如を考察する。
寛容なバイアスを測定するために、AllFaith Representation Benchmark: 150の倫理的および個人的な質問に貢献する。
LLMは、人間の期待に対して一貫して宗教を過小評価している。
- 参考スコア(独自算出の注目度): 2.910241872147875
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As large language models become a default source of guidance on personal, moral, and existential questions, it matters whether they draw on the religious frameworks that have historically shaped such reasoning, or systematically omit them. In this paper, we ask a deliberately narrow question: when posed an everyday ethical question for which religious perspectives may be valuable, do LLMs invoke religion at all? In contrast to benchmarks that look for the presence of political leanings or social bias, we look for the absence of religious representation as a dimension of value alignment and bias in LLMs. We term this ``omissive bias.'' To measure omissive bias, we contribute the AllFaith Religious Representation Benchmark: 150 ethically and personally salient questions, sourced from in-the-wild chat transcripts and faith-community contributors, paired with an LLM-as-judge rubric that gives full credit for any mention of a religion, a religious practice, or a religious leader. The questions are not themselves about religion--they are open-ended questions about grief, forgiveness, relationships, purpose, and honesty, where religion is one valuable perspective among several. We also run a human-subjects survey to compare LLM behavior against human expectations. Evaluating 27 models, we find that LLMs consistently underrepresent religion relative to human expectations. The omission is asymmetric: models invoke religion more readily for abstract existential questions (meaning, death, truth) than for the practical personal situations--grief, marriage, family conflict, addiction--where many people most rely on it. It is not our purpose to adjudicate which values LLMs should hold. We argue, more modestly, that current LLM responses overlook critical opportunities to reflect religious frameworks that many people draw on when navigating personal and ethical challenges.
- Abstract(参考訳): 大規模な言語モデルが、個人的、道徳的、実在的な問題に関するガイダンスのデフォルトの源となると、それらが歴史的にそのような推論を形作った宗教的な枠組みを踏襲するか、体系的に省略するかが重要となる。
本稿では、宗教観が価値のある日常的な倫理的問題を提示したとき、LLMは宗教を全く呼び出すのかという、意図的に狭い問いを投げかける。
政治的傾きや社会的偏見の存在を求めるベンチマークとは対照的に、LLMにおける価値アライメントと偏見の次元としての宗教的表現が欠如していることが注目される。
これを『寛容な偏見』と呼ぶ。
「寛容な偏見を測るために、我々は、宗教、宗教実践、宗教指導者のあらゆる言及に全面的な信用を与えるLLM-as-judge rubricと組んで、道徳的にかつ個人的に敬意を表した150の質問を提出する。
これらの質問は宗教についてではなく、悲しみ、許し、関係、目的、誠実さに関するオープンエンドの質問である。
また,LLMの行動と人間の期待とを比較するために,人物体調査を実施している。
27モデルを評価したところ、LLMは人間の期待に反する宗教を一貫して過小評価していることがわかった。
モデルは、抽象的な実在的な質問(意味、死、真実)のために、より容易に宗教を呼び起こす。
LLMが保持すべき価値を判断することは私たちの目的ではありません。
我々は、より控えめに言って、現在のLLMの反応は、多くの人々が個人的および倫理的課題をナビゲートする際に引き起こす宗教的な枠組みを反映する重要な機会を見落としていると論じている。
関連論文リスト
- When AI Takes Sides on Questions of Faith: Persistent Asymmetries in AI-Mediated Faith Guidance [1.163745353081629]
ある宗教から別の宗教への仮説的信仰の移行について助言を求めると、モデルは一貫した非対称性を示した。
平均的なカトリック、バー、シク教徒の宗教は広く好まれた。
無神論者、アグノスティックス、ジェホバの証人は、主に嫌われていた。
論文 参考訳(メタデータ) (2026-05-21T19:05:09Z) - Are Language Models Sensitive to Morally Irrelevant Distractors? [47.92026843851412]
低あいまいなシナリオであっても、道徳的気晴らし者が大きな言語モデルの道徳的判断を30%以上シフトできることを示す。
この研究は、人間の道徳的判断の安定性を仮定する理論に挑戦する。
論文 参考訳(メタデータ) (2026-02-10T05:18:05Z) - Sacred or Synthetic? Evaluating LLM Reliability and Abstention for Religious Questions [10.53116395328794]
我々は、アラビア語と英語の4つの主要なスンニ学派によって明確に分類された、LLMが生成するイスラム支配に焦点を当てた新しいベンチマークであるFiqhQAを紹介した。
我々のゼロショットと棄権実験は、LLM、言語、および法的な思考の流派間で大きな変化を示します。
我々の知る限りでは、この研究は、よりきめ細かいイスラム特有の支配世代のための LLMs の有効性をベンチマークし、イスラムクエリの棄権を評価する最初の研究である。
論文 参考訳(メタデータ) (2025-08-04T07:27:26Z) - Arbiters of Ambivalence: Challenges of Using LLMs in No-Consensus Tasks [52.098988739649705]
本研究では, LLMのバイアスと限界について, 応答生成器, 判定器, 討論器の3つの役割について検討した。
我々は、様々な先行的曖昧なシナリオを含む例をキュレートすることで、合意なしのベンチマークを開発する。
以上の結果から, LLMは, オープンエンドの回答を生成する際に, 曖昧な評価を行うことができる一方で, 審査員や討論者として採用する場合は, 合意なしのトピックにスタンスを取る傾向が示唆された。
論文 参考訳(メタデータ) (2025-05-28T01:31:54Z) - Measuring Spiritual Values and Bias of Large Language Models [28.892254056685008]
大規模言語モデル(LLM)は、様々なバックグラウンドを持つユーザにとって不可欠なツールとなっている。
これらのモデルは、事前学習データに埋め込まれた言語的・文化的ニュアンスを反映している。
このデータに固有の値と視点は、LCMの挙動に影響を与え、潜在的なバイアスをもたらす。
論文 参考訳(メタデータ) (2024-10-15T14:33:23Z) - Divine LLaMAs: Bias, Stereotypes, Stigmatization, and Emotion Representation of Religion in Large Language Models [19.54202714712677]
社会文化的体系としての宗教は、その信者に対する信念と価値観の集合を規定している。
私たちの価値観についてほとんど言及していないジェンダーとは違い、宗教はその信条と信条のセットを定めている。
アメリカやヨーロッパ諸国の主要な宗教は、よりニュアンスで表現されている。
ヒンドゥー教や仏教のような東方宗教は強くステレオタイプ化されている。
論文 参考訳(メタデータ) (2024-07-09T14:45:15Z) - Whose Side Are You On? Investigating the Political Stance of Large Language Models [56.883423489203786]
大規模言語モデル(LLM)の政治的指向性について,8つのトピックのスペクトルにわたって検討する。
我々の調査は、中絶からLGBTQ問題まで8つのトピックにまたがるLLMの政治的整合性について考察している。
この結果から,ユーザはクエリ作成時に留意すべきであり,中立的なプロンプト言語を選択する際には注意が必要であることが示唆された。
論文 参考訳(メタデータ) (2024-03-15T04:02:24Z) - Political Compass or Spinning Arrow? Towards More Meaningful Evaluations for Values and Opinions in Large Language Models [61.45529177682614]
我々は,大規模言語モデルにおける価値と意見の制約評価パラダイムに挑戦する。
強制されない場合、モデルが実質的に異なる答えを与えることを示す。
我々はこれらの知見をLLMの価値と意見を評価するための推奨とオープンな課題に抽出する。
論文 参考訳(メタデータ) (2024-02-26T18:00:49Z) - Large Language Models are Geographically Biased [47.88767211956144]
我々は、地理のレンズを通して、我々の住む世界について、Large Language Models (LLM)が何を知っているかを研究する。
我々は,地理空間予測において,システム的誤りと定義する,様々な問題的地理的バイアスを示す。
論文 参考訳(メタデータ) (2024-02-05T02:32:09Z) - Do LLMs exhibit human-like response biases? A case study in survey
design [66.1850490474361]
大規模言語モデル(LLM)が人間の反応バイアスをどの程度反映しているかについて検討する。
アンケート調査では, LLMが人間のような応答バイアスを示すかどうかを評価するためのデータセットとフレームワークを設計した。
9つのモデルに対する総合的な評価は、一般のオープンかつ商用のLCMは、一般的に人間のような振る舞いを反映しないことを示している。
論文 参考訳(メタデータ) (2023-11-07T15:40:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。