Fugu-MT 論文翻訳(概要): Sima AIunty: Caste Audit in LLM-Driven Matchmaking

論文の概要: Sima AIunty: Caste Audit in LLM-Driven Matchmaking

arxiv url: http://arxiv.org/abs/2603.29288v1
Date: Tue, 31 Mar 2026 05:44:55 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-01 15:25:03.176842
Title: Sima AIunty: Caste Audit in LLM-Driven Matchmaking
Title（参考訳）: Sima AIunty: LLM駆動のマッチメイキングにおけるキャスト監査
Authors: Atharva Naik, Shounok Kar, Varnika Sharma, Ashwin Rajadesingan, Koustuv Saha,
Abstract要約: 我々は,大言語モデル(LLM)によるマッチング評価において,キャストバイアスの制御を行う。ブラーミン、クシャトリヤ、ヴァイシャ、シュドラ、ダリトではキャスターのアイデンティティが異なり、5つのバケツで収入を得ている。我々の分析では、モデル間の一貫した階層的パターンが明らかになっている。
参考スコア（独自算出の注目度）: 10.466211034402386
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Social and personal decisions in relational domains such as matchmaking are deeply entwined with cultural norms and historical hierarchies, and can potentially be shaped by algorithmic and AI-mediated assessments of compatibility, acceptance, and stability. In South Asian contexts, caste remains a central aspect of marital decision-making, yet little is known about how contemporary large language models (LLMs) reproduce or disrupt caste-based stratification in such settings. In this work, we conduct a controlled audit of caste bias in LLM-mediated matchmaking evaluations using real-world matrimonial profiles. We vary caste identity across Brahmin, Kshatriya, Vaishya, Shudra, and Dalit, and income across five buckets, and evaluate five LLM families (GPT, Gemini, Llama, Qwen, and BharatGPT). Models are prompted to assess profiles along dimensions of social acceptance, marital stability, and cultural compatibility. Our analysis reveals consistent hierarchical patterns across models: same-caste matches are rated most favorably, with average ratings up to 25% higher (on a 10-point scale) than inter-caste matches, which are further ordered according to traditional caste hierarchy. These findings highlight how existing caste hierarchies are reproduced in LLM decision-making and underscore the need for culturally grounded evaluation and intervention strategies in AI systems deployed in socially sensitive domains, where such systems risk reinforcing historical forms of exclusion.
Abstract（参考訳）: マッチメイキングのような関係領域における社会的および個人的決定は、文化的規範や歴史的階層に深く結びついており、互換性、受容、安定性のアルゴリズム的およびAIによる評価によって形成される可能性がある。南アジアの文脈では、カストは婚姻決定の中心的な側面であり続けているが、現代の大規模言語モデル(LLM)がそのような環境でどのようにキャストベースの階層化を再現するか、あるいは破壊するかについてはほとんど分かっていない。本研究では,実世界の母体プロファイルを用いたLCMによるマッチング評価において,キャストバイアスの制御による評価を行う。我々は,ブラーミン,クシャトリヤ,ヴァイシャ,シュドラ,ダリトにまたがるキャスターのアイデンティティ,および5つのバケット(GPT,Gemini,Llama,Qwen,BharatGPT)の収入,および5つのLLMファミリー(GPT,Gemini,Llama,Qwen,BharatGPT)を評価する。モデルは、社会的受容、結婚の安定性、文化的適合性の次元に沿ったプロファイルを評価するよう促される。我々の分析では、モデル間の一貫した階層的パターンが明らかにされている: 同一キャスティングマッチは、従来のキャスティング階層に従ってさらに順序付けられた、キャスティングマッチよりも25%高い(10ポイントスケールで)平均レーティングで、最も好適に評価されている。これらの知見は、既存のキャスト階層がLLM意思決定においてどのように再現され、社会的に敏感なドメインに展開されるAIシステムにおいて、文化的に根ざした評価と介入戦略の必要性を浮き彫りにしている。

関連論文リスト

IndiCASA: A Dataset and Bias Evaluation Framework in LLMs Using Contrastive Embedding Similarity in the Indian Context [10.90604216960609]
大きな言語モデル(LLM)は、その印象的なコンテキスト理解と生成能力によって、重要なドメイン間で大きな牽引力を得ています。類似度を埋め込むことにより,微粒なバイアスを捕捉するコントラスト学習を用いて学習したエンコーダに基づく評価フレームワークを提案する。 IndiBiasをベースとしたコンテキストアライメントされたステレオタイプとアンチステレオタイプ) は,5つの人口動態軸にまたがる2,575の人文から構成される。
論文参考訳（メタデータ） (2025-10-03T06:03:26Z)
FairI Tales: Evaluation of Fairness in Indian Contexts with a Focus on Bias and Stereotypes [23.71105683137539]
フェアネスに関する既存の研究は、主に西洋に焦点を絞っており、インドのような文化的に多様な国では不十分である。インドを中心とした総合的なベンチマークであるINDIC-BIASを導入し,85の社会アイデンティティグループを対象としたLCMの公平性を評価する。
論文参考訳（メタデータ） (2025-06-29T06:31:06Z)
DECASTE: Unveiling Caste Stereotypes in Large Language Models through Multi-Dimensional Bias Analysis [20.36241144630387]
大規模言語モデル (LLM) は自然言語処理 (NLP) に革命をもたらした。 LLMは、民族、性別、宗教に基づくものなど、有害な社会的偏見を反映し、永続することが示されている。我々は,LLMにおける暗黙的および明示的なキャストバイアスを検知し,評価するための新しいフレームワークであるDECASTEを提案する。
論文参考訳（メタデータ） (2025-05-20T23:19:13Z)
The Root Shapes the Fruit: On the Persistence of Gender-Exclusive Harms in Aligned Language Models [91.86718720024825]
我々はトランスジェンダー、ノンバイナリ、その他のジェンダー・ディバースのアイデンティティを中心とし、アライメント手順が既存のジェンダー・ディバースバイアスとどのように相互作用するかを検討する。以上の結果から,DPO対応モデルは特に教師付き微調整に敏感であることが示唆された。 DPOとより広範なアライメントプラクティスに合わせたレコメンデーションで締めくくります。
論文参考訳（メタデータ） (2024-11-06T06:50:50Z)
GenderCARE: A Comprehensive Framework for Assessing and Reducing Gender Bias in Large Language Models [73.23743278545321]
大規模言語モデル(LLM)は、自然言語生成において顕著な能力を示してきたが、社会的バイアスを増大させることも観察されている。 GenderCAREは、革新的な基準、バイアス評価、リダクションテクニック、評価メトリクスを含む包括的なフレームワークである。
論文参考訳（メタデータ） (2024-08-22T15:35:46Z)
Social Debiasing for Fair Multi-modal LLMs [59.61512883471714]
MLLM(Multi-modal Large Language Models)は、研究分野を劇的に進歩させ、強力な視覚言語理解機能を提供する。これらのモデルは、しばしば訓練データから根深い社会的偏見を継承し、人種や性別などの属性に対する不快な反応をもたらす。本稿では,MLLMにおける社会的バイアスの問題を,複数の社会的概念を持つ包括的対実的データセットを導入することで解決する。
論文参考訳（メタデータ） (2024-08-13T02:08:32Z)
Training Socially Aligned Language Models on Simulated Social Interactions [99.39979111807388]
AIシステムにおける社会的アライメントは、確立された社会的価値に応じてこれらのモデルが振舞うことを保証することを目的としている。現在の言語モデル(LM)は、トレーニングコーパスを独立して厳格に複製するように訓練されている。本研究は,シミュレートされた社会的相互作用からLMを学習することのできる,新しい学習パラダイムを提案する。
論文参考訳（メタデータ） (2023-05-26T14:17:36Z)
Decoding Demographic un-fairness from Indian Names [4.402336973466853]
デモグラフィック分類は、レコメンデーションシステムにおける公正度評価や、オンラインネットワークや投票システムにおける意図しない偏見の測定に不可欠である。我々は3つの公開データセットを収集し、性別分類とキャスト分類の領域で最先端の分類器を訓練する。上記のモデルの有効性を理解するために、クロステスト(異なるデータセットでのトレーニングとテスト)を実施します。
論文参考訳（メタデータ） (2022-09-07T11:54:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。