論文の概要: Six Llamas: Comparative Religious Ethics Through LoRA-Adapted Language Models
- arxiv url: http://arxiv.org/abs/2604.18404v1
- Date: Mon, 20 Apr 2026 15:22:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.971097
- Title: Six Llamas: Comparative Religious Ethics Through LoRA-Adapted Language Models
- Title(参考訳): Six Llamas: LoRA適応言語モデルによる比較宗教倫理
- Authors: Chad Coleman, W. Russell Neuman, Manan Shah, Ali Dasdan, Matthew Crispi, Morris Chiang, Zack Leitman, Mustafa Poonawala,
- Abstract要約: シックス・ラマス(Six Llamas)は、異なる宗教的コーパスに微調整された大きな言語モデルが、倫理的推論の体系的に異なるパターンをコードしているかどうかを比較研究したものである。
6つのモデルは全て、道徳的ジレンマ、ゲーム理論的シナリオ、公共政策問題、道徳心理学的堅牢性にまたがる17の標準化された倫理的プロンプトの同一のバッテリーで調査されている。
- 参考スコア(独自算出の注目度): 3.0427155224159006
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present Six Llamas, a comparative study examining whether large language models fine-tuned on distinct religious corpora encode systematically different patterns of ethical reasoning. Six variants of Meta-Llama-3.1-8B are constructed: one unmodified control and five LoRA-adapted models trained exclusively on the sacred and theological texts of Christianity, Islam, Judaism, Hinduism, or Buddhism. All six models are probed with an identical battery of 17 standardized ethical prompts spanning moral dilemmas, game-theoretic scenarios, public policy questions, and moral-psychological self-assessments. To assess robustness and reproducibility, we implement a multi-temperature sampling design spanning ten temperature settings. We compute response consistency metrics, pairwise inter-model agreement rates, temperature sensitivity coefficients across four prompt domains, and run-to-run stability analyses. Findings show that LoRA-adapted models produce ethical reasoning patterns that are (a) systematically differentiated from the base model, (b) consistent with the moral logics of their training traditions, (c) structured along interpretable dimensions in moral-philosophical space, (d) core ethical positions remain stable across temperature variations for high-consensus dilemmas. The Trolley Problem achieves 100% consistency across all models and temperatures, while (e) tradition-specific divergence intensifies at higher temperatures in morally contested domains, and (f) the base model exhibits the highest overall response consistency (mean 88.3%), suggesting LoRA adaptation introduces both tradition-specific signal and increased sampling sensitivity. The study offers a proof-of-concept for the condensate comparative method using differentially trained language models as instruments for cultural and ethical analysis and identifies specific criteria for falsification and planned extensions.
- Abstract(参考訳): シックス・ラマ(Six Llamas)は、異なる宗教的コーパスに微調整された大きな言語モデルが、倫理的推論の体系的に異なるパターンをコードしているかどうかを比較検討した。
メタ・ラマ-3.1-8Bの6つの変種が建設され、キリスト教、イスラム教、ユダヤ教、ヒンドゥー教、仏教の聖典と神学にのみ訓練された1つの無修正の制御と5つのロラ適応モデルが作られた。
6つのモデルは全て、道徳的ジレンマ、ゲーム理論的シナリオ、公共政策問題、道徳的心理学的自己評価にまたがる17の標準化された倫理的プロンプトで調査されている。
堅牢性と再現性を評価するため,10温度設定にまたがる多温度サンプリング設計を実装した。
我々は,応答整合性指標,モデル間整合率,4つのプロンプト領域における温度感度係数,実行時安定性解析を計算した。
LoRA適応モデルが倫理的推論パターンを生成することを示す発見
a) 基本モデルと体系的に区別する
(b)訓練の伝統の道徳的論理と整合している。
(c)道徳哲学空間の解釈可能な次元に沿って構成される
(d)高濃度ジレンマの温度変化における中心的倫理的位置は安定である。
トロリー問題(Trolley Problem)は、すべてのモデルと温度で100%整合性を達成する。
(e)伝統固有の分散は、道徳的に争われた領域の高温で強化し、
(f) ベースモデルが最も高い応答一貫性を示し(平均88.3%)、LoRAの適応は伝統的な信号とサンプリング感度の両方を導入することを示唆している。
この研究は、文化的・倫理的分析のための道具として、差分訓練された言語モデルを用いたコンデンサ比較手法の実証と、ファルシフィケーションと計画された拡張のための特定の基準の特定を提供する。
関連論文リスト
- Probing Ethical Framework Representations in Large Language Models: Structure, Entanglement, and Methodological Challenges [43.1650681858003]
我々は,4B-72Bパラメータにまたがる6つのLLMにおいて,5つの倫理的枠組み(デオントロジー,実用主義,徳,正義,常識)にまたがる隠された表現を探索する。
我々の分析では、非対称な伝達パターンを持つ区別された倫理的部分空間が明らかにされている。例えば、デオントロジーは、部分的に美徳のシナリオに当てはまるが、コモンセンスプローブは、公正に破滅的に失敗する。
論文 参考訳(メタデータ) (2026-03-24T19:01:29Z) - Reasoning or Rhetoric? An Empirical Analysis of Moral Reasoning Explanations in Large Language Models [17.68920753323464]
13個のLCMから600以上の応答を分類するために,3つの判定モデルで検証したLCM-as-judgeスコアパイプラインを用いた。
応答は,モデルのサイズ,アーキテクチャ,あるいはプロンプト戦略によらず,従来の推論と圧倒的に一致している。
最も印象的なことに、モデルのサブセットは道徳的な疎結合を示しており、これは論理的不整合の形で、規模を超えて継続し、戦略を推進している。
論文 参考訳(メタデータ) (2026-03-23T11:43:49Z) - V-ReasonBench: Toward Unified Reasoning Benchmark Suite for Video Generation Models [52.97290143922252]
V-ReasonBenchは、4つの主要な次元にわたるビデオ推論を評価するために設計されたベンチマークである。
6つの最先端ビデオモデルの評価は、明らかに次元的な違いを示している。
全体として、V-ReasonBenchは、ビデオ推論を測定する統一的で再現可能なフレームワークを提供する。
論文 参考訳(メタデータ) (2025-11-20T18:59:42Z) - Do Vision-Language Models Have Internal World Models? Towards an Atomic Evaluation [54.3628937181904]
内部世界モデル(英語版)(WM)は、エージェントが世界の状態を理解し、遷移を予測することを可能にする。
近年,OpenAI o3, GPT-4o, Geminiなどの大規模視覚言語モデル(VLM)は汎用的なWMとしての可能性を示している。
論文 参考訳(メタデータ) (2025-06-27T03:24:29Z) - A Closer Look at Bias and Chain-of-Thought Faithfulness of Large (Vision) Language Models [58.32070787537946]
思考の連鎖(CoT)推論は、大きな言語モデルの性能を高める。
大規模視覚言語モデルにおけるCoT忠実度に関する最初の総合的研究について述べる。
論文 参考訳(メタデータ) (2025-05-29T18:55:05Z) - Auditing the Ethical Logic of Generative AI Models [6.0972634521845475]
本稿では,主要な大規模言語モデル(LLM)の倫理的論理を評価するための5次元監査モデルを提案する。
モデルが一般に倫理的決定に収束する一方で、説明的厳密性や道徳的優先順位付けの点で異なることを発見した7つの主要なLCMをベンチマークする。
チェーン・オブ・ソート(Chain-of-Thought)のプロンプトと推論最適化モデルにより,監査指標のパフォーマンスが大幅に向上した。
論文 参考訳(メタデータ) (2025-04-24T13:32:30Z) - MindGYM: What Matters in Question Synthesis for Thinking-Centric Fine-Tuning? [51.85759493254735]
MindGYMは、質問合成のための構造化されスケーラブルなフレームワークである。
モデル合成の振る舞いを形作るために、高レベルの推論目的を注入する。
より深い推論のために、QAシードに基づいてより複雑なマルチホップ質問を構成する。
論文 参考訳(メタデータ) (2025-03-12T16:03:03Z) - Analyzing the Ethical Logic of Six Large Language Models [1.119697400073873]
本研究では,OpenAI GPT-4o, Meta LLaMA 3.1, Perplexity, Anthropic Claude 3.5 Sonnet, Google Gemini, Mistral 7Bの6つの著名な生成言語モデルの倫理的理由について検討した。
発見によると、LLMは、合理主義的、連帯主義的な強調が特徴で、しばしば害と公正を優先する決定を伴う、ほぼ収束した倫理論理を示す。
論文 参考訳(メタデータ) (2025-01-15T16:56:26Z) - The Moral Mind(s) of Large Language Models [0.0]
大規模言語モデル (LLM) は、その決定を導く道徳的嗜好の一貫性のある構造を示す。
確率論的合理性テストを用いて、各主要プロバイダの少なくとも1つのモデルが、ほぼ安定した道徳的嗜好と整合した振る舞いを示した。
そして、これらのユーティリティ関数を推定し、ほとんどのモデルが中立的な道徳的スタンスの周りに集まっていることを発見した。
論文 参考訳(メタデータ) (2024-11-19T15:40:16Z) - Exploring and steering the moral compass of Large Language Models [55.2480439325792]
大規模言語モデル(LLM)は、様々な分野における自動化と意思決定の推進の中心となっている。
本研究は,その道徳的特徴を評価するために,最も先進的なLCMの総合的比較分析を提案する。
論文 参考訳(メタデータ) (2024-05-27T16:49:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。