論文の概要: Cards Against LLMs: Benchmarking Humor Alignment in Large Language Models
- arxiv url: http://arxiv.org/abs/2604.08757v1
- Date: Thu, 09 Apr 2026 20:42:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.576117
- Title: Cards Against LLMs: Benchmarking Humor Alignment in Large Language Models
- Title(参考訳): LLMに対するカード: 大規模言語モデルにおけるHummorアライメントのベンチマーク
- Authors: Yousra Fettach, Guillaume Bied, Hannu Toivonen, Tijl De Bie,
- Abstract要約: ヒューモアは人類のコミュニケーションにおいて最も文化的に埋め込まれ、社会的に重要な次元の1つである。
モデル同士が人間と同意する頻度よりもはるかに頻繁に一致していることが示されています。
- 参考スコア(独自算出の注目度): 5.8065292265511514
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humor is one of the most culturally embedded and socially significant dimensions of human communication, yet it remains largely unexplored as a dimension of Large Language Model (LLM) alignment. In this study, five frontier language models play the same Cards Against Humanity games (CAH) as human players. The models select the funniest response from a slate of ten candidate cards across 9,894 rounds. While all models exceed the random baseline, alignment with human preference remains modest. More striking is that models agree with each other substantially more often than they agree with humans. We show that this preference is partly explained by systematic position biases and content preferences, raising the question whether LLM humor judgment reflects genuine preference or structural artifacts of inference and alignment.
- Abstract(参考訳): ヒューモアは人類のコミュニケーションにおいて最も文化的に埋め込まれ、社会的に重要な次元の1つであるが、大言語モデル(LLM)のアライメントの次元として探索されていない。
本研究では、5つのフロンティア言語モデルが人間のプレイヤーと同じカード対人間性ゲーム(CAH)をプレイする。
モデルは、9,894ラウンドにわたる10の候補カードのスレートから、最も面白い応答を選択する。
すべてのモデルはランダムなベースラインを超えるが、人間の好みとの整合性は控えめである。
さらに注目すべきは、モデル同士が人間と同意するよりも、かなり頻繁に一致していることです。
この嗜好は、体系的な位置バイアスとコンテンツ嗜好によって部分的に説明され、LLMのユーモア判断が真の嗜好を反映しているか、推測とアライメントの構造的アーティファクトを反映しているかという疑問が提起される。
関連論文リスト
- Can LLMs interpret figurative language as humans do?: surface-level vs representational similarity [0.0]
人的参加者と4つの命令調整 LLM は、6つの言語的特徴を表す240の対話に基づく文を評価した。
その結果、人間とLLMは表面レベルでは人間と一致していたが、表現レベルでは大きなばらつきが見られた。
GPT-4は人間の表現パターンを最もよく近似し、全てのモデルは文脈に依存し、社会的な表現に苦しむ。
論文 参考訳(メタデータ) (2026-01-14T00:13:00Z) - Beyond Human Judgment: A Bayesian Evaluation of LLMs' Moral Values Understanding [1.7635992653738075]
我々はアノテータ不一致をモデル化し、アレタリック不一致(遺伝性ヒト不一致)とてんかん不一致(モデルドメイン感度)の両方を捉える。
我々は、ソーシャルネットワーク、ニュース、フォーラムにまたがる100K以上のテキストにおいて、約700のアノテーションから250K以上のアノテーションにまたがる最高の言語モデルを評価する。
GPUに最適化されたBayesianフレームワークは、1M以上のモデルクエリを処理し、AIモデルが人間のアノテータの上位25%にランクされ、平均的なバランスの取れた精度よりもはるかに優れた結果が得られた。
論文 参考訳(メタデータ) (2025-08-19T13:05:48Z) - Surface Fairness, Deep Bias: A Comparative Study of Bias in Language Models [45.41676783204022]
大規模言語モデル(LLM)におけるバイアスの様々なプロキシ尺度について検討する。
MMLU (Multi-subject benchmark) を用いた人格評価モデルでは, スコアの無作為かつ大半がランダムな差が生じることがわかった。
LLMアシスタントメモリとパーソナライゼーションの最近の傾向により、これらの問題は異なる角度から開かれている。
論文 参考訳(メタデータ) (2025-06-12T08:47:40Z) - Spoken Stereoset: On Evaluating Social Bias Toward Speaker in Speech Large Language Models [50.40276881893513]
本研究では,音声大言語モデル(SLLM)における社会的バイアスの評価を目的としたデータセットであるSpken Stereosetを紹介する。
多様な人口集団の発話に対して異なるモデルがどのように反応するかを調べることで、これらのバイアスを特定することを目指している。
これらの結果から,ほとんどのモデルではバイアスが最小であるが,ステレオタイプや反ステレオタイプ傾向がわずかにみられた。
論文 参考訳(メタデータ) (2024-08-14T16:55:06Z) - Language Model Alignment in Multilingual Trolley Problems [138.5684081822807]
Moral Machine 実験に基づいて,MultiTP と呼ばれる100以上の言語でモラルジレンマヴィグネットの言語間コーパスを開発する。
分析では、19の異なるLLMと人間の判断を一致させ、6つのモラル次元をまたいだ嗜好を捉えた。
我々は、AIシステムにおける一様道徳的推論の仮定に挑戦し、言語間のアライメントの顕著なばらつきを発見した。
論文 参考訳(メタデータ) (2024-07-02T14:02:53Z) - Do Large Language Models Learn Human-Like Strategic Preferences? [0.0]
LLMは、戦略的シナリオにおいて人間のような選好判断をすることを学ぶ。
太陽とミストラルは、人間と一致した安定な値に基づく嗜好を示す。
論文 参考訳(メタデータ) (2024-04-11T19:13:24Z) - Speaking Multiple Languages Affects the Moral Bias of Language Models [70.94372902010232]
事前訓練された多言語言語モデル(PMLM)は、複数の言語からのデータや言語間転送を扱う際に一般的に用いられる。
モデルは英語から道徳的規範を捉え、他の言語に強制するか?
我々の実験は、事実、PMLMが道徳的バイアスを符号化していることを示しているが、これらは必ずしも人間の意見の文化的相違や共通点に対応しているわけではない。
論文 参考訳(メタデータ) (2022-11-14T20:08:54Z) - Do Multilingual Language Models Capture Differing Moral Norms? [71.52261949766101]
大量多言語文表現は、未処理データの大規模なコーパスに基づいて訓練される。
これは、高資源言語からの道徳的判断を含む文化的価値をモデルが把握する原因となる可能性がある。
特定の言語におけるデータ不足は、ランダムで潜在的に有害な信念を発達させる可能性がある。
論文 参考訳(メタデータ) (2022-03-18T12:26:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。