論文の概要: HumorGen: Cognitive Synergy for Humor Generation in Large Language Models via Persona-Based Distillation
- arxiv url: http://arxiv.org/abs/2604.09629v1
- Date: Thu, 19 Mar 2026 13:12:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.5763
- Title: HumorGen: Cognitive Synergy for Humor Generation in Large Language Models via Persona-Based Distillation
- Title(参考訳): HumorGen:ペルソナ蒸留による大規模言語モデルにおけるHummor生成の認知シナジー
- Authors: Edward Ajayi, Prasenjit Mitra,
- Abstract要約: 本稿では,高品質なユーモアデータを生成する手法であるCognitive Synergy Frameworkを紹介する。
我々は6つの認知的ペルソナを配置し、与えられたプロンプトのために多様な喜劇的視点を合成する。
認知駆動型データは、ユーモア生成のためのアライメントアルゴリズムやモデルスケールよりもはるかに重要である。
- 参考スコア(独自算出の注目度): 13.570863502498336
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humor generation poses a significant challenge for Large Language Models (LLMs), because their standard training objective - predicting the most likely next word - inherently conflicts with the surprise and incongruity needed for comedy. To bridge this gap, we introduce the Cognitive Synergy Framework, a theoretically grounded methodology for generating high-quality humor data inspired by psychological theories of humor. Utilizing a Mixture-of-Thought (MoT) approach, we deploy six cognitive personas (e.g., The Absurdist, The Cynic) to synthesize diverse comedic perspectives for a given prompt. This framework creates a theoretically grounded dataset, which we use to fine-tune a 7B-parameter student model. We compare Direct Preference Optimization (DPO) and a novel Offline Group Relative Policy Optimization (O-GRPO); our 7B model significantly outperforms larger instruction-tuned baselines and achieves performance competitive with state-of-the-art proprietary models. We find that cognitive-driven data curation is far more critical than alignment algorithms or model scale for humor generation. Code and data will be available upon publication.
- Abstract(参考訳): 広範言語モデル(LLM)では、その標準的なトレーニング目標である、最も可能性の高い次の単語を予測することが、コメディーに必要な驚きと不整合と本質的に矛盾するからである。
このギャップを埋めるために,心理学的ユーモア理論にインスパイアされた高品質なユーモアデータを生成するための理論的な基盤となる手法であるCognitive Synergy Frameworkを導入する。
また,Mixture-of-Thought (MoT) アプローチを用いて6人の認知的人物(例えば,The Absurdist,The Cynic)を配置し,特定のプロンプトに対して様々な喜劇的視点を合成する。
このフレームワークは理論的に基底化されたデータセットを生成し、7Bパラメーターの学生モデルを微調整するために使用します。
我々は,DPO(Direct Preference Optimization)とO-GRPO(Offline Group Relative Policy Optimization)を比較した。
認知駆動型データキュレーションは、ユーモア生成のためのアライメントアルゴリズムやモデルスケールよりもはるかに重要である。
コードとデータは公開時に公開されます。
関連論文リスト
- From Perception to Punchline: Empowering VLM with the Art of In-the-wild Meme [5.462301274468853]
HUMORは,階層的推論を通じてミームを誘導し,グループ的な人間の嗜好と整合させる新しいフレームワークである。
主観的ユーモアを捉えるために、同じテンプレートを共有するミームのグループ内で機能するペアワイズ報酬モデルを訓練する。
本研究は,オープンエンド・ヒューマンアライメント型マルチモーダル生成のための一般的なトレーニングパラダイムを提案する。
論文 参考訳(メタデータ) (2025-12-31T01:35:49Z) - PRISM: A Personality-Driven Multi-Agent Framework for Social Media Simulation [24.36529339525981]
パーソナリティ・リフラクト・インテリジェント・シミュレーション・モデル (PRISM) を導入する。
PRISMは、標準的な均一性やビッグファイブベンチマークよりも優れた、人間の根拠の真理との整合性を達成している。
この枠組みは合理的な抑圧や感情共鳴のような創発的な現象を効果的に再現し、複雑なソーシャルメディアエコシステムを解析するための堅牢なツールを提供する。
論文 参考訳(メタデータ) (2025-12-22T23:31:49Z) - HUMORCHAIN: Theory-Guided Multi-Stage Reasoning for Interpretable Multimodal Humor Generation [13.49193658655368]
噂は、創造的な人間の活動と社会的結びつきのメカニズムの両方として、AI生成において長年大きな課題を提起してきた。
理論誘導型多段階推論フレームワークHUMORCHAINを提案する。
視覚的意味解析、ユーモアと心理学に基づく推論、そしてユーモア評価のための微調整された識別器を統合している。
論文 参考訳(メタデータ) (2025-11-21T09:52:46Z) - A Survey on Generative Recommendation: Data, Model, and Tasks [55.36322811257545]
ジェネレーティブ・レコメンデーションは、差別的なスコアではなく、世代としてのレコメンデーションを再認識する。
この調査は、データ、モデル、タスク次元にまたがる統合された三部構成のフレームワークを通じて包括的な調査を提供する。
世界知識の統合、自然言語理解、推論能力、スケーリング法則、創造的生成の5つの主要な利点を特定します。
論文 参考訳(メタデータ) (2025-10-31T04:02:58Z) - Prismatic Synthesis: Gradient-based Data Diversification Boosts Generalization in LLM Reasoning [77.120955854093]
我々は,データ多様性が言語モデルにおける一般化の強力な予測因子であることを示す。
モデル誘起勾配のエントロピーを通して多様性を定量化する計量であるG-Vendiを導入する。
多様な合成データを生成するためのフレームワークであるPrismatic Synthesisを提案する。
論文 参考訳(メタデータ) (2025-05-26T16:05:10Z) - MindGYM: What Matters in Question Synthesis for Thinking-Centric Fine-Tuning? [51.85759493254735]
MindGYMは、質問合成のための構造化されスケーラブルなフレームワークである。
モデル合成の振る舞いを形作るために、高レベルの推論目的を注入する。
より深い推論のために、QAシードに基づいてより複雑なマルチホップ質問を構成する。
論文 参考訳(メタデータ) (2025-03-12T16:03:03Z) - Explore Theory of Mind: Program-guided adversarial data generation for theory of mind reasoning [88.68573198200698]
本研究では,多様で挑戦的な心的データ理論を大規模に生成するための最初のフレームワークであるExploreToMを紹介する。
我々のアプローチは、A*検索をカスタムドメイン特化言語に利用して、複雑なストーリ構造と、新しく、多様だが、もっともらしいシナリオを生成します。
評価の結果,Llama-3.1-70B や GPT-4o などの最先端 LLM はExploreToM 生成データに対して0%,9% の精度を示した。
論文 参考訳(メタデータ) (2024-12-12T21:29:00Z) - Promises and Pitfalls of Generative Masked Language Modeling: Theoretical Framework and Practical Guidelines [74.42485647685272]
GMLM(Generative Masked Language Models)に焦点を当てる。
我々は,マルコフ連鎖の入力として使用されるマスキングにより,データ分布の条件付き確率に適合するモデルを訓練し,モデルからサンプルを抽出する。
我々は,T5モデルを並列デコーディングに適応させ,最小品質の犠牲を伴って機械翻訳における2~3倍の高速化を実現した。
論文 参考訳(メタデータ) (2024-07-22T18:00:00Z) - Towards Multimodal Prediction of Spontaneous Humour: A Novel Dataset and First Results [84.37263300062597]
風は人間の社会的行動、感情、認知の重要な要素である。
現在のユーモア検出法は、ステージ化されたデータのみに基づいており、「現実世界」の応用には不十分である。
約11時間の記録を含むPassau-Spontaneous Football Coach Humorデータセットを導入することで,この障害への対処に寄与する。
論文 参考訳(メタデータ) (2022-09-28T17:36:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。