論文の概要: lmfaoooo at SemEval-2026 Task 1: Humor Is an Audience. Preference Modeling for Constrained Humor Generation
- arxiv url: http://arxiv.org/abs/2606.00022v1
- Date: Tue, 14 Apr 2026 12:56:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.580603
- Title: lmfaoooo at SemEval-2026 Task 1: Humor Is an Audience. Preference Modeling for Constrained Humor Generation
- Title(参考訳): Lmfaoooo at SemEval-2026 Task 1: Humor is audience. Preference Modeling for Constrained Humor Generation
- Authors: Alexey Tikhonov, Alexey Ivanov,
- Abstract要約: 本稿では,厳密な制約下でのユーモア生成に焦点を当てたSemEval-2026 Task-1(MWAHAHA)について述べる。
このタスクは、1-on-1アリーナスタイルの比較において、人間の嗜好判断を介して提出されたシステムを評価する。
MWAHAHAの英語・中国語サブタスクでは1位,スペイン語サブタスクでは2位にランクインした。
- 参考スコア(独自算出の注目度): 5.924227288651974
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humor generation remains difficult not only because producing fluent, novel jokes is hard, but because "funny" is audience-dependent and supervision is noisy -- preferences vary with audience, context, and culture, and annotator agreement is often low. In this paper, we describe our system for the SemEval-2026 Task-1 (MWAHAHA), which focuses on humor generation under explicit constraints. The task evaluates submitted systems via human preference judgments in 1-on-1 arena-style comparisons. We adopt a "generate-many -> select-best" strategy. First, we generate a diverse pool of candidates per instance using multi-step prompting, model ensembling, and diversity-oriented decoding. Second, we select outputs using a preference model that approximates a "reader" by learning from human comparisons rather than absolute funniness scores. To support this approach, we release 2.5K human pairwise judgments collected through the Humor Arena prototype. We further propose an interpretable pipeline that converts labeled comparisons into a preference model. Across three preference datasets, our models consistently outperform baselines and show stronger cross-domain transfer. Finally, we apply the learned preference model to rank candidates for the MWAHAHA setting and release intermediate artifacts (candidate pools and rankings) to facilitate follow-up work. Our system ranked 1st in the English and Chinese subtasks of MWAHAHA and 2nd in the Spanish subtask.
- Abstract(参考訳): ユーモア生成は、流動的で斬新なジョークを生み出すことが難しいだけでなく、"面白い"が観客に依存しており、監督がうるさいため、オーディエンス、コンテキスト、文化によって好みが異なり、アノテータの合意は低いことが多いため、依然として難しいままである。
本稿では,厳密な制約下でのユーモア生成に着目したSemEval-2026 Task-1(MWAHAHA)について述べる。
このタスクは、1-on-1アリーナスタイルの比較において、人間の嗜好判断を介して提出されたシステムを評価する。
我々は、"ジェネレート・マネ -> セレクト・ベスト"戦略を採用しています。
まず、マルチステッププロンプト、モデルアンサンブル、多様性指向のデコーディングを用いて、インスタンス毎に多様な候補プールを生成する。
第2に、絶対的な面白さスコアではなく、人間の比較から学習することで「読み手」を近似する選好モデルを用いて出力を選択する。
このアプローチを支援するために,Humor Arenaのプロトタイプを用いて収集した2.5万個の人間対の判断を公表する。
さらに,ラベル付き比較を選好モデルに変換する解釈可能なパイプラインを提案する。
3つの選好データセットを通して、我々のモデルは一貫してベースラインを上回り、より強力なクロスドメイン転送を示す。
最後に、学習した選好モデルを用いて、MWAHA設定の候補をランク付けし、中間成果物(候補プールとランキング)を解放し、フォローアップ作業を容易にする。
MWAHAHAの英語・中国語サブタスクでは1位,スペイン語サブタスクでは2位にランクインした。
関連論文リスト
- HumorGen: Cognitive Synergy for Humor Generation in Large Language Models via Persona-Based Distillation [13.570863502498336]
本稿では,高品質なユーモアデータを生成する手法であるCognitive Synergy Frameworkを紹介する。
我々は6つの認知的ペルソナを配置し、与えられたプロンプトのために多様な喜劇的視点を合成する。
認知駆動型データは、ユーモア生成のためのアライメントアルゴリズムやモデルスケールよりもはるかに重要である。
論文 参考訳(メタデータ) (2026-03-19T13:12:53Z) - Are LLMs Enough for Hyperpartisan, Fake, Polarized and Harmful Content Detection? Evaluating In-Context Learning vs. Fine-Tuning [20.193445005516363]
本研究では,超党派・フェイクニュース,有害ツイート,政治的偏見を検出するための多言語モデル適応パラダイムの概要を述べる。
パラメータ効率のよい言語モデルの微調整から、さまざまなインコンテキスト学習戦略やプロンプトまで、さまざまな戦略を試した。
論文 参考訳(メタデータ) (2025-09-09T14:01:15Z) - ComPO: Community Preferences for Language Model Personalization [122.54846260663922]
ComPOは、言語モデルにおける好みの最適化をパーソナライズする手法である。
ComPRedはRedditからコミュニティレベルの好みを持った質問応答データセットです。
論文 参考訳(メタデータ) (2024-10-21T14:02:40Z) - A Probability--Quality Trade-off in Aligned Language Models and its Relation to Sampling Adaptors [50.046717886067555]
一致した言語モデルからコーパスをサンプリングする場合,文字列の平均報酬と平均ログ類似度との間にはトレードオフが存在することを示す。
我々は、この現象を形式的に処理し、サンプリングアダプタの選択が、どれだけの確率で報酬を交換できるかを選択できるかを実証する。
論文 参考訳(メタデータ) (2024-06-14T17:38:21Z) - Audience-Centric Natural Language Generation via Style Infusion [5.6732899077715375]
本稿では,事前学習された言語生成モデルにおける聴衆のスタイル的嗜好に影響を及ぼす,新しいスタイル注入の課題を提案する。
限定的な人間の判断を利用して、スタイル分析モデルをブートストラップし、シードセットの判断を強化する。
我々の注入アプローチは、ジェネリックテキストプロンプトを用いた魅力的なスタイル化された例を生成することができる。
論文 参考訳(メタデータ) (2023-01-24T19:57:50Z) - Robust Preference Learning for Storytelling via Contrastive
Reinforcement Learning [53.92465205531759]
制御された自動ストーリ生成は、自然言語批判や嗜好から制約を満たす自然言語ストーリを生成することを目指している。
対照的なバイエンコーダモデルをトレーニングし、ストーリーを人間の批評と整合させ、汎用的な嗜好モデルを構築する。
我々はさらに、ストーリー生成の堅牢性を高めるために、プロンプトラーニング技術を用いて、対照的な報酬モデルを微調整する。
論文 参考訳(メタデータ) (2022-10-14T13:21:33Z) - Predicting the Humorousness of Tweets Using Gaussian Process Preference
Learning [56.18809963342249]
本稿では,人間の嗜好判断と言語アノテーションの自動生成を利用して,短文のユーモラスさのランク付けと評価を学習する確率論的アプローチを提案する。
本研究は, HAHA@IberLEF 2019データにおける数値スコアの変換と, 提案手法に必要な判定アノテーションの相互変換から生じる問題点について報告する。
論文 参考訳(メタデータ) (2020-08-03T13:05:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。