Fugu-MT 論文翻訳(概要): Chumor 2.0: Towards Benchmarking Chinese Humor Understanding

論文の概要: Chumor 2.0: Towards Benchmarking Chinese Humor Understanding

arxiv url: http://arxiv.org/abs/2412.17729v1
Date: Mon, 23 Dec 2024 17:19:58 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-24 19:42:48.520183
Title: Chumor 2.0: Towards Benchmarking Chinese Humor Understanding
Title（参考訳）: Chumor 2.0: 漢文理解のベンチマークに向けて
Authors: Ruiqi He, Yushu He, Longju Bai, Jiarui Liu, Zhenjie Sun, Zenghao Tang, He Wang, Hanchen Xia, Rada Mihalcea, Naihao Deng,
Abstract要約: Chumorは中国初のユーモアデータセットで、既存のユーモアデータセットの規模を超える。 Chumorは中国のRedditのようなプラットフォームで、知的に挑戦的で文化的に特定のジョークを共有することで有名だ。
参考スコア（独自算出の注目度）: 23.370445567734798
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Existing humor datasets and evaluations predominantly focus on English, leaving limited resources for culturally nuanced humor in non-English languages like Chinese. To address this gap, we construct Chumor, the first Chinese humor explanation dataset that exceeds the size of existing humor datasets. Chumor is sourced from Ruo Zhi Ba, a Chinese Reddit-like platform known for sharing intellectually challenging and culturally specific jokes. We test ten LLMs through direct and chain-of-thought prompting, revealing that Chumor poses significant challenges to existing LLMs, with their accuracy slightly above random and far below human. In addition, our analysis highlights that human-annotated humor explanations are significantly better than those generated by GPT-4o and ERNIE-4-turbo. We release Chumor at https://huggingface.co/datasets/dnaihao/Chumor, our project page is at https://dnaihao.github.io/Chumor-dataset/, our leaderboard is at https://huggingface.co/spaces/dnaihao/Chumor, and our codebase is at https://github.com/dnaihao/Chumor-dataset.
Abstract（参考訳）: 既存のユーモアデータセットと評価は主に英語に重点を置いており、中国語のような非英語の言語では、文化的にニュアンスのあるユーモアの限られた資源を残している。このギャップに対処するため,中国初のユーモア説明データセットであるChumorを構築した。 Chumorは中国のRedditのようなプラットフォームで、知的に挑戦的で文化的に特定のジョークを共有することで有名だ。直列と直列のプロンプトによって10個のLSMをテストしたところ、Chumorが既存のLSMに重大な課題をもたらし、その精度はランダムで人間よりはるかに低いことが判明した。また,本研究では,GPT-4oとERNIE-4-turboが生成したものよりも,人間のアノテーションによるユーモアの説明が有意に優れていることを強調した。 Chumor at https://huggingface.co/datasets/dnaihao/Chumor、プロジェクトページはhttps://dnaihao.github.io/Chumor-dataset/、リーダーボードはhttps://huggingface.co/spaces/dnaihao/Chumor、コードベースはhttps://github.com/dnaihao/Chumor-datasetです。

関連論文リスト

Comparing Apples to Oranges: A Dataset & Analysis of LLM Humour Understanding from Traditional Puns to Topical Jokes [14.762724547600447]
我々は,ユーモアを説明するためのLarge Language Models (LLMs) が,特定のユーモア形式に依存するかどうかを検討する。我々は、現実世界の実体や出来事の知識を必要とする単純な句とより複雑な話題のユーモアのモデルを比較する。テストされたどのモデルも、すべてのジョークの型についての十分な説明を確実に生成できないことがわかった。
論文参考訳（メタデータ） (2025-07-17T17:51:20Z)
From Punchlines to Predictions: A Metric to Assess LLM Performance in Identifying Humor in Stand-Up Comedy [6.124881326867511]
大きな言語モデルが広く採用されていることを踏まえ、ユーモアとAIの交わりは笑い事ではない。本研究では,スタンドアップコメディの書き起こしからユーモラスな引用を正確に識別するモデルの有効性を評価する。ユーモラスなパンチラインを抽出する能力について,様々なプロンプトの中からLLMを評価するために考案された新しいユーモラス検出指標を提案する。
論文参考訳（メタデータ） (2025-04-12T02:19:53Z)
Deceptive Humor: A Synthetic Multilingual Benchmark Dataset for Bridging Fabricated Claims with Humorous Content [0.0]
Deceptive Humor データセット (DHD) は、偽造されたクレームと誤情報から派生したユーモアを研究するための新しいリソースである。 DHDは、偽の物語から生成されたユーモアを注入したコメントで構成され、偽造されたクレームと操作された情報を取り入れている。データセットは、英語、Telugu、Hindi、Kannada、Tamil、およびそれらのコード混合変種(Te-En、Hi-En、Ka-En、Ta-En)を含む複数の言語にまたがる。
論文参考訳（メタデータ） (2025-03-20T10:58:02Z)
Can Pre-trained Language Models Understand Chinese Humor? [74.96509580592004]
本論文は,事前学習言語モデル(PLM)のユーモア理解能力を体系的に研究する最初の論文である。提案した評価フレームワークのすべてのデータ要件を完全に満たす中国の総合的ユーモアデータセットを構築した。中国のユーモアデータセットに関する実証的研究は、ユーモア理解と生成におけるPLMの将来の最適化に非常に役立つ貴重な観察結果をもたらす。
論文参考訳（メタデータ） (2024-07-04T18:13:38Z)
Is AI fun? HumorDB: a curated dataset and benchmark to investigate graphical humor [8.75275650545552]
HumorDBは、視覚的ユーモア理解を促進するために特別に設計された、イメージのみのデータセットである。このデータセットは、バイナリ分類、レンジ回帰、ペアワイズ比較タスクによる評価を可能にする。 HumorDBは、強力な大規模マルチモーダルモデルの貴重なベンチマークとしての可能性を示している。
論文参考訳（メタデータ） (2024-06-19T13:51:40Z)
Chumor 1.0: A Truly Funny and Challenging Chinese Humor Understanding Dataset from Ruo Zhi Ba [7.878358092927338]
われわれは、中国のRedditのようなプラットフォームであるRuo Zhi Ba(RZB)をベースとしたデータセットであるChumorを構築した。ジョークごとの説明に注釈を付け,2つの最先端LCM, GPT-4o, ERNIE Botに対する人間の説明を評価する。評価の結果,SOTA LLMにおいてもChumorは難易度が高く,人間によるChumorのジョークの説明はLLMによる説明よりもはるかに優れていることがわかった。
論文参考訳（メタデータ） (2024-06-18T16:22:05Z)
Getting Serious about Humor: Crafting Humor Datasets with Unfunny Large Language Models [27.936545041302377]
大規模言語モデル(LLM)は、テキストを編集することでユーモア検出のための合成データを生成することができる。我々は、既存の人間のデータセット上でLLMをベンチマークし、現在のLLMは、ジョークを「不快に」する印象的な能力を示すことを示す。我々は、GPT-4の合成データがバイリンガルアノテータによって高度に評価されているという、コード混成のイングリッシュ・ヒンディー語ユーモアデータセットにアプローチを拡張した。
論文参考訳（メタデータ） (2024-02-23T02:58:12Z)
ChatGPT is fun, but it is not funny! Humor is still challenging Large Language Models [19.399535453449488]
OpenAIのChatGPTモデルは、ほとんど人間レベルでコミュニケーションを取り、ジョークを言うことができます。ジョーク、すなわち生成、説明、検出に関する一連の探索実験において、ChatGPTの人間のユーモアを把握、再現する能力を理解しようと試みる。私たちの経験的証拠は、ジョークはハードコードではなく、主にモデルによって新たに生成されたものではないことを示している。
論文参考訳（メタデータ） (2023-06-07T16:10:21Z)
The Naughtyformer: A Transformer Understands Offensive Humor [63.05016513788047]
Redditから抽出された新しいジョークデータセットを導入し、Naughtyformerと呼ばれる微調整されたトランスフォーマーを用いてサブタイプ分類タスクを解決する。本モデルでは, ジョークの攻撃性の検出が, 最先端の手法と比較して有意に優れていることを示す。
論文参考訳（メタデータ） (2022-11-25T20:37:58Z)
ExPUNations: Augmenting Puns with Keywords and Explanations [88.58174386894913]
我々は、キーワードの詳細なクラウドソースアノテーションで既存の句のデータセットを拡張する。これは、パント専用の広範囲できめ細かなアノテーションを備えた最初のユーモアデータセットである。句分類支援のための説明生成とキーワード条件付き句生成という2つのタスクを提案する。
論文参考訳（メタデータ） (2022-10-24T18:12:02Z)
Towards Multimodal Prediction of Spontaneous Humour: A Novel Dataset and First Results [84.37263300062597]
風は人間の社会的行動、感情、認知の重要な要素である。現在のユーモア検出法は、ステージ化されたデータのみに基づいており、「現実世界」の応用には不十分である。約11時間の記録を含むPassau-Spontaneous Football Coach Humorデータセットを導入することで,この障害への対処に寄与する。
論文参考訳（メタデータ） (2022-09-28T17:36:47Z)
Do Androids Laugh at Electric Sheep? Humor "Understanding" Benchmarks from The New Yorker Caption Contest [70.40189243067857]
大きめのニューラルネットワークがジョークを生成できるようになったが、本当にユーモアを「理解」しているのだろうか? 私たちは、New Yorker Cartoon Caption Contestから派生した3つのタスクでAIモデルに挑戦します。どちらのモデルも3つのタスクすべてで苦労しています。
論文参考訳（メタデータ） (2022-09-13T20:54:00Z)
M2H2: A Multimodal Multiparty Hindi Dataset For Humor Recognition in Conversations [72.81164101048181]
テレビシリーズ『Shrimaan Shrimati Phir Se』の13話から6,191発の発声を含む会話におけるマルチモーダル・マルチパーティ・ヒンディー・ヒューム(M2H2)認識のためのデータセットを提案する。それぞれの発話はユーモア/非感情ラベルでアノテートされ、音響、視覚、テキストのモダリティを含む。 M2H2データセットにおける実験結果から,マルチモーダル情報はユーモア認識のための単調な情報を補完することが示された。
論文参考訳（メタデータ） (2021-08-03T02:54:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。