論文の概要: Multilingual Humour-Aware Retrieval with Dense and Re-Ranking Models
- arxiv url: http://arxiv.org/abs/2605.25165v1
- Date: Sun, 24 May 2026 16:50:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.92922
- Title: Multilingual Humour-Aware Retrieval with Dense and Re-Ranking Models
- Title(参考訳): 多言語Humour-Aware Retrieval with Dense and Re-Ranking Models
- Authors: Georgios Arampatzis, Avi Arampatzis,
- Abstract要約: Team DUTH は CLEF 2025 JOKER Task 1 ベンチマークを用いて,多言語対応の情報検索を研究している。
提案手法は,多言語XLM-RoBERTaに基づく高密度検索と,ニューラルリランクを含む追加のシステム変種を組み合わせたものである。
- 参考スコア(独自算出の注目度): 0.4640835690336653
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humour-aware information retrieval poses unique challenges beyond standard semantic retrieval, as systems must account not only for topical relevance but also for humour-specific linguistic phenomena such as wordplay, phonetic ambiguity, and polysemy. In this paper, Team DUTH studies multilingual humour-aware information retrieval using the CLEF 2025 JOKER Task 1 benchmark, which evaluates humour retrieval in English and Portuguese. Our approach combines multilingual XLM-RoBERTa-based dense retrieval with additional system variants, including neural re-ranking, in order to assess the extent to which general-purpose Transformer models can capture humour-specific relevance. The results reveal substantial cross-lingual variation. While the Portuguese runs demonstrate comparatively strong performance across MAP, MRR, and early precision metrics, the English runs perform significantly worse, with relevant humorous documents frequently appearing at lower ranks. These findings highlight the limitations of purely semantic dense representations for humour retrieval, particularly when humour depends on surface-level cues that are not explicitly modelled by multilingual encoders. We further analyse contributing factors to this discrepancy, including dataset characteristics, query-document alignment, and variation in humour mechanisms. Overall, the Team DUTH experiments establish multilingual dense-retrieval and re-ranking baselines and provide insights into the challenges of modelling humour-aware relevance within the JOKER framework.
- Abstract(参考訳): ヒュームアウェア情報検索は、話題の関連性だけでなく、言葉遊び、音声のあいまいさ、多意味性といったユーモア固有の言語現象も考慮しなければならないため、標準的な意味検索以上の難題を生じさせる。
本稿では,英語とポルトガル語のユーモア検索を評価するCLEF 2025 JOKER Task 1ベンチマークを用いて,多言語対応のユーモア情報検索について検討する。
提案手法は,多言語XLM-RoBERTaに基づく高密度検索とニューラルリランクを含む追加のシステム変種を組み合わせることで,汎用トランスフォーマーモデルがユーモア固有の妥当性をどの程度捉えることができるかを評価する。
その結果、言語間の大きな違いが明らかとなった。
ポルトガルのランはMAP、MRR、早期精度の指標で比較的強いパフォーマンスを示したが、イングランドのランは著しく悪化し、関連するユーモアの文書は低いランクにしばしば現れる。
これらの知見は、ユーモア検索のための純粋に意味的な密度表現の限界、特にユーモアが多言語エンコーダで明示的にモデル化されていない表面レベルの手がかりに依存している場合を浮き彫りにする。
我々はさらに,データセットの特徴,クエリ文書のアライメント,ユーモア機構の変動など,この相違に対する寄与要因を分析した。
総合的に、チームDUTH実験は、多言語で密集した検索と再ランクのベースラインを確立し、JOKERフレームワーク内でユーモアを意識した妥当性をモデル化する上での課題に対する洞察を提供する。
関連論文リスト
- Investigating Language Preference of Multilingual RAG Systems [4.438698005789677]
MRAGシステムは、クエリとドキュメント間の言語的バリエーションによって、関連する情報を取得するのに苦労する。
DKM-RAG(Dual Knowledge Multilingual RAG)は,翻訳された多言語パスを相補的なモデル知識で融合するフレームワークである。
実験結果から,DKM-RAGは言語嗜好を緩和し,多様な言語環境における性能向上を図っている。
論文 参考訳(メタデータ) (2025-02-16T15:54:05Z) - Examining Multilingual Embedding Models Cross-Lingually Through LLM-Generated Adversarial Examples [29.62231663945077]
本稿では,並列文のみを必要とする軽量な評価タスクである言語間セマンティック識別(D)と,対向的気晴らしを生成するLarge Language Model(LLM)を導入する。
CLSDは、意味的に誤解を招くが、語彙的に類似した代替品の上に、真の並列文をランク付けする埋め込みモデルの能力を測定する。
我々の実験では、検索タスクに微調整されたモデルは、英語をピボットすることの恩恵を受ける一方、bitextマイニングモデルは、直接言語間設定で最高のパフォーマンスを示す。
論文 参考訳(メタデータ) (2025-02-12T18:54:37Z) - mFollowIR: a Multilingual Benchmark for Instruction Following in Retrieval [61.17793165194077]
本稿では,検索モデルにおける命令追従能力のベンチマークであるmFollowIRを紹介する。
本稿では,多言語 (XX-XX) と多言語 (En-XX) のパフォーマンスについて述べる。
英語をベースとした学習者による多言語間性能は高いが,多言語設定では顕著な性能低下がみられた。
論文 参考訳(メタデータ) (2025-01-31T16:24:46Z) - P-MMEval: A Parallel Multilingual Multitask Benchmark for Consistent Evaluation of LLMs [84.24644520272835]
本稿では,P-MMEvalを提案する。P-MMEval,P-MMEval,P-MMEval,P-MMEval,P-MMEval,P-MMEval,P-MMEval,P-MMEval,P-MMEval,P-MMEval,P-MMEval,P -M
P-MMEvalは、さまざまなデータセットにわたって一貫した言語カバレッジを提供し、並列サンプルを提供する。
我々は、モデルとタスク間の性能を比較するために、代表的多言語モデル系列に関する広範な実験を行う。
論文 参考訳(メタデータ) (2024-11-14T01:29:36Z) - On Cross-Lingual Retrieval with Multilingual Text Encoders [51.60862829942932]
言語間文書・文検索タスクにおける最先端多言語エンコーダの適合性について検討する。
教師なしのアドホック文と文書レベルのCLIR実験でそれらの性能をベンチマークする。
我々は、ゼロショット言語とドメイン転送CLIR実験のシリーズにおける英語関連データに基づいて、教師付き方式で微調整された多言語エンコーダの評価を行った。
論文 参考訳(メタデータ) (2021-12-21T08:10:27Z) - Evaluating Multilingual Text Encoders for Unsupervised Cross-Lingual
Retrieval [51.60862829942932]
本稿では,言語間文書・文検索タスクにおける最先端多言語エンコーダの適合性に着目した体系的実証研究を行う。
文レベルのCLIRでは、最先端のパフォーマンスが達成できることを実証する。
しかし、ピーク性能は、汎用の多言語テキストエンコーダをオフ・ザ・シェルフで使うのではなく、文の理解タスクにさらに特化したバリエーションに依存している。
論文 参考訳(メタデータ) (2021-01-21T00:15:38Z) - VECO: Variable and Flexible Cross-lingual Pre-training for Language
Understanding and Generation [77.82373082024934]
我々はTransformerエンコーダにクロスアテンションモジュールを挿入し、言語間の相互依存を明確に構築する。
独自の言語でコンテキストにのみ条件付けされたマスク付き単語の予測の退化を効果的に回避することができる。
提案した言語間モデルでは,XTREMEベンチマークのさまざまな言語間理解タスクに対して,最先端の新たな結果が提供される。
論文 参考訳(メタデータ) (2020-10-30T03:41:38Z) - Predicting the Humorousness of Tweets Using Gaussian Process Preference
Learning [56.18809963342249]
本稿では,人間の嗜好判断と言語アノテーションの自動生成を利用して,短文のユーモラスさのランク付けと評価を学習する確率論的アプローチを提案する。
本研究は, HAHA@IberLEF 2019データにおける数値スコアの変換と, 提案手法に必要な判定アノテーションの相互変換から生じる問題点について報告する。
論文 参考訳(メタデータ) (2020-08-03T13:05:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。