論文の概要: SaRoHead: A Dataset for Satire Detection in Romanian Multi-Domain News Headlines
- arxiv url: http://arxiv.org/abs/2504.07612v1
- Date: Thu, 10 Apr 2025 10:03:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-11 12:21:35.327383
- Title: SaRoHead: A Dataset for Satire Detection in Romanian Multi-Domain News Headlines
- Title(参考訳): SaRoHead: ルーマニアのマルチドメインニュース見出しにおけるサファイア検出用データセット
- Authors: Mihnea-Alexandru Vîrlan, Răzvan-Alexandru Smădu, Dumitru-Clementin Cercel,
- Abstract要約: SaRoHeadはルーマニアの多ドメインニュースの見出しで風刺検出のための最初のコーパスである。
以上の結果から,ノンサチリカルな見出しで使用されるクリックベイトがモデルに大きく影響していることが示唆された。
- 参考スコア(独自算出の注目度): 1.6976911886883272
- License:
- Abstract: The headline is an important part of a news article, influenced by expressiveness and connection to the exposed subject. Although most news outlets aim to present reality objectively, some publications prefer a humorous approach in which stylistic elements of satire, irony, and sarcasm blend to cover specific topics. Satire detection can be difficult because a headline aims to expose the main idea behind a news article. In this paper, we propose SaRoHead, the first corpus for satire detection in Romanian multi-domain news headlines. Our findings show that the clickbait used in some non-satirical headlines significantly influences the model.
- Abstract(参考訳): 見出しは、露出した被写体への表現性やつながりに影響を受け、ニュース記事の重要な部分である。
ほとんどの報道機関は現実を客観的に提示することを目標としているが、一部の出版物は風刺、皮肉、皮肉のスタイル的要素が特定の話題をカバーするためにブレンドされるユーモラスなアプローチを好んでいる。
見出しは、ニュース記事の背後にある主要なアイデアを公開することを目的としているため、サファイア検出は困難である。
本稿では,ルーマニアのマルチドメインニュースの見出しにおいて,最初の風刺検出コーパスであるSaRoHeadを提案する。
以上の結果から,ノンサティリカルな見出しで使用されるクリックベイトがモデルに大きく影響していることが示唆された。
関連論文リスト
- Adapting Fake News Detection to the Era of Large Language Models [48.5847914481222]
我々は,機械による(言い換えられた)リアルニュース,機械生成のフェイクニュース,人書きのフェイクニュース,人書きのリアルニュースの相互作用について検討する。
我々の実験では、人書き記事のみに特化して訓練された検知器が、機械が生成したフェイクニュースを検出できる興味深いパターンを明らかにしましたが、その逆ではありません。
論文 参考訳(メタデータ) (2023-11-02T08:39:45Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - NewsEdits: A News Article Revision Dataset and a Document-Level
Reasoning Challenge [122.37011526554403]
NewsEditsは、最初に公開されたニュースリビジョン履歴のデータセットである。
120万記事と、22以上の英語とフランス語の新聞ソースから460万バージョンを収録している。
論文 参考訳(メタデータ) (2022-06-14T18:47:13Z) - SaRoCo: Detecting Satire in a Novel Romanian Corpus of News Articles [15.877673959068455]
言語に関係なく風刺検出のための最大のコーポラの一つであり、ルーマニア語のための唯一のコーポラである。
2つの最先端のディープニューラルモデルで実験を行い、その結果、新しいコーパスの強力なベースラインが出来上がった。
その結果,ルーマニア語における風刺検出の機械レベルの精度は,人間レベルの精度(87%)に比べ非常に低く,今後の研究に十分な改善の余地を残していることがわかった。
論文 参考訳(メタデータ) (2021-05-13T17:54:37Z) - Misinfo Belief Frames: A Case Study on Covid & Climate News [49.979419711713795]
読者がニュースの信頼性や誤った情報の影響をどのように認識するかを理解するための形式主義を提案する。
23.5kの見出しに66kの推論データセットであるMisinfo Belief Frames (MBF) corpusを紹介する。
大規模言語モデルを用いて誤情報フレームを予測した結果,機械生成推論がニュース見出しに対する読者の信頼に影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2021-04-18T09:50:11Z) - Birds of a Feather Flock Together: Satirical News Detection via Language
Model Differentiation [7.556286423133077]
風刺的なニュースでは、文脈の語彙的・実践的な属性が読者を楽しませる上で重要な要素である。
本稿では,風刺ニュースと真のニュースを区別する手法を提案する。
論文 参考訳(メタデータ) (2020-07-04T18:46:36Z) - Diverse, Controllable, and Keyphrase-Aware: A Corpus and Method for News
Multi-Headline Generation [98.98411895250774]
ユーザ関心のキーワードで複数の見出しを生成することを提案する。
提案手法は,品質と多様性の観点から,最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-04-08T08:30:05Z) - Satirical News Detection with Semantic Feature Extraction and
Game-theoretic Rough Sets [5.326582776477692]
本稿では,風刺的なニュースツイートを検出するための意味的特徴に基づくアプローチを提案する。
特徴は、句、実体、および主節と相対節の間の矛盾を探索することによって抽出される。
確率しきい値がゲーム平衡と繰り返し学習機構によって導出される風刺ニュースを検出するために,ゲーム理論ラフセットモデルを適用した。
論文 参考訳(メタデータ) (2020-04-08T03:22:21Z) - BaitWatcher: A lightweight web interface for the detection of
incongruent news headlines [27.29585619643952]
BaitWatcherは軽量なWebインターフェースで、ニュース記事の見出しをクリックする前に、読者が不一致の可能性を推定する。
BaiittWatcherは階層的リカレントエンコーダを使用して、ニュース見出しとその関連するボディテキストの複雑なテキスト表現を効率的に学習する。
論文 参考訳(メタデータ) (2020-03-23T23:43:02Z) - HoaxItaly: a collection of Italian disinformation and fact-checking
stories shared on Twitter in 2019 [72.96986027203377]
データセットには約37Kのニュース記事のタイトルとボディも含まれている。
https://doi.org/10.79DVN/PGVDHXで公開されている。
論文 参考訳(メタデータ) (2020-01-29T16:14:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。