論文の概要: SaRoHead: Detecting Satire in a Multi-Domain Romanian News Headline Dataset
- arxiv url: http://arxiv.org/abs/2504.07612v2
- Date: Thu, 28 Aug 2025 16:22:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-29 13:55:31.042691
- Title: SaRoHead: Detecting Satire in a Multi-Domain Romanian News Headline Dataset
- Title(参考訳): SaRoHead: マルチドメインルーマニアのニュース見出しデータセットでサファイアを検出する
- Authors: Mihnea-Alexandru Vîrlan, Răzvan-Alexandru Smădu, Dumitru-Clementin Cercel, Florin Pop, Mihaela-Claudia Cercel,
- Abstract要約: 見出しでさえ、風刺的な主内容のトーンを反映しなければならない。
ルーマニア語に対する現在のアプローチは、メイン記事と見出しを組み合わせることでトーンを検出する。
- 参考スコア(独自算出の注目度): 3.1208433686641666
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The primary goal of a news headline is to summarize an event in as few words as possible. Depending on the media outlet, a headline can serve as a means to objectively deliver a summary or improve its visibility. For the latter, specific publications may employ stylistic approaches that incorporate the use of sarcasm, irony, and exaggeration, key elements of a satirical approach. As such, even the headline must reflect the tone of the satirical main content. Current approaches for the Romanian language tend to detect the non-conventional tone (i.e., satire and clickbait) of the news content by combining both the main article and the headline. Because we consider a headline to be merely a brief summary of the main article, we investigate in this paper the presence of satirical tone in headlines alone, testing multiple baselines ranging from standard machine learning algorithms to deep learning models. Our experiments show that Bidirectional Transformer models outperform both standard machine-learning approaches and Large Language Models (LLMs), particularly when the meta-learning Reptile approach is employed.
- Abstract(参考訳): ニュースの見出しの主な目標は、イベントをできるだけ少ない言葉で要約することだ。
メディアメディアによっては、見出しは客観的に要約を配信したり、その可視性を改善する手段として機能する。
後者については、特定の出版物は皮肉、皮肉、誇張を取り入れた様式的なアプローチを採用することができる。
そのため、見出しでさえ風刺的な主内容のトーンを反映しなければならない。
ルーマニア語に対する現在のアプローチは、メイン記事と見出しの両方を組み合わせることで、ニュースコンテンツの非伝統的なトーン(風刺とクリックベイト)を検出する傾向がある。
本論文では,見出しをメイン記事の簡単な要約にすぎないと考えているので,標準的な機械学習アルゴリズムからディープラーニングモデルまで,複数のベースラインをテストすることで,見出しに風刺的なトーンの存在を調査する。
実験により,双方向トランスフォーマーモデルは,メタラーニング・レプタイル・アプローチを採用する場合,標準的な機械学習手法とLarge Language Models(LLMs)の両方より優れていることがわかった。
関連論文リスト
- MuSaRoNews: A Multidomain, Multimodal Satire Dataset from Romanian News Articles [1.232097230344824]
この研究は、ルーマニアのニュース記事 MuSaRoNews において、風刺検出のためのマルチモーダルコーパスを導入している。
具体的には,ルーマニア語における風刺検出のための最初のマルチモーダルコーパスを構成する,現実的および風刺的なニュースソースから117,834件の公開ニュース記事を収集した。
論文 参考訳(メタデータ) (2025-04-10T15:02:59Z) - Adapting Fake News Detection to the Era of Large Language Models [48.5847914481222]
我々は,機械による(言い換えられた)リアルニュース,機械生成のフェイクニュース,人書きのフェイクニュース,人書きのリアルニュースの相互作用について検討する。
我々の実験では、人書き記事のみに特化して訓練された検知器が、機械が生成したフェイクニュースを検出できる興味深いパターンを明らかにしましたが、その逆ではありません。
論文 参考訳(メタデータ) (2023-11-02T08:39:45Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - NewsEdits: A News Article Revision Dataset and a Document-Level
Reasoning Challenge [122.37011526554403]
NewsEditsは、最初に公開されたニュースリビジョン履歴のデータセットである。
120万記事と、22以上の英語とフランス語の新聞ソースから460万バージョンを収録している。
論文 参考訳(メタデータ) (2022-06-14T18:47:13Z) - SaRoCo: Detecting Satire in a Novel Romanian Corpus of News Articles [15.877673959068455]
言語に関係なく風刺検出のための最大のコーポラの一つであり、ルーマニア語のための唯一のコーポラである。
2つの最先端のディープニューラルモデルで実験を行い、その結果、新しいコーパスの強力なベースラインが出来上がった。
その結果,ルーマニア語における風刺検出の機械レベルの精度は,人間レベルの精度(87%)に比べ非常に低く,今後の研究に十分な改善の余地を残していることがわかった。
論文 参考訳(メタデータ) (2021-05-13T17:54:37Z) - Misinfo Belief Frames: A Case Study on Covid & Climate News [49.979419711713795]
読者がニュースの信頼性や誤った情報の影響をどのように認識するかを理解するための形式主義を提案する。
23.5kの見出しに66kの推論データセットであるMisinfo Belief Frames (MBF) corpusを紹介する。
大規模言語モデルを用いて誤情報フレームを予測した結果,機械生成推論がニュース見出しに対する読者の信頼に影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2021-04-18T09:50:11Z) - Birds of a Feather Flock Together: Satirical News Detection via Language
Model Differentiation [7.556286423133077]
風刺的なニュースでは、文脈の語彙的・実践的な属性が読者を楽しませる上で重要な要素である。
本稿では,風刺ニュースと真のニュースを区別する手法を提案する。
論文 参考訳(メタデータ) (2020-07-04T18:46:36Z) - Diverse, Controllable, and Keyphrase-Aware: A Corpus and Method for News
Multi-Headline Generation [98.98411895250774]
ユーザ関心のキーワードで複数の見出しを生成することを提案する。
提案手法は,品質と多様性の観点から,最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-04-08T08:30:05Z) - Satirical News Detection with Semantic Feature Extraction and
Game-theoretic Rough Sets [5.326582776477692]
本稿では,風刺的なニュースツイートを検出するための意味的特徴に基づくアプローチを提案する。
特徴は、句、実体、および主節と相対節の間の矛盾を探索することによって抽出される。
確率しきい値がゲーム平衡と繰り返し学習機構によって導出される風刺ニュースを検出するために,ゲーム理論ラフセットモデルを適用した。
論文 参考訳(メタデータ) (2020-04-08T03:22:21Z) - BaitWatcher: A lightweight web interface for the detection of
incongruent news headlines [27.29585619643952]
BaitWatcherは軽量なWebインターフェースで、ニュース記事の見出しをクリックする前に、読者が不一致の可能性を推定する。
BaiittWatcherは階層的リカレントエンコーダを使用して、ニュース見出しとその関連するボディテキストの複雑なテキスト表現を効率的に学習する。
論文 参考訳(メタデータ) (2020-03-23T23:43:02Z) - HoaxItaly: a collection of Italian disinformation and fact-checking
stories shared on Twitter in 2019 [72.96986027203377]
データセットには約37Kのニュース記事のタイトルとボディも含まれている。
https://doi.org/10.79DVN/PGVDHXで公開されている。
論文 参考訳(メタデータ) (2020-01-29T16:14:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。