論文の概要: What Makes You CLIC: Detection of Croatian Clickbait Headlines
- arxiv url: http://arxiv.org/abs/2507.14314v1
- Date: Fri, 18 Jul 2025 18:39:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:31.834563
- Title: What Makes You CLIC: Detection of Croatian Clickbait Headlines
- Title(参考訳): クロアチアのクリックベイトヘッドラインを検知するCLIC
- Authors: Marija Anđedelić, Dominik Šipek, Laura Majer, Jan Šnajder,
- Abstract要約: 本稿では,20年間にわたるクロアチアのニュースヘッドラインのクリックベイト検出のための新しいデータセットについて述べる。
このタスクでBERTi'cモデルを微調整し、その性能をLLMベースのICL法とクロアチア語と英語のプロンプトと比較する。
分析した見出しの半分近くはクリックベイトが含まれており、微調整されたモデルの方が一般的なLCMよりも良い結果をもたらすことがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Online news outlets operate predominantly on an advertising-based revenue model, compelling journalists to create headlines that are often scandalous, intriguing, and provocative -- commonly referred to as clickbait. Automatic detection of clickbait headlines is essential for preserving information quality and reader trust in digital media and requires both contextual understanding and world knowledge. For this task, particularly in less-resourced languages, it remains unclear whether fine-tuned methods or in-context learning (ICL) yield better results. In this paper, we compile CLIC, a novel dataset for clickbait detection of Croatian news headlines spanning a 20-year period and encompassing mainstream and fringe outlets. We fine-tune the BERTi\'c model on this task and compare its performance to LLM-based ICL methods with prompts both in Croatian and English. Finally, we analyze the linguistic properties of clickbait. We find that nearly half of the analyzed headlines contain clickbait, and that finetuned models deliver better results than general LLMs.
- Abstract(参考訳): オンラインニュースメディアは、主に広告ベースの収益モデルで運営されており、ジャーナリストに、しばしばスキャンダル、興味深く、挑発的な見出しを作るよう説得している。
クリックベイトヘッドラインの自動検出は,デジタルメディアにおける情報品質と読者信頼の維持に不可欠であり,文脈的理解と世界知識の両方を必要とする。
このタスク、特に低リソースの言語では、微調整された方法と文脈内学習(ICL)がより良い結果をもたらすかどうかは不明だ。
本稿では,20年間にわたるクロアチアのニュース見出しのクリックベイト検出のための新しいデータセットであるCLICをコンパイルする。
このタスクでBERTi\'cモデルを微調整し、その性能をLLMベースのICL法と比較し、クロアチア語と英語の両方のプロンプトと比較する。
最後に,クリックベイトの言語特性を解析する。
分析した見出しの半分近くはクリックベイトが含まれており、微調整されたモデルの方が一般的なLCMよりも良い結果をもたらすことがわかった。
関連論文リスト
- Te Ahorré Un Click: A Revised Definition of Clickbait and Detection in Spanish News [0.0]
現在のコンセンサスに欠けるクリックベイトの定義を再検討する。
スペイン語でクリックベイト検出のための最初のオープンソースデータセットであるTA1Cをリリースしました。
論文 参考訳(メタデータ) (2025-07-13T20:19:08Z) - NewsEdits 2.0: Learning the Intentions Behind Updating News [74.84017890548259]
イベントが進むにつれて、ニュース記事は新しい情報で更新されることが多い。
本研究では,言語的特徴が事実流動性を示すことを仮定し,ニュース記事のテキストのみを用いて,どの事実が更新されるかを予測する。
論文 参考訳(メタデータ) (2024-11-27T23:35:23Z) - Prompt-tuning for Clickbait Detection via Text Summarization [18.027598728494485]
クリックベイト(Clickbaits)は、ソーシャルな投稿や、クリック数を増やすためにユーザーを誘惑する偽ニュースの見出しだ。
既存のほとんどの手法は、クリックベイトを検出するために見出しと内容のセマンティックな類似性を計算する。
テキスト要約によるクリックベイト検出のプロンプトチューニング手法を提案する。
論文 参考訳(メタデータ) (2024-04-17T09:39:02Z) - Tracking the Newsworthiness of Public Documents [107.12303391111014]
この研究は、サンフランシスコ・クロニクル(San Francisco Chronicle)によるサンフランシスコ・ベイエリアにおける地方公共政策のニュース報道に焦点を当てている。
まず、新聞記事、公共政策文書、会議記録を収集し、確率的関係モデルを用いてそれらをリンクする。
第二に、ポリシー項目がカバーされるかどうかを予測するために、ニューズサステイネス予測という新しいタスクを定義します。
論文 参考訳(メタデータ) (2023-11-16T10:05:26Z) - BanglaBait: Semi-Supervised Adversarial Approach for Clickbait Detection
on Bangla Clickbait Dataset [0.6008132390640294]
15,056個のラベル付きニュース記事と65,406個のラベル付きニュース記事を含むバングラクリックベイト検出データセットを構築した。
各記事は3人の専門言語学者によってラベル付けされ、記事のタイトル、ボディ、その他のメタデータが含まれている。
半監視世代適応ネットワーク(SS GANs)を用いて,事前学習したバングラ変圧器モデルを逆向きに微調整する。
論文 参考訳(メタデータ) (2023-11-10T17:38:46Z) - Fake News in Sheep's Clothing: Robust Fake News Detection Against LLM-Empowered Style Attacks [60.14025705964573]
SheepDogは、ニュースの正確性を決定する際に、スタイルよりもコンテンツを優先する、スタイルに反する偽ニュース検出ツールだ。
SheepDog はこのレジリエンスを,(1) LLM を利用したニュースリフレーミング,(2) 異なるスタイルに対応する記事のカスタマイズによる学習プロセスへのスタイル多様性の注入,(2) スタイルの異なるリフレーミング間で一貫した妥当性予測を保証するスタイル非依存のトレーニング,(3) LLM からコンテンツ中心のガイドラインを抽出して偽ニュースを抽出するコンテンツ中心の属性を通じて達成する。
論文 参考訳(メタデータ) (2023-10-16T21:05:12Z) - A Novel Contrastive Learning Method for Clickbait Detection on RoCliCo:
A Romanian Clickbait Corpus of News Articles [29.119911024232064]
ルーマニア語のクリックベイトコーパスは公開されていない。
クリックベイトラベルと非クリックベイトラベルを手動で注釈付けした8,313のニュースサンプルからなるルーマニア語Clickbait Corpus(RoCliCo)を紹介した。
本稿では,ニュースタイトルやコンテンツが深い距離空間にエンコードされることを学習する,BERTに基づく新しいコントラスト学習モデルを提案する。
論文 参考訳(メタデータ) (2023-10-10T11:38:16Z) - Clickbait Detection via Large Language Models [22.100030863671623]
大規模言語モデル(LLM)は強力な道具として登場し、一連のNLP下流タスクで大きな成功を収めている。
本稿では,英語と中国語のベンチマークデータセットを用いて,数ショット,ゼロショットのシナリオにおけるLLMの性能を解析する。
実験結果から, LLM は最先端の深部・微調整 PLM 法に比べ, 最高の結果が得られないことがわかった。
論文 参考訳(メタデータ) (2023-06-16T02:49:20Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - NewsEdits: A News Article Revision Dataset and a Document-Level
Reasoning Challenge [122.37011526554403]
NewsEditsは、最初に公開されたニュースリビジョン履歴のデータセットである。
120万記事と、22以上の英語とフランス語の新聞ソースから460万バージョンを収録している。
論文 参考訳(メタデータ) (2022-06-14T18:47:13Z) - WeClick: Weakly-Supervised Video Semantic Segmentation with Click
Annotations [64.52412111417019]
WeClick と呼ばれるクリックアノテーション付きビデオセマンティックセマンティックセマンティックパイプラインを提案する。
詳細なセマンティック情報はクリックによってキャプチャされないため、クリックラベルによる直接トレーニングはセグメンテーションの予測が不十分になる。
WeClickは最先端の手法より優れ、ベースラインよりも10.24%のmIoUで性能を向上し、リアルタイム実行を実現している。
論文 参考訳(メタデータ) (2021-07-07T09:12:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。