論文の概要: Distinguishing Commercial from Editorial Content in News
- arxiv url: http://arxiv.org/abs/2111.03916v1
- Date: Sat, 6 Nov 2021 16:45:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-09 15:26:51.841800
- Title: Distinguishing Commercial from Editorial Content in News
- Title(参考訳): ニュースの編集内容からの商業的排除
- Authors: Timo Kats, Peter van der Putten and Jasper Schelling
- Abstract要約: 機械学習モデルとそれに由来する語彙を用いて両者を区別することを目的としている。
これは、オランダの4つの異なるニュースソースから1,000の記事と1,000の副詞を抽出することで達成された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: How can we distinguish commercial from editorial content in news, or more
specifically, differentiate between advertorials and regular news articles? An
advertorial is a commercial message written and formatted as an article, making
it harder for readers to recognize these as advertising, despite the use of
disclaimers. In our research we aim to differentiate the two using a machine
learning model, and a lexicon derived from it. This was accomplished by
scraping 1.000 articles and 1.000 advertorials from four different Dutch news
sources and classifying these based on textual features. With this setup our
most successful machine learning model had an accuracy of just over $90\%$. To
generate additional insights into differences between news and advertorial
language, we also analyzed model coefficients and explored the corpus through
co-occurrence networks and t-SNE graphs.
- Abstract(参考訳): 広告とニュースの編集コンテンツ、具体的には広告記事と通常のニュース記事とを区別するにはどうすればいいのか?
副詞(advertorial)は、記事として書かれ、フォーマットされた商業的メッセージであり、読者がこれを広告として認識することが困難である。
本研究の目的は,機械学習モデルとそれに由来する語彙を用いて両者を区別することである。
これは4つの異なるオランダのニュースソースから10000の記事と10000の副詞を抽出し、テキストの特徴に基づいて分類することで達成された。
このセットアップで、最も成功した機械学習モデルは、90\%$という精度でした。
ニュースと副詞の相違に関するさらなる知見を得るため,モデル係数を解析し,共起ネットワークとt-SNEグラフを用いてコーパスを探索した。
関連論文リスト
- TieFake: Title-Text Similarity and Emotion-Aware Fake News Detection [15.386007761649251]
本稿では,マルチモーダルな文脈情報と著者の感情を共同でモデル化し,テキストの類似性と感情認識型フェイクニュース検出(TieFake)手法を提案する。
具体的には、BERT と ResNeSt を用いて、テキストや画像の表現を学習し、出版者感情抽出器を用いて、ニュースコンテンツにおける著者の主観的感情をキャプチャする。
論文 参考訳(メタデータ) (2023-04-19T04:47:36Z) - Persuasion Strategies in Advertisements [68.70313043201882]
我々は,説得戦略の広範な語彙を導入し,説得戦略を付加した最初の広告画像コーパスを構築した。
次に,マルチモーダル学習による説得戦略予測のタスクを定式化する。
我々は、Fortune-500社の1600件の広告キャンペーンについて、現実世界でケーススタディを実施している。
論文 参考訳(メタデータ) (2022-08-20T07:33:13Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - Cross-Domain Learning for Classifying Propaganda in Online Contents [67.10699378370752]
本稿では,ラベル付き文書や,ニュースやつぶやきからの文をベースとしたクロスドメイン学習の手法を提案する。
本実験は,本手法の有効性を実証し,移動過程におけるソースやターゲットの様々な構成における困難さと限界を同定する。
論文 参考訳(メタデータ) (2020-11-13T10:19:13Z) - LTIatCMU at SemEval-2020 Task 11: Incorporating Multi-Level Features for
Multi-Granular Propaganda Span Identification [70.1903083747775]
本稿では,新聞記事におけるプロパガンダ・スパン識別の課題について述べる。
本稿では,BERT-BiLSTMに基づくプロパガンダ分類モデルを提案する。
論文 参考訳(メタデータ) (2020-08-11T16:14:47Z) - Leveraging Declarative Knowledge in Text and First-Order Logic for
Fine-Grained Propaganda Detection [139.3415751957195]
本稿では,ニュース記事中のプロパガンダ的テキスト断片の検出について検討する。
本稿では,詳細なプロパガンダ手法の宣言的知識を注入する手法を提案する。
論文 参考訳(メタデータ) (2020-04-29T13:46:15Z) - Transform and Tell: Entity-Aware News Image Captioning [77.4898875082832]
本稿では,ニュース記事に埋め込まれた画像のキャプションを生成するエンドツーエンドモデルを提案する。
画像中の顔や物体とキャプション内の単語を関連付けることで,マルチモーダル・マルチヘッドアテンション機構によって,最初の課題に対処する。
本稿では、バイトペアエンコーディングを用いて単語部分の列としてキャプションを生成する、最先端のトランスフォーマー言語モデルによる第2の課題に取り組む。
論文 参考訳(メタデータ) (2020-04-17T05:44:37Z) - BaitWatcher: A lightweight web interface for the detection of
incongruent news headlines [27.29585619643952]
BaitWatcherは軽量なWebインターフェースで、ニュース記事の見出しをクリックする前に、読者が不一致の可能性を推定する。
BaiittWatcherは階層的リカレントエンコーダを使用して、ニュース見出しとその関連するボディテキストの複雑なテキスト表現を効率的に学習する。
論文 参考訳(メタデータ) (2020-03-23T23:43:02Z) - SirenLess: reveal the intention behind news [31.757138364005087]
本稿では,言語的特徴による誤ニュース検出のための視覚解析システムであるSirenLessを紹介する。
このシステムは、ニュースメタデータと言語機能を統合し、ニュース記事の意味構造を明らかにする新しいインタラクティブツールである、記事エクスプローラーを特徴とする。
我々は、SirenLessを用いて、異なるソースから18のニュース記事を分析し、誤ったニュース検出のためのいくつかの有用なパターンを要約する。
論文 参考訳(メタデータ) (2020-01-08T20:36:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。