論文の概要: SCStory: Self-supervised and Continual Online Story Discovery
- arxiv url: http://arxiv.org/abs/2312.03725v1
- Date: Mon, 27 Nov 2023 04:50:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-11 03:06:47.071296
- Title: SCStory: Self-supervised and Continual Online Story Discovery
- Title(参考訳): SCStory: 自己管理と継続的オンラインストーリーディスカバリ
- Authors: Susik Yoon, Yu Meng, Dongha Lee, Jiawei Han
- Abstract要約: SCStoryは、素早く公開されたニュース記事ストリームを人間のアノテーションなしでリアルタイムで消化するのに役立つ。
SCStoryは、ニュース記事ストリームのストーリー指向適応モデリングという新しいアイデアを取り入れて、自己指導的かつ継続的な学習を取り入れている。
- 参考スコア(独自算出の注目度): 53.72745249384159
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a framework SCStory for online story discovery, that helps people
digest rapidly published news article streams in real-time without human
annotations. To organize news article streams into stories, existing approaches
directly encode the articles and cluster them based on representation
similarity. However, these methods yield noisy and inaccurate story discovery
results because the generic article embeddings do not effectively reflect the
story-indicative semantics in an article and cannot adapt to the rapidly
evolving news article streams. SCStory employs self-supervised and continual
learning with a novel idea of story-indicative adaptive modeling of news
article streams. With a lightweight hierarchical embedding module that first
learns sentence representations and then article representations, SCStory
identifies story-relevant information of news articles and uses them to
discover stories. The embedding module is continuously updated to adapt to
evolving news streams with a contrastive learning objective, backed up by two
unique techniques, confidence-aware memory replay and prioritized-augmentation,
employed for label absence and data scarcity problems. Thorough experiments on
real and the latest news data sets demonstrate that SCStory outperforms
existing state-of-the-art algorithms for unsupervised online story discovery.
- Abstract(参考訳): オンラインストーリー発見のためのフレームワークscstoryを提案する。これは、人間が注釈を使わずに、素早く公開されたニュース記事ストリームをリアルタイムで消化するのに役立つ。
ニュース記事ストリームをストーリーに整理するために、既存のアプローチは記事を直接エンコードし、表現の類似性に基づいてそれらをクラスタ化する。
しかし,これらの手法は,記事の要約的意味を効果的に反映せず,急速に発展するニュース記事ストリームに適応できないため,ノイズや不正確な記事発見結果をもたらす。
SCStoryは、ニュース記事ストリームのストーリー指向適応モデリングという新しいアイデアで、自己指導的かつ継続的な学習を採用している。
SCStoryは、まず文章表現と記事表現を学習する軽量な階層的な埋め込みモジュールを用いて、ニュース記事のストーリー関連情報を識別し、それらを用いて物語を発見する。
埋め込みモジュールは、ラベルの欠如とデータの不足という2つのユニークなテクニックによって支えられた、対照的な学習目標で、進化するニュースストリームに適応するために継続的に更新される。
リアルと最新のニュースデータセットに関する詳細な実験によると、SCStoryは教師なしのオンラインストーリー発見のための最先端のアルゴリズムより優れている。
関連論文リスト
- A Novel Method for News Article Event-Based Embedding [8.183446952097528]
本稿では,記事中のエンティティやテーマに着目して,ニュース埋め込み生成を最適化する,新しい軽量な手法を提案する。
我々はGDELTプロジェクトから,85万件以上のニュース記事と1000,000件のイベントを活用し,本手法の検証と評価を行った。
提案手法は,共有イベント検出タスクにおける最先端手法の改善と性能向上の両立を実証した。
論文 参考訳(メタデータ) (2024-05-20T20:55:07Z) - Prompt-and-Align: Prompt-Based Social Alignment for Few-Shot Fake News
Detection [50.07850264495737]
プロンプト・アンド・アライン(Prompt-and-Align、P&A)は、数発のフェイクニュース検出のための新しいプロンプトベースのパラダイムである。
我々はP&Aが、数発のフェイクニュース検出性能をかなりのマージンで新たな最先端に設定していることを示す。
論文 参考訳(メタデータ) (2023-09-28T13:19:43Z) - Unsupervised Story Discovery from Continuous News Streams via Scalable
Thematic Embedding [37.62597275581973]
関連ニュース記事のあるストーリーをリアルタイムで発見することは、高価な人間のアノテーションなしで巨大なニュースストリームを消化するのに役立ちます。
記事や物語を動的に表現するために,既訓練の文エンコーダを用いた新しいテーマ埋め込みを提案する。
実ニュースデータセットによる徹底的な評価は、USTORYがベースラインよりも高いストーリー発見性能を達成することを示す。
論文 参考訳(メタデータ) (2023-04-08T20:41:15Z) - Generating Coherent Narratives by Learning Dynamic and Discrete Entity
States with a Contrastive Framework [68.1678127433077]
我々はトランスフォーマーモデルを拡張して,物語生成のためのエンティティ状態更新と文実現を動的に行う。
2つのナラティブデータセットの実験により、我々のモデルは強いベースラインよりも一貫性があり多様なナラティブを生成できることが示された。
論文 参考訳(メタデータ) (2022-08-08T09:02:19Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - Tell Me Who Your Friends Are: Using Content Sharing Behavior for News
Source Veracity Detection [3.359647717705252]
ネットワークとして定式化されたニュースソースのコンテンツ共有行動を利用した,新規かつ堅牢なニュースベラシティ検出モデルを提案する。
美術書記スタイルとCSNの特徴は,予測時に多種多様な誤りを犯し,両者が分類作業において異なる役割を担っていることを示す。
論文 参考訳(メタデータ) (2021-01-15T21:39:51Z) - Detecting Cross-Modal Inconsistency to Defend Against Neural Fake News [57.9843300852526]
我々は、画像やキャプションを含む機械生成ニュースに対して、より現実的で挑戦的な対策を導入する。
敵が悪用できる可能性のある弱点を特定するために、4つの異なる種類の生成された記事からなるNeuralNewsデータセットを作成します。
ユーザ実験から得られた貴重な知見に加えて,視覚的意味的不整合の検出にもとづく比較的効果的なアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-16T14:13:15Z) - Fake News Detection on News-Oriented Heterogeneous Information Networks
through Hierarchical Graph Attention [12.250335118888891]
階層型グラフ注意ネットワーク(HGAT)という,新たなフェイクニュース検出フレームワークを提案する。
HGATは、新しい階層的な注意機構を使用して、HINでノード表現学習を行い、ニュース記事ノードを分類することでフェイクニュースを検出する。
2つの実世界のフェイクニュースデータセットの実験は、HGATがテキストベースのモデルや他のネットワークベースのモデルより優れていることを示している。
論文 参考訳(メタデータ) (2020-02-05T19:09:13Z) - Generating Representative Headlines for News Stories [31.67864779497127]
同じ出来事をニュースに報告している記事のグループ化は、読者がニュースを消費するのを助ける一般的な方法である。
各ストーリーの代表的見出しを効率的かつ効果的に生成することは、依然として困難な研究課題である。
我々は,人間のアノテーションを使わずに大規模世代モデルを訓練するための遠隔監視手法を開発した。
論文 参考訳(メタデータ) (2020-01-26T02:08:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。