論文の概要: NSTM: Real-Time Query-Driven News Overview Composition at Bloomberg
- arxiv url: http://arxiv.org/abs/2006.01117v1
- Date: Mon, 1 Jun 2020 17:58:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 07:06:56.214227
- Title: NSTM: Real-Time Query-Driven News Overview Composition at Bloomberg
- Title(参考訳): NSTM: Bloombergのリアルタイムクエリ駆動ニュース概要
- Authors: Joshua Bambrick, Minjie Xu, Andy Almonte, Igor Malioutov, Guim
Perarnau, Vittorio Selo and Iat Chong Chan
- Abstract要約: このような膨大な量のニュースを仮定すると、ほとんど不可能な課題が浮かび上がっている。
例えば、ブルームバーグの英国に関するニュースを検索する読者は、通常の日に1万記事を見つけることになる。
ACL 2020でキーニューステーマ(NSTM)のデモを紹介する。
- 参考スコア(独自算出の注目度): 6.927055673104935
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Millions of news articles from hundreds of thousands of sources around the
globe appear in news aggregators every day. Consuming such a volume of news
presents an almost insurmountable challenge. For example, a reader searching on
Bloomberg's system for news about the U.K. would find 10,000 articles on a
typical day. Apple Inc., the world's most journalistically covered company,
garners around 1,800 news articles a day.
We realized that a new kind of summarization engine was needed, one that
would condense large volumes of news into short, easy to absorb points. The
system would filter out noise and duplicates to identify and summarize key news
about companies, countries or markets.
When given a user query, Bloomberg's solution, Key News Themes (or NSTM),
leverages state-of-the-art semantic clustering techniques and novel
summarization methods to produce comprehensive, yet concise, digests to
dramatically simplify the news consumption process.
NSTM is available to hundreds of thousands of readers around the world and
serves thousands of requests daily with sub-second latency. At ACL 2020, we
will present a demo of NSTM.
- Abstract(参考訳): 世界中の数十万の情報源からの何百万ものニュース記事が毎日ニュースアグリゲータに載っている。
このような量のニュースを仮定すると、ほとんど不可能な課題だ。
例えば、ブルームバーグの英国に関するニュースを検索する読者は、通常の日に1万記事を見つけることになる。
米アップルは1日当たり約1800件のニュース記事を掲載している。
私たちは、大量のニュースを短く簡単に吸収できるような、新しい種類の要約エンジンが必要であることに気付きました。
このシステムはノイズや重複をフィルターして、企業や国、市場に関する重要なニュースを識別し要約する。
ユーザクエリが与えられた場合、BloombergのソリューションであるKey News Themes(NSTM)は、最先端のセマンティッククラスタリング技術と新しい要約手法を活用して、包括的かつ簡潔なダイジェストを生成し、ニュース消費プロセスを劇的に単純化する。
NSTMは世界中の数十万の読者が利用でき、毎日数千のリクエストを秒以下のレイテンシで処理できる。
ACL 2020ではNSTMのデモを紹介する。
関連論文リスト
- 3DLNews: A Three-decade Dataset of US Local News Articles [49.1574468325115]
3DLNewsは、1996年から2024年までの期間にアメリカのローカルニュース記事を載せた、新しいデータセットである。
約100万のURL(HTMLテキストを含む)があり、50州で14,000以上の地元新聞、テレビ、ラジオ局から提供されている。
論文 参考訳(メタデータ) (2024-08-08T18:33:37Z) - SCStory: Self-supervised and Continual Online Story Discovery [53.72745249384159]
SCStoryは、素早く公開されたニュース記事ストリームを人間のアノテーションなしでリアルタイムで消化するのに役立つ。
SCStoryは、ニュース記事ストリームのストーリー指向適応モデリングという新しいアイデアを取り入れて、自己指導的かつ継続的な学習を取り入れている。
論文 参考訳(メタデータ) (2023-11-27T04:50:01Z) - Adapting Fake News Detection to the Era of Large Language Models [48.5847914481222]
我々は,機械による(言い換えられた)リアルニュース,機械生成のフェイクニュース,人書きのフェイクニュース,人書きのリアルニュースの相互作用について検討する。
我々の実験では、人書き記事のみに特化して訓練された検知器が、機械が生成したフェイクニュースを検出できる興味深いパターンを明らかにしましたが、その逆ではありません。
論文 参考訳(メタデータ) (2023-11-02T08:39:45Z) - News Category Dataset [1.7513645771137178]
HuffPostから入手した2012年から2018年までの約200万のニュースの見出しを含むNews Categoryデータセットを提示する。
本稿では,データセットから新たな知見を導き,データセットの既存および潜在的応用について述べる。
論文 参考訳(メタデータ) (2022-09-23T06:13:16Z) - Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2021 [55.41644538483948]
共有タスクの目標は、コミュニティにこの重要な問題を解決するための効率的な方法を考え出すことを動機付けることです。
トレーニングセットには1300件の注釈付きニュース記事、750件のリアルニュース、550件のフェイクニュース、300件のニュース記事、200件のリアルニュース、100件のフェイクニュースが含まれている。
F1-macroスコアは0.679で、これは過去最高の0.907 F1-macroよりも低かった。
論文 参考訳(メタデータ) (2022-07-11T18:58:36Z) - Islander: A Real-Time News Monitoring and Analysis System [22.67888928983199]
オンラインニュース分析システム「アイランド」について紹介する。
このシステムでは、複数のソースや視点からトレンドトピックを記事で閲覧することができる。
我々は,いくつかの指標をニュース品質のプロキシとして定義し,自動推定のためのアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-04-25T06:20:49Z) - Deep Dynamic Neural Network to trade-off between Accuracy and Diversity
in a News Recommender System [1.3126169294309855]
本稿では,ニュースと読者の興味を統一した枠組みで学習する深層ニューラルネットワークを提案する。
読者のクリック履歴から読者の長期的関心、LSTMSによる最近のクリックからの短期的関心、および注意メカニズムを通じて多様な読者の興味を学びます。
論文 参考訳(メタデータ) (2021-03-15T15:30:25Z) - 365 Dots in 2019: Quantifying Attention of News Sources [69.50862982117125]
様々な情報源から,オンラインニュース記事の話題の重複を計測する。
ほぼリアルタイムで注目度に応じてニュースストーリーを採点する。
これにより、最も注目を集めているトピックを識別するなど、複数の研究が可能になる。
論文 参考訳(メタデータ) (2020-03-22T20:32:47Z) - HoaxItaly: a collection of Italian disinformation and fact-checking
stories shared on Twitter in 2019 [72.96986027203377]
データセットには約37Kのニュース記事のタイトルとボディも含まれている。
https://doi.org/10.79DVN/PGVDHXで公開されている。
論文 参考訳(メタデータ) (2020-01-29T16:14:47Z) - Generating Representative Headlines for News Stories [31.67864779497127]
同じ出来事をニュースに報告している記事のグループ化は、読者がニュースを消費するのを助ける一般的な方法である。
各ストーリーの代表的見出しを効率的かつ効果的に生成することは、依然として困難な研究課題である。
我々は,人間のアノテーションを使わずに大規模世代モデルを訓練するための遠隔監視手法を開発した。
論文 参考訳(メタデータ) (2020-01-26T02:08:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。