論文の概要: Where Did the President Visit Last Week? Detecting Celebrity Trips from
News Articles
- arxiv url: http://arxiv.org/abs/2307.08721v1
- Date: Mon, 17 Jul 2023 05:37:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-19 17:59:56.667225
- Title: Where Did the President Visit Last Week? Detecting Celebrity Trips from
News Articles
- Title(参考訳): 大統領は先週どこに訪れましたか。
ニュース記事から有名人の旅行を検知する
- Authors: Kai Peng, Ying Zhang, Shuai Ling, Zhaoru Ke, Haipeng Zhang
- Abstract要約: 本稿では,ニュース記事に基づいて有名人の旅行を検知するツールを提案する。
提案されたセレトリプはこれらのモジュールを共同で訓練し、全てのベースラインモデルを上回っ、F1メートル法で82.53%を達成する。
- 参考スコア(独自算出の注目度): 4.247942943483429
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Celebrities' whereabouts are of pervasive importance. For instance, where
politicians go, how often they visit, and who they meet, come with profound
geopolitical and economic implications. Although news articles contain travel
information of celebrities, it is not possible to perform large-scale and
network-wise analysis due to the lack of automatic itinerary detection tools.
To design such tools, we have to overcome difficulties from the heterogeneity
among news articles: 1)One single article can be noisy, with irrelevant people
and locations, especially when the articles are long. 2)Though it may be
helpful if we consider multiple articles together to determine a particular
trip, the key semantics are still scattered across different articles
intertwined with various noises, making it hard to aggregate them effectively.
3)Over 20% of the articles refer to the celebrities' trips indirectly, instead
of using the exact celebrity names or location names, leading to large portions
of trips escaping regular detecting algorithms. We model text content across
articles related to each candidate location as a graph to better associate
essential information and cancel out the noises. Besides, we design a special
pooling layer based on attention mechanism and node similarity, reducing
irrelevant information from longer articles. To make up the missing information
resulted from indirect mentions, we construct knowledge sub-graphs for named
entities (person, organization, facility, etc.). Specifically, we dynamically
update embeddings of event entities like the G7 summit from news descriptions
since the properties (date and location) of the event change each time, which
is not captured by the pre-trained event representations. The proposed CeleTrip
jointly trains these modules, which outperforms all baseline models and
achieves 82.53% in the F1 metric.
- Abstract(参考訳): 有名人の居場所は広く重要である。
例えば、政治家の出入り頻度、出会っている人などには、地政学的にも経済的にも大きな影響がある。
ニュース記事にはセレブの旅行情報が含まれているが,自動検出ツールの欠如により大規模かつネットワーク的な分析は不可能である。
このようなツールを設計するには, ニュース記事の異質性の難しさを克服する必要がある。1) 関連のない人や場所,特に記事が長い場合には, 一つの記事が騒々しい。
2)複数の項目を一つにまとめて特定の旅行を決定するのに役立ちますが,重要セマンティクスは様々なノイズに絡み合ったさまざまな項目に分散しており,効果的にまとめるのが困難である。
3) 記事の20%以上は、有名人の旅行を間接的に参照し、正確な有名人名や場所名を使う代わりに、通常の検出アルゴリズムから逃れる旅行の大部分を導く。
各候補の場所に関連する記事間のテキストコンテンツをグラフとしてモデル化し,本質的情報を関連付け,ノイズをキャンセルする。
さらに,注意機構とノード類似性に基づく特別なプーリング層を設計し,より長い記事から無関係な情報を減らす。
間接的な言及から得られた情報不足を補うため、名前付きエンティティ(人、組織、施設など)の知識サブグラフを構築します。
具体的には、事前トレーニングされたイベント表現ではキャプチャされないイベントのプロパティ(日付と場所)が毎回変化するため、ニュース記述からg7 summitのようなイベントエンティティの埋め込みを動的に更新する。
提案されたceletripは、これらモジュールを共同でトレーニングし、すべてのベースラインモデルを上回り、f1メトリックで82.53%を達成する。
関連論文リスト
- SCStory: Self-supervised and Continual Online Story Discovery [53.72745249384159]
SCStoryは、素早く公開されたニュース記事ストリームを人間のアノテーションなしでリアルタイムで消化するのに役立つ。
SCStoryは、ニュース記事ストリームのストーリー指向適応モデリングという新しいアイデアを取り入れて、自己指導的かつ継続的な学習を取り入れている。
論文 参考訳(メタデータ) (2023-11-27T04:50:01Z) - Tracking the Newsworthiness of Public Documents [107.12303391111014]
この研究は、サンフランシスコ・クロニクル(San Francisco Chronicle)によるサンフランシスコ・ベイエリアにおける地方公共政策のニュース報道に焦点を当てている。
まず、新聞記事、公共政策文書、会議記録を収集し、確率的関係モデルを用いてそれらをリンクする。
第二に、ポリシー項目がカバーされるかどうかを予測するために、ニューズサステイネス予測という新しいタスクを定義します。
論文 参考訳(メタデータ) (2023-11-16T10:05:26Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Classification of news spreading barriers [3.0036519884678894]
新聞記事のセマンティクスをウィキペディアの概念で推測するバリア分類手法を提案する。
我々はニュース記事を収集し、ニュース出版社のメタデータを使って様々な種類の障壁に注釈を付けた。
われわれは、ウィキペディアの概念とニュース記事のボディーテキストを、ニュース拡散障壁を推測する機能として利用している。
論文 参考訳(メタデータ) (2023-04-10T20:13:54Z) - GREENER: Graph Neural Networks for News Media Profiling [24.675574340841163]
本稿では,ウェブ上でのニュースメディアのプロファイリングの問題について,その実態と偏見について考察する。
私たちの主な焦点は、オーディエンスの重複に基づいて、メディア間の類似性をモデル化することにあります。
予測精度は2つのタスクに対して2.5-27マクロF1ポイント向上した。
論文 参考訳(メタデータ) (2022-11-10T12:46:29Z) - Unsupervised Key Event Detection from Massive Text Corpora [42.31889135421941]
本稿では,ニュースコーパスキーイベントから検出することを目的とした,中間レベルでのキーイベント検出という新たなタスクを提案する。
このタスクは、イベントの理解と構造化をブリッジすることができ、キーイベントのテーマと時間的近接性のために本質的に困難である。
我々は、新しいttf-itfスコアを用いて、時間的に頻繁なピークフレーズを抽出する、教師なしキーイベント検出フレームワークEvMineを開発した。
論文 参考訳(メタデータ) (2022-06-08T20:31:02Z) - Content-based Analysis of the Cultural Differences between TikTok and
Douyin [95.32409577885645]
ショートフォームのソーシャルメディアは、聴衆にダイナミックなストーリーを伝え、彼らの注意を引き付けることによって、伝統的なメディアパラダイムから遠ざかる。
特に、興味深く、理解しやすいユニークなシーンを表現するために、日常的なオブジェクトの異なる組み合わせを用いることができる。
同じ会社によって提供されたTikTokとDouyinは、近年人気になった新しいメディアの好例だ。
メディアファッションや社会的慣用性とともに文化的な違いを表現しているという仮説が,本研究の主目的である。
論文 参考訳(メタデータ) (2020-11-03T01:47:49Z) - Placepedia: Comprehensive Place Understanding with Multi-Faceted
Annotations [79.80036503792985]
Placepediaは、240万のユニークな場所から3500万枚以上の写真を集めた大規模な場所データセットです。
写真に加えて、各場所にはGDP、人口など、膨大な多面的な情報も付属している。
このデータセットは大量のデータと豊富なアノテーションを持ち、様々な研究を行うことができる。
論文 参考訳(メタデータ) (2020-07-07T20:17:01Z) - A German Corpus for Fine-Grained Named Entity Recognition and Relation
Extraction of Traffic and Industry Events [63.08899104652265]
この研究は、微粒な地理的要素で注釈付けされたドイツ語文書のコーパスを記述する。
また、15の交通・産業関連n-aryリレーションシップやイベントもアノテートされている。
コーパスは、ニュースワイヤーのテキスト、Twitterメッセージ、ラジオ局、警察、鉄道会社からの交通報告で構成されている。
論文 参考訳(メタデータ) (2020-04-07T11:39:50Z) - BaitWatcher: A lightweight web interface for the detection of
incongruent news headlines [27.29585619643952]
BaitWatcherは軽量なWebインターフェースで、ニュース記事の見出しをクリックする前に、読者が不一致の可能性を推定する。
BaiittWatcherは階層的リカレントエンコーダを使用して、ニュース見出しとその関連するボディテキストの複雑なテキスト表現を効率的に学習する。
論文 参考訳(メタデータ) (2020-03-23T23:43:02Z) - Generating Representative Headlines for News Stories [31.67864779497127]
同じ出来事をニュースに報告している記事のグループ化は、読者がニュースを消費するのを助ける一般的な方法である。
各ストーリーの代表的見出しを効率的かつ効果的に生成することは、依然として困難な研究課題である。
我々は,人間のアノテーションを使わずに大規模世代モデルを訓練するための遠隔監視手法を開発した。
論文 参考訳(メタデータ) (2020-01-26T02:08:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。