論文の概要: Multilingual News Location Detection using an Entity-Based Siamese
Network with Semi-Supervised Contrastive Learning and Knowledge Base
- arxiv url: http://arxiv.org/abs/2212.11856v1
- Date: Thu, 22 Dec 2022 16:42:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-23 13:41:03.494971
- Title: Multilingual News Location Detection using an Entity-Based Siamese
Network with Semi-Supervised Contrastive Learning and Knowledge Base
- Title(参考訳): 半教師付きコントラスト学習と知識ベースを用いたエンティティベースシャムネットワークを用いた多言語ニュース位置検出
- Authors: V\'ictor Su\'arez-Paniagua and Steven Derby and Tri Kurniawan Wijaya
- Abstract要約: ニュース中の関連箇所の早期発見は、環境災害、戦争紛争、疫病の発生、政治的混乱などの極端な出来事において重要である。
テキストに明示的に言及されていない場合でも,関連する位置を推測するシステムを提案する。
我々は,ゴールド標準の多言語ニュースロケーションデータセットであるNewsLOCで研究コミュニティに貢献する。
- 参考スコア(独自算出の注目度): 0.7734726150561089
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Early detection of relevant locations in a piece of news is especially
important in extreme events such as environmental disasters, war conflicts,
disease outbreaks, or political turmoils. Additionally, this detection also
helps recommender systems to promote relevant news based on user locations.
Note that, when the relevant locations are not mentioned explicitly in the
text, state-of-the-art methods typically fail to recognize them because these
methods rely on syntactic recognition. In contrast, by incorporating a
knowledge base and connecting entities with their locations, our system
successfully infers the relevant locations even when they are not mentioned
explicitly in the text. To evaluate the effectiveness of our approach, and due
to the lack of datasets in this area, we also contribute to the research
community with a gold-standard multilingual news-location dataset, NewsLOC. It
contains the annotation of the relevant locations (and their WikiData IDs) of
600+ Wikinews articles in five different languages: English, French, German,
Italian, and Spanish. Through experimental evaluations, we show that our
proposed system outperforms the baselines and the fine-tuned version of the
model using semi-supervised data that increases the classification rate. The
source code and the NewsLOC dataset are publicly available for being used by
the research community at https://github.com/vsuarezpaniagua/NewsLocation.
- Abstract(参考訳): ニュース中の関連箇所の早期発見は、特に環境災害、戦争紛争、疫病の発生、政治的混乱などの極端な出来事において重要である。
さらに、この検出は、ユーザ位置に基づいて関連するニュースをプロモートするレコメンデータシステムにも役立ちます。
注意すべき点は、関連する場所がテキストに明示的に言及されていない場合、これらのメソッドは構文認識に依存しているため、最先端の手法では認識できないことである。
対照的に、知識ベースを組み込んでエンティティをそれらの位置と結びつけることで、テキストに明示的に言及されていない場合でも、関係する位置を推測することに成功した。
提案手法の有効性を評価するため,本分野ではデータセットが不足しているため,ゴールドスタンダードの多言語ニュースロケーションデータセットであるNewsLOCを用いて研究コミュニティに貢献する。
英語、フランス語、ドイツ語、イタリア語、スペイン語の5つの言語で600以上のWikinews記事の関連する場所(およびWikiData ID)のアノテーションを含んでいる。
実験結果から,提案手法は,半教師付きデータを用いてモデルのベースラインと微調整バージョンを上回り,分類率を増加させることを示した。
ソースコードとnewslocデータセットは、研究コミュニティがhttps://github.com/vsuarezpaniagua/newslocationで利用できる。
関連論文リスト
- Discovering Geo-dependent Stories by Combining Density-based Clustering
and Thread-based Aggregation techniques [0.0]
本稿では,ソーシャルメディアにおけるジオタグ付き投稿のグローバル分析を紹介する。
i)都市における予期せぬ行動の検出と、(ii)何が起こっているのかを推測するためのポストの分析を支援する。
われわれはこの手法を、ニューヨーク市のInstagram活動から7ヶ月にわたって得られたデータセットに適用した。
論文 参考訳(メタデータ) (2023-12-18T10:17:12Z) - What's happening in your neighborhood? A Weakly Supervised Approach to Detect Local News [0.3749861135832073]
我々は、ローカルニュースの自動検出とコンテンツに基づくローカルニュースレコメンデーションを可能にする統合パイプラインを開発した。
スタンフォード大学のCore NERモデルと比較して、私たちのパイプラインはより高精度で、実世界と人間ラベルのデータセットでリコール評価されています。
論文 参考訳(メタデータ) (2023-01-15T03:20:18Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - Contextual information integration for stance detection via
cross-attention [59.662413798388485]
スタンス検出は、著者の目標に対する姿勢を特定することを扱う。
既存のスタンス検出モデルの多くは、関連するコンテキスト情報を考慮していないため、制限されている。
文脈情報をテキストとして統合する手法を提案する。
論文 参考訳(メタデータ) (2022-11-03T15:04:29Z) - Location reference recognition from texts: A survey and comparison [9.36819544451632]
まず、地理情報検索、災害管理、災害監視、交通管理、空間人文科学、観光管理、犯罪管理の7つの典型的な応用分野を概説する。
次に、世界中の39,736個の位置参照を含む異なるタイプのテキストを持つ26の公開データセットに基づいて、最も広く使われている位置参照認識のための27の精度と計算効率を徹底的に評価した。
論文 参考訳(メタデータ) (2022-07-04T19:25:15Z) - Evaluation of Fake News Detection with Knowledge-Enhanced Language
Models [10.45851991054367]
偽ニュース検出の最近の進歩は、大規模事前学習言語モデル(PLM)の成功を生かしている。
最先端のアプローチは、ラベル付きフェイクニュースデータセットの微調整 PLM に基づいている。
既存の知識ベース(KB)を人事情報に富んだ情報と組み合わせることで、偽ニュースの検出をより効果的かつ堅牢にすることができる。
論文 参考訳(メタデータ) (2022-04-01T14:14:46Z) - A Closer Look at Debiased Temporal Sentence Grounding in Videos:
Dataset, Metric, and Approach [53.727460222955266]
テンポラル・センテンス・グラウンディング・イン・ビデオ(TSGV)は、未編集のビデオに自然言語文を埋め込むことを目的としている。
最近の研究では、現在のベンチマークデータセットには明らかなモーメントアノテーションバイアスがあることが判明している。
偏りのあるデータセットによる膨らませ評価を緩和するため、基礎的リコールスコアを割引する新しい評価基準「dR@n,IoU@m」を導入する。
論文 参考訳(メタデータ) (2022-03-10T08:58:18Z) - Assessing the quality of sources in Wikidata across languages: a hybrid
approach [64.05097584373979]
いくつかの言語でラベルを持つWikidataのトリプルからサンプルした参照コーパスの大規模なコーパスを評価するために,一連のマイクロタスク実験を実施している。
クラウドソースアセスメントの統合されたバージョンを使用して、いくつかの機械学習モデルをトレーニングして、Wikidata全体の分析をスケールアップしています。
この結果はWikidataにおける参照の質の確認に役立ち、ユーザ生成多言語構造化データの品質をWeb上で定義し、取得する際の共通の課題を特定するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-20T10:06:46Z) - Triggering Failures: Out-Of-Distribution detection by learning from
local adversarial attacks in Semantic Segmentation [76.2621758731288]
セグメンテーションにおけるアウト・オブ・ディストリビューション(OOD)オブジェクトの検出に取り組む。
私たちの主な貢献は、ObsNetと呼ばれる新しいOOD検出アーキテクチャであり、ローカル・アタック(LAA)に基づく専用トレーニングスキームと関連付けられています。
3つの異なるデータセットの文献の最近の10つの手法と比較して,速度と精度の両面で最高の性能が得られることを示す。
論文 参考訳(メタデータ) (2021-08-03T17:09:56Z) - BanFakeNews: A Dataset for Detecting Fake News in Bangla [1.4170999534105675]
自動フェイクニュース検知システムの構築に使用できる50Kニュースの注釈付きデータセットを提案する。
我々は,Bangla偽ニュースを識別するためのNLP技術の現状を示すベンチマークシステムを開発した。
論文 参考訳(メタデータ) (2020-04-19T07:42:22Z) - Local-Global Video-Text Interactions for Temporal Grounding [77.5114709695216]
本稿では,テキストクエリに関連するビデオの時間間隔を特定することを目的とした,テキスト間時間グラウンドリングの問題に対処する。
そこで本研究では,テキストクエリにおける意味句の中間レベルの特徴の集合を抽出する,新しい回帰モデルを用いてこの問題に対処する。
提案手法は,ローカルからグローバルへのコンテキスト情報を活用することにより,目標時間間隔を効果的に予測する。
論文 参考訳(メタデータ) (2020-04-16T08:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。