論文の概要: Boosting Entity Mention Detection for Targetted Twitter Streams with
Global Contextual Embeddings
- arxiv url: http://arxiv.org/abs/2201.11885v1
- Date: Fri, 28 Jan 2022 01:44:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-31 14:59:35.113795
- Title: Boosting Entity Mention Detection for Targetted Twitter Streams with
Global Contextual Embeddings
- Title(参考訳): グローバルコンテキスト埋め込みによるtwitterストリームのエンティティ参照検出の促進
- Authors: Satadisha Saha Bhowmick, Eduard C. Dragut and Weiyi Meng
- Abstract要約: マイクロブログにおける情報の自動抽出と解析に関連する2つの重要なタスクは、エンティティ・メンション・インテクション(EMD)とエンティティ・インテクション(ED)である。
最先端システムは、オフラインの静的データセットに基づいてトレーニングすることで、マイクロブログテキストの非文学的な性質をモデル化することを目的としている。
しかし、マイクロブログストリームの絶え間なく進化している性質を考えると、このような変化する限られたコンテキストからすべてのエンティティが言及されていることを検知することは難しい問題である。
我々はマイクロブログストリーム上での学習者実行に適したGlobalizerというフレームワークを提案する。
- 参考スコア(独自算出の注目度): 7.337247167823921
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Microblogging sites, like Twitter, have emerged as ubiquitous sources of
information. Two important tasks related to the automatic extraction and
analysis of information in Microblogs are Entity Mention Detection (EMD) and
Entity Detection (ED). The state-of-the-art EMD systems aim to model the
non-literary nature of microblog text by training upon offline static datasets.
They extract a combination of surface-level features -- orthographic, lexical,
and semantic -- from individual messages for noisy text modeling and entity
extraction. But given the constantly evolving nature of microblog streams,
detecting all entity mentions from such varying yet limited context of short
messages remains a difficult problem. To this end, we propose a framework named
EMD Globalizer, better suited for the execution of EMD learners on microblog
streams. It deviates from the processing of isolated microblog messages by
existing EMD systems, where learned knowledge from the immediate context of a
message is used to suggest entities. After an initial extraction of entity
candidates by an EMD system, the proposed framework leverages occurrence mining
to find additional candidate mentions that are missed during this first
detection. Aggregating the local contextual representations of these mentions,
a global embedding is drawn from the collective context of an entity candidate
within a stream. The global embeddings are then utilized to separate entities
within the candidates from false positives. All mentions of said entities from
the stream are produced in the framework's final outputs. Our experiments show
that EMD Globalizer can enhance the effectiveness of all existing EMD systems
that we tested (on average by 25.61%) with a small additional computational
overhead.
- Abstract(参考訳): Twitterのようなマイクロブログサイトは、ユビキタスな情報ソースとして登場した。
マイクロブログにおける情報の自動抽出と分析に関する2つの重要なタスクは、エンティティ参照検出(emd)とエンティティ検出(ed)である。
最先端のemdシステムは、オフラインの静的データセットでトレーニングすることで、マイクロブログテキストの非文字的性質をモデル化することを目的としている。
彼らは、ノイズの多いテキストモデリングとエンティティ抽出のために個々のメッセージから、表面レベルの特徴(正書法、語彙、意味)の組み合わせを抽出する。
しかし、マイクロブログストリームの絶え間なく進化する性質を考えると、短いメッセージのさまざまな限られたコンテキストから、すべてのエンティティへの言及を検出することは難しい問題である。
そこで本稿では,マイクロブログストリーム上でのEMD学習者実行に適したフレームワークであるEMD Globalizerを提案する。
既存のemdシステムによる分離されたマイクロブログメッセージの処理から逸脱し、メッセージの即時コンテキストからの学習知識がエンティティの提案に使用される。
EMDシステムによるエンティティ候補の最初の抽出の後、提案手法は発生源のマイニングを利用して、この最初の検出で見落とされた追加の候補言及を見つける。
これらの言及の局所的な文脈表現を集約すると、ストリーム内のエンティティ候補の集団的コンテキストからグローバル埋め込みが引き出される。
グローバルな埋め込みは、候補内のエンティティを偽陽性から分離するために使用される。
ストリームからの当該エンティティに関するすべての言及は、フレームワークの最終出力で生成される。
実験の結果、emd globalizerは、テストしたすべての既存のemdシステム(平均25.61%)の有効性を、計算オーバーヘッドを小さく向上できることがわかった。
関連論文リスト
- Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。
本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。
実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-10-31T06:55:24Z) - AMPLE: Emotion-Aware Multimodal Fusion Prompt Learning for Fake News Detection [0.1499944454332829]
本稿では,Emotion-textbfAware textbfMultimodal Fusion textbfPrompt textbfLtextbfEarning (textbfAMPLE) フレームワークについて述べる。
このフレームワークは感情分析ツールを利用してテキストから感情要素を抽出する。
次に、マルチヘッドクロスアテンション(MCA)機構と類似性を考慮した融合手法を用いて、マルチモーダルデータを統合する。
論文 参考訳(メタデータ) (2024-10-21T02:19:24Z) - LLMs as Bridges: Reformulating Grounded Multimodal Named Entity Recognition [28.136662420053568]
Grounded Multimodal Named Entity Recognition (GMNER) は、名前付きエンティティ、エンティティタイプ、および対応する視覚領域を識別することを目的とした、初期段階のマルチモーダルタスクである。
本稿では,大規模な言語モデル(LLM)を接続ブリッジとして活用することにより,GMNERをMNER-VE-VGタスクに再構成する統一フレームワークであるRiVEGを提案する。
論文 参考訳(メタデータ) (2024-02-15T14:54:33Z) - ECEA: Extensible Co-Existing Attention for Few-Shot Object Detection [52.16237548064387]
Few-shot Object Detection (FSOD) は、非常に少数のアノテーション付きサンプルからオブジェクトを識別する。
近年のFSOD法の多くは、2段階の学習パラダイムを適用しており、このパラダイムは豊富なベースクラスから学んだ知識を、グローバルな特徴を学習することで、数発の検知を補助する。
本研究では,局所的な部分に応じて大域的オブジェクトを推論するための拡張可能共存注意(ECEA)モジュールを提案する。
論文 参考訳(メタデータ) (2023-09-15T06:55:43Z) - TextFormer: A Query-based End-to-End Text Spotter with Mixed Supervision [61.186488081379]
Transformerアーキテクチャを用いた問合せベースのエンドツーエンドテキストスポッターであるTextFormerを提案する。
TextFormerは、画像エンコーダとテキストデコーダの上に構築され、マルチタスクモデリングのための共同セマンティック理解を学ぶ。
分類、セグメンテーション、認識のブランチの相互訓練と最適化を可能にし、より深い特徴共有をもたらす。
論文 参考訳(メタデータ) (2023-06-06T03:37:41Z) - Information Screening whilst Exploiting! Multimodal Relation Extraction
with Feature Denoising and Multimodal Topic Modeling [96.75821232222201]
既存のマルチモーダル関係抽出(MRE)研究は、内部情報過剰利用と外部情報過多という2つの共存課題に直面している。
内部情報スクリーニングと外部情報活用を同時に実現する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-19T14:56:57Z) - Automatic Context Pattern Generation for Entity Set Expansion [40.535332689515656]
我々は,エンティティの高品質なコンテキストパターンを自動的に生成するモジュールを開発する。
また、前述のGenerAted PAtternsを活用してターゲットエンティティを拡張するGAPAフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-17T06:50:35Z) - Knowledge-Rich Self-Supervised Entity Linking [58.838404666183656]
Knowledge-RIch Self-Supervision(KRISSBERT$)は400万のUMLSエンティティのためのユニバーサルエンティティリンカーである。
提案手法はゼロショット法と少数ショット法を仮定し,利用可能であればエンティティ記述やゴールドレファレンスラベルを簡単に組み込むことができる。
ラベル付き情報を一切使わずに400万のUMLSエンティティのためのユニバーサルエンティティリンカである$tt KRISSBERT$を生成する。
論文 参考訳(メタデータ) (2021-12-15T05:05:12Z) - Triggering Failures: Out-Of-Distribution detection by learning from
local adversarial attacks in Semantic Segmentation [76.2621758731288]
セグメンテーションにおけるアウト・オブ・ディストリビューション(OOD)オブジェクトの検出に取り組む。
私たちの主な貢献は、ObsNetと呼ばれる新しいOOD検出アーキテクチャであり、ローカル・アタック(LAA)に基づく専用トレーニングスキームと関連付けられています。
3つの異なるデータセットの文献の最近の10つの手法と比較して,速度と精度の両面で最高の性能が得られることを示す。
論文 参考訳(メタデータ) (2021-08-03T17:09:56Z) - Interpretable and Low-Resource Entity Matching via Decoupling Feature
Learning from Decision Making [22.755892575582788]
Entity Matchingは、同じ現実世界のオブジェクトを表すエンティティレコードを認識することを目的としている。
異種情報融合(HIF)とキー属性ツリー(KAT)誘導からなる新しいEMフレームワークを提案する。
提案手法は効率が高く,ほとんどの場合SOTA EMモデルより優れている。
論文 参考訳(メタデータ) (2021-06-08T08:27:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。