論文の概要: Named Entity Recognition for Social Media Texts with Semantic
Augmentation
- arxiv url: http://arxiv.org/abs/2010.15458v1
- Date: Thu, 29 Oct 2020 10:06:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-01 22:53:21.353721
- Title: Named Entity Recognition for Social Media Texts with Semantic
Augmentation
- Title(参考訳): 意味的拡張を伴うソーシャルメディアテキストに対する名前付きエンティティ認識
- Authors: Yuyang Nie, Yuanhe Tian, Xiang Wan, Yan Song, and Bo Dai
- Abstract要約: 名前付きエンティティ認識のための既存のアプローチは、短いテキストと非公式テキストで実行される場合、データ空間の問題に悩まされる。
そこで我々は,NER によるソーシャルメディアテキストに対するニューラルベースアプローチを提案し,ローカルテキストと拡張セマンティクスの両方を考慮に入れた。
- 参考スコア(独自算出の注目度): 70.44281443975554
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing approaches for named entity recognition suffer from data sparsity
problems when conducted on short and informal texts, especially user-generated
social media content. Semantic augmentation is a potential way to alleviate
this problem. Given that rich semantic information is implicitly preserved in
pre-trained word embeddings, they are potential ideal resources for semantic
augmentation. In this paper, we propose a neural-based approach to NER for
social media texts where both local (from running text) and augmented semantics
are taken into account. In particular, we obtain the augmented semantic
information from a large-scale corpus, and propose an attentive semantic
augmentation module and a gate module to encode and aggregate such information,
respectively. Extensive experiments are performed on three benchmark datasets
collected from English and Chinese social media platforms, where the results
demonstrate the superiority of our approach to previous studies across all
three datasets.
- Abstract(参考訳): 名前付きエンティティ認識の既存のアプローチは、短いテキストや非公式なテキスト、特にユーザー生成のソーシャルメディアコンテンツで実行される場合、データのスパーシティの問題に苦しむ。
セマンティック拡張はこの問題を緩和する潜在的方法である。
リッチな意味情報は、事前訓練された単語の埋め込みで暗黙的に保存されているので、セマンティック拡張のための潜在的理想的なリソースである。
本稿では,NERの局所的(実行中のテキストから)と拡張的セマンティクスを考慮に入れたソーシャルメディアテキストに対するニューラルベースアプローチを提案する。
特に,大規模コーパスから拡張された意味情報を取得し,これら情報をエンコードし集約するための注意的意味拡張モジュールとゲートモジュールを提案する。
英語と中国語のソーシャルメディアプラットフォームから収集した3つのベンチマークデータセットで広範な実験を行い,この3つのデータセットすべてにおいて,これまでの研究よりも優れたアプローチを示す。
関連論文リスト
- Semantic Communication Enhanced by Knowledge Graph Representation Learning [11.68356846628016]
本稿では,意味的コミュニケーションの新たなパラダイムにおいて,グラフに抽出された意味的知識の表現と処理の利点について検討する。
本稿では,無線チャネルを通じてノード埋め込みと等価な意味記号を送信し,受信側で完全な知識グラフを推測する。
論文 参考訳(メタデータ) (2024-07-27T20:57:10Z) - Self-Supervised Speech Representations are More Phonetic than Semantic [52.02626675137819]
自己教師付き音声モデル(S3Ms)は、音声応用の有効なバックボーンとなっている。
S3Msで符号化された単語レベルの言語特性のよりきめ細かい分析を求める。
本研究により,S3M表現は意味的類似性よりも連続的かつ顕著に音声的類似性を示すことが明らかとなった。
論文 参考訳(メタデータ) (2024-06-12T20:04:44Z) - SememeASR: Boosting Performance of End-to-End Speech Recognition against
Domain and Long-Tailed Data Shift with Sememe Semantic Knowledge [58.979490858061745]
セメムに基づくセマンティック知識情報を音声認識に導入する。
実験の結果,セム情報により音声認識の有効性が向上することが示された。
さらに,本実験により,セメム知識が長期データ認識を改善することが確認された。
論文 参考訳(メタデータ) (2023-09-04T08:35:05Z) - Disentangling Learnable and Memorizable Data via Contrastive Learning
for Semantic Communications [81.10703519117465]
セマンティック・レディにするために、ソースデータをアンタングルする新しい機械推論フレームワークが提案されている。
特に、データ上でインスタンスとクラスタの識別を行う新しいコントラスト学習フレームワークが提案されている。
信頼度の高い深いセマンティッククラスタは、学習可能でセマンティックリッチなデータだと考えられている。
シミュレーションの結果は, セマンティック・インパクトとミニマリズムの観点から, コントラスト学習アプローチの優位性を示した。
論文 参考訳(メタデータ) (2022-12-18T12:00:12Z) - Performance Optimization for Semantic Communications: An Attention-based
Reinforcement Learning Approach [187.4094332217186]
テキストデータ伝送のためのセマンティック通信フレームワークを提案する。
回復したテキストの意味的精度と完全性を共同でキャプチャする意味的類似度尺度(MSS)を提案する。
論文 参考訳(メタデータ) (2022-08-17T11:39:16Z) - Boosting Video-Text Retrieval with Explicit High-Level Semantics [115.66219386097295]
VTRのための新しい視覚言語整合モデルHiSEを提案する。
明示的なハイレベルなセマンティクスを取り入れることで、クロスモーダル表現を改善する。
提案手法は,3つのベンチマークデータセット上での最先端手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-08-08T15:39:54Z) - Regional Semantic Contrast and Aggregation for Weakly Supervised
Semantic Segmentation [25.231470587575238]
本稿では,意味的セグメンテーションを学習するための地域意味的コントラストとアグリゲーション(RCA)を提案する。
RCAは、訓練データに現れる多種多様なオブジェクトパターンを格納する地域記憶バンクを備えている。
RCAは、きめ細かいセマンティック理解の強い能力を獲得し、最終的には2つの人気のあるベンチマークで新しい最先端の結果を確立する。
論文 参考訳(メタデータ) (2022-03-17T23:29:03Z) - Data Expansion using Back Translation and Paraphrasing for Hate Speech
Detection [1.192436948211501]
本稿では,バック翻訳手法を融合した新しい深層学習手法と,データ拡張のためのパラフレージング手法を提案する。
AskFm corpus, Formspring データセット, Warner と Waseem データセット, Olid および Wikipedia の有毒なコメントデータセットである。
論文 参考訳(メタデータ) (2021-05-25T09:52:42Z) - EDS-MEMBED: Multi-sense embeddings based on enhanced distributional
semantic structures via a graph walk over word senses [0.0]
WordNetの豊富なセマンティック構造を活用して、マルチセンス埋め込みの品質を高めます。
M-SEの新たな分布意味類似度測定法を先行して導出する。
WSDとWordの類似度タスクを含む11のベンチマークデータセットの評価結果を報告します。
論文 参考訳(メタデータ) (2021-02-27T14:36:55Z) - A Framework for Pre-processing of Social Media Feeds based on Integrated
Local Knowledge Base [1.5749416770494706]
本稿では,ソーシャルメディアフィードの事前処理によるパフォーマンス向上のためのフレームワークを提案する。
このフレームワークは、標準化されたデータセットで94.07%、ツイートから感情を抽出する際には、局所化されたデータセットで99.78%の精度を持っていた。
論文 参考訳(メタデータ) (2020-06-29T07:56:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。