論文の概要: TweetNLP: Cutting-Edge Natural Language Processing for Social Media
- arxiv url: http://arxiv.org/abs/2206.14774v1
- Date: Wed, 29 Jun 2022 17:16:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-30 20:01:04.821065
- Title: TweetNLP: Cutting-Edge Natural Language Processing for Social Media
- Title(参考訳): TweetNLP:ソーシャルメディアのためのカットエッジ自然言語処理
- Authors: Jose Camacho-Collados and Kiamehr Rezaee and Talayeh Riahi and Asahi
Ushio and Daniel Loureiro and Dimosthenis Antypas and Joanne Boisson and Luis
Espinosa-Anke and Fangyu Liu and Eugenio Mart\'inez-C\'amara and Gonzalo
Medina and Thomas Buhrmann and Leonardo Neves and Francesco Barbieri
- Abstract要約: TweetNLPは、ソーシャルメディアにおける自然言語処理(NLP)の統合プラットフォームである。
感情分析や名前付きエンティティ認識といった汎用的な焦点領域を含む、多様なNLPタスク群をサポートする。
システムは、ソーシャルメディアのテキストに特化した、合理的な大きさのTransformerベースの言語モデルを利用している。
- 参考スコア(独自算出の注目度): 22.6980150693332
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we present TweetNLP, an integrated platform for Natural
Language Processing (NLP) in social media. TweetNLP supports a diverse set of
NLP tasks, including generic focus areas such as sentiment analysis and named
entity recognition, as well as social media-specific tasks such as emoji
prediction and offensive language identification. Task-specific systems are
powered by reasonably-sized Transformer-based language models specialized on
social media text (in particular, Twitter) which can be run without the need
for dedicated hardware or cloud services. The main contributions of TweetNLP
are: (1) an integrated Python library for a modern toolkit supporting social
media analysis using our various task-specific models adapted to the social
domain; (2) an interactive online demo for codeless experimentation using our
models; and (3) a tutorial covering a wide variety of typical social media
applications.
- Abstract(参考訳): 本稿では,ソーシャルメディアにおける自然言語処理(NLP)の統合プラットフォームであるTweetNLPについて述べる。
TweetNLPは感情分析や名前付きエンティティ認識といった汎用的な焦点領域や、絵文字予測や攻撃的な言語識別といったソーシャルメディア固有のタスクなど、さまざまなNLPタスクをサポートする。
タスク固有のシステムは、ソーシャルメディアテキスト(特にTwitter)に特化した合理的なサイズのTransformerベースの言語モデルで、専用のハードウェアやクラウドサービスを必要とせずに実行できる。
tweetnlpの主な貢献は、(1)ソーシャルドメインに適合した様々なタスク特化モデルを用いたソーシャルメディア分析をサポートするモダンなツールキットのための統合pythonライブラリ、(2)モデルを用いたコードレス実験のためのインタラクティブなオンラインデモ、(3)様々な典型的なソーシャルメディアアプリケーションをカバーするチュートリアル、である。
関連論文リスト
- NarrationDep: Narratives on Social Media For Automatic Depression Detection [24.11420537250414]
我々は、抑うつに関連する物語を検出することに焦点を当てた、textttNarrationDepと呼ばれる新しいモデルを開発した。
textttNarrationDepは、個々のツイート表現とユーザのツイートのクラスタを共同でモデル化するディープラーニングフレームワークである。
論文 参考訳(メタデータ) (2024-07-24T11:24:25Z) - SoMeLVLM: A Large Vision Language Model for Social Media Processing [78.47310657638567]
ソーシャルメディア処理のための大規模ビジョン言語モデル(SoMeLVLM)を提案する。
SoMeLVLMは、知識と理解、応用、分析、評価、作成を含む5つの重要な機能を備えた認知フレームワークである。
実験により,複数のソーシャルメディアタスクにおいて,SoMeLVLMが最先端のパフォーマンスを達成できることが実証された。
論文 参考訳(メタデータ) (2024-02-20T14:02:45Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - TwHIN-BERT: A Socially-Enriched Pre-trained Language Model for
Multilingual Tweet Representations at Twitter [31.698196219228024]
TwHIN-BERTはTwitterで制作された多言語言語モデルである。
私たちのモデルは、100以上の異なる言語をカバーする70億のツイートで訓練されています。
我々は,多言語ソーシャルレコメンデーションと意味理解タスクにおけるモデルの評価を行った。
論文 参考訳(メタデータ) (2022-09-15T19:01:21Z) - BERTuit: Understanding Spanish language in Twitter through a native
transformer [70.77033762320572]
bfBERTuitは、これまでスペイン語のために提案された大きなトランスフォーマーで、2億3000万のスペイン語ツイートの膨大なデータセットで事前トレーニングされている。
私たちのモチベーションは、スペイン語のTwitterをよりよく理解し、このソーシャルネットワークにフォーカスしたアプリケーションに利用するための強力なリソースを提供することです。
論文 参考訳(メタデータ) (2022-04-07T14:28:51Z) - Annotating the Tweebank Corpus on Named Entity Recognition and Building
NLP Models for Social Media Analysis [12.871968485402084]
Twitterメッセージ(つぶやき)のようなソーシャルメディアデータは、短い、騒々しく、口語的な性質のため、NLPシステムに特別な課題をもたらす。
我々は、Tweebank V2 (TB2) に基づく NER コーパスである Tweebank-NER を作成し、これらを用いて最先端の NLP モデルを訓練する。
将来のつぶやきNLP研究のために、データセットをリリースし、モデルを"既成の"方法で使用できるようにします。
論文 参考訳(メタデータ) (2022-01-18T19:34:23Z) - FBERT: A Neural Transformer for Identifying Offensive Content [67.12838911384024]
fBERTは、SOLIDで再訓練されたBERTモデルである。
複数の英文データセット上での攻撃的内容の同定におけるfBERTの性能を評価し、SOLIDからインスタンスを選択するためのしきい値をテストする。
fBERTモデルは、コミュニティで自由に利用できるようになる。
論文 参考訳(メタデータ) (2021-09-10T19:19:26Z) - pysentimiento: A Python Toolkit for Opinion Mining and Social NLP tasks [0.2826977330147589]
pysentimientoは意見マイニングやその他のソーシャルNLPタスク用に設計されたPythonツールキットである。
このオープンソースライブラリは、簡単に使えるPythonライブラリで、スペイン語、英語、イタリア語、ポルトガル語の最先端モデルを提供する。
各種タスク,言語,データセットにまたがる事前学習言語モデルの総合的な性能評価を行う。
論文 参考訳(メタデータ) (2021-06-17T13:15:07Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - Semi-automatic Generation of Multilingual Datasets for Stance Detection
in Twitter [9.359018642178917]
本稿では,Twitterにおける姿勢検出のための多言語データセットを得る手法を提案する。
ユーザベースの情報を利用して、大量のツイートを半自動でラベル付けします。
論文 参考訳(メタデータ) (2021-01-28T13:05:09Z) - N-LTP: An Open-source Neural Language Technology Platform for Chinese [68.58732970171747]
textttN-は、中国の6つの基本的なNLPタスクをサポートする、オープンソースのニューラルネットワークテクノロジプラットフォームである。
textttN-は、中国のタスク間で共有知識をキャプチャする利点がある共有事前学習モデルを使用することで、マルチタスクフレームワークを採用する。
論文 参考訳(メタデータ) (2020-09-24T11:45:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。