論文の概要: TLA: Twitter Linguistic Analysis
- arxiv url: http://arxiv.org/abs/2107.09710v1
- Date: Tue, 20 Jul 2021 18:25:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-23 00:25:31.387137
- Title: TLA: Twitter Linguistic Analysis
- Title(参考訳): tla: twitterの言語分析
- Authors: Tushar Sarkar, Nishant Rajadhyaksha
- Abstract要約: TLA(Twitter Linguistic Analysis)は、Twitterのデータをコーパスとして収集、ラベル付け、分析するためのフレームワークである。
フレームワークの基本的な理解を提供し、言語コーパスのためのTwitterのデータ収集、ラベル付け、分析のプロセスについて議論する。
TLAが提供している分析は、異なる言語コミュニティの感情を理解するための長い道のりでもある。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Linguistics has been instrumental in developing a deeper understanding of
human nature. Words are indispensable to bequeath the thoughts, emotions, and
purpose of any human interaction, and critically analyzing these words can
elucidate the social and psychological behavior and characteristics of these
social animals. Social media has become a platform for human interaction on a
large scale and thus gives us scope for collecting and using that data for our
study. However, this entire process of collecting, labeling, and analyzing this
data iteratively makes the entire procedure cumbersome. To make this entire
process easier and structured, we would like to introduce TLA(Twitter
Linguistic Analysis). In this paper, we describe TLA and provide a basic
understanding of the framework and discuss the process of collecting, labeling,
and analyzing data from Twitter for a corpus of languages while providing
detailed labeled datasets for all the languages and the models are trained on
these datasets. The analysis provided by TLA will also go a long way in
understanding the sentiments of different linguistic communities and come up
with new and innovative solutions for their problems based on the analysis.
- Abstract(参考訳): 言語学は人間の本性をより深く理解するのに役立つ。
言葉は、人間の相互作用の思考、感情、目的をbequeathするために不可欠であり、これらの単語を批判的に分析することで、これらの社会動物の社会的、心理的行動と特性を解明することができる。
ソーシャルメディアは大規模にヒューマンインタラクションのプラットフォームとなり、我々の研究のためにそのデータを収集し利用するためのスコープを与えてくれました。
しかし、このデータの収集、ラベル付け、分析のプロセス全体が反復的に手順全体を複雑にします。
このプロセス全体を簡単かつ構造化するために、TLA(Twitter Linguistic Analysis)を紹介したいと思います。
本稿では,tlaについて述べるとともに,フレームワークの基本的な理解と,twitterから言語コーパスのためのデータ収集,ラベル付け,分析のプロセスについて議論するとともに,これらデータセット上でトレーニングされたすべての言語とモデルに対して詳細なラベル付きデータセットを提供する。
TLAが提供した分析はまた、異なる言語コミュニティの感情を理解するための長い道のりを歩み、その分析に基づいて問題に対する新しい革新的な解決策を思いつくだろう。
関連論文リスト
- X-PARADE: Cross-Lingual Textual Entailment and Information Divergence across Paragraphs [55.80189506270598]
X-PARADEは、段落レベルの情報の分岐の最初の言語間データセットである。
アノテーションは、対象言語における段落をスパンレベルでラベル付けし、ソース言語における対応する段落に対して評価する。
アライメントされた段落は、異なる言語のウィキペディアページから引用される。
論文 参考訳(メタデータ) (2023-09-16T04:34:55Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - Neural Approaches to Entity-Centric Information Extraction [2.8935588665357077]
テキスト内の情報に対して、根本的に異なるエンティティ中心の視点を導入します。
個々の言及をテキストで意味を理解する代わりに、エンティティの概念の観点で機能するアプリケーションを構築するべきだ、と私たちは主張する。
本研究では,各参照を個別にではなく,コア参照クラスタレベルでエンティティリンクを行うことにより,このタスクを改善することができることを示す。
論文 参考訳(メタデータ) (2023-04-15T20:07:37Z) - Types of Approaches, Applications and Challenges in the Development of
Sentiment Analysis Systems [0.0]
知覚分析は自然言語処理と機械学習の重要な応用の1つである。
何百万ものコメントが毎日記録され、大量の構造化されていないテキストデータを生成する。
論文 参考訳(メタデータ) (2023-03-09T15:18:34Z) - LSA-T: The first continuous Argentinian Sign Language dataset for Sign
Language Translation [52.87578398308052]
手話翻訳(SLT)は、人間とコンピュータの相互作用、コンピュータビジョン、自然言語処理、機械学習を含む活発な研究分野である。
本稿では,最初の連続的アルゼンチン手話(LSA)データセットを提案する。
このビデオには、CN Sordos YouTubeチャンネルから抽出されたLCAの14,880の文レベルのビデオと、各署名者のためのラベルとキーポイントアノテーションが含まれている。
論文 参考訳(メタデータ) (2022-11-14T14:46:44Z) - Identifying concept libraries from language about object structure [56.83719358616503]
自然言語記述を2Kプロシージャ生成オブジェクトの多種多様なセットに利用して,ユーザが使用する部分を特定する。
我々は、異なる部分概念を含むプログラムライブラリの空間の探索として、この問題を形式化する。
自然言語と構造化されたプログラム表現を組み合わせることで、人々が名前をつける部分概念を規定する基本的な情報理論的なトレードオフを発見する。
論文 参考訳(メタデータ) (2022-05-11T17:49:25Z) - Metaphors in Pre-Trained Language Models: Probing and Generalization
Across Datasets and Languages [6.7126373378083715]
大規模事前学習言語モデル(PLM)は、NLPシステムに有用な比喩的知識を符号化する。
本稿では,複数のメタファ検出データセットと4言語について研究する。
実験の結果,PLMにおける文脈表現はメタファー的知識をコード化しており,その大部分は中層にあることが示唆された。
論文 参考訳(メタデータ) (2022-03-26T19:05:24Z) - Social Analysis of Young Basque Speaking Communities in Twitter [0.9445512376558136]
バスク語で大量のつぶやきを処理することによって、人口統計分析を行うために、社会的側面と言語的側面の両方を考慮する。
階層的特徴と社会関係の研究は,機械学習と現代ディープラーニング自然言語処理(NLP)技術を適用して行われている。
論文 参考訳(メタデータ) (2021-09-08T08:19:08Z) - Vyaktitv: A Multimodal Peer-to-Peer Hindi Conversations based Dataset
for Personality Assessment [50.15466026089435]
本稿では,ピアツーピアのHindi会話データセットであるVyaktitvを提案する。
参加者の高品質な音声とビデオの録音と、会話ごとにヒングリッシュのテキストによる書き起こしで構成されている。
データセットには、収入、文化的指向など、すべての参加者のための豊富な社会デコグラフィー的特徴が含まれています。
論文 参考訳(メタデータ) (2020-08-31T17:44:28Z) - Presentation and Analysis of a Multimodal Dataset for Grounded Language
Learning [32.28310581819443]
接地的な言語習得は、言語に基づく相互作用が周囲の世界をどのように参照するかを学ぶことを伴う。
実際には、学習に使用されるデータは、実際の人間のインタラクションよりもクリーンで、クリアで、文法的な傾向があります。
本稿では,話し言葉と書き言葉を併用した家庭内共通物体のデータセットについて述べる。
論文 参考訳(メタデータ) (2020-07-29T17:58:04Z) - Experience Grounds Language [185.73483760454454]
言語理解研究は、言語が記述する物理的世界と、それが促進する社会的相互作用とを関連づけることに失敗している。
テキストだけで訓練された後にタスクに取り組むための言語処理モデルの驚くべき効果にもかかわらず、成功した言語コミュニケーションは世界の共有経験に依存している。
論文 参考訳(メタデータ) (2020-04-21T16:56:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。