論文の概要: Use of social media and Natural Language Processing (NLP) in natural
hazard research
- arxiv url: http://arxiv.org/abs/2304.08341v1
- Date: Mon, 17 Apr 2023 15:03:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-18 14:39:49.432676
- Title: Use of social media and Natural Language Processing (NLP) in natural
hazard research
- Title(参考訳): ナチュラルハザード研究におけるソーシャルメディアと自然言語処理(NLP)の利用
- Authors: Jos\'e Augusto Proen\c{c}a Maia Devienne
- Abstract要約: The work of Sasaki et al. (2010) and Earle et al. (2011)では、自然災害を検出するためにTwitter上でのリアルタイムインタラクションについて検討している。
このようなアプリケーションに固有の課題は自然言語処理(NLP)である。
本稿では,高度な分類と分類を応用したNLP機械学習プロセスを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Twitter is a microblogging service for sending short, public text messages
(tweets) that has recently received more attention in scientific comunity. In
the works of Sasaki et al. (2010) and Earle et al., (2011) the authors explored
the real-time interaction on Twitter for detecting natural hazards (e.g.,
earthquakes, typhoons) baed on users' tweets. An inherent challenge for such an
application is the natural language processing (NLP), which basically consists
in converting the words in number (vectors and tensors) in order to
(mathematically/ computationally) make predictions and classifications.
Recently advanced computational tools have been made available for dealing with
text computationally. In this report we implement a NLP machine learning with
TensorFlow, an end-to-end open source plataform for machine learning
applications, to process and classify evenct based on files containing only
text.
- Abstract(参考訳): Twitterは、短い公開メッセージ(つぶやき)を送るためのマイクロブログサービスで、最近科学界で注目を集めている。
Sasaki et al. (2010) と Earle et al. (2011) の著作で、著者らはTwitter上でのリアルタイムインタラクションを、ユーザーのつぶやきに基づく自然災害(地震、台風など)を検出するために探求した。
このようなアプリケーションに固有の課題は自然言語処理(NLP)であり、これは基本的に数(ベクトルとテンソル)の単語を(数学的・計算的に)予測と分類を行うために変換するものである。
近年,テキスト処理のための高度な計算ツールが開発されている。
本稿では、機械学習アプリケーションのためのエンドツーエンドのオープンソースプラタフォームであるTensorFlowを用いて、NLP機械学習を実装し、テキストのみを含むファイルに基づいて偶数処理と分類を行う。
関連論文リスト
- A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus [71.77214818319054]
自然言語推論は自然言語理解のプロキシである。
ルーマニア語のNLIコーパスは公開されていない。
58Kの訓練文対からなるルーマニア初のNLIコーパス(RoNLI)を紹介する。
論文 参考訳(メタデータ) (2024-05-20T08:41:15Z) - Natural Language Processing for Dialects of a Language: A Survey [56.93337350526933]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットに対するNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文 参考訳(メタデータ) (2024-01-11T03:04:38Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - Twitter-Demographer: A Flow-based Tool to Enrich Twitter Data [31.19059013571499]
Twitter-Demographerは、Twitterのデータにツイートやユーザーに関する追加情報を加えるフローベースのツールだ。
フローベースのプログラミングパラダイムにインスパイアされた設計選択を議論し、容易にチェーン化して拡張可能なブラックボックスコンポーネントの使用について論じる。
論文 参考訳(メタデータ) (2022-01-26T14:59:17Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - Efficacy of BERT embeddings on predicting disaster from Twitter data [0.548253258922555]
救助機関はソーシャルメディアを監視し、災害を特定し、生命のリスクを減らす。
人間が大量のデータを手動でチェックし、災害をリアルタイムで特定することは不可能である。
先進的な文脈埋め込み法(BERT)は、同じ単語に対する異なるベクトルを異なる文脈で構築する。
BERT埋め込みは、従来の単語埋め込みよりも災害予測タスクにおいて最良の結果をもたらす。
論文 参考訳(メタデータ) (2021-08-08T17:44:29Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - BERT Transformer model for Detecting Arabic GPT2 Auto-Generated Tweets [6.18447297698017]
本稿では、アラビア語の文が人間が書いたか、ボットが自動生成したかを検出できるトランスファー学習に基づくモデルを提案する。
新しいトランスファーラーニングモデルは、最大98%の精度を得ました。
私たちの知る限り、この研究はARABERTとGPT2を組み合わせ、アラビア語の自動生成テキストを検出し、分類した最初の研究です。
論文 参考訳(メタデータ) (2021-01-22T21:50:38Z) - Deep Learning for Text Style Transfer: A Survey [71.8870854396927]
テキストスタイル転送は、生成したテキストの特定の属性を制御することを目的として、自然言語生成において重要なタスクである。
2017年の最初のニューラルテキストスタイル転送作業以降,100以上の代表的な記事を対象とした,ニューラルテキストスタイル転送の研究の体系的な調査を行う。
タスクの定式化、既存のデータセットとサブタスク、評価、並列データと非並列データの存在下での豊富な方法論について論じる。
論文 参考訳(メタデータ) (2020-11-01T04:04:43Z) - Integrating Crowdsourcing and Active Learning for Classification of
Work-Life Events from Tweets [9.137917522951277]
ソーシャルメディアデータは構造化されておらず、研究のために複雑な操作をしなければならない。
私たちは、アクティブな学習戦略を組み合わせたクラウドソーシングパイプラインを考案しました。
結果として、クラウドソーシングは高品質なアノテーションを作成するのに有用であり、アクティブな学習は必要なツイート数を減らすのに役立ちます。
論文 参考訳(メタデータ) (2020-03-26T20:19:33Z) - Deep Learning for Hindi Text Classification: A Comparison [6.8629257716723]
デヴァナガリ文字で書かれた形態的に豊かで低資源のヒンディー語を分類する研究は、大きなラベル付きコーパスがないために限られている。
本研究では,CNN,LSTM,注意に基づくモデル評価のために,英文データセットの翻訳版を用いた。
また,本論文は,一般的なテキスト分類手法のチュートリアルとしても機能する。
論文 参考訳(メタデータ) (2020-01-19T09:29:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。