論文の概要: Through the Twitter Glass: Detecting Questions in Micro-Text
- arxiv url: http://arxiv.org/abs/2006.07732v1
- Date: Sat, 13 Jun 2020 22:34:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 21:16:35.738998
- Title: Through the Twitter Glass: Detecting Questions in Micro-Text
- Title(参考訳): Twitter Glassでマイクロテキストで質問を検出する
- Authors: Kyle Dent and Sharoda Paul
- Abstract要約: 別の調査では、Twitter上での人々のQ&A習慣を理解することに興味がありました。
Twitter内で質問を見つけることは難しい課題であることが判明したので、従来のNLPアプローチを問題に適用することを検討しました。
この研究はまだ予備的ですが、本稿では、私たちが使ったテクニックと学んだ教訓について論じます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In a separate study, we were interested in understanding people's Q&A habits
on Twitter. Finding questions within Twitter turned out to be a difficult
challenge, so we considered applying some traditional NLP approaches to the
problem. On the one hand, Twitter is full of idiosyncrasies, which make
processing it difficult. On the other, it is very restricted in length and
tends to employ simple syntactic constructions, which could help the
performance of NLP processing. In order to find out the viability of NLP and
Twitter, we built a pipeline of tools to work specifically with Twitter input
for the task of finding questions in tweets. This work is still preliminary,
but in this paper we discuss the techniques we used and the lessons we learned.
- Abstract(参考訳): 別の研究では、twitter上の人々のq&a習慣を理解することに興味がありました。
Twitter内で質問を見つけることは難しい課題であることが判明したので、従来のNLPアプローチを問題に適用することを検討しました。
一方、Twitterは慣用性に満ちており、処理が難しくなっている。
他方では、長さが非常に制限されており、単純な構文構造を用いる傾向があるため、NLP処理の性能が向上する可能性がある。
NLPとTwitterの実用性を調べるために、Twitterのインプットに特化して、ツイート中の質問を見つけるためのツールのパイプラインを構築しました。
この作業はまだ予備的ですが,本稿では,使用するテクニックと学んだ教訓について論じます。
関連論文リスト
- How to Engage Your Readers? Generating Guiding Questions to Promote Active Reading [60.19226384241482]
教科書や科学論文から10Kのインテキスト質問のデータセットであるGuidingQを紹介した。
言語モデルを用いてこのような質問を生成するための様々なアプローチを探索する。
我々は、そのような質問が読解に与える影響を理解するために、人間の研究を行う。
論文 参考訳(メタデータ) (2024-07-19T13:42:56Z) - Which questions should I answer? Salience Prediction of Inquisitive Questions [118.097974193544]
非常に健全な質問は、同じ記事で経験的に答えられる可能性が高いことを示す。
質問に対する回答が,ニュースの要約品質の指標であることを示すことで,我々の知見をさらに検証する。
論文 参考訳(メタデータ) (2024-04-16T21:33:05Z) - Use of social media and Natural Language Processing (NLP) in natural
hazard research [0.0]
The work of Sasaki et al. (2010) and Earle et al. (2011)では、自然災害を検出するためにTwitter上でのリアルタイムインタラクションについて検討している。
このようなアプリケーションに固有の課題は自然言語処理(NLP)である。
本稿では,高度な分類と分類を応用したNLP機械学習プロセスを提案する。
論文 参考訳(メタデータ) (2023-04-17T15:03:05Z) - Twitter-Demographer: A Flow-based Tool to Enrich Twitter Data [31.19059013571499]
Twitter-Demographerは、Twitterのデータにツイートやユーザーに関する追加情報を加えるフローベースのツールだ。
フローベースのプログラミングパラダイムにインスパイアされた設計選択を議論し、容易にチェーン化して拡張可能なブラックボックスコンポーネントの使用について論じる。
論文 参考訳(メタデータ) (2022-01-26T14:59:17Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - What goes on inside rumour and non-rumour tweets and their reactions: A
Psycholinguistic Analyses [58.75684238003408]
ソーシャルメディアのテキストの心理言語学的分析は、誤情報を緩和するために意味のある結論を導くのに不可欠である。
本研究は,様々な事象に関する噂の深い心理言語学的分析を行うことによって貢献する。
論文 参考訳(メタデータ) (2021-11-09T07:45:11Z) - TweeNLP: A Twitter Exploration Portal for Natural Language Processing [5.315717519923849]
TweeNLPはTwitterの自然言語処理(NLP)データを整理するワンストップポータルである。
様々なNLPカンファレンスやNLPの一般的な議論から、2021年4月時点で19,395のツイートをキュレートする。
論文 参考訳(メタデータ) (2021-06-19T15:11:22Z) - A Weakly Supervised Approach for Classifying Stance in Twitter Replies [11.139350549173953]
オンライン会話では敵の反応が一般的である。
これらの不利な見解(あるいは姿勢)を返信文から推測することは困難である。
我々は,twitter応答におけるスタンスを予測するための弱い教師付きアプローチを提案する。
論文 参考訳(メタデータ) (2021-03-12T06:02:45Z) - You Are What You Tweet: Profiling Users by Past Tweets to Improve Hate
Speech Detection [5.203329540700176]
我々は,新しい発話がヘイトスピーチを構成するか否かをより正確に予測するために,過去の発話によるユーザを情報として調査する。
これを評価するために、Twitterのヘイトスピーチデータセットを3つ追加のタイムラインデータで拡張し、この追加コンテキストを強力なベースラインモデルに組み込む。
有望な結果はさらなる調査のメリットを示唆するが、分析はアノテーションのスキームやプロセスの違いやtwitter apiの制限、データ共有ポリシーによって複雑である。
論文 参考訳(メタデータ) (2020-12-16T17:17:47Z) - Universal Natural Language Processing with Limited Annotations: Try
Few-shot Textual Entailment as a Start [125.23550801424328]
Universal Few-shot Textual Entailment (UFO-Entail)
universal Few-shot Textual Entailment (UFO-Entail)を紹介する。
我々は、このフレームワークにより、事前訓練されたエンターテイメントモデルが、数ショット設定で新しいエンターテイメントドメインでうまく機能できることを実証する。
論文 参考訳(メタデータ) (2020-10-06T09:50:25Z) - Writer Identification Using Microblogging Texts for Social Media
Forensics [53.180678723280145]
私たちは、文学的分析に広く使われている人気のあるスタイル的特徴と、URL、ハッシュタグ、返信、引用などの特定のTwitter機能を評価します。
我々は、様々なサイズの著者集合と、著者毎のトレーニング/テストテキストの量をテストする。
論文 参考訳(メタデータ) (2020-07-31T00:23:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。