論文の概要: TACO -- Twitter Arguments from COnversations
- arxiv url: http://arxiv.org/abs/2404.00406v1
- Date: Sat, 30 Mar 2024 16:14:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-04 03:59:36.716664
- Title: TACO -- Twitter Arguments from COnversations
- Title(参考訳): TACO -- 会話からTwitterを訴える
- Authors: Marc Feger, Stefan Dietze,
- Abstract要約: 引数マイニングは、情報と推論として表される議論の構造的要素を特定することを目的としている。
TACOは、200の会話全体をカバーする1,814のツイートを利用した、Twitter Argumentsの最初のデータセットです。
われわれのデータによると、Twitterユーザーはインフォームド推論や情報に関する議論をしがちだ。
- 参考スコア(独自算出の注目度): 3.887532996081327
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Twitter has emerged as a global hub for engaging in online conversations and as a research corpus for various disciplines that have recognized the significance of its user-generated content. Argument mining is an important analytical task for processing and understanding online discourse. Specifically, it aims to identify the structural elements of arguments, denoted as information and inference. These elements, however, are not static and may require context within the conversation they are in, yet there is a lack of data and annotation frameworks addressing this dynamic aspect on Twitter. We contribute TACO, the first dataset of Twitter Arguments utilizing 1,814 tweets covering 200 entire conversations spanning six heterogeneous topics annotated with an agreement of 0.718 Krippendorff's alpha among six experts. Second, we provide our annotation framework, incorporating definitions from the Cambridge Dictionary, to define and identify argument components on Twitter. Our transformer-based classifier achieves an 85.06\% macro F1 baseline score in detecting arguments. Moreover, our data reveals that Twitter users tend to engage in discussions involving informed inferences and information. TACO serves multiple purposes, such as training tweet classifiers to manage tweets based on inference and information elements, while also providing valuable insights into the conversational reply patterns of tweets.
- Abstract(参考訳): Twitterは、オンライン会話に参加するためのグローバルなハブとして現れ、ユーザー生成コンテンツの重要性を認識したさまざまな分野の研究コーパスとして登場した。
アーグメントマイニングはオンライン談話の処理と理解において重要な分析課題である。
具体的には、情報と推論として表される議論の構造的要素を特定することを目的としている。
しかし、これらの要素は静的ではなく、会話の中でコンテキストを必要とするかもしれないが、Twitterのこの動的な側面に対処するデータとアノテーションのフレームワークが欠如している。
我々は、Twitter Argumentsの最初のデータセットであるTACOを6人の専門家の間で0.718のクリッペンドルフのアルファでアノテートされた6つの異種トピックにまたがる200の会話全体をカバーする1,814のつぶやきを利用している。
第2に、Twitter上で引数コンポーネントを定義し、識別するために、Cambridge Dictionaryの定義を取り入れたアノテーションフレームワークを提供する。
我々の変換器に基づく分類器は、引数を検出する際に85.06\%のマクロF1ベースラインスコアを得る。
さらに、我々のデータによると、Twitterユーザーはインフォームド推論や情報に関する議論に携わる傾向にある。
TACOは、つぶやき分類器を訓練して、推測や情報要素に基づくつぶやきを管理するなど、複数の目的を果たすと同時に、ツイートの会話応答パターンに関する貴重な洞察を提供する。
関連論文リスト
- Uncovering the Potential of ChatGPT for Discourse Analysis in Dialogue:
An Empirical Study [51.079100495163736]
本稿では、トピックセグメンテーションと談話解析という2つの談話分析タスクにおけるChatGPTの性能を体系的に検証する。
ChatGPTは、一般的なドメイン間会話においてトピック構造を特定する能力を示すが、特定のドメイン間会話ではかなり困難である。
我々のより深い調査は、ChatGPTは人間のアノテーションよりも合理的なトピック構造を提供するが、階層的なレトリック構造を線形に解析することしかできないことを示唆している。
論文 参考訳(メタデータ) (2023-05-15T07:14:41Z) - When Crowd Meets Persona: Creating a Large-Scale Open-Domain Persona
Dialogue Corpus [13.051107304650627]
自然言語データセットの構築には、単語の意味論が微妙なテキストの変更や注釈付き概念の定義に弱いため、注意が必要である。
本研究では,大規模なオープンドメインペルソナ対話コーパスを作成する際に,これらの課題に対処する。
論文 参考訳(メタデータ) (2023-04-01T16:10:36Z) - CoSyn: Detecting Implicit Hate Speech in Online Conversations Using a
Context Synergized Hyperbolic Network [52.85130555886915]
CoSynは、オンライン会話における暗黙のヘイトスピーチを検出するために、ユーザと会話のコンテキストを明示的に組み込んだ、コンテキスト中心のニューラルネットワークである。
我々は、CoSynが、1.24%から57.8%の範囲で絶対的に改善された暗黙のヘイトスピーチを検出することで、我々のベースラインを全て上回っていることを示す。
論文 参考訳(メタデータ) (2023-03-02T17:30:43Z) - Semantic Parsing for Conversational Question Answering over Knowledge
Graphs [63.939700311269156]
本研究では,ユーザの質問にSparqlパースとアノテートし,システム回答が実行結果に対応するデータセットを開発する。
本稿では,2つの意味解析手法を提案し,その課題を強調した。
私たちのデータセットとモデルはhttps://github.com/Edinburgh/SPICE.orgで公開されています。
論文 参考訳(メタデータ) (2023-01-28T14:45:11Z) - A Unified Approach to Entity-Centric Context Tracking in Social
Conversations [6.0969408858730985]
人間と人間の会話において、コンテキストトラッキングは重要な実体を特定し、それらの性質と関係を追跡する。
Contrackは、人間と人間の大規模会話コーパスで、コンテキストトラッキングと位置アノテーションを提供する。
コンテキストトラッキングのためのニューラルネットワークアーキテクチャをオープンソースとして公開しています。
論文 参考訳(メタデータ) (2022-01-28T20:38:13Z) - What goes on inside rumour and non-rumour tweets and their reactions: A
Psycholinguistic Analyses [58.75684238003408]
ソーシャルメディアのテキストの心理言語学的分析は、誤情報を緩和するために意味のある結論を導くのに不可欠である。
本研究は,様々な事象に関する噂の深い心理言語学的分析を行うことによって貢献する。
論文 参考訳(メタデータ) (2021-11-09T07:45:11Z) - The emojification of sentiment on social media: Collection and analysis
of a longitudinal Twitter sentiment dataset [5.528896840956628]
TM-Sentiは、Twitterの感情データセットを大規模に管理し、ツイート数は1億1400万を超えている。
我々は,大規模なエモティコンと絵文字に基づくラベル付き感情分析データセットを組み立てるための方法論を記述し,評価する。
私たちの分析では絵文字のエモティコンへの利用の増加など、興味深い時間的変化が強調されている。
論文 参考訳(メタデータ) (2021-08-31T14:54:46Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - A Weakly Supervised Approach for Classifying Stance in Twitter Replies [11.139350549173953]
オンライン会話では敵の反応が一般的である。
これらの不利な見解(あるいは姿勢)を返信文から推測することは困難である。
我々は,twitter応答におけるスタンスを予測するための弱い教師付きアプローチを提案する。
論文 参考訳(メタデータ) (2021-03-12T06:02:45Z) - Exploratory Analysis of Covid-19 Tweets using Topic Modeling, UMAP, and
DiGraphs [36.33347149799959]
本稿では,Covid19 ツイートのトピック,キーワード,特徴,情報拡散の速度,ネットワーク行動の5つの異なる評価手法について述べる。
米国のケースに特有なトピックは、ホワイトハウスのコロナウイルス対策部隊のブリーフィングの後すぐに上昇し始めるだろう。
この分析の最も単純な特徴の1つは、正規表現のような初期記述的手法がハイレベルなテーマをうまく識別できることである。
論文 参考訳(メタデータ) (2020-05-06T19:16:38Z) - IART: Intent-aware Response Ranking with Transformers in
Information-seeking Conversation Systems [80.0781718687327]
我々は、情報探索会話におけるユーザ意図パターンを分析し、意図認識型ニューラルレスポンスランキングモデル「IART」を提案する。
IARTは、ユーザ意図モデリングと言語表現学習とTransformerアーキテクチャの統合の上に構築されている。
論文 参考訳(メタデータ) (2020-02-03T05:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。