Fugu-MT 論文翻訳(概要): Short Text Topic Modeling: Application to tweets about Bitcoin

論文の概要: Short Text Topic Modeling: Application to tweets about Bitcoin

arxiv url: http://arxiv.org/abs/2203.11152v1
Date: Thu, 17 Mar 2022 15:53:47 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-22 18:39:15.120989
Title: Short Text Topic Modeling: Application to tweets about Bitcoin
Title（参考訳）: ショートテキストのトピックモデリング:bitcoinに関するツイートへの適用
Authors: Hugo Schnoering
Abstract要約: トピックモデルは、文書のコーパスから"トピック"を抽出することを目的とした確率モデルである。 3つのトピックモデルをトレーニングし、そのアウトプットをいくつかのスコアで評価する。また,抽出したトピックの具体的応用を提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Understanding the semantic of a collection of texts is a challenging task. Topic models are probabilistic models that aims at extracting "topics" from a corpus of documents. This task is particularly difficult when the corpus is composed of short texts, such as posts on social networks. Following several previous research papers, we explore in this paper a set of collected tweets about bitcoin. In this work, we train three topic models and evaluate their output with several scores. We also propose a concrete application of the extracted topics.
Abstract（参考訳）: テキストの集合の意味を理解することは難しい作業である。トピックモデルは、文書のコーパスから「トピック」を抽出することを目的とした確率モデルである。このタスクは、コーパスがソーシャルネットワーク上の投稿のような短いテキストで構成されている場合、特に難しい。これまでのいくつかの研究論文に続いて、この論文でbitcoinに関する一連のツイートを考察する。本研究では,3つのトピックモデルをトレーニングし,その出力を複数のスコアで評価する。また,抽出したトピックの具体的応用を提案する。

関連論文リスト

A Large Language Model Guided Topic Refinement Mechanism for Short Text Modeling [10.589126787499973]
既存のトピックモデルは、しばしば短いテキストの根底にあるセマンティックなパターンを正確に捉えるのに苦労する。本稿では,トピックリファインメント(Topic Refinement)と呼ばれる新しいモデル非依存機構を提案する。トピックリファインメントによりトピックの品質が向上し、トピック関連テキスト分類タスクのパフォーマンスが向上することを示す。
論文参考訳（メタデータ） (2024-03-26T13:50:34Z)
Prompting Large Language Models for Topic Modeling [10.31712610860913]
大規模言語モデル(LLM)の高度な言語理解を活用する新しいトピックモデリング手法であるPromptTopicを提案する。個々の文書から文章レベルでトピックを抽出し、これらのトピックを事前定義された量に集約して凝縮し、最終的に様々な長さのテキストに対して一貫性のあるトピックを提供する。 PromptTopicを3つの非常に多様なデータセットの最先端のベースラインに対してベンチマークし、意味のあるトピックを発見する能力を確立しました。
論文参考訳（メタデータ） (2023-12-15T11:15:05Z)
TopicAdapt- An Inter-Corpora Topics Adaptation Approach [27.450275637652418]
本稿では、関連するソースコーパスから関連するトピックを適応し、ソースコーパスに存在しないターゲットコーパスに新しいトピックを発見できるトピックモデルTopicAdaptを提案する。多様なドメインからの複数のデータセットに対する実験は、最先端のトピックモデルに対して提案されたモデルの優位性を示している。
論文参考訳（メタデータ） (2023-10-08T02:56:44Z)
Multi-turn Dialogue Comprehension from a Topic-aware Perspective [70.37126956655985]
本稿では,話題認識の観点から,マルチターン対話をモデル化することを提案する。対話文のセグメント化アルゴリズムを用いて、対話文を教師なしの方法でトピック集中フラグメントに分割する。また,トピックセグメントを処理要素として扱う新しいモデルとして,トピック認識デュアルアテンションマッチング(TADAM)ネットワークを提案する。
論文参考訳（メタデータ） (2023-09-18T11:03:55Z)
Topics in the Haystack: Extracting and Evaluating Topics beyond Coherence [0.0]
本稿では,文と文書のテーマを深く理解する手法を提案する。これにより、一般的な単語やネオロジズムを含む潜在トピックを検出することができる。本稿では, 侵入者の単語の人間識別と相関係数を示し, 単語侵入作業において, ほぼ人間レベルの結果を得る。
論文参考訳（メタデータ） (2023-03-30T12:24:25Z)
Twitter Topic Classification [15.306383757213956]
我々は、ツイートトピック分類に基づく新しいタスクを提案し、関連する2つのデータセットをリリースする。ソーシャルメディアで最も重要な議論点をカバーする幅広いトピックについて、トレーニングとテストデータを提供しています。タスク上で,現在の汎用言語モデルとドメイン固有言語モデルの定量的評価と分析を行う。
論文参考訳（メタデータ） (2022-09-20T16:13:52Z)
CTM -- A Model for Large-Scale Multi-View Tweet Topic Classification [3.8566204000714315]
本稿では,300ドルのトピックを対象とするトピック空間をサポートする新しいニューラルモデルCTMを提案する。提案手法は,他の手法に優れた性能を付与することにより,ツイートを大規模にトピックに分類する効果的な方法を提供する。
論文参考訳（メタデータ） (2022-05-03T16:32:09Z)
EmailSum: Abstractive Email Thread Summarization [105.46012304024312]
我々は,メールスレッド要約(EmailSum)データセットを抽象化的に開発する。このデータセットには、人間による注釈付きショート(30ワード)と、2549のメールスレッドからなるロング(100ワード)のサマリーが含まれている。本研究は,現在の抽象的要約モデルの課題を明らかにするものである。
論文参考訳（メタデータ） (2021-07-30T15:13:14Z)
ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文参考訳（メタデータ） (2021-06-01T22:17:13Z)
Multi-View Sequence-to-Sequence Models with Conversational Structure for Abstractive Dialogue Summarization [72.54873655114844]
テキスト要約は、NLPにおいて最も困難で興味深い問題の1つである。本研究では、まず、異なる視点から構造化されていない日々のチャットの会話構造を抽出し、会話を表現するマルチビューシーケンス・ツー・シーケンスモデルを提案する。大規模対話要約コーパスの実験により,本手法は,自動評価と人的判断の両面から,従来の最先端モデルよりも有意に優れた性能を示した。
論文参考訳（メタデータ） (2020-10-04T20:12:44Z)
Topic-Aware Multi-turn Dialogue Modeling [91.52820664879432]
本稿では,トピック認識発話を教師なしでセグメント化して抽出する,多元対話モデリングのための新しいソリューションを提案する。トピック・アウェア・モデリングは、新たに提案されたトピック・アウェア・セグメンテーション・アルゴリズムとトピック・アウェア・デュアル・アテンション・マッチング(TADAM)ネットワークによって実現されている。
論文参考訳（メタデータ） (2020-09-26T08:43:06Z)
Video Captioning with Guidance of Multimodal Latent Topics [123.5255241103578]
我々は、データから教師なしの方法でマルチモーダルトピックをマイニングする統合キャプションフレームワークM&M TGMを提案する。事前に定義されたトピックと比較して、マイニングされたマルチモーダルトピックはより意味的に、視覚的に一貫性がある。 MSR-VTTとYoutube2Textのデータセットを用いた大規模な実験の結果,提案手法の有効性が示された。
論文参考訳（メタデータ） (2017-08-31T11:18:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。