論文の概要: Conversational Structure Aware and Context Sensitive Topic Model for
Online Discussions
- arxiv url: http://arxiv.org/abs/2002.02353v1
- Date: Thu, 6 Feb 2020 16:57:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 12:36:22.698784
- Title: Conversational Structure Aware and Context Sensitive Topic Model for
Online Discussions
- Title(参考訳): オンライン討論における会話構造認識と文脈感性トピックモデル
- Authors: Yingcheng Sun and Kenneth Loparo and Richard Kolacinski
- Abstract要約: 本稿では,コメントに対する応答数を定量化し,単語の発生頻度を拡大する「人気度」尺度を提案する。
我々は,人気度と推移度に基づいて対話型構造認識トピックモデル(CSATM)を構築し,トピックとコメントへの課題を推測する。
- 参考スコア(独自算出の注目度): 0.32228025627337864
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Millions of online discussions are generated everyday on social media
platforms. Topic modelling is an efficient way of better understanding large
text datasets at scale. Conventional topic models have had limited success in
online discussions, and to overcome their limitations, we use the discussion
thread tree structure and propose a "popularity" metric to quantify the number
of replies to a comment to extend the frequency of word occurrences, and the
"transitivity" concept to characterize topic dependency among nodes in a nested
discussion thread. We build a Conversational Structure Aware Topic Model
(CSATM) based on popularity and transitivity to infer topics and their
assignments to comments. Experiments on real forum datasets are used to
demonstrate improved performance for topic extraction with six different
measurements of coherence and impressive accuracy for topic assignments.
- Abstract(参考訳): 何百万ものオンラインディスカッションがソーシャルメディアプラットフォーム上で毎日発生している。
トピックモデリングは大規模なテキストデータセットをより理解するための効率的な方法である。
従来のトピックモデルは,オンライン議論において限られた成功を収めており,それらの制限を克服するために,議論スレッド木構造を用いて,コメントに対する応答数を定量化し,単語発生頻度を拡大する指標と,ネストした議論スレッド内のノード間のトピック依存性を特徴付ける「推移性」概念を提案する。
我々は,人気度と推移度に基づく会話構造意識トピックモデル(CSATM)を構築し,トピックとコメントへの課題を推測する。
実フォーラムデータセットにおける実験は、6つの異なるコヒーレンスの測定とトピック割り当ての印象的な精度でトピック抽出のパフォーマンス向上を示すために使用される。
関連論文リスト
- CantTalkAboutThis: Aligning Language Models to Stay on Topic in Dialogues [4.427811636536821]
CantTalkAboutこのデータセットは、異なるドメインからの幅広い会話トピックに関する合成対話で構成されている。
このデータセット上の微調整言語モデルは、割り当てられたロールから逸脱する耐性を高めるのに役立ちます。
予備的な観察は、このデータセットのトレーニングモデルが、安全アライメントを含む、きめ細かい指示に従うタスクのパフォーマンスを向上させることを示唆している。
論文 参考訳(メタデータ) (2024-04-04T22:31:58Z) - Prompting Large Language Models for Topic Modeling [10.31712610860913]
大規模言語モデル(LLM)の高度な言語理解を活用する新しいトピックモデリング手法であるPromptTopicを提案する。
個々の文書から文章レベルでトピックを抽出し、これらのトピックを事前定義された量に集約して凝縮し、最終的に様々な長さのテキストに対して一貫性のあるトピックを提供する。
PromptTopicを3つの非常に多様なデータセットの最先端のベースラインに対してベンチマークし、意味のあるトピックを発見する能力を確立しました。
論文 参考訳(メタデータ) (2023-12-15T11:15:05Z) - TopicGPT: A Prompt-based Topic Modeling Framework [77.72072691307811]
TopicGPTは,大規模言語モデルを用いてテキストコレクション内の潜在トピックを明らかにするプロンプトベースのフレームワークである。
競合する手法と比較して、人間の分類とよく一致したトピックを生成する。
そのトピックもまた解釈可能であり、自然言語ラベルと関連する自由形式の記述を含むトピックを好んで、曖昧な言葉の袋を除いた。
論文 参考訳(メタデータ) (2023-11-02T17:57:10Z) - HyperMiner: Topic Taxonomy Mining with Hyperbolic Embedding [54.52651110749165]
本稿では,単語や話題を表現するために,メタボリック埋め込みを導入した新しいフレームワークを提案する。
双曲空間のツリー様性により、下層のセマンティック階層はより解釈可能なトピックをマイニングするためによりうまく利用することができる。
論文 参考訳(メタデータ) (2022-10-16T02:54:17Z) - Twitter Topic Classification [15.306383757213956]
我々は、ツイートトピック分類に基づく新しいタスクを提案し、関連する2つのデータセットをリリースする。
ソーシャルメディアで最も重要な議論点をカバーする幅広いトピックについて、トレーニングとテストデータを提供しています。
タスク上で,現在の汎用言語モデルとドメイン固有言語モデルの定量的評価と分析を行う。
論文 参考訳(メタデータ) (2022-09-20T16:13:52Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - Unsupervised Summarization for Chat Logs with Topic-Oriented Ranking and
Context-Aware Auto-Encoders [59.038157066874255]
本稿では,手動ラベル付きデータを用いずにチャット要約を行うrankaeという新しいフレームワークを提案する。
RankAEは、中心性と多様性に応じてトピックの発話を同時に選択するトピック指向のランキング戦略で構成されています。
消音自動エンコーダは、選択された発話に基づいて簡潔でコンテキスト情報に基づいた要約を生成するように設計されています。
論文 参考訳(メタデータ) (2020-12-14T07:31:17Z) - Multi-View Sequence-to-Sequence Models with Conversational Structure for
Abstractive Dialogue Summarization [72.54873655114844]
テキスト要約は、NLPにおいて最も困難で興味深い問題の1つである。
本研究では、まず、異なる視点から構造化されていない日々のチャットの会話構造を抽出し、会話を表現するマルチビューシーケンス・ツー・シーケンスモデルを提案する。
大規模対話要約コーパスの実験により,本手法は,自動評価と人的判断の両面から,従来の最先端モデルよりも有意に優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-04T20:12:44Z) - Topic-Aware Multi-turn Dialogue Modeling [91.52820664879432]
本稿では,トピック認識発話を教師なしでセグメント化して抽出する,多元対話モデリングのための新しいソリューションを提案する。
トピック・アウェア・モデリングは、新たに提案されたトピック・アウェア・セグメンテーション・アルゴリズムとトピック・アウェア・デュアル・アテンション・マッチング(TADAM)ネットワークによって実現されている。
論文 参考訳(メタデータ) (2020-09-26T08:43:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。