論文の概要: AOBTM: Adaptive Online Biterm Topic Modeling for Version Sensitive
Short-texts Analysis
- arxiv url: http://arxiv.org/abs/2009.09930v1
- Date: Sun, 13 Sep 2020 09:50:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 02:49:34.920131
- Title: AOBTM: Adaptive Online Biterm Topic Modeling for Version Sensitive
Short-texts Analysis
- Title(参考訳): AOBTM:バージョンセンシティブな短文分析のための適応的オンライン2項トピックモデリング
- Authors: Mohammad Abdul Hadi and Fatemeh H Fard
- Abstract要約: 本稿では,短いテキストでトピックを適応的にモデル化するAdaptive Online Biterm Topic Model (AOBTM)を提案する。
AOBTMは、短文のスパーシリティ問題を緩和し、過去のタイムスライスの最適な数の統計データを考える。
- 参考スコア(独自算出の注目度): 2.1320960069210484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Analysis of mobile app reviews has shown its important role in requirement
engineering, software maintenance and evolution of mobile apps. Mobile app
developers check their users' reviews frequently to clarify the issues
experienced by users or capture the new issues that are introduced due to a
recent app update. App reviews have a dynamic nature and their discussed topics
change over time. The changes in the topics among collected reviews for
different versions of an app can reveal important issues about the app update.
A main technique in this analysis is using topic modeling algorithms. However,
app reviews are short texts and it is challenging to unveil their latent topics
over time. Conventional topic models suffer from the sparsity of word
co-occurrence patterns while inferring topics for short texts. Furthermore,
these algorithms cannot capture topics over numerous consecutive time-slices.
Online topic modeling algorithms speed up the inference of topic models for the
texts collected in the latest time-slice by saving a fraction of data from the
previous time-slice. But these algorithms do not analyze the statistical-data
of all the previous time-slices, which can confer contributions to the topic
distribution of the current time-slice.
We propose Adaptive Online Biterm Topic Model (AOBTM) to model topics in
short texts adaptively. AOBTM alleviates the sparsity problem in short-texts
and considers the statistical-data for an optimal number of previous
time-slices. We also propose parallel algorithms to automatically determine the
optimal number of topics and the best number of previous versions that should
be considered in topic inference phase. Automatic evaluation on collections of
app reviews and real-world short text datasets confirm that AOBTM can find more
coherent topics and outperforms the state-of-the-art baselines.
- Abstract(参考訳): モバイルアプリレビューの分析は,要件エンジニアリングやソフトウェアメンテナンス,モバイルアプリの進化において重要な役割を担っている。
モバイルアプリ開発者は、ユーザのレビューを頻繁にチェックして、ユーザが経験した問題を明らかにするか、あるいは最近のアプリアップデートによって導入された新しい問題をキャプチャする。
アプリレビューはダイナミックな性質を持ち、議論されるトピックは時間とともに変化する。
アプリの異なるバージョンのレビューで収集されたトピックの変更は、アプリのアップデートに関する重要な問題を明らかにすることができる。
この分析の主なテクニックはトピックモデリングアルゴリズムを使うことである。
しかし、アプリレビューは短いテキストであり、潜むトピックを時間とともに公開することは困難である。
従来の話題モデルは、短いテキストの話題を推測しながら、単語共起パターンのスパースに苦しむ。
さらに、これらのアルゴリズムは連続した時間スライスでトピックをキャプチャできない。
オンライントピックモデリングアルゴリズムは、前の時間スライスからわずかなデータを保存することで、最新の時間スライスで収集されたテキストのトピックモデルの推論を高速化する。
しかし、これらのアルゴリズムは以前の全ての時間スライスの統計データを解析しないため、現在の時間スライスのトピック分布への寄与が期待できる。
本稿では,短いテキストでトピックを適応的にモデル化するAdaptive Online Biterm Topic Model (AOBTM)を提案する。
AOBTMは短文で空間問題を緩和し、過去の時間スライスの最適な数の統計データを考える。
また,最適なトピック数とトピック推論フェーズで考慮すべき前のバージョン数を自動的に決定する並列アルゴリズムを提案する。
アプリレビューと実世界の短文データセットのコレクションの自動評価により、AOBTMはより一貫性のあるトピックを見つけ、最先端のベースラインを上回ります。
関連論文リスト
- Enhancing Short-Text Topic Modeling with LLM-Driven Context Expansion and Prefix-Tuned VAEs [25.915607750636333]
本稿では,大規模言語モデル(LLM)を利用して,トピックモデリングを適用する前に,短いテキストをより詳細なシーケンスに拡張する手法を提案する。
提案手法は,データ空間が極端である実世界のデータセットに対する広範な実験により,短文のトピックモデリング性能を著しく向上させる。
論文 参考訳(メタデータ) (2024-10-04T01:28:56Z) - Interactive Topic Models with Optimal Transport [75.26555710661908]
ラベル名監視型トピックモデリングのためのアプローチとして,EdTMを提案する。
EdTMは、LM/LLMベースのドキュメントトピック親和性を活用しながら、代入問題としてのトピックモデリングをモデル化する。
論文 参考訳(メタデータ) (2024-06-28T13:57:27Z) - TopicGPT: A Prompt-based Topic Modeling Framework [77.72072691307811]
TopicGPTは,大規模言語モデルを用いてテキストコレクション内の潜在トピックを明らかにするプロンプトベースのフレームワークである。
競合する手法と比較して、人間の分類とよく一致したトピックを生成する。
そのトピックもまた解釈可能であり、自然言語ラベルと関連する自由形式の記述を含むトピックを好んで、曖昧な言葉の袋を除いた。
論文 参考訳(メタデータ) (2023-11-02T17:57:10Z) - Let the Pretrained Language Models "Imagine" for Short Texts Topic
Modeling [29.87929724277381]
短いテキストでは、共起情報は最小限であり、結果として文書表現の特徴が分散する。
既存のトピックモデル(確率的あるいは神経的)は、ほとんどの場合、一貫性のあるトピックを生成するためにパターンのマイニングに失敗します。
既存の事前学習言語モデル(PLM)を用いて、短いテキストを長いシーケンスに拡張する。
論文 参考訳(メタデータ) (2023-10-24T00:23:30Z) - TopicAdapt- An Inter-Corpora Topics Adaptation Approach [27.450275637652418]
本稿では、関連するソースコーパスから関連するトピックを適応し、ソースコーパスに存在しないターゲットコーパスに新しいトピックを発見できるトピックモデルTopicAdaptを提案する。
多様なドメインからの複数のデータセットに対する実験は、最先端のトピックモデルに対して提案されたモデルの優位性を示している。
論文 参考訳(メタデータ) (2023-10-08T02:56:44Z) - EditEval: An Instruction-Based Benchmark for Text Improvements [73.5918084416016]
編集機能の自動評価のためのインストラクションベース、ベンチマーク、評価スイートであるEditEvalを提示する。
InstructGPTとPEERが最良であることを示す事前学習モデルをいくつか評価するが,ほとんどのベースラインは教師付きSOTA以下である。
我々の分析は、タスクの編集によく使われるメトリクスが必ずしも相関しているとは限らないことを示し、最高の性能を持つプロンプトに対する最適化は、必ずしも異なるモデルに対して強い堅牢性を持つとは限らないことを示唆している。
論文 参考訳(メタデータ) (2022-09-27T12:26:05Z) - HTMOT : Hierarchical Topic Modelling Over Time [0.0]
本稿では,階層的話題モデリングを行うための新しい手法であるHTMOTを提案する。
時間モデリングを深層サブトピックに適用するだけで、特定のストーリーやイベントを抽出できることを示す。
以上の結果から,トレーニング手順は高速で,高精度なトピックと時間的高精度なサブトピックを抽出できることが示唆された。
論文 参考訳(メタデータ) (2021-11-22T11:02:35Z) - Recurrent Coupled Topic Modeling over Sequential Documents [33.35324412209806]
現在のトピックは、結合重みが対応するすべてのトピックから進化し、マルチトピック・スレッドの進化を形成することを示す。
進化するトピック間のマルチカップリングを解消する,新しいデータ拡張手法を用いた新しいソリューションを提案する。
後方フィルタアルゴリズムを備えた新しいギブスサンプリング器は、閉形式の潜時時間パラメータを効率的に学習する。
論文 参考訳(メタデータ) (2021-06-23T08:58:13Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - Unsupervised Summarization for Chat Logs with Topic-Oriented Ranking and
Context-Aware Auto-Encoders [59.038157066874255]
本稿では,手動ラベル付きデータを用いずにチャット要約を行うrankaeという新しいフレームワークを提案する。
RankAEは、中心性と多様性に応じてトピックの発話を同時に選択するトピック指向のランキング戦略で構成されています。
消音自動エンコーダは、選択された発話に基づいて簡潔でコンテキスト情報に基づいた要約を生成するように設計されています。
論文 参考訳(メタデータ) (2020-12-14T07:31:17Z) - Topic Adaptation and Prototype Encoding for Few-Shot Visual Storytelling [81.33107307509718]
トピック間一般化の能力をモデル化するためのトピック適応型ストーリーテラを提案する。
また,アトピー内導出能力のモデル化を目的とした符号化手法の試作も提案する。
実験結果から,トピック適応とプロトタイプ符号化構造が相互に利益をもたらすことが明らかとなった。
論文 参考訳(メタデータ) (2020-08-11T03:55:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。