論文の概要: Importance-aware Topic Modeling for Discovering Public Transit Risk from Noisy Social Media
- arxiv url: http://arxiv.org/abs/2512.06293v1
- Date: Sat, 06 Dec 2025 04:45:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.287899
- Title: Importance-aware Topic Modeling for Discovering Public Transit Risk from Noisy Social Media
- Title(参考訳): 騒々しいソーシャルメディアから公共交通のリスクを明らかにするための重要度を考慮したトピックモデリング
- Authors: Fatima Ashraf, Muhammad Ayub Sabir, Jiaxin Deng, Junbiao Pang, Haitao Yu,
- Abstract要約: 都市交通機関は、群衆、遅延、安全事故などの新興サービスのリスクを監視するために、ソーシャルメディアに目を向けている。
言語相互作用とユーザの影響を共同でモデル化することで,この問題に対処する。
提案モデルでは,最先端のトピックコヒーレンスと,先行するベースラインと比較して強い多様性を実現する。
- 参考スコア(独自算出の注目度): 8.638879065913246
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Urban transit agencies increasingly turn to social media to monitor emerging service risks such as crowding, delays, and safety incidents, yet the signals of concern are sparse, short, and easily drowned by routine chatter. We address this challenge by jointly modeling linguistic interactions and user influence. First, we construct an influence-weighted keyword co-occurrence graph from cleaned posts so that socially impactful posts contributes proportionally to the underlying evidence. The core of our framework is a Poisson Deconvolution Factorization (PDF) that decomposes this graph into a low-rank topical structure and topic-localized residual interactions, producing an interpretable topic--keyword basis together with topic importance scores. A decorrelation regularizer \emph{promotes} distinct topics, and a lightweight optimization procedure ensures stable convergence under nonnegativity and normalization constraints. Finally, the number of topics is selected through a coherence-driven sweep that evaluates the quality and distinctness of the learned topics. On large-scale social streams, the proposed model achieves state-of-the-art topic coherence and strong diversity compared with leading baselines. The code and dataset are publicly available at https://github.com/pangjunbiao/Topic-Modeling_ITS.git
- Abstract(参考訳): 都市交通機関は、人混み、遅延、安全事故などの新興サービスのリスクを監視するためにソーシャルメディアに目を向ける傾向にあるが、懸念のシグナルは小さく、短く、日常的な会話に溺れやすい。
言語相互作用とユーザの影響を共同でモデル化することで,この問題に対処する。
まず、クリーンな投稿から影響重み付きキーワード共起グラフを構築し、社会的影響のある投稿が基礎となる証拠に比例して寄与するようにした。
我々のフレームワークの中核はPoisson Deconvolution Factorization (PDF) であり、このグラフを低ランクなトピック構造とトピック局所化された残留相互作用に分解し、トピック重要度スコアとともに解釈可能なトピック-キーワードベースを生成する。
Decorrelation regularizer \emph{promotes} は異なるトピックであり、軽量な最適化手順は非負性および正規化制約の下で安定収束を保証する。
最後に、学習したトピックの品質と区別を評価するコヒーレンス駆動のスイープを通じてトピック数を選択する。
大規模ソーシャルストリームでは,提案手法は最先端のトピックコヒーレンスと,主要なベースラインに比べて多様性が強い。
コードとデータセットはhttps://github.com/pangjunbiao/Topic-Modeling_ITS.gitで公開されている。
関連論文リスト
- TopiCLEAR: Topic extraction by CLustering Embeddings with Adaptive dimensional Reduction [0.0]
TopiCLEAR: 適応次元還元による埋め込みのクラスタリングによるトピック抽出について述べる。
我々は、20News、AgNewsTitle、Reddit、TweetTopicの4つの多様なデータセットに対するアプローチを評価した。
本手法はより解釈可能なトピックを生成し,ソーシャルメディアデータやWebコンテンツ分析への応用の可能性を強調した。
論文 参考訳(メタデータ) (2025-12-07T07:01:28Z) - Latent Topic Synthesis: Leveraging LLMs for Electoral Ad Analysis [51.95395936342771]
ラベルなしコーパスから解釈可能なトピック分類を自動生成するエンドツーエンドフレームワークを提案する。
われわれはこの枠組みを、2024年アメリカ合衆国大統領選挙の1ヶ月前のMeta政治広告の大規模なコーパスに適用する。
提案手法は,潜在談話構造を明らかにし,意味的に豊かなトピックラベルを合成し,モラル・フレーミングの次元でトピックを注釈する。
論文 参考訳(メタデータ) (2025-10-16T20:30:20Z) - LLM-Assisted Topic Reduction for BERTopic on Social Media Data [0.22940141855172028]
本稿では,話題生成のためのBERTopicと話題短縮のための大規模言語モデルを組み合わせたフレームワークを提案する。
3つのTwitter/Xデータセットと4つの異なる言語モデルにまたがるアプローチを評価した。
論文 参考訳(メタデータ) (2025-09-18T20:59:11Z) - Enhancing the Robustness of Contextual ASR to Varying Biasing Information Volumes Through Purified Semantic Correlation Joint Modeling [63.755562174967274]
クロスアテンションはバイアス情報量の変化に影響される。
そこで本研究では,PSC-Jointを用いた意味相関結合モデリング手法を提案する。
PSC-JointはAISHELL-1では21.34%、KeSpeechでは28.46%の平均的なF1スコアの改善を達成した。
論文 参考訳(メタデータ) (2025-09-07T03:46:59Z) - Cluster-Aware Attacks on Graph Watermarks [50.19105800063768]
本稿では,コミュニティ誘導型修正を回避できるクラスタ・アウェア・脅威モデルを提案する。
その結果,クラスタ・アウェア・アタックは,ランダムなベースラインよりも最大80%の精度でアトリビューション精度を低下させることができることがわかった。
グラフコミュニティにまたがる透かしノードを分散する軽量な埋め込み拡張を提案する。
論文 参考訳(メタデータ) (2025-04-24T22:49:28Z) - A social context-aware graph-based multimodal attentive learning framework for disaster content classification during emergencies: a benchmark dataset and method [4.757418935621701]
CrisisSpotは、テキストと視覚の複雑な関係をキャプチャする手法である。
IDEAは、データ内の調和とコントラストの両方のパターンをキャプチャして、マルチモーダルインタラクションを強化する。
CrisisSpotは最先端の手法と比較してF1スコアの平均9.45%と5.01%の上昇を達成した。
論文 参考訳(メタデータ) (2024-10-11T13:51:46Z) - Seeing the Unseen: Learning Basis Confounder Representations for Robust Traffic Prediction [41.59726314922999]
交通予測はインテリジェント交通システムと都市コンピューティングにとって不可欠である。
各種統計・深層学習手法を用いて, 過去の交通データXと将来の交通状況Yの関係を確立することを目的とする。
X -> Y の関係は、しばしば X と Y の両方に同時に影響を与える外部共同設立者の影響を受けている。
既存のディープラーニングトラフィック予測モデルでは、共同創業者の問題に対処するために、古典的なフロントドアとバックドアの調整が採用されている。
論文 参考訳(メタデータ) (2023-11-21T09:33:13Z) - Recurrent Coupled Topic Modeling over Sequential Documents [33.35324412209806]
現在のトピックは、結合重みが対応するすべてのトピックから進化し、マルチトピック・スレッドの進化を形成することを示す。
進化するトピック間のマルチカップリングを解消する,新しいデータ拡張手法を用いた新しいソリューションを提案する。
後方フィルタアルゴリズムを備えた新しいギブスサンプリング器は、閉形式の潜時時間パラメータを効率的に学習する。
論文 参考訳(メタデータ) (2021-06-23T08:58:13Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。