論文の概要: pytopicgram: A library for data extraction and topic modeling from Telegram channels
- arxiv url: http://arxiv.org/abs/2502.04882v1
- Date: Fri, 07 Feb 2025 12:41:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-10 14:56:54.770293
- Title: pytopicgram: A library for data extraction and topic modeling from Telegram channels
- Title(参考訳): pytopicgram: Telegramチャンネルからのデータ抽出とトピックモデリングのためのライブラリ
- Authors: J. Gómez-Romero, J. Cantón Correa, R. Pérez Mercado, F. Prados Abad, M. Molina-Solana, W. Fajardo,
- Abstract要約: pytopicgramは、研究者がこれらのTelegramメッセージを収集し、整理し、分析するのを助けるPythonライブラリである。
pytopicgramを使えば、ユーザーはコンテンツがどのように拡散し、聴衆がTelegramでどのように相互作用するかを知ることができる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Telegram is a popular platform for public communication, generating large amounts of messages through its channels. pytopicgram is a Python library that helps researchers collect, organize, and analyze these Telegram messages. The library offers key features such as easy message retrieval, detailed channel information, engagement metrics, and topic identification using advanced modeling techniques. By simplifying data extraction and analysis, pytopicgram allows users to understand how content spreads and how audiences interact on Telegram. This paper describes the design, main features, and practical uses of \pytopicgram, showcasing its effectiveness for studying public conversations on Telegram.
- Abstract(参考訳): Telegramは公共通信のための人気のあるプラットフォームであり、チャネルを通じて大量のメッセージを生成する。
pytopicgramは、研究者がこれらのTelegramメッセージを収集し、整理し、分析するのを助けるPythonライブラリである。
このライブラリは、簡単なメッセージ検索、詳細なチャネル情報、エンゲージメントメトリクス、高度なモデリング技術を用いたトピック識別などの重要な機能を提供する。
データ抽出と分析を簡単にすることで、pytopicgramはユーザーがコンテンツがどのように拡散し、聴衆がTelegram上でどのように相互作用するかを理解することができる。
本稿では,Telegram 上での公開会話研究の有効性を示すとともに,その設計,主な特徴,実用的利用について述べる。
関連論文リスト
- TelegramScrap: A comprehensive tool for scraping Telegram data [0.0]
TelegramScrapは、Telegramチャンネルやグループからデータを抽出して分析するツールである。
このホワイトペーパーは、学術・科学研究におけるツールの開発、能力、応用について概説する。
論文 参考訳(メタデータ) (2024-12-21T21:46:56Z) - Bridging Nodes and Narrative Flows: Identifying Intervention Targets for Disinformation on Telegram [1.124958340749622]
本稿では,テレグラム上での誤報の伝播を促進する構造機構について検討する。
我々は, ニューダルテレグラムチャネルの影響を定量化するために, 多次元「ブリッジング」メトリックを導入する。
ノードの小さなサブセットを発見し、このプラットフォームで情報「フロー」を象徴するパターンを特定します。
論文 参考訳(メタデータ) (2024-11-08T19:10:42Z) - Integrating Large Language Models with Graph-based Reasoning for Conversational Question Answering [58.17090503446995]
我々は,テキストや知識グラフ,テーブル,インフォボックスといった異質な情報源から収集された証拠について,文脈における質問の理解と推論の課題を組み合わせた会話型質問応答タスクに着目する。
提案手法はグラフ構造表現を用いて質問とその文脈に関する情報を集約する。
論文 参考訳(メタデータ) (2024-06-14T13:28:03Z) - Enhancing Chat Language Models by Scaling High-quality Instructional
Conversations [91.98516412612739]
まず,UltraChatという,体系的に設計され,多様で,情報的,大規模な会話データセットを提供する。
我々の目標は、人間がAIアシスタントで持つであろう対話の幅を捉えることです。
我々はLLaMAモデルを微調整し、強力な対話モデルであるUltraLLaMAを作成する。
論文 参考訳(メタデータ) (2023-05-23T16:49:14Z) - TGDataset: Collecting and Exploring the Largest Telegram Channels Dataset [57.2282378772772]
本稿では,120,979のTelegramチャネルと4億以上のメッセージを含む新しいデータセットであるTGDatasetを提案する。
我々は、データセット内で話される言語と、英語チャンネルでカバーされるトピックを分析した。
生のデータセットに加えて、データセットの分析に使用したスクリプトと、Sabmykと呼ばれる新しい陰謀論のネットワークに属するチャネルのリストもリリースしました。
論文 参考訳(メタデータ) (2023-03-09T15:42:38Z) - Using Large Language Models to Generate Engaging Captions for Data
Visualizations [51.98253121636079]
大規模言語モデル(LLM)は、高度なディープラーニング技術を用いて人間のような散文を生成する。
主な課題は、プロンプトエンジニアリングと呼ばれるLLMの最も効果的なプロンプトを設計することである。
我々は,LLM GPT-3を用いた最初の実験について報告し,いくつかの有望な結果を得た。
論文 参考訳(メタデータ) (2022-12-27T23:56:57Z) - Introducing an Abusive Language Classification Framework for Telegram to
Investigate the German Hater Community [0.6459215652021234]
我々は,(i)ドイツテレグラムのメッセージに対する虐待的言語分類モデルと,(ii)テレグラムチャンネルのヘイトフルネスに関する分類モデルからなるフレームワークを開発する。
チャネル分類モデルでは,トピックモデルから得られるチャネル固有のコンテンツ情報とソーシャルグラフを組み合わせて,チャネルのヘイトフルネスを予測する手法を開発した。
本研究のさらなるアウトプットとして,1,149件のTelegramメッセージを含むアノテート乱用言語データセットを作成した。
論文 参考訳(メタデータ) (2021-09-15T14:58:46Z) - EmailSum: Abstractive Email Thread Summarization [105.46012304024312]
我々は,メールスレッド要約(EmailSum)データセットを抽象化的に開発する。
このデータセットには、人間による注釈付きショート(30ワード)と、2549のメールスレッドからなるロング(100ワード)のサマリーが含まれている。
本研究は,現在の抽象的要約モデルの課題を明らかにするものである。
論文 参考訳(メタデータ) (2021-07-30T15:13:14Z) - Unsupervised Summarization for Chat Logs with Topic-Oriented Ranking and
Context-Aware Auto-Encoders [59.038157066874255]
本稿では,手動ラベル付きデータを用いずにチャット要約を行うrankaeという新しいフレームワークを提案する。
RankAEは、中心性と多様性に応じてトピックの発話を同時に選択するトピック指向のランキング戦略で構成されています。
消音自動エンコーダは、選択された発話に基づいて簡潔でコンテキスト情報に基づいた要約を生成するように設計されています。
論文 参考訳(メタデータ) (2020-12-14T07:31:17Z) - The Pushshift Telegram Dataset [1.7109522466982476]
モバイルメッセージングプラットフォームであるTelegramからデータセットを提示する。
私たちのデータセットは27.8Kのチャネルと220万のユニークなユーザからの317万のメッセージで構成されています。
論文 参考訳(メタデータ) (2020-01-23T10:37:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。