論文の概要: A Survey of Datasets for Information Diffusion Tasks
- arxiv url: http://arxiv.org/abs/2407.05161v1
- Date: Sat, 06 Jul 2024 19:38:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-10 20:15:54.111290
- Title: A Survey of Datasets for Information Diffusion Tasks
- Title(参考訳): 情報拡散課題におけるデータセット調査
- Authors: Fuxia Guo, Xiaowen Wang, Yanwei Xie, Zehao Wang, Jingqiu Li, Lanjun Wang,
- Abstract要約: 情報拡散タスクとデータセットの系統分類を「5Wモデル」フレームワークに基づいて調査する。
まず、情報拡散タスクを定義とデータセット分析により10のサブタスクに分類する。
また、情報拡散タスクの公開データセットリポジトリと利用可能なリンクを収集し、比較する。
- 参考スコア(独自算出の注目度): 13.492353205799311
- License:
- Abstract: Information diffusion across various new media platforms gradually influences perceptions, decisions, and social behaviors of individual users. In communication studies, the famous Five W's of Communication model (5W Model) has displayed the process of information diffusion clearly. At present, although plenty of studies and corresponding datasets about information diffusion have emerged, a systematic categorization of tasks and an integration of datasets are still lacking. To address this gap, we survey a systematic taxonomy of information diffusion tasks and datasets based on the "5W Model" framework. We first categorize the information diffusion tasks into ten subtasks with definitions and datasets analysis, from three main tasks of information diffusion prediction, social bot detection, and misinformation detection. We also collect the publicly available dataset repository of information diffusion tasks with the available links and compare them based on six attributes affiliated to users and content: user information, social network, bot label, propagation content, propagation network, and veracity label. In addition, we discuss the limitations and future directions of current datasets and research topics to advance the future development of information diffusion. The dataset repository can be accessed at our website https://github.com/fuxiaG/Information-Diffusion-Datasets.
- Abstract(参考訳): 様々なメディアプラットフォームにまたがる情報拡散は、個々のユーザの知覚、決定、社会的行動に徐々に影響を及ぼす。
コミュニケーション研究において、有名な5Wモデル(5Wモデル)は情報拡散の過程を明確に示している。
現在、情報拡散に関する多くの研究やそれに対応するデータセットが出現しているが、タスクの体系的な分類とデータセットの統合はいまだに不足している。
このギャップに対処するため、我々は「5Wモデル」フレームワークに基づく情報拡散タスクとデータセットの系統分類を調査した。
まず、情報拡散予測、ソーシャルボット検出、誤情報検出の3つの主要なタスクから、情報拡散タスクを定義とデータセット分析で10のサブタスクに分類する。
また,ユーザ情報,ソーシャルネットワーク,ボットラベル,伝搬コンテンツ,伝播ネットワーク,検証ラベルの6つの属性に基づいて,情報拡散タスクの公開データセットリポジトリとリンクを比較した。
さらに,情報拡散の進展を推し進めるため,現在のデータセットと研究トピックの限界と今後の方向性について論じる。
データセットリポジトリは、私たちのWebサイトhttps://github.com/fuxiaG/Information-Diffusion-Datasetsでアクセスできます。
関連論文リスト
- Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - Supervised Algorithmic Fairness in Distribution Shifts: A Survey [17.826312801085052]
現実世界のアプリケーションでは、機械学習モデルは特定のデータセットでトレーニングされることが多いが、データ分散がシフトする可能性のある環境にデプロイされる。
この変化は、人種や性別などのセンシティブな属性によって特徴づけられる特定のグループに不公平な予測をもたらす可能性がある。
論文 参考訳(メタデータ) (2024-02-02T11:26:18Z) - Capture the Flag: Uncovering Data Insights with Large Language Models [90.47038584812925]
本研究では,Large Language Models (LLMs) を用いてデータの洞察の発見を自動化する可能性について検討する。
そこで本稿では,データセット内の意味的かつ関連する情報(フラグ)を識別する能力を測定するために,フラグを捕捉する原理に基づく新しい評価手法を提案する。
論文 参考訳(メタデータ) (2023-12-21T14:20:06Z) - MIDDAG: Where Does Our News Go? Investigating Information Diffusion via
Community-Level Information Pathways [114.42360191723469]
我々は、新型コロナウイルス関連のニュース記事によって引き起こされるソーシャルメディア上の情報伝達経路を可視化する、直感的でインタラクティブなシステムMIDDAGを提案する。
我々は,ユーザ間のコミュニティを構築し,伝播予測機能を開発し,情報の普及方法の追跡と理解を可能にする。
論文 参考訳(メタデータ) (2023-10-04T02:08:11Z) - An information-Theoretic Approach to Semi-supervised Transfer Learning [33.89602092349131]
トランスファーラーニングは、ある"ソースデータセット"から別の"ターゲットデータセット"に情報を伝達することを可能にする
ソースとターゲットデータの分布の相違は一般的です。
本稿では,伝達学習の文脈におけるディープニューラルネットワークの性能解析のための新しい情報理論アプローチを提案する。
論文 参考訳(メタデータ) (2023-06-11T17:45:46Z) - Self-supervised Activity Representation Learning with Incremental Data:
An Empirical Study [7.782045150068569]
本研究では,時系列分類タスクにおける自己教師付き表現学習モデルの利用が及ぼす影響について検討する。
4つの公開データセットにおいて,ラベル付きデータのサイズ,分布,ソースが最終分類性能に与える影響を解析した。
論文 参考訳(メタデータ) (2023-05-01T01:39:55Z) - Beyond Information Exchange: An Approach to Deploy Network Properties
for Information Diffusion [1.80476943513092]
我々は情報拡散のための共通近隣戦略 (CNS) アルゴリズムを提案している。
CNSアルゴリズムの性能は、拡散速度と拡散アウトスプレッドの観点から、複数の実世界のデータセットで評価される。
実験の結果、CNSアルゴリズムは拡散速度と拡散アウトスプレッドの両方において、より良い情報拡散を可能にすることが示された。
論文 参考訳(メタデータ) (2022-12-21T06:56:14Z) - From Distributed Machine Learning to Federated Learning: A Survey [49.7569746460225]
分散学習は、分散データとコンピューティングリソースを利用するための効率的なアプローチとして現れる。
本論文では,連合学習システムの機能構造と関連手法の分類法を提案する。
本稿では,flシステムの分散トレーニング,データ通信,セキュリティについて述べる。
論文 参考訳(メタデータ) (2021-04-29T14:15:11Z) - InSRL: A Multi-view Learning Framework Fusing Multiple Information
Sources for Distantly-supervised Relation Extraction [19.176183245280267]
ナレッジベースに広く存在する2つのソース、すなわちエンティティ記述と複数の粒度のエンティティタイプを紹介します。
Intact Space Representation Learning (InSRL) による関係抽出のためのエンドツーエンドのマルチビュー学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-12-17T02:49:46Z) - Multi-modal AsynDGAN: Learn From Distributed Medical Image Data without
Sharing Private Information [55.866673486753115]
プライバシーとセキュリティを守るために拡張可能で弾力性のある学習フレームワークを提案します。
提案するフレームワークは分散Asynchronized Discriminator Generative Adrial Networks (AsynDGAN) である。
論文 参考訳(メタデータ) (2020-12-15T20:41:24Z) - DeGAN : Data-Enriching GAN for Retrieving Representative Samples from a
Trained Classifier [58.979104709647295]
我々は、トレーニングされたネットワークの将来の学習タスクのために、利用可能なデータの豊富さと関連するデータの欠如の間のギャップを埋める。
利用可能なデータは、元のトレーニングデータセットまたは関連するドメインデータセットの不均衡なサブセットである可能性があるため、代表サンプルを検索するために使用します。
関連ドメインからのデータを活用して最先端のパフォーマンスを実現することを実証する。
論文 参考訳(メタデータ) (2019-12-27T02:05:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。