論文の概要: CLMIR: A Textual Dataset for Rumor Identification and Marking
- arxiv url: http://arxiv.org/abs/2508.11138v1
- Date: Fri, 15 Aug 2025 01:09:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:23.703502
- Title: CLMIR: A Textual Dataset for Rumor Identification and Marking
- Title(参考訳): CLMIR: 噂の識別とマーキングのためのテキストデータセット
- Authors: Bin Ma, Yifei Zhang, Yongjin Xian, Qi Li, Linna Zhou, Gongxun Miao,
- Abstract要約: 本稿では,CLMIRという,きめ細かいマーキングによる噂検出のためのデータセットを構築した。
記事がうわさかどうかを判断するのに加えて、このデータセットは、そのうわさがベースとなっている特定のコンテンツをさらにマークする。
- 参考スコア(独自算出の注目度): 15.703292627605304
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rise of social media, rumor detection has drawn increasing attention. Although numerous methods have been proposed with the development of rumor classification datasets, they focus on identifying whether a post is a rumor, lacking the ability to mark the specific rumor content. This limitation largely stems from the lack of fine-grained marks in existing datasets. Constructing a rumor dataset with rumor content information marking is of great importance for fine-grained rumor identification. Such a dataset can facilitate practical applications, including rumor tracing, content moderation, and emergency response. Beyond being utilized for overall performance evaluation, this dataset enables the training of rumor detection algorithms to learn content marking, and thus improves their interpretability and reasoning ability, enabling systems to effectively address specific rumor segments. This paper constructs a dataset for rumor detection with fine-grained markings, named CLMIR (Content-Level Marking Dataset for Identifying Rumors). In addition to determining whether a post is a rumor, this dataset further marks the specific content upon which the rumor is based.
- Abstract(参考訳): ソーシャルメディアの普及に伴い、噂の発見が注目を集めている。
噂分類データセットの開発には多くの方法が提案されているが、特定の噂内容をマークする能力が欠如しているため、記事が噂であるかどうかの特定に重点を置いている。
この制限は、既存のデータセットにきめ細かいマークが欠如していることに起因している。
噂コンテンツ情報マーキングを用いた噂データセットの構築は、きめ細かい噂を識別する上で非常に重要である。
このようなデータセットは、噂のトレース、コンテンツモデレーション、緊急応答など、実用的な応用を促進することができる。
このデータセットは、全体的な性能評価に活用されるだけでなく、噂検出アルゴリズムのトレーニングによるコンテンツマーキングの学習を可能にし、その解釈性と推論能力を改善し、特定の噂セグメントに効果的に対処することを可能にする。
本稿では,CLMIR(Content-Level Marking Dataset for Identifying Rumors)と呼ばれる,きめ細かいマーキングによる噂検出のためのデータセットを構築した。
記事がうわさかどうかを判断するのに加えて、このデータセットは、そのうわさがベースとなっている特定のコンテンツをさらにマークする。
関連論文リスト
- Towards Real-World Rumor Detection: Anomaly Detection Framework with Graph Supervised Contrastive Learning [3.2803526084968904]
WeiboとTwitterの2つの大規模会話データセットを構築した。
噂と非噂の分布には明らかな違いがある。
本稿では,異常検出フレームワークであるGraph Supervised Contrastive Learningを提案する。
論文 参考訳(メタデータ) (2025-08-10T06:59:33Z) - Scribbles for All: Benchmarking Scribble Supervised Segmentation Across Datasets [51.74296438621836]
Scribbles for Allは、スクリブルラベルに基づいて訓練されたセマンティックセグメンテーションのためのラベルおよびトレーニングデータ生成アルゴリズムである。
弱い監督の源泉としてのスクリブルの主な制限は、スクリブルセグメンテーションのための挑戦的なデータセットの欠如である。
Scribbles for Allは、いくつかの人気のあるセグメンテーションデータセットのスクリブルラベルを提供し、密集したアノテーションを持つデータセットのスクリブルラベルを自動的に生成するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2024-08-22T15:29:08Z) - Detecting Rumor Veracity with Only Textual Information by Double-Channel
Structure [7.931904787652709]
ソーシャルメディア上での噂の真偽を判断するための二重チャネル構造を提案する。
まず、各テキストを特定の(偽の噂)または不確実な(偽の噂)カテゴリに割り当てる。
次に,情報提供された噂に対して嘘検出アルゴリズムを適用し,未報の噂に対してスレッド応答合意検出アルゴリズムを適用した。
論文 参考訳(メタデータ) (2023-12-06T00:08:44Z) - PNT-Edge: Towards Robust Edge Detection with Noisy Labels by Learning
Pixel-level Noise Transitions [119.17602768128806]
特に大規模なデータセットでは、エッジの正確なラベル付けは難しい。
本稿では,ラベル破壊過程をモデル化するために,Pixelレベルのノイズ遷移を学習することを提案する。
論文 参考訳(メタデータ) (2023-07-26T09:45:17Z) - FedNoisy: Federated Noisy Label Learning Benchmark [53.73816587601204]
フェデレーション学習は、クライアントからの機密データを集約することなく、分散学習で人気を集めている。
データ分離の分散と分離の性質は、データ品質によって複雑になり、ノイズの多いラベルに対してより脆弱になる可能性がある。
私たちは、研究者が潜在的にフェデレートされたノイズ設定を十分に調査するのに役立つ、最初の標準ベンチマークを提供しています。
論文 参考訳(メタデータ) (2023-06-20T16:18:14Z) - Probing Spurious Correlations in Popular Event-Based Rumor Detection
Benchmarks [28.550143417847373]
オープンソースのベンチマークデータセットは、既存の研究で無視されている急激な相関に悩まされている。
本稿では,突発的な手がかりを除去する手段として,事象分離型うわさ検出法を提案する。
提案手法は, 有効性, 効率, 一般化性の観点から, 既存のベースラインよりも優れている。
論文 参考訳(メタデータ) (2022-09-19T07:11:36Z) - Rumor Detection with Self-supervised Learning on Texts and Social Graph [101.94546286960642]
異種情報ソース上での自己教師型学習を対照的に提案し,それらの関係を明らかにするとともに,噂をよりよく特徴付ける。
我々はこの枠組みをSRD(Self-supervised Rumor Detection)と呼ぶ。
3つの実世界のデータセットに対する大規模な実験により、ソーシャルメディア上での噂の自動検出におけるSRDの有効性が検証された。
論文 参考訳(メタデータ) (2022-04-19T12:10:03Z) - Audio Tagging by Cross Filtering Noisy Labels [26.14064793686316]
そこで我々はCrossFilterという新しいフレームワークを提案し,音声タグ付けにおけるノイズラベル問題に対処する。
提案手法は最先端の性能を達成し,アンサンブルモデルを超えている。
論文 参考訳(メタデータ) (2020-07-16T07:55:04Z) - Fine-Tune Longformer for Jointly Predicting Rumor Stance and Veracity [27.661609140918916]
本稿では,噂の姿勢と妥当性を共同で予測するマルチタスク学習フレームワークを提案する。
フレームワークは2つの部分から構成される:a) フレームワークの下部は、会話スレッド内の各投稿に対するスタンスを分類し、マルチターン会話をモデル化し、隣の投稿を各投稿に認識させることにより、噂を議論する。
SemEval 2019 Task 7 データセットの実験結果から,提案手法は噂の定式化と妥当性予測の両方において,従来の手法よりも優れていたことがわかった。
論文 参考訳(メタデータ) (2020-07-15T17:09:17Z) - Rumor Detection on Social Media with Bi-Directional Graph Convolutional
Networks [89.13567439679709]
本稿では,二方向グラフ畳み込みネットワーク (Bi-Directional Graph Convolutional Networks, Bi-GCN) と呼ばれる新しい双方向グラフモデルを提案する。
これは、噂拡散のパターンを学習するために、噂拡散のトップダウン指向グラフを持つGCNと、噂拡散の反対指向グラフを持つGCNを活用して、噂拡散の構造を捉える。
論文 参考訳(メタデータ) (2020-01-17T15:12:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。