論文の概要: HSFN: Hierarchical Selection for Fake News Detection building Heterogeneous Ensemble
- arxiv url: http://arxiv.org/abs/2508.21482v1
- Date: Fri, 29 Aug 2025 10:09:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-01 19:45:11.004817
- Title: HSFN: Hierarchical Selection for Fake News Detection building Heterogeneous Ensemble
- Title(参考訳): HSFN:不均一なアンサンブルを構築するフェイクニュース検出のための階層的選択
- Authors: Sara B. Coutinho, Rafael M. O. Cruz, Francimaria R. S. Nascimento, George D. C. Cavalcanti,
- Abstract要約: 本稿では,その多様性を優先し,性能によって拡張された新しい自動分類器選択手法を提案する。
異なるアプリケーションドメインから6つのデータセットにまたがる40の異種分類器を用いて実験を行う。
その結果,提案手法は6つのデータセットのうち2つにおいて最も精度が高いことがわかった。
- 参考スコア(独自算出の注目度): 7.982080205252205
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Psychological biases, such as confirmation bias, make individuals particularly vulnerable to believing and spreading fake news on social media, leading to significant consequences in domains such as public health and politics. Machine learning-based fact-checking systems have been widely studied to mitigate this problem. Among them, ensemble methods are particularly effective in combining multiple classifiers to improve robustness. However, their performance heavily depends on the diversity of the constituent classifiers-selecting genuinely diverse models remains a key challenge, especially when models tend to learn redundant patterns. In this work, we propose a novel automatic classifier selection approach that prioritizes diversity, also extended by performance. The method first computes pairwise diversity between classifiers and applies hierarchical clustering to organize them into groups at different levels of granularity. A HierarchySelect then explores these hierarchical levels to select one pool of classifiers per level, each representing a distinct intra-pool diversity. The most diverse pool is identified and selected for ensemble construction from these. The selection process incorporates an evaluation metric reflecting each classifiers's performance to ensure the ensemble also generalises well. We conduct experiments with 40 heterogeneous classifiers across six datasets from different application domains and with varying numbers of classes. Our method is compared against the Elbow heuristic and state-of-the-art baselines. Results show that our approach achieves the highest accuracy on two of six datasets. The implementation details are available on the project's repository: https://github.com/SaraBCoutinho/HSFN .
- Abstract(参考訳): 確認バイアスのような心理学的バイアスは、個人を特にソーシャルメディア上で偽のニュースを信じ広めることに弱くし、公衆衛生や政治などの領域で重大な結果をもたらす。
機械学習に基づくファクトチェックシステムは、この問題を軽減するために広く研究されている。
その中でも、アンサンブル法は、堅牢性を改善するために複数の分類器を組み合わせるのに特に効果的である。
しかし、それらの性能は構成分類器の多様性に大きく依存する-真に多様なモデルを選択することは重要な課題であり、特にモデルが冗長なパターンを学習する傾向にある。
本研究では,多様性を優先する自動分類器選択手法を提案する。
この手法はまず、分類器間のペアワイズを計算し、階層的クラスタリングを適用して、異なるレベルの粒度のグループに分類する。
階層選択(HierarchySelect)は、これらの階層レベルを探索し、各レベルごとに1つの分類器のプールを選択する。
最も多様なプールが識別され、これらからアンサンブル建設のために選択される。
選択過程には、各分類器のパフォーマンスを反映した評価基準が組み込まれており、アンサンブルの一般化も良好である。
我々は、異なるアプリケーションドメインから6つのデータセットにまたがる40の異種分類器を用いて、様々な数のクラスで実験を行う。
本手法はエルボのヒューリスティックおよび最先端のベースラインと比較する。
その結果,提案手法は6つのデータセットのうち2つにおいて最も精度が高いことがわかった。
実装の詳細はプロジェクトのリポジトリ(https://github.com/SaraBCoutinho/HSFN)で確認できる。
関連論文リスト
- Unsupervised Estimation of Ensemble Accuracy [0.0]
いくつかの分類器の結合力を推定する手法を提案する。
ラベルに依存しない「多様性」対策に重点を置く既存のアプローチとは異なる。
本手法は,一般的な大規模顔認証データセット上で実証する。
論文 参考訳(メタデータ) (2023-11-18T02:31:36Z) - Anomaly Detection using Ensemble Classification and Evidence Theory [62.997667081978825]
本稿では,アンサンブル分類とエビデンス理論を用いた新しい検出手法を提案する。
固体アンサンブル分類器を構築するためのプール選択戦略が提示される。
我々は異常検出手法の不確実性を利用する。
論文 参考訳(メタデータ) (2022-12-23T00:50:41Z) - An Evolutionary Approach for Creating of Diverse Classifier Ensembles [11.540822622379176]
CIF-Eと呼ばれる4段階のプロトコルに基づく分類器の選択と融合のためのフレームワークを提案する。
我々は,提案したCIF-Eプロトコルに従って,24種類のアンサンブルアプローチを実装し,評価した。
実験により、提案された進化的アプローチは、多くのよく知られたUCIデータセットにおいて最先端の文献的アプローチより優れていることが示された。
論文 参考訳(メタデータ) (2022-08-23T14:23:27Z) - Ensemble pruning via an integer programming approach with diversity
constraints [0.0]
本稿では、二項分類問題を考察し、最適部分集合を選択する整数プログラミング(IP)アプローチを提案する。
アンサンブルにおける最小の多様性レベルを確保するための制約も提案する。
本手法は, 文学において最もよく使われている刈り取り法と比較して, 競争力のある結果をもたらす。
論文 参考訳(メタデータ) (2022-05-02T17:59:11Z) - Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised
Person Re-Identification and Text Authorship Attribution [77.85461690214551]
完全ラベル付きデータからの学習は、Person Re-IdentificationやText Authorship Attributionなどのマルチメディアフォレスト問題において困難である。
近年の自己教師型学習法は,基礎となるクラスに意味的差異が有る場合に,完全ラベル付きデータを扱う際に有効であることが示されている。
本研究では,異なるクラスからのサンプルが顕著に多様性を持っていない場合でも,ラベルのないデータから学習できるようにすることにより,個人再認識とテキストオーサシップの属性に対処する戦略を提案する。
論文 参考訳(メタデータ) (2022-02-07T13:08:11Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Learning and Evaluating Representations for Deep One-class
Classification [59.095144932794646]
ディープワンクラス分類のための2段階フレームワークを提案する。
まず,一級データから自己教師付き表現を学習し,学習した表現に基づいて一級分類器を構築する。
実験では、視覚領域の1クラス分類ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2020-11-04T23:33:41Z) - Diversity-Aware Weighted Majority Vote Classifier for Imbalanced Data [1.2944868613449219]
多様性を考慮したアンサンブル学習に基づくアルゴリズム DAMVI を提案する。
本稿では, 予測保守作業, クレジットカード不正検出, ウェブページ分類, 医療応用に関する最先端モデルに関して, 提案手法の効率性を示す。
論文 参考訳(メタデータ) (2020-04-16T11:27:50Z) - A Systematic Evaluation: Fine-Grained CNN vs. Traditional CNN
Classifiers [54.996358399108566]
本稿では,大規模分類データセット上でトップノーチ結果を示すランドマーク一般的なCNN分類器の性能について検討する。
最先端のきめ細かい分類器と比較する。
実験において, 粒度の細かい分類器がベースラインを高められるかどうかを判定するために, 6つのデータセットについて広範囲に評価する。
論文 参考訳(メタデータ) (2020-03-24T23:49:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。