論文の概要: Blog Data Showdown: Machine Learning vs Neuro-Symbolic Models for Gender Classification
- arxiv url: http://arxiv.org/abs/2512.16687v1
- Date: Thu, 18 Dec 2025 15:53:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:32.138144
- Title: Blog Data Showdown: Machine Learning vs Neuro-Symbolic Models for Gender Classification
- Title(参考訳): ブログデータ ショーダウン: ジェンダー分類のための機械学習対ニューロシンボリックモデル
- Authors: Natnael Tilahun Sinshaw, Mengmei He, Tadesse K. Bahiru, Sudhir Kumar Mohapatra,
- Abstract要約: 本研究では,SVM(Support Vector Machines),NB(Naive Bayes),LR(Logistic Regression),AdaBoost(AdaBoost),XGBoost(XGBoost),ニューロシンボリックAI(NeSy)を備えたSVM変種(SVM_R)など,広く使用されている機械学習アルゴリズムの比較分析を行った。
実験の結果,データセットが限られているにもかかわらず,NeSyアプローチの使用は強い結果に一致した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text classification problems, such as gender classification from a blog, have been a well-matured research area that has been well studied using machine learning algorithms. It has several application domains in market analysis, customer recommendation, and recommendation systems. This study presents a comparative analysis of the widely used machine learning algorithms, namely Support Vector Machines (SVM), Naive Bayes (NB), Logistic Regression (LR), AdaBoost, XGBoost, and an SVM variant (SVM_R) with neuro-symbolic AI (NeSy). The paper also explores the effect of text representations such as TF-IDF, the Universal Sentence Encoder (USE), and RoBERTa. Additionally, various feature extraction techniques, including Chi-Square, Mutual Information, and Principal Component Analysis, are explored. Building on these, we introduce a comparative analysis of the machine learning and deep learning approaches in comparison to the NeSy. The experimental results show that the use of the NeSy approach matched strong MLP results despite a limited dataset. Future work on this research will expand the knowledge base, the scope of embedding types, and the hyperparameter configuration to further study the effectiveness of the NeSy approach.
- Abstract(参考訳): ブログからの性別分類などのテキスト分類問題は、機械学習アルゴリズムを用いてよく研究されている、よく適合した研究領域である。
市場分析、カスタマーレコメンデーション、レコメンデーションシステムにいくつかのアプリケーションドメインがある。
本研究では,SVM(Support Vector Machines),NB(Naive Bayes),LR(Logistic Regression),AdaBoost(AdaBoost),XGBoost(XGBoost),ニューロシンボリックAI(NeSy)を備えたSVM変種(SVM_R)など,広く使用されている機械学習アルゴリズムの比較分析を行った。
また, TF-IDF, Universal Sentence Encoder (USE), RoBERTaなどのテキスト表現の効果についても検討した。
さらに,Chi-Square,Mutual Information,Principal Component Analysisなどの特徴抽出手法についても検討した。
これらに基づいて、NeSyと比較して、機械学習とディープラーニングのアプローチの比較分析を導入する。
実験の結果,NeSyアプローチはデータセットが限られているにもかかわらず,強いMLP結果と一致していた。
この研究の今後の研究は、知識ベース、埋め込み型の範囲、ハイパーパラメータ構成を拡張して、NeSyアプローチの有効性をさらに研究する予定である。
関連論文リスト
- Automated Research Article Classification and Recommendation Using NLP and ML [0.5486463492959637]
本稿では,論文分類と推薦のための自動フレームワークを提案する。
30年以上にわたる大規模なarXiv.orgデータセットを使用します。
分類を補完するために,ベクトル化された記事のコサイン類似性に基づいたレコメンデーションモジュールを組み込む。
論文 参考訳(メタデータ) (2025-10-07T01:24:35Z) - Comparison of Machine Learning Models to Classify Documents on Digital Development [0.0]
本研究は,12分野に分類される世界規模のデジタル開発介入に関する文書データベースを公開している。
この研究は、データ量がパフォーマンスに影響を与える唯一の要因ではないと結論付け、クラス間の類似性やクラス間の相違性といった特徴も重要であると結論付けている。
論文 参考訳(メタデータ) (2025-10-01T09:53:28Z) - An experimental survey and Perspective View on Meta-Learning for Automated Algorithms Selection and Parametrization [0.0]
我々は、この継続的な発展途上の分野における芸術の状況について概観する。
AutoMLは、高度な分析を適用することに興味があるドメイン科学者が機械学習技術にアクセスできるようにする。
論文 参考訳(メタデータ) (2025-04-08T16:51:22Z) - Enhancing literature review with LLM and NLP methods. Algorithmic trading case [0.0]
本研究では,機械学習アルゴリズムを用いて,アルゴリズム取引分野の知識を分析し,整理する。
1956年から2020年の第1四半期にかけて、1億3600万件の研究論文のデータセットをフィルタリングして14,342件の関連記事を特定した。
論文 参考訳(メタデータ) (2024-10-23T13:37:27Z) - AI-Aided Kalman Filters [65.35350122917914]
カルマンフィルタ(KF)とその変種は、信号処理において最も著名なアルゴリズムの一つである。
最近の進歩は、古典的なカルマン型フィルタリングでディープニューラルネットワーク(DNN)を融合させる可能性を示している。
本稿では,KF型アルゴリズムにAIを組み込むための設計アプローチについて,チュートリアル形式で概説する。
論文 参考訳(メタデータ) (2024-10-16T06:47:53Z) - Embedding in Recommender Systems: A Survey [54.55152033023537]
本調査では,レコメンデータシステム埋め込み技術の進歩を包括的に分析する。
マトリックスベースのシナリオでは、協調フィルタリングはユーザの好みを効果的にモデル化する埋め込みを生成する。
パフォーマンス向上のため,AutoMLやハッシュ技術,量子化手法など,新たなアプローチを導入する。
論文 参考訳(メタデータ) (2023-10-28T06:31:06Z) - Comparative Analysis of Libraries for the Sentimental Analysis [0.0]
この研究は、機械学習手法を用いたライブラリの比較を行うことが主な目的である。
PythonとRの5つのライブラリ、NLTK、Textlob Vader、Transformer(GPTとBERTの事前トレーニング)、Tidytextを使って感情分析技術を適用する。
論文 参考訳(メタデータ) (2023-07-26T17:21:53Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - Deep Representational Similarity Learning for analyzing neural
signatures in task-based fMRI dataset [81.02949933048332]
本稿では、表現類似度分析(RSA)の深部拡張であるDRSL(Deep Representational similarity Learning)を開発する。
DRSLは、多数の被験者を持つfMRIデータセットにおける様々な認知タスク間の類似性を分析するのに適している。
論文 参考訳(メタデータ) (2020-09-28T18:30:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。