論文の概要: Analysis of child development facts and myths using text mining techniques and classification models
- arxiv url: http://arxiv.org/abs/2408.13091v1
- Date: Fri, 23 Aug 2024 14:16:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-26 14:50:54.431252
- Title: Analysis of child development facts and myths using text mining techniques and classification models
- Title(参考訳): テキストマイニング技術と分類モデルを用いた子どもの発達事実と神話の分析
- Authors: Mehedi Tajrian, Azizur Rahman, Muhammad Ashad Kabir, Md Rafiqul Islam,
- Abstract要約: 本研究は,児童発達に関する神話と事実を区別するために,テキストマイニング手法と分類モデルを適用した。
ロジスティック回帰は高い精度を示し、Bag-of-Words特徴抽出技術で90%の精度を達成した。
- 参考スコア(独自算出の注目度): 1.2416206871977309
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid dissemination of misinformation on the internet complicates the decision-making process for individuals seeking reliable information, particularly parents researching child development topics. This misinformation can lead to adverse consequences, such as inappropriate treatment of children based on myths. While previous research has utilized text-mining techniques to predict child abuse cases, there has been a gap in the analysis of child development myths and facts. This study addresses this gap by applying text mining techniques and classification models to distinguish between myths and facts about child development, leveraging newly gathered data from publicly available websites. The research methodology involved several stages. First, text mining techniques were employed to pre-process the data, ensuring enhanced accuracy. Subsequently, the structured data was analysed using six robust Machine Learning (ML) classifiers and one Deep Learning (DL) model, with two feature extraction techniques applied to assess their performance across three different training-testing splits. To ensure the reliability of the results, cross-validation was performed using both k-fold and leave-one-out methods. Among the classification models tested, Logistic Regression (LR) demonstrated the highest accuracy, achieving a 90% accuracy with the Bag-of-Words (BoW) feature extraction technique. LR stands out for its exceptional speed and efficiency, maintaining low testing time per statement (0.97 microseconds). These findings suggest that LR, when combined with BoW, is effective in accurately classifying child development information, thus providing a valuable tool for combating misinformation and assisting parents in making informed decisions.
- Abstract(参考訳): インターネット上での誤報の急速な普及は、信頼できる情報を求める個人、特に子育てに関する両親の意思決定過程を複雑にしている。
この誤報は、神話に基づく子供の不適切な扱いなど、有害な結果をもたらす可能性がある。
これまでの研究では、児童虐待の予測にテキストマイニング技術を用いてきたが、児童発生神話や事実の分析にはギャップがあった。
本研究では,子育てに関する神話と事実を識別するためにテキストマイニング手法と分類モデルを適用し,新たに収集したWebサイトからのデータを活用することによって,このギャップを解消する。
研究手法にはいくつかの段階があった。
まず、テキストマイニング技術を用いてデータを前処理し、精度を向上した。
その後、構造化されたデータは、6つの堅牢な機械学習(ML)分類器と1つのディープラーニング(DL)モデルを用いて分析され、3つの異なるトレーニングテストスプリットでパフォーマンスを評価するために2つの特徴抽出技術が適用された。
結果の信頼性を確保するため,k-fold法とLeft-one-out法の両方を用いてクロスバリデーションを行った。
テストした分類モデルの中で、ロジスティック回帰(LR)が最も精度が高く、Bag-of-Words(BoW)特徴抽出技術で90%の精度を達成した。
LRは例外的な速度と効率で、ステートメント毎のテスト時間(0.97マイクロ秒)を低く保っている。
これらの結果から, LRはBoWと組み合わせることで, 子育て情報の正確な分類に有効であることが示唆された。
関連論文リスト
- The Surprising Effectiveness of Test-Time Training for Abstract Reasoning [64.36534512742736]
モデル推論能力向上のためのメカニズムとして,テストタイムトレーニング(TTT)の有効性を検討する。
TTTはARCタスクのパフォーマンスを大幅に改善し、ベースとなる微調整モデルと比較して最大6倍の精度向上を実現した。
本研究は,ニューラルネットワークモデルにおける抽象的推論改善の道筋として,明示的な記号探索が唯一の道ではないことを示唆している。
論文 参考訳(メタデータ) (2024-11-11T18:59:45Z) - Data Augmentation for Sparse Multidimensional Learning Performance Data Using Generative AI [17.242331892899543]
学習パフォーマンスデータは、適応学習における正しい解答や問題解決の試みを記述している。
学習性能データは、適応的なアイテム選択のため、ほとんどの実世界のアプリケーションでは、非常にスパースな(80%(sim)90%の欠落)傾向にある。
本稿では,学習者のデータの分散性に対処するために,学習者のデータを拡張するための体系的フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T00:25:07Z) - Extracting Training Data from Unconditional Diffusion Models [76.85077961718875]
拡散確率モデル(DPM)は、生成人工知能(AI)の主流モデルとして採用されている。
本研究の目的は,1) 理論解析のための記憶量,2) 情報ラベルとランダムラベルを用いた条件記憶量,3) 記憶量測定のための2つのより良い評価指標を用いて,DPMにおける記憶量の理論的理解を確立することである。
提案手法は,理論解析に基づいて,SIDE (textbfSurrogate condItional Data extract) と呼ばれる新しいデータ抽出手法を提案する。
論文 参考訳(メタデータ) (2024-06-18T16:20:12Z) - Neural Lineage [56.34149480207817]
本稿では,親子間の系統関係の発見を目的としたニューラルライン検出という新しいタスクを提案する。
実用上,ニューラルネットワーク表現類似度指標に微調整プロセスの近似を組み込んだ学習自由アプローチを導入する。
精度を追求するために,エンコーダと変圧器検出器からなる学習系系統検出装置を導入する。
論文 参考訳(メタデータ) (2024-06-17T01:11:53Z) - Continual Learning with Pre-Trained Models: A Survey [61.97613090666247]
継続的な学習は、新しい知識を学ぶ際に、かつての知識の破滅的な忘れを克服することを目的としている。
本稿では, PTM を用いた CL の最近の進歩を包括的に調査する。
論文 参考訳(メタデータ) (2024-01-29T18:27:52Z) - Detection of developmental language disorder in Cypriot Greek children
using a neural network algorithm [0.0]
本研究の目的は,人工知能を用いた発達言語障害(DLD)の自動識別手法の開発である。
このプロトコルは、DLDを持つキプロス系ギリシャ人の子供に初めて適用される。
モデルの性能は精度,精度,リコール,F1スコア,ROC/AUC曲線などの指標を用いて評価した。
論文 参考訳(メタデータ) (2023-11-25T15:23:46Z) - Investigating Relative Performance of Transfer and Meta Learning [0.0]
本稿では,トランスファーラーニングとメタラーニングの2つの異なるアプローチを比較した研究結果について述べる。
包括的な目的は、多様な機械学習シナリオにおいて最も適切な方法を選択するための堅牢な基準を確立することである。
論文 参考訳(メタデータ) (2023-10-31T12:52:00Z) - Robust Learning with Progressive Data Expansion Against Spurious
Correlation [65.83104529677234]
本研究では,2層非線形畳み込みニューラルネットワークの学習過程について検討した。
分析の結果,不均衡なデータ群と学習容易なスプリアス特徴が学習過程におけるスプリアス特徴の優位性に繋がる可能性が示唆された。
本稿では,PDEと呼ばれる新たなトレーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-08T05:44:06Z) - Rethinking Bayesian Learning for Data Analysis: The Art of Prior and
Inference in Sparsity-Aware Modeling [20.296566563098057]
信号処理と機械学習のためのスパースモデリングは、20年以上にわたって科学研究の焦点となっている。
本稿では,3つの一般的なデータモデリングツールにスパーシティ・プロモーティング・プリエントを組み込むことの最近の進歩を概観する。
論文 参考訳(メタデータ) (2022-05-28T00:43:52Z) - Confident Coreset for Active Learning in Medical Image Analysis [57.436224561482966]
本稿では,情報的サンプルを効果的に選択するための,不確実性と分散性を考慮した新しい能動的学習手法である信頼コアセットを提案する。
2つの医用画像解析タスクの比較実験により,本手法が他の活動的学習方法より優れていることを示す。
論文 参考訳(メタデータ) (2020-04-05T13:46:16Z) - A survey of statistical learning techniques as applied to inexpensive
pediatric Obstructive Sleep Apnea data [3.1373682691616787]
閉塞性睡眠時無呼吸は小学生の1-5%に影響を及ぼす。
スウィフトの診断と治療は、子供の成長と発達にとって重要であるが、症状の多様性と利用可能なデータの複雑さは、これを困難にしている。
探索データ解析のプロセスにおいて,相関ネットワーク,トポロジカルデータ解析からのMapperアルゴリズム,特異値分解を適用した。
論文 参考訳(メタデータ) (2020-02-17T18:15:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。