論文の概要: Unsupervised Thematic Clustering Of hadith Texts Using The Apriori Algorithm
- arxiv url: http://arxiv.org/abs/2512.16694v1
- Date: Thu, 18 Dec 2025 15:59:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:32.140314
- Title: Unsupervised Thematic Clustering Of hadith Texts Using The Apriori Algorithm
- Title(参考訳): Aprioriアルゴリズムを用いたハディステキストの教師なしセマンティッククラスタリング
- Authors: Wisnu Uriawan, Achmad Ajie Priyajie, Angga Gustian, Fikri Nur Hidayat, Sendi Ahmad Rafiudin, Muhamad Fikri Zaelani,
- Abstract要約: Aprioriアルゴリズムによる教師なし学習アプローチは、ラベルなしテキストデータにおける関連パターンと意味関係の同定に有効であることが証明された。
以上の結果から,ラカイト・プライヤー,反啓示,ハディース・ストーリーの関係などの有意義な関連パターンの存在が示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This research stems from the urgency to automate the thematic grouping of hadith in line with the growing digitalization of Islamic texts. Based on a literature review, the unsupervised learning approach with the Apriori algorithm has proven effective in identifying association patterns and semantic relations in unlabeled text data. The dataset used is the Indonesian Translation of the hadith of Bukhari, which first goes through preprocessing stages including case folding, punctuation cleaning, tokenization, stopword removal, and stemming. Next, an association rule mining analysis was conducted using the Apriori algorithm with support, confidence, and lift parameters. The results show the existence of meaningful association patterns such as the relationship between rakaat-prayer, verse-revelation, and hadith-story, which describe the themes of worship, revelation, and hadith narration. These findings demonstrate that the Apriori algorithm has the ability to automatically uncover latent semantic relationships, while contributing to the development of digital Islamic studies and technology-based learning systems.
- Abstract(参考訳): この研究は、イスラム教のテキストのデジタル化が進むにつれて、ハディスの主題的グループ化を自動化する緊急性に起因している。
文献レビューから,Aprioriアルゴリズムを用いた教師なし学習アプローチは,ラベルなしテキストデータにおける関連パターンと意味関係の同定に有効であることが証明された。
使用されたデータセットはインドネシア語でブハリのハディスを翻訳したもので、まずケース折り畳み、句読点のクリーニング、トークン化、ストップワードの除去、ステミングといった前処理段階を経る。
次に,Aprioriアルゴリズムを用いてアソシエーションルールマイニング分析を行い,その支援,信頼性,リフトパラメータについて検討した。
以上の結果から,ラーカト・プライヤー,反啓示,ハディース・ストーリーなどの意味ある関連パターンの存在が示唆され,信仰のテーマ,啓示,ハディース・ナレーションが説明される。
これらの結果から,Aprioriアルゴリズムは,デジタルイスラム研究や技術に基づく学習システムの発展に寄与しながら,潜在意味関係を自動的に解明する能力を有していることが示唆された。
関連論文リスト
- A Critical Review of the Need for Knowledge-Centric Evaluation of Quranic Recitation [0.9332987715848714]
クラーニック・リサイクリング(タイウェド)の聖なる実践は、現代において重要な教育的課題に直面している。
デジタル技術は教育への前例のないアクセスを約束する一方で、評価のための自動ツールが広く普及または教育効果を達成できなかった。
本総説では, 言語知識と高度な音声分析を融合したハイブリッドシステムに, 自動クラニック評価の今後について考察する。
論文 参考訳(メタデータ) (2025-10-14T13:39:49Z) - Data Leakage and Deceptive Performance: A Critical Examination of Credit Card Fraud Detection Methodologies [3.6234531924374527]
本研究はクレジットカード不正検出研究における方法論的厳密性について批判的に検討する。
基本的な方法論の原則に反した場合、単純なモデルでさえ、見事に印象的な結果が得られることを実証する。
論文 参考訳(メタデータ) (2025-06-03T09:56:43Z) - H-STAR: LLM-driven Hybrid SQL-Text Adaptive Reasoning on Tables [56.73919743039263]
本稿では,2段階のプロセスにシンボル的アプローチと意味的アプローチ(テキスト的アプローチ)を統合し,制約に対処する新しいアルゴリズムを提案する。
実験の結果,H-STARは3つの質問応答(QA)と事実検証データセットにおいて,最先端の手法を大幅に上回っていることがわかった。
論文 参考訳(メタデータ) (2024-06-29T21:24:19Z) - The Short Text Matching Model Enhanced with Knowledge via Contrastive
Learning [8.350445155753167]
本稿では,コントラスト学習と外部知識を組み合わせた短いテキストマッチングモデルを提案する。
ノイズを避けるため、原文の主文としてキーワードを用いて、知識ベースで対応する知識語を検索する。
設計モデルは,2つの公開可能な中国語テキストマッチングデータセット上で,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-04-08T03:24:05Z) - A Human Word Association based model for topic detection in social networks [1.8749305679160366]
本稿では,単語連想の心的能力を模倣する概念に基づく,ソーシャルネットワークの話題検出フレームワークを提案する。
このフレームワークの性能は、トピック検出の分野におけるベンチマークであるFA-CUPデータセットを用いて評価される。
論文 参考訳(メタデータ) (2023-01-30T17:10:34Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - Speaker Embedding-aware Neural Diarization for Flexible Number of
Speakers with Textual Information [55.75018546938499]
本稿では,話者埋め込み認識型ニューラルダイアリゼーション(SEND)手法を提案する。
本手法は,ターゲット話者の音声活動検出よりも低いダイアリゼーション誤差率を実現する。
論文 参考訳(メタデータ) (2021-11-28T12:51:04Z) - Relation Clustering in Narrative Knowledge Graphs [71.98234178455398]
原文内の関係文は(SBERTと)埋め込み、意味論的に類似した関係をまとめるためにクラスタ化される。
予備的なテストでは、そのようなクラスタリングが類似した関係を検知し、半教師付きアプローチのための貴重な前処理を提供することが示されている。
論文 参考訳(メタデータ) (2020-11-27T10:43:04Z) - Leveraging Cognitive Search Patterns to Enhance Automated Natural
Language Retrieval Performance [0.0]
ユーザの検索行動を模倣する認知的再構成パターンが強調されている。
問合せの概念表現を考慮し,これらのパターンの適用を形式化する。
遺伝的アルゴリズムに基づく重み付けプロセスでは、概念的役割タイプに応じて用語に重点を置くことができる。
論文 参考訳(メタデータ) (2020-04-21T14:13:33Z) - Temporal Embeddings and Transformer Models for Narrative Text
Understanding [72.88083067388155]
キャラクタ関係モデリングのための物語テキスト理解のための2つのアプローチを提案する。
これらの関係の時間的進化は動的単語埋め込みによって説明され、時間とともに意味的変化を学ぶように設計されている。
最新の変換器モデルBERTに基づく教師付き学習手法を用いて文字間の静的な関係を検出する。
論文 参考訳(メタデータ) (2020-03-19T14:23:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。