論文の概要: Quranic Conversations: Developing a Semantic Search tool for the Quran
using Arabic NLP Techniques
- arxiv url: http://arxiv.org/abs/2311.05120v1
- Date: Thu, 9 Nov 2023 03:14:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-10 16:21:29.020236
- Title: Quranic Conversations: Developing a Semantic Search tool for the Quran
using Arabic NLP Techniques
- Title(参考訳): Quranic Conversations:アラビアNLP技術を用いたQuranのためのセマンティック検索ツールの開発
- Authors: Yasser Shohoud, Maged Shoman, Sarah Abdelazim
- Abstract要約: クラーンの聖典は、約23年間にわたって預言者ムハンマド(英語版)(PBUH)に明かされたように、神(アッラー)の文字通りの言葉であると考えられている。
ムスリムにとって、問題や関心の探求に関連するすべてのアヤ(詩)を入手することは困難である。
ユーザの質問やプロンプトに関連する句を検索するQuranセマンティック検索ツールを開発した。
- 参考スコア(独自算出の注目度): 0.7673339435080445
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Holy Book of Quran is believed to be the literal word of God (Allah) as
revealed to the Prophet Muhammad (PBUH) over a period of approximately 23
years. It is the book where God provides guidance on how to live a righteous
and just life, emphasizing principles like honesty, compassion, charity and
justice, as well as providing rules for personal conduct, family matters,
business ethics and much more. However, due to constraints related to the
language and the Quran organization, it is challenging for Muslims to get all
relevant ayahs (verses) pertaining to a matter or inquiry of interest. Hence,
we developed a Quran semantic search tool which finds the verses pertaining to
the user inquiry or prompt. To achieve this, we trained several models on a
large dataset of over 30 tafsirs, where typically each tafsir corresponds to
one verse in the Quran and, using cosine similarity, obtained the tafsir tensor
which is most similar to the prompt tensor of interest, which was then used to
index for the corresponding ayah in the Quran. Using the SNxLM model, we were
able to achieve a cosine similarity score as high as 0.97 which corresponds to
the abdu tafsir for a verse relating to financial matters.
- Abstract(参考訳): コーランの聖典は、約23年間にわたって預言者ムハンマド(英語版)(pbuh)に明かされた神(アッラー)の文字通りの言葉であると信じられている。
神が、誠実さ、慈悲、慈善、正義といった原則を強調するとともに、個人的行為、家族的問題、ビジネス倫理などの規則を神に課す本である。
しかし、言語とクルアーンの組織に関する制約により、ムスリムが関心事や調査に関連するすべてのアヤ(詩)を入手することは困難である。
そこで我々は,ユーザの質問やプロンプトに関連する句を検索するQuranセマンティック検索ツールを開発した。
これを達成するために、30以上のtafsirの大きなデータセット上で複数のモデルをトレーニングしました。ここでは、典型的には、各tafsirは、クルアーンの1つの詩に対応し、コサインの類似性を用いて、関心のテンソルに最も近いtafsirテンソルを取得しました。
snxlmモデルを用いて,abdu tafsirに対応する0.97までのコサイン類似度スコアを,金融問題に関する詩として達成することができた。
関連論文リスト
- A Benchmark Dataset with Larger Context for Non-Factoid Question Answering over Islamic Text [0.16385815610837165]
本稿では,Quranic Tafsir と Ahadith の領域内で質問応答を目的とした包括的データセットについて紹介する。
このデータセットは、73,000以上の質問応答ペアからなる堅牢なコレクションで構成されており、この特殊なドメインで報告されている最大のデータセットである。
本稿では,データセットのコントリビューションを強調しながら,その後の人的評価から,既存の自動評価手法の限界に関する批判的な洞察が得られた。
論文 参考訳(メタデータ) (2024-09-15T19:50:00Z) - Towards Unsupervised Recognition of Token-level Semantic Differences in
Related Documents [61.63208012250885]
意味的差異をトークンレベルの回帰タスクとして認識する。
マスク付き言語モデルに依存する3つの教師なしアプローチについて検討する。
その結果,単語アライメントと文レベルのコントラスト学習に基づくアプローチは,ゴールドラベルと強い相関関係があることが示唆された。
論文 参考訳(メタデータ) (2023-05-22T17:58:04Z) - Mispronunciation Detection of Basic Quranic Recitation Rules using Deep
Learning [0.0]
イスラム教では、読み手はタイウェド規則と呼ばれる一連の発音規則を適用して、クルランを引用しなければならない。
タジュウェドの教師の数は、現在、すべてのムスリムにとって毎日のリサイクリングの練習には不十分である。
本稿では,Mel-Frequency Cepstral Coefficient (MFCC) とLong Short-Term Memory (LSTM) ニューラルネットワークを組み合わせた時系列モデルを提案する。
論文 参考訳(メタデータ) (2023-05-10T19:31:25Z) - Quran Recitation Recognition using End-to-End Deep Learning [0.0]
クルランはイスラム教の聖典であり、その引用は宗教の重要な側面である。
聖クラーンの朗読が自動的に認められることは、その独特の規則のために難しい課題である。
本稿では,神聖クラーンの朗読を認識するための新しいエンド・ツー・エンド深層学習モデルを提案する。
論文 参考訳(メタデータ) (2023-05-10T18:40:01Z) - Towards a Holistic Understanding of Mathematical Questions with
Contrastive Pre-training [65.10741459705739]
本稿では,数学的問題表現,すなわち QuesCo に対する対照的な事前学習手法を提案する。
まず、コンテンツレベルと構造レベルを含む2段階の質問強化を設計し、類似した目的で文字通り多様な質問ペアを生成する。
そこで我々は,知識概念の階層的情報を完全に活用するために,知識階層を意識したランク戦略を提案する。
論文 参考訳(メタデータ) (2023-01-18T14:23:29Z) - Relational Sentence Embedding for Flexible Semantic Matching [86.21393054423355]
文埋め込みの可能性を明らかにするための新しいパラダイムとして,文埋め込み(Sentence Embedding, RSE)を提案する。
RSEは文関係のモデル化に有効で柔軟性があり、一連の最先端の埋め込み手法より優れている。
論文 参考訳(メタデータ) (2022-12-17T05:25:17Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - Fantastic Questions and Where to Find Them: FairytaleQA -- An Authentic
Dataset for Narrative Comprehension [136.82507046638784]
幼稚園児の物語理解に焦点を当てたデータセットであるFairytaleQAを8年生に紹介する。
FairytaleQAは10,580の明示的で暗黙的な質問で構成されており、278の子供フレンドリーな物語から導かれる。
論文 参考訳(メタデータ) (2022-03-26T00:20:05Z) - TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and
Textual Content in Finance [71.76018597965378]
TAT-QAと呼ばれるタブラデータとテクスチャデータの両方を含む新しい大規模な質問応答データセットを構築します。
本稿では,テーブルとテキストの両方を推論可能な新しいQAモデルであるTAGOPを提案する。
論文 参考訳(メタデータ) (2021-05-17T06:12:06Z) - Smartajweed Automatic Recognition of Arabic Quranic Recitation Rules [0.0]
Tajweedは、クランを暗唱しながら、すべてのクォリティで文字の正しい発音でクォランを読むためのルールのセットです。
これらの特徴はメロディックな規則、例えば、どこで停止するか、どのくらいの期間、発音で2文字をマージするか、あるいは何文字を伸ばすか、あるいは他の文字にもっと力を加えるかなどである。
論文 参考訳(メタデータ) (2020-12-26T11:24:03Z) - Quran Intelligent Ontology Construction Approach Using Association Rules
Mining [0.0]
本研究プロジェクトは、クアランオントロジーを抽出するためのアソシエーションルールの使用に関するものである。
本システムは,Quran句から意味的・概念的関係を抽出する統計と手法の組み合わせに基づく。
クァランの概念はクァランの知識の新しい強力な表現を提供し、関連ルールはクァランにおける連結概念のすべてのクラス間の関係を表現するのに役立つ。
論文 参考訳(メタデータ) (2020-08-07T15:48:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。