論文の概要: The Arabic Ontology -- An Arabic Wordnet with Ontologically Clean
Content
- arxiv url: http://arxiv.org/abs/2205.09664v1
- Date: Thu, 19 May 2022 16:27:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-20 18:20:02.776594
- Title: The Arabic Ontology -- An Arabic Wordnet with Ontologically Clean
Content
- Title(参考訳): アラビアオントロジー-オントロジー的にクリーンな内容を持つアラビア語のワーネット
- Authors: Mustafa Jarrar
- Abstract要約: オントロジーはおよそ1,300の精巧な概念と、部分的に検証された11,000の概念で構成されている。
オントロジーは辞書検索エンジンを通じてアクセス可能で検索可能である。
Ontology は Princeton WordNet や Wikidata などのリソースで完全にマップされている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a formal Arabic wordnet built on the basis of a carefully designed
ontology hereby referred to as the Arabic Ontology. The ontology provides a
formal representation of the concepts that the Arabic terms convey, and its
content was built with ontological analysis in mind, and benchmarked to
scientific advances and rigorous knowledge sources as much as this is possible,
rather than to only speakers' beliefs as lexicons typically are. A
comprehensive evaluation was conducted thereby demonstrating that the current
version of the top-levels of the ontology can top the majority of the Arabic
meanings. The ontology consists currently of about 1,300 well-investigated
concepts in addition to 11,000 concepts that are partially validated. The
ontology is accessible and searchable through a lexicographic search engine
(https://ontology.birzeit.edu) that also includes about 150 Arabic-multilingual
lexicons, and which are being mapped and enriched using the ontology. The
ontology is fully mapped with Princeton WordNet, Wikidata, and other resources.
- Abstract(参考訳): 我々は、ここでアラビアオントロジーと呼ばれる、慎重に設計されたオントロジーに基づいて構築された形式アラビア語のワードネットを提示する。
オントロジーはアラビア語の用語が伝える概念を形式的に表現し、その内容は存在論的分析を念頭に置いて構築され、可能な限り科学的進歩と厳格な知識ソースにベンチマークされた。
包括的な評価が行われ、オントロジーの最上位階の現在のバージョンがアラビア語の意味の大部分を上回ることができることを示した。
オントロジーは現在約1,300の精巧な概念と、部分的に検証された11,000の概念で構成されている。
オントロジーは辞書検索エンジン(https://ontology.birzeit.edu)を通じてアクセス可能で、約150のアラビア語対応のレキシコンを含む。
オントロジーは、Princeton WordNet、Wikidata、その他のリソースで完全にマッピングされている。
関連論文リスト
- Arabic Text Sentiment Analysis: Reinforcing Human-Performed Surveys with
Wider Topic Analysis [49.1574468325115]
詳細な研究は、2002年から2020年の間に英語で出版された133のASA論文を手作業で分析する。
主な発見は、機械学習、レキシコンベース、ハイブリッドアプローチといった、ASAで使用されるさまざまなアプローチを示している。
アラビア文字SAについては、業界だけでなく学術分野でも使用できるASAツールを開発する必要がある。
論文 参考訳(メタデータ) (2024-03-04T10:37:48Z) - Curras + Baladi: Towards a Levantine Corpus [0.0]
約9.6Kの注釈付きトークンからなるレバノン・コーパス・バラディを提示する。
提案するコーパスは,キュラスを濃縮し,より一般的なレバンタインコーパスに変換するために構築された。
論文 参考訳(メタデータ) (2022-05-19T16:53:04Z) - Urdu Morphology, Orthography and Lexicon Extraction [0.0]
本稿では,Urdu言語の実装をソフトウェアAPIとして記述する。
我々は、正書法、形態学、辞書の抽出を扱う。
論文 参考訳(メタデータ) (2022-04-06T20:14:01Z) - Semantic Search for Large Scale Clinical Ontologies [63.71950996116403]
本稿では,大規模臨床語彙検索システムを構築するための深層学習手法を提案する。
本稿では,意味学習データに基づくトレーニングデータを生成するTriplet-BERTモデルを提案する。
このモデルは,5つの実ベンチマークデータセットを用いて評価され,提案手法は自由テキストから概念,概念まで,概念語彙の検索において高い結果が得られることを示す。
論文 参考訳(メタデータ) (2022-01-01T05:15:42Z) - New Arabic Medical Dataset for Diseases Classification [55.41644538483948]
いくつかのアラブの医療ウェブサイトから収集された2000の医療資料を含む、アラブの医療データセットを新たに導入する。
データセットはテキストの分類作業のために構築され、10つのクラス(Blood, Bone, Cardiovascular, Ear, Endocrine, Eye, Gastrointestinal, Immune, Liver, Nephrological)を含んでいる。
データセットの実験は、GoogleのBERT、大きなアラビアのコーパスを持つBERTに基づくアラビアト、アラビアの医療コーパスをベースとしたAraBioNERの3つの事前トレーニングモデルによって行われた。
論文 参考訳(メタデータ) (2021-06-29T10:42:53Z) - Formalising Concepts as Grounded Abstractions [68.24080871981869]
このレポートは、表現学習が生データから概念を誘導する方法を示しています。
このレポートの主な技術的目標は、表現学習のテクニックが概念空間の格子理論的定式化とどのように結婚できるかを示すことである。
論文 参考訳(メタデータ) (2021-01-13T15:22:01Z) - Neural Coreference Resolution for Arabic [12.986359659930146]
我々は、Lee et alのエンドツーエンドアーキテクチャと、アラビア語版のbertと外部参照検出器を組み合わせた、アラビア語のコア参照解決システムを導入する。
われわれの知る限りでは、これはアラビア語に特化した最初のニューラルコア参照解決システムだ。
OntoNotes 5.0では15.2ポイントのconll F1で、既存の技術よりも大幅に優れています。
論文 参考訳(メタデータ) (2020-10-31T14:34:43Z) - Automatic Arabic Dialect Identification Systems for Written Texts: A
Survey [0.0]
アラビア語の方言識別は自然言語処理の特定のタスクであり、与えられたテキストのアラビア語方言を自動的に予測することを目的としている。
本稿では,アラビア語の方言識別研究をテキストで包括的に調査する。
本稿では、従来の機械学習手法、ディープラーニングアーキテクチャ、アラビア方言識別のための複雑な学習アプローチについてレビューする。
論文 参考訳(メタデータ) (2020-09-26T15:33:16Z) - Quran Intelligent Ontology Construction Approach Using Association Rules
Mining [0.0]
本研究プロジェクトは、クアランオントロジーを抽出するためのアソシエーションルールの使用に関するものである。
本システムは,Quran句から意味的・概念的関係を抽出する統計と手法の組み合わせに基づく。
クァランの概念はクァランの知識の新しい強力な表現を提供し、関連ルールはクァランにおける連結概念のすべてのクラス間の関係を表現するのに役立つ。
論文 参考訳(メタデータ) (2020-08-07T15:48:58Z) - Computational linguistic assessment of textbook and online learning
media by means of threshold concepts in business education [59.003956312175795]
言語学的観点では、しきい値の概念は特別な語彙の例であり、特定の言語的特徴を示す。
ビジネス教育における63のしきい値の概念のプロファイルは、教科書、新聞、ウィキペディアで調査されている。
3種類のリソースは、しきい値の概念のプロファイルから区別できる。
論文 参考訳(メタデータ) (2020-08-05T12:56:16Z) - Word Sense Disambiguation for 158 Languages using Word Embeddings Only [80.79437083582643]
文脈における単語感覚の曖昧さは人間にとって容易であるが、自動的アプローチでは大きな課題である。
本稿では,学習前の標準単語埋め込みモデルを入力として,完全に学習した単語認識のインベントリを誘導する手法を提案する。
この手法を用いて、158の言語に対して、事前訓練されたfastText単語の埋め込みに基づいて、センスインベントリのコレクションを誘導する。
論文 参考訳(メタデータ) (2020-03-14T14:50:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。