論文の概要: Ontology Learning Using Formal Concept Analysis and WordNet
- arxiv url: http://arxiv.org/abs/2311.14699v1
- Date: Fri, 10 Nov 2023 08:28:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-03 13:53:17.090681
- Title: Ontology Learning Using Formal Concept Analysis and WordNet
- Title(参考訳): 形式的概念分析とWordNetを用いたオントロジー学習
- Authors: Bryar A. Hassan
- Abstract要約: このプロジェクトと論文は、自由テキストから概念階層を学習するための形式概念分析とWordNetフレームワークを提供する。
形式的なアイデア格子を計算し、古典的な概念階層を作成する。
いくつかのシステム制約と、論理的な結論を妨げる可能性のあるコンポーネントの相違にもかかわらず、以下のデータは、このプロジェクトにおける階層性と論文が有望であることを示している。
- 参考スコア(独自算出の注目度): 0.9065034043031668
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Manual ontology construction takes time, resources, and domain specialists.
Supporting a component of this process for automation or semi-automation would
be good. This project and dissertation provide a Formal Concept Analysis and
WordNet framework for learning concept hierarchies from free texts. The process
has steps. First, the document is Part-Of-Speech labeled, then parsed to
produce sentence parse trees. Verb/noun dependencies are derived from parse
trees next. After lemmatizing, pruning, and filtering the word pairings, the
formal context is created. The formal context may contain some erroneous and
uninteresting pairs because the parser output may be erroneous, not all derived
pairs are interesting, and it may be large due to constructing it from a large
free text corpus. Deriving lattice from the formal context may take longer,
depending on the size and complexity of the data. Thus, decreasing formal
context may eliminate erroneous and uninteresting pairs and speed up idea
lattice derivation. WordNet-based and Frequency-based approaches are tested.
Finally, we compute formal idea lattice and create a classical concept
hierarchy. The reduced concept lattice is compared to the original to evaluate
the outcomes. Despite several system constraints and component discrepancies
that may prevent logical conclusion, the following data imply idea hierarchies
in this project and dissertation are promising. First, the reduced idea lattice
and original concept have commonalities. Second, alternative language or
statistical methods can reduce formal context size. Finally, WordNet-based and
Frequency-based approaches reduce formal context differently, and the order of
applying them is examined to reduce context efficiently.
- Abstract(参考訳): 手動オントロジー構築には時間、リソース、ドメインスペシャリストが必要です。
自動化や半自動化のためにこのプロセスのコンポーネントをサポートするのはよいことです。
このプロジェクトと論文は、自由テキストから概念階層を学習するための形式概念分析とWordNetフレームワークを提供する。
プロセスにはステップがあります。
まず、文書はPart-Of-Speechラベル付きで解析され、文解析木を生成する。
動詞/名詞の依存関係は次にパースツリーから導き出される。
単語のペアリングを補間、プルーニング、フィルタリングした後、正式なコンテキストが生成される。
形式的文脈は、パーサの出力が誤った場合があり、すべての導出されたペアが興味深く、大きな自由テキストコーパスから構築された場合が大きいため、いくつかの誤ったペアを含む。
形式的コンテキストからの格子の導出には、データのサイズや複雑さによって時間がかかる可能性がある。
したがって、形式的文脈の減少は、誤って興味のないペアを排除し、アイデア格子の導出を高速化する。
wordnetベースと周波数ベースのアプローチがテストされている。
最後に、形式的アイデア格子を計算し、古典的な概念階層を作成する。
還元された概念格子は、結果を評価するために原点と比較される。
いくつかのシステムの制約と、論理的な結論を妨げるコンポーネントの相違にもかかわらず、以下のデータはプロジェクトの階層化を示唆しており、論文化は有望である。
まず、還元されたアイデア格子と元の概念は共通点を持つ。
第二に、代替言語や統計的手法は形式的文脈サイズを減らすことができる。
最後に, WordNet と Frequency をベースとしたアプローチは, 形式的文脈の差異を低減し, 適用順序を検証し, 文脈を効率的に削減する。
関連論文リスト
- Structured Dialogue Discourse Parsing [79.37200787463917]
談話解析は、多人数会話の内部構造を明らかにすることを目的としている。
本稿では,符号化と復号化という2つの観点から,従来の作業を改善する原理的手法を提案する。
実験の結果,本手法は,STACでは2.3,Mollweniでは1.5,先行モデルでは2.3を上回った。
論文 参考訳(メタデータ) (2023-06-26T22:51:01Z) - Laziness Is a Virtue When It Comes to Compositionality in Neural
Semantic Parsing [20.856601758389544]
本稿では,論理形式の葉から始まる論理形式をボトムアップから構築するニューラルセマンティック解析生成手法を提案する。
我々の新しいボトムアップ・パーシング・セマンティック・テクニックは、汎用的なセマンティクスよりも優れており、同等のニューラル・セマンティクスと競合していることを示す。
論文 参考訳(メタデータ) (2023-05-07T17:53:08Z) - APOLLO: A Simple Approach for Adaptive Pretraining of Language Models
for Logical Reasoning [73.3035118224719]
本稿では,論理的推論能力を改善した適応事前学習型言語モデルAPOLLOを提案する。
APOLLOはReClorで比較可能であり、LogiQAでベースラインを上回ります。
論文 参考訳(メタデータ) (2022-12-19T07:40:02Z) - The Whole Truth and Nothing But the Truth: Faithful and Controllable
Dialogue Response Generation with Dataflow Transduction and Constrained
Decoding [65.34601470417967]
本稿では,ニューラルネットワークモデリングとルールベース生成の強みを組み合わせた対話応答生成のためのハイブリッドアーキテクチャについて述べる。
本実験により, 本システムは, 流布性, 妥当性, 真理性の評価において, ルールベースおよび学習的アプローチの両方に優れることがわかった。
論文 参考訳(メタデータ) (2022-09-16T09:00:49Z) - A Proposed Conceptual Framework for a Representational Approach to
Information Retrieval [42.67826268399347]
本稿では,情報検索と自然言語処理における最近の発展を理解するための概念的枠組みについて概説する。
本稿では,コアテキスト検索問題を論理的スコアリングモデルと物理的検索モデルに分解する表現的アプローチを提案する。
論文 参考訳(メタデータ) (2021-10-04T15:57:02Z) - Extracting Grammars from a Neural Network Parser for Anomaly Detection
in Unknown Formats [79.6676793507792]
強化学習は、ある未知のフォーマットで文を解析するために、人工知能を訓練する技術として、最近約束されている。
本稿では、ニューラルネットワークから生成規則を抽出し、これらの規則を用いて、ある文が名目か異常かを決定する手順を提案する。
論文 参考訳(メタデータ) (2021-07-30T23:10:24Z) - Formal context reduction in deriving concept hierarchies from corpora
using adaptive evolutionary clustering algorithm star [15.154538450706474]
コーパスから概念階層を導出するプロセスは、通常、時間とリソース集約的なプロセスである。
結果として得られる形式的文脈の格子は、概念的格子不変量を用いて標準格子に評価される。
その結果,適応ECA*は,異なるフィリング比で,他の競合技術よりも高速に概念格子を実行することがわかった。
論文 参考訳(メタデータ) (2021-07-10T07:18:03Z) - Can a Fruit Fly Learn Word Embeddings? [16.280120177501733]
フルーツフライ脳は、神経科学で最も研究されたシステムの1つです。
ネットワークモチーフは単語の意味表現を学習し,静的および文脈依存の単語埋め込みを生成できることを示す。
また,fruit fly networkのモチーフはnlpの既存の手法に匹敵する性能を実現するだけでなく,計算資源のほんの一部しか使用できないことを示した。
論文 参考訳(メタデータ) (2021-01-18T05:41:50Z) - Logic Constrained Pointer Networks for Interpretable Textual Similarity [11.142649867439406]
本稿では, セシネルゲーティング機能を備えた新しいポインターネットワークモデルを導入し, 構成チャンクを整列させる。
両文の相違を等しく補償し、アライメントが双方向であることを保証するために、損失関数によるこのベースモデルを改善する。
このモデルは、チャンクアライメントタスクのためのベンチマークSemEvalデータセットにおいて、97.73と96.32のF1スコアを達成する。
論文 参考訳(メタデータ) (2020-07-15T13:01:44Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z) - Multi-Step Inference for Reasoning Over Paragraphs [95.91527524872832]
テキスト上の複雑な推論には、自由形式の述語と論理的な連結体を理解し、連鎖する必要がある。
本稿では,ニューラルネットワークを連想させる構成モデルを提案する。
論文 参考訳(メタデータ) (2020-04-06T21:12:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。