論文の概要: Reducing Formal Context Extraction: A Newly Proposed Framework from Big Corpora
- arxiv url: http://arxiv.org/abs/2504.06285v1
- Date: Tue, 01 Apr 2025 09:24:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-13 05:54:40.552128
- Title: Reducing Formal Context Extraction: A Newly Proposed Framework from Big Corpora
- Title(参考訳): 形式的コンテキスト抽出の削減:Big Corporaから新たに提案されたフレームワーク
- Authors: Bryar A. Hassan, Shko M. Qader, Alla A. Hassan, Joan Lu, Aram M. Ahmed, Jafar Majidpour, Tarik A. Rashid,
- Abstract要約: 本研究では,自由テキストから概念階層を抽出する際の形式的文脈を削減する枠組みを提案する。
我々は、WordNetベースの手法と周波数ベースの手法のハイブリッドを用いて、形式的文脈のサイズを小さくすることで、これを実現する。
- 参考スコア(独自算出の注目度): 5.045556232232993
- License:
- Abstract: Automating the extraction of concept hierarchies from free text is advantageous because manual generation is frequently labor- and resource-intensive. Free result, the whole procedure for concept hierarchy learning from free text entails several phases, including sentence-level text processing, sentence splitting, and tokenization. Lemmatization is after formal context analysis (FCA) to derive the pairings. Nevertheless, there could be a few uninteresting and incorrect pairings in the formal context. It may take a while to generate formal context; thus, size reduction formal context is necessary to weed out irrelevant and incorrect pairings to extract the concept lattice and hierarchies more quickly. This study aims to propose a framework for reducing formal context in extracting concept hierarchies from free text to reduce the ambiguity of the formal context. We achieve this by reducing the size of the formal context using a hybrid of a WordNet-based method and a frequency-based technique. Using 385 samples from the Wikipedia corpus and the suggested framework, tests are carried out to examine the reduced size of formal context, leading to concept lattice and concept hierarchy. With the help of concept lattice-invariants, the generated formal context lattice is compared to the normal one. In contrast to basic ones, the homomorphic between the resultant lattices retains up to 98% of the quality of the generating concept hierarchies, and the reduced concept lattice receives the structural connection of the standard one. Additionally, the new framework is compared to five baseline techniques to calculate the running time on random datasets with various densities. The findings demonstrate that, in various fill ratios, hybrid approaches of the proposed method outperform other indicated competing strategies in concept lattice performance.
- Abstract(参考訳): 自由テキストから概念階層の抽出を自動化することは、手動生成がしばしば労働集約的かつ資源集約的であるため、有利である。
自由な結果、自由テキストからの概念階層学習の手順全体は、文レベルのテキスト処理、文分割、トークン化など、いくつかのフェーズを含む。
補題化は、ペアリングを導出するための形式的文脈解析(FCA)の後である。
それでも、形式的な文脈では、興味をそそらない、誤ったペアリングがいくつかあるかもしれない。
形式的文脈を生成するにはしばらく時間がかかるため、より早く概念格子と階層を抽出するためには、無関係で不正なペアリングを取り除くために、サイズ縮小形式的文脈が必要である。
本研究では,形式的文脈のあいまいさを軽減するために,自由テキストから概念階層を抽出する際の形式的文脈を減らす枠組みを提案する。
我々は、WordNetベースの手法と周波数ベースの手法のハイブリッドを用いて、形式的文脈のサイズを小さくすることで、これを実現する。
ウィキペディアのコーパスと提案フレームワークの385のサンプルを用いて、形式的文脈の縮小サイズを調べるテストを行い、概念的階層と概念的階層に繋がった。
概念格子不変の助けを借りて、生成された形式的文脈格子は通常のものと比較される。
基本格子とは対照的に、結果格子間の準同型は生成概念階層の質の98%を保ち、縮小された概念格子は標準格子の構造接続を受ける。
さらに、新しいフレームワークは、様々な密度のランダムデータセット上で実行時間を計算するための5つのベースライン技術と比較される。
その結果,様々なフィリング比において,提案手法のハイブリッドアプローチは,概念格子性能の競合戦略よりも優れていることがわかった。
関連論文リスト
- Learning Visual-Semantic Subspace Representations for Propositional Reasoning [49.17165360280794]
本稿では,特定の意味構造に適合する視覚表現を学習するための新しい手法を提案する。
我々のアプローチは、新しい核規範に基づく損失に基づいている。
部分空間格子におけるセマンティクスのスペクトル幾何学を最小エンコードしていることを示す。
論文 参考訳(メタデータ) (2024-05-25T12:51:38Z) - Ontology Learning Using Formal Concept Analysis and WordNet [0.9065034043031668]
このプロジェクトと論文は、自由テキストから概念階層を学習するための形式概念分析とWordNetフレームワークを提供する。
形式的なアイデア格子を計算し、古典的な概念階層を作成する。
いくつかのシステム制約と、論理的な結論を妨げる可能性のあるコンポーネントの相違にもかかわらず、以下のデータは、このプロジェクトにおける階層性と論文が有望であることを示している。
論文 参考訳(メタデータ) (2023-11-10T08:28:30Z) - Conjunct Resolution in the Face of Verbal Omissions [51.220650412095665]
本稿では,テキスト上で直接動作する接続分解タスクを提案し,コーディネーション構造に欠けている要素を復元するために,分割・言い換えパラダイムを利用する。
クラウドソースアノテーションによる自然に発生する動詞の省略例を10万件以上を含む,大規模なデータセットをキュレートする。
我々は、このタスクのために様々な神経ベースラインをトレーニングし、最良の手法が適切なパフォーマンスを得る一方で、改善のための十分なスペースを残していることを示す。
論文 参考訳(メタデータ) (2023-05-26T08:44:02Z) - Variational Cross-Graph Reasoning and Adaptive Structured Semantics
Learning for Compositional Temporal Grounding [143.5927158318524]
テンポラルグラウンドティング(Temporal grounding)とは、クエリ文に従って、未編集のビデオから特定のセグメントを特定するタスクである。
新たに構成時間グラウンドタスクを導入し,2つの新しいデータセット分割を構築した。
ビデオや言語に内在する構造的意味論は、構成的一般化を実現する上で重要な要素である、と我々は主張する。
論文 参考訳(メタデータ) (2023-01-22T08:02:23Z) - Progressive Tree-Structured Prototype Network for End-to-End Image
Captioning [74.8547752611337]
本稿では,新しいプログレッシブツリー構造型プロトタイプネットワーク(PTSN)を提案する。
PTSNは、階層的テキスト意味論をモデル化することによって、適切な意味論で予測語の範囲を狭める最初の試みである。
提案手法は,144.2%(シングルモデル),146.5%(4モデルのアンサンブル),141.4%(c5),143.9%(c40)のCIDErを公式オンラインテストサーバ上でスコアする。
論文 参考訳(メタデータ) (2022-11-17T11:04:00Z) - The Whole Truth and Nothing But the Truth: Faithful and Controllable
Dialogue Response Generation with Dataflow Transduction and Constrained
Decoding [65.34601470417967]
本稿では,ニューラルネットワークモデリングとルールベース生成の強みを組み合わせた対話応答生成のためのハイブリッドアーキテクチャについて述べる。
本実験により, 本システムは, 流布性, 妥当性, 真理性の評価において, ルールベースおよび学習的アプローチの両方に優れることがわかった。
論文 参考訳(メタデータ) (2022-09-16T09:00:49Z) - Keywords and Instances: A Hierarchical Contrastive Learning Framework Unifying Hybrid Granularities for Text Generation [60.62039705180484]
入力テキスト中のハイブリッドな粒度意味を統一する階層的コントラスト学習機構を提案する。
実験により,本モデルがパラフレージング,対話生成,ストーリーテリングタスクにおいて,競争ベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2022-05-26T13:26:03Z) - Concept and Attribute Reduction Based on Rectangle Theory of Formal
Concept [5.657202839641533]
形式概念には、中核概念、相対的必要概念、不要概念の3種類が存在することが知られている。
比較的必要な概念と不要な概念に対する新たな判断結果を示す。
形式的概念の集合の拡張を保ちながら属性を減少させる高速アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-10-29T02:10:08Z) - Artificial Intelligence Algorithms for Natural Language Processing and
the Semantic Web Ontology Learning [0.76146285961466]
新しい進化的クラスタリングアルゴリズム(ECA*)が提案されている。
5つの最先端アプローチに対してECA*を評価する実験を行った。
その結果,ECA*は,適切なクラスタを見つける能力において,その競争力を克服していることがわかった。
論文 参考訳(メタデータ) (2021-08-31T11:57:41Z) - Formal context reduction in deriving concept hierarchies from corpora
using adaptive evolutionary clustering algorithm star [15.154538450706474]
コーパスから概念階層を導出するプロセスは、通常、時間とリソース集約的なプロセスである。
結果として得られる形式的文脈の格子は、概念的格子不変量を用いて標準格子に評価される。
その結果,適応ECA*は,異なるフィリング比で,他の競合技術よりも高速に概念格子を実行することがわかった。
論文 参考訳(メタデータ) (2021-07-10T07:18:03Z) - Attribute Selection using Contranominal Scales [0.09668407688201358]
形式的概念分析(FCA)は、概念を導出して格子に並べることでバイナリデータを解析することができる。
そのような格子の大きさは、対応する形式的文脈におけるサブコンテキストの数に依存する。
本稿では,与えられた形式的文脈のすべての対数スケールの計算を可能にするアルゴリズムであるContraFinderを提案する。
論文 参考訳(メタデータ) (2021-06-21T10:53:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。