Fugu-MT 論文翻訳(概要): Formal context reduction in deriving concept hierarchies from corpora using adaptive evolutionary clustering algorithm star

論文の概要: Formal context reduction in deriving concept hierarchies from corpora using adaptive evolutionary clustering algorithm star

arxiv url: http://arxiv.org/abs/2107.04781v1
Date: Sat, 10 Jul 2021 07:18:03 GMT
ステータス: 翻訳完了
システム内更新日: 2021-07-13 16:20:49.665602
Title: Formal context reduction in deriving concept hierarchies from corpora using adaptive evolutionary clustering algorithm star
Title（参考訳）: 適応型進化クラスタリングアルゴリズムstarを用いたコーパスから導出する概念階層の形式的コンテキスト削減
Authors: Bryar A. Hassan, Tarik A. Rashid and Seyedali Mirjalili
Abstract要約: コーパスから概念階層を導出するプロセスは、通常、時間とリソース集約的なプロセスである。結果として得られる形式的文脈の格子は、概念的格子不変量を用いて標準格子に評価される。その結果,適応ECA*は,異なるフィリング比で,他の競合技術よりも高速に概念格子を実行することがわかった。
参考スコア（独自算出の注目度）: 15.154538450706474
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: It is beneficial to automate the process of deriving concept hierarchies from corpora since a manual construction of concept hierarchies is typically a time-consuming and resource-intensive process. As such, the overall process of learning concept hierarchies from corpora encompasses a set of steps: parsing the text into sentences, splitting the sentences and then tokenising it. After the lemmatisation step, the pairs are extracted using FCA. However, there might be some uninteresting and erroneous pairs in the formal context. Generating formal context may lead to a time-consuming process, so formal context size reduction is required to remove uninterested and erroneous pairs, taking less time to extract the concept lattice and concept hierarchies accordingly. In this premise, this study aims to propose two frameworks: (1) A framework to review the current process of deriving concept hierarchies from corpus utilising FCA; (2) A framework to decrease the formal contexts ambiguity of the first framework using an adaptive version of ECA*. Experiments are conducted by applying 385 sample corpora from Wikipedia on the two frameworks to examine the reducing size of formal context, which leads to yield concept lattice and concept hierarchy. The resulting lattice of formal context is evaluated to the standard one using concept lattice-invariants. Accordingly, the homomorphic between the two lattices preserves the quality of resulting concept hierarchies by 89% in contrast to the basic ones, and the reduced concept lattice inherits the structural relation of the standard one. The adaptive ECA* is examined against its four counterpart baseline algorithms to measure the execution time on random datasets with different densities (fill ratios). The results show that adaptive ECA* performs concept lattice faster than other mentioned competitive techniques in different fill ratios.
Abstract（参考訳）: 概念階層の手動構築は通常、時間を要するリソース集約的なプロセスであるため、コーパスから概念階層を導出するプロセスを自動化することは有益である。このように、コーパスから概念階層を学習する全体的なプロセスは、テキストを文にパースし、文章を分割し、トークン化する一連のステップを含んでいる。補間ステップの後、fcaを用いてペアを抽出する。しかし、形式的な文脈では、面白くない、誤ったペアがいくつか存在するかもしれない。形式的コンテキストの生成は時間のかかるプロセスにつながる可能性があるため、形式的コンテキストサイズ削減は、興味のない、誤ったペアを取り除くために必要であり、それに従って概念格子と概念階層を抽出する時間を削減する。本研究の目的は,(1)FCAを利用するコーパスから概念階層を導出するフレームワーク,(2)ECA*の適応版を用いた第1フレームワークの形式的文脈あいまいさを低減させるフレームワーク,の2つの枠組みを提案することである。 wikipediaのサンプル385コーパスを2つのフレームワークに適用して、形式的コンテキストのサイズを削減し、概念格子と概念階層を生成する実験を行った。その結果得られる形式的文脈の格子は、概念格子不変量を用いて標準の格子に評価される。したがって、2つの格子間の準同型は、基本格子とは対照的に、結果として得られる概念階層の質を89%維持し、縮小された概念格子は標準格子の構造的関係を継承する。適応ECA*は,異なる密度(充填比)のランダムデータセット上での実行時間を測定するために,対応する4つのベースラインアルゴリズムに対して検討される。その結果,適応ECA*は,異なるフィリング比で,他の競合技術よりも高速に概念格子を実行することがわかった。

関連論文リスト

Hierarchical Concept Embedding & Pursuit for Interpretable Image Classification [39.219841379322716]
解釈可能な設計モデルは、予測に忠実な説明を提供するため、コンピュータビジョンにおいて勢いを増している。提案する階層型概念埋め込み・探索(HCEP)は,潜在空間における概念埋め込みの階層構造を誘導するフレームワークである。 HCEPは, 競争的分類精度を維持しつつ, 概念精度とリコールにおいて, ベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (2026-02-11T23:53:15Z)
Improving Scientific Document Retrieval with Academic Concept Index [47.95234352955763]
汎用ドメインレトリバーを科学領域に適用することは、大規模ドメイン固有の関連アノテーションが不足しているため困難である。最近のアプローチでは、これらの問題を2つの独立した方向で解決している。本稿では,論文から重要な概念を抽出し,学術分類学に導かれる概念を整理する学術概念索引を紹介する。
論文参考訳（メタデータ） (2026-01-02T04:47:49Z)
StructCoh: Structured Contrastive Learning for Context-Aware Text Semantic Matching [10.000850856259866]
StructCohはグラフ強化のコントラスト学習フレームワークである。階層的な対照的な目的は、複数の粒度で一貫性を強制する。 3つの法的な文書マッチングベンチマークと学術的プラジャリズム検出データセットの実験は、大幅な改善を示している。
論文参考訳（メタデータ） (2025-09-02T07:21:36Z)
Reducing Formal Context Extraction: A Newly Proposed Framework from Big Corpora [5.045556232232993]
本研究では,自由テキストから概念階層を抽出する際の形式的文脈を削減する枠組みを提案する。我々は、WordNetベースの手法と周波数ベースの手法のハイブリッドを用いて、形式的文脈のサイズを小さくすることで、これを実現する。
論文参考訳（メタデータ） (2025-04-01T09:24:07Z)
A Canonicalization Perspective on Invariant and Equivariant Learning [54.44572887716977]
フレームの設計について,本質的で完全な視点を提供する正準化の視点を導入する。フレームと標準形式の間には固有の関係があることが示される。既存の手法よりも厳密な固有ベクトルのための新しいフレームを設計する。
論文参考訳（メタデータ） (2024-05-28T17:22:15Z)
Best of Both Worlds: A Pliable and Generalizable Neuro-Symbolic Approach for Relation Classification [17.398872494876365]
本稿では,関係分類のための新しいニューロシンボリックアーキテクチャを提案する。ルールベースの手法と現代のディープラーニング技術を組み合わせる。提案手法は4つの設定のうち3つで従来の最先端モデルよりも優れていることを示す。
論文参考訳（メタデータ） (2024-03-05T20:08:32Z)
Ontology Learning Using Formal Concept Analysis and WordNet [0.9065034043031668]
このプロジェクトと論文は、自由テキストから概念階層を学習するための形式概念分析とWordNetフレームワークを提供する。形式的なアイデア格子を計算し、古典的な概念階層を作成する。いくつかのシステム制約と、論理的な結論を妨げる可能性のあるコンポーネントの相違にもかかわらず、以下のデータは、このプロジェクトにおける階層性と論文が有望であることを示している。
論文参考訳（メタデータ） (2023-11-10T08:28:30Z)
Coherent Entity Disambiguation via Modeling Topic and Categorical Dependency [87.16283281290053]
従来のエンティティ曖昧化(ED)メソッドは、参照コンテキストと候補エンティティの一致するスコアに基づいて予測を行う、識別パラダイムを採用している。本稿では,エンティティ予測のコヒーレンス向上を目的とした新しいデザインを備えたEDシステムであるCoherentedを提案する。我々は、人気EDベンチマークにおいて、平均1.3F1ポイントの改善により、最先端の新たな結果を得る。
論文参考訳（メタデータ） (2023-11-06T16:40:13Z)
Understanding and Constructing Latent Modality Structures in Multi-modal Representation Learning [53.68371566336254]
優れたパフォーマンスの鍵は、完全なモダリティアライメントではなく、有意義な潜在モダリティ構造にある、と我々は主張する。具体的には,1)モダリティ内正規化のための深い特徴分離損失,2)モダリティ間正規化のためのブラウン橋損失,3)モダリティ内正規化およびモダリティ間正規化のための幾何学的整合損失を設計する。
論文参考訳（メタデータ） (2023-03-10T14:38:49Z)
Progressive Tree-Structured Prototype Network for End-to-End Image Captioning [74.8547752611337]
本稿では,新しいプログレッシブツリー構造型プロトタイプネットワーク(PTSN)を提案する。 PTSNは、階層的テキスト意味論をモデル化することによって、適切な意味論で予測語の範囲を狭める最初の試みである。提案手法は,144.2%(シングルモデル),146.5%(4モデルのアンサンブル),141.4%(c5),143.9%(c40)のCIDErを公式オンラインテストサーバ上でスコアする。
論文参考訳（メタデータ） (2022-11-17T11:04:00Z)
Two-stream Hierarchical Similarity Reasoning for Image-text Matching [66.43071159630006]
文脈情報を自動的に抽出する階層的類似性推論モジュールを提案する。従来のアプローチでは、シングルストリームの類似性アライメントを学習することしか検討されていなかった。イメージ・ツー・テキスト・レベルの類似性計算とテキスト・ツー・テキスト・レベルの類似性計算に画像・テキストマッチングを分解する2ストリームアーキテクチャを開発した。
論文参考訳（メタデータ） (2022-03-10T12:56:10Z)
Concept and Attribute Reduction Based on Rectangle Theory of Formal Concept [5.657202839641533]
形式概念には、中核概念、相対的必要概念、不要概念の3種類が存在することが知られている。比較的必要な概念と不要な概念に対する新たな判断結果を示す。形式的概念の集合の拡張を保ちながら属性を減少させる高速アルゴリズムを提案する。
論文参考訳（メタデータ） (2021-10-29T02:10:08Z)
Artificial Intelligence Algorithms for Natural Language Processing and the Semantic Web Ontology Learning [0.76146285961466]
新しい進化的クラスタリングアルゴリズム(ECA*)が提案されている。 5つの最先端アプローチに対してECA*を評価する実験を行った。その結果,ECA*は,適切なクラスタを見つける能力において,その競争力を克服していることがわかった。
論文参考訳（メタデータ） (2021-08-31T11:57:41Z)
Hierarchical Poset Decoding for Compositional Generalization in Language [52.13611501363484]
出力が部分的に順序付けられた集合(命題)である構造化予測タスクとして人間の言語理解を形式化する。現在のエンコーダ・デコーダアーキテクチャは意味論のポーズ構造を適切に考慮していない。本稿では,言語における合成一般化のための新しい階層型ポーズデコーディングパラダイムを提案する。
論文参考訳（メタデータ） (2020-10-15T14:34:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。