論文の概要: A Novel Method of Extracting Topological Features from Word Embeddings
- arxiv url: http://arxiv.org/abs/2003.13074v2
- Date: Sun, 19 Apr 2020 21:56:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 13:05:34.041717
- Title: A Novel Method of Extracting Topological Features from Word Embeddings
- Title(参考訳): 単語埋め込みから位相的特徴を抽出する新しい方法
- Authors: Shafie Gholizadeh, Armin Seyeditabari and Wlodek Zadrozny
- Abstract要約: テキストの単語埋め込み表現からトポロジ的特徴を抽出する新しいアルゴリズムを提案する。
定義したトポロジ的特徴が従来のテキストマイニング機能より優れていることを示す。
- 参考スコア(独自算出の注目度): 2.4063592468412267
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, topological data analysis has been utilized for a wide range
of problems to deal with high dimensional noisy data. While text
representations are often high dimensional and noisy, there are only a few work
on the application of topological data analysis in natural language processing.
In this paper, we introduce a novel algorithm to extract topological features
from word embedding representation of text that can be used for text
classification. Working on word embeddings, topological data analysis can
interpret the embedding high-dimensional space and discover the relations among
different embedding dimensions. We will use persistent homology, the most
commonly tool from topological data analysis, for our experiment. Examining our
topological algorithm on long textual documents, we will show our defined
topological features may outperform conventional text mining features.
- Abstract(参考訳): 近年,高次元雑音データを扱うために,多種多様な問題に対してトポロジカルデータ解析が用いられている。
テキスト表現は高次元でノイズが多いことが多いが、自然言語処理におけるトポロジカルデータ分析の適用についての研究は少ない。
本稿では,テキスト分類に使用できるテキストの単語埋め込み表現から位相的特徴を抽出する新しいアルゴリズムを提案する。
単語埋め込みに取り組んでいるトポロジカルデータ解析は、埋め込み高次元空間を解釈し、異なる埋め込み次元間の関係を発見することができる。
実験には、トポロジデータ解析の最も一般的なツールである永続的ホモロジーを使用します。
長文文書上でのトポロジ的アルゴリズムから,定義したトポロジ的特徴が従来のテキストマイニング的特徴より優れていることを示す。
関連論文リスト
- Topograph: An efficient Graph-Based Framework for Strictly Topology Preserving Image Segmentation [78.54656076915565]
位相的正しさは多くの画像分割タスクにおいて重要な役割を果たす。
ほとんどのネットワークは、Diceのようなピクセル単位の損失関数を使って、トポロジカルな精度を無視して訓練されている。
トポロジ的に正確な画像セグメンテーションのための新しいグラフベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-05T16:20:14Z) - Ontology Embedding: A Survey of Methods, Applications and Resources [54.3453925775069]
オントロジはドメイン知識とメタデータを表現するために広く使われている。
1つの簡単な解決策は、統計分析と機械学習を統合することである。
埋め込みに関する多くの論文が出版されているが、体系的なレビューの欠如により、研究者はこの分野の包括的な理解を妨げている。
論文 参考訳(メタデータ) (2024-06-16T14:49:19Z) - Linguistics from a topological viewpoint [2.4238741865874363]
本稿では,南アメリカの言語のトポロジカルな形状を解析するためのワークフローについて述べる。
その結果、データの明確な可視化は困難である。
論文 参考訳(メタデータ) (2024-03-16T23:10:42Z) - Topological Learning in Multi-Class Data Sets [0.3050152425444477]
フィードフォワードディープニューラルネットワーク(DNN)の学習におけるトポロジカル複雑度の影響について検討する。
我々は,複数の構築およびオープンソースデータセットに対するトポロジ的分類アルゴリズムの評価を行った。
論文 参考訳(メタデータ) (2023-01-23T21:54:25Z) - Rethinking Persistent Homology for Visual Recognition [27.625893409863295]
本稿では,様々な訓練シナリオにおける画像分類におけるトポロジ的特性の有効性を詳細に分析する。
例えば、小さなデータセット上で単純なネットワークをトレーニングするなど、トポロジ的特徴から最も恩恵を受けるシナリオを特定します。
論文 参考訳(メタデータ) (2022-07-09T08:01:11Z) - Hierarchical Heterogeneous Graph Representation Learning for Short Text
Classification [60.233529926965836]
短文分類のためのグラフニューラルネットワーク(GNN)に基づく ShiNE と呼ばれる新しい手法を提案する。
まず,短文データセットを単語レベル成分グラフからなる階層的不均一グラフとしてモデル化する。
そして、類似した短いテキスト間の効果的なラベル伝搬を容易にするショート文書グラフを動的に学習する。
論文 参考訳(メタデータ) (2021-10-30T05:33:05Z) - Artificial Text Detection via Examining the Topology of Attention Maps [58.46367297712477]
トポロジカルデータ分析(TDA)に基づく3種類の解釈可能なトポロジカル特徴を提案する。
BERTモデルから派生した特徴が3つの共通データセットにおいて、カウントベースとニューラルベースベースラインを最大10%上回っていることを実証的に示す。
特徴の探索解析は表面に対する感度と構文的性質を明らかにしている。
論文 参考訳(メタデータ) (2021-09-10T12:13:45Z) - Argumentative Topology: Finding Loop(holes) in Logic [3.977669302067367]
トポロジカルワード埋め込みは力学系解析とデータ駆動形状抽出に数学的手法を用いる。
トポロジカル遅延埋め込みを用いることで、異なる形状の論理概念をキャプチャして抽出できることが示される。
論文 参考訳(メタデータ) (2020-11-17T21:23:58Z) - A Survey of Embedding Space Alignment Methods for Language and Knowledge
Graphs [77.34726150561087]
単語,文,知識グラフの埋め込みアルゴリズムに関する現在の研究状況について調査する。
本稿では、関連するアライメント手法の分類と、この研究分野で使用されるベンチマークデータセットについて論じる。
論文 参考訳(メタデータ) (2020-10-26T16:08:13Z) - A Comparative Study on Structural and Semantic Properties of Sentence
Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。
異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。
これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文 参考訳(メタデータ) (2020-09-23T15:45:32Z) - Topological Data Analysis in Text Classification: Extracting Features
with Additive Information [2.1410799064827226]
位相データ解析は高次元数値データに適用することが困難である。
トポロジカルな特徴は、従来のテキストマイニングでは捉えられていない独占的な情報を持っている。
アンサンブルモデルにおける従来の特徴に位相的特徴を加えることで、分類結果が改善される。
論文 参考訳(メタデータ) (2020-03-29T21:02:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。