論文の概要: Topological Data Analysis for Word Sense Disambiguation
- arxiv url: http://arxiv.org/abs/2203.00565v1
- Date: Tue, 1 Mar 2022 15:41:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-02 14:55:44.513967
- Title: Topological Data Analysis for Word Sense Disambiguation
- Title(参考訳): 単語センスの曖昧さに関するトポロジ的データ解析
- Authors: Michael Rawson, Samuel Dooley, Mithun Bharadwaj, and Rishabh Choudhary
- Abstract要約: 我々は,単語知覚誘導と曖昧化のための新しい教師なしアルゴリズムを開発し,検証する。
提案手法は,単語知覚誘導タスクのためのクラスタのよりリッチな概念化を提供するトポロジの分野における高度な数学的概念に依存している。
このことは、自然言語処理のためのトポロジカルアルゴリズムの約束を示し、この将来的な領域における今後の研究を提唱する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop and test a novel unsupervised algorithm for word sense induction
and disambiguation which uses topological data analysis. Typical approaches to
the problem involve clustering, based on simple low level features of distance
in word embeddings. Our approach relies on advanced mathematical concepts in
the field of topology which provides a richer conceptualization of clusters for
the word sense induction tasks. We use a persistent homology barcode algorithm
on the SemCor dataset and demonstrate that our approach gives low relative
error on word sense induction. This shows the promise of topological algorithms
for natural language processing and we advocate for future work in this
promising area.
- Abstract(参考訳): 我々は、トポロジカルデータ解析を用いた単語知覚誘導・曖昧化のための新しい教師なしアルゴリズムを開発し、検証する。
この問題に対する典型的なアプローチは、単語埋め込みにおける距離の単純な低レベル特徴に基づくクラスタリングである。
本手法は,単語感覚誘導タスクのためのクラスタのよりリッチな概念化を提供するトポロジーの分野における高度な数学的概念に依拠する。
我々は, semcorデータセット上の持続的ホモロジーバーコードアルゴリズムを用いて, この手法が単語感覚誘導に低い相対誤差を与えることを示す。
これは自然言語処理におけるトポロジカルアルゴリズムの有望さを示し、この有望な分野における今後の研究を提唱する。
関連論文リスト
- Topograph: An efficient Graph-Based Framework for Strictly Topology Preserving Image Segmentation [78.54656076915565]
位相的正しさは多くの画像分割タスクにおいて重要な役割を果たす。
ほとんどのネットワークは、Diceのようなピクセル単位の損失関数を使って、トポロジカルな精度を無視して訓練されている。
トポロジ的に正確な画像セグメンテーションのための新しいグラフベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-05T16:20:14Z) - Graph-Boosted Attentive Network for Semantic Body Parsing [1.4042211166197214]
本稿では,制約のない環境下で複数の人体を意味部分領域に分解する手法を提案する。
本稿では,特徴階層にまたがる新しい意味的・輪郭的注意機構を備えた畳み込みニューラルネットワークアーキテクチャを提案する。
提案手法は,Pascal Person-Partデータセットの最先端化を実現する。
論文 参考訳(メタデータ) (2024-07-08T13:32:01Z) - Word Sense Induction with Hierarchical Clustering and Mutual Information
Maximization [14.997937028599255]
単語知覚誘導は自然言語処理において難しい問題である。
階層的クラスタリングと不変情報クラスタリングに基づく新しい教師なし手法を提案する。
我々は、ある場合において、我々のアプローチが先行したWSIの最先端手法よりも優れていることを実証的に実証した。
論文 参考訳(メタデータ) (2022-10-11T13:04:06Z) - Fine-Grained Visual Entailment [51.66881737644983]
そこで本稿では,テキストから画像への微粒な知識要素の論理的関係を予測することを目的として,このタスクの拡張を提案する。
従来の研究とは異なり、本手法は本質的に説明可能であり、異なるレベルの粒度で論理的予測を行う。
本手法は,手動でアノテートした知識要素のデータセットを用いて評価し,この課題に対して68.18%の精度を達成できることを示す。
論文 参考訳(メタデータ) (2022-03-29T16:09:38Z) - Semantic Search for Large Scale Clinical Ontologies [63.71950996116403]
本稿では,大規模臨床語彙検索システムを構築するための深層学習手法を提案する。
本稿では,意味学習データに基づくトレーニングデータを生成するTriplet-BERTモデルを提案する。
このモデルは,5つの実ベンチマークデータセットを用いて評価され,提案手法は自由テキストから概念,概念まで,概念語彙の検索において高い結果が得られることを示す。
論文 参考訳(メタデータ) (2022-01-01T05:15:42Z) - Large Scale Substitution-based Word Sense Induction [48.49573297876054]
本稿では,事前学習されたマスキング言語モデル(MLM)に基づく単語センス誘導手法を提案する。
その結果、コーパス由来の感覚インベントリに基づいて感覚タグ付けされ、各感覚が指示語に関連付けられているコーパスとなる。
本手法を用いた英語ウィキペディアの評価では,Babelfy などの WSD 手法と比較しても,誘導された感覚とインスタンスごとの感覚代入の両方が高品質であることがわかった。
論文 参考訳(メタデータ) (2021-10-14T19:40:37Z) - Learning the Implicit Semantic Representation on Graph-Structured Data [57.670106959061634]
グラフ畳み込みネットワークにおける既存の表現学習手法は主に、各ノードの近傍を知覚全体として記述することで設計される。
本稿では,グラフの潜在意味パスを学習することで暗黙的な意味を探索する意味グラフ畳み込みネットワーク(sgcn)を提案する。
論文 参考訳(メタデータ) (2021-01-16T16:18:43Z) - A Novel Word Sense Disambiguation Approach Using WordNet Knowledge Graph [0.0]
本稿では,SCSMM (Sequential Contextual Likeity Matrix multiplication) という知識に基づく単語感覚解読アルゴリズムを提案する。
SCSMMアルゴリズムは、セマンティックな類似性、知識、文書コンテキストを組み合わせて、それぞれローカルコンテキストのメリットを利用する。
提案されたアルゴリズムは、金の標準データセットの名詞を曖昧にするときに他のアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2021-01-08T06:47:32Z) - Argumentative Topology: Finding Loop(holes) in Logic [3.977669302067367]
トポロジカルワード埋め込みは力学系解析とデータ駆動形状抽出に数学的手法を用いる。
トポロジカル遅延埋め込みを用いることで、異なる形状の論理概念をキャプチャして抽出できることが示される。
論文 参考訳(メタデータ) (2020-11-17T21:23:58Z) - Semi-Supervised Learning with Meta-Gradient [123.26748223837802]
半教師付き学習における簡単なメタ学習アルゴリズムを提案する。
その結果,提案アルゴリズムは最先端の手法に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2020-07-08T08:48:56Z) - Ontology-based Interpretable Machine Learning for Textual Data [35.01650633374998]
本稿では,予測モデルを説明するためのサンプリング手法に基づいて,解釈可能なモデルを学習する新しい解釈フレームワークを提案する。
説明のために探索空間を狭めるために,学習可能なアンカーアルゴリズムを設計する。
さらに、学習された解釈可能な表現とアンカーを組み合わせることで、理解可能な説明を生成する一連の規則が導入された。
論文 参考訳(メタデータ) (2020-04-01T02:51:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。