論文の概要: Interval Probabilistic Fuzzy WordNet
- arxiv url: http://arxiv.org/abs/2104.10660v1
- Date: Sun, 4 Apr 2021 17:28:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-05 08:34:42.945036
- Title: Interval Probabilistic Fuzzy WordNet
- Title(参考訳): 区間確率的ファジィワードネット
- Authors: Yousef Alizadeh-Q, Behrouz Minaei-Bidgoli, Sayyed-Ali Hossayni,
Mohammad-R Akbarzadeh-T, Diego Reforgiato Recupero, Mohammad-Reza Rajati,
Aldo Gangemi
- Abstract要約: 本稿では,任意の言語でIPF(Interval Probabilistic Fuzzy)シンセサイザーを構築するアルゴリズムを提案する。
我々は、英語のためのWordNetのIPFシンセセットを構築し、公開した。
- 参考スコア(独自算出の注目度): 8.396691008449704
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: WordNet lexical-database groups English words into sets of synonyms called
"synsets." Synsets are utilized for several applications in the field of
text-mining. However, they were also open to criticism because although, in
reality, not all the members of a synset represent the meaning of that synset
with the same degree, in practice, they are considered as members of the
synset, identically. Thus, the fuzzy version of synsets, called fuzzy-synsets
(or fuzzy word-sense classes) were proposed and studied. In this study, we
discuss why (type-1) fuzzy synsets (T1 F-synsets) do not properly model the
membership uncertainty, and propose an upgraded version of fuzzy synsets in
which membership degrees of word-senses are represented by intervals, similar
to what in Interval Type 2 Fuzzy Sets (IT2 FS) and discuss that IT2 FS
theoretical framework is insufficient for analysis and design of such synsets,
and propose a new concept, called Interval Probabilistic Fuzzy (IPF) sets. Then
we present an algorithm for constructing the IPF synsets in any language, given
a corpus and a word-sense-disambiguation system. Utilizing our algorithm and
the open-American-online-corpus (OANC) and UKB word-sense-disambiguation, we
constructed and published the IPF synsets of WordNet for English language.
- Abstract(参考訳): wordnet lexical-database は英語の単語を "synsets" と呼ばれる同義語の集合に分類する。
synsetsはテキストマイニングの分野でいくつかのアプリケーションで利用されている。
しかし、実際には、シンセットの全てのメンバーが同じ程度にそのシンセットの意味を表わしているわけではないが、実際には、それらは同じ意味でシンセットのメンバーと見なされているため、批判も開かれた。
そこで、ファジィシンセット(fuzzy-synsets)と呼ばれるファジィバージョンのシンセットを提案し、研究した。
本研究では, (type-1) fuzzy Synsets (T1 F-synsets) がメンバシップの不確かさを適切にモデル化しない理由を論じ, 単語センスのメンバシップ度が間隔で表されるようなファジィシンセットのアップグレード版を提案し, それらのシンセットの分析と設計には IT2 FS 理論フレームワークが不十分であることを示すとともに, 新しい概念である Interval Probabilistic Fuzzy Set (IPF) を提案する。
次に、コーパスと単語センスの曖昧さを考慮し、任意の言語でIPFシンセセットを構築するアルゴリズムを提案する。
このアルゴリズムとopen-american-online-corpus (oanc) とukb word-sense-disambiguationを用いて,wordnetのipf合成を英語用に構築し,公開している。
関連論文リスト
- Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - A Benchmark and Scoring Algorithm for Enriching Arabic Synonyms [0.0]
モノ/マルチリンガルシンセットとしきい値(ファジィ値[0-1])が与えられた場合、我々のゴールは既存のレキシコンからこのしきい値の上に新しい同義語を抽出することである。
データセットは500シンセットの3K候補シノニムで構成されている。
評価の結果,アルゴリズムは言語学者のように振る舞うことができ,ファジィ値は言語学者が提案したものに近いことがわかった。
論文 参考訳(メタデータ) (2023-02-04T20:30:32Z) - PropSegmEnt: A Large-Scale Corpus for Proposition-Level Segmentation and
Entailment Recognition [63.51569687229681]
文中の各命題の文的含意関係を個別に認識する必要性について論じる。
提案するPropSegmEntは45K以上の提案のコーパスであり, 専門家によるアノテートを行う。
我々のデータセット構造は、(1)文書内の文章を命題の集合に分割し、(2)異なるが、トポジカルに整合した文書に対して、各命題の含意関係を分類するタスクに類似している。
論文 参考訳(メタデータ) (2022-12-21T04:03:33Z) - Latent Topology Induction for Understanding Contextualized
Representations [84.7918739062235]
本研究では,文脈的埋め込みの表現空間について検討し,大規模言語モデルの隠れトポロジについて考察する。
文脈化表現の言語特性を要約した潜在状態のネットワークが存在することを示す。
論文 参考訳(メタデータ) (2022-06-03T11:22:48Z) - FastKASSIM: A Fast Tree Kernel-Based Syntactic Similarity Metric [48.66580267438049]
我々は,発話レベルと文書レベルの構文的類似性の指標であるFastKASSIMを提案する。
ツリーカーネルに基づいたドキュメントのペア間で、最も類似した依存関係解析ツリーをペア化し、平均化する。
r/ChangeMyViewコーパス内のドキュメントのベースラインメソッドよりも最大5.2倍高速に動作します。
論文 参考訳(メタデータ) (2022-03-15T22:33:26Z) - Cross-linguistically Consistent Semantic and Syntactic Annotation of Child-directed Speech [27.657676278734534]
本稿では,子指向音声のこのようなコーパスを,感性論理形式と組み合わせて構築する手法を提案する。
このアプローチは言語間一貫した表現を強制し、依存関係表現とセマンティック解析の最近の進歩に基づいている。
論文 参考訳(メタデータ) (2021-09-22T18:17:06Z) - Syntactic representation learning for neural network based TTS with
syntactic parse tree traversal [49.05471750563229]
本稿では,構文解析木に基づく構文表現学習手法を提案し,構文構造情報を自動的に活用する。
実験の結果,提案手法の有効性が示された。
複数の構文解析木を持つ文では、合成音声から韻律的差異が明確に認識される。
論文 参考訳(メタデータ) (2020-12-13T05:52:07Z) - SynSetExpan: An Iterative Framework for Joint Entity Set Expansion and
Synonym Discovery [66.24624547470175]
SynSetExpanは2つのタスクを相互に拡張できる新しいフレームワークである。
クラウドソーシングによる最初の大規模Synonym-Enhanced Set Expansionデータセットを作成する。
SE2データセットと以前のベンチマークの実験では、エンティティセットの拡張と同義語発見タスクの両方においてSynSetExpanの有効性が示されている。
論文 参考訳(メタデータ) (2020-09-29T07:32:17Z) - An Algorithm for Fuzzification of WordNets, Supported by a Mathematical
Proof [3.684688928766659]
任意の言語のWLDのファジィバージョンを構築するアルゴリズムを提案する。
英語WordNet(FWN)のファジフィケーション版をオンラインで公開する。
論文 参考訳(メタデータ) (2020-06-07T04:47:40Z) - Dense Embeddings Preserving the Semantic Relationships in WordNet [2.9443230571766854]
WordNetにおける名詞と動詞の合成のための低次元ベクトル埋め込みを生成する新しい方法を提案する。
これをSense Spectrum(および埋め込みのためのSense Spectra)と呼ぶ。
感性スペクトルの学習に適したラベルを作成するために,WordNetにおける名詞と動詞の合成のための新しい類似度尺度を考案した。
論文 参考訳(メタデータ) (2020-04-22T21:09:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。