論文の概要: Semantic Relatedness and Taxonomic Word Embeddings
- arxiv url: http://arxiv.org/abs/2002.06235v1
- Date: Fri, 14 Feb 2020 20:02:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 03:38:02.980157
- Title: Semantic Relatedness and Taxonomic Word Embeddings
- Title(参考訳): 意味的関連性と分類学的単語埋め込み
- Authors: Magdalena Kacmajor and John D. Kelleher and Filip Klubicka and Alfredo
Maldonado
- Abstract要約: 意味的関連性には様々な種類があり、異なる語彙表現が異なる関係性の形をコードしていることを示す。
分類学上のランダムウォークによって生成された合成コーパスで訓練された分類学的埋め込みを分析する実験を行った。
本研究では, 天然コーパスと合成コーパスの相対サイズが, 組込み性能に及ぼす影響について検討した。
- 参考スコア(独自算出の注目度): 2.47944699884651
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper connects a series of papers dealing with taxonomic word
embeddings. It begins by noting that there are different types of semantic
relatedness and that different lexical representations encode different forms
of relatedness. A particularly important distinction within semantic
relatedness is that of thematic versus taxonomic relatedness. Next, we present
a number of experiments that analyse taxonomic embeddings that have been
trained on a synthetic corpus that has been generated via a random walk over a
taxonomy. These experiments demonstrate how the properties of the synthetic
corpus, such as the percentage of rare words, are affected by the shape of the
knowledge graph the corpus is generated from. Finally, we explore the
interactions between the relative sizes of natural and synthetic corpora on the
performance of embeddings when taxonomic and thematic embeddings are combined.
- Abstract(参考訳): 本稿では,分類学的な単語埋め込みを扱う一連の論文を関連付ける。
意味的関連性には異なる種類があり、異なる語彙表現は異なる関係性の形式を符号化している点に注意することから始まる。
意味的関連性の中で特に重要な区別は、セマンティックと分類学的関連性である。
次に,分類学上のランダムウォークによって生成された合成コーパス上で訓練された分類学組込みを解析する実験をいくつか紹介する。
これらの実験は、合成コーパスの特性、例えばレアワードの割合が、コーパスが生成する知識グラフの形状によってどのように影響を受けるかを示す。
最後に,自然コーパスと合成コーパスの相対的大きさの相互作用を,分類学と主題的埋め込みが組み合わさった場合の埋め込みのパフォーマンスについて検討する。
関連論文リスト
- Entropy and type-token ratio in gigaword corpora [0.0]
本研究では,英語,スペイン語,トルコ語の6つの大規模言語データセットにおいて,語彙の多様性を示す2つの指標であるエントロピーとテキストトケン比について検討した。
コーパスを横切るエントロピーとテキスト-トケン比の関数的関係が検討されている。
この結果は,テキスト構造の理論的理解に寄与し,自然言語処理などの分野に実践的な意味を与える。
論文 参考訳(メタデータ) (2024-11-15T14:40:59Z) - Estimating the Influence of Sequentially Correlated Literary Properties in Textual Classification: A Data-Centric Hypothesis-Testing Approach [4.161155428666988]
スティロメトリーは、ジャンルやテーマといった要素とは異なる半意識的な選択を反映していると考えられる文学的特徴を分析して著者を区別することを目的としている。
主題的内容など一部の文学的特性は、隣接するテキスト単位間の相関関係として表される可能性が高いが、権威的なスタイルのように、その独立性を持つものもいる。
テキスト分類における逐次相関文学的特性の影響を評価するための仮説検証手法を提案する。
論文 参考訳(メタデータ) (2024-11-07T18:28:40Z) - Data-driven Coreference-based Ontology Building [48.995395445597225]
参照解決は、伝統的に個々の文書理解のコンポーネントとして使用される。
よりグローバルな視点で、すべてのドキュメントレベルのコア参照関係から、ドメインについて何が学べるかを探求します。
コードとともに、クリエイティブ・コモンズライセンスの下でコア参照チェーンをリリースします。
論文 参考訳(メタデータ) (2024-10-22T14:30:40Z) - Agentivit\`a e telicit\`a in GilBERTo: implicazioni cognitive [77.71680953280436]
本研究の目的は,トランスフォーマーに基づくニューラルネットワークモデルが語彙意味論を推論するかどうかを検討することである。
考慮される意味的性質は、テリシティ(定性とも組み合わされる)と作用性である。
論文 参考訳(メタデータ) (2023-07-06T10:52:22Z) - Probing Taxonomic and Thematic Embeddings for Taxonomic Information [2.9874726192215157]
分類学的および主題的関連性をモデル化することは、包括的な自然言語理解を持つAIを構築する上で重要である。
我々は,新しいハイポニム・ハイポニム探索タスクを設計し,分類学およびテーマSGNSとGloVeの埋め込みに関する比較調査を行う。
両種類の埋め込みがいくつかの分類情報をエンコードしていることを示す実験は、エンコーダアーキテクチャと埋め込み訓練データの両方に独立して関係している。
論文 参考訳(メタデータ) (2023-01-25T15:59:26Z) - Relational Sentence Embedding for Flexible Semantic Matching [86.21393054423355]
文埋め込みの可能性を明らかにするための新しいパラダイムとして,文埋め込み(Sentence Embedding, RSE)を提案する。
RSEは文関係のモデル化に有効で柔軟性があり、一連の最先端の埋め込み手法より優れている。
論文 参考訳(メタデータ) (2022-12-17T05:25:17Z) - Quantifying Synthesis and Fusion and their Impact on Machine Translation [79.61874492642691]
自然言語処理(NLP)では、一般に、融合や凝集のような厳密な形態を持つ言語全体をラベル付けする。
本研究では,単語とセグメントレベルで形態型を定量化することにより,そのようなクレームの剛性を低減することを提案する。
本研究では, 英語, ドイツ語, トルコ語の非教師なし・教師付き形態素分割法について検討する一方, 融合ではスペイン語を用いた半自動手法を提案する。
そして、機械翻訳品質と単語(名詞と動詞)における合成・融合の程度との関係を分析する。
論文 参考訳(メタデータ) (2022-05-06T17:04:58Z) - Decomposing lexical and compositional syntax and semantics with deep
language models [82.81964713263483]
GPT2のような言語変換器の活性化は、音声理解中の脳活動に線形にマップすることが示されている。
本稿では,言語モデルの高次元アクティベーションを,語彙,構成,構文,意味表現の4つのクラスに分類する分類法を提案する。
その結果は2つの結果が浮かび上がった。
まず、構成表現は、語彙よりも広範な皮質ネットワークを募集し、両側の側頭、頭頂、前頭前皮質を包含する。
論文 参考訳(メタデータ) (2021-03-02T10:24:05Z) - Comparative Probing of Lexical Semantics Theories for Cognitive
Plausibility and Technological Usefulness [1.028961895672321]
語彙意味論の理論は、単語の意味が推論グラフ、特徴写像、ベクトル空間として表されると主張する点で異なる。
我々は,その認知的妥当性と技術的有用性のレベルについて,様々な語彙意味論を体系的に研究した。
論文 参考訳(メタデータ) (2020-11-16T14:46:08Z) - A Comparative Study on Structural and Semantic Properties of Sentence
Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。
異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。
これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文 参考訳(メタデータ) (2020-09-23T15:45:32Z) - Exploiting Non-Taxonomic Relations for Measuring Semantic Similarity and
Relatedness in WordNet [0.0]
本稿では,WordNetナレッジグラフなどの大規模リンクデータにおいて,あらゆる種類の非トキソノミック関係を利用する利点について検討する。
本稿では,新しい関係に基づく情報内容と非タキソノミックな重み付き経路に基づく総合的多関係手法を提案する。
論文 参考訳(メタデータ) (2020-06-22T09:59:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。