論文の概要: Sense disambiguation of compound constituents
- arxiv url: http://arxiv.org/abs/2204.00429v1
- Date: Fri, 1 Apr 2022 13:33:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-04 18:10:10.667924
- Title: Sense disambiguation of compound constituents
- Title(参考訳): 化合物成分のセンスの曖昧化
- Authors: Carlo Schackow, Stefan Conrad and Ingo Plag
- Abstract要約: 名詞-名詞化合物の意味の分布的意味論では、構成的多節語の役割は、ほとんど未適応のままである。
成分の異なる意味を平均化する意味的ベクトルの代わりに、これらのより特定の構成的意味が化合物全体の意味に何をもたらすかを確認するために、成分の曖昧なベクトルが必要である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In distributional semantic accounts of the meaning of noun-noun compounds
(e.g. starfish, bank account, houseboat) the important role of constituent
polysemy remains largely unaddressed(cf. the meaning of star in starfish vs.
star cluster vs. star athlete). Instead of semantic vectors that average over
the different meanings of a constituent, disambiguated vectors of the
constituents would be needed in order to see what these more specific
constituent meanings contribute to the meaning of the compound as a whole. This
paper presents a novel approach to this specific problem of word sense
disambiguation: set expansion. We build on the approach developed by Mahabal et
al. (2018) which was originally designed to solve the analogy problem. We
modified their method in such a way that it can address the problem of sense
disambiguation of compound constituents. The results of experiments with a data
set of almost 9000 compounds (LADEC, Gagn\'e et al. 2019) suggest that this
approach is successful, yet the success is sensitive to the frequency with
which the compounds are attested.
- Abstract(参考訳): 分布論的意味論では、名詞-名詞化合物の意味(例えば、starfish、bank account、houseboat)において、構成的ポリセミーの重要な役割は、ほとんど役に立たない(cf. starfish vs. star cluster vs. star athlete)。
成分の異なる意味を平均化する意味的ベクトルの代わりに、これらのより特定の構成的意味が化合物全体の意味に何をもたらすかを確認するために、成分の曖昧なベクトルが必要である。
本稿では,この単語感覚の曖昧さという問題に対する新しいアプローチを提案する。
mahabal et al. (2018) によって開発されたアプローチに基づいており、これは元々アナロジー問題を解くために設計されたものである。
我々はそれらの手法を複合成分の曖昧さを解消する問題に対処するように修正した。
約9000の化合物からなるデータセット(LADEC, Gagn\'e et al. 2019)による実験の結果、このアプローチは成功しているが、その成功は化合物が証明される頻度に敏感である。
関連論文リスト
- Measuring Meaning Composition in the Human Brain with Composition Scores from Large Language Models [53.840982361119565]
コンポジションスコアは、文理解中に意味合成の度合いを定量化するために設計された、新しいモデルに基づく計量である。
実験結果から, 単語の頻度, 構造処理, 単語に対する一般感性に関連する脳クラスタとの関連が示唆された。
論文 参考訳(メタデータ) (2024-03-07T08:44:42Z) - DepNeCTI: Dependency-based Nested Compound Type Identification for
Sanskrit [7.04795623262177]
本研究はネスト化合物型同定(NeCTI)の新たな課題を紹介する。
マルチコンポーネント化合物のネストしたスパンを特定し、それら間の暗黙的な意味関係をデコードすることを目的としている。
我々の知る限りでは、これはこの課題を提案する語彙意味論の分野における最初の試みである。
論文 参考訳(メタデータ) (2023-10-14T06:11:53Z) - Stepwise functional refoundation of relational concept analysis [0.0]
概念分析 (RCA) は、いくつかの関連するコンテキストを同時に扱うことができる形式的概念解析の拡張である。
RCAは単一の概念格子を返しますが、データに円形の依存関係がある場合、他のソリューションは許容できると考えられます。
我々はRCAが許容できる解の集合の最小要素を返すことを示す。
論文 参考訳(メタデータ) (2023-10-10T09:13:46Z) - How Do Transformers Learn Topic Structure: Towards a Mechanistic
Understanding [56.222097640468306]
我々は、トランスフォーマーが「意味構造」を学ぶ方法の機械的理解を提供する
数学的解析とウィキペディアデータの実験を組み合わせることで、埋め込み層と自己保持層がトピック構造をエンコードしていることを示す。
論文 参考訳(メタデータ) (2023-03-07T21:42:17Z) - Are Representations Built from the Ground Up? An Empirical Examination
of Local Composition in Language Models [91.3755431537592]
構成的・非構成的句を表現することは言語理解にとって重要である。
まず,より長いフレーズのLM-内部表現を,その構成成分から予測する問題を定式化する。
意味的構成性の人間の判断と相関する予測精度を期待するが、大部分はそうではない。
論文 参考訳(メタデータ) (2022-10-07T14:21:30Z) - RAW-C: Relatedness of Ambiguous Words--in Context (A New Lexical
Resource for English) [2.792030485253753]
文脈的埋め込みが単語の意味の連続的、動的性質にどの程度適合しているかを評価する。
我々は、コサイン距離が、人間が同じ単語の感覚をいかに利用しているかを体系的に過小評価していることを示す。
本稿では,精神語彙の心理言語学理論と語彙意味論の計算モデルとの合成を提案する。
論文 参考訳(メタデータ) (2021-05-27T16:07:13Z) - An Iterative Contextualization Algorithm with Second-Order Attention [0.40611352512781856]
文を構成する単語の表現をまとまりのある全体にまとめる方法について説明します。
私たちのアルゴリズムは、おそらくコンテキストの誤った値から始まり、手元のトークンに関してこの値を調整します。
私たちのモデルは、よく知られたテキスト分類タスクで強い結果を報告します。
論文 参考訳(メタデータ) (2021-03-03T05:34:50Z) - Topology of Word Embeddings: Singularities Reflect Polysemy [68.8204255655161]
本稿では,単語の意味の実際の数とよく相関する,永続的ホモロジーに基づく多意味性のトポロジカル尺度を提案する。
本稿では,SemEval-2010における単語センスの誘導と曖昧さに対する単純なトポロジ的な解決法を提案する。
論文 参考訳(メタデータ) (2020-11-18T17:21:51Z) - Informational Space of Meaning for Scientific Texts [68.8204255655161]
本稿では,単語の意味を,テキストが属する対象カテゴリに関する相対情報ゲイン(RIG)のベクトルで表現する意味空間を紹介する。
Leicester Scientific Corpus (LSC) と Leicester Scientific Dictionary-Core (LScDC) に基づく意味空間の構築に本手法を適用した。
RIGに基づく提案モデルでは,カテゴリ内の話題特化語を際立たせる能力があることが示されている。
論文 参考訳(メタデータ) (2020-04-28T14:26:12Z) - Human Correspondence Consensus for 3D Object Semantic Understanding [56.34297279246823]
本稿では,CorresPondenceNetという新しいデータセットを提案する。
このデータセットに基づいて、新しい測地的整合性損失を伴う密接なセマンティック埋め込みを学習することができる。
CorresPondenceNetは異種オブジェクトの細粒度理解を促進できるだけでなく、クロスオブジェクト登録や部分オブジェクトマッチングも実現できた。
論文 参考訳(メタデータ) (2019-12-29T04:24:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。