論文の概要: Domain Embeddings for Generating Complex Descriptions of Concepts in
Italian Language
- arxiv url: http://arxiv.org/abs/2402.16632v1
- Date: Mon, 26 Feb 2024 15:04:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-28 20:17:53.654732
- Title: Domain Embeddings for Generating Complex Descriptions of Concepts in
Italian Language
- Title(参考訳): イタリア語における概念記述の複合化のためのドメイン埋め込み
- Authors: Alessandro Maisto
- Abstract要約: 電子辞書から抽出した言語情報と語彙情報に富んだ分布意味資源を提案する。
リソースは21のドメイン固有の行列と1つの包括的なマトリックスとグラフィカルユーザインタフェースから構成される。
本モデルは,具体的概念知識に直接関連した行列を選択することにより,概念の意味的記述の推論を容易にする。
- 参考スコア(独自算出の注目度): 65.268245109828
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In this work, we propose a Distributional Semantic resource enriched with
linguistic and lexical information extracted from electronic dictionaries,
designed to address the challenge of bridging the gap between the continuous
semantic values represented by distributional vectors and the discrete
descriptions offered by general semantics theory. Recently, many researchers
have concentrated on the nexus between embeddings and a comprehensive theory of
semantics and meaning. This often involves decoding the representation of word
meanings in Distributional Models into a set of discrete, manually constructed
properties such as semantic primitives or features, using neural decoding
techniques. Our approach introduces an alternative strategy grounded in
linguistic data. We have developed a collection of domain-specific
co-occurrence matrices, derived from two sources: a classification of Italian
nouns categorized into 4 semantic traits and 20 concrete noun sub-categories,
and a list of Italian verbs classified according to their semantic classes. In
these matrices, the co-occurrence values for each word are calculated
exclusively with a defined set of words pertinent to a particular lexical
domain. The resource comprises 21 domain-specific matrices, one comprehensive
matrix, and a Graphical User Interface. Our model facilitates the generation of
reasoned semantic descriptions of concepts by selecting matrices directly
associated with concrete conceptual knowledge, such as a matrix based on
location nouns and the concept of animal habitats. We assessed the utility of
the resource through two experiments, achieving promising outcomes in both: the
automatic classification of animal nouns and the extraction of animal features.
- Abstract(参考訳): 本研究では,電子辞書から抽出した言語情報と語彙情報に富んだ分散意味資源を提案し,分布ベクトルで表される連続意味値と一般的な意味論理論で表される離散記述とのギャップを埋めることの課題に対処する。
近年、多くの研究者が埋め込みと意味論と意味論の包括的理論の間のネクサスに集中している。
これはしばしば、分散モデルにおける単語の意味の表現を、神経的復号法を用いて、意味的プリミティブや特徴のような、独立した手作業で構築された特性の集合に復号する。
本手法は,言語データに基づく代替戦略を導入する。
我々は,4つの意味的特徴と20の具体的な名詞サブカテゴリに分類されたイタリア語名詞の分類と,それらの意味的クラスに基づいて分類されたイタリア語動詞のリストという,ドメイン固有の共起行列のコレクションを開発した。
これらの行列において、各単語の共起値は、特定の語彙領域に関連する単語の集合でのみ計算される。
リソースは21のドメイン固有の行列と1つの包括的なマトリックスとグラフィカルユーザインタフェースから構成される。
本モデルは,位置名詞に基づくマトリクスや動物生息地の概念など,具体的な概念知識に直接関連するマトリクスを選択することにより,概念の推論された意味記述の生成を促進する。
本研究は,動物名詞の自動分類と動物特徴の抽出という2つの実験を通して資源の有用性を評価し,有望な結果を得た。
関連論文リスト
- How well do distributed representations convey contextual lexical semantics: a Thesis Proposal [3.3585951129432323]
本稿では,現代ニューラルネットワークによる語彙意味の符号化における分散表現の有効性について検討する。
文脈に影響された意味の関連性と類似性に基づいて,曖昧さの4つの源を同定する。
次に、多言語データセットの収集や構築、様々な言語モデルの利用、言語解析ツールの利用により、これらの情報源を評価することを目的とする。
論文 参考訳(メタデータ) (2024-06-02T14:08:51Z) - Contribuci\'on de la sem\'antica combinatoria al desarrollo de
herramientas digitales multiling\"ues [0.0]
本稿では、スペイン語、フランス語、ドイツ語の名詞句における引数パターンの自動生成のための3つのプロトタイプの設計に、コンビニアル・セマンティックスの分野がどのように貢献したかを述べる。
また、外国語の文脈における生産状況において、議論の構文・意味的インターフェースについて知ることが重要であることも示している。
論文 参考訳(メタデータ) (2023-12-26T19:32:05Z) - Agentivit\`a e telicit\`a in GilBERTo: implicazioni cognitive [77.71680953280436]
本研究の目的は,トランスフォーマーに基づくニューラルネットワークモデルが語彙意味論を推論するかどうかを検討することである。
考慮される意味的性質は、テリシティ(定性とも組み合わされる)と作用性である。
論文 参考訳(メタデータ) (2023-07-06T10:52:22Z) - Variational Cross-Graph Reasoning and Adaptive Structured Semantics
Learning for Compositional Temporal Grounding [143.5927158318524]
テンポラルグラウンドティング(Temporal grounding)とは、クエリ文に従って、未編集のビデオから特定のセグメントを特定するタスクである。
新たに構成時間グラウンドタスクを導入し,2つの新しいデータセット分割を構築した。
ビデオや言語に内在する構造的意味論は、構成的一般化を実現する上で重要な要素である、と我々は主張する。
論文 参考訳(メタデータ) (2023-01-22T08:02:23Z) - Monolingual alignment of word senses and definitions in lexicographical
resources [0.0]
この論文の焦点は、辞書、特に辞書のアライメントである。
最初の課題は、2つの異なる単言語辞書における見出しの感覚定義を考慮し、最適なアライメントを見つけることである。
このベンチマークは、単語センスアライメントシステムの評価に使用することができる。
論文 参考訳(メタデータ) (2022-09-06T13:09:52Z) - A bilingual approach to specialised adjectives through word embeddings
in the karstology domain [3.92181732547846]
単語埋め込みを用いた特定の意味関係を表現する形容詞の抽出実験を行う。
実験の結果は徹底的に分析され、形式的または意味的な類似性を示す形容詞のグループに分類される。
論文 参考訳(メタデータ) (2022-03-31T08:27:15Z) - A cognitively driven weighted-entropy model for embedding semantic
categories in hyperbolic geometry [0.0]
双曲幾何学に意味圏を埋め込むための教師なしおよび認知駆動型重み付きエントロピー法を提案する。
以上の結果から,この手法は,英語における基本色と血統語の大部分に対して,人気と類似性のセマンティックな関係をモデル化し,マッピングすることが可能であることが示唆された。
論文 参考訳(メタデータ) (2021-12-13T18:33:45Z) - Decomposing lexical and compositional syntax and semantics with deep
language models [82.81964713263483]
GPT2のような言語変換器の活性化は、音声理解中の脳活動に線形にマップすることが示されている。
本稿では,言語モデルの高次元アクティベーションを,語彙,構成,構文,意味表現の4つのクラスに分類する分類法を提案する。
その結果は2つの結果が浮かび上がった。
まず、構成表現は、語彙よりも広範な皮質ネットワークを募集し、両側の側頭、頭頂、前頭前皮質を包含する。
論文 参考訳(メタデータ) (2021-03-02T10:24:05Z) - Computational linguistic assessment of textbook and online learning
media by means of threshold concepts in business education [59.003956312175795]
言語学的観点では、しきい値の概念は特別な語彙の例であり、特定の言語的特徴を示す。
ビジネス教育における63のしきい値の概念のプロファイルは、教科書、新聞、ウィキペディアで調査されている。
3種類のリソースは、しきい値の概念のプロファイルから区別できる。
論文 参考訳(メタデータ) (2020-08-05T12:56:16Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。