論文の概要: Geometry of Semantic Space: Comparative Study of Discrete and Continuous Models
- arxiv url: http://arxiv.org/abs/2606.07183v1
- Date: Fri, 05 Jun 2026 11:47:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.719779
- Title: Geometry of Semantic Space: Comparative Study of Discrete and Continuous Models
- Title(参考訳): 意味空間の幾何学:離散モデルと連続モデルの比較研究
- Authors: Gabriel Bounias, Sabine Ploux,
- Abstract要約: 教師付きベクトル埋め込みと、より直接的に意味関係を符号化する語彙共起グラフを比較する。
対照的に、グラフベースのモデルは、より明確で、より人間的に読みやすい意味の組織を明らかにする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work examines the semantic geometry underlying NLP models. We compare supervised vector embeddings, such as CamemBERT, with lexical co-occurrence graphs that encode semantic relations more directly. While transformer-based embeddings achieve strong performance, their induced geometries often display unsatisfactory distributions. In contrast, graph-based models reveal a clearer and more human-readable organization of meaning. We have implemented a methodology that allows us to perform a comparative analysis either based on the structure of the graphs or based on the topology of the embeddings induced by these two approaches. The results of the comparison -- applied to the French "Great National Debate" corpus a collection of citizen contributions to the public debate -- show a similar local topology but a very different overall structure and topology. Theses findings suggest complementary perspectives between deep supervised models and graph-based models, considering a new pathway to guide neural architectures toward more stable and interpretable convergence with graphs structures.
- Abstract(参考訳): 本研究はNLPモデルの基礎となる意味幾何学について考察する。
我々は、CamemBERTのような教師付きベクトル埋め込みを、意味関係をより直接的にエンコードする語彙共起グラフと比較する。
変換器をベースとした埋め込みは高い性能を達成するが、誘導されたジオメトリーはしばしば不満足な分布を示す。
対照的に、グラフベースのモデルは、より明確で、より人間的に読みやすい意味の組織を明らかにする。
我々は,グラフの構造に基づいて,あるいはこれらの2つのアプローチによって誘導される埋め込みのトポロジに基づいて比較分析を行う手法を実装した。
比較の結果は、フランスの「グレート・ナショナル・ディベート」コーパスに公共の議論に対する市民の貢献を集めたもので、類似した地域トポロジであるが、全体構造とトポロジは全く異なる。
これらの結果は、より安定かつ解釈可能なグラフ構造との収束に向けて神経アーキテクチャを導く新しい経路を考えることにより、深い教師付きモデルとグラフベースモデルとの相補的な視点を示唆している。
関連論文リスト
- TopoAlign: Topology-Aware Visual Representation Alignment [18.80110544625249]
TopoAlignは、構造の観点からモデル表現を視覚的に比較するためのフレームワークである。
TopoAlignは、トポロジカルな視点から表現構造とアライメントについて有意義な洞察を提供する。
論文 参考訳(メタデータ) (2026-05-25T07:58:26Z) - Weisfeiler and Lehman Go Paths: Learning Topological Features via Path Complexes [4.23480641508611]
グラフニューラルネットワーク(GNN)は理論上、1-Weisfeiler-Lehmanテストによって拘束される。
本研究では, トポロジ的メッセージパッシング過程において, グラフ内の単純な経路に着目し, 新たな視点を示す。
論文 参考訳(メタデータ) (2023-08-13T19:45:20Z) - On the Expressivity of Persistent Homology in Graph Learning [13.608942872770855]
計算トポロジのテクニックである永続化ホモロジーは、最近、グラフ分類の文脈において、強い経験的性能を示した。
本稿では、グラフの文脈における永続的ホモロジーの簡単な紹介と、グラフ学習タスクにおけるその表現性に関する理論的議論と実証分析について述べる。
論文 参考訳(メタデータ) (2023-02-20T08:19:19Z) - Geometry Contrastive Learning on Heterogeneous Graphs [50.58523799455101]
本稿では,幾何学コントラスト学習(Geometry Contrastive Learning, GCL)と呼ばれる,新しい自己指導型学習手法を提案する。
GCLはユークリッドと双曲的な視点からヘテロジニアスグラフを同時に見ることができ、リッチな意味論と複雑な構造をモデル化する能力の強い融合を目指している。
4つのベンチマークデータセットの大規模な実験は、提案手法が強いベースラインよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-25T03:54:53Z) - Learning Gaussian Graphical Models with Latent Confounders [74.72998362041088]
我々は、グラフィカルモデルにおける推論のための2つの戦略を、潜伏した共同創設者と比較し、対比する。
これら2つのアプローチは、類似した目標を持っているが、それらは共起に関する異なる仮定によって動機付けられている。
これら2つのアプローチの強みを組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2021-05-14T00:53:03Z) - High-order Semantic Role Labeling [86.29371274587146]
本稿では,ニューラルセマンティックロールラベリングモデルのための高階グラフ構造を提案する。
これにより、モデルは孤立述語-引数対だけでなく、述語-引数対間の相互作用も明示的に考慮することができる。
CoNLL-2009ベンチマークの7つの言語に対する実験結果から、高次構造学習技術は強力なSRLモデルに有益であることが示された。
論文 参考訳(メタデータ) (2020-10-09T15:33:54Z) - Structural Landmarking and Interaction Modelling: on Resolution Dilemmas
in Graph Classification [50.83222170524406]
解法ジレンマの統一概念に基づくグラフ分類における本質的難易度の研究」
構造ランドマークと相互作用モデリングのためのインダクティブニューラルネットワークモデルSLIM'を提案する。
論文 参考訳(メタデータ) (2020-06-29T01:01:42Z) - Embedding Graph Auto-Encoder for Graph Clustering [90.8576971748142]
グラフ自動エンコーダ(GAE)モデルは、半教師付きグラフ畳み込みネットワーク(GCN)に基づく
我々は、グラフクラスタリングのための特定のGAEベースのモデルを設計し、その理論、すなわち、埋め込みグラフオートエンコーダ(EGAE)と整合する。
EGAEは1つのエンコーダと2つのデコーダで構成される。
論文 参考訳(メタデータ) (2020-02-20T09:53:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。