論文の概要: Finding Meaning in Embeddings: Concept Separation Curves
- arxiv url: http://arxiv.org/abs/2604.21555v1
- Date: Thu, 23 Apr 2026 11:29:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.4631
- Title: Finding Meaning in Embeddings: Concept Separation Curves
- Title(参考訳): 埋め込みにおける意味の発見:概念分離曲線
- Authors: Paul Keuren, Marc Ponsen, Robert Ayoub Bagheri,
- Abstract要約: 文埋め込み技術は、文の意味のキー概念をベクトル空間にエンコードすることを目的としている。
文の埋め込み品質の評価手法の大半は、追加の分類器や下流タスクの利用に依存している。
文レベルの概念をキャプチャする上での文埋め込み手法の有効性を評価するための新しい手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sentence embedding techniques aim to encode key concepts of a sentence's meaning in a vector space. However, the majority of evaluation approaches for sentence embedding quality rely on the use of additional classifiers or downstream tasks. These additional components make it unclear whether good results stem from the embedding itself or from the classifier's behaviour. In this paper, we propose a novel method for evaluating the effectiveness of sentence embedding methods in capturing sentence-level concepts. Our approach is classifier-independent, allowing for an objective assessment of the model's performance. The approach adopted in this study involves the systematic introduction of syntactic noise and semantic negations into sentences, with the subsequent quantification of their relative effects on the resulting embeddings. The visualisation of these effects is facilitated by Concept Separation Curves, which show the model's capacity to differentiate between conceptual and surface-level variations. By leveraging data from multiple domains, employing both Dutch and English languages, and examining sentence lengths, this study offers a compelling demonstration that Concept Separation Curves provide an interpretable, reproducible, and cross-model approach for evaluating the conceptual stability of sentence embeddings.
- Abstract(参考訳): 文埋め込み技術は、文の意味のキー概念をベクトル空間にエンコードすることを目的としている。
しかし、文の埋め込み品質の評価手法の大半は、追加の分類器や下流タスクの利用に依存している。
これらの追加コンポーネントは、良い結果が埋め込み自体によるものなのか、それとも分類器の振る舞いによるものなのかを明確にする。
本稿では,文レベルの概念をキャプチャする上での文埋め込み手法の有効性を評価するための新しい手法を提案する。
我々のアプローチは分類器非依存であり、モデルの性能を客観的に評価することができる。
本研究で採用されるアプローチは、構文ノイズと意味否定を文に体系的に導入することであり、その結果として生じる埋め込みに対する相対的な影響の定量化である。
これらの効果の可視化は、概念分離曲線によって促進され、モデルが概念レベルと表面レベルの違いを区別する能力を示す。
本研究は、複数のドメインからのデータを活用し、オランダ語と英語を併用し、文長を調べることによって、概念分離曲線が文埋め込みの概念的安定性を評価するための解釈可能、再現可能、およびクロスモデルアプローチを提供することを示す。
関連論文リスト
- Studying Classifier(-Free) Guidance From a Classifier-Centric Perspective [100.54185280153753]
分類器なし誘導と分類器なし誘導の両方が,微分拡散軌道を決定境界から遠ざけることによって条件付き生成を実現することがわかった。
本研究では,フローマッチングをベースとした汎用的な後処理ステップを提案し,事前学習した復調拡散モデルに対する学習分布と実データ分布とのギャップを小さくする。
論文 参考訳(メタデータ) (2025-03-13T17:59:59Z) - Scalable Multi-phase Word Embedding Using Conjunctive Propositional Clauses [9.691610260478248]
入力シーケンスの文脈埋め込みを発見するために,2相学習を取り入れた新しい手法を提案する。
この技術はスケーラブルなモデルの設計を促進するだけでなく、解釈可能性も維持する。
実験の結果,提案手法は従来の手法と比較して競争性能が高いことがわかった。
論文 参考訳(メタデータ) (2025-01-31T10:39:04Z) - Independence Constrained Disentangled Representation Learning from Epistemological Perspective [13.51102815877287]
Disentangled Representation Learningは、データ生成プロセスにおいて意味論的に意味のある潜伏変数を識別するデータエンコーダをトレーニングすることで、ディープラーニングメソッドの説明可能性を向上させることを目的としている。
不整合表現学習の目的については合意が得られない。
本稿では,相互情報制約と独立性制約を統合した非絡み合い表現学習手法を提案する。
論文 参考訳(メタデータ) (2024-09-04T13:00:59Z) - DenoSent: A Denoising Objective for Self-Supervised Sentence
Representation Learning [59.4644086610381]
本稿では,他の視点,すなわち文内視点から継承する新たな認知的目的を提案する。
離散ノイズと連続ノイズの両方を導入することで、ノイズの多い文を生成し、モデルを元の形式に復元するように訓練する。
我々の経験的評価は,本手法が意味的テキスト類似性(STS)と幅広い伝達タスクの両面で競合する結果をもたらすことを示した。
論文 参考訳(メタデータ) (2024-01-24T17:48:45Z) - Resolving label uncertainty with implicit posterior models [71.62113762278963]
本稿では,データサンプルのコレクション間でラベルを共同で推論する手法を提案する。
異なる予測子を後部とする生成モデルの存在を暗黙的に仮定することにより、弱い信念の下での学習を可能にする訓練目標を導出する。
論文 参考訳(メタデータ) (2022-02-28T18:09:44Z) - Discriminative Attribution from Counterfactuals [64.94009515033984]
本稿では,特徴属性と反実的説明を組み合わせたニューラルネットワークの解釈可能性について述べる。
本手法は,特徴属性法の性能を客観的に評価するために有効であることを示す。
論文 参考訳(メタデータ) (2021-09-28T00:53:34Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。