論文の概要: LLM-Augmented Semantic Steering of Text Embedding Projection Spaces
- arxiv url: http://arxiv.org/abs/2605.01957v1
- Date: Sun, 03 May 2026 16:41:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.015733
- Title: LLM-Augmented Semantic Steering of Text Embedding Projection Spaces
- Title(参考訳): テキスト埋め込み射影空間のLLM強化セマンティックステアリング
- Authors: Wei Liu, Eric Krokos, Kirsten Whitley, Rebecca Faust, Chris North,
- Abstract要約: LLMを付加したセマンティックステアリングを導入し、アナリストはプロジェクション内のサンプル文書の小さなセットをグループ化することでセマンティックな意図を表現できる。
大規模言語モデルは、この意図を自然言語表現として外部化し、関連する文書に選択的に拡張する。
結果のセマンティック情報は、テキスト拡張や埋め込みレベルのブレンディングを通じて文書表現に組み込まれる。
- 参考スコア(独自算出の注目度): 7.516736502809871
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Low-dimensional projections of text embeddings support visual analysis of document collections, but their spatial organization may not reflect the relationships an analyst intends to examine. Existing semantic interaction approaches encode semantic intent indirectly through geometric constraints or model updates, limiting interpretability and flexibility. We introduce LLM-augmented semantic steering, which enables analysts to express semantic intent by grouping a small set of example documents within the projection. A large language model externalizes this intent as natural-language representations and selectively extends it to related documents; the resulting semantic information is then incorporated into document representations via text augmentation or embedding-level blending, without retraining the underlying models. A case study illustrates how the same corpus can be reorganized from different semantic perspectives, while simulation-based evaluation shows that semantic steering improves global and local alignment with target semantic structures using only minimal interaction. Embedding-level blending further enables continuous and controllable steering of projection layouts. These results position projection spaces as intent-dependent semantic workspaces that can be reshaped through explicit, interpretable, language-mediated interaction.
- Abstract(参考訳): テキスト埋め込みの低次元投影は、文書コレクションの視覚的解析を支援するが、それらの空間的構造は、アナリストが検討しようとする関係を反映しないかもしれない。
既存の意味的相互作用アプローチは、幾何学的制約やモデル更新を通じて間接的に意味的意図を符号化し、解釈可能性と柔軟性を制限する。
LLMを付加したセマンティックステアリングを導入し、アナリストはプロジェクション内のサンプル文書の小さなセットをグループ化することでセマンティックな意図を表現できる。
大きな言語モデルは、この意図を自然言語表現として外部化し、関連する文書に選択的に拡張する。
ケーススタディでは、同じコーパスを異なるセマンティック視点から再構成する方法が示されているが、シミュレーションに基づく評価では、セマンティックステアリングは、最小限の相互作用だけでターゲットセマンティック構造とのグローバルおよび局所的なアライメントを改善することが示されている。
埋め込みレベルのブレンディングにより、プロジェクションレイアウトの連続的かつ制御可能なステアリングが可能になる。
これらの結果は、射影空間を意図に依存した意味的ワークスペースとして位置づける。
関連論文リスト
- Text-as-Signal: Quantitative Semantic Scoring with Embeddings, Logprobs, and Noise Reduction [0.0]
本稿では,テキストコーパスを定量的意味信号に変換するための実用的なパイプラインを提案する。
本稿では,Qwen埋め込み, UMAP, モデル出力空間から直接導出される意味指標, および3段階の異常検出手順が, 操作用テキスト・アズ・サインのワークフローにどのように組み合わされているかを示す。
論文 参考訳(メタデータ) (2026-03-17T19:56:29Z) - AffordGrasp: Cross-Modal Diffusion for Affordance-Aware Grasp Synthesis [50.793806818677716]
AffordGraspは、物理的に安定し、セマンティックに忠実な人間の握りを高精度に生成する。
AffordGraspは、手ポーズの空きを意識した潜在表現を二重条件拡散プロセスに統合する。
AffordGraspはHO-3D, OakInk, GRAB, AffordPoseの4つの命令強化ベンチマークで評価した。
論文 参考訳(メタデータ) (2026-03-09T06:56:35Z) - Formal Semantic Control over Language Models [2.7708787391533463]
この論文は意味表現学習を進め、言語表現をより意味的に、幾何学的に解釈できるものにする。
VAEフレームワーク内でこの目標を追求し、2つの補完的な研究方向を探索する。
包括的な目的は、内部の意味表現を体系的に解釈できる言語モデルに移行することである。
論文 参考訳(メタデータ) (2026-01-31T10:12:53Z) - Ambiguity in LLMs is a concept missing problem [12.039364223570479]
自然言語における曖昧さは、構造化されたデータマッピングに対する正確なテキストを実現するための重要な障害である。
我々は、潜在空間における曖昧なテキストの表現差を特徴付ける異なるアプローチを採用する。
本稿では,概念上のパスカーネルに基づく新しい距離測度を導入し,あいまいな質問とあいまいな質問を区別する。
論文 参考訳(メタデータ) (2025-05-16T20:39:30Z) - Hypergraph based Understanding for Document Semantic Entity Recognition [65.84258776834524]
我々は,ハイパグラフアテンションを利用したハイパグラフアテンション文書セマンティックエンティティ認識フレームワークHGAを構築し,エンティティ境界とエンティティカテゴリを同時に重視する。
FUNSD, CORD, XFUNDIE で得られた結果は,本手法が意味的エンティティ認識タスクの性能を効果的に向上できることを示す。
論文 参考訳(メタデータ) (2024-07-09T14:35:49Z) - Open-Vocabulary Camouflaged Object Segmentation [66.94945066779988]
OVCOS(Open-vocabulary camouflaged Object segmentation)を導入した。
我々は11,483個の手選択画像とそれに対応するオブジェクトクラスを含む大規模複合シーンデータセット(textbfOVCamo)を構築した。
クラスセマンティック知識の指導とエッジ情報と深度情報からの視覚構造的手がかりの補足を統合することにより、提案手法は効率よくカモフラージュされたオブジェクトを捕捉できる。
論文 参考訳(メタデータ) (2023-11-19T06:00:39Z) - LAW-Diffusion: Complex Scene Generation by Diffusion with Layouts [107.11267074981905]
LAW拡散(LAW-Diffusion)と呼ばれる意味制御可能なレイアウト・AWare拡散モデルを提案する。
LAW拡散は、特にコヒーレントな対象関係を持つ最先端の生成性能をもたらすことを示す。
論文 参考訳(メタデータ) (2023-08-13T08:06:18Z) - SAP-sLDA: An Interpretable Interface for Exploring Unstructured Text [28.36260646471421]
低次元投影における文書間の意味的に意味のある関係を保存するための半教師付きLDAに基づく学習手法を提案する。
合成コーパスでは, 少数のラベルのみを付与したベースライン法よりも解釈可能なプロジェクションが得られた。
論文 参考訳(メタデータ) (2023-07-28T05:43:39Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - Unsupervised Distillation of Syntactic Information from Contextualized
Word Representations [62.230491683411536]
我々は,ニューラルネットワーク表現における意味論と構造学の非教師なしの絡み合いの課題に取り組む。
この目的のために、構造的に類似しているが意味的に異なる文群を自動的に生成する。
我々は、我々の変換クラスタベクトルが、語彙的意味論ではなく構造的特性によって空間に現れることを実証する。
論文 参考訳(メタデータ) (2020-10-11T15:13:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。