論文の概要: A Geometric Profile of Semantic Information in Text: Frame-Conditional Uniqueness and a Trade-Off Triangle for Scalar Summaries
- arxiv url: http://arxiv.org/abs/2606.11222v1
- Date: Wed, 27 May 2026 04:37:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.850473
- Title: A Geometric Profile of Semantic Information in Text: Frame-Conditional Uniqueness and a Trade-Off Triangle for Scalar Summaries
- Title(参考訳): テキスト中の意味情報の幾何学的プロファイル:スカラー・サプリメントのためのフレーム・コンディショナル・ユニークさとトレードオフ・トライアングル
- Authors: Dmitriy Kompaneets,
- Abstract要約: テキストの文の埋め込み構造から意味的内容を測定するフレームワークを開発する。
推奨のランク正規化構成は、28の順序チェックのうち25をポイント推定としてパスする。
別個の変動結果は、幅座標を行列点過程の対数行列式に接続する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: How much meaning does a text carry? Shannon's theory measures uncertainty over symbols and is intentionally indifferent to meaning, while pairwise metrics such as BERTScore compare two texts rather than characterizing one. We develop a geometric framework that measures semantic content from the structure of a text's sentence embeddings. The framework has three parts. First, within a fixed embedding and baseline, six natural axioms uniquely determine a scalar measure up to scale, a frame-conditional uniqueness theorem. The resulting scalar is empirically too coarse, motivating a richer representation. Second, we propose a three-coordinate semantic profile capturing novelty (displacement from generic discourse), breadth (diversity of distinct ideas), and integration (connectedness among them), together with a discrete minimal unit (the semantic quantum) whose resolution is fixed by a clustering threshold $τ$. Third, we prove a no-go theorem: no scalar summary of the profile can simultaneously satisfy analytic stability under paraphrase and concatenation, ordinal robustness across text scales, and cross-representation comparability. We exhibit two practical scalars, $S_{\mathrm{minmax}}$ and $S_{\mathrm{rank}}$, each occupying a distinct corner of this trade-off triangle. Validation across 23 synthetic categories, 5 Project Gutenberg novels, and 3 embedding models confirms the trade-off. The recommended rank-normalized configuration passes 25 of 28 ordinal checks as point estimates (21 of 28 after Benjamini-Hochberg correction), outperforming seven baselines including unigram entropy and a BERTScore-based novelty signal. A separate variational result connects the breadth coordinate to the log-determinant of a determinantal point process (Spearman $ρ= 0.985$ over 507 Gutenberg chapters), giving an optimization-theoretic foundation for breadth.
- Abstract(参考訳): テキストはどの程度の意味を持ちますか。
シャノンの理論は記号に対する不確かさを測り、意図的に意味に無関心であり、BERTScoreのような対の指標は2つのテキストを特徴付けるのではなく比較する。
テキストの文の埋め込み構造から意味的内容を測定する幾何学的枠組みを開発する。
フレームワークには3つの部分があります。
まず、固定埋め込みとベースラインの中で、6つの自然な公理がスカラー測度をスケールまで一意に決定し、フレーム条件の特異性定理である。
結果として生じるスカラーは経験的に粗いので、よりリッチな表現を動機付けている。
第2に,新奇性(一般的な言論から逸脱),広さ(異なるアイデアの多様性),統合性(相互接続性)を捉えた3座標意味プロファイルと,クラスタリングしきい値$τ$で解像度を固定した離散最小単位(セマンティック量子)を提案する。
第3に、我々はノーゴー定理を証明している: プロファイルのスカラー的な要約は、パラフレーズと連結の下で解析的安定性を同時に満たすことができず、テキストスケールをまたいだ順序的堅牢性、および相互表現の可視性である。
我々は2つの実用的なスカラー、$S_{\mathrm{minmax}}$と$S_{\mathrm{rank}}$を示し、それぞれがこのトレードオフ三角形の異なる角を占める。
23の合成カテゴリ、5つのプロジェクト・グーテンベルクの小説、3つの埋め込みモデルはトレードオフを確認します。
推奨のランク正規化構成は28の正規チェックのうち25を点推定として通過し(ベンジャミン=ホックベルク補正後の28の21)、ユニグラムエントロピーとBERTScoreベースのノベルティ信号を含む7つのベースラインを上回っている。
別個の変分結果は、幅座標を行列点過程の対数行列式 (Spearman $ρ= 0.985$ over 507 Gutenberg chapters) に接続し、幅の最適化理論の基礎を与える。
関連論文リスト
- A Mathematical Theory of Value: a synthesis on goal-directed agency under resource constraints [6.057587531186626]
目的指向エージェントが生成し、破壊し、交換する価値は、情報と同じカテゴリの法的構造量であることを示す。
価格がフレームに依存していない間、価値はフレーム相対的であり、そのリソースをプールし、その知覚を融合する艦隊が天井を継承する。
論文 参考訳(メタデータ) (2026-06-10T16:11:04Z) - See More, Match Better: Multi-Source Feature Fusion for Two-View Correspondence Learning [52.52121389921707]
2視点対応学習は、画像対における真対応(インレーシ)と偽対応(インレーシ)とを区別することを目的としている。
既存の手法は主に座標に基づく幾何の整合性に依存する。
本稿では,2視点対応学習のためのマルチソース機能融合フレームワークTriMatchを提案する。
論文 参考訳(メタデータ) (2026-06-08T09:33:01Z) - A Triadic Suffix Tokenization Scheme for Numerical Reasoning [0.0]
本稿では,3桁を3桁の3桁に分割し,各3桁を明示的な大きさのマーカーで注釈する決定論的スキームであるTST(Tiadic Suffix Tokenization)を紹介する。
TST は接尾辞と整数部分の桁数の間の固定された 1 対 1 の写像を定義する。
1) 既存の語彙に少なくとも10,000の固定トークンを追加し、33桁のマグニチュード(10〜15ドルから1018ドル)をカバーした語彙ベースのアプローチと、(2) 特別なトークンの小さなセットを使って動的に大きさを示す接尾辞マーカアプローチである。
論文 参考訳(メタデータ) (2026-04-13T14:58:24Z) - Finding Belief Geometries with Sparse Autoencoders [0.0]
本稿では,変圧器表現における単純な部分空間の候補を求めるパイプラインを提案する。
隠れマルコフモデルを用いて学習した変圧器上でのパイプラインの検証を行った。
真の信念のような幾何学がGemma-2-9Bの表現空間に存在するという予備的な証拠がある。
論文 参考訳(メタデータ) (2026-04-03T03:29:48Z) - SegSplat: Feed-forward Gaussian Splatting and Open-Set Semantic Segmentation [114.57192386025373]
SegSplatは、高速でフィードフォワードな3D再構成とリッチでオープンなセマンティック理解のギャップを埋めるために設計された、新しいフレームワークである。
この研究は、意味的に認識された3D環境の実践的でオンザフライな生成に向けた重要なステップである。
論文 参考訳(メタデータ) (2025-11-23T10:26:38Z) - Ambiguity-aware Point Cloud Segmentation by Adaptive Margin Contrastive Learning [65.94127546086156]
本稿では,ポイントクラウド上のセマンティックセマンティックセグメンテーションのための適応的マージン比較学習法を提案する。
まず,両立度推定フレームワークにコントラスト学習を組み込んだAMContrast3Dを設計する。
共同トレーニングの洞察に触発されて、並列にトレーニングされた2つのブランチとAMContrast3D++を統合することを提案する。
論文 参考訳(メタデータ) (2025-07-09T07:00:32Z) - Span Pointer Networks for Non-Autoregressive Task-Oriented Semantic
Parsing [55.97957664897004]
seq2seq、非自動回帰的、タスク指向を構築するための効果的なレシピは、3つのステップで発話とセマンティックフレームをマッピングする。
これらのモデルは通常、長さ予測によってボトルネックとなる。
本研究では,デコードタスクをテキスト生成からスパン予測へシフトさせる非自己回帰手法を提案する。
論文 参考訳(メタデータ) (2021-04-15T07:02:35Z) - 3D Correspondence Grouping with Compatibility Features [51.869670613445685]
本稿では,3次元対応グルーピングのための簡易かつ効果的な手法を提案する。
目的は、局所幾何学的記述子を不整合と外接点にマッチングすることによって得られる初期対応を正確に分類することである。
本稿では,不整合と不整合を表わすために,互換性特徴(CF)と呼ばれる3次元対応の表現を提案する。
論文 参考訳(メタデータ) (2020-07-21T02:39:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。