論文の概要: The Proxy Presumption: From Semantic Embeddings to Valid Social Measures
- arxiv url: http://arxiv.org/abs/2605.07409v1
- Date: Fri, 08 May 2026 08:03:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.910992
- Title: The Proxy Presumption: From Semantic Embeddings to Valid Social Measures
- Title(参考訳): プロキシ推定:セマンティック・エンベディングから社会対策の検証まで
- Authors: Baishi Li, Ta Yu, Kelvin J. L. Koa, Ke-Wei Huang,
- Abstract要約: セマンティック埋め込みと有効な社会対策のギャップを埋めるために,コンストラクト妥当性プロトコル(CVP)を導入する。
また,埋め込み空間におけるコンバウンディングを低減するために,ファクトファクトニュートラル化を提案する。
この研究は、コミュニティにプロキシを堅牢で科学的に保護可能な楽器に変換するツールキットを提供する。
- 参考スコア(独自算出の注目度): 0.3849857432787595
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Natural Language Processing is rapidly evolving into a primary instrument for Computational Social Science, with researchers increasingly using embeddings to measure latent constructs such as novelty, creativity, and bias. However, this transition faces a fundamental validity challenge: the ''Proxy Presumption,'' or the reliance on geometric properties (e.g., cosine distance) as direct measures of social concepts. We argue that without explicit validation, unsupervised representations remain entangled mixtures of the target construct ($C$) and confounding attributes ($Z$) like topic, style, and authorship. To bridge the gap between semantic embeddings and valid social measures, we introduce the Construct Validity Protocol (CVP). Drawing on causal representation learning and psychometrics, the CVP offers a rigorous pipeline from conceptualization to quantitative verification. We further propose Counterfactual Neutralization, a novel method using LLMs to reduce confounding in embedding space. By providing a standardized Validity Suite -- including tests for discriminant, incremental, and predictive validity -- this work offers the community a toolkit to transform heuristic proxies into robust, scientifically defensible instruments.
- Abstract(参考訳): 自然言語処理は、コンピュータ社会科学の主要な道具として急速に進化しており、研究者は、新しいもの、創造性、偏見などの潜伏した構造を測定するために埋め込みをますます利用している。
しかし、この移行は、社会的概念の直接的な測度としての幾何学的特性(例えば、コサイン距離)への依存という、基本的な妥当性の課題に直面している。
明示的な検証がなければ、教師なしの表現は、対象のコンストラクト($C$)と、トピック、スタイル、オーサシップのような属性($Z$)の混在を保ちます。
セマンティック埋め込みと有効な社会対策のギャップを埋めるために,コンストラクト妥当性プロトコル(CVP)を導入する。
因果表現学習と心理測定に基づいて、CVPは概念化から定量的検証までの厳密なパイプラインを提供する。
さらに,LLMを用いた埋込空間の凹凸低減手法である反現実ニュートラル化を提案する。
差別的、漸進的、予測的妥当性のテストを含む標準化された妥当性スイートを提供することにより、この研究は、ヒューリスティックなプロキシを堅牢で科学的に保護可能な楽器に変換するためのツールキットを提供する。
関連論文リスト
- Beyond Preset Identities: How Agents Form Stances and Boundaries in Generative Societies [28.436766185842767]
本稿では,計算仮想エスノグラフィーと定量的社会認知プロファイリングを組み合わせた新しい混合メソドックスフレームワークを提案する。
Innate Value Bias (IVB)、Persuasion Sensitivity、Trust-Action Decoupling (TAD)の3つの新しいメトリクスを形式化する。
発見は静的なプロンプトエンジニアリングの脆弱さを明らかにし、人間とエージェントのハイブリッド社会における動的アライメントの方法論的かつ定量的基盤を提供する。
論文 参考訳(メタデータ) (2026-03-24T16:38:46Z) - The Prediction-Measurement Gap: Toward Meaning Representations as Scientific Instruments [0.0]
この論文は、科学的意味分析は、科学的ユーザビリティという、異なる目的のファミリーを動機付けている、と論じている。
静的な単語埋め込みと文脈変換器表現をこれらの要件に対して評価する。
分野がスケールファーストの進歩の限界について議論するにつれて、測定可能な表現は原則化された新しいフロンティアを提供する。
論文 参考訳(メタデータ) (2026-03-10T18:08:53Z) - Towards Simulating Social Media Users with LLMs: Evaluating the Operational Validity of Conditioned Comment Prediction [2.5450067638785945]
本研究は,ユーザが所定の刺激に対してどのようにコメントするかをモデルが予測するタスクである条件付きコメント予測(CCP)を紹介する。
オープンウェイトな8Bモデル(Llama3.1、Qwen3、Ministral)を英語、ドイツ語、ルクセンブルク語のシナリオで評価する。
論文 参考訳(メタデータ) (2026-02-26T08:40:21Z) - From Passive Metric to Active Signal: The Evolving Role of Uncertainty Quantification in Large Language Models [77.04403907729738]
このサーベイは、受動的診断基準からリアルタイムモデル動作を導くアクティブ制御信号への不確実性の進化をグラフ化する。
3つのフロンティアにまたがるアクティブ制御信号として不確実性がいかに活用されているかを示す。
この調査は、次世代のスケーラブルで信頼性があり、信頼できるAIを構築するためには、新しい不確実性のトレンドを習得することが不可欠である、と論じている。
論文 参考訳(メタデータ) (2026-01-22T06:21:31Z) - Reasoning-Driven Amodal Completion: Collaborative Agents and Perceptual Evaluation [17.405818788700234]
本稿では,視覚合成から意味的計画を明確に分離する協調的マルチエージェント推論フレームワークを提案する。
提案手法は,画素生成前の構造的,明示的なプランを生成し,視覚的,意味的に整合した単一パス合成を可能にする。
従来の評価基準の限界に対処し,新しい人間対応評価指標MAC-Scoreを導入する。
論文 参考訳(メタデータ) (2025-12-24T04:39:45Z) - Geometrically-Constrained Agent for Spatial Reasoning [53.93718394870856]
視覚言語モデルは空間的推論において基本的な意味-幾何学的ギャップを示す。
現在のパラダイムは、このギャップを埋めることに失敗します。
本稿では,形式的タスク制約を導入することにより,このギャップを解消する学習自由エージェントパラダイムを提案する。
論文 参考訳(メタデータ) (2025-11-27T17:50:37Z) - Taming Polysemanticity in LLMs: Provable Feature Recovery via Sparse Autoencoders [50.52694757593443]
既存のSAEトレーニングアルゴリズムは厳密な数学的保証を欠いていることが多く、実用的な制限に悩まされている。
まず,特徴の特定可能性という新たな概念を含む特徴回復問題の統計的枠組みを提案する。
本稿では、ニューラルネットワークのバイアスパラメータを適応的に調整し、適切なアクティベーション間隔を確保する手法である「バイアス適応」に基づく新たなSAEトレーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-06-16T20:58:05Z) - Improving Language Models Meaning Understanding and Consistency by
Learning Conceptual Roles from Dictionary [65.268245109828]
現代事前訓練言語モデル(PLM)の非人間的行動は、その信頼性を損なう主要な原因である。
驚くべき現象は、矛盾した結果を生み出す不整合予測の生成である。
本研究では,PLMの認知度を向上させることで,一貫性のない行動問題を緩和する実践的アプローチを提案する。
論文 参考訳(メタデータ) (2023-10-24T06:15:15Z) - Federated Conformal Predictors for Distributed Uncertainty
Quantification [83.50609351513886]
コンフォーマル予測は、機械学習において厳密な不確実性定量化を提供するための一般的なパラダイムとして現れつつある。
本稿では,共形予測を連邦学習環境に拡張する。
本稿では、FL設定に適した部分交換可能性の弱い概念を提案し、それをフェデレート・コンフォーマル予測フレームワークの開発に利用する。
論文 参考訳(メタデータ) (2023-05-27T19:57:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。