論文の概要: Ethology of Latent Spaces
- arxiv url: http://arxiv.org/abs/2602.05710v1
- Date: Thu, 05 Feb 2026 14:37:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.976779
- Title: Ethology of Latent Spaces
- Title(参考訳): 潜伏空間のエソロジー
- Authors: Philippe Boisnard,
- Abstract要約: 本研究では,視覚言語モデルにおける潜在空間の中立性について考察する。
等質不確定性の空間を構成するのではなく、潜在空間はモデル固有のアルゴリズム感受性を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study challenges the presumed neutrality of latent spaces in vision language models (VLMs) by adopting an ethological perspective on their algorithmic behaviors. Rather than constituting spaces of homogeneous indeterminacy, latent spaces exhibit model-specific algorithmic sensitivities, understood as differential regimes of perceptual salience shaped by training data and architectural choices. Through a comparative analysis of three models (OpenAI CLIP, OpenCLIP LAION, SigLIP) applied to a corpus of 301 artworks (15th to 20th), we reveal substantial divergences in the attribution of political and cultural categories. Using bipolar semantic axes derived from vector analogies (Mikolov et al., 2013), we show that SigLIP classifies 59.4% of the artworks as politically engaged, compared to only 4% for OpenCLIP. African masks receive the highest political scores in SigLIP while remaining apolitical in OpenAI CLIP. On an aesthetic colonial axis, inter-model discrepancies reach 72.6 percentage points. We introduce three operational concepts: computational latent politicization, describing the emergence of political categories without intentional encoding; emergent bias, irreducible to statistical or normative bias and detectable only through contrastive analysis; and three algorithmic scopic regimes: entropic (LAION), institutional (OpenAI), and semiotic (SigLIP), which structure distinct modes of visibility. Drawing on Foucault's notion of the archive, Jameson's ideologeme, and Simondon's theory of individuation, we argue that training datasets function as quasi-archives whose discursive formations crystallize within latent space. This work contributes to a critical reassessment of the conditions under which VLMs are applied to digital art history and calls for methodologies that integrate learning architectures into any delegation of cultural interpretation to algorithmic agents.
- Abstract(参考訳): 本研究は,視覚言語モデル(VLM)における潜伏空間の中立性について,そのアルゴリズム的挙動に関する倫理的視点を用いて検討する。
等質不確定性の空間を構成するのではなく、潜在空間は、訓練データとアーキテクチャ選択によって形成される知覚的サリエンスの差分状態として理解される、モデル固有のアルゴリズム的感性を示す。
3つのモデルの比較分析 (OpenAI CLIP, OpenCLIP LAION, SigLIP) を通して, 政治的・文化的カテゴリーの帰属に大きく相違があることを明らかにする。
ベクトル類似から派生した双極性意味軸(Mikolov et al , 2013)を用いて、SigLIPは59.4%のアートワークを政治的に関与していると分類し、OpenCLIPは4%に過ぎなかった。
アフリカのマスクは、OpenAI CLIPに残されている間、SigLIPで最も高い政治的スコアを受け取っている。
審美的な植民地軸では、モデル間差は72.6ポイントに達する。
計算潜在政治,意図的エンコーディングのない政治的カテゴリの出現,統計的あるいは規範的バイアスとは無関係な創発的バイアス,コントラスト的分析による検出,および異なる可視モードを構成する3つのアルゴリズム的可視性(LAION),機関的(OpenAI),半可視性(SigLIP)の3つの機能的概念を紹介する。
フーコーのアーカイブの概念、ジェイムソンのイデオロギーム、およびサイモンドンの分別化の理論に基づいて、トレーニングデータセットは、非帰的形成が潜時空間内で結晶化する準構造として機能すると主張している。
この研究は、VLMがデジタル美術史に応用される条件の批判的再評価に寄与し、学習アーキテクチャをアルゴリズムエージェントへの文化的解釈の委譲に組み込む方法論を求める。
関連論文リスト
- Computational Measurement of Political Positions: A Review of Text-Based Ideal Point Estimation Algorithms [0.0]
本稿では、教師なしおよび半教師付き計算テキストベース理想点推定(CT-IPE)アルゴリズムの体系的レビューを行う。
CT-IPEアルゴリズムは、議会演説、政党宣言、ソーシャルメディアからイデオロギー的嗜好を推定するために、政治科学、コミュニケーション、計算社会科学、コンピュータ科学で広く使われている。
論文 参考訳(メタデータ) (2025-11-17T11:01:09Z) - Measuring Algorithmic Partisanship via Zero-Shot Classification and Its Implications on Political Discourse [0.0]
本研究は,ゼロショット分類手法を用いて,アルゴリズム的政治的パルチザン性を評価する。
6つの主要な大言語モデルにまたがる1800のモデル応答は、4つの異なる微調整された分類アルゴリズムに個別に入力された。
その結果、リベラルな権威主義的アライメントが増幅され、推理スーパーセッションや缶詰の拒絶の顕著な事例が示された。
論文 参考訳(メタデータ) (2025-09-25T05:26:20Z) - Generalized Decoupled Learning for Enhancing Open-Vocabulary Dense Perception [71.26728044621458]
DeCLIPは、CLIPを強化する新しいフレームワークで、自己認識モジュールを分離して、それぞれコンテンツ’と“コンテキスト’の機能を取得する。
2D検出とセグメンテーション、3Dインスタンスのセグメンテーション、ビデオインスタンスのセグメンテーション、6Dオブジェクトのポーズ推定など、幅広いタスクにわたる最先端のパフォーマンスを一貫して達成する。
論文 参考訳(メタデータ) (2025-08-15T06:43:51Z) - Localizing Persona Representations in LLMs [8.022710512070338]
大規模言語モデル(LLM)の表現空間におけるペルソナのエンコード方法と場所について検討する。
我々は、道徳的ニヒリズムや実用主義など、特定の倫理的観点で重なるアクティベーションを観察する。
対照的に、保守主義や自由主義のような政治的イデオロギーは、より異なる地域で表現されているようである。
論文 参考訳(メタデータ) (2025-05-30T12:46:44Z) - CCL-LGS: Contrastive Codebook Learning for 3D Language Gaussian Splatting [53.15827818829865]
2Dプリンシパルに依存しているメソッドは、横断的なセマンティクスの不整合という重要な課題に陥る。
CCL-LGSは、多視点セマンティックキューを統合することで、ビューに一貫性のあるセマンティック監視を実現する新しいフレームワークである。
我々の枠組みは、カテゴリー識別性を維持しながら意味的対立を明示的に解決する。
論文 参考訳(メタデータ) (2025-05-26T19:09:33Z) - From Tokens to Thoughts: How LLMs and Humans Trade Compression for Meaning [63.25540801694765]
大きな言語モデル (LLMs) は言語能力を示すが、同じバランスをとれるかどうかは不明だ。
本稿では,LLMと人間を定量的に比較するために,Information Bottleneckの原理を適用した。
論文 参考訳(メタデータ) (2025-05-21T16:29:00Z) - Implicit Personalization in Language Models: A Systematic Study [94.29756463158853]
インプリシトパーソナライゼーション (IP) は、入力プロンプト内の暗黙の手がかりからユーザの背景を推測する言語モデルの現象である。
この研究は、厳密な数学的定式化、多面的道徳的推論フレームワーク、そして一連の事例研究を通じて、IPを体系的に研究する。
論文 参考訳(メタデータ) (2024-05-23T17:18:46Z) - Deep Clustering by Semantic Contrastive Learning [67.28140787010447]
Semantic Contrastive Learning (SCL) と呼ばれる新しい変種を紹介します。
従来のコントラスト学習とディープクラスタリングの両方の特徴を探求する。
コントラスト学習と深層クラスタリングの強みを統一的なアプローチで増幅することができる。
論文 参考訳(メタデータ) (2021-03-03T20:20:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。