論文の概要: Context Steering: A New Paradigm for Compression-based Embeddings by Synthesizing Relevant Information Features
- arxiv url: http://arxiv.org/abs/2508.14780v1
- Date: Wed, 20 Aug 2025 15:26:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.500817
- Title: Context Steering: A New Paradigm for Compression-based Embeddings by Synthesizing Relevant Information Features
- Title(参考訳): コンテキストステアリング:関連情報特徴の合成による圧縮型埋め込みのための新しいパラダイム
- Authors: Guillermo Sarasa Durán, Ana Granados Fontecha, Francisco de Borja Rodríguez Ortíz,
- Abstract要約: コンテキストステアリング(context steering)は、機能形成プロセスを積極的にガイドする方法論である。
正規化圧縮距離(NCD)と相対圧縮距離(NRC)を用いて,この戦略の有効性を検証する。
テキストから実世界の音声への異種データセット間の実験結果-コンテキストステアリングの堅牢性と汎用性を検証した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Compression-based distances (CD) offer a flexible and domain-agnostic means of measuring similarity by identifying implicit information through redundancies between data objects. However, as similarity features are derived from the data, rather than defined as an input, it often proves difficult to align with the task at hand, particularly in complex clustering or classification settings. To address this issue, we introduce "context steering," a novel methodology that actively guides the feature-shaping process. Instead of passively accepting the emergent data structure (typically a hierarchy derived from clustering CDs), our approach "steers" the process by systematically analyzing how each object influences the relational context within a clustering framework. This process generates a custom-tailored embedding that isolates and amplifies class-distinctive information. We validate the capabilities of this strategy using Normalized Compression Distance (NCD) and Relative Compression Distance (NRC) with common hierarchical clustering, providing an effective alternative to common transductive methods. Experimental results across heterogeneous datasets-from text to real-world audio-validate the robustness and generality of context steering, marking a fundamental shift in their application: from merely discovering inherent data structures to actively shaping a feature space tailored to a specific objective.
- Abstract(参考訳): 圧縮ベース距離(CD)は、データオブジェクト間の冗長性を通じて暗黙的な情報を識別することで類似性を測定するフレキシブルでドメインに依存しない手段を提供する。
しかし、類似性機能は入力として定義されるのではなく、データから派生しているため、特に複雑なクラスタリングや分類設定において、手前のタスクと整合することが難しいことがしばしばある。
この問題に対処するために,機能形成プロセスを積極的に導く新しい方法論である"コンテキストステアリング"を導入する。
創発的なデータ構造(一般的にはクラスタリングCDから派生した階層)を受動的に受け入れる代わりに、我々のアプローチは、各オブジェクトがクラスタリングフレームワーク内のリレーショナルコンテキストにどのように影響するかを体系的に分析することで、プロセスの「ステアリング」を行う。
このプロセスは、クラス識別情報を分離して増幅するカスタムのカスタマイズされた埋め込みを生成する。
正規化圧縮距離 (NCD) と相対圧縮距離 (NRC) を共通階層的クラスタリングにより検証し, 共通帰納的手法の代替として有効であることを示す。
テキストから実世界のオーディオバリデーションまで、異種データセットにわたる実験結果は、コンテキストステアリングの堅牢性と汎用性を検証し、アプリケーションの基本的変化をマークする。
関連論文リスト
- Object Style Diffusion for Generalized Object Detection in Urban Scene [69.04189353993907]
本稿では,GoDiffという新しい単一ドメインオブジェクト検出一般化手法を提案する。
擬似ターゲットドメインデータとソースドメインデータを統合することで、トレーニングデータセットを多様化する。
実験により,本手法は既存の検出器の一般化能力を高めるだけでなく,他の単一領域一般化手法のプラグ・アンド・プレイ拡張として機能することが示された。
論文 参考訳(メタデータ) (2024-12-18T13:03:00Z) - A Plug-and-Play Method for Rare Human-Object Interactions Detection by Bridging Domain Gap [50.079224604394]
textbfContext-textbfEnhanced textbfFeature textbfAment (CEFA) と呼ばれる新しいモデルに依存しないフレームワークを提案する。
CEFAは機能アライメントモジュールとコンテキスト拡張モジュールで構成される。
本手法は, 稀なカテゴリにおけるHOIモデルの検出性能を向上させるために, プラグアンドプレイモジュールとして機能する。
論文 参考訳(メタデータ) (2024-07-31T08:42:48Z) - Sanitized Clustering against Confounding Bias [38.928080236294775]
本稿では,共起バイアスに対する衛生クラスタリング(SCAB)という新しいクラスタリングフレームワークを提案する。
SCABは、非線型依存尺度を通じて、複素データのセマンティック潜在空間における境界要素を除去する。
複雑なデータセットの実験は、SCABがクラスタリングのパフォーマンスにおいて大きな向上を達成していることを示している。
論文 参考訳(メタデータ) (2023-11-02T14:10:14Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - Robust Hierarchical Clustering for Directed Networks: An Axiomatic
Approach [13.406858660972551]
有向ネットワークに対するロバストな階層的クラスタリング手法の完全な分類学的特徴を提供する。
本稿では,階層クラスタリングにおけるロバスト性に関連する3つの実用的特性について紹介する。
また,本手法の実装に対処し,実データへのアプリケーション記述を行う。
論文 参考訳(メタデータ) (2021-08-16T17:28:21Z) - Towards Uncovering the Intrinsic Data Structures for Unsupervised Domain
Adaptation using Structurally Regularized Deep Clustering [119.88565565454378]
Unsupervised Domain Adapt (UDA) は、ターゲットドメイン上のラベルなしデータの予測を行う分類モデルを学ぶことである。
本稿では,対象データの正規化判別クラスタリングと生成クラスタリングを統合する構造的正規化深層クラスタリングのハイブリッドモデルを提案する。
提案するH-SRDCは, インダクティブ設定とトランスダクティブ設定の両方において, 既存の手法よりも優れている。
論文 参考訳(メタデータ) (2020-12-08T08:52:00Z) - Cross-Supervised Joint-Event-Extraction with Heterogeneous Information
Networks [61.950353376870154]
Joint-event- Extractは、トリガとエンティティのタグからなるタグセットを備えたシーケンスからシーケンスまでのラベリングタスクである。
トリガやエンティティの抽出を交互に監督するクロススーパーバイザードメカニズム(CSM)を提案する。
我々の手法は、エンティティとトリガー抽出の両方において最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-10-13T11:51:17Z) - Out-of-distribution Generalization via Partial Feature Decorrelation [72.96261704851683]
本稿では,特徴分解ネットワークと対象画像分類モデルとを協調的に最適化する,PFDL(Partial Feature Deorrelation Learning)アルゴリズムを提案する。
実世界のデータセットを用いた実験により,OOD画像分類データセットにおけるバックボーンモデルの精度が向上することを示した。
論文 参考訳(メタデータ) (2020-07-30T05:48:48Z) - Simple and Scalable Sparse k-means Clustering via Feature Ranking [14.839931533868176]
直感的で実装が簡単で,最先端のアルゴリズムと競合する,スパースk平均クラスタリングのための新しいフレームワークを提案する。
本手法は,属性のサブセットのクラスタリングや部分的に観測されたデータ設定など,タスク固有のアルゴリズムに容易に一般化できる。
論文 参考訳(メタデータ) (2020-02-20T02:41:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。