論文の概要: Sheaf-Laplacian Obstruction and Projection Hardness for Cross-Modal Compatibility on a Modality-Independent Site
- arxiv url: http://arxiv.org/abs/2604.07632v1
- Date: Wed, 08 Apr 2026 22:20:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.58336
- Title: Sheaf-Laplacian Obstruction and Projection Hardness for Cross-Modal Compatibility on a Modality-Independent Site
- Title(参考訳): モダリティ非依存地におけるクロスモーダル適合性のためのシーフ・ラプラシアン障害物と投影硬度
- Authors: Tibor Sloboda,
- Abstract要約: 学習表現における相互互換を解析するための統一的なフレームワークを開発する。
有向モダリティ対 $(ato b)$ に対して、2つの相補的不和性機構を形式化する。
具体的なReLU設定では, 直接アライメントが不可能な場合でも, 中間モダリティは有効硬度を厳密に低減できることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop a unified framework for analyzing cross-modal compatibility in learned representations. The core object is a modality-independent neighborhood site on sample indices, equipped with a cellular sheaf of finite-dimensional real inner-product spaces. For a directed modality pair $(a\to b)$, we formalize two complementary incompatibility mechanisms: projection hardness, the minimal complexity within a nested Lipschitz-controlled projection family needed for a single global map to align whitened embeddings; and sheaf-Laplacian obstruction, the minimal spatial variation required by a locally fit field of projection parameters to achieve a target alignment error. The obstruction invariant is implemented via a projection-parameter sheaf whose 0-Laplacian energy exactly matches the smoothness penalty used in sheaf-regularized regression, making the theory directly operational. This separates two distinct failure modes: hardness failure, where no low-complexity global projection exists, and obstruction failure, where local projections exist but cannot be made globally consistent over the semantic neighborhood graph without large parameter variation. We link the sheaf spectral gap to stability of global alignment, derive bounds relating obstruction energy to excess global-map error under mild Lipschitz assumptions, and give explicit constructions showing that compatibility is generally non-transitive. We further define bridging via composed projection families and show, in a concrete ReLU setting, that an intermediate modality can strictly reduce effective hardness even when direct alignment remains infeasible.
- Abstract(参考訳): 学習表現における相互互換を解析するための統一的なフレームワークを開発する。
コアオブジェクトはサンプルインデックス上のモダリティ非依存の近傍サイトであり、有限次元の実内積空間のセル層を備える。
有向モダリティ対 $(a\to b)$ に対して、投影硬度、白色の埋め込みを整列する単一の大域写像に必要なネスト付きリプシッツ制御プロジェクションファミリー内の最小の複雑さ、およびターゲットアライメント誤差を達成するためにプロジェクションパラメータの局所的に適合するフィールドによって必要となる最小の空間的変動である層-ラプラシアン障害物の2つの相補的不整合機構を定式化する。
障害物不変量は、0-ラプラシアエネルギーが層-正則回帰で用いられる滑らかさのペナルティと正確に一致し、直接的に作用するプロジェクションパラメータによって実装される。
低複雑さのグローバルプロジェクションが存在しない硬度障害と、局所的なプロジェクションが存在するが、大きなパラメータのばらつきなしにセマンティック近隣グラフ上でグローバルに一貫性を持たせることができない障害物障害である。
我々は、せん断スペクトルギャップを大域的アライメントの安定性に結び付け、緩やかなリプシッツ仮定の下で閉塞エネルギーと過剰な大域的マップ誤差に関する境界を導出し、整合性は概して非推移的であることを示す明示的な構成を与える。
さらに、合成射影ファミリによるブリッジングを定義し、具体的なReLU設定では、中間モダリティが直接アライメントが不可能な場合でも、有効硬度を厳密に低減できることを示す。
関連論文リスト
- Stability and Generalization of Push-Sum Based Decentralized Optimization over Directed Graphs [55.77845440440496]
プッシュベースの分散通信は、情報交換が非対称である可能性のある通信ネットワークの最適化を可能にする。
我々は、グラディエント・プッシュ(SGP)アルゴリズムのための統一的な一様安定性フレームワークを開発する。
重要な技術的要素は、2つの量に束縛された不均衡認識の一般化である。
論文 参考訳(メタデータ) (2026-02-24T05:32:03Z) - MirrorLA: Reflecting Feature Map for Vision Linear Attention [49.41670925034762]
リニアアテンションはトランスフォーマーの2次から線形への計算複雑性を著しく低下させるが、パフォーマンスにおけるソフトマックスに基づくアテンションの遅れは一貫して遅れる。
我々は、受動トランケーションをアクティブなリオリエンテーションに置き換える幾何学的枠組みであるMirrorLAを提案する。
MirrorLAは標準的なベンチマークで最先端のパフォーマンスを実現し、表現の忠実さを損なうことなく厳密な線形効率を実現できることを示した。
論文 参考訳(メタデータ) (2026-02-04T09:14:09Z) - UAGLNet: Uncertainty-Aggregated Global-Local Fusion Network with Cooperative CNN-Transformer for Building Extraction [83.48950950780554]
リモートセンシング画像からの抽出は、複雑な構造変化のために難しい課題である。
既存の方法は、セグメンテーションモデルにおけるマルチスケール特徴をキャプチャするために、畳み込みブロックまたは自己アテンションブロックを使用する。
高品質なグローバルローカルなビジュアルセマンティクスを活用するために,不確実性集約型グローバルローカルフュージョンネットワーク(UAGLNet)を提案する。
論文 参考訳(メタデータ) (2025-12-15T02:59:16Z) - On the Collapse of Generative Paths: A Criterion and Correction for Diffusion Steering [29.633206995806542]
インタイムステアリングにより、事前トレーニングされた拡散/フローモデルを、再トレーニングせずに新しいタスクに適合させることができる。
この構造には批判的かつ以前は形式化されていなかった障害モード(Marginal Path Collapse)がある。
本稿では,Feynman-Kac ステアリングを時間変化指数に拡張する Adaptive path Correction with Exponents (ACE) を提案する。
論文 参考訳(メタデータ) (2025-12-11T06:44:08Z) - Revisiting Zeroth-Order Optimization: Minimum-Variance Two-Point Estimators and Directionally Aligned Perturbations [57.179679246370114]
乱摂動の分布は, 摂動段差がゼロになる傾向にあるため, 推定子の分散を最小限に抑える。
以上の結果から, 一定の長さを維持するのではなく, 真の勾配に方向を合わせることが可能であることが示唆された。
論文 参考訳(メタデータ) (2025-10-22T19:06:39Z) - Fundamental limits to contrast reversal of self-fidelity correlations [0.0]
測定設計においては、アンチコントラストのリードアウトを設計することが一般的である。
広義の入力アンサンブルに対して2つの進化を均一に反対にできるかどうかを問う。
我々は、ピアソン相関係数を、2つの進化の間の大域的対立のデバイスに依存しない尺度として採用する。
論文 参考訳(メタデータ) (2025-09-30T15:07:28Z) - Every Subtlety Counts: Fine-grained Person Independence Micro-Action Recognition via Distributionally Robust Optimization [36.230001277076376]
マイクロアクション認識は、心理的アセスメントと人間とコンピュータの相互作用に不可欠である。
既存の手法は現実のシナリオで失敗することが多い。
本稿では、分散ロバスト最適化の原則を取り入れた個人独立ユニバーサルマイクロアクション認識フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-25T14:54:24Z) - Cross-modal Full-mode Fine-grained Alignment for Text-to-Image Person Retrieval [54.90229711181207]
TIPR (Text-to-Image Person Retrieval) は、与えられたテキストクエリに基づいて、最も関連性の高い人物画像を取得することを目的としている。
TIPRの鍵となる課題は、テキストと視覚のモダリティの効果的なアライメントを達成することである。
FMFA, クロスモーダルフルモーデファインファインファインファインアライメントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-17T07:12:05Z) - Log-Likelihood Ratio Minimizing Flows: Towards Robust and Quantifiable
Neural Distribution Alignment [52.02794488304448]
そこで本研究では,対数様比統計量と正規化フローに基づく新しい分布アライメント手法を提案する。
入力領域の局所構造を保存する領域アライメントにおいて,結果の最小化を実験的に検証する。
論文 参考訳(メタデータ) (2020-03-26T22:10:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。