論文の概要: ICON: Invariant Counterfactual Optimization with Neuro-Symbolic Priors for Text-Based Person Search
- arxiv url: http://arxiv.org/abs/2601.15931v1
- Date: Thu, 22 Jan 2026 13:09:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-23 21:37:20.606998
- Title: ICON: Invariant Counterfactual Optimization with Neuro-Symbolic Priors for Text-Based Person Search
- Title(参考訳): ICON: テキストに基づく人物検索のためのニューロシンボリック前駆体を用いた不変な非現実的最適化
- Authors: Xiangyu Wang, Zhixin Lv, Yongjiao Sun, Anrui Han, Ye Yuan, Hangxu Ji,
- Abstract要約: テキストベースの人物検索は、視覚的知覚と言語理解を橋渡しする現実世界の監視においてユニークな価値を持っている。
事前学習モデルを利用した現在のパラダイムは、しばしば複雑なオープンワールドシナリオに効果的に転送できない。
本稿では,因果関係とトポロジ的前提を統合したフレームワークであるICONを提案する。
- 参考スコア(独自算出の注目度): 6.247167721048087
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text-Based Person Search (TBPS) holds unique value in real-world surveillance bridging visual perception and language understanding, yet current paradigms utilizing pre-training models often fail to transfer effectively to complex open-world scenarios. The reliance on "Passive Observation" leads to multifaceted spurious correlations and spatial semantic misalignment, causing a lack of robustness against distribution shifts. To fundamentally resolve these defects, this paper proposes ICON (Invariant Counterfactual Optimization with Neuro-symbolic priors), a framework integrating causal and topological priors. First, we introduce Rule-Guided Spatial Intervention to strictly penalize sensitivity to bounding box noise, forcibly severing location shortcuts to achieve geometric invariance. Second, Counterfactual Context Disentanglement is implemented via semantic-driven background transplantation, compelling the model to ignore background interference for environmental independence. Then, we employ Saliency-Driven Semantic Regularization with adaptive masking to resolve local saliency bias and guarantee holistic completeness. Finally, Neuro-Symbolic Topological Alignment utilizes neuro-symbolic priors to constrain feature matching, ensuring activated regions are topologically consistent with human structural logic. Experimental results demonstrate that ICON not only maintains leading performance on standard benchmarks but also exhibits exceptional robustness against occlusion, background interference, and localization noise. This approach effectively advances the field by shifting from fitting statistical co-occurrences to learning causal invariance.
- Abstract(参考訳): テキストベースパーソンサーチ(TBPS)は、視覚的知覚と言語理解を橋渡しする現実世界の監視においてユニークな価値を持っているが、事前学習モデルを利用した現在のパラダイムは、しばしば複雑なオープンワールドシナリオに効果的に転送できない。
パッシブ・オブザーバ (Passive Observation) への依存は、多面的なスプリアス相関と空間的意味的ミスアライメントをもたらし、分布シフトに対する堅牢性の欠如を引き起こす。
本稿では、これらの欠陥を根本的に解決するために、因果的およびトポロジカルな先行を統合したフレームワークであるICON(Invariant Counterfactual Optimization with Neuro-symbolic priors)を提案する。
まず,ボックスノイズに対する感度を厳格化するためにルールガイド型空間干渉を導入し,位置ショートカットを強制的に切断して幾何学的不変性を実現する。
第二に、対実的コンテキスト分散は、セマンティック駆動の背景移植によって実装され、環境独立のための背景干渉を無視するようモデルに促す。
次に,適応マスキングを併用したサリエンシ駆動セマンティック正規化を適用し,局所サリエンシバイアスを解消し,完全性を保証する。
最後に、ニューロシンボリックトポロジカルアライメントは、ヒトの構造論理とトポロジカルに整合していることを保証するため、特徴マッチングを制約するために、ニューロシンボリックトポロジカルトポロジカルアライメントを利用する。
実験結果から、ICONは標準ベンチマークの先行性能を維持しているだけでなく、閉塞、バックグラウンド干渉、ローカライゼーションノイズに対する例外的な堅牢性も示している。
このアプローチは、統計的共起の適合から因果不変性の学習への移行によって、効果的に分野を前進させる。
関連論文リスト
- Ontology Neural Networks for Topologically Conditioned Constraint Satisfaction [0.0]
トポロジカルコンディショニングと勾配安定化機構を統合した拡張フレームワークを提案する。
このフレームワークは、シード非依存の収束と、20ノード問題までの優雅なスケーリング挙動を示す。
論文 参考訳(メタデータ) (2026-01-08T18:01:52Z) - BiPrompt: Bilateral Prompt Optimization for Visual and Textual Debiasing in Vision-Language Models [7.174865411448373]
テスト時間適応時の両モード間の非因果的特徴依存を緩和する二元的プロンプト最適化フレームワーク(BiPrompt)を提案する。
視覚面では、背景のアクティベーションを抑制し、因果領域と突発領域の間の予測一貫性を強制するために、構造化された注意誘導消去を用いる。
テキスト側では、クラス埋め込みを等方的意味空間に整合させる学習可能な再中心化機構である、バランスの取れたプロンプト正規化を導入している。
論文 参考訳(メタデータ) (2026-01-05T14:22:20Z) - TRUST: Leveraging Text Robustness for Unsupervised Domain Adaptation [9.906359339999039]
視覚モデルの適応を導くために,言語モダリティの堅牢性を活用する新しいUDAアプローチを導入する。
視覚と言語の特徴空間を整合させるマルチモーダルなソフトコントラスト学習損失を提案する。
我々のアプローチは従来の手法よりも優れており、従来の(DomainNet)ドメインシフトと複雑な(GeoNet)ドメインシフトに新しい最先端の設定を施しています。
論文 参考訳(メタデータ) (2025-08-08T16:51:44Z) - Latent Diffusion Model Based Denoising Receiver for 6G Semantic Communication: From Stochastic Differential Theory to Application [11.385703484113552]
生成人工知能(GAI)を利用した新しい意味コミュニケーションフレームワークを提案する。
意味的特徴抽出のための変分オートエンコーダを組み合わせた潜在拡散モデル(LDM)に基づくセマンティックコミュニケーションフレームワークを提案する。
提案システムはゼロショットの一般化をサポートし,低SNRおよびアウト・オブ・ディストリビューション条件下での優れた性能を実現する訓練自由フレームワークである。
論文 参考訳(メタデータ) (2025-06-06T03:20:32Z) - Certified Neural Approximations of Nonlinear Dynamics [51.01318247729693]
安全クリティカルな文脈では、神経近似の使用は、基礎となるシステムとの密接性に公式な境界を必要とする。
本稿では,認証された一階述語モデルに基づく新しい,適応的で並列化可能な検証手法を提案する。
論文 参考訳(メタデータ) (2025-05-21T13:22:20Z) - Topology-Aware Conformal Prediction for Stream Networks [68.02503121089633]
本研究では,ネットワークトポロジと時間的ダイナミクスを共形予測フレームワークに統合した新しいフレームワークであるspatio-Temporal Adaptive Conformal Inference (textttCISTA)を提案する。
この結果から,TextttCISTAは予測効率とカバレッジのバランスを効果的に保ち,既存のストリームネットワークの共形予測手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2025-03-06T21:21:15Z) - Neighbor-Aware Calibration of Segmentation Networks with Penalty-Based
Constraints [19.897181782914437]
本稿では,ロジット値の等式制約に基づく基本的かつ単純な解を提案し,強制制約と罰則の重みを明示的に制御する。
我々のアプローチは、広範囲のディープセグメンテーションネットワークのトレーニングに利用できる。
論文 参考訳(メタデータ) (2024-01-25T19:46:57Z) - Achieving Constraints in Neural Networks: A Stochastic Augmented
Lagrangian Approach [49.1574468325115]
DNN(Deep Neural Networks)の正規化は、一般化性の向上とオーバーフィッティングの防止に不可欠である。
制約付き最適化問題としてトレーニングプロセスのフレーミングによるDNN正規化に対する新しいアプローチを提案する。
我々はAugmented Lagrangian (SAL) 法を用いて、より柔軟で効率的な正規化機構を実現する。
論文 参考訳(メタデータ) (2023-10-25T13:55:35Z) - Robust Regularization with Adversarial Labelling of Perturbed Samples [22.37046166576859]
本稿では、正規化手法として、ALPS(Adversarial Labelling of Perturbed Samples)を提案する。
ALPSはニューラルネットワークを、それぞれの真正な入力サンプルを、逆向きに割り当てられたラベルとともに、別のものに向かって摂動することによって形成された合成サンプルで訓練する。
SVHN、CIFAR-10、CIFAR-100、Tiny-ImageNetのデータセットによる実験は、ALPSが最先端の正規化性能を持っていることを示している。
論文 参考訳(メタデータ) (2021-05-28T11:26:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。