Fugu-MT 論文翻訳(概要): Learning Invariant Causal Mechanism from Vision-Language Models

論文の概要: Learning Invariant Causal Mechanism from Vision-Language Models

arxiv url: http://arxiv.org/abs/2405.15289v2
Date: Mon, 12 Aug 2024 10:53:03 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-13 21:12:59.779088
Title: Learning Invariant Causal Mechanism from Vision-Language Models
Title（参考訳）: 視覚言語モデルからの不変因果メカニズムの学習
Authors: Zeen Song, Siyu Zhao, Xingyu Zhang, Jiangmeng Li, Changwen Zheng, Wenwen Qiang,
Abstract要約: 現実世界のアプリケーションでは、CLIPモデルはトレーニング中に遭遇したシナリオよりも多様なシナリオで使用されることが多い。 Invariant Causal Mechanism for CLIP (CLIP-ICM)を提案する。提案手法は単純だが, 計算オーバーヘッドが大きくない。
参考スコア（独自算出の注目度）: 14.0158707862717
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Large-scale pre-trained vision-language models such as CLIP have been widely applied to a variety of downstream scenarios. In real-world applications, the CLIP model is often utilized in more diverse scenarios than those encountered during its training, a challenge known as the out-of-distribution (OOD) problem. However, our experiments reveal that CLIP performs unsatisfactorily in certain domains. Through a causal analysis, we find that CLIP's current prediction process cannot guarantee a low OOD risk. The lowest OOD risk can be achieved when the prediction process is based on invariant causal mechanisms, i.e., predicting solely based on invariant latent factors. However, theoretical analysis indicates that CLIP does not identify these invariant latent factors. Therefore, we propose the Invariant Causal Mechanism for CLIP (CLIP-ICM), a framework that first identifies invariant latent factors using interventional data and then performs invariant predictions across various domains. Our method is simple yet effective, without significant computational overhead. Experimental results demonstrate that CLIP-ICM significantly improves CLIP's performance in OOD scenarios.
Abstract（参考訳）: CLIPのような大規模な事前学習された視覚言語モデルは、様々なダウンストリームシナリオに広く適用されている。現実世界のアプリケーションでは、CLIPモデルはトレーニング中に遭遇したシナリオよりも多様なシナリオで使用されることが多い。しかし,実験の結果,CLIPは特定の領域で不満足に機能することが判明した。因果解析により、CLIPの現在の予測プロセスは低いOODリスクを保証できないことがわかった。最も低いOODリスクは、予測プロセスが不変因果機構、すなわち不変因果因子のみに基づいて予測する場合に達成できる。しかし、理論解析により、CLIPはこれらの不変潜伏因子を同定していないことが示されている。そこで我々はCLIPの不変因果メカニズム(CLIP-ICM)を提案する。これはまず、介入データを用いて不変因果関係を識別し、その後、様々な領域にわたって不変な予測を行うフレームワークである。提案手法は,計算オーバーヘッドを伴わず,単純かつ効果的である。実験の結果、CLIP-ICMはOODシナリオにおけるCLIPの性能を大幅に改善することが示された。

関連論文リスト

Learning Causality for Longitudinal Data [1.2691047660244335]
この論文は、高次元の時間変化データにおける因果推論と因果表現学習の手法を開発する。最初のコントリビューションは、個別処理効果(ITE)を推定するモデルであるCDVAE(Causal Dynamic Variational Autoencoder)の導入である。第2のコントリビューションでは,Contrastive Predictive Coding (CPC) とInfoMaxによって強化された RNN に基づく長期的反事実回帰のための効率的なフレームワークを提案する。第3のコントリビューションは、潜伏が観察された変数にどのように現れるかに対処することでCRLを前進させる。
論文参考訳（メタデータ） (2025-12-04T16:51:49Z)
Constraint-Reduced MILP with Local Outlier Factor Modeling for Plausible Counterfactual Explanations in Credit Approval [0.06999740786886534]
そこで本稿では, 局所外乱係数 (LOF) の制約数を大幅に削減するMILP(Mixed-Integer Linear Programming) の定式化を提案する。その結果,提案手法は説明品質を維持しつつ,より高速な解法時間を実現することがわかった。
論文参考訳（メタデータ） (2025-09-23T19:23:08Z)
Causal Disentanglement and Cross-Modal Alignment for Enhanced Few-Shot Learning [11.752632557524969]
Causal CLIP Adapter(CCA)は、CLIPから抽出された視覚的特徴を明示的に分離する新しいフレームワークである。本手法は, 分散シフトに対する数ショット性能とロバスト性の観点から, 常に最先端の手法より優れる。
論文参考訳（メタデータ） (2025-08-05T05:30:42Z)
ICLShield: Exploring and Mitigating In-Context Learning Backdoor Attacks [61.06621533874629]
In-context Learning (ICL)は、大規模言語モデル(LLM)において顕著な成功を収めた。本稿では,LLMがタスク関連潜伏概念とバックドア関連潜伏概念の両方を同時に学習する,という二重学習仮説を初めて提案する。そこで本研究では,概念選好比を動的に調整する防衛機構であるICLShieldを提案する。
論文参考訳（メタデータ） (2025-07-02T03:09:20Z)
From predictions to confidence intervals: an empirical study of conformal prediction methods for in-context learning [4.758643223243787]
本稿では,共形予測に基づく予測区間の構築手法を提案する。従来のコンフォメーション法はモデルフィッティングの繰り返しによる計算コストが高いが,ICLを利用して1回のフォワードパスで信頼区間を効率よく生成する。我々の実証分析は、リッジ回帰に基づくコンフォメーション手法に対するこのアプローチと比較し、インコンテキスト学習(CP with ICL)によるコンフォメーション予測が、堅牢でスケーラブルな不確実性推定を実現することを示す。
論文参考訳（メタデータ） (2025-04-22T09:11:48Z)
Model Hemorrhage and the Robustness Limits of Large Language Models [119.46442117681147]
大規模言語モデル(LLM)は、自然言語処理タスク全体で強力なパフォーマンスを示すが、デプロイメント用に修正された場合、大幅なパフォーマンス低下を経験する。この現象をモデル出血(パラメータ変更とアーキテクチャ変更によるパフォーマンス低下)と定義する。
論文参考訳（メタデータ） (2025-03-31T10:16:03Z)
Self-Healing Machine Learning: A Framework for Autonomous Adaptation in Real-World Environments [50.310636905746975]
実世界の機械学習システムは、基礎となるデータ生成プロセスの分散シフトによって、モデルの性能劣化に遭遇することが多い。概念のドリフト適応のような既存のシフトへのアプローチは、その理性に依存しない性質によって制限される。我々はこれらの制限を克服するために自己修復機械学習(SHML)を提案する。
論文参考訳（メタデータ） (2024-10-31T20:05:51Z)
Cycles of Thought: Measuring LLM Confidence through Stable Explanations [53.15438489398938]
大規模言語モデル(LLM)は、様々なベンチマークで人間レベルの精度に到達し、さらに超えることができるが、不正確な応答における過度な自信は、依然として十分に文書化された障害モードである。本稿では,LLMの不確実性を測定するためのフレームワークを提案する。
論文参考訳（メタデータ） (2024-06-05T16:35:30Z)
Contrastive Learning Via Equivariant Representation [19.112460889771423]
CLeVERは,任意の複雑性の増大戦略に適合する,新しい異種コントラスト学習フレームワークである。実験結果から,CLeVERは実用自然画像から同変情報を効果的に抽出し,組み込んだ。
論文参考訳（メタデータ） (2024-06-01T01:53:51Z)
Bayesian Exploration of Pre-trained Models for Low-shot Image Classification [14.211305168954594]
本研究はガウス過程に基づくシンプルで効果的な確率的モデルアンサンブルフレームワークを提案する。平均関数をCLIPとカーネル関数で指定することで,事前知識の統合を実現する。提案手法は,予測性能に関する競争アンサンブルベースラインを一貫して上回ることを示す。
論文参考訳（メタデータ） (2024-03-30T10:25:28Z)
Diagnosing and Rectifying Fake OOD Invariance: A Restructured Causal Approach [51.012396632595554]
不変表現学習(IRL)は、不変因果的特徴から環境から切り離されたラベルへの予測を促進する。最近の理論的結果は、IRLによって回復されたいくつかの因果的特徴は、訓練環境ではドメイン不変のふりをするが、目に見えない領域では失敗する。本研究では,RS-SCMに関する条件付き相互情報に基づく手法を開発し,その効果を巧みに補正する。
論文参考訳（メタデータ） (2023-12-15T12:58:05Z)
Variance of ML-based software fault predictors: are we really improving fault prediction? [0.3222802562733786]
我々は、最先端の故障予測手法のばらつきを実験的に分析する。我々は,クラス毎の精度測定値において最大10.10%のばらつきを観測した。
論文参考訳（メタデータ） (2023-10-26T09:31:32Z)
CLIPood: Generalizing CLIP to Out-of-Distributions [73.86353105017076]
対照的に、CLIP(Language-image Pre-training)モデルでは、印象的なゼロショット能力を示しているが、下流タスクにおけるCLIPのさらなる適応は、OODのパフォーマンスを好ましくない劣化させる。ドメインシフトとオープンクラスの両方が見えないテストデータ上で発生する可能性があるOOD状況にCLIPモデルを適用するための微調整手法であるCLIPoodを提案する。さまざまなOODシナリオによるさまざまなデータセットの実験は、CLIPoodが既存の一般化テクニックを一貫して上回っていることを示している。
論文参考訳（メタデータ） (2023-02-02T04:27:54Z)
Learning Counterfactually Invariant Predictors [11.682403472580162]
我々はCIP(Counterfactual Invariant Prediction)と呼ばれるモデルに依存しないフレームワークを提案する。実験の結果,CIPが様々なシミュレーションおよび実世界のデータセットに反実的不変性を付与する効果が示された。
論文参考訳（メタデータ） (2022-07-20T09:23:35Z)
Out-of-distribution Generalization with Causal Invariant Transformations [17.18953986654873]
本研究では,因果的特徴を明示的に回復することなく,OOD問題に対処する。不変因果機構の設定の下で、理論的には、そのような変換がすべて利用可能であれば、最小限の最適モデルを学ぶことができる。これらの因果不変変換の完全な集合が非現実的であることを知ることは、これらの変換のサブセットのみを知るのに十分であることを示す。
論文参考訳（メタデータ） (2022-03-22T08:04:38Z)
Variance Minimization in the Wasserstein Space for Invariant Causal Prediction [72.13445677280792]
そこで本研究では,ICPで行ったアプローチを,予測器数で線形にスケールする一連の非パラメトリックテストとして再検討する。これらのテストはそれぞれ、最適輸送理論の道具から導かれる新しい損失関数の最小化に依存している。我々は,本手法が同定可能な直接原因の集合を回復できるという軽微な仮定の下で証明し,他のベンチマーク因果探索アルゴリズムと競合することを示す。
論文参考訳（メタデータ） (2021-10-13T22:30:47Z)
Discovering Latent Causal Variables via Mechanism Sparsity: A New Principle for Nonlinear ICA [81.4991350761909]
ICA(Independent component analysis)は、この目的を定式化し、実用的な応用のための推定手順を提供する手法の集合を指す。潜伏変数は、潜伏機構をスパースに正則化すれば、置換まで復元可能であることを示す。
論文参考訳（メタデータ） (2021-07-21T14:22:14Z)
Nonlinear Invariant Risk Minimization: A Causal Approach [5.63479133344366]
非線形環境下での分布外一般化を可能にする学習パラダイムを提案する。我々は、非常に単純な変換までデータ表現の識別性を示す。合成データと実世界のデータセットの両方に関する広範な実験は、我々のアプローチが様々なベースラインメソッドを大きく上回っていることを示している。
論文参考訳（メタデータ） (2021-02-24T15:38:41Z)
Learning Causal Semantic Representation for Out-of-Distribution Prediction [125.38836464226092]
因果推論に基づく因果意味生成モデル(CSG)を提案し,その2つの要因を別々にモデル化する。 CSGはトレーニングデータに適合させることで意味的因子を識別できることを示し、この意味的識別はOOD一般化誤差の有界性を保証する。
論文参考訳（メタデータ） (2020-11-03T13:16:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。