論文の概要: In Defense of Information Leakage in Concept-based Models
- arxiv url: http://arxiv.org/abs/2606.10669v1
- Date: Tue, 09 Jun 2026 10:19:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.441254
- Title: In Defense of Information Leakage in Concept-based Models
- Title(参考訳): 概念モデルにおける情報漏洩の防御
- Authors: Mateo Espinosa Zarlenga,
- Abstract要約: 概念ベースモデル(CM)は、概念に依存しない情報を漏らす表現を学習する。
このリークは望ましくないもので、解釈不能なモデルにつながるため、根絶されるべきである。
概念の不完全性が標準である実世界の環境では、正確でインターベンザブルなCMを構築するのに、いくつかのリークがしばしば必要である、と我々は主張する。
- 参考スコア(独自算出の注目度): 5.959957715491888
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Concept-based models (CMs), deep neural networks that ground their predictions on representations aligned with human-understandable concepts (e.g., "round", "stripes", etc.), have been shown to learn representations that leak concept-irrelevant information. As the traditional narrative goes, this leakage is undesirable and should be eradicated as it leads to uninterpretable models. In this paper, we posit that this conventional view of leakage in CMs is not only ill-posed, as the evidence of how leakage makes a model less interpretable is often inconclusive, but also bound to lead to impractical CMs under common real-world constraints. Specifically, we argue that in real-world settings where concept incompleteness is the norm, some leakage is often necessary for constructing accurate and intervenable CMs. To this end, we propose that there is such a thing as benign leakage and show that, by optimizing a reframing of the typical CM training objective, CMs can encourage and exploit this form of leakage without sacrificing accuracy or intervenability.
- Abstract(参考訳): 概念ベースモデル(CM)、人間の理解できない概念(例えば「丸」や「ストリップ」など)に沿った表現に基づいて予測を基礎とするディープニューラルネットワークは、概念関連情報を漏洩する表現を学ぶために示されている。
伝統的な物語が進むにつれて、このリークは望ましくないものであり、解釈不能なモデルにつながるため、根絶されるべきである。
本稿では, 従来のCMにおける漏洩の見方が不適切であるだけでなく, 一般の現実的制約下での非現実的CMに結びつくことがしばしばあるため, モデルが解釈しにくいことを示す証拠として提示する。
具体的には、概念の不完全性が標準である実世界の環境では、正確でインターベンタブルなCMを構築するのに、いくつかのリークが必要であると論じる。
そこで本稿では, 従来のCMトレーニング目標の再フレーミングを最適化することで, 正確性や介入性を損なうことなく, この形態の漏洩を促進・活用できることを示す。
関連論文リスト
- Rethinking Concept Bottleneck Models: From Pitfalls to Solutions [53.84388497227224]
概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、人間の理解可能な概念の基底予測である。
CBM-Suiteはこれらの課題に対処するための方法論的なフレームワークである。
論文 参考訳(メタデータ) (2026-03-05T19:37:49Z) - Is Model Editing Built on Sand? Revealing Its Illusory Success and Fragile Foundation [50.40861036534546]
大きな言語モデル(LLM)は、必然的に時代遅れまたは誤った知識をエンコードする。そのような知識の更新、削除、そして忘れは、アライメント、安全性、その他の問題にとって重要である。
この問題を解決するために、モデル編集は有望なパラダイムとして現れ、特定の事実が更新され、他の知識を保持しながら、パラメータの小さなサブセットを正確に編集する。
前回の論文で大きな成功を収めたにもかかわらず、編集の信頼性は脆弱な基盤にかかっていることが判明した。
我々の経験的証拠は、編集が完全な意味論よりもショートカットに基づく可能性が高いことを示し、さらなる進歩の前にモデル編集の基盤を急激な再考を求める。
論文 参考訳(メタデータ) (2025-10-01T07:59:23Z) - Seeing Through Deception: Uncovering Misleading Creator Intent in Multimodal News with Vision-Language Models [65.23999399834638]
DeceptionDecodedは,信頼に値する参照記事に基づく12,000のイメージキャプチャペアのベンチマークである。
データセットは、誤解を招くケースと、誤解を招くケースの両方をキャプチャし、視覚的およびテキスト的モダリティにわたって操作する。
インテント中心の3つのタスク – 意図の検出を誤解させる、ソースの属性を誤解させる、創造的欲求推論 – をサポートしている。
論文 参考訳(メタデータ) (2025-05-21T13:14:32Z) - Avoiding Leakage Poisoning: Concept Interventions Under Distribution Shifts [10.806525657355872]
本稿では,概念ベースモデル(CM)がアウト・オブ・ディストリビューション(OOD)の入力にどのように反応するかを検討する。
我々はMixCEMという新しいCMを紹介した。これは、この情報が流通中である場合に限って、その概念から漏れた漏洩情報を動的に活用することを学ぶ。
論文 参考訳(メタデータ) (2025-04-24T20:24:31Z) - Leakage and Interpretability in Concept-Based Models [0.24466725954625887]
概念ボトルネックモデルは、高レベルの中間概念を予測することによって解釈可能性を改善することを目的としている。
それらは情報漏洩に悩まされ、学習された概念の中で符号化された意図しない情報を利用するモデルで知られている。
漏洩を厳格に特徴づけ定量化するための情報理論フレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-18T22:21:06Z) - How to Continually Adapt Text-to-Image Diffusion Models for Flexible Customization? [91.49559116493414]
本稿では,CIDM(Concept-Incremental Text-to-image Diffusion Model)を提案する。
破滅的な忘れと概念の無視を解決し、新しいカスタマイズタスクを概念的な方法で学習する。
実験により、CIDMが既存のカスタム拡散モデルを上回ることが確認された。
論文 参考訳(メタデータ) (2024-10-23T06:47:29Z) - Concept Arithmetics for Circumventing Concept Inhibition in Diffusion Models [58.065255696601604]
拡散モデルの合成特性を使い、単一の画像生成において複数のプロンプトを利用することができる。
本論では, 画像生成の可能なすべてのアプローチを, 相手が適用可能な拡散モデルで検討することが重要であると論じる。
論文 参考訳(メタデータ) (2024-04-21T16:35:16Z) - Implicit Concept Removal of Diffusion Models [92.55152501707995]
テキスト・ツー・イメージ(T2I)拡散モデルはしばしば、透かしや安全でない画像のような望ましくない概念を不注意に生成する。
幾何学駆動制御に基づく新しい概念除去手法であるGeom-Erasingを提案する。
論文 参考訳(メタデータ) (2023-10-09T17:13:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。