論文の概要: Label Forensics: Interpreting Hard Labels in Black-Box Text Classifier
- arxiv url: http://arxiv.org/abs/2512.01514v1
- Date: Mon, 01 Dec 2025 10:39:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.808443
- Title: Label Forensics: Interpreting Hard Labels in Black-Box Text Classifier
- Title(参考訳): Label Forensics: Black-Box テキスト分類器におけるハードラベルの解釈
- Authors: Mengyao Du, Gang Yang, Han Fang, Quanjun Yin, Ee-chien Chang,
- Abstract要約: ラベルの意味を再構築するブラックボックスフレームワークであるラベル法医学を紹介する。
複数のブラックボックス分類器の実験では、平均的なラベルの一貫性は約92.24%に達する。
- 参考スコア(独自算出の注目度): 27.11428257480993
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The widespread adoption of natural language processing techniques has led to an unprecedented growth of text classifiers across the modern web. Yet many of these models circulate with their internal semantics undocumented or even intentionally withheld. Such opaque classifiers, which may expose only hard-label outputs, can operate in unregulated web environments or be repurposed for unknown intents, raising legitimate forensic and auditing concerns. In this paper, we position ourselves as investigators and work to infer the semantic concept each label encodes in an undocumented black-box classifier. Specifically, we introduce label forensics, a black-box framework that reconstructs a label's semantic meaning. Concretely, we represent a label by a sentence embedding distribution from which any sample reliably reflects the concept the classifier has implicitly learned for that label. We believe this distribution should maintain two key properties: precise, with samples consistently classified into the target label, and general, covering the label's broad semantic space. To realize this, we design a semantic neighborhood sampler and an iterative optimization procedure to select representative seed sentences that jointly maximize label consistency and distributional coverage. The final output, an optimized seed sentence set combined with the sampler, constitutes the empirical distribution representing the label's semantics. Experiments on multiple black-box classifiers achieve an average label consistency of around 92.24 percent, demonstrating that the embedding regions accurately capture each classifier's label semantics. We further validate our framework on an undocumented HuggingFace classifier, enabling fine-grained label interpretation and supporting responsible AI auditing.
- Abstract(参考訳): 自然言語処理技術の普及により、現代のウェブ全体でテキスト分類器が前例のない成長を遂げた。
しかし、これらのモデルの多くは、内部のセマンティクスが文書化されていない、あるいは意図的に保持されていない状態で流通している。
このような不透明な分類器は、ハードラベルの出力しか公開しないため、規制されていないWeb環境で動作したり、未知の目的のために再利用することができる。
本稿では,自己を研究者として位置づけ,各ラベルがエンコードする意味概念を文書化されていないブラックボックス分類器に推論する作業を行う。
具体的には,ラベルの意味を再構築するブラックボックスフレームワークであるラベル法医学を紹介する。
具体的には,どのサンプルもそのラベルに対して暗黙的に学習した概念を確実に反映した文埋め込み分布によってラベルを表現する。
我々は、この分布が2つの重要な特性を維持すべきであると信じている:正確に、常にターゲットラベルに分類されたサンプルと、ラベルの広い意味空間を包含する一般のサンプルである。
これを実現するために、ラベルの一貫性と分布範囲を最大化する代表的なシード文を選択するために、セマンティックな近傍サンプルと反復的な最適化手順を設計する。
最終出力は、最適化されたシード文セットとサンプルが組み合わされ、ラベルの意味を表す経験的分布を構成する。
複数のブラックボックス分類器の実験は、平均的なラベル一貫性を92.24パーセント達成し、埋め込み領域がそれぞれの分類器のラベルセマンティクスを正確に捉えることを示した。
我々はさらに、未文書のHuggingFace分類器上で、詳細なラベル解釈を可能にし、責任あるAI監査をサポートするフレームワークを検証する。
関連論文リスト
- One Size Does Not Fit All: Exploring Variable Thresholds for Distance-Based Multi-Label Text Classification [1.8165993946919816]
距離に基づく教師なしテキスト分類では、ラベルとテキスト間の意味的類似性を使用してラベルの関連性を決定する。
類似度分布は、モデル、データセット、さらにはラベルセットの間で統計的に有意な差異を示す。
検証セットを用いてラベル固有の閾値を最適化する新しい手法を提案する。
論文 参考訳(メタデータ) (2025-10-13T08:52:14Z) - Sanitizing Manufacturing Dataset Labels Using Vision-Language Models [1.0819408603463427]
本稿では,ラベル・サニタイズ・リファインメントのための視覚言語ベースのフレームワークであるVLSRについて紹介する。
この方法は、CLIPビジョン言語モデルを利用して、画像とその関連するテキストラベルを共有意味空間に埋め込む。
実験の結果、VLSRフレームワークは問題のあるラベルの識別に成功し、ラベルの一貫性を向上させることがわかった。
論文 参考訳(メタデータ) (2025-06-30T02:13:09Z) - Zero-Shot Pseudo Labels Generation Using SAM and CLIP for Semi-Supervised Semantic Segmentation [0.0]
注釈付きラベルと擬似ラベルを用いた画像を用いた意味的セグメンテーションモデルを訓練する手法を提案する。
モデルの精度は、擬似ラベルの品質と注釈付きラベルによるデータの量に依存する。
提案手法の有効性は,公開データセットであるPASCALとMS COCOを用いて実証した。
論文 参考訳(メタデータ) (2025-05-26T11:31:13Z) - Scribble Hides Class: Promoting Scribble-Based Weakly-Supervised
Semantic Segmentation with Its Class Label [16.745019028033518]
画像レベルのクラスから情報を得たスクリブルアノテーションと擬似ラベルと、監督のためのグローバルセマンティクスの両方を利用するクラス駆動型スクリブルプロモーションネットワークを提案する。
スクリブルアノテーションの異なる性質を持つScribbleSupデータセットの実験は、従来の手法よりも優れており、本手法の優位性と堅牢性を示している。
論文 参考訳(メタデータ) (2024-02-27T14:51:56Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - Debiased Contrastive Learning [64.98602526764599]
我々は,同ラベルデータポイントのサンプリングを補正する,偏りのあるコントラスト目的の開発を行う。
実証的に、提案する目的は、視覚、言語、強化学習ベンチマークにおける表現学習の最先端を一貫して上回る。
論文 参考訳(メタデータ) (2020-07-01T04:25:24Z) - MatchGAN: A Self-Supervised Semi-Supervised Conditional Generative
Adversarial Network [51.84251358009803]
本稿では,条件付き生成逆数ネットワーク(GAN)に対する,半教師付き環境下での自己教師型学習手法を提案する。
利用可能な数少ないラベル付きサンプルのラベル空間から無作為なラベルをサンプリングして拡張を行う。
本手法は,ベースラインのトレーニングに使用したラベル付きサンプルの20%に過ぎません。
論文 参考訳(メタデータ) (2020-06-11T17:14:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。