論文の概要: Smoothing the Black-Box: Signed-Distance Supervision for Black-Box Model Copying
- arxiv url: http://arxiv.org/abs/2601.20773v1
- Date: Wed, 28 Jan 2026 17:00:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-29 15:46:07.029684
- Title: Smoothing the Black-Box: Signed-Distance Supervision for Black-Box Model Copying
- Title(参考訳): ブラックボックスの平滑化:ブラックボックスモデルコピーのためのサイン付き距離スーパービジョン
- Authors: Rubén Jiménez, Oriol Pujol,
- Abstract要約: ブラックボックスのコピーは、レガシーモデルをアップグレードする実用的なメカニズムを提供する。
ハードラベル出力に制限された場合、コピーは不連続な表面再構成問題となる。
本稿では,教師の意思決定境界に署名された距離にハードレーベルの監督を置き換える距離ベース複写フレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.6015898117103069
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deployed machine learning systems must continuously evolve as data, architectures, and regulations change, often without access to original training data or model internals. In such settings, black-box copying provides a practical refactoring mechanism, i.e. upgrading legacy models by learning replicas from input-output queries alone. When restricted to hard-label outputs, copying turns into a discontinuous surface reconstruction problem from pointwise queries, severely limiting the ability to recover boundary geometry efficiently. We propose a distance-based copying (distillation) framework that replaces hard-label supervision with signed distances to the teacher's decision boundary, converting copying into a smooth regression problem that exploits local geometry. We develop an $α$-governed smoothing and regularization scheme with Hölder/Lipschitz control over the induced target surface, and introduce two model-agnostic algorithms to estimate signed distances under label-only access. Experiments on synthetic problems and UCI benchmarks show consistent improvements in fidelity and generalization accuracy over hard-label baselines, while enabling distance outputs as uncertainty-related signals for black-box replicas.
- Abstract(参考訳): デプロイされた機械学習システムは、オリジナルのトレーニングデータやモデル内部にアクセスせずに、データ、アーキテクチャ、規制が変わるにつれて、継続的に進化しなければなりません。
このような設定では、ブラックボックスのコピーは、例えば、入力出力クエリだけでレプリカを学習することでレガシーモデルをアップグレードする、実用的なリファクタリングメカニズムを提供する。
ハードラベル出力に制限された場合、コピーはポイントワイドクエリによる不連続な表面再構成問題となり、境界幾何を効率的に回復する能力を著しく制限する。
本稿では,教師の意思決定境界に符号付き距離でハードラベルの監督を置き換え,コピーを局所的な幾何学的手法を用いたスムーズな回帰問題に変換する,距離ベースの複写(蒸留)フレームワークを提案する。
我々は,Hölder/Lipschitz制御を誘導対象面上で適用し,ラベルのみアクセス下で符号付き距離を推定する2つのモデル非依存アルゴリズムを提案する。
合成問題とUCIベンチマークの実験では、ハードラベルベースラインよりも忠実度と一般化精度が一貫した改善を示し、ブラックボックスレプリカの不確実性関連信号として距離出力を可能にした。
関連論文リスト
- PEARL: Prototype-Enhanced Alignment for Label-Efficient Representation Learning with Deployment-Driven Insights from Digital Governance Communication Systems [7.027521313133687]
PEARL は,クラスプロトタイプへの埋め込みをソフトに整列させるため,限定的な監督を用いたラベル効率のよい手法である。
PEARLを極度のラベル不足から高いラベル設定まで制御されたラベル条件下で評価する。
ラベル・スカース条件下では、PEARLは局所的な品質を大幅に改善し、生の埋め込みよりも25.7%向上し、強い監督されていない後処理と比較して21.1%以上向上する。
論文 参考訳(メタデータ) (2026-01-24T15:46:02Z) - To Copy or Not to Copy: Copying Is Easier to Induce Than Recall [5.057026826740146]
言語モデルは、重みに格納されたパラメトリック知識と、プロンプトの文脈情報とを仲裁しなければならない。
本研究は, モデルアクティベーションから慣性ベクトルを抽出し, その選択に関する力学的検討を行う。
論文 参考訳(メタデータ) (2026-01-17T14:46:29Z) - DST-Calib: A Dual-Path, Self-Supervised, Target-Free LiDAR-Camera Extrinsic Calibration Network [57.22935789233992]
本稿では,オンライン方式で動作するLiDARカメラ外装キャリブレーションネットワークについて紹介する。
提案手法は,一般化可能性の観点から既存手法を著しく上回っている。
論文 参考訳(メタデータ) (2026-01-03T13:57:01Z) - Deep Delta Learning [91.75868893250662]
本稿では,標準残差接続を一般化した新しいアーキテクチャであるDeep Delta Learning(DDL)を紹介する。
我々はこの演算子のスペクトル解析を行い、ゲート$(mathbfX)$がアイデンティティマッピング、投影、幾何反射のダイナミックな相互作用を可能にすることを示した。
この統合により、ネットワークは階層的な遷移作用素のスペクトルを明示的に制御することができ、複雑な非単調力学のモデリングを可能にする。
論文 参考訳(メタデータ) (2026-01-01T18:11:38Z) - SoliReward: Mitigating Susceptibility to Reward Hacking and Annotation Noise in Video Generation Reward Models [53.19726629537694]
ビデオ生成モデルと人間の好みのトレーニング後のアライメントは、重要な目標である。
現在のデータ収集パラダイムは、プロンプト内のペアワイズアノテーションに依存しており、ノイズのラベル付けに悩まされている。
ビデオRMトレーニングのための体系的フレームワークであるSoliRewardを提案する。
論文 参考訳(メタデータ) (2025-12-17T14:28:23Z) - Datarus-R1: An Adaptive Multi-Step Reasoning LLM for Automated Data Analysis [0.0]
本稿では,Qwen 2.5-14B-Instructの言語モデルであるDatarus-R1-14Bを提案する。
Datarusは、独立した問合せペアではなく、推論ステップ、コード実行、エラートレース、自己補正、最終的な結論を含む完全な分析トラジェクトリに基づいて訓練されている。
論文 参考訳(メタデータ) (2025-08-18T21:58:18Z) - On-the-Fly Adaptive Distillation of Transformer to Dual-State Linear Attention [53.22963042513293]
大規模言語モデル(LLM)は、自己アテンションを通じてグローバルトークンの依存関係をキャプチャするが、長い入力に対する計算とメモリコストに直面する。
まず,二状態線形注意(Dual-state linear attention, A)を提案する。これは2つの隠れ状態を保持する設計であり,その1つは,リニアアテンションアーキテクチャの典型的な短距離バイアスを緩和し,リニアアテンションを追尾するものである。
本稿では,DSLA層を段階的に置き換えるオンライン適応蒸留フレームワークであるDSLA-Serveを紹介する。
論文 参考訳(メタデータ) (2025-06-11T01:25:06Z) - BFRFormer: Transformer-based generator for Real-World Blind Face
Restoration [37.77996097891398]
本稿では,トランスフォーマーをベースとしたブラインドフェイス復元手法BFRFormerを提案する。
提案手法は, 合成データセットと実世界の4つのデータセットにおいて, 最先端の手法より優れる。
論文 参考訳(メタデータ) (2024-02-29T02:31:54Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Tourbillon: a Physically Plausible Neural Architecture [8.7660229706359]
Tourbillonは、バックプロパゲーションの制限に対処する新しいアーキテクチャである。
Tourbillonは、バックプロパゲーションで訓練されたモデルに匹敵するパフォーマンスを達成できることを示す。
論文 参考訳(メタデータ) (2021-07-13T22:51:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。