論文の概要: Rate-Distortion Signatures of Generalization and Information Trade-offs
- arxiv url: http://arxiv.org/abs/2603.01568v1
- Date: Mon, 02 Mar 2026 07:48:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.745923
- Title: Rate-Distortion Signatures of Generalization and Information Trade-offs
- Title(参考訳): 一般化と情報トレードオフの速度歪み信号
- Authors: Leyla Roksan Caglar, Pedro A. M. Mediano, Baihan Lin,
- Abstract要約: 新たな視覚条件への一般化は、人間と機械の両方の視覚にとって、依然として中心的な課題である。
標準的なロバストネスメトリクスは、システムのロバストネスに対する精度の取引方法に関する限られた洞察を提供する。
本稿では,刺激応答行動を効果的な通信チャネルとして扱う速度歪み理論フレームワークを提案する。
- 参考スコア(独自算出の注目度): 13.021443536696497
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generalization to novel visual conditions remains a central challenge for both human and machine vision, yet standard robustness metrics offer limited insight into how systems trade accuracy for robustness. We introduce a rate-distortion-theoretic framework that treats stimulus-response behavior as an effective communication channel, derives rate-distortion (RD) frontiers from confusion matrices, and summarizes each system with two interpretable geometric signatures - slope ($β$) and curvature ($κ$) - which capture the marginal cost and abruptness of accuracy-robustness trade-offs. Applying this framework to human psychophysics and 18 deep vision models under controlled image perturbations, we compare generalization geometry across model architectures and training regimes. We find that both biological and artificial systems follow a common lossy-compression principle but occupy systematically different regions of RD space. In particular, humans exhibit smoother, more flexible trade-offs, whereas modern deep networks operate in steeper and more brittle regimes even at matched accuracy. Across training regimes, robustness training induces systematic but dissociable shifts in beta/kappa, revealing cases where improved robustness or accuracy does not translate into more human-like generalization geometry. These results demonstrate that RD geometry provides a compact, model-agnostic lens for comparing generalization behavior across systems beyond standard accuracy-based metrics.
- Abstract(参考訳): 新たな視覚条件への一般化は、人間と機械の両方にとって依然として中心的な課題である。
本稿では,刺激応答挙動を効果的な通信チャネルとして扱うための速度歪み理論フレームワークを導入し,乱雑な行列からRDフロンティアを導出し,各システムを2つの解釈可能な幾何学的シグネチャ(スロープ(β$)と曲率(κ$))で要約する。
この枠組みを人間の心理物理学と18の深部視覚モデルに適用し、モデルアーキテクチャとトレーニング体制間の一般化幾何を比較した。
生体系と人工系は共通の損失圧縮原理に従っているものの、RD空間の系統的に異なる領域を占有していることがわかった。
特に人間はよりスムーズで柔軟なトレードオフを示し、一方現代のディープネットワークは、一致した精度でもより急激で不安定な状態で動作する。
トレーニング体制全体では、ロバストネストレーニングは、ベータ/カッパの体系的だが解離可能なシフトを誘導し、ロバストネスの改善や精度がより人間的な一般化幾何学に変換されないケースを明らかにする。
これらの結果から、RD幾何は標準的な精度に基づく測度を超えるシステム間での一般化挙動を比較するためのコンパクトでモデルに依存しないレンズを提供することが示された。
関連論文リスト
- Diagnosing Generalization Failures from Representational Geometry Markers [8.403001493770427]
医用バイオマーカーにインスパイアされた一般化失敗について検討する。
我々は,ネットワークマーカーを設計,テストし,構造や機能リンクの探索,予後指標の同定,実環境における予測の検証を行う。
この研究は、表現幾何学が隠れた脆弱性を隠蔽し、モデル選択とAI解釈可能性に関するより堅牢なガイダンスを提供することを示した。
論文 参考訳(メタデータ) (2026-03-02T13:59:19Z) - ERGO: Excess-Risk-Guided Optimization for High-Fidelity Monocular 3D Gaussian Splatting [63.138778159026934]
本稿では,ERGOと呼ばれる過度のリスク分解によって導かれる適応最適化フレームワークを提案する。
ERGOはビュー固有の過剰リスクを動的に推定し、最適化中の損失重みを適応的に調整する。
Google Scanned ObjectsデータセットとOmniObject3Dデータセットの実験は、既存の最先端メソッドよりもERGOの方が優れていることを示している。
論文 参考訳(メタデータ) (2026-02-10T20:44:43Z) - Joint Source-Channel-Generation Coding: From Distortion-oriented Reconstruction to Semantic-consistent Generation [58.67925548779465]
本稿では,知覚的再構成から確率的生成へ焦点を移す新しいパラダイムとして,JSCGC(Joint Source-Channel-Generation Coding)を提案する。
JSCGCは意味的品質と意味的忠実性を大幅に改善し、従来の歪み指向J SCC法よりも大幅に向上する。
論文 参考訳(メタデータ) (2026-01-19T08:12:47Z) - Deterministic World Models for Verification of Closed-loop Vision-based Systems [2.5051366017487715]
本稿では,システム状態を直接生成画像にマッピングし,正確な入力境界を確保するための決定論的世界モデル(DWM)を提案する。
我々はDWMをStar-based reachability analysis(StarV)を利用した検証パイプラインに統合し、厳密な統計的境界を導出するために共形予測を用いる。
標準ベンチマーク実験により,提案手法は潜在変数ベースラインよりもはるかに密着性が高く,検証性能も良好であることが示された。
論文 参考訳(メタデータ) (2025-12-08T02:32:07Z) - TopoReformer: Mitigating Adversarial Attacks Using Topological Purification in OCR Models [2.8272661103123258]
テキストの逆摂動画像は、OCRシステムが人間の目に見えない変化から誤った書き起こしや誤った書き起こしを発生させる可能性がある。
既存の防御、例えば、敵の訓練、入力前処理、あるいは認識後の補正は、しばしばモデル固有であり、計算的に高価であり、摂動しない入力のパフォーマンスに影響する。
TopoReformerは、テキストイメージの構造的整合性を保ちながら、敵対的摂動を緩和するモデルに依存しない改革パイプラインである。
論文 参考訳(メタデータ) (2025-11-19T19:01:51Z) - Causal Graph Profiling via Structural Divergence for Robust Anomaly Detection in Cyber-Physical Systems [25.567981742631005]
公共インフラシステムにおける信頼性の高いサイバー攻撃検出のために設計された因果グラフに基づく異常検出フレームワーク。
CGADは、因果プロファイリングと異常スコアという2段階の監視フレームワークに従う。
因果構造を利用することで、CGADは非定常および不均衡な時系列環境において優れた適応性と精度を実現する。
論文 参考訳(メタデータ) (2025-08-13T05:26:43Z) - Fair Deepfake Detectors Can Generalize [51.21167546843708]
共同設立者(データ分散とモデルキャパシティ)の制御により,公正な介入による一般化が向上することを示す。
この知見を応用して, 逆正当性重み付けとサブグループワイド特徴正規化を併用し, 新たなアライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・インセンティブ・インターベンション・インベンション・インテクション(DAID)を提案する。
DAIDは、いくつかの最先端技術と比較して、公平性と一般化の両方において一貫して優れた性能を達成する
論文 参考訳(メタデータ) (2025-07-03T14:10:02Z) - Generalized Linear Mode Connectivity for Transformers [87.32299363530996]
驚くべき現象はリニアモード接続(LMC)であり、独立に訓練されたモデルを低損失またはゼロ損失の経路で接続することができる。
以前の研究は主に置換によるニューロンの並べ替えに焦点を合わせてきたが、そのようなアプローチは範囲に限られている。
我々は、4つの対称性クラス(置換、半置換、変換、一般可逆写像)をキャプチャする統一的なフレームワークを導入する。
この一般化により、独立に訓練された視覚変換器とGPT-2モデルの間の低障壁とゼロバリア線形経路の発見が可能となった。
論文 参考訳(メタデータ) (2025-06-28T01:46:36Z) - NDCG-Consistent Softmax Approximation with Accelerated Convergence [67.10365329542365]
本稿では,ランキングの指標と直接一致した新たな損失定式化を提案する。
提案したRG損失を高効率な Alternating Least Squares (ALS) 最適化手法と統合する。
実世界のデータセットに対する実証的な評価は、我々のアプローチが同等または上位のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-06-11T06:59:17Z) - Mitigating Bias in Facial Recognition Systems: Centroid Fairness Loss Optimization [9.537960917804993]
公正なAIシステムの社会的需要は、新しい公正性基準を満たす予測モデルを開発する研究コミュニティに圧力を与えている。
特に、特定の人口セグメントにまたがる特定の顔認識(FR)システムによる誤差の変動は、後者の展開を損なう。
本稿では,Centroid-based scores に作用する回帰損失を最適化することにより,事前学習されたFRモデルの公平性を改善するための新しいポストプロセッシング手法を提案する。
論文 参考訳(メタデータ) (2025-04-27T22:17:44Z) - Beyond the Kolmogorov Barrier: A Learnable Weighted Hybrid Autoencoder for Model Order Reduction [0.8021197489470758]
我々は,コルモゴロフ障壁を克服するために,学習可能な重み付きハイブリッドオートエンコーダを提案する。
トレーニングされたモデルは、他のモデルに比べて何千倍もシャープさが小さいことを実証的に見出した。
論文 参考訳(メタデータ) (2024-10-23T00:04:26Z) - Spatiotemporal Implicit Neural Representation as a Generalized Traffic Data Learner [46.866240648471894]
時空間交通データ(STTD)は、マルチスケール交通システムの複雑な動的挙動を測定する。
本稿では,STTDを暗黙的ニューラル表現としてパラメータ化することで,STTD学習問題に対処する新しいパラダイムを提案する。
実世界のシナリオにおける広範な実験を通じて,その有効性を検証し,廊下からネットワークスケールへの応用を示す。
論文 参考訳(メタデータ) (2024-05-06T06:23:06Z) - Rethinking Bias Mitigation: Fairer Architectures Make for Fairer Face
Recognition [107.58227666024791]
顔認識システムは、法執行を含む安全クリティカルなアプリケーションに広くデプロイされている。
彼らは、性別や人種など、様々な社会的デデノグラフィー次元に偏見を示す。
バイアス軽減に関するこれまでの研究は、主にトレーニングデータの事前処理に重点を置いていた。
論文 参考訳(メタデータ) (2022-10-18T15:46:05Z) - Generalized Real-World Super-Resolution through Adversarial Robustness [107.02188934602802]
本稿では,実世界のSRに取り組むために,敵攻撃の一般化能力を活用したロバスト超解法を提案する。
我々の新しいフレームワークは、現実世界のSR手法の開発においてパラダイムシフトをもたらす。
単一のロバストモデルを使用することで、実世界のベンチマークで最先端の特殊な手法より優れています。
論文 参考訳(メタデータ) (2021-08-25T22:43:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。