Fugu-MT 論文翻訳(概要): Directional Confusions Reveal Divergent Inductive Biases Through Rate-Distortion Geometry in Human and Machine Vision

論文の概要: Directional Confusions Reveal Divergent Inductive Biases Through Rate-Distortion Geometry in Human and Machine Vision

arxiv url: http://arxiv.org/abs/2604.21909v1
Date: Thu, 23 Apr 2026 17:52:16 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-24 14:40:06.809375
Title: Directional Confusions Reveal Divergent Inductive Biases Through Rate-Distortion Geometry in Human and Machine Vision
Title（参考訳）: 人間と機械の視界における速度歪み幾何学による方向転換誘導性ビアーゼの拡散
Authors: Leyla Roksan Caglar, Pedro A. M. Mediano, Baihan Lin,
Abstract要約: 人間と現代の視覚モデルは、体系的に異なる種類のミスをしながら、同様の分類精度に達することができる。これらの方向の混乱は、精度だけでは見えない、独特な帰納バイアスを明らかにしている。人間は広いが弱い非対称性を示すのに対し、深い視覚モデルでは、より広い方向の崩壊を示す。
参考スコア（独自算出の注目度）: 13.021443536696497
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Humans and modern vision models can reach similar classification accuracy while making systematically different kinds of mistakes - differing not in how often they err, but in who gets mistaken for whom, and in which direction. We show that these directional confusions reveal distinct inductive biases that are invisible to accuracy alone. Using matched human and deep vision model responses on a natural-image categorization task under 12 perturbation types, we quantify asymmetry in confusion matrices and link it to generalization geometry through a Rate-Distortion (RD) framework, summarized by three geometric signatures (slope (beta), curvature (kappa)) and efficiency (AUC). We find that humans exhibit broad but weak asymmetries, whereas deep vision models show sparser, stronger directional collapses. Robustness training reduces global asymmetry but fails to recover the human-like breadth-strength profile of graded similarity. Mechanistic simulations further show that different asymmetry organizations shift the RD frontier in opposite directions, even when matched for performance. Together, these results position directional confusions and RD geometry as compact, interpretable signatures of inductive bias under distribution shift.
Abstract（参考訳）: 人間と現代の視覚モデルは、体系的に異なる種類のミスをしながら、同様の分類精度に達することができる。これらの方向の混乱は、精度だけでは見えない、独特な帰納バイアスを明らかにしている。 12種類の摂動型の下での自然像分類タスクにおけるマッチングされた人間と深部視覚モデル応答を用いて、混乱行列の非対称性を定量化し、それを3つの幾何学的シグネチャ(傾斜(ベータ)、曲率(カッパ)、効率(AUC)で要約したRD(Rate-Distortion)フレームワークを介して一般化幾何学にリンクする。人間は広いが弱い非対称性を示すのに対し、深い視覚モデルでは、より広い方向の崩壊を示す。ロバストネストレーニングは、大域的な非対称性を低下させるが、格付けされた類似性のヒトのような幅強度プロファイルを回復することができない。力学シミュレーションにより、異なる非対称性の組織は、性能にマッチしてもRDフロンティアを反対方向にシフトすることを示した。これらの結果は、方向の混乱とRD幾何を分布シフトの下での帰納バイアスのコンパクトかつ解釈可能なシグネチャとして位置づける。

関連論文リスト

The Geometric Alignment Tax: Tokenization vs. Continuous Geometry in Scientific Foundation Models [0.0]
根本原因は、幾何学的アライメント税である。速度歪理論とMINEを用いた14の生物基盤モデルの評価を行った。低歪み、高相互情報、大域コヒーレンスを同時に達成するモデルは存在しない。
論文参考訳（メタデータ） (2026-04-05T15:45:49Z)
Rate-Distortion Signatures of Generalization and Information Trade-offs [13.021443536696497]
新たな視覚条件への一般化は、人間と機械の両方の視覚にとって、依然として中心的な課題である。標準的なロバストネスメトリクスは、システムのロバストネスに対する精度の取引方法に関する限られた洞察を提供する。本稿では,刺激応答行動を効果的な通信チャネルとして扱う速度歪み理論フレームワークを提案する。
論文参考訳（メタデータ） (2026-03-02T07:48:39Z)
Counterfactual Explanations on Robust Perceptual Geodesics [13.054357482525505]
本稿では,頑健な視覚特徴から誘導される測地線を測る手法として,知覚的対物測地学 (PCG) を導入する。この幾何学は人間の知覚と一致し、脆い方向を罰し、滑らかでオン・マニフォールドで意味論的に妥当な遷移を可能にする。 3つのビジョンデータセットの実験では、PCGはベースラインを上回り、標準メトリクスの下に隠された障害モードを明らかにする。
論文参考訳（メタデータ） (2026-01-26T16:52:54Z)
Generative Model Inversion Through the Lens of the Manifold Hypothesis [98.37040155914595]
モデル反転攻撃(MIA)は、訓練されたモデルからクラス表現型サンプルを再構成することを目的としている。最近の生成的MIAは、生成的敵ネットワークを使用して、反転過程を導く画像の事前学習を行う。
論文参考訳（メタデータ） (2025-09-24T14:39:25Z)
Generalized Linear Mode Connectivity for Transformers [87.32299363530996]
驚くべき現象はリニアモード接続(LMC)であり、独立に訓練されたモデルを低損失またはゼロ損失の経路で接続することができる。以前の研究は主に置換によるニューロンの並べ替えに焦点を合わせてきたが、そのようなアプローチは範囲に限られている。我々は、4つの対称性クラス(置換、半置換、変換、一般可逆写像)をキャプチャする統一的なフレームワークを導入する。この一般化により、独立に訓練された視覚変換器とGPT-2モデルの間の低障壁とゼロバリア線形経路の発見が可能となった。
論文参考訳（メタデータ） (2025-06-28T01:46:36Z)
Latent Representation Matters: Human-like Sketches in One-shot Drawing Tasks [15.328499301244708]
我々は、異なる誘導バイアスが潜在拡散モデル(LDM)の潜時空間をどのように形成するかを研究する。冗長性の低減とプロトタイプベース正規化によるLCDが, ほぼ人間に近い図形を生成することを示す。
論文参考訳（メタデータ） (2024-06-10T07:52:29Z)
A U-turn on Double Descent: Rethinking Parameter Counting in Statistical Learning [68.76846801719095]
二重降下がいつどこで起こるのかを正確に示し、その位置が本質的に閾値 p=n に結び付けられていないことを示す。これは二重降下と統計的直観の間の緊張を解消する。
論文参考訳（メタデータ） (2023-10-29T12:05:39Z)
It's an Alignment, Not a Trade-off: Revisiting Bias and Variance in Deep Models [51.66015254740692]
深層学習に基づく分類モデルのアンサンブルでは, バイアスと分散がサンプルレベルで一致していることが示される。我々はこの現象をキャリブレーションと神経崩壊という2つの理論的観点から研究する。
論文参考訳（メタデータ） (2023-10-13T17:06:34Z)
Predicting and Enhancing the Fairness of DNNs with the Curvature of Perceptual Manifolds [44.79535333220044]
近年の研究では、テールクラスは必ずしも学習が困難ではないことが示されており、サンプルバランスのデータセットではモデルバイアスが観察されている。本研究ではまず,モデルフェアネスを解析するための幾何学的視点を確立し,次いで,一連の幾何学的測度を体系的に提案する。
論文参考訳（メタデータ） (2023-03-22T04:49:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。