論文の概要: Characterization of the Distortion-Perception Tradeoff for Finite
Channels with Arbitrary Metrics
- arxiv url: http://arxiv.org/abs/2402.02265v1
- Date: Sat, 3 Feb 2024 21:17:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 21:03:18.977091
- Title: Characterization of the Distortion-Perception Tradeoff for Finite
Channels with Arbitrary Metrics
- Title(参考訳): 任意距離を有する有限チャネルの歪み知覚トレードオフ特性
- Authors: Dror Freirich and Nir Weinberger and Ron Meir
- Abstract要約: 有限アルファベットチャネル上の歪み知覚トレードオフについて検討する。
DP関数と最適再構成の計算は,一連の線形プログラミング問題の解法と等価であることを示す。
- 参考スコア(独自算出の注目度): 31.383958289479015
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Whenever inspected by humans, reconstructed signals should not be
distinguished from real ones. Typically, such a high perceptual quality comes
at the price of high reconstruction error, and vice versa. We study this
distortion-perception (DP) tradeoff over finite-alphabet channels, for the
Wasserstein-$1$ distance induced by a general metric as the perception index,
and an arbitrary distortion matrix. Under this setting, we show that computing
the DP function and the optimal reconstructions is equivalent to solving a set
of linear programming problems. We provide a structural characterization of the
DP tradeoff, where the DP function is piecewise linear in the perception index.
We further derive a closed-form expression for the case of binary sources.
- Abstract(参考訳): 人間によって検査される場合、再構成された信号は実際の信号と区別するべきではない。
一般的に、このような高い知覚品質は、高い再構成誤差の価格で得られ、その逆である。
本研究では,一般計量を知覚指標とし,任意の歪み行列として誘導されるワッサースタイン-$$ 距離について,有限アルファベットチャネル上のこの歪み知覚(dp)トレードオフについて検討する。
この設定では、DP関数と最適再構成の計算は、一連の線形プログラミング問題の解法と等価であることを示す。
本稿では,DP関数が知覚指数において一意に線形であるDPトレードオフの構造的特徴について述べる。
さらに,二元源の場合の閉形式表現も導出する。
関連論文リスト
- Refined Risk Bounds for Unbounded Losses via Transductive Priors [58.967816314671296]
線形回帰の逐次変分を2乗損失、ヒンジ損失の分類問題、ロジスティック回帰で再検討する。
我々の鍵となるツールは、慎重に選択された導出先を持つ指数重み付けアルゴリズムに基づいている。
論文 参考訳(メタデータ) (2024-10-29T00:01:04Z) - Rate-Distortion-Perception Tradeoff Based on the
Conditional-Distribution Perception Measure [33.084834042565895]
本研究では,大きなブロック長の制限下で,メモリレスソースモデルに対するRDPのトレードオフについて検討する。
我々の知覚尺度は、エンコーダ出力に条件付されたソースの分布と再構成シーケンスのばらつきに基づく。
論文 参考訳(メタデータ) (2024-01-22T18:49:56Z) - On the Computation of the Gaussian Rate-Distortion-Perception Function [10.564071872770146]
平均二乗誤差(MSE)歪み下における多変量ガウス音源に対するレート歪み知覚関数(RDPF)の計算について検討した。
我々は、関連するアルゴリズムの実現、および収束と収束のキャラクタリゼーションの速度を提供する。
計算結果を数値シミュレーションで相関させ,既存の結果に関連付ける。
論文 参考訳(メタデータ) (2023-11-15T18:34:03Z) - Stable Nonconvex-Nonconcave Training via Linear Interpolation [51.668052890249726]
本稿では,ニューラルネットワークトレーニングを安定化(大規模)するための原理的手法として,線形アヘッドの理論解析を提案する。
最適化過程の不安定性は、しばしば損失ランドスケープの非単調性によって引き起こされるものであり、非拡張作用素の理論を活用することによって線型性がいかに役立つかを示す。
論文 参考訳(メタデータ) (2023-10-20T12:45:12Z) - Gradient Descent Provably Solves Nonlinear Tomographic Reconstruction [60.95625458395291]
計算トモグラフィー(CT)では、フォワードモデルは線形変換と、ベル=ランベルト法則に従って光の減衰に基づく指数非線形性によって構成される。
金属クラウンを用いた人間の頭蓋骨の商業的再構築と比較すると,このアプローチは金属人工物を減らすことが示されている。
論文 参考訳(メタデータ) (2023-10-06T00:47:57Z) - Graph Signal Sampling for Inductive One-Bit Matrix Completion: a
Closed-form Solution [112.3443939502313]
グラフ信号解析と処理の利点を享受する統合グラフ信号サンプリングフレームワークを提案する。
キーとなる考え方は、各ユーザのアイテムのレーティングをアイテムイットグラフの頂点上の関数(信号)に変換することである。
オンライン設定では、グラフフーリエ領域における連続ランダムガウス雑音を考慮したベイズ拡張(BGS-IMC)を開発する。
論文 参考訳(メタデータ) (2023-02-08T08:17:43Z) - Deep filter bank regression for super-resolution of anisotropic MR brain
images [18.41979609846356]
2次元マルチスライス磁気共鳴(MR)取得では、スループレーン信号は通常、インプレーン信号よりも低解像度である。
超高分解能(SR)法は、基礎となる高分解能ボリュームを回復することを目的としているが、推定された高周波数情報は、エンドツーエンドのデータ駆動トレーニングを通じて暗黙的である。
そこで本研究では,特定スキャンの異方性獲得に対応する完全再構成フィルタバンクの完成を近似する2段階の手法を提案する。
論文 参考訳(メタデータ) (2022-09-06T16:05:19Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Physics-Enforced Modeling for Insertion Loss of Transmission Lines by
Deep Neural Networks [4.762000720968522]
ニューラルネットワークの直接適用は、負の挿入損失を持つ非物理モデルにつながる可能性があることを示す。
1つの解決策は、受動的条件を表す規制項を最終損失関数に追加し、挿入損失の負の量を強制することである。
第2の方法では、挿入損失を近似する正性を保証する3階式を最初に定義する。
論文 参考訳(メタデータ) (2021-07-27T00:22:10Z) - A Theory of the Distortion-Perception Tradeoff in Wasserstein Space [35.25746003630763]
推定器の歪みを下げると、その出力の分布は、推定しようとする信号の分布から逸脱する。
この現象は画像修復において顕著な関心を集めており、真理画像の忠実さは知覚品質の犠牲となる。
知覚歪トレードオフの2つの極端における推定器から推定器をどのように構築できるかを示す。
論文 参考訳(メタデータ) (2021-07-06T11:53:36Z) - 3D Human Pose and Shape Regression with Pyramidal Mesh Alignment
Feedback Loop [128.07841893637337]
回帰に基づく手法は最近、単眼画像からヒトのメッシュを再構成する有望な結果を示した。
パラメータの小さな偏差は、推定メッシュと画像のエビデンスの間に顕著な不一致を引き起こす可能性がある。
本稿では,特徴ピラミッドを活用し,予測パラメータを補正するために,ピラミッドメッシュアライメントフィードバック(pymaf)ループを提案する。
論文 参考訳(メタデータ) (2021-03-30T17:07:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。