論文の概要: The troublesome kernel -- On hallucinations, no free lunches and the accuracy-stability trade-off in inverse problems
- arxiv url: http://arxiv.org/abs/2001.01258v4
- Date: Tue, 18 Jun 2024 19:18:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-22 11:37:45.644563
- Title: The troublesome kernel -- On hallucinations, no free lunches and the accuracy-stability trade-off in inverse problems
- Title(参考訳): 厄介なカーネル -- 幻覚、無料ランチなし、逆問題における精度-安定性トレードオフについて
- Authors: Nina M. Gottschling, Vegard Antun, Anders C. Hansen, Ben Adcock,
- Abstract要約: 人工知能(AI)にインスパイアされた手法は、計算科学と工学を根本的に変え始めている。
方法が幻覚、偽物、現実的に見える人工物、不安定性、すなわちデータの摂動に対する感受性に苦しむという経験的証拠が増えている。
本稿ではこれらの現象の理論的基礎を提供する。
- 参考スコア(独自算出の注目度): 0.5999777817331315
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Methods inspired by Artificial Intelligence (AI) are starting to fundamentally change computational science and engineering through breakthrough performances on challenging problems. However, reliability and trustworthiness of such techniques is a major concern. In inverse problems in imaging, the focus of this paper, there is increasing empirical evidence that methods may suffer from hallucinations, i.e., false, but realistic-looking artifacts; instability, i.e., sensitivity to perturbations in the data; and unpredictable generalization, i.e., excellent performance on some images, but significant deterioration on others. This paper provides a theoretical foundation for these phenomena. We give mathematical explanations for how and when such effects arise in arbitrary reconstruction methods, with several of our results taking the form of `no free lunch' theorems. Specifically, we show that (i) methods that overperform on a single image can wrongly transfer details from one image to another, creating a hallucination, (ii) methods that overperform on two or more images can hallucinate or be unstable, (iii) optimizing the accuracy-stability trade-off is generally difficult, (iv) hallucinations and instabilities, if they occur, are not rare events, and may be encouraged by standard training, (v) it may be impossible to construct optimal reconstruction maps for certain problems. Our results trace these effects to the kernel of the forward operator whenever it is nontrivial, but also apply to the case when the forward operator is ill-conditioned. Based on these insights, our work aims to spur research into new ways to develop robust and reliable AI-based methods for inverse problems in imaging.
- Abstract(参考訳): 人工知能(AI)にインスパイアされた手法は、困難な問題に対するブレークスルーパフォーマンスを通じて、計算科学と工学を根本的に変え始めている。
しかし、そのような手法の信頼性と信頼性は大きな懸念事項である。
画像の逆問題において、この論文の焦点は、手法が幻覚、すなわち、偽の、しかし現実的に見えるアーティファクト、不安定、すなわち、データの摂動に対する感受性、予測不能な一般化、すなわち、いくつかの画像における優れたパフォーマンス、そして他の画像に対する顕著な劣化に悩まされているという経験的証拠が増大している。
本稿ではこれらの現象の理論的基礎を提供する。
このような効果が任意の再構成法でどのように、いつ起こるのかを数学的に説明し、いくつかの結果は「無料ランチ」定理の形式を取っている。
具体的には
二 一つの画像に対して過度に上回る方法により、ある画像から別の画像へ誤って詳細を伝達し、幻覚を生じさせることができること。
二以上の画像にオーバーパフォーマンスする手法は幻覚や不安定になることがある。
三 精度安定トレードオフの最適化は概ね困難である。
(四)幻覚や不安定が生じた場合、まれな出来事ではなく、標準的な訓練によって奨励されることがある。
(v) ある問題に対して最適な再構成マップを構築することは不可能かもしれない。
この結果から, フォワード演算子のカーネルに対して, 非自明な場合, フォワード演算子のカーネルにこれらの効果をトレースするが, フォワード演算子が不条件の場合にも適用できる。
これらの知見に基づいて、我々の研究は、画像の逆問題に対する堅牢で信頼性の高いAIベースの手法を開発する新しい方法の研究を促進することを目的としている。
関連論文リスト
- Looks Too Good To Be True: An Information-Theoretic Analysis of Hallucinations in Generative Restoration Models [13.605340325383452]
生成モデルは、しばしば実際のデータと視覚的に区別できない結果を生み出すことができる。
また、彼らは幻覚を生み出す傾向が強まっている。
本稿では,この現象を情報理論のレンズを通して検討し,不確実性と知覚の根本的なトレードオフを明らかにする。
論文 参考訳(メタデータ) (2024-05-26T07:58:51Z) - Uncertainty in latent representations of variational autoencoders optimized for visual tasks [4.919240908498475]
可変オートエンコーダ(VAE)の潜時表現における不確実性表現について検討する。
本稿では、EA-VAEと呼ばれる新しい手法が、これらの問題をいかに解決するかを示す。
EA-VAEは、コンピュータ神経科学における知覚のモデルとコンピュータビジョンにおける推論ツールの両方として有用である。
論文 参考訳(メタデータ) (2024-04-23T16:26:29Z) - Representing Noisy Image Without Denoising [91.73819173191076]
ラドン空間におけるフラクショナルオーダーモーメント(FMR)は、ノイズの多い画像から直接ロバストな表現を引き出すように設計されている。
従来の整数順序法とは異なり、我々の研究は特別な場合のような古典的手法を取り入れたより汎用的な設計である。
論文 参考訳(メタデータ) (2023-01-18T10:13:29Z) - Causal Triplet: An Open Challenge for Intervention-centric Causal
Representation Learning [98.78136504619539]
Causal Tripletは、視覚的に複雑なシーンを特徴とする因果表現学習ベンチマークである。
この結果から,不整合表現やオブジェクト中心表現の知識によって構築されたモデルが,分散表現よりもはるかに優れていることを示す。
論文 参考訳(メタデータ) (2023-01-12T17:43:38Z) - On the Robustness of Normalizing Flows for Inverse Problems in Imaging [16.18759484251522]
意図しない厳密な人工物は、時折条件付き正規化フローの出力で観察される。
条件付きアフィンカップリング層における「分散の爆発」により,これらの問題が生じることを実証的,理論的に明らかにする。
そこで本研究では,アフィンカップリング層を2次スプラインカップリング層に置換し,フローを正規化する簡単な方法を提案する。
論文 参考訳(メタデータ) (2022-12-08T15:18:28Z) - AT-DDPM: Restoring Faces degraded by Atmospheric Turbulence using
Denoising Diffusion Probabilistic Models [64.24948495708337]
大気の乱流は、ぼやけや幾何学的歪みを導入して画質を著しく劣化させる。
CNNベースやGANインバージョンベースなど,深層学習に基づく単一画像大気乱流低減手法が提案されている。
Denoising Diffusion Probabilistic Models (DDPMs) は、その安定したトレーニングプロセスと高品質な画像を生成する能力により、最近注目を集めている。
論文 参考訳(メタデータ) (2022-08-24T03:13:04Z) - Training Adaptive Reconstruction Networks for Blind Inverse Problems [0.0]
本研究では,ネットワークをフォワード演算子のファミリーでトレーニングすることで,再構成品質を著しく向上させることなく適応性問題を解くことができることを示す。
実験には、感度推定とオフ共鳴効果を備えたMRI(MRI)による部分フーリエサンプリング問題、傾斜した形状のコンピュータ断層撮影(CT)、フレネル回折核による画像劣化などが含まれる。
論文 参考訳(メタデータ) (2022-02-23T07:56:02Z) - Meta Adversarial Perturbations [66.43754467275967]
メタ逆境摂動(MAP)の存在を示す。
MAPは1段階の上昇勾配更新によって更新された後、自然画像を高い確率で誤分類する。
これらの摂動は画像に依存しないだけでなく、モデルに依存しないものであり、単一の摂動は見えないデータポイントと異なるニューラルネットワークアーキテクチャにまたがってうまく一般化される。
論文 参考訳(メタデータ) (2021-11-19T16:01:45Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z) - Self-Supervised Linear Motion Deblurring [112.75317069916579]
深層畳み込みニューラルネットワークは、画像の劣化の最先端技術である。
本稿では,自己監督型動作遅延に対する識別可能なreblurモデルを提案する。
我々の実験は、自己監督された単一画像の劣化が本当に実現可能であることを実証した。
論文 参考訳(メタデータ) (2020-02-10T20:15:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。