論文の概要: What makes an image realistic?
- arxiv url: http://arxiv.org/abs/2403.04493v4
- Date: Tue, 21 May 2024 14:44:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-22 18:22:08.278656
- Title: What makes an image realistic?
- Title(参考訳): イメージが現実的になる理由?
- Authors: Lucas Theis,
- Abstract要約: 非現実的なデータから現実的なデータを確実に検出できる関数を設計する、リアリズムの定量化の問題について議論する。
この問題がなぜ難しいのか、なぜ優れた生成モデルだけで解決できないのか、そして良い解決策がどのようなものかについて議論する。
我々は、敵の批判者と異なり、敵の訓練を必要としない普遍的な批判の概念を導入する。
- 参考スコア(独自算出の注目度): 5.656581242851759
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The last decade has seen tremendous progress in our ability to generate realistic-looking data, be it images, text, audio, or video. Here, we discuss the closely related problem of quantifying realism, that is, designing functions that can reliably tell realistic data from unrealistic data. This problem turns out to be significantly harder to solve and remains poorly understood, despite its prevalence in machine learning and recent breakthroughs in generative AI. Drawing on insights from algorithmic information theory, we discuss why this problem is challenging, why a good generative model alone is insufficient to solve it, and what a good solution would look like. In particular, we introduce the notion of a universal critic, which unlike adversarial critics does not require adversarial training. While universal critics are not immediately practical, they can serve both as a North Star for guiding practical implementations and as a tool for analyzing existing attempts to capture realism.
- Abstract(参考訳): 過去10年で、画像、テキスト、オーディオ、ビデオなど、現実的なデータを生成する能力が大幅に進歩しました。
ここでは,非現実的なデータから現実的なデータを確実に検出できる関数を設計する,リアリズムの定量化という,密接に関連する問題について議論する。
この問題は、機械学習の流行と最近の生成AIのブレークスルーにもかかわらず、解決が著しく難しく、まだ理解されていないことが判明した。
アルゴリズム情報理論からの洞察に基づいて、なぜこの問題が難しいのか、なぜ良い生成モデルだけでは解決できないのか、良い解決策がどのようなものになるのかを論じる。
特に、敵の批判者が敵の訓練を必要としないのとは違って、普遍的な批判の概念を導入する。
普遍的批評家はすぐには実践的ではないが、実践的な実践を導くためのノーススターや、現実主義を捉えようとする既存の試みを分析するツールとしても機能する。
関連論文リスト
- Information-Theoretic Foundations for Machine Learning [20.617552198581024]
本稿では,洞窟外に存在する問題に答えようとする理論的枠組みを提案する。
我々はベイズ統計とシャノンの情報理論に根ざしたフレームワークを提供し、機械学習における多くの現象の分析を統一するのに十分一般的なものである。
我々は、不特定アルゴリズムの性能を特徴付けるセクションを締めくくる。
論文 参考訳(メタデータ) (2024-07-17T03:18:40Z) - Efficient Imitation Learning with Conservative World Models [54.52140201148341]
報酬機能のない専門家によるデモンストレーションから政策学習の課題に取り組む。
純粋な強化学習ではなく、微調整問題として模倣学習を再構成する。
論文 参考訳(メタデータ) (2024-05-21T20:53:18Z) - Sim2real Transfer Learning for Point Cloud Segmentation: An Industrial
Application Case on Autonomous Disassembly [55.41644538483948]
我々は,点クラウドデータにsim2realTransfer Learningを用いた産業アプリケーションケースを提案する。
合成ポイントクラウドデータの生成と処理方法に関する洞察を提供する。
この問題に対処するために、パッチベースの新しいアテンションネットワークも提案されている。
論文 参考訳(メタデータ) (2023-01-12T14:00:37Z) - Understanding Self-Predictive Learning for Reinforcement Learning [61.62067048348786]
強化学習のための自己予測学習の学習ダイナミクスについて検討する。
本稿では,2つの表現を同時に学習する新しい自己予測アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-06T20:43:37Z) - Resolving Copycat Problems in Visual Imitation Learning via Residual
Action Prediction [10.275717930942989]
観察履歴の模倣は, 最新の観察結果の模倣よりも悪い結果が得られた。
本稿では,この課題に対処しない,新しい模倣学習ニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-07-20T07:15:32Z) - Causal Reasoning Meets Visual Representation Learning: A Prospective
Study [117.08431221482638]
解釈可能性の欠如、堅牢性、分布外一般化が、既存の視覚モデルの課題となっている。
人間レベルのエージェントの強い推論能力にインスパイアされた近年では、因果推論パラダイムの開発に多大な努力が注がれている。
本稿では,この新興分野を包括的に概観し,注目し,議論を奨励し,新たな因果推論手法の開発の急激さを先導することを目的とする。
論文 参考訳(メタデータ) (2022-04-26T02:22:28Z) - Occlusion-Aware Self-Supervised Monocular 6D Object Pose Estimation [88.8963330073454]
自己教師付き学習による新しい単眼6次元ポーズ推定手法を提案する。
ノイズの多い学生のトレーニングと差別化可能なレンダリングの現在の傾向を活用して、モデルをさらに自己監督する。
提案する自己超越法は,合成データに依存する他の方法よりも優れている。
論文 参考訳(メタデータ) (2022-03-19T15:12:06Z) - On The Empirical Effectiveness of Unrealistic Adversarial Hardening
Against Realistic Adversarial Attacks [9.247680268877795]
本研究では,非現実的対向例が実例からモデルを保護するのに有効かどうかを考察する。
その結果,非現実的な例が現実的な例と同等に有効である場合や,限られた改善しか得られない場合とでは,ユースケース間での相違が明らかとなった。
効果的硬化に使用できる非現実的な例を識別するパターンに光を当てた。
論文 参考訳(メタデータ) (2022-02-07T15:08:10Z) - Practical Imitation Learning in the Real World via Task Consistency Loss [18.827979446629296]
本稿では,機能レベルと行動予測レベルの両方において,シミュレートと実際のアライメントを促進する自己監督的損失を提案する。
我々は、シミュレートとリアルで遠隔操作されたデモンストレーションを16.2時間しか使っていない10のシーンで80%の成功を達成した。
論文 参考訳(メタデータ) (2022-02-03T21:43:06Z) - Dark, Beyond Deep: A Paradigm Shift to Cognitive AI with Humanlike
Common Sense [142.53911271465344]
我々は、次世代のAIは、新しいタスクを解決するために、人間のような「暗黒」の常識を取り入れなければならないと論じている。
我々は、人間のような常識を持つ認知AIの5つの中核領域として、機能、物理学、意図、因果性、実用性(FPICU)を識別する。
論文 参考訳(メタデータ) (2020-04-20T04:07:28Z) - Adversarial Texture Optimization from RGB-D Scans [37.78810126921875]
弱教師付き視点から得られた条件付き対向損失を用いた色彩テクスチャ生成のための新しい手法を提案する。
提案手法の鍵となる考え方は,テクスチャ最適化をミスアライメントに寛容に導くパッチベースの条件判別器を学習することである。
論文 参考訳(メタデータ) (2020-03-18T18:00:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。