論文の概要: ArtFID: Quantitative Evaluation of Neural Style Transfer
- arxiv url: http://arxiv.org/abs/2207.12280v1
- Date: Mon, 25 Jul 2022 15:52:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-26 14:59:36.523370
- Title: ArtFID: Quantitative Evaluation of Neural Style Transfer
- Title(参考訳): ArtFID:ニューラルスタイル伝達の定量的評価
- Authors: Matthias Wright and Bj\"orn Ommer
- Abstract要約: 本稿では,現在ほぼ定性的な評価手法を補完する手法を提案する。
提案手法が人間の判断と強く一致することを示すため,広範囲な評価と大規模ユーザスタディを提供する。
- 参考スコア(独自算出の注目度): 1.90365714903665
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The field of neural style transfer has experienced a surge of research
exploring different avenues ranging from optimization-based approaches and
feed-forward models to meta-learning methods. The developed techniques have not
just progressed the field of style transfer, but also led to breakthroughs in
other areas of computer vision, such as all of visual synthesis. However,
whereas quantitative evaluation and benchmarking have become pillars of
computer vision research, the reproducible, quantitative assessment of style
transfer models is still lacking. Even in comparison to other fields of visual
synthesis, where widely used metrics exist, the quantitative evaluation of
style transfer is still lagging behind. To support the automatic comparison of
different style transfer approaches and to study their respective strengths and
weaknesses, the field would greatly benefit from a quantitative measurement of
stylization performance. Therefore, we propose a method to complement the
currently mostly qualitative evaluation schemes. We provide extensive
evaluations and a large-scale user study to show that the proposed metric
strongly coincides with human judgment.
- Abstract(参考訳): ニューラルスタイルのトランスファーの分野は、最適化ベースのアプローチやフィードフォワードモデルからメタ学習方法まで、さまざまな方法を研究する研究が急増している。
開発された技術は、スタイル転送の分野を進歩させただけでなく、視覚合成など他の分野のコンピュータビジョンにもブレークスルーをもたらした。
しかし、定量的評価とベンチマークはコンピュータビジョン研究の柱となっているが、スタイル伝達モデルの再現性や定量的評価はまだ欠けている。
広く使用されているメトリクスが存在する視覚合成の他の分野と比較しても、スタイル転送の定量的評価は遅れている。
異なるスタイル伝達アプローチの自動比較とそれぞれの強度と弱みの研究を支援するため、スタイライゼーション性能の定量的測定から大きな恩恵を受けることができた。
そこで本研究では,現在の定性評価手法を補完する手法を提案する。
提案手法が人間の判断と強く一致することを示すために,広範囲な評価と大規模ユーザ調査を行った。
関連論文リスト
- Evaluation in Neural Style Transfer: A Review [0.7614628596146599]
既存の評価手法の詳細な分析を行い、現在の評価手法の不整合と限界を特定し、標準化された評価手法の推奨を行う。
我々は、ロバストな評価フレームワークの開発により、より有意義で公平な比較が可能になるだけでなく、この分野における研究成果の理解と解釈を高めることができると考えている。
論文 参考訳(メタデータ) (2024-01-30T15:45:30Z) - Masked Modeling for Self-supervised Representation Learning on Vision
and Beyond [69.64364187449773]
仮面モデリングは、トレーニング中に比例的にマスキングされる元のデータの一部を予測する、独特なアプローチとして現れてきた。
マスクモデリングにおけるテクニックの詳細については,多様なマスキング戦略,ターゲット回復,ネットワークアーキテクチャなどについて詳述する。
我々は、現在の手法の限界について議論し、マスクモデリング研究を進めるためのいくつかの道のりを指摘した。
論文 参考訳(メタデータ) (2023-12-31T12:03:21Z) - Image-Based Virtual Try-On: A Survey [38.6177665201224]
画像ベースの仮想試着は、自然に着飾った人物画像を衣服のイメージで合成することを目的としており、オンラインショッピングに革命をもたらし、画像生成に関連トピックを刺激する。
本稿では,パイプラインアーキテクチャ,人物表現,トライオン表示,衣料品のワープ,トライオンステージといった重要なモジュールの側面において,最先端技術と方法論を包括的に分析する。
さらに、CLIPを用いて試行結果のセマンティックアライメントを評価し、同じデータセット上で一様に実装された評価指標を用いて代表手法を評価する。
論文 参考訳(メタデータ) (2023-11-08T16:34:18Z) - Diffusion-based Visual Counterfactual Explanations -- Towards Systematic
Quantitative Evaluation [64.0476282000118]
視覚的対物的説明法(VCE)の最新手法は、深い生成モデルの力を利用して、印象的な画質の高次元画像の新しい例を合成する。
評価手順が大きく異なり,個々の実例の視覚検査や小規模なユーザスタディなど,これらのVCE手法の性能を比較することは,現時点では困難である。
本稿では,VCE手法の体系的,定量的評価のためのフレームワークと,使用する指標の最小セットを提案する。
論文 参考訳(メタデータ) (2023-08-11T12:22:37Z) - Better Understanding Differences in Attribution Methods via Systematic Evaluations [57.35035463793008]
モデル決定に最も影響を及ぼす画像領域を特定するために、ポストホック属性法が提案されている。
本稿では,これらの手法の忠実度をより確実に評価するための3つの新しい評価手法を提案する。
これらの評価手法を用いて、広範囲のモデルにおいて広く用いられている属性手法の長所と短所について検討する。
論文 参考訳(メタデータ) (2023-03-21T14:24:58Z) - Towards Better Understanding Attribution Methods [77.1487219861185]
モデル決定に最も影響を及ぼす画像領域を特定するために、ポストホック属性法が提案されている。
本稿では,これらの手法の忠実度をより確実に評価するための3つの新しい評価手法を提案する。
また,いくつかの属性法の性能を著しく向上する処理後平滑化ステップを提案する。
論文 参考訳(メタデータ) (2022-05-20T20:50:17Z) - Image Quality Assessment in the Modern Age [53.19271326110551]
本チュートリアルは、画像品質評価(IQA)の基礎的理論、方法論、現状の進歩を聴衆に提供する。
まず,視覚刺激を適切に選択する方法に着目し,主観的品質評価手法を再考する。
手書きのエンジニアリングと(深い)学習ベースの手法の両方をカバーします。
論文 参考訳(メタデータ) (2021-10-19T02:38:46Z) - Empirical Evaluation of Supervision Signals for Style Transfer Models [44.39622949370144]
本研究は,トレーニング中に指導信号を提供する支配的な最適化パラダイムを実証的に比較する。
バックトランスレーションにはモデル固有の制限があり、トレーニングスタイルのトランスファーモデルを阻害する。
また、私たちの知識では、スタイル転送のタスクで経験的に評価されていない機械翻訳コミュニティで人気のあるテクニックである最小リスクトレーニングを実験しています。
論文 参考訳(メタデータ) (2021-01-15T15:33:30Z) - On Learning Text Style Transfer with Direct Rewards [101.97136885111037]
平行コーパスの欠如により、テキストスタイルの転送タスクの教師付きモデルを直接訓練することは不可能である。
我々は、当初、微調整されたニューラルマシン翻訳モデルに使用されていた意味的類似度指標を活用している。
我々のモデルは、強いベースラインに対する自動評価と人的評価の両方において大きな利益をもたらす。
論文 参考訳(メタデータ) (2020-10-24T04:30:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。