論文の概要: SketchRef: a Multi-Task Evaluation Benchmark for Sketch Synthesis
- arxiv url: http://arxiv.org/abs/2408.08623v2
- Date: Wed, 09 Apr 2025 03:18:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-10 13:04:43.870637
- Title: SketchRef: a Multi-Task Evaluation Benchmark for Sketch Synthesis
- Title(参考訳): SketchRef: スケッチ合成のためのマルチタスク評価ベンチマーク
- Authors: Xingyue Lin, Xingjian Hu, Shuai Peng, Jianhua Zhu, Liangcai Gao,
- Abstract要約: SketchRefは、スケッチ合成のための最初の総合的なマルチタスク評価ベンチマークである。
タスクは、動物、共通物、人体、顔の4つの領域にまたがる5つのサブタスクに分けられる。
アート愛好家から7,920の回答を収集することで,我々のアプローチを検証する。
- 参考スコア(独自算出の注目度): 6.832790933688975
- License:
- Abstract: Sketching is a powerful artistic technique for capturing essential visual information about real-world objects and has increasingly attracted attention in image synthesis research. However, the field lacks a unified benchmark to evaluate the performance of various synthesis methods. To address this, we propose SketchRef, the first comprehensive multi-task evaluation benchmark for sketch synthesis. SketchRef fully leverages the shared characteristics between sketches and reference photos. It introduces two primary tasks: category prediction and structural consistency estimation, the latter being largely overlooked in previous studies. These tasks are further divided into five sub-tasks across four domains: animals, common things, human body, and faces. Recognizing the inherent trade-off between recognizability and simplicity in sketches, we are the first to quantify this balance by introducing a recognizability calculation method constrained by simplicity, mRS, ensuring fair and meaningful evaluations. To validate our approach, we collected 7,920 responses from art enthusiasts, confirming the effectiveness of our proposed evaluation metrics. Additionally, we evaluate the performance of existing sketch synthesis methods on our benchmark, highlighting their strengths and weaknesses. We hope this study establishes a standardized benchmark and offers valuable insights for advancing sketch synthesis algorithms.
- Abstract(参考訳): スケッチは、現実世界の物体に関する重要な視覚情報を取得するための強力な芸術技術であり、画像合成研究において注目を集めている。
しかし、フィールドは様々な合成手法の性能を評価するための統一されたベンチマークを欠いている。
そこで本研究では,スケッチ合成のためのマルチタスク評価ベンチマークSketchRefを提案する。
SketchRefは、スケッチと参照写真の共有特性を完全に活用する。
カテゴリー予測と構造的整合性推定という2つの主要なタスクを導入し、後者は以前の研究でほとんど見落とされた。
これらのタスクはさらに、動物、共通物、人体、顔の4つの領域にまたがる5つのサブタスクに分けられる。
スケッチにおける認識可能性と単純さの本質的にのトレードオフを認識し、我々は、単純さ、mRSに制約された認識可能性計算手法を導入し、公平で有意義な評価を確実にすることで、このバランスを定量化する最初の人物である。
アプローチを検証するため,アート愛好家から7,920件の回答を収集し,提案手法の有効性を確認した。
さらに,既存のスケッチ合成手法の性能をベンチマークで評価し,その長所と短所を強調した。
この研究は、標準化されたベンチマークを確立し、スケッチ合成アルゴリズムを進化させるための貴重な洞察を提供することを願っている。
関連論文リスト
- CrossScore: Towards Multi-View Image Evaluation and Scoring [24.853612457257697]
相互参照画像品質評価法は画像評価景観のギャップを埋める。
本手法は,地上の真理参照を必要とせず,精度の高い画像品質評価を可能にする。
論文 参考訳(メタデータ) (2024-04-22T17:59:36Z) - Advancing Generative Model Evaluation: A Novel Algorithm for Realistic
Image Synthesis and Comparison in OCR System [1.2289361708127877]
本研究は、生成モデル分野における重要な課題、特に合成画像の生成と評価について論じる。
合成画像のリアリズムを客観的に評価するための先駆的アルゴリズムを提案する。
我々のアルゴリズムは、アラビア文字の手書き数字の現実的な画像の生成と評価の課題に対処するために特に適している。
論文 参考訳(メタデータ) (2024-02-27T04:53:53Z) - A Fine-Grained Image Description Generation Method Based on Joint
Objectives [7.565093400979752]
本稿では, 共同目的物に基づく微細な画像記述生成モデルを提案する。
我々は、記述繰り返しと省略を扱う際のモデルの性能をより直感的に評価するために、新しいオブジェクトベースの評価指標を導入する。
実験の結果,提案手法はCIDErの評価基準を大幅に改善することが示された。
論文 参考訳(メタデータ) (2023-09-02T03:22:39Z) - CarPatch: A Synthetic Benchmark for Radiance Field Evaluation on Vehicle
Components [77.33782775860028]
車両の新たな総合ベンチマークであるCarPatchを紹介する。
内在カメラパラメータと外在カメラパラメータを付加した画像のセットに加えて、各ビューに対して対応する深度マップとセマンティックセグメンテーションマスクが生成されている。
グローバルとパートベースのメトリクスは、いくつかの最先端技術を評価し、比較し、より良い特徴付けるために定義され、使われてきた。
論文 参考訳(メタデータ) (2023-07-24T11:59:07Z) - TexPose: Neural Texture Learning for Self-Supervised 6D Object Pose
Estimation [55.94900327396771]
合成データから6次元オブジェクトポーズ推定のためのニューラルネットワークによるテクスチャ学習を提案する。
実画像からオブジェクトの現実的なテクスチャを予測することを学ぶ。
画素完全合成データからポーズ推定を学習する。
論文 参考訳(メタデータ) (2022-12-25T13:36:32Z) - Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。
提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文 参考訳(メタデータ) (2022-03-11T02:37:35Z) - TISE: A Toolbox for Text-to-Image Synthesis Evaluation [9.092600296992925]
単目的と多目的のテキスト・ツー・イメージ合成のための最先端手法の研究を行う。
これらの手法を評価するための共通フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-02T16:39:35Z) - Unsupervised Part Discovery from Contrastive Reconstruction [90.88501867321573]
自己監督型視覚表現学習の目標は、強く伝達可能な画像表現を学習することである。
対象部分の発見とセグメンテーションに対する教師なしアプローチを提案する。
本手法は, 細粒度, 視覚的に異なるカテゴリ間でセマンティックな部分を生成する。
論文 参考訳(メタデータ) (2021-11-11T17:59:42Z) - Revisiting The Evaluation of Class Activation Mapping for
Explainability: A Novel Metric and Experimental Analysis [54.94682858474711]
クラスアクティベーションマッピング(cam)アプローチは、アクティベーションマップの平均を重み付けすることで、効果的な可視化を提供する。
説明マップを定量化するための新しいメトリクスセットを提案し、より効果的な方法を示し、アプローチ間の比較を簡素化します。
論文 参考訳(メタデータ) (2021-04-20T21:34:24Z) - Unifying Remote Sensing Image Retrieval and Classification with Robust
Fine-tuning [3.6526118822907594]
新しい大規模トレーニングおよびテストデータセットであるSF300で、リモートセンシングイメージの検索と分類を統一することを目指しています。
本研究では,ImageNetの事前学習ベースラインと比較して,9つのデータセットの検索性能と分類性能を体系的に向上させることを示す。
論文 参考訳(メタデータ) (2021-02-26T11:01:30Z) - A Revised Generative Evaluation of Visual Dialogue [80.17353102854405]
本稿では,VisDialデータセットの改訂評価手法を提案する。
モデルが生成した回答と関連する回答の集合のコンセンサスを測定する。
DenseVisDialとして改訂された評価スキームのこれらのセットとコードをリリースする。
論文 参考訳(メタデータ) (2020-04-20T13:26:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。