論文の概要: Annotation-Free Human Sketch Quality Assessment
- arxiv url: http://arxiv.org/abs/2507.20548v1
- Date: Mon, 28 Jul 2025 06:18:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:57.88346
- Title: Annotation-Free Human Sketch Quality Assessment
- Title(参考訳): 注釈のない人間のスケッチ品質評価
- Authors: Lan Yang, Kaiyue Pang, Honggang Zhang, Yi-Zhe Song,
- Abstract要約: この記事では、品質評価を初めて研究します。
重要な発見は、スケッチ機能の大きさ(Lメトリックと$ノルム)を量的品質指標として活用することにある。
このような品質評価機能が,初めて3つの実用的なスケッチアプリケーションを実現する方法を示す。
- 参考スコア(独自算出の注目度): 56.71509868378274
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: As lovely as bunnies are, your sketched version would probably not do them justice (Fig.~\ref{fig:intro}). This paper recognises this very problem and studies sketch quality assessment for the first time -- letting you find these badly drawn ones. Our key discovery lies in exploiting the magnitude ($L_2$ norm) of a sketch feature as a quantitative quality metric. We propose Geometry-Aware Classification Layer (GACL), a generic method that makes feature-magnitude-as-quality-metric possible and importantly does it without the need for specific quality annotations from humans. GACL sees feature magnitude and recognisability learning as a dual task, which can be simultaneously optimised under a neat cross-entropy classification loss with theoretic guarantee. This gives GACL a nice geometric interpretation (the better the quality, the easier the recognition), and makes it agnostic to both network architecture changes and the underlying sketch representation. Through a large scale human study of 160,000 \doublecheck{trials}, we confirm the agreement between our GACL-induced metric and human quality perception. We further demonstrate how such a quality assessment capability can for the first time enable three practical sketch applications. Interestingly, we show GACL not only works on abstract visual representations such as sketch but also extends well to natural images on the problem of image quality assessment (IQA). Last but not least, we spell out the general properties of GACL as general-purpose data re-weighting strategy and demonstrate its applications in vertical problems such as noisy label cleansing. Code will be made publicly available at github.com/yanglan0225/SketchX-Quantifying-Sketch-Quality.
- Abstract(参考訳): バニーのように、スケッチしたバージョンは、おそらく正義を果たさないだろう(図)。
~\ref{fig:intro})。
この記事では、この問題を認識し、初めて品質評価をスケッチする。
私たちの重要な発見は、スケッチ機能の規模(L_2$ norm)を量的品質指標として活用することにあります。
本稿では,特徴量と品質を測る汎用的な手法であるGeometry-Aware Classification Layer (GACL)を提案する。
GACLは特徴量と認識可能性学習を2つのタスクと見なしており、理論的保証とともに適切なクロスエントロピー分類損失の下で同時に最適化することができる。
これにより、GACLは優れた幾何学的解釈(品質の向上、認識の容易化)ができ、ネットワークアーキテクチャの変更と基礎となるスケッチ表現の両方に非依存になる。
160,000人の人間による大規模研究を通じて, GACLによる測定値と人的品質知覚との一致を確認した。
さらに、このような品質評価機能が、初めて3つの実用的なスケッチアプリケーションを実現することを実証する。
興味深いことに、GACLはスケッチのような抽象的な視覚表現だけでなく、画像品質評価(IQA)の問題に関する自然画像にも優れていることを示す。
最後に,GACLの一般的な特性を汎用データ再重み付け戦略として記述し,ノイズラベルのクリーン化などの垂直問題への応用を実証する。
コードはgithub.com/yanglan0225/SketchX-Quantifying-Sketch-Qualityで公開される。
関連論文リスト
- Open Vocabulary Semantic Scene Sketch Understanding [5.638866331696071]
フリーハンドシーンスケッチの機械的理解における未探索だが基本的な視覚問題について検討する。
本研究では,意味的に認識可能な特徴空間を実現するスケッチエンコーダを導入し,その性能を意味的スケッチセグメンテーションタスクでテストすることで評価する。
提案手法は,セグメンテーション結果のゼロショットCLIP画素精度を37ポイント上回り,FS-COCOスケッチデータセットの精度が85.5%に達した。
論文 参考訳(メタデータ) (2023-12-18T19:02:07Z) - What Can Human Sketches Do for Object Detection? [127.67444974452411]
スケッチは非常に表現力が高く、本質的に主観的かつきめ細かい視覚的手がかりを捉えている。
スケッチ可能なオブジェクト検出フレームワークは、 textityou sketch -- textit that zebra' に基づいて検出する。
スケッチベース画像検索(SBIR)のために構築された基礎モデル(例えばCLIP)と既存のスケッチモデルとの直感的な相乗効果を示す。
特に、まず、エンコーダモデルの両方のスケッチブランチで独立に実行し、高度に一般化可能なスケッチとフォトエンコーダを構築する。
論文 参考訳(メタデータ) (2023-03-27T12:33:23Z) - CLIP for All Things Zero-Shot Sketch-Based Image Retrieval, Fine-Grained
or Not [109.69076457732632]
ゼロショットスケッチに基づく画像検索(ZS-SBIR)におけるCLIPの利用
私たちはこのシナジーを達成するのにいかに最適かという新しいデザインを提唱した。
これまでの最先端技術よりも26.9%の領域で顕著なパフォーマンス向上が観察された。
論文 参考訳(メタデータ) (2023-03-23T17:02:00Z) - KonX: Cross-Resolution Image Quality Assessment [6.658103076536836]
本研究は,この2つの問題を,KonXを介して別々に検討した最初の研究である。
対象のIQA法はスケールバイアスを有しており,予測性能が低下することを示す。
本稿では,従来のIQAモデルよりも高性能なマルチスケール・マルチカラムアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-12-12T10:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。