Fugu-MT 論文翻訳(概要): Annotation-Free Human Sketch Quality Assessment

論文の概要: Annotation-Free Human Sketch Quality Assessment

arxiv url: http://arxiv.org/abs/2507.20548v1
Date: Mon, 28 Jul 2025 06:18:51 GMT
ステータス: 翻訳完了
システム内更新日: 2025-07-29 16:23:57.88346
Title: Annotation-Free Human Sketch Quality Assessment
Title（参考訳）: 注釈のない人間のスケッチ品質評価
Authors: Lan Yang, Kaiyue Pang, Honggang Zhang, Yi-Zhe Song,
Abstract要約: この記事では、品質評価を初めて研究します。重要な発見は、スケッチ機能の大きさ(Lメトリックと$ノルム)を量的品質指標として活用することにある。このような品質評価機能が,初めて3つの実用的なスケッチアプリケーションを実現する方法を示す。
参考スコア（独自算出の注目度）: 56.71509868378274
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: As lovely as bunnies are, your sketched version would probably not do them justice (Fig.~\ref{fig:intro}). This paper recognises this very problem and studies sketch quality assessment for the first time -- letting you find these badly drawn ones. Our key discovery lies in exploiting the magnitude ($L_2$ norm) of a sketch feature as a quantitative quality metric. We propose Geometry-Aware Classification Layer (GACL), a generic method that makes feature-magnitude-as-quality-metric possible and importantly does it without the need for specific quality annotations from humans. GACL sees feature magnitude and recognisability learning as a dual task, which can be simultaneously optimised under a neat cross-entropy classification loss with theoretic guarantee. This gives GACL a nice geometric interpretation (the better the quality, the easier the recognition), and makes it agnostic to both network architecture changes and the underlying sketch representation. Through a large scale human study of 160,000 \doublecheck{trials}, we confirm the agreement between our GACL-induced metric and human quality perception. We further demonstrate how such a quality assessment capability can for the first time enable three practical sketch applications. Interestingly, we show GACL not only works on abstract visual representations such as sketch but also extends well to natural images on the problem of image quality assessment (IQA). Last but not least, we spell out the general properties of GACL as general-purpose data re-weighting strategy and demonstrate its applications in vertical problems such as noisy label cleansing. Code will be made publicly available at github.com/yanglan0225/SketchX-Quantifying-Sketch-Quality.
Abstract（参考訳）: バニーのように、スケッチしたバージョンは、おそらく正義を果たさないだろう(図)。～\ref{fig:intro})。この記事では、この問題を認識し、初めて品質評価をスケッチする。私たちの重要な発見は、スケッチ機能の規模(L_2$ norm)を量的品質指標として活用することにあります。本稿では,特徴量と品質を測る汎用的な手法であるGeometry-Aware Classification Layer (GACL)を提案する。 GACLは特徴量と認識可能性学習を2つのタスクと見なしており、理論的保証とともに適切なクロスエントロピー分類損失の下で同時に最適化することができる。これにより、GACLは優れた幾何学的解釈(品質の向上、認識の容易化)ができ、ネットワークアーキテクチャの変更と基礎となるスケッチ表現の両方に非依存になる。 160,000人の人間による大規模研究を通じて, GACLによる測定値と人的品質知覚との一致を確認した。さらに、このような品質評価機能が、初めて3つの実用的なスケッチアプリケーションを実現することを実証する。興味深いことに、GACLはスケッチのような抽象的な視覚表現だけでなく、画像品質評価(IQA)の問題に関する自然画像にも優れていることを示す。最後に,GACLの一般的な特性を汎用データ再重み付け戦略として記述し,ノイズラベルのクリーン化などの垂直問題への応用を実証する。コードはgithub.com/yanglan0225/SketchX-Quantifying-Sketch-Qualityで公開される。

関連論文リスト

SketchRef: a Multi-Task Evaluation Benchmark for Sketch Synthesis [6.832790933688975]
SketchRefは、スケッチ合成のための最初の総合的なマルチタスク評価ベンチマークである。タスクは、動物、共通物、人体、顔の4つの領域にまたがる5つのサブタスクに分けられる。アート愛好家から7,920の回答を収集することで,我々のアプローチを検証する。
論文参考訳（メタデータ） (2024-08-16T09:32:26Z)
Open Vocabulary Semantic Scene Sketch Understanding [5.638866331696071]
フリーハンドシーンスケッチの機械的理解における未探索だが基本的な視覚問題について検討する。本研究では,意味的に認識可能な特徴空間を実現するスケッチエンコーダを導入し,その性能を意味的スケッチセグメンテーションタスクでテストすることで評価する。提案手法は,セグメンテーション結果のゼロショットCLIP画素精度を37ポイント上回り,FS-COCOスケッチデータセットの精度が85.5%に達した。
論文参考訳（メタデータ） (2023-12-18T19:02:07Z)
What Can Human Sketches Do for Object Detection? [127.67444974452411]
スケッチは非常に表現力が高く、本質的に主観的かつきめ細かい視覚的手がかりを捉えている。スケッチ可能なオブジェクト検出フレームワークは、 textityou sketch -- textit that zebra' に基づいて検出する。スケッチベース画像検索(SBIR)のために構築された基礎モデル(例えばCLIP)と既存のスケッチモデルとの直感的な相乗効果を示す。特に、まず、エンコーダモデルの両方のスケッチブランチで独立に実行し、高度に一般化可能なスケッチとフォトエンコーダを構築する。
論文参考訳（メタデータ） (2023-03-27T12:33:23Z)
CLIP for All Things Zero-Shot Sketch-Based Image Retrieval, Fine-Grained or Not [109.69076457732632]
ゼロショットスケッチに基づく画像検索(ZS-SBIR)におけるCLIPの利用私たちはこのシナジーを達成するのにいかに最適かという新しいデザインを提唱した。これまでの最先端技術よりも26.9%の領域で顕著なパフォーマンス向上が観察された。
論文参考訳（メタデータ） (2023-03-23T17:02:00Z)
Sketch2Saliency: Learning to Detect Salient Objects from Human Drawings [99.9788496281408]
本研究では,スケッチを弱いラベルとして使用して,画像中の有能な物体を検出する方法について検討する。これを実現するために,与えられた視覚写真に対応する逐次スケッチ座標を生成することを目的としたフォト・ツー・スケッチ生成モデルを提案する。テストは、私たちの仮説を証明し、スケッチベースの唾液度検出モデルが、最先端技術と比較して、競争力のあるパフォーマンスを提供する方法を明確にします。
論文参考訳（メタデータ） (2023-03-20T23:46:46Z)
KonX: Cross-Resolution Image Quality Assessment [6.658103076536836]
本研究は,この2つの問題を,KonXを介して別々に検討した最初の研究である。対象のIQA法はスケールバイアスを有しており,予測性能が低下することを示す。本稿では,従来のIQAモデルよりも高性能なマルチスケール・マルチカラムアーキテクチャを提案する。
論文参考訳（メタデータ） (2022-12-12T10:23:48Z)
CompGuessWhat?!: A Multi-task Evaluation Framework for Grounded Language Learning [78.3857991931479]
本稿では,属性を用いたグラウンドド言語学習のための評価フレームワークGROLLAを提案する。また、学習したニューラル表現の品質を評価するためのフレームワークの例として、新しいデータセットCompGuessWhat!?を提案する。
論文参考訳（メタデータ） (2020-06-03T11:21:42Z)
RANSAC-Flow: generic two-stage image alignment [53.11926395028508]
単純な教師なしのアプローチは、様々なタスクにおいて驚くほどうまく機能することを示す。その単純さにもかかわらず、我々の手法は様々なタスクやデータセットで競合する結果を示す。
論文参考訳（メタデータ） (2020-04-03T12:37:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。