論文の概要: Predicting Perceived Gloss: Do Weak Labels Suffice?
- arxiv url: http://arxiv.org/abs/2403.17672v1
- Date: Tue, 26 Mar 2024 13:02:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-27 15:27:36.579736
- Title: Predicting Perceived Gloss: Do Weak Labels Suffice?
- Title(参考訳): 認識されたグロースを予測する: ラベルは十分か?
- Authors: Julia Guerrero-Viu, J. Daniel Subias, Ana Serrano, Katherine R. Storrs, Roland W. Fleming, Belen Masia, Diego Gutierrez,
- Abstract要約: 我々は、人間のアノテーションのより小さなセットが、自動的に派生した「弱ラベル」で効果的に拡張できることを示します。
我々は、限られた注釈付きデータから人間の光沢知覚を予測するために、3つの代替弱ラベルを評価する。
- 参考スコア(独自算出の注目度): 5.010944559639167
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Estimating perceptual attributes of materials directly from images is a challenging task due to their complex, not fully-understood interactions with external factors, such as geometry and lighting. Supervised deep learning models have recently been shown to outperform traditional approaches, but rely on large datasets of human-annotated images for accurate perception predictions. Obtaining reliable annotations is a costly endeavor, aggravated by the limited ability of these models to generalise to different aspects of appearance. In this work, we show how a much smaller set of human annotations ("strong labels") can be effectively augmented with automatically derived "weak labels" in the context of learning a low-dimensional image-computable gloss metric. We evaluate three alternative weak labels for predicting human gloss perception from limited annotated data. Incorporating weak labels enhances our gloss prediction beyond the current state of the art. Moreover, it enables a substantial reduction in human annotation costs without sacrificing accuracy, whether working with rendered images or real photographs.
- Abstract(参考訳): 画像から直接素材の知覚特性を推定することは、幾何学や照明といった外部要因と完全に理解されていない相互作用が複雑なため、難しい課題である。
監視されたディープラーニングモデルは、最近、従来のアプローチより優れていることが示されているが、正確な知覚予測のために、人間の注釈付き画像の大規模なデータセットに依存している。
信頼性のあるアノテーションを取得することはコストのかかる取り組みであり、外観の異なる側面に一般化するこれらのモデルの限られた能力によって悪化する。
本研究では,低次元の画像計算可能な光沢メトリクスの学習において,人間のアノテーション(強いラベル)の集合が,自動的に抽出された「弱ラベル」で効果的に拡張可能であることを示す。
我々は、限られた注釈付きデータから人間の光沢知覚を予測するために、3つの代替弱ラベルを評価する。
弱いラベルを組み込むことで、現在の最先端以上の光沢予測が強化される。
さらに、レンダリング画像や実際の写真を扱う場合でも、精度を犠牲にすることなく、人間のアノテーションコストを大幅に削減することができる。
関連論文リスト
- Data Augmentation via Latent Diffusion for Saliency Prediction [67.88936624546076]
残差予測モデルはラベル付きデータの限られた多様性と量によって制約される。
本研究では,実世界のシーンの複雑さと変動性を保ちながら,自然画像の編集を行うディープ・サリエンシ・予測のための新しいデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2024-09-11T14:36:24Z) - Weakly Semi-supervised Tool Detection in Minimally Invasive Surgery
Videos [11.61305113932032]
外科的ツール検出は、最小侵襲の手術ビデオの分析と評価に不可欠である。
インスタンスレベルのラベルを持つ大規模なイメージデータセットは、アノテーションの負担のために制限されることが多い。
本研究では,非常にコストのかかるアノテーションの重み付けと検出性能のバランスをとることを提案する。
論文 参考訳(メタデータ) (2024-01-05T13:05:02Z) - Vision-language Assisted Attribute Learning [53.60196963381315]
大規模な属性ラベリングは通常不完全で部分的である。
既存の属性学習手法は、欠落したラベルを否定的な扱いをすることが多い。
利用可能な視覚言語知識を活用して、モデル学習の強化に欠落しているラベルを明確に明らかにする。
論文 参考訳(メタデータ) (2023-12-12T06:45:19Z) - Capturing Perspectives of Crowdsourced Annotators in Subjective Learning Tasks [9.110872603799839]
監督された分類は、人間によって注釈付けされたデータセットに大きく依存する。
毒性分類などの主観的なタスクでは、これらのアノテーションはラッカー間での合意が低くなることが多い。
本研究では、主観的分類タスクのためのtextbfAnnotator Awares for Texts (AART) を提案する。
論文 参考訳(メタデータ) (2023-11-16T10:18:32Z) - Debiased Pseudo Labeling in Self-Training [77.83549261035277]
ディープニューラルネットワークは、大規模ラベル付きデータセットの助けを借りて、幅広いタスクで顕著なパフォーマンスを達成する。
ラベル付きデータの要求を軽減するため、ラベル付けされていないデータに擬似ラベルを付けることにより、学術と産業の両方で自己学習が広く使われている。
疑似ラベルの生成と利用を2つの独立した頭文字で分離するデバイアスドを提案する。
論文 参考訳(メタデータ) (2022-02-15T02:14:33Z) - Towards Good Practices for Efficiently Annotating Large-Scale Image
Classification Datasets [90.61266099147053]
多数の画像の分類ラベルを収集するための効率的なアノテーション戦略を検討する。
人間のラベリング作業を最小化するための修正とベストプラクティスを提案します。
ImageNet100の125kイメージサブセットのシミュレーション実験では、平均で0.35のアノテーションで80%のトップ-1の精度でアノテートできることが示されている。
論文 参考訳(メタデータ) (2021-04-26T16:29:32Z) - Leveraging Self-Supervision for Cross-Domain Crowd Counting [71.75102529797549]
混雑したシーンで人をカウントするための最先端の方法は、群衆密度を推定するために深いネットワークに依存します。
われわれのネットワークは、通常の画像から逆さまの実際の画像を認識できるように訓練し、その不確実性を予測する能力を組み込む。
このアルゴリズムは、推論時に余分な計算をせずに、最先端のクロスドメイン群をカウントするアルゴリズムを一貫して上回る。
論文 参考訳(メタデータ) (2021-03-30T12:37:55Z) - Visual Distant Supervision for Scene Graph Generation [66.10579690929623]
シーングラフモデルは通常、大量のラベル付きデータを人間のアノテーションで教師付き学習する必要がある。
本研究では,人間ラベルデータを用いずにシーングラフモデルを訓練できる視覚関係学習の新しいパラダイムである視覚遠方監視を提案する。
包括的な実験結果から、我々の遠隔監視モデルは、弱い監督と半監督のベースラインよりも優れています。
論文 参考訳(メタデータ) (2021-03-29T06:35:24Z) - Towards Imperceptible Query-limited Adversarial Attacks with Perceptual
Feature Fidelity Loss [3.351714665243138]
そこで本研究では,低レベル画像特徴の忠実度と人間の視覚感度の関連性を利用した新しい知覚計測手法を提案する。
提案手法は, 種々の条件下で検証された, 生成した逆画像の不受容性を, 頑健に反映し, 記述できることを示す。
論文 参考訳(メタデータ) (2021-01-31T13:32:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。