論文の概要: Novel Artistic Scene-Centric Datasets for Effective Transfer Learning in Fragrant Spaces
- arxiv url: http://arxiv.org/abs/2407.11701v1
- Date: Tue, 16 Jul 2024 13:18:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-17 14:52:24.958115
- Title: Novel Artistic Scene-Centric Datasets for Effective Transfer Learning in Fragrant Spaces
- Title(参考訳): フラグラント空間における効果的な伝達学習のための新しい芸術的シーン中心データセット
- Authors: Shumei Liu, Haiting Huang, Mathias Zinnen, Andreas Maier, Vincent Christlein,
- Abstract要約: 文化遺産研究でしばしば見落とされ、人間の経験やアイデンティティを形作る上で重要な役割を担っている。
弱ラベル付き学習データを用いた移動学習手法は、香り空間の分類を著しく改善できることを示す。
- 参考スコア(独自算出の注目度): 6.780679790916122
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Olfaction, often overlooked in cultural heritage studies, holds profound significance in shaping human experiences and identities. Examining historical depictions of olfactory scenes can offer valuable insights into the role of smells in history. We show that a transfer-learning approach using weakly labeled training data can remarkably improve the classification of fragrant spaces and, more generally, artistic scene depictions. We fine-tune Places365-pre-trained models by querying two cultural heritage data sources and using the search terms as supervision signal. The models are evaluated on two manually corrected test splits. This work lays a foundation for further exploration of fragrant spaces recognition and artistic scene classification. All images and labels are released as the ArtPlaces dataset at https://zenodo.org/doi/10.5281/zenodo.11584328.
- Abstract(参考訳): 文化遺産研究でしばしば見落とされ、人間の経験やアイデンティティを形作る上で重要な役割を担っている。
嗅覚シーンの歴史的描写を見ることは、歴史における嗅覚の役割についての貴重な洞察を与えることができる。
弱いラベル付きトレーニングデータを用いたトランスファーラーニングアプローチは、香りのよい空間の分類を著しく改善し、より一般的には、芸術的な場面の描写を表現できることが示される。
本研究では,2つの文化遺産データソースを検索し,検索用語を監視信号として使用することにより,Places365事前学習モデルを微調整する。
モデルは、手動で修正された2つのテスト分割で評価される。
この研究は、香りのよい空間認識と芸術シーンの分類のさらなる探求の基礎を築いた。
イメージとラベルはすべてArtPlacesデータセットとしてhttps://zenodo.org/doi/10.5281/zenodo.11584328でリリースされている。
関連論文リスト
- APDDv2: Aesthetics of Paintings and Drawings Dataset with Artist Labeled Scores and Comments [45.57709215036539]
Aesthetics Paintings and Drawings dataset (APDD)は,24の異なる芸術カテゴリーと10の美的属性を含む最初の総合的な絵画コレクションである。
APDDv2は画像コーパスを拡張し、アノテーションの品質を改善し、詳細な言語コメントを特徴としている。
本稿では,ArtCLIP(Art Assessment Network for Specific Painting Styles)の改訂版について紹介する。
論文 参考訳(メタデータ) (2024-11-13T11:46:42Z) - MuseumMaker: Continual Style Customization without Catastrophic Forgetting [50.12727620780213]
本研究では,一組のカスタマイズスタイルを終末的に追従することで,画像の合成を可能にする方法であるMuseumMakerを提案する。
新しいカスタマイズスタイルに直面すると、新しい画像生成のためのトレーニングデータのスタイルを抽出し学習するスタイル蒸留損失モジュールを開発する。
これは、新しい訓練画像の内容による学習バイアスを最小限に抑え、少数ショット画像によって引き起こされる破滅的な過適合問題に対処することができる。
論文 参考訳(メタデータ) (2024-04-25T13:51:38Z) - Knowledge-Aware Artifact Image Synthesis with LLM-Enhanced Prompting and
Multi-Source Supervision [5.517240672957627]
本稿では,失った歴史的物体を視覚的形状に正確に反映する,知識を意識した新しい人工物画像合成手法を提案する。
既存の手法と比較して,提案手法は文書に含まれる暗黙の細部や歴史的知識とよく一致した高品質なアーティファクト画像を生成する。
論文 参考訳(メタデータ) (2023-12-13T11:03:07Z) - Saliency Guided Contrastive Learning on Scene Images [71.07412958621052]
我々は、学習中のモデルの出力から導かれるサリエンシマップを活用し、差別的な領域を強調し、対照的な学習全体をガイドする。
提案手法は,画像上の自己教師学習の性能を,画像の線形評価において+1.1,+4.3,+2.2の精度で向上させる。
論文 参考訳(メタデータ) (2023-02-22T15:54:07Z) - ArcAid: Analysis of Archaeological Artifacts using Drawings [23.906975910478142]
考古学はコンピュータビジョンの興味深い分野である。
ラベル付きデータに不足するだけでなく、高度に混ざったデータに悩まされる。
本稿では,考古学的遺物の画像の分類と検索のための,新しい半教師付きモデルを提案する。
論文 参考訳(メタデータ) (2022-11-17T11:57:01Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - Semi-supervised Human Pose Estimation in Art-historical Images [9.633949256082763]
アート言語画像における人間のポーズを推定する新しい手法を提案する。
我々の手法は、事前訓練されたモデルやスタイル転送を使用する方法よりも、はるかに優れた結果が得られる。
論文 参考訳(メタデータ) (2022-07-06T21:20:58Z) - Compositional Scene Representation Learning via Reconstruction: A Survey [48.33349317481124]
構成シーン表現学習はそのような能力を実現するタスクである。
ディープニューラルネットワークは表現学習において有利であることが証明されている。
大量のラベルのないデータを使用し、費用がかかるデータアノテーションを避けることができるため、再構築による学習は有利である。
論文 参考訳(メタデータ) (2022-02-15T02:14:05Z) - Grafit: Learning fine-grained image representations with coarse labels [114.17782143848315]
本稿では,学習ラベルの提供するものよりも細かな表現を学習する問題に対処する。
粗いラベルと下層の細粒度潜在空間を併用することにより、カテゴリレベルの検索手法の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2020-11-25T19:06:26Z) - What Can You Learn from Your Muscles? Learning Visual Representation
from Human Interactions [50.435861435121915]
視覚のみの表現よりも優れた表現を学べるかどうかを調べるために,人間のインタラクションとアテンション・キューを用いている。
実験の結果,我々の「音楽監督型」表現は,視覚のみの最先端手法であるMoCoよりも優れていた。
論文 参考訳(メタデータ) (2020-10-16T17:46:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。