論文の概要: Large-image Object Detection for Fine-grained Recognition of Punches Patterns in Medieval Panel Painting
- arxiv url: http://arxiv.org/abs/2501.12489v1
- Date: Tue, 21 Jan 2025 20:30:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-23 16:53:52.599784
- Title: Large-image Object Detection for Fine-grained Recognition of Punches Patterns in Medieval Panel Painting
- Title(参考訳): 中世パネル塗装におけるパンチパターンの微粒化認識のための大画像物体検出
- Authors: Josh Bruegger, Diana Ioana Catana, Vanja Macovaz, Matias Valdenegro-Toro, Matthia Sabatelli, Marco Zullich,
- Abstract要約: 画像に含まれるパンチに対してオブジェクト検出を行うために、機械学習パイプラインをトレーニングする。
以上の結果から, 現場で働く美術史家は, パンチの識別と抽出に, 確実に我々の手法を活用できることが示唆された。
- 参考スコア(独自算出の注目度): 6.762125776126245
- License:
- Abstract: The attribution of the author of an art piece is typically a laborious manual process, usually relying on subjective evaluations of expert figures. However, there are some situations in which quantitative features of the artwork can support these evaluations. The extraction of these features can sometimes be automated, for instance, with the use of Machine Learning (ML) techniques. An example of these features is represented by repeated, mechanically impressed patterns, called punches, present chiefly in 13th and 14th-century panel paintings from Tuscany. Previous research in art history showcased a strong connection between the shapes of punches and specific artists or workshops, suggesting the possibility of using these quantitative cues to support the attribution. In the present work, we first collect a dataset of large-scale images of these panel paintings. Then, using YOLOv10, a recent and popular object detection model, we train a ML pipeline to perform object detection on the punches contained in the images. Due to the large size of the images, the detection procedure is split across multiple frames by adopting a sliding-window approach with overlaps, after which the predictions are combined for the whole image using a custom non-maximal suppression routine. Our results indicate how art historians working in the field can reliably use our method for the identification and extraction of punches.
- Abstract(参考訳): 美術作品の著者の帰属は、通常、精巧な手作業であり、通常、専門家の主観的な評価に依存している。
しかし,これらの評価を定量的に支援できる状況もある。
これらの機能の抽出は、機械学習(ML)技術を使用して自動化される場合がある。
これらの特徴の例としては、主に13世紀と14世紀のトスカーナのパネル絵画に見られるパンチと呼ばれる繰り返し、機械的に印象づけられたパターンがある。
それまでの美術史の研究では、パンチの形状と特定の芸術家や工房との強い結びつきが示され、これらの量的手がかりが帰属を支えている可能性が示唆された。
本研究では,これらのパネル絵画の大規模画像のデータセットをまず収集する。
そして、最近普及しているオブジェクト検出モデルであるYOLOv10を用いて、画像に含まれるパンチに対してオブジェクト検出を行うようにMLパイプラインを訓練する。
画像の大きさが大きいため、重なり合うスライディングウインドウアプローチを採用して複数のフレームに分割し、その後、カスタムな非最大抑圧ルーチンを用いて画像全体に対して予測を合成する。
以上の結果から, 現場で働く美術史家は, パンチの識別と抽出に, 確実に我々の手法を活用できることが示唆された。
関連論文リスト
- Visual Motif Identification: Elaboration of a Curated Comparative Dataset and Classification Methods [4.431754853927668]
映画では、視覚的なモチーフは、芸術的または美的な意味を持つ反復的な図形的構成である。
私たちのゴールは、これらのモチーフを認識して分類することであり、その目的にカスタムデータセットを使用する新しい機械学習モデルを提案することです。
CLIPモデルから抽出した機能を、浅いネットワークと適切な損失を用いて、20の異なるモチーフに分類し、驚くほど良い結果が得られることを示す。
論文 参考訳(メタデータ) (2024-10-21T10:50:00Z) - VIP: Versatile Image Outpainting Empowered by Multimodal Large Language Model [28.345828491336874]
本研究は,ユーザの要求に応じて結果のカスタマイズが可能な,新たな画像出力フレームワークを提案する。
画像のマスキング部分とマスキング部分のテキスト記述を自動的に抽出し整理するマルチモーダル大言語モデル(MLLM)を利用する。
さらに、画像の特定の空間領域とテキストプロンプトの対応する部分との相互作用を強化するために、特別にCentral-Total-Surrounding (CTS) と呼ばれるCentral-Attentionモジュールが精巧に設計されている。
論文 参考訳(メタデータ) (2024-06-03T07:14:19Z) - Leveraging Open-Vocabulary Diffusion to Camouflaged Instance
Segmentation [59.78520153338878]
テキスト・ツー・イメージ拡散技術は、テキスト記述から高品質な画像を生成する素晴らしい能力を示している。
そこで本研究では,オープン語彙を応用した最先端拡散モデルを用いて,多スケールのテキスト・視覚的特徴を学習する手法を提案する。
論文 参考訳(メタデータ) (2023-12-29T07:59:07Z) - Detecting Generated Images by Real Images Only [64.12501227493765]
既存の画像検出手法は、生成画像中の視覚的アーティファクトを検出したり、大規模なトレーニングによって、実画像と生成画像の両方から識別的特徴を学習する。
本稿では,新たな視点から生成した画像検出問題にアプローチする。
実画像の共通性を見つけ、特徴空間内の密接な部分空間にマッピングすることで、生成した画像は生成モデルに関係なくサブ空間の外側に投影される。
論文 参考訳(メタデータ) (2023-11-02T03:09:37Z) - Deep Image Matting: A Comprehensive Survey [85.77905619102802]
本稿では,ディープラーニング時代における画像マッチングの最近の進歩を概観する。
本稿では,補助的な入力ベースの画像マッチングと,自動的な画像マッチングという,2つの基本的なサブタスクに焦点を当てる。
画像マッチングの関連応用について論じ,今後の研究への課題と可能性を明らかにする。
論文 参考訳(メタデータ) (2023-04-10T15:48:55Z) - Leveraging Computer Vision Application in Visual Arts: A Case Study on
the Use of Residual Neural Network to Classify and Analyze Baroque Paintings [0.0]
本稿ではヨハン・クペツキーの「画家シャルル・ブルニの肖像」の分類に焦点をあてる。
残余ネットワークトレーニングで抽出した特徴は,オンラインアートコレクションの検索システム内での画像検索に有用であることを示す。
論文 参考訳(メタデータ) (2022-10-27T10:15:36Z) - Few-Shot Object Detection by Knowledge Distillation Using
Bag-of-Visual-Words Representations [58.48995335728938]
対象検出器の学習を導くための新しい知識蒸留フレームワークを設計する。
まず,視覚単語の代表的な袋を学習するための単語の位置認識モデルを提案する。
次に、2つの異なる特徴空間において、画像が一貫したBoVW表現を持つべきであるという事実に基づいて知識蒸留を行う。
論文 参考訳(メタデータ) (2022-07-25T10:40:40Z) - An End-to-End Approach for Seam Carving Detection using Deep Neural
Networks [0.0]
シーム・カービング(Seam Carving)は、画像形状ではなく、その内容に基づいて画像の縮小と拡大の両面を縮小する計算方法である。
本稿では,自動シーム彫刻検出の課題に対処するためのエンドツーエンドアプローチを提案する。
論文 参考訳(メタデータ) (2022-03-05T12:53:55Z) - Museum Painting Retrieval [0.0]
古典的なコンピュータビジョン技術を用いて,美術館画像コレクション内の絵画のサンプル検索システムを構築した。
画像中の異なる摂動を持つデータセットにおける色,テクスチャ,テキスト,特徴記述子の性能を検討する。
論文 参考訳(メタデータ) (2021-05-11T09:28:14Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - Insights From A Large-Scale Database of Material Depictions In Paintings [18.2193253052961]
本稿では,視覚認識システムと美術品で利用可能な豊富な情報との関係について検討する。
自然画像用に設計された視覚認識システムは、絵画で驚くほどうまく機能する。
絵画からの学習は、自然画像に使用されることを意図したニューラルネットワークにとって有益であることを示す。
論文 参考訳(メタデータ) (2020-11-24T18:42:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。