論文の概要: ArcAid: Analysis of Archaeological Artifacts using Drawings
- arxiv url: http://arxiv.org/abs/2211.09480v3
- Date: Sat, 20 Jan 2024 16:54:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-23 22:26:23.792533
- Title: ArcAid: Analysis of Archaeological Artifacts using Drawings
- Title(参考訳): ArcAid:図面を用いた考古学的遺物の分析
- Authors: Offry Hayon, Stefan M\"unger, Ilan Shimshoni, Ayellet Tal
- Abstract要約: 考古学はコンピュータビジョンの興味深い分野である。
ラベル付きデータに不足するだけでなく、高度に混ざったデータに悩まされる。
本稿では,考古学的遺物の画像の分類と検索のための,新しい半教師付きモデルを提案する。
- 参考スコア(独自算出の注目度): 23.906975910478142
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Archaeology is an intriguing domain for computer vision. It suffers not only
from shortage in (labeled) data, but also from highly-challenging data, which
is often extremely abraded and damaged. This paper proposes a novel
semi-supervised model for classification and retrieval of images of
archaeological artifacts. This model utilizes unique data that exists in the
domain -- manual drawings made by special artists. These are used during
training to implicitly transfer the domain knowledge from the drawings to their
corresponding images, improving their classification results. We show that
while learning how to classify, our model also learns how to generate drawings
of the artifacts, an important documentation task, which is currently performed
manually. Last but not least, we collected a new dataset of stamp-seals of the
Southern Levant. Our code and dataset are publicly available.
- Abstract(参考訳): 考古学はコンピュータビジョンの興味深い分野である。
ラベル付き)データの不足だけでなく、高度に乱雑なデータにも苦しんでいます。
本稿では,考古学的遺物の画像の分類と検索のための新しい半教師付きモデルを提案する。
このモデルはドメイン内に存在するユニークなデータ -- 特殊なアーティストによる手作業による図面 -- を利用する。
これらはトレーニング中に、図面から対応する画像にドメインの知識を暗黙的に転送し、分類結果を改善するために使用される。
分類の仕方を学習しながら、このモデルは、現在手作業で行われている重要なドキュメントタスクであるアーティファクトの図面を生成する方法も学んでいます。
最後に、我々は南レバントのスタンプシールの新しいデータセットを収集しました。
コードとデータセットは公開されています。
関連論文リスト
- HaSPeR: An Image Repository for Hand Shadow Puppet Recognition [2.048226951354646]
シャドウグラフィー(Shadowgraphy)またはボンボマニー(ombromanie)は、演劇芸術とストーリーテリングの一形態である。
プロとアマチュアの両方の手影人形クリップから抽出した11種類の手影人形の8,340枚の画像からなる新しいデータセットを提案する。
本研究の結果は,従来のコンボリューションモデルよりも,注目に基づくトランスフォーマーアーキテクチャよりもかなり優れた性能を示した。
論文 参考訳(メタデータ) (2024-08-19T18:56:24Z) - Measuring Style Similarity in Diffusion Models [118.22433042873136]
画像からスタイル記述子を理解し抽出するためのフレームワークを提案する。
我々のフレームワークは、スタイルが画像の主観的特性であるという洞察を用いてキュレートされた新しいデータセットで構成されている。
また、テキスト・ツー・イメージ・モデルのトレーニングデータセットで使用される画像に対して、生成した画像のスタイルに使用できるスタイル属性記述子を抽出する手法を提案する。
論文 参考訳(メタデータ) (2024-04-01T17:58:30Z) - Knowledge-Aware Artifact Image Synthesis with LLM-Enhanced Prompting and
Multi-Source Supervision [5.517240672957627]
本稿では,失った歴史的物体を視覚的形状に正確に反映する,知識を意識した新しい人工物画像合成手法を提案する。
既存の手法と比較して,提案手法は文書に含まれる暗黙の細部や歴史的知識とよく一致した高品質なアーティファクト画像を生成する。
論文 参考訳(メタデータ) (2023-12-13T11:03:07Z) - AutArch: An AI-assisted workflow for object detection and automated
recording in archaeological catalogues [37.69303106863453]
本稿では,遺産として利用可能な考古学的発見カタログからデータを収集するための新しいワークフローを紹介する。
このワークフローは、自動検索されたデータの検証と調整を行う画像処理、オブジェクト検出、インタラクティブな手段をサポートするカスタムソフトウェア(AutArch)に依存している。
我々は、人工知能(AI)を、物体の検出と分類のためのニューラルネットワークの観点でワークフローに統合する。
論文 参考訳(メタデータ) (2023-11-29T17:24:04Z) - Perceptual Artifacts Localization for Image Synthesis Tasks [59.638307505334076]
我々は10,168個の画像からなる新しいデータセットを導入し,それぞれに知覚的アーティファクトラベルを付加した。
提案したデータセットに基づいてトレーニングされたセグメンテーションモデルは、さまざまなタスクにまたがるアーティファクトを効果的にローカライズする。
生成した画像の知覚的アーティファクトをシームレスに修正する,革新的なズームイン・インペインティングパイプラインを提案する。
論文 参考訳(メタデータ) (2023-10-09T10:22:08Z) - Augraphy: A Data Augmentation Library for Document Images [59.457999432618614]
Augraphyはデータ拡張パイプラインを構築するためのPythonライブラリである。
標準的なオフィス操作によって変更されたように見えるクリーンなドキュメントイメージの拡張版を作成するための戦略を提供する。
論文 参考訳(メタデータ) (2022-08-30T22:36:19Z) - Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。
画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。
提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-29T16:51:16Z) - Transfer Learning for Pose Estimation of Illustrated Characters [37.04208600867858]
図示された文字領域のポーズ推定器は、補助的なコンテンツ作成タスクに貴重な事前情報を提供する。
ドメイン固有のソースモデルとタスク固有のソースモデルの両方から効率的に転送学習することで、ドメインギャップを橋渡しします。
ポーズ誘導図形検索の新たな課題を解決するために,得られた最先端キャラクタのポーズ推定手法を適用した。
論文 参考訳(メタデータ) (2021-08-04T02:37:28Z) - Iconographic Image Captioning for Artworks [2.3859169601259342]
本研究は,Iconclass分類システムの概念を付加したアート画像の大規模データセットを利用する。
アノテーションはクリーンなテキスト記述に処理され、画像キャプションタスク上でディープニューラルネットワークモデルのトレーニングに適したデータセットを生成する。
画像データセットを用いて、トランスフォーマーに基づく視覚言語事前学習モデルを微調整する。
生成したキャプションの品質と新たなデータに一般化するモデルの能力について,新たな絵画コレクションにモデルを適用し,一般的なキャプションと芸術ジャンルの関係を解析することにより検討する。
論文 参考訳(メタデータ) (2021-02-07T23:11:33Z) - Multi-Class Zero-Shot Learning for Artistic Material Recognition [68.8204255655161]
Zero-Shot Learning(ZSL)は、トランスファーラーニングの極端な形態であり、トレーニング段階で分類されるデータのラベル付き例は提供されない。
ここでは、作品の主題の英語記述と合成資料との関係を学習することにより、作品が作成された資料を特定するためのモデルについて概説する。
我々は、全く異なる博物館のデータセットから、作品に使われている素材を正確に識別できるモデルを作成する。
論文 参考訳(メタデータ) (2020-10-26T19:04:50Z) - Hidden Footprints: Learning Contextual Walkability from 3D Human Trails [70.01257397390361]
現在のデータセットは、人々がどこにいるか、どこにいるかを教えてくれません。
まず、画像間で人の観察を伝播させ、3D情報を利用して、私たちが「隠れ足跡」と呼ぶものを作成することで、有効なラベル付き歩行可能領域の集合を拡大する。
このようなスパースラベルのために設計されたトレーニング戦略を考案し、クラスバランスの分類損失と文脈逆転損失を組み合わせた。
論文 参考訳(メタデータ) (2020-08-19T23:19:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。