論文の概要: A Multi-modal Registration and Visualization Software Tool for Artworks
using CraquelureNet
- arxiv url: http://arxiv.org/abs/2208.08836v1
- Date: Thu, 18 Aug 2022 13:57:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-19 13:44:55.833642
- Title: A Multi-modal Registration and Visualization Software Tool for Artworks
using CraquelureNet
- Title(参考訳): craquelurenetを用いたアートワークのマルチモーダル登録・可視化ツール
- Authors: Aline Sindel, Andreas Maier and Vincent Christlein
- Abstract要約: 本稿では,歴史画におけるひび割れ構造の横断的特徴を抽出して自動登録を行うために,畳み込みニューラルネットワークを組み込んだ登録可視化ソフトウェアツールを提案する。
グラフィカルユーザインタフェースは、ユーザの入力を処理して、登録パラメータを設定し、登録されたペアとイメージオーバーレイで画像ビューをインタラクティブに適応させる。
本評価では,本手法を歴史的印刷物に適用することにより,マルチモーダル絵画における登録性能と短い推測時間と伝達性の観点から,ソフトウェアツールの有効性を質的かつ定量的に示す。
- 参考スコア(独自算出の注目度): 11.225641274591101
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For art investigations of paintings, multiple imaging technologies, such as
visual light photography, infrared reflectography, ultraviolet fluorescence
photography, and x-radiography are often used. For a pixel-wise comparison, the
multi-modal images have to be registered. We present a registration and
visualization software tool, that embeds a convolutional neural network to
extract cross-modal features of the crack structures in historical paintings
for automatic registration. The graphical user interface processes the user's
input to configure the registration parameters and to interactively adapt the
image views with the registered pair and image overlays, such as by individual
or synchronized zoom or movements of the views. In the evaluation, we
qualitatively and quantitatively show the effectiveness of our software tool in
terms of registration performance and short inference time on multi-modal
paintings and its transferability by applying our method to historical prints.
- Abstract(参考訳): 絵画のアート調査には、視覚光写真、赤外線反射写真、紫外線蛍光写真、x線撮影などの複数のイメージング技術がしばしば用いられる。
ピクセル単位で比較するには、マルチモーダル画像を登録する必要がある。
本稿では,歴史画におけるひび割れ構造の横断的特徴を抽出して自動登録を行うために,畳み込みニューラルネットワークを組み込んだ登録可視化ソフトウェアツールを提案する。
グラフィカルユーザインタフェースは、ユーザの入力を処理して登録パラメータを設定し、画像ビューを登録されたペアおよび画像オーバーレイにインタラクティブに適応させる。
本評価では,本手法を歴史的印刷物に適用することにより,マルチモーダル絵画における登録性能と短い推測時間と伝達性の観点から,ソフトウェアツールの有効性を質的かつ定量的に示す。
関連論文リスト
- Neuromorphic Synergy for Video Binarization [54.195375576583864]
バイモーダルオブジェクトは視覚システムによって容易に認識できる情報を埋め込む視覚形式として機能する。
ニューロモルフィックカメラは、動きのぼかしを緩和する新しい機能を提供するが、最初にブルーを脱色し、画像をリアルタイムでバイナライズするのは簡単ではない。
本稿では,イベント空間と画像空間の両方で独立に推論を行うために,バイモーダル目標特性の事前知識を活用するイベントベースバイナリ再構築手法を提案する。
また、このバイナリ画像を高フレームレートバイナリビデオに伝搬する効率的な統合手法も開発している。
論文 参考訳(メタデータ) (2024-02-20T01:43:51Z) - Breaking Modality Disparity: Harmonized Representation for Infrared and
Visible Image Registration [66.33746403815283]
シーン適応型赤外線と可視画像の登録を提案する。
我々は、異なる平面間の変形をシミュレートするためにホモグラフィーを用いる。
我々は、まず、赤外線と可視画像のデータセットが不一致であることを示す。
論文 参考訳(メタデータ) (2023-04-12T06:49:56Z) - End-to-end Multi-modal Video Temporal Grounding [105.36814858748285]
ビデオから補完情報を抽出するマルチモーダルフレームワークを提案する。
我々は、外見にRGB画像、運動に光学フロー、画像構造に深度マップを採用する。
本稿では、Charades-STAおよびActivityNet Captionsデータセットの実験を行い、提案手法が最先端のアプローチに対して好適に動作することを示す。
論文 参考訳(メタデータ) (2021-07-12T17:58:10Z) - Deep Image Synthesis from Intuitive User Input: A Review and
Perspectives [23.01321275304037]
ユーザは、テキスト、スケッチ、ストローク、グラフ、レイアウトなどの直感的な非画像入力を提供することが望ましい。
GAN(Generative Adversarial Network)やVAE(VAE)、フローベース手法といった深層生成モデルの最近の進歩は、より強力で汎用的な画像生成タスクを可能にしている。
本稿では,直感的なユーザ入力による画像合成,入力の汎用性の向上,画像生成手法,ベンチマークデータセット,評価指標について概説する。
論文 参考訳(メタデータ) (2021-07-09T06:31:47Z) - DeepMultiCap: Performance Capture of Multiple Characters Using Sparse
Multiview Cameras [63.186486240525554]
deep multicapは、スパースマルチビューカメラを用いたマルチパーソンパフォーマンスキャプチャのための新しい手法である。
本手法では,事前走査型テンプレートモデルを用いることなく,時間変化した表面の詳細をキャプチャできる。
論文 参考訳(メタデータ) (2021-05-01T14:32:13Z) - A survey of image labelling for computer vision applications [0.0]
近年,画像コンテンツ認識のためのディープラーニングアルゴリズムが普及し,アドホックなラベリングツールが出現している。
画像ラベリングソフトウェアの基本的な概念と特徴をコンパイルするために,構造化文献レビューを行う。
論文 参考訳(メタデータ) (2021-04-18T16:01:55Z) - Multimodal Face Synthesis from Visual Attributes [85.87796260802223]
本稿では,マルチモーダル顔画像を保存するIDを同時に合成する新たな生成対向ネットワークを提案する。
実画像と偽画像の区別を行う識別装置にマルチモーダルストレッチインモジュールを導入。
論文 参考訳(メタデータ) (2021-04-09T13:47:23Z) - Robust image stitching with multiple registrations [22.174139555366505]
パノラマ生成はコンピュータビジョンにおいて最も広く使われている技法の1つである。
伝統的に、問題は登録、シーム発見、ブレンディングの3つの段階に分けられる。
ここでは、特に大きな深度変化や物体の動きのあるシーンにおいて、単一の登録を使用することでエラーが発生することが多いことを観察する。
代わりに、複数の登録を使用することにより、異なる深さの画像の領域をより正確にキャプチャすることができる。
論文 参考訳(メタデータ) (2020-11-23T23:08:39Z) - Deep Group-wise Variational Diffeomorphic Image Registration [3.0022455491411653]
本稿では,複数の画像の同時登録を可能にするために,現在の学習ベース画像登録を拡張することを提案する。
本稿では,複数の画像の粘性測地線平均への登録と,利用可能な画像のいずれかを固定画像として使用可能な登録を両立できる汎用的な数学的枠組みを提案する。
論文 参考訳(メタデータ) (2020-10-01T07:37:28Z) - EXACT: A collaboration toolset for algorithm-aided annotation of images
with annotation version control [7.6457287740201]
EXACTは、オンラインおよびオフラインで画像の協調的な学際的解析を可能にする。
ソフトウェアは、スクリーニングモードでミトティックフィギュアをカウントするなど、多様なアプリケーションに適応することができる。
すでに幅広いアノテーションタスクにうまく適用されています。
論文 参考訳(メタデータ) (2020-04-30T06:07:21Z) - Towards Coding for Human and Machine Vision: A Scalable Image Coding
Approach [104.02201472370801]
圧縮モデルと生成モデルの両方を活用することにより,新しい画像符号化フレームワークを考案した。
高度な生成モデルを導入することで、コンパクトな特徴表現と参照画素から画像を再構成するフレキシブルネットワークを訓練する。
実験により、人間の視覚的品質と顔のランドマーク検出の両方において、我々の枠組みが優れていることが示された。
論文 参考訳(メタデータ) (2020-01-09T10:37:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。