論文の概要: Enhancing Object Detection in Ancient Documents with Synthetic Data
Generation and Transformer-Based Models
- arxiv url: http://arxiv.org/abs/2307.16005v1
- Date: Sat, 29 Jul 2023 15:29:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-01 18:16:23.060274
- Title: Enhancing Object Detection in Ancient Documents with Synthetic Data
Generation and Transformer-Based Models
- Title(参考訳): 合成データ生成とトランスフォーマモデルを用いた古文書における物体検出の強化
- Authors: Zahra Ziran, Francesco Leotta, Massimo Mecella
- Abstract要約: 本研究は, 偽陽性を低減し, 精度を向上させることによって, 古文書における物体検出の精度を高めることを目的とする。
本稿では,計算メディエーションによる合成データセットの作成を含む手法を提案する。
我々のアプローチには、オブジェクトをコンポーネント部品に関連付けることや、異なるシンボルと文書要素を識別するための視覚的特徴マップの導入が含まれます。
- 参考スコア(独自算出の注目度): 0.4125187280299248
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The study of ancient documents provides a glimpse into our past. However, the
low image quality and intricate details commonly found in these documents
present significant challenges for accurate object detection. The objective of
this research is to enhance object detection in ancient documents by reducing
false positives and improving precision. To achieve this, we propose a method
that involves the creation of synthetic datasets through computational
mediation, along with the integration of visual feature extraction into the
object detection process. Our approach includes associating objects with their
component parts and introducing a visual feature map to enable the model to
discern between different symbols and document elements. Through our
experiments, we demonstrate that improved object detection has a profound
impact on the field of Paleography, enabling in-depth analysis and fostering a
greater understanding of these valuable historical artifacts.
- Abstract(参考訳): 古代文書の研究は、我々の過去を垣間見ることができる。
しかし、これらの文書でよく見られる画像品質の低さと複雑な詳細は、正確な物体検出に重大な課題をもたらす。
本研究の目的は,偽陽性を低減し,精度を向上させることで,古文書の物体検出性を向上させることである。
そこで本研究では,画像特徴抽出のオブジェクト検出プロセスへの統合とともに,計算仲介による合成データセットの作成を含む手法を提案する。
我々のアプローチには、オブジェクトをコンポーネント部品に関連付け、異なるシンボルと文書要素を識別するための視覚的特徴マップを導入することが含まれる。
実験により, 改良された物体検出が古文書の分野に大きな影響を与え, 詳細な分析が可能となり, 貴重な歴史的遺物の理解が深まることを実証した。
関連論文リスト
- Correlation of Object Detection Performance with Visual Saliency and Depth Estimation [0.09208007322096533]
本稿では,物体検出精度と,深度予測と視覚塩分率予測の2つの基本的な視覚的課題の相関について検討する。
分析の結果,これらの相関は対象のカテゴリ間で有意な変化を示し,相関値がより小さいオブジェクトの最大3倍も大きいことが判明した。
これらの結果から, 物体検出アーキテクチャに視覚的サリエンシ機能を組み込むことは, 深度情報よりも有益であることが示唆された。
論文 参考訳(メタデータ) (2024-11-05T06:34:19Z) - Scene-Graph ViT: End-to-End Open-Vocabulary Visual Relationship Detection [14.22646492640906]
オープン語彙の視覚的関係検出のための単純かつ高効率なデコーダレスアーキテクチャを提案する。
我々のモデルはTransformerベースの画像エンコーダで、オブジェクトをトークンとして表現し、それらの関係を暗黙的にモデル化する。
提案手法は,ビジュアルゲノムおよび大語彙GQAベンチマーク上で,リアルタイムな推論速度で,最先端の関係検出性能を実現する。
論文 参考訳(メタデータ) (2024-03-21T10:15:57Z) - Oriented Object Detection in Optical Remote Sensing Images using Deep Learning: A Survey [10.665235711722076]
オブジェクト指向物体検出は、リモートセンシングにおいて最も基本的で困難なタスクの1つである。
近年,ディープラーニング技術を用いたオブジェクト指向物体検出の進歩が目覚ましい。
論文 参考訳(メタデータ) (2023-02-21T06:31:53Z) - Spatial Reasoning for Few-Shot Object Detection [21.3564383157159]
本稿では,空間的推論フレームワークを提案する。
グラフ畳み込みネットワークをRoIとその関連性はそれぞれノードとエッジとして定義する。
提案手法は最先端の手法を著しく上回り, 広範囲なアブレーション研究により有効性を検証する。
論文 参考訳(メタデータ) (2022-11-02T12:38:08Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - Inverting and Understanding Object Detectors [15.207501110589924]
本稿では,最新の物体検出法を理解し,レイアウトインバージョンに対する最適化に基づくアプローチを開発するために,インバージョンを主要なツールとして用いることを提案する。
我々は, 種々の現代の物体検出器にレイアウト反転技術を適用して, 検出器の興味深い特性を明らかにした。
論文 参考訳(メタデータ) (2021-06-26T03:31:59Z) - Ensembling object detectors for image and video data analysis [98.26061123111647]
本稿では,複数の物体検出器の出力をアンサンブルすることで,画像データ上の境界ボックスの検出性能と精度を向上させる手法を提案する。
本研究では,2段階追跡に基づく検出精度向上手法を提案することで,映像データに拡張する。
論文 参考訳(メタデータ) (2021-02-09T12:38:16Z) - Deep Texture-Aware Features for Camouflaged Object Detection [69.84122372541506]
本稿では, テクスチャ認識モジュールを定式化し, 深層畳み込みニューラルネットワークにおけるテクスチャ認識の特徴を学習する。
我々は,キャモフラージュされた物体検出のためのベンチマークデータセット上で,定性的かつ定量的にネットワークを評価した。
論文 参考訳(メタデータ) (2021-02-05T04:38:32Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - Learning Object Detection from Captions via Textual Scene Attributes [70.90708863394902]
キャプションには、オブジェクトの属性やそれらの関係など、画像に関するよりリッチな情報が含まれている、と我々は主張する。
本稿では,この「テキストシーングラフ」の属性を用いて物体検知器を訓練する手法を提案する。
得られたモデルが、いくつかの挑戦的なオブジェクト検出データセットに対して、最先端の結果を達成することを実証的に実証した。
論文 参考訳(メタデータ) (2020-09-30T10:59:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。