論文の概要: Reviving Cultural Heritage: A Novel Approach for Comprehensive Historical Document Restoration
- arxiv url: http://arxiv.org/abs/2507.05108v1
- Date: Mon, 07 Jul 2025 15:26:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:35.478234
- Title: Reviving Cultural Heritage: A Novel Approach for Comprehensive Historical Document Restoration
- Title(参考訳): 文化遺産の復興 : 総合的史料復元への新たなアプローチ
- Authors: Yuyi Zhang, Peirong Zhang, Zhenhua Yang, Pengyu Yan, Yongxin Shi, Pengwei Liu, Fengjun Guo, Lianwen Jin,
- Abstract要約: 歴史文書は貴重な文化遺産であるが、涙、水浸食、酸化などを通じて時間の経過とともに著しく劣化している。
既存の文書復元法(モダリティ)は主に単一ないし限定的な修復に重点を置いており、実際的な要求に応えていない。
フルページHDRデータセット(FP)と新しい自動HDRソリューション(Auto)を提案する。
FPは1,633個の実画像と6,543個の合成画像と、文字レベルと行レベルの位置と、異なる損傷グレードの文字アノテーションから構成される。
- 参考スコア(独自算出の注目度): 25.382796458767835
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Historical documents represent an invaluable cultural heritage, yet have undergone significant degradation over time through tears, water erosion, and oxidation. Existing Historical Document Restoration (HDR) methods primarily focus on single modality or limited-size restoration, failing to meet practical needs. To fill this gap, we present a full-page HDR dataset (FPHDR) and a novel automated HDR solution (AutoHDR). Specifically, FPHDR comprises 1,633 real and 6,543 synthetic images with character-level and line-level locations, as well as character annotations in different damage grades. AutoHDR mimics historians' restoration workflows through a three-stage approach: OCR-assisted damage localization, vision-language context text prediction, and patch autoregressive appearance restoration. The modular architecture of AutoHDR enables seamless human-machine collaboration, allowing for flexible intervention and optimization at each restoration stage. Experiments demonstrate AutoHDR's remarkable performance in HDR. When processing severely damaged documents, our method improves OCR accuracy from 46.83\% to 84.05\%, with further enhancement to 94.25\% through human-machine collaboration. We believe this work represents a significant advancement in automated historical document restoration and contributes substantially to cultural heritage preservation. The model and dataset are available at https://github.com/SCUT-DLVCLab/AutoHDR.
- Abstract(参考訳): 歴史文書は貴重な文化遺産であるが、涙、水浸食、酸化などを通じて時間の経過とともに著しく劣化している。
既存の歴史的文書復元法(HDR)は主に単一のモダリティや限られたサイズの復元に重点を置いており、実際的な要求に応えていない。
このギャップを埋めるために、フルページHDRデータセット(FPHDR)と、新しい自動HDRソリューション(AutoHDR)を提案する。
具体的には、FPHDRは1,633個の実画像と6,543個の合成画像と、文字レベルと行レベルの位置と、異なる損傷グレードの文字アノテーションから構成される。
AutoHDRは、歴史学者の復元ワークフローを3段階のアプローチで模倣している。
AutoHDRのモジュラーアーキテクチャは、シームレスな人間と機械の協調を可能にし、各修復段階で柔軟な介入と最適化を可能にする。
実験はオートHDRのHDRにおける顕著な性能を示す。
重傷を負った文書を処理する場合,OCRの精度は46.83\%から84.05\%に向上し,さらに94.25\%に向上する。
本研究は, 自動史料復元の大幅な進歩を図り, 文化遺産保存に大きく貢献すると考えられる。
モデルとデータセットはhttps://github.com/SCUT-DLVCLab/AutoHDRで公開されている。
関連論文リスト
- PreP-OCR: A Complete Pipeline for Document Image Restoration and Enhanced OCR Accuracy [14.50674472785442]
PreP-OCRは、文書イメージの復元と意味認識後OCR修正を組み合わせた2段階のパイプラインである。
原画像上のOCRと比較して,PreP-OCRは文字誤り率を63.9-70.3%削減する。
論文 参考訳(メタデータ) (2025-05-26T18:25:28Z) - Predicting the Original Appearance of Damaged Historical Documents [34.86809131375189]
歴史資料には多くの文化財が含まれているが、文字の欠如、紙の損傷、インク浸食などの深刻な被害に悩まされている。
既存の文書処理方法は、主にバイナライゼーション、強化等に重点を置いており、これらの損傷の修復を怠っている。
我々は,損傷した史料の本来の出現を予測することを目的とした,歴史文書修復という新たな課題を提示する。
論文 参考訳(メタデータ) (2024-12-16T10:25:03Z) - Preserving Old Memories in Vivid Detail: Human-Interactive Photo Restoration Framework [19.213916633152625]
写真修復は結果の質を向上させることができるが、コストと修復に要する時間の観点からすると、しばしば高い価格で提供される。
本稿では,複数のステージから構成されるAIベースの写真復元フレームワークについて述べる。
評価用データセットが公開されていないため,新しい写真復元データセットを提案する。
論文 参考訳(メタデータ) (2024-10-12T13:23:08Z) - Overcoming False Illusions in Real-World Face Restoration with Multi-Modal Guided Diffusion Model [55.46927355649013]
本稿では,新しいマルチモーダル・リアル・ワールド・フェイス・リカバリ技術を紹介する。
MGFRは偽の顔の特徴とアイデンティティの生成を緩和することができる。
4800のアイデンティティにまたがる21,000以上の高解像度顔画像からなるReface-HQデータセットを提案する。
論文 参考訳(メタデータ) (2024-10-05T13:46:56Z) - InstructIR: High-Quality Image Restoration Following Human Instructions [61.1546287323136]
本稿では,人間の手書きによる画像復元モデルを導出する手法を提案する。
InstructIRという手法は、いくつかの修復作業において最先端の結果を得る。
論文 参考訳(メタデータ) (2024-01-29T18:53:33Z) - Scaling Up to Excellence: Practicing Model Scaling for Photo-Realistic Image Restoration In the Wild [57.06779516541574]
SUPIR (Scaling-UP Image Restoration) は、生成前処理とモデルスケールアップのパワーを利用する、画期的な画像復元手法である。
モデルトレーニングのための2000万の高解像度高画質画像からなるデータセットを収集し、それぞれに記述的テキストアノテーションを付加する。
論文 参考訳(メタデータ) (2024-01-24T17:58:07Z) - Efficient HDR Reconstruction from Real-World Raw Images [16.54071503000866]
エッジデバイス上の高解像度スクリーンは、効率的な高ダイナミックレンジ(HDR)アルゴリズムに対する強い需要を刺激する。
多くの既存のHDRメソッドは不満足な結果をもたらすか、計算資源やメモリ資源を消費する。
本研究では,生画像から直接HDRを再構成し,新しいニューラルネットワーク構造を探索する優れた機会を見出した。
論文 参考訳(メタデータ) (2023-06-17T10:10:15Z) - HDR-GAN: HDR Image Reconstruction from Multi-Exposed LDR Images with
Large Motions [62.44802076971331]
マルチ露光LDR画像からHDR画像を合成するための新しいGANモデルHDR-GANを提案する。
本手法は,敵対学習を取り入れることで,欠落したコンテンツのある領域に忠実な情報を生成することができる。
論文 参考訳(メタデータ) (2020-07-03T11:42:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。