論文の概要: A Cross-Font Image Retrieval Network for Recognizing Undeciphered Oracle Bone Inscriptions
- arxiv url: http://arxiv.org/abs/2409.06381v2
- Date: Thu, 26 Dec 2024 02:32:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-30 17:22:17.102286
- Title: A Cross-Font Image Retrieval Network for Recognizing Undeciphered Oracle Bone Inscriptions
- Title(参考訳): 非解読型Oracle骨碑文認識のためのクロスフォン画像検索ネットワーク
- Authors: Zhicong Wu, Qifeng Su, Ke Gu, Xiaodong Shi,
- Abstract要約: Oracle Bone Inscription (OBI)は中国最古の成熟した書記システムである。
OBI文字を解読するクロスファント画像検索ネットワーク(CFIRN)を提案する。
- 参考スコア(独自算出の注目度): 12.664292922995532
- License:
- Abstract: Oracle Bone Inscription (OBI) is the earliest mature writing system in China, which represents a crucial stage in the development of hieroglyphs. Nevertheless, the substantial quantity of undeciphered OBI characters remains a significant challenge for scholars, while conventional methods of ancient script research are both time-consuming and labor-intensive. In this paper, we propose a cross-font image retrieval network (CFIRN) to decipher OBI characters by establishing associations between OBI characters and other script forms, simulating the interpretive behavior of paleography scholars. Concretely, our network employs a siamese framework to extract deep features from character images of various fonts, fully exploring structure clues with different resolutions by multiscale feature integration (MFI) module and multiscale refinement classifier (MRC). Extensive experiments on three challenging cross-font image retrieval datasets demonstrate that, given undeciphered OBI characters, our CFIRN can effectively achieve accurate matches with characters from other gallery fonts, thereby facilitating the deciphering.
- Abstract(参考訳): Oracle Bone Inscription (OBI)は中国で最初期の成熟した書記システムであり、ヒエログリフの開発において重要な段階である。
それでも、未解読のOBI文字のかなりの量は、研究者にとって重要な課題であり、従来の書体研究の手法は、時間と労働の両方に費やされている。
本稿では,OBI文字と他のスクリプト形式との関連性を確立し,古文学者の解釈行動をシミュレートすることで,OBI文字を解読するクロスファント画像検索ネットワーク(CFIRN)を提案する。
具体的には,様々なフォントの文字画像から深い特徴を抽出するシマセフレームワークを用いて,マルチスケール特徴統合 (MFI) モジュールとマルチスケール精細分類器 (MRC) を用いて,解像度の異なる構造手がかりを探索する。
3つの難解なクロスファント画像検索データセットに対する大規模な実験により、未解読のOBI文字が与えられた場合、我々のCFIRNは、他のギャラリーフォントの文字との正確なマッチングを効果的に達成し、解読を容易にすることを示した。
関連論文リスト
- Towards Text-Image Interleaved Retrieval [49.96332254241075]
テキスト画像検索(TIIR)タスクを導入し、クエリと文書をインターリーブしたテキスト画像シーケンスとする。
我々は、自然にインターリーブされたwikiHowチュートリアルに基づいてTIIRベンチマークを構築し、インターリーブされたクエリを生成するために特定のパイプラインを設計する。
異なる粒度で視覚トークンの数を圧縮する新しいMMEを提案する。
論文 参考訳(メタデータ) (2025-02-18T12:00:47Z) - Structured Analysis and Comparison of Alphabets in Historical Handwritten Ciphers [3.423211639513232]
本稿では,暗号文書のペア比較手法であるCSIメトリックを提案する。
我々は、SIFT、事前学習型埋め込み、OCR記述子などの視覚的特徴を利用した教師なしクラスタリングシナリオにおけるそれらの有効性を評価する。
論文 参考訳(メタデータ) (2024-10-29T10:12:16Z) - Retrieval-Enhanced Machine Learning: Synthesis and Opportunities [60.34182805429511]
検索エンハンスメントは機械学習(ML)の幅広い範囲に拡張できる
この研究は、MLの様々な領域の文献を、現在の文献から欠落している一貫した表記で合成することで、このパラダイムの正式なフレームワークであるRetrieval-Enhanced Machine Learning (REML)を導入する。
本研究の目的は、様々な分野の研究者に対して、検索強化モデルの包括的、正式に構造化された枠組みを付与し、学際的な将来の研究を促進することである。
論文 参考訳(メタデータ) (2024-07-17T20:01:21Z) - Oracle Bone Inscriptions Multi-modal Dataset [58.20314888996118]
オラクルの骨碑文(Oracle bone inscriptions, OBI)は中国最古の書記体系であり、初期の上海の歴史や古史の貴重な実例を記している。
本稿では,10,077個のオラクル骨の注釈情報を含むOracle Bone Inscriptions Multi-modalデータセットを提案する。
このデータセットは、OBIの文字検出と認識、ラビングDenoising、キャラクタマッチング、キャラクタ生成、読み込みシーケンス予測、ミスキャラクタ補完タスクなど、OBIの分野に関連するさまざまなAI関連研究タスクに使用することができる。
論文 参考訳(メタデータ) (2024-07-04T12:47:32Z) - Puzzle Pieces Picker: Deciphering Ancient Chinese Characters with Radical Reconstruction [73.26364649572237]
Oracle Bone Inscriptionsは、世界で最も古い書式である。
多くのOracle Bone Inscriptions (OBI) は未解読のままであり、今日の古生物学におけるグローバルな課題の1つとなっている。
本稿では, 急進的再構成によってこれらの謎的文字を解読する新しい手法, Puzzle Pieces Picker (P$3$) を提案する。
論文 参考訳(メタデータ) (2024-06-05T07:34:39Z) - Deformation Robust Text Spotting with Geometric Prior [5.639053898266709]
我々は,文字の複雑な変形の認識問題を解決するために,頑健なテキストスポッティング法(DR TextSpotter)を開発した。
グラフ畳み込みネットワークは、キャラクタの特徴とランドマークの特徴を融合させ、セマンティック推論を行い、異なるキャラクタの識別を強化する。
論文 参考訳(メタデータ) (2023-08-31T02:13:15Z) - OCRBench: On the Hidden Mystery of OCR in Large Multimodal Models [122.27878464009181]
テキスト関連視覚タスクにおいて, GPT4V や Gemini などの大規模マルチモーダルモデルの包括的評価を行った。
OCRBenchには29のデータセットがあり、最も包括的なOCR評価ベンチマークが利用できる。
論文 参考訳(メタデータ) (2023-05-13T11:28:37Z) - Unsupervised Clustering of Roman Potsherds via Variational Autoencoders [63.8376359764052]
我々は,ローマのコモンウェア・ポッシャードの分類作業において,考古学者を支援する人工知能ソリューションを提案する。
断片の部分性と手作りのばらつきは、それらのマッチングを困難な問題にしている。
深部畳み込み変分オートエンコーダ(VAE)ネットワークの潜時空間で学習した非線形特徴の教師なし階層的クラスタリングにより、類似したプロファイルをペアリングすることを提案する。
論文 参考訳(メタデータ) (2022-03-14T18:56:13Z) - HENet: Forcing a Network to Think More for Font Recognition [10.278412487287882]
本稿では,フォント認識タスクを解決するプラグインモジュールを備えた新しいフォント認識器を提案する。
プラグイン可能なモジュールは、最も識別しやすい機能を隠蔽し、HEブロックと呼ばれる類似フォントの難しい例を解決するために、他の複雑な機能を考えるようにネットワークに強制する。
論文 参考訳(メタデータ) (2021-10-21T03:25:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。