論文の概要: A Cross-Font Image Retrieval Network for Recognizing Undeciphered Oracle Bone Inscriptions
- arxiv url: http://arxiv.org/abs/2409.06381v1
- Date: Tue, 10 Sep 2024 10:04:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-11 18:10:00.497535
- Title: A Cross-Font Image Retrieval Network for Recognizing Undeciphered Oracle Bone Inscriptions
- Title(参考訳): 非解読型Oracle骨碑文認識のためのクロスフォン画像検索ネットワーク
- Authors: Zhicong Wu, Qifeng Su, Ke Gu, Xiaodong Shi,
- Abstract要約: Oracle Bone Inscription (OBI) は中国で最も初期の成熟した書記システムである。
OBI文字を解読するクロスファント画像検索ネットワーク(CFIRN)を提案する。
- 参考スコア(独自算出の注目度): 12.664292922995532
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Oracle Bone Inscription (OBI) is the earliest mature writing system known in China to date, which represents a crucial stage in the development of hieroglyphs. Nevertheless, the substantial quantity of undeciphered OBI characters continues to pose a persistent challenge for scholars, while conventional methods of ancient script research are both time-consuming and labor-intensive. In this paper, we propose a cross-font image retrieval network (CFIRN) to decipher OBI characters by establishing associations between OBI characters and other script forms, simulating the interpretive behavior of paleography scholars. Concretely, our network employs a siamese framework to extract deep features from character images of various fonts, fully exploring structure clues with different resolution by designed multiscale feature integration (MFI) module and multiscale refinement classifier (MRC). Extensive experiments on three challenging cross-font image retrieval datasets demonstrate that, given undeciphered OBI characters, our CFIRN can effectively achieve accurate matches with characters from other gallery fonts.
- Abstract(参考訳): Oracle Bone Inscription (OBI) は中国で最も初期の成熟した書記システムであり、ヒエログリフの開発において重要な段階である。
それでも、未解読のOBI文字のかなりの量は学者にとって永続的な課題であり続けており、従来の書体研究の手法は時間がかかり、労働集約的である。
本稿では,OBI文字と他のスクリプト形式との関連性を確立し,古文学者の解釈行動をシミュレートすることで,OBI文字を解読するクロスファント画像検索ネットワーク(CFIRN)を提案する。
具体的には,様々なフォントの文字画像から深い特徴を抽出するシマセフレームワークを用いて,設計したマルチスケール特徴統合(MFI)モジュールとマルチスケール精細分類器(MRC)を用いて,解像度の異なる構造手がかりを探索する。
3つの難解なクロスファント画像検索データセットに対する大規模な実験により、未解読のOBI文字が与えられた場合、我々のCFIRNは、他のギャラリーフォントの文字との正確なマッチングを効果的に達成できることを示した。
関連論文リスト
- Retrieval-Enhanced Machine Learning: Synthesis and Opportunities [60.34182805429511]
検索エンハンスメントは機械学習(ML)の幅広い範囲に拡張できる
この研究は、MLの様々な領域の文献を、現在の文献から欠落している一貫した表記で合成することで、このパラダイムの正式なフレームワークであるRetrieval-Enhanced Machine Learning (REML)を導入する。
本研究の目的は、様々な分野の研究者に対して、検索強化モデルの包括的、正式に構造化された枠組みを付与し、学際的な将来の研究を促進することである。
論文 参考訳(メタデータ) (2024-07-17T20:01:21Z) - Oracle Bone Inscriptions Multi-modal Dataset [58.20314888996118]
オラクルの骨碑文(Oracle bone inscriptions, OBI)は中国最古の書記体系であり、初期の上海の歴史や古史の貴重な実例を記している。
本稿では,10,077個のオラクル骨の注釈情報を含むOracle Bone Inscriptions Multi-modalデータセットを提案する。
このデータセットは、OBIの文字検出と認識、ラビングDenoising、キャラクタマッチング、キャラクタ生成、読み込みシーケンス予測、ミスキャラクタ補完タスクなど、OBIの分野に関連するさまざまなAI関連研究タスクに使用することができる。
論文 参考訳(メタデータ) (2024-07-04T12:47:32Z) - Puzzle Pieces Picker: Deciphering Ancient Chinese Characters with Radical Reconstruction [73.26364649572237]
Oracle Bone Inscriptionsは、世界で最も古い書式である。
多くのOracle Bone Inscriptions (OBI) は未解読のままであり、今日の古生物学におけるグローバルな課題の1つとなっている。
本稿では, 急進的再構成によってこれらの謎的文字を解読する新しい手法, Puzzle Pieces Picker (P$3$) を提案する。
論文 参考訳(メタデータ) (2024-06-05T07:34:39Z) - OCRBench: On the Hidden Mystery of OCR in Large Multimodal Models [122.27878464009181]
テキスト関連視覚タスクにおいて, GPT4V や Gemini などの大規模マルチモーダルモデルの包括的評価を行った。
OCRBenchには29のデータセットがあり、最も包括的なOCR評価ベンチマークが利用できる。
論文 参考訳(メタデータ) (2023-05-13T11:28:37Z) - VGTS: Visually Guided Text Spotting for Novel Categories in Historical Manuscripts [26.09365732823049]
本稿では,1つの注釈付きサポートサンプルを用いて,新しい文字を正確に検出するビジュアルガイドテキストスポッティング(VGTS)手法を提案する。
DSAブロックは、人間の視覚的スポッティングプロセスを模倣して、サポート画像とクエリ画像における識別的空間領域を特定し、焦点を合わせ、学習することを目的としている。
低リソーススポッティングタスクにおける例不均衡問題に対処するため,距離メトリック学習のための埋め込み空間の識別力を高める新しいトーラス損失関数を開発した。
論文 参考訳(メタデータ) (2023-04-03T06:40:52Z) - Unsupervised Clustering of Roman Potsherds via Variational Autoencoders [63.8376359764052]
我々は,ローマのコモンウェア・ポッシャードの分類作業において,考古学者を支援する人工知能ソリューションを提案する。
断片の部分性と手作りのばらつきは、それらのマッチングを困難な問題にしている。
深部畳み込み変分オートエンコーダ(VAE)ネットワークの潜時空間で学習した非線形特徴の教師なし階層的クラスタリングにより、類似したプロファイルをペアリングすることを提案する。
論文 参考訳(メタデータ) (2022-03-14T18:56:13Z) - Continuous Offline Handwriting Recognition using Deep Learning Models [0.0]
手書き文字認識は、自動文書画像解析の分野に大きな関心を持つオープンな問題である。
我々は,畳み込みニューラルネットワーク(CNN)とシーケンス・ツー・シーケンス(seq2seq)という,2種類のディープラーニングアーキテクチャの統合に基づく新しい認識モデルを提案する。
提案した新たなモデルでは,他の確立された方法論と競合する結果が得られる。
論文 参考訳(メタデータ) (2021-12-26T07:31:03Z) - HENet: Forcing a Network to Think More for Font Recognition [10.278412487287882]
本稿では,フォント認識タスクを解決するプラグインモジュールを備えた新しいフォント認識器を提案する。
プラグイン可能なモジュールは、最も識別しやすい機能を隠蔽し、HEブロックと呼ばれる類似フォントの難しい例を解決するために、他の複雑な機能を考えるようにネットワークに強制する。
論文 参考訳(メタデータ) (2021-10-21T03:25:47Z) - Scalable Font Reconstruction with Dual Latent Manifolds [55.29525824849242]
タイポグラフィー解析とフォント再構成を行う深層生成モデルを提案する。
このアプローチによって、効果的にモデル化できるキャラクタの種類を大規模にスケールアップすることが可能になります。
多くの言語の文字タイプを表す様々なデータセット上でフォント再構成のタスクを評価する。
論文 参考訳(メタデータ) (2021-09-10T20:37:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。