論文の概要: A comprehensive survey of oracle character recognition: challenges, benchmarks, and beyond
- arxiv url: http://arxiv.org/abs/2411.11354v1
- Date: Mon, 18 Nov 2024 07:50:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-19 14:35:18.370261
- Title: A comprehensive survey of oracle character recognition: challenges, benchmarks, and beyond
- Title(参考訳): オラクル文字認識に関する包括的調査--課題、ベンチマークなど
- Authors: Jing Li, Xueke Chi, Qiufeng Wang, Dahan Wang, Kaizhu Huang, Yongge Liu, Cheng-lin Liu,
- Abstract要約: オラクルの文字認識は考古学、古生物学、歴史文化研究と交差する重要な分野となっている。
伝統的な神託文字認識法は、専門家による手作業による解釈に大きく依存している。
近年のパターン認識とディープラーニングの進歩により、オラクル文字認識の自動化に向けた動きが高まっている。
- 参考スコア(独自算出の注目度): 39.542007188857376
- License:
- Abstract: Oracle character recognition-an analysis of ancient Chinese inscriptions found on oracle bones-has become a pivotal field intersecting archaeology, paleography, and historical cultural studies. Traditional methods of oracle character recognition have relied heavily on manual interpretation by experts, which is not only labor-intensive but also limits broader accessibility to the general public. With recent breakthroughs in pattern recognition and deep learning, there is a growing movement towards the automation of oracle character recognition (OrCR), showing considerable promise in tackling the challenges inherent to these ancient scripts. However, a comprehensive understanding of OrCR still remains elusive. Therefore, this paper presents a systematic and structured survey of the current landscape of OrCR research. We commence by identifying and analyzing the key challenges of OrCR. Then, we provide an overview of the primary benchmark datasets and digital resources available for OrCR. A review of contemporary research methodologies follows, in which their respective efficacies, limitations, and applicability to the complex nature of oracle characters are critically highlighted and examined. Additionally, our review extends to ancillary tasks associated with OrCR across diverse disciplines, providing a broad-spectrum analysis of its applications. We conclude with a forward-looking perspective, proposing potential avenues for future investigations that could yield significant advancements in the field.
- Abstract(参考訳): オラクルの文字認識(オラクルの文字認識)-オラクルの骨から発見された古代中国の碑文を分析した結果、考古学、古生物学、歴史文化研究と交差する重要な分野となった。
伝統的なオラクルの文字認識法は、専門家による手作業による解釈に大きく依存しており、これは労働集約的なだけでなく、一般大衆への幅広いアクセシビリティも制限している。
近年のパターン認識とディープラーニングの進歩により、オラクル文字認識(OrCR)の自動化に向けた動きが高まり、これらの古代のスクリプトに固有の課題に対処する上で大きな可能性を秘めている。
しかし、OrCRの包括的な理解はまだ解明されていない。
そこで本研究では,OrCR研究の現況を体系的かつ構造化した調査を行った。
我々はOrCRの重要な課題を特定し分析し始める。
次に、OrCRで利用可能な主要なベンチマークデータセットとデジタルリソースの概要を紹介する。
現代の研究手法のレビューでは、それぞれの効力、限界、およびオラクル文字の複雑な性質への適用性を批判的に強調し、検討している。
さらに、我々のレビューは、OrCRに関連するアシリータスクを様々な分野にわたって拡張し、その応用の幅広いスペクトル分析を提供する。
我々は、今後の調査に向けた潜在的な道のりを提案し、この分野で大きな進歩をもたらす可能性がある、という先見的な視点で結論づける。
関連論文リスト
- On the Element-Wise Representation and Reasoning in Zero-Shot Image Recognition: A Systematic Survey [82.49623756124357]
ゼロショット画像認識(ZSIR)は、目に見えない領域の認識と推論をモデルに与えることを目的としている。
本稿では,近年の素子ワイドZSIRの進歩について概説する。
まず、オブジェクト認識、合成認識、基礎モデルに基づくオープンワールド認識という3つの基本的なZSIRタスクを、統一された要素的視点に統合する。
論文 参考訳(メタデータ) (2024-08-09T05:49:21Z) - Self-Supervised Learning for Text Recognition: A Critical Survey [11.599791967838481]
テキスト認識(英語: Text Recognition, TR)とは、画像からテキスト情報を取得することに焦点を当てた研究領域である。
ディープニューラルネットワーク(DNN)のトレーニングにラベルなしデータの大規模なデータセットを活用することで、自己監視学習(SSL)が注目されている。
本稿では,TR分野におけるSSLの利用を集約し,その技術の現状を概観する。
論文 参考訳(メタデータ) (2024-07-29T11:11:17Z) - Recent Advances in Hate Speech Moderation: Multimodality and the Role of Large Models [52.24001776263608]
この包括的調査は、HSモデレーションの最近の歩みを掘り下げている。
大型言語モデル(LLM)と大規模マルチモーダルモデル(LMM)の急成長する役割を強調した。
研究における既存のギャップを、特に表現不足言語や文化の文脈で特定する。
論文 参考訳(メタデータ) (2024-01-30T03:51:44Z) - Advancements and Challenges in Arabic Optical Character Recognition: A
Comprehensive Survey [0.6629765271909505]
本稿では,アラビア語光文字認識(OCR)に関する現代的応用,方法論,課題の徹底的なレビューを提案する。
OCRプロセス全体で広く利用されている技術について、徹底的な分析を行い、改善された成果を示す最も効果的なアプローチを識別する努力を払っている。
本稿では,最先端技術と手法の提示に加えて,アラビアOCRの領域における研究ギャップを批判的に識別する。
論文 参考訳(メタデータ) (2023-12-19T03:01:31Z) - Oracle Character Recognition using Unsupervised Discriminative
Consistency Network [65.64172835624206]
オラクル文字認識(OrCR)のための新しい教師なしドメイン適応手法を提案する。
擬似ラベルを利用して意味情報を適応と制約強化の整合性に組み込む。
提案手法は,Oracle-241データセットの最先端結果を実現し,最近提案した構造・テクスチャ分離ネットワークを15.1%向上させる。
論文 参考訳(メタデータ) (2023-12-11T02:52:27Z) - OCRBench: On the Hidden Mystery of OCR in Large Multimodal Models [122.27878464009181]
テキスト関連視覚タスクにおいて, GPT4V や Gemini などの大規模マルチモーダルモデルの包括的評価を行った。
OCRBenchには29のデータセットがあり、最も包括的なOCR評価ベンチマークが利用できる。
論文 参考訳(メタデータ) (2023-05-13T11:28:37Z) - Review of coreference resolution in English and Persian [8.604145658574689]
参照解決(CR)は、同じ現実世界の実体を参照する表現を識別する。
本稿では、コア参照とアナフォラ分解能にまたがるCRの最近の進歩について考察する。
ペルシャのCRの独特な課題を認識し、このアンダーリソース言語に焦点をあてる。
論文 参考訳(メタデータ) (2022-11-08T18:14:09Z) - Deep Learning meets Liveness Detection: Recent Advancements and
Challenges [3.2011056280404637]
我々は,2017年以降の深部機能的FAS手法に関する文献を包括的に調査している。
本研究では,FASの時系列,進化過程,評価基準について概説する。
論文 参考訳(メタデータ) (2021-12-29T19:24:58Z) - On how Cognitive Computing will plan your next Systematic Review [3.0816257225447763]
我々は,24人のSLR著者の計画実践,課題,支援戦略に対するフィードバックについての知見を報告する。
我々はこの知見をcognitive augmentation frameworkで検証し,プロトタイプの実装と評価について報告する。
論文 参考訳(メタデータ) (2020-12-15T09:56:09Z) - Survey on the Analysis and Modeling of Visual Kinship: A Decade in the
Making [66.72253432908693]
親和性認識は多くの実践的応用において難しい問題である。
我々は、多くの人にその見解を刺激した公開リソースとデータ課題についてレビューする。
10周年記念には、さまざまなkinベースのタスクのためのデモコードが用意されている。
論文 参考訳(メタデータ) (2020-06-29T13:25:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。