論文の概要: Decoding Ancient Oracle Bone Script via Generative Dictionary Retrieval
- arxiv url: http://arxiv.org/abs/2604.09668v1
- Date: Wed, 01 Apr 2026 09:28:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.609368
- Title: Decoding Ancient Oracle Bone Script via Generative Dictionary Retrieval
- Title(参考訳): 生成辞書検索による古代Oracle Bone Scriptのデコード
- Authors: Yin Wu, Gangjian Zhang, Jiayu Chen, Chang Xu, Yuyu Luo, Nan Tang, Hui Xiong,
- Abstract要約: 中国の上海王朝の Oracle Bone Script (OBS) はこの課題を実証している。
現代漢字に対する可塑性OBS変種の合成辞書を生成する。
54.3%のTop-10と86.6%のTop-50の精度を達成した。
- 参考スコア(独自算出の注目度): 39.098205969594424
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Understanding humanity's earliest writing systems is crucial for reconstructing civilization's origins, yet many ancient scripts remain undeciphered. Oracle Bone Script (OBS) from China's Shang dynasty exemplifies this challenge: only approximately 1,500 of roughly 4,600 characters have been decoded, and a substantial portion of these 3,000-year-old inscriptions remains only partially understood. Limited by extreme data scarcity, existing computational methods achieve under 3% accuracy on unseen characters -- the core palaeographic challenge. We overcome this by reframing decipherment from classification to dictionary-based retrieval. Using deep learning guided by character evolution principles, we generate a comprehensive synthetic dictionary of plausible OBS variants for modern Chinese characters. Scholars query unknown inscriptions to retrieve visually similar candidates with transparent evidence, replacing algorithmic black boxes with interpretable hypotheses. Our approach achieves 54.3% Top-10 and 86.6% Top-50 accuracy for unseen characters. This scalable, transparent framework accelerates decipherment of a pivotal undeciphered script and establishes a generalizable methodology for AI-assisted archaeological discovery.
- Abstract(参考訳): 人類の最も初期の文字体系を理解することは文明の起源の再構築に不可欠であるが、多くの古代の文字は解読されていない。
約4,600文字の約1,500文字が解読され、3,000年前の碑文のかなりの部分が部分的には理解されていない。
極端なデータ不足によって制限された既存の計算手法は、未確認文字の精度を3%以下に抑える。
我々は、解読を分類から辞書ベースの検索に再定義することでこれを克服する。
文字進化原理で導かれた深層学習を用いて,現代漢字の可塑性OBS変種を包括的に合成した辞書を生成する。
学者は未知の碑文をクエリして、視覚的に類似した候補を透明な証拠で検索し、アルゴリズム的なブラックボックスを解釈可能な仮説で置き換える。
提案手法は54.3%のTop-10と86.6%のTop-50の精度を実現する。
このスケーラブルで透明なフレームワークは、重要な未解読スクリプトの解読を加速し、AI支援考古学的発見のための一般化可能な方法論を確立する。
関連論文リスト
- Deciphering Oracle Bone Language with Diffusion Models [70.69739681961558]
Oracle Bone Script (OBS) は約3,000年前の中国の上海王朝に由来する。
本稿では,Oracle Bone Script Decipher(OBSD)の開発を通じて,画像生成技術を採用した新しいアプローチを提案する。
OBSDは、古代の言語のAI支援分析の新しいコースをグラフ化して、解読のための重要な手がかりを生成する。
論文 参考訳(メタデータ) (2024-06-02T09:42:23Z) - An open dataset for oracle bone script recognition and decipherment [66.35957530824872]
古代中国最古の書体の一つ、Oracleの骨書は、3000年前にさかのぼる上海王朝の人文・地理を研究する学者にとって、貴重な研究資料を提示している。
時間の経過はそれらの意味の多くを曖昧にしており、これらの古代のテキストを解読する上で重要な課題が提示されている。
人工知能(AI)の出現により、Oracle Bone Characters(OBC)の解読を支援するAIが実現可能な選択肢となっている。
このデータセットは1,588個の解読文字の77,064個の画像と9,411個の未解読文字の62,989個の画像を含む。
論文 参考訳(メタデータ) (2024-01-27T09:54:16Z) - An open dataset for the evolution of oracle bone characters: EVOBC [72.91231825135665]
現存する最古の漢字は、他の東アジアの言語と密接に関連しているオラクルの骨碑文に由来する。
本研究では,6つの歴史的段階にまたがる権威あるテキストやウェブサイトから,古代の文字を体系的に収集した。
我々は13,714の異なる文字カテゴリを表す229,170の画像からなる広範囲なデータセットを構築した。
論文 参考訳(メタデータ) (2024-01-23T03:30:47Z) - Persian Typographical Error Type Detection Using Deep Neural Networks on Algorithmically-Generated Misspellings [2.2503811834154104]
タイポグラフィーによるペルシャのエラータイプ検出は比較的調査の少ない地域である。
本稿では,ペルシャ語文の誤字を検出するための説得力のあるアプローチを提案する。
最終手法の結果は競争力が高く、精度は97.62%、精度は98.83%、リコールは98.61%、速度は他を上回った。
論文 参考訳(メタデータ) (2023-05-19T15:05:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。