論文の概要: OracleFusion: Assisting the Decipherment of Oracle Bone Script with Structurally Constrained Semantic Typography
- arxiv url: http://arxiv.org/abs/2506.21101v1
- Date: Thu, 26 Jun 2025 08:56:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:10.029028
- Title: OracleFusion: Assisting the Decipherment of Oracle Bone Script with Structurally Constrained Semantic Typography
- Title(参考訳): OracleFusion: 構造的に制約されたセマンティックタイポグラフィによるOracle Bone Scriptの解読を支援する
- Authors: Caoshuo Li, Zengmao Ding, Xiaobin Hu, Bang Li, Donghao Luo, AndyPian Wu, Chaoyang Wang, Chengjie Wang, Taisong Jin, SevenShu, Yunsheng Wu, Yongge Liu, Rongrong Ji,
- Abstract要約: Oracle Bone Script (OBS) は古代文明の文化記録と知的表現をカプセル化している。
約4,500のOBS文字が発見されたが、解読されたのは1,600文字程度である。
本稿では,OracleFusionという新しい2段階セマンティックフレームワークを提案する。
- 参考スコア(独自算出の注目度): 58.790901822971094
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As one of the earliest ancient languages, Oracle Bone Script (OBS) encapsulates the cultural records and intellectual expressions of ancient civilizations. Despite the discovery of approximately 4,500 OBS characters, only about 1,600 have been deciphered. The remaining undeciphered ones, with their complex structure and abstract imagery, pose significant challenges for interpretation. To address these challenges, this paper proposes a novel two-stage semantic typography framework, named OracleFusion. In the first stage, this approach leverages the Multimodal Large Language Model (MLLM) with enhanced Spatial Awareness Reasoning (SAR) to analyze the glyph structure of the OBS character and perform visual localization of key components. In the second stage, we introduce Oracle Structural Vector Fusion (OSVF), incorporating glyph structure constraints and glyph maintenance constraints to ensure the accurate generation of semantically enriched vector fonts. This approach preserves the objective integrity of the glyph structure, offering visually enhanced representations that assist experts in deciphering OBS. Extensive qualitative and quantitative experiments demonstrate that OracleFusion outperforms state-of-the-art baseline models in terms of semantics, visual appeal, and glyph maintenance, significantly enhancing both readability and aesthetic quality. Furthermore, OracleFusion provides expert-like insights on unseen oracle characters, making it a valuable tool for advancing the decipherment of OBS.
- Abstract(参考訳): 初期の古代言語の一つとして、Oracle Bone Script (OBS) は古代文明の文化的記録と知的表現をカプセル化している。
約4,500のOBS文字が発見されたが、解読されたのは1,600文字程度である。
残りの未解読のものは、複雑な構造と抽象的なイメージを持ち、解釈に重大な課題を生じさせる。
これらの課題に対処するために,OracleFusionという2段階のセマンティックタイポグラフィーフレームワークを提案する。
第1段階では,マルチモーダル大言語モデル(MLLM)と空間認識推論(SAR)を活用し,OBS文字のグリフ構造を分析し,キーコンポーネントの視覚的局所化を行う。
第二段階では、Oracle Structure Vector Fusion (OSVF)を導入し、グリフ構造制約とグリフ保守制約を取り入れ、意味的にリッチなベクトルフォントの正確な生成を保証する。
このアプローチはグリフ構造の客観的な完全性を保持し、OBSを解読する専門家を支援する視覚的に拡張された表現を提供する。
広範囲にわたる質的、定量的な実験により、OracleFusionはセマンティクス、視覚的魅力、グリフのメンテナンスという点で最先端のベースラインモデルより優れており、可読性と美的品質の両方を著しく向上させています。
さらに、OracleFusionは、未確認のオラクル文字に関する専門家のような洞察を提供し、OBSの解読を促進する貴重なツールである。
関連論文リスト
- OracleSage: Towards Unified Visual-Linguistic Understanding of Oracle Bone Scripts through Cross-Modal Knowledge Fusion [19.788896054132053]
中国最古の成熟した書記システムであるOracle bone script (OBS) は、自動認識において重大な課題を提起している。
私たちは、階層的な視覚的理解とグラフベースのセマンティック推論を統合する新しいクロスモーダルフレームワークであるOracleSageを紹介します。
論文 参考訳(メタデータ) (2024-11-26T19:26:06Z) - A Cross-Font Image Retrieval Network for Recognizing Undeciphered Oracle Bone Inscriptions [12.664292922995532]
Oracle Bone Inscription (OBI)は中国最古の成熟した書記システムである。
OBI文字を解読するクロスファント画像検索ネットワーク(CFIRN)を提案する。
論文 参考訳(メタデータ) (2024-09-10T10:04:58Z) - Deciphering Oracle Bone Language with Diffusion Models [70.69739681961558]
Oracle Bone Script (OBS) は約3,000年前の中国の上海王朝に由来する。
本稿では,Oracle Bone Script Decipher(OBSD)の開発を通じて,画像生成技術を採用した新しいアプローチを提案する。
OBSDは、古代の言語のAI支援分析の新しいコースをグラフ化して、解読のための重要な手がかりを生成する。
論文 参考訳(メタデータ) (2024-06-02T09:42:23Z) - Diff-Oracle: Deciphering Oracle Bone Scripts with Controllable Diffusion Model [48.956844881630886]
オラクルの骨文書の解読は中国考古学や文献学において重要な役割を担っている。
Diff-Oracleは、制御可能なオラクル文字を生成する拡散モデルに基づく新しいアプローチである。
Diff-Oracleは、下流のオラクル文字認識に大きく貢献し、既存のSOTAをはるかに上回っている。
論文 参考訳(メタデータ) (2023-12-21T07:48:38Z) - Unsupervised Structure-Texture Separation Network for Oracle Character
Recognition [70.29024469395608]
オラクルの骨書は上海王朝の中国最古の書記体系であり、考古学や文献学に重要視されている。
そこで本稿では, 連関, 変換, 適応, 認識のためのエンドツーエンド学習フレームワークである構造テクスチャ分離ネットワーク(STSN)を提案する。
論文 参考訳(メタデータ) (2022-05-13T10:27:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。