論文の概要: HieroGlyphTranslator: Automatic Recognition and Translation of Egyptian Hieroglyphs to English
- arxiv url: http://arxiv.org/abs/2512.03817v1
- Date: Wed, 03 Dec 2025 14:05:18 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-04 11:55:06.533317
- Title: HieroGlyphTranslator: Automatic Recognition and Translation of Egyptian Hieroglyphs to English
- Title(参考訳): HieroGlyphTranslator:エジプトのヒエログリフの英語への自動認識と翻訳
- Authors: Ahmed Nasser, Marwan Mohamed, Alaa Sherif, Basmala Mahmoud, Shereen Yehia, Asmaa Saad, Mariam S. El-Rahmany, Ensaf H. Mohamed,
- Abstract要約: 本稿では,古代エジプトのヒエログリフを画像から英語に自動認識・翻訳する手法を提案する。
このモデルはBLEUスコア42.2を達成したが、これは以前の研究と比べて大きな結果となった。
- 参考スコア(独自算出の注目度): 0.14053129774629072
- License:
- Abstract: Egyptian hieroglyphs, the ancient Egyptian writing system, are composed entirely of drawings. Translating these glyphs into English poses various challenges, including the fact that a single glyph can have multiple meanings. Deep learning translation applications are evolving rapidly, producing remarkable results that significantly impact our lives. In this research, we propose a method for the automatic recognition and translation of ancient Egyptian hieroglyphs from images to English. This study utilized two datasets for classification and translation: the Morris Franken dataset and the EgyptianTranslation dataset. Our approach is divided into three stages: segmentation (using Contour and Detectron2), mapping symbols to Gardiner codes, and translation (using the CNN model). The model achieved a BLEU score of 42.2, a significant result compared to previous research.
- Abstract(参考訳): 古代エジプトの書記体系であるエジプトのヒエログリフは、すべて図面で構成されている。
これらのグリフを英語に翻訳することは、単一のグリフが複数の意味を持つという事実など、様々な問題を引き起こす。
ディープラーニング翻訳アプリケーションは急速に進化し、私たちの生活に大きな影響を及ぼす素晴らしい結果をもたらしています。
本研究では,古代エジプトのヒエログリフを画像から英語に自動認識・翻訳する手法を提案する。
本研究は、モリス・フランケンデータセットとエジプト翻訳データセットの2つの分類と翻訳に利用した。
我々のアプローチは,セグメンテーション(Contour と Detectron2),シンボルを Gardiner コードにマッピングすること,翻訳(CNN モデル)の3段階に分けられる。
このモデルはBLEUスコア42.2を達成したが、これは以前の研究と比べて大きな結果となった。
関連論文リスト
- ParsTranslit: Truly Versatile Tajik-Farsi Transliteration [6.164342356356261]
ペルシア語は、アフガニスタンとイランのペルソ・アラビア語と、タジキスタンのタジク・キリル語という2つの標準を用いている。
文字の違いは、単純な1対1のマッピングを妨げ、タジキスタンとペルシャ語を話す兄弟の間で書かれたコミュニケーションと相互作用を妨げる」。
そこで本研究では,タジク・ファルシ文字翻訳のための最先端のシーケンス・ツー・シーケンスモデルを提案する。
論文 参考訳(メタデータ) (2025-10-08T20:33:50Z) - ArzEn-MultiGenre: An aligned parallel dataset of Egyptian Arabic song lyrics, novels, and subtitles, with English translations [0.0]
ArzEn-MultiGenreは、エジプトのアラビア語の歌詞、小説、テレビ番組のサブタイトルのパラレルデータセットで、手動で翻訳され、英語のサブタイトルと一致している。
データセットには25,557のセグメントペアが含まれており、新しい機械翻訳モデルのベンチマーク、数ショット設定で微調整された大きな言語モデル、Google Translateなどの商用機械翻訳アプリケーションへの適応に使用できる。
論文 参考訳(メタデータ) (2025-08-02T15:28:41Z) - HieroLM: Egyptian Hieroglyph Recovery with Next Word Prediction Language Model [1.1510009152620668]
エジプトのヒエログリフは多くの古代エジプトの遺物から発見されているが、浸食によってぼやけたり、行方不明になったりすることが多い。
ぼやけたヒエログリフの復元には、CNNやモデルヒエログリフリカバリといったコンピュータビジョン技術が用いられている。
本稿では,次の単語予測タスクとしてヒエログリフ回復をモデル化し,それに対応する言語モデルを提案する。
論文 参考訳(メタデータ) (2025-03-06T21:53:49Z) - Puzzle Pieces Picker: Deciphering Ancient Chinese Characters with Radical Reconstruction [73.26364649572237]
Oracle Bone Inscriptionsは、世界で最も古い書式である。
多くのOracle Bone Inscriptions (OBI) は未解読のままであり、今日の古生物学におけるグローバルな課題の1つとなっている。
本稿では, 急進的再構成によってこれらの謎的文字を解読する新しい手法, Puzzle Pieces Picker (P$3$) を提案する。
論文 参考訳(メタデータ) (2024-06-05T07:34:39Z) - Leveraging Corpus Metadata to Detect Template-based Translation: An Exploratory Case Study of the Egyptian Arabic Wikipedia Edition [0.0]
アラビア語ウィキペディアの3つの版、アラビア語ウィキペディア(AR)、エジプトアラビア語ウィキペディア(ARZ)、モロッコアラビア語ウィキペディア(ary)を研究している。
エジプト・アラビア語ウィキペディアで発生したテンプレート翻訳の問題を,これらのテンプレート翻訳記事とその特徴を識別することによって緩和することを目的としている。
論文 参考訳(メタデータ) (2024-03-31T05:14:38Z) - Dual-Alignment Pre-training for Cross-lingual Sentence Embedding [79.98111074307657]
本稿では,言語間文埋め込みのためのDAP(Dual-alignment pre-training)フレームワークを提案する。
そこで本研究では,一方の文脈化トークン表現を用いて翻訳相手を再構成する,新しい表現翻訳学習(RTL)タスクを提案する。
我々の手法は文の埋め込みを大幅に改善できる。
論文 参考訳(メタデータ) (2023-05-16T03:53:30Z) - The Effect of Normalization for Bi-directional Amharic-English Neural
Machine Translation [53.907805815477126]
本稿では,比較的大規模なアムハラ語-英語並列文データセットを提案する。
我々は、既存のFacebook M2M100事前学習モデルを微調整することで、双方向のアムハラ語翻訳モデルを構築する。
その結果, 両方向のアンハラ語・英語機械翻訳の性能は, アンハラ語ホモホン文字の正規化により向上することが示唆された。
論文 参考訳(メタデータ) (2022-10-27T07:18:53Z) - SimulSLT: End-to-End Simultaneous Sign Language Translation [55.54237194555432]
既存の手話翻訳手法では、翻訳を開始する前にすべてのビデオを読む必要がある。
我々は,最初のエンドツーエンド同時手話翻訳モデルであるSimulSLTを提案する。
SimulSLTは最新のエンドツーエンドの非同時手話翻訳モデルを超えるBLEUスコアを達成する。
論文 参考訳(メタデータ) (2021-12-08T11:04:52Z) - Itihasa: A large-scale corpus for Sanskrit to English translation [9.566221218224637]
イティハサ (Itihasa) は、サンスクリット語の93,000対のスロカとその英訳を含む大規模な翻訳データセットである。
まず、このようなデータセットのキュレーションの背後にあるモチベーションを説明し、そのニュアンスを引き出すための経験的分析を続行する。
論文 参考訳(メタデータ) (2021-06-06T22:58:13Z) - Translation Artifacts in Cross-lingual Transfer Learning [51.66536640084888]
機械翻訳は、既存の言語間モデルに顕著な影響を与える微妙なアーティファクトを導入することができることを示す。
自然言語の推論では、前提と仮説を独立に翻訳することで、それらの間の語彙的重複を減らすことができる。
また、XNLIでは、それぞれ4.3点と2.8点の翻訳とゼロショットのアプローチを改善している。
論文 参考訳(メタデータ) (2020-04-09T17:54:30Z) - Sign Language Transformers: Joint End-to-end Sign Language Recognition
and Translation [59.38247587308604]
本稿では,連続手話認識と翻訳を共同で学習するトランスフォーマーアーキテクチャを提案する。
RWTH-PHOENIX-Weather-2014Tデータセットの認識と翻訳性能の評価を行った。
我々の翻訳ネットワークは、動画を音声言語に、光沢を音声言語翻訳モデルに、どちらよりも優れています。
論文 参考訳(メタデータ) (2020-03-30T21:35:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。