論文の概要: Learning Diachronic Representations of Ancient Greek Letterforms
- arxiv url: http://arxiv.org/abs/2606.24984v1
- Date: Tue, 23 Jun 2026 14:13:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 17:05:30.081377
- Title: Learning Diachronic Representations of Ancient Greek Letterforms
- Title(参考訳): 古代ギリシア文字のダイアクロニック表現の学習
- Authors: John Pavlopoulos, Spyros Barbakos, Lavinia Ferretti, Dionysis Voulgarakis, Asimina Paparrigopoulou, Maria Konstantinidou, Giuseppe De Gregorio, Isabelle Marthot-Santaniello, Paraskevi Platanou, Holger Essler,
- Abstract要約: 何世紀にもわたって手書きの変動に頑健な表現を学習することは、ダイアクロニック表現学習における重要な課題である。
ダイアクロニック表現学習のための3つのデータセット: Hell-Char、紀元前3世紀から1世紀にかけての訓練セット、PaLit-CharとMed-Charの2つの評価セットを紹介する。
そこで本研究では,クラス間類似度を動的に推定して埋め込みをバイアスする類似性重み付き教師付きコントラスト損失と,リアルな写本の破損をシミュレートするラグナ駆動拡張スキームを提案する。
- 参考スコア(独自算出の注目度): 5.399565315727663
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Learning representations that remain robust across centuries of variation in handwriting is a key challenge in diachronic representation learning. Taking one of the longest continuously used writing systems, ancient Greek, as a case study, we introduce three datasets for diachronic representation learning: Hell-Char, a curated training set spanning the 3rd-1st centuries BCE, and two evaluation sets, PaLit-Char (2nd-5th c. CE) and Med-Char (9th-14th c. CE). To address the challenges of symbolic variation, scarce data, and systematic degradation, we propose: a similarity-weighted supervised contrastive loss that biases embeddings using dynamically estimated inter-class similarities, and a lacuna-driven augmentation scheme that simulates realistic manuscript corruptions. Trained with these strategies, both a lightweight CNN and a pretrained ResNet achieve strong recognition performance and produce embeddings that more coherently separate character classes than PCA or generic pretrained models. These embeddings enable clustering, identification of stylistic subgroups, and construction of prototype images that visualize diachronic evolution and transitional letterforms. Our results demonstrate that respecting intrinsic inter-letter relationships and augmenting with domain-informed corruptions yield robust, interpretable representations, offering a transferable paradigm for representation learning under scarce, temporally evolving, and noisy conditions. Code and data available at: https://github.com/ipavlopoulos/diachronic-greek-letterforms.
- Abstract(参考訳): 何世紀にもわたって手書きの変動に頑健な表現を学習することは、ダイアクロニック表現学習における重要な課題である。
これは紀元前3世紀から1世紀にかけての訓練セットであり、PaLit-Char (2nd-5th CE) とMed-Char (9th-14th CE) の2つの評価セットである。
シンボリック変動, 不足データ, 系統的劣化の課題に対処するため, 動的に推定されるクラス間の類似性を用いて埋め込みをバイアスする類似性重み付き教師付きコントラスト損失と, 現実的な写本の破損をシミュレートするラグナ駆動の増補スキームを提案する。
これらの戦略で訓練された軽量CNNと事前訓練されたResNetは、強力な認識性能を達成し、PCAや一般的な事前訓練モデルよりも整合的に文字クラスを分離した埋め込みを生成する。
これらの埋め込みにより、クラスタリング、スタイリスティックな部分群の同定、およびダイアクロニック進化と遷移レターフォームを視覚化するプロトタイプ画像の構築が可能になる。
本研究の結果は,本文間の関係を尊重し,ドメイン情報による汚職を増大させることによって,表現学習のための伝達可能なパラダイムを,希少かつ時間的に進化し,騒々しい条件下で提供し,堅牢で解釈可能な表現が得られることを示す。
コードとデータは、https://github.com/ipavlopoulos/diachronic-greek-letterforms.comで公開されている。
関連論文リスト
- Self-Supervised Learning as Discrete Communication [3.33876524834826]
ほとんどの自己教師付き学習(SSL)メソッドは、同じ入力の異なるビューを整列させることで、連続的な視覚表現を学習する。
我々は,教師と学生ネットワーク間の個別のコミュニケーションプロセスとして,視覚的自己教師型学習の枠組みを定めている。
プロジェクションヘッドの周期的再起動は、予測的のままの埋め込みを促進することによって、この効果を高めることを示す。
論文 参考訳(メタデータ) (2026-02-10T13:24:06Z) - Visible Yet Unreadable: A Systematic Blind Spot of Vision Language Models Across Writing Systems [25.47053654117902]
先進視覚言語モデル(VLM)がこのレジリエンスを共有しているかどうかを検討する。
我々は、異なる筆記システムにまたがる2つの心理物理学的なベンチマークを構築した。
クリーンテキスト上での強いパフォーマンスにもかかわらず、現代のVLMはこれらの摂動の下で深刻な低下を見せている。
論文 参考訳(メタデータ) (2025-09-04T05:35:32Z) - Extremely Fine-Grained Visual Classification over Resembling Glyphs in the Wild [15.102325077732745]
グリフに類似した認識課題に対する2段階のコントラスト学習手法を提案する。
最初の段階では、教師付きコントラスト学習を利用してラベル情報を利用してバックボーンネットワークをウォームアップする。
第2段階では、Euclidean空間とAngular空間の両方で分類とコントラスト学習を統合するネットワークアーキテクチャであるCCFG-Netを導入する。
論文 参考訳(メタデータ) (2024-08-25T08:59:27Z) - Noisy-Correspondence Learning for Text-to-Image Person Re-identification [50.07634676709067]
本稿では,雑音対応においても頑健な視覚関係を学習するための新しいロバスト二重埋め込み法(RDE)を提案する。
提案手法は,3つのデータセット上での合成ノイズ対応と非合成ノイズ対応を両立させる。
論文 参考訳(メタデータ) (2023-08-19T05:34:13Z) - Revisiting Multimodal Representation in Contrastive Learning: From Patch
and Token Embeddings to Finite Discrete Tokens [76.40196364163663]
本稿では,CLIPのような学習型視覚言語事前学習手法を提案する。
提案手法は,より包括的な表現を学習し,意味のある相互対応を捉えることができることを示す。
論文 参考訳(メタデータ) (2023-03-27T00:58:39Z) - Repurposing Knowledge Graph Embeddings for Triple Representation via
Weak Supervision [77.34726150561087]
現在の方法では、事前訓練されたモデルからの実体と述語埋め込みを使わずに、スクラッチから三重埋め込みを学習する。
本研究では,知識グラフからトリプルを自動抽出し,事前学習した埋め込みモデルからそれらのペアの類似性を推定する手法を開発した。
これらのペアの類似度スコアは、細い三重表現のためにシームズ様のニューラルネットワークに供給される。
論文 参考訳(メタデータ) (2022-08-22T14:07:08Z) - CODER: Coupled Diversity-Sensitive Momentum Contrastive Learning for
Image-Text Retrieval [108.48540976175457]
クロスモーダル表現を改善するために,共用ダイバーシティ・センシティブ・モーメント・コンストラシティブ・ラーニング(CODER)を提案する。
両モードの動的辞書を導入し、画像テキストペアのスケールを拡大し、適応的な負のペア重み付けにより多様性に敏感性を実現する。
MSCOCOとFlicker30Kという2つの人気のあるベンチマークで実施された実験は、CODERが最先端のアプローチを著しく上回っていることを証明している。
論文 参考訳(メタデータ) (2022-08-21T08:37:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。