論文の概要: Signs of the Past, Patterns of the Present: On the Automatic Classification of Old Babylonian Cuneiform Signs
- arxiv url: http://arxiv.org/abs/2507.13959v1
- Date: Fri, 18 Jul 2025 14:24:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-21 20:43:26.318125
- Title: Signs of the Past, Patterns of the Present: On the Automatic Classification of Old Babylonian Cuneiform Signs
- Title(参考訳): 過去の兆候, 現状のパターン:古バビロニア・キュニフォーム記号の自動分類について
- Authors: Eli Verwimp, Gustav Ryberg Smidt, Hendrik Hameeuw, Katrien De Graef,
- Abstract要約: 本稿では,cuneiform signの分類のための機械学習(ML)技術の訓練と評価について述べる。
提示および分析されたモデルはResNet50で、トップ1スコアは87.1%、トップ5スコアは96.5%、少なくとも20のインスタンスを持つ記号は96.5%である。
- 参考スコア(独自算出の注目度): 1.1405827621489222
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The work in this paper describes the training and evaluation of machine learning (ML) techniques for the classification of cuneiform signs. There is a lot of variability in cuneiform signs, depending on where they come from, for what and by whom they were written, but also how they were digitized. This variability makes it unlikely that an ML model trained on one dataset will perform successfully on another dataset. This contribution studies how such differences impact that performance. Based on our results and insights, we aim to influence future data acquisition standards and provide a solid foundation for future cuneiform sign classification tasks. The ML model has been trained and tested on handwritten Old Babylonian (c. 2000-1600 B.C.E.) documentary texts inscribed on clay tablets originating from three Mesopotamian cities (Nippur, D\=ur-Abie\v{s}uh and Sippar). The presented and analysed model is ResNet50, which achieves a top-1 score of 87.1% and a top-5 score of 96.5% for signs with at least 20 instances. As these automatic classification results are the first on Old Babylonian texts, there are currently no comparable results.
- Abstract(参考訳): 本報告では, 偏形記号の分類のための機械学習技術(ML)の訓練と評価について述べる。
クチュニフォームの記号には、どこから来たか、何が書かれたか、などによって多くのバリエーションがあり、またどのようにデジタル化されたかにもよる。
この可変性により、あるデータセットでトレーニングされたMLモデルが、別のデータセットで正常に実行される可能性は低い。
この貢献は、そのような違いがパフォーマンスにどのように影響するかを研究する。
結果と知見に基づいて,将来的なデータ取得基準に影響を及ぼし,将来的なキュニフォーム手形分類タスクの基盤となることを目指しています。
MLモデルは、メソポタミアの3都市(Nippur, D\=ur-Abie\v{s}uh and Sippar)に由来する粘土板に刻まれた古バビロニア語(2000-1600年頃)の文書で訓練され、試験されている。
提示および分析されたモデルはResNet50で、トップ1スコアは87.1%、トップ5スコアは96.5%、少なくとも20のインスタンスを持つ記号は96.5%である。
これらの自動分類結果は、古バビロニア語のテキストで最初のものであるため、現在では同等の結果は得られていない。
関連論文リスト
- Pretraining Language Models to Ponder in Continuous Space [50.52734567589996]
単一のトークン生成ステップ内で,前処理を繰り返し呼び出すことによって,この思考プロセスを言語モデルに導入する。
人間のアノテーションを使わずに、自己教師付き学習を通じて、この方法でモデルを学習できることが示される。
論文 参考訳(メタデータ) (2025-05-27T03:47:33Z) - Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - GECOBench: A Gender-Controlled Text Dataset and Benchmark for Quantifying Biases in Explanations [1.0000511213628438]
性別制御されたテキストデータセットであるGECOを作成し、それ以外は男性と女性に同じ文が現れる。
これにより、ジェンダー分類タスクの「世界説明」が根本から生まれる。
また,一般的なXAI手法をベンチマークする厳密な定量的評価フレームワークであるGECOBenchも提供する。
論文 参考訳(メタデータ) (2024-06-17T13:44:37Z) - Shaping History: Advanced Machine Learning Techniques for the Analysis and Dating of Cuneiform Tablets over Three Millennia [0.0]
紀元前4千年紀後期頃の古代メソポタミアに出現したキュニフォーム・タブレットは、人類最古の書記体系の1つである。
伝統的に、これらのタブレットの分析と日付は、形状と書体の主観的な評価に依存している。
デジタル化の最近の進歩は、アクセシビリティと分析能力を高めることによって、キュニフォームの研究に革命をもたらした。
論文 参考訳(メタデータ) (2024-06-06T13:05:32Z) - The Languini Kitchen: Enabling Language Modelling Research at Different
Scales of Compute [66.84421705029624]
本稿では,アクセル時間で測定された等価計算に基づくモデル比較を可能にする実験的プロトコルを提案する。
私たちは、既存の学術的ベンチマークを上回り、品質、多様性、文書の長さで上回る、大規模で多様で高品質な書籍データセットを前処理します。
この研究は、GPT-2アーキテクチャから派生したフィードフォワードモデルと、10倍のスループットを持つ新しいLSTMの形式でのリカレントモデルという2つのベースラインモデルも提供する。
論文 参考訳(メタデータ) (2023-09-20T10:31:17Z) - Decoding the Alphabet Soup of Degrees in the United States Postsecondary
Education System Through Hybrid Method: Database and Text Mining [0.0]
本稿では,全国学生クリアリングハウス(NSC)の学生追跡レポートで明快に表現された後中等教育のレベル(学士、修士等)を予測するモデルを提案する。
このモデルは4つの異なるグレードのマルチラベルデータセットで訓練され、最も洗練されたデータセットで97.83%の精度で返却された。
論文 参考訳(メタデータ) (2023-09-06T16:03:14Z) - DeepScribe: Localization and Classification of Elamite Cuneiform Signs Via Deep Learning [3.61748395394812]
1933年、シカゴ大学東洋研究所の考古学者たちは、ペルセポリスの発掘中に数万の土台や破片を発見した。
これらのタブレットの多くは、専門家のキュニフォーム主義者によって痛々しく撮影され、注釈付けされた5000枚以上のアノテートされたタブレットイメージと、10万枚以上のキュニフォームのサインバウンディングボックスからなるリッチなデータセットを提供している。
我々はこのデータセットを活用して、各符号の同一性に関する提案を提供するモジュール型コンピュータビジョンパイプラインであるDeepScribeを開発した。
論文 参考訳(メタデータ) (2023-06-02T05:04:27Z) - PART: Pre-trained Authorship Representation Transformer [52.623051272843426]
文書を書く著者は、自分のテキストに識別情報を印字する。
以前の作品では、手作りの機能や分類タスクを使って著者モデルを訓練していた。
セマンティクスの代わりにテキストの埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Revisiting Self-Training for Few-Shot Learning of Language Model [61.173976954360334]
ラベル付きデータにはタスク関連情報が豊富に含まれており、言語モデルの素早い学習に有用であることが証明されている。
本研究では,言語モデルファインチューニングのための自己学習手法を再検討し,最先端のプロンプトベースの少ショット学習者,SFLMを提案する。
論文 参考訳(メタデータ) (2021-10-04T08:51:36Z) - Deep Learning Frameworks for Pavement Distress Classification: A
Comparative Analysis [2.752817022620644]
本研究では,舗装の苦痛を検知し,特徴付けるための最先端のディープラーニングアルゴリズムをデプロイする。
モデルは、日本、チェコ、インドの都市部や農村部で撮影された21,041枚の画像を用いて訓練された。
最高のパフォーマンスモデルは、IEEE Global Road Damage Detection Challengeがリリースした2つのテストデータセットで、F1スコアの0.58と0.57を達成した。
論文 参考訳(メタデータ) (2020-10-21T00:26:59Z) - Evaluation Toolkit For Robustness Testing Of Automatic Essay Scoring
Systems [64.4896118325552]
モデル逆算評価スキームと関連するメトリクスを用いて、現状のAESモデルを評価する。
AESモデルは非常に過大評価されていることがわかった。質問の話題に関係のない内容の重い修正(25%まで)でさえ、モデルが生み出すスコアを低下させることはない。
論文 参考訳(メタデータ) (2020-07-14T03:49:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。