論文の概要: DeepScribe: Localization and Classification of Elamite Cuneiform Signs
Via Deep Learning
- arxiv url: http://arxiv.org/abs/2306.01268v1
- Date: Fri, 2 Jun 2023 05:04:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-05 16:42:55.012739
- Title: DeepScribe: Localization and Classification of Elamite Cuneiform Signs
Via Deep Learning
- Title(参考訳): deepscribe: deep learning による elamite cuneiform sign の局在と分類
- Authors: Edward C. Williams, Grace Su, Sandra R. Schloen, Miller C. Prosser,
Susanne Paulus, Sanjay Krishnan
- Abstract要約: 1933年、シカゴ大学東洋研究所の考古学者たちは、ペルセポリスの発掘中に数万の土台や破片を発見した。
これらのタブレットの多くは、専門家のキュニフォーム主義者によって痛々しく撮影され、注釈付けされた5000枚以上のアノテートされたタブレットイメージと、10万枚以上のキュニフォームのサインバウンディングボックスからなるリッチなデータセットを提供している。
我々はこのデータセットを活用して、各符号の同一性に関する提案を提供するモジュール型コンピュータビジョンパイプラインであるDeepScribeを開発した。
- 参考スコア(独自算出の注目度): 5.7343926114197075
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Twenty-five hundred years ago, the paperwork of the Achaemenid Empire was
recorded on clay tablets. In 1933, archaeologists from the University of
Chicago's Oriental Institute (OI) found tens of thousands of these tablets and
fragments during the excavation of Persepolis. Many of these tablets have been
painstakingly photographed and annotated by expert cuneiformists, and now
provide a rich dataset consisting of over 5,000 annotated tablet images and
100,000 cuneiform sign bounding boxes. We leverage this dataset to develop
DeepScribe, a modular computer vision pipeline capable of localizing cuneiform
signs and providing suggestions for the identity of each sign. We investigate
the difficulty of learning subtasks relevant to cuneiform tablet transcription
on ground-truth data, finding that a RetinaNet object detector can achieve a
localization mAP of 0.78 and a ResNet classifier can achieve a top-5 sign
classification accuracy of 0.89. The end-to-end pipeline achieves a top-5
classification accuracy of 0.80. As part of the classification module,
DeepScribe groups cuneiform signs into morphological clusters. We consider how
this automatic clustering approach differs from the organization of standard,
printed sign lists and what we may learn from it. These components, trained
individually, are sufficient to produce a system that can analyze photos of
cuneiform tablets from the Achaemenid period and provide useful transliteration
suggestions to researchers. We evaluate the model's end-to-end performance on
locating and classifying signs, providing a roadmap to a linguistically-aware
transliteration system, then consider the model's potential utility when
applied to other periods of cuneiform writing.
- Abstract(参考訳): 25万年前、アケメニド帝国の文書が粘土板に記録された。
1933年、シカゴ大学東洋研究所(OI)の考古学者たちは、ペルセポリスの発掘中に数万の錠剤と破片を発見した。
これらのタブレットの多くは、専門家のキュニフォーム主義者によって痛々しく撮影され、注釈付けされた5000枚以上のアノテートされたタブレットイメージと、10万枚以上のキュニフォームのサインバウンディングボックスからなるリッチなデータセットを提供している。
我々はこのデータセットを活用して、各符号の同一性に関する提案を提供するモジュール型コンピュータビジョンパイプラインであるDeepScribeを開発した。
地中構造データからタブレットの文字起こしに関連するサブタスクを学習することの難しさについて検討し,RetinaNetオブジェクト検出器が0.78の局所化mAPを達成でき,ResNet分類器が0.89の上位5の符号分類精度を達成できることを確認した。
エンドツーエンドパイプラインは、トップ5の分類精度0.80を達成する。
分類モジュールの一部として、DeepScribe 群はcuneiform sign をモルフォロジークラスタに分類する。
この自動クラスタリングアプローチが、標準の印刷されたサインリストの組織とどのように異なるのか、そこから何を学ぶことができるのかを考える。
個別に訓練されたこれらのコンポーネントは、アケメニド時代のキュニフォームタブレットの写真を分析し、研究者に有用な翻訳提案を提供するシステムを作るのに十分である。
本研究では,記号の同定と分類におけるモデルのエンドツーエンド性能を評価し,言語的に認識された音訳システムへのロードマップを提供し,そのモデルの潜在的有用性を検討する。
関連論文リスト
- Scribbles for All: Benchmarking Scribble Supervised Segmentation Across Datasets [51.74296438621836]
Scribbles for Allは、スクリブルラベルに基づいて訓練されたセマンティックセグメンテーションのためのラベルおよびトレーニングデータ生成アルゴリズムである。
弱い監督の源泉としてのスクリブルの主な制限は、スクリブルセグメンテーションのための挑戦的なデータセットの欠如である。
Scribbles for Allは、いくつかの人気のあるセグメンテーションデータセットのスクリブルラベルを提供し、密集したアノテーションを持つデータセットのスクリブルラベルを自動的に生成するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2024-08-22T15:29:08Z) - Shaping History: Advanced Machine Learning Techniques for the Analysis and Dating of Cuneiform Tablets over Three Millennia [0.0]
紀元前4千年紀後期頃の古代メソポタミアに出現したキュニフォーム・タブレットは、人類最古の書記体系の1つである。
伝統的に、これらのタブレットの分析と日付は、形状と書体の主観的な評価に依存している。
デジタル化の最近の進歩は、アクセシビリティと分析能力を高めることによって、キュニフォームの研究に革命をもたらした。
論文 参考訳(メタデータ) (2024-06-06T13:05:32Z) - UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - Spatial Implicit Neural Representations for Global-Scale Species Mapping [72.92028508757281]
ある種が観察された場所の集合を考えると、その種がどこにいても存在しないかを予測するためのモデルを構築することが目的である。
従来の手法は、新たな大規模クラウドソースデータセットを活用するのに苦労している。
本研究では,47k種の地理的範囲を同時に推定するために,空間入射ニューラル表現(SINR)を用いる。
論文 参考訳(メタデータ) (2023-06-05T03:36:01Z) - Mapping Temporary Slums from Satellite Imagery using a Semi-Supervised
Approach [5.830619388189557]
全世界で10億人がスラムに住んでいると推定されている。
小さくて散らばった一時的なスラムは、データ収集とラベル付けを面倒で時間を要する。
半教師付きディープラーニングセグメンテーションに基づく一時スラム検出手法を提案する。
論文 参考訳(メタデータ) (2022-04-09T08:02:32Z) - Deep learning classification of large-scale point clouds: A case study
on cuneiform tablets [0.0]
本稿では,大規模点雲の分類のための新しいネットワークアーキテクチャを提案する。
このネットワークは、キュニフォームタブレットからメタデータを分類するために使用される。
論文 参考訳(メタデータ) (2022-02-22T12:24:47Z) - Bending Graphs: Hierarchical Shape Matching using Gated Optimal
Transport [80.64516377977183]
形状マッチングは、コンピュータグラフィックスと視覚のコミュニティにとって長い間研究されてきた問題である。
局所的なパッチレベル情報とグローバルな形状レベルの構造を組み込んだ階層型学習設計について検討する。
本研究では,非信頼ノード上の特徴を逐次更新し,形状間の一貫した一致を学習することで,新しい最適輸送解法を提案する。
論文 参考訳(メタデータ) (2022-02-03T11:41:46Z) - Object Tracking and Geo-localization from Street Images [4.5958644027273685]
本稿では,低フレームレートのストリートビデオから交通標識を検出・位置情報化するフレームワークを提案する。
提案システムは、カメラに対する各符号の位置オフセットを予測するRetinaNet(GPS-RetinaNet)の修正版を用いている。
提案したデータセットは、幅広い道路から収集された多様な環境群をカバーする。
論文 参考訳(メタデータ) (2021-07-13T17:32:04Z) - Self-supervised Graph-level Representation Learning with Local and
Global Structure [71.45196938842608]
自己教師付き全グラフ表現学習のためのローカル・インスタンスとグローバル・セマンティック・ラーニング(GraphLoG)という統合フレームワークを提案する。
GraphLoGは、局所的な類似点の保存に加えて、グローバルなセマンティッククラスタをキャプチャする階層的なプロトタイプも導入している。
モデル学習のための効率的なオンライン予測最大化(EM)アルゴリズムがさらに開発された。
論文 参考訳(メタデータ) (2021-06-08T05:25:38Z) - Very High Resolution Land Cover Mapping of Urban Areas at Global Scale
with Convolutional Neural Networks [0.0]
本稿では,高解像度画像と限られたノイズラベル付きデータから,都市域の7クラス土地被覆マップを作成する手法について述べる。
データベースの集約、セミオートマチックな分類、手動のアノテーションといったいくつかの分野に関するトレーニングデータセットを作成して、各クラスで完全な基礎的真実を得ました。
最終生成物は、ベクトル化の前に縫合され、二項化され、精製されたモデル予測から計算された非常に貴重な土地被覆写像である。
論文 参考訳(メタデータ) (2020-05-12T10:03:20Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。