論文の概要: Segmentation of Maya hieroglyphs through fine-tuned foundation models
- arxiv url: http://arxiv.org/abs/2405.16426v1
- Date: Sun, 26 May 2024 04:41:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-28 21:18:20.890894
- Title: Segmentation of Maya hieroglyphs through fine-tuned foundation models
- Title(参考訳): 微調整基礎モデルによるマヤヒエログリフのセグメンテーション
- Authors: FNU Shivam, Megan Leight, Mary Kate Kelly, Claire Davis, Kelsey Clodfelter, Jacob Thrasher, Yenumula Reddy, Prashnna Gyawali,
- Abstract要約: マヤのヒエログリフ書の研究は、この古代文明の視覚的物語に埋め込まれた文化的・社会的知識の豊かな歴史を解き放つ。
マヤの人工物専用のオープンソースデジタルライブラリから,マヤのヒエログリフを抽出するための基礎モデルを活用している。
一般に利用可能な基本セグメンテーションモデルの当初の約束にもかかわらず、マヤのヒエログリフを正確にセグメンテーションする効果は当初は限られていた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The study of Maya hieroglyphic writing unlocks the rich history of cultural and societal knowledge embedded within this ancient civilization's visual narrative. Artificial Intelligence (AI) offers a novel lens through which we can translate these inscriptions, with the potential to allow non-specialists access to reading these texts and to aid in the decipherment of those hieroglyphs which continue to elude comprehensive interpretation. Toward this, we leverage a foundational model to segment Maya hieroglyphs from an open-source digital library dedicated to Maya artifacts. Despite the initial promise of publicly available foundational segmentation models, their effectiveness in accurately segmenting Maya hieroglyphs was initially limited. Addressing this challenge, our study involved the meticulous curation of image and label pairs with the assistance of experts in Maya art and history, enabling the fine-tuning of these foundational models. This process significantly enhanced model performance, illustrating the potential of fine-tuning approaches and the value of our expanding dataset. We plan to open-source this dataset for encouraging future research, and eventually to help make the hieroglyphic texts legible to a broader community, particularly for Maya heritage community members.
- Abstract(参考訳): マヤのヒエログリフ書の研究は、この古代文明の視覚的物語に埋め込まれた文化的・社会的知識の豊かな歴史を解き放つ。
人工知能(AI)は、これらの碑文を翻訳できる新しいレンズを提供しており、非特殊主義者がこれらのテキストを読めるようにし、包括的な解釈を継続するヒエログリフの解読を助けることができる。
そこで我々は,Mayaの人工物専用のオープンソースデジタルライブラリから,Mayaのヒエログリフをセグメントする基礎モデルを活用する。
一般に利用可能な基本セグメンテーションモデルの当初の約束にもかかわらず、マヤのヒエログリフを正確にセグメンテーションする効果は当初は限られていた。
この課題に対処するために、マヤの芸術と歴史の専門家の助けを借りて、画像とラベルのペアの厳密なキュレーションを行い、基礎モデルの微調整を可能にした。
このプロセスによりモデル性能が大幅に向上し、微調整アプローチの可能性と拡張データセットの価値が明らかになった。
我々は、このデータセットをオープンソース化して将来の研究を奨励し、最終的にはヒエログリフのテキストをより広いコミュニティ、特にマヤの遺産コミュニティのメンバにリーチできるようにする予定です。
関連論文リスト
- A Bayesian Approach to Harnessing the Power of LLMs in Authorship Attribution [57.309390098903]
著者の属性は、文書の起源または著者を特定することを目的としている。
大きな言語モデル(LLM)とその深い推論能力と長距離テキストアソシエーションを維持する能力は、有望な代替手段を提供する。
IMDbおよびブログデータセットを用いた結果, 著者10名を対象に, 著者1名に対して, 85%の精度が得られた。
論文 参考訳(メタデータ) (2024-10-29T04:14:23Z) - Empowering Backbone Models for Visual Text Generation with Input Granularity Control and Glyph-Aware Training [68.41837295318152]
拡散に基づくテキスト・ツー・イメージモデルでは、多様性と美学の素晴らしい成果が示されているが、視覚的なテキストで画像を生成するのに苦労している。
既存のバックボーンモデルには、ミススペル、テキスト生成の失敗、中国語テキストのサポートの欠如といった制限がある。
本稿では,英語と中国語の視覚テキスト生成にバックボーンモデルを活用するための一連の手法を提案する。
論文 参考訳(メタデータ) (2024-10-06T10:25:39Z) - Puzzle Pieces Picker: Deciphering Ancient Chinese Characters with Radical Reconstruction [73.26364649572237]
Oracle Bone Inscriptionsは、世界で最も古い書式である。
多くのOracle Bone Inscriptions (OBI) は未解読のままであり、今日の古生物学におけるグローバルな課題の1つとなっている。
本稿では, 急進的再構成によってこれらの謎的文字を解読する新しい手法, Puzzle Pieces Picker (P$3$) を提案する。
論文 参考訳(メタデータ) (2024-06-05T07:34:39Z) - Source Attribution for Large Language Model-Generated Data [57.85840382230037]
合成テキストの生成に寄与したデータプロバイダを特定することで、ソース属性を実行できることが不可欠である。
我々はこの問題を透かしによって取り組めることを示した。
本稿では,アルゴリズム設計により,これらの重要な特性を満足する情報源属性フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-01T12:02:57Z) - GiGaMAE: Generalizable Graph Masked Autoencoder via Collaborative Latent
Space Reconstruction [76.35904458027694]
マスク付きオートエンコーダモデルは、グラフデータに対する優れた一般化能力に欠ける。
本稿では,GiGaMAEと呼ばれる新しいグラフマスマスキングオートエンコーダフレームワークを提案する。
私たちの結果は、グラフ構造化データに基づく基礎モデルの設計に光を当てます。
論文 参考訳(メタデータ) (2023-08-18T16:30:51Z) - GujiBERT and GujiGPT: Construction of Intelligent Information Processing
Foundation Language Models for Ancient Texts [11.289265479095956]
GujiBERTとGujiGPT言語モデルは、古代のテキストの知的情報処理に特化した基礎モデルである。
これらのモデルは、単純化された漢字と伝統的な漢字の両方を含む広範なデータセットで訓練されている。
これらのモデルは、公開データセットを使用して、さまざまなバリデーションタスクで例外的なパフォーマンスを示しています。
論文 参考訳(メタデータ) (2023-07-11T15:44:01Z) - Discover the Mysteries of the Maya: Selected Contributions from the
Machine Learning Challenge & The Discovery Challenge Workshop at ECML PKDD
2021 [8.570682612057787]
この巻は、機械学習チャレンジ「マヤの謎を発見」から選ばれたコントリビューションを含んでいる。
リモートセンシングは、古代マヤの森林地帯における伝統的な考古学的景観調査を大幅に加速させた。
マヤの謎を発見」という課題は、古代マヤの建築を発見・特定することを目的としていた。
論文 参考訳(メタデータ) (2022-08-05T13:41:31Z) - Filling the Gaps in Ancient Akkadian Texts: A Masked Language Modelling
Approach [8.00388161728995]
我々は、古代メソポタミアの文書の文字化を前提とした、欠落したテキストを完遂するモデルを提案する。
タブレットの劣化のため、学者はテキストの欠落部分を手作業で埋めるために文脈的な手がかりに頼っていることが多い。
論文 参考訳(メタデータ) (2021-09-09T18:58:14Z) - Exploiting Structured Knowledge in Text via Graph-Guided Representation
Learning [73.0598186896953]
本稿では、知識グラフからのガイダンスを用いて、生テキスト上で学習する2つの自己教師型タスクを提案する。
エンティティレベルのマスキング言語モデルに基づいて、最初のコントリビューションはエンティティマスキングスキームです。
既存のパラダイムとは対照的に,本手法では事前学習時にのみ,知識グラフを暗黙的に使用する。
論文 参考訳(メタデータ) (2020-04-29T14:22:42Z) - KaoKore: A Pre-modern Japanese Art Facial Expression Dataset [8.987910033541239]
近代日本美術品から抽出された顔からなる新しいデータセットKaoKoreを提案する。
画像分類のためのデータセットとしての価値と、生成モデルを用いて探索する創造的で芸術的なデータセットとしての価値を実証する。
論文 参考訳(メタデータ) (2020-02-20T07:22:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。