論文の概要: Restoration of Fragmentary Babylonian Texts Using Recurrent Neural
Networks
- arxiv url: http://arxiv.org/abs/2003.01912v1
- Date: Wed, 4 Mar 2020 06:36:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 12:06:21.437374
- Title: Restoration of Fragmentary Babylonian Texts Using Recurrent Neural
Networks
- Title(参考訳): リカレントニューラルネットワークによる断片的バビロニアテキストの復元
- Authors: Ethan Fetaya, Yonatan Lifshitz, Elad Aaron and Shai Gordin
- Abstract要約: 古代メソポタミアの歴史と文化に関する主要な情報源は粘土の土器である。
貴重なリソースであるにもかかわらず、多くのタブレットは断片化され、情報が不足している。
本研究では,Achaemenid 時代バビロニアの古代アッカド語のテキストを,繰り返しニューラルネットワークを用いて言語をモデル化することにより,研究者を支援する可能性について検討する。
- 参考スコア(独自算出の注目度): 14.024892678242379
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The main source of information regarding ancient Mesopotamian history and
culture are clay cuneiform tablets. Despite being an invaluable resource, many
tablets are fragmented leading to missing information. Currently these missing
parts are manually completed by experts. In this work we investigate the
possibility of assisting scholars and even automatically completing the breaks
in ancient Akkadian texts from Achaemenid period Babylonia by modelling the
language using recurrent neural networks.
- Abstract(参考訳): 古代メソポタミアの歴史と文化に関する主要な情報源は粘土のクネイフォームである。
貴重なリソースであるにもかかわらず、多くのタブレットが断片化され、情報が失われている。
現在、これらの欠落部分は専門家によって手作業で完成されている。
本研究では,Achaemenid 時代バビロニアの古代アッカド語のテキストを,繰り返しニューラルネットワークを用いて言語をモデル化することにより,研究者を支援する可能性について検討する。
関連論文リスト
- Restoring Ancient Ideograph: A Multimodal Multitask Neural Network
Approach [11.263700269889654]
本稿では,古文書を復元する新しいマルチモーダルマルチタスク復元モデル(MMRM)を提案する。
文脈理解と、損傷した古代の遺物からの残余の視覚情報を組み合わせることで、損傷した文字を予測し、同時に復元された画像を生成する。
論文 参考訳(メタデータ) (2024-03-11T12:57:28Z) - Dolma: an Open Corpus of Three Trillion Tokens for Language Model
Pretraining Research [140.6355066137106]
われわれは、Webコンテンツ、科学論文、コード、パブリックドメインの書籍、ソーシャルメディア、百科事典の素材を多種に混ぜて構築した3兆の英語コーパスであるDolmaをリリースする。
本報告では、Dolmaの設計原則、構築の詳細、内容の要約を含む、Dolmaについて述べる。
Dolmaは、言語モデリングの科学を構築し研究するために設計された、最先端のオープン言語モデルとフレームワークであるOLMoのトレーニングに使用されている。
論文 参考訳(メタデータ) (2024-01-31T20:29:50Z) - An open dataset for oracle bone script recognition and decipherment [68.33464571563293]
Oracle Bone Script (OBS) は、3000年前にさかのぼる上海王朝の人文と地理に関する貴重な洞察を持っている。
時間の経過はそれらの意味の多くを曖昧にしており、これらの古代のテキストを解読する上で重要な課題が提示されている。
このデータセットは1,588個の解読されたスクリプトの77,064個の画像と9,411個の未解読文字の62,989個の画像を含んでいる。
論文 参考訳(メタデータ) (2024-01-27T09:54:16Z) - Learning From Free-Text Human Feedback -- Collect New Datasets Or Extend
Existing Ones? [57.16050211534735]
一般的な対話データセットにおける自由文フィードバックのタイプと頻度について検討する。
この結果から, エラータイプ, ユーザ応答タイプ, それらの関係性など, 調査したデータセットの構成に関する新たな知見が得られた。
論文 参考訳(メタデータ) (2023-10-24T12:01:11Z) - Graecia capta ferum victorem cepit. Detecting Latin Allusions to Ancient
Greek Literature [23.786649328915097]
本稿では古典哲学に適した三言語文文モデルSPhilBERTaを紹介する。
古代ギリシア語、ラテン語、英語にまたがる言語間の意味理解と同一の文の同定に優れる。
我々は、英語のテキストを自動的に古代ギリシア語に翻訳することで、新しいトレーニングデータを生成する。
論文 参考訳(メタデータ) (2023-08-23T08:54:05Z) - Style Classification of Rabbinic Literature for Detection of Lost
Midrash Tanhuma Material [1.933681537640272]
本稿では,そのスタイルに基づいたラビ文学の分類システムを提案する。
本研究では,この手法を用いて,特定のミッドラッシュジャンルから失われた素材を発見できることを示す。
論文 参考訳(メタデータ) (2022-11-17T17:45:59Z) - Building the Language Resource for a Cebuano-Filipino Neural Machine
Translation System [0.0]
本稿では,CebuanoとFilipinoの平行コーパスを,聖書テキストとWebという2つの異なるドメインから構築する取り組みについて述べる。
聖書資料では、動詞のサブワード単位翻訳と名詞のコピー可能なアプローチが翻訳の不整合を正すために適用された。
Wikipediaでは、ソースとターゲット言語の両方から、一般的に発生するトピックセグメントが抽出された。
論文 参考訳(メタデータ) (2021-10-05T23:03:09Z) - Filling the Gaps in Ancient Akkadian Texts: A Masked Language Modelling
Approach [8.00388161728995]
我々は、古代メソポタミアの文書の文字化を前提とした、欠落したテキストを完遂するモデルを提案する。
タブレットの劣化のため、学者はテキストの欠落部分を手作業で埋めるために文脈的な手がかりに頼っていることが多い。
論文 参考訳(メタデータ) (2021-09-09T18:58:14Z) - New Arabic Medical Dataset for Diseases Classification [55.41644538483948]
いくつかのアラブの医療ウェブサイトから収集された2000の医療資料を含む、アラブの医療データセットを新たに導入する。
データセットはテキストの分類作業のために構築され、10つのクラス(Blood, Bone, Cardiovascular, Ear, Endocrine, Eye, Gastrointestinal, Immune, Liver, Nephrological)を含んでいる。
データセットの実験は、GoogleのBERT、大きなアラビアのコーパスを持つBERTに基づくアラビアト、アラビアの医療コーパスをベースとしたAraBioNERの3つの事前トレーニングモデルによって行われた。
論文 参考訳(メタデータ) (2021-06-29T10:42:53Z) - Reservoir Stack Machines [77.12475691708838]
メモリ拡張ニューラルネットワークは、情報ストレージを必要とするタスクをサポートするために、明示的なメモリを備えたリカレントニューラルネットワークを備える。
本研究では,全ての決定論的文脈自由言語を確実に認識できるモデルである貯水池スタックマシンを導入する。
以上の結果から, 貯水池スタックマシンは, 訓練データよりも長い試験シーケンスでもゼロ誤差を達成できることがわかった。
論文 参考訳(メタデータ) (2021-05-04T16:50:40Z) - MedLatinEpi and MedLatinLit: Two Datasets for the Computational
Authorship Analysis of Medieval Latin Texts [72.16295267480838]
我々は、中世ラテン文字の2つのデータセットであるMedLatinEpiとMedLatinLitを、計算オーサシップ分析の研究に使用し、利用可能にしている。
MedLatinEpi と MedLatinLit はそれぞれ 294 と 30 のキュレートされたテキストで構成されており、MedLatinEpi のテキストはエピストリー的な性質を持ち、MedLatinLit のテキストは文学的なコメントと様々な主題に関する論文で構成されている。
論文 参考訳(メタデータ) (2020-06-22T14:22:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。