論文の概要: Latin writing styles analysis with Machine Learning: New approach to old
questions
- arxiv url: http://arxiv.org/abs/2109.00601v1
- Date: Wed, 1 Sep 2021 20:21:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-04 06:01:48.426984
- Title: Latin writing styles analysis with Machine Learning: New approach to old
questions
- Title(参考訳): 機械学習を用いたラテン書体分析 : 古い質問に対する新しいアプローチ
- Authors: Arianna Di Bernardo, Simone Poetto, Pietro Sillano, Beatrice Villata,
Weronika S\'ojka, Zofia Pi\k{e}tka-Danilewicz, Piotr Pranke
- Abstract要約: 中世のテキストは、世代から世代までのコミュニケーション手段を用いて、心から学び、普及した。
ラテン語で書かれた文学の特定の構成を考慮に入れれば、特定の物語テキストの親しみやすい情報源の確率パターンを探索し、示すことができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the Middle Ages texts were learned by heart and spread using oral means of
communication from generation to generation. Adaptation of the art of prose and
poems allowed keeping particular descriptions and compositions characteristic
for many literary genres. Taking into account such a specific construction of
literature composed in Latin, we can search for and indicate the probability
patterns of familiar sources of specific narrative texts. Consideration of
Natural Language Processing tools allowed us the transformation of textual
objects into numerical ones and then application of machine learning algorithms
to extract information from the dataset. We carried out the task consisting of
the practical use of those concepts and observation to create a tool for
analyzing narrative texts basing on open-source databases. The tool focused on
creating specific search tools resources which could enable us detailed
searching throughout the text. The main objectives of the study take into
account finding similarities between sentences and between documents. Next, we
applied machine learning algorithms on chosen texts to calculate specific
features of them (for instance authorship or centuries) and to recognize
sources of anonymous texts with a certain percentage.
- Abstract(参考訳): 中世のテキストは、世代から世代までのコミュニケーション手段を用いて、心から学び、普及した。
散文や詩の芸術への適応は、多くの文学ジャンルに特有の、特定の記述や作曲の維持を可能にした。
ラテン語で書かれた文学の特定の構成を考慮に入れれば、特定の物語テキストの親しみやすい情報源の確率パターンを探索し、示すことができる。
自然言語処理ツールの考察により、テキストオブジェクトを数値に変換し、機械学習アルゴリズムを用いてデータセットから情報を抽出することができた。
我々は,これらの概念の実用的利用と観察からなる課題を遂行し,オープンソースデータベースを基盤としたナラティブテキストの分析ツールを構築した。
このツールは、テキスト全体の詳細な検索を可能にする、特定の検索ツールリソースの作成に焦点を当てている。
本研究の主な目的は,文章間の類似性と文書間の類似性を検討することである。
次に、選択されたテキストに機械学習アルゴリズムを適用し、それらの特定の特徴(例えば著者や世紀)を計算し、特定の割合で匿名テキストのソースを認識する。
関連論文リスト
- BookWorm: A Dataset for Character Description and Analysis [59.186325346763184]
本稿では,短い事実プロファイルを生成する文字記述と,詳細な解釈を提供する文字解析という2つのタスクを定義する。
本稿では,Gutenbergプロジェクトからの書籍と,人間による記述と分析のペアリングを行うBookWormデータセットを紹介する。
その結果,検索に基づくアプローチは両タスクにおいて階層的アプローチよりも優れていた。
論文 参考訳(メタデータ) (2024-10-14T10:55:58Z) - Visual Text Meets Low-level Vision: A Comprehensive Survey on Visual
Text Processing [4.057550183467041]
視覚テキスト処理の分野は、基本的な生成モデルの出現によって、研究の急増を経験してきた。
この分野での最近の進歩を包括的かつ多面的に分析する。
論文 参考訳(メタデータ) (2024-02-05T15:13:20Z) - Deep dive into language traits of AI-generated Abstracts [5.209583971923267]
ChatGPTのような生成言語モデルは、人間のような文章を生成する能力に注意を向けている。
本研究では,ChatGPTが生成する抽象概念を,長さとバウンドがはるかに短い方法で検出しようと試みる。
テキストの意味的特徴と語彙的特性を抽出し、従来の機械学習モデルがこれらの抽象概念を確実に検出できることを観察する。
論文 参考訳(メタデータ) (2023-12-17T06:03:33Z) - Storyfier: Exploring Vocabulary Learning Support with Text Generation
Models [52.58844741797822]
本研究では,学習者の興味をひく対象語に対するコヒーレントな文脈を提供するために,Storyfierを開発した。
学習者は一般的に、生成したストーリーを目標語を接続し、学習負荷を緩和するための支援を書くのに好む。
読み書き学習セッションでは、AI機能のないベースラインツールで学習するよりも、Storyfierを使用する参加者は、リコールやターゲット語の使用でパフォーマンスが悪くなります。
論文 参考訳(メタデータ) (2023-08-07T18:25:00Z) - Lexical Complexity Prediction: An Overview [13.224233182417636]
テキスト中の未知の単語の発生は、読書の理解を著しく妨げている。
計算モデリングは、テキスト中の複雑な単語を識別し、より単純な代替語に置き換えるために応用されている。
本稿では,英文データに基づく語彙複雑性予測に対する計算手法の概要について述べる。
論文 参考訳(メタデータ) (2023-03-08T19:35:08Z) - How learners produce data from text in classifying clickbait [0.0]
本研究は,テキストデータを用いた学習者がドメインの特定の側面を抽出するシナリオにおける理性について考察する。
私たちのゴールは、見出しを「クリックベイト」または「ニュース」と分類する動機づけタスクを用いて、学生がテキストをデータとして理解することについて光を当てることでした。
論文 参考訳(メタデータ) (2023-01-28T20:23:39Z) - A survey on text generation using generative adversarial networks [0.0]
本研究は, ジェネレーティブ・アドバイサル・ネットワークを用いた最近の研究とテキスト生成の進展について, 徹底的なレビューを行う。
テキスト生成における敵対的学習の使用は、いわゆる「自然な」言語を生成する代替手段を提供するので、有望である。
論文 参考訳(メタデータ) (2022-12-20T17:54:08Z) - TRIE++: Towards End-to-End Information Extraction from Visually Rich
Documents [51.744527199305445]
本稿では,視覚的にリッチな文書からエンド・ツー・エンドの情報抽出フレームワークを提案する。
テキスト読み出しと情報抽出は、よく設計されたマルチモーダルコンテキストブロックを介して互いに強化することができる。
フレームワークはエンドツーエンドのトレーニング可能な方法でトレーニングでき、グローバルな最適化が達成できる。
論文 参考訳(メタデータ) (2022-07-14T08:52:07Z) - SCROLLS: Standardized CompaRison Over Long Language Sequences [62.574959194373264]
SCROLLSは長いテキストに対する推論を必要とするタスクのスイートである。
SCROLLSには要約、質問応答、自然言語推論タスクが含まれる。
すべてのデータセットを統一されたテキスト・ツー・テキスト形式で利用可能にし、モデルアーキテクチャと事前学習方法の研究を容易にするために、ライブのリーダーボードをホストします。
論文 参考訳(メタデータ) (2022-01-10T18:47:15Z) - Positioning yourself in the maze of Neural Text Generation: A
Task-Agnostic Survey [54.34370423151014]
本稿では, ストーリーテリング, 要約, 翻訳など, 世代ごとのタスクインパクトをリレーする手法の構成要素について検討する。
本稿では,学習パラダイム,事前学習,モデリングアプローチ,復号化,各分野における重要な課題について,命令的手法の抽象化を提案する。
論文 参考訳(メタデータ) (2020-10-14T17:54:42Z) - TRIE: End-to-End Text Reading and Information Extraction for Document
Understanding [56.1416883796342]
本稿では,統合されたエンドツーエンドのテキスト読解と情報抽出ネットワークを提案する。
テキスト読解のマルチモーダル視覚的特徴とテキスト的特徴は、情報抽出のために融合される。
提案手法は, 精度と効率の両面において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-05-27T01:47:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。