論文の概要: A digital perspective on the role of a stemma in material-philological transmission studies
- arxiv url: http://arxiv.org/abs/2505.06938v1
- Date: Sun, 11 May 2025 11:05:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:49.125679
- Title: A digital perspective on the role of a stemma in material-philological transmission studies
- Title(参考訳): 物質・生理的伝達研究における幹細胞の役割に関するデジタル視点
- Authors: Katarzyna Anna Kapitan,
- Abstract要約: Hr'omundurの古ノルド語のサガをケーススタディとして、本論文は、幹細胞がテキストの伝統をさらに探求するための出発点となることを実証する。
記事には、Hr'omundar sagaの伝統と2つのカスタムPythonスクリプトのためのステマを生成するために使用されるデータセットが添付されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Taking its point of departure in the recent developments in the field of digital humanities and the increasing automatisation of scholarly workflows, this study explores the implications of digital approaches to textual traditions for the broader field of textual scholarship. It argues that the relative simplicity of creating computergenerated stemmas allows us to view the stemma codicum as a research tool rather than the final product of our scholarly investigation. Using the Old Norse saga of Hr\'omundur as a case study, this article demonstrates that stemmas can serve as a starting point for exploring textual traditions further. In doing so, they enable us to address research questions that otherwise remain unanswered. The article is accompanied by datasets used to generate stemmas for the Hr\'omundar saga tradition as well as two custom Python scripts. The scripts are designed to convert XML-based textual data, encoded according to the TEI Guidelines, into the input format used for the analysis in the PHYLIP package to generate unrooted trees of relationships between texts.
- Abstract(参考訳): デジタル人文科学の分野における最近の発展と学術的ワークフローの自動化の進展から,本研究では,より広い分野のテキスト・奨学金のために,デジタル・アプローチがテキスト・伝統にもたらす意味を考察する。
コンピュータ生成幹細胞の作成の比較的単純さは、研究の最終的な成果ではなく、研究ツールとして幹細胞を見ることができる、と論じている。
Hr\'omundurの古ノルド語のサガを事例研究として、本論文は、幹細胞がテキストの伝統をさらに探求するための出発点となることを実証する。
そうすることで、答えが得られない研究上の問題に対処できます。
記事には、Hr\omundar sagaの伝統と2つのカスタムPythonスクリプトのためのステマを生成するために使用されるデータセットが添付されている。
これらのスクリプトは、TEIガイドラインに従ってエンコードされたXMLベースのテキストデータから、PHYLIPパッケージの分析に使用される入力形式に変換して、テキスト間の関係の未ルート木を生成するように設計されている。
関連論文リスト
- ParsiPy: NLP Toolkit for Historical Persian Texts in Python [1.637832760977605]
この研究は、音声の書き起こしを処理し、古代のテキストを分析するためのNLPツールキットであるParsiPyを導入している。
ParsiPyは、トークン化、補題化、音声タグ付け、音素から音素への変換、単語の埋め込みのためのモジュールを提供する。
論文 参考訳(メタデータ) (2025-03-22T16:21:29Z) - Curatr: A Platform for Semantic Analysis and Curation of Historical
Literary Texts [5.075506385456811]
本稿では,機械学習によるセマンティックサーチによる文献の探索とキュレーションを行うオンラインプラットフォームであるCuratrを提案する。
このプラットフォームは、ニューラルネットワークの埋め込みと専門家のドメイン知識を組み合わせて、セマティックレキシコンの生成を可能にする。
論文 参考訳(メタデータ) (2023-06-13T15:15:31Z) - Semantic Similarity Measure of Natural Language Text through Machine
Learning and a Keyword-Aware Cross-Encoder-Ranking Summarizer -- A Case Study
Using UCGIS GIS&T Body of Knowledge [2.4909170697740968]
GIS&T Body of Knowledge (BoK)は、地理空間的トピックを定義し、開発し、文書化するためのコミュニティ主導の取り組みである。
本研究は,テキストから意味を抽出する上で,複数自然言語処理(NLP)技術の有効性を評価する。
また、科学出版物を分析するための機械学習技術の使用について、新たな視点を提供する。
論文 参考訳(メタデータ) (2023-05-17T01:17:57Z) - The Learnable Typewriter: A Generative Approach to Text Analysis [17.355857281085164]
テキスト行中の文字解析と認識に対する生成文書固有のアプローチを提案する。
同様のフォントや手書きのテキスト行を入力として、我々のアプローチは多数の異なる文字を学習することができる。
論文 参考訳(メタデータ) (2023-02-03T11:17:59Z) - An Inclusive Notion of Text [69.36678873492373]
テキストの概念の明確さは再現可能で一般化可能なNLPにとって不可欠である,と我々は主張する。
言語的および非言語的要素の2層分類を導入し,NLPモデリングに使用することができる。
論文 参考訳(メタデータ) (2022-11-10T14:26:43Z) - Digital Editions as Distant Supervision for Layout Analysis of Printed
Books [76.29918490722902]
本稿では,この意味的マークアップを,レイアウト解析モデルのトレーニングと評価のための遠隔監視として利用する手法について述べる。
DTA(Deutsches Textarchiv)の50万ページにわたるモデルアーキテクチャの実験では、これらの領域レベルの評価手法と画素レベルのメトリクスとワードレベルのメトリクスとの高い相関性を見出した。
自己学習による精度向上の可能性と、DTAで訓練されたモデルが他の歴史書に一般化できる可能性について論じる。
論文 参考訳(メタデータ) (2021-12-23T16:51:53Z) - Latin writing styles analysis with Machine Learning: New approach to old
questions [0.0]
中世のテキストは、世代から世代までのコミュニケーション手段を用いて、心から学び、普及した。
ラテン語で書かれた文学の特定の構成を考慮に入れれば、特定の物語テキストの親しみやすい情報源の確率パターンを探索し、示すことができる。
論文 参考訳(メタデータ) (2021-09-01T20:21:45Z) - Deep Learning for Text Style Transfer: A Survey [71.8870854396927]
テキストスタイル転送は、生成したテキストの特定の属性を制御することを目的として、自然言語生成において重要なタスクである。
2017年の最初のニューラルテキストスタイル転送作業以降,100以上の代表的な記事を対象とした,ニューラルテキストスタイル転送の研究の体系的な調査を行う。
タスクの定式化、既存のデータセットとサブタスク、評価、並列データと非並列データの存在下での豊富な方法論について論じる。
論文 参考訳(メタデータ) (2020-11-01T04:04:43Z) - A Survey of Knowledge-Enhanced Text Generation [81.24633231919137]
テキスト生成の目標は、機械を人間の言語で表現できるようにすることである。
入力テキストを出力テキストにマッピングすることを学ぶことで、目的を達成するために、様々なニューラルエンコーダデコーダモデルが提案されている。
この問題に対処するために、研究者は入力テキスト以外の様々な種類の知識を生成モデルに組み込むことを検討してきた。
論文 参考訳(メタデータ) (2020-10-09T06:46:46Z) - Exploring the Limits of Transfer Learning with a Unified Text-to-Text
Transformer [64.22926988297685]
下流タスクで微調整される前に、まずデータリッチタスクでモデルが事前訓練されるトランスファーラーニングは、自然言語処理(NLP)において強力な手法として登場した。
本稿では,すべてのテキストベースの言語問題をテキスト・トゥ・テキスト・フォーマットに変換する統一フレームワークにより,NLPのためのトランスファー学習手法を導入する状況について検討する。
論文 参考訳(メタデータ) (2019-10-23T17:37:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。