論文の概要: Strategies of Effective Digitization of Commentaries and
Sub-commentaries: Towards the Construction of Textual History
- arxiv url: http://arxiv.org/abs/2201.01693v1
- Date: Wed, 5 Jan 2022 16:43:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-06 15:13:42.262489
- Title: Strategies of Effective Digitization of Commentaries and
Sub-commentaries: Towards the Construction of Textual History
- Title(参考訳): コメント・サブ記事の効果的なデジタル化戦略--テクスチュアル・ヒストリーの構築に向けて
- Authors: Diptesh Kanojia, Malhar Kulkarni, Sayali Ghodekar, Eivind Kahrs,
Pushpak Bhattacharyya
- Abstract要約: 我々は、K=a'sik=avrtti(KV)のテキストをサンプルテキストとして使用し、文献学者の助けを借りて、利用可能な注釈をデジタル化する。
本稿では,各論説と副論を機能単位に分割し,機能単位の背景にある方法論とモチベーションについて述べる。
- 参考スコア(独自算出の注目度): 26.355399011710944
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper describes additional aspects of a digital tool called the 'Textual
History Tool'. We describe its various salient features with special reference
to those of its features that may help the philologist digitize commentaries
and sub-commentaries on a text. This tool captures the historical evolution of
a text through various temporal stages, and interrelated data culled from
various types of related texts. We use the text of the K\=a\'sik\=avrtti (KV)
as a sample text, and with the help of philologists, we digitize the
commentaries available to us. We digitize the Ny\=asa (Ny), the Padama\~njar\=i
(Pm) and sub commentaries on the KV text known as the Tantraprad\=ipa (Tp), and
the Makaranda (Mk). We divide each commentary and sub-commentary into
functional units and describe the methodology and motivation behind the
functional unit division. Our functional unit division helps generate more
accurate phylogenetic trees for the text, based on distance methods using the
data entered in the tool.
- Abstract(参考訳): 本稿では,「テキスト歴史ツール」と呼ばれるデジタルツールについて述べる。
文献学者がテキスト上で注釈やサブ記事のデジタル化に役立てるかもしれない特徴に特化して、その多彩な特徴について述べる。
このツールは、様々な時間段階を通してテキストの歴史的進化を捉え、様々な種類の関連テキストから得られた相互関連データをキャプチャする。
我々は、K\=a\'sik\=avrtti(KV)のテキストをサンプルテキストとして使用し、文献学者の助けを借りて、利用可能な注釈をデジタル化する。
我々は、Ny\=asa (Ny)、Padama\~njar\=i (Pm)、およびTantraprad\=ipa (Tp)、Makaranda (Mk)として知られるKVテキストのサブコメンタをデジタル化する。
各論点と副論点を機能単位に分割し,機能単位分割の背後にある方法論と動機を説明する。
我々の機能単位は、ツールに入力されたデータを用いた距離法に基づいて、テキストのより正確な系統木を生成するのに役立ちます。
関連論文リスト
- The Learnable Typewriter: A Generative Approach to Text Analysis [17.355857281085164]
テキスト行中の文字解析と認識に対する生成文書固有のアプローチを提案する。
同様のフォントや手書きのテキスト行を入力として、我々のアプローチは多数の異なる文字を学習することができる。
論文 参考訳(メタデータ) (2023-02-03T11:17:59Z) - Classifying text using machine learning models and determining
conversation drift [4.785406121053965]
様々な種類のテキストの分析は、意味的意味と関連性の両方を理解するのに有用である。
テキスト分類は文書を分類する方法である。
コンピュータテキスト分類と自然言語処理を組み合わせて、テキストを集約して分析する。
論文 参考訳(メタデータ) (2022-11-15T18:09:45Z) - Beyond Text Generation: Supporting Writers with Continuous Automatic
Text Summaries [27.853155569154705]
本稿では,ユーザによる記述プロセスの計画,構造化,反映を支援するテキストエディタを提案する。
自動テキスト要約を用いて、連続的に更新された段落の要約をマージンアノテーションとして提供する。
論文 参考訳(メタデータ) (2022-08-19T13:09:56Z) - Contrastive Graph Multimodal Model for Text Classification in Videos [9.218562155255233]
我々は、マルチモーダル情報を融合させることで、ビデオテキスト分類の新しい課題に最初に対処する。
レイアウト情報を明示的に抽出することで特徴表現を強化するために、相関ネットと呼ばれる特定のモジュールを調整します。
我々は、ビデオテキスト認識および分類アプリケーションの構築と評価を目的とした、TI-Newsと呼ばれるニュースドメインから、明確に定義された新しい産業データセットを構築した。
論文 参考訳(メタデータ) (2022-06-06T04:06:21Z) - Discourse Analysis for Evaluating Coherence in Video Paragraph Captions [99.37090317971312]
ビデオ段落のコヒーレンスを評価するための,新しい談話に基づく枠組みを検討中である。
ビデオのコヒーレンスに条件付き段落のコヒーレンスをモデル化する上で,ビデオの談話表現が中心となる。
実験の結果,提案手法は,ビデオ段落のコヒーレンスをベースライン法よりも有意に向上させることがわかった。
論文 参考訳(メタデータ) (2022-01-17T04:23:08Z) - SCROLLS: Standardized CompaRison Over Long Language Sequences [62.574959194373264]
SCROLLSは長いテキストに対する推論を必要とするタスクのスイートである。
SCROLLSには要約、質問応答、自然言語推論タスクが含まれる。
すべてのデータセットを統一されたテキスト・ツー・テキスト形式で利用可能にし、モデルアーキテクチャと事前学習方法の研究を容易にするために、ライブのリーダーボードをホストします。
論文 参考訳(メタデータ) (2022-01-10T18:47:15Z) - Digital Editions as Distant Supervision for Layout Analysis of Printed
Books [76.29918490722902]
本稿では,この意味的マークアップを,レイアウト解析モデルのトレーニングと評価のための遠隔監視として利用する手法について述べる。
DTA(Deutsches Textarchiv)の50万ページにわたるモデルアーキテクチャの実験では、これらの領域レベルの評価手法と画素レベルのメトリクスとワードレベルのメトリクスとの高い相関性を見出した。
自己学習による精度向上の可能性と、DTAで訓練されたモデルが他の歴史書に一般化できる可能性について論じる。
論文 参考訳(メタデータ) (2021-12-23T16:51:53Z) - Integrating Visuospatial, Linguistic and Commonsense Structure into
Story Visualization [81.26077816854449]
まず、構造的入力を符号化するための選挙区解析木の利用について検討する。
第二に、構造化されたインプットをコモンセンス情報で強化し、この外部知識が視覚的ストーリーの生成に与える影響について検討する。
第3に、境界ボックスと高密度キャプションによって視覚構造を組み込んで、生成された画像の文字やオブジェクトに関するフィードバックを提供する。
論文 参考訳(メタデータ) (2021-10-21T00:16:02Z) - Aligning Subtitles in Sign Language Videos [80.20961722170655]
17.7時間に及ぶビデオの字幕15k以上の注釈付きアライメントを手作業でトレーニングした。
我々は,この2つの信号を符号化するために,BERT字幕埋め込みとCNNビデオ表現を用いた。
本モデルでは,ビデオフレームごとのフレームレベルの予測,すなわちクェリされたサブタイトルに属するか否かを出力する。
論文 参考訳(メタデータ) (2021-05-06T17:59:36Z) - Topical Change Detection in Documents via Embeddings of Long Sequences [4.13878392637062]
テキストセグメンテーションのタスクを独立した教師付き予測タスクとして定式化する。
類似セクションの段落を微調整することで、学習した特徴がトピック情報をエンコードすることを示すことができます。
文レベルで操作する従来のアプローチとは異なり、我々は常により広いコンテキストを使用します。
論文 参考訳(メタデータ) (2020-12-07T12:09:37Z) - Abstractive Summarization of Spoken and Written Instructions with BERT [66.14755043607776]
本稿では,BERTSumモデルの最初の対話型言語への応用について述べる。
我々は多種多様な話題にまたがるナレーションビデオの抽象要約を生成する。
我々は、これをインテリジェントな仮想アシスタントの機能として統合し、要求に応じて文字と音声の両方の指導内容の要約を可能にすることを想定する。
論文 参考訳(メタデータ) (2020-08-21T20:59:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。