論文の概要: KwicKwocKwac, a tool for rapidly generating concordances and marking up a literary text
- arxiv url: http://arxiv.org/abs/2410.06043v1
- Date: Tue, 08 Oct 2024 13:41:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-10 13:33:07.058563
- Title: KwicKwocKwac, a tool for rapidly generating concordances and marking up a literary text
- Title(参考訳): KwicKwocKwac - 一致を迅速に生成し、文章をマークするツール
- Authors: Sebastian Barzaghi, Francesco Paolucci, Francesca Tomasi, Fabio Vitali,
- Abstract要約: KwicKKは人文科学におけるデジタルテキストのアノテーションと豊かさを高めるために設計されたウェブアプリケーションである。
主な機能としては、KeyWord in Context (KWIC)、KeyWord Out Of Context (KWOC)、KeyWord After Context (KWAC) を用いた注釈付きテキストの可視化がある。
このアプリケーションはメタデータ入力をサポートし、複数のダウンロードフォーマットを提供し、アクセシビリティと使いやすさを促進する。
- 参考スコア(独自算出の注目度): 1.5233810864317798
- License:
- Abstract: This paper introduces KwicKwocKwac 1.0 (KwicKK), a web application designed to enhance the annotation and enrichment of digital texts in the humanities. KwicKK provides a user-friendly interface that enables scholars and researchers to perform semi-automatic markup of textual documents, facilitating the identification of relevant entities such as people, organizations, and locations. Key functionalities include the visualization of annotated texts using KeyWord in Context (KWIC), KeyWord Out Of Context (KWOC), and KeyWord After Context (KWAC) methodologies, alongside automatic disambiguation of generic references and integration with Wikidata for Linked Open Data connections. The application supports metadata input and offers multiple download formats, promoting accessibility and ease of use. Developed primarily for the National Edition of Aldo Moro's works, KwicKK aims to lower the technical barriers for users while fostering deeper engagement with digital scholarly resources. The architecture leverages contemporary web technologies, ensuring scalability and reliability. Future developments will explore user experience enhancements, collaborative features, and integration of additional data sources.
- Abstract(参考訳): KwicKwocKwac 1.0 (KwicKK) は人文におけるデジタルテキストのアノテーションと豊かさを高めるために設計されたウェブアプリケーションである。
KwicKKは、学者や研究者がテキスト文書の半自動マークアップを実行し、人、組織、場所などの関連エンティティの識別を容易にする、ユーザフレンドリーなインターフェースを提供する。
主な機能としては、KeyWord in Context (KWIC)、KeyWord Out Of Context (KWOC)、KeyWord After Context (KWAC) の方法論を使った注釈付きテキストの可視化、ジェネリック参照の自動曖昧化、リンクされたオープンデータ接続のためのWikidataとの統合などがある。
このアプリケーションはメタデータ入力をサポートし、複数のダウンロードフォーマットを提供し、アクセシビリティと使いやすさを促進する。
主にアルド・モロの作品のナショナル版のために開発されたKwicKKは、デジタル学術資源とのより深い関わりを育みながら、ユーザの技術的な障壁を低くすることを目的としている。
このアーキテクチャは、現代的なWeb技術を活用し、スケーラビリティと信頼性を確保する。
今後の開発では、ユーザエクスペリエンスの向上、コラボレーティブ機能、追加データソースの統合などについて検討する予定である。
関連論文リスト
- See then Tell: Enhancing Key Information Extraction with Vision Grounding [54.061203106565706]
STNet(See then Tell Net)は,視覚基盤の正確な答えを提供するために設計された,新しいエンドツーエンドモデルである。
モデルの可視性を高めるため、広範囲に構造化されたテーブル認識データセットを収集する。
論文 参考訳(メタデータ) (2024-09-29T06:21:05Z) - VisFocus: Prompt-Guided Vision Encoders for OCR-Free Dense Document Understanding [18.609441902943445]
VisFocusは、視覚エンコーダのキャパシティを言語プロンプトと直接結合することにより、OCRフリーな手法である。
視覚的エンコーダに入力された文書テキストのスニペットに言語マスキングを用いて,アーキテクチャ拡張と新たな事前学習タスクを組み合わせた。
我々の実験は、このプロンプト誘導型視覚符号化アプローチが性能を著しく向上させることを示した。
論文 参考訳(メタデータ) (2024-07-17T14:16:46Z) - Callico: a Versatile Open-Source Document Image Annotation Platform [3.306544219329259]
CallicoはWebベースのオープンソースプラットフォームで、文書認識プロジェクトのアノテーションプロセスを簡単にするように設計されている。
このプラットフォームは、オープンソース開発へのコミットメントによって、多彩な機能を備えたコラボレーティブアノテーションをサポートしている。
例としては、ベルフォート市立登録簿の転写、フランス第二次世界大戦の捕虜のICRCへの索引付け、ソックフェイスプロジェクトの国勢調査リストからの個人情報の抽出などがある。
論文 参考訳(メタデータ) (2024-05-02T08:03:18Z) - Knowledge Graphs and Pre-trained Language Models enhanced Representation Learning for Conversational Recommender Systems [58.561904356651276]
本稿では,対話型推薦システムのためのエンティティの意味理解を改善するために,知識強化型エンティティ表現学習(KERL)フレームワークを紹介する。
KERLは知識グラフと事前訓練された言語モデルを使用して、エンティティの意味的理解を改善する。
KERLはレコメンデーションとレスポンス生成の両方のタスクで最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-12-18T06:41:23Z) - Towards Improving Document Understanding: An Exploration on
Text-Grounding via MLLMs [96.54224331778195]
本稿では,画像中のテキストの空間的位置を識別し,MLLMを強化したテキストグラウンド文書理解モデルTGDocを提案する。
我々は,テキスト検出,認識,スポッティングなどの命令チューニングタスクを定式化し,視覚エンコーダと大言語モデルとの密接なアライメントを容易にする。
提案手法は,複数のテキストリッチベンチマークにまたがる最先端性能を実現し,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2023-11-22T06:46:37Z) - Semantic Communications for Artificial Intelligence Generated Content
(AIGC) Toward Effective Content Creation [75.73229320559996]
本稿では,AIGCとSemComの統合の概念モデルを開発する。
AIGC技術を利用した新しいフレームワークが,意味情報のためのエンコーダおよびデコーダとして提案されている。
このフレームワークは、生成されたさまざまなタイプのコンテンツ、要求される品質、活用される意味情報に適応することができる。
論文 参考訳(メタデータ) (2023-08-09T13:17:21Z) - Semantic Similarity Measure of Natural Language Text through Machine
Learning and a Keyword-Aware Cross-Encoder-Ranking Summarizer -- A Case Study
Using UCGIS GIS&T Body of Knowledge [2.4909170697740968]
GIS&T Body of Knowledge (BoK)は、地理空間的トピックを定義し、開発し、文書化するためのコミュニティ主導の取り組みである。
本研究は,テキストから意味を抽出する上で,複数自然言語処理(NLP)技術の有効性を評価する。
また、科学出版物を分析するための機械学習技術の使用について、新たな視点を提供する。
論文 参考訳(メタデータ) (2023-05-17T01:17:57Z) - Open Domain Question Answering over Virtual Documents: A Unified
Approach for Data and Text [62.489652395307914]
我々は、知識集約型アプリケーションのための構造化知識を符号化する手段として、Data-to-text法、すなわち、オープンドメイン質問応答(QA)を用いる。
具体的には、ウィキペディアとウィキソースの3つのテーブルを付加知識源として使用する、データとテキスト上でのオープンドメインQAのための冗長化-レトリバー・リーダー・フレームワークを提案する。
UDT-QA(Unified Data and Text QA)は,知識インデックスの拡大を効果的に活用できることを示す。
論文 参考訳(メタデータ) (2021-10-16T00:11:21Z) - Bringing Cognitive Augmentation to Web Browsing Accessibility [69.62988485669146]
我々は、より自然でアクセス可能なwebブラウジング体験を提供するための認知的拡張によってもたらされる機会を探求する。
我々は,BVIP対話型Webブラウジングニーズを支援するための概念的フレームワークを開発する。
構造的特徴とコンテンツ機能のみを考慮した初期の作業とプロトタイプについて説明する。
論文 参考訳(メタデータ) (2020-12-07T14:40:52Z) - Knowledge Graph Based Synthetic Corpus Generation for Knowledge-Enhanced
Language Model Pre-training [22.534866015730664]
我々は全英Wikidata KGを言語化した。
Wikidataのような包括的で百科事典的なKGを言語化することで、構造化されたKGと自然言語コーパスを統合することができることを示す。
論文 参考訳(メタデータ) (2020-10-23T22:14:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。