論文の概要: STONYBOOK: A System and Resource for Large-Scale Analysis of Novels
- arxiv url: http://arxiv.org/abs/2311.03614v1
- Date: Mon, 6 Nov 2023 23:46:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-08 17:26:25.046858
- Title: STONYBOOK: A System and Resource for Large-Scale Analysis of Novels
- Title(参考訳): stonybook : 小説の大規模解析のためのシステムと資源
- Authors: Charuta Pethe, Allen Kim, Rajesh Prabhakar, Tanzir Pial, Steven Skiena
- Abstract要約: 本は歴史的に物語が伝えられる主要なメカニズムである。
我々は,小説の大規模分析のための資料コレクションを開発した。
- 参考スコア(独自算出の注目度): 11.304581370821756
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Books have historically been the primary mechanism through which narratives
are transmitted. We have developed a collection of resources for the
large-scale analysis of novels, including: (1) an open source end-to-end NLP
analysis pipeline for the annotation of novels into a standard XML format, (2)
a collection of 49,207 distinct cleaned and annotated novels, and (3) a
database with an associated web interface for the large-scale aggregate
analysis of these literary works. We describe the major functionalities
provided in the annotation system along with their utilities. We present
samples of analysis artifacts from our website, such as visualizations of
character occurrences and interactions, similar books, representative
vocabulary, part of speech statistics, and readability metrics. We also
describe the use of the annotated format in qualitative and quantitative
analysis across large corpora of novels.
- Abstract(参考訳): 本は歴史的に物語が伝えられる主要なメカニズムである。
本稿では,小説の大規模解析のための資料集として,(1)小説の注釈を標準xml形式に変換するための,オープンソースのエンド・ツー・エンドのnlp分析パイプライン,(2)個別にクリーン・アノテートされた小説49,207冊のコレクション,(3)これら文学作品の大規模集約分析のための関連webインターフェースを備えたデータベースを開発した。
アノテーションシステムで提供される主要な機能とそのユーティリティについて述べる。
本稿では,本サイトから,文字の発生と相互作用の可視化,類似書籍,代表語彙,音声統計の一部,可読性指標などの分析アーティファクトのサンプルを提示する。
また,大量の小説の質的・定量的解析における注釈形式の利用について述べる。
関連論文リスト
- BookWorm: A Dataset for Character Description and Analysis [59.186325346763184]
本稿では,短い事実プロファイルを生成する文字記述と,詳細な解釈を提供する文字解析という2つのタスクを定義する。
本稿では,Gutenbergプロジェクトからの書籍と,人間による記述と分析のペアリングを行うBookWormデータセットを紹介する。
その結果,検索に基づくアプローチは両タスクにおいて階層的アプローチよりも優れていた。
論文 参考訳(メタデータ) (2024-10-14T10:55:58Z) - Bridging Research and Readers: A Multi-Modal Automated Academic Papers
Interpretation System [47.13932723910289]
本稿では,3段階のプロセス段階を有するオープンソースマルチモーダル自動学術論文解釈システム(MMAPIS)を紹介する。
ドキュメントからプレーンテキストや表や図を別々に抽出するために、ハイブリッドなモダリティ前処理とアライメントモジュールを使用している。
すると、この情報は彼らが属するセクション名に基づいて調整され、同じセクション名を持つデータが同じセクションの下に分類される。
抽出されたセクション名を用いて、記事を短いテキストセグメントに分割し、LSMを通してセクション内とセクション間の特定の要約を容易にする。
論文 参考訳(メタデータ) (2024-01-17T11:50:53Z) - Panel Transitions for Genre Analysis in Visual Narratives [1.320904960556043]
本稿では,漫画や漫画風のビジュアル・ナラティブに基づくジャンルのマルチモーダル分析を行うための新しいアプローチを提案する。
我々は、主観的ラベルをモデル化する際の既存の計算手法の限界と課題を強調した。
論文 参考訳(メタデータ) (2023-12-14T08:05:09Z) - One Graph to Rule them All: Using NLP and Graph Neural Networks to
analyse Tolkien's Legendarium [3.0448872422956432]
J.R.R.トールキンのレジェンダリウムのテキストコーパスから抽出した文字ネットワークについて検討した。
この視点は、トールキンの作品を特徴づける物語のスタイルを分析し、視覚化するのに役立ちます。
論文 参考訳(メタデータ) (2022-10-14T14:47:56Z) - BASS: Boosting Abstractive Summarization with Unified Semantic Graph [49.48925904426591]
BASSは、統合されたセマンティックグラフに基づく抽象的な要約を促進するためのフレームワークである。
文書表現と要約生成の両方を改善するために,グラフベースのエンコーダデコーダモデルを提案する。
実験結果から,提案アーキテクチャは長期文書および複数文書要約タスクに大幅な改善をもたらすことが示された。
論文 参考訳(メタデータ) (2021-05-25T16:20:48Z) - Modeling Social Readers: Novel Tools for Addressing Reception from
Online Book Reviews [0.0]
5つの人気小説のレビューのコーパスを使用して、小説のメインストーリーラインの読者の蒸留を研究します。
無限語彙ネットワークの研究に3つの重要な貢献をしている。
本稿では、レビューから集約された部分軌跡に基づいてイベントのコンセンサスシーケンスを生成する新しいシーケンシングアルゴリズムREV2SEQを提案する。
論文 参考訳(メタデータ) (2021-05-03T20:10:14Z) - What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-06T02:23:01Z) - Quasi Error-free Text Classification and Authorship Recognition in a
large Corpus of English Literature based on a Novel Feature Set [0.0]
GLECの準誤りのないテキスト分類とオーサシップ認識は,同一の5つのスタイルと5つのコンテンツ特徴を用いた手法で可能であることを示す。
我々のデータは、心理学を読むための文学や実験の、多くの未来の計算および実証的研究の道を開く。
論文 参考訳(メタデータ) (2020-10-21T07:39:55Z) - Abstractive Summarization of Spoken and Written Instructions with BERT [66.14755043607776]
本稿では,BERTSumモデルの最初の対話型言語への応用について述べる。
我々は多種多様な話題にまたがるナレーションビデオの抽象要約を生成する。
我々は、これをインテリジェントな仮想アシスタントの機能として統合し、要求に応じて文字と音声の両方の指導内容の要約を可能にすることを想定する。
論文 参考訳(メタデータ) (2020-08-21T20:59:34Z) - A Hierarchical Network for Abstractive Meeting Summarization with
Cross-Domain Pretraining [52.11221075687124]
本稿では,会議シナリオに適応する抽象的要約ネットワークを提案する。
提案手法は,長時間の会議記録に対応する階層構造と,話者間の差異を表現する役割ベクトルを設計する。
我々のモデルは、自動測定と人的評価の両方において、過去のアプローチよりも優れています。
論文 参考訳(メタデータ) (2020-04-04T21:00:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。