論文の概要: Creating an Aligned Corpus of Sound and Text: The Multimodal Corpus of Shakespeare and Milton
- arxiv url: http://arxiv.org/abs/2407.18730v1
- Date: Fri, 26 Jul 2024 13:30:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-29 13:21:06.603735
- Title: Creating an Aligned Corpus of Sound and Text: The Multimodal Corpus of Shakespeare and Milton
- Title(参考訳): 音とテキストのアライメントコーパスの作成:シェイクスピアとミルトンのマルチモーダルコーパス
- Authors: Manex Agirrezabal,
- Abstract要約: 我々はウィリアム・シェイクスピアとジョン・ミルトンによる詩集を公開し、パブリックドメインからの読書で豊かになった。
我々はこれらの詩の基本的な視覚化プラットフォームを作り、将来の可能性を見極めることで結論付ける。
- 参考スコア(独自算出の注目度): 2.9370710299422607
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this work we present a corpus of poems by William Shakespeare and John Milton that have been enriched with readings from the public domain. We have aligned all the lines with their respective audio segments, at the line, word, syllable and phone level, and we have included their scansion. We make a basic visualization platform for these poems and we conclude by conjecturing possible future directions.
- Abstract(参考訳): この作品では、ウィリアム・シェイクスピアとジョン・ミルトンによる詩集を公開ドメインからの読書で豊かにしている。
すべての行をそれぞれの音声セグメント、行、単語、音節、電話レベルに合わせることができ、それらのスキャンも含んでいます。
我々はこれらの詩の基本的な視覚化プラットフォームを作り、将来の可能性を見極めることで結論付ける。
関連論文リスト
- Sonnet or Not, Bot? Poetry Evaluation for Large Models and Datasets [3.0040661953201475]
大規模言語モデル(LLM)が詩を生成、認識できるようになった。
我々はLLMが英語詩の1つの側面をいかに認識するかを評価するタスクを開発する。
我々は,現在最先端のLLMが,一般的な文体と一般的でない文体の両方を識別できることを示す。
論文 参考訳(メタデータ) (2024-06-27T05:36:53Z) - A Computational Approach to Style in American Poetry [19.41186389974801]
我々は,アメリカの詩のスタイルを評価し,詩集を相互に視覚化する手法を開発した。
質的な詩批評は、様々な正書法、構文、音韻の特徴を分析するメトリクスの開発を導くのに役立ちました。
本手法は,テキストの学術研究,詩に対する直感的な個人的反応の研究,およびお気に入りの詩に基づいた読者への推薦に有効である。
論文 参考訳(メタデータ) (2023-10-13T18:49:14Z) - Audio-Visual Neural Syntax Acquisition [91.14892278795892]
視覚的音声からの句構造誘導について検討する。
本稿では,音声を聴いたり,画像を見たりすることでフレーズ構造を学習するAV-NSL(Audio-Visual Neural Syntax Learner)について述べる。
論文 参考訳(メタデータ) (2023-10-11T16:54:57Z) - VCSE: Time-Domain Visual-Contextual Speaker Extraction Network [54.67547526785552]
本稿では,VCSEという2段階の時間領域視覚コンテキスト話者抽出ネットワークを提案する。
第1段階では、視覚的手がかりで対象音声を事前抽出し、基礎となる音声系列を推定する。
第2段階では、事前抽出されたターゲット音声を自己学習した文脈的手がかりで洗練する。
論文 参考訳(メタデータ) (2022-10-09T12:29:38Z) - PoeLM: A Meter- and Rhyme-Controllable Language Model for Unsupervised
Poetry Generation [42.12348554537587]
形式詩は詩の韻律や韻律に厳格な制約を課している。
この種の詩を創作する以前の作品のほとんどは、既存の詩を監督に用いている。
本稿では,任意の韻律や韻律に従って詩を生成するための教師なしアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-24T17:09:55Z) - Zero-shot Sonnet Generation with Discourse-level Planning and Aesthetics
Features [37.45490765899826]
詩の訓練を必要としないソネットを生成するための新しい枠組みを提案する。
具体的には、コンテンツ計画モジュールを非詩文で訓練し、談話レベルのコヒーレンスを得る。
また、生成されたソネットのパラメータとリズムの制約を課す制約付き復号アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-05-03T23:44:28Z) - Textless Speech Emotion Conversion using Decomposed and Discrete
Representations [49.55101900501656]
我々は、音声を、コンテンツ単位、F0、話者、感情からなる離散的、非絡み合いの学習表現に分解する。
まず、内容単位を対象の感情に翻訳し、その単位に基づいて韻律的特徴を予測することによって、音声内容を変更する。
最後に、予測された表現をニューラルボコーダに入力して音声波形を生成する。
論文 参考訳(メタデータ) (2021-11-14T18:16:42Z) - CCPM: A Chinese Classical Poetry Matching Dataset [50.90794811956129]
本稿では,詩のマッチングによるモデルの意味的理解を評価するための新しい課題を提案する。
この課題は、現代漢訳の漢詩では、4人の候補者の中から1行の漢詩を選ばなければならない。
このデータセットを構築するために、まず中国古典詩と現代中国語の翻訳の並列データを得る。
論文 参考訳(メタデータ) (2021-06-03T16:49:03Z) - DISCO PAL: Diachronic Spanish Sonnet Corpus with Psychological and
Affective Labels [1.7205106391379026]
本稿では,スペイン語ソネットの注釈付きコーパスについて,GAMを予測するために個々の単語から特徴を構築できるかどうかを解析するために検討する。
使用したコーパスには、15世紀から19世紀にかけての様々な世紀の著者による274のスペイン語ソネットが含まれている。
これにより、ソネットのコーパスは、詩推薦システム、著者の人格テキストマイニング研究、治療目的の詩の使用など、様々な用途で利用することができる。
論文 参考訳(メタデータ) (2020-07-09T08:26:22Z) - Unsupervised Speech Decomposition via Triple Information Bottleneck [63.55007056410914]
音声情報は、言語内容、音色、ピッチ、リズムの4つの構成要素に大別できる。
本稿では,3つの慎重に設計された情報ボトルネックを導入することで,音声をその4つの構成要素に盲目的に分解できるSpeechSplitを提案する。
論文 参考訳(メタデータ) (2020-04-23T16:12:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。