論文の概要: Seshat: A tool for managing and verifying annotation campaigns of audio
data
- arxiv url: http://arxiv.org/abs/2003.01472v2
- Date: Wed, 17 Feb 2021 09:58:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 22:42:59.831062
- Title: Seshat: A tool for managing and verifying annotation campaigns of audio
data
- Title(参考訳): seshat: 音声データのアノテーションキャンペーンを管理し検証するツール
- Authors: Hadrien Titeux (LSCP, CoML), Rachid Riad (LSCP, CoML), Xuan-Nga Cao
(LSCP, CoML), Nicolas Hamilakis (LSCP, CoML), Kris Madden (CoML), Alejandrina
Cristia (LSCP), Anne-Catherine Bachoud-L\'evi (INSERM, PSL, UPEC M\'edecine),
Emmanuel Dupoux (LSCP, CoML, PSL, Inria, CNRS, EHESS)
- Abstract要約: Seshatは、音声コーパスのアノテーションを効率的に管理する、新しくてシンプルでオープンソースのソフトウェアである。
ユーザーは大きなオーディオコーパスのアノテーションをカスタマイズして管理できる。
- 参考スコア(独自算出の注目度): 38.98439939494304
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce Seshat, a new, simple and open-source software to efficiently
manage annotations of speech corpora. The Seshat software allows users to
easily customise and manage annotations of large audio corpora while ensuring
compliance with the formatting and naming conventions of the annotated output
files. In addition, it includes procedures for checking the content of
annotations following specific rules that can be implemented in personalised
parsers. Finally, we propose a double-annotation mode, for which Seshat
computes automatically an associated inter-annotator agreement with the
$\gamma$ measure taking into account the categorisation and segmentation
discrepancies.
- Abstract(参考訳): 本稿では,音声コーパスのアノテーションを効率的に管理するオープンソースソフトウェアSeshatを紹介する。
Seshatソフトウェアにより、ユーザーは、注釈付き出力ファイルのフォーマットや命名規則に準拠しながら、大きなオーディオコーパスのアノテーションを簡単にカスタマイズおよび管理できる。
さらに、パーソナライズされたパーサに実装可能な特定のルールに従うアノテーションの内容をチェックする手順も含まれている。
最後に、セシャールは分類とセグメンテーションの相違を考慮した$\gamma$測度と関連するアノテータ契約を自動的に計算する二重アノテーションモードを提案する。
関連論文リスト
- From Weak to Strong Sound Event Labels using Adaptive Change-Point Detection and Active Learning [11.312115846980602]
音声録音セグメントの弱いラベルアノテーションを機械誘導する適応的変化点検出法(A-CPD)を提案する。
ラベルのない音声記録毎に,アノテーションを導くために使用する確率曲線の導出に予測モデルを用いる。
アノテーション予算の制限により,高品質なラベルを抽出し,A-CPDに好適な結果を示すことができることを示す。
論文 参考訳(メタデータ) (2024-03-13T13:33:35Z) - Multi-granular Software Annotation using File-level Weak Labelling [7.106986689736827]
本稿では,弱いラベル付け手法と階層的アグリゲーションを用いたソースコードファイルのアノテート手法を提案する。
本手法がソフトウェアプロジェクトのマルチグラニュラアノテーションの実現に有効かどうかを評価する。
論文 参考訳(メタデータ) (2023-11-20T08:48:18Z) - TokenSplit: Using Discrete Speech Representations for Direct, Refined,
and Transcript-Conditioned Speech Separation and Recognition [51.565319173790314]
TokenSplit は Transformer アーキテクチャを使用するシーケンス・ツー・シーケンス・エンコーダ・デコーダモデルである。
また,本モデルでは,書き起こし条件付けの有無にかかわらず,分離の点で優れた性能を発揮することを示す。
また、自動音声認識(ASR)の性能を測定し、音声合成の音声サンプルを提供し、我々のモデルの有用性を実証する。
論文 参考訳(メタデータ) (2023-08-21T01:52:01Z) - How Good is Automatic Segmentation as a Multimodal Discourse Annotation
Aid? [3.3861948721202233]
我々は,協調問題解決のための支援として,異なる発話分割手法の質を評価する。
また, 音素発声は, 自動分節音声と最小の対応を保ち, 異なる分節音声を用いた分節音声も一致しないことを示す。
論文 参考訳(メタデータ) (2023-05-27T03:06:15Z) - Attributable and Scalable Opinion Summarization [79.87892048285819]
我々は、頻繁なエンコーディングを復号することで抽象的な要約を生成し、同じ頻繁なエンコーディングに割り当てられた文を選択して抽出的な要約を生成する。
本手法は,要約プロセスの一部として要約を生成するために使用される文を同定するため,帰属的手法である。
なぜなら、アグリゲーションはトークンの長いシーケンスではなく、潜在空間で実行されるからである。
論文 参考訳(メタデータ) (2023-05-19T11:30:37Z) - SciAnnotate: A Tool for Integrating Weak Labeling Sources for Sequence
Labeling [55.71459234749639]
SciAnnotateはSciAnnotateという名前のテキストアノテーションのためのウェブベースのツールで、科学的なアノテーションツールを指す。
我々のツールは、弱いラベルを作成するために複数のユーザフレンドリーなインターフェースを提供する。
本研究では,Bertifying Conditional Hidden Markov Modelを用いて,ツールが生成する弱いラベルを識別する手法を提案する。
論文 参考訳(メタデータ) (2022-08-07T19:18:13Z) - Simplifying Semantic Annotations of SMCalFlow [0.0]
SMCalFlowはタスク指向の自然な対話を意味的に詳細に記述した大量のコーパスである。
この注釈付きコーパスの可用性、サイズ、豊かさにもかかわらず、対話システムの研究での使用は限られている。
本稿では、SMCalFlowアノテーションの簡易化と、アノテーション付きデータフロープログラムの実行を検査するために必要なコードのリリースを提案する。
論文 参考訳(メタデータ) (2022-06-27T16:22:16Z) - Annotation Curricula to Implicitly Train Non-Expert Annotators [56.67768938052715]
自発的な研究は、しばしば、アノテータがタスク、そのアノテーションスキーム、およびデータドメインに精通することを要求する。
これは最初は圧倒的であり、精神的に課税され、結果として生じるアノテーションにエラーを誘導する。
暗黙的にアノテータを訓練する新しい手法であるアノテーションキュリキュラを提案する。
論文 参考訳(メタデータ) (2021-06-04T09:48:28Z) - audino: A Modern Annotation Tool for Audio and Speech [47.923092635544556]
audinoは、音声の時間分割を定義し、記述するためのツールである。
管理者は、ユーザロールとプロジェクト割り当てを集中的に制御することができる。
このツールの柔軟性は、音声認識、音声活動検出(VAD)、話者識別、話者識別、音声認識、感情認識などのアノテーションを可能にする。
論文 参考訳(メタデータ) (2020-06-09T13:12:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。