論文の概要: Turn-taking annotation for quantitative and qualitative analyses of conversation
- arxiv url: http://arxiv.org/abs/2504.09980v1
- Date: Mon, 14 Apr 2025 08:45:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:49:58.283809
- Title: Turn-taking annotation for quantitative and qualitative analyses of conversation
- Title(参考訳): 会話の量的・質的分析のためのターンテイクアノテーション
- Authors: Anneliese Kelterer, Barbara Schuppler,
- Abstract要約: ターンテイクは2つのレイヤ、IPU(Inter-Pausal Units)とPCOMP(point of potential completion)にアノテートされた。
IPUアノテーションの一致がほぼ完全であることを示す。
このシステムは、言語学および技術応用のための様々な会話データに適用することができる。
- 参考スコア(独自算出の注目度): 5.425050980601873
- License:
- Abstract: This paper has two goals. First, we present the turn-taking annotation layers created for 95 minutes of conversational speech of the Graz Corpus of Read and Spontaneous Speech (GRASS), available to the scientific community. Second, we describe the annotation system and the annotation process in more detail, so other researchers may use it for their own conversational data. The annotation system was developed with an interdisciplinary application in mind. It should be based on sequential criteria according to Conversation Analysis, suitable for subsequent phonetic analysis, thus time-aligned annotations were made Praat, and it should be suitable for automatic classification, which required the continuous annotation of speech and a label inventory that is not too large and results in a high inter-rater agreement. Turn-taking was annotated on two layers, Inter-Pausal Units (IPU) and points of potential completion (PCOMP; similar to transition relevance places). We provide a detailed description of the annotation process and of segmentation and labelling criteria. A detailed analysis of inter-rater agreement and common confusions shows that agreement for IPU annotation is near-perfect, that agreement for PCOMP annotations is substantial, and that disagreements often are either partial or can be explained by a different analysis of a sequence which also has merit. The annotation system can be applied to a variety of conversational data for linguistic studies and technological applications, and we hope that the annotations, as well as the annotation system will contribute to a stronger cross-fertilization between these disciplines.
- Abstract(参考訳): この論文には2つの目標がある。
まず,Glaz Corpus of Read and Spontaneous Speech (GRASS) の95分間の会話音声のターンテイクアノテーション層を科学コミュニティに提供した。
第2に、アノテーションシステムとアノテーションプロセスについてより詳細に記述するため、他の研究者も自身の会話データに使用することができる。
アノテーションシステムは学際的な応用を念頭に開発された。
対話分析に基づく逐次基準に基づき、その後の音声分析に適合し、時間順のアノテーションをPratにし、音声の連続的なアノテーションと、あまり大きくないラベルのインベントリを必要とする自動分類に適している。
ターンテイクは2つのレイヤ、IPU (Inter-Pausal Units) とPCOMP (point of potential completion) にアノテートされた。
アノテーションのプロセスとセグメンテーションとラベル付けの基準について詳述する。
IPUアノテーションの合意は、ほぼ完全であり、PCOMPアノテーションの合意は実質的であり、不一致はしばしば部分的であるか、あるいは有益である配列の異なる分析によって説明できることを示している。
アノテーションシステムは言語学および技術応用のための様々な会話データに適用でき、アノテーションシステムだけでなくアノテーションシステムもこれらの分野間の強い交配に寄与することを期待している。
関連論文リスト
- Aspect-based Meeting Transcript Summarization: A Two-Stage Approach with
Weak Supervision on Sentence Classification [91.13086984529706]
Aspect-based meeting transcript summarization は複数の要約を生成することを目的としている。
従来の要約手法は、全ての側面の情報を1つの要約で混合する。
アスペクトベースの会議書き起こし要約のための2段階の手法を提案する。
論文 参考訳(メタデータ) (2023-11-07T19:06:31Z) - How Good is Automatic Segmentation as a Multimodal Discourse Annotation
Aid? [3.3861948721202233]
我々は,協調問題解決のための支援として,異なる発話分割手法の質を評価する。
また, 音素発声は, 自動分節音声と最小の対応を保ち, 異なる分節音声を用いた分節音声も一致しないことを示す。
論文 参考訳(メタデータ) (2023-05-27T03:06:15Z) - SNaC: Coherence Error Detection for Narrative Summarization [73.48220043216087]
SNaCは長文の微粒化アノテーションに根ざした物語コヒーレンス評価フレームワークである。
本稿では,生成した物語要約におけるコヒーレンスエラーの分類法を開発し,150冊の本や映画の脚本要約にまたがる6.6k文のスパンレベルアノテーションを収集する。
我々の研究は、最先端の要約モデルによって生成されるコヒーレンスエラーの最初の特徴と、群衆アノテータからコヒーレンス判断を引き出すためのプロトコルを提供する。
論文 参考訳(メタデータ) (2022-05-19T16:01:47Z) - Sentence Embeddings and High-speed Similarity Search for Fast Computer
Assisted Annotation of Legal Documents [0.5249805590164901]
文章を「横」にアノテートするための概念証明システムを提案する。
アプローチは、意味的に類似した文が、特定の型システムにおいて、しばしば同じラベルを持つという観察に基づいている。
論文 参考訳(メタデータ) (2021-12-21T19:27:21Z) - Annotation Curricula to Implicitly Train Non-Expert Annotators [56.67768938052715]
自発的な研究は、しばしば、アノテータがタスク、そのアノテーションスキーム、およびデータドメインに精通することを要求する。
これは最初は圧倒的であり、精神的に課税され、結果として生じるアノテーションにエラーを誘導する。
暗黙的にアノテータを訓練する新しい手法であるアノテーションキュリキュラを提案する。
論文 参考訳(メタデータ) (2021-06-04T09:48:28Z) - Unsupervised Summarization for Chat Logs with Topic-Oriented Ranking and
Context-Aware Auto-Encoders [59.038157066874255]
本稿では,手動ラベル付きデータを用いずにチャット要約を行うrankaeという新しいフレームワークを提案する。
RankAEは、中心性と多様性に応じてトピックの発話を同時に選択するトピック指向のランキング戦略で構成されています。
消音自動エンコーダは、選択された発話に基づいて簡潔でコンテキスト情報に基づいた要約を生成するように設計されています。
論文 参考訳(メタデータ) (2020-12-14T07:31:17Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - Predicting the Humorousness of Tweets Using Gaussian Process Preference
Learning [56.18809963342249]
本稿では,人間の嗜好判断と言語アノテーションの自動生成を利用して,短文のユーモラスさのランク付けと評価を学習する確率論的アプローチを提案する。
本研究は, HAHA@IberLEF 2019データにおける数値スコアの変換と, 提案手法に必要な判定アノテーションの相互変換から生じる問題点について報告する。
論文 参考訳(メタデータ) (2020-08-03T13:05:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。