論文の概要: Data-driven Parsing Evaluation for Child-Parent Interactions
- arxiv url: http://arxiv.org/abs/2209.13778v1
- Date: Wed, 28 Sep 2022 02:13:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 16:46:19.662609
- Title: Data-driven Parsing Evaluation for Child-Parent Interactions
- Title(参考訳): データ駆動解析による親子間相互作用の評価
- Authors: Zoey Liu and Emily Prud'hommeaux
- Abstract要約: 自然主義的子供と子供指向音声のための構文依存ツリーバンクを英語で提示する(MacWhinney, 2000)
既存のUDスタイルの音声木バンクや、特に親子間相互作用の依存性コーパスと比較して、我々のデータセットは(大きな)大きさ(発話のN = 44,744; 単語のN = 233, 907)であり、幅広い年齢層をカバーする10人の子供の音声を含んでいる(18~66ヶ月)。
- 参考スコア(独自算出の注目度): 7.529417276142102
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We present a syntactic dependency treebank for naturalistic child and
child-directed speech in English (MacWhinney, 2000). Our annotations largely
followed the guidelines of the Universal Dependencies project (UD (Zeman et
al., 2022)), with detailed extensions to lexical/syntactic structures unique to
conversational speech (in opposition to written texts). Compared to existing
UD-style spoken treebanks as well as other dependency corpora of child-parent
interactions specifically, our dataset is of (much) larger size (N of
utterances = 44,744; N of words = 233, 907) and contains speech from a total of
10 children covering a wide age range (18-66 months). With this dataset, we
ask: (1) How well would state-of-the-art dependency parsers, tailored for the
written domain, perform for speech of different interlocutors in spontaneous
conversations? (2) What is the relationship between parser performance and the
developmental stage of the child? To address these questions, in ongoing work,
we are conducting thorough dependency parser evaluations using both graph-based
and transition-based parsers with different hyperparameterization, trained from
three different types of out-of-domain written texts: news, tweets, and learner
data.
- Abstract(参考訳): 自然主義的な子供と子供指向の英語(MacWhinney, 2000)のための構文依存ツリーバンクを提案する。
私たちのアノテーションは、(文章とは対照的に)会話音声特有の語彙/構文構造への詳細な拡張を含む、universal dependencies project(ud(zeman et al., 2022)のガイドラインに従っています。
既存のUDスタイルの音声木バンクや、特に親子間相互作用の依存性コーパスと比較して、我々のデータセットは(大きな)大きさ(発話のN = 44,744; 単語のN = 233, 907)であり、幅広い年齢層(18~66ヶ月)をカバーする10人の子供のスピーチを含んでいる。
1) 自発的な会話における異なる対話者の発話に対して、書込みドメイン用に調整された最先端の依存関係パーサは、どの程度うまく機能するのか?
2)子どもの発達段階とパーサー性能の関係について
これらの問題に対処するために,現在進行中の作業では,ハイパーパラメータ化の異なるグラフベースとトランジッションベースの2つのパーサを使用して,ニュース,つぶやき,学習者データという,ドメイン外の3種類のテキストからトレーニングを行っている。
関連論文リスト
- Syntactic Language Change in English and German: Metrics, Parsers, and
Convergences [59.3104689496844]
本論文は,過去160年間の議会討論のコーパスを用いて,英語とドイツ語の統語的言語変化のダイアクロニックな傾向を考察する。
私たちは、広く使われているStanford Coreと、新しい4つの選択肢を含む5つの依存関係をベースとしています。
文長分布の尾部では,構文的尺度の変化が頻繁であることが明らかとなった。
論文 参考訳(メタデータ) (2024-02-18T11:46:16Z) - Paralinguistics-Enhanced Large Language Modeling of Spoken Dialogue [71.15186328127409]
パラリンGPT(Paralin GPT)
モデルは、シリアライズされたマルチタスクフレームワーク内の入力プロンプトとして、テキスト、音声埋め込み、およびパラ言語属性の会話コンテキストを取る。
音声対話データセットとして,感情ラベルをパラ言語属性として含むSwitchboard-1コーパスを利用する。
論文 参考訳(メタデータ) (2023-12-23T18:14:56Z) - A Pilot Study on Dialogue-Level Dependency Parsing for Chinese [21.698966896156087]
850の対話と199,803の依存関係を含む高品質な人間注釈コーパスを開発する。
このようなタスクはアノテーションのコストが高いため、ゼロショットと少数ショットのシナリオを調査する。
既存のシンタクティックツリーバンクをベースとした信号ベースの手法により、目に見えないシンタクティック依存関係を非表示のツリーバンクに変換する。
論文 参考訳(メタデータ) (2023-05-21T12:20:13Z) - MD3: The Multi-Dialect Dataset of Dialogues [20.144004030947507]
本稿では,インド,ナイジェリア,米国から英語を表現した会話音声のデータセットを紹介する。
データセットには、20時間以上のオーディオと、20万以上の正書法で書き起こされたトークンが含まれている。
論文 参考訳(メタデータ) (2023-05-19T00:14:10Z) - Conversational Semantic Parsing using Dynamic Context Graphs [68.72121830563906]
汎用知識グラフ(KG)を用いた会話意味解析の課題を,数百万のエンティティと数千のリレーショナルタイプで検討する。
ユーザ発話を実行可能な論理形式にインタラクティブにマッピングできるモデルに焦点を当てる。
論文 参考訳(メタデータ) (2023-05-04T16:04:41Z) - Semantic Parsing for Conversational Question Answering over Knowledge
Graphs [63.939700311269156]
本研究では,ユーザの質問にSparqlパースとアノテートし,システム回答が実行結果に対応するデータセットを開発する。
本稿では,2つの意味解析手法を提案し,その課題を強調した。
私たちのデータセットとモデルはhttps://github.com/Edinburgh/SPICE.orgで公開されています。
論文 参考訳(メタデータ) (2023-01-28T14:45:11Z) - Discourse Analysis via Questions and Answers: Parsing Dependency
Structures of Questions Under Discussion [57.43781399856913]
この研究は、談話分析にQUD(Language framework of Questions Under discussion)を採用する。
我々は、文間の関係を、徹底的なきめ細かい質問とは対照的に、自由形式の質問として特徴づける。
完全文書上の質問の依存関係構造を導出する第一種QUDを開発する。
論文 参考訳(メタデータ) (2022-10-12T03:53:12Z) - What Makes Sentences Semantically Related: A Textual Relatedness Dataset
and Empirical Study [31.062129406113588]
本稿では,5500の英文対を手動で注釈付けしたセマンティックテキスト関連性データセットSTR-2022を紹介する。
文対の関連性に関する人間の直感は信頼性が高く, 繰り返しアノテーションの相関は0.84である。
また, STR-2022は, 文章表現の自動手法や, 下流の様々なNLPタスクに対して有効であることを示す。
論文 参考訳(メタデータ) (2021-10-10T16:23:54Z) - A Survey of Unsupervised Dependency Parsing [62.16714720135358]
教師なしの依存関係解析は、正しいパースツリーのアノテーションを持たない文から依存関係を学ぶことを目的としている。
その困難さにもかかわらず、教師なしの構文解析は、ほとんど無制限に注釈のないテキストデータを利用することができるため、興味深い研究方向である。
論文 参考訳(メタデータ) (2020-10-04T10:51:22Z) - A Survey of Syntactic-Semantic Parsing Based on Constituent and
Dependency Structures [14.714725860010724]
我々は、構文解析の最も一般的な2つの形式、すなわち構成解析と依存性解析に焦点を当てている。
本稿では、構成解析と依存性解析の代表モデルと、リッチセマンティクスによる依存性解析について概説する。
論文 参考訳(メタデータ) (2020-06-19T10:21:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。