論文の概要: Data-driven Parsing Evaluation for Child-Parent Interactions
- arxiv url: http://arxiv.org/abs/2209.13778v1
- Date: Wed, 28 Sep 2022 02:13:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 16:46:19.662609
- Title: Data-driven Parsing Evaluation for Child-Parent Interactions
- Title(参考訳): データ駆動解析による親子間相互作用の評価
- Authors: Zoey Liu and Emily Prud'hommeaux
- Abstract要約: 自然主義的子供と子供指向音声のための構文依存ツリーバンクを英語で提示する(MacWhinney, 2000)
既存のUDスタイルの音声木バンクや、特に親子間相互作用の依存性コーパスと比較して、我々のデータセットは(大きな)大きさ(発話のN = 44,744; 単語のN = 233, 907)であり、幅広い年齢層をカバーする10人の子供の音声を含んでいる(18~66ヶ月)。
- 参考スコア(独自算出の注目度): 7.529417276142102
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We present a syntactic dependency treebank for naturalistic child and
child-directed speech in English (MacWhinney, 2000). Our annotations largely
followed the guidelines of the Universal Dependencies project (UD (Zeman et
al., 2022)), with detailed extensions to lexical/syntactic structures unique to
conversational speech (in opposition to written texts). Compared to existing
UD-style spoken treebanks as well as other dependency corpora of child-parent
interactions specifically, our dataset is of (much) larger size (N of
utterances = 44,744; N of words = 233, 907) and contains speech from a total of
10 children covering a wide age range (18-66 months). With this dataset, we
ask: (1) How well would state-of-the-art dependency parsers, tailored for the
written domain, perform for speech of different interlocutors in spontaneous
conversations? (2) What is the relationship between parser performance and the
developmental stage of the child? To address these questions, in ongoing work,
we are conducting thorough dependency parser evaluations using both graph-based
and transition-based parsers with different hyperparameterization, trained from
three different types of out-of-domain written texts: news, tweets, and learner
data.
- Abstract(参考訳): 自然主義的な子供と子供指向の英語(MacWhinney, 2000)のための構文依存ツリーバンクを提案する。
私たちのアノテーションは、(文章とは対照的に)会話音声特有の語彙/構文構造への詳細な拡張を含む、universal dependencies project(ud(zeman et al., 2022)のガイドラインに従っています。
既存のUDスタイルの音声木バンクや、特に親子間相互作用の依存性コーパスと比較して、我々のデータセットは(大きな)大きさ(発話のN = 44,744; 単語のN = 233, 907)であり、幅広い年齢層(18~66ヶ月)をカバーする10人の子供のスピーチを含んでいる。
1) 自発的な会話における異なる対話者の発話に対して、書込みドメイン用に調整された最先端の依存関係パーサは、どの程度うまく機能するのか?
2)子どもの発達段階とパーサー性能の関係について
これらの問題に対処するために,現在進行中の作業では,ハイパーパラメータ化の異なるグラフベースとトランジッションベースの2つのパーサを使用して,ニュース,つぶやき,学習者データという,ドメイン外の3種類のテキストからトレーニングを行っている。
関連論文リスト
- Integrating Supertag Features into Neural Discontinuous Constituent Parsing [0.0]
伝統的な選挙区の見解では、構成要素は隣接した単語で構成されており、ドイツ語のような言語で一般的である。
トランジションベースの構文解析は、大きな注釈付きコーパス上で教師あり学習を用いて生のテキストを入力した木を生成する。
論文 参考訳(メタデータ) (2024-10-11T12:28:26Z) - Growing Trees on Sounds: Assessing Strategies for End-to-End Dependency Parsing of Speech [8.550564152063522]
音声解析における2つの解析パラダイムの性能評価を目的とした一連の実験について報告する。
我々はこの評価をフランス語の大きな木バンクで行い、現実的な自発的な会話を特徴とする。
その結果, (i) グラフに基づく手法は, (ii) パラメータが30%少ないにもかかわらず, (ii) 音声から直接解析することで, パイプライン手法よりも優れた結果が得られることがわかった。
論文 参考訳(メタデータ) (2024-06-18T13:46:10Z) - Syntactic Language Change in English and German: Metrics, Parsers, and Convergences [56.47832275431858]
本論文は,過去160年間の議会討論のコーパスを用いて,英語とドイツ語の統語的言語変化のダイアクロニックな傾向を考察する。
私たちは、広く使われているStanford Coreと、新しい4つの選択肢を含む5つの依存関係をベースとしています。
文長分布の尾部では,構文的尺度の変化が頻繁であることが明らかとなった。
論文 参考訳(メタデータ) (2024-02-18T11:46:16Z) - Paralinguistics-Enhanced Large Language Modeling of Spoken Dialogue [71.15186328127409]
パラリンGPT(Paralin GPT)
モデルは、シリアライズされたマルチタスクフレームワーク内の入力プロンプトとして、テキスト、音声埋め込み、およびパラ言語属性の会話コンテキストを取る。
音声対話データセットとして,感情ラベルをパラ言語属性として含むSwitchboard-1コーパスを利用する。
論文 参考訳(メタデータ) (2023-12-23T18:14:56Z) - Conversational Semantic Parsing using Dynamic Context Graphs [68.72121830563906]
汎用知識グラフ(KG)を用いた会話意味解析の課題を,数百万のエンティティと数千のリレーショナルタイプで検討する。
ユーザ発話を実行可能な論理形式にインタラクティブにマッピングできるモデルに焦点を当てる。
論文 参考訳(メタデータ) (2023-05-04T16:04:41Z) - Semantic Parsing for Conversational Question Answering over Knowledge
Graphs [63.939700311269156]
本研究では,ユーザの質問にSparqlパースとアノテートし,システム回答が実行結果に対応するデータセットを開発する。
本稿では,2つの意味解析手法を提案し,その課題を強調した。
私たちのデータセットとモデルはhttps://github.com/Edinburgh/SPICE.orgで公開されています。
論文 参考訳(メタデータ) (2023-01-28T14:45:11Z) - Discourse Analysis via Questions and Answers: Parsing Dependency
Structures of Questions Under Discussion [57.43781399856913]
この研究は、談話分析にQUD(Language framework of Questions Under discussion)を採用する。
我々は、文間の関係を、徹底的なきめ細かい質問とは対照的に、自由形式の質問として特徴づける。
完全文書上の質問の依存関係構造を導出する第一種QUDを開発する。
論文 参考訳(メタデータ) (2022-10-12T03:53:12Z) - What Makes Sentences Semantically Related: A Textual Relatedness Dataset
and Empirical Study [31.062129406113588]
本稿では,5500の英文対を手動で注釈付けしたセマンティックテキスト関連性データセットSTR-2022を紹介する。
文対の関連性に関する人間の直感は信頼性が高く, 繰り返しアノテーションの相関は0.84である。
また, STR-2022は, 文章表現の自動手法や, 下流の様々なNLPタスクに対して有効であることを示す。
論文 参考訳(メタデータ) (2021-10-10T16:23:54Z) - A Survey of Unsupervised Dependency Parsing [62.16714720135358]
教師なしの依存関係解析は、正しいパースツリーのアノテーションを持たない文から依存関係を学ぶことを目的としている。
その困難さにもかかわらず、教師なしの構文解析は、ほとんど無制限に注釈のないテキストデータを利用することができるため、興味深い研究方向である。
論文 参考訳(メタデータ) (2020-10-04T10:51:22Z) - A Survey of Syntactic-Semantic Parsing Based on Constituent and
Dependency Structures [14.714725860010724]
我々は、構文解析の最も一般的な2つの形式、すなわち構成解析と依存性解析に焦点を当てている。
本稿では、構成解析と依存性解析の代表モデルと、リッチセマンティクスによる依存性解析について概説する。
論文 参考訳(メタデータ) (2020-06-19T10:21:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。