論文の概要: Using Pause Information for More Accurate Entity Recognition
- arxiv url: http://arxiv.org/abs/2109.13222v1
- Date: Mon, 27 Sep 2021 17:47:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-28 15:54:11.598950
- Title: Using Pause Information for More Accurate Entity Recognition
- Title(参考訳): より正確なエンティティ認識のためのポーズ情報の利用
- Authors: Sahas Dendukuri, Pooja Chitkara, Joel Ruben Antony Moniz, Xiao Yang,
Manos Tsagkias, Stephen Pulman
- Abstract要約: 停止時間に関する言語学的観察は,機械学習言語理解タスクの精度向上に有効であることを示す。
テキストベースのNLUとは対照的に、文脈埋め込みを豊かにするために停止期間を適用する。
以上の結果から,提案した新しい埋め込みは,フランス語の3つの領域において,相対誤差率を最大8%向上させることがわかった。
- 参考スコア(独自算出の注目度): 6.912121934692421
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Entity tags in human-machine dialog are integral to natural language
understanding (NLU) tasks in conversational assistants. However, current
systems struggle to accurately parse spoken queries with the typical use of
text input alone, and often fail to understand the user intent. Previous work
in linguistics has identified a cross-language tendency for longer speech
pauses surrounding nouns as compared to verbs. We demonstrate that the
linguistic observation on pauses can be used to improve accuracy in
machine-learnt language understanding tasks. Analysis of pauses in French and
English utterances from a commercial voice assistant shows the statistically
significant difference in pause duration around multi-token entity span
boundaries compared to within entity spans. Additionally, in contrast to
text-based NLU, we apply pause duration to enrich contextual embeddings to
improve shallow parsing of entities. Results show that our proposed novel
embeddings improve the relative error rate by up to 8% consistently across
three domains for French, without any added annotation or alignment costs to
the parser.
- Abstract(参考訳): ヒューマンマシンダイアログのエンティティタグは、会話アシスタントの自然言語理解(nlu)タスクに不可欠なものである。
しかし、現在のシステムでは、テキスト入力だけで音声クエリを正確に解析するのに苦労しており、しばしばユーザーの意図を理解できない。
言語学における以前の研究は、動詞と比較して名詞を取り巻く長い言論停止の言語的傾向を特定してきた。
ポーズによる言語観察は,機械学習による言語理解タスクの精度向上に有効であることを示す。
商用音声アシスタントによるフランス語と英語の発話の停止時間の解析は、複数の音素の境界付近の停止時間と、エンティティスパン内との統計的に有意な差を示した。
さらに、テキストベースのnluとは対照的に、エンティティの浅いパースを改善するために、コンテキスト埋め込みの強化に一時停止時間を適用する。
提案手法は,フランス語の3領域において,構文解析に付加的なアノテーションやアライメントのコストを伴わずに,相対誤差率を最大8%向上することを示した。
関連論文リスト
- Gujarati-English Code-Switching Speech Recognition using ensemble
prediction of spoken language [29.058108207186816]
マルチヘッドアテンション機構において,言語固有のパラメータと説明可能性を導入する2つの手法を提案する。
WERを著しく削減できないにもかかわらず、本手法は音声データから正しい言語を予測することを約束している。
論文 参考訳(メタデータ) (2024-03-12T18:21:20Z) - Syntactic Language Change in English and German: Metrics, Parsers, and Convergences [56.47832275431858]
本論文は,過去160年間の議会討論のコーパスを用いて,英語とドイツ語の統語的言語変化のダイアクロニックな傾向を考察する。
私たちは、広く使われているStanford Coreと、新しい4つの選択肢を含む5つの依存関係をベースとしています。
文長分布の尾部では,構文的尺度の変化が頻繁であることが明らかとなった。
論文 参考訳(メタデータ) (2024-02-18T11:46:16Z) - Pixel Sentence Representation Learning [67.4775296225521]
本研究では,視覚表現学習プロセスとして,文レベルのテキスト意味論の学習を概念化する。
タイポスや単語順シャッフルのような視覚的に接地されたテキスト摂動法を採用し、人間の認知パターンに共鳴し、摂動を連続的に認識できるようにする。
我々のアプローチは、大規模に教師なしのトピックアライメントトレーニングと自然言語推論監督によってさらに強化されている。
論文 参考訳(メタデータ) (2024-02-13T02:46:45Z) - Explaining Interactions Between Text Spans [50.70253702800355]
入力の異なる部分からのトークンのスパンに対する推論は、自然言語理解に不可欠である。
NLUタスク2つのタスク(NLIとFC)に対する人間間相互作用の説明データセットであるSpanExを紹介する。
次に,複数の微調整された大言語モデルの決定過程を,スパン間の相互接続の観点から検討する。
論文 参考訳(メタデータ) (2023-10-20T13:52:37Z) - Bilingual End-to-End ASR with Byte-Level Subwords [4.268218327369146]
文字レベル、バイトレベル、バイトペア符号化(BPE)、バイトレベルバイトペア符号化(BBPE)など、さまざまな表現について検討する。
我々は,発話に基づくバイリンガルASRをサポートする単一エンドツーエンドモデルの開発に注力する。
ペナルティスキーム付きBBPEは,少ない出力と少ないパラメータであっても,発話ベースのバイリンガルASR性能を2%から5%向上できることがわかった。
論文 参考訳(メタデータ) (2022-05-01T15:01:01Z) - Spoken Term Detection Methods for Sparse Transcription in Very
Low-resource Settings [20.410074074340447]
2つの口頭言語での実験では、ターゲット言語音声のほんの数分で微調整された、事前訓練された普遍的な電話認識器が、音声語検出に使用できることが示されている。
グラフ構造における音素認識の曖昧さの表現は、低リソース音声語検出タスクにおいて高い精度を維持しながら、リコールをさらに促進できることを示す。
論文 参考訳(メタデータ) (2021-06-11T04:09:54Z) - VECO: Variable and Flexible Cross-lingual Pre-training for Language
Understanding and Generation [77.82373082024934]
我々はTransformerエンコーダにクロスアテンションモジュールを挿入し、言語間の相互依存を明確に構築する。
独自の言語でコンテキストにのみ条件付けされたマスク付き単語の予測の退化を効果的に回避することができる。
提案した言語間モデルでは,XTREMEベンチマークのさまざまな言語間理解タスクに対して,最先端の新たな結果が提供される。
論文 参考訳(メタデータ) (2020-10-30T03:41:38Z) - Pareto Probing: Trading Off Accuracy for Complexity [87.09294772742737]
我々は,プローブの複雑性と性能の基本的なトレードオフを反映したプローブ計量について論じる。
係り受け解析による実験により,文脈表現と非文脈表現の統語的知識の幅広いギャップが明らかとなった。
論文 参考訳(メタデータ) (2020-10-05T17:27:31Z) - Reinforcement learning of minimalist grammars [0.5862282909017474]
最先端の言語技術は、関連するキーワードに対して音響解析された音声信号をスキャンする。
単語はセマンティックスロットに挿入され、ユーザの意図を解釈する。
メンタルレキシコンは、ユーザとのインタラクション中に認知エージェントによって取得されなければならない。
論文 参考訳(メタデータ) (2020-04-30T14:25:58Z) - On the Language Neutrality of Pre-trained Multilingual Representations [70.93503607755055]
語彙意味論に関して,多言語文脈埋め込みの言語中立性を直接的に検討する。
その結果、文脈埋め込みは言語ニュートラルであり、概して静的な単語型埋め込みよりも情報的であることがわかった。
本稿では,言語識別における最先端の精度に到達し,並列文の単語アライメントのための統計的手法の性能を一致させる方法について述べる。
論文 参考訳(メタデータ) (2020-04-09T19:50:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。