論文の概要: Smart Word Suggestions for Writing Assistance
- arxiv url: http://arxiv.org/abs/2305.09975v1
- Date: Wed, 17 May 2023 06:15:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-18 17:24:47.853402
- Title: Smart Word Suggestions for Writing Assistance
- Title(参考訳): 書字支援のためのスマートワードの提案
- Authors: Chenshuo Wang, Shaoguang Mao, Tao Ge, Wenshan Wu, Xun Wang, Yan Xia,
Jonathan Tien, Dongyan Zhao
- Abstract要約: 本稿では,SWS(Smart Word Suggestions)タスクとベンチマークを紹介する。
SWSはエンドツーエンドの評価を強調し、より現実的な記述支援シナリオを提示します。
ベンチマークには、テストのための人間ラベル付きデータ、トレーニングのための大規模な遠隔監視データセット、評価のためのフレームワークが含まれている。
- 参考スコア(独自算出の注目度): 56.21376840058941
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Enhancing word usage is a desired feature for writing assistance. To further
advance research in this area, this paper introduces "Smart Word Suggestions"
(SWS) task and benchmark. Unlike other works, SWS emphasizes end-to-end
evaluation and presents a more realistic writing assistance scenario. This task
involves identifying words or phrases that require improvement and providing
substitution suggestions. The benchmark includes human-labeled data for
testing, a large distantly supervised dataset for training, and the framework
for evaluation. The test data includes 1,000 sentences written by English
learners, accompanied by over 16,000 substitution suggestions annotated by 10
native speakers. The training dataset comprises over 3.7 million sentences and
12.7 million suggestions generated through rules. Our experiments with seven
baselines demonstrate that SWS is a challenging task. Based on experimental
analysis, we suggest potential directions for future research on SWS. The
dataset and related codes is available at
https://github.com/microsoft/SmartWordSuggestions.
- Abstract(参考訳): 単語の使用拡大は、文字の補助に望ましい機能である。
この領域の研究をさらに進めるために,本稿では「スマートワード提案(smart word suggestions, sws)」タスクとベンチマークを紹介する。
他の作業とは異なり、SWSはエンドツーエンドの評価を強調し、より現実的な記述支援シナリオを提示します。
このタスクは、改善を必要とする単語やフレーズを識別し、置換の提案を提供する。
ベンチマークには、テストのための人間ラベル付きデータ、トレーニングのための大規模な遠隔監視データセット、評価のためのフレームワークが含まれている。
テストデータには、英語学習者が書いた1000の文章と、10人のネイティブ話者が注釈を付けた16,000以上の代替提案が含まれている。
トレーニングデータセットは、ルールによって生成された370万文と1270万の提案からなる。
7つのベースラインによる我々の実験は、SWSが難しい課題であることを示している。
実験分析に基づいて,今後のSWS研究の方向性を提案する。
データセットと関連するコードはhttps://github.com/microsoft/SmartWordSuggestions.comで公開されている。
関連論文リスト
- Cross-lingual Contextualized Phrase Retrieval [63.80154430930898]
そこで本研究では,言語間関係の単語検索を多義的に行うタスクの定式化を提案する。
我々は、コントラスト学習を用いて、言語間コンテクスト対応句検索(CCPR)を訓練する。
フレーズ検索タスクでは、CCPRはベースラインをかなり上回り、少なくとも13ポイント高いトップ1の精度を達成する。
論文 参考訳(メタデータ) (2024-03-25T14:46:51Z) - QTSumm: Query-Focused Summarization over Tabular Data [58.62152746690958]
人々は主に、データ分析を行うか、特定の質問に答えるためにテーブルをコンサルティングします。
そこで本研究では,テキスト生成モデルに人間的な推論を行なわなければならない,クエリ中心のテーブル要約タスクを新たに定義する。
このタスクには,2,934テーブル上の7,111の人間注釈付きクエリ-サマリーペアを含む,QTSummという新しいベンチマークを導入する。
論文 参考訳(メタデータ) (2023-05-23T17:43:51Z) - Semantic Parsing for Conversational Question Answering over Knowledge
Graphs [63.939700311269156]
本研究では,ユーザの質問にSparqlパースとアノテートし,システム回答が実行結果に対応するデータセットを開発する。
本稿では,2つの意味解析手法を提案し,その課題を強調した。
私たちのデータセットとモデルはhttps://github.com/Edinburgh/SPICE.orgで公開されています。
論文 参考訳(メタデータ) (2023-01-28T14:45:11Z) - Mining Word Boundaries in Speech as Naturally Annotated Word
Segmentation Data [41.494096583913105]
中国語単語セグメンテーション(CWS)の自然な注釈付きデータの探索に触発されたこの研究は、パラレル音声/テキストデータから単語境界を抽出することを提案する。
まず、実験で使用したCWSデータに関連する2つのインターネットソースから、並列音声/テキストデータを収集する。
隣接する文字間の停止時間に応じて単語境界を決定するための文字レベルのアライメントと簡単なルールを設計する。
論文 参考訳(メタデータ) (2022-10-31T08:02:21Z) - TransLIST: A Transformer-Based Linguistically Informed Sanskrit
Tokenizer [11.608920658638976]
サンスクリットワードアルゴリズム(SWS)は、デジタル化されたテキストを利用できるようにし、下流のタスクをデプロイするのに不可欠である。
我々はTransLIST(Transformer based Linguistically Informed Sanskrit Tokenizer)を提案する。
TransLISTは、SWS特有のサンディー現象を考慮した潜在単語情報と共に文字入力を符号化する。
論文 参考訳(メタデータ) (2022-10-21T06:15:40Z) - Sentiment-Aware Word and Sentence Level Pre-training for Sentiment
Analysis [64.70116276295609]
SentiWSPは、WordレベルとSentenceレベルの事前トレーニングタスクを組み合わせた、Sentiment対応の事前トレーニング言語モデルである。
SentiWSPは、様々な文レベルおよびアスペクトレベルの感情分類ベンチマーク上で、最先端のパフォーマンスを新たに達成する。
論文 参考訳(メタデータ) (2022-10-18T12:25:29Z) - Pedagogical Word Recommendation: A novel task and dataset on
personalized vocabulary acquisition for L2 learners [4.507860128918788]
Pedagogical Word Recommendation と呼ばれる新しいタスクのためのデータの提案と公開を行う。
PWRの主な目的は、学習者が既に見てきた他の単語に基づいて、ある学習者が与えられた単語を知っているかどうかを予測することである。
このITSの特徴として、学生は、自分たちが解決した質問から知らない単語を直接表示して、ワードブックを作成することができる。
論文 参考訳(メタデータ) (2021-12-27T17:52:48Z) - Prefix-to-SQL: Text-to-SQL Generation from Incomplete User Questions [33.48258057604425]
本稿では,ユーザから質問文を入力として取り出して,意図したsqlを予測する,新しいタスクであるPremction-to-Queryを提案する。
我々はPAGSASと呼ばれる新しいベンチマークを構築し、124Kのユーザ質問プレフィックスと5つのサブタスクのアドバイス、GeoQuery、Scholar、ATIS、Spiderを含む。
省略トークンの数にプレフィックス・ツー・クエリの難しさが関係しているのを観察するため,サンプルの摂食に関するカリキュラム学習と,省略トークンの数の増加について考察する。
論文 参考訳(メタデータ) (2021-09-15T14:28:18Z) - A General Multi-Task Learning Framework to Leverage Text Data for Speech
to Text Tasks [36.216979991706594]
本稿では,自動音声認識(ASR)と音声翻訳(ST)タスクのためのテキストデータを活用する汎用マルチタスク学習フレームワークを提案する。
テキスト入力を音素シーケンスとして表現することで、音声とテキスト入力の差を減らし、テキストコーパスからテキストタスクへの知識伝達を促進できることを示す。
論文 参考訳(メタデータ) (2020-10-21T22:40:43Z) - Words aren't enough, their order matters: On the Robustness of Grounding
Visual Referring Expressions [87.33156149634392]
視覚的参照表現認識のための標準ベンチマークであるRefCOgを批判的に検討する。
83.7%のケースでは言語構造に関する推論は不要である。
比較学習とマルチタスク学習の2つの手法を提案し,ViLBERTのロバスト性を高める。
論文 参考訳(メタデータ) (2020-05-04T17:09:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。