論文の概要: Sampling and Ranking for Digital Ink Generation on a tight computational
budget
- arxiv url: http://arxiv.org/abs/2306.03103v1
- Date: Fri, 2 Jun 2023 09:55:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-07 19:08:44.498410
- Title: Sampling and Ranking for Digital Ink Generation on a tight computational
budget
- Title(参考訳): 厳密な計算予算に基づくデジタルインク生成のためのサンプリングとランク付け
- Authors: Andrei Afonin, Andrii Maksai, Aleksandr Timofeev, and Claudiu Musat
- Abstract要約: トレーニングされたデジタルインク生成モデルの出力品質を最大化する方法について検討する。
我々は、デジタルインク領域におけるその種類に関する最初のアブレーション研究において、複数のサンプリングとランキング手法の効果を使用、比較する。
- 参考スコア(独自算出の注目度): 69.15275423815461
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Digital ink (online handwriting) generation has a number of potential
applications for creating user-visible content, such as handwriting
autocompletion, spelling correction, and beautification. Writing is personal
and usually the processing is done on-device. Ink generative models thus need
to produce high quality content quickly, in a resource constrained environment.
In this work, we study ways to maximize the quality of the output of a
trained digital ink generative model, while staying within an inference time
budget. We use and compare the effect of multiple sampling and ranking
techniques, in the first ablation study of its kind in the digital ink domain.
We confirm our findings on multiple datasets - writing in English and
Vietnamese, as well as mathematical formulas - using two model types and two
common ink data representations. In all combinations, we report a meaningful
improvement in the recognizability of the synthetic inks, in some cases more
than halving the character error rate metric, and describe a way to select the
optimal combination of sampling and ranking techniques for any given
computational budget.
- Abstract(参考訳): デジタルインク(オンライン手書き)生成は、手書きのオートコンプリート、スペル訂正、美化など、ユーザ可視コンテンツを作成するための多くの潜在的な応用がある。
書き込みは個人的であり、通常はデバイス上で処理される。
したがって、インク生成モデルはリソース制約のある環境で、高品質なコンテンツを迅速に生成する必要がある。
本研究では,予測時間予算内に留まりながら,トレーニング済みデジタルインク生成モデルの出力品質を最大化する方法について検討する。
我々は、デジタルインク領域におけるその種類に関する最初のアブレーション研究において、複数のサンプリングとランキング手法の効果を使用、比較する。
2つのモデルタイプと2つの一般的なインクデータ表現を用いて,複数のデータセット – 英語とベトナム語で書くこと,数学的公式 – について知見を確認した。
いずれの組み合わせにおいても,文字誤り率メトリクスを半減する以上の場合において,合成インクの認識可能性に有意義な改善を報告し,任意の計算予算に対してサンプリングとランキング手法の最適な組み合わせを選択する方法について述べる。
関連論文リスト
- InkSight: Offline-to-Online Handwriting Conversion by Learning to Read
and Write [7.827729986700937]
InkSightは、物理的なメモ取り者が自分の仕事(オフラインの筆跡)をデジタルのインク(オンラインの筆跡)に変換するのを助ける
当社のアプローチでは、事前の読み書きと組み合わせて、大量のペアのサンプルがない場合にモデルをトレーニングすることが可能です。
人間の評価では,HierTextデータセット上で得られたサンプルの87%が,入力画像の有効なトレースとして検討されている。
論文 参考訳(メタデータ) (2024-02-08T16:41:41Z) - DSS: Synthesizing long Digital Ink using Data augmentation, Style
encoding and Split generation [47.90135553071684]
このタスクでよく使われるモデルは、長文データへの一般化に失敗することを示す。
これらの手法は対照的な学習技法を用いており、特に筆跡領域に特化している。
論文 参考訳(メタデータ) (2023-11-29T16:33:19Z) - Improving the Generation Quality of Watermarked Large Language Models
via Word Importance Scoring [81.62249424226084]
トークンレベルの透かしは、トークン確率分布を変更して生成されたテキストに透かしを挿入する。
この透かしアルゴリズムは、生成中のロジットを変化させ、劣化したテキストの品質につながる可能性がある。
We propose to improve the quality of texts generated by a watermarked language model by Watermarking with Importance Scoring (WIS)。
論文 参考訳(メタデータ) (2023-11-16T08:36:00Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Improving Accuracy and Explainability of Online Handwriting Recognition [0.9176056742068814]
我々は,OnHW-charsデータセット上で手書き認識モデルを開発し,先行モデルの精度を向上させる。
私たちの結果は公開リポジトリを通じて検証可能で再現可能です。
論文 参考訳(メタデータ) (2022-09-14T21:28:14Z) - Quark: Controllable Text Generation with Reinforced Unlearning [68.07749519374089]
大規模言語モデルは、しばしばユーザの期待に合わない振る舞いを学ぶ。
本稿では,(不必要な)特性を定量化する報酬関数を最適化するアルゴリズムQuarkを紹介する。
未学習の毒性、ネガティブな感情、反復について、我々の実験はQuarkが強いベースラインと最先端の強化学習法の両方より優れていることを示している。
論文 参考訳(メタデータ) (2022-05-26T21:11:51Z) - Structural Information Preserving for Graph-to-Text Generation [59.00642847499138]
グラフ・トゥ・テキスト生成の課題は、入力グラフの意味を保存した文を生成することである。
入力情報を保存するためのモデルとして,より豊かなトレーニング信号を活用することで,この問題に取り組むことを提案する。
グラフからテキストへの生成のための2つのベンチマークに関する実験は、最先端のベースラインに対するアプローチの有効性を示しています。
論文 参考訳(メタデータ) (2021-02-12T20:09:01Z) - Offline Handwritten Chinese Text Recognition with Convolutional Neural
Networks [5.984124397831814]
本稿では,畳み込みニューラルネットワークのみを用いてモデルを構築し,CTCを損失関数として利用する。
ICDAR 2013のコンペでは6.81%の文字誤り率(CER)を達成した。
論文 参考訳(メタデータ) (2020-06-28T14:34:38Z) - FCN+RL: A Fully Convolutional Network followed by Refinement Layers to
Offline Handwritten Signature Segmentation [3.3144312096837325]
そこで本研究では,手書き署名の画素の識別と抽出を行う手法を提案する。
この技術は、完全な畳み込みエンコーダ・デコーダネットワークと、予測された画像のアルファチャネルのための洗練されたレイヤのブロックを組み合わせたものである。
論文 参考訳(メタデータ) (2020-05-28T18:47:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。