論文の概要: EmpLite: A Lightweight Sequence Labeling Model for Emphasis Selection of
Short Texts
- arxiv url: http://arxiv.org/abs/2101.03025v1
- Date: Tue, 15 Dec 2020 19:00:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-07 05:37:08.030610
- Title: EmpLite: A Lightweight Sequence Labeling Model for Emphasis Selection of
Short Texts
- Title(参考訳): EmpLite:短いテキストの強調選択のための軽量シーケンスラベルモデル
- Authors: Vibhav Agarwal, Sourav Ghosh, Kranti Chalamalasetti, Bharath Challa,
Sonal Kumari, Harshavardhana, Barath Raj Kandur Raja
- Abstract要約: 本論文では,短文の強調語検出を自動化する新しい手法を提案する。
私たちの知る限りでは、この研究は強調選択のスマートフォン展開のための最初の軽量深層学習アプローチを提示します。
- 参考スコア(独自算出の注目度): 1.3192560874022086
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Word emphasis in textual content aims at conveying the desired intention by
changing the size, color, typeface, style (bold, italic, etc.), and other
typographical features. The emphasized words are extremely helpful in drawing
the readers' attention to specific information that the authors wish to
emphasize. However, performing such emphasis using a soft keyboard for social
media interactions is time-consuming and has an associated learning curve. In
this paper, we propose a novel approach to automate the emphasis word detection
on short written texts. To the best of our knowledge, this work presents the
first lightweight deep learning approach for smartphone deployment of emphasis
selection. Experimental results show that our approach achieves comparable
accuracy at a much lower model size than existing models. Our best lightweight
model has a memory footprint of 2.82 MB with a matching score of 0.716 on
SemEval-2020 public benchmark dataset.
- Abstract(参考訳): テキストコンテンツにおける単語強調は、サイズ、色、書体、スタイル(ボールド、イタリックなど)を変えることで、望ましい意図を伝えることを目的としている。
ほか、タイポグラフィー機能もある。
強調された単語は、著者が強調したい特定の情報に読者の注意を引くのに非常に役立つ。
しかし、ソーシャルメディアのインタラクションにソフトキーボードを使うことは時間を要するため、関連する学習曲線を持つ。
本稿では,短い文章に対する単語検出の重み付けを自動化する新しい手法を提案する。
我々の知る限り、この研究は、強調選択のスマートフォン展開のための、初めての軽量なディープラーニングアプローチを示す。
実験の結果,既存のモデルよりもずっと小さいモデルサイズで比較精度が得られることがわかった。
我々の最も軽量なモデルはメモリフットプリントが2.82MBで、SemEval-2020公開ベンチマークデータセットのスコアは0.716である。
関連論文リスト
- Exploring Text-to-Motion Generation with Human Preference [59.28730218998923]
本稿では,テキスト・トゥ・モーション・ジェネレーションにおける嗜好学習の探索について述べる。
テキスト・トゥ・モーション・ジェネレーションの現在の改善は、まだモーションキャプチャシステムを備えたエキスパート・ラベラーを必要とするデータセットに依存していることがわかった。
我々は、好み学習が、現在のテキスト・ツー・モーション生成モデルを大幅に改善する可能性があることを示す。
論文 参考訳(メタデータ) (2024-04-15T04:14:42Z) - Retrieval is Accurate Generation [99.24267226311157]
本稿では,支援文書の集合からコンテキスト認識句を選択する新しい手法を提案する。
本モデルでは,検索対象のベースラインの中で,最高の性能と低レイテンシを実現する。
論文 参考訳(メタデータ) (2024-02-27T14:16:19Z) - Fine-tuning CLIP Text Encoders with Two-step Paraphrasing [83.3736789315201]
パラフレーズに対するCLIPモデルの表現を強化するための簡単な微調整手法を提案する。
ParaCLIPと呼ばれる我々のモデルは、様々なタスクでベースラインCLIPモデルよりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-02-23T06:11:50Z) - MetricPrompt: Prompting Model as a Relevance Metric for Few-shot Text
Classification [65.51149771074944]
MetricPromptは、数発のテキスト分類タスクをテキストペア関連性推定タスクに書き換えることで、言語設計の難易度を緩和する。
広範に使われている3つのテキスト分類データセットを4つのショット・セッティングで実験する。
結果から,MetricPromptは,手動弁証法や自動弁証法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2023-06-15T06:51:35Z) - Take the Hint: Improving Arabic Diacritization with
Partially-Diacritized Text [4.863310073296471]
本稿では,任意のダイアクリティカルティクスを効果的にサポートするマルチソースモデルである2SDiacを提案する。
また、ランダムマスキングのレベルが異なる入力において、与えられたダイアクリティカルを活用できるトレーニングスキームであるガイドドラーニングを導入する。
論文 参考訳(メタデータ) (2023-06-06T10:18:17Z) - Zero-Shot Text Classification via Self-Supervised Tuning [46.9902502503747]
ゼロショットテキスト分類タスクを解決するための自己教師付き学習に基づく新しいパラダイムを提案する。
自己教師付きチューニングという,ラベルのないデータで言語モデルをチューニングする。
我々のモデルは10タスク中7タスクで最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2023-05-19T05:47:33Z) - ABINet++: Autonomous, Bidirectional and Iterative Language Modeling for
Scene Text Spotting [121.11880210592497]
言語モデルの限られた能力は,1)暗黙的な言語モデリング,2)一方向の特徴表現,3)雑音入力を伴う言語モデルから生じる。
シーンテキストスポッティングのための自律的で双方向かつ反復的なABINet++を提案する。
論文 参考訳(メタデータ) (2022-11-19T03:50:33Z) - MetaHTR: Towards Writer-Adaptive Handwritten Text Recognition [36.12001394921506]
我々は手書き文字認識の新しい手法を提案する。
新しいメタラーニングフレームワークを使い、新たなライターデータを利用する。
当社のフレームワークは、最先端のHTRモデルの上に簡単に実装できます。
論文 参考訳(メタデータ) (2021-04-05T12:35:39Z) - Read Like Humans: Autonomous, Bidirectional and Iterative Language
Modeling for Scene Text Recognition [80.446770909975]
言語知識はシーンのテキスト認識に非常に有益である。
エンドツーエンドのディープネットワークで言語規則を効果的にモデル化する方法はまだ研究の課題です。
シーンテキスト認識のための自律的双方向反復型ABINetを提案する。
論文 参考訳(メタデータ) (2021-03-11T06:47:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。