論文の概要: StyleKQC: A Style-Variant Paraphrase Corpus for Korean Questions and
Commands
- arxiv url: http://arxiv.org/abs/2103.13439v1
- Date: Wed, 24 Mar 2021 18:38:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-27 03:28:50.333888
- Title: StyleKQC: A Style-Variant Paraphrase Corpus for Korean Questions and
Commands
- Title(参考訳): stylekqc: 韓国語質問とコマンドのためのスタイル可変パラフレーズコーパス
- Authors: Won Ik Cho, Sangwhan Moon, Jong In Kim, Seok Min Kim, Nam Soo Kim
- Abstract要約: スタイル・バリアント・パラフレージングは、トーンやマナーにおいて重要であり、ダイアログシステムなどの産業アプリケーションにも重要です。
本稿では,韓国語における指示文の中核的内容とスタイル,すなわち意図と形式を同時に検討するコーパス構築方式を用いて,この問題に対処する。
- 参考スコア(独自算出の注目度): 10.842598478887243
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Paraphrasing is often performed with less concern for controlled style
conversion. Especially for questions and commands, style-variant paraphrasing
can be crucial in tone and manner, which also matters with industrial
applications such as dialog system. In this paper, we attack this issue with a
corpus construction scheme that simultaneously considers the core content and
style of directives, namely intent and formality, for the Korean language.
Utilizing manually generated natural language queries on six daily topics, we
expand the corpus to formal and informal sentences by human rewriting and
transferring. We verify the validity and industrial applicability of our
approach by checking the adequate classification and inference performance that
fit with the fine-tuning approaches, at the same time proposing a supervised
formality transfer task.
- Abstract(参考訳): パラフレーズ化はしばしば、制御されたスタイル変換に対する関心を減らして行われる。
特に質問やコマンドの場合、スタイル不変のパラフレーズはトーンや方法において重要であり、ダイアログシステムのような産業的応用においても重要である。
本稿では,韓国語における指示文の中核的内容とスタイル,すなわち意図と形式を同時に検討するコーパス構築方式を用いて,この問題に対処する。
人手による6つのトピックの自然言語クエリを用いて,人間の書き直しと変換によってコーパスを形式的文と形式的文に拡張する。
本手法の妥当性と工業的適用性を検証するために, 微調整手法に適合する適切な分類と推論性能の検証と同時に, 教師あり形式変換タスクを提案する。
関連論文リスト
- Gradable ChatGPT Translation Evaluation [7.697698018200632]
大規模事前学習に基づく言語モデルであるChatGPTは,機械翻訳の領域に大きな影響を与えている。
翻訳の素早い設計は、翻訳のスタイル、精度、正確さなどの要因に影響を与えうる重要な側面として現れる。
本稿では,表現タイプ,翻訳スタイル,POS情報,明示的ステートメントの観点から,段階的な翻訳プロンプトを規定する総称分類法を提案する。
論文 参考訳(メタデータ) (2024-01-18T13:58:10Z) - Machine Translation to Control Formality Features in the Target Language [0.9208007322096532]
本研究では、機械学習が英語からフォーマルな言語への翻訳にどのように使われているかを検討する。
これは、形式性制御された設定でバイリンガルモデルを訓練し、その性能を事前訓練された多言語モデルと比較することで実現された。
予測されたマスク付きトークンと基底真理を比較することにより,公式な形式性精度(ACC)を評価する。
論文 参考訳(メタデータ) (2023-11-22T15:42:51Z) - ParaGuide: Guided Diffusion Paraphrasers for Plug-and-Play Textual Style
Transfer [57.6482608202409]
テキストスタイル転送は、意味を保ちながらテキストのスタイル特性を変換するタスクである。
任意のスタイルに柔軟に適応できる汎用型転送のための新しい拡散型フレームワークを提案する。
本研究では,人的評価と自動評価の両面から,Enron Email Corpusの手法を検証するとともに,形式性,感情,さらにはオーサシップスタイルの伝達にも優れることを示す。
論文 参考訳(メタデータ) (2023-08-29T17:36:02Z) - Don't lose the message while paraphrasing: A study on content preserving
style transfer [61.38460184163704]
スタイル伝達研究の現実的な応用には,コンテンツ保存が不可欠である。
形式性伝達領域の例において、様々なスタイル転送モデルを比較する。
我々は,スタイル伝達のための最先端技術について,精密な比較研究を行っている。
論文 参考訳(メタデータ) (2023-08-17T15:41:08Z) - A Corpus for Sentence-level Subjectivity Detection on English News Articles [49.49218203204942]
我々はこのガイドラインを用いて、議論を呼んだ話題に関する英ニュース記事から抽出した638の目的語と411の主観的な文からなるNewsSD-ENGを収集する。
我々のコーパスは、語彙や機械翻訳といった言語固有のツールに頼ることなく、英語で主観的検出を行う方法を舗装している。
論文 参考訳(メタデータ) (2023-05-29T11:54:50Z) - Controllable Mixed-Initiative Dialogue Generation through Prompting [50.03458333265885]
混合開始対話タスクには、情報の繰り返し交換と会話制御が含まれる。
エージェントは、ポリシープランナーが定める特定の対話意図や戦略に従う応答を生成することにより、コントロールを得る。
標準的なアプローチは、これらの意図に基づいて生成条件を実行するために、訓練済みの言語モデルを微調整している。
代わりに、条件生成の微調整に代えて、大きな言語モデルをドロップインで置き換えるように促します。
論文 参考訳(メタデータ) (2023-05-06T23:11:25Z) - nl2spec: Interactively Translating Unstructured Natural Language to
Temporal Logics with Large Language Models [3.1143846686797314]
大規模言語モデル(LLM)を適用するためのフレームワークであるnl2specは、構造化されていない自然言語から正式な仕様を導出する。
本稿では,自然言語におけるシステム要求のあいまいさを検知し,解決する新たな手法を提案する。
ユーザは、これらのサブ翻訳を反復的に追加、削除、編集して、不正なフォーマル化を修正する。
論文 参考訳(メタデータ) (2023-03-08T20:08:53Z) - StoryTrans: Non-Parallel Story Author-Style Transfer with Discourse
Representations and Content Enhancing [73.81778485157234]
長文は通常、文よりも談話構造のような複雑な著者の言語的嗜好を含んでいる。
我々は、入力されたストーリーを特定の著者スタイルに転送する必要があるノン並列ストーリー作者スタイル転送のタスクを定式化する。
モデルが自動エンコーダに退化することを防ぐために,学習した談話表現からスタイル的特徴を引き離すための追加の学習目標を用いる。
論文 参考訳(メタデータ) (2022-08-29T08:47:49Z) - Transductive Learning for Unsupervised Text Style Transfer [60.65782243927698]
教師なしスタイル転送モデルは、主に帰納的学習アプローチに基づいている。
本稿では,検索に基づく文脈認識スタイルの表現に基づく新しいトランスダクティブ学習手法を提案する。
論文 参考訳(メタデータ) (2021-09-16T08:57:20Z) - Customizing Contextualized Language Models forLegal Document Reviews [0.22940141855172028]
一般ドメインコーパスに歪んだ異なる言語モデルがどのように、法的文書レビュータスクに最適にカスタマイズできるかを示す。
本研究は,タスクのパフォーマンスと実践的考察の効率を比較検討する。
論文 参考訳(メタデータ) (2021-02-10T22:14:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。