論文の概要: Multitasking Framework for Unsupervised Simple Definition Generation
- arxiv url: http://arxiv.org/abs/2203.12926v1
- Date: Thu, 24 Mar 2022 08:16:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-25 21:50:32.627744
- Title: Multitasking Framework for Unsupervised Simple Definition Generation
- Title(参考訳): 教師なし単純定義生成のためのマルチタスクフレームワーク
- Authors: Cunliang Kong, Yun Chen, Hengyuan Zhang, Liner Yang, Erhong Yang
- Abstract要約: 本稿では,言語学習者や低リテラシー学習者を支援するための,シンプル定義生成の課題を提案する。
この課題の重要な課題は、多くの言語における学習者の辞書の欠如である。
複雑な定義を持つ標準辞書と任意の単純なテキストを含むコーパスのみを必要とするマルチタスクフレームワークSimpDefinerを提案する。
- 参考スコア(独自算出の注目度): 5.2221935174520056
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The definition generation task can help language learners by providing
explanations for unfamiliar words. This task has attracted much attention in
recent years. We propose a novel task of Simple Definition Generation (SDG) to
help language learners and low literacy readers. A significant challenge of
this task is the lack of learner's dictionaries in many languages, and
therefore the lack of data for supervised training. We explore this task and
propose a multitasking framework SimpDefiner that only requires a standard
dictionary with complex definitions and a corpus containing arbitrary simple
texts. We disentangle the complexity factors from the text by carefully
designing a parameter sharing scheme between two decoders. By jointly training
these components, the framework can generate both complex and simple
definitions simultaneously. We demonstrate that the framework can generate
relevant, simple definitions for the target words through automatic and manual
evaluations on English and Chinese datasets. Our method outperforms the
baseline model by a 1.77 SARI score on the English dataset, and raises the
proportion of the low level (HSK level 1-3) words in Chinese definitions by
3.87%.
- Abstract(参考訳): 定義生成タスクは、不慣れな単語の説明を提供することで、言語学習者に役立つ。
この作業は近年多くの注目を集めている。
本稿では,言語学習者や低リテラシー読解者を支援するための,シンプルな定義生成(SDG)の課題を提案する。
この課題の重要な課題は、多くの言語における学習者の辞書の欠如であり、教師付きトレーニングのためのデータの欠如である。
我々は、このタスクを探索し、複雑な定義を持つ標準辞書と任意の単純なテキストを含むコーパスのみを必要とするマルチタスクフレームワークsimpdefinerを提案する。
2つのデコーダ間のパラメータ共有スキームを慎重に設計することで、複雑性要因をテキストから切り離す。
これらのコンポーネントを共同でトレーニングすることで、フレームワークは複雑な定義と単純な定義の両方を同時に生成できる。
このフレームワークは、英語と中国語のデータセットを自動的および手動で評価することにより、対象単語の関連性、簡単な定義を生成できることを実証する。
本手法は,英語データセットの1.77 SARIスコアでベースラインモデルより優れ,中国語定義における低レベル(HSKレベル1-3)単語の割合を3.87%向上させる。
関連論文リスト
- Generating Continuations in Multilingual Idiomatic Contexts [2.0849578298972835]
非合成図形テキストを含むニュアンス言語理解における生成言語モデル(LM)の能力を検証する。
3つの異なるトレーニング設定の下で、2つの異なる言語(英語とポルトガル語)でデータセットを使用して実験を行う。
以上の結果から,本モデルでは慣用的文脈よりも文脈の連続性をわずかに向上し,マージンが極端に小さいことが示唆された。
論文 参考訳(メタデータ) (2023-10-31T05:40:33Z) - Assisting Language Learners: Automated Trans-Lingual Definition
Generation via Contrastive Prompt Learning [25.851611353632926]
標準定義生成タスクは、モノリンガル定義を自動的に生成する必要がある。
本稿では,他言語で定義を生成することを目的としたTLDG(Trans-Lingual Definition Generation)を提案する。
論文 参考訳(メタデータ) (2023-06-09T17:32:45Z) - Did You Read the Instructions? Rethinking the Effectiveness of Task
Definitions in Instruction Learning [74.70157466822612]
教科学習におけるタスク定義の役割を体系的に研究する。
タスク出力を記述する内容を削除すると,モデルの性能が大幅に低下することがわかった。
本稿では,モデルのタスク命令の活用を支援するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2023-06-01T21:11:24Z) - SLUE Phase-2: A Benchmark Suite of Diverse Spoken Language Understanding
Tasks [88.4408774253634]
音声言語理解(SLU)タスクは、音声研究コミュニティで何十年にもわたって研究されてきた。
SLUタスクベンチマークはそれほど多くはなく、既存のベンチマークの多くは、すべての研究者が自由に利用できないデータを使っている。
最近の研究は、いくつかのタスクにそのようなベンチマークを導入し始めている。
論文 参考訳(メタデータ) (2022-12-20T18:39:59Z) - Prompting Language Models for Linguistic Structure [73.11488464916668]
本稿では,言語構造予測タスクに対する構造化プロンプト手法を提案する。
提案手法は, 音声タグ付け, 名前付きエンティティ認識, 文チャンキングについて評価する。
PLMはタスクラベルの事前知識を事前学習コーパスに漏えいすることで有意な事前知識を含むが、構造化プロンプトは任意のラベルで言語構造を復元することも可能である。
論文 参考訳(メタデータ) (2022-11-15T01:13:39Z) - Task Grouping for Multilingual Text Recognition [28.036892501896983]
Gumbel-Softmax を用いたタスクグループ化と代入モジュールを用いた多言語テキスト認識の自動手法を提案する。
MLT19の実験は、全てのタスクを結合し、タスクグループ化/分離のより良い構成を達成する全てのタスクを分離する中間的な基盤が存在するという我々の仮説に証拠を与えている。
論文 参考訳(メタデータ) (2022-10-13T23:54:23Z) - Coarse-to-Fine: Hierarchical Multi-task Learning for Natural Language
Understanding [51.31622274823167]
本稿では,各タスクの下位レベルを全タスクに共有し,中間レベルを異なるグループに分割し,上位レベルを各タスクに割り当てる,粗大なパラダイムを持つ階層型フレームワークを提案する。
これにより、すべてのタスクから基本言語特性を学習し、関連するタスクのパフォーマンスを高め、無関係なタスクから負の影響を減らすことができる。
論文 参考訳(メタデータ) (2022-08-19T02:46:20Z) - Learning to Follow Language Instructions with Compositional Policies [22.778677208048475]
本稿では,目標達成タスクからなる環境下で自然言語命令を実行することを学習するフレームワークを提案する。
我々は強化学習エージェントを訓練し、その後ブール代数を通して構成できる値関数を学習する。
我々は、Webスケールコーパスで事前訓練されたSeq2seqモデルを微調整し、言語を論理式にマッピングする。
論文 参考訳(メタデータ) (2021-10-09T21:28:26Z) - Rethinking End-to-End Evaluation of Decomposable Tasks: A Case Study on
Spoken Language Understanding [101.24748444126982]
分解可能なタスクは複雑で、サブタスクの階層から構成される。
しかし、既存のベンチマークでは、通常は表面レベルのサブタスクのみの例が示される。
サブタスク固有のユーティリティ関数上の座標アセントを用いて、ロバストなテストセットを構築するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-29T02:53:59Z) - Words aren't enough, their order matters: On the Robustness of Grounding
Visual Referring Expressions [87.33156149634392]
視覚的参照表現認識のための標準ベンチマークであるRefCOgを批判的に検討する。
83.7%のケースでは言語構造に関する推論は不要である。
比較学習とマルチタスク学習の2つの手法を提案し,ViLBERTのロバスト性を高める。
論文 参考訳(メタデータ) (2020-05-04T17:09:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。