論文の概要: Understanding Tieq Viet with Deep Learning Models
- arxiv url: http://arxiv.org/abs/2207.00975v1
- Date: Sun, 3 Jul 2022 08:05:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-06 11:15:22.115854
- Title: Understanding Tieq Viet with Deep Learning Models
- Title(参考訳): ディープラーニングモデルによるTieq Viet理解
- Authors: Nguyen Ha Thanh
- Abstract要約: 失った情報を復元する深層学習モデルの能力を示す優れた例を見つけ出す。
テストしたいという仮説は、ベトナム語からタイク・ヴィエ語に翻訳すると、ディープラーニングモデルが失われた情報を復元できるかどうかである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning is a powerful approach in recovering lost information as well
as harder inverse function computation problems. When applied in natural
language processing, this approach is essentially making use of context as a
mean to recover information through likelihood maximization. Not long ago, a
linguistic study called Tieq Viet was controversial among both researchers and
society. We find this a great example to demonstrate the ability of deep
learning models to recover lost information. In the proposal of Tieq Viet, some
consonants in the standard Vietnamese are replaced. A sentence written in this
proposal can be interpreted into multiple sentences in the standard version,
with different meanings. The hypothesis that we want to test is whether a deep
learning model can recover the lost information if we translate the text from
Vietnamese to Tieq Viet.
- Abstract(参考訳): 深層学習は、失われた情報とより難しい逆関数計算問題を回復する強力なアプローチである。
自然言語処理に適用する場合、この手法は基本的に、最大限の最大化によって情報を回復する手段としてコンテキストを利用する。
程なくして、ティエク・ヴィエトという言語研究が研究者と社会の間で論争を巻き起こした。
これは、深層学習モデルが失われた情報を回復する能力を示す素晴らしい例です。
Tieq Vietの提案では、ベトナム標準語の子音が置き換えられている。
この提案で書かれた文は、異なる意味を持つ標準バージョンで複数の文に解釈できる。
テストしたい仮説は、ベトナム語からtieq vietにテキストを翻訳すれば、ディープラーニングモデルが失われた情報を復元できるかどうかです。
関連論文リスト
- Measuring Non-Adversarial Reproduction of Training Data in Large Language Models [71.55350441396243]
自然と良性のプロンプトに応答する際のモデル応答と事前学習データの重なりを定量化する。
一般的な会話言語モデルによるテキスト出力の最大15%は、インターネットのスニペットと重なることが判明した。
適切なプロンプトは、平均して非敵の再現を減少させるが、トレーニングデータの最悪の再現を緩和するには、より強力な防御が必要である。
論文 参考訳(メタデータ) (2024-11-15T14:55:01Z) - InfoLossQA: Characterizing and Recovering Information Loss in Text Simplification [60.10193972862099]
本研究は, 簡易化による情報損失を問合せ・問合せ形式で特徴づけ, 回復する枠組みを提案する。
QAペアは、読者がテキストの知識を深めるのに役立つように設計されている。
論文 参考訳(メタデータ) (2024-01-29T19:00:01Z) - RECKONING: Reasoning through Dynamic Knowledge Encoding [51.076603338764706]
言語モデルは、文脈の一部として提供される知識について推論することで、質問に答えることができることを示す。
これらの状況では、モデルは質問に答えるために必要な知識を区別することができない。
我々は、与えられた文脈知識をモデルのパラメータに折り畳み、より堅牢に推論するようにモデルに教えることを提案する。
論文 参考訳(メタデータ) (2023-05-10T17:54:51Z) - Leveraging Semantic Representations Combined with Contextual Word
Representations for Recognizing Textual Entailment in Vietnamese [0.25782420501870296]
本稿では,SRLタスクによる意味表現と,RTE問題に対するBERT相対モデルのコンテキスト表現を組み合わせた実験を行う。
実験の結果,意味認識型文脈表現モデルは意味表現を含まないモデルよりも約1%高い性能を示した。
論文 参考訳(メタデータ) (2023-01-01T15:13:25Z) - Multi-stage Information Retrieval for Vietnamese Legal Texts [0.17188280334580194]
本研究では, 文変換器を用いたベトナムの法律文書の検索手法を提案する。
様々な実験を行い、異なる変圧器モデル、ランキングスコア、音節レベル、単語レベルの訓練を比較した。
論文 参考訳(メタデータ) (2022-09-29T01:13:56Z) - VieSum: How Robust Are Transformer-based Models on Vietnamese
Summarization? [1.1379578593538398]
ベトナムの抽象的な要約のためのトランスフォーマーベースエンコーダデコーダアーキテクチャのロバスト性について検討する。
ベトナムの2つのデータセットにおける手法の性能を検証した。
論文 参考訳(メタデータ) (2021-10-08T17:10:31Z) - Toward the Understanding of Deep Text Matching Models for Information
Retrieval [72.72380690535766]
本稿では,既存の深層テキストマッチング手法が情報検索の基本的な勾配を満たすかどうかを検証することを目的とする。
具体的には, 項周波数制約, 項識別制約, 長さ正規化制約, TF長制約の4つの属性を用いる。
LETOR 4.0 と MS Marco の実験結果から,研究対象の深層テキストマッチング手法はすべて,統計学において高い確率で上記の制約を満たすことが示された。
論文 参考訳(メタデータ) (2021-08-16T13:33:15Z) - A Vietnamese Dataset for Evaluating Machine Reading Comprehension [2.7528170226206443]
ベトナム語として低リソース言語のための新しいデータセットであるUIT-ViQuADを提案する。
このデータセットは、ウィキペディアから174のベトナム語記事の5,109節に基づいて、23,000人以上の人が生成した質問応答ペアで構成されている。
UIT-ViQuADの最初の実験モデルとして、英語と中国語の最先端MRC手法の実験を行った。
論文 参考訳(メタデータ) (2020-09-30T15:06:56Z) - Information-Theoretic Probing for Linguistic Structure [74.04862204427944]
本稿では,相互情報を推定するための情報理論による探索運用手法を提案する。
我々は,NLP研究でしばしば不足している10の型的多様言語について評価した。
論文 参考訳(メタデータ) (2020-04-07T01:06:36Z) - Enhancing lexical-based approach with external knowledge for Vietnamese
multiple-choice machine reading comprehension [2.5199066832791535]
我々はベトナム語の417のテキストに基づいて,2,783対の複数選択質問と回答からなるデータセットを構築した。
本稿では,意味的類似度尺度と外部知識源を用いて質問を分析し,与えられたテキストから回答を抽出する語彙ベースのMDC手法を提案する。
提案手法は,最良ベースラインモデルよりも5.51%高い精度で61.81%の精度を実現する。
論文 参考訳(メタデータ) (2020-01-16T08:09:51Z) - A Simple Joint Model for Improved Contextual Neural Lemmatization [60.802451210656805]
本稿では,20言語で最先端の成果を得られる,単純結合型ニューラルモデルを提案する。
本論文では,トレーニングと復号化に加えて,本モデルについて述べる。
論文 参考訳(メタデータ) (2019-04-04T02:03:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。