論文の概要: Disentangling Singlish Discourse Particles with Task-Driven Representation
- arxiv url: http://arxiv.org/abs/2409.20366v4
- Date: Wed, 16 Oct 2024 15:09:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-05 15:48:47.440713
- Title: Disentangling Singlish Discourse Particles with Task-Driven Representation
- Title(参考訳): タスク駆動表現による散在するSinglish談話粒子
- Authors: Linus Tze En Foo, Lynnette Hui Xian Ng,
- Abstract要約: シングリッシュ(英語: Singlish、正式にはコロキール・シンガポール英語)は、南東アジアのシンガポールを起源とするクレオール語である。
シングリッシュを理解するための基本的な課題は、まずその言論粒子の実用的函数を理解することである。
この研究は、Singlishの談話粒子をタスク駆動表現学習で解き放つための予備的な取り組みを提供する。
解離後、これらの談話粒子をクラスタリングし、実効性を識別し、Singlish-to- English 機械翻訳を行う。
- 参考スコア(独自算出の注目度): 1.3812010983144802
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Singlish, or formally Colloquial Singapore English, is an English-based creole language originating from the SouthEast Asian country Singapore. The language contains influences from Sinitic languages such as Chinese dialects, Malay, Tamil and so forth. A fundamental task to understanding Singlish is to first understand the pragmatic functions of its discourse particles, upon which Singlish relies heavily to convey meaning. This work offers a preliminary effort to disentangle the Singlish discourse particles (lah, meh and hor) with task-driven representation learning. After disentanglement, we cluster these discourse particles to differentiate their pragmatic functions, and perform Singlish-to-English machine translation. Our work provides a computational method to understanding Singlish discourse particles, and opens avenues towards a deeper comprehension of the language and its usage.
- Abstract(参考訳): シングリッシュ(英語: Singlish、正式にはコロキール・シンガポール英語)は、南東アジアのシンガポールを起源とするクレオール語である。
この言語は、中国語の方言、マレー語、タミル語などのシナ語の影響を受けている。
シングリッシュを理解するための基本的な課題は、まずその言説粒子の実用的機能を理解することである。
この研究は、Singlishの談話粒子(lah, meh, hor)をタスク駆動表現学習で解き放つための予備的な努力を提供する。
解離後、これらの談話粒子をクラスタリングし、実効性を識別し、Singlish-to- English 機械翻訳を行う。
我々の研究は、Singlishの談話粒子を理解するための計算方法を提供し、言語とその使用法をより深く理解するための道を開く。
関連論文リスト
- Limpeh ga li gong: Challenges in Singlish Annotations [1.3812010983144802]
本稿では,Singlish文のPOSタグ付けという,自然言語処理の基本タスクについて検討する。
そこで本研究では,ネイティブなSinglish話者による翻訳とPOSアノテーションを用いて,直接英訳とPOSタグを含む並列Singlishデータセットを構築した。
自動トランジションおよびトランスフォーマーベースのタグは、人名付きPOSラベルに対して評価すると、たったの$sim 80%の精度で実行される。
論文 参考訳(メタデータ) (2024-10-21T16:21:45Z) - Assessing the Role of Lexical Semantics in Cross-lingual Transfer through Controlled Manipulations [15.194196775504613]
我々は、英語と対象言語の違いが、英語の事前訓練された表現空間と言語を整合させる能力にどのように影響するかを分析する。
文字や単語の順序などの特性はアライメント品質に限られた影響しか与えないが、翻訳エントロピーの尺度を用いて定義する2言語間の語彙マッチングの程度は、それに大きな影響を及ぼすことを示す。
論文 参考訳(メタデータ) (2024-08-14T14:59:20Z) - Cross-Dialect Sentence Transformation: A Comparative Analysis of
Language Models for Adapting Sentences to British English [0.0]
本研究は、アメリカ、インド、アイルランドの英語方言の言語的区別について考察する。
様々な言語モデル(LLM)を評価し、これらの方言から英国英語の翻訳を生成する。
論文 参考訳(メタデータ) (2023-11-05T12:56:28Z) - Teacher Perception of Automatically Extracted Grammar Concepts for L2
Language Learning [66.79173000135717]
本研究は、カンナダ語とマラティ語という2つのインドの言語教育に適用する。
我々は、形態素構文(単語順、一致、ケースマーキング、または単語形成の学習)と意味論(語彙の学習)に関する疑問に答える自然なテキストコーパスから記述を抽出する。
我々は,北米の学校から言語教育者の助けを借りて手作業による評価を行い,教材が授業の準備や学習者評価に利用できる可能性を見出した。
論文 参考訳(メタデータ) (2023-10-27T18:17:29Z) - Multi-lingual and Multi-cultural Figurative Language Understanding [69.47641938200817]
図形言語は人間のコミュニケーションに浸透するが、NLPでは比較的過小評価されている。
Hindi, Indonesian, Javanese, Kannada, Sundanese, Swahili, Yorubaの7つの多様な言語に関するデータセットを作成しました。
我々のデータセットから,各言語は,同じ領域から派生した言語間で最も高い重なり合いを持つ,図形表現の文化的・地域的概念に依存していることが明らかとなった。
全ての言語は、事前学習データと微調整データの可用性を反映した性能の変化により、英語と比較して大きな欠陥がある。
論文 参考訳(メタデータ) (2023-05-25T15:30:31Z) - Improve Bilingual TTS Using Dynamic Language and Phonology Embedding [10.244215079409797]
本稿では,中国語の単言語話者からより標準の英語音声を取得するために,マンダリン・イングリッシュ・TSシステムを構築した。
言語と音韻の動的強度を捉えるための埋め込み強度変調器を特別に設計する。
論文 参考訳(メタデータ) (2022-12-07T03:46:18Z) - Teacher Perception of Automatically Extracted Grammar Concepts for L2
Language Learning [91.49622922938681]
本稿では,文法の異なる側面の記述を自動的に発見・可視化する自動フレームワークを提案する。
具体的には、形態素構文と意味論に関する疑問に答える自然なテキストコーパスから記述を抽出する。
この手法をインド語、カンナダ語、マラタイ語に応用するが、これは英語とは異なり、十分に発達した教育資源を持たない。
論文 参考訳(メタデータ) (2022-06-10T14:52:22Z) - Representing `how you say' with `what you say': English corpus of
focused speech and text reflecting corresponding implications [10.103202030679844]
音声通信では、何かが語られる方法(パラ言語情報)は、何を言うか(言語情報)と同じくらい重要である
現在の音声翻訳システムは、発話が言語的に同一であれば、同じ翻訳を返す。
本稿では,語彙・文法機器を用いて,言語領域にパラ言語情報をマッピングする手法を提案する。
論文 参考訳(メタデータ) (2022-03-29T12:29:22Z) - AUTOLEX: An Automatic Framework for Linguistic Exploration [93.89709486642666]
本稿では言語学者による言語現象の簡潔な記述の発見と抽出を容易にするための自動フレームワークを提案する。
具体的には、この枠組みを用いて、形態的一致、ケースマーキング、単語順序の3つの現象について記述を抽出する。
本研究では,言語専門家の助けを借りて記述を評価し,人間の評価が不可能な場合に自動評価を行う手法を提案する。
論文 参考訳(メタデータ) (2022-03-25T20:37:30Z) - Verb Knowledge Injection for Multilingual Event Processing [50.27826310460763]
動詞のセマンティック・シンタクティックな振る舞いに関する明示的な情報を注入することでLMプリトレーニングトランスフォーマーの性能が向上するかどうかを検討する。
まず,動詞知識の注入が英語イベント抽出のパフォーマンス向上につながることを示す。
次に、他の言語でのイベント抽出のための動詞アダプタの有用性を探ります。
論文 参考訳(メタデータ) (2020-12-31T03:24:34Z) - Pragmatic information in translation: a corpus-based study of tense and
mood in English and German [70.3497683558609]
文法的時制とムードは自然言語処理(NLP)研究において考慮すべき重要な言語現象である。
我々は翻訳における英語とドイツ語の時制とムードの対応について考察する。
特に重要なのは、ルールベース、フレーズベース統計およびニューラルマシン翻訳における時制とムードをモデル化することである。
論文 参考訳(メタデータ) (2020-07-10T08:15:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。