論文の概要: Automatic Dialect Adaptation in Finnish and its Effect on Perceived
Creativity
- arxiv url: http://arxiv.org/abs/2009.02685v1
- Date: Sun, 6 Sep 2020 09:28:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 08:22:01.383857
- Title: Automatic Dialect Adaptation in Finnish and its Effect on Perceived
Creativity
- Title(参考訳): フィンランドにおける自動方言適応と知覚的創造性への影響
- Authors: Mika H\"am\"al\"ainen, Niko Partanen, Khalid Alnajjar, Jack Rueter and
Thierry Poibeau
- Abstract要約: 我々は、方言適応がコンピュータ生成詩の創造性に対する影響について研究する。
方言が標準フィンランド語から逸脱するほど、人々は既存の評価基準を提示する傾向にある。
- 参考スコア(独自算出の注目度): 2.231167375820083
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present a novel approach for adapting text written in standard Finnish to
different dialects. We experiment with character level NMT models both by using
a multi-dialectal and transfer learning approaches. The models are tested with
over 20 different dialects. The results seem to favor transfer learning,
although not strongly over the multi-dialectal approach. We study the influence
dialectal adaptation has on perceived creativity of computer generated poetry.
Our results suggest that the more the dialect deviates from the standard
Finnish, the lower scores people tend to give on an existing evaluation metric.
However, on a word association test, people associate creativity and
originality more with dialect and fluency more with standard Finnish.
- Abstract(参考訳): 標準フィンランド語で書かれたテキストを異なる方言に適応させる新しいアプローチを提案する。
文字レベルのNMTモデルについて,マルチディレクタとトランスファーの学習手法を用いて実験を行った。
モデルは20以上の異なる方言でテストされる。
結果は転校学習を好んでいるように思われるが,マルチダイアレクタアプローチには強く影響しない。
言語適応がコンピュータ生成詩の創造性に与える影響について検討した。
以上の結果から,方言が標準フィンランド語から逸脱するほど,既存の評価基準よりも低いスコアが与えられる傾向が示唆された。
しかし、単語アソシエーションテストでは、クリエイティビティとオリジニティをより方言と、標準フィンランド語よりもフルエンシーと結びつける。
関連論文リスト
- Dialetto, ma Quanto Dialetto? Transcribing and Evaluating Dialects on a Continuum [25.732397636695882]
イタリア語方言における音声とテキストのパフォーマンスを測定し,地理的な特徴の相違を実証的に観察する。
この格差は(-0.5)言語的に最もパフォーマンスの高い方言とほぼ類似している。
さらに, 地学的手法を用いて, 見えない場所でのゼロショット性能を予測し, 地理的情報の導入により予測性能を大幅に向上する。
論文 参考訳(メタデータ) (2024-10-18T16:39:42Z) - On the Proper Treatment of Tokenization in Psycholinguistics [53.960910019072436]
論文は、トークンレベルの言語モデルは、精神言語学研究で使用される前に、文字レベルの言語モデルにマージ化されるべきであると主張している。
興味領域自体のサブプライムよりも心理学的予測が優れている様々な焦点領域を見いだす。
論文 参考訳(メタデータ) (2024-10-03T17:18:03Z) - Voices Unheard: NLP Resources and Models for Yorùbá Regional Dialects [72.18753241750964]
Yorub'aは、約4700万人の話者を持つアフリカの言語である。
アフリカ語のためのNLP技術開発への最近の取り組みは、彼らの標準方言に焦点を当てている。
我々は、このギャップを埋めるために、新しい高品質のパラレルテキストと音声コーパスを導入する。
論文 参考訳(メタデータ) (2024-06-27T22:38:04Z) - Disentangling Dialect from Social Bias via Multitask Learning to Improve Fairness [16.746758715820324]
本稿では,構文的および語彙的バリエーションを組み込む補助課題として,方言をモデル化するマルチタスク学習手法を提案する。
アフリカ系アメリカ人の英語方言を用いた実験では、共通学習アプローチと方言モデリングを補完することで、その公正さが向上することを示す実証的証拠を提供する。
その結果、マルチタスク学習は最先端の性能を達成し、偏りのある言語の性質をより確実に検出するのに役立つことが示唆された。
論文 参考訳(メタデータ) (2024-06-14T12:39:39Z) - Modeling Orthographic Variation in Occitan's Dialects [3.038642416291856]
大規模多言語モデルは、前処理時のスペル正規化の必要性を最小限に抑える。
以上の結果から,複数言語モデルでは,前処理時のスペル正規化の必要性が最小限に抑えられていることが示唆された。
論文 参考訳(メタデータ) (2024-04-30T07:33:51Z) - What Do Dialect Speakers Want? A Survey of Attitudes Towards Language Technology for German Dialects [60.8361859783634]
我々はドイツ語に関連する方言と地域言語に関する話者を調査した。
回答者は特に、方言入力で動作する潜在的なNLPツールを好んでいる。
論文 参考訳(メタデータ) (2024-02-19T09:15:28Z) - Multi-VALUE: A Framework for Cross-Dialectal English NLP [49.55176102659081]
マルチディレクト (Multi-Dilect) は、50の英語方言にまたがる制御可能なルールベースの翻訳システムである。
ストレステストは、非標準方言の先行モデルに対する顕著な性能格差を示す。
私たちはチカノやインド英語のネイティブスピーカーと提携して、人気のあるCoQAタスクの新しいゴールドスタンダード版をリリースしています。
論文 参考訳(メタデータ) (2022-12-15T18:17:01Z) - Dialect-robust Evaluation of Generated Text [40.85375247260744]
NLG評価指標の目標として,方言の頑健性と方言認識を定式化する。
このスイートを現在の最先端のメトリクスに適用すると、それらが方言ロバストではないことが示される。
論文 参考訳(メタデータ) (2022-11-02T07:12:23Z) - VALUE: Understanding Dialect Disparity in NLU [50.35526025326337]
アフリカ・アメリカン・バーナクラ・イングリッシュ(AAVE)の11つの特徴に関するルールを構築した。
言語的アクセプタビリティ判断により,各特徴変換の検証を行うために,流線型AAVE話者を募集する。
実験により、これらの新しい方言の特徴がモデル性能の低下につながることが示された。
論文 参考訳(メタデータ) (2022-04-06T18:30:56Z) - Leveraging Adversarial Training in Self-Learning for Cross-Lingual Text
Classification [52.69730591919885]
本稿では,ラベル保存型入力摂動の最大損失を最小限に抑える半教師付き対向学習法を提案する。
多様な言語群に対する文書分類と意図分類において,有効性が著しく向上するのを観察する。
論文 参考訳(メタデータ) (2020-07-29T19:38:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。