論文の概要: Challenges and Strategies in Cross-Cultural NLP
- arxiv url: http://arxiv.org/abs/2203.10020v1
- Date: Fri, 18 Mar 2022 15:36:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-21 14:23:10.236991
- Title: Challenges and Strategies in Cross-Cultural NLP
- Title(参考訳): クロスカルチャーNLPの課題と戦略
- Authors: Daniel Hershcovich and Stella Frank and Heather Lent and Miryam de
Lhoneux and Mostafa Abdou and Stephanie Brandl and Emanuele Bugliarello and
Laura Cabello Piqueras and Ilias Chalkidis and Ruixiang Cui and Constanza
Fierro and Katerina Margatina and Phillip Rust and Anders S{\o}gaard
- Abstract要約: 異文化と多文化のNLPは、NLPシステムの利用者により良いサービスを提供するために相違点を考慮する。
我々はこれらの取り組みを枠組み化するための原則的枠組みを提案し、既存の戦略と潜在的戦略を調査する。
- 参考スコア(独自算出の注目度): 22.574770327988066
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Various efforts in the Natural Language Processing (NLP) community have been
made to accommodate linguistic diversity and serve speakers of many different
languages. However, it is important to acknowledge that speakers and the
content they produce and require, vary not just by language, but also by
culture. Although language and culture are tightly linked, there are important
differences. Analogous to cross-lingual and multilingual NLP, cross-cultural
and multicultural NLP considers these differences in order to better serve
users of NLP systems. We propose a principled framework to frame these efforts,
and survey existing and potential strategies.
- Abstract(参考訳): 自然言語処理(NLP)コミュニティにおける様々な取り組みは、言語多様性に対応し、多くの異なる言語の話者にサービスを提供している。
しかし、話者とそれらが生成し、必要とするコンテンツが言語だけでなく、文化によっても異なることを認めることが重要である。
言語と文化は密接に結びついているが、重要な違いがある。
言語横断NLPや多言語NLPとは対照的に、異文化と多文化のNLPは、NLPシステムの利用者により良いサービスを提供するためにこれらの違いを考察している。
我々は,これらの取り組みを体系化し,既存および潜在的戦略を調査するための原則的枠組みを提案する。
関連論文リスト
- LLM for Everyone: Representing the Underrepresented in Large Language Models [21.07409393578553]
この論文は、表現不足言語に焦点をあてて、NLPの研究と開発におけるギャップを埋めることを目的としている。
大規模言語モデル(LLM)の包括的評価を行い,それらの能力を評価する。
提案手法は、言語間連続的命令チューニング、検索に基づく言語間インコンテキスト学習、コンテキスト内クエリアライメントを網羅する。
論文 参考訳(メタデータ) (2024-09-20T20:53:22Z) - Multilingual Evaluation of Semantic Textual Relatedness [0.0]
意味的テクスト関係性(STR)は、言語的要素や話題、感情、視点といった非言語的要素を考慮して、表面的な単語重複を越えている。
以前のNLP研究は主に英語に焦点を合わせており、言語間の適用性を制限している。
Marathi、Hindi、スペイン語、英語でSTRを探索し、情報検索や機械翻訳などの可能性を解き放つ。
論文 参考訳(メタデータ) (2024-04-13T17:16:03Z) - A Taxonomy of Ambiguity Types for NLP [53.10379645698917]
NLP分析を容易にするために,英語で見られるあいまいさの分類法を提案する。
私たちの分類学は、言語あいまいさデータにおいて意味のある分割を実現するのに役立ち、データセットとモデルパフォーマンスのよりきめ細かい評価を可能にします。
論文 参考訳(メタデータ) (2024-03-21T01:47:22Z) - Is Translation All You Need? A Study on Solving Multilingual Tasks with Large Language Models [79.46179534911019]
大規模言語モデル (LLM) は多言語機能を示しているが、トレーニングコーパスの不均衡のため、主に英語中心である。
この作業は、NLPタスクから実際のユーザクエリまで、評価を拡張します。
深い言語理解を必要とする文化関連のタスクでは、ネイティブ言語のプロンプトがより有望になる傾向があります。
論文 参考訳(メタデータ) (2024-03-15T12:47:39Z) - What Do Dialect Speakers Want? A Survey of Attitudes Towards Language Technology for German Dialects [60.8361859783634]
我々はドイツ語に関連する方言と地域言語に関する話者を調査した。
回答者は特に、方言入力で動作する潜在的なNLPツールを好んでいる。
論文 参考訳(メタデータ) (2024-02-19T09:15:28Z) - Multi-lingual and Multi-cultural Figurative Language Understanding [69.47641938200817]
図形言語は人間のコミュニケーションに浸透するが、NLPでは比較的過小評価されている。
Hindi, Indonesian, Javanese, Kannada, Sundanese, Swahili, Yorubaの7つの多様な言語に関するデータセットを作成しました。
我々のデータセットから,各言語は,同じ領域から派生した言語間で最も高い重なり合いを持つ,図形表現の文化的・地域的概念に依存していることが明らかとなった。
全ての言語は、事前学習データと微調整データの可用性を反映した性能の変化により、英語と比較して大きな欠陥がある。
論文 参考訳(メタデータ) (2023-05-25T15:30:31Z) - Some Languages are More Equal than Others: Probing Deeper into the
Linguistic Disparity in the NLP World [2.0777058026628583]
NLP世界の言語格差は近年広く認識されている問題である。
本稿では,世界の言語に存在する格差を包括的に分析する。
論文 参考訳(メタデータ) (2022-10-16T12:50:30Z) - All You Need In Sign Language Production [50.3955314892191]
言語認識と生産のサインは、いくつかの重要な課題に対処する必要があります。
本稿では,難聴文化,難聴センター,手話の心理的視点について紹介する。
また、SLPのバックボーンアーキテクチャや手法を簡潔に紹介し、SLPの分類について提案する。
論文 参考訳(メタデータ) (2022-01-05T13:45:09Z) - Discovering Representation Sprachbund For Multilingual Pre-Training [139.05668687865688]
多言語事前学習モデルから言語表現を生成し、言語分析を行う。
すべての対象言語を複数のグループにクラスタリングし、表現のスプラックバンドとして各グループに名前を付ける。
言語間ベンチマークで実験を行い、強いベースラインと比較して大幅な改善が達成された。
論文 参考訳(メタデータ) (2021-09-01T09:32:06Z) - The State and Fate of Linguistic Diversity and Inclusion in the NLP
World [12.936270946393483]
言語技術は、世界中の多言語主義と言語多様性の促進に寄与している。
世界中で7000を超える言語のごく少数のみが、急速に進化する言語技術やアプリケーションで表現されている。
論文 参考訳(メタデータ) (2020-04-20T07:19:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。