Fugu-MT 論文翻訳(概要): Generative AI and Large Language Models in Language Preservation: Opportunities and Challenges

論文の概要: Generative AI and Large Language Models in Language Preservation: Opportunities and Challenges

arxiv url: http://arxiv.org/abs/2501.11496v1
Date: Mon, 20 Jan 2025 14:03:40 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-22 19:37:19.422086
Title: Generative AI and Large Language Models in Language Preservation: Opportunities and Challenges
Title（参考訳）: 言語保存におけるジェネレーティブAIと大規模言語モデル - 機会と課題
Authors: Vincent Koc,
Abstract要約: ジェネレーティブAIと大規模言語モデル(LLM)は、言語保存の強力なツールとして登場した。本稿では,絶滅危惧言語保存におけるジェネレーティブAIとLLMの役割について検討し,その使用に伴うリスクと課題を明らかにする。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Generative AI and large-scale language models (LLM) have emerged as powerful tools in language preservation, particularly for near-native and endangered languages. With the increasing reliance on technology for communication, education, and cultural documentation, new opportunities have emerged to mitigate the dramatic decline of linguistic diversity worldwide. This paper examines the role of generative AIs and LLMs in preserving endangered languages, highlighting the risks and challenges associated with their use. We analyze the underlying technologies driving these models, including natural language processing (NLP) and deep learning, and explore several cases where these technologies have been applied to low-resource languages. Additionally, we discuss ethical considerations, data scarcity issues, and technical challenges while proposing solutions to enhance AI-driven language preservation.
Abstract（参考訳）: ジェネレーティブAIと大規模言語モデル(LLM)は、言語保存における強力なツールとして、特に近ネイティブ言語や絶滅危惧言語のために登場した。コミュニケーション、教育、文化文書への技術への依存が高まるにつれ、世界中の言語多様性の劇的な低下を緩和する新たな機会が生まれてきた。本稿では,絶滅危惧言語保存におけるジェネレーティブAIとLLMの役割について検討し,その使用に伴うリスクと課題を明らかにする。我々は、自然言語処理(NLP)やディープラーニングなど、これらのモデルを駆動する基盤技術を分析し、これらの技術が低リソース言語に適用された事例をいくつか探求する。さらに、AIによる言語保存を強化するソリューションを提案しながら、倫理的考察、データ不足問題、技術的課題についても論じる。

関連論文リスト

IOLBENCH: Benchmarking LLMs on Linguistic Reasoning [8.20398036986024]
IOL(International Linguistics Olympiad)問題に基づく新しいベンチマークであるIOLBENCHを紹介する。このデータセットは、文法、形態学、音韻学、意味論をテストする様々な問題を含んでいる。最も先進的なモデルでさえ、言語的な複雑さの複雑さを扱うのに苦労している。
論文参考訳（メタデータ） (2025-01-08T03:15:10Z)
Opportunities and Challenges of Large Language Models for Low-Resource Languages in Humanities Research [23.773194690783512]
低リソース言語は、文化進化と知的多様性を具現化した、人類の歴史の貴重なリポジトリとして機能する。その重要性にもかかわらず、これらの言語はデータ不足や技術的な制限など、重要な課題に直面している。大規模言語モデル(LLM)の最近の進歩は、これらの課題に対処するための変革的な機会を提供する。
論文参考訳（メタデータ） (2024-11-30T00:10:56Z)
LIMBA: An Open-Source Framework for the Preservation and Valorization of Low-Resource Languages using Generative Models [62.47865866398233]
この白書は低リソース言語のための言語ツールを生成するためのフレームワークを提案する。このような言語に対するインテリジェントな応用を妨げるデータ不足に対処することにより、言語多様性の促進に寄与する。
論文参考訳（メタデータ） (2024-11-20T16:59:41Z)
Lens: Rethinking Multilingual Enhancement for Large Language Models [70.85065197789639]
Lensは、大規模言語モデル(LLM)の多言語機能を強化する新しいアプローチである LLMの上位層から言語に依存しない、言語固有のサブ空間内の隠された表現を操作できる。既存のポストトレーニング手法に比べて計算資源がはるかに少ないため、優れた結果が得られる。
論文参考訳（メタデータ） (2024-10-06T08:51:30Z)
Harnessing the Power of Artificial Intelligence to Vitalize Endangered Indigenous Languages: Technologies and Experiences [31.62071644137294]
我々は、世界の言語の多様性の低下と、AIとNLPに固有の倫理的課題をもたらすインディジェネラル言語について論じる。 Indigenous Language のための高品質な機械学習トランスレータの開発に励む成果を報告する。私たちは2023年と2024年にブラジルの先住民コミュニティで実施したプロジェクトで構築したプロトタイプを紹介します。
論文参考訳（メタデータ） (2024-07-17T14:46:37Z)
A Survey on Large Language Models with Multilingualism: Recent Advances and New Frontiers [51.8203871494146]
LLM(Large Language Models)の急速な開発は、自然言語処理における顕著な多言語機能を示している。 LLMのブレークスルーにもかかわらず、多言語シナリオの研究は依然として不十分である。本調査は,多言語問題に対する研究コミュニティの取り組みを支援することを目的としており,LLMに基づく多言語自然言語処理における中核概念,鍵技術,最新の発展の包括的理解を提供する。
論文参考訳（メタデータ） (2024-05-17T17:47:39Z)
From Bytes to Borsch: Fine-Tuning Gemma and Mistral for the Ukrainian Language Representation [0.0]
生成型大規模言語モデル(LLM)は、テキスト理解と生成において非並列的な能力を示すイノベーションの最前線にある。しかし、ウクライナ語のような低リソース言語の限られた表現は、この技術のリーチと関連性を制限し、顕著な課題となっている。本稿は, オープンソースのGemmaとMistral LLMをウクライナのデータセットで微調整し, 言語能力の向上を目指す。
論文参考訳（メタデータ） (2024-04-14T04:25:41Z)
Factuality Challenges in the Era of Large Language Models [113.3282633305118]
大規模言語モデル(LLM)は、誤った、誤った、あるいは誤解を招くコンテンツを生成する。 LLMは悪意のあるアプリケーションに利用することができる。これは、ユーザーを欺く可能性があるという点で、社会に重大な課題をもたらす。
論文参考訳（メタデータ） (2023-10-08T14:55:02Z)
A Survey of Large Language Models [81.06947636926638]
言語モデリングは、過去20年間、言語理解と生成のために広く研究されてきた。近年,大規模コーパス上でのトランスフォーマーモデルの事前学習により,事前学習言語モデル (PLM) が提案されている。パラメータスケールの違いを識別するために、研究コミュニティは大規模言語モデル (LLM) という用語を提唱した。
論文参考訳（メタデータ） (2023-03-31T17:28:46Z)
Systematic Inequalities in Language Technology Performance across the World's Languages [94.65681336393425]
本稿では,言語技術のグローバルな有用性を評価するためのフレームワークを紹介する。本分析では, ユーザ対応技術と言語的NLPタスクの両面において, より深く研究されている。
論文参考訳（メタデータ） (2021-10-13T14:03:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。