論文の概要: AlbanianLLMSafety: A Safety Evaluation Dataset for Large Language Models in Albanian
- arxiv url: http://arxiv.org/abs/2605.26954v1
- Date: Tue, 26 May 2026 12:43:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.094965
- Title: AlbanianLLMSafety: A Safety Evaluation Dataset for Large Language Models in Albanian
- Title(参考訳): AlbanianLLMSafety: アルバニアにおける大規模言語モデルの安全性評価データセット
- Authors: Wajdi Zaghouani, Kholoud K. Aldous, Isra Fejzullaj,
- Abstract要約: 本稿では,アルバニア語におけるLarge Language Models (LLMs) の安全性評価データセットであるAlbanianLLMSafetyを紹介する。
データセットには、セルフハーム、暴力、人種差別的内容、児童虐待、過激化を含む、11の安全カテゴリにまたがる2,951のプロンプトが含まれている。
このデータセットは、アルバニア語を話すコミュニティの安全評価、微調整、チーム編成、ガードレール開発をサポートするよう要求された時に提供される。
- 参考スコア(独自算出の注目度): 0.5824996804401527
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Safety evaluation of Large Language Models (LLMs) has largely focused on high-resource languages, leaving low-resource languages critically underserved. We present AlbanianLLMSafety, the first publicly available safety evaluation dataset for LLMs in Albanian, a linguistically distinct low-resource language with approximately 7.5 million speakers across Albania, Kosovo, North Macedonia, and the diaspora. The dataset contains 2,951 prompts spanning 11 safety categories, including self-harm, violence, racist content, child exploitation, and radicalization, with an average of 268 prompts per category. Each prompt is provided in Albanian with an English reference translation and a detailed category label. This resource addresses a significant gap in safety evaluation infrastruc-ture for low-resource languages and provides an essential benchmark for developing safer, more inclusive LLMs. The dataset will be provided upon request to support safety evaluation, fine-tuning, red-teaming, and guardrail development for Albanian-speaking communities.
- Abstract(参考訳): LLM(Large Language Models)の安全性評価は、低リソース言語を重要視し、高リソース言語に重点を置いている。
アルバニア語、コソボ、北マケドニア、ディアスポラで約750万人の話者を抱える言語的に異なる低リソース言語である。
データセットには、セルフハーム、暴力、人種差別的コンテンツ、児童虐待、過激化を含む11の安全カテゴリーにまたがる2,951のプロンプトが含まれており、平均268のプロンプトがある。
各プロンプトはアルバニア語で英語の参照翻訳と詳細なカテゴリラベルが提供されている。
このリソースは、低リソース言語に対する安全性評価のインフラ構築の重大なギャップに対処し、より安全で包括的なLLMを開発するための重要なベンチマークを提供する。
このデータセットは、アルバニア語を話すコミュニティの安全評価、微調整、チーム編成、ガードレール開発をサポートするよう要求された時に提供される。
関連論文リスト
- LASA: Language-Agnostic Semantic Alignment at the Semantic Bottleneck for LLM Safety [88.98698230989186]
大規模言語モデル(LLM)は、しばしば高リソース言語で強力な安全性性能を示すが、低リソース言語では深刻な脆弱性を示す。
このギャップは、言語に依存しない意味理解能力と、高リソース言語に偏った言語に支配的な安全アライメントのミスマッチによるものと考えられる。
セマンティック・アライメント(LASA)を提案し,セマンティック・ボトルネックに直接安全アライメントを固定する。
論文 参考訳(メタデータ) (2026-04-13T15:59:50Z) - LinguaSafe: A Comprehensive Multilingual Safety Benchmark for Large Language Models [22.273388934888278]
私たちのデータセットは、ハンガリー語からマレー語まで、12言語で45万のエントリで構成されています。
我々のベンチマークは、詳細な安全性評価のための総合的なメトリクススイートを提供する。
論文 参考訳(メタデータ) (2025-08-18T08:59:01Z) - RabakBench: Scaling Human Annotations to Construct Localized Multilingual Safety Benchmarks for Low-Resource Languages [3.7678366606419345]
RabakBenchはシンガポール独自の言語コンテキストにローカライズされた新しい多言語安全ベンチマークである。
人間の検証された翻訳や評価コードを含むベンチマークデータセットが公開されている。
論文 参考訳(メタデータ) (2025-07-08T13:37:25Z) - PolyGuard: A Multilingual Safety Moderation Tool for 17 Languages [27.318299273902984]
PolyGUARDは、LLM(Large Language Models)世代を保護するための、最先端の多言語安全モデルである。
これまでに17言語にまたがる190万のサンプルを含む、最大規模の多言語安全訓練コーパスで訓練されている。
PolyGUARDPROMPTSは、安全ガードレールの評価のための29Kサンプルを用いた高品質な多言語ベンチマークである。
論文 参考訳(メタデータ) (2025-04-06T06:09:21Z) - LLMs Lost in Translation: M-ALERT uncovers Cross-Linguistic Safety Inconsistencies [63.10843814055688]
M-ALERTは5つの言語における大規模言語モデルの安全性を評価するベンチマークである。
M-ALERTには言語毎に15kの高品質なプロンプトが含まれており、合計で75k、カテゴリワイドアノテーションがある。
39種類のLLMに関する実験は,言語固有の安全性解析の重要性を強調した。
論文 参考訳(メタデータ) (2024-12-19T16:46:54Z) - All Languages Matter: On the Multilingual Safety of Large Language Models [96.47607891042523]
我々は、大規模言語モデル(LLM)のための最初の多言語安全ベンチマークを構築した。
XSafetyは、複数の言語ファミリーにまたがる10言語にわたる14種類の一般的な安全問題をカバーしている。
本稿では,ChatGPTの多言語安全性向上のための簡易かつ効果的なプロンプト手法を提案する。
論文 参考訳(メタデータ) (2023-10-02T05:23:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。