Fugu-MT 論文翻訳(概要): A Systematic Study and Analysis of Bengali Folklore with Natural Language Processing Systems

論文の概要: A Systematic Study and Analysis of Bengali Folklore with Natural Language Processing Systems

arxiv url: http://arxiv.org/abs/2203.06607v1
Date: Sun, 13 Mar 2022 09:36:55 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-16 09:07:21.326620
Title: A Systematic Study and Analysis of Bengali Folklore with Natural Language Processing Systems
Title（参考訳）: 自然言語処理システムを用いたベンガル伝承の体系的研究と分析
Authors: Mustain Billah, Md. Mynoddin, Mostafijur Rahman Akhond, Md. Nasim Adnan, Syed Md. Galib, Rizwanur Rahad, M Nurujjaman Khan
Abstract要約: 本研究の目的は、より洗練された計算方法で、私たちの豊かな伝承をより誰でも理解できるようにすることである。提案するモデルはベンガルの民俗学に特化することであり、技術的にはベンガルの民俗学を研究・分析するためのベンガルの自然言語処理への第一歩となる。
参考スコア（独自算出の注目度）: 1.339230763466954
License: http://creativecommons.org/publicdomain/zero/1.0/
Abstract: Folklore, a solid branch of folk literature, is the hallmark of any nation or any society. Such as oral tradition; as proverbs or jokes, it also includes material culture as well as traditional folk beliefs, and various customs. Bengali folklore is as rich in-depth as it is amazing. Nevertheless, in the womb of time, it is determined to sustain its existence. Therefore, our aim in this study is to make our rich folklore more comprehensible to everyone in a more sophisticated computational way. Some studies concluded various aspects of the Bengali language with NLP. Our proposed model is to be specific for Bengali folklore. Technically, it will be the first step towards Bengali natural language processing for studying and analyzing the folklore of Bengal.
Abstract（参考訳）: フォークロア(Folklore)は、民族文学の一分野であり、あらゆる国や社会の目印である。口承の伝統など、証明やジョークとして、伝統的な民間信仰や様々な習慣の材料文化も含んでいる。ベンガルの民間伝承は驚くべきほど豊かである。それにもかかわらず、その存在を継続することが決定されている。そこで本研究の目的は,より高度な計算方法で,我々の豊かな伝承をより理解しやすいものにすることである。ベンガル語の様々な側面をNLPで締めくくった研究もある。提案モデルはベンガルの民俗伝承に特有なものである。技術的には、ベンガルの民俗学を研究し分析するためのベンガル自然言語処理への第一歩となる。

関連論文リスト

BengaliFig: A Low-Resource Challenge for Figurative and Culturally Grounded Reasoning in Bengali [0.0]
コンパクトでリッチな注釈付き挑戦集合であるBengaliFigを提示する。データセットには、ベンガルの口頭と文学の伝統から採られた435のユニークな謎が含まれている。各項目は、推論タイプ、トラップタイプ、文化的深さ、回答カテゴリ、難易度を5次元にアノテートする。
論文参考訳（メタデータ） (2025-11-25T15:26:47Z)
RegSpeech12: A Regional Corpus of Bengali Spontaneous Speech Across Dialects [5.805745873296805]
ベンガル語は、南アジアやディアスポラスのコミュニティで広く話されている。東ベンガル語、マンブミ語、ランプリ語、ヴァレンドリ語、ラーリ語の5つの主要な方言群が特定されている。ベンガル方言の計算処理に関する研究は依然として限られている。
論文参考訳（メタデータ） (2025-10-28T06:08:42Z)
BLUCK: A Benchmark Dataset for Bengali Linguistic Understanding and Cultural Knowledge [11.447710593895831]
BLUCKはベンガルの言語理解と文化知識における大規模言語モデル(LLM)の性能を測定するために設計された新しいデータセットである。私たちのデータセットは、2366の多重選択質問(MCQ)で構成されています。 GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama-3.3-70B-Instruct、DeepSeekV3を含む6つのプロプライエタリおよび3つのオープンソースLCMを用いてBLUCKをベンチマークした。
論文参考訳（メタデータ） (2025-05-27T12:19:12Z)
Indigenous Languages Spoken in Argentina: A Survey of NLP and Speech Resources [45.07333085270152]
アルゼンチンには、少なくとも40の異なる言語を含む、大きながほとんど知られていない先住民族の言語多様性がある。我々はアルゼンチンで話される先住民族の言語を体系化し、それらを7つの言語族に分類する。それぞれについて、最新のアルゼンチンの国勢調査に基づいて、全国の先住民の人口規模を推定する。
論文参考訳（メタデータ） (2025-01-17T03:47:19Z)
Exploring Bengali Religious Dialect Biases in Large Language Models with Evaluation Perspectives [5.648318448953635]
大規模言語モデル(LLM)はステレオタイプとバイアスを含む出力を生成することができる。我々はベンガル語における宗教的な視点から偏見を探求し、特にヒンドゥー語とムスリム・マジョリティの2つの主要な宗教方言に焦点を当てている。
論文参考訳（メタデータ） (2024-07-25T20:19:29Z)
Guylingo: The Republic of Guyana Creole Corpora [6.582021376649199]
クレオール語領域におけるNLP研究の進展を目的とした包括的コーパスについて述べる。我々はまず,この多言語コーパスの収集とデジタル化のための枠組みについて概説する。次に、クレオールにおける機械翻訳のためのNLPモデルの訓練と評価の課題を示す。
論文参考訳（メタデータ） (2024-05-06T20:30:14Z)
CultureBank: An Online Community-Driven Knowledge Base Towards Culturally Aware Language Technologies [53.2331634010413]
CultureBankは、ユーザの自己物語に基づいて構築された知識ベースである。 TikTokから12K、Redditから1Kの文化的記述が含まれている。今後の文化的に意識された言語技術に対する推奨事項を提示する。
論文参考訳（メタデータ） (2024-04-23T17:16:08Z)
CULTURE-GEN: Revealing Global Cultural Perception in Language Models through Natural Language Prompting [73.94059188347582]
110か国・地域での3つのSOTAモデルの文化認識を,文化条件付き世代を通して8つの文化関連トピックについて明らかにした。文化条件付き世代は、デフォルトの文化と区別される余分な文化を区別する言語的な「マーカー」から成り立っていることが判明した。
論文参考訳（メタデータ） (2024-04-16T00:50:43Z)
CreoleVal: Multilingual Multitask Benchmarks for Creoles [46.50887462355172]
CreoleValは8つの異なるNLPタスクにまたがるベンチマークデータセットの集合である。これは、理解、関係分類、クレオールの機械翻訳のための新しい開発データセットの集合である。
論文参考訳（メタデータ） (2023-10-30T14:24:20Z)
Multi-lingual and Multi-cultural Figurative Language Understanding [69.47641938200817]
図形言語は人間のコミュニケーションに浸透するが、NLPでは比較的過小評価されている。 Hindi, Indonesian, Javanese, Kannada, Sundanese, Swahili, Yorubaの7つの多様な言語に関するデータセットを作成しました。我々のデータセットから,各言語は,同じ領域から派生した言語間で最も高い重なり合いを持つ,図形表現の文化的・地域的概念に依存していることが明らかとなった。全ての言語は、事前学習データと微調整データの可用性を反映した性能の変化により、英語と比較して大きな欠陥がある。
論文参考訳（メタデータ） (2023-05-25T15:30:31Z)
Analyzing Folktales of Different Regions Using Topic Modeling and Clustering [2.2559617939136505]
本稿では,トピックモデリングとクラスタリングという2つの主要な自然言語処理技術を用いて,民俗学のパターンを見つける。民俗学の共通する傾向として,家族,食生活,伝統的なジェンダーの役割,神話的人物,動物などがあげられる。我々の結果は、世界中の文化における特定の要素の出現を実証している。
論文参考訳（メタデータ） (2022-06-09T02:04:18Z)
How can NLP Help Revitalize Endangered Languages? A Case Study and Roadmap for the Cherokee Language [91.79339725967073]
世界で話されている言語の43%以上が危険にさらされている。本研究では,NLPが絶滅危惧言語の再活性化にどう役立つかについて議論する。私たちは、深刻な絶滅危惧言語であるチェロキーをケーススタディとして捉えています。
論文参考訳（メタデータ） (2022-04-25T18:25:57Z)
Harnessing Cross-lingual Features to Improve Cognate Detection for Low-resource Languages [50.82410844837726]
言語間単語埋め込みを用いた14言語間のコニャートの検出を実証する。インドの12言語からなる挑戦的データセットを用いて,コニャート検出手法の評価を行った。我々は,コグネート検出のためのFスコアで最大18%の改善点を観察した。
論文参考訳（メタデータ） (2021-12-16T11:17:58Z)
Anubhuti -- An annotated dataset for emotional analysis of Bengali short stories [2.3424047967193826]
アヌブティはベンガルの短編小説の著者が表現した感情を分析するための最初の、そして最大のテキストコーパスである。本稿では,データ収集手法,手作業によるアノテーション処理,そして結果として生じるハイアノテータ間の合意について説明する。我々は、ベースライン機械学習と感情分類のためのディープラーニングモデルを用いて、データセットの性能を検証した。
論文参考訳（メタデータ） (2020-10-06T22:33:58Z)
Generating Major Types of Chinese Classical Poetry in a Uniformed Framework [88.57587722069239]
GPT-2に基づく漢詩の主要なタイプを生成するフレームワークを提案する。予備的な結果は、この強化されたモデルが、形も内容も質の高い大型漢詩を生成できることを示している。
論文参考訳（メタデータ） (2020-03-13T14:16:25Z)
A Continuous Space Neural Language Model for Bengali Language [0.4799822253865053]
本稿では, 連続空間ニューラル言語モデル, より具体的にはASGD重量減少型LSTM言語モデル, およびベンガル語で効率的に学習する手法を提案する。提案したアーキテクチャは、ベンガルの保持されたデータセットにおいて、推論の難易度を51.2まで低くすることで、それよりも優れている。
論文参考訳（メタデータ） (2020-01-11T14:50:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。