論文の概要: Analyzing Folktales of Different Regions Using Topic Modeling and
Clustering
- arxiv url: http://arxiv.org/abs/2206.04221v1
- Date: Thu, 9 Jun 2022 02:04:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-11 03:43:50.270512
- Title: Analyzing Folktales of Different Regions Using Topic Modeling and
Clustering
- Title(参考訳): トピックモデリングとクラスタリングによる異なる地域の民俗分析
- Authors: Jacob Werzinsky, Zhiyan Zhong, Xuedan Zou
- Abstract要約: 本稿では,トピックモデリングとクラスタリングという2つの主要な自然言語処理技術を用いて,民俗学のパターンを見つける。
民俗学の共通する傾向として,家族,食生活,伝統的なジェンダーの役割,神話的人物,動物などがあげられる。
我々の結果は、世界中の文化における特定の要素の出現を実証している。
- 参考スコア(独自算出の注目度): 2.2559617939136505
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper employs two major natural language processing techniques, topic
modeling and clustering, to find patterns in folktales and reveal cultural
relationships between regions. In particular, we used Latent Dirichlet
Allocation and BERTopic to extract the recurring elements as well as K-means
clustering to group folktales. Our paper tries to answer the question what are
the similarities and differences between folktales, and what do they say about
culture. Here we show that the common trends between folktales are family,
food, traditional gender roles, mythological figures, and animals. Also,
folktales topics differ based on geographical location with folktales found in
different regions having different animals and environment. We were not
surprised to find that religious figures and animals are some of the common
topics in all cultures. However, we were surprised that European and Asian
folktales were often paired together. Our results demonstrate the prevalence of
certain elements in cultures across the world. We anticipate our work to be a
resource to future research of folktales and an example of using natural
language processing to analyze documents in specific domains. Furthermore,
since we only analyzed the documents based on their topics, more work could be
done in analyzing the structure, sentiment, and the characters of these
folktales.
- Abstract(参考訳): 本稿では,トピックモデリングとクラスタリングという2つの主要な自然言語処理技術を用いて,民俗学のパターンを見つけ,地域間の文化的関係を明らかにする。
特に, 潜在ディリクレ割当とベルトピートを用いて再帰的要素とk平均クラスタリングを群民話に抽出した。
本論文は,民俗学の類似点と相違点,文化について何を言っているのか,という疑問に答えようとしている。
ここでは、民俗学の共通する傾向として、家族、食物、伝統的なジェンダーの役割、神話的人物、動物などがあげられる。
また、民俗学の話題は地理的な場所によって異なるが、動物や環境の異なる地域でも見られる。
宗教的な人物や動物が、すべての文化において共通のトピックであるということに驚きませんでした。
しかし、ヨーロッパとアジアの民話がしばしば合わさったことに驚きました。
我々の結果は、世界中の文化における特定の要素の出現を示している。
我々は,今後の民俗研究の資源として,自然言語処理を用いて特定の領域の文書を分析する事例として,我々の研究が期待する。
さらに,これらの資料は,その話題に基づいてのみ分析されるため,これらの伝承の構造,感情,性格を解析する上で,さらに多くの作業を行うことができた。
関連論文リスト
- Cross-Lingual and Cross-Cultural Variation in Image Descriptions [2.8664758928324883]
画像記述における言語間差異に関する大規模な実証的研究を行った。
私たちは、31の言語とさまざまな場所の画像を持つマルチモーダルデータセットを使用します。
我々の分析によると、地理的にあるいは遺伝的に近い言語のペアは、同じ実体に頻繁に言及する傾向がある。
論文 参考訳(メタデータ) (2024-09-25T05:57:09Z) - Are Fairy Tales Fair? Analyzing Gender Bias in Temporal Narrative Event
Chains of Children's Fairy Tales [46.65377334112404]
社会的バイアスやステレオタイプは、私たちの物語における彼らの存在を通じて、私たちの文化に埋め込まれています。
そこで本稿では,各キャラクタに対して,物語の時間的動詞に基づくイベントチェーンを自動的に抽出する計算パイプラインを提案する。
また、従来のステレオタイプと整合するカテゴリを含むことで、バイアス分析を容易にする動詞ベースのイベントアノテーションスキームを提案する。
論文 参考訳(メタデータ) (2023-05-26T05:29:37Z) - Comparing Biases and the Impact of Multilingual Training across Multiple
Languages [70.84047257764405]
ダウンストリーム感情分析タスクにおいて,イタリア語,中国語,英語,ヘブライ語,スペイン語のバイアス分析を行う。
我々は、既存の感情バイアスのテンプレートを、人種、宗教、国籍、性別の4つの属性で、イタリア語、中国語、ヘブライ語、スペイン語に適応させる。
以上の結果から,各言語の文化に支配的な集団の嗜好など,バイアス表現の類似性を明らかにした。
論文 参考訳(メタデータ) (2023-05-18T18:15:07Z) - A Moral- and Event- Centric Inspection of Gender Bias in Fairy Tales at
A Large Scale [50.92540580640479]
7つの文化から得られた624個の妖精物語を含む妖精物語データセットにおいて,ジェンダーバイアスを計算的に解析した。
その結果,男性キャラクターの数は女性キャラクターの2倍であり,男女表現が不均等であることが判明した。
女性キャラクターは、注意、忠誠、尊厳に関する道徳的な言葉とより関連しているのに対し、男性キャラクターは、公正、権威に関する道徳的な単語とより関連している。
論文 参考訳(メタデータ) (2022-11-25T19:38:09Z) - American cultural regions mapped through the lexical analysis of social
media [1.8199326045904993]
本研究は,マイクロブログ投稿からの大規模データセットの自動解析に基づいて,文化的地域を推定する手法を導入することで,この方向への重要な一歩を踏み出した。
特に、記述された言論の地域的変化は、アメリカのソーシャルメディアで測定される。
この低次元空間におけるデータの階層的クラスタリングを通じて、この手法は明確な文化的領域とそれらを定義する議論のトピックを生み出す。
論文 参考訳(メタデータ) (2022-08-16T10:18:47Z) - Computational Lens on Cognition: Study Of Autobiographical Versus
Imagined Stories With Large-Scale Language Models [95.88620740809004]
GPT-3を用いた自伝的物語と想像的物語における出来事の物語の流れの相違について検討した。
想像された物語は自伝的物語よりも逐次性が高いことがわかった。
想像された物語と比較すると、自伝的な物語は、最初の人物に関連するより具体的な言葉と単語を含んでいる。
論文 参考訳(メタデータ) (2022-01-07T20:10:47Z) - Broaden the Vision: Geo-Diverse Visual Commonsense Reasoning [49.04866469947569]
地理的・地理的・地理的な共通点を理解する視覚・言語モデルの能力をテストするために,Geo-Diverse Visual Commonsense Reasoning dataset(GD-VCR)を構築した。
その結果,東アジア,南アジア,アフリカを含む非西欧地域での両モデルの性能は,西欧地域に比べて著しく低いことがわかった。
論文 参考訳(メタデータ) (2021-09-14T17:52:55Z) - It's not Rocket Science : Interpreting Figurative Language in Narratives [48.84507467131819]
我々は2つの非構成的図形言語(イディオムとシミュラ)の解釈を研究する。
実験の結果、事前学習された言語モデルのみに基づくモデルは、これらのタスクにおいて人間よりもはるかにひどい性能を示すことがわかった。
また, 知識強化モデルを提案し, 具体的言語を解釈するための人的戦略を採用した。
論文 参考訳(メタデータ) (2021-08-31T21:46:35Z) - Legends: Folklore on Reddit [0.4924126492174801]
Redditで有名になった古き良き記事を集めたRedditの伝説を紹介します。
Redditの伝説は、実際に民間伝承とみなすことができ、それらが体系的なテキストベースのアプローチに修正可能であることを示す。
論文 参考訳(メタデータ) (2020-07-01T20:55:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。