論文の概要: Mapping Hymns and Organizing Concepts in the Rigveda: Quantitatively Connecting the Vedic Suktas
- arxiv url: http://arxiv.org/abs/2503.18226v1
- Date: Sun, 23 Mar 2025 22:01:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-25 14:31:22.007003
- Title: Mapping Hymns and Organizing Concepts in the Rigveda: Quantitatively Connecting the Vedic Suktas
- Title(参考訳): リグヴェダにおけるヒュムのマッピングと組織概念--ベディド・サクタを定量的に結合する
- Authors: Venkatesh Bollineni, Igor Crk, Eren Gultepe,
- Abstract要約: NLP手法を用いて,Rigveda内の賛美歌の話題と意味的関連を同定した。
リグヴェーダの現代英語訳からの1028のサクタ(賛美歌)が前処理され、サクタレベルの埋め込みが得られた。
Suktaネットワークにおけるトピックのコミュニティ検出は,Louvain,Leiden,およびラベル伝搬法を用いて行った。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Accessing and gaining insight into the Rigveda poses a non-trivial challenge due to its extremely ancient Sanskrit language, poetic structure, and large volume of text. By using NLP techniques, this study identified topics and semantic connections of hymns within the Rigveda that were corroborated by seven well-known groupings of hymns. The 1,028 suktas (hymns) from the modern English translation of the Rigveda by Jamison and Brereton were preprocessed and sukta-level embeddings were obtained using, i) a novel adaptation of LSA, presented herein, ii) SBERT, and iii) Doc2Vec embeddings. Following an UMAP dimension reduction of the vectors, the network of suktas was formed using k-nearest neighbours. Then, community detection of topics in the sukta networks was performed with the Louvain, Leiden, and label propagation methods, whose statistical significance of the formed topics were determined using an appropriate null distribution. Only the novel adaptation of LSA using the Leiden method, had detected sukta topic networks that were significant (z = 2.726, p < .01) with a modularity score of 0.944. Of the seven famous sukta groupings analyzed (e.g., creation, funeral, water, etc.) the LSA derived network was successful in all seven cases, while Doc2Vec was not significant and failed to detect the relevant suktas. SBERT detected four of the famous suktas as separate groups, but mistakenly combined three of them into a single mixed group. Also, the SBERT network was not statistically significant.
- Abstract(参考訳): リグヴェダ語へのアクセスと理解の獲得は、非常に古いサンスクリット語、詩的構造、大量のテキストが原因で、難題となっている。
NLP手法を用いて,7つのよく知られた賛美歌グループによって裏付けられたRigveda内の賛美歌の話題と意味的関係を同定した。
ジャミソンとブレアトンによる現代英語訳『リグヴェーダ』の1028のサクタ(賛歌)が前処理され、サクタレベルの埋め込みが得られた。
i) ここで提示されるLAAの新規な適応
ii)SBERT,及び
三 Doc2Vec埋め込み
ベクトルのUMAP次元の減少の後、k-アネレスト近傍でスクタスのネットワークが形成された。
次に,サクタネットワークにおけるトピックのコミュニティ検出をルーヴァン,ライデン,ラベル伝搬法を用いて行った。
ライデン法を用いた新しい LSA の適応のみが重要な (z = 2.726, p < .01) スクタのトピックネットワークを検出し、モジュラリティスコアは0.944である。
7つの有名なサクタ群集(例, 創成, 葬式, 水等)のうち, LSA由来のネットワークは7例すべて成功し, Doc2Vecは重要ではなく, 関連するサクタを検出できなかった。
SBERTは有名な4つのサクタを別個のグループとして検出したが、誤って3つのサクタを1つの混合グループに組み合わせた。
また、SBERTネットワークは統計的に重要ではなかった。
関連論文リスト
- Detecting Redundant Health Survey Questions Using Language-agnostic BERT Sentence Embedding (LaBSE) [0.27979733090439307]
我々はNIH CDEリポジトリ, PROMIS, 韓国の公衆衛生機関, 学術出版物から, 英語と韓国語の両方で書かれた様々な健康調査質問をまとめた。
1758の質問ペアからなるセマンティックテキスト類似性データセットを生成するためにランダム化された質問ペア方式が用いられた。
各質問のペア間の類似度スコアは2人の人間専門家によって割り当てられた。
論文 参考訳(メタデータ) (2024-12-05T02:18:35Z) - SMILE-UHURA Challenge -- Small Vessel Segmentation at Mesoscopic Scale from Ultra-High Resolution 7T Magnetic Resonance Angiograms [60.35639972035727]
公開されている注釈付きデータセットの欠如は、堅牢で機械学習駆動のセグメンテーションアルゴリズムの開発を妨げている。
SMILE-UHURAチャレンジは、7T MRIで取得したTime-of-Flightアンジオグラフィーの注釈付きデータセットを提供することで、公開されている注釈付きデータセットのギャップに対処する。
Diceスコアは、それぞれのデータセットで0.838 $pm$0.066と0.716 $pm$ 0.125まで到達し、平均パフォーマンスは0.804 $pm$ 0.15までになった。
論文 参考訳(メタデータ) (2024-11-14T17:06:00Z) - Unifying Token and Span Level Supervisions for Few-Shot Sequence
Labeling [18.24907067631541]
短いショットシーケンスラベリングは、少数のラベル付きサンプルに基づいて新しいクラスを特定することを目的としている。
本稿では,数ショットのシーケンスラベリングのためのCDAP(Consistent Dual Adaptive Prototypeal)ネットワークを提案する。
本モデルでは,3つのベンチマークデータセットに対して,最先端の新たな結果が得られる。
論文 参考訳(メタデータ) (2023-07-16T04:50:52Z) - Ambiguity-Resistant Semi-Supervised Learning for Dense Object Detection [98.66771688028426]
本研究では,一段階検出器のためのAmbiguity-Resistant Semi-supervised Learning (ARSL)を提案する。
擬似ラベルの分類とローカライズ品質を定量化するために,JCE(Joint-Confidence Estimation)を提案する。
ARSLは、曖昧さを効果的に軽減し、MS COCOおよびPASCALVOC上で最先端のSSOD性能を達成する。
論文 参考訳(メタデータ) (2023-03-27T07:46:58Z) - PlasmoID: A dataset for Indonesian malaria parasite detection and
segmentation in thin blood smear [0.0]
インドネシアは東南アジアで最多のマラリア患者数で2番目に高い国である。
ディープラーニングアプローチに基づくマラリア寄生虫セマンティックセグメンテーションの異なる手法は、従来の方法の限界を減らす代替手段である。
本研究では,より高速なRCNNと意味的セグメンテーション技術を組み合わせたマラリア寄生虫のセグメンテーションと検出手法を提案する。
論文 参考訳(メタデータ) (2022-11-28T07:47:09Z) - WSSS4LUAD: Grand Challenge on Weakly-supervised Tissue Semantic
Segmentation for Lung Adenocarcinoma [51.50991881342181]
この課題には10,091個のパッチレベルのアノテーションと1300万以上のラベル付きピクセルが含まれる。
第一位チームは0.8413mIoUを達成した(腫瘍:0.8389、ストーマ:0.7931、正常:0.8919)。
論文 参考訳(メタデータ) (2022-04-13T15:27:05Z) - PointMatch: A Consistency Training Framework for Weakly Supervised
Semantic Segmentation of 3D Point Clouds [117.77841399002666]
本稿では,データ自体から十分な情報を探索するために整合性正規化を適用することで,データとラベルの両面に立つ新しいフレームワークであるPointMatchを提案する。
提案したPointMatchは、ScanNet-v2データセットとS3DISデータセットの両方で、様々な弱い教師付きスキームの下で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-02-22T07:26:31Z) - TA-Net: Topology-Aware Network for Gland Segmentation [71.52681611057271]
本研究では, 密集した腺と高度に変形した腺を正確に分離する新しいトポロジ・アウェア・ネットワーク(TA-Net)を提案する。
TA-Netはマルチタスク学習アーキテクチャを持ち、腺セグメンテーションの一般化を強化する。
2つのデータセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-10-27T17:10:58Z) - Neighborhood Contrastive Learning for Novel Class Discovery [79.14767688903028]
我々は,クラスタリング性能に重要な識別表現を学習するために,Neighborhood Contrastive Learningという新しいフレームワークを構築した。
これらの2つの成分がクラスタリング性能に大きく寄与し、我々のモデルが最先端の手法よりも大きなマージンで優れていることを実験的に実証した。
論文 参考訳(メタデータ) (2021-06-20T17:34:55Z) - Unsupervised Spoken Term Discovery Based on Re-clustering of
Hypothesized Speech Segments with Siamese and Triplet Networks [35.2633450287549]
本稿では,初期仮説列クラスタからトレーニング例を生成することを提案する。
Siamese/Tripletネットワークは、2つの音声セグメント間の類似度を測定するために、仮説上の例に基づいて訓練される。
論文 参考訳(メタデータ) (2020-11-28T03:52:38Z) - A New Approach for Texture based Script Identification At Block Level
using Quad Tree Decomposition [38.20489458130109]
マルチスクリプトシナリオが一般的であるインドのような国では、事前にスクリプトを特定することが義務付けられます。
公式手書き文字11文字に対する方向エネルギーとエントロピー分布の抽出におけるガボルウェーブレットフィルタの重要性を示す。
論文 参考訳(メタデータ) (2020-09-16T02:50:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。