論文の概要: Darshana Graph: A Parallel Commentary Corpus for Comparative Indian Philosophy, with Stylometric and Exploratory Graph Analyses
- arxiv url: http://arxiv.org/abs/2606.18222v1
- Date: Tue, 16 Jun 2026 17:49:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.588517
- Title: Darshana Graph: A Parallel Commentary Corpus for Comparative Indian Philosophy, with Stylometric and Exploratory Graph Analyses
- Title(参考訳): Darshana Graph: Stylometric and Exploratory Graph Analysesによる比較インド哲学の並列解説コーパス
- Authors: Joy Bose,
- Abstract要約: ダルシャナグラフ (Darshana Graph) は、ヒンドゥー教、仏教、ジャイナ教の哲学的伝統にまたがる125,000以上のテキスト記録のコーパスである。
その独特な貢献は、約8,500のヒンドゥー教とジャイナ教の記録の、構造的に独特な部分であり、同じ根本詩や経典が18の歴史的コメンテーターの間で並んだものである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce Darshana Graph, a corpus of over 125,000 text records spanning classical Hindu, Buddhist, and Jain philosophical traditions, drawn from public-domain and openly licensed translations of sources including the Bhagavad Gita, Brahma Sutras, principal Upanishads, the Pali Canon, and core Jain texts. Its distinctive contribution lies in a structurally unique subset of roughly 8,500 Hindu and Jain records in which the same root verse or sutra is aligned across eighteen historical commentators representing five schools of Vedanta and other darshanas, enabling direct comparison of how independent interpretive traditions read identical source material. To our knowledge, no publicly available resource provides comparable cross-commentator alignment at this scale. We present two analyses built on this corpus. First, a transparent stylometric comparison requiring no machine learning measures argumentative style through scriptural citation density, explicit refutation rate, and sentence complexity. It finds a moderate negative correlation between citation density and refutation rate, a marked increase in refutation rate across three commentators in a related doctrinal lineage, and measurable genre-level differences within the Pali Canon itself. Second, we describe a constrained large language model pipeline that extracts typed philosophical relationships between concepts using a predefined relation vocabulary and deterministic post-hoc validation. The resulting graph surfaces cross-school disagreement patterns while also revealing important extraction limitations, including cases where an independent embedding-based analysis disagrees with the graph-derived findings. We release the full corpus, extracted relationship graph, and all source code.
- Abstract(参考訳): ダーシャナグラフ(Darshana Graph)は、ヒンドゥー教、仏教、ジャイナ教の哲学の伝統にまたがる125,000以上のテキスト記録のコーパスで、バガヴァド・ギガ、ブラーマ経典、プリンシパル・ウパニシャド、パリ・カノン、コア・ジャイナ教のテキストなど、パブリックドメインと公にライセンスされた資料の翻訳から作成されている。
その独特な貢献は、約8,500のヒンドゥー教とジャイナ教の記録の、構造的に独特な部分であり、同じルーツの詩や経典は、ヴェダンタと他のダーシャナの5つの流派を代表する18の歴史的コメンテーターの間で一致しており、独立した解釈的伝統がどのように同じ資料を読むかを直接比較することができる。
我々の知る限りでは、この規模で同等のクロスコンストラクタアライメントを提供するリソースは公開されていない。
このコーパス上に構築された2つの解析結果を示す。
第一に、文の引用密度、明示的な反響率、文の複雑さを通じて、機械学習が議論的スタイルを測ることを必要としない透明なテクスチャ比較を行う。
引用密度と消火率の間には中程度の負の相関がみられ、関連する教義系統の3つのコメンテーター間での消火率が顕著に増加し、パリ・カノン自体のジャンルレベルでの差異が測定可能となった。
次に、事前定義された関係語彙と決定論的ポストホック検証を用いて、概念間の型付き哲学的関係を抽出する制約付き大規模言語モデルパイプラインについて述べる。
結果として得られたグラフは、学校間の不一致パターンを表面化し、また、グラフ由来の発見と独立な埋め込みに基づく分析が一致しないケースを含む重要な抽出制限を明らかにした。
完全なコーパス、関係グラフの抽出、およびすべてのソースコードをリリースします。
関連論文リスト
- PaliBench: A Multi-Reference Blueprint for Classical Language Translation Benchmarks [0.0]
PaliBenchは、Pali-to- English翻訳のベンチマークである。
本稿では、Pali-to- English翻訳のためのベンチマークであるPaliBenchと、古典言語のためのマルチ参照翻訳ベンチマークを構築する再利用可能な方法について紹介する。
論文 参考訳(メタデータ) (2026-05-16T08:43:01Z) - Floating or Suggesting Ideas? A Large-Scale Contrastive Analysis of Metaphorical and Literal Verb-Object Constructions [53.690096725532726]
本研究では,2Mコーパス文中の297の英語動詞オブジェクト対(例:float idea vs. suggest idea)を分析した。
5つのNLPツールを用いて,感情的,語彙的,統語的,言論的な特徴を捉えた認知的・言語的特徴2,293点を抽出した。
クロスペアの結果は, 語彙頻度, 凝集度, 構造規則性が高く, 比喩的文脈は感情負荷, イメージ性, 語彙多様性, 構造的特異性を示す。
論文 参考訳(メタデータ) (2026-04-09T14:08:57Z) - SiPaKosa: A Comprehensive Corpus of Canonical and Classical Buddhist Texts in Sinhala and Pali [0.0]
SiPaKosa は Sinhala と Pali doctrinal の総括コーパスで、約 786K 文と 9.25M ワードからなる。
コーパスは、Google Document AIを歴史写本に使用して、高品質なOCRによって作成された。
10の事前学習モデルを用いて言語モデルの性能を評価し, コーパス上でのパープレキシティスコアは1.09から189.67である。
論文 参考訳(メタデータ) (2026-03-31T03:36:46Z) - Eigenmood Space: Uncertainty-Aware Spectral Graph Analysis of Psychological Patterns in Classical Persian Poetry [0.0]
我々は、詩人レベルの心理的分析のための不確実性を考慮した計算フレームワークを提案する。
各詩は、心理学的概念のセット、ラベルごとの信頼度スコア、そして不十分な証拠を示す棄権フラグに関連付けられている。
10人の詩人にまたがる61,573節のコーパスでは、22.2%の詩が禁じられ、不確実性の分析的重要性が強調されている。
論文 参考訳(メタデータ) (2026-02-18T23:53:07Z) - Data-driven Coreference-based Ontology Building [48.995395445597225]
参照解決は、伝統的に個々の文書理解のコンポーネントとして使用される。
よりグローバルな視点で、すべてのドキュメントレベルのコア参照関係から、ドメインについて何が学べるかを探求します。
コードとともに、クリエイティブ・コモンズライセンスの下でコア参照チェーンをリリースします。
論文 参考訳(メタデータ) (2024-10-22T14:30:40Z) - Tracing the Genealogies of Ideas with Large Language Model Embeddings [0.0]
大規模コーパスにまたがる知的影響を検出する新しい手法を提案する。
この手法を用いて、19世紀の約40万冊のノンフィクション書籍と学術出版物のコーパスから文章をベクトル化する。
論文 参考訳(メタデータ) (2024-01-13T18:42:27Z) - Quantifying the redundancy between prosody and text [67.07817268372743]
我々は大きな言語モデルを用いて、韻律と単語自体の間にどれだけの情報が冗長であるかを推定する。
単語が持つ情報と韻律情報の間には,複数の韻律的特徴にまたがる高い冗長性が存在する。
それでも、韻律的特徴はテキストから完全には予測できないことが観察され、韻律は単語の上下に情報を運ぶことが示唆された。
論文 参考訳(メタデータ) (2023-11-28T21:15:24Z) - Semantic and sentiment analysis of selected Bhagavad Gita translations
using BERT-based language framework [0.4125187280299248]
バガヴァド・ギーガ(Bhagavad Gita)は、サンスクリットで書かれた古代ヒンドゥー教の哲学書で、マハーバーラタ戦争の前にクリシュナ卿とアルジュナの会話を描いている。
本稿では,Bhagavad Gitaから選択された翻訳文(主にサンスクリット語から英語)を,意味分析と感情分析を用いて比較する。
論文 参考訳(メタデータ) (2022-01-09T23:59:11Z) - Did they answer? Subjective acts and intents in conversational discourse [48.63528550837949]
英会話の複数の主観的かつ主観的な解釈を含む最初の対話データセットを提示する。
意見の相違が曖昧であることを示し、異なる文脈要因についてより深く理解する必要がある。
論文 参考訳(メタデータ) (2021-04-09T16:34:19Z) - Focusing Knowledge-based Graph Argument Mining via Topic Modeling [43.69396080017806]
文レベルの議論マイニングの課題について検討するが、議論は特定・理解するためにはある程度の世界知識が必要である。
話題モデルを用いて,構造化知識ベースWikidataから話題や文固有の証拠を抽出する。
また、構造化知識基盤の一般的な不完全性に対処するために、Googleが発見したトピック特化記事に基づく第2のグラフを構築した。
論文 参考訳(メタデータ) (2021-02-03T14:39:58Z) - A computational model implementing subjectivity with the 'Room Theory'.
The case of detecting Emotion from Text [68.8204255655161]
本研究は,テキスト分析における主観性と一般的文脈依存性を考慮した新しい手法を提案する。
単語間の類似度を用いて、ベンチマーク中の要素の相対的関連性を抽出することができる。
この方法は、主観的評価がテキストの相対値や意味を理解するために関係しているすべてのケースに適用できる。
論文 参考訳(メタデータ) (2020-05-12T21:26:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。