論文の概要: Critical biblical studies via word frequency analysis: unveiling text authorship
- arxiv url: http://arxiv.org/abs/2410.19883v1
- Date: Thu, 24 Oct 2024 22:08:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:17:38.931476
- Title: Critical biblical studies via word frequency analysis: unveiling text authorship
- Title(参考訳): 単語頻度分析による批判的聖書研究--テキスト著者の紹介
- Authors: Shira Faigenbaum-Golovin, Alon Kipnis, Axel Bühler, Eli Piasetzky, Thomas Römer, Israel Finkelstein,
- Abstract要約: 私たちは、聖書の最初の9冊にまたがる多くの章にまたがる3つの異なる著者を区別することを目指しています。
我々の分析は、最初の2人の著者(DとDtrH)が、専門家の評価と一致した事実であるPよりもはるかに密接な関係があることを示唆している。
- 参考スコア(独自算出の注目度): 7.2762881851201255
- License:
- Abstract: The Bible, a product of an extensive and intricate process of oral-written transmission spanning centuries, obscures the contours of its earlier recensions. Debate rages over determining the existing layers and identifying the date of composition and historical background of the biblical texts. Traditional manual methodologies have grappled with authorship challenges through scrupulous textual criticism, employing linguistic, stylistic, inner-biblical, and historical criteria. Despite recent progress in computer-assisted analysis, many patterns still need to be uncovered in Biblical Texts. In this study, we address the question of authorship of biblical texts by employing statistical analysis to the frequency of words using a method that is particularly sensitive to deviations in frequencies associated with a few words out of potentially many. We aim to differentiate between three distinct authors across numerous chapters spanning the first nine books of the Bible. In particular, we examine 50 chapters labeled according to biblical exegesis considerations into three corpora (D, DtrH, and P). Without prior assumptions about author identity, our approach leverages subtle differences in word frequencies to distinguish among the three corpora and identify author-dependent linguistic properties. Our analysis indicates that the first two authors (D and DtrH) are much more closely related compared to P, a fact that aligns with expert assessments. Additionally, we attain high accuracy in attributing authorship by evaluating the similarity of each chapter with the reference corpora. This study sheds new light on the authorship of biblical texts by providing interpretable, statistically significant evidence that there are different linguistic characteristics of biblical authors and that these differences can be identified.
- Abstract(参考訳): 聖書は、何世紀にもわたって口頭で書かれた伝達の広範囲で複雑な過程の産物であり、初期の修正の輪郭を曖昧にしている。
既存の層を決定することや、聖書の成立年月日や歴史的背景について論じる。
伝統的な手作業の方法論は、言語的、スタイリスティック、内的聖書的、歴史的基準を取り入れた、巧妙な文章的批判を通じて著者の挑戦に悩まされてきた。
コンピュータ支援分析の最近の進歩にもかかわらず、多くのパターンを聖書テキストで明らかにする必要がある。
そこで本研究では,いくつかの単語の出現頻度の偏差に特に敏感な手法を用いて,単語の頻度に対する統計的解析を用いて,聖書テキストの著者の疑問に対処する。
私たちは、聖書の最初の9冊にまたがる多くの章にまたがる3つの異なる著者を区別することを目指しています。
特に,聖書のエクセゲシスを考慮した50の章を3つのコーパス(D,DtrH,P)に分類した。
著者の身元を事前に仮定することなく,単語周波数の微妙な差異を利用して3つのコーパスを識別し,著者に依存した言語特性を同定する。
我々の分析は、最初の2人の著者(DとDtrH)が、専門家による評価と一致する事実であるPよりもはるかに密接な関係があることを示唆している。
さらに,各章と参照コーパスの類似性を評価することにより,著者の帰属度を高い精度で評価する。
本研究は,聖書の著者の言語的特徴が異なっており,その違いを識別できるという解釈的,統計的に有意な証拠を提供することにより,聖書の著者に新たな光を当てるものである。
関連論文リスト
- A Bayesian Approach to Harnessing the Power of LLMs in Authorship Attribution [57.309390098903]
著者の属性は、文書の起源または著者を特定することを目的としている。
大きな言語モデル(LLM)とその深い推論能力と長距離テキストアソシエーションを維持する能力は、有望な代替手段を提供する。
IMDbおよびブログデータセットを用いた結果, 著者10名を対象に, 著者1名に対して, 85%の精度が得られた。
論文 参考訳(メタデータ) (2024-10-29T04:14:23Z) - Inclusivity in Large Language Models: Personality Traits and Gender Bias in Scientific Abstracts [49.97673761305336]
我々は,3つの大きな言語モデル (LLM) を,人間の物語スタイルと潜在的な性別バイアスに適合させることで評価した。
以上の結果から,これらのモデルは一般的にヒトの投稿内容によく似たテキストを生成するが,スタイル的特徴の変化は有意な性差を示すことが示唆された。
論文 参考訳(メタデータ) (2024-06-27T19:26:11Z) - Large language model for Bible sentiment analysis: Sermon on the Mount [1.8804426519412474]
我々は、聖書の選択された章を研究するために感情分析を利用する。
これらの章は山のサーモンとして知られている。
私たちは、イエスがメッセージを伝えるために使った各章で、ユーモア、楽観主義、共感の異なるレベルを検知します。
論文 参考訳(メタデータ) (2024-01-01T07:35:29Z) - Quantifying the redundancy between prosody and text [67.07817268372743]
我々は大きな言語モデルを用いて、韻律と単語自体の間にどれだけの情報が冗長であるかを推定する。
単語が持つ情報と韻律情報の間には,複数の韻律的特徴にまたがる高い冗長性が存在する。
それでも、韻律的特徴はテキストから完全には予測できないことが観察され、韻律は単語の上下に情報を運ぶことが示唆された。
論文 参考訳(メタデータ) (2023-11-28T21:15:24Z) - A Statistical Exploration of Text Partition Into Constituents: The Case
of the Priestly Source in the Books of Genesis and Exodus [1.8780017602640042]
本稿では, テクストのテクスト探索のためのパイプラインを提案し, テクストのスタイメオグラフィーに基づく説明と, テキストの仮定分割の統計的検証を行う。
私たちは、聖書の最初の2冊の本にパイプラインを適用し、そこでは1つの様式的な要素が聖書学者、すなわちプリーストリーの構成要素の目の前で際立っている。
論文 参考訳(メタデータ) (2023-05-03T15:07:42Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Syllabic Quantity Patterns as Rhythmic Features for Latin Authorship
Attribution [74.27826764855911]
我々は、ラテン散文の計算的オーサシップ属性のタスクにおいて、リズミカルな特徴を導出する基盤として、音節量を用いる。
2つの異なる機械学習手法を用いて3つの異なるデータセットを用いて実験を行い、音節量に基づくリズム特徴がラテン散文の著者の識別に有用であることを示した。
論文 参考訳(メタデータ) (2021-10-27T06:25:31Z) - Sensing Ambiguity in Henry James' "The Turn of the Screw" [0.8528384027684192]
この研究は、計算テキスト分析と文芸分析を組み合わせて、特定のテキストにおけるあいまいさが意味を形成する上で重要な役割を担っているかを示す。
我々は、ヘンリー・ジェームズの19世紀の小説『ザ・ターン・オブ・ザ・スクリュー』におけるあいまいさの役割について、人文科学でよく知られた議論を再考する。
我々は,コサインの類似性と単語移動者の距離が,最も微妙な文体におけるあいまいさを検出するのに十分敏感であることを示す。
論文 参考訳(メタデータ) (2020-11-21T17:53:41Z) - Artificial intelligence based writer identification generates new
evidence for the unknown scribes of the Dead Sea Scrolls exemplified by the
Great Isaiah Scroll (1QIsaa) [5.285396202883411]
我々は、パターン認識と人工知能技術を用いて、著者識別に関するスクロールのパレオグラフィーを革新する。
多くの学者は1QIsaaは1人の筆記者によって書かれたと信じているが、本巻の連載コラムの破断点の新しい証拠を報告している。
この研究は、聖書の旧約聖書文化に新たな光を当て、古代の聖書のテキストが単一の書体によってコピーされるのではなく、複数の書体が特定の写本と密に協力できるという、新しい具体的な証拠を提供した。
論文 参考訳(メタデータ) (2020-10-27T17:36:18Z) - Improving Machine Reading Comprehension with Contextualized Commonsense
Knowledge [62.46091695615262]
我々は、機械読解の理解を改善するために、常識知識を抽出することを目指している。
構造化知識を文脈内に配置することで,関係を暗黙的に表現することを提案する。
我々は,教師の学習パラダイムを用いて,複数種類の文脈的知識を学生機械読取機に注入する。
論文 参考訳(メタデータ) (2020-09-12T17:20:01Z) - Comparative Computational Analysis of Global Structure in Canonical,
Non-Canonical and Non-Literary Texts [0.0]
3つのテキストタイプ(ノンリテラル、文学/カノニカル、文学/カノニカル)は、読者の美的反応の相関として構造設計の特徴に関して体系的な違いを示す。
大域構造の2つの側面、変動性、およびテキストに沿った長距離相関を反映する自己相似(フラクタル)パターンについて検討した。
その結果,3種類のテキストに対して,テキストの低レベル特性は高レベル特性よりも差別性が高いことがわかった。
論文 参考訳(メタデータ) (2020-08-25T09:37:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。