論文の概要: Accessibility and Trajectory-Based Text Characterization
- arxiv url: http://arxiv.org/abs/2201.06665v1
- Date: Mon, 17 Jan 2022 23:33:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-19 16:47:21.310966
- Title: Accessibility and Trajectory-Based Text Characterization
- Title(参考訳): アクセシビリティと軌道に基づくテキストキャラクタリゼーション
- Authors: B\'arbara C. e Souza and Filipi N. Silva and Henrique F. de Arruda and
Luciano da F. Costa and Diego R. Amancio
- Abstract要約: 特に、テキストは階層構造によって特徴づけられ、マルチスケールの概念や手法を用いてアプローチすることができる。
テキスト・ナラティブを表現するためのメソスコピック・アプローチを拡張し,発話のタグ付け部分間の反復関係のみを考慮した。
テキストのキャラクタリゼーションは、アクセシビリティ、対称性、繰り返しシグネチャといったスケール依存の相補的手法を考慮することで達成された。
- 参考スコア(独自算出の注目度): 0.6912244027050454
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Several complex systems are characterized by presenting intricate
characteristics extending along many scales. These characterizations are used
in various applications, including text classification, better understanding of
diseases, and comparison between cities, among others. In particular, texts are
also characterized by a hierarchical structure that can be approached by using
multi-scale concepts and methods. The present work aims at developing these
possibilities while focusing on mesoscopic representations of networks. More
specifically, we adopt an extension to the mesoscopic approach to represent
text narratives, in which only the recurrent relationships among tagged parts
of speech are considered to establish connections among sequential pieces of
text (e.g., paragraphs). The characterization of the texts was then achieved by
considering scale-dependent complementary methods: accessibility, symmetry and
recurrence signatures. In order to evaluate the potential of these concepts and
methods, we approached the problem of distinguishing between literary genres
(fiction and non-fiction). A set of 300 books organized into the two genres was
considered and were compared by using the aforementioned approaches. All the
methods were capable of differentiating to some extent between the two genres.
The accessibility and symmetry reflected the narrative asymmetries, while the
recurrence signature provide a more direct indication about the non-sequential
semantic connections taking place along the narrative.
- Abstract(参考訳): いくつかの複雑な系は、多くのスケールにまたがる複雑な特性を示すことで特徴づけられる。
これらの特徴は、テキスト分類、疾患の理解の向上、都市間の比較など、様々な用途で用いられている。
特に、テキストは階層構造によって特徴づけられ、マルチスケールの概念や手法を用いてアプローチすることができる。
本研究は,ネットワークのメソスコピック表現に着目しながら,これらの可能性を開発することを目的とする。
より具体的には、テキスト物語を表現するメソスコピックアプローチの拡張として、タグ付けされた部分間の連続的な関係のみが、逐次的なテキスト(例えば、段落)間の関係を確立すると考えられる。
テキストの特徴付けは、アクセシビリティ、対称性、繰り返しシグネチャといったスケール依存の補完的手法を考慮して達成された。
これらの概念や手法の可能性を評価するために,文学的ジャンル(フィクションとノンフィクション)を区別する問題にアプローチした。
2つのジャンルに分かれた300冊の本が検討され、上記のアプローチを用いて比較された。
すべての手法は、2つのジャンルの間である程度の差異があった。
アクセシビリティと対称性は物語の非対称性を反映し、繰り返しシグネチャは物語に沿って起こる非逐次意味的関係をより直接的に示す。
関連論文リスト
- Story Grammar Semantic Matching for Literary Study [3.686808512438363]
ストーリー構造とその関連要素を利用した,より透過的なアプローチを提案する。
文章と叙事詩をストーリー要素ラベルでラベル付けし、これらのラベルを特徴としてのみ考慮して意味マッチングを行う。
この新たな手法であるストーリー・グラマー・セマンティック・マッチング(Story Grammar Semantic Matching)は、文学者に対して、パターンや文学的技法を特徴づける方法で、テキスト間での論証やその他の意味的類似性を導くものである。
論文 参考訳(メタデータ) (2025-02-17T19:20:39Z) - Estimating the Influence of Sequentially Correlated Literary Properties in Textual Classification: A Data-Centric Hypothesis-Testing Approach [4.161155428666988]
スティロメトリーは、ジャンルやテーマといった要素とは異なる半意識的な選択を反映していると考えられる文学的特徴を分析して著者を区別することを目的としている。
主題的内容など一部の文学的特性は、隣接するテキスト単位間の相関関係として表される可能性が高いが、権威的なスタイルのように、その独立性を持つものもいる。
テキスト分類における逐次相関文学的特性の影響を評価するための仮説検証手法を提案する。
論文 参考訳(メタデータ) (2024-11-07T18:28:40Z) - Conjuring Semantic Similarity [59.18714889874088]
2つのテキスト表現間の意味的類似性は、潜伏者の「意味」の間の距離を測定する
テキスト表現間の意味的類似性は、他の表現を言い換えるのではなく、それらが引き起こすイメージに基づいている、という新しいアプローチを提案する。
提案手法は,人間の注釈付きスコアに適合するだけでなく,テキスト条件付き生成モデル評価のための新たな道を開く意味的類似性に関する新たな視点を提供する。
論文 参考訳(メタデータ) (2024-10-21T18:51:34Z) - How Well Do Text Embedding Models Understand Syntax? [50.440590035493074]
テキスト埋め込みモデルが幅広い構文的文脈にまたがって一般化する能力は、まだ解明されていない。
その結果,既存のテキスト埋め込みモデルは,これらの構文的理解課題に十分対応していないことが明らかとなった。
多様な構文シナリオにおけるテキスト埋め込みモデルの一般化能力を高めるための戦略を提案する。
論文 参考訳(メタデータ) (2023-11-14T08:51:00Z) - A Comparative Study of Sentence Embedding Models for Assessing Semantic
Variation [0.0]
本稿では,複数の文献において,連続する文間の意味的類似性の時系列と対の文類似性の行列を用いた最近の文埋め込み法について比較する。
文の埋め込み手法のほとんどは、ある文書において意味的類似性の高相関パターンを推定するが、興味深い相違が見られる。
論文 参考訳(メタデータ) (2023-08-08T23:31:10Z) - Tragic and Comical Networks. Clustering Dramatic Genres According to
Structural Properties [0.0]
ネットワーク研究とドラマ史の合同分野における伝統は、劇のキャラクターネットワークからの解釈を生み出している。
我々の目的は、プレイのよく解釈可能なシンプルな特性に基づいて、類似した構造を持つテキストをクラスタリングできる方法を作ることである。
これらの特徴の発見は,本研究の最も重要な部分であるとともに,テキスト間の類似性を計算するための適切な統計的手順を確立する。
論文 参考訳(メタデータ) (2023-02-16T12:36:16Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - Relation Clustering in Narrative Knowledge Graphs [71.98234178455398]
原文内の関係文は(SBERTと)埋め込み、意味論的に類似した関係をまとめるためにクラスタ化される。
予備的なテストでは、そのようなクラスタリングが類似した関係を検知し、半教師付きアプローチのための貴重な前処理を提供することが示されている。
論文 参考訳(メタデータ) (2020-11-27T10:43:04Z) - Contextual Modulation for Relation-Level Metaphor Identification [3.2619536457181075]
本稿では,ある文法的関係の関連レベルの比喩表現を識別するための新しいアーキテクチャを提案する。
視覚的推論の研究にインスパイアされた方法論では、我々のアプローチは、深い文脈化された特徴にニューラルネットワークの計算を条件付けすることに基づいている。
提案したアーキテクチャは,ベンチマークデータセット上で最先端の結果が得られることを示す。
論文 参考訳(メタデータ) (2020-10-12T12:07:02Z) - A Comparative Study on Structural and Semantic Properties of Sentence
Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。
異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。
これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文 参考訳(メタデータ) (2020-09-23T15:45:32Z) - Temporal Embeddings and Transformer Models for Narrative Text
Understanding [72.88083067388155]
キャラクタ関係モデリングのための物語テキスト理解のための2つのアプローチを提案する。
これらの関係の時間的進化は動的単語埋め込みによって説明され、時間とともに意味的変化を学ぶように設計されている。
最新の変換器モデルBERTに基づく教師付き学習手法を用いて文字間の静的な関係を検出する。
論文 参考訳(メタデータ) (2020-03-19T14:23:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。