論文の概要: Data-driven Methods of Extracting Text Structure and Information Transfer
- arxiv url: http://arxiv.org/abs/2509.12999v1
- Date: Tue, 16 Sep 2025 12:13:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:53.073149
- Title: Data-driven Methods of Extracting Text Structure and Information Transfer
- Title(参考訳): データ駆動型テキスト構造抽出法と情報伝達
- Authors: Shinichi Honna, Taichi Murayama, Akira Matsui,
- Abstract要約: アンナ・カレニナの原則(AKP)では、成功にはいくつかの必須条件を満たす必要があるが、失敗には多様な形態が必要である。
我々は、AKP、その逆、さらに2つのパターンを、小説、オンライン百科事典、研究論文、映画に順調でうるさく説明します。
- 参考スコア(独自算出の注目度): 1.7013938542585925
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Anna Karenina Principle (AKP) holds that success requires satisfying a small set of essential conditions, whereas failure takes diverse forms. We test AKP, its reverse, and two further patterns described as ordered and noisy across novels, online encyclopedias, research papers, and movies. Texts are represented as sequences of functional blocks, and convergence is assessed in transition order and position. Results show that structural principles vary by medium: novels follow reverse AKP in order, Wikipedia combines AKP with ordered patterns, academic papers display reverse AKP in order but remain noisy in position, and movies diverge by genre. Success therefore depends on structural constraints that are specific to each medium, while failure assumes different shapes across domains.
- Abstract(参考訳): アンナ・カレニナの原則(AKP)では、成功にはいくつかの必須条件を満たす必要があるが、失敗には多様な形態が必要である。
我々は、AKP、その逆、さらに2つのパターンを、小説、オンライン百科事典、研究論文、映画に順調でうるさく説明します。
テキストは関数ブロックのシーケンスとして表現され、収束は遷移順序と位置で評価される。
小説は順に逆のAKP、ウィキペディアは順に逆のAKPを示し、学術論文は順に逆のAKPを表示し、映画はジャンルによって異なる。
したがって、成功は各媒体に特有の構造的制約に依存するが、障害はドメイン間で異なる形状を仮定する。
関連論文リスト
- Penrose Tiled Low-Rank Compression and Section-Wise Q&A Fine-Tuning: A General Framework for Domain-Specific Large Language Model Adaptation [7.161207910629032]
大規模言語モデル(LLM)は、材料科学のような専門的な科学分野に対して大きな約束を持っている。
本稿では,この課題に対処するために,構造化モデル圧縮と科学的微調整システムを組み合わせた2段階のフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-28T01:33:05Z) - A Fixed-Point Approach for Causal Generative Modeling [20.88890689294816]
本稿では,構造因果モデル(Structure Causal Models, SCM)を因果順序付き変数の固定点問題として記述する新しい形式論を提案する。
トポロジカル順序付け(TO)を考えると,その特異な回復のために最も弱い既知の条件を確立する。
論文 参考訳(メタデータ) (2024-04-10T12:29:05Z) - Noise Contrastive Estimation-based Matching Framework for Low-Resource Security Attack Pattern Recognition [45.34519578504934]
TTP(Tactics, Techniques and Procedures)は、サイバーセキュリティドメインにおける高度な攻撃パターンを表す。
そこで本研究では,TTPラベルへのテキストの割り当てが,両者の直接的な意味的類似性によって決定される,異なる学習パラダイムの問題を定式化する。
本稿では,効果的なサンプリングベース学習機構を備えたニューラルマッチングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-01-18T19:02:00Z) - GNAT: A General Narrative Alignment Tool [12.100007440638667]
バイオインフォマティクスと現代のテキスト類似度指標を結合したSmith-Watermanアルゴリズムのナラティブアライメントに対する一般的なアプローチを開発する。
文書の相対長と絶対長の両方で大きく異なる4つの異なる問題領域に対して、一般的な物語アライメントツール(GNAT)を適用し、評価する。
論文 参考訳(メタデータ) (2023-11-07T00:24:14Z) - Finding Pragmatic Differences Between Disciplines [14.587150614245123]
文書セクションのドメインに依存しない記述子の固定セットを学習し、これらの記述子にコーパスを"再最適化"する。
我々は、これらの記述子の位置と順序を文書間で分析し、規律と構造の関係を理解する。
本研究は,研究の質,ドメインスタイルの移譲,さらに実践的な分析を行うための基礎となるものである。
論文 参考訳(メタデータ) (2023-09-30T00:46:14Z) - End-to-End Page-Level Assessment of Handwritten Text Recognition [69.55992406968495]
HTRシステムは、文書のエンドツーエンドのページレベルの書き起こしに直面している。
標準メトリクスは、現れる可能性のある不整合を考慮していない。
本稿では、転写精度とROの良さを別々に検討する2つの評価法を提案する。
論文 参考訳(メタデータ) (2023-01-14T15:43:07Z) - Autoregressive Structured Prediction with Language Models [73.11519625765301]
本稿では, PLM を用いた自己回帰的手法を用いて, モデル構造を行動列として記述する。
我々のアプローチは、私たちが見てきた全ての構造化予測タスクにおいて、新しい最先端を実現する。
論文 参考訳(メタデータ) (2022-10-26T13:27:26Z) - Supporting Vision-Language Model Inference with Confounder-pruning Knowledge Prompt [71.77504700496004]
視覚言語モデルは、オープンセットの視覚概念を扱うために、画像とテキストのペアを共通の空間に整列させることで事前訓練される。
事前訓練されたモデルの転送可能性を高めるため、最近の研究では、固定または学習可能なプロンプトが採用されている。
しかし、どのようにして、どのプロンプトが推論性能を改善するのかは、まだ不明である。
論文 参考訳(メタデータ) (2022-05-23T07:51:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。