論文の概要: Data-driven Methods of Extracting Text Structure and Information Transfer
- arxiv url: http://arxiv.org/abs/2509.12999v1
- Date: Tue, 16 Sep 2025 12:13:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:53.073149
- Title: Data-driven Methods of Extracting Text Structure and Information Transfer
- Title(参考訳): データ駆動型テキスト構造抽出法と情報伝達
- Authors: Shinichi Honna, Taichi Murayama, Akira Matsui,
- Abstract要約: アンナ・カレニナの原則(AKP)では、成功にはいくつかの必須条件を満たす必要があるが、失敗には多様な形態が必要である。
我々は、AKP、その逆、さらに2つのパターンを、小説、オンライン百科事典、研究論文、映画に順調でうるさく説明します。
- 参考スコア(独自算出の注目度): 1.7013938542585925
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Anna Karenina Principle (AKP) holds that success requires satisfying a small set of essential conditions, whereas failure takes diverse forms. We test AKP, its reverse, and two further patterns described as ordered and noisy across novels, online encyclopedias, research papers, and movies. Texts are represented as sequences of functional blocks, and convergence is assessed in transition order and position. Results show that structural principles vary by medium: novels follow reverse AKP in order, Wikipedia combines AKP with ordered patterns, academic papers display reverse AKP in order but remain noisy in position, and movies diverge by genre. Success therefore depends on structural constraints that are specific to each medium, while failure assumes different shapes across domains.
- Abstract(参考訳): アンナ・カレニナの原則(AKP)では、成功にはいくつかの必須条件を満たす必要があるが、失敗には多様な形態が必要である。
我々は、AKP、その逆、さらに2つのパターンを、小説、オンライン百科事典、研究論文、映画に順調でうるさく説明します。
テキストは関数ブロックのシーケンスとして表現され、収束は遷移順序と位置で評価される。
小説は順に逆のAKP、ウィキペディアは順に逆のAKPを示し、学術論文は順に逆のAKPを表示し、映画はジャンルによって異なる。
したがって、成功は各媒体に特有の構造的制約に依存するが、障害はドメイン間で異なる形状を仮定する。
関連論文リスト
- Invariance on Manifolds: Understanding Robust Visual Representations for Place Recognition [19.200074425090595]
本稿では,2次幾何統計フレームワークを提案する。
提案手法では、固定されたトレーニング済みのバックボーン上に構築されたトレーニング不要のフレームワークを導入し、パラメータ更新なしで強力なゼロショット一般化を実現する。
論文 参考訳(メタデータ) (2026-01-31T18:12:29Z) - StructAlign: Structured Cross-Modal Alignment for Continual Text-to-Video Retrieval [75.28673512571449]
Continual Text-to-Video Retrievalの重要な課題はフィーチャードリフトだ。
我々はCTVRのための構造化クロスモーダルアライメント手法であるStructAlignを提案する。
我々の手法は、常に最先端の連続検索手法より優れています。
論文 参考訳(メタデータ) (2026-01-28T13:34:44Z) - Penrose Tiled Low-Rank Compression and Section-Wise Q&A Fine-Tuning: A General Framework for Domain-Specific Large Language Model Adaptation [7.161207910629032]
大規模言語モデル(LLM)は、材料科学のような専門的な科学分野に対して大きな約束を持っている。
本稿では,この課題に対処するために,構造化モデル圧縮と科学的微調整システムを組み合わせた2段階のフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-28T01:33:05Z) - A Fixed-Point Approach for Causal Generative Modeling [20.88890689294816]
本稿では,構造因果モデル(Structure Causal Models, SCM)を因果順序付き変数の固定点問題として記述する新しい形式論を提案する。
トポロジカル順序付け(TO)を考えると,その特異な回復のために最も弱い既知の条件を確立する。
論文 参考訳(メタデータ) (2024-04-10T12:29:05Z) - Document Structure in Long Document Transformers [64.76981299465885]
長い文書は、しばしばセクションヘッダーや段落のような異なる機能で階層的に整理された要素を持つ構造を示す。
文書構造の不明瞭さにもかかわらず、自然言語処理(NLP)におけるその役割はいまだに不透明である。
長期文書変換モデルは事前学習中に文書構造の内部表現を取得するか?
事前トレーニング後に構造情報をモデルに伝達するにはどうすればよいのか、下流のパフォーマンスにどのように影響するのか?
論文 参考訳(メタデータ) (2024-01-31T08:28:06Z) - Noise Contrastive Estimation-based Matching Framework for Low-Resource Security Attack Pattern Recognition [45.34519578504934]
TTP(Tactics, Techniques and Procedures)は、サイバーセキュリティドメインにおける高度な攻撃パターンを表す。
そこで本研究では,TTPラベルへのテキストの割り当てが,両者の直接的な意味的類似性によって決定される,異なる学習パラダイムの問題を定式化する。
本稿では,効果的なサンプリングベース学習機構を備えたニューラルマッチングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-01-18T19:02:00Z) - GNAT: A General Narrative Alignment Tool [12.100007440638667]
バイオインフォマティクスと現代のテキスト類似度指標を結合したSmith-Watermanアルゴリズムのナラティブアライメントに対する一般的なアプローチを開発する。
文書の相対長と絶対長の両方で大きく異なる4つの異なる問題領域に対して、一般的な物語アライメントツール(GNAT)を適用し、評価する。
論文 参考訳(メタデータ) (2023-11-07T00:24:14Z) - Finding Pragmatic Differences Between Disciplines [14.587150614245123]
文書セクションのドメインに依存しない記述子の固定セットを学習し、これらの記述子にコーパスを"再最適化"する。
我々は、これらの記述子の位置と順序を文書間で分析し、規律と構造の関係を理解する。
本研究は,研究の質,ドメインスタイルの移譲,さらに実践的な分析を行うための基礎となるものである。
論文 参考訳(メタデータ) (2023-09-30T00:46:14Z) - End-to-End Page-Level Assessment of Handwritten Text Recognition [69.55992406968495]
HTRシステムは、文書のエンドツーエンドのページレベルの書き起こしに直面している。
標準メトリクスは、現れる可能性のある不整合を考慮していない。
本稿では、転写精度とROの良さを別々に検討する2つの評価法を提案する。
論文 参考訳(メタデータ) (2023-01-14T15:43:07Z) - Autoregressive Structured Prediction with Language Models [73.11519625765301]
本稿では, PLM を用いた自己回帰的手法を用いて, モデル構造を行動列として記述する。
我々のアプローチは、私たちが見てきた全ての構造化予測タスクにおいて、新しい最先端を実現する。
論文 参考訳(メタデータ) (2022-10-26T13:27:26Z) - Supporting Vision-Language Model Inference with Confounder-pruning Knowledge Prompt [71.77504700496004]
視覚言語モデルは、オープンセットの視覚概念を扱うために、画像とテキストのペアを共通の空間に整列させることで事前訓練される。
事前訓練されたモデルの転送可能性を高めるため、最近の研究では、固定または学習可能なプロンプトが採用されている。
しかし、どのようにして、どのプロンプトが推論性能を改善するのかは、まだ不明である。
論文 参考訳(メタデータ) (2022-05-23T07:51:15Z) - SVIP: Sequence VerIfication for Procedures in Videos [68.07865790764237]
ステップレベルの変換を伴う負のアクションシーケンスと同一のアクションシーケンスを実行するポジティブなビデオペアを区別することを目的とした,新しいシーケンス検証タスクを提案する。
このような困難なタスクは、事前のアクション検出やセグメンテーションなしで、オープンセット設定に置かれる。
我々は、化学実験において、あらゆる段階的な変換を列挙したスクリプト付きビデオデータセットを収集する。
論文 参考訳(メタデータ) (2021-12-13T07:03:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。