論文の概要: DWTSumm: Discrete Wavelet Transform for Document Summarization
- arxiv url: http://arxiv.org/abs/2604.21070v1
- Date: Wed, 22 Apr 2026 20:30:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.170622
- Title: DWTSumm: Discrete Wavelet Transform for Document Summarization
- Title(参考訳): DWTSumm: 文書要約のための離散ウェーブレット変換
- Authors: Rana Salama, Abdou Youssef, Mona Diab,
- Abstract要約: 本稿では,テキストを意味的信号として扱い,それをグローバルな(近似)コンポーネントとローカルな(詳細)コンポーネントに分解する多分解能フレームワークを提案する。
文レベルの埋め込みや単語レベルの埋め込みを適用したDWTは、全体的な構造と重要なドメイン固有の詳細を保存するコンパクトな表現を生成する。
GPT-4oベースラインと比較して、DWTベースの要約は意味的類似性と接地性を一貫して改善する。
- 参考スコア(独自算出の注目度): 4.9053277714790084
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Summarizing long, domain-specific documents with large language models (LLMs) remains challenging due to context limitations, information loss, and hallucinations, particularly in clinical and legal settings. We propose a Discrete Wavelet Transform (DWT)-based multi-resolution framework that treats text as a semantic signal and decomposes it into global (approximation) and local (detail) components. Applied to sentence- or word-level embeddings, DWT yields compact representations that preserve overall structure and critical domain-specific details, which are used directly as summaries or to guide LLM generation. Experiments on clinical and legal benchmarks demonstrate comparable ROUGE-L scores. Compared to a GPT-4o baseline, the DWT based summarization consistently improve semantic similarity and grounding, achieving gains of over 2% in BERTScore, more than 4\% in Semantic Fidelity, factual consistency in legal tasks, and large METEOR improvements indicative of preserved domain-specific semantics. Across multiple embedding models, Fidelity reaches up to 97%, suggesting that DWT acts as a semantic denoising mechanism that reduces hallucinations and strengthens factual grounding. Overall, DWT provides a lightweight, generalizable method for reliable long-document and domain-specific summarization with LLMs.
- Abstract(参考訳): 大きな言語モデル(LLM)で長いドメイン固有文書を要約することは、コンテキスト制限、情報損失、幻覚、特に臨床および法的な設定のために依然として困難である。
テキストを意味的信号として扱い、それをグローバル(近似)およびローカル(詳細)コンポーネントに分解する離散ウェーブレット変換(DWT)に基づく多分解能フレームワークを提案する。
文レベルの埋め込みや単語レベルの埋め込みに適用すると、DWTは、要約やLLM生成のガイドとして直接使用される、全体的な構造と重要なドメイン固有の詳細を保存するコンパクトな表現が得られる。
臨床および法的なベンチマークの実験では、ROUGE-Lスコアに匹敵する。
GPT-4oベースラインと比較して、DWTベースの要約は、セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティクスの2%以上、セマンティック・フィデリティの45%以上、法的タスクにおける事実整合性、および保存ドメイン固有のセマンティクスの大規模なMETEOR改善を一貫して改善している。
複数の埋め込みモデル全体では、Fidelityは最大97%に達し、DWTは幻覚を減らし、事実の根拠を強化する意味論的なメカニズムとして機能することを示唆している。
全体として、DWTは信頼性の高い長期ドキュメントとLLMによるドメイン固有の要約のための軽量で一般化可能な方法を提供する。
関連論文リスト
- Job Skill Extraction via LLM-Centric Multi-Module Framework [51.37063712967151]
本稿では,意味検索,文脈内学習,教師付き微調整を組み合わせたLLM中心のフレームワークであるSRICLを提案する。
SRICLは、6つの公的なスパンラベル付きジョブアド文のコーパスにおいて、GPT-3.5よりも相当なSTRICT-F1の改善を達成し、ベースラインを加速し、無効なタグと幻覚したスパンを激減する。
論文 参考訳(メタデータ) (2026-04-23T10:46:07Z) - Adaptive Global and Fine-Grained Perceptual Fusion for MLLM Embeddings Compatible with Hard Negative Amplification [49.109117617514066]
マルチモーダル埋め込みは、視覚と言語を整合させるブリッジとして機能する。
MLLM埋め込みのための適応的グローバルおよび微粒な知覚融合法を提案する。
AGFF-Embedは、総合的および微粒な理解において、最先端のパフォーマンスを包括的に達成する。
論文 参考訳(メタデータ) (2026-02-05T14:52:35Z) - VIOLA: Towards Video In-Context Learning with Minimal Annotations [20.810620293371027]
我々は、豊富なラベルのないデータと最小限の専門家監督を相乗化するためのフレームワークVIOLAを紹介する。
我々のフレームワークは、低リソース環境で様々なベースラインを著しく上回り、最小限のアノテーションコストでロバストな適応を実現しています。
論文 参考訳(メタデータ) (2026-01-22T00:35:30Z) - URaG: Unified Retrieval and Generation in Multimodal LLMs for Efficient Long Document Understanding [55.45331924836242]
MLLM内での検索と生成を統一するフレームワークであるURaGについて述べる。
URaGは,計算オーバーヘッドを44~56%削減し,最先端性能を実現する。
論文 参考訳(メタデータ) (2025-11-13T17:54:09Z) - RECALL: REpresentation-aligned Catastrophic-forgetting ALLeviation via Hierarchical Model Merging [33.22889542330089]
大規模言語モデル(LLM)の内部表現は、学習知識の信頼できるプロキシとして機能する。
本稿では,過去データにアクセスせずに連続的な学習を行うための表現認識モデル統合フレームワークRECALLを提案する。
論文 参考訳(メタデータ) (2025-10-23T12:17:37Z) - Semantic Compression for Word and Sentence Embeddings using Discrete Wavelet Transform [11.234696109974255]
単語と文の埋め込みに対する離散ウェーブレット変換(DWT)の応用を実証的に活用する。
以上の結果から,DWTは意味的類似性タスクの性能をほとんど変更することなく,埋め込みの次元を50~93%削減できることがわかった。
論文 参考訳(メタデータ) (2025-07-31T23:46:40Z) - Iterative Augmentation with Summarization Refinement (IASR) Evaluation for Unstructured Survey data Modeling and Analysis [0.43988112145759295]
本研究は,大規模言語モデル(LLM)に基づくテキスト拡張のための原則的評価フレームワークを導入する。
実証評価の結果, GPT-3.5 Turbo はセマンティック忠実度, 多様性, 生成効率の最良のバランスを達成できた。
論文 参考訳(メタデータ) (2025-07-16T10:49:30Z) - Graft: Integrating the Domain Knowledge via Efficient Parameter Synergy for MLLMs [56.76586846269894]
MLLM(Multimodal Large Language Models)は、様々な領域で成功している。
その重要性にもかかわらず、ドメイン固有のMLLM間の知識共有の研究はほとんど未調査のままである。
専門家機能のモジュール構成を可能にする統一パラメータ統合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-30T15:07:41Z) - DelTA: An Online Document-Level Translation Agent Based on Multi-Level Memory [96.35468670508476]
大規模言語モデル(LLM)のための文書レバレッジ翻訳エージェントであるDelTAを紹介する。
DelTAは、様々な粒度とスパンにまたがる情報を格納するマルチレベルメモリ構造を備えている。
実験結果から,DelTAは翻訳の一貫性や品質において,強いベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2024-10-10T17:30:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。