論文の概要: Beyond SEO: A Transformer-Based Approach for Reinventing Web Content Optimisation
- arxiv url: http://arxiv.org/abs/2507.03169v1
- Date: Thu, 03 Jul 2025 20:52:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.606423
- Title: Beyond SEO: A Transformer-Based Approach for Reinventing Web Content Optimisation
- Title(参考訳): トランスフォーマーによるWebコンテンツ最適化の再発明
- Authors: Florian Lüttgenau, Imar Colic, Gervasio Ramirez,
- Abstract要約: 生成エンジン最適化(GEO)のためのドメイン固有の微調整手法を提案する。
提案手法は,1,905個のWebサイトコンテンツペアからなる合成学習データに基づいて,BARTベースのトランスフォーマーを微調整する。
最適化されたコンテンツは、生成的検索応答において顕著な可視性の向上を示し、15.63%の絶対的な単語数の改善、30.96%の位置調整された単語数メトリクスの改善がある。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rise of generative AI search engines is disrupting traditional SEO, with Gartner predicting 25% reduction in conventional search usage by 2026. This necessitates new approaches for web content visibility in AI-driven search environments. We present a domain-specific fine-tuning approach for Generative Engine Optimization (GEO) that transforms web content to improve discoverability in large language model outputs. Our method fine-tunes a BART-base transformer on synthetically generated training data comprising 1,905 cleaned travel website content pairs. Each pair consists of raw website text and its GEO-optimized counterpart incorporating credible citations, statistical evidence, and improved linguistic fluency. We evaluate using intrinsic metrics (ROUGE-L, BLEU) and extrinsic visibility assessments through controlled experiments with Llama-3.3-70B. The fine-tuned model achieves significant improvements over baseline BART: ROUGE-L scores of 0.249 (vs. 0.226) and BLEU scores of 0.200 (vs. 0.173). Most importantly, optimized content demonstrates substantial visibility gains in generative search responses with 15.63% improvement in absolute word count and 30.96% improvement in position-adjusted word count metrics. This work provides the first empirical demonstration that targeted transformer fine-tuning can effectively enhance web content visibility in generative search engines with modest computational resources. Our results suggest GEO represents a tractable approach for content optimization in the AI-driven search landscape, offering concrete evidence that small-scale, domain-focused fine-tuning yields meaningful improvements in content discoverability.
- Abstract(参考訳): 生成型AI検索エンジンの台頭は、従来のSEOをディスラプトし、Gartnerは2026年までに従来の検索使用量の25%削減を予測している。
これにより、AI駆動検索環境におけるWebコンテンツの可視性に対する新たなアプローチが必要になる。
本稿では,大規模言語モデル出力の発見可能性を向上させるために,Webコンテンツを変換するジェネレーティブエンジン最適化(GEO)のためのドメイン固有の微調整手法を提案する。
提案手法は,1,905個のWebサイトコンテンツペアからなる合成学習データに基づいて,BARTベースのトランスフォーマーを微調整する。
それぞれのペアは、生のWebサイトテキストと、そのGEOに最適化されたテキストから成り、信頼できる引用、統計的証拠、言語流布の改善を取り入れている。
我々は,Llama-3.3-70Bを用いた制御実験により,内因性測定値(ROUGE-L,BLEU)と外因性視認性評価値を用いて評価を行った。
ROUGE-Lスコアは0.249(vs. 0.226)、BLEUスコアは0.200(vs. 0.173)である。
最も重要なことは、最適化されたコンテンツは、生成的な検索応答において、絶対的な単語数では15.63%、位置調整された単語数では30.96%、かなりの可視性の向上を示していることである。
この研究は、ターゲティングトランスフォーマーの微調整によって、控えめな計算資源を持つ生成検索エンジンにおけるWebコンテンツの可視性を効果的に向上する、最初の実証的なデモンストレーションを提供する。
以上の結果から,GEOはAIによる検索環境におけるコンテンツ最適化の難易度の高いアプローチであり,小規模でドメイン中心の微調整がコンテンツの発見可能性において有意義な改善をもたらすという具体的な証拠を提供する。
関連論文リスト
- KARE-RAG: Knowledge-Aware Refinement and Enhancement for RAG [63.82127103851471]
Retrieval-Augmented Generation (RAG)は、大規模言語モデルがより広範な知識ソースにアクセスすることを可能にする。
ノイズの多いコンテンツを処理するために生成モデルの能力を向上させることは、ロバストなパフォーマンスに等しく重要であることを実証する。
本稿では,3つの重要なイノベーションを通じて知識利用を改善するKARE-RAGを提案する。
論文 参考訳(メタデータ) (2025-06-03T06:31:17Z) - Zero-Indexing Internet Search Augmented Generation for Large Language Models [15.138260067336455]
大規模言語モデルの性能向上に有効な手法として,検索用拡張生成が登場している。
このアプローチは通常、静的な前処理コーパスを管理するために様々なインデックス機構を使用する内部検索モジュールに依存します。
本稿では,標準検索エンジンAPIを活用して最新のオンライン情報を動的に統合する代替手法について検討する。
論文 参考訳(メタデータ) (2024-11-29T05:31:04Z) - Collaborative Vision-Text Representation Optimizing for Open-Vocabulary Segmentation [82.95830628372845]
本稿では,Open-Vocabulary encoder(OVS)分野における協調視覚テキスト最適化機構を提案する。
我々の知る限り、私たちはOVSフィールド内で協調的な視覚テキスト最適化メカニズムを最初に確立しました。
オープン語彙のセマンティックセグメンテーションでは、この手法は、+0.5, +2.3, +3.4, +0.4, +1.1 mIoU の従来の最先端アプローチよりも優れている。
論文 参考訳(メタデータ) (2024-08-01T17:48:08Z) - Tree Search for Language Model Agents [69.43007235771383]
対話型Web環境での探索と多段階計画を行うために,LMエージェントの推論時探索アルゴリズムを提案する。
我々のアプローチは、実環境空間内で機能する最優先木探索の一形態である。
現実的なWebタスクにおいて有効性を示すLMエージェントのための最初の木探索アルゴリズムである。
論文 参考訳(メタデータ) (2024-07-01T17:07:55Z) - LOLA: LLM-Assisted Online Learning Algorithm for Content Experiments [2.2021543101231167]
現代のメディア企業は、ユーザーにとって最も魅力的で魅力的なコンテンツを特定するために、自動化され効率的な方法を必要としている。
本稿ではまず,3つの純LLM手法を用いて,最もキャッチラインを識別する能力について検討する。
LLM-Assisted Online Learning Algorithm (LOLA) は,Large Language Models (LLM) と適応実験を統合し,コンテンツ配信を最適化する新しいフレームワークである。
論文 参考訳(メタデータ) (2024-06-03T07:56:58Z) - GEO: Generative Engine Optimization [50.45232692363787]
我々は、生成エンジン(GE)の統一的な枠組みを定式化する。
GEは大規模な言語モデル(LLM)を使用して情報を収集し、ユーザクエリに応答する。
生成エンジンは通常、複数のソースから情報を合成し、それらを要約することでクエリを満足する。
我々は、生成エンジン応答におけるコンテンツの可視性向上を支援するために、コンテンツ作成者を支援する最初の新しいパラダイムである生成エンジン最適化(GEO)を紹介する。
論文 参考訳(メタデータ) (2023-11-16T10:06:09Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。