論文の概要: OwlerLite: Scope- and Freshness-Aware Web Retrieval for LLM Assistants
- arxiv url: http://arxiv.org/abs/2601.17824v1
- Date: Sun, 25 Jan 2026 13:11:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.419187
- Title: OwlerLite: Scope- and Freshness-Aware Web Retrieval for LLM Assistants
- Title(参考訳): OwlerLite: LLMアシスタントのためのスコープと鮮度を考慮したWeb検索
- Authors: Saber Zerhoudi, Michael Dinzinger, Michael Granitzer, Jelena Mitrovic,
- Abstract要約: OwlerLiteはブラウザベースのRAGシステムで、ユーザが定義したスコープとデータの鮮度を検索の中心とする。
フレッシュネスを意識したクローラーは、ライブページを監視し、意味のある更新を識別するためにセマンティックチェンジ検出器を使用し、変更したコンテンツを選択的に再インデックスする。
- 参考スコア(独自算出の注目度): 3.4012351571963073
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Browser-based language models often use retrieval-augmented generation (RAG) but typically rely on fixed, outdated indices that give users no control over which sources are consulted. This can lead to answers that mix trusted and untrusted content or draw on stale information. We present OwlerLite, a browser-based RAG system that makes user-defined scopes and data freshness central to retrieval. Users define reusable scopes-sets of web pages or sources-and select them when querying. A freshness-aware crawler monitors live pages, uses a semantic change detector to identify meaningful updates, and selectively re-indexes changed content. OwlerLite integrates text relevance, scope choice, and recency into a unified retrieval model. Implemented as a browser extension, it represents a step toward more controllable and trustworthy web assistants.
- Abstract(参考訳): ブラウザベースの言語モデルは、しばしば検索強化世代(RAG)を使用するが、一般的には、どのソースが参照されているかを制御できない固定された時代遅れのインデックスに依存している。
これにより、信頼されたコンテンツと信頼されていないコンテンツが混ざり合ったり、古い情報を引き付けたりする。
我々は,ユーザ定義のスコープとデータの鮮度を検索の中心とするブラウザベースのRAGシステムであるOwlerLiteを提案する。
ユーザは、Webページやソースの再利用可能なスコープセットを定義し、クエリ時にそれらを選択する。
フレッシュネスを意識したクローラーは、ライブページを監視し、意味のある更新を識別するためにセマンティックチェンジ検出器を使用し、変更したコンテンツを選択的に再インデックスする。
OwlerLiteは、テキストの関連性、スコープの選択、および参照を統一された検索モデルに統合する。
ブラウザの拡張機能として実装され、よりコントロール可能で信頼性の高いWebアシスタントへの一歩である。
関連論文リスト
- Nested Browser-Use Learning for Agentic Information Seeking [60.775556172513014]
情報検索(IS)エージェントは広範囲にわたる検索タスクで高いパフォーマンスを達成しているが、ツールの使用はAPIレベルのスニペット検索やURLベースのページフェッチに限られている。
我々はNested Browser-Use Learning (NestBrowse)を提案する。NestBrowseは、ネストされた構造を通してページ探索からインタラクション制御を分離する最小かつ完全なブラウザアクションフレームワークである。
論文 参考訳(メタデータ) (2025-12-29T17:59:14Z) - Leveraging LLM-Assisted Query Understanding for Live Retrieval-Augmented Generation [6.62734677678023]
実世界のライブ検索拡張生成(RAG)システムは、ノイズがありあいまいで、複数の意図を含むユーザクエリを処理する場合、課題に直面します。
本稿では,オープンドメイン環境におけるRAGシステムの堅牢性と有効性向上を目的とした新しいフレームワークであるOmni-RAGを紹介する。
論文 参考訳(メタデータ) (2025-06-26T15:35:12Z) - Search Arena: Analyzing Search-Augmented LLMs [61.28673331156436]
クラウドソーシングで大規模で,24,000以上のペア化されたマルチターンユーザインタラクションの人為的なデータセットであるSearch Arenaを紹介した。
データセットはさまざまな意図や言語にまたがっており、人間の好みの投票数約12,000の完全なシステムトレースが含まれている。
分析の結果,引用されたコンテンツが属性付クレームを直接サポートしていない場合でも,ユーザの嗜好は引用数に影響されていることが明らかとなった。
論文 参考訳(メタデータ) (2025-06-05T17:59:26Z) - Improving Retrieval in Sponsored Search by Leveraging Query Context Signals [6.152499434499752]
本稿では,クエリをリッチなコンテキスト信号で拡張することで,クエリ理解を強化する手法を提案する。
我々は、Web検索のタイトルとスニペットを使って、現実世界の情報にクエリを接地し、GPT-4を使ってクエリの書き直しと説明を生成する。
我々の文脈認識アプローチは文脈自由モデルよりも大幅に優れている。
論文 参考訳(メタデータ) (2024-07-19T14:28:53Z) - AutoScraper: A Progressive Understanding Web Agent for Web Scraper Generation [54.17246674188208]
Webスクレイピングは、Webサイトからデータを抽出し、自動データ収集を可能にし、データ分析機能を強化し、手動のデータ入力作業を最小化する強力なテクニックである。
既存の手法では、ラッパーベースの手法は、新しいウェブサイトで直面する場合、適応性とスケーラビリティの制限に悩まされる。
本稿では,大規模言語モデル(LLM)を用いたWebスクレイパー生成のパラダイムを紹介し,多様なWeb環境をより効率的に処理できる2段階フレームワークであるAutoScraperを提案する。
論文 参考訳(メタデータ) (2024-04-19T09:59:44Z) - Backtracing: Retrieving the Cause of the Query [7.715089044732362]
本稿では,ユーザクエリを最も引き起こす可能性のあるテキストセグメントをシステムで検索する,バックトラシングのタスクを紹介する。
人気情報検索手法と言語モデリング手法のゼロショット性能を評価する。
以上の結果から,後方追跡には改善の余地があり,新たな検索手法が必要であることが示唆された。
論文 参考訳(メタデータ) (2024-03-06T18:59:02Z) - Synergistic Interplay between Search and Large Language Models for
Information Retrieval [141.18083677333848]
InteRにより、RMはLLM生成した知識コレクションを使用してクエリの知識を拡張することができる。
InteRは、最先端手法と比較して総合的に優れたゼロショット検索性能を実現する。
論文 参考訳(メタデータ) (2023-05-12T11:58:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。