論文の概要: ULTRA:Urdu Language Transformer-based Recommendation Architecture
- arxiv url: http://arxiv.org/abs/2602.11836v1
- Date: Thu, 12 Feb 2026 11:26:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.785882
- Title: ULTRA:Urdu Language Transformer-based Recommendation Architecture
- Title(参考訳): ULTRA:Urdu言語変換器を用いた推薦アーキテクチャ
- Authors: Alishbah Bashir, Fatima Qaiser, Ijaz Hussain,
- Abstract要約: ローリソース言語であるUrduには、効果的なセマンティックコンテンツレコメンデーションシステムがない。
我々はこれらの課題に対処するためにULTRA(Urdu Language Transformer-based Recommendation Architecture)を提案する。
大規模なUrduニュースコーパスで実施された大規模な実験により、提案アーキテクチャは多様なクエリタイプ間のレコメンデーション関連性を一貫して改善することを示した。
- 参考スコア(独自算出の注目度): 0.41292255339309664
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Urdu, as a low-resource language, lacks effective semantic content recommendation systems, particularly in the domain of personalized news retrieval. Existing approaches largely rely on lexical matching or language-agnostic techniques, which struggle to capture semantic intent and perform poorly under varying query lengths and information needs. This limitation results in reduced relevance and adaptability in Urdu content recommendation. We propose ULTRA (Urdu Language Transformer-based Recommendation Architecture),an adaptive semantic recommendation framework designed to address these challenges. ULTRA introduces a dual-embedding architecture with a query-length aware routing mechanism that dynamically distinguishes between short, intent-focused queries and longer, context-rich queries. Based on a threshold-driven decision process, user queries are routed to specialized semantic pipelines optimized for either title/headline-level or full-content/document level representations, ensuring appropriate semantic granularity during retrieval. The proposed system leverages transformer-based embeddings and optimized pooling strategies to move beyond surface-level keyword matching and enable context-aware similarity search. Extensive experiments conducted on a large-scale Urdu news corpus demonstrate that the proposed architecture consistently improves recommendation relevance across diverse query types. Results show gains in precision above 90% compared to single-pipeline baselines, highlighting the effectiveness of query-adaptive semantic alignment for low-resource languages. The findings establish ULTRA as a robust and generalizable content recommendation architecture, offering practical design insights for semantic retrieval systems in low-resource language settings.
- Abstract(参考訳): ローリソース言語であるUrduは、特にパーソナライズされたニュース検索の領域において、効果的なセマンティックコンテンツレコメンデーションシステムを持たない。
既存のアプローチは主に語彙マッチングや言語非依存の手法に依存しており、意味的な意図を捉えるのに苦労し、クエリの長さや情報要求の変化に乏しい。
この制限により、Urduコンテンツレコメンデーションの関連性と適応性が低下する。
これらの課題に対処するための適応型セマンティックレコメンデーションフレームワークULTRA(Urdu Language Transformer-based Recommendation Architecture)を提案する。
ULTRAは、クエリ長を意識したルーティング機構を備えた二重埋め込みアーキテクチャを導入し、ショートでインテントを重視したクエリと、より長いコンテキストリッチなクエリを動的に区別する。
しきい値駆動決定プロセスに基づいて、ユーザクエリはタイトル/ヘッドラインレベルまたはフルコンテンツ/ドキュメントレベルの表現に最適化されたセマンティックパイプラインにルーティングされ、検索中に適切なセマンティックな粒度が確保される。
提案システムはトランスフォーマーベースの埋め込みと最適化されたプール戦略を利用して,表面レベルのキーワードマッチングを超えてコンテキスト認識の類似性検索を可能にする。
大規模なUrduニュースコーパスで実施された大規模な実験により、提案アーキテクチャは多様なクエリタイプ間のレコメンデーション関連性を一貫して改善することを示した。
その結果,低リソース言語に対するクエリ適応型セマンティックアライメントの有効性が示された。
その結果,ULTRAは堅牢で汎用的なコンテントレコメンデーションアーキテクチャとして確立され,低リソース言語設定におけるセマンティック検索システムのための実用的な設計上の洞察を提供する。
関連論文リスト
- Unleashing the Native Recommendation Potential: LLM-Based Generative Recommendation via Structured Term Identifiers [51.64398574262054]
本稿では,意味的にリッチで標準化されたテキストキーワードの集合として定義された用語ID(TID)を導入し,堅牢な項目識別子として機能する。
本稿では,TIDを中心にした新しいフレームワークGRLMを提案し,項目のメタデータを標準化されたTIDに変換し,統合的インストラクションファインタニングを活用して,用語の内部化とシーケンシャルレコメンデーションを協調的に最適化する。
論文 参考訳(メタデータ) (2026-01-11T07:53:20Z) - Hint-Augmented Re-ranking: Efficient Product Search using LLM-Based Query Decomposition [20.966359103135762]
LLMは,eコマースクエリにおいて最下位の意図を明らかにすることができることを示す。
提案手法では,クエリを検索と同時に生成した属性値ヒントに分解する。
本手法はMAPにおける検索効率を10.9ポイント改善し,ベースライン上のMRRにおいて5.9ポイントのランク付けを行う。
論文 参考訳(メタデータ) (2025-11-17T23:53:25Z) - Reasoning-enhanced Query Understanding through Decomposition and Interpretation [87.56450566014625]
ReDIは、分解と解釈によるクエリ理解のための推論強化アプローチである。
我々は,大規模検索エンジンから実世界の複雑なクエリの大規模データセットをコンパイルした。
BRIGHT と BEIR の実験により、ReDI はスパースと密度の高い検索パラダイムの両方において、強いベースラインを一貫して超えることを示した。
論文 参考訳(メタデータ) (2025-09-08T10:58:42Z) - Tree-Based Text Retrieval via Hierarchical Clustering in RAGFrameworks: Application on Taiwanese Regulations [0.0]
階層的なクラスタリングに基づく検索手法を提案する。
本手法は,意味的関連コンテンツを適応的に選択しながら,システム応答の精度と関連性を維持する。
我々のフレームワークは実装が簡単で、既存のRAGパイプラインと簡単に統合できます。
論文 参考訳(メタデータ) (2025-06-16T15:34:29Z) - ELITE: Embedding-Less retrieval with Iterative Text Exploration [5.8851517822935335]
大規模言語モデル(LLM)は自然言語処理において顕著な進歩を遂げた。
長期のコンテキスト制約を維持する能力は、ドキュメントレベルやマルチターンタスクのパフォーマンスを制限します。
論文 参考訳(メタデータ) (2025-05-17T08:48:43Z) - Improving Retrieval-augmented Text-to-SQL with AST-based Ranking and Schema Pruning [10.731045939849125]
本稿では,テキストからセマンティックへの解析に注目する。
商用データベースのスキーマのサイズとビジネスインテリジェンスソリューションのデプロイ可能性に関する課題から,入力データベース情報を動的に取得する $textASTReS$ を提案する。
論文 参考訳(メタデータ) (2024-07-03T15:55:14Z) - CART: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
クロスモーダル検索は、異なるモーダルデータの相互作用を通じて、クエリと意味的に関連するインスタンスを検索することを目的としている。
従来のソリューションでは、クエリと候補の間のスコアを明示的に計算するために、シングルトウワーまたはデュアルトウワーのフレームワークを使用している。
粗大なセマンティックモデリングに基づく生成的クロスモーダル検索フレームワーク(CART)を提案する。
論文 参考訳(メタデータ) (2024-06-25T12:47:04Z) - Text-Video Retrieval with Global-Local Semantic Consistent Learning [122.15339128463715]
我々は,シンプルで効果的なグローバル局所意味的一貫性学習(GLSCL)を提案する。
GLSCLは、テキストビデオ検索のためのモダリティをまたいだ潜在共有セマンティクスを活用する。
本手法はSOTAと同等の性能を実現し,計算コストの約220倍の高速化を実現している。
論文 参考訳(メタデータ) (2024-05-21T11:59:36Z) - Leveraging Translation For Optimal Recall: Tailoring LLM Personalization
With User Profiles [0.0]
本稿では,言語間情報検索システムにおけるリコール改善のための新しい手法について検討する。
提案手法は,マルチレベル翻訳,セマンティック埋め込みに基づく拡張,ユーザプロファイル中心の拡張を組み合わせた手法である。
ニュースとTwitterデータセットの実験では、ベースラインBM25ランキングよりも優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-21T03:25:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。