論文の概要: Demo: Soccer Information Retrieval via Natural Queries using SoccerRAG
- arxiv url: http://arxiv.org/abs/2406.01280v2
- Date: Mon, 22 Jul 2024 06:44:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-10 23:05:25.509151
- Title: Demo: Soccer Information Retrieval via Natural Queries using SoccerRAG
- Title(参考訳): デモ: SoccerRAGを用いた自然言語によるサッカー情報検索
- Authors: Aleksander Theo Strand, Sushant Gautam, Cise Midoglu, Pål Halvorsen,
- Abstract要約: SoccerRAGはRetrieval Augmented Generation(RAG)とLarge Language Models(LLM)のパワーを活用するために設計された革新的なフレームワークである。
マルチモーダルデータセットを利用することで、動的クエリと自動データバリデーションをサポートする。
コア機能を取り巻くChainlitフレームワークに基づいた,インタラクティブなユーザインターフェース(UI)を新たに提案する。
- 参考スコア(独自算出の注目度): 42.095162323265676
- License:
- Abstract: The rapid evolution of digital sports media necessitates sophisticated information retrieval systems that can efficiently parse extensive multimodal datasets. This paper demonstrates SoccerRAG, an innovative framework designed to harness the power of Retrieval Augmented Generation (RAG) and Large Language Models (LLMs) to extract soccer-related information through natural language queries. By leveraging a multimodal dataset, SoccerRAG supports dynamic querying and automatic data validation, enhancing user interaction and accessibility to sports archives. We present a novel interactive user interface (UI) based on the Chainlit framework which wraps around the core functionality, and enable users to interact with the SoccerRAG framework in a chatbot-like visual manner.
- Abstract(参考訳): デジタルスポーツメディアの急速な進化は、広範囲なマルチモーダルデータセットを効率的に解析できる高度な情報検索システムを必要とする。
本稿では,Large Language Models (LLM) とRetrieval Augmented Generation (RAG) のパワーを利用した,自然言語クエリによるサッカー関連情報の抽出を目的とした,革新的なフレームワークである SoccerRAG を紹介する。
マルチモーダルデータセットを活用することにより、動的クエリと自動データバリデーションをサポートし、ユーザのインタラクションとスポーツアーカイブへのアクセシビリティを向上させる。
本稿では,Chainlitフレームワークをベースとした対話型ユーザインタフェース(UI)を提案する。
関連論文リスト
- Enhancing Multimodal Query Representation via Visual Dialogues for End-to-End Knowledge Retrieval [26.585985828583304]
本稿では,マルチモーダルクエリを理解可能なテキスト検索機能を実現するために,エンドツーエンドのマルチモーダル検索システムRet-XKnowを提案する。
マルチモーダルインタラクションを効果的に学習するために、視覚対話データセットから構築したVisual Dialogue-to-Retrievalデータセットも導入する。
提案手法は,ゼロショット設定における検索性能を大幅に向上するだけでなく,微調整シナリオの大幅な改善も達成できることを示す。
論文 参考訳(メタデータ) (2024-11-13T04:32:58Z) - GUI Agents with Foundation Models: A Comprehensive Survey [52.991688542729385]
この調査は(M)LLMベースのGUIエージェントに関する最近の研究を集約する。
データ、フレームワーク、アプリケーションにおける重要なイノベーションを強調します。
本稿では, (M)LLM ベースの GUI エージェントの分野におけるさらなる発展を期待する。
論文 参考訳(メタデータ) (2024-11-07T17:28:10Z) - EDGE: Enhanced Grounded GUI Understanding with Enriched Multi-Granularity Synthetic Data [15.801018643716437]
本稿では,大規模視覚言語モデル(LVLM)のGUI理解と対話能力を,データ駆動型アプローチにより向上することを目的とする。
本稿では,Web上のWebページから大規模で粒度の高いトレーニングデータを自動的に生成する汎用データ合成フレームワークEDGEを提案する。
提案手法は,手動アノテーションへの依存を著しく低減し,研究者がWeb上で利用可能な膨大な公開リソースを活用して作業を進めることを可能にする。
論文 参考訳(メタデータ) (2024-10-25T10:46:17Z) - An Interactive Multi-modal Query Answering System with Retrieval-Augmented Large Language Models [21.892975397847316]
本稿では,新たに開発したマルチモーダル検索フレームワークとナビゲーショングラフインデックスを用いて,対話型マルチモーダルクエリ・アンサーリング(MQA)システムを提案する。
MQAの特筆すべき点は、異なるモダリティの重要性を評価するために、コントラスト学習を利用することである。
本システムは,計算プルーニング技術を用いて改良した,先進的なナビゲーショングラフインデックスによる効率的な検索を実現する。
論文 参考訳(メタデータ) (2024-07-05T02:01:49Z) - LLaRA: Supercharging Robot Learning Data for Vision-Language Policy [56.505551117094534]
視覚言語モデル(VLM)は、状態情報を視覚的テキストのプロンプトとして処理し、テキスト内のポリシー決定に応答することができる。
LLaRA:Large Language and Robotics Assistantは,ロボットの行動ポリシーを会話として定式化するフレームワークである。
論文 参考訳(メタデータ) (2024-06-28T17:59:12Z) - SoccerRAG: Multimodal Soccer Information Retrieval via Natural Queries [42.095162323265676]
SoccerRAGはRetrieval Augmented Generation(RAG)とLarge Language Models(LLM)のパワーを活用するために設計された革新的なフレームワークである。
マルチモーダルデータセットを利用することで、動的クエリと自動データバリデーションをサポートする。
評価の結果,従来の検索システムに比較して,複雑なクエリを効果的に処理できることが示唆された。
論文 参考訳(メタデータ) (2024-06-03T12:39:04Z) - SoccerNet-Echoes: A Soccer Game Audio Commentary Dataset [46.60191376520379]
本稿では,サッカーゲーム放送からの音声コメントの自動書き起こしによる,サッカーネットデータセットの拡張であるFocoNet-Echoesについて述べる。
視覚的および聴覚的コンテンツとともにテキストデータを組み込むことで、サッカーゲームのダイナミクスを捉えるアルゴリズムを開発するための総合的なリソースとなることを目的としている。
論文 参考訳(メタデータ) (2024-05-12T18:25:38Z) - KamerRaad: Enhancing Information Retrieval in Belgian National Politics through Hierarchical Summarization and Conversational Interfaces [55.00702535694059]
KamerRaadは、大きな言語モデルを活用するAIツールで、市民がベルギーの政治情報と対話的に関わるのを助ける。
このツールは、議会の手続きから重要な抜粋を抽出し、簡潔に要約し、次いで生成AIに基づくインタラクションの可能性を示す。
論文 参考訳(メタデータ) (2024-04-22T15:01:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。