論文の概要: OpenLifelogQA: An Open-Ended Multi-Modal Lifelog Question-Answering Dataset
- arxiv url: http://arxiv.org/abs/2508.03583v1
- Date: Tue, 05 Aug 2025 15:50:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-06 18:18:56.053371
- Title: OpenLifelogQA: An Open-Ended Multi-Modal Lifelog Question-Answering Dataset
- Title(参考訳): OpenLifelogQA: オープンソースのマルチモーダルライフログ質問回答データセット
- Authors: Quang-Linh Tran, Binh Nguyen, Gareth J. F. Jones, Cathal Gurrin,
- Abstract要約: 本稿では,OpenLifelogQAと呼ばれる新しいライフログQAデータセットを提案する。
われわれのデータセットは、日々のライフログ利用における実世界の応用による、オープンで実用的なQAに焦点を当てている。
我々はこのQ&Aデータセットを研究コミュニティに公開し、ライフログ技術の新たな研究を支援する。
- 参考スコア(独自算出の注目度): 3.7677338505963633
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Lifelogging refers to the process of passively collecting, storing, and analysing personal daily life data using wearable devices. This data can support applications in memory preservation and enhancement. For example, using an ask-and-answer strategy, question-answering (QA) on lifelog data opens an interactive and interesting way to explore memorable events and insights into daily life. However, research resources for QA on lifelog data are limited to small-sized or synthetic QA datasets. In this paper, we present a novel lifelog QA dataset called OpenLifelogQA, building upon an 18-month lifelog dataset. Our dataset focuses on an open-ended and practical QA with real-world application in daily lifelog usage. We construct 14,187 pairs of Q&A with diverse types and difficulty levels. A baseline experiment is reported for this dataset with competitive average performance of 89.7% BERT Score, 25.87% ROUGE-L and 3.9665 LLM Score from LLaVA-NeXT-Interleave 7B model. We release this Q&A dataset to the research community to support new research into lifelog technologies, such as enabling personal chat-based assistants for lifelog data to become a reality.
- Abstract(参考訳): ライフログ(Lifelogging)とは、ウェアラブルデバイスを使用して個人の日常生活データを受動的に収集、保存、分析するプロセスである。
このデータは、メモリ保存および拡張のアプリケーションをサポートすることができる。
例えば、QA(Q&A戦略)をライフログデータに適用することで、記憶に残る出来事や日々の生活に対する洞察を探求するインタラクティブで興味深い方法が開かれる。
しかし、ライフログデータに対するQAの研究資源は、小型または合成QAデータセットに限られている。
本稿では,18ヶ月のライフログデータセットに基づいて,OpenLifelogQAと呼ばれる新しいライフログQAデータセットを提案する。
われわれのデータセットは、日々のライフログ利用における実世界の応用による、オープンで実用的なQAに焦点を当てている。
多様なタイプと難易度を持つ14,187対のQ&Aを構築した。
LLaVA-NeXT-Interleave 7Bモデルから、89.7%のBERTスコア、25.87%のROUGE-L、3.9665のLMスコアの競合平均性能を持つこのデータセットのベースライン実験が報告されている。
我々は、このQ&Aデータセットを研究コミュニティにリリースし、ライフログデータのためのパーソナルチャットベースのアシスタントが現実になることを可能にするなど、ライフログ技術に関する新たな研究を支援する。
関連論文リスト
- SessionIntentBench: A Multi-task Inter-session Intention-shift Modeling Benchmark for E-commerce Customer Behavior Understanding [64.45047674586671]
本稿では,意図木の概念を導入し,データセットキュレーションパイプラインを提案する。
我々は,L(V)LMsのセッション間意図シフト理解能力を評価するマルチモーダルベンチマークSessionIntentBenchを構築した。
1,952,177の意図的エントリ,1,132,145のセッション意図軌跡,および10,905のセッションを使用してマイニングされた13,003,664のタスクにより,既存のセッションデータを活用可能なスケーラブルな方法を提供する。
論文 参考訳(メタデータ) (2025-07-27T09:04:17Z) - LifeIR at the NTCIR-18 Lifelog-6 Task [7.029612431665877]
NTCIR-18 Lifelog-6 Challengeのライフログセマンティックアクセスタスク(LSAT)は、大規模なユーザのライフログから関連画像を取得することに焦点を当てている。
本稿では,ライフログ検索における様々な課題に対処するため,テキストを用いて画像検索を行うための多段階パイプラインを提案する。
論文 参考訳(メタデータ) (2025-05-27T10:21:57Z) - LSC-ADL: An Activity of Daily Living (ADL)-Annotated Lifelog Dataset Generated via Semi-Automatic Clustering [5.797232480259793]
LSCデータセットから派生したADLアノテーション付きライフログデータセットであるLCC-ADLを紹介する。
正確なADLアノテーションを生成し、検索説明性を向上させる。
このデータセットは、ライフログ検索、アクティビティ認識、エゴセントリックビジョンの研究を前進させるものと信じている。
論文 参考訳(メタデータ) (2025-04-02T18:39:28Z) - Time-MQA: Time Series Multi-Task Question Answering with Context Enhancement [55.2439260314328]
Time Series Multi-Task Question Answering (Time-MQA)は、複数の時系列タスクにわたる自然言語クエリを可能にする統合フレームワークである。
Time-MQAの中心はTSQAデータセットである。
論文 参考訳(メタデータ) (2025-02-26T13:47:13Z) - SensorQA: A Question Answering Benchmark for Daily-Life Monitoring [1.925154869666529]
SensorQAは、日常生活監視のための長期時系列センサデータのための人為的な質問応答データセットである。
このデータセット上で、最先端AIモデルのベンチマークを確立し、典型的なエッジデバイス上でのパフォーマンスを評価する。
我々の結果は、現在のモデルと最適なQAパフォーマンスと効率のギャップを明らかにし、新しいコントリビューションの必要性を強調します。
論文 参考訳(メタデータ) (2025-01-09T05:06:44Z) - DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。
我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。
私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-07-01T18:58:22Z) - Automatic Question-Answer Generation for Long-Tail Knowledge [65.11554185687258]
テールエンティティのための特別なQAデータセットを生成するための自動アプローチを提案する。
我々は,新たに生成された長尾QAデータセットに事前学習したLLMを用いて広範な実験を行う。
論文 参考訳(メタデータ) (2024-03-03T03:06:31Z) - Test-Time Self-Adaptive Small Language Models for Question Answering [63.91013329169796]
ラベルのないテストデータのみを用いて、より小さな自己適応型LMの能力を示し、検討する。
提案した自己適応戦略は,ベンチマークQAデータセットの大幅な性能向上を示す。
論文 参考訳(メタデータ) (2023-10-20T06:49:32Z) - TimelineQA: A Benchmark for Question Answering over Timelines [22.931761248196363]
ライフログ(Lifelog)とは、人生で経験した経験を記述したものである。
Lifelogsは、コンテキスト内でアドバイスを提供しようとするときに、パーソナルアシスタントに重要なリソースを提供することができる。
ライフログのクエリの進捗を加速するベンチマークであるTimelineQA1を作成した。
論文 参考訳(メタデータ) (2023-06-01T18:17:13Z) - Disfl-QA: A Benchmark Dataset for Understanding Disfluencies in Question
Answering [21.857273918785452]
Disfl-QAは、データセットに対する新たな課題である。
Disfl-QAには、テキストのより包括的な理解を必要とする様々な難題が含まれている。
また,データ拡張手法により性能の低下を部分的に回復し,さらに細調整に金のデータを用いることの有効性を示した。
論文 参考訳(メタデータ) (2021-06-08T00:03:40Z) - Rapidly Bootstrapping a Question Answering Dataset for COVID-19 [88.86456834766288]
我々は、新型コロナウイルスに特化して設計された質問応答データセットの始まりであるCovidQAを紹介する。
これは、そのタイプの最初の公開リソースであり、より実質的な評価資源が利用可能になるまで研究を導くためのストップギャップとして意図されている。
論文 参考訳(メタデータ) (2020-04-23T17:35:11Z) - QActor: On-line Active Learning for Noisy Labeled Stream Data [10.814099534254922]
そこで本研究では,品質モデルによるクリーンなサンプルの選択と,最も情報に富む真のラベルに対する託宣を積極的にクエリするQActorを提案する。
QActorは、データフィルタリングのための品質モデルの利点と、最も情報性の高いデータのクリーニングのためのオラクルクエリを素早く組み合わせます。
QActorの中心的な機能は、各データバッチの学習損失に応じてクエリ制限を動的に調整することである。
論文 参考訳(メタデータ) (2020-01-28T15:13:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。