論文の概要: Lazy or Efficient? Towards Accessible Eye-Tracking Event Detection Using LLMs
- arxiv url: http://arxiv.org/abs/2604.13243v1
- Date: Tue, 14 Apr 2026 19:21:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.267876
- Title: Lazy or Efficient? Towards Accessible Eye-Tracking Event Detection Using LLMs
- Title(参考訳): 遅延・効率性? LLMを用いたアクセシブルアイトラッキングイベント検出に向けて
- Authors: Dongyang Guo, Yasmeen Abdrabou, Enkelejda Kasneci,
- Abstract要約: I-VTとI-DTは、前処理とパラメータ化に非常に敏感である。
この研究は、自然言語命令をエンドツーエンドの分析に変換する、コードフリーで大規模言語モデル(LLM)駆動のパイプラインを導入している。
- 参考スコア(独自算出の注目度): 16.611818489854787
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Gaze event detection is fundamental to vision science, human-computer interaction, and applied analytics. However, current workflows often require specialized programming knowledge and careful handling of heterogeneous raw data formats. Classical detectors such as I-VT and I-DT are effective but highly sensitive to preprocessing and parameterization, limiting their usability outside specialized laboratories. This work introduces a code-free, large language model (LLM)-driven pipeline that converts natural language instructions into an end-to-end analysis. The system (1) inspects raw eye-tracking files to infer structure and metadata, (2) generates executable routines for data cleaning and detector implementation from concise user prompts, (3) applies the generated detector to label fixations and saccades, and (4) returns results and explanatory reports, and allows users to iteratively optimize their code by editing the prompt. Evaluated on public benchmarks, the approach achieves accuracy comparable to traditional methods while substantially reducing technical overhead. The framework lowers barriers to entry for eye-tracking research, providing a flexible and accessible alternative to code-intensive workflows.
- Abstract(参考訳): 迷路イベント検出は、視覚科学、人間とコンピュータの相互作用、および応用分析の基礎である。
しかし、現在のワークフローは特別なプログラミング知識と不均一な生データフォーマットの慎重な処理を必要とすることが多い。
I-VTやI-DTのような古典的な検出器は、前処理やパラメータ化に非常に敏感であり、特殊な研究室の外での使用性を制限している。
この研究は、自然言語命令をエンドツーエンドの分析に変換する、コードフリーで大規模言語モデル(LLM)駆動のパイプラインを導入している。
システム(1)は、構造やメタデータを推測するために生の目追跡ファイルを検査し、(2)簡潔なユーザプロンプトからデータクリーニングおよび検出器実装のための実行ルーチンを生成し、(3)生成した検出器をラベル付けやササードに適用し、(4)結果と説明報告を返却し、そのプロンプトを編集してコードを反復的に最適化する。
公開ベンチマークに基づいて評価すると、この手法は従来の手法に匹敵する精度を達成し、技術的オーバーヘッドを大幅に削減する。
このフレームワークは、視線追跡研究の参入障壁を低くし、コード集約型ワークフローの柔軟な代替手段を提供する。
関連論文リスト
- Heuristic-inspired Reasoning Priors Facilitate Data-Efficient Referring Object Detection [53.988759250627425]
HeROD(Heuristic-inspired ROD)は、明示的で解釈可能な空間的および意味的推論を注入する軽量でモデルに依存しないフレームワークである。
HeRODは、スカーセラベル体制において強い接地ベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2026-03-25T10:33:22Z) - Trajectory2Task: Training Robust Tool-Calling Agents with Synthesized Yet Verifiable Data for Complex User Intents [52.30603055218294]
Trajectory2Taskは,3つの現実的なユーザシナリオの下で大規模なツール使用を研究するための,検証可能なデータ生成パイプラインである。
有効なツールコールトラジェクトリを、制御されたインテント適応を伴うユーザ向けタスクに変換する。
我々は、生成された複雑なユーザシナリオタスクに対して、7つの最先端のLCMをベンチマークし、頻繁な障害を観察する。
論文 参考訳(メタデータ) (2026-01-28T00:36:13Z) - Toward Automated and Trustworthy Scientific Analysis and Visualization with LLM-Generated Code [6.068120728706316]
大規模言語モデル(LLM)は、自然言語記述からコードを生成することで、有望なソリューションを提供する。
実際の研究課題を反映したドメインインスパイアされたプロンプトのベンチマークスイートを構築した。
人間の介入なしには, LLM生成コードの信頼性は限られている。
論文 参考訳(メタデータ) (2025-11-26T21:27:03Z) - Advancing Machine-Generated Text Detection from an Easy to Hard Supervision Perspective [108.30620357325559]
既存の機械生成テキスト(MGT)検出手法は、ラベルを「黄金標準」として暗黙的に仮定する
このような不正確な条件下での信頼性の高い監視を実現するための,容易かつハードな強化フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-02T15:59:31Z) - From Objects to Events: Unlocking Complex Visual Understanding in Object Detectors via LLM-guided Symbolic Reasoning [71.41062111470414]
現在のオブジェクト検出器は、エンティティのローカライゼーションと分類において優れているが、イベント認識機能には固有の制限がある。
本稿では,単なるオブジェクト認識以上の標準オブジェクト検出能力を,複雑なイベント理解に拡張する新しいフレームワークを提案する。
私たちの重要なイノベーションは、高価なタスク固有のトレーニングを必要とせずに、オブジェクト検出とイベント理解のセマンティックなギャップを埋めることです。
論文 参考訳(メタデータ) (2025-02-09T10:30:54Z) - Harnessing Diverse Perspectives: A Multi-Agent Framework for Enhanced Error Detection in Knowledge Graphs [29.44542764343831]
知識グラフ誤り検出(MAKGED)のための新しいマルチエージェントフレームワークを提案する。
訓練中, 細粒度で双方向なサブグラフ埋め込みとLLMベースのクエリ埋め込みを結合することにより, これらの表現を統合して4つの特殊エージェントを生成する。
FB15KとWN18RRの実験では、MAKGEDは最先端の手法よりも優れており、KG評価の精度と堅牢性を高めている。
論文 参考訳(メタデータ) (2025-01-27T05:35:25Z) - Large Language Models for Anomaly Detection in Computational Workflows: from Supervised Fine-Tuning to In-Context Learning [9.601067780210006]
本稿では,大規模言語モデル(LLM)を用いて,複雑なデータパターンの学習能力を活用することにより,ワークフローの異常検出を行う。
教師付き微調整 (SFT) では, 文分類のためのラベル付きデータに基づいて事前学習したLCMを微調整し, 異常を識別する。
論文 参考訳(メタデータ) (2024-07-24T16:33:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。