Fugu-MT 論文翻訳(概要): GazeBehavior Annotation Toolkit (GBAT): AI-powered toolkit for automatic annotation of egocentric eye-tracking and video data of child-caregiver interaction

論文の概要: GazeBehavior Annotation Toolkit (GBAT): AI-powered toolkit for automatic annotation of egocentric eye-tracking and video data of child-caregiver interaction

arxiv url: http://arxiv.org/abs/2605.22962v1
Date: Thu, 21 May 2026 18:47:56 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-25 17:29:20.059268
Title: GazeBehavior Annotation Toolkit (GBAT): AI-powered toolkit for automatic annotation of egocentric eye-tracking and video data of child-caregiver interaction
Title（参考訳）: GazeBehavior Annotation Toolkit (GBAT): 自己中心型視線追跡の自動アノテーションのためのAIによるツールキットと保育者の相互作用のビデオデータ
Authors: Iba Baig, Kevin Li, Yanbin Xu, Seiji Cattelain, Marie Hallo, Hayato Ono, Sho Tsuji, Ming Bo Cai,
Abstract要約: データ前処理と特徴抽出の3つの重要なプロセスを容易にするためのディープラーニングベースのツールキットであるGaze Behavior Toolkitを紹介した。このツールキットは、人間中心の視線追跡とビデオデータから特徴抽出の効率性とスケーラビリティを向上させる。
参考スコア（独自算出の注目度）: 3.5325553073481886
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Video recordings of child-caregiver interactions enable investigation of attentional dynamics during naturalistic behavior. Such multimodal recording also allows researchers to examine how attention interacts with action and language use in real time. However, manual annotation of such data is time-consuming. Here, we introduce GazeBehavior Annotation Toolkit, a deep-learning-based toolkit designed to facilitate three key processes in data preprocessing and feature extraction: post-hoc synchronization across multiple videos, semi-automatic annotation of gaze target categories, and categorization of participants' poses and hand actions. This toolkit improves the efficiency and scalability of feature extraction from human egocentric eye-tracking and video data. Such improvement is critical in supporting large-scale and longitudinal investigations of attentional dynamics and naturalistic behavior in human early development.
Abstract（参考訳）: 子どもと介護者の相互作用のビデオ記録は、自然主義的行動における注意のダイナミクスを調査することができる。このようなマルチモーダル記録は、研究者がリアルタイムでアクションや言語の使用とどのように反応するかを調査することを可能にする。しかし、そのようなデータの手動アノテーションは時間がかかります。本稿では,データ前処理と特徴抽出における3つの重要なプロセスの促進を目的としたディープラーニングベースのツールキットであるGazeBehavior Annotation Toolkitを紹介した。このツールキットは、人間中心の視線追跡とビデオデータから特徴抽出の効率性とスケーラビリティを向上させる。このような改善は、人間の早期発達における注意力学と自然主義的行動の大規模・縦断的な研究を支援する上で重要である。

関連論文リスト

Interactive Tracking: A Human-in-the-Loop Paradigm with Memory-Augmented Adaptation [60.96010213186819]
自然言語コマンドを使用していつでもトラッカーをガイドできる新しいパラダイムであるInteractive Trackingを導入する。対話型トラッキングのための最初の大規模ベンチマークであるInteractTrackについて紹介する。第3に,ユーザからのフィードバックから学習し,トラッキング動作を更新するために動的メモリ機構を利用する新しいベースラインであるInteractive Memory-Augmented Tracking (IMAT)を導入する。
論文参考訳（メタデータ） (2026-04-02T12:33:27Z)
SILVI: Simple Interface for Labeling Video Interactions [37.845796174011475]
SILVIは、ビデオデータのためのオープンソースのラベルソフトウェアである。研究者はビデオデータに直接アノテートしたり、対話したりすることができる。コンピュータビジョンモデルのトレーニングと検証に適した構造化出力を生成する。
論文参考訳（メタデータ） (2025-11-05T19:39:00Z)
I-MPN: Inductive Message Passing Network for Efficient Human-in-the-Loop Annotation of Mobile Eye Tracking Data [4.487146086221174]
本稿では,移動眼球追跡設定における物体の自動認識のための新しい人間中心学習アルゴリズムを提案する。提案手法は,オブジェクト検出器と空間的関係を考慮した誘導型メッセージパッシングネットワーク(I-MPN)をシームレスに統合し,ノードプロファイル情報を活用し,オブジェクト相関を捉える。
論文参考訳（メタデータ） (2024-06-10T13:08:31Z)
Decoding Attention from Gaze: A Benchmark Dataset and End-to-End Models [6.642042615005632]
視線追跡は、生態学的に有効な環境において、人間の認知に関する豊富な行動データを提供する可能性がある。本稿では,コンピュータビジョンツールを用いて,時間とともに参加者の過度な視覚的注意の軌跡を評価する作業である「アテンション・デコーディング」について検討する。
論文参考訳（メタデータ） (2022-11-20T12:24:57Z)
Learn to Predict How Humans Manipulate Large-sized Objects from Interactive Motions [82.90906153293585]
本稿では,動きデータと動的記述子を融合させるグラフニューラルネットワークHO-GCNを提案する。動的記述子を消費するネットワークは、最先端の予測結果が得られ、未確認オブジェクトへのネットワークの一般化に役立つことを示す。
論文参考訳（メタデータ） (2022-06-25T09:55:39Z)
Self-Regulated Learning for Egocentric Video Activity Anticipation [147.9783215348252]
自己制御学習(SRL)は、中間表現を連続的に制御し、現在のタイムスタンプのフレームにおける新しい情報を強調する表現を作り出すことを目的としている。 SRLは2つのエゴセントリックなビデオデータセットと2つの第三者のビデオデータセットにおいて、既存の最先端技術よりも大幅に優れています。
論文参考訳（メタデータ） (2021-11-23T03:29:18Z)
Weakly Supervised Human-Object Interaction Detection in Video via Contrastive Spatiotemporal Regions [81.88294320397826]
システムは、ビデオに人間と物体の相互作用が存在するか、あるいは人間と物体の実際の位置を知らない。文節から収集した人-物間相互作用による6.5k以上のビデオからなるデータセットを提案する。ビデオデータセットのアノテーションに適応した弱教師付きベースラインの性能向上を実証した。
論文参考訳（メタデータ） (2021-10-07T15:30:18Z)
Efficient Modelling Across Time of Human Actions and Interactions [92.39082696657874]
3つの畳み込みニューラルネットワーク(CNND)における現在の固定サイズの時間的カーネルは、入力の時間的変動に対処するために改善できると主張している。我々は、アーキテクチャの異なるレイヤにまたがる機能の違いを強化することで、アクションのクラス間でどのようにうまく対処できるかを研究する。提案手法は、いくつかのベンチマークアクション認識データセットで評価され、競合する結果を示す。
論文参考訳（メタデータ） (2021-10-05T15:39:11Z)
Beyond Tracking: Using Deep Learning to Discover Novel Interactions in Biological Swarms [3.441021278275805]
本稿では,システムレベルの状態を全体像から直接予測するディープ・ネットワーク・モデルを提案する。結果の予測モデルは、人間の理解した予測モデルに基づいていないため、説明モジュールを使用する。これは、行動生態学における人工知能の例である。
論文参考訳（メタデータ） (2021-08-20T22:50:41Z)
Learning Asynchronous and Sparse Human-Object Interaction in Videos [56.73059840294019]
Asynchronous-Sparse Interaction Graph Networks(ASSIGN)は、ビデオシーン内のエンティティに関連するインタラクションイベントの構造を自動的に検出します。 ASSIGNは人間と物体の相互作用認識において試験され、人間のサブアクティビティのセグメンテーションおよびラベル付けにおいて優れた性能を示す。
論文参考訳（メタデータ） (2021-03-03T23:43:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。