論文の概要: Perception Is All You Need: A Neuroscience Framework for Low Cost Sensorless Gaze in HRI
- arxiv url: http://arxiv.org/abs/2604.09829v1
- Date: Fri, 10 Apr 2026 19:00:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.696251
- Title: Perception Is All You Need: A Neuroscience Framework for Low Cost Sensorless Gaze in HRI
- Title(参考訳): センサーなしの低コストゲーミングのための神経科学フレームワーク「Perception」
- Authors: Mason Kadem,
- Abstract要約: センサと計算を完全に回避するフレームワークを提案する。
我々は、脳の視線パイプラインを直接逆向きに実装するサブドル段ボールロボットの設計を動機付けている。
利用すれば、20年にわたるHRIの視線は、人口規模で届けられるようになる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Gaze-following in child-robot interaction improves attention, recall, and learning, but requires expensive platforms (\$30,000+), sensors, algorithms, and raises privacy concerns. We propose a framework that avoids sensors and computation entirely, instead relying on the human visual system's assumption of convexity to produce perceptual gaze-following between a robot and its viewer. Specifically, we motivate sub-dollar cardboard robot design that directly implements the brain's own gaze computation pipeline in reverse, making the viewer's perceptual system the robot's "actuator", with no sensors, no power, and no privacy concerns. We ground this framework in three converging lines of theoretical and empirical neuroscience evidence. Namely, the distributed face processing network that computes gaze direction via the superior temporal sulcus, the high-precision convexity prior that causes the brain to perceive concave faces as convex, and the predictive processing hierarchy in which top-down face knowledge overrides bottom-up depth signals. These mechanisms explain why a concave eye socket with a painted pupil produces the perception of mutual gaze from any viewing angle. We derive design constraints from perceptual science, present a sub-dollar open-template robot with parameterized interchangeable eye inserts, and identify boundary conditions (developmental, clinical, and geometric) that predict where the framework will succeed and where it will fail. If leveraged, two decades of HRI gaze findings become deliverable at population scale.
- Abstract(参考訳): 子どもとロボットのインタラクションにおける視線追跡は、注意、リコール、学習を改善するが、高価なプラットフォーム(3万ドル以上)、センサー、アルゴリズム、プライバシー上の懸念を高める必要がある。
センサと計算を完全に回避するフレームワークを提案し,その代わりに人間の視覚系による凸性の仮定を頼りに,ロボットと視聴者の視線追跡を行う。
具体的には、脳自身の視線計算パイプラインを直接リバースに実装するサブドル段ボールロボットの設計を動機付け、視聴者の知覚システムを、センサーも電力もプライバシの懸念もない「アクチュエータ」にする。
我々はこの枠組みを、理論的および経験的神経科学的な証拠の3つの収束線に根ざした。
すなわち、上側頭骨を介して視線方向を演算する分散顔処理ネットワーク、脳が凹面を凸として知覚する前の高精度な凸性、トップダウン顔知識がボトムアップ深度信号を上書きする予測処理階層である。
これらのメカニズムは、凹凸眼ソケットが瞳孔を塗った場合、視線を視角から知覚する理由を説明できる。
我々は、知覚科学から設計上の制約を導き、パラメータ化可能な眼差し込み可能なサブドル型のオープンテンプレートロボットを提示し、フレームワークが成功する場所と失敗する場所を予測する境界条件(開発、臨床、幾何学)を特定する。
利用すれば、20年にわたるHRIの視線は、人口規模で届けられるようになる。
関連論文リスト
- Solving adversarial examples requires solving exponential misalignment [58.04667880030032]
敵対的攻撃 – ニューラルネットワークを騙す人間には受け入れられない入力摂動 – は、マシンラーニングにおいて永続的な障害モードのままである。
我々は、ネットワークによってそのクラスに確実に割り当てられた全ての入力の空間として、クラス概念のためのネットワーク多様体(PM)を解析する。
驚くべきことに、ニューラルネットワークPMの次元は、自然の人間の概念よりも桁違いに高い。
論文 参考訳(メタデータ) (2026-03-03T20:28:22Z) - Toward a Machine Bertin: Why Visualization Needs Design Principles for Machine Cognition [0.27074235008521247]
視覚言語モデル(VLM)は、自動分析パイプラインのチャートイメージをますます消費する。
現在のアプローチでは、主にビジョンを完全にバイパスすることで、このギャップに対処しています。
本稿では、可視化分野において、異なる研究課題として、マシン指向の視覚設計を調査する必要があることを論じる。
論文 参考訳(メタデータ) (2026-02-02T01:39:33Z) - Mind Meets Space: Rethinking Agentic Spatial Intelligence from a Neuroscience-inspired Perspective [53.556348738917166]
エージェントAIの最近の進歩は、自律的なタスク実行と言語に基づく推論が可能なシステムにつながっている。
人間の空間知能は、統合された多感覚知覚、空間記憶、認知マップに根ざし、非構造環境における柔軟でコンテキスト対応の意思決定を可能にする。
論文 参考訳(メタデータ) (2025-09-11T05:23:22Z) - Social Robots for People with Dementia: A Literature Review on Deception from Design to Perception [12.140026676198401]
知覚印象に影響を及ぼす可能性のある4つの重要なデザインキューカテゴリを同定する。
認知症を持つ人は、しばしば生物学的、社会的、精神的な能力がロボットに帰属する。
既存のロボットの騙しの定義は、しばしば哲学的あるいは行動主義的な前提に当てはまる。
論文 参考訳(メタデータ) (2025-07-01T17:12:40Z) - Brain3D: Generating 3D Objects from fMRI [78.46936519561298]
被験者のfMRIデータを入力として利用する新しい3Dオブジェクト表現学習手法であるBrain3Dを設計する。
我々は,人間の視覚系の各領域の異なる機能的特徴を,我々のモデルが捉えていることを示す。
予備評価は、Brain3Dがシミュレーションシナリオで障害した脳領域を正常に識別できることを示唆している。
論文 参考訳(メタデータ) (2024-05-24T06:06:11Z) - How does the primate brain combine generative and discriminative
computations in vision? [4.691670689443386]
推論過程の2つの対照的な概念は、それぞれ生物学的ビジョンと機械ビジョンの研究に影響を与えている。
視覚は、しばしば感覚データのトップダウン予測を含むと考えられるプロセスにおいて、証拠の尋問を通じて生成モデルを逆転させることを示す。
本稿では,この用語を説明し,重要な実証的証拠を概説するとともに,霊長類視覚の謎のハイブリッドアルゴリズムを明らかにするための段階を超越し,設定する経験的研究プログラムを提案する。
論文 参考訳(メタデータ) (2024-01-11T16:07:58Z) - Neural feels with neural fields: Visuo-tactile perception for in-hand
manipulation [57.60490773016364]
マルチフィンガーハンドの視覚と触覚を組み合わせることで,手動操作時の物体の姿勢と形状を推定する。
提案手法であるNeuralFeelsは,ニューラルネットワークをオンラインで学習することでオブジェクトの形状を符号化し,ポーズグラフ問題を最適化して共同で追跡する。
私たちの結果は、タッチが少なくとも、洗練され、そして最も最良のものは、手動操作中に視覚的推定を曖昧にすることを示しています。
論文 参考訳(メタデータ) (2023-12-20T22:36:37Z) - Neuroscience-inspired perception-action in robotics: applying active
inference for state estimation, control and self-perception [2.1067139116005595]
神経科学の発見が、ロボット工学における現在の推定と制御アルゴリズムを改善する機会をいかに開放するかについて議論する。
本稿では,実体プラットフォーム上でのこのような計算モデルの開発から得られた実験と教訓を要約する。
論文 参考訳(メタデータ) (2021-05-10T10:59:38Z) - Perceiving Humans: from Monocular 3D Localization to Social Distancing [93.03056743850141]
本稿では,人間の3次元位置と身体の向きを1つの画像から知覚する,コスト効率の高い視覚ベースの新しい手法を提案する。
我々は,「社会的距離」という概念を,単純な位置に基づくルールとは対照的に,社会的相互作用の一形態として再考することが可能であることを示す。
論文 参考訳(メタデータ) (2020-09-01T10:12:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。