論文の概要: Preliminary Report: Enhancing Role Differentiation in Conversational HCI Through Chromostereopsis
- arxiv url: http://arxiv.org/abs/2503.03968v1
- Date: Wed, 05 Mar 2025 23:40:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-07 15:58:55.081369
- Title: Preliminary Report: Enhancing Role Differentiation in Conversational HCI Through Chromostereopsis
- Title(参考訳): Chromostereopsisによる会話型HCIにおける役割分化の促進
- Authors: Matteo Grella,
- Abstract要約: テキストベースのAIインタフェースにおける会話の役割を視覚的に識別するための新しいアプローチとして,色コントラストによる深度知覚を誘発する知覚現象であるクロモステレオプシスを活用することを提案する。
- 参考スコア(独自算出の注目度): 0.8611782340880084
- License:
- Abstract: We propose leveraging chromostereopsis, a perceptual phenomenon inducing depth perception through color contrast, as a novel approach to visually differentiating conversational roles in text-based AI interfaces. This method aims to implicitly communicate role hierarchy and add a subtle sense of physical space.
- Abstract(参考訳): テキストベースのAIインタフェースにおける会話の役割を視覚的に識別するための新しいアプローチとして,色コントラストによる深度知覚を誘発する知覚現象であるクロモステレオプシスを活用することを提案する。
本手法は,役割階層を暗黙的に伝達し,物理空間の微妙な感覚を付加することを目的とする。
関連論文リスト
- Emphasizing Semantic Consistency of Salient Posture for Speech-Driven Gesture Generation [44.78811546051805]
音声駆動ジェスチャ生成は、入力音声信号と同期したジェスチャシーケンスを合成することを目的としている。
従来の手法では、ニューラルネットワークを利用して、コンパクトな音声表現をジェスチャーシーケンスに直接マッピングする。
そこで本稿では,姿勢のセマンティック一貫性を重視した音声によるジェスチャー生成手法を提案する。
論文 参考訳(メタデータ) (2024-10-17T17:22:59Z) - Two in One Go: Single-stage Emotion Recognition with Decoupled Subject-context Transformer [78.35816158511523]
単段階の感情認識手法として,DSCT(Decoupled Subject-Context Transformer)を用いる。
広範に使われている文脈認識型感情認識データセットであるCAER-SとEMOTICの単段階フレームワークの評価を行った。
論文 参考訳(メタデータ) (2024-04-26T07:30:32Z) - Disentangled Interaction Representation for One-Stage Human-Object
Interaction Detection [70.96299509159981]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、人間中心の画像理解のコアタスクである。
最近のワンステージ手法では、対話予測に有用な画像ワイドキューの収集にトランスフォーマーデコーダを採用している。
従来の2段階の手法は、非絡み合いで説明可能な方法で相互作用特徴を構成する能力から大きな恩恵を受ける。
論文 参考訳(メタデータ) (2023-12-04T08:02:59Z) - Kefa: A Knowledge Enhanced and Fine-grained Aligned Speaker for
Navigation Instruction Generation [70.76686546473994]
ナビゲーション命令生成のための新しい話者モデルtextscKefaを提案する。
提案したKEFA話者は,屋内および屋外の両方で最先端の指示生成性能を実現する。
論文 参考訳(メタデータ) (2023-07-25T09:39:59Z) - Revisiting Conversation Discourse for Dialogue Disentanglement [88.3386821205896]
本稿では,対話談話特性を最大限に活用し,対話の絡み合いを高めることを提案する。
我々は,会話の意味的文脈をより良くモデル化するために,リッチな構造的特徴を統合する構造認識フレームワークを開発した。
我々の研究は、より広範なマルチスレッド対話アプリケーションを促進する大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-06-06T19:17:47Z) - deep learning of segment-level feature representation for speech emotion
recognition in conversations [9.432208348863336]
そこで本稿では,意図的文脈依存と話者感応的相互作用をキャプチャする対話型音声感情認識手法を提案する。
まず、事前訓練されたVGGishモデルを用いて、個々の発話におけるセグメントベース音声表現を抽出する。
第2に、注意的双方向リカレントユニット(GRU)は、文脈に敏感な情報をモデル化し、話者内および話者間依存関係を共同で探索する。
論文 参考訳(メタデータ) (2023-02-05T16:15:46Z) - Channel-aware Decoupling Network for Multi-turn Dialogue Comprehension [81.47133615169203]
本稿では,PrLMの逐次文脈化を超えて,発話間の包括的相互作用のための合成学習を提案する。
私たちは、モデルが対話ドメインに適応するのを助けるために、ドメイン適応型トレーニング戦略を採用しています。
実験の結果,提案手法は4つの公開ベンチマークデータセットにおいて,強力なPrLMベースラインを著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-01-10T13:18:25Z) - Exploration of the Usage of Color Terms by Color-blind Participants in
Online Discussion Platforms [4.445130093341008]
赤緑色話者は、予測不可能な文脈で「赤」と「緑」の用語を使用することを示す。
これらの発見は、我々の言語システムにおける感覚経験の役割について、新しく興味深い光を当てた。
論文 参考訳(メタデータ) (2022-10-21T12:11:10Z) - Toward a Visual Concept Vocabulary for GAN Latent Space [74.12447538049537]
本稿では,GANの潜在空間で表現される原始視覚概念のオープンエンド語彙を構築するための新しい手法を提案する。
提案手法は, 層選択性に基づく知覚的正当方向の自動識別, 自由形, 構成的自然言語記述による人為的アノテーションの3つの要素から構成される。
実験により、我々のアプローチで学んだ概念は信頼性があり、構成可能であることが示され、クラス、コンテキスト、オブザーバをまたいで一般化される。
論文 参考訳(メタデータ) (2021-10-08T17:58:19Z) - Discourse Coherence, Reference Grounding and Goal Oriented Dialogue [15.766916122461922]
我々は、混合開始型人間-コンピュータの参照通信を実現するための新しいアプローチについて論じる。
本稿では,談話間の制約を蓄積し,学習確率モデルを用いて解釈する参照通信領域における単純な対話システムについて述べる。
論文 参考訳(メタデータ) (2020-07-08T20:53:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。