Fugu-MT 論文翻訳(概要): Three Modalities, Two Design Probes, One Prototype, and No Vision: Experience-Based Co-Design of a Multi-modal 3D Data Visualization Tool

論文の概要: Three Modalities, Two Design Probes, One Prototype, and No Vision: Experience-Based Co-Design of a Multi-modal 3D Data Visualization Tool

arxiv url: http://arxiv.org/abs/2604.09426v1
Date: Fri, 10 Apr 2026 15:39:10 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-13 17:57:53.93991
Title: Three Modalities, Two Design Probes, One Prototype, and No Vision: Experience-Based Co-Design of a Multi-modal 3D Data Visualization Tool
Title（参考訳）: 3つのモダリティ、2つのデザインプローブ、1つのプロトタイプ、そしてビジョンなし:マルチモーダル3Dデータ可視化ツールの経験に基づく共同設計
Authors: Sanchita S. Kamath, Aziz N Zeidieh, Venkatesh Potluri, Sile O'Modhrain, Kenneth Perry, JooYoung Seo,
Abstract要約: 3次元(3D)データの可視化は、STEM分野において不可欠であるが、視覚障害者や低視野者(BLV)にとってはほとんどアクセスできない。 BLVの共同設計者とともにエクスペリエンスベースの共同設計を行い、アクセス可能でマルチモーダルなWebネイティブ可視化ツールを開発した。
参考スコア（独自算出の注目度）: 4.8269483182429616
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Three-dimensional (3D) data visualizations, such as surface plots, are vital in STEM fields from biomedical imaging to spectroscopy, yet remain largely inaccessible to blind and low-vision (BLV) people. To address this gap, we conducted an Experience-Based Co-Design with BLV co-designers with expertise in non-visual data representations to create an accessible, multi-modal, web-native visualization tool. Using a multi-phase methodology, our team of five BLV and one non-BLV researcher(s) participated in two iterative sessions, comparing a low-fidelity tactile probe with a high-fidelity digital prototype. This process produced a prototype with empirically grounded features, including reference sonification, stereo and volumetric audio, and configurable buffer aggregation, which our co-designers validated as improving analytic accuracy and learnability. In this study, we target core analytic tasks essential for non-visual 3D data exploration: orientation, landmark and peak finding, comparing local maxima versus global trends, gradient tracing, and identifying occluded or partially hidden features. Our work offers accessibility researchers and developers a co-design protocol for translating tactile knowledge to digital interfaces, concrete design guidance for future systems, and opportunities to extend accessible 3D visualization into embodied data environments.
Abstract（参考訳）: 表面プロットのような三次元(3D)データの可視化は、生体医用画像から分光までSTEM分野において不可欠であるが、視覚障害者や低ビジョン(BLV)の人々には殆どアクセスできない。このギャップに対処するため、私たちはBLVの共同設計者とともに、視覚的でないデータ表現に関する専門知識を持つエクスペリエンスベースの共同設計を行い、アクセス可能でマルチモーダルなWebネイティブな可視化ツールを作成しました。マルチフェーズの手法を用いて、5人のBLV研究者と1人の非BLV研究者からなるチームが2つの反復的なセッションに参加し、低忠実度触覚プローブと高忠実度デジタルプロトタイプを比較した。このプロセスは, 基準音素化, ステレオ, ボリュームオーディオ, 構成可能なバッファアグリゲーションなど, 実験的に基礎を成したプロトタイプを作成し, 解析精度と学習性の向上を図った。本研究では,非視覚的3次元データ探索に不可欠な中核的解析課題である,向き,ランドマーク,ピーク探索,局所的最大値とグローバルトレンドの比較,勾配追跡,隠蔽あるいは部分的隠蔽特徴の同定を対象とする。我々の研究は、アクセシビリティ研究者と開発者に対して、触覚知識をデジタルインターフェースに翻訳するための共同設計プロトコル、将来のシステムのための具体的な設計ガイダンス、そして3Dビジュアライゼーションを具体化データ環境に拡張する機会を提供する。

関連論文リスト

Abstract 3D Perception for Spatial Intelligence in Vision-Language Models [100.13033631690114]
視覚言語モデル(VLM)は、空間認識や物理的理解といった3D関連課題に苦しむ。我々は,VLMの幾何学的構造と物理力学を符号化するために,抽象的境界ボックスを利用するフレームワークであるSandboxVLMを紹介した。提案手法は空間知能を常に向上させ,SAT Realの8.3%のゲインをベースライン法と比較して達成する。
論文参考訳（メタデータ） (2025-11-14T04:16:09Z)
Spatial Understanding from Videos: Structured Prompts Meet Simulation Data [89.77871049500546]
本稿では,事前学習された視覚言語モデルにおける3次元空間推論を,アーキテクチャを変更することなく拡張するための統一的なフレームワークを提案する。このフレームワークは、複雑なシーンと質問を解釈可能な推論ステップに分解する構造化プロンプト戦略であるSpatialMindと、多様な3Dシミュレーションシーンから構築されたスケーラブルな質問応答データセットであるScanForgeQAを組み合わせる。
論文参考訳（メタデータ） (2025-06-04T07:36:33Z)
ViewSpatial-Bench: Evaluating Multi-perspective Spatial Localization in Vision-Language Models [68.46716645478661]
視覚言語モデル (VLM) は視覚的内容の理解と推論において顕著な能力を示した。現在のVLMは、主に自我中心の空間的推論(カメラの観点から)に優れるが、同中心の視点に一般化することができない。マルチ視点空間位置認識評価に特化して設計された,初の総合的なベンチマークであるViewSpatial-Benchを紹介する。
論文参考訳（メタデータ） (2025-05-27T17:59:26Z)
Visualization of a multidimensional point cloud as a 3D swarm of avatars [0.0]
本稿では,Chernoffの顔にインスパイアされたアイコンを用いて,多次元データセットを表現する革新的な手法を提案する。データ次元のセマンティックな分割を直感的および技術的カテゴリに導入し、前者をアバター特徴に割り当て、後者を4次元空間埋め込みに投影する。この技術はオープンソースのdpVisionビジュアライゼーションプラットフォームのプラグインとして実装されており、ユーザーはアバターの群れという形でデータをインタラクティブに探索することができる。
論文参考訳（メタデータ） (2025-04-09T10:14:33Z)
From Flatland to Space: Teaching Vision-Language Models to Perceive and Reason in 3D [32.547597353581594]
本研究では,3次元地上構造を持つシーンデータ上に構築された新しい2次元空間データ生成およびアノテーションパイプラインを提案する。複数の公開データセットにまたがって数千のシーンから生成される大規模データセットであるSPAR-7Mを構築した。さらに,空間能力をより包括的に評価するためのベンチマークであるSPAR-Benchを紹介する。
論文参考訳（メタデータ） (2025-03-29T04:51:50Z)
Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文参考訳（メタデータ） (2024-06-17T07:43:53Z)
WHU-Synthetic: A Synthetic Perception Dataset for 3-D Multitask Model Research [9.945833036861892]
WHU-Syntheticは、マルチタスク学習用に設計された大規模3D合成認識データセットである。我々は,現実のシナリオにおいて実現が困難である特定のアイデアを実現するために,いくつかの新しい設定を実装している。
論文参考訳（メタデータ） (2024-02-29T11:38:44Z)
Dual-Perspective Knowledge Enrichment for Semi-Supervised 3D Object Detection [55.210991151015534]
本稿では, DPKE という新しい2次元知識豊か化手法を提案する。我々のDPKEは、データパースペクティブと機能パースペクティブという2つの観点から、限られたトレーニングデータ、特にラベルなしデータの知識を豊かにしています。
論文参考訳（メタデータ） (2024-01-10T08:56:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。