論文の概要: Spacewalker: Traversing Representation Spaces for Fast Interactive Exploration and Annotation of Unstructured Data
- arxiv url: http://arxiv.org/abs/2409.16793v2
- Date: Tue, 14 Jan 2025 08:47:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-15 13:25:30.857941
- Title: Spacewalker: Traversing Representation Spaces for Fast Interactive Exploration and Annotation of Unstructured Data
- Title(参考訳): Spacewalker: 高速なインタラクティブな探索と非構造化データのアノテーションのための表現空間のトラバース
- Authors: Lukas Heine, Fabian Hörst, Jana Fragemann, Gijs Luijten, Jan Egger, Fin Bahnsen, M. Saquib Sarfraz, Jens Kleesiek, Constantin Seibold,
- Abstract要約: Spacewalkerは、複数のモードでデータを分析、探索、注釈付けするインタラクティブツールである。
ユーザは、データ表現を抽出し、低次元空間で視覚化し、探索的または関心のある領域を問合せすることによって、大きなデータセットをトラバースすることができる。
従来の手法と比較して,Spacewalkerは時間と労力を削減できることを示す。
- 参考スコア(独自算出の注目度): 8.425539271589113
- License:
- Abstract: In industries such as healthcare, finance, and manufacturing, analysis of unstructured textual data presents significant challenges for analysis and decision making. Uncovering patterns within large-scale corpora and understanding their semantic impact is critical, but depends on domain experts or resource-intensive manual reviews. In response, we introduce Spacewalker in this system demonstration paper, an interactive tool designed to analyze, explore, and annotate data across multiple modalities. It allows users to extract data representations, visualize them in low-dimensional spaces and traverse large datasets either exploratory or by querying regions of interest. We evaluated Spacewalker through extensive experiments and annotation studies, assessing its efficacy in improving data integrity verification and annotation. We show that Spacewalker reduces time and effort compared to traditional methods. The code of this work is open-source and can be found at: https://github.com/code-lukas/Spacewalker
- Abstract(参考訳): 医療、金融、製造業などの産業において、構造化されていないテキストデータの分析は、分析と意思決定の重要な課題である。
大規模コーパス内のパターンを発見し、その意味的影響を理解することは重要だが、ドメインの専門家やリソース集約的なマニュアルレビューに依存する。
本システムでは,複数のモダリティをまたいだデータの解析,探索,注釈付けを行うインタラクティブツールであるSpacewalkerを紹介した。
ユーザは、データ表現を抽出し、低次元空間で視覚化し、探索的または関心のある領域を問合せすることによって、大きなデータセットをトラバースすることができる。
実験とアノテーション研究を通じてSpacewalkerを評価し,データ整合性検証とアノテーションの改善の有効性を評価した。
従来の手法と比較して,Spacewalkerは時間と労力を削減できることを示す。
この作業のコードはオープンソースで、https://github.com/code-lukas/Spacewalkerを参照してください。
関連論文リスト
- Map2Text: New Content Generation from Low-Dimensional Visualizations [60.02149343347818]
低次元の可視化における空間座標を新しい、一貫性のある、正確に整列されたテキストコンテンツに変換する新しいタスクであるMap2Textを紹介する。
これによってユーザは、これらの空間的レイアウトに埋め込まれた未発見情報を対話的に、直感的に探索し、ナビゲートすることができる。
論文 参考訳(メタデータ) (2024-12-24T20:16:13Z) - InSpaceType: Dataset and Benchmark for Reconsidering Cross-Space Type Performance in Indoor Monocular Depth [21.034022456528938]
屋内の単眼深度推定は、ロボットナビゲーションや周囲の知覚のためのAR/VRを含むホームオートメーションに役立つ。
研究者は、カスタムデータまたはより頻度の低いタイプで、リリース済みの事前トレーニングモデルで、劣化したパフォーマンスを経験的に見つけることができる。
本稿では,よく見られるが見落としやすい因子空間のタイプについて検討し,空間間のモデルの性能差を実現する。
論文 参考訳(メタデータ) (2024-08-25T02:39:55Z) - VERA: Generating Visual Explanations of Two-Dimensional Embeddings via Region Annotation [0.0]
Visual Explanations via Region (VERA) は2次元埋め込みの視覚的説明を生成する自動埋め込みアノテーション手法である。
VERAは、埋め込み空間内の異なる領域を特徴付ける情報的説明を生成し、ユーザがその埋め込み風景を一目で概観することができる。
実世界のデータセット上でのVERAの利用について説明するとともに,本手法の有効性を比較ユーザスタディで検証する。
論文 参考訳(メタデータ) (2024-06-07T10:23:03Z) - SPACE-IDEAS: A Dataset for Salient Information Detection in Space Innovation [0.3017070810884304]
本研究では,空間領域に関連するイノベーションのアイデアから情報を検出するためのデータセットであるSPACE-IDEASを紹介する。
SPACE-IDEASのテキストは大きく異なり、非公式、技術的、学術的、ビジネス指向の書き込みスタイルを含んでいる。
手動でアノテートしたデータセットに加えて、大きな生成言語モデルを使ってアノテートされた拡張バージョンをリリースします。
論文 参考訳(メタデータ) (2024-03-25T17:04:02Z) - Understanding Before Recommendation: Semantic Aspect-Aware Review Exploitation via Large Language Models [53.337728969143086]
レコメンデーションシステムは、クリックやレビューのようなユーザとイテムのインタラクションを利用して表現を学習する。
従来の研究では、様々な側面や意図にまたがるユーザの嗜好をモデル化することで、推奨精度と解釈可能性を改善する。
そこで本研究では,意味的側面と認識的相互作用を明らかにするためのチェーンベースのプロンプト手法を提案する。
論文 参考訳(メタデータ) (2023-12-26T15:44:09Z) - Capture the Flag: Uncovering Data Insights with Large Language Models [90.47038584812925]
本研究では,Large Language Models (LLMs) を用いてデータの洞察の発見を自動化する可能性について検討する。
そこで本稿では,データセット内の意味的かつ関連する情報(フラグ)を識別する能力を測定するために,フラグを捕捉する原理に基づく新しい評価手法を提案する。
論文 参考訳(メタデータ) (2023-12-21T14:20:06Z) - Open-Vocabulary Camouflaged Object Segmentation [66.94945066779988]
OVCOS(Open-vocabulary camouflaged Object segmentation)を導入した。
我々は11,483個の手選択画像とそれに対応するオブジェクトクラスを含む大規模複合シーンデータセット(textbfOVCamo)を構築した。
クラスセマンティック知識の指導とエッジ情報と深度情報からの視覚構造的手がかりの補足を統合することにより、提案手法は効率よくカモフラージュされたオブジェクトを捕捉できる。
論文 参考訳(メタデータ) (2023-11-19T06:00:39Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - Machine Identification of High Impact Research through Text and Image
Analysis [0.4737991126491218]
本稿では,引用の可能性が低い論文から高い論文を自動的に分離するシステムを提案する。
本システムでは,文書全体の外観を推測する視覚的分類器と,コンテンツインフォームド決定のためのテキスト分類器の両方を用いる。
論文 参考訳(メタデータ) (2020-05-20T19:12:24Z) - IDDA: a large-scale multi-domain dataset for autonomous driving [16.101248613062292]
本稿では,100以上の異なる視覚領域を持つセマンティックセグメンテーションのための大規模合成データセットを提案する。
このデータセットは、さまざまな天候や視点条件下でのトレーニングとテストデータのドメインシフトの課題に明示的に対処するために作成されている。
論文 参考訳(メタデータ) (2020-04-17T15:22:38Z) - ORB: An Open Reading Benchmark for Comprehensive Evaluation of Machine
Reading Comprehension [53.037401638264235]
我々は,7種類の読解データセットの性能を報告する評価サーバORBを提案する。
評価サーバは、モデルのトレーニング方法に制限を課さないため、トレーニングパラダイムや表現学習の探索に適したテストベッドである。
論文 参考訳(メタデータ) (2019-12-29T07:27:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。