論文の概要: Leam: An Interactive System for In-situ Visual Text Analysis
- arxiv url: http://arxiv.org/abs/2009.03520v1
- Date: Tue, 8 Sep 2020 05:18:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 21:29:08.065777
- Title: Leam: An Interactive System for In-situ Visual Text Analysis
- Title(参考訳): Leam:in-situビジュアルテキスト分析のためのインタラクティブシステム
- Authors: Sajjadur Rahman and Peter Griggs and \c{C}a\u{g}atay Demiralp
- Abstract要約: Leamは、計算ノート、スプレッドシート、可視化ツールの利点を組み合わせることで、テキスト解析プロセスを単一の連続体として扱うシステムである。
本稿では,Leam開発における現在の進歩を報告するとともに,その有用性を実例で示す。
- 参考スコア(独自算出の注目度): 0.6445605125467573
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the increase in scale and availability of digital text generated on the
web, enterprises such as online retailers and aggregators often use text
analytics to mine and analyze the data to improve their services and products
alike. Text data analysis is an iterative, non-linear process with diverse
workflows spanning multiple stages, from data cleaning to visualization.
Existing text analytics systems usually accommodate a subset of these stages
and often fail to address challenges related to data heterogeneity, provenance,
workflow reusability and reproducibility, and compatibility with established
practices. Based on a set of design considerations we derive from these
challenges, we propose Leam, a system that treats the text analysis process as
a single continuum by combining advantages of computational notebooks,
spreadsheets, and visualization tools. Leam features an interactive user
interface for running text analysis workflows, a new data model for managing
multiple atomic and composite data types, and an expressive algebra that
captures diverse sets of operations representing various stages of text
analysis and enables coordination among different components of the system,
including data, code, and visualizations. We report our current progress in
Leam development while demonstrating its usefulness with usage examples.
Finally, we outline a number of enhancements to Leam and identify several
research directions for developing an interactive visual text analysis system.
- Abstract(参考訳): オンライン小売業者やアグリゲータといった企業は、web上で生成されたデジタルテキストの規模と可用性の増加に伴い、データマイニングや分析にテキスト分析を使用して、サービスや製品を改善することが多い。
テキストデータ分析は、データのクリーニングから視覚化まで、さまざまな段階にわたるさまざまなワークフローを持つ反復的で非線形なプロセスである。
既存のテキスト分析システムは、通常これらのステージのサブセットに対応しており、しばしばデータの不均一性、証明、ワークフローの再利用性と再現性、確立されたプラクティスとの互換性に関する課題に対処できない。
これらの課題から導いた一連の設計上の考察に基づき,計算ノート,スプレッドシート,可視化ツールの利点を組み合わせることで,テキスト解析プロセスを単一連続体として扱うシステムであるLeamを提案する。
Leamは、テキスト分析ワークフローを実行するためのインタラクティブなユーザインターフェース、複数のアトミックおよび複合データ型を管理する新しいデータモデル、およびテキスト分析のさまざまなステージを表すさまざまな操作セットをキャプチャし、データ、コード、視覚化を含むシステムのさまざまなコンポーネント間の調整を可能にする表現代数学を備えている。
我々は,leam開発の現状を報告しつつ,利用例を用いてその有用性を示す。
最後に,Leamの改良点について概説し,インタラクティブなビジュアルテキスト解析システムを開発するためのいくつかの研究方向を特定する。
関連論文リスト
- generAItor: Tree-in-the-Loop Text Generation for Language Model
Explainability and Adaptation [28.715001906405362]
大規模言語モデル(LLM)は、自動補完、補助的な書き込み、チャットベースのテキスト生成など、様々な下流タスクに広くデプロイされている。
本稿では,ビーム探索ツリーの視覚的表現を解析,説明,適応する中心的な要素とする,ループ内ツリーのアプローチを提案することで,この欠点に対処する。
視覚解析技術であるGenerAItorを,タスク固有のウィジェットで中央ビーム探索木を拡大し,ターゲットとした可視化とインタラクションの可能性を提供する。
論文 参考訳(メタデータ) (2024-03-12T13:09:15Z) - Enhancing Visual Document Understanding with Contrastive Learning in
Large Visual-Language Models [56.76307866160105]
文書オブジェクト協調学習(Document Object Contrastive Learning, DoCo)と呼ばれる対照的な学習フレームワークを提案する。
DoCoは補助的なマルチモーダルエンコーダを利用して文書オブジェクトの特徴を取得し、それをLVLM(Large Visual-Language Models)の視覚エンコーダによって生成された視覚的特徴に合わせる。
提案するDoCoは,様々なLVLMの事前学習において,推論過程における計算複雑性の増大を招くことなく,プラグイン・アンド・プレイの事前学習手法として機能することが実証された。
論文 参考訳(メタデータ) (2024-02-29T10:17:27Z) - The (R)Evolution of Multimodal Large Language Models: A Survey [48.61135328255951]
MLLM(Multimodal Large Language Models)は、視覚とテキストのモダリティを、入力と出力の両方としてシームレスに統合することができる。
本稿では,近年の視覚的MLLMのレビュー,アーキテクチャ選択,マルチモーダルアライメント戦略,トレーニング手法について述べる。
論文 参考訳(メタデータ) (2024-02-19T19:01:01Z) - Text2Analysis: A Benchmark of Table Question Answering with Advanced
Data Analysis and Unclear Queries [67.0083902913112]
高度な解析タスクを取り入れたText2Analysisベンチマークを開発した。
また,5つのイノベーティブかつ効果的なアノテーション手法を開発した。
3つの異なる指標を用いて5つの最先端モデルを評価する。
論文 参考訳(メタデータ) (2023-12-21T08:50:41Z) - Towards More Unified In-context Visual Understanding [77.03395229184238]
マルチモーダル出力を有効にした視覚理解のための新しいICLフレームワークを提案する。
まず、テキストと視覚的プロンプトの両方を量子化し、統一された表現空間に埋め込む。
次にデコーダのみのスパーストランスアーキテクチャを用いて生成モデリングを行う。
論文 参考訳(メタデータ) (2023-12-05T06:02:21Z) - Using Textual Interface to Align External Knowledge for End-to-End
Task-Oriented Dialogue Systems [53.38517204698343]
本稿では,外部知識の整合化と冗長なプロセスの排除にテキストインタフェースを用いた新しいパラダイムを提案する。
我々は、MultiWOZ-Remakeを用いて、MultiWOZデータベース用に構築されたインタラクティブテキストインタフェースを含む、我々のパラダイムを実演する。
論文 参考訳(メタデータ) (2023-05-23T05:48:21Z) - Visual Analytics of Multivariate Networks with Representation Learning
and Composite Variable Construction [20.414031495380147]
本稿では,多変量ネットワーク研究のための視覚解析ワークフローを提案する。
それは、データを分類するニューラルネットワークベースの学習フェーズ、次元の削減と最適化フェーズ、ユーザが実行する解釈フェーズで構成される。
ニューラルネットワークから得られる非線形特徴を直感的に解釈できる線形特徴にモデル化する複合変数構築ステップが,我々の設計の鍵となる。
論文 参考訳(メタデータ) (2023-03-16T18:31:18Z) - Analytical Engines With Context-Rich Processing: Towards Efficient
Next-Generation Analytics [12.317930859033149]
我々は、文脈に富む分析を可能にするコンポーネントと協調して最適化された分析エンジンを構想する。
我々は、リレーショナルおよびモデルベース演算子間の総括的なパイプラインコストとルールベースの最適化を目指している。
論文 参考訳(メタデータ) (2022-12-14T21:46:33Z) - Distributed intelligence on the Edge-to-Cloud Continuum: A systematic
literature review [62.997667081978825]
このレビューは、現在利用可能な機械学習とデータ分析のための最先端ライブラリとフレームワークに関する包括的なビジョンを提供することを目的としている。
現在利用可能なEdge-to-Cloud Continuumに関する実験的な研究のための、主要なシミュレーション、エミュレーション、デプロイメントシステム、テストベッドも調査されている。
論文 参考訳(メタデータ) (2022-04-29T08:06:05Z) - A Visual Analytics Framework for Reviewing Streaming Performance Data [20.61348106852359]
データ管理,分析,インタラクティブな可視化という3つのモジュールからなる視覚分析フレームワークを提案する。
特に、計算コストを制御できるだけでなく、分析結果の重要な側面をよりよく追従するためのオンラインおよびプログレッシブ分析手法を提案する。
論文 参考訳(メタデータ) (2020-01-26T04:34:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。