論文の概要: Leam: An Interactive System for In-situ Visual Text Analysis
- arxiv url: http://arxiv.org/abs/2009.03520v1
- Date: Tue, 8 Sep 2020 05:18:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 21:29:08.065777
- Title: Leam: An Interactive System for In-situ Visual Text Analysis
- Title(参考訳): Leam:in-situビジュアルテキスト分析のためのインタラクティブシステム
- Authors: Sajjadur Rahman and Peter Griggs and \c{C}a\u{g}atay Demiralp
- Abstract要約: Leamは、計算ノート、スプレッドシート、可視化ツールの利点を組み合わせることで、テキスト解析プロセスを単一の連続体として扱うシステムである。
本稿では,Leam開発における現在の進歩を報告するとともに,その有用性を実例で示す。
- 参考スコア(独自算出の注目度): 0.6445605125467573
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the increase in scale and availability of digital text generated on the
web, enterprises such as online retailers and aggregators often use text
analytics to mine and analyze the data to improve their services and products
alike. Text data analysis is an iterative, non-linear process with diverse
workflows spanning multiple stages, from data cleaning to visualization.
Existing text analytics systems usually accommodate a subset of these stages
and often fail to address challenges related to data heterogeneity, provenance,
workflow reusability and reproducibility, and compatibility with established
practices. Based on a set of design considerations we derive from these
challenges, we propose Leam, a system that treats the text analysis process as
a single continuum by combining advantages of computational notebooks,
spreadsheets, and visualization tools. Leam features an interactive user
interface for running text analysis workflows, a new data model for managing
multiple atomic and composite data types, and an expressive algebra that
captures diverse sets of operations representing various stages of text
analysis and enables coordination among different components of the system,
including data, code, and visualizations. We report our current progress in
Leam development while demonstrating its usefulness with usage examples.
Finally, we outline a number of enhancements to Leam and identify several
research directions for developing an interactive visual text analysis system.
- Abstract(参考訳): オンライン小売業者やアグリゲータといった企業は、web上で生成されたデジタルテキストの規模と可用性の増加に伴い、データマイニングや分析にテキスト分析を使用して、サービスや製品を改善することが多い。
テキストデータ分析は、データのクリーニングから視覚化まで、さまざまな段階にわたるさまざまなワークフローを持つ反復的で非線形なプロセスである。
既存のテキスト分析システムは、通常これらのステージのサブセットに対応しており、しばしばデータの不均一性、証明、ワークフローの再利用性と再現性、確立されたプラクティスとの互換性に関する課題に対処できない。
これらの課題から導いた一連の設計上の考察に基づき,計算ノート,スプレッドシート,可視化ツールの利点を組み合わせることで,テキスト解析プロセスを単一連続体として扱うシステムであるLeamを提案する。
Leamは、テキスト分析ワークフローを実行するためのインタラクティブなユーザインターフェース、複数のアトミックおよび複合データ型を管理する新しいデータモデル、およびテキスト分析のさまざまなステージを表すさまざまな操作セットをキャプチャし、データ、コード、視覚化を含むシステムのさまざまなコンポーネント間の調整を可能にする表現代数学を備えている。
我々は,leam開発の現状を報告しつつ,利用例を用いてその有用性を示す。
最後に,Leamの改良点について概説し,インタラクティブなビジュアルテキスト解析システムを開発するためのいくつかの研究方向を特定する。
関連論文リスト
- Empowering Large Language Models in Wireless Communication: A Novel Dataset and Fine-Tuning Framework [81.29965270493238]
我々は,無線通信アプリケーションのための大規模言語モデル(LLM)の評価と微調整を目的とした,特殊なデータセットを開発した。
データセットには、真/偽と複数選択型を含む、さまざまなマルチホップ質問が含まれている。
本稿では,PVI(Pointwise V-Information)に基づく微調整手法を提案する。
論文 参考訳(メタデータ) (2025-01-16T16:19:53Z) - ARTEMIS-DA: An Advanced Reasoning and Transformation Engine for Multi-Step Insight Synthesis in Data Analytics [0.0]
ARTEMIS-DAは、複雑で多段階のデータ分析タスクを解決するために、大規模言語モデルを拡張するために設計されたフレームワークである。
ARTEMIS-DAはPlanner、Coder、Grapherという3つのコアコンポーネントを統合している。
このフレームワークはWikiTableQuestionsやTabFactといったベンチマーク上でのSOTA(State-of-the-art)のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-12-18T18:44:08Z) - "Show Me What's Wrong!": Combining Charts and Text to Guide Data Analysis [4.016592757754338]
金融詐欺検出の文脈では、アナリストは取引データの中で不審な活動を素早く特定する必要がある。
これは、パターンの認識、グループ化、比較といった複雑な探索的なタスクからなる反復的なプロセスである。
これらのステップに固有の情報の過負荷を軽減するため、自動化された情報ハイライト、大規模言語モデルが生成するテキストインサイト、視覚分析を組み合わせたツールを提案する。
論文 参考訳(メタデータ) (2024-10-01T14:16:10Z) - Data Analysis in the Era of Generative AI [56.44807642944589]
本稿では,AIを活用したデータ分析ツールの可能性について考察する。
我々は、大規模言語とマルチモーダルモデルの出現が、データ分析ワークフローの様々な段階を強化する新しい機会を提供する方法について検討する。
次に、直感的なインタラクションを促進し、ユーザ信頼を構築し、AI支援分析ワークフローを複数のアプリにわたって合理化するための、人間中心の設計原則を調べます。
論文 参考訳(メタデータ) (2024-09-27T06:31:03Z) - Knowledge-Aware Reasoning over Multimodal Semi-structured Tables [85.24395216111462]
本研究では、現在のAIモデルがマルチモーダルな構造化データに基づいて知識を考慮した推論を行うことができるかどうかを検討する。
この目的のために設計された新しいデータセットであるMMTabQAを紹介する。
我々の実験は、複数のテキストと画像の入力を効果的に統合し解釈する上で、現在のAIモデルに対する重大な課題を浮き彫りにしている。
論文 参考訳(メタデータ) (2024-08-25T15:17:43Z) - Towards Unified Multi-granularity Text Detection with Interactive Attention [56.79437272168507]
Detect Any Text"は、シーンテキストの検出、レイアウト分析、ドキュメントページの検出を結合的なエンドツーエンドモデルに統合する高度なパラダイムである。
DATにおける重要なイノベーションは、テキストインスタンスの表現学習を大幅に強化する、粒度横断型アテンションモジュールである。
テストによると、DATは様々なテキスト関連ベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-05-30T07:25:23Z) - Visual Analytics of Multivariate Networks with Representation Learning and Composite Variable Construction [19.265502727154473]
本稿では,多変量ネットワーク研究のための視覚解析ワークフローを提案する。
それは、データを分類するニューラルネットワークベースの学習フェーズ、次元の削減と最適化フェーズ、ユーザが実行する解釈フェーズで構成される。
ニューラルネットワークから得られる非線形特徴を直感的に解釈できる線形特徴にモデル化する複合変数構築ステップが,我々の設計の鍵となる。
論文 参考訳(メタデータ) (2023-03-16T18:31:18Z) - Vision+X: A Survey on Multimodal Learning in the Light of Data [64.03266872103835]
様々なソースからのデータを組み込んだマルチモーダル機械学習が,ますます普及している研究分野となっている。
我々は、視覚、音声、テキスト、動きなど、各データフォーマットの共通点と特異点を分析する。
本稿では,表現学習と下流アプリケーションレベルの両方から,マルチモーダル学習に関する既存の文献を考察する。
論文 参考訳(メタデータ) (2022-10-05T13:14:57Z) - Distributed intelligence on the Edge-to-Cloud Continuum: A systematic
literature review [62.997667081978825]
このレビューは、現在利用可能な機械学習とデータ分析のための最先端ライブラリとフレームワークに関する包括的なビジョンを提供することを目的としている。
現在利用可能なEdge-to-Cloud Continuumに関する実験的な研究のための、主要なシミュレーション、エミュレーション、デプロイメントシステム、テストベッドも調査されている。
論文 参考訳(メタデータ) (2022-04-29T08:06:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。