論文の概要: SemTUI: a Framework for the Interactive Semantic Enrichment of Tabular
Data
- arxiv url: http://arxiv.org/abs/2203.09521v1
- Date: Thu, 17 Mar 2022 17:14:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-21 15:30:03.583232
- Title: SemTUI: a Framework for the Interactive Semantic Enrichment of Tabular
Data
- Title(参考訳): semtui:表データのインタラクティブな意味豊かさのためのフレームワーク
- Authors: Marco Ripamonti, Flavio De Paoli, Matteo Palmonari (University of
Milan-Bicocca)
- Abstract要約: SemTUIは、セマンティクスを使うことで、リッチ化プロセスを柔軟、完全、効果的にするためのフレームワークである。
タスク駆動のユーザ評価によって、SemTUIは理解でき、使いやすく、テーブルの充実をほとんど努力も時間もかからずに達成できることが証明された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The large availability of datasets fosters the use of \acrshort{ml} and
\acrshort{ai} technologies to gather insights, study trends, and predict unseen
behaviours out of the world of data. Today, gathering and integrating data from
different sources is mainly a manual activity that requires the knowledge of
expert users at an high cost in terms of both time and money. It is, therefore,
necessary to make the process of gathering and linking data from many different
sources affordable to make datasets ready to perform the desired analysis. In
this work, we propose the development of a comprehensive framework, named
SemTUI, to make the enrichment process flexible, complete, and effective
through the use of semantics. The approach is to promote fast integration of
external services to perform enrichment tasks such as reconciliation and
extension; and to provide users with a graphical interface to support
additional tasks, such as refinement to correct ambiguous results provided by
automatic enrichment algorithms. A task-driven user evaluation proved SemTUI to
be understandable, usable, and capable of achieving table enrichment with
little effort and time with user tests that involved people with different
skills and experiences.
- Abstract(参考訳): データセットの大規模利用は、データの世界から見知らぬ振る舞いを収集、研究し、予測するために、 \acrshort{ml} と \acrshort{ai} 技術の使用を促進する。
今日では、異なるソースからのデータ収集と統合は、主に、時間とお金の両面で、高いコストで専門家ユーザの知識を必要とする手作業である。
したがって、望ましい分析を行うためにデータセットを準備するために、さまざまなソースからデータを収集、リンクするプロセスを安価にする必要がある。
本研究では,セマンティクスの活用による富化プロセスのフレキシブル,完全,効果的化を図るため,SemTUIと呼ばれる包括的フレームワークの開発を提案する。
提案手法は,統合処理や拡張処理などの拡張処理を行うための外部サービスの迅速な統合を促進するとともに,自動強化アルゴリズムによる曖昧な結果の修正などの追加タスクをサポートするグラフィカルインターフェースをユーザに提供する。
タスク駆動のユーザ評価によって、semtuiは理解可能で、使い勝手がよく、異なるスキルや経験を持つ人を含むユーザテストで、少ない労力と時間でテーブルエンリッチメントを達成できることが証明された。
関連論文リスト
- Imitation Learning Datasets: A Toolkit For Creating Datasets, Training
Agents and Benchmarking [0.9944647907864256]
模倣学習分野は、タスク内のエージェントを訓練するために専門家データを必要とする。
多くの場合、この学習アプローチは利用可能なデータの欠如に悩まされる。
この作業は、Imitation Learningデータセットを作成することで、これらの問題に対処することを目的としている。
論文 参考訳(メタデータ) (2024-03-01T14:18:46Z) - Persona-DB: Efficient Large Language Model Personalization for Response
Prediction with Collaborative Data Refinement [82.56964750522161]
本稿では,タスクコンテキスト間の一般化を改善するため,階層的な構築プロセスからなるシンプルなフレームワークであるPersona-DBを紹介する。
応答予測のタスクでは,Persona-DBは,検索サイズを大幅に削減した精度を維持する上で,優れた効率性を示す。
我々の実験は、ユーザーが極めて少ないデータを持つ場合、コールドスタートシナリオで15%以上の顕著な改善が示されていることも示している。
論文 参考訳(メタデータ) (2024-02-16T20:20:43Z) - JOBSKAPE: A Framework for Generating Synthetic Job Postings to Enhance
Skill Matching [18.94748873243611]
JobSkapeは、スキル・ツー・タコノミーマッチングのための合成データを生成するフレームワークである。
このフレームワーク内では、ジョブ投稿の包括的な合成データセットであるSkillSkapeを作成します。
本稿では,大規模言語モデルを用いたスキル抽出とマッチングタスクのための多段階パイプラインを提案する。
論文 参考訳(メタデータ) (2024-02-05T17:57:26Z) - Collaborative business intelligence virtual assistant [1.9953434933575993]
本研究では、ユーザとCBI仮想アシスタントのインタラクションを通じて、分散仮想チームにおけるデータマイニングの応用に焦点を当てる。
CBIのための仮想アシスタントは、より広い範囲のユーザのためのデータ探索アクセシビリティを強化し、データ分析に必要な時間と労力を合理化するためのものである。
論文 参考訳(メタデータ) (2023-12-20T05:34:12Z) - AUGUST: an Automatic Generation Understudy for Synthesizing
Conversational Recommendation Datasets [56.052803235932686]
本稿では,大規模かつ高品質なレコメンデーションダイアログを生成する新しい自動データセット合成手法を提案する。
i)従来のレコメンデーションデータセットからの豊富なパーソナライズされたユーザプロファイル、(ii)知識グラフからの豊富な外部知識、(iii)人間対人間会話レコメンデーションデータセットに含まれる会話能力。
論文 参考訳(メタデータ) (2023-06-16T05:27:14Z) - Composite Learning for Robust and Effective Dense Predictions [81.2055761433725]
マルチタスク学習は、目標タスクを補助タスクと協調的に最適化することで、より優れたモデル一般化を約束する。
自己監督型(補助的)タスクと密接な予測(目標)タスクを共同でトレーニングすることで、目標タスクの性能を継続的に向上し、補助タスクのラベル付けの必要性を排除できることが判明した。
論文 参考訳(メタデータ) (2022-10-13T17:59:16Z) - Nemo: Guiding and Contextualizing Weak Supervision for Interactive Data
Programming [77.38174112525168]
私たちは、WS 学習パイプラインの全体的な生産性を、一般的な WS 監督アプローチと比較して平均20%(最大 47% のタスク)改善する、エンドツーエンドのインタラクティブなスーパービジョンシステムである Nemo を紹介します。
論文 参考訳(メタデータ) (2022-03-02T19:57:32Z) - MS-LaTTE: A Dataset of Where and When To-do Tasks are Completed [14.009925631455092]
我々はMS-LaTTEと呼ばれる新しい大規模データセットをリリースする。
タスク完了を取り巻くコンテキストの中核となる2つの側面(場所と時間)をキャプチャする。
本研究では,空間的タスクと時間的タスクの共起を予測する2つの問題に対して,データセットを検証した。
論文 参考訳(メタデータ) (2021-11-12T19:01:06Z) - Single-Modal Entropy based Active Learning for Visual Question Answering [75.1682163844354]
視覚質問応答(VQA)のマルチモーダル設定におけるアクティブラーニングに対処する
マルチモーダルな入力,画像,質問を考慮し,有効サンプル取得のための新しい手法を提案する。
私たちの新しいアイデアは、実装が簡単で、コスト効率が高く、他のマルチモーダルタスクにも容易に適応できます。
論文 参考訳(メタデータ) (2021-10-21T05:38:45Z) - Mining Implicit Entity Preference from User-Item Interaction Data for
Knowledge Graph Completion via Adversarial Learning [82.46332224556257]
本稿では,知識グラフ補完タスクにおけるユーザインタラクションデータを活用することで,新たな逆学習手法を提案する。
我々のジェネレータはユーザインタラクションデータから分離されており、識別器の性能を向上させるのに役立ちます。
利用者の暗黙の実体的嗜好を発見するために,グラフニューラルネットワークに基づく精巧な協調学習アルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-03-28T05:47:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。