論文の概要: AdaTyper: Adaptive Semantic Column Type Detection
- arxiv url: http://arxiv.org/abs/2311.13806v1
- Date: Thu, 23 Nov 2023 04:42:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-28 00:30:21.424661
- Title: AdaTyper: Adaptive Semantic Column Type Detection
- Title(参考訳): AdaTyper:適応型セマンティックカラム型検出
- Authors: Madelon Hulsebos and Paul Groth and \c{C}a\u{g}atay Demiralp
- Abstract要約: 私たちはAdaTyperを提案し、最も重要なデプロイメント課題の1つに対処します。
AdaTyperは弱いスーパービジョンを使用して、ハイブリッド型予測器を新しいセマンティックタイプに適応し、推論時にデータ分散をシフトする。
クラウドソーシングによる実世界のデータベーステーブル上でのAdaTyperの適応性能の評価を行った。
- 参考スコア(独自算出の注目度): 4.062265896931587
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding the semantics of relational tables is instrumental for
automation in data exploration and preparation systems. A key source for
understanding a table is the semantics of its columns. With the rise of deep
learning, learned table representations are now available, which can be applied
for semantic type detection and achieve good performance on benchmarks.
Nevertheless, we observe a gap between this performance and its applicability
in practice. In this paper, we propose AdaTyper to address one of the most
critical deployment challenges: adaptation. AdaTyper uses weak-supervision to
adapt a hybrid type predictor towards new semantic types and shifted data
distributions at inference time, using minimal human feedback. The hybrid type
predictor of AdaTyper combines rule-based methods and a light machine learning
model for semantic column type detection. We evaluate the adaptation
performance of AdaTyper on real-world database tables hand-annotated with
semantic column types through crowdsourcing and find that the f1-score improves
for new and existing types. AdaTyper approaches an average precision of 0.6
after only seeing 5 examples, significantly outperforming existing adaptation
methods based on human-provided regular expressions or dictionaries.
- Abstract(参考訳): 関係表の意味を理解することは、データ探索と準備システムの自動化に役立つ。
テーブルを理解するための重要な情報源は列のセマンティクスである。
ディープラーニングの台頭に伴い、学習したテーブル表現が利用可能になり、セマンティックな型検出に適用でき、ベンチマークのパフォーマンスが向上する。
それでも我々は,この性能と実用性とのギャップを観察する。
本稿では,最も重要なデプロイメント課題の1つである適応性に対処するために,adatyperを提案する。
AdaTyperは弱いスーパービジョンを使用して、人間の最小限のフィードバックを使用して、ハイブリッド型予測器を新しいセマンティックタイプに適応し、推論時にデータ分散をシフトする。
AdaTyperのハイブリッド型予測器は,ルールベースの手法と,意味列型検出のための光機械学習モデルを組み合わせる。
本稿では,実世界のデータベーステーブルにおけるadatyperの適応性能をクラウドソーシングによって評価し,f1-scoreが新規および既存型に対して改善することを示す。
adatyperは5つの例だけを見て平均0.6の精度にアプローチし、人間の正規表現や辞書に基づく既存の適応法を大きく上回っている。
関連論文リスト
- Graph Neural Network Approach to Semantic Type Detection in Tables [3.929053351442136]
本研究では,関係表中の意味列型を検出することの課題に対処する。
本稿では,グラフニューラルネットワーク(GNN)を用いてテーブル内依存関係をモデル化する手法を提案する。
提案手法は,既存の最先端アルゴリズムよりも優れているだけでなく,意味型検出のための様々なGNN型の有用性と機能に関する新たな知見を提供する。
論文 参考訳(メタデータ) (2024-04-30T18:17:44Z) - Generative Type Inference for Python [62.01560866916557]
本稿では静的解析から静的ドメイン知識を取り入れた数ショットの生成型推論手法であるTypeGenを紹介する。
TypeGenは、静的解析の型推論ステップを、型依存グラフ(TDG)に基づいたプロンプトに変換することで、COTプロンプトを生成する。
実験の結果、TypeGenは引数型予測では10.0%、Top-1 Exact Matchでは22.5%で最高のベースラインであるType4Pyを上回っている。
論文 参考訳(メタデータ) (2023-07-18T11:40:31Z) - TypeT5: Seq2seq Type Inference using Static Analysis [51.153089609654174]
本稿では,型予測をコード入力タスクとして扱う新しい型推論手法を提案する。
本手法では静的解析を用いて,型シグネチャがモデルによって予測されるコード要素毎に動的コンテキストを構築する。
また,モデルの入力コンテキストに事前の型予測を組み込んだ反復復号方式を提案する。
論文 参考訳(メタデータ) (2023-03-16T23:48:00Z) - Prototype-based Embedding Network for Scene Graph Generation [105.97836135784794]
現在のシーングラフ生成(SGG)手法は、コンテキスト情報を探索し、エンティティペア間の関係を予測する。
被写体と対象物の組み合わせが多様であるため、各述語カテゴリーには大きなクラス内変異が存在する。
プロトタイプベースのEmbedding Network (PE-Net) は、エンティティ/述語を、プロトタイプに準拠したコンパクトで独特な表現でモデル化する。
PLは、PE-Netがそのようなエンティティ述語マッチングを効率的に学習するのを助けるために導入され、不明瞭なエンティティ述語マッチングを緩和するためにプロトタイプ正規化(PR)が考案されている。
論文 参考訳(メタデータ) (2023-03-13T13:30:59Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - CAFA: Class-Aware Feature Alignment for Test-Time Adaptation [50.26963784271912]
テスト時間適応(TTA)は、テスト時にラベルのないデータにモデルを適応させることによって、この問題に対処することを目的としている。
本稿では,クラス認識特徴アライメント(CAFA, Class-Aware Feature Alignment)と呼ばれる単純な機能アライメント損失を提案する。
論文 参考訳(メタデータ) (2022-06-01T03:02:07Z) - Ultra-fine Entity Typing with Indirect Supervision from Natural Language
Inference [28.78215056129358]
この研究は、エンティティ型付けを自然言語推論(NLI)問題として定式化する新しいアプローチであるLITEを提示する。
実験により、LITEは訓練データに制限があるため、UFETタスクにおける最先端のパフォーマンスが得られることが示された。
論文 参考訳(メタデータ) (2022-02-12T23:56:26Z) - A Closer Look at Prototype Classifier for Few-shot Image Classification [28.821731837776593]
プロトタイプの分類器は微調整やメタラーニングを伴わずに等しく機能することを示す。
本稿では, 特徴ベクトルのノルムの分散に着目し, 性能を向上できることを示す。
論文 参考訳(メタデータ) (2021-10-11T08:28:43Z) - Making Table Understanding Work in Practice [9.352813774921655]
表理解モデルをデプロイする上での3つの課題について論じ,それに対応するためのフレームワークを提案する。
本稿では、GitTablesでトレーニングされたハイブリッドモデルをカプセル化し、軽量なHuman-in-the-loopアプローチを統合してモデルをカスタマイズするSigmaTyperを提案する。
論文 参考訳(メタデータ) (2021-09-11T03:38:24Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。