論文の概要: Humans, Machine Learning, and Language Models in Union: A Cognitive Study on Table Unionability
- arxiv url: http://arxiv.org/abs/2506.12990v1
- Date: Sun, 15 Jun 2025 23:13:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:47.196996
- Title: Humans, Machine Learning, and Language Models in Union: A Cognitive Study on Table Unionability
- Title(参考訳): ユニオンにおける人間、機械学習、言語モデル:テーブルの統一性に関する認知的研究
- Authors: Sreeram Marimuthu, Nina Klimenkova, Roee Shraga,
- Abstract要約: 本研究では,データ発見におけるテーブル結合性の決定における人間の行動について検討する。
分析から得られた知見を用いて、人間の(生)パフォーマンスを高めるための機械学習フレームワークを開発する。
我々はこの研究が、効率的なデータ発見のための将来のHuman-in-the-Loopシステムの開発の基礎となると信じている。
- 参考スコア(独自算出の注目度): 5.515192437680943
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Data discovery and table unionability in particular became key tasks in modern Data Science. However, the human perspective for these tasks is still under-explored. Thus, this research investigates the human behavior in determining table unionability within data discovery. We have designed an experimental survey and conducted a comprehensive analysis, in which we assess human decision-making for table unionability. We use the observations from the analysis to develop a machine learning framework to boost the (raw) performance of humans. Furthermore, we perform a preliminary study on how LLM performance is compared to humans indicating that it is typically better to consider a combination of both. We believe that this work lays the foundations for developing future Human-in-the-Loop systems for efficient data discovery.
- Abstract(参考訳): データ発見とテーブルの結合性は、現代データサイエンスの重要なタスクとなった。
しかし、これらの課題に対する人間の視点はまだ解明されていない。
そこで本研究では,データ発見におけるテーブル結合性の決定における人間の行動について検討する。
我々は実験的な調査を設計し、包括的分析を行い、テーブルの結合性に関する人間の意思決定を評価する。
分析から得られた知見を用いて、人間の(生)パフォーマンスを高めるための機械学習フレームワークを開発する。
さらに,LLMの性能が人間とどのように比較されるかについて予備研究を行い,両者の組み合わせを検討するのが一般的であることを示す。
我々はこの研究が、効率的なデータ発見のための将来のHuman-in-the-Loopシステムの開発の基礎となると信じている。
関連論文リスト
- A Novel, Human-in-the-Loop Computational Grounded Theory Framework for Big Social Data [8.695136686770772]
結果の信頼性とロバスト性への信頼は、"Human-in-the-loop"手法を採用することに依存している、と我々は主張する。
本稿では,大規模定性的データセットの分析を支援する計算基底理論(CGT)の方法論的枠組みを提案する。
論文 参考訳(メタデータ) (2025-06-06T13:43:12Z) - When Models Know More Than They Can Explain: Quantifying Knowledge Transfer in Human-AI Collaboration [79.69935257008467]
我々は,人間とAIの知識伝達能力に関する概念的かつ実験的フレームワークである知識統合と伝達評価(KITE)を紹介する。
最初の大規模人間実験(N=118)を行い,その測定を行った。
2段階のセットアップでは、まずAIを使って問題解決戦略を思いつき、その後独立してソリューションを実装し、モデル説明が人間の理解に与える影響を分離します。
論文 参考訳(メタデータ) (2025-06-05T20:48:16Z) - Language Models Trained to do Arithmetic Predict Human Risky and Intertemporal Choice [4.029252551781513]
本稿では,認知モデルとしての大規模言語モデルの有用性を高める新しい手法を提案する。
生態学的に有効な算術的データセットに基づいて事前訓練されたLLMは、従来の認知モデルよりも人間の行動を予測する。
論文 参考訳(メタデータ) (2024-05-29T17:37:14Z) - Machine Learning Techniques for Sensor-based Human Activity Recognition with Data Heterogeneity -- A Review [0.8142555609235358]
HAR(Human Activity Recognition)はユビキタスコンピューティングにおいて重要である。
HARは特にデータ分散の仮定において、課題に直面します。
本稿では,機械学習がHARにおけるデータの不均一性にどのように対処するかを検討する。
論文 参考訳(メタデータ) (2024-03-12T22:22:14Z) - Large Language Model-based Human-Agent Collaboration for Complex Task
Solving [94.3914058341565]
複雑なタスク解決のためのLarge Language Models(LLM)に基づくヒューマンエージェントコラボレーションの問題を紹介する。
Reinforcement Learning-based Human-Agent Collaboration method, ReHACを提案する。
このアプローチには、タスク解決プロセスにおける人間の介入の最も急進的な段階を決定するために設計されたポリシーモデルが含まれている。
論文 参考訳(メタデータ) (2024-02-20T11:03:36Z) - Capture the Flag: Uncovering Data Insights with Large Language Models [90.47038584812925]
本研究では,Large Language Models (LLMs) を用いてデータの洞察の発見を自動化する可能性について検討する。
そこで本稿では,データセット内の意味的かつ関連する情報(フラグ)を識別する能力を測定するために,フラグを捕捉する原理に基づく新しい評価手法を提案する。
論文 参考訳(メタデータ) (2023-12-21T14:20:06Z) - Evaluating and Incentivizing Diverse Data Contributions in Collaborative
Learning [89.21177894013225]
フェデレートされた学習モデルがうまく機能するためには、多様で代表的なデータセットを持つことが不可欠である。
データの多様性を定量化するために用いられる統計的基準と、使用するフェデレート学習アルゴリズムの選択が、結果の平衡に有意な影響を及ぼすことを示す。
我々はこれを活用して、データ収集者がグローバルな人口を代表するデータに貢献することを奨励する、シンプルな最適なフェデレーション学習機構を設計する。
論文 参考訳(メタデータ) (2023-06-08T23:38:25Z) - JECC: Commonsense Reasoning Tasks Derived from Interactive Fictions [75.42526766746515]
本稿では,人間のインタラクティブ・フィクション(IF)ゲームプレイ・ウォークスルーに基づく新しいコモンセンス推論データセットを提案する。
本データセットは,事実知識ではなく,機能的コモンセンス知識ルールの評価に重点を置いている。
実験の結果、導入したデータセットは、以前の機械読影モデルと新しい大規模言語モデルに難題であることが示されている。
論文 参考訳(メタデータ) (2022-10-18T19:20:53Z) - Investigations of Performance and Bias in Human-AI Teamwork in Hiring [30.046502708053097]
AIによる意思決定では、効果的なハイブリッドチームワーク(ヒューマンAI)は、AIのパフォーマンスにのみ依存するものではない。
本研究では,モデルの予測性能とバイアスの両方が,推薦型意思決定タスクにおいてどのように人間に伝達されるかを検討する。
論文 参考訳(メタデータ) (2022-02-21T17:58:07Z) - Uncovering the Data-Related Limits of Human Reasoning Research: An
Analysis based on Recommender Systems [1.7478203318226309]
認知科学は、理論駆動の観点から人間のような知性をモデル化する目的を追求している。
ソロジック推論は人間の推論研究のコアドメインの1つである。
最近のモデルの性能予測の結果、改善の停滞が明らかになった。
論文 参考訳(メタデータ) (2020-03-11T10:12:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。