論文の概要: Scholastic: Graphical Human-Al Collaboration for Inductive and
Interpretive Text Analysis
- arxiv url: http://arxiv.org/abs/2208.06133v1
- Date: Fri, 12 Aug 2022 06:41:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-15 13:49:44.042393
- Title: Scholastic: Graphical Human-Al Collaboration for Inductive and
Interpretive Text Analysis
- Title(参考訳): 帰納的・解釈的テキスト分析のための図形的人間-Al協調
- Authors: Matt-Heun Hong, Lauren A. Marsh, Jessica L. Feuston, Janet Ruppert,
Jed R. Brubaker, Danielle Albers Szafir
- Abstract要約: 解釈学者は、意味のあるテーマが現れるまで、文書を手作業でサンプリングし、コードを適用し、コードをカテゴリに書き換え、照合することで、テキストコーパスから知識を生成する。
大規模なコーパスがあれば、機械学習はデータのサンプリングと分析をスケールするのに役立ちますが、以前の研究は、専門家が一般的に、解釈奨学金の破壊や推進に懸念を抱いていることを示しています。
我々は,機械・イン・ザ・ループクラスタリングアルゴリズムに関わる問題に対処するために,人間中心の設計アプローチを採り入れ,解釈テキスト分析を足場とした。
- 参考スコア(独自算出の注目度): 20.008165537258254
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Interpretive scholars generate knowledge from text corpora by manually
sampling documents, applying codes, and refining and collating codes into
categories until meaningful themes emerge. Given a large corpus, machine
learning could help scale this data sampling and analysis, but prior research
shows that experts are generally concerned about algorithms potentially
disrupting or driving interpretive scholarship. We take a human-centered design
approach to addressing concerns around machine-assisted interpretive research
to build Scholastic, which incorporates a machine-in-the-loop clustering
algorithm to scaffold interpretive text analysis. As a scholar applies codes to
documents and refines them, the resulting coding schema serves as structured
metadata which constrains hierarchical document and word clusters inferred from
the corpus. Interactive visualizations of these clusters can help scholars
strategically sample documents further toward insights. Scholastic demonstrates
how human-centered algorithm design and visualizations employing familiar
metaphors can support inductive and interpretive research methodologies through
interactive topic modeling and document clustering.
- Abstract(参考訳): 解釈学者は、文書を手作業でサンプリングし、コードを適用し、意味のあるテーマが現れるまで、分類し、照合することで、テキストコーパスから知識を生み出す。
大きなコーパスが与えられると、機械学習はデータのサンプリングと分析をスケールするのに役立つが、以前の研究では、専門家が一般的にアルゴリズムが解釈的奨学金の破壊や推進を心配していることが示されている。
我々は,機械支援による解釈研究に関する懸念に対処するために,人間中心設計アプローチを取り上げ,scholasticを構築した。
学者が文書にコードを適用し、それらを洗練するにつれて、結果として得られるコーディングスキーマは、コーパスから推論された階層的なドキュメントとワードクラスタを制約する構造化メタデータとして機能する。
これらのクラスタのインタラクティブな視覚化は、研究者が文書を戦略的に分析するのに役立つ。
scholastic氏は、身近なメタファーを用いた人間中心のアルゴリズム設計と視覚化が、インタラクティブなトピックモデリングとドキュメントクラスタリングを通じて、帰納的および解釈的研究方法論をどのように支援できるかをデモしている。
関連論文リスト
- Thematic Analysis with Open-Source Generative AI and Machine Learning: A New Method for Inductive Qualitative Codebook Development [0.0]
本稿では,GATOS(Generative AI- enabled Theme Organization and Structuring)ワークフローを紹介する。
オープンソースの機械学習技術、自然言語処理ツール、および生成テキストモデルを使用して、テーマ分析を容易にする。
GATOSのワークフローは、元の合成データセットを生成するのに使われたテキストのテーマを識別できることを示す。
論文 参考訳(メタデータ) (2024-09-28T18:52:16Z) - Interactive Topic Models with Optimal Transport [75.26555710661908]
ラベル名監視型トピックモデリングのためのアプローチとして,EdTMを提案する。
EdTMは、LM/LLMベースのドキュメントトピック親和性を活用しながら、代入問題としてのトピックモデリングをモデル化する。
論文 参考訳(メタデータ) (2024-06-28T13:57:27Z) - generAItor: Tree-in-the-Loop Text Generation for Language Model
Explainability and Adaptation [28.715001906405362]
大規模言語モデル(LLM)は、自動補完、補助的な書き込み、チャットベースのテキスト生成など、様々な下流タスクに広くデプロイされている。
本稿では,ビーム探索ツリーの視覚的表現を解析,説明,適応する中心的な要素とする,ループ内ツリーのアプローチを提案することで,この欠点に対処する。
視覚解析技術であるGenerAItorを,タスク固有のウィジェットで中央ビーム探索木を拡大し,ターゲットとした可視化とインタラクションの可能性を提供する。
論文 参考訳(メタデータ) (2024-03-12T13:09:15Z) - An Image-based Typology for Visualization [23.716718517642878]
本稿では,画像からの視覚表現の質的解析結果について述べる。
定義群を10種類に分類した。
我々は、6,833枚のタグ付き画像のデータセットと、ラベル付き画像の大規模な集合を探索および分析するために使用できるオンラインツールを提供する。
論文 参考訳(メタデータ) (2024-03-07T04:33:42Z) - Language Model Decoding as Likelihood-Utility Alignment [54.70547032876017]
モデルの有効性がタスク固有の実用性の概念とどのように一致しているかについて、暗黙の仮定に基づいて、デコード戦略をグループ化する分類法を導入する。
具体的には、様々なタスクの集合における予測の可能性と有用性の相関を解析することにより、提案された分類を裏付ける最初の実証的証拠を提供する。
論文 参考訳(メタデータ) (2022-10-13T17:55:51Z) - What and How of Machine Learning Transparency: Building Bespoke
Explainability Tools with Interoperable Algorithmic Components [77.87794937143511]
本稿では,データ駆動予測モデルを説明するためのハンズオントレーニング教材について紹介する。
これらのリソースは、解釈可能な表現合成、データサンプリング、説明生成の3つのコアビルディングブロックをカバーする。
論文 参考訳(メタデータ) (2022-09-08T13:33:25Z) - No Pattern, No Recognition: a Survey about Reproducibility and
Distortion Issues of Text Clustering and Topic Modeling [0.0]
機械学習アルゴリズムは、ラベルのないテキストから知識を抽出するために使用することができる。
教師なし学習は、機械学習アルゴリズムによって変動を引き起こす可能性がある。
異常値と異常値の存在が決定要因となる。
論文 参考訳(メタデータ) (2022-08-02T19:51:43Z) - Self-Supervised Visual Representation Learning with Semantic Grouping [50.14703605659837]
我々は、未ラベルのシーン中心のデータから視覚表現を学習する問題に取り組む。
本研究では,データ駆動型セマンティックスロット,すなわちSlotConによる協調型セマンティックグルーピングと表現学習のためのコントラスト学習を提案する。
論文 参考訳(メタデータ) (2022-05-30T17:50:59Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - Interpretable Deep Learning: Interpretations, Interpretability,
Trustworthiness, and Beyond [49.93153180169685]
一般に混同される2つの基本的な概念(解釈と解釈可能性)を紹介・明らかにする。
我々は,新しい分類法を提案することにより,異なる視点から,最近のいくつかの解釈アルゴリズムの設計を詳細に述べる。
信頼される」解釈アルゴリズムを用いてモデルの解釈可能性を評価する上での既存の作業をまとめる。
論文 参考訳(メタデータ) (2021-03-19T08:40:30Z) - Visually Analyzing Contextualized Embeddings [2.802183323381949]
本稿では,ディープニューラルネットワークに基づく言語モデルによって生成された文脈的埋め込みを視覚的に解析する手法を提案する。
我々のアプローチは自然言語処理のための言語探索から着想を得ており、タスクは言語構造のための言語モデルを探索するために設計されている。
論文 参考訳(メタデータ) (2020-09-05T15:40:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。