論文の概要: How to Do Things with Deep Learning Code
- arxiv url: http://arxiv.org/abs/2304.09406v1
- Date: Wed, 19 Apr 2023 03:46:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-20 15:40:21.322498
- Title: How to Do Things with Deep Learning Code
- Title(参考訳): 深層学習コードを使って物事をする方法
- Authors: Minh Hua, Rita Raley
- Abstract要約: 我々は,一般ユーザーが深層学習システムの行動と対話し,直接的に対話する手段に注意を向ける。
問題となっているのは、大規模言語モデルの責任ある応用について、社会技術的に理解されたコンセンサスを達成する可能性である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The premise of this article is that a basic understanding of the composition
and functioning of large language models is critically urgent. To that end, we
extract a representational map of OpenAI's GPT-2 with what we articulate as two
classes of deep learning code, that which pertains to the model and that which
underwrites applications built around the model. We then verify this map
through case studies of two popular GPT-2 applications: the text adventure
game, AI Dungeon, and the language art project, This Word Does Not Exist. Such
an exercise allows us to test the potential of Critical Code Studies when the
object of study is deep learning code and to demonstrate the validity of code
as an analytical focus for researchers in the subfields of Critical Artificial
Intelligence and Critical Machine Learning Studies. More broadly, however, our
work draws attention to the means by which ordinary users might interact with,
and even direct, the behavior of deep learning systems, and by extension works
toward demystifying some of the auratic mystery of "AI." What is at stake is
the possibility of achieving an informed sociotechnical consensus about the
responsible applications of large language models, as well as a more expansive
sense of their creative capabilities-indeed, understanding how and where
engagement occurs allows all of us to become more active participants in the
development of machine learning systems.
- Abstract(参考訳): 本稿の前提は,大規模言語モデルの構成と機能に関する基本的な理解が,極めて緊急的であることである。
そこで我々は,OpenAI の GPT-2 の表現マップを,モデルに関連する深層学習コードの2つのクラスとして記述し,モデルを中心に構築されたアプリケーションを書き込む。
次に、テキストアドベンチャーゲーム、AI Dungeon、言語アートプロジェクトであるThis Word Does Not Existの2つの人気のあるGPT-2アプリケーションのケーススタディを通して、このマップを検証する。
このようなエクササイズによって、学習対象が深層学習コードである場合の臨界コード研究の可能性をテストすることができ、批判的人工知能と批判的機械学習研究のサブフィールドの研究者にとって分析的焦点としてのコードの妥当性を示すことができる。
しかし,本研究は,より広範に,一般ユーザーが深層学習システムの行動と対話し,さらに直接的に対話する手段に注意を向け,さらに「AI」のオーラティックミステリーの一部を解明するための拡張作業を行っている。
注目されているのは、大規模言語モデルの責任ある応用に関する社会技術的コンセンサスを得る可能性であり、また、その創造的能力のより広範に理解され、どのように、どこでエンゲージメントが発生するかを理解し、私たち全員が機械学習システムの開発にもっと積極的に参加できるようになる。
関連論文リスト
- Interpreting Latent Student Knowledge Representations in Programming Assignments [2.184775414778289]
本稿では,学生の潜在的知識状態の解釈を促す情報正規化オープンエンドアイテム応答理論モデルを提案する。
本稿では,InfoOIRTが学生のコードを正確に生成し,解釈可能な学生の知識表現につながることを示す。
論文 参考訳(メタデータ) (2024-05-13T22:01:03Z) - Knowledge Plugins: Enhancing Large Language Models for Domain-Specific
Recommendations [50.81844184210381]
本稿では,大規模言語モデルをDOmain固有のKnowledgEで拡張し,実践的アプリケーション,すなわちDOKEの性能を向上させるためのパラダイムを提案する。
このパラダイムはドメイン知識抽出器に依存し,1)タスクに効果的な知識を準備すること,2)特定のサンプルごとに知識を選択すること,3)LLMで理解可能な方法で知識を表現すること,の3つのステップで動作する。
論文 参考訳(メタデータ) (2023-11-16T07:09:38Z) - Detecting Any Human-Object Interaction Relationship: Universal HOI
Detector with Spatial Prompt Learning on Foundation Models [55.20626448358655]
本研究では,ビジョン・ランゲージ(VL)基礎モデルと大規模言語モデル(LLM)を用いて,オープンワールド環境におけるユニバーサルインタラクション認識について検討する。
我々の設計にはHO Prompt-guided Decoder (HOPD) が含まれており、基礎モデルにおける高次関係表現と画像内の様々なHOペアとの結合を容易にする。
オープンカテゴリの対話認識では,対話文と解釈文の2つのタイプがサポートされている。
論文 参考訳(メタデータ) (2023-11-07T08:27:32Z) - Beyond Factuality: A Comprehensive Evaluation of Large Language Models
as Knowledge Generators [78.63553017938911]
大規模言語モデル(LLM)は、下流の知識集約タスクのための情報検索技術より優れている。
しかし、コミュニティの懸念は、この無検閲の知識を使用することの事実と潜在的意味について多岐にわたる。
本研究では,6つの重要な視点から生成した知識を評価するために設計されたCONNERを紹介する。
論文 参考訳(メタデータ) (2023-10-11T08:22:37Z) - How Generative AI models such as ChatGPT can be (Mis)Used in SPC
Practice, Education, and Research? An Exploratory Study [2.0841728192954663]
生成人工知能(AI)モデルは、統計的プロセス制御(SPC)の実践、学習、研究に革命をもたらす可能性がある。
これらのツールは開発の初期段階にあり、簡単に誤用されるか、誤解される可能性がある。
コードを提供し、基本的な概念を説明し、SPCの実践、学習、研究に関する知識を創造するChatGPTの能力を探求する。
論文 参考訳(メタデータ) (2023-02-17T15:48:37Z) - Exploring External Knowledge for Accurate modeling of Visual and
Language Problems [2.7190267444272056]
この論文は、多くの困難なタスクを含む視覚的および言語的理解に焦点を当てている。
これらの問題を解決する最先端の手法は通常、ソースデータとターゲットラベルの2つの部分のみを含む。
まず外部知識を抽出し,元のモデルと統合する手法を開発した。
論文 参考訳(メタデータ) (2023-01-27T02:01:50Z) - Learning Action-Effect Dynamics for Hypothetical Vision-Language
Reasoning Task [50.72283841720014]
本研究では,行動の効果に関する推論を改善する新しい学習戦略を提案する。
本稿では,提案手法の有効性を実証し,性能,データ効率,一般化能力の観点から,従来のベースラインに対する優位性を論じる。
論文 参考訳(メタデータ) (2022-12-07T05:41:58Z) - Ten Quick Tips for Deep Learning in Biology [116.78436313026478]
機械学習は、データのパターンを認識し、予測モデリングに使用するアルゴリズムの開発と応用に関係している。
ディープラーニングは、独自の機械学習のサブフィールドになっている。
生物学的研究の文脈において、ディープラーニングは高次元の生物学的データから新しい洞察を導き出すためにますます使われてきた。
論文 参考訳(メタデータ) (2021-05-29T21:02:44Z) - Semi-Supervised Learning Approach to Discover Enterprise User Insights
from Feedback and Support [9.66491980663996]
本稿では,Deep Learning と Topic Modeling を利用した,革新的なセミスーパーバイザラーニング手法を提案する。
このアプローチは、教師付き学習と新しい確率的・セマンティックハイブリッドトピック推論(PSHTI)モデルを組み合わせたBERTベースのマルチクラス化アルゴリズムである。
本システムは,Webクローリングを通じて製品に関するドメイン知識を活用することで,トップワードを自己ヘルプ問題にマッピングすることを可能にする。
論文 参考訳(メタデータ) (2020-07-18T01:18:00Z) - Plausible Counterfactuals: Auditing Deep Learning Classifiers with
Realistic Adversarial Examples [84.8370546614042]
ディープラーニングモデルのブラックボックスの性質は、彼らがデータから何を学ぶかについて、未回答の疑問を提起している。
GAN(Generative Adversarial Network)とマルチオブジェクトは、監査されたモデルに妥当な攻撃を与えるために使用される。
その実用性は人間の顔の分類タスクの中で示され、提案されたフレームワークの潜在的可能性を明らかにしている。
論文 参考訳(メタデータ) (2020-03-25T11:08:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。