論文の概要: Distilling Text into Circuits
- arxiv url: http://arxiv.org/abs/2301.10595v1
- Date: Wed, 25 Jan 2023 13:56:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-26 15:12:19.483421
- Title: Distilling Text into Circuits
- Title(参考訳): テキストを回路に蒸留する
- Authors: Vincent Wang-Mascianica, Jonathon Liu, Bob Coecke
- Abstract要約: DisCoCirc というフレームワークがスケッチされ,(1) は構成的かつ分布的(ベクトル的)であること,(2) 一般文に適用すること,(3) 意味間の言語的つながりを捉えること(文法)
ここでは、DisCoCircに相当量の英語の断片があることに気付きます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper concerns the structure of meanings within natural language.
Earlier, a framework named DisCoCirc was sketched that (1) is compositional and
distributional (a.k.a. vectorial); (2) applies to general text; (3) captures
linguistic `connections' between meanings (cf. grammar) (4) updates word
meanings as text progresses; (5) structures sentence types; (6) accommodates
ambiguity. Here, we realise DisCoCirc for a substantial fragment of English.
When passing to DisCoCirc's text circuits, some `grammatical bureaucracy' is
eliminated, that is, DisCoCirc displays a significant degree of (7) inter- and
intra-language independence. That is, e.g., independence from word-order
conventions that differ across languages, and independence from choices like
many short sentences vs. few long sentences. This inter-language independence
means our text circuits should carry over to other languages, unlike the
language-specific typings of categorial grammars. Hence, text circuits are a
lean structure for the `actual substance of text', that is, the inner-workings
of meanings within text across several layers of expressiveness (cf. words,
sentences, text), and may capture that what is truly universal beneath grammar.
The elimination of grammatical bureaucracy also explains why DisCoCirc: (8)
applies beyond language, e.g. to spatial, visual and other cognitive modes.
While humans could not verbally communicate in terms of text circuits, machines
can.
We first define a `hybrid grammar' for a fragment of English, i.e. a
purpose-built, minimal grammatical formalism needed to obtain text circuits. We
then detail a translation process such that all text generated by this grammar
yields a text circuit. Conversely, for any text circuit obtained by freely
composing the generators, there exists a text (with hybrid grammar) that gives
rise to it. Hence: (9) text circuits are generative for text.
- Abstract(参考訳): 本稿では自然言語における意味の構造について述べる。
以前、discocirc というフレームワークは、(1) は構成的かつ分布的(すなわちベクトル的)であり、(2) は一般のテキストに適用され、(3) 意味(文法)間の言語的「接続」をキャプチャする、(4) 単語の意味をテキストの進行に応じて更新する、(5) 構造文型は曖昧性に対応している、というスケッチがなされた。
ここでは、DisCoCircに相当量の英語の断片があることに気付きます。
DisCoCircのテキスト回路に渡すと、いくつかの「文法官僚主義」が排除される。
例えば、言語によって異なる単語順の慣習からの独立性や、多くの短い文のような選択からの独立性などです。
この言語間独立性は、分類文法の言語固有の型付けとは異なり、テキスト回路を他の言語に継承することを意味する。
したがって、テキスト回路は「テキストの実際の実体」のリーン構造であり、表現力のある複数の層(単語、文、テキスト)にまたがるテキスト内の意味の内部作業であり、文法の下で真に普遍的であることを捉えることができる。
文法官僚主義の排除はまた、DisCoCirc: (8) 言語を超えて、例えば空間、視覚、その他の認知モードに適用する理由を説明している。
人間はテキスト回路で口頭でコミュニケーションすることができないが、機械はできる。
まず、英語の断片に対して「ハイブリッド文法」を定義する。すなわち、テキスト回路を得るのに必要な目的の最小限の文法形式である。
次に、この文法によって生成されたすべてのテキストがテキスト回路を生成するように翻訳プロセスの詳細を示す。
逆に、生成器を自由に構成して得られる任意のテキスト回路に対して、それを引き起こすテキスト(ハイブリッド文法)が存在する。
したがって、 (9)テキスト回路はテキストに対して生成される。
関連論文リスト
- Grammar Induction from Visual, Speech and Text [91.98797120799227]
本研究は、新しい視覚音声テキスト文法誘導タスク(textbfVAT-GI)を導入する。
言語文法がテキストを超えて存在するという事実に触発されて、テキストは文法帰納において支配的なモダリティであってはならないと論じる。
そこで本稿では,豊富なモーダル特化機能と補完機能を有効文法解析に活用した,ビジュアル・オーディオ・テキスト・インサイド・アウトサイド・オートエンコーダ(textbfVaTiora)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-01T02:24:18Z) - Wav2Gloss: Generating Interlinear Glossed Text from Speech [78.64412090339044]
音声から4つの言語アノテーションを自動抽出するタスクであるWav2Glossを提案する。
音声からのインターリニア・グロッシド・テキスト・ジェネレーションの今後の研究の基盤となる基盤となるものについて述べる。
論文 参考訳(メタデータ) (2024-03-19T21:45:29Z) - Spot the bot: Coarse-Grained Partition of Semantic Paths for Bots and
Humans [55.2480439325792]
本稿では,人書きテキストとボット生成テキストのセマンティックパスの粗粒度分割構造の比較に焦点をあてる。
意味構造が言語によって異なる可能性があるため、ロシア語、英語、ドイツ語、ベトナム語を調査する。
論文 参考訳(メタデータ) (2024-02-27T10:38:37Z) - Guiding Text-to-Text Privatization by Syntax [0.0]
メトリック微分プライバシー(Metric Differential Privacy)は、テキストからテキストへのプライベート化というユニークな課題に対処するために設計された、差分プライバシーの一般化である。
置換後の単語の文法的カテゴリを保存するために,テキスト・テキスト・プライベート化の能力を分析する。
我々は、民営化のステップを、置換が一致した文法特性を持つ単語に向けられる候補選択問題に変換する。
論文 参考訳(メタデータ) (2023-06-02T11:52:21Z) - Language-independence of DisCoCirc's Text Circuits: English and Urdu [0.0]
DisCoCircはテキストの文法と意味を表現するためのフレームワークである。
本研究では,DisCoCirc回路を通過すると,英語とウルドゥー語の文法構造の違いがなくなることを示す。
論文 参考訳(メタデータ) (2022-08-11T09:32:00Z) - Sentences as connection paths: A neural language architecture of
sentence structure in the brain [0.0]
論文は、脳内の文構造に関するニューラル言語アーキテクチャを提示する。
言葉は「in-situ」のままであり、常に内容に順応できる。
任意文と新規文(新語)は、単語や文の「神経黒板」で作成することができる。
論文 参考訳(メタデータ) (2022-05-19T13:58:45Z) - VLGrammar: Grounded Grammar Induction of Vision and Language [86.88273769411428]
共同学習枠組みにおける視覚と言語の基底文法誘導について検討する。
本稿では,複合確率文脈自由文法(pcfgs)を用いて言語文法と画像文法を同時に誘導する手法であるvlgrammarを提案する。
論文 参考訳(メタデータ) (2021-03-24T04:05:08Z) - Automatic Extraction of Rules Governing Morphological Agreement [103.78033184221373]
原文から第一パス文法仕様を抽出する自動フレームワークを開発する。
我々は、世界の多くの言語の文法の中核にあるモルフォシンタクティックな現象である合意を記述する規則の抽出に焦点をあてる。
我々のフレームワークはUniversal Dependenciesプロジェクトに含まれるすべての言語に適用され、有望な結果が得られます。
論文 参考訳(メタデータ) (2020-10-02T18:31:45Z) - Declarative Memory-based Structure for the Representation of Text Data [1.0742675209112622]
本稿では,人間の記憶基盤に影響されたテキスト表現方式を提案する。
我々は、長期記憶を利用して、経時的に観察されるテキスト情報を保存する。
Wordnetはセマンティックメモリを模倣するために使われてきた。
論文 参考訳(メタデータ) (2020-02-25T04:56:47Z) - A Deep Neural Framework for Contextual Affect Detection [51.378225388679425]
感情を持たない短い単純なテキストは、その文脈と共に読むときに強い感情を表現することができる。
文中の単語の相互依存を学習する文脈影響検出フレームワークを提案する。
論文 参考訳(メタデータ) (2020-01-28T05:03:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。