論文の概要: An Exploratory Framework for Future SETI Applications: Detecting Generative Reactivity via Language Models
- arxiv url: http://arxiv.org/abs/2506.02730v1
- Date: Tue, 03 Jun 2025 10:46:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:35.5941
- Title: An Exploratory Framework for Future SETI Applications: Detecting Generative Reactivity via Language Models
- Title(参考訳): 将来のSETIアプリケーションのための探索的フレームワーク:言語モデルによる生成的反応性の検出
- Authors: Po-Chieh Yu,
- Abstract要約: 我々は、地球外信号の復号化を前提とせず、入力が生成系における言語行動を引き起こすかどうかを評価する。
音声入力は,ヒトの発声,ハンプバッククジラの発声,Phyloscopus trochilus Birdong,アルゴリズムによる白色雑音の4種類を検討した。
その結果,クジラと鳥の発声は白色雑音よりもSIPスコアが高く,ヒトの発声は中程度の反応しか起こらなかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present an exploratory framework to test whether noise-like input can induce structured responses in language models. Instead of assuming that extraterrestrial signals must be decoded, we evaluate whether inputs can trigger linguistic behavior in generative systems. This shifts the focus from decoding to viewing structured output as a sign of underlying regularity in the input. We tested GPT-2 small, a 117M-parameter model trained on English text, using four types of acoustic input: human speech, humpback whale vocalizations, Phylloscopus trochilus birdsong, and algorithmically generated white noise. All inputs were treated as noise-like, without any assumed symbolic encoding. To assess reactivity, we defined a composite score called Semantic Induction Potential (SIP), combining entropy, syntax coherence, compression gain, and repetition penalty. Results showed that whale and bird vocalizations had higher SIP scores than white noise, while human speech triggered only moderate responses. This suggests that language models may detect latent structure even in data without conventional semantics. We propose that this approach could complement traditional SETI methods, especially in cases where communicative intent is unknown. Generative reactivity may offer a different way to identify data worth closer attention.
- Abstract(参考訳): 本稿では,雑音のような入力が言語モデルにおける構造化応答を誘発できるかどうかを探索する枠組みを提案する。
我々は、地球外信号の復号化を前提とせず、入力が生成系における言語行動を引き起こすかどうかを評価する。
これにより、焦点がデコードから構造化された出力にシフトし、入力の根底にある正則性の兆候となる。
GPT-2 small, a 117M-parameter model training on English text, using four type of acoustic input: human speech, humpback whale vocalizations, Phylloscopus trochilus birdsong, and algorithmally generated white noise。
全ての入力はノイズのように扱われ、シンボルエンコーディングは想定されなかった。
反応を評価するために,エントロピー,構文コヒーレンス,圧縮ゲイン,繰り返しペナルティを組み合わせたセマンティック誘導電位 (SIP) という複合スコアを定義した。
その結果,クジラと鳥の発声は白色雑音よりもSIPスコアが高く,ヒトの発声は中程度の反応しか起こらなかった。
これは、従来の意味論のないデータにおいても、言語モデルが潜在構造を検出する可能性があることを示唆している。
本稿では,従来のSETI手法を補完する手法を提案する。
生成的反応性は、注目に値するデータを識別する別の方法を提供するかもしれない。
関連論文リスト
- Languages in Multilingual Speech Foundation Models Align Both Phonetically and Semantically [58.019484208091534]
事前訓練された言語モデル(LM)における言語間アライメントは、テキストベースのLMの効率的な転送を可能にしている。
テキストに基づく言語間アライメントの発見と手法が音声に適用されるかどうかについては、未解決のままである。
論文 参考訳(メタデータ) (2025-05-26T07:21:20Z) - DeepSpeech models show Human-like Performance and Processing of Cochlear Implant Inputs [12.234206036041218]
我々は、ディープニューラルネットワーク(DNN)のDeepSpeech2をパラダイムとして、自然入力と人工内耳ベースの入力が時間の経過とともにどのように処理されるかを調べる。
音声文から自然言語および人工内耳のような入力を生成し、モデル性能と人的性能の類似性を検証した。
各レイヤにおける時間的ダイナミクスは、コンテキストや入力タイプの影響を受けます。
論文 参考訳(メタデータ) (2024-07-30T04:32:27Z) - Language Generation from Brain Recordings [68.97414452707103]
本稿では,大言語モデルと意味脳デコーダの容量を利用した生成言語BCIを提案する。
提案モデルでは,視覚的・聴覚的言語刺激のセマンティック内容に整合したコヒーレントな言語系列を生成することができる。
本研究は,直接言語生成におけるBCIの活用の可能性と可能性を示すものである。
論文 参考訳(メタデータ) (2023-11-16T13:37:21Z) - READIN: A Chinese Multi-Task Benchmark with Realistic and Diverse Input
Noises [87.70001456418504]
我々は、Realistic and Diverse Input Noisesを用いた中国のマルチタスクベンチマークREADINを構築した。
READINには4つの多様なタスクとアノテータが含まれており、Pinyin入力と音声入力という2つの一般的な中国語入力方式で元のテストデータを再入力するよう要求する。
我々は、強化された事前訓練された言語モデルと、堅牢なトレーニング手法を用いて実験を行い、これらのモデルがREADINに顕著な性能低下を被ることがしばしば見いだされた。
論文 参考訳(メタデータ) (2023-02-14T20:14:39Z) - Applying Feature Underspecified Lexicon Phonological Features in
Multilingual Text-to-Speech [1.9688095374610102]
ARPABET/pinyinをSAMPA/SAMPA-SCにマッピングし,音声学的特徴について検討した。
このマッピングは、2つの言語でネイティブ、非ネイティブ、コードスイッチングされたスピーチを成功させるかどうかテストされた。
論文 参考訳(メタデータ) (2022-04-14T21:04:55Z) - Applying Phonological Features in Multilingual Text-To-Speech [2.567123525861164]
ARPABET/pinyinをSAMPA/SAMPA-SCにマッピングし,音声学的特徴について検討した。
このマッピングが、2つの言語でネイティブ、非ネイティブ、コードスイッチトされた音声の生成を成功させるかどうかを検証した。
論文 参考訳(メタデータ) (2021-10-07T16:37:01Z) - Is Attention always needed? A Case Study on Language Identification from
Speech [1.162918464251504]
本研究では,畳み込みリカレントニューラルネットワーク(CRNN)を用いたLIDを提案する。
CRNNベースのLIDは、音声サンプルのMel- frequency Cepstral Coefficient(MFCC)特性で動作するように設計されている。
LIDモデルは言語的に類似した言語に対して97%から100%のハイパフォーマンスレベルを示す。
論文 参考訳(メタデータ) (2021-10-05T16:38:57Z) - Continuous speech separation: dataset and analysis [52.10378896407332]
自然な会話では、音声信号は連続的であり、重複成分と重複成分の両方を含む。
本稿では,連続音声分離アルゴリズムを評価するためのデータセットとプロトコルについて述べる。
論文 参考訳(メタデータ) (2020-01-30T18:01:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。