このサイトではarxivの論文のうち、30ページ以下でCreative Commonsライセンス(CC 0, CC BY, CC BY-SA)の論文を日本語訳しています。 本文がCCでない論文、長すぎる論文はメタデータのみを翻訳しています。(arxivのメタデータは CC 0です。) 翻訳文のライセンスはCC BY-SA 4.0です。 翻訳にはFugu-Machine Translatorを利用しています。

本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。

公開日が20200107となっている論文です。

PDF登録状況(公開日: 20200107)

TitleAuthorsAbstract論文公表日・翻訳日
# アルゴリズムは私の医療プロキシになれるか?

Can an Algorithm be My Healthcare Proxy? ( http://arxiv.org/abs/2001.09742v1 )

ライセンス: Link先を確認
Duncan C McElfresh, Samuel Dooley, Yuan Cui, Kendra Griesman, Weiqin Wang, Tyler Will, Neil Sehgal, John P Dickerson(参考訳) 死の計画は皆が参加するプロセスではない。 しかし、計画の欠如は、患者の幸福、家族の幸福、そして医療社会全体に大きな影響を与える可能性がある。 アドバンスト・ケア・プランニング (ACP) は、半世紀にわたってアメリカ合衆国で行われてきた分野である。 現代の多くの技術は、患者に人生の終わり(EOL)について考えるよう促す。 異なる調査は異なる集団(病気の進行や文化的要因などに基づくもの)を対象としており、異なる意図で設計され、異なる方法で管理されている。 近年,先行介護計画ツールの利用者数を増やすために技術を用いた研究が進められている。 しかし、機械学習と人工知能による現代的な技術は、現在のappプロセスにさらなる変化をもたらすことができる。 本稿では,これらのツールが適用できる可能性について考察する。 患者シナリオのvignettesを通じて,これらの応用の可能性について議論する。 本稿では,AIのACPにおける適切な応用と,意図の尊重を確実にするためにAIの実装について考えることを期待する。

Planning for death is not a process in which everyone participates. Yet a lack of planning can have vast impacts on a patient's well-being, the well-being of her family, and the medical community as a whole. Advance Care Planning (ACP) has been a field in the United States for a half-century. Many modern techniques prompting patients to think about end of life (EOL) involve short surveys or questionnaires. Different surveys are targeted to different populations (based off of likely disease progression or cultural factors, for instance), are designed with different intentions, and are administered in different ways. There has been recent work using technology to increase the number of people using advance care planning tools. However, modern techniques from machine learning and artificial intelligence could be employed to make additional changes to the current ACP process. In this paper we will discuss some possible ways in which these tools could be applied. We will discuss possible implications of these applications through vignettes of patient scenarios. We hope that this paper will encourage thought about appropriate applications of artificial intelligence in ACP as well as implementation of AI in order to ensure intentions are honored.
翻訳日:2023-06-08 11:13:25 公開日:2020-01-07
# ウェアラブルセンシング研究における地中真実貿易

The Ground Truth Trade-Off in Wearable Sensing Studies ( http://arxiv.org/abs/2001.09738v1 )

ライセンス: Link先を確認
Daniyal Liaqat, Robert Wu, Salaar Liaqat, Eyal de Lara, Andrea Gershon, Frank Rudzicz(参考訳) Perez氏らがApple Watchを使って心房細動(AF)を識別する研究は、ウェアラブルコンピューティングのための大規模機械学習において破滅的な瞬間である。 関連する患者を特定することは、医療研究にとって極めて重要である。 afのような条件では、脳卒中リスクを3分の2減らすことができる。 Perezらの研究によると、420,000人の個人のうち、根拠となる真理データを持っているのは450人しかいなかった。 この研究は不規則なパルス通知を使用して417,000人の参加者を除外した。 この設計決定は、彼らの研究は正の予測値(ppv)しか報告できず、感度や特異性を調べることができなかったことを意味する。 本稿では,基礎的真理データ取得の難しさとその研究設計への応用について考察する。

Perez et al's study using the Apple Watch to identify atrial fibrillation (AF) is a watershed moment in large-scale machine learning for wearable computing. Identifying relevant patients will be tremendously important to research in healthcare. For a condition like AF, this could reduce stroke risk by two thirds. In the study by Perez et al, only 450 out of 420,000 individuals had ground truth data. Their study excluded 417,000 participants using the irregular pulse notification. This design decision means their study was only able to report positive predictive value (PPV) and unable to explore sensitivity or specificity. In this editorial, we explore the difficulty of obtaining ground truth data and its implications for study design.
翻訳日:2023-06-08 11:13:09 公開日:2020-01-07
# srf-ii法による歴史的建造物の適応的再利用の仮説比較のための複数基準決定分析

Multiple criteria decision analysis with the SRF-II method to compare hypotheses of adaptive reuse for an iconic historical building ( http://arxiv.org/abs/2001.01964v1 )

ライセンス: Link先を確認
Francesca Abastante, Salvatore Corrente, Salvatore Greco, Isabella Lami, Beatrice Mecca(参考訳) 本稿は,イタリア・トリノにある歴史的建造物(株式取引所)の適応的再利用に関する6つの仮説の分析を,複数の基準決定支援ツール(mcda)がいかに支援し得るかを示す。 過去2年間、建物の再配置に関する議論は、市民によって「記念物」と見なされ、建築的・タイプ的価値が全国的に認識され、公益と私益が伴うなど、いくつかの理由から大きなものとなった。 In this context, interacting with experts involved in the ongoing discussion, we consider a recently proposed conjunction of four MCDA methods, namely: Multiple Criteria Hierarchy Process (MCHP), permitting to consider structural relationships between criteria; ELECTRE III, considering three types of interaction effects between criteria (strengthening, weakening and antagonistic effects); the imprecise SRF method, supplying an easily understandable approach to collect information from the DM; and Stochastic Multicriteria Acceptability Analysis (SMAA), providing robust recommendation, in terms of rankings and relations of preference, indifference and incomparability between project alternatives, at each level of the hierarchy. そこで本研究では,同一のsrf法において重要な進歩となる意思決定支援手順の信頼性を高めるため,sfr-iiと呼ばれるsrf法の改良を提案する。

The paper shows how Multiple Criteria Decision Aiding (MCDA) tools can support the analyses of six hypotheses of adaptive reuse of an iconic historical building in Turin, Italy (called Stock Exchange) to identify the preferred alternative. In the last two years, the debate around the requalification of the building has been huge for several reasons: it is perceived as a "monument" by citizens; it shows architectural and typological values nationally recognized; it involves public and private interests. In this context, interacting with experts involved in the ongoing discussion, we consider a recently proposed conjunction of four MCDA methods, namely: Multiple Criteria Hierarchy Process (MCHP), permitting to consider structural relationships between criteria; ELECTRE III, considering three types of interaction effects between criteria (strengthening, weakening and antagonistic effects); the imprecise SRF method, supplying an easily understandable approach to collect information from the DM; and Stochastic Multicriteria Acceptability Analysis (SMAA), providing robust recommendation, in terms of rankings and relations of preference, indifference and incomparability between project alternatives, at each level of the hierarchy. We propose a modification of the SRF methodology, called SFR-II, to increase the reliability of the decision aid procedure, which could constitute a significant advance for the same SRF method.
翻訳日:2023-06-08 11:12:58 公開日:2020-01-07
# 確率的機械学習のための多項式複雑性を持つベイズテンソルネットワーク

Bayesian Tensor Network with Polynomial Complexity for Probabilistic Machine Learning ( http://arxiv.org/abs/1912.12923v2 )

ライセンス: Link先を確認
Shi-Ju Ran(参考訳) 複数の事象の条件付き確率の記述や計算は指数関数的に高価であることが知られている。 本研究では,複数の事象の条件確率を多項式複雑性で効率的に捉えるために,ベイズテンソルネットワーク(BTN)を提案する。 BTNは、TNのサブセットを形成する有向非巡回グラフィカルモデルである。 指数的に多くの事象に対するその妥当性を検証するため、BTNは画像認識に実装され、この分類は指数的に大きなサンプル空間における条件付き確率を捉えるためにマッピングされる。 競合性能は単純なツリーネットワーク構造を持つBTNによって達成される。 量子系のテンソルネットワークシミュレーションと類似して、単純なツリーBTNの妥当性は、画像認識問題における変動の'area law''を意味する。

It is known that describing or calculating the conditional probabilities of multiple events is exponentially expensive. In this work, Bayesian tensor network (BTN) is proposed to efficiently capture the conditional probabilities of multiple sets of events with polynomial complexity. BTN is a directed acyclic graphical model that forms a subset of TN. To testify its validity for exponentially many events, BTN is implemented to the image recognition, where the classification is mapped to capturing the conditional probabilities in an exponentially large sample space. Competitive performance is achieved by the BTN with simple tree network structures. Analogous to the tensor network simulations of quantum systems, the validity of the simple-tree BTN implies an ``area law'' of fluctuations in image recognition problems.
翻訳日:2023-01-17 02:33:49 公開日:2020-01-07
# 機械のフリート型状態監視のための汎用異常検出フレームワーク

A general anomaly detection framework for fleet-based condition monitoring of machines ( http://arxiv.org/abs/1912.12941v3 )

ライセンス: Link先を確認
Kilian Hendrickx, Wannes Meert, Yves Mollet, Johan Gyselinck, Bram Cornelis, Konstantinos Gryllias, Jesse Davis(参考訳) 機械の故障は時間とともに減少し、補修コストや人的被害や環境汚染につながる可能性がある。 最近の状態監視技術は、時間を要する手動分析と手作りの特徴抽出を避けるために人工知能を使用している。 これらの多くは単一のマシンのみを分析し、大きな履歴データセットを必要とする。 実際には、収集が難しくて費用がかかる場合がある。 しかし、いくつかの産業条件監視アプリケーションには、同様のオペレーティングシステム群が含まれる。 これらのアプリケーションのほとんどは、ほとんどのマシンにとって健全な条件を仮定することは安全である。 マシンの振る舞いを逸脱することはマシンの障害の指標となる。 本研究は,フリート型状態監視のための教師なし,ジェネリック,異常検出フレームワークを提案する。 一般的なビルディングブロックを使用し、3つの重要な利点を提供する。 まず、オンラインのフリートベース比較のため、歴史的なデータセットは不要である。 第二に、ドメインの専門知識をユーザ定義の比較尺度で組み込むことができる。 最後に、ほとんどのブラックボックス人工知能技術とは対照的に、容易に解釈できるため、ドメインの専門家はフレームワークによってなされた予測を検証できる。 電気機械群における2つのユースケースは、電気的および振動的シグネチャを用いて電圧アンバランスを検出する枠組みの適用性を示す。

Machine failures decrease up-time and can lead to extra repair costs or even to human casualties and environmental pollution. Recent condition monitoring techniques use artificial intelligence in an effort to avoid time-consuming manual analysis and handcrafted feature extraction. Many of these only analyze a single machine and require a large historical data set. In practice, this can be difficult and expensive to collect. However, some industrial condition monitoring applications involve a fleet of similar operating machines. In most of these applications, it is safe to assume healthy conditions for the majority of machines. Deviating machine behavior is then an indicator for a machine fault. This work proposes an unsupervised, generic, anomaly detection framework for fleet-based condition monitoring. It uses generic building blocks and offers three key advantages. First, a historical data set is not required due to online fleet-based comparisons. Second, it allows incorporating domain expertise by user-defined comparison measures. Finally, contrary to most black-box artificial intelligence techniques, easy interpretability allows a domain expert to validate the predictions made by the framework. Two use-cases on an electrical machine fleet demonstrate the applicability of the framework to detect a voltage unbalance by means of electrical and vibration signatures.
翻訳日:2023-01-17 02:25:13 公開日:2020-01-07
# 多言語ニューラルマシン翻訳の包括的調査

A Comprehensive Survey of Multilingual Neural Machine Translation ( http://arxiv.org/abs/2001.01115v2 )

ライセンス: Link先を確認
Raj Dabre, Chenhui Chu, Anoop Kunchukuttan(参考訳) 近年,多言語ニューラルマシン翻訳 (MNMT) が注目されている。 mnmtは翻訳知識伝達(トランスファー学習)の結果、翻訳品質を向上させるのに有用である。 MNMTは、機械翻訳の研究のために、エンドツーエンドのモデリングと分散表現が新しい道を開くため、統計機械翻訳よりも有望で興味深い。 多言語並列コーパスを翻訳品質向上に活用するために多くのアプローチが提案されている。 しかしながら、包括的な調査の欠如は、どのアプローチが有望であるかを決定することが難しく、したがってさらなる調査に値する。 本稿では,MNMTにおける既存文献の詳細な調査を行う。 まず、その中心的なユースケースに基づいてさまざまなアプローチを分類し、次にリソースシナリオ、基盤となるモデリング原則、コアイシュー、課題に基づいてさらに分類します。 可能な限り私たちは,いくつかのテクニックの長所と短所を,それらを比較することによって解決します。 MNMT研究がもたらす今後の方向性についても論じる。 本論文はnmtの初心者と専門家の両方を対象としている。 この論文が、mnmtに関心を持つ研究者やエンジニアのための新しいアイデアの出発点となることを願っている。

We present a survey on multilingual neural machine translation (MNMT), which has gained a lot of traction in the recent years. MNMT has been useful in improving translation quality as a result of translation knowledge transfer (transfer learning). MNMT is more promising and interesting than its statistical machine translation counterpart because end-to-end modeling and distributed representations open new avenues for research on machine translation. Many approaches have been proposed in order to exploit multilingual parallel corpora for improving translation quality. However, the lack of a comprehensive survey makes it difficult to determine which approaches are promising and hence deserve further exploration. In this paper, we present an in-depth survey of existing literature on MNMT. We first categorize various approaches based on their central use-case and then further categorize them based on resource scenarios, underlying modeling principles, core-issues and challenges. Wherever possible we address the strengths and weaknesses of several techniques by comparing them with each other. We also discuss the future directions that MNMT research might take. This paper is aimed towards both, beginners and experts in NMT. We hope this paper will serve as a starting point as well as a source of new ideas for researchers and engineers interested in MNMT.
翻訳日:2023-01-14 12:31:44 公開日:2020-01-07
# ディープラーニング学習のリアルタイムインタラクティブ解析システム

A System for Real-Time Interactive Analysis of Deep Learning Training ( http://arxiv.org/abs/2001.01215v2 )

ライセンス: Link先を確認
Shital Shah, Roland Fernandez, Steven Drucker(参考訳) 深層学習モデルの訓練中に診断や探索的分析を行うのは難しいが、漸進的な観察によって導かれる一連の決定を行うには、しばしば必要である。 この目的のために現在利用可能なシステムは、トレーニングプロセスが始まる前に指定しなければならないログデータのみを監視することに限定されている。 新しい情報が要求される度に、トレーニングプロセスでストップ・チェンジ・リスタートのサイクルが必要となる。 これらの制限は、インタラクティブな探索と診断のタスクを困難にし、モデル開発中に長い退屈なイテレーションを課す。 本稿では,複数面の複数のフォーマットで同時にレンダリング可能なリアルタイム情報を生成するライブプロセス上で,ユーザが対話的なクエリを実行できるようにするシステムを提案する。 これを実現するために,多くのデータサイエンティストがすでに慣れ親しんだmap-reduceパラダイムを用いて,ディープラーニングトレーニングプロセスの様々な探索的検査と診断タスクをストリームの仕様としてモデル化する。 現在利用可能なシステムと根本的に異なるアプローチである構成可能なプリミティブを定義することで,汎用性と拡張性を実現する。 このシステムのオープンソース実装はTensorWatchプロジェクトとしてhttps://github.com/microsoft/tensorwatch.comで公開されている。

Performing diagnosis or exploratory analysis during the training of deep learning models is challenging but often necessary for making a sequence of decisions guided by the incremental observations. Currently available systems for this purpose are limited to monitoring only the logged data that must be specified before the training process starts. Each time a new information is desired, a cycle of stop-change-restart is required in the training process. These limitations make interactive exploration and diagnosis tasks difficult, imposing long tedious iterations during the model development. We present a new system that enables users to perform interactive queries on live processes generating real-time information that can be rendered in multiple formats on multiple surfaces in the form of several desired visualizations simultaneously. To achieve this, we model various exploratory inspection and diagnostic tasks for deep learning training processes as specifications for streams using a map-reduce paradigm with which many data scientists are already familiar. Our design achieves generality and extensibility by defining composable primitives which is a fundamentally different approach than is used by currently available systems. The open source implementation of our system is available as TensorWatch project at https://github.com/microsoft/tensorwatch.
翻訳日:2023-01-14 07:42:23 公開日:2020-01-07
# 人間の視覚システムと敵AI

The Human Visual System and Adversarial AI ( http://arxiv.org/abs/2001.01172v2 )

ライセンス: Link先を確認
Yaoshiang Ho, Samuel Wookey(参考訳) 本稿では,人間視覚システムの理論を適用し,AIをより効果的にする。 これまでAdversarial AIは、Lpノルムを用いたクリーンと逆のイメージの知覚距離をモデル化してきた。 これらの規範は、単純な数学的記述の利点と知覚距離を近似する妥当な有効性を持っている。 しかし、過去数十年間、画像処理の他の領域は平均二乗誤差(mse)のような単純なモデルを超えて、人間の視覚システム(hvs)をよりよく近似するより複雑なモデルへと移行してきた。 本稿では,HVSモデルをAdversarial AIに組み込むことの概念実証を行う。

This paper applies theories about the Human Visual System to make Adversarial AI more effective. To date, Adversarial AI has modeled perceptual distances between clean and adversarial examples of images using Lp norms. These norms have the benefit of simple mathematical description and reasonable effectiveness in approximating perceptual distance. However, in prior decades, other areas of image processing have moved beyond simpler models like Mean Squared Error (MSE) towards more complex models that better approximate the Human Visual System (HVS). We demonstrate a proof of concept of incorporating HVS models into Adversarial AI.
翻訳日:2023-01-14 07:41:23 公開日:2020-01-07
# 深い可視化による連続学習における破滅的予測

Dissecting Catastrophic Forgetting in Continual Learning by Deep Visualization ( http://arxiv.org/abs/2001.01578v2 )

ライセンス: Link先を確認
Giang Nguyen, Shuan Chen, Thao Do, Tae Joon Jun, Ho-Jin Choi, Daeyoung Kim(参考訳) 深層ニューラルネットワーク(通常はブラックボックスと見なされる)の振る舞いを解釈することは、特に人間の生活の様々な側面に広く採用されている場合に重要である。 本稿では、説明可能な人工知能の進歩を踏まえ、連続学習における破滅的な忘れを識別するAuto DeepVisと呼ばれる新しい手法を提案する。 また,Auto DeepVisによるジレンマの解明に際し,破滅的な「臨界凍結」に対処する新たな手法が導入された。 キャプションモデルの実験は、特にどのコンポーネントが忘れているか、または変化しているかを示す、破滅的な忘れ方がどのように起こるかを注意深く示す。 より正確には、クリティカルフリーズが、ベースラインよりも以前のタスクと今後のタスクの両方において最高のパフォーマンスを主張し、調査の能力を証明する。 我々の技術は、生涯学習のための破滅的な忘れを完全に根絶するための既存の解決策を補うだけでなく、説明も可能である。

Interpreting the behaviors of Deep Neural Networks (usually considered as a black box) is critical especially when they are now being widely adopted over diverse aspects of human life. Taking the advancements from Explainable Artificial Intelligent, this paper proposes a novel technique called Auto DeepVis to dissect catastrophic forgetting in continual learning. A new method to deal with catastrophic forgetting named critical freezing is also introduced upon investigating the dilemma by Auto DeepVis. Experiments on a captioning model meticulously present how catastrophic forgetting happens, particularly showing which components are forgetting or changing. The effectiveness of our technique is then assessed; and more precisely, critical freezing claims the best performance on both previous and coming tasks over baselines, proving the capability of the investigation. Our techniques could not only be supplementary to existing solutions for completely eradicating catastrophic forgetting for life-long learning but also explainable.
翻訳日:2023-01-14 01:59:49 公開日:2020-01-07
# Blue River Controls: ハードウェア上の強化学習制御システムのためのツールキット

Blue River Controls: A toolkit for Reinforcement Learning Control Systems on Hardware ( http://arxiv.org/abs/2001.02254v1 )

ライセンス: Link先を確認
Kirill Polzounov, Ramitha Sundar, Lee Redden(参考訳) 我々はQuanserのハードウェア・イン・ザ・ループ・ソフトウェア開発キット(HIL SDK)を囲むシンプルなハードウェアラッパーを提供し、新しいQuanserハードウェアの開発を容易にする。 ハードウェアに接続するには、Cythonで記述されたモジュールを使用します。 内部quanserwrapperクラスは、(ハードウェアタイマーを使用する)タイミングや、ハードウェアに送信されるデータが安全かつ正しいことを保証することを含む、ハードウェアとのインタラクションの難点の大部分を処理し、安全が指定されたハードウェアの安全な動作電圧と電流に対応する。 Reinforcement Learning(RL)の成功の多くは、OpenAI GymやDeepmind Control Suiteといったトレーニングとテストツールによって実現されている。 残念なことに、シミュレーションから実際のハードウェア環境への高速なRLアルゴリズムのテストと転送のためのツールはほとんどない。 強化学習アルゴリズムを実世界のハードウェア上でトレーニングし,テストするためのツールであるblue river controlsを提案する。 openai gymをベースにしたシンプルなインターフェースで、シミュレーションとハードウェアの両方で直接動作する。 QuanserのQube Servo2-USBプラットフォームは、初期テストデバイスとして不活性化された回転振り子である。 また、他のハードウェア上でのRLアルゴリズムのトレーニングを簡単にするツールも提供しています。 古典的なコントローラと事前訓練されたRLエージェントの両方のベースラインは、タスク間でのパフォーマンスを比較するために含まれている。 blue river controlsはこのhttps urlで利用可能である。 https://github.com/bluerivertech/quanser-openai-driver

We provide a simple hardware wrapper around the Quanser's hardware-in-the-loop software development kit (HIL SDK) to allow for easy development of new Quanser hardware. To connect to the hardware we use a module written in Cython. The internal QuanserWrapper class handles most of the difficult aspects of interacting with hardware, including the timing (using a hardware timer), and ensuring the data sent to hardware is safe and correct, where safety corresponds to safe operating voltage and current for the specified hardware. Much of the recent success of Reinforcement learning (RL) has been made possible with training and testing tools like OpenAI Gym and Deepmind Control Suite. Unfortunately, tools for quickly testing and transferring high-frequency RL algorithms from simulation to real hardware environment remain mostly absent. We present Blue River Controls, a tool that allows to train and test reinforcement learning algorithms on real-world hardware. It features a simple interface based on OpenAI Gym, that works directly on both simulation and hardware. We use Quanser's Qube Servo2-USB platform, an underactuated rotary pendulum as an initial testing device. We also provide tools to simplify training RL algorithms on other hardware. Several baselines, from both classical controllers and pretrained RL agents are included to compare performance across tasks. Blue River Controls is available at this https URL: https://github.com/BlueRiverTech/quanser-openai-driver
翻訳日:2023-01-13 21:37:00 公開日:2020-01-07
# ナノカロリメトリーによる単一マイクロ波光子検出の量子軌道解析

Quantum trajectory analysis of single microwave photon detection by nanocalorimetry ( http://arxiv.org/abs/2001.01943v1 )

ライセンス: Link先を確認
Bayan Karimi and Jukka P. Pekola(参考訳) 本研究では, 超伝導量子ビットの現実的なセットアップを, 抵抗によって形成される熱浴に結合して解析するために量子軌道技術を適用した。 ジャンプ軌道の主な特性について検討し, ナノカロリメータとして抵抗を用いた蛍光測定の期待結果(クリック)と関連づける。 そこで本研究では,マイクロ波単一光子に対する現実的な熱量計の時間領域応答を予測し,吸収器の基本熱揺らぎと温度計の有限帯域幅による固有ノイズを組み込んだモデルを提案する。

We apply quantum trajectory techniques to analyze a realistic set-up of a superconducting qubit coupled to a heat bath formed by a resistor, a system that yields explicit expressions of the relevant transition rates to be used in the analysis. We discuss the main characteristics of the jump trajectories and relate them to the expected outcomes ("clicks") of a fluorescence measurement using the resistor as a nanocalorimeter. As the main practical outcome we present a model that predicts the time-domain response of a realistic calorimeter subject to single microwave photons, incorporating the intrinsic noise due to the fundamental thermal fluctuations of the absorber and finite bandwidth of a thermometer.
翻訳日:2023-01-13 21:36:25 公開日:2020-01-07
# 通信波長におけるシリコンの単一人工原子

Single artificial atoms in silicon emitting at telecom wavelengths ( http://arxiv.org/abs/2001.02136v1 )

ライセンス: Link先を確認
W. Redjem, A. Durand, T. Herzig, A. Benali, S. Pezzagna, J. Meijer, A. Yu. Kuznetsov, H. S. Nguyen, S. Cueff, J.-M. G\'erard, I. Robert-Philip, B. Gil, D. Caliste, P. Pochet, M. Abbarchi, V. Jacques, A. Dr\'eau and G. Cassabois(参考訳) 統合性とスケーラビリティの未熟な可能性を考えると、シリコンは大規模量子技術の鍵となるプラットフォームになるだろう。 不純物または量子ドットによって形成された個々の電子コード人工原子は、シリコンベースの集積量子回路の有望な解決策として登場した。 しかし、広帯域情報交換に必要な光学的インターフェースを特徴とする単一量子ビットは、そのような一般的な半導体ではまだ分離されていない。 ここでは、炭素原子を注入した商用シリコンオン絶縁体ウェハにおける単一光学活性点欠陥の分離を示す。 これらの人工原子は、光ファイバーの長距離伝播に適したテレコム波長で、明るく線形に偏光した単一光子放出を示す。 以上の結果から,シリコンは低バンドギャップ (約1.1 ev) の先行観測では好ましくないが,広帯域ギャップ半導体のように単一スケールで光学的に可溶な点欠陥を許容できることがわかった。 この研究は、集積量子フォトニクスから量子通信やメトロロジーまで、シリコンベースの量子技術に対する多くの視点を開く。

Given its unrivaled potential of integration and scalability, silicon is likely to become a key platform for large-scale quantum technologies. Individual electron-encoded artificial atoms either formed by impurities or quantum dots have emerged as a promising solution for silicon-based integrated quantum circuits. However, single qubits featuring an optical interface needed for large-distance exchange of information have not yet been isolated in such a prevailing semiconductor. Here we show the isolation of single optically-active point defects in a commercial silicon-on-insulator wafer implanted with carbon atoms. These artificial atoms exhibit a bright, linearly polarized single-photon emission at telecom wavelengths suitable for long-distance propagation in optical fibers. Our results demonstrate that despite its small bandgap (~ 1.1 eV) a priori unfavorable towards such observation, silicon can accommodate point defects optically isolable at single scale, like in wide-bandgap semiconductors. This work opens numerous perspectives for silicon-based quantum technologies, from integrated quantum photonics to quantum communications and metrology.
翻訳日:2023-01-13 21:35:52 公開日:2020-01-07
# 量子セキュアマイクログリッド

Quantum-Secure Microgrid ( http://arxiv.org/abs/2001.02301v1 )

ライセンス: Link先を確認
Zefan Tang, Yanyuan Qin, Zimin Jiang, Walter O. Krawec, Peng Zhang(参考訳) 既存のマイクログリッド通信は、量子コンピュータからの攻撃に弱い古典的な公開鍵システムに依存している。 本稿では、量子鍵分布(QKD)を用いて、これらの量子時代のマイクログリッドの課題を解決する。 具体的には,以下の新規貢献を行う。 1)マイクログリッドのためのQKDベースのマイクログリッド通信アーキテクチャを提供する。 2)RTDS環境で量子セキュアなマイクログリッドテストベッドを構築する方法を示す。 3)QKDベースのマイクログリッドのサイバー攻撃耐性を改善するキープール共有(KPS)戦略を開発する。 4) テストベッドを用いて重要なQKDパラメータの影響を分析する。 テスト結果は、量子セキュアなマイクログリッドを構築するための洞察力のあるリソースを提供する。

Existing microgrid communication relies on classical public key systems, which are vulnerable to attacks from quantum computers. This paper uses quantum key distribution (QKD) to solve these quantum-era microgrid challenges. Specifically, this paper makes the following novel contributions: 1) it offers a QKD-based microgrid communication architecture for microgrids; 2) it shows how to build a quantum-secure microgrid testbed in an RTDS environment; 3) it develops a key pool sharing (KPS) strategy to improve the cyberattack resilience of the QKD-based microgrid; and 4) it analyzes the impacts of critical QKD parameters with the testbed. Test results provide insightful resources for building a quantum-secure microgrid.
翻訳日:2023-01-13 21:35:23 公開日:2020-01-07
# 量子ネットワーク上でのリモート絡み合い生成のための効果的なルーティング設計

Effective routing design for remote entanglement generation on quantum networks ( http://arxiv.org/abs/2001.02204v1 )

ライセンス: Link先を確認
Changhao Li, Tianyi Li, Yi-Xiang Liu and Paola Cappellaro(参考訳) 量子ネットワークは、その古典的な能力を超えた多くの画期的なアプリケーションにとって有望なプラットフォームである。 量子メモリのような比較的限られた資源を持つ量子ネットワーク上での効率的な絡み合い生成は、ネットワークの機能を完全に実現するために不可欠である。 本研究では,有限エッジ容量の量子格子ネットワーク上で,ソース終端局間の絡み合い発生の複数の要求に対する自動応答を実現する効果的なルーティング方式を提案する。 接続要求毎に複数の接続パスを活用し、絡み合い精製を行うことにより、絡み合い忠実度を各経路毎に確保する。 ルーティング方式は柔軟な性質で高度にモジュール化されており、アルゴリズムワークフローに量子演算を埋め込んでおり、その性能は複数の観点から評価されている。 特に3つのアルゴリズムが提案され、量子ネットワークのエッジにおけるキャパシティ割り当てのスケジューリングに比較される。 古典的経路問題においてよく研究されてきた比例分担と漸進的充足の考え方を具体化し,スケジューリング性能の古典的ヒューリスティックスに基づく2つのアルゴリズムをオーバーライドする新しいスケジューリングアルゴリズム,プロパゲーション更新法を設計した。 一般解法は、応用量子ネットワーク上の効率的なルーティングとフロー制御プロトコルを効果的に設計するための道を開く。

Quantum network is a promising platform for many ground-breaking applications that lie beyond the capability of its classical counterparts. Efficient entanglement generation on quantum networks with relatively limited resources such as quantum memories is essential to fully realize the network's capabilities, the solution to which calls for delicate network design and is currently at the primitive stage. In this study we propose an effective routing scheme to enable automatic responses for multiple requests of entanglement generation between source-terminal stations on a quantum lattice network with finite edge capacities. Multiple connection paths are exploited for each connection request while entanglement fidelity is ensured for each path by performing entanglement purification. The routing scheme is highly modularized with a flexible nature, embedding quantum operations within the algorithmic workflow, whose performance is evaluated from multiple perspectives. In particular, three algorithms are proposed and compared for the scheduling of capacity allocation on the edges of quantum network. Embodying the ideas of proportional share and progressive filling that have been well-studied in classical routing problems, we design a new scheduling algorithm, the propagatory update method, which in certain aspects overrides the two algorithms based on classical heuristics in scheduling performances. The general solution scheme paves the road for effective design of efficient routing and flow control protocols on applicational quantum networks.
翻訳日:2023-01-13 21:30:09 公開日:2020-01-07
# 故障診断のための片側アライメントによる欠落型ロバスト領域適応

Missing-Class-Robust Domain Adaptation by Unilateral Alignment for Fault Diagnosis ( http://arxiv.org/abs/2001.02015v1 )

ライセンス: Link先を確認
Qin Wang, Gabriel Michau, Olga Fink(参考訳) ドメイン適応は、ソースドメインで学んだ知識を活用し、ターゲットドメインに転送することで、モデルの性能を改善することを目的としています。 近年, 対象領域とソース領域の分散シフトを軽減するために, ドメイン逆法が特に成功している。 しかし、これらの手法は二つの領域の間に同じラベル空間を仮定する。 この仮定は、ターゲットのトレーニングセットがクラスの完全なセットを含まない可能性があるため、実際のアプリケーションに対して重大な制限を課す。 本稿では,ドメイン逆数法の性能がトレーニング中に不完全なターゲットラベル空間に対して脆弱であることを示す。 この問題を克服するために,二段階一方向アライメントアプローチを提案する。 提案手法は、ソースドメインのクラス間関係を利用し、一方的にターゲットをソースドメインに整列させる。 提案手法の利点はまずMNIST$\rightarrow$MNIST-M適応タスクで評価される。 提案手法は,目標訓練データセットにおける故障型欠落の問題が一般的である故障診断タスクでも評価される。 どちらの実験も提案手法の有効性を示す。

Domain adaptation aims at improving model performance by leveraging the learned knowledge in the source domain and transferring it to the target domain. Recently, domain adversarial methods have been particularly successful in alleviating the distribution shift between the source and the target domains. However, these methods assume an identical label space between the two domains. This assumption imposes a significant limitation for real applications since the target training set may not contain the complete set of classes. We demonstrate in this paper that the performance of domain adversarial methods can be vulnerable to an incomplete target label space during training. To overcome this issue, we propose a two-stage unilateral alignment approach. The proposed methodology makes use of the inter-class relationships of the source domain and aligns unilaterally the target to the source domain. The benefits of the proposed methodology are first evaluated on the MNIST$\rightarrow$MNIST-M adaptation task. The proposed methodology is also evaluated on a fault diagnosis task, where the problem of missing fault types in the target training dataset is common in practice. Both experiments demonstrate the effectiveness of the proposed methodology.
翻訳日:2023-01-13 21:29:05 公開日:2020-01-07
# 深層学習によるタンパク質水和密度と自由エネルギーのオンザフライ予測

On-the-fly Prediction of Protein Hydration Densities and Free Energies using Deep Learning ( http://arxiv.org/abs/2001.02201v1 )

ライセンス: Link先を確認
Ahmadreza Ghanbarpour, Amr H. Mahmoud, Markus A. Lill(参考訳) 生体化学系の熱力学特性の計算には、典型的には資源集約的な分子シミュレーション法を用いる必要がある。 その1つの例は水和部位の熱力学的プロファイリング、すなわちタンパク質表面の水分子の高確率位置であり、タンパク質リガンド結合において必須の役割を果たすため、結合ポーズや親和性の予測に組み込まれなければならない。 水和サイト予測における時間消費シミュレーションを置き換えるために,水和サイトデータ予測を目的とした2種類のディープニューラルネットワークモデルを開発した。 最初のアプローチでは、結合ポケットを含む通常の3Dグリッド上に配置された特定の分子プローブと静的タンパク質との相互作用を表すメッシュ3D画像を生成する。 これらの分子相互作用場は、U-Netアーキテクチャに基づくニューラルネットワークを用いて、対応する水和占有の3次元画像にマッピングされる。 第2のアプローチでは、完全連結層に基づくニューラルネットワークを用いて水和占有率と熱力学をポイントごとに予測した。 直接タンパク質相互作用場に加えて,各格子点の環境は,近傍格子点の相互作用特性の球面調和膨張モーメントを用いて表現された。 構造活性関係解析とタンパク質リガンドポーズスコア付けへの応用は, 予測水和情報の有用性を示す。

The calculation of thermodynamic properties of biochemical systems typically requires the use of resource-intensive molecular simulation methods. One example thereof is the thermodynamic profiling of hydration sites, i.e. high-probability locations for water molecules on the protein surface, which play an essential role in protein-ligand associations and must therefore be incorporated in the prediction of binding poses and affinities. To replace time-consuming simulations in hydration site predictions, we developed two different types of deep neural-network models aiming to predict hydration site data. In the first approach, meshed 3D images are generated representing the interactions between certain molecular probes placed on regular 3D grids, encompassing the binding pocket, with the static protein. These molecular interaction fields are mapped to the corresponding 3D image of hydration occupancy using a neural network based on an U-Net architecture. In a second approach, hydration occupancy and thermodynamics were predicted point-wise using a neural network based on fully-connected layers. In addition to direct protein interaction fields, the environment of each grid point was represented using moments of a spherical harmonics expansion of the interaction properties of nearby grid points. Application to structure-activity relationship analysis and protein-ligand pose scoring demonstrates the utility of the predicted hydration information.
翻訳日:2023-01-13 21:28:28 公開日:2020-01-07
# 無限水平微分モデル予測制御

Infinite-Horizon Differentiable Model Predictive Control ( http://arxiv.org/abs/2001.02244v1 )

ライセンス: Link先を確認
Sebastian East, Marco Gallieri, Jonathan Masci, Jan Koutnik, Mark Cannon(参考訳) 本稿では,安全な模倣学習のための微分線形2次モデル予測制御(MPC)フレームワークを提案する。 無限水平コストは離散時間代数リカティ方程式(DARE)から得られる終端コスト関数を用いて実施され、学習した制御器が閉ループで安定化することを証明できる。 中心的な貢献はDAREの解の分析微分の導出であり、それによって微分に基づく学習法が利用可能となる。 拡張ラグランジアン法は、状態と入力に厳しい制約を課しながら、MPC最適化が訓練を通して実現可能であることを保証し、事前安定化コントローラは、MPCソリューションとデリバティブが各イテレーションで正確であることを保証する。 このフレームワークの学習能力は、一連の数値研究で実証されている。

This paper proposes a differentiable linear quadratic Model Predictive Control (MPC) framework for safe imitation learning. The infinite-horizon cost is enforced using a terminal cost function obtained from the discrete-time algebraic Riccati equation (DARE), so that the learned controller can be proven to be stabilizing in closed-loop. A central contribution is the derivation of the analytical derivative of the solution of the DARE, thereby allowing the use of differentiation-based learning methods. A further contribution is the structure of the MPC optimization problem: an augmented Lagrangian method ensures that the MPC optimization is feasible throughout training whilst enforcing hard constraints on state and input, and a pre-stabilizing controller ensures that the MPC solution and derivatives are accurate at each iteration. The learning capabilities of the framework are demonstrated in a set of numerical studies.
翻訳日:2023-01-13 21:28:05 公開日:2020-01-07
# 確率的局所相互作用モデル:地統計学

Stochastic Local Interaction Model: Geostatistics without Kriging ( http://arxiv.org/abs/2001.02246v1 )

ライセンス: Link先を確認
Dionissios T. Hristopulos, Andreas Pavlides, Vasiliki D. Agou, and Panagiota Gkafa(参考訳) 古典的な地球統計学的手法は、大規模な空間分布データに直面すると深刻な計算上の課題に直面する。 本稿では,大容量データを扱う計算効率の良い空間予測のための簡易確率的局所相互作用(SLI)モデルを提案する。 sli法では,データ値,位置,サンプリング密度の変化を考慮した空間的相互作用行列(precision matrix)を構築する。 この精度行列は厳密な正定値であることを示す。 sliアプローチでは、パラメータ推定、空間予測、不確実性推定のための行列反転は必要とせず、krigingよりも計算量的にはるかに少ない計算手順へと繋がる。 精度行列は、疎行列法の適用を可能にするコンパクトなカーネル関数(球面関数、二次関数など)を含み、計算時間とメモリ要求を改善する。 本研究では,キャンベル郡(ワイオミング州)の石炭厚の掘削孔データを含むデータセットを用いて,SLI法を提案する。 また,SLIと通常のクリグ (OK) を比較し,クロスバリデーション解析と計算時間を用いて推定性能を比較した。 検証方法によると,SLIはクロスバリデーションの指標として,オッケーよりも海藻の厚みをわずかに評価する。 計算時間に関しては、SLI予測は同じグリッドサイズでOKよりも3倍から25倍高速である。

Classical geostatistical methods face serious computational challenges if they are confronted with large sets of spatially distributed data. We present a simplified stochastic local interaction (SLI) model for computationally efficient spatial prediction that can handle large data. The SLI method constructs a spatial interaction matrix (precision matrix) that accounts for the data values, their locations, and the sampling density variations without user input. We show that this precision matrix is strictly positive definite. The SLI approach does not require matrix inversion for parameter estimation, spatial prediction, and uncertainty estimation, leading to computational procedures that are significantly less intensive computationally than kriging. The precision matrix involves compact kernel functions (spherical, quadratic, etc.) which enable the application of sparse matrix methods, thus improving computational time and memory requirements. We investigate the proposed SLI method with a data set that includes approximately 11500 drill-hole data of coal thickness from Campbell County (Wyoming, USA). We also compare SLI with ordinary kriging (OK) in terms of estimation performance, using cross validation analysis, and computational time. According to the validation measures used, SLI performs slightly better in estimating seam thickness than OK in terms of cross-validation measures. In terms of computation time, SLI prediction is 3 to 25 times (depending on the size of the kriging neighborhood) faster than OK for the same grid size.
翻訳日:2023-01-13 21:27:50 公開日:2020-01-07
# 正規直交分解を用いた機械学習に基づく塑性モデル

A machine learning based plasticity model using proper orthogonal decomposition ( http://arxiv.org/abs/2001.03438v1 )

ライセンス: Link先を確認
Dengpeng Huang, Jan Niklas Fuhg, Christian Wei{\ss}enfels, Peter Wriggers(参考訳) データ駆動型物質モデルは、実験データの直接利用や追加データが利用できる場合の予測性能の向上など、古典的な数値的アプローチよりも多くの利点がある。 データ駆動型マテリアルモデルを開発する1つのアプローチは、機械学習ツールを使用することである。 これらはオフラインでトレーニングすることで、観察対象の動作に適合し、オンラインアプリケーションに適用することができる。 しかし、歴史に依存した材料モデル(可塑性など)の学習と予測は依然として困難である。 本研究では, 弾性と塑性の両方に対して機械学習による材料モデリングフレームワークを提案する。 機械学習ベースの超弾性モデルはフィードフォワードニューラルネットワーク(feed forward neural network, fnn)で直接開発され、機械学習ベースの可塑性モデルは適切な直交分解フィードフォワードニューラルネットワーク(podfnn)と呼ばれる新しい手法を用いて開発されている。 載荷履歴を考慮し, 累積絶対ひずみを塑性モデルの履歴変数として提案する。 さらに, 塑性の列の概念に基づいて, 異なる荷下経路から塑性のひずみ列データを収集した。 PODにより、多次元応力列は分離され、独立した一次元係数列となる。 この場合、複数のアウトプットを持つニューラルネットワークは、それぞれ1次元アウトプットを持つ複数の独立したニューラルネットワークに置き換えられ、トレーニング時間が少なく、トレーニングパフォーマンスが向上する。 有限要素解析に機械学習に基づく材料モデルを適用するために、タンジェント行列は自動記号微分ツールAceGenにより導出される。 提案モデルの有効性と一般化を2次元および3次元有限要素解析を用いて一連の数値例を用いて検討した。

Data-driven material models have many advantages over classical numerical approaches, such as the direct utilization of experimental data and the possibility to improve performance of predictions when additional data is available. One approach to develop a data-driven material model is to use machine learning tools. These can be trained offline to fit an observed material behaviour and then be applied in online applications. However, learning and predicting history dependent material models, such as plasticity, is still challenging. In this work, a machine learning based material modelling framework is proposed for both elasticity and plasticity. The machine learning based hyperelasticity model is developed with the Feed forward Neural Network (FNN) directly whereas the machine learning based plasticity model is developed by using of a novel method called Proper Orthogonal Decomposition Feed forward Neural Network (PODFNN). In order to account for the loading history, the accumulated absolute strain is proposed to be the history variable of the plasticity model. Additionally, the strain-stress sequence data for plasticity is collected from different loading-unloading paths based on the concept of sequence for plasticity. By means of the POD, the multi-dimensional stress sequence is decoupled leading to independent one dimensional coefficient sequences. In this case, the neural network with multiple output is replaced by multiple independent neural networks each possessing a one-dimensional output, which leads to less training time and better training performance. To apply the machine learning based material model in finite element analysis, the tangent matrix is derived by the automatic symbolic differentiation tool AceGen. The effectiveness and generalization of the presented models are investigated by a series of numerical examples using both 2D and 3D finite element analysis.
翻訳日:2023-01-13 21:20:09 公開日:2020-01-07
# 導波路に強く結合した量子エミッタの周期鎖の透明性

Transparency in a periodic chain of quantum emitters strongly coupled to a waveguide ( http://arxiv.org/abs/2001.01901v1 )

ライセンス: Link先を確認
Debsuvra Mukhopadhyay and Girish S. Agarwal(参考訳) 特に、原子間分離が共鳴波長の半積分倍である場合、すなわち$kl$は$\pi$の積分倍であり、$k$は空間周波数、$l$は空間周期性である。 等しいが反対の周波数デチューニングが偶数個の原子の系にペアで割り当てられると、完全透過が起こる。 鎖の大きさが奇数であるとき、同様の割り当ては、奇数原子がスペクトルの挙動を決定すると集団効果の消失につながる。 また,これらの特徴の消散効果に対するロバスト性を示し,スペクトル挙動が崩壊速度と比較して原子間の相対的減衰に大きく依存することを示した。 電磁誘導透明性(EIT)現象との大きな違いは、導波路の場合、原子間の固有の導波路を介する相結合の存在が輸送特性に強く影響を与えることである。 さらに、単一光子輸送における相互性は相結合によって一般的には保たないが、導波路が透過係数と反射係数の両方に関して相互挙動を示す$kL = n\pi$の興味深い例外を観察する。

We demonstrate the emergence of transparent behavior in a chain of periodically spaced non-identical quantums emitters coupled to a waveguide, in the special case when the inter-atomic separation is a half-integral multiple of the resonant wavelength, i.e. $kL$ is an integral multiple of $\pi$, with $k$ being the spatial frequency and $L$ the spatial periodicity. When equal but opposite frequency detunings are assigned in pairs to a system of even number of atoms, perfect transmission ensues. When the chain size is odd, a similar assignment leads to the disappearance of collective effects as the odd atom determines the spectral behavior. We also manifest the robustness of these features against dissipative effects and show, how the spectral behavior hinges significantly on the relative detunings between the atoms as compared to the decay rate. A key distinction from the phenomenon of Electromagnetically Induced Transparency (EIT) is that in the waveguide case, the presence of an intrinsic waveguide mediated phase coupling between the atoms strongly affects the transport properties. Furthermore, while reciprocity in single-photon transport does not generally hold due to the phase coupling, we observe an interesting exception for $kL = n\pi$ at which the waveguide demonstrates reciprocal behavior with regard to both the transmission and reflection coefficients.
翻訳日:2023-01-13 21:19:24 公開日:2020-01-07
# 最も頻度の高い文字列探索、二つの文字列列の交叉、文字列問題のソートのための量子アルゴリズム

Quantum Algorithms for the Most Frequently String Search, Intersection of Two String Sequences and Sorting of Strings Problems ( http://arxiv.org/abs/2001.01914v1 )

ライセンス: Link先を確認
Kamil Khadiev and Artem Ilikaev(参考訳) 我々は弦の3つの問題を解決するアルゴリズムを勉強する。 1つ目は、文字列検索の最も頻繁な問題である。 問題は以下のとおりである。 長さ$k$の$n$文字列列があると仮定する。 問題は、シーケンスで最も頻繁に発生する文字列を見つけることだ。 我々は,クエリの複雑性$\tilde{o}(n \sqrt{k})$を持つ量子アルゴリズムを提案する。 このアルゴリズムは$\omega(nk)$クエリを必要とする決定論的アルゴリズムと比較するスピードアップを示す。 2つ目は、2つの弦列の交叉である。 すべての文字列は同じ長さの$k$を持つ。 最初のセットのサイズは$n$で、2番目のセットのサイズは$m$である。 クエリ複雑性を$\tilde{O}((n+m) \sqrt{k})$とする量子アルゴリズムを提案する。 このアルゴリズムは、$\Omega((n+m)k)$クエリを必要とする決定論的アルゴリズムと比較したスピードアップを示す。 第3の問題は、長さ$k$の文字列をソートすることだ。 一方、量子アルゴリズムは古典的アルゴリズムよりも漸近的に高速に物体を分類できないことが知られている。 一方、任意のオブジェクトではない文字列のソートに重点を置いている。 我々は,クエリの複雑性$o(n (\log n)^2 \sqrt{k})$を持つ量子アルゴリズムを提案する。 このアルゴリズムは、$d$がアルファベットのサイズである$\omega((n+d)k)$クエリを必要とする決定論的アルゴリズム(radix sort)と比較するスピードアップを示す。

We study algorithms for solving three problems on strings. The first one is the Most Frequently String Search Problem. The problem is the following. Assume that we have a sequence of $n$ strings of length $k$. The problem is finding the string that occurs in the sequence most often. We propose a quantum algorithm that has a query complexity $\tilde{O}(n \sqrt{k})$. This algorithm shows speed-up comparing with the deterministic algorithm that requires $\Omega(nk)$ queries. The second one is searching intersection of two sequences of strings. All strings have the same length $k$. The size of the first set is $n$ and the size of the second set is $m$. We propose a quantum algorithm that has a query complexity $\tilde{O}((n+m) \sqrt{k})$. This algorithm shows speed-up comparing with the deterministic algorithm that requires $\Omega((n+m)k)$ queries. The third problem is sorting of $n$ strings of length $k$. On the one hand, it is known that quantum algorithms cannot sort objects asymptotically faster than classical ones. On the other hand, we focus on sorting strings that are not arbitrary objects. We propose a quantum algorithm that has a query complexity $O(n (\log n)^2 \sqrt{k})$. This algorithm shows speed-up comparing with the deterministic algorithm (radix sort) that requires $\Omega((n+d)k)$ queries, where $d$ is a size of the alphabet.
翻訳日:2023-01-13 21:19:01 公開日:2020-01-07
# マイクロ波アシストcnotゲートの研究

Study of Microwave Assisted CNOT Gate ( http://arxiv.org/abs/2001.01928v1 )

ライセンス: Link先を確認
M K Mehta, P Sen and J T Andrews(参考訳) 磁気不純物ドープ半導体量子ドットにおける集団進化は、選択されたパルス領域のパルス列を適用することで研究されている。 光励起機構により(J_z=+3/2)の集団は、(J=+1/2)伝導帯状態を介して(J_z=-3/2)価帯状態に運ばれる。 注入されたマイクロ波は伝導帯状態を絡ませる。 この配置は量子CNOT演算の確認に成功し、計算はCNOT演算の最大忠実度80\%を予測する。

Population evolution in a magnetic impurity doped semiconductor quantum dot has been studied by applying a sequence of pulses of chosen pulse area. By optical excitation mechanism, the population in (J_z=+3/2), heavy hole state of valence band is carried over to (J_z=-3/2), valance band state, via the (J=+1/2) conduction band states. The injected microwaves entangle conduction band states. This arrangement is successfully employed to ascertain quantum CNOT operation, and the calculation predicts maximum fidelity of 80\% for the CNOT operation.
翻訳日:2023-01-13 21:18:42 公開日:2020-01-07
# pairdiag: 一般的なペアリングハミルトニアンを解くための厳密な対角化プログラム

PairDiag: an exact diagonalization program for solving general pairing Hamiltonians ( http://arxiv.org/abs/2001.01978v1 )

ライセンス: Link先を確認
Xiaoyu Liu, Chong Qi(参考訳) 本稿では,対角化に基づく一般対数ハミルトニアンの解法について述べる。 このプログラムは `01' インバージョンアルゴリズムによって、歳差ゼロのシェルモデルライクな基底ベクトルを生成する。 ハミルトン行列は、その高次零空間で構成される。 プログラムは、生成された基底に作用する散乱演算子と探索アルゴリズムを用いて、ハミルトニアン行列のすべての非零要素を評価する。 行列は反復lanczosアルゴリズムを用いて対角化される。 このプログラムであるPairDiagは、任意のペアリングハミルトンの基底状態固有値と固有ベクトルを効率的に計算することができる。 このプログラムは、標準自己整合平均場計算でbcs近似を置き換えるために容易に実装できる。 コードはOpenMPを使って並列化されている。 次元が 10$^{8-9}$ の大規模システムの場合、計算は標準デスクトップコンピュータで1日以内に行うことができる。

We present a program for solving exactly the general pairing Hamiltonian based on diagonalization. The program generates the seniority-zero shell-model-like basis vectors via the `01' inversion algorithm. The Hamiltonian matrix is constructed in that seniority-zero space. The program evaluates all non-zero elements of the Hamiltonian matrix "on the fly" using the scattering operator and the search algorithm that act on the generated basis. The matrix is diagonalized by using the iterative Lanczos algorithm. The program thus developed, PairDiag, can calculate efficiently the ground-state eigenvalue and eigenvector of any pairing Hamiltonian. The program can be easily implemented to replace the BCS approximation in standard self-consistent mean-field calculations. The code is parallelized using OpenMP. For larger systems with dimension around 10$^{8-9}$, the calculation can be done within a day on standard desktop computers.
翻訳日:2023-01-13 21:18:30 公開日:2020-01-07
# 普遍線形光学に対する最適モジュラーアーキテクチャ

Optimal modular architectures for universal linear optics ( http://arxiv.org/abs/2001.02012v1 )

ライセンス: Link先を確認
Shreya P. Kumar and Ish Dhand(参考訳) 光上に任意の離散ユニタリ変換を実装するためのモジュラーおよび最適アーキテクチャを提案する。 これらのアーキテクチャは、より小さなMモード線形光干渉計を体系的に組み合わせ、より大きなNモード変換を実装している。 これにより、偏光、時間、軌道角運動量といった光の空間的または内部的自由度に作用するより小さなモジュールを用いて、大きな線形光変換を実現することができる。 アーキテクチャは長方形のゲート構造につながり、これらのアーキテクチャ上で任意の変換を実現するには、最小限の光学素子と最小の回路深さが必要である。 さらに、長方形構造は、それぞれの異なる光学モードがバランスの取れた光学損失を発生させることを保証するため、アーキテクチャは既存のスキームに比べて大幅に拡張されたプロセス忠実性を約束する。

We present modular and optimal architectures for implementing arbitrary discrete unitary transformations on light. These architectures are based on systematically combining smaller M-mode linear optical interferometers together to implement a larger N-mode transformation. Thus this work enables the implementation of large linear optical transformations using smaller modules that act on the spatial or the internal degrees of freedom of light such as polarization, time or orbital angular momentum. The architectures lead to a rectangular gate structure, which is optimal in the sense that realizing arbitrary transformations on these architectures needs a minimal number of optical elements and minimal circuit depth. Moreover, the rectangular structure ensures that each the different optical modes incur balanced optical losses, so the architectures promise substantially enhanced process fidelities as compared to existing schemes.
翻訳日:2023-01-13 21:18:18 公開日:2020-01-07
# 定量的構造活性回帰モデリングのための半教師付き学習枠組み

A semi-supervised learning framework for quantitative structure-activity regression modelling ( http://arxiv.org/abs/2001.01924v1 )

ライセンス: Link先を確認
Oliver P Watson, Isidro Cortes-Ciriano, James A Watson(参考訳) 教師付き学習モデル、または量的構造活性回帰モデル(qsarモデル)は、前臨床的小分子薬物発見の過程を補助するためにますます使われている。 モデルは、分子構造の有限次元表現とその対応する標的特定活性からなるデータに基づいて訓練される。 これらのモデルを用いて、未測定の新規化合物の活性を予測することができる。 この研究では、このアプローチに関連する2つの問題に対処する。 第一は、モデル予測の品質がトレーニングデータ中の化合物と非常に異なる化合物に対して劣化する程度を推定することである。 2つ目は、多くのトレーニングデータセットに固有のスクリーニング依存選択バイアスを調整することである。 最も極端な場合、活性依存スクリーニングを通過する化合物のみが報告される。 半教師付き学習フレームワークを用いて,テスト化合物とトレーニングデータの類似性を考慮した予測と,報告選択バイアスの調整が可能であることを示す。 本手法は,GlaxoSmithKline (The Tres Cantos AntiMalarial Set) が報告した大規模化合物の公開構造活性データを用いて,in vitroでのP. falciparum成長を抑制する。

Supervised learning models, also known as quantitative structure-activity regression (QSAR) models, are increasingly used in assisting the process of preclinical, small molecule drug discovery. The models are trained on data consisting of a finite dimensional representation of molecular structures and their corresponding target specific activities. These models can then be used to predict the activity of previously unmeasured novel compounds. In this work we address two problems related to this approach. The first is to estimate the extent to which the quality of the model predictions degrades for compounds very different from the compounds in the training data. The second is to adjust for the screening dependent selection bias inherent in many training data sets. In the most extreme cases, only compounds which pass an activity-dependent screening are reported. By using a semi-supervised learning framework, we show that it is possible to make predictions which take into account the similarity of the testing compounds to those in the training data and adjust for the reporting selection bias. We illustrate this approach using publicly available structure-activity data on a large set of compounds reported by GlaxoSmithKline (the Tres Cantos AntiMalarial Set) to inhibit in vitro P. falciparum growth.
翻訳日:2023-01-13 21:12:26 公開日:2020-01-07
# 公衆衛生分野における音素・視覚・キーストローク類似性を考慮した大規模確率的記録リンクへの機械学習分類法

Machine-learning classifiers for logographic name matching in public health applications: approaches for incorporating phonetic, visual, and keystroke similarity in large-scale probabilistic record linkage ( http://arxiv.org/abs/2001.01895v1 )

ライセンス: Link先を確認
Philip A. Collender, Zhiyue Tom Hu, Charles Li, Qu Cheng, Xintong Li, Yue You, Song Liang, Changhong Yang, Justin V. Remais(参考訳) 個人名などの高度に識別可能なテキストフィールドにおける複雑な変動を考慮に入れた近似文字列マッチング手法は、確率的記録結合を高めることができる。 しかし、一致文字列と非一致文字列の区別は、発音、外観、キーストロークシーケンスの類似性が文字列データに直接エンコードされないロジグラフスクリプトでは難しい。 我々は中国の大規模行政データセットを利用してロジスティック回帰とXgboost分類器を開発し、視覚的、音声的、キーストローク類似性の尺度を統合し、潜在的にマッチング可能な名前ペアの同定を強化する。 We evaluate three methods of leveraging name similarity scores in large-scale probabilistic record linkage, which can adapt to varying match prevalence and information in supporting fields: (1) setting a threshold score based on predicted quality of name-matching across all record pairs; (2) setting a threshold score based on predicted discriminatory power of the linkage model; and (3) using empirical score distributions among matches and nonmatches to perform Bayesian adjustment of matching probabilities estimated from exact-agreement linkage. ホールドアウトデータおよび様々な名前誤り率と支援フィールドをシミュレートしたデータ実験において、ベイズ法で組み込まれたロジスティック回帰分類器は、識別力、一致確率推定、正確性に関して、厳密な分離連鎖よりも顕著な改善を示し、テストデータでは、誤分類されたレコードペアの総数を21%、シミュレーションデータセットでは平均93%削減した。 以上の結果から,視覚的,音韻的,キーストローク的類似性をロジグラフ名マッチングに組み込む価値と,大規模レコードリンクにおける名前マッチングを活用するベイズ的アプローチの可能性を実証した。

Approximate string-matching methods to account for complex variation in highly discriminatory text fields, such as personal names, can enhance probabilistic record linkage. However, discriminating between matching and non-matching strings is challenging for logographic scripts, where similarities in pronunciation, appearance, or keystroke sequence are not directly encoded in the string data. We leverage a large Chinese administrative dataset with known match status to develop logistic regression and Xgboost classifiers integrating measures of visual, phonetic, and keystroke similarity to enhance identification of potentially-matching name pairs. We evaluate three methods of leveraging name similarity scores in large-scale probabilistic record linkage, which can adapt to varying match prevalence and information in supporting fields: (1) setting a threshold score based on predicted quality of name-matching across all record pairs; (2) setting a threshold score based on predicted discriminatory power of the linkage model; and (3) using empirical score distributions among matches and nonmatches to perform Bayesian adjustment of matching probabilities estimated from exact-agreement linkage. In experiments on holdout data, as well as data simulated with varying name error rates and supporting fields, a logistic regression classifier incorporated via the Bayesian method demonstrated marked improvements over exact-agreement linkage with respect to discriminatory power, match probability estimation, and accuracy, reducing the total number of misclassified record pairs by 21% in test data and up to an average of 93% in simulated datasets. Our results demonstrate the value of incorporating visual, phonetic, and keystroke similarity for logographic name matching, as well as the promise of our Bayesian approach to leverage name-matching within large-scale record linkage.
翻訳日:2023-01-13 21:12:05 公開日:2020-01-07
# ファクトチェックURLレコメンデーションのためのマルチリレーショナルアテンションネットワーク

Attributed Multi-Relational Attention Network for Fact-checking URL Recommendation ( http://arxiv.org/abs/2001.02214v1 )

ライセンス: Link先を確認
Di You, Nguyen Vo, Kyumin Lee, Qiang Liu(参考訳) フェイクニュースに対抗するために、研究者は主に偽ニュースやジャーナリストが構築・維持している事実チェックサイト(Snopes.com や Politifact.com など)を検出することに集中した。 しかし、偽ニュースの普及はソーシャルメディアサイトを通じて大きく促進され、これらの事実確認サイトは十分に活用されていない。 本稿では,これらの問題を克服し,フェイクニュースに対する既存手法を補完するために,TwitterやFacebookなどのソーシャルメディアサイトにおけるフェイクニュースの影響を軽減するための,ディープラーニングに基づくファクトチェックURLレコメンデーションシステムを提案する。 特に,提案するフレームワークは,ユーザ-URLペア,ユーザ-ユーザペア,URL-URLペア間の複雑な/意味的関係を学習するための,多言語対応モジュールと異種グラフアテンションネットワークから構成される。 実世界のデータセットに対する大規模な実験により、提案したフレームワークは8つの最先端レコメンデーションモデルを上回っ、少なくとも3~5.3%の改善が達成された。

To combat fake news, researchers mostly focused on detecting fake news and journalists built and maintained fact-checking sites (e.g., Snopes.com and Politifact.com). However, fake news dissemination has been greatly promoted via social media sites, and these fact-checking sites have not been fully utilized. To overcome these problems and complement existing methods against fake news, in this paper we propose a deep-learning based fact-checking URL recommender system to mitigate impact of fake news in social media sites such as Twitter and Facebook. In particular, our proposed framework consists of a multi-relational attentive module and a heterogeneous graph attention network to learn complex/semantic relationship between user-URL pairs, user-user pairs, and URL-URL pairs. Extensive experiments on a real-world dataset show that our proposed framework outperforms eight state-of-the-art recommendation models, achieving at least 3~5.3% improvement.
翻訳日:2023-01-13 21:11:32 公開日:2020-01-07
# 無人表面車両のための水-障害物分離・改質ネットワーク

A water-obstacle separation and refinement network for unmanned surface vehicles ( http://arxiv.org/abs/2001.01921v1 )

ライセンス: Link先を確認
Borja Bovcon and Matej Kristan(参考訳) セマンティックセグメンテーションによる障害物検出は、無人表面車両(USV)における自律航法に大きな可能性を示す。 しかし、既存の手法では、視覚的曖昧さの有無による水辺の推定が不十分で、小さな障害物の検出が不十分で、水面反射やウェイクに対する偽陽性率が高い。 本稿では,これらの問題に対処するため,新しい深層エンコーダ・デコーダアーキテクチャ(WaSR)を提案する。 IMUの慣性情報をエンコーダの視覚的特徴と徐々に融合させる新しいデコーダにより、検出および水辺精度を向上させる。 また,新たな損失関数は,ネットワークの早期に水と障害物の分離を増加させるように設計されている。 その後、デコーダの残りのレイヤのキャパシティがよりよく利用され、偽陽性が大幅に減少し、真陽性が増加する。 実験の結果,WaSRは最先端技術よりも大きなマージンで優れており,第2ベスト法よりもF測定が14%増加した。

Obstacle detection by semantic segmentation shows a great promise for autonomous navigation in unmanned surface vehicles (USV). However, existing methods suffer from poor estimation of the water edge in the presence of visual ambiguities, poor detection of small obstacles and high false-positive rate on water reflections and wakes. We propose a new deep encoder-decoder architecture, a water-obstacle separation and refinement network (WaSR), to address these issues. Detection and water edge accuracy are improved by a novel decoder that gradually fuses inertial information from IMU with the visual features from the encoder. In addition, a novel loss function is designed to increase the separation between water and obstacle features early on in the network. Subsequently, the capacity of the remaining layers in the decoder is better utilised, leading to a significant reduction in false positives and increased true positives. Experimental results show that WaSR outperforms the current state-of-the-art by a large margin, yielding a 14% increase in F-measure over the second-best method.
翻訳日:2023-01-13 21:11:12 公開日:2020-01-07
# 形態的陰影決定木を用いた網膜画像における糖尿病異常の検出

Detection of Diabetic Anomalies in Retinal Images using Morphological Cascading Decision Tree ( http://arxiv.org/abs/2001.01953v1 )

ライセンス: Link先を確認
Faisal Ghaffar, Sarwar Khan, Bunyarit Uyyanonvara, Chanjira Sinthanayothin and Hirohiko Kaneko(参考訳) 本研究は糖尿病網膜症のスクリーニングのための効率的なシステムを開発することを目的とする。 糖尿病網膜症は盲目の主な原因である。 糖尿病網膜症の重症度は、血管領域、排出物、出血、微小動脈瘤などの特徴によって認識される。 疾患を検査するには、スクリーニングシステムはこれらの特徴を効率的に検出する必要がある。 本稿では,糖尿病網膜症を簡易かつ迅速に検出する方法を提案する。 グレースケール画像の事前処理を行い, 出血, 排出物, 血管, 光学ディスクなどに関わらず, すべてのラベル付き連結成分(ブロブ)を画像中に検出する。 次に,糖尿病網膜症の原因となる候補連結成分のスクリーニングに,コンパクト性,ブロブ面積,強度,コントラストなどの制約を適用した。 いくつかのポスト処理を行うことで最終結果を得る。 結果は地上の真実と比較される。 性能はリコール(感度)を見つけることで測定される。 寸法500×752の画像10枚を撮りました。 平均リコール率は90.03%。

This research aims to develop an efficient system for screening of diabetic retinopathy. Diabetic retinopathy is the major cause of blindness. Severity of diabetic retinopathy is recognized by some features, such as blood vessel area, exudates, haemorrhages and microaneurysms. To grade the disease the screening system must efficiently detect these features. In this paper we are proposing a simple and fast method for detection of diabetic retinopathy. We do pre-processing of grey-scale image and find all labelled connected components (blobs) in an image regardless of whether it is haemorrhages, exudates, vessels, optic disc or anything else. Then we apply some constraints such as compactness, area of blob, intensity and contrast for screening of candidate connectedcomponent responsible for diabetic retinopathy. We obtain our final results by doing some post processing. The results are compared with ground truths. Performance is measured by finding the recall (sensitivity). We took 10 images of dimension 500 * 752. The mean recall is 90.03%.
翻訳日:2023-01-13 21:10:52 公開日:2020-01-07
# ボーム量子ポテンシャルに基づく波動関数の重力還元

Gravitational reduction of the wave function based on Bohmian quantum potential ( http://arxiv.org/abs/2001.01905v1 )

ライセンス: Link先を確認
Faramarz Rahmani, Mehdi Golshani, Ghadir Jafari(参考訳) 量子系の波動関数の客観的な重力還元では、系の古典的極限は系の客観的性質の観点から得られる。 一方、ボヘミアの量子力学では、古典的な極限を得るための通常の基準は、客観的な記述の欠如に苦しむ量子ポテンシャルまたは系の量子力の消滅である。 この点に関して、ボーム量子力学における自由粒子の古典的極限を得るための通常の基準について検討した。 そして、量子ポテンシャルや量子力のようなボヘミアの機械的概念に関連する客観的な重力的古典的極限を持つことがいかに可能かについて議論した。 また,波動関数の減少に関する微分方程式を導出した。 ボームの概念と重力の概念の間には興味深い関係がある。

In objective gravitational reduction of the wave function of a quantum system, the classical limit of the system is obtained in terms of the objective properties of the system. On the other hand, in Bohmian quantum mechanics the usual criterion for getting classical limit is the vanishing of the quantum potential or the quantum force of the system, which suffers from the lack of an objective description. In this regard, we investigated the usual criterion of getting the classical limit of a free particle in Bohmian quantum mechanics. Then we argued that how it is possible to have an objective gravitational classical limit related to the Bohmian mechanical concepts like quantum potential or quantum force. Also we derived a differential equation related to the wave function reduction. An interesting connection will be made between Bohmian concepts and gravitational concepts.
翻訳日:2023-01-13 21:02:21 公開日:2020-01-07
# ハーディの非局所性をもつ多部構造エンタングルメントの構造の検証

Testing the Structure of Multipartite Entanglement with Hardy's Nonlocality ( http://arxiv.org/abs/2001.02143v1 )

ライセンス: Link先を確認
Lijinzhi Lin, Zhaohui Wei(参考訳) 多部量子状態は、局所的な量子演算だけでは互いに変換できないため、異なる種類の多部量子絡み合いを示すことができ、異なるタイプの多部量子絡み合いの数学的構造を完全に理解することが非常に難しい課題である。 本稿では、ハーディの非局所性の観点から、w と ghz の状態を比較し、それらの2つの重要な異なる挙動を示す。 特に、w 状態のハーディの非局所性問題に対する幾何学的モデルを開発することにより、その最大違反確率の上限を導出し、これは対応する ghz 状態の確率よりも厳密に小さいことが判明した。 これにより、これらの2つの量子状態の新たな比較ができ、その結果はGHZ状態がより絡み合っているという我々の直観と一致している。 さらに、一般の$N$-qubit W状態に対する漸近的特徴を得るためのアプローチを一般化し、$N$が上がると、最大違反確率が崩壊する速度が一般の$N$-qubit GHZ状態よりも指数関数的に遅くなることを示した。 理論的結果を検証するために数値シミュレーションを行う。

Multipartite quantum states may exhibit different types of quantum entanglement in that they cannot be converted into each other by local quantum operations only, and fully understanding mathematical structures of different types of multipartite entanglement is a very challenging task. In this paper, from the viewpoint of Hardy's nonlocality, we compare W and GHZ states and show a couple of crucial different behaviors between them. Particularly, by developing a geometric model for the Hardy's nonlocality problem of W states, we derive an upper bound for its maximal violation probability, which turns out to be strictly smaller than the corresponding probability of GHZ state. This gives us a new comparison between these two quantum states, and the result is also consistent with our intuition that GHZ states is more entangled. Furthermore, we generalize our approach to obtain an asymptotic characterization for general $N$-qubit W states, revealing that when $N$ goes up, the speed that the maximum violation probabilities decay is exponentially slower than that of general $N$-qubit GHZ states. We provide some numerical simulations to verify our theoretical results.
翻訳日:2023-01-13 21:01:26 公開日:2020-01-07
# 非マルコフ量子力学:何が良いのか?

Non-Markovian quantum dynamics: What is it good for? ( http://arxiv.org/abs/2001.02247v1 )

ライセンス: Link先を確認
C.-F. Li, G.-C. Guo, J. Piilo(参考訳) 実用的な量子工学と制御技術の発展は、オープン量子システムとデコヒーレンス工学の実験研究に重要な発展をもたらした。 実際、非マルコフ量子力学に関連する様々な理論、数学的、物理的概念を実験的にテストすることが可能となった。 これには、マルコフ的でないメモリ効果の実験的評価と定量化や、特定の量子通信や情報処理にそれらを使う方法の証明が含まれる。 本稿では,オープンシステム研究における最近の実験的進歩,特にメモリ効果の応用を含む非マルコフ力学に焦点をあて,デコヒーレンスとオープンシステムダイナミクスの究極的な制御の可能性について議論する。

Recent developments in practical quantum engineering and control techniques have allowed significant developments for experimental studies of open quantum systems and decoherence engineering. Indeed, it has become possible to test experimentally various theoretical, mathematical, and physical concepts related to non-Markovian quantum dynamics. This includes experimental characterization and quantification of non-Markovian memory effects and proof-of-principle demonstrations how to use them for certain quantum communication and information tasks. We describe here recent experimental advances for open system studies, focussing in particular to non-Markovian dynamics including the applications of memory effects, and discuss the possibilities for ultimate control of decoherence and open system dynamics.
翻訳日:2023-01-13 21:01:03 公開日:2020-01-07
# 非マルコフ量子力学:それは何を意味するのか?

Non-Markovian quantum dynamics: What does it mean? ( http://arxiv.org/abs/2001.02252v1 )

ライセンス: Link先を確認
C.-F. Li, G.-C. Guo, J. Piilo(参考訳) この10年間で、非マルコフのオープンシステムダイナミクスの研究はますます人気を増し、様々な研究コミュニティから貢献を受けている。 この関心は、量子ドメインにおけるメモリ効果の定義と定量化の基本的な問題、それに基づくアプリケーションの利用と開発方法、そしてオープンシステムのダイナミクスを制御するための究極の限界が何かという疑問によって生じた。 ここでは、量子的非マルコビアン性を定義し、定量化するための基本的なアプローチに関する簡単な理論的な紹介を紹介する。 オープン量子システム研究の発展の重要性に加えて、確率過程や量子情報科学の形式的研究など他の分野での進歩がもたらす影響についても論じ、最近の発展が開く将来的な方向性について結論づける。

During the last ten years, the studies on non-Markovian open system dynamics has become increasingly popular and having contributions from diverse set of research communities. This interest has arisen due to fundamental problematics how to define and quantify memory effects in the quantum domain, how to exploit and develop applications based on them, and also due to the question what are the ultimate limits for controlling open system dynamics. We give here a simple theoretical introduction to the basic approaches to define and quantify quantum non-Markovianity -- also highlighting their connections and differences. In addition to the importance of the development for open quantum systems studies, we also discuss the implications of the progress for other fields including, e.g., formal studies of stochastic processes and quantum information science, and conclude with possible future directions the recent developments open.
翻訳日:2023-01-13 21:00:52 公開日:2020-01-07
# 1億5000万キロメーターで分離した光源間の量子干渉に関するコメント 物理研究レター123, 080401(2019)

Comment on Quantum Interference between Light Sources Separated by 150 Million Kilometers Deng et al. PHYSICAL REVIEW LETTERS 123, 080401 (2019) ( http://arxiv.org/abs/2001.02376v1 )

ライセンス: Link先を確認
Shaul Mukamel(参考訳) This is a comment on the paper: Quantum Interference between Light Sources Separated by 150 Million Kilometers by Deng et al, PHYSICAL REVIEW LETTERS 123, 080401 (2019)

This is a comment on the paper : Quantum Interference between Light Sources Separated by 150 Million Kilometers by Deng et al, PHYSICAL REVIEW LETTERS 123, 080401 (2019)
翻訳日:2023-01-13 21:00:37 公開日:2020-01-07
# ソーシャル・グッドのための人工知能:調査

Artificial Intelligence for Social Good: A Survey ( http://arxiv.org/abs/2001.01818v1 )

ライセンス: Link先を確認
Zheyuan Ryan Shi, Claire Wang, Fei Fang(参考訳) 社会善のための人工知能(AI4SG)は、人工知能を利用して社会問題に対処し、世界の幸福を改善する研究テーマである。 AI4SGは過去10年間、研究コミュニティから多くの注目を集めており、いくつかの応用が成功している。 現在までのAI4SG文献の最も包括的なコレクションを1000以上のコントリビューション論文で構築し、このテーマの下での作業の詳細な説明と分析を以下に示す。 1)AI4SG文献の分布と傾向をアプリケーションドメインとAI技術の観点から定量的に分析する。 2) 既存の文献を体系的に分類し,8つのAI4SGアプリケーションドメインを統一的なフレームワークで解析する3つの概念的手法を提案する。 (3)AI4SGの様々なアプリケーション領域における共通課題を表す5つの研究トピックを抽出する。 (4)AI4SG研究の今後の発展に光を当てることのできる5つの課題について議論する。

Artificial intelligence for social good (AI4SG) is a research theme that aims to use and advance artificial intelligence to address societal issues and improve the well-being of the world. AI4SG has received lots of attention from the research community in the past decade with several successful applications. Building on the most comprehensive collection of the AI4SG literature to date with over 1000 contributed papers, we provide a detailed account and analysis of the work under the theme in the following ways. (1) We quantitatively analyze the distribution and trend of the AI4SG literature in terms of application domains and AI techniques used. (2) We propose three conceptual methods to systematically group the existing literature and analyze the eight AI4SG application domains in a unified framework. (3) We distill five research topics that represent the common challenges in AI4SG across various application domains. (4) We discuss five issues that, we hope, can shed light on the future development of the AI4SG research.
翻訳日:2023-01-13 21:00:30 公開日:2020-01-07
# 信頼と説明がAI支援意思決定の正確性と信頼度に及ぼす影響

Effect of Confidence and Explanation on Accuracy and Trust Calibration in AI-Assisted Decision Making ( http://arxiv.org/abs/2001.02114v1 )

ライセンス: Link先を確認
Yunfeng Zhang, Q. Vera Liao, Rachel K. E. Bellamy(参考訳) 今日では、AIは人間の専門家が高いシナリオで意思決定するのを助けるためにますます使われています。 これらのシナリオでは、完全な自動化は多くの場合望ましくないものであり、結果の重要さだけでなく、人間の専門家がタスクの成功を保証するためにモデルに相補的なドメイン知識を引き出すことができるからです。 これらのシナリオをAIによる意思決定と呼び、人間とAIの個々の強みが集まって、共同決定結果を最適化します。 彼らの成功の鍵は、aiの人間的信頼をケースバイケースで適切に\textit{calibrate}することである;いつ信頼するか不信かを知ることによって、aiの専門家は、その知識を適切に適用し、モデルがうまく機能しない場合の意思決定結果を改善することができる。 この研究は、人間とAIが同等のパフォーマンスを持つAI支援意思決定のケーススタディを行い、ケース固有のモデル情報を明らかにする特徴が、人間とAIの共同パフォーマンスを校正し改善するかどうかを探る。 具体的には,特定の予測に対する信頼性スコアと局所的説明の効果について検討する。 2つの人間実験を通して、信頼スコアはAIモデルに対する人々の信頼を校正するのに役立ちますが、信頼の校正だけではAIによる意思決定を改善するには不十分です。 また、AI支援意思決定シナリオに局所的な説明を使用することの問題点を強調し、AIに対する人間の信頼を校正するための説明可能性に関する新たなアプローチを研究コミュニティに求めます。

Today, AI is being increasingly used to help human experts make decisions in high-stakes scenarios. In these scenarios, full automation is often undesirable, not only due to the significance of the outcome, but also because human experts can draw on their domain knowledge complementary to the model's to ensure task success. We refer to these scenarios as AI-assisted decision making, where the individual strengths of the human and the AI come together to optimize the joint decision outcome. A key to their success is to appropriately \textit{calibrate} human trust in the AI on a case-by-case basis; knowing when to trust or distrust the AI allows the human expert to appropriately apply their knowledge, improving decision outcomes in cases where the model is likely to perform poorly. This research conducts a case study of AI-assisted decision making in which humans and AI have comparable performance alone, and explores whether features that reveal case-specific model information can calibrate trust and improve the joint performance of the human and AI. Specifically, we study the effect of showing confidence score and local explanation for a particular prediction. Through two human experiments, we show that confidence score can help calibrate people's trust in an AI model, but trust calibration alone is not sufficient to improve AI-assisted decision making, which may also depend on whether the human can bring in enough unique knowledge to complement the AI's errors. We also highlight the problems in using local explanation for AI-assisted decision making scenarios and invite the research community to explore new approaches to explainability for calibrating human trust in AI.
翻訳日:2023-01-13 21:00:14 公開日:2020-01-07
# 超音波伝搬の物理によるBモード画像における骨表面の描写

Delineating Bone Surfaces in B-Mode Images Constrained by Physics of Ultrasound Propagation ( http://arxiv.org/abs/2001.02001v1 )

ライセンス: Link先を確認
Firat Ozdemir, Christine Tanner, Orcun Goksel(参考訳) 超音波による骨表面の脱線は, 診断, 手術計画, 術後経過観察に有用であるとともに, 外科的ナビゲーションにおいて骨を解剖学的ランドマークとして用いる可能性から, 注目されている。 本稿では,超音波伝搬の物理を骨表面のデライン化を目的とした因子グラフにコードする手法を提案する。 このグラフ構造において、ユニリーノード電位は、画像記述子によって学習される軟部組織または音響シャドー領域の局所的可能性をコードする。 対方向のエッジ電位は、骨表面の超音波伝搬の制約をエンコードする。 提案手法は,前腕背側および掌側からの超音波画像を用いて,従来の4つのアプローチと比較して評価した。 提案手法は平均根平均二乗誤差と対称ハウスドルフ距離をそれぞれ0.28mmと1.78mmとする。 注釈付き骨の表面の99.9%を検出でき、平均走査線誤差は0.39mmである。

Bone surface delineation in ultrasound is of interest due to its potential in diagnosis, surgical planning, and post-operative follow-up in orthopedics, as well as the potential of using bones as anatomical landmarks in surgical navigation. We herein propose a method to encode the physics of ultrasound propagation into a factor graph formulation for the purpose of bone surface delineation. In this graph structure, unary node potentials encode the local likelihood for being a soft tissue or acoustic-shadow (behind bone surface) region, both learned through image descriptors. Pair-wise edge potentials encode ultrasound propagation constraints of bone surfaces given their large acoustic-impedance difference. We evaluate the proposed method in comparison with four earlier approaches, on in-vivo ultrasound images collected from dorsal and volar views of the forearm. The proposed method achieves an average root-mean-square error and symmetric Hausdorff distance of 0.28mm and 1.78mm, respectively. It detects 99.9% of the annotated bone surfaces with a mean scanline error (distance to annotations) of 0.39mm.
翻訳日:2023-01-13 20:53:46 公開日:2020-01-07
# AD-VO: Attentive Disparity Map を用いたスケールレジリエント・ビジュアルオドメトリー

AD-VO: Scale-Resilient Visual Odometry Using Attentive Disparity Map ( http://arxiv.org/abs/2001.02090v1 )

ライセンス: Link先を確認
Joosung Lee, Sangwon Hwang, Kyungjae Lee, Woo Jin Kim, Junhyeop Lee, Tae-young Chung, Sangyoun Lee(参考訳) 視力計測はSLAMシステムのローカライゼーションモジュールにとって重要な鍵である。 しかし、以前の方法は環境変化に対応するためにシステムをチューニングする必要がある。 本稿では,フレーム・ツー・フレームの単眼視力推定のための学習的アプローチを提案する。 提案するネットワークは,環境変化を網羅するだけでなく,スケール問題を解くために,不均一マップによってのみ学習される。 さらに,様々な運転環境においてロバストな性能を実現するため,注意ブロックとスキップ順序付け方式を導入する。 我々のネットワークは、色や光の流れなどの共通領域を使用する従来の手法と比較される。 実験結果から,提案するネットワークは,より高安定な他の手法よりも優れた性能を示すことがわかった。

Visual odometry is an essential key for a localization module in SLAM systems. However, previous methods require tuning the system to adapt environment changes. In this paper, we propose a learning-based approach for frame-to-frame monocular visual odometry estimation. The proposed network is only learned by disparity maps for not only covering the environment changes but also solving the scale problem. Furthermore, attention block and skip-ordering scheme are introduced to achieve robust performance in various driving environment. Our network is compared with the conventional methods which use common domain such as color or optical flow. Experimental results confirm that the proposed network shows better performance than other approaches with higher and more stable results.
翻訳日:2023-01-13 20:53:05 公開日:2020-01-07
# 幾何学的に操作された顔のアグリゲーションによるロバストな顔ランドマーク検出

Robust Facial Landmark Detection via Aggregation on Geometrically Manipulated Faces ( http://arxiv.org/abs/2001.03113v1 )

ライセンス: Link先を確認
Seyed Mehdi Iranmanesh, Ali Dabouei, Sobhan Soleymani, Hadi Kazemi, Nasser M. Nasrabadi(参考訳) 本研究では,顔のランドマーク検出問題に対する実用的なアプローチを提案する。 提案手法は, リッチな形状変形下で大きな形状と外観変化を扱うことができる。 形状変化に対処するため,操作された顔画像の集約を行う。 提案フレームワークは,与えられた顔画像のみを用いて,異なる操作顔を生成する。 この手法は、入力領域における小さなが慎重に作られた幾何学的操作が深層顔認識モデルを騙すことができるという事実を利用する。 そこで本研究では,敵の攻撃による操作と既知の変換による操作を行う3つの異なる顔生成手法を提案する。 操作された顔の集約は、より堅牢なランドマーク検出アプローチを提供し、顔形状のより重要な変形やバリエーションを捉えることができる。 提案手法は,ベンチマークデータセットAFLW,300-W,COFWの最先端手法に比べて優れていることを示す。

In this work, we present a practical approach to the problem of facial landmark detection. The proposed method can deal with large shape and appearance variations under the rich shape deformation. To handle the shape variations we equip our method with the aggregation of manipulated face images. The proposed framework generates different manipulated faces using only one given face image. The approach utilizes the fact that small but carefully crafted geometric manipulation in the input domain can fool deep face recognition models. We propose three different approaches to generate manipulated faces in which two of them perform the manipulations via adversarial attacks and the other one uses known transformations. Aggregating the manipulated faces provides a more robust landmark detection approach which is able to capture more important deformations and variations of the face shapes. Our approach is demonstrated its superiority compared to the state-of-the-art method on benchmark datasets AFLW, 300-W, and COFW.
翻訳日:2023-01-13 20:52:13 公開日:2020-01-07
# タグ付きテキストにおけるヒープの法則とヒープ関数:その言語的関連性の証拠

Heaps' law and Heaps functions in tagged texts: Evidences of their linguistic relevance ( http://arxiv.org/abs/2001.02178v1 )

ライセンス: Link先を確認
Andr\'es Chacoma and Dami\'an H. Zanette(参考訳) 語彙サイズと文長の関係を,6人の著者が著述した英語の775ドルの文学作品のコーパスで検討し,3つの文法クラス(「タグ」,「名詞」,「動詞」,「他」)の寄与度を区別し,各テキストに沿ってタグの新たな単語の出現を漸進的に分析した。 ヘップスの法則で規定される法則関係は、全語彙サイズとテキストの長さで十分満足に満たされるが、各テキストにおける新しい単語の出現は、パワー法に従わないテキストのランダムシャッフルの平均によって完全にうまく記述されている。 しかし、この平均からの偏差は統計的に有意であり、コーパス全体にわたって系統的な傾向を示す。 具体的には、各テキストに沿った新しい単語の出現は、ランダムなシャッフルの平均に対して、主に妨げられている。 さらに、異なるタグは、この傾向に体系的に異なる貢献をすることを示しており、一方、"it verbs} と "it others} は、それぞれ平均傾向よりも遅くなり、代わりに "it nouns} は、この全体的な平均に従う。 これらの統計学的体系は、ヘプスの法則の異なる変種に格納されている言語学的に関連のある情報の存在を示唆している可能性が高い。

We study the relationship between vocabulary size and text length in a corpus of $75$ literary works in English, authored by six writers, distinguishing between the contributions of three grammatical classes (or ``tags,'' namely, {\it nouns}, {\it verbs}, and {\it others}), and analyze the progressive appearance of new words of each tag along each individual text. While the power-law relation prescribed by Heaps' law is satisfactorily fulfilled by total vocabulary sizes and text lengths, the appearance of new words in each text is on the whole well described by the average of random shufflings of the text, which does not obey a power law. Deviations from this average, however, are statistically significant and show a systematic trend across the corpus. Specifically, they reveal that the appearance of new words along each text is predominantly retarded with respect to the average of random shufflings. Moreover, different tags are shown to add systematically distinct contributions to this tendency, with {\it verbs} and {\it others} being respectively more and less retarded than the mean trend, and {\it nouns} following instead this overall mean. These statistical systematicities are likely to point to the existence of linguistically relevant information stored in the different variants of Heaps' law, a feature that is still in need of extensive assessment.
翻訳日:2023-01-13 20:52:00 公開日:2020-01-07
# 光力学系における安定不動点から極限サイクルへの遷移の量子シグネチャ

Quantum signatures of transitions from stable fixed points to limit cycles in optomechanical systems ( http://arxiv.org/abs/2001.01843v1 )

ライセンス: Link先を確認
Qing Xia Meng, Zhi Jiao Deng, Zhigang Zhu, and Liang Huang(参考訳) 光力学系は、固有の非線形光力学カップリングのため、異なる種類の運動のリッチな非線形ダイナミクスを所有している。 興味深い問題は、あるタイプから別のタイプへの非線形力学遷移を推測する共通の量子的特徴が存在するかどうかである。 本稿では,安定な固定点から極限周期への遷移の量子シグネチャについて,オプトロメカニカルフォノンレーザーシステムで検討した。 計算の結果, 安定な固定点の絡み合いは時間とともに変化しないが, 限界周期の機械振動周波数の時間とともに周期的に振動することがわかった。 最も顕著なことに、境界線に非常に近い絡み合いは一定であり、この特定の古典的な遷移の強い兆候として、熱フォノンノイズに対して非常に頑丈である。

Optomechanical systems, due to its inherent nonlinear optomechanical coupling, owns rich nonlinear dynamics of different types of motion. The interesting question is that whether there exist some common quantum features to infer the nonlinear dynamical transitions from one type to another. In this paper, we have studied the quantum signatures of transitions from stable fixed points to limit cycles in an optomechanical phonon laser system. Our calculations show that the entanglement of stable fixed points in the long run does not change with time, however, it will oscillate periodically with time at the mechanical vibration frequency for the limit cycles. Most strikingly, the entanglement quite close to the boundary line keeps as a constant, and it is very robust to the thermal phonon noise, as strong indications of this particular classical transitions.
翻訳日:2023-01-13 20:51:33 公開日:2020-01-07
# 深部光学フローダイナミクスとPixelMPCを用いた攻撃的知覚認識ナビゲーション

Aggressive Perception-Aware Navigation using Deep Optical Flow Dynamics and PixelMPC ( http://arxiv.org/abs/2001.02307v1 )

ライセンス: Link先を確認
Keuntaek Lee, Jason Gibson, Evangelos A. Theodorou(参考訳) 近年,機械学習のパワーを活用した視覚制御が注目されている。 本研究では,モデル予測制御(MPC)フレームワークをビジュアルパイプラインに結合する。 本稿では,光流れとロボット動力学を組み合わせた深層光流れ(dof)ダイナミクスを紹介する。 dofダイナミクスを用いて、mpcは、関連するピクセルの予測された動きをロボットの計画軌道に明示的に組み込む。 DOFの実装はメモリ効率が良く、データ効率が良く、計算コストも安いので、MPCフレームワークでリアルタイムに計算することができる。 提案されたPixel Model Predictive Control (PixelMPC)アルゴリズムは、重要な特徴(ゲート)の可視性を保ちながら、ロボットを高速なレースタスクを達成するように制御する。 これにより、位置推定のための視覚ベースの推定器の信頼性が向上し、最終的には安全な自律飛行につながる可能性がある。 提案アルゴリズムは、高速ドローンレースタスクを用いたフォトリアリスティックシミュレーションでテストされている。

Recently, vision-based control has gained traction by leveraging the power of machine learning. In this work, we couple a model predictive control (MPC) framework to a visual pipeline. We introduce deep optical flow (DOF) dynamics, which is a combination of optical flow and robot dynamics. Using the DOF dynamics, MPC explicitly incorporates the predicted movement of relevant pixels into the planned trajectory of a robot. Our implementation of DOF is memory-efficient, data-efficient, and computationally cheap so that it can be computed in real-time for use in an MPC framework. The suggested Pixel Model Predictive Control (PixelMPC) algorithm controls the robot to accomplish a high-speed racing task while maintaining visibility of the important features (gates). This improves the reliability of vision-based estimators for localization and can eventually lead to safe autonomous flight. The proposed algorithm is tested in a photorealistic simulation with a high-speed drone racing task.
翻訳日:2023-01-13 20:45:21 公開日:2020-01-07
# ターゲット指向オピニオン単語抽出のための潜在オピニオン伝達ネットワーク

Latent Opinions Transfer Network for Target-Oriented Opinion Words Extraction ( http://arxiv.org/abs/2001.01989v1 )

ライセンス: Link先を確認
Zhen Wu, Fei Zhao, Xin-Yu Dai, Shujian Huang, Jiajun Chen(参考訳) ToWE(Target-oriented opinion words extract)は、文中の特定の意見対象に対して対応する意見語を抽出することを目的としたABSAの新しいサブタスクである。 近年,この課題にニューラルネットワーク手法を適用し,有望な結果を得た。 しかし、アノテーションの難しさにより、TOWEのデータセットが不十分になり、ニューラルモデルの性能が大幅に制限される。 対照的に、豊富なレビュー感情分類データはオンラインレビューサイトで簡単に利用できる。 これらのレビューには、かなり遅れた意見情報とセマンティックパターンが含まれている。 本稿では,これらの意見知識を資源豊富なレビュー感情分類データセットから低リソースタスクTOWEへ転送する新しいモデルを提案する。 トランスファープロセスにおける課題に対処するため,我々は潜在意見を得るための効果的なトランスフォーメーション手法を設計し,それらをTOWEに統合する。 広範な実験結果から,本モデルは他の最先端手法と比較して優れた性能を得られ,意見の伝達を伴わずに基礎モデルを大きく上回る結果が得られた。 さらなる分析により、我々のモデルの有効性が検証される。

Target-oriented opinion words extraction (TOWE) is a new subtask of ABSA, which aims to extract the corresponding opinion words for a given opinion target in a sentence. Recently, neural network methods have been applied to this task and achieve promising results. However, the difficulty of annotation causes the datasets of TOWE to be insufficient, which heavily limits the performance of neural models. By contrast, abundant review sentiment classification data are easily available at online review sites. These reviews contain substantial latent opinions information and semantic patterns. In this paper, we propose a novel model to transfer these opinions knowledge from resource-rich review sentiment classification datasets to low-resource task TOWE. To address the challenges in the transfer process, we design an effective transformation method to obtain latent opinions, then integrate them into TOWE. Extensive experimental results show that our model achieves better performance compared to other state-of-the-art methods and significantly outperforms the base model without transferring opinions knowledge. Further analysis validates the effectiveness of our model.
翻訳日:2023-01-13 20:44:38 公開日:2020-01-07
# タンパク質間相互作用抽出のための知識認識型注意ネットワーク

Knowledge-aware Attention Network for Protein-Protein Interaction Extraction ( http://arxiv.org/abs/2001.02091v1 )

ライセンス: Link先を確認
Huiwei Zhou, Zhuang Liu1, Shixian Ning, Chengkun Lang, Yingyu Lin, Lei Du(参考訳) 公開科学文献からのタンパク質-タンパク質相互作用(ppi)の抽出は、精密医学への追加支援を提供する。 しかし、現在のPPI抽出法の多くは広範な特徴工学を必要としており、知識ベース(KB)の知識を十分に活用することはできない。 KBはエンティティや関係に関する膨大な構造化情報を含んでいるため、PPI抽出において重要な役割を果たす。 本稿では,タンパク質対の事前知識とppi抽出のためのコンテキスト情報を融合する知識認識アテンションネットワーク(kan)を提案する。 提案モデルではまず, KB から学習した知識表現とともに, コンテキストシーケンスを符号化する多視点アテンション機構を採用する。 次に、エンコードされたコンテキストを最もよく記述できる特徴を選択するために、新しい多次元注意機構を用いる。 BioCreative VI PPIデータセットによる実験結果から,提案手法は複数の単語間の知識依存を連続的に獲得し,新たな最先端性能を実現することができることがわかった。

Protein-protein interaction (PPI) extraction from published scientific literature provides additional support for precision medicine efforts. However, many of the current PPI extraction methods need extensive feature engineering and cannot make full use of the prior knowledge in knowledge bases (KB). KBs contain huge amounts of structured information about entities and relationships, therefore plays a pivotal role in PPI extraction. This paper proposes a knowledge-aware attention network (KAN) to fuse prior knowledge about protein-protein pairs and context information for PPI extraction. The proposed model first adopts a diagonal-disabled multi-head attention mechanism to encode context sequence along with knowledge representations learned from KB. Then a novel multi-dimensional attention mechanism is used to select the features that can best describe the encoded context. Experiment results on the BioCreative VI PPI dataset show that the proposed approach could acquire knowledge-aware dependencies between different words in a sequence and lead to a new state-of-the-art performance.
翻訳日:2023-01-13 20:44:21 公開日:2020-01-07
# 記憶ネットワークを用いたタンパク質間相互作用抽出のための事前知識の活用

Leveraging Prior Knowledge for Protein-Protein Interaction Extraction with Memory Network ( http://arxiv.org/abs/2001.02107v1 )

ライセンス: Link先を確認
Huiwei Zhou, Zhuang Liu, Shixian Ning, Yunlong Yang, Chengkun Lang, Yingyu Lin, Kun Ma(参考訳) バイオメディカル文献からタンパク質-タンパク質相互作用(PPI)を自動抽出することで、精密医療への取り組みが促進される。 本稿では,ppi抽出のための新しいメモリネットワークベースモデル(mnm)を提案する。 提案するmnmは,知識ベースから学習した知識表現に関する重要な文脈手がかりを捉えている。 先行知識の実体埋め込みと関係埋め込みは、PPI抽出モデルの改善に有効であり、BioCreative VI PPIデータセット上での新たな最先端パフォーマンスをもたらす。 また、外部メモリ上の複数の計算層は、局所記憶を伴う長期記憶ネットワークよりも優れていることを示す。

Automatically extracting Protein-Protein Interactions (PPI) from biomedical literature provides additional support for precision medicine efforts. This paper proposes a novel memory network-based model (MNM) for PPI extraction, which leverages prior knowledge about protein-protein pairs with memory networks. The proposed MNM captures important context clues related to knowledge representations learned from knowledge bases. Both entity embeddings and relation embeddings of prior knowledge are effective in improving the PPI extraction model, leading to a new state-of-the-art performance on the BioCreative VI PPI dataset. The paper also shows that multiple computational layers over an external memory are superior to long short-term memory networks with the local memories.
翻訳日:2023-01-13 20:44:04 公開日:2020-01-07
# ニューラルネットワークの要素としての単一結合VO2発振子のスイッチングダイナミクス

Switching dynamics of single and coupled VO2-based oscillators as elements of neural networks ( http://arxiv.org/abs/2001.01854v1 )

ライセンス: Link先を確認
Andrei Velichko, Maksim Belyaev, Vadim Putrolaynen, Alexander Pergament, and Valentin Perminov(参考訳) 本稿では, 単一および結合型VO2系発振器の抵抗結合および容量結合によるスイッチングダイナミクスについて報告し, 発振ニューラルネットワークへの応用の可能性について検討する。 これらの結果に基づき、結合発振回路の動作モードを記述するのに適切なSPICEモデルを選択する。 提案モデルの適用限界を決定する前方電気スイッチング時間と逆電気スイッチング時間に影響を与える物理的メカニズムを同定する。 抵抗結合については, 一定値の結合抵抗で同期が発生するが, 不安定であり, 周期的に同期故障が発生することが示されている。 容量結合については、弱い結合と強い結合を持つ2つの同期モードが見つかる。 これらのモード間の遷移はカオス振動を伴う。 弱結合モードにおけるスペクトル高調波の幅の減少と強結合モードの増大を検出する。 結合振動回路の周波数と位相差のカップリング容量依存性について検討した。 中央パターン発生器としての結合型VO2発振器の動作例を示す。

In the present paper, we report on the switching dynamics of both single and coupled VO2-based oscillators, with resistive and capacitive coupling, and explore the capability of their application in oscillatory neural networks. Based on these results, we further select an adequate SPICE model to describe the modes of operation of coupled oscillator circuits. Physical mechanisms influencing the time of forward and reverse electrical switching, that determine the applicability limits of the proposed model, are identified. For the resistive coupling, it is shown that synchronization takes place at a certain value of the coupling resistance, though it is unstable and a synchronization failure occurs periodically. For the capacitive coupling, two synchronization modes, with weak and strong coupling, are found. The transition between these modes is accompanied by chaotic oscillations. A decrease in the width of the spectrum harmonics in the weak-coupling mode, and its increase in the strong-coupling one, is detected. The dependences of frequencies and phase differences of the coupled oscillatory circuits on the coupling capacitance are found. Examples of operation of coupled VO2 oscillators as a central pattern generator are demonstrated.
翻訳日:2023-01-13 20:43:53 公開日:2020-01-07
# 確率的関係モデルによる未知宇宙の探索

Exploring Unknown Universes in Probabilistic Relational Models ( http://arxiv.org/abs/2001.02021v1 )

ライセンス: Link先を確認
Tanya Braun, Ralf M\"oller(参考訳) 大きな確率モデルはしばしば既知の個人(宇宙)のプールとそれらの間の関係によって形成される。 lifted inferenceアルゴリズムは、扱いやすい推論のために既知の個人の集合を処理する。 しかし、宇宙は常に知られているとは限らないし、「小さな宇宙はより可能性が高い」という仮定によってのみ記述されることもある。 宇宙がなければ、持ち上げられたアルゴリズムでは推論は不可能となり、抽出可能な推論の利点を失う。 本論文の目的は、特定の制約言語から分離された未知の宇宙を持つモデルのセマンティクスを定義し、従って扱いやすい推論を可能にすることである。

Large probabilistic models are often shaped by a pool of known individuals (a universe) and relations between them. Lifted inference algorithms handle sets of known individuals for tractable inference. Universes may not always be known, though, or may only described by assumptions such as "small universes are more likely". Without a universe, inference is no longer possible for lifted algorithms, losing their advantage of tractable inference. The aim of this paper is to define a semantics for models with unknown universes decoupled from a specific constraint language to enable lifted and thereby, tractable inference.
翻訳日:2023-01-13 20:43:36 公開日:2020-01-07
# ビジネスプロセス自動化のための統一会話アシスタントフレームワーク

A Unified Conversational Assistant Framework for Business Process Automation ( http://arxiv.org/abs/2001.03543v1 )

ライセンス: Link先を確認
Yara Rizk, Abhishek Bhandwalder, Scott Boag, Tathagata Chakraborti, Vatche Isahagian, Yasaman Khazaeni, Falk Pollock, Merve Unuvar(参考訳) ビジネスプロセス自動化(business process automation, ビジネスプロセス自動化)は、数十億ドル規模の産業で、自律的なエージェントの導入を通じて、労働者の皿からメニアルタスクを取り除き、より創造的で魅力的なタスクのために時間と脳力を解放することを約束している。 しかしながら、このような自律エージェントのデプロイを成功させる上で不可欠なコンポーネントは、ビジネスユーザがパフォーマンスを監視し、実行をカスタマイズできることです。 銀行、保険、小売、その他の分野におけるそのようなエージェントの採用を促進するためには、学習曲線の低いシンプルでユーザフレンドリーなインターフェースが必要である。 その結果、積極的なチャットボットはビジネス自動化の分野で重要な役割を果たすことになる。 ユーザのクエリに応答し,その代理としてアクションを実行するだけでなく,ユーザとのコミュニケーションを開始し,システムの振る舞いを知らせる。 これにより、ビジネスユーザは、自律エージェントと対話し、監視し、制御するための自然言語インターフェースを提供する。 本研究では,エージェントに構成できるスキルの種類やエージェントのオーケストレーション方法について議論し,プロアクティブなチャットボットを開発するためのマルチエージェントオーケストレーションフレームワークを提案する。 旅行先承認ビジネスプロセスとローンアプリケーションビジネスプロセスの2つのユースケースは、パフォーマンス、コーディングオーバーヘッド、スケーラビリティ、エージェントオーバーラップという4つの基準に基づいて、提案されたフレームワークを定性的に分析するために採用されます。

Business process automation is a booming multi-billion-dollar industry that promises to remove menial tasks from workers' plates -- through the introduction of autonomous agents -- and free up their time and brain power for more creative and engaging tasks. However, an essential component to the successful deployment of such autonomous agents is the ability of business users to monitor their performance and customize their execution. A simple and user-friendly interface with a low learning curve is necessary to increase the adoption of such agents in banking, insurance, retail and other domains. As a result, proactive chatbots will play a crucial role in the business automation space. Not only can they respond to users' queries and perform actions on their behalf but also initiate communication with the users to inform them of the system's behavior. This will provide business users a natural language interface to interact with, monitor and control autonomous agents. In this work, we present a multi-agent orchestration framework to develop such proactive chatbots by discussing the types of skills that can be composed into agents and how to orchestrate these agents. Two use cases on a travel preapproval business process and a loan application business process are adopted to qualitatively analyze the proposed framework based on four criteria: performance, coding overhead, scalability, and agent overlap.
翻訳日:2023-01-13 20:43:27 公開日:2020-01-07
# アンサンブル学習による薬物シナジーの予測

Prediction of Drug Synergy by Ensemble Learning ( http://arxiv.org/abs/2001.01997v1 )

ライセンス: Link先を確認
I\c{s}{\i}ksu Ek\c{s}io\u{g}lu, Mehmet Tan(参考訳) 癌などの複雑な疾患を治療するための有望な方法の1つは、組み合わせ療法である。 組合せ複雑性のため、機械学習モデルはこの分野で有用であり、近年、相乗的組み合わせの決定において重要な改善がなされている。 本研究では,薬物相乗効果の予測における異なる化合物表現の有効性について検討した。 大規模ドラッグコンバインドスクリーンデータセットにおいて,我々はまず,この問題に使用されていない有望な表現の使用を実演し,その後,各ベースラインモデルに匹敵する表現モデルとモデルの組み合わせに関するアンサンブルを提案する。

One of the promising methods for the treatment of complex diseases such as cancer is combinational therapy. Due to the combinatorial complexity, machine learning models can be useful in this field, where significant improvements have recently been achieved in determination of synergistic combinations. In this study, we investigate the effectiveness of different compound representations in predicting the drug synergy. On a large drug combination screen dataset, we first demonstrate the use of a promising representation that has not been used for this problem before, then we propose an ensemble on representation-model combinations that outperform each of the baseline models.
翻訳日:2023-01-13 20:36:59 公開日:2020-01-07
# 三角カーネルプロファイルを用いた一般化平均シフト

Generalized mean shift with triangular kernel profile ( http://arxiv.org/abs/2001.02165v1 )

ライセンス: Link先を確認
S\'ebastien Razakarivony and Axel Barrau(参考訳) 平均シフトアルゴリズムは、クラスタリングや視覚追跡に使用される特定のカーネルベースの形状をとる確率密度関数のモードを見つける一般的な方法である。 導入以来、いくつかの実践的な改善と一般化が行われ、また収束性を中心に深い理論解析が行われた。 励ましの結果にもかかわらず、この質問はまだ明確な一般回答を得られていない。 本稿では,この作業の動機となった分散クラスタリングアプリケーションに特に適応した,カーネルの特定のクラスに注目する。 その結果,それらに適応した新しい平均シフト変種が導出され,有限個の反復の後に収束することが証明された。 平均シフト理論の一般図において、この新しい手法のクラスをシチュートするために、我々はこの分野の既存の結果の合成露光を行う。

The mean shift algorithm is a popular way to find modes of some probability density functions taking a specific kernel-based shape, used for clustering or visual tracking. Since its introduction, it underwent several practical improvements and generalizations, as well as deep theoretical analysis mainly focused on its convergence properties. In spite of encouraging results, this question has not received a clear general answer yet. In this paper we focus on a specific class of kernels, adapted in particular to the distributions clustering applications which motivated this work. We show that a novel Mean Shift variant adapted to them can be derived, and proved to converge after a finite number of iterations. In order to situate this new class of methods in the general picture of the Mean Shift theory, we alo give a synthetic exposure of existing results of this field.
翻訳日:2023-01-13 20:35:56 公開日:2020-01-07
# レコメンダシステムにおけるパーソナリティ側面の分析を可能にする

Enabling the Analysis of Personality Aspects in Recommender Systems ( http://arxiv.org/abs/2001.04825v1 )

ライセンス: Link先を確認
Shahpar Yakhchi (1), Amin Beheshti (1), Seyed Mohssen Ghafari (1), Mehmet Orgun (1) ((1) Macquarie University- Sydney-Australia)(参考訳) 既存のRecommender Systemsは主にユーザーのフィードバック、例えば評価、類似したユーザーを検出するための共通項目のレビューの活用に重点を置いている。 したがって、ユーザ間で共通の関心事がない場合に失敗する可能性がある。 我々はこの問題を,DSW-n-FCI (Data Sparsity With Feedback on Common Items) と呼んでいる。 パーソナリティに基づくレコメンデーションシステムは、パーソナリティのタイプに基づいて類似ユーザを特定することに成功している。 しかし、文献には、退屈なタスクであるアンケートに記入して人格を明示的に発見する人格ベースの推薦システムや、ユーザの個人的関心や知識のレベルの影響を無視するものもある。 異なるのは、ユーザの個性タイプを暗黙的に識別し、ユーザの個人的関心や知識のレベルとともに、それを取り入れることである。 実世界のデータセットにおける実験結果は,特にdsw-n-fciにおけるモデルの有効性を示す。

Existing Recommender Systems mainly focus on exploiting users' feedback, e.g., ratings, and reviews on common items to detect similar users. Thus, they might fail when there are no common items of interest among users. We call this problem the Data Sparsity With no Feedback on Common Items (DSW-n-FCI). Personality-based recommender systems have shown a great success to identify similar users based on their personality types. However, there are only a few personality-based recommender systems in the literature which either discover personality explicitly through filling a questionnaire that is a tedious task, or neglect the impact of users' personal interests and level of knowledge, as a key factor to increase recommendations' acceptance. Differently, we identifying users' personality type implicitly with no burden on users and incorporate it along with users' personal interests and their level of knowledge. Experimental results on a real-world dataset demonstrate the effectiveness of our model, especially in DSW-n-FCI situations.
翻訳日:2023-01-13 20:35:43 公開日:2020-01-07
# ディープニューラルネットワークを用いた高速かつ堅牢な多面体分子局在顕微鏡

Fast and robust multiplane single molecule localization microscopy using deep neural network ( http://arxiv.org/abs/2001.01893v1 )

ライセンス: Link先を確認
Toshimitsu Aritake, Hideitsu Hino, Shigeyuki Namiki, Daisuke Asanuma, Kenzo Hirose, Noboru Murata(参考訳) 単分子局在顕微鏡は、回折限界より小さい試料のナノ構造を測定する生物学的研究に広く用いられている。 本研究は多焦点平面顕微鏡を用いて,分子の側方および軸方向の位置を推定する3次元単一分子局在問題に対処する。 しかし, 多焦点平面顕微鏡を用いた場合, カメラ位置の小さな横方向のドリフトにより, 3次元位置推定の精度は容易に低下する。 本研究では,3次元分子の局在化問題と横方向のドリフトの推定を圧縮センシング問題として定式化し,この問題を高精度かつ効率的に解くためにディープニューラルネットワークを適用した。 提案手法は横ドリフトに対して頑健であり, 横方向20nm, 軸方向50nmの精度を, 明確なドリフト補正を行なわずに達成できる。

Single molecule localization microscopy is widely used in biological research for measuring the nanostructures of samples smaller than the diffraction limit. This study uses multifocal plane microscopy and addresses the 3D single molecule localization problem, where lateral and axial locations of molecules are estimated. However, when we multifocal plane microscopy is used, the estimation accuracy of 3D localization is easily deteriorated by the small lateral drifts of camera positions. We formulate a 3D molecule localization problem along with the estimation of the lateral drifts as a compressed sensing problem, A deep neural network was applied to accurately and efficiently solve this problem. The proposed method is robust to the lateral drifts and achieves an accuracy of 20 nm laterally and 50 nm axially without an explicit drift correction.
翻訳日:2023-01-13 20:35:07 公開日:2020-01-07
# 深層学習の多時間普遍性と限界

Poly-time universality and limitations of deep learning ( http://arxiv.org/abs/2001.02992v1 )

ライセンス: Link先を確認
Emmanuel Abbe and Colin Sandon(参考訳) 本研究の目的は,多時間で学習できる,あるいはできない関数分布を特徴付けることである。 SGDに基づく深層学習には普遍性があり、GDに基づく深層学習には非ユニバーシティ結果が証明され、また、SGDに基づく深層学習と統計的クエリアルゴリズムを分離する: (1) SGDによる深部学習は効率よく普遍的である。 } ポリタイムでサンプルから学習できる関数分布は、ポリステップ、ポリレート、おそらくポリノイズによるポリタイム初期化において、SGDで訓練されたポリサイズニューラルネットワークによって学習することができる。 したがって、深層学習は普遍的な学習パラダイムを提供する: 近似と推定誤差はNPハードのERMを用いて多次元ニューラルネットワークで制御できることが知られている; この新たな結果は、最適化誤差も多時間でSGDで制御できることを示している。 The picture changes for GD with large enough batches: (2) {\it Result (1) does not hold for GD:} Neural nets of poly-size trained with GD (full gradients or large enough batches) on any initialization with poly-steps, poly-range and at least poly-noise cannot learn any function distribution that has super-polynomial {\it cross-predictability,} where the cross-predictability gives a measure of ``average'' function correlation -relations and distinctions to the statistical dimension are discussed. 特に、これらの制約を持つ GD は、$k$ が定数である場合に限り、$k$ の単項を効率的に学習することができる。 したがって、(1) と (2) は興味深いコントラストを指している: SGD はある種のポリノイズでも普遍的であるが、完全な GD や SQ のアルゴリズムは(パリティのように)そうでない。

The goal of this paper is to characterize function distributions that deep learning can or cannot learn in poly-time. A universality result is proved for SGD-based deep learning and a non-universality result is proved for GD-based deep learning; this also gives a separation between SGD-based deep learning and statistical query algorithms: (1) {\it Deep learning with SGD is efficiently universal.} Any function distribution that can be learned from samples in poly-time can also be learned by a poly-size neural net trained with SGD on a poly-time initialization with poly-steps, poly-rate and possibly poly-noise. Therefore deep learning provides a universal learning paradigm: it was known that the approximation and estimation errors could be controlled with poly-size neural nets, using ERM that is NP-hard; this new result shows that the optimization error can also be controlled with SGD in poly-time. The picture changes for GD with large enough batches: (2) {\it Result (1) does not hold for GD:} Neural nets of poly-size trained with GD (full gradients or large enough batches) on any initialization with poly-steps, poly-range and at least poly-noise cannot learn any function distribution that has super-polynomial {\it cross-predictability,} where the cross-predictability gives a measure of ``average'' function correlation -- relations and distinctions to the statistical dimension are discussed. In particular, GD with these constraints can learn efficiently monomials of degree $k$ if and only if $k$ is constant. Thus (1) and (2) point to an interesting contrast: SGD is universal even with some poly-noise while full GD or SQ algorithms are not (e.g., parities).
翻訳日:2023-01-13 20:34:03 公開日:2020-01-07
# コンディショニング・隠れデータを用いた特定世帯のモーメントマッチング条件

Moment-Matching Conditions for Exponential Families with Conditioning or Hidden Data ( http://arxiv.org/abs/2001.09771v1 )

ライセンス: Link先を確認
Justin Domke(参考訳) 指数族による最大確率学習は、古典的な結果である十分な統計の瞬間マッチングをもたらす。 これは条件付き指数族や隠れたデータがあるときに一般化することができる。 この文書は、これらの一般化されたモーメントマッチング条件の第一原理的な説明と自己完結した導出を与える。

Maximum likelihood learning with exponential families leads to moment-matching of the sufficient statistics, a classic result. This can be generalized to conditional exponential families and/or when there are hidden data. This document gives a first-principles explanation of these generalized moment-matching conditions, along with a self-contained derivation.
翻訳日:2023-01-13 20:27:36 公開日:2020-01-07
# LSTMリカレントニューラルネットワークを用いた喫煙行動の状態遷移モデリング

State Transition Modeling of the Smoking Behavior using LSTM Recurrent Neural Networks ( http://arxiv.org/abs/2001.02101v1 )

ライセンス: Link先を確認
Chrisogonas O. Odhiambo, Casey A. Cole, Alaleh Torkjazi, Homayoun Valafar(参考訳) センサーの使用は、人間の活動監視、医療、ソーシャルネットワークなど、いくつかのアプリケーションで日常生活に浸透している。 本研究では,スマートウォッチセンサによる喫煙行動の認識に焦点をあてた。 具体的には,喫煙検出における従来の研究を,喫煙の文脈内認識を含むように改定した。 本研究では, 従来のニューラルネットワークを用いて, ミニジェスチャのハンド・ツー・リップ, ハンド・オン・リップ, ハンド・オフ・リップからなる状態遷移モデルとして, 喫煙動作の再構成を行った。 さらに,97%近い精度でジェスチャーのコンテキスト内検出を可能にするために,Long-Short-Term Memory(LSTM)ニューラルネットワークの利用を開始した。

The use of sensors has pervaded everyday life in several applications including human activity monitoring, healthcare, and social networks. In this study, we focus on the use of smartwatch sensors to recognize smoking activity. More specifically, we have reformulated the previous work in detection of smoking to include in-context recognition of smoking. Our presented reformulation of the smoking gesture as a state-transition model that consists of the mini-gestures hand-to-lip, hand-on-lip, and hand-off-lip, has demonstrated improvement in detection rates nearing 100% using conventional neural networks. In addition, we have begun the utilization of Long-Short-Term Memory (LSTM) neural networks to allow for in-context detection of gestures with accuracy nearing 97%.
翻訳日:2023-01-13 20:27:30 公開日:2020-01-07
# サイバー物理ヒューマンシステム(CPHS)のコンテキスト認識設計

Context-Aware Design of Cyber-Physical Human Systems (CPHS) ( http://arxiv.org/abs/2001.01918v1 )

ライセンス: Link先を確認
Supratik Mukhopadhyay, Qun Liu, Edward Collier, Yimin Zhu, Ravindra Gudishala, Chanachok Chokwitthaya, Robert DiBiano, Alimire Nabijiang, Sanaz Saeidi, Subhajit Sidhanta, Arnab Ganguly(参考訳) 近年,人間とサイバー物理インフラの相互作用が,後者の性能決定に重要な役割を果たしていることが研究コミュニティから広く受け入れられている。 サイバー物理システムを最適性能に設計するための既存のパラダイムは、歴史的データに基づくモデルの開発に焦点を当てている。 ヒューマンシステムインタラクションを駆動するコンテキスト要因の影響は困難であり、既存の設計モデルでキャプチャと複製が困難である。 その結果、多くの既存モデルは、コンテキスト要素をキャプチャする能力の欠如のために、新しい設計のコンテキスト要素に対処する、あるいは部分的にのみ対処する。 多くの既存モデルでのこの制限は、しばしば予測結果と測定結果の間のパフォーマンスギャップを引き起こす。 我々は,設計対象の物理インフラの意思決定プロセスが,設計特徴の実験や既存インスタンスの操作による実証的証拠など,サイバーインフラ上の分散リソースとインテリジェントに結びついている,新しい設計環境,サイバー物理ヒューマンシステム(CPHS)を構想する。 このフレームワークは、既存のデザインモデルと、新しいデザインにおけるヒューマン・インフラクチャー相互作用を含むコンテキスト認識設計固有のデータを組み合わせて、機械学習アプローチを使用して、予測能力を改善した拡張デザインモデルを作成する。

Recently, it has been widely accepted by the research community that interactions between humans and cyber-physical infrastructures have played a significant role in determining the performance of the latter. The existing paradigm for designing cyber-physical systems for optimal performance focuses on developing models based on historical data. The impacts of context factors driving human system interaction are challenging and are difficult to capture and replicate in existing design models. As a result, many existing models do not or only partially address those context factors of a new design owing to the lack of capabilities to capture the context factors. This limitation in many existing models often causes performance gaps between predicted and measured results. We envision a new design environment, a cyber-physical human system (CPHS) where decision-making processes for physical infrastructures under design are intelligently connected to distributed resources over cyberinfrastructure such as experiments on design features and empirical evidence from operations of existing instances. The framework combines existing design models with context-aware design-specific data involving human-infrastructure interactions in new designs, using a machine learning approach to create augmented design models with improved predictive powers.
翻訳日:2023-01-13 20:26:18 公開日:2020-01-07
# 高次元感覚空間のロボット探査における固有運動とエピソード記憶

Intrinsic Motivation and Episodic Memories for Robot Exploration of High-Dimensional Sensory Spaces ( http://arxiv.org/abs/2001.01982v1 )

ライセンス: Link先を確認
Guido Schillaci, Antonio Pico Villalpando, Verena Vanessa Hafner, Peter Hanappe, David Colliaux, Timoth\'ee Wintz(参考訳) 本研究では,マイクロファーミングロボットの画像センサのための好奇心駆動型目標指向探索行動を生成するアーキテクチャを提案する。 画像からの低次元特徴のオフライン教師なし学習のためのディープニューラルネットワークと、システムの逆数と前方運動学を表す浅層ニューラルネットワークのオンライン学習の組み合わせが用いられている。 人工好奇心システムは、予め定義された目標のセットに関心値を割り当て、学習の進捗を最大化すると予想される目標への探索を促進する。 本稿では,ニューラルネットワークのオンライン更新を行う際に発生する破滅的な忘れ問題に直面するために,内在的モチベーションシステムにおけるエピソードメモリの統合を提案する。 以上の結果から,エピソディックメモリシステムを採用することで,計算モデルが過去に獲得した知識をすぐに忘れてしまうことを防ぐだけでなく,可塑性と安定性のバランスを調節する新たな手段が得られた。

This work presents an architecture that generates curiosity-driven goal-directed exploration behaviours for an image sensor of a microfarming robot. A combination of deep neural networks for offline unsupervised learning of low-dimensional features from images, and of online learning of shallow neural networks representing the inverse and forward kinematics of the system have been used. The artificial curiosity system assigns interest values to a set of pre-defined goals, and drives the exploration towards those that are expected to maximise the learning progress. We propose the integration of an episodic memory in intrinsic motivation systems to face catastrophic forgetting issues, typically experienced when performing online updates of artificial neural networks. Our results show that adopting an episodic memory system not only prevents the computational models from quickly forgetting knowledge that has been previously acquired, but also provides new avenues for modulating the balance between plasticity and stability of the models.
翻訳日:2023-01-13 20:25:59 公開日:2020-01-07
# 表現学習における情報ボトルネックの位相遷移

Phase Transitions for the Information Bottleneck in Representation Learning ( http://arxiv.org/abs/2001.01878v1 )

ライセンス: Link先を確認
Tailin Wu and Ian Fischer(参考訳) Information Bottleneck(IB)では、圧縮と予測項の相対的な強度をチューニングする場合、この2つの用語はどのように振る舞うか、データセットと学習された表現との関係はどのようなものか? 本稿では, ib 目的の複数の相転移について検討することで,これらの質問に答えることにした。 $\text{ib}_\beta[p(z|x)] = i(x; z) - \beta i(y; z)$ 入力 $x$, target $y$ および表現 $z$ に対して符号化分布 p(z|x) 上で定義される$\text{ib}_\beta[p(z|x)] - \beta i(y; z)$ であり,$\beta$ の増加とともに予測精度が観測される。 ib位相遷移の定義をib損失景観の質的変化として導入し,その遷移が新しい授業の学習開始に対応していることを示す。 IB相転移の実用的な条件を提供する式を導出し、パラメータ化モデルのフィッシャー情報行列と接続する。 我々は,各IB相転移が,学習表現に直交する最大(非線形)相関成分である$X$と$Y$の成分を線形設定における正準相関解析(CCA)に類似して発見することを明らかにする。 この理論に基づいて,位相遷移点を発見するアルゴリズムを提案する。 最後に,本理論とアルゴリズムが分類データセットの位相遷移を正確に予測し,新しいクラス学習の開始とmnistのクラス難易度を予測し,cifar10における位相遷移を予測できることを確認した。

In the Information Bottleneck (IB), when tuning the relative strength between compression and prediction terms, how do the two terms behave, and what's their relationship with the dataset and the learned representation? In this paper, we set out to answer these questions by studying multiple phase transitions in the IB objective: $\text{IB}_\beta[p(z|x)] = I(X; Z) - \beta I(Y; Z)$ defined on the encoding distribution p(z|x) for input $X$, target $Y$ and representation $Z$, where sudden jumps of $dI(Y; Z)/d \beta$ and prediction accuracy are observed with increasing $\beta$. We introduce a definition for IB phase transitions as a qualitative change of the IB loss landscape, and show that the transitions correspond to the onset of learning new classes. Using second-order calculus of variations, we derive a formula that provides a practical condition for IB phase transitions, and draw its connection with the Fisher information matrix for parameterized models. We provide two perspectives to understand the formula, revealing that each IB phase transition is finding a component of maximum (nonlinear) correlation between $X$ and $Y$ orthogonal to the learned representation, in close analogy with canonical-correlation analysis (CCA) in linear settings. Based on the theory, we present an algorithm for discovering phase transition points. Finally, we verify that our theory and algorithm accurately predict phase transitions in categorical datasets, predict the onset of learning new classes and class difficulty in MNIST, and predict prominent phase transitions in CIFAR10.
翻訳日:2023-01-13 20:24:44 公開日:2020-01-07
# 因果モザイク:非線形ICAとアンサンブル法による因果推論

Causal Mosaic: Cause-Effect Inference via Nonlinear ICA and Ensemble Method ( http://arxiv.org/abs/2001.01894v1 )

ライセンス: Link先を確認
Pengzhou Wu and Kenji Fukumizu(参考訳) 二変量設定における原因と効果を区別する問題に対処する。 非線形独立成分分析(ica)の最近の進展に基づき,非加法的雑音を許容する非パラメトリック一般非線形因果モデルを訓練する。 さらに,非線形モデルの混合により因果ペアをモデル化する,因果モザイクと呼ばれるアンサンブルフレームワークを構築した。 我々は,この手法を,人工および実世界のベンチマークデータセット上の他の手法と比較し,最先端の性能を示す。

We address the problem of distinguishing cause from effect in bivariate setting. Based on recent developments in nonlinear independent component analysis (ICA), we train nonparametrically general nonlinear causal models that allow non-additive noise. Further, we build an ensemble framework, namely Causal Mosaic, which models a causal pair by a mixture of nonlinear models. We compare this method with other recent methods on artificial and real world benchmark datasets, and our method shows state-of-the-art performance.
翻訳日:2023-01-13 20:18:23 公開日:2020-01-07
# 時系列データクラスタリングのためのガウスプロセスエミッション付きスケーラブルハイブリッドHMM

Scalable Hybrid HMM with Gaussian Process Emission for Sequential Time-series Data Clustering ( http://arxiv.org/abs/2001.01917v1 )

ライセンス: Link先を確認
Yohan Jung, Jinkyoo Park(参考訳) 隠れマルコフモデル(HMM)とガウス過程(GP)のエミッションを組み合わせることで、複雑な入出力関係観測のシーケンスで隠れた状態を推定することができる。 特に、GP放射にスペクトル混合(SM)カーネルを用いる場合、このモデルをハイブリッドHMM-GPSMと呼ぶ。 このモデルは時系列データのシーケンスを効果的にモデル化することができる。 しかし、SMカーネルのパラメータが多すぎるため、このモデルは(1)状態遷移のための長いシーケンスを持つ大量のデータで効果的に訓練することはできない。 2)各シーケンスに多数の時系列データセットがある。 本稿では,HMM-GPSMのためのスケーラブルな学習法を提案する。 モデルを長いシーケンスで効果的に訓練するために, 確率的変分推論 (svi) を用いた手法を提案する。 また、時系列データ毎に多数のデータポイントを効率的に処理するために、Reparametrized Random Fourier Feature (R-RFF)を用いてSMカーネルを近似する。 これら2つのテクニックを組み合わせることで、トレーニング時間が大幅に短縮される。 提案手法は,値の欠落した大規模合成データと実データを用いて,その隠れ値推定精度と計算時間の観点から検証する。

Hidden Markov Model (HMM) combined with Gaussian Process (GP) emission can be effectively used to estimate the hidden state with a sequence of complex input-output relational observations. Especially when the spectral mixture (SM) kernel is used for GP emission, we call this model as a hybrid HMM-GPSM. This model can effectively model the sequence of time-series data. However, because of a large number of parameters for the SM kernel, this model can not effectively be trained with a large volume of data having (1) long sequence for state transition and 2) a large number of time-series dataset in each sequence. This paper proposes a scalable learning method for HMM-GPSM. To effectively train the model with a long sequence, the proposed method employs a Stochastic Variational Inference (SVI) approach. Also, to effectively process a large number of data point each time-series data, we approximate the SM kernel using Reparametrized Random Fourier Feature (R-RFF). The combination of these two techniques significantly reduces the training time. We validate the proposed learning method in terms of its hidden-sate estimation accuracy and computation time using large-scale synthetic and real data sets with missing values.
翻訳日:2023-01-13 20:17:27 公開日:2020-01-07
# フェダイン(federated newton-type method)

FedDANE: A Federated Newton-Type Method ( http://arxiv.org/abs/2001.01920v1 )

ライセンス: Link先を確認
Tian Li, Anit Kumar Sahu, Manzil Zaheer, Maziar Sanjabi, Ameet Talwalkar, Virginia Smith(参考訳) フェデレーション学習は、大規模分散リモートデバイス上で統計モデルを共同学習することを目的としている。 そこで本研究では,古典的分散最適化手法であるdaneを用いて,フェデレート学習の実用的制約を扱うための最適化手法であるfederaneを提案する。 本研究では,凸関数と非凸関数の両方で学習する場合の収束保証を提供する。 理論的な結果が奨励されているにもかかわらず、この手法は経験的に性能を弱めている。 特に、合成データセットと実世界のデータセットの実証シミュレーションを通じて、FedDANEは、現実的なフェデレーション設定において、FedAvgとFedProxのベースラインを一貫して過小評価している。 本研究は,低デバイス参加と統計的デバイスの不均一性を,この基盤となる2つの要因として認識し,今後の作業の方向性を示唆する。

Federated learning aims to jointly learn statistical models over massively distributed remote devices. In this work, we propose FedDANE, an optimization method that we adapt from DANE, a method for classical distributed optimization, to handle the practical constraints of federated learning. We provide convergence guarantees for this method when learning over both convex and non-convex functions. Despite encouraging theoretical results, we find that the method has underwhelming performance empirically. In particular, through empirical simulations on both synthetic and real-world datasets, FedDANE consistently underperforms baselines of FedAvg and FedProx in realistic federated settings. We identify low device participation and statistical device heterogeneity as two underlying causes of this underwhelming performance, and conclude by suggesting several directions of future work.
翻訳日:2023-01-13 20:17:08 公開日:2020-01-07
# ソフトマックスに基づく分類はk-平均クラスタリング:形式的証明、敵攻撃の因果関係、セントロイドに基づくテーラーリングによる改善

Softmax-based Classification is k-means Clustering: Formal Proof, Consequences for Adversarial Attacks, and Improvement through Centroid Based Tailoring ( http://arxiv.org/abs/2001.01987v1 )

ライセンス: Link先を確認
Sibylle Hess, Wouter Duivesteijn, Decebal Mocanu(参考訳) 我々は,k平均クラスタリングと,ソフトマックスアクティベーション層に基づくニューラルネットワークの予測との関係を正式に証明する。 既存の研究では、この関係は経験的に分析されてきたが、数学的に導出されたことは一度もない。 softmax関数は変換された入力空間をコーンに分割し、それぞれがクラスを包含する。 これは、この変換された空間を原点から等距離に配置することと同値であり、k平均はこれらの中心点に近接してデータポイントをクラスタリングする。 ソフトマックスは、データポイントが落ちる円錐のみを気にし、その円錐内にあるセンチロイドからの距離を気にしません。 我々は、小さなリプシッツモジュラス(敵の攻撃に対する感受性が低い)を持つネットワークが、クラスタの遠心部に近いデータポイントをマッピングすることで、k-meansフレンドリーな空間へのマッピングが可能になることを正式に証明する。 この知識を活用するために,ニューラルネットワークの最後の層におけるソフトマックス関数の代替として,Centroid Based Tailoringを提案する。 ガウスネットワークは従来のネットワークと同様の予測精度を持つが、1ピクセル攻撃の影響を受けにくい。

We formally prove the connection between k-means clustering and the predictions of neural networks based on the softmax activation layer. In existing work, this connection has been analyzed empirically, but it has never before been mathematically derived. The softmax function partitions the transformed input space into cones, each of which encompasses a class. This is equivalent to putting a number of centroids in this transformed space at equal distance from the origin, and k-means clustering the data points by proximity to these centroids. Softmax only cares in which cone a data point falls, and not how far from the centroid it is within that cone. We formally prove that networks with a small Lipschitz modulus (which corresponds to a low susceptibility to adversarial attacks) map data points closer to the cluster centroids, which results in a mapping to a k-means-friendly space. To leverage this knowledge, we propose Centroid Based Tailoring as an alternative to the softmax function in the last layer of a neural network. The resulting Gauss network has similar predictive accuracy as traditional networks, but is less susceptible to one-pixel attacks; while the main contribution of this paper is theoretical in nature, the Gauss network contributes empirical auxiliary benefits.
翻訳日:2023-01-13 20:16:31 公開日:2020-01-07
# 平行に平均する確率的重量-よく一般化する大規模バッチ訓練

Stochastic Weight Averaging in Parallel: Large-Batch Training that Generalizes Well ( http://arxiv.org/abs/2001.02312v1 )

ライセンス: Link先を確認
Vipul Gupta, Santiago Akle Serrano, Dennis DeCoste(参考訳) DNNトレーニングを高速化するアルゴリズムであるStochastic Weight Averaging in Parallel (SWAP)を提案する。 提案アルゴリズムは, 高速に近似解を計算し, 並列に計算された複数のモデルの重みを平均化し, 精度を向上する。 結果として得られたモデルは、小さなミニバッチで訓練されたモデルと同等に一般化するが、かなり短い時間で生産される。 コンピュータビジョンデータセットcifar10,cifar100,imagenetにおいて,トレーニング時間の短縮と結果モデルの優れた一般化性能を示す。

We propose Stochastic Weight Averaging in Parallel (SWAP), an algorithm to accelerate DNN training. Our algorithm uses large mini-batches to compute an approximate solution quickly and then refines it by averaging the weights of multiple models computed independently and in parallel. The resulting models generalize equally well as those trained with small mini-batches but are produced in a substantially shorter time. We demonstrate the reduction in training time and the good generalization performance of the resulting models on the computer vision datasets CIFAR10, CIFAR100, and ImageNet.
翻訳日:2023-01-13 20:15:47 公開日:2020-01-07
# 凍結重量による継続的なトレーニングの改善

Frosting Weights for Better Continual Training ( http://arxiv.org/abs/2001.01829v1 )

ライセンス: Link先を確認
Xiaofeng Zhu, Feng Liu, Goce Trajcevski, Dingding Wang(参考訳) ニューラルネットワークモデルのトレーニングは、生涯学習プロセスであり、計算集約的なプロセスである。 深層ニューラルネットワークモデルで発生する深刻な副作用は、新しいデータの再トレーニング中に壊滅的な忘れに苦しむ可能性があることである。 このような連続学習の混乱を避けるためには、アンサンブルモデルの加法的性質が魅力的である。 本稿では,学習前のニューラルネットワークモデルをチューニングする際の悲惨な忘れを解くために,勾配向上とメタラーニングという2つの一般的なアンサンブル手法を提案する。

Training a neural network model can be a lifelong learning process and is a computationally intensive one. A severe adverse effect that may occur in deep neural network models is that they can suffer from catastrophic forgetting during retraining on new data. To avoid such disruptions in the continuous learning, one appealing property is the additive nature of ensemble models. In this paper, we propose two generic ensemble approaches, gradient boosting and meta-learning, to solve the catastrophic forgetting problem in tuning pre-trained neural network models.
翻訳日:2023-01-13 20:09:03 公開日:2020-01-07
# テキストから画像へのマルチモーダル意味変換。 分布セマンティックスによる微粒化画像分類

Multimodal Semantic Transfer from Text to Image. Fine-Grained Image Classification by Distributional Semantics ( http://arxiv.org/abs/2001.02372v1 )

ライセンス: Link先を確認
Simon Donig, Maria Christoforaki, Bernhard Bermeitinger, Siegfried Handschuh(参考訳) 過去数年間、美術史と遺産情報学の領域におけるニューラルネットワークのような画像分類プロセスは、広く分布している(Lang and Ommer 2018)。 これらの手法は、比較的少量のデータを扱うことや、Digital Humanitiesの高次元データなど、いくつかの課題に直面している。 ここで、畳み込みニューラルネットワーク(CNN)は、出力が通常のように平らなテキストラベルのシリーズではなく、意味的にロードされたベクトルのシリーズである。 これらのベクトルは、ドメイン内のテキストコーパスから生成される分散意味モデル(DSM)から生じる。 In den letzten Jahren hat die Verwendung von Bildklassifizierungsverfahren wie neuronalen Netzwerken auch im Bereich der historischen Bildwissenschaften und der Heritage Informatics weite Verbreitung gefunden (Lang und Ommer 2018) シュテイン・ダベイ(stehen dabei vor einer reihe von herausforderungen, darunter dem umgangmit den vergleichsweise kleinen datenmengen sowie zugleich hochdimensionalen da-tenr\"aumen in den digitalen geisteswissenschaften. シュテイン・シュテイン(stehen dabei vor einer reihe von herausforderungen, darunter dem umgangmit den vergleichsweise kleinen datenmengen sochdimensionalen dachdimensionalen da-tenr\"aumen in den digitalen geisteswissenschaften. フラメン・ラウム・アブ(flachen raum ab)に就て : ビルデン・ディーズ・メソジスト・メソジスト・メソジスト・ジクラーズ・ジクラーズ・イズ・アヴ・エッネン・ヴェルグレヒスヴァイス・フラメン・フラメン・ラウム・ラウム・アブ(meist bilden diese methoden dieklassifizierung auf einen vergleichsweise flachen raum ab)に就て 英語: Dieser flache Zugang verliert im Bem\"uhen um ontologische Eindeutigkeit eine Reihe von relevanten Dimensionen, darunter taxonomische, mereologische und assoziative Beziehungen zwischenden Klassen beziehungsweise dem nicht formalisierten Kontext。 Dabei wird ein Convolutional Neural Network (CNN) genutzt, dessen Ausgabe im Trainingsprozess, Anders als herk\"ommlich, nicht auf einer Serie flacher Textlabel beruht, sondern auf einer Serie von Vektoren。 Diese Vektoren resultieren aus einem Distributional Semantic Model (DSM)、welches aus einem Dom\"ane-Textkorpus generiert wird。

In the last years, image classification processes like neural networks in the area of art-history and Heritage Informatics have experienced a broad distribution (Lang and Ommer 2018). These methods face several challenges, including the handling of comparatively small amounts of data as well as high-dimensional data in the Digital Humanities. Here, a Convolutional Neural Network (CNN) is used that output is not, as usual, a series of flat text labels but a series of semantically loaded vectors. These vectors result from a Distributional Semantic Model (DSM) which is generated from an in-domain text corpus. ----- In den letzten Jahren hat die Verwendung von Bildklassifizierungsverfahren wie neuronalen Netzwerken auch im Bereich der historischen Bildwissenschaften und der Heritage Informatics weite Verbreitung gefunden (Lang und Ommer 2018). Diese Verfahren stehen dabei vor einer Reihe von Herausforderungen, darunter dem Umgangmit den vergleichsweise kleinen Datenmengen sowie zugleich hochdimensionalen Da-tenr\"aumen in den digitalen Geisteswissenschaften. Meist bilden diese Methoden dieKlassifizierung auf einen vergleichsweise flachen Raum ab. Dieser flache Zugang verliert im Bem\"uhen um ontologische Eindeutigkeit eine Reihe von relevanten Dimensionen, darunter taxonomische, mereologische und assoziative Beziehungen zwischenden Klassen beziehungsweise dem nicht formalisierten Kontext. Dabei wird ein Convolutional Neural Network (CNN) genutzt, dessen Ausgabe im Trainingsprozess, anders als herk\"ommlich, nicht auf einer Serie flacher Textlabel beruht, sondern auf einer Serie von Vektoren. Diese Vektoren resultieren aus einem Distributional Semantic Model (DSM), welches aus einem Dom\"ane-Textkorpus generiert wird.
翻訳日:2023-01-13 20:08:53 公開日:2020-01-07
# スパイクニューラルネットワークのFPGA実装のための確率的スパイク伝播

Probabilistic spike propagation for FPGA implementation of spiking neural networks ( http://arxiv.org/abs/2001.09725v1 )

ライセンス: Link先を確認
Abinand Nallathambi and Nitin Chandrachoodan(参考訳) スパイキングニューラルネットワークの評価には、シナプス後ニューロンを更新するために大量のシナプス重みをフェッチする必要がある。 これは並列性を制限し、ハードウェアのボトルネックとなる。 本稿では,重みの確率論的解釈に基づくスパイク伝播手法を提案する。 本研究では,スパイク処理におけるランダム性の導入効果について検討し,認識精度への影響を最小限に抑えて,ベンチマークネットワークに示す。 我々は,Xilinx Zynqプラットフォーム上でのMNISTおよびCIFAR10データセットの完全接続および畳み込みネットワーク上でのアーキテクチャとトレードオフについて述べる。

Evaluation of spiking neural networks requires fetching a large number of synaptic weights to update postsynaptic neurons. This limits parallelism and becomes a bottleneck for hardware. We present an approach for spike propagation based on a probabilistic interpretation of weights, thus reducing memory accesses and updates. We study the effects of introducing randomness into the spike processing, and show on benchmark networks that this can be done with minimal impact on the recognition accuracy. We present an architecture and the trade-offs in accuracy on fully connected and convolutional networks for the MNIST and CIFAR10 datasets on the Xilinx Zynq platform.
翻訳日:2023-01-13 20:07:54 公開日:2020-01-07
# 単語の潜在性袋を用いたパラフレーズ生成

Paraphrase Generation with Latent Bag of Words ( http://arxiv.org/abs/2001.01941v1 )

ライセンス: Link先を確認
Yao Fu, Yansong Feng and John P. Cunningham(参考訳) パラフレーズ生成は自然言語処理における長年の重要な問題である。 さらに、近年の深層生成モデルの進歩は、テキスト生成のための離散潜在変数に対する有望な結果を示している。 本研究では,離散的潜在構造を持つ変分オートエンコーダに着想を得て,パラファーゼ生成のための潜在語(bow)モデルを提案する。 目的文からの弓によって離散潜在変数の意味を接地する。 この潜在変数を使用して、完全に微分可能なコンテンツ計画と表面実現モデルを構築します。 具体的には、ソース語を用いて隣人の予測を行い、ターゲットBOWをソフトマックスの混合でモデル化する。 我々は、予測されたBOW分布から微分可能なサブセットサンプリングを行うために、Gumbel top-k reparameterization を用いる。 サンプルした単語の埋め込みを検索し、デコーダの強化に利用し、生成した検索空間をガイドする。 我々の潜在BOWモデルはデコーダを強化するだけでなく、明確な解釈可能性を示す。 emph{ に関するモデルの解釈可能性を示す。 (i) 単語隣人 \emph{ の教師なし学習 (ii) ステップバイステップ生成手順。 大規模な実験は、このモデルの透明で効果的な生成過程を示す。 コードは \url{https://github.com/franxyao/dgm_latent_bow}} にある。

Paraphrase generation is a longstanding important problem in natural language processing. In addition, recent progress in deep generative models has shown promising results on discrete latent variables for text generation. Inspired by variational autoencoders with discrete latent structures, in this work, we propose a latent bag of words (BOW) model for paraphrase generation. We ground the semantics of a discrete latent variable by the BOW from the target sentences. We use this latent variable to build a fully differentiable content planning and surface realization model. Specifically, we use source words to predict their neighbors and model the target BOW with a mixture of softmax. We use Gumbel top-k reparameterization to perform differentiable subset sampling from the predicted BOW distribution. We retrieve the sampled word embeddings and use them to augment the decoder and guide its generation search space. Our latent BOW model not only enhances the decoder, but also exhibits clear interpretability. We show the model interpretability with regard to \emph{(i)} unsupervised learning of word neighbors \emph{(ii)} the step-by-step generation procedure. Extensive experiments demonstrate the transparent and effective generation process of this model.\footnote{Our code can be found at \url{https://github.com/FranxYao/dgm_latent_bow}}
翻訳日:2023-01-13 20:07:14 公開日:2020-01-07
# IMLI: 解釈可能な分類規則のMaxSATに基づく学習のためのインクリメンタルフレームワーク

IMLI: An Incremental Framework for MaxSAT-Based Learning of Interpretable Classification Rules ( http://arxiv.org/abs/2001.01891v1 )

ライセンス: Link先を確認
Bishwamittra Ghosh and Kuldeep S. Meel(参考訳) 医学診断、法学、教育といった重要な分野における機械学習の普及により、エンドユーザーが学習システムによる意思決定の背後にある理由を理解する必要性から、解釈可能な技術の必要性が高まった。 解釈可能な学習の計算的難易度は、実践者がヒューリスティックなテクニックを設計するきっかけとなった。 過去10年間のMaxSATソルバの成功に触発された最近、MLICと呼ばれるMaxSATベースのアプローチが提案され、Conjunctive Normal Form (CNF)で表現された解釈可能なルールをMaxSATクエリに学習することの問題を減らそうとしている。 MLICは、小さな解釈可能なCNF式を生成しながら、アートブラックボックス分類器の他の状態と同様の精度を達成できたが、MLICのランタイム性能は著しく遅れており、実際は使用できない。 現実のインスタンスにスケールしながらMaxSATソルバを活用可能な、解釈可能な学習のための健全なフレームワークは、両方の世界のベストを達成できますか? 本稿では,上記の質問に対する肯定的回答に向けて一歩踏み出した。 我々は、分割ベースのトレーニング手法によりスケーラブルなランタイムパフォーマンスを実現するMaxSATベースのフレームワークへの漸進的なアプローチであるIMLIを提案する。 UCIリポジトリから生じるベンチマークに関する大規模な実験は、IMLIが精度と解釈可能性を失うことなく最大3桁のランタイム改善を達成することを示した。

The wide adoption of machine learning in the critical domains such as medical diagnosis, law, education had propelled the need for interpretable techniques due to the need for end users to understand the reasoning behind decisions due to learning systems. The computational intractability of interpretable learning led practitioners to design heuristic techniques, which fail to provide sound handles to tradeoff accuracy and interpretability. Motivated by the success of MaxSAT solvers over the past decade, recently MaxSAT-based approach, called MLIC, was proposed that seeks to reduce the problem of learning interpretable rules expressed in Conjunctive Normal Form (CNF) to a MaxSAT query. While MLIC was shown to achieve accuracy similar to that of other state of the art black-box classifiers while generating small interpretable CNF formulas, the runtime performance of MLIC is significantly lagging and renders approach unusable in practice. In this context, authors raised the question: Is it possible to achieve the best of both worlds, i.e., a sound framework for interpretable learning that can take advantage of MaxSAT solvers while scaling to real-world instances? In this paper, we take a step towards answering the above question in affirmation. We propose IMLI: an incremental approach to MaxSAT based framework that achieves scalable runtime performance via partition-based training methodology. Extensive experiments on benchmarks arising from UCI repository demonstrate that IMLI achieves up to three orders of magnitude runtime improvement without loss of accuracy and interpretability.
翻訳日:2023-01-13 20:06:43 公開日:2020-01-07
# 最小予測情報正規化による非線形関係の発見

Discovering Nonlinear Relations with Minimum Predictive Information Regularization ( http://arxiv.org/abs/2001.01885v1 )

ライセンス: Link先を確認
Tailin Wu, Thomas Breuel, Michael Skuhersky and Jan Kautz(参考訳) 非線形相互作用と複雑な関係構造を持つ観測時系列から基礎となる方向関係を同定することは、幅広い応用の鍵となるが、依然として難しい問題である。 本研究では,時系列から方向関係を推測する最小限の予測情報正規化手法を導入し,深層学習モデルによる非線形関係の発見を可能にする。 本手法は, 合成データセットにおける非線形関係を学習する他の手法を実質的に上回り, ビデオゲーム環境と心拍対呼吸速度データセットの方向関係を探索する。

Identifying the underlying directional relations from observational time series with nonlinear interactions and complex relational structures is key to a wide range of applications, yet remains a hard problem. In this work, we introduce a novel minimum predictive information regularization method to infer directional relations from time series, allowing deep learning models to discover nonlinear relations. Our method substantially outperforms other methods for learning nonlinear relations in synthetic datasets, and discovers the directional relations in a video game environment and a heart-rate vs. breath-rate dataset.
翻訳日:2023-01-13 20:06:00 公開日:2020-01-07