このサイトではarxivの論文のうち、30ページ以下でCreative Commonsライセンス(CC 0, CC BY, CC BY-SA)の論文を日本語訳しています。 本文がCCでない論文、長すぎる論文はメタデータのみを翻訳しています。(arxivのメタデータは CC 0です。) 翻訳文のライセンスはCC BY-SA 4.0です。 翻訳にはFugu-Machine Translatorを利用しています。

本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。

公開日が20200829となっている論文です。

PDF登録状況(公開日: 20200829)

TitleAuthorsAbstract論文公表日・翻訳日
# 逆のスケーリングを持つバンド

Bandits with adversarial scaling ( http://arxiv.org/abs/2003.02287v2 )

ライセンス: Link先を確認
Thodoris Lykouris, Vahab Mirrokni, Renato Paes Leme(参考訳) 本研究では,報酬が確率的かつ敵対的要素を持つマルチアームバンディットモデルである"adversarial scaling"について検討する。 本モデルでは,「クリックスルーレート」をアーム品質成分と非ステヒスティックなユーザ関連成分(腕に固定)に分解可能なディスプレイ広告をキャプチャする。 我々のモデルの相対確率性にもかかわらず、ほとんどのバンディットアルゴリズムが苦しむ2つの設定を示す。 正の面では、アクション除去とミラー降下系からの2つのアルゴリズムは、逆スケーリングに頑健であるのに十分な適応性を示す。 本研究は,確率的バンドイットにおける適応パラメータ選択のロバスト性に光を当てた。

We study "adversarial scaling", a multi-armed bandit model where rewards have a stochastic and an adversarial component. Our model captures display advertising where the "click-through-rate" can be decomposed to a (fixed across time) arm-quality component and a non-stochastic user-relevance component (fixed across arms). Despite the relative stochasticity of our model, we demonstrate two settings where most bandit algorithms suffer. On the positive side, we show that two algorithms, one from the action elimination and one from the mirror descent family are adaptive enough to be robust to adversarial scaling. Our results shed light on the robustness of adaptive parameter selection in stochastic bandits, which may be of independent interest.
翻訳日:2022-12-26 12:50:35 公開日:2020-08-29
# パラメータ化量子回路の評価 : 分類精度,表現性,絡み合い能力の関係について

Evaluation of Parameterized Quantum Circuits: on the relation between classification accuracy, expressibility and entangling capability ( http://arxiv.org/abs/2003.09887v2 )

ライセンス: Link先を確認
Thomas Hubregtsen, Josef Pichlmeier, Patrick Stecher, Koen Bertels(参考訳) 量子アドバンテージの探索における活発な研究領域は、量子機械学習である。 特にハイブリッド量子古典的なセットアップにおける量子機械学習とパラメータ化量子回路は、ヒルベルト空間の高次元を特徴空間として利用することで精度の向上をもたらす可能性がある。 しかし、ヒルベルト空間に均一に対処する量子回路の能力は、分類精度のよい指標だろうか? 本研究では,先行技術による手法と定量化を行い,相関のレベルを評価するために数値的研究を行う。 ヒルベルト空間に一様に対応できる回路の能力と、単一の埋め込み層を含む回路の識別精度と、1または2つの回路設計との間に強い相関関係を見出した。 本研究は1層構成と2層構成の両方で19個の回路を網羅し,9つのデータセットで評価した。 将来の研究は、それが異なる回路設計に当てはまるかどうかを評価する。

An active area of investigation in the search for quantum advantage is Quantum Machine Learning. Quantum Machine Learning, and Parameterized Quantum Circuits in a hybrid quantum-classical setup in particular, could bring advancements in accuracy by utilizing the high dimensionality of the Hilbert space as feature space. But is the ability of a quantum circuit to uniformly address the Hilbert space a good indicator of classification accuracy? In our work, we use methods and quantifications from prior art to perform a numerical study in order to evaluate the level of correlation. We find a strong correlation between the ability of the circuit to uniformly address the Hilbert space and the achieved classification accuracy for circuits that entail a single embedding layer followed by 1 or 2 circuit designs. This is based on our study encompassing 19 circuits in both 1 and 2 layer configuration, evaluated on 9 datasets of increasing difficulty. Future work will evaluate if this holds for different circuit designs.
翻訳日:2022-12-21 05:32:26 公開日:2020-08-29
# アリは強盗で泥棒をオリエンテーターできる

Ants can orienteer a thief in their robbery ( http://arxiv.org/abs/2004.07017v3 )

ライセンス: Link先を確認
Jonatas B. C. Chagas and Markus Wagner(参考訳) Thief Orienteering Problem (ThOP) は、2つの古典的な組合せ最適化問題(オリエンテーリング問題とKnapsack問題)の特徴を組み合わせた多成分問題である。 ThOPは、所定の時間制約とコンポーネント間の相互作用のため、難しい。 本稿では,問題成分を個別かつインタラクティブに扱う新しいパッキングヒューリスティックとともにantコロニー最適化アルゴリズムを提案する。 私たちのアプローチは、ベンチマークインスタンスの90%以上で既存の作業よりも優れており、平均的な改善は300%以上です。

The Thief Orienteering Problem (ThOP) is a multi-component problem that combines features of two classic combinatorial optimization problems: Orienteering Problem and Knapsack Problem. The ThOP is challenging due to the given time constraint and the interaction between its components. We propose an Ant Colony Optimization algorithm together with a new packing heuristic to deal individually and interactively with problem components. Our approach outperforms existing work on more than 90% of the benchmarking instances, with an average improvement of over 300%.
翻訳日:2022-12-13 03:29:59 公開日:2020-08-29
# 日内電力価格の予測:軌道のシミュレーション

Ensemble Forecasting for Intraday Electricity Prices: Simulating Trajectories ( http://arxiv.org/abs/2005.01365v3 )

ライセンス: Link先を確認
Micha{\l} Narajewski and Florian Ziel(参考訳) 電力価格予測に関する最近の研究は、時間単位のドイツの日内連続市場が弱い状態にあることを示す。 したがって、我々はこの問題に対して新しい先進的なアプローチをとる。 時間内電気価格の確率予測は、各取引窓の軌跡をシミュレートして現実的なアンサンブルを受け取り、より効率的な日内取引と再取引を可能にする。 一般化加法モデルは、ディラックと学生のt分布を正確に混合したゼロ膨らんだ分布に従うという仮定と、価格差に適合する。 さらに,ラッソペナルティを伴う高次元ロジスティック回帰を用いて混合項を推定した。 予測値とボラティリティを, 自己回帰効果, 無軌道効果, 負荷, 風力および太陽光発電予測を用いてモデル化し, 成熟までの時間などの非線形性を考慮した。 転がり窓予測研究により、試料内特性と予測性能の両方を解析する。 モデルの複数のバージョンを複数のベンチマークモデルと比較し、確率的予測と重要度テストを用いて評価する。 この調査は、過去3時間でドイツの日内連続市場における価格分布を予測することを目的としているが、このアプローチは、特にヨーロッパでは、他の連続市場への適用を可能にする。 その結果,混合モデルが,ボラティリティのモデル化によって最も多く得られるベンチマークよりも優れていることがわかった。 また、XBIDの導入によって市場のボラティリティが低下したことも示唆している。

Recent studies concerning the point electricity price forecasting have shown evidence that the hourly German Intraday Continuous Market is weak-form efficient. Therefore, we take a novel, advanced approach to the problem. A probabilistic forecasting of the hourly intraday electricity prices is performed by simulating trajectories in every trading window to receive a realistic ensemble to allow for more efficient intraday trading and redispatch. A generalized additive model is fitted to the price differences with the assumption that they follow a zero-inflated distribution, precisely a mixture of the Dirac and the Student's t-distributions. Moreover, the mixing term is estimated using a high-dimensional logistic regression with lasso penalty. We model the expected value and volatility of the series using i.a. autoregressive and no-trade effects or load, wind and solar generation forecasts and accounting for the non-linearities in e.g. time to maturity. Both the in-sample characteristics and forecasting performance are analysed using a rolling window forecasting study. Multiple versions of the model are compared to several benchmark models and evaluated using probabilistic forecasting measures and significance tests. The study aims to forecast the price distribution in the German Intraday Continuous Market in the last 3 hours of trading, but the approach allows for application to other continuous markets, especially in Europe. The results prove superiority of the mixture model over the benchmarks gaining the most from the modelling of the volatility. They also indicate that the introduction of XBID reduced the market volatility.
翻訳日:2022-12-07 01:47:54 公開日:2020-08-29
# 協調・競争環境のための遅延対応多エージェント強化学習

Delay-Aware Multi-Agent Reinforcement Learning for Cooperative and Competitive Environments ( http://arxiv.org/abs/2005.05441v2 )

ライセンス: Link先を確認
Baiming Chen, Mengdi Xu, Zuxin Liu, Liang Li, Ding Zhao(参考訳) 実世界のサイバー物理システムでは、強化学習設計の課題となるような行動と観察の遅れが広く見られる。 エージェントの遅延が他のエージェントに分散できるマルチエージェントシステムを扱う場合、特に面倒な作業である。 この問題を解決するために,モデルフリーの深層強化学習を用いたマルチエージェントタスクの非定常学習問題とともに,遅延に対処する新しい枠組みを提案する。 我々は,環境内のすべてのエージェントの遅延を組み込んだ遅延対応マルコフゲームを正式に定義する。 遅延対応型マルコフゲームを実現するために,エージェントが集中型コントローラを必要とせず,多エージェントシステムの非定常問題を緩和するために追加情報を利用する集中型トレーニングと分散型実行を適用する。 実験は, 協調コミュニケーション, 協調ナビゲーション, 競争実験を含む多エージェント粒子環境下で実施される。 また,遅延認識の実用的価値を示すために,全自動運転車の協調を必要とする交通シナリオにおいて提案アルゴリズムをテストした。 その結果,遅延認識型マルチエージェント強化学習アルゴリズムは遅延による性能劣化を大幅に軽減することがわかった。 コードとデモビデオはhttps://github.com/baimingc/delay-aware-marl。

Action and observation delays exist prevalently in the real-world cyber-physical systems which may pose challenges in reinforcement learning design. It is particularly an arduous task when handling multi-agent systems where the delay of one agent could spread to other agents. To resolve this problem, this paper proposes a novel framework to deal with delays as well as the non-stationary training issue of multi-agent tasks with model-free deep reinforcement learning. We formally define the Delay-Aware Markov Game that incorporates the delays of all agents in the environment. To solve Delay-Aware Markov Games, we apply centralized training and decentralized execution that allows agents to use extra information to ease the non-stationarity issue of the multi-agent systems during training, without the need of a centralized controller during execution. Experiments are conducted in multi-agent particle environments including cooperative communication, cooperative navigation, and competitive experiments. We also test the proposed algorithm in traffic scenarios that require coordination of all autonomous vehicles to show the practical value of delay-awareness. Results show that the proposed delay-aware multi-agent reinforcement learning algorithm greatly alleviates the performance degradation introduced by delay. Codes and demo videos are available at: https://github.com/baimingc/delay-aware-MARL.
翻訳日:2022-12-04 20:02:58 公開日:2020-08-29
# 非対称双方向光フローに基づく高品質パノラマストッチ

High-quality Panorama Stitching based on Asymmetric Bidirectional Optical Flow ( http://arxiv.org/abs/2006.01201v3 )

ライセンス: Link先を確認
Mingyuan Meng, Shaojun Liu(参考訳) 本稿では,非対称な双方向光流れに基づくパノラマ縫製アルゴリズムを提案する。 このアルゴリズムでは、魚眼レンズカメラで撮影した複数の写真を入力として、提案アルゴリズムにより、これらの写真を高品質な360度球面パノラマ画像にマージすることができる。 遠方から撮影した写真では、それらの間の視差は比較的小さく、得られたパノラマ画像はほぼシームレスで、ばらばらにすることができる。 近近の視点や比較的大きな視差で撮影された写真では、シームレスだが部分的に歪んだパノラマ画像も得られる。 また、gpu(graphics processing unit)の助けを借りて、このアルゴリズムは縫製プロセス全体を非常に高速で完了させることができる: 通常、パノラマ画像を得るのに30秒未満しかかからないので、多くのリアルタイムアプリケーションで我々のパノラマ縫製アルゴリズムは高い価値を持つ。 私たちのコードはhttps://github.com/mungomeng/panorama-opticalflowで利用可能です。

In this paper, we propose a panorama stitching algorithm based on asymmetric bidirectional optical flow. This algorithm expects multiple photos captured by fisheye lens cameras as input, and then, through the proposed algorithm, these photos can be merged into a high-quality 360-degree spherical panoramic image. For photos taken from a distant perspective, the parallax among them is relatively small, and the obtained panoramic image can be nearly seamless and undistorted. For photos taken from a close perspective or with a relatively large parallax, a seamless though partially distorted panoramic image can also be obtained. Besides, with the help of Graphics Processing Unit (GPU), this algorithm can complete the whole stitching process at a very fast speed: typically, it only takes less than 30s to obtain a panoramic image of 9000-by-4000 pixels, which means our panorama stitching algorithm is of high value in many real-time applications. Our code is available at https://github.com/MungoMeng/Panorama-OpticalFlow.
翻訳日:2022-11-26 07:51:58 公開日:2020-08-29
# 協調学習のための無線通信

Wireless Communications for Collaborative Federated Learning ( http://arxiv.org/abs/2006.02499v2 )

ライセンス: Link先を確認
Mingzhe Chen, H. Vincent Poor, Walid Saad, and Shuguang Cui(参考訳) IoT(Internet of Things)サービスでは、機械学習ツールを使用して、推論、自律性、制御目的でIoTデバイスが収集したさまざまなタイプのデータを効率的に分析する。 しかしながら、リソースの制約とプライバシの課題のため、エッジIoTデバイスは、収集したデータを中央のコントローラに送信してマシンラーニングモデルをトレーニングすることはできない。 この課題を克服するために、エッジデバイスがデータ交換なしで共有機械学習モデルをトレーニングできるようにする手段として、連合学習(federated learning:fl)が提案されている。 しかしながら,GoogleのセミナルFLアルゴリズムでは,すべてのデバイスを中央コントローラに直接接続する必要があるため,アプリケーションのシナリオが大幅に制限される。 本稿では、エッジデバイスが中央制御器に頼らずにFLを実装することを可能にする、コラボレーティブFL(CFL)と呼ばれる新しいFLフレームワークを提案する。 このフレームワークの基本が開発され、cflの性能を向上させるために多くの通信技術が提案されている。 この目的のために、集中学習の概要、GoogleのセミナルFL、CFLが最初に紹介される。 学習の種類ごとに、基本的なアーキテクチャと、その利点、欠点、利用状況が紹介される。 次に,3つのCFL性能指標を提示し,ネットワーク形成,デバイススケジューリング,モビリティ管理,コーディングといった一連の通信手法を導入して,CFLの性能を最適化する。 各技術について,今後の研究機会についても論じる。 本稿では,モノのインターネットなどの大規模無線システムのエッジにおいて,提案したCFLフレームワークを効果的に実装する方法を紹介する。

Internet of Things (IoT) services will use machine learning tools to efficiently analyze various types of data collected by IoT devices for inference, autonomy, and control purposes. However, due to resource constraints and privacy challenges, edge IoT devices may not be able to transmit their collected data to a central controller for training machine learning models. To overcome this challenge, federated learning (FL) has been proposed as a means for enabling edge devices to train a shared machine learning model without data exchanges thus reducing communication overhead and preserving data privacy. However, Google's seminal FL algorithm requires all devices to be directly connected with a central controller, which significantly limits its application scenarios. In this context, this paper introduces a novel FL framework, called collaborative FL (CFL), which enables edge devices to implement FL with less reliance on a central controller. The fundamentals of this framework are developed and then, a number of communication techniques are proposed so as to improve the performance of CFL. To this end, an overview of centralized learning, Google's seminal FL, and CFL is first presented. For each type of learning, the basic architecture as well as its advantages, drawbacks, and usage conditions are introduced. Then, three CFL performance metrics are presented and a suite of communication techniques ranging from network formation, device scheduling, mobility management, and coding is introduced to optimize the performance of CFL. For each technique, future research opportunities are also discussed. In a nutshell, this article will showcase how the proposed CFL framework can be effectively implemented at the edge of large-scale wireless systems such as the Internet of Things.
翻訳日:2022-11-25 18:48:07 公開日:2020-08-29
# CBIRにおける関連性フィードバックの改善

An Improved Relevance Feedback in CBIR ( http://arxiv.org/abs/2006.11821v2 )

ライセンス: Link先を確認
Subhadip Maji and Smarajit Bose(参考訳) コンテントベース画像検索における関連性フィードバックは,パフォーマンスフィードバックを自己改善に活用する手法である。 先行研究では、関連性フィードバック手法として機能の再重み付けと分類技術を用いる。 本稿では,検索精度を向上するため,従来手法に新たな付加手法を提案する。 これらに加えて,本論文では,関連フィードバック情報から0回目の繰り返しの精度を向上する新たなアイデアも提示している。

Relevance Feedback in Content-Based Image Retrieval is a method where the feedback of the performance is being used to improve itself. Prior works use feature re-weighting and classification techniques as the Relevance Feedback methods. This paper shows a novel addition to the prior methods to further improve the retrieval accuracy. In addition to all of these, the paper also shows a novel idea to even improve the 0-th iteration retrieval accuracy from the information of Relevance Feedback.
翻訳日:2022-11-18 12:32:43 公開日:2020-08-29
# リアルタイムの高速反事実説明

Fast Real-time Counterfactual Explanations ( http://arxiv.org/abs/2007.05684v2 )

ライセンス: Link先を確認
Yunxia Zhao(参考訳) これは、なぜ予測がクラスAであるが、Bではないのかを問うものである。 従来の最適化手法と異なり,マルチドメイン画像から画像への変換アルゴリズムの開発により,最適化のない高速ReAl-time Counterfactual Explanation (FRACE)アルゴリズムが提案されている。 StarGANから構築されたトランスフォーマーは、クエリ画像の内容情報を保持する提案摂動損失に制約された分類器の残差発生条件として訓練されるが、クラス固有の意味情報だけを変更する。 変換器は問合せ画像を任意の対物クラスに転送することができ、推論中は前方時間でのみ説明を生成することができる。 高速で、リアルタイムの実用的応用を満足できる。 GANの敵対的な訓練のため、我々の説明は他のものよりも現実的である。 実験の結果,提案手法は品質と速度の点で既存の技術よりも優れていることがわかった。

Counterfactual explanations are considered, which is to answer {\it why the prediction is class A but not B.} Different from previous optimization based methods, an optimization-free Fast ReAl-time Counterfactual Explanation (FRACE) algorithm is proposed benefiting from the development of multi-domain image to image translation algorithms. Built from starGAN, a transformer is trained as a residual generator conditional on a classifier constrained under a proposal perturbation loss which maintains the content information of the query image, but just the class-specific semantic information is changed. The transformer can transfer the query image to any counterfactual class, and during inference, our explanation can be generated by it only within a forward time. It is fast and can satisfy the real-time practical application. Because of the adversarial training of GAN, our explanation is also more realistic compared to other counterparts. The experimental results demonstrate that our proposal is better than the existing state of the art in terms of quality and speed.
翻訳日:2022-11-11 13:36:44 公開日:2020-08-29
# nengoと低消費電力aiハードウェアによるロバストな組み込みニューロロボティクス

Nengo and low-power AI hardware for robust, embedded neurorobotics ( http://arxiv.org/abs/2007.10227v2 )

ライセンス: Link先を確認
Travis DeWolf and Pawel Jaworski and Chris Eliasmith(参考訳) 本稿では,Nengoのニューラルモデリングとシミュレーションライブラリを用いて,KerasやPythonといった慣れ親しんだツールを用いて,ニューロモルフィックハードウェア上でのロボット認識とアクションニューラルネットワークのシミュレーションを迅速に行う方法を紹介する。 強靭で組込み型ニューロロボティクスシステムを構築する上での4つの主要な課題を特定します。 1)環境とセンサとの相互作用のためのインフラの開発 2 タスク特定感覚信号の処理 3) 堅牢で説明可能な制御信号の生成 4) ターゲットハードウェア上で動作するニューラルネットワークのコンパイル。 Nengoはこれらの課題に次のように対処する。 1) NengoInterfacesライブラリを提供する。これは、ユーザがシミュレーションやハードウェアと対話するためのシンプルだが強力なAPIを定義する。 NengoDLライブラリを提供することで、ユーザはNengoモデルの開発にKerasとTensorFlow APIを使用することができる。 3)既知の機能や回路を実装するためのホワイトボックスメソッドを提供するNeural Engineering Frameworkの実装 4) nengoloihiのような複数のバックエンドライブラリを提供し、ユーザが同じモデルを異なるハードウェアにコンパイルできるようにする。 我々は、Nengoを使用してCPU、GPU、IntelのニューロモーフィックチップであるLoihiで動作するニューラルネットワークを開発し、このワークフローを実証する2つの例を示す。 最初の例は、Mujocoでシミュレートされたローバーを制御するエンドツーエンドのスパイクニューラルネットワークである。 ネットワークは、搭載されたカメラから視覚入力を処理して目標を追跡するディープ畳み込みネットワークと、ローバーを目標に誘導するステアリングと駆動機能を実装する制御システムを統合する。 第2の例は、実世界のkinova jaco2ロボットアームを使用して到達タスク中のパフォーマンスを改善するために、神経適応制御を備えた力ベースの運用スペースコントローラを増強する。 コードと詳細は、他の研究者が独自の神経ロボティクスシステムを構築できるようにすることを目的としている。

In this paper we demonstrate how the Nengo neural modeling and simulation libraries enable users to quickly develop robotic perception and action neural networks for simulation on neuromorphic hardware using familiar tools, such as Keras and Python. We identify four primary challenges in building robust, embedded neurorobotic systems: 1) developing infrastructure for interfacing with the environment and sensors; 2) processing task specific sensory signals; 3) generating robust, explainable control signals; and 4) compiling neural networks to run on target hardware. Nengo helps to address these challenges by: 1) providing the NengoInterfaces library, which defines a simple but powerful API for users to interact with simulations and hardware; 2) providing the NengoDL library, which lets users use the Keras and TensorFlow API to develop Nengo models; 3) implementing the Neural Engineering Framework, which provides white-box methods for implementing known functions and circuits; and 4) providing multiple backend libraries, such as NengoLoihi, that enable users to compile the same model to different hardware. We present two examples using Nengo to develop neural networks that run on CPUs, GPUs, and Intel's neuromorphic chip, Loihi, to demonstrate this workflow. The first example is an end-to-end spiking neural network that controls a rover simulated in Mujoco. The network integrates a deep convolutional network that processes visual input from mounted cameras to track a target, and a control system implementing steering and drive functions to guide the rover to the target. The second example augments a force-based operational space controller with neural adaptive control to improve performance during a reaching task using a real-world Kinova Jaco2 robotic arm. Code and details are provided with the intent of enabling other researchers to build their own neurorobotic systems.
翻訳日:2022-11-08 13:41:35 公開日:2020-08-29
# CovMUNET:胸部X線からのCOVID-19検出への複数の損失アプローチ

CovMUNET: A Multiple Loss Approach towards Detection of COVID-19 from Chest X-ray ( http://arxiv.org/abs/2007.14318v2 )

ライセンス: Link先を確認
A.Q.M. Sazzad Sayyed, Dipayan Saha, Abdul Rakib Hossain(参考訳) 新型コロナウイルス(COVID-19)の感染拡大で全世界が停止し、公衆衛生、世界経済、教育システムに壊滅的な影響を与えた。 ウイルスのワクチンはまだ入手できないため、ウイルスと戦う最も効果的な方法は検査と社会的距離の確保である。 その他の検出技術の中で、Chest X-ray (CXR) ベースの手法は、その単純さ、迅速性、コスト、効率、アクセシビリティーに良い解決策となる。 本稿では、CXR画像からCOVID-19の症例を検出するために、多損失ディープニューラルネットワークアプローチであるCovMUNETを提案する。 提案アルゴリズムのロバスト性を保証するために広範な実験を行い,精度,リコール,精度,f1-scoreの観点から性能評価を行った。 提案手法は,3分類の96.97% (covid-19 vs normal vs pneumonia) と2分類の99.41% (covid vs non-covid) の精度で最先端のアプローチを上回っている。 提案するニューラルネットワークもcxr画像の異常の検出に成功している。

The recent outbreak of COVID-19 has halted the whole world, bringing a devastating effect on public health, global economy, and educational systems. As the vaccine of the virus is still not available, the most effective way to combat the virus is testing and social distancing. Among all other detection techniques, the Chest X-ray (CXR) based method can be a good solution for its simplicity, rapidity, cost, efficiency, and accessibility. In this paper, we propose CovMUNET, which is a multiple loss deep neural network approach to detect COVID-19 cases from CXR images. Extensive experiments are performed to ensure the robustness of the proposed algorithm and the performance is evaluated in terms of precision, recall, accuracy, and F1-score. The proposed method outperforms the state-of-the-art approaches with an accuracy of 96.97% for 3-class classification (COVID-19 vs normal vs pneumonia) and 99.41% for 2-class classification (COVID vs non-COVID). The proposed neural architecture also successfully detects the abnormality in CXR images.
翻訳日:2022-11-06 03:04:07 公開日:2020-08-29
# PillarFlow: 自律走行のためのエンドツーエンドの鳥眼ビューフロー推定

PillarFlow: End-to-end Birds-eye-view Flow Estimation for Autonomous Driving ( http://arxiv.org/abs/2008.01179v3 )

ライセンス: Link先を確認
Kuan-Hui Lee, Matthew Kliemann, Adrien Gaidon, Jie Li, Chao Fang, Sudeep Pillai, Wolfram Burgard(参考訳) 自律運転では、周囲の障害物の状態を正確に推定することは安全で堅牢な経路計画にとって重要である。 しかし、この知覚課題は、特に外見や閉塞の変化により、一般的な障害物や物体に対して困難である。 そこで本研究では,鳥眼ビュー(BeV)におけるLIDARに基づくフロー推定のためのエンドツーエンドのディープラーニングフレームワークを提案する。 本手法は連続点雲対を入力とし,各セルの動的状態を記述する2次元BeVフローグリッドを生成する。 実験の結果,提案手法は2次元BeV流れを正確に推定するだけでなく,動的物体と静的物体の両方の追尾性能も向上することがわかった。

In autonomous driving, accurately estimating the state of surrounding obstacles is critical for safe and robust path planning. However, this perception task is difficult, particularly for generic obstacles/objects, due to appearance and occlusion changes. To tackle this problem, we propose an end-to-end deep learning framework for LIDAR-based flow estimation in bird's eye view (BeV). Our method takes consecutive point cloud pairs as input and produces a 2-D BeV flow grid describing the dynamic state of each cell. The experimental results show that the proposed method not only estimates 2-D BeV flow accurately but also improves tracking performance of both dynamic and static objects.
翻訳日:2022-11-03 06:14:39 公開日:2020-08-29
# 分割近似を用いた無損失二元畳み込みニューラルネットワーク

Towards Lossless Binary Convolutional Neural Networks Using Piecewise Approximation ( http://arxiv.org/abs/2008.03520v2 )

ライセンス: Link先を確認
Baozhou Zhu, Zaid Al-Ars, Wei Pan(参考訳) binary convolutional neural network (cnns) は演算数とメモリストレージのサイズを大幅に削減することができるため、モバイルや組み込みシステムへのcnnのデプロイがより有望になる。 しかし、単一のバイナリcnnと複数のバイナリcnnの精度低下は、現代のアーキテクチャやimagenetのような大規模データセットでは受け入れられない。 本稿では,完全精度の重みとアクティベーションを効率良く近似し,ビット演算の並列性を維持して効率を保証し,精度損失を低減できるマルチバイナリcnnのための分割近似(pa)スキームを提案する。 従来の手法とは異なり、提案したPAスキームは全精度の重みとアクティベーションを断片的に分割し、各ピースをスケーリング係数で近似する。 ImageNetの深度が異なるResNetの実装は、完全精度と比較してTop-1とTop-5の分類精度のギャップを約1.0%削減できる。 ダウンサンプリング層の双対化により、提案したPA-ResNet50はメモリ使用量が少なくなり、Flopsは4つの重みと5つのアクティベーションベースを持つ単一のバイナリCNNよりも2倍必要になる。 PAスキームは、DenseNetやMobileNetのような他のアーキテクチャにも一般化でき、ResNetと同様の近似能力を持つ。 コードと事前訓練されたモデルは一般公開される。

Binary Convolutional Neural Networks (CNNs) can significantly reduce the number of arithmetic operations and the size of memory storage, which makes the deployment of CNNs on mobile or embedded systems more promising. However, the accuracy degradation of single and multiple binary CNNs is unacceptable for modern architectures and large scale datasets like ImageNet. In this paper, we proposed a Piecewise Approximation (PA) scheme for multiple binary CNNs which lessens accuracy loss by approximating full precision weights and activations efficiently and maintains parallelism of bitwise operations to guarantee efficiency. Unlike previous approaches, the proposed PA scheme segments piece-wisely the full precision weights and activations, and approximates each piece with a scaling coefficient. Our implementation on ResNet with different depths on ImageNet can reduce both Top-1 and Top-5 classification accuracy gap compared with full precision to approximately 1.0%. Benefited from the binarization of the downsampling layer, our proposed PA-ResNet50 requires less memory usage and two times Flops than single binary CNNs with 4 weights and 5 activations bases. The PA scheme can also generalize to other architectures like DenseNet and MobileNet with similar approximation power as ResNet which is promising for other tasks using binary convolutions. The code and pretrained models will be publicly available.
翻訳日:2022-11-01 12:04:45 公開日:2020-08-29
# 時空間およびピーク需要パターンに基づく2段階建築エネルギー消費クラスタリング

Two-stage building energy consumption clustering based on temporal and peak demand patterns ( http://arxiv.org/abs/2008.04293v2 )

ライセンス: Link先を確認
Milad Afzalan, Farrokh Jazizadeh, and Hoda Eldardiry(参考訳) スマートメータのデータを分析してエネルギー消費パターンを理解することは、ユーティリティやエネルギープロバイダがカスタマイズされた需要応答操作を実行するのに役立ちます。 既存のエネルギー消費セグメンテーション技術は、メンバーを表すクラスタの品質が低下する可能性がある仮定を使用する。 負荷形状の時間パターンとピーク要求をより正確に把握する2段階クラスタリング手法を導入することで,この制限に対処する。 第1段階では、多数のクラスターがエネルギー利用パターンの変動を正確に把握し、負荷形状をクラスタ化し、形状の不整合を考慮したクラスタセントロイドを抽出する。 第2段階では、ダイナミックタイムワーピングを用いて、類似したセントロイドとパワーマグニチュードの範囲のクラスターをマージする。 約250世帯(約15,000プロファイル)からなる3つのデータセットを使用して、ベースライン手法と比較してパフォーマンス改善を実証し、エネルギー管理への影響について論じた。

Analyzing smart meter data to understand energy consumption patterns helps utilities and energy providers perform customized demand response operations. Existing energy consumption segmentation techniques use assumptions that could result in reduced quality of clusters in representing their members. We address this limitation by introducing a two-stage clustering method that more accurately captures load shape temporal patterns and peak demands. In the first stage, load shapes are clustered by allowing a large number of clusters to accurately capture variations in energy use patterns and cluster centroids are extracted by accounting for shape misalignments. In the second stage, clusters of similar centroid and power magnitude range are merged by using Dynamic Time Warping. We used three datasets consisting of ~250 households (~15000 profiles) to demonstrate the performance improvement, compared to baseline methods, and discuss the impact on energy management.
翻訳日:2022-10-31 23:42:12 公開日:2020-08-29
# LGNN:コンテキスト対応ラインセグメンテーション検出器

LGNN: A Context-aware Line Segment Detector ( http://arxiv.org/abs/2008.05892v2 )

ライセンス: Link先を確認
Quan Meng, Jiakai Zhang, Qiang Hu, Xuming He, Jingyi Yu(参考訳) 本稿では,Line Graph Neural Network (LGNN) と呼ばれる新しいリアルタイム線分検出手法を提案する。 既存のアプローチでは計算コストの高い検証や後処理が必要となる。 我々のLGNNは、線分を直接提案するディープ畳み込みニューラルネットワーク(DCNN)と、それらの接続性を推論するためのグラフニューラルネットワーク(GNN)モジュールを使用している。 特にlgnnは、gnnモジュールが予測候補を頂点として、スパースグラフを構築して構造的文脈を強制するラインセグメント毎に、新しい四重項表現を利用する。 最先端と比較して、LGNNは精度を損なうことなくほぼリアルタイムのパフォーマンスを達成する。 LGNNはさらに、時間に敏感な3Dアプリケーションを可能にする。 3次元点雲がアクセス可能である場合、環境の3次元ワイヤフレームを堅牢かつ効率的に抽出するマルチモーダルラインセグメント分類手法を提案する。

We present a novel real-time line segment detection scheme called Line Graph Neural Network (LGNN). Existing approaches require a computationally expensive verification or postprocessing step. Our LGNN employs a deep convolutional neural network (DCNN) for proposing line segment directly, with a graph neural network (GNN) module for reasoning their connectivities. Specifically, LGNN exploits a new quadruplet representation for each line segment where the GNN module takes the predicted candidates as vertexes and constructs a sparse graph to enforce structural context. Compared with the state-of-the-art, LGNN achieves near real-time performance without compromising accuracy. LGNN further enables time-sensitive 3D applications. When a 3D point cloud is accessible, we present a multi-modal line segment classification technique for extracting a 3D wireframe of the environment robustly and efficiently.
翻訳日:2022-10-30 22:54:33 公開日:2020-08-29
# Adaptive Signal Variances: モダンアーキテクチャによるCNNの初期化

Adaptive Signal Variances: CNN Initialization Through Modern Architectures ( http://arxiv.org/abs/2008.06885v2 )

ライセンス: Link先を確認
Takahiko Henmi, Esmeraldo Ronnie Rey Zara, Yoshihiro Hirohashi, Tsuyoshi Kato(参考訳) 深層畳み込みニューラルネットワーク(cnn)は、画像処理タスクにおけるその性能に対する不当な自信を実現した。 CNNアーキテクチャは、畳み込み層と最大プール層を含む様々なタイプの層を構成する。 CNN実践者は、学習の安定性が各層でモデルパラメータを初期化する方法に依存するという事実を広く理解している。 今日では、初期化のデファクト標準スキームが、Heらによって開発されたいわゆるカイミング初期化であると疑う者はいない。 カイミングスキームは、カイミングスキームの出現以来、現在使われているCNN構造よりもはるかに単純なモデルから派生したものである。 カイミングモデルは畳み込みと完全連結層のみで構成され、最大プール層とグローバル平均プール層を無視している。 本研究では, 単純化されたカイミングモデルではなく, 最新のCNNアーキテクチャから初期化手法を再度導出し, 現在広く使われているデファクト標準方式と比較して, 新たな初期化手法がどのように機能するかを実証的に検討した。

Deep convolutional neural networks (CNN) have achieved the unwavering confidence in its performance on image processing tasks. The CNN architecture constitutes a variety of different types of layers including the convolution layer and the max-pooling layer. CNN practitioners widely understand the fact that the stability of learning depends on how to initialize the model parameters in each layer. Nowadays, no one doubts that the de facto standard scheme for initialization is the so-called Kaiming initialization that has been developed by He et al. The Kaiming scheme was derived from a much simpler model than the currently used CNN structure having evolved since the emergence of the Kaiming scheme. The Kaiming model consists only of the convolution and fully connected layers, ignoring the max-pooling layer and the global average pooling layer. In this study, we derived the initialization scheme again not from the simplified Kaiming model, but precisely from the modern CNN architectures, and empirically investigated how the new initialization method performs compared to the de facto standard ones that are widely used today.
翻訳日:2022-10-28 08:59:11 公開日:2020-08-29
# 箱界認識ベクトルを用いた空中画像のオブジェクト指向物体検出

Oriented Object Detection in Aerial Images with Box Boundary-Aware Vectors ( http://arxiv.org/abs/2008.07043v2 )

ライセンス: Link先を確認
Jingru Yi, Pengxiang Wu, Bo Liu, Qiaoying Huang, Hui Qu, Dimitris Metaxas(参考訳) 空中画像中の物体は任意の方向に表示され、通常は密集しているため、空中画像における指向性物体検出は難しい課題である。 現在のオブジェクト指向物体検出法は主に2段階のアンカーベース検出器に依存している。 しかし、アンカーベースの検出器は通常、正と負のアンカーボックス間の深刻な不均衡の問題に悩まされる。 この問題に対処するため、本研究では、水平キーポイントに基づくオブジェクト検出器をオブジェクト指向オブジェクト検出タスクに拡張する。 特に、まずオブジェクトの中心キーポイントを検出し、それに基づいてボックス境界認識ベクター(bbavector)を回帰させ、向き付けられたバウンディングボックスをキャプチャします。 ボックス境界認識ベクトルは、任意の向きのすべての対象に対するデカルト座標系の四象限に分布する。 コーナーケースにおけるベクトル学習の難しさを緩和するため,向き付けられた境界ボックスを水平および回転境界ボックスに分類した。 実験では, ボックス境界認識ベクトルの学習は, ベースライン法で採用されている配向箱の幅, 高さ, 角度を直接予測するよりも優れていることを示した。 また,提案手法は最先端手法と有利に競合する。 コードはhttps://github.com/yijingru/BBAVectors-Oriented-Object-Detectionで公開されている。

Oriented object detection in aerial images is a challenging task as the objects in aerial images are displayed in arbitrary directions and are usually densely packed. Current oriented object detection methods mainly rely on two-stage anchor-based detectors. However, the anchor-based detectors typically suffer from a severe imbalance issue between the positive and negative anchor boxes. To address this issue, in this work we extend the horizontal keypoint-based object detector to the oriented object detection task. In particular, we first detect the center keypoints of the objects, based on which we then regress the box boundary-aware vectors (BBAVectors) to capture the oriented bounding boxes. The box boundary-aware vectors are distributed in the four quadrants of a Cartesian coordinate system for all arbitrarily oriented objects. To relieve the difficulty of learning the vectors in the corner cases, we further classify the oriented bounding boxes into horizontal and rotational bounding boxes. In the experiment, we show that learning the box boundary-aware vectors is superior to directly predicting the width, height, and angle of an oriented bounding box, as adopted in the baseline method. Besides, the proposed method competes favorably with state-of-the-art methods. Code is available at https://github.com/yijingru/BBAVectors-Oriented-Object-Detection.
翻訳日:2022-10-28 03:53:04 公開日:2020-08-29
# 被害者か加害者か? 映画脚本からの暴力的文字ポートフォリオの分析

Victim or Perpetrator? Analysis of Violent Characters Portrayals from Movie Scripts ( http://arxiv.org/abs/2008.08225v2 )

ライセンス: Link先を確認
Victor R Martinez and Krishna Somandepalli and Karan Singla and Anil Ramanakrishna and Yalda T. Uhls and Shrikanth Narayanan(参考訳) メディア内の暴力的なコンテンツは、視聴者の社会に対する認識に影響を与える可能性がある。 例えば、被害者や加害者としての特定の人口の描写は、ステレオタイプ化された態度を形作ることができる。 本稿では,映画における暴力の大規模分析を支援する計算手法を提案する。 本手法は,スクリプトで使用される言語からのみ暴力的コンテンツの側面を特徴付ける。 このように、本手法は、制作前のコンテンツ制作の初期段階の映画に適用可能である。 これは、オーディオやビデオのポストプロダクションに依存する以前の作品と相補的である。 本研究では,その役を演じる俳優の人口動態に基づいて,登場人物役(被害者,加害者,ナレーター)のステレオタイプを特定する。 以上の結果から, 被害者と加害者との相互作用の人口動態と, その頻度に有意な差が認められた。(1) 被害者として女性キャラクターの方が多く現れ, 2) 被害者が黒もしくはラテン系である場合, 白人であることが示唆された。 これまでのところ、映画脚本で使われる言語は暴力的なコンテンツの強い指標であり、特定の人口動態を大きなデータセットで被害者や加害者として体系的に描写していることを示す最初の例である。 これはストーリーテリングにおける表現の認知の創出を支援する新しい計算ツールを提供する

Violent content in the media can influence viewers' perception of the society. For example, frequent depictions of certain demographics as victims or perpetrators of violence can shape stereotyped attitudes. We propose that computational methods can aid in the large-scale analysis of violence in movies. The method we develop characterizes aspects of violent content solely from the language used in the scripts. Thus, our method is applicable to a movie in the earlier stages of content creation even before it is produced. This is complementary to previous works which rely on audio or video post production. In this work, we identify stereotypes in character roles (i.e., victim, perpetrator and narrator) based on the demographics of the actor casted for that role. Our results highlight two significant differences in the frequency of portrayals as well as the demographics of the interaction between victims and perpetrators : (1) female characters appear more often as victims, and (2) perpetrators are more likely to be White if the victim is Black or Latino. To date, we are the first to show that language used in movie scripts is a strong indicator of violent content, and that there are systematic portrayals of certain demographics as victims and perpetrators in a large dataset. This offers novel computational tools to assist in creating awareness of representations in storytelling
翻訳日:2022-10-27 11:41:08 公開日:2020-08-29
# コミュニケーションのないマルチエージェント強化学習による多モジュール推薦における協調学習

Learning to Collaborate in Multi-Module Recommendation via Multi-Agent Reinforcement Learning without Communication ( http://arxiv.org/abs/2008.09369v2 )

ライセンス: Link先を確認
Xu He, Bo An, Yanghua Li, Haikai Chen, Rundong Wang, Xinrun Wang, Runsheng Yu, Xin Li, and Zhirong Wang(参考訳) オンラインeコマースプラットフォームが普及するにつれ、ますます多くの顧客がオンラインショッピングを好んでいる。 より多くの製品を販売するために、オンラインプラットフォームは様々なモジュールを導入し、大きなディスカウントなどさまざまな特質を持つ商品を推薦する。 ウェブページは、しばしば異なる独立したモジュールから構成される。 これらのモジュールのランキングポリシは、異なるチームによって決定され、協力なしで個別に最適化される。 したがって、全ページのグローバルポリシーは準最適かもしれない。 本稿では,異なるモジュールが通信できないという制約を満たした,新しいマルチエージェント協調強化学習手法を提案する。 私たちの貢献は3倍です。 まず, 相関平衡というゲーム理論の解法の概念に着想を得て, 異なるモジュールに対して信号(ベクトル)を生成することにより, すべてのモジュールの協調を促進する信号ネットワークを設計した。 第二に、信号ネットワークのエントロピー規則化されたバージョンは、エージェントによる最適なグローバルポリシーの探索を協調するために提案される。 さらに,実世界の電子商取引データに基づく実験により,本アルゴリズムがベースラインよりも優れた性能を得ることを示す。

With the rise of online e-commerce platforms, more and more customers prefer to shop online. To sell more products, online platforms introduce various modules to recommend items with different properties such as huge discounts. A web page often consists of different independent modules. The ranking policies of these modules are decided by different teams and optimized individually without cooperation, which might result in competition between modules. Thus, the global policy of the whole page could be sub-optimal. In this paper, we propose a novel multi-agent cooperative reinforcement learning approach with the restriction that different modules cannot communicate. Our contributions are three-fold. Firstly, inspired by a solution concept in game theory named correlated equilibrium, we design a signal network to promote cooperation of all modules by generating signals (vectors) for different modules. Secondly, an entropy-regularized version of the signal network is proposed to coordinate agents' exploration of the optimal global policy. Furthermore, experiments based on real-world e-commerce data demonstrate that our algorithm obtains superior performance over baselines.
翻訳日:2022-10-26 21:21:03 公開日:2020-08-29
# 手話認識における技術の現状に関する定量的調査

Quantitative Survey of the State of the Art in Sign Language Recognition ( http://arxiv.org/abs/2008.09918v2 )

ライセンス: Link先を確認
Oscar Koller(参考訳) 本研究は,400以上の実験結果が得られた約300の手話認識論文を対象としたメタスタディである。 1983年から2020年までのほとんどの論文が収録されている。 さらに、この分野の標準ベンチマークタスクであるrwth-phoenix-weather 2014における認識アプローチを比較した25以上の研究に関する詳細な分析も取り上げている。 手話認識分野の研究は過去10年で著しく進展し、タスクがこれまでにないほど注目を集めている。 本研究は、現場を前進させ、オープンな質問を明らかにするための簡潔な方法で芸術の状態をコンパイルする。 さらに、このメタスタディのソースデータはすべて公開されており、今後の作業の緩和とさらなる拡張が図られている。 分析された論文は、手動で分類された。 データは、侵入的から非侵入的なキャプチャー、地域的特徴からグローバルな特徴、中・大規模語彙認識システムに含まれる非手動パラメータの欠如など、多くの洞察を浮き彫りにしている。 驚くべきことに、rwth-phoenix-weatherの語彙1080の記号は、世界規模の大語彙連続手話認識ベンチマークの唯一のリソースである。

This work presents a meta study covering around 300 published sign language recognition papers with over 400 experimental results. It includes most papers between the start of the field in 1983 and 2020. Additionally, it covers a fine-grained analysis on over 25 studies that have compared their recognition approaches on RWTH-PHOENIX-Weather 2014, the standard benchmark task of the field. Research in the domain of sign language recognition has progressed significantly in the last decade, reaching a point where the task attracts much more attention than ever before. This study compiles the state of the art in a concise way to help advance the field and reveal open questions. Moreover, all of this meta study's source data is made public, easing future work with it and further expansion. The analyzed papers have been manually labeled with a set of categories. The data reveals many insights, such as, among others, shifts in the field from intrusive to non-intrusive capturing, from local to global features and the lack of non-manual parameters included in medium and larger vocabulary recognition systems. Surprisingly, RWTH-PHOENIX-Weather with a vocabulary of 1080 signs represents the only resource for large vocabulary continuous sign language recognition benchmarking world wide.
翻訳日:2022-10-26 08:12:36 公開日:2020-08-29
# 自然な会話から人間のようなタスク識別を実現する

Enabling human-like task identification from natural conversation ( http://arxiv.org/abs/2008.10073v2 )

ライセンス: Link先を確認
Pradip Pramanick, Chayan Sarkar, Balamuralidhar P, Ajay Kattepur, Indrajit Bhattacharya, Arpan Pal(参考訳) 同僚や同居者としてのロボットは、低コストの高度なハードウェアの開発で日々主流になりつつある。 しかし、ロボットハードウェアのユーザビリティを補助するソフトウェアスタックは、そのプロセスのボトルネックであり、特にロボットが1つの仕事に専念していない場合はなおさらだ。 多目的ロボットのプログラミングには、タスク識別と計画生成を含むオンザフライミッションスケジューリング機能が必要である。 問題次元は、ロボットが自然言語で人間からのタスクを受け入れると増加する。 近年のNLPとプランナー開発は様々な複雑な問題を解くことができるが、動的ロボットタスクハンドラの融合は限られた範囲で行われている。 具体的には、自然言語の指示から計画問題を定式化する問題は、詳細は研究されていない。 本研究では, nlpエンジンとプランナーを組み合わせることで, ロボットがタスクと関連するパラメータをすべて識別し, タスクの正確な計画を生成するための非自明な手法を提案する。 さらに、自然言語命令の曖昧さや欠落した情報を解決するためのメカニズムもいくつか必要である。 そこで我々は,必要最小限の質問応答繰り返しで追加情報を収集することを目的とした対話戦略も開発している。 この研究は、ロボットにおける人間のようなタスク理解能力の実現に向けて大きな一歩を踏み出した。

A robot as a coworker or a cohabitant is becoming mainstream day-by-day with the development of low-cost sophisticated hardware. However, an accompanying software stack that can aid the usability of the robotic hardware remains the bottleneck of the process, especially if the robot is not dedicated to a single job. Programming a multi-purpose robot requires an on the fly mission scheduling capability that involves task identification and plan generation. The problem dimension increases if the robot accepts tasks from a human in natural language. Though recent advances in NLP and planner development can solve a variety of complex problems, their amalgamation for a dynamic robotic task handler is used in a limited scope. Specifically, the problem of formulating a planning problem from natural language instructions is not studied in details. In this work, we provide a non-trivial method to combine an NLP engine and a planner such that a robot can successfully identify tasks and all the relevant parameters and generate an accurate plan for the task. Additionally, some mechanism is required to resolve the ambiguity or missing pieces of information in natural language instruction. Thus, we also develop a dialogue strategy that aims to gather additional information with minimal question-answer iterations and only when it is necessary. This work makes a significant stride towards enabling a human-like task understanding capability in a robot.
翻訳日:2022-10-26 03:11:40 公開日:2020-08-29
# 車両内ネットワーク確保のための敵攻撃防御システム

An Adversarial Attack Defending System for Securing In-Vehicle Networks ( http://arxiv.org/abs/2008.11278v2 )

ライセンス: Link先を確認
Yi Li, Jing Lin, and Kaiqi Xiong(参考訳) 現代の車両では、70以上の電子制御ユニット(ECU)がある。 車両内ネットワークでは、ECUはコントローラエリアネットワーク(CAN)などの標準通信プロトコルに従って通信を行う。 しかし、攻撃者は車載ネットワークに容易にアクセスして、WLANやBluetoothを介してECUに侵入することができる。 車両内ネットワークの確保には様々な深層学習(DL)手法が提案されているが、近年の敵の事例では、攻撃者が容易にDLモデルを騙せることが示されている。 本研究では,車載ネットワークにおける逆例をさらに探求する。 まず,車載ネットワークで使用されるlong short term memory(lstm)ベースの検出モデルに有害な2つの敵攻撃モデルを発見し,実装する。 そこで本研究では,車載ネットワークを確保するためのアタック防御システム(AADS)を提案する。 具体的には車内ネットワークにおけるブレーキ関連ECUに着目した。 実験の結果,LSTMに基づく検出モデルでは98%以上の精度で容易に攻撃が可能であり,AADSは99%以上の精度で敵の攻撃を検出できることがわかった。

In a modern vehicle, there are over seventy Electronics Control Units (ECUs). For an in-vehicle network, ECUs communicate with each other by following a standard communication protocol, such as Controller Area Network (CAN). However, an attacker can easily access the in-vehicle network to compromise ECUs through a WLAN or Bluetooth. Though there are various deep learning (DL) methods suggested for securing in-vehicle networks, recent studies on adversarial examples have shown that attackers can easily fool DL models. In this research, we further explore adversarial examples in an in-vehicle network. We first discover and implement two adversarial attack models that are harmful to a Long Short Term Memory (LSTM)-based detection model used in the in-vehicle network. Then, we propose an Adversarial Attack Defending System (AADS) for securing an in-vehicle network. Specifically, we focus on brake-related ECUs in an in-vehicle network. Our experimental results demonstrate that adversaries can easily attack the LSTM-based detection model with a success rate of over 98%, and the proposed AADS achieves over 99% accuracy for detecting adversarial attacks.
翻訳日:2022-10-25 04:36:54 公開日:2020-08-29
# テンソルイジングモデルにおける推定

Estimation in Tensor Ising Models ( http://arxiv.org/abs/2008.12882v1 )

ライセンス: Link先を確認
Somabha Mukherjee, Jaesung Son, and Bhaswar B. Bhattacharya(参考訳) p$-tensor isingモデル(英語版)は依存するバイナリデータをモデル化するための1パラメータの離散指数関数群であり、十分な統計量は次数 $p \geq 2$ の多重線形形式である。 これは行列イジングモデルの自然な一般化であり、複雑な関係データの高階依存を捉えるのに便利な数学的枠組みを提供する。 本稿では,$N$ノード上の分布から1つのサンプルが与えられた場合,$p$-tensor Isingモデルの自然パラメータを推定する問題を考察する。 提案手法は,計算効率のよいパラメータ推定アルゴリズムであり,計算可能な分割関数の計算を避ける。 mpl の推定値が $\sqrt n$ であるような一般的な条件、すなわち 1/\sqrt n$ の真のパラメータに収束する。 特に、p$-spin sherrington-kirkpatrick (sk)モデルにおけるmpl推定の$\sqrt n$-consistency、一般的な$p$-uniformハイパーグラフ上のスピン系、ハイパーグラフ確率ブロックモデル(hsbm)上のイジングモデルを示す。 実際、HSBMでは、ある平均場変動問題の正の値によって決定される位相遷移しきい値の正確な位置を、MPL推定値が$\sqrt N$-consistentであり、しきい値以下では、推定値が一貫しない。 最後に、$p$-tensor Curie-Weiss モデルの特別な場合における MPL 推定の正確な揺らぎを導出する。 その結果,Curie-WeissモデルにおけるMPL推定は,計算的トラクタビリティの真の可能性関数の近似を最小化して得られるにもかかわらず,推定しきい値以上のすべての点において,MPL推定が漸近的効率の損失を生じない,という結果が得られた。

The $p$-tensor Ising model is a one-parameter discrete exponential family for modeling dependent binary data, where the sufficient statistic is a multi-linear form of degree $p \geq 2$. This is a natural generalization of the matrix Ising model, that provides a convenient mathematical framework for capturing higher-order dependencies in complex relational data. In this paper, we consider the problem of estimating the natural parameter of the $p$-tensor Ising model given a single sample from the distribution on $N$ nodes. Our estimate is based on the maximum pseudo-likelihood (MPL) method, which provides a computationally efficient algorithm for estimating the parameter that avoids computing the intractable partition function. We derive general conditions under which the MPL estimate is $\sqrt N$-consistent, that is, it converges to the true parameter at rate $1/\sqrt N$. In particular, we show the $\sqrt N$-consistency of the MPL estimate in the $p$-spin Sherrington-Kirkpatrick (SK) model, spin systems on general $p$-uniform hypergraphs, and Ising models on the hypergraph stochastic block model (HSBM). In fact, for the HSBM we pin down the exact location of the phase transition threshold, which is determined by the positivity of a certain mean-field variational problem, such that above this threshold the MPL estimate is $\sqrt N$-consistent, while below the threshold no estimator is consistent. Finally, we derive the precise fluctuations of the MPL estimate in the special case of the $p$-tensor Curie-Weiss model. An interesting consequence of our results is that the MPL estimate in the Curie-Weiss model saturates the Cramer-Rao lower bound at all points above the estimation threshold, that is, the MPL estimate incurs no loss in asymptotic efficiency, even though it is obtained by minimizing only an approximation of the true likelihood function for computational tractability.
翻訳日:2022-10-23 17:38:21 公開日:2020-08-29
# インテリジェント反射面支援無線ネットワークのための最適化駆動機械学習

Optimization-driven Machine Learning for Intelligent Reflecting Surfaces Assisted Wireless Networks ( http://arxiv.org/abs/2008.12938v1 )

ライセンス: Link先を確認
Shimin Gong, Jiaye Lin, Jinbei Zhang, Dusit Niyato, Dong In Kim, and Mohsen Guizani(参考訳) intelligent reflecting surface (irs) は最近、個々の散乱素子の位相シフト、すなわち受動ビームフォーミングを制御して無線チャネルを再構成するために用いられている。 散乱素子の規模が大きいため、受動ビームフォーミングは通常、高い計算複雑性と不正確なチャネル情報によって挑戦される。 本稿では、IRS支援無線ネットワークの性能最大化のための機械学習(ML)アプローチに焦点を当てる。 一般に、MLアプローチは不確実な情報や不正確なモデリングに対して、柔軟性と堅牢性を向上させる。 オフライントレーニングにおける大規模なデータセットの需要と、オンライン学習における収束の遅さが主な原因である。 これらの観測は、モデルベース最適化の効率性とモデルフリーMLアプローチの堅牢性の両面から、IRS支援無線ネットワークのための新しい最適化駆動型MLフレームワークを設計する動機となっている。 決定変数を2つの部分に分割することにより、一方は外ループMLアプローチにより得られ、他方は近似問題を解くことにより効率よく最適化される。 計算結果は,従来のモデルフリー学習手法と比較して,最適化駆動型ML手法が収束性と報奨性能の両方を向上できることを確認した。

Intelligent reflecting surface (IRS) has been recently employed to reshape the wireless channels by controlling individual scattering elements' phase shifts, namely, passive beamforming. Due to the large size of scattering elements, the passive beamforming is typically challenged by the high computational complexity and inexact channel information. In this article, we focus on machine learning (ML) approaches for performance maximization in IRS-assisted wireless networks. In general, ML approaches provide enhanced flexibility and robustness against uncertain information and imprecise modeling. Practical challenges still remain mainly due to the demand for a large dataset in offline training and slow convergence in online learning. These observations motivate us to design a novel optimization-driven ML framework for IRS-assisted wireless networks, which takes both advantages of the efficiency in model-based optimization and the robustness in model-free ML approaches. By splitting the decision variables into two parts, one part is obtained by the outer-loop ML approach, while the other part is optimized efficiently by solving an approximate problem. Numerical results verify that the optimization-driven ML approach can improve both the convergence and the reward performance compared to conventional model-free learning approaches.
翻訳日:2022-10-23 17:37:40 公開日:2020-08-29
# 学習方針に埋め込まれた構造は四足歩行の学習にどのように影響するか?

How does the structure embedded in learning policy affect learning quadruped locomotion? ( http://arxiv.org/abs/2008.12970v1 )

ライセンス: Link先を確認
Kuangen Zhang, Jongwoo Lee, Zhimin Hou, Clarence W. de Silva, Chenglong Fu, Neville Hogan(参考訳) 強化学習(rl)は、ロボット工学で大きな成功を収めた一般的なデータ駆動手法である。 以前の作品は通常、関節トルクを直接出力するためのエンドツーエンド(直接)ポリシーの学習に焦点を当てている。 直接的な方針は便利に思えるが、結果のパフォーマンスは私たちの期待に合わないかもしれない。 パフォーマンスを向上させるために、より洗練された報酬機能やより構造化されたポリシーが利用できる。 本論文は、構造的ポリシーがより直感的であり、従来のモデルベースコントローラからの洞察を継承できるため、後者に焦点を当てる。 アクション空間のより良い選択や運動軌跡の制約のような構造が、一般的なコストでトレーニングプロセスと政策の最終性能に利益をもたらすことは予想できないが、定量効果はまだ不明である。 本稿では,構造の影響を定量的に解析するため,四足歩行学習における構造レベルの異なる3つの政策,すなわち,直接政策,構造化政策,高度構成政策について検討する。 構造化されたポリシーは、タスク空間インピーダンスコントローラを学習するために訓練され、高度に構造化されたポリシーは、以前の作業から採用したトロットランニングに適したコントローラを学ぶ。 訓練されたポリシーを評価するために, 異なる所望の速度を追従するシミュレーション実験を考案する。 シミュレーションの結果、構造化政策と高度構成政策は、同じレベルの累積報酬を達成するために、直接政策よりも1/3と3/4の訓練ステップを要し、直接政策よりも堅牢で効率的であることがわかった。 このポリシーに埋め込まれた構造は、足の移動などの複雑なダイナミクスが関与する複雑なタスクの学習の全体的なパフォーマンスに大きく影響する。

Reinforcement learning (RL) is a popular data-driven method that has demonstrated great success in robotics. Previous works usually focus on learning an end-to-end (direct) policy to directly output joint torques. While the direct policy seems convenient, the resultant performance may not meet our expectations. To improve its performance, more sophisticated reward functions or more structured policies can be utilized. This paper focuses on the latter because the structured policy is more intuitive and can inherit insights from previous model-based controllers. It is unsurprising that the structure, such as a better choice of the action space and constraints of motion trajectory, may benefit the training process and the final performance of the policy at the cost of generality, but the quantitative effect is still unclear. To analyze the effect of the structure quantitatively, this paper investigates three policies with different levels of structure in learning quadruped locomotion: a direct policy, a structured policy, and a highly structured policy. The structured policy is trained to learn a task-space impedance controller and the highly structured policy learns a controller tailored for trot running, which we adopt from previous work. To evaluate trained policies, we design a simulation experiment to track different desired velocities under force disturbances. Simulation results show that structured policy and highly structured policy require 1/3 and 3/4 fewer training steps than the direct policy to achieve a similar level of cumulative reward, and seem more robust and efficient than the direct policy. We highlight that the structure embedded in the policies significantly affects the overall performance of learning a complicated task when complex dynamics are involved, such as legged locomotion.
翻訳日:2022-10-23 17:37:22 公開日:2020-08-29
# 携帯電話データに基づく都市センシング : アプローチ, 応用, 課題

Urban Sensing based on Mobile Phone Data: Approaches, Applications and Challenges ( http://arxiv.org/abs/2008.12992v1 )

ライセンス: Link先を確認
Mohammadhossein Ghahramani, MengChu Zhou, and Gang Wang(参考訳) データボリュームは、強力なスマートフォンと革新的なモバイルアプリケーションの増加によって爆発的に増加する。 これらのデータを正確かつ広範囲に監視および分析する能力が必要である。 モバイルデータ分析における多くの関心は、人間とその行動に関連している。 これらの膨大なデータの裏にある潜在的な価値から、対応するパターンを理解するための異なるアプローチが提案されている。 そのために、固定位置で数えるか、原点決定行列を生成して追跡するかといった人々のインタラクションを監視することが重要である。 前者は道路や都市アトラクションなどの資産の利用を判断するために使用することができる。 後者は輸送インフラの計画に有用である。 このような洞察により、政府は新しい道路、新しい公共交通路、既存のインフラの変更、混雑ゾーンの検出を予測でき、より効率的な設計と改善が可能になる。 スマートフォンのデータ探索は、都市計画、交通、医療、ビジネスマーケティングなど、さまざまな分野の研究に役立つ。 意思決定やポリシ実装,監視,評価など,あらゆるレベルでの組織を支援します。 本研究は,携帯電話データから知識を発見するために実装された手法と手法をレビューすることを目的とする。 我々は,これらの既存手法を分類し,それらの長所と短所を考察し,関連研究の分類法を提案する。

Data volume grows explosively with the proliferation of powerful smartphones and innovative mobile applications. The ability to accurately and extensively monitor and analyze these data is necessary. Much concern in mobile data analysis is related to human beings and their behaviours. Due to the potential value that lies behind these massive data, there have been different proposed approaches for understanding corresponding patterns. To that end, monitoring people's interactions, whether counting them at fixed locations or tracking them by generating origin-destination matrices is crucial. The former can be used to determine the utilization of assets like roads and city attractions. The latter is valuable when planning transport infrastructure. Such insights allow a government to predict the adoption of new roads, new public transport routes, modification of existing infrastructure, and detection of congestion zones, resulting in more efficient designs and improvement. Smartphone data exploration can help research in various fields, e.g., urban planning, transportation, health care, and business marketing. It can also help organizations in decision making, policy implementation, monitoring and evaluation at all levels. This work aims to review the methods and techniques that have been implemented to discover knowledge from mobile phone data. We classify these existing methods and present a taxonomy of the related work by discussing their pros and cons.
翻訳日:2022-10-23 17:36:51 公開日:2020-08-29
# 自然言語処理と機械学習技術に基づくインテキスト・サイテーション分析の10年 -実証的研究の概要-

A Decade of In-text Citation Analysis based on Natural Language Processing and Machine Learning Techniques: An overview of empirical studies ( http://arxiv.org/abs/2008.13020v1 )

ライセンス: Link先を確認
Sehrish Iqbal, Saeed-Ul Hassan, Naif Radi Aljohani, Salem Alelyani, Raheel Nawaz and Lutz Bornmann(参考訳) 引用分析は、研究評価において最も頻繁に用いられる方法の1つである。 主にWeb of Science, Scopus, Google Scholar, Microsoft Academic, Dimensionsといった引用データベースが利用可能になったためです。 近年のフルテキストパブリッシングコーパスへのより良いアクセスのために、情報科学者は、文脈的に科学出版の影響を測定するために、フルテキストデータ処理技術の進歩に踏み込んで、従来の文献学をはるかに超えた。 これは、引用文脈とコンテンツ分析、引用分類、引用感情分析、引用要約、引用に基づく推薦の技術的発展につながった。 本稿は,これらの発展に関する研究を物語的に見直すことを目的とする。 その主な焦点は、自然言語処理と機械学習技術を使って引用を分析する出版物である。

Citation analysis is one of the most frequently used methods in research evaluation. We are seeing significant growth in citation analysis through bibliometric metadata, primarily due to the availability of citation databases such as the Web of Science, Scopus, Google Scholar, Microsoft Academic, and Dimensions. Due to better access to full-text publication corpora in recent years, information scientists have gone far beyond traditional bibliometrics by tapping into advancements in full-text data processing techniques to measure the impact of scientific publications in contextual terms. This has led to technical developments in citation context and content analysis, citation classifications, citation sentiment analysis, citation summarisation, and citation-based recommendation. This article aims to narratively review the studies on these developments. Its primary focus is on publications that have used natural language processing and machine learning techniques to analyse citations.
翻訳日:2022-10-23 17:36:34 公開日:2020-08-29
# マルチロータ航空機(MAV)の動力学的平滑化による経路計画

Path Planning Followed by Kinodynamic Smoothing for Multirotor Aerial Vehicles (MAVs) ( http://arxiv.org/abs/2008.12950v1 )

ライセンス: Link先を確認
Geesara Kulathunga, Dmitry Devitt, Roman Fedorenko, Sergei Savin and Alexandr Klimchik(参考訳) 我々は,MAVの動力学的実現性を確保しつつ,キノダイナミックスムース化に伴う経路計画について検討する。 我々はこの目的のために、幾何学的に基づく動き計画手法「textquotedblleft RRT*\textquotedblright」を選択した。 提案手法では,適応的な探索空間と,プランナーの一貫性を高めるためのステアリング関数を導入して,rrt*を修正した。 さらに、最適な経路が選択された場合、所望の経路の集合を生成する複数のRT*を提案する。 次に、kinodynamic smoothingを適用すれば、障害物のないパスと同様に動的に実現できます。 その後、bスプラインベース軌道が生成され、未知の環境で自律的に車両を操縦する。 最後に,提案手法を様々なシミュレーション環境でテストした。

We explore path planning followed by kinodynamic smoothing while ensuring the vehicle dynamics feasibility for MAVs. We have chosen a geometrically based motion planning technique \textquotedblleft RRT*\textquotedblright\; for this purpose. In the proposed technique, we modified original RRT* introducing an adaptive search space and a steering function which help to increase the consistency of the planner. Moreover, we propose multiple RRT* which generates a set of desired paths, provided that the optimal path is selected among them. Then, apply kinodynamic smoothing, which will result in dynamically feasible as well as obstacle-free path. Thereafter, a b spline-based trajectory is generated to maneuver vehicle autonomously in unknown environments. Finally, we have tested the proposed technique in various simulated environments.
翻訳日:2022-10-23 17:36:19 公開日:2020-08-29
# 隠れマルコフ過程のシャノンエントロピー速度

Shannon Entropy Rate of Hidden Markov Processes ( http://arxiv.org/abs/2008.12886v1 )

ライセンス: Link先を確認
Alexandra M. Jurgens and James P. Crutchfield(参考訳) 隠れマルコフ連鎖は、基礎物理学や化学から金融、健康、人工知能まで、確率過程の統計モデルとして広く応用されている。 しかし、それらが生成する隠れマルコフ過程は、たとえ鎖が有限状態であっても、そのシャノンエントロピー率に対する有限表現は存在せず、それらの予測的特徴の集合は総じて無限である。 そのため、現在まで、それらがいかにランダムであるか、どのように構造化されているかについての一般的な言明はできない。 本稿では,エントロピー率を効率良く正確に計算する方法を示すことで,この課題の最初の部分に対処する。 また,この手法が最小限の無限予測的特徴を与えることを示す。 続編は、構造に関するチャレンジの第2部に対処します。

Hidden Markov chains are widely applied statistical models of stochastic processes, from fundamental physics and chemistry to finance, health, and artificial intelligence. The hidden Markov processes they generate are notoriously complicated, however, even if the chain is finite state: no finite expression for their Shannon entropy rate exists, as the set of their predictive features is generically infinite. As such, to date one cannot make general statements about how random they are nor how structured. Here, we address the first part of this challenge by showing how to efficiently and accurately calculate their entropy rates. We also show how this method gives the minimal set of infinite predictive features. A sequel addresses the challenge's second part on structure.
翻訳日:2022-10-23 17:36:08 公開日:2020-08-29
# 韻律と偽音を用いたデータ強化による非母語話者の発話認識

Data augmentation using prosody and false starts to recognize non-native children's speech ( http://arxiv.org/abs/2008.12914v1 )

ライセンス: Link先を確認
Hemant Kathania, Mittul Singh, Tam\'as Gr\'osz, Mikko Kurimo(参考訳) 本稿では,aaltoasrの音声認識システムであるinterspeech 2020 shared task on automatic speech recognition (asr)について述べる。 タスクは、限られた量のスピーチを与えられたさまざまな年齢の子供からの非ネイティブなスピーチを認識することである。 さらに、自発的な発話は、部分的な単語として書き起こされ始め、テストの書き起こしでは見当たらない部分的な単語につながる。 これら2つの課題に対処するために,データ拡張に基づくアプローチを検討する。 まず,音声データを補うために韻律に基づくデータ拡張を適用する。 第2に,言語モデリングコーパスに部分語ノイズを導入することで,偽語開始をシミュレートする。 韻律に基づく拡張データで訓練された音響モデルは、ベースラインレシピやスペックーグメントに基づく拡張によってモデルを上回る。 部分単語ノイズは、ベースライン言語モデルの改善にも役立ちます。 これらのスキームを組み合わせたASRシステムは,評価期間中に第3位となり,単語誤り率18.71%を達成した。 評価後,韻律に基づく拡張データの増加がパフォーマンスの向上につながることが観察された。 さらに、低信頼の単語を仮説から取り除くことは、さらなる利益につながる可能性がある。 これら2つの改良により、ASRエラー率は17.99%に低下した。

This paper describes AaltoASR's speech recognition system for the INTERSPEECH 2020 shared task on Automatic Speech Recognition (ASR) for non-native children's speech. The task is to recognize non-native speech from children of various age groups given a limited amount of speech. Moreover, the speech being spontaneous has false starts transcribed as partial words, which in the test transcriptions leads to unseen partial words. To cope with these two challenges, we investigate a data augmentation-based approach. Firstly, we apply the prosody-based data augmentation to supplement the audio data. Secondly, we simulate false starts by introducing partial-word noise in the language modeling corpora creating new words. Acoustic models trained on prosody-based augmented data outperform the models using the baseline recipe or the SpecAugment-based augmentation. The partial-word noise also helps to improve the baseline language model. Our ASR system, a combination of these schemes, is placed third in the evaluation period and achieves the word error rate of 18.71%. Post-evaluation period, we observe that increasing the amounts of prosody-based augmented data leads to better performance. Furthermore, removing low-confidence-score words from hypotheses can lead to further gains. These two improvements lower the ASR error rate to 17.99%.
翻訳日:2022-10-23 17:31:49 公開日:2020-08-29
# soccogcom at semeval-2020 task 11: characterizing and detection propaganda using sentence-level emotional salience features (英語)

SocCogCom at SemEval-2020 Task 11: Characterizing and Detecting Propaganda using Sentence-Level Emotional Salience Features ( http://arxiv.org/abs/2008.13012v1 )

ライセンス: Link先を確認
Gangeshwar Krishnamurthy, Raj Kumar Gupta, Yinping Yang(参考訳) 本稿では,ニュース記事からプロパガンダ手法を検出するシステムについて述べる。 本稿では,ニュースセグメントから抽出した感情的サリエンスの特徴が,プロパガンダ技術の存在を特徴づけ,予測するのに役立つかを検討する。 相関分析は、例えば「負荷のある言語」と「スローガン」のテクニックは、原子価と喜びの強さと負の関連があるが、怒り、恐怖、悲しみの強さと正の関連がある興味深いパターンを表面化した。 対照的に、"flag waves" と "appeal to fear-prejudice" は正反対のパターンを持つ。 予測実験により, BERTのみの特徴が0.548のF1スコアを得たのに対し, 感情強度特徴とBERTハイブリッド特徴が0.570のF1スコアを得ることができた。 金の試験データから,14種類のプロパガンダによる検出効果について,F1スコア0.558のマイクロ平均値を得た。 負荷言語」(F1 = 0.772)、"name call and labeling" (F1 = 0.673)、"doubt" (F1 = 0.604)、"flag swing" (F1 = 0.543) を比較的よく検出した。

This paper describes a system developed for detecting propaganda techniques from news articles. We focus on examining how emotional salience features extracted from a news segment can help to characterize and predict the presence of propaganda techniques. Correlation analyses surfaced interesting patterns that, for instance, the "loaded language" and "slogan" techniques are negatively associated with valence and joy intensity but are positively associated with anger, fear and sadness intensity. In contrast, "flag waving" and "appeal to fear-prejudice" have the exact opposite pattern. Through predictive experiments, results further indicate that whereas BERT-only features obtained F1-score of 0.548, emotion intensity features and BERT hybrid features were able to obtain F1-score of 0.570, when a simple feedforward network was used as the classifier in both settings. On gold test data, our system obtained micro-averaged F1-score of 0.558 on overall detection efficacy over fourteen propaganda techniques. It performed relatively well in detecting "loaded language" (F1 = 0.772), "name calling and labeling" (F1 = 0.673), "doubt" (F1 = 0.604) and "flag waving" (F1 = 0.543).
翻訳日:2022-10-23 17:31:32 公開日:2020-08-29
# Tile-Wise Sparsityによるハードウェア不要スパースDNNモデルの高速化

Accelerating Sparse DNN Models without Hardware-Support via Tile-Wise Sparsity ( http://arxiv.org/abs/2008.13006v1 )

ライセンス: Link先を確認
Cong Guo and Bo Yang Hsueh and Jingwen Leng and Yuxian Qiu and Yue Guan and Zehuan Wang and Xiaoying Jia and Xipeng Li and Minyi Guo and Yuhao Zhu(参考訳) ネットワークプルーニングは、ディープニューラルネットワーク(DNN)モデルの高い計算コストを削減できる。 しかし、それらの精度を維持するためにスパースモデルはしばしばランダムに分散した重みを持ち、不規則な計算に繋がる。 その結果、スパースモデルは、密度行列計算用に構築されたコモディティハードウェア(例えばgpu)において有意義なスピードアップを達成できない。 そのため、事前の作業は通常、疎性を利用するために完全に新しい疎性最適化アーキテクチャを変更または設計する。 本稿では,既存の高密度アーキテクチャの遅延高速化を実現するアルゴリズム・ソフトウェア共同設計のpruning手法を提案する。 私たちの研究は、マトリクスの乗算が並列実行のために大きなマトリクスを複数の小さなタイルに分割するという洞察に基づいている。 そこで本稿では,タイルレベルで規則的なパターンを維持しつつ,グローバルスケールで不規則で任意の刈り取りを可能とし,高い精度を維持するタイル指向のスパルシティパターンを提案する。 gputensor core上でsparsityパターンを実装し,評価し,高密度モデル上で1.9倍の高速化を実現する。

Network pruning can reduce the high computation cost of deep neural network (DNN) models. However, to maintain their accuracies, sparse models often carry randomly-distributed weights, leading to irregular computations. Consequently, sparse models cannot achieve meaningful speedup on commodity hardware (e.g., GPU) built for dense matrix computations. As such, prior works usually modify or design completely new sparsity-optimized architectures for exploiting sparsity. We propose an algorithm-software co-designed pruning method that achieves latency speedups on existing dense architectures. Our work builds upon the insight that the matrix multiplication generally breaks the large matrix into multiple smaller tiles for parallel execution. We propose a tiling-friendly "tile-wise" sparsity pattern, which maintains a regular pattern at the tile level for efficient execution but allows for irregular, arbitrary pruning at the global scale to maintain the high accuracy. We implement and evaluate the sparsity pattern on GPU tensor core, achieving a 1.95x speedup over the dense model.
翻訳日:2022-10-23 17:31:05 公開日:2020-08-29
# 深層学習による乳房筋のデジタルマンモグラムにおけるセグメンテーションについて

On segmentation of pectoralis muscle in digital mammograms by means of deep learning ( http://arxiv.org/abs/2008.12904v1 )

ライセンス: Link先を確認
Hossein Soleimani and Oleg V.Michailovich(参考訳) コンピュータ支援診断 (CAD) は長い間, 乳腺疾患の放射線学的管理において重要な役割を担い, 乳房密度の定量的評価やX線マンモグラフィーによる悪性腫瘍の早期発見など, 数多くの重要な臨床応用に寄与してきた。 このような応用に共通しているのは、乳腺組織と隣接する解剖組織を自動で識別する必要性であり、後者は胸筋(または胸筋)によって主に表される。 特に中側方斜視(MLO)で得られたマンモグラムでは, 形態的, 光学的類似性から, 胸部解剖学的要素と容易に相違する。 その結果,MLOマンモグラムにおける胸部筋の自動検出・分節化の問題は,いまだ必要であり,常に検索される革新的なアプローチである。 そこで本研究では,データ駆動予測(深層学習)とグラフベース画像処理を組み合わせた2段階のセグメンテーション戦略を提案する。 特に,胸壁境界の位置を空間分解能の異なるレベルで予測するために,畳み込みニューラルネットワーク(CNN)を用いた。 その後、予測はアルゴリズムの第2段階によって行われ、特別に設計されたグラフ上の最短経路問題の解として所望の境界が回復される。 提案アルゴリズムは、3つの異なるデータセット(MIAS, CBIS-DDSm, InBreast)で、様々な定量値を用いてテストされている。 比較分析の結果,最先端技術よりも大幅に改善され,モデルフリーで完全自動処理が可能となった。

Computer-aided diagnosis (CAD) has long become an integral part of radiological management of breast disease, facilitating a number of important clinical applications, including quantitative assessment of breast density and early detection of malignancies based on X-ray mammography. Common to such applications is the need to automatically discriminate between breast tissue and adjacent anatomy, with the latter being predominantly represented by pectoralis major (or pectoral muscle). Especially in the case of mammograms acquired in the mediolateral oblique (MLO) view, the muscle is easily confusable with some elements of breast anatomy due to their morphological and photometric similarity. As a result, the problem of automatic detection and segmentation of pectoral muscle in MLO mammograms remains a challenging task, innovative approaches to which are still required and constantly searched for. To address this problem, the present paper introduces a two-step segmentation strategy based on a combined use of data-driven prediction (deep learning) and graph-based image processing. In particular, the proposed method employs a convolutional neural network (CNN) which is designed to predict the location of breast-pectoral boundary at different levels of spatial resolution. Subsequently, the predictions are used by the second stage of the algorithm, in which the desired boundary is recovered as a solution to the shortest path problem on a specially designed graph. The proposed algorithm has been tested on three different datasets (i.e., MIAS, CBIS-DDSm and InBreast) using a range of quantitative metrics. The results of comparative analysis show considerable improvement over state-of-the-art, while offering the possibility of model-free and fully automatic processing.
翻訳日:2022-10-23 17:30:45 公開日:2020-08-29
# 時間順・主観的識別による縦断的画像登録

Longitudinal Image Registration with Temporal-order and Subject-specificity Discrimination ( http://arxiv.org/abs/2008.13002v1 )

ライセンス: Link先を確認
Qianye Yang, Yunguan Fu, Francesco Giganti, Nooshin Ghavami, Qingchao Chen, J. Alison Noble, Tom Vercauteren, Dean Barratt, and Yipeng Hu(参考訳) 前立腺癌における縦型mr画像の形態学的解析は、能動的監視プログラムに置かれている疾患進行のモニタリングにおいて重要な役割を担っている。 本稿では,同一患者から取得した1対の画像間の関心領域の変化を2つの異なるタイミングで定量化する学習ベースの画像登録アルゴリズムについて述べる。 人口データに訓練された登録ネットワークは, 強度に基づく類似性と腺分節を弱監視として組み合わせることで, 患者データに対するターゲット登録誤差(TRE)を, 登録前のものと反復登録アルゴリズムによるものと比較して有意に低減した。 さらに,本研究は,複数の長手データサンプリング戦略を定量的に分析し,異なるサンプル画像ペア間の最大平均誤差に基づく新たな正規化手法を提案する。 86例の3D MR画像から, 平均TREは5.6mmであり, 異なるトレーニングデータサンプリング方法に統計的に有意差が認められた。

Morphological analysis of longitudinal MR images plays a key role in monitoring disease progression for prostate cancer patients, who are placed under an active surveillance program. In this paper, we describe a learning-based image registration algorithm to quantify changes on regions of interest between a pair of images from the same patient, acquired at two different time points. Combining intensity-based similarity and gland segmentation as weak supervision, the population-data-trained registration networks significantly lowered the target registration errors (TREs) on holdout patient data, compared with those before registration and those from an iterative registration algorithm. Furthermore, this work provides a quantitative analysis on several longitudinal-data-sampling strategies and, in turn, we propose a novel regularisation method based on maximum mean discrepancy, between differently-sampled training image pairs. Based on 216 3D MR images from 86 patients, we report a mean TRE of 5.6 mm and show statistically significant differences between the different training data sampling strategies.
翻訳日:2022-10-23 17:29:57 公開日:2020-08-29
# $\epsilon^*$+: エネルギー制約された自動運転車のオンライン被覆経路計画アルゴリズム

$\epsilon^*$+: An Online Coverage Path Planning Algorithm for Energy-constrained Autonomous Vehicles ( http://arxiv.org/abs/2008.13041v1 )

ライセンス: Link先を確認
Zongyuan Shen and James P. Wilson and Shalabh Gupta(参考訳) 本稿では,エネルギー制約型自律走行車を用いた未知環境のオンラインカバレッジパス計画のための新しいアルゴリズムである$\epsilon^*$+を提案する。 バッテリー容量が限られているため、省エネ車両の運転時間は限られている。 そのため、被覆軌道を実行している間に、バッテリーが切れる前に充電ステーションに戻る必要がある。 この点において、$\epsilon^*$+アルゴリズムにより、車両はカバープロセスを通して監視される残りのエネルギーに基づいて充電ステーションに戻ることができる。 後続の先進軌跡では、車両を未調査の経路に近づけてカバーを再開するが、後退軌跡の左前の地点に戻すのではなく、全体のカバー時間を短縮する。 提案されている$\epsilon^*$+ アルゴリズムは$\epsilon^*$ アルゴリズムの拡張であり、探索チューリングマシン (exploratory turing machine, etm) をスーパーバイザーとして使用し、完全なカバレッジのために車両を前後に移動させる。 $\epsilon^*$+ アルゴリズムの性能は、高忠実度ロボットシミュレータである player/stage を用いて複雑なシナリオで検証される。

This paper presents a novel algorithm, called $\epsilon^*$+, for online coverage path planning of unknown environments using energy-constrained autonomous vehicles. Due to limited battery size, the energy-constrained vehicles have limited duration of operation time. Therefore, while executing a coverage trajectory, the vehicle has to return to the charging station for a recharge before the battery runs out. In this regard, the $\epsilon^*$+ algorithm enables the vehicle to retreat back to the charging station based on the remaining energy which is monitored throughout the coverage process. This is followed by an advance trajectory that takes the vehicle to a near by unexplored waypoint to restart the coverage process, instead of taking it back to the previous left over point of the retreat trajectory; thus reducing the overall coverage time. The proposed $\epsilon^*$+ algorithm is an extension of the $\epsilon^*$ algorithm, which utilizes an Exploratory Turing Machine (ETM) as a supervisor to navigate the vehicle with back and forth trajectory for complete coverage. The performance of the $\epsilon^*$+ algorithm is validated on complex scenarios using Player/Stage which is a high-fidelity robotic simulator.
翻訳日:2022-10-23 17:29:39 公開日:2020-08-29
# t$^{\star}$-lite:マルチスピード自動運転車のための高速時間リスク最適運動計画アルゴリズム

T$^{\star}$-Lite: A Fast Time-Risk Optimal Motion Planning Algorithm for Multi-Speed Autonomous Vehicles ( http://arxiv.org/abs/2008.13048v1 )

ライセンス: Link先を確認
James P. Wilson and Zongyuan Shen and Shalabh Gupta and Thomas A. Wettergren(参考訳) 本稿では,可変速自動運転車の高速な時間リスク最適運動計画を可能にする,T$^{\star}$-Liteと呼ばれる新しいアルゴリズムを開発した。 T$^{\star}$-Liteアルゴリズムは、以前に開発されたT$^{\star}$アルゴリズムのかなり高速なバージョンである。 T$^{\star}$-Liteは、T$^{\star}$の新しい時間リスクコスト関数を使用するが、グリッドベースのアプローチの代わりに、漸近的に最適なサンプリングベースのモーションプランナーを使用する。 さらに,最近開発されたGMDM(Generalized Multi-speed Dubins Motion-model)を用いてキノダイナミックな動作計画を行う。 サンプルベースアプローチとGMDMにより,T$^{\star}$の計算負担を著しく低減し,合理的な解品質を提供する。 サンプルポイントは、2つの位置座標と車両の向きと速度からなる4次元構成空間から引き出される。 具体的には、T$^{\star}$-Liteにより、運動プランナーは障害物に近接して車両の速度と方向を選択し、より速く安全な経路を生成できる。 本稿では、RT$^{\star}$-Liteを運動プランナーを用いて開発するが、他の運動プランナーへの適応は簡単であり、プランナーのニーズに依存している。

In this paper, we develop a new algorithm, called T$^{\star}$-Lite, that enables fast time-risk optimal motion planning for variable-speed autonomous vehicles. The T$^{\star}$-Lite algorithm is a significantly faster version of the previously developed T$^{\star}$ algorithm. T$^{\star}$-Lite uses the novel time-risk cost function of T$^{\star}$; however, instead of a grid-based approach, it uses an asymptotically optimal sampling-based motion planner. Furthermore, it utilizes the recently developed Generalized Multi-speed Dubins Motion-model (GMDM) for sample-to-sample kinodynamic motion planning. The sample-based approach and GMDM significantly reduce the computational burden of T$^{\star}$ while providing reasonable solution quality. The sample points are drawn from a four-dimensional configuration space consisting of two position coordinates plus vehicle heading and speed. Specifically, T$^{\star}$-Lite enables the motion planner to select the vehicle speed and direction based on its proximity to the obstacle to generate faster and safer paths. In this paper, T$^{\star}$-Lite is developed using the RRT$^{\star}$ motion planner, but adaptation to other motion planners is straightforward and depends on the needs of the planner
翻訳日:2022-10-23 17:29:18 公開日:2020-08-29
# 予測モデルによるプロセスデータのサブタスク解析

Subtask Analysis of Process Data Through a Predictive Model ( http://arxiv.org/abs/2009.00717v1 )

ライセンス: Link先を確認
Zhi Wang, Xueying Tang, Jingchen Liu and Zhiliang Ying(参考訳) 人間とコンピュータの対話的な項目から収集された応答プロセスデータは、回答者の行動パターンや認知過程に関する豊富な情報を含んでいる。 その不規則な形式と大きなサイズは標準統計ツールの適用を困難にしている。 本稿では,そのようなプロセスデータの探索的解析を効率的に行う方法を提案する。 新しいアプローチでは、長い個々のプロセスを短いサブプロセスのシーケンスに分割し、複雑さの低減、クラスタリングの容易化、意味のある解釈を実現する。 各サブプロセスはサブタスクとみなされる。 セグメンテーションは、シャノンエントロピーと組み合わせた微妙な予測モデルを用いた逐次行動予測可能性に基づいている。 新しい手法の性能を評価するためにシミュレーション研究を行った。 PIAAC 2012のプロセスデータを用いて、新しいアプローチでプロセスデータの探索分析がどのように行えるかを示す。

Response process data collected from human-computer interactive items contain rich information about respondents' behavioral patterns and cognitive processes. Their irregular formats as well as their large sizes make standard statistical tools difficult to apply. This paper develops a computationally efficient method for exploratory analysis of such process data. The new approach segments a lengthy individual process into a sequence of short subprocesses to achieve complexity reduction, easy clustering and meaningful interpretation. Each subprocess is considered a subtask. The segmentation is based on sequential action predictability using a parsimonious predictive model combined with the Shannon entropy. Simulation studies are conducted to assess performance of the new methods. We use the process data from PIAAC 2012 to demonstrate how exploratory analysis of process data can be done with the new approach.
翻訳日:2022-10-23 17:29:00 公開日:2020-08-29
# プレイヤーのいないゲーム難易度とチャーン予測

Predicting Game Difficulty and Churn Without Players ( http://arxiv.org/abs/2008.12937v1 )

ライセンス: Link先を確認
Shaghayegh Roohi (1), Asko Relas (2), Jari Takatalo (2), Henri Heiskanen (2), Perttu H\"am\"al\"ainen (1) ((1) Aalto University, Espoo, Finland, (2) Rovio Entertainment, Espoo, Finland)(参考訳) 本研究では,人気のモバイルゲームであるangry birds dream blastのレベル毎のチャーンとパスレートを予測できる新しいシミュレーションモデルを提案する。 我々の主な貢献は、Deep Reinforcement Learning (DRL) を用いたAIゲームプレイと、プレイヤーの集団がレベルを超えてどのように進化するかのシミュレーションを組み合わせることである。 aiプレイヤーは、スキル、永続性、退屈さをシミュレートしたプレイヤー人口モデルを駆動するために使用されるレベル困難を予測する。 これにより、例えば、持続性や熟練の選手が高難易度に対していかに敏感であるか、そして、そのようなプレイヤーが早期にどのように混乱するかをモデル化できるため、プレイヤーの人口と難易度の関係はレベルごとに進化する。 本研究は,DRLゲームプレイによって生成されるプレイヤーの行動予測を,エージェントの再学習やシミュレーションされた各プレイヤーに対する新たなDRLゲームプレイデータ収集を必要とせず,極めて単純な個体差シミュレーションによって大幅に改善できることを実証する。

We propose a novel simulation model that is able to predict the per-level churn and pass rates of Angry Birds Dream Blast, a popular mobile free-to-play game. Our primary contribution is to combine AI gameplay using Deep Reinforcement Learning (DRL) with a simulation of how the player population evolves over the levels. The AI players predict level difficulty, which is used to drive a player population model with simulated skill, persistence, and boredom. This allows us to model, e.g., how less persistent and skilled players are more sensitive to high difficulty, and how such players churn early, which makes the player population and the relation between difficulty and churn evolve level by level. Our work demonstrates that player behavior predictions produced by DRL gameplay can be significantly improved by even a very simple population-level simulation of individual player differences, without requiring costly retraining of agents or collecting new DRL gameplay data for each simulated player.
翻訳日:2022-10-23 17:22:37 公開日:2020-08-29
# 敵対的特徴からコンパクトな視覚特徴へのゼロショット学習

Zero-Shot Learning from Adversarial Feature Residual to Compact Visual Feature ( http://arxiv.org/abs/2008.12962v1 )

ライセンス: Link先を確認
Bo Liu, Qiulei Dong, Zhanyi Hu(参考訳) 近年,組込み特徴空間における識別対象特徴の学習に焦点をあてたゼロショット学習(ZSL)手法が数多く行われているが,これらの手法によって学習される未確認クラスの特徴の分布は部分的に重なりがちであり,不正確な物体認識をもたらす。 この問題に対処するため,我々は,ZSLのコンパクトな意味的視覚特徴を合成する,新たな敵対的ネットワークを提案する。 残余生成器は、視覚特徴の合成のためのプロトタイプ予測器を介して予測される視覚プロトタイプと統合される視覚特徴残差を生成する。 識別器は、既存の分類cnnから抽出された実際の視覚特徴と合成視覚特徴を区別する。 生成した残差は, 試作機間距離よりも数値的にはるかに小さいため, 提案したネットワークで合成した未確認特徴の分布は重なりが小さい。 また,分類CNNの視覚的特徴が意味的特徴と一致していないことを考えると,よりコンパクトな視覚的特徴を抽出するための単純な特徴選択戦略が導入された。 6つのベンチマークデータセットの広範な実験結果から,本手法は既存の最先端手法よりも1.2~13.2%の精度で性能が向上することが分かった。

Recently, many zero-shot learning (ZSL) methods focused on learning discriminative object features in an embedding feature space, however, the distributions of the unseen-class features learned by these methods are prone to be partly overlapped, resulting in inaccurate object recognition. Addressing this problem, we propose a novel adversarial network to synthesize compact semantic visual features for ZSL, consisting of a residual generator, a prototype predictor, and a discriminator. The residual generator is to generate the visual feature residual, which is integrated with a visual prototype predicted via the prototype predictor for synthesizing the visual feature. The discriminator is to distinguish the synthetic visual features from the real ones extracted from an existing categorization CNN. Since the generated residuals are generally numerically much smaller than the distances among all the prototypes, the distributions of the unseen-class features synthesized by the proposed network are less overlapped. In addition, considering that the visual features from categorization CNNs are generally inconsistent with their semantic features, a simple feature selection strategy is introduced for extracting more compact semantic visual features. Extensive experimental results on six benchmark datasets demonstrate that our method could achieve a significantly better performance than existing state-of-the-art methods by 1.2-13.2% in most cases.
翻訳日:2022-10-23 17:21:45 公開日:2020-08-29
# グラフニューラルネットワークを用いた関係学習による腫瘍画像におけるリンパ節グロース腫瘍体積の検出

Lymph Node Gross Tumor Volume Detection in Oncology Imaging via Relationship Learning Using Graph Neural Network ( http://arxiv.org/abs/2008.13013v1 )

ライセンス: Link先を確認
Chun-Hung Chao, Zhuotun Zhu, Dazhou Guo, Ke Yan, Tsung-Ying Ho, Jinzheng Cai, Adam P. Harrison, Xianghua Ye, Jing Xiao, Alan Yuille, Min Sun, Le Lu, Dakai Jin(参考訳) GTV$_{LN}$の拡散を決定することは、多くのがんに対する外科的切除および放射線治療の下流ワークフローにおける各切除領域または照射領域を定義する上で不可欠である。 より一般的な拡大リンパ節 (LN) と異なり、GTV$_{LN}$は、高ポジトロン放射断層画像信号やCTの転移徴候に関連付けられている場合、より小さなリンパ節も含む。 これは厄介な仕事です。 本稿では,真のGTV$_{LN}$を検出するために,LN外見とLN間関係学習フレームワークを提案する。 これは、LNが結合リンパ系を形成するという以前の臨床知識によって動機付けられ、LN間のがん細胞の拡散は、しばしば特定の経路を辿る。 具体的には、まずROIプーリングを備えた3次元畳み込みニューラルネットワークを用いて、GTV$_{LN}$のインスタンスワイドな外観特徴を抽出する。 次に,グローバルLN-腫瘍空間先行が学習プロセスに含まれるLN間関係をさらにモデル化するグラフニューラルネットワークを提案する。 これにより、GTV$_{LN}$を分類することで、エンドツーエンドのトレーニング可能なネットワークが検出される。 予備的な第1段階法によって生成されるGTV$_{LN}$候補のセットでモデルを動作させ,高偽陽性(FP)(患者1人あたり15ドルFP)のコストで感度が85\%である。 胸部および腹部上部部を含む142対のPET/RTCTスキャンを用いた放射線治療データセットについて検討した。 提案法は, 患者1人当たり平均感度値が2, 3, 4, 6$ FPs, 5.5 %$, 13.1 %$で, 最先端(SOTA) LN 分類法を大幅に改善する。

Determining the spread of GTV$_{LN}$ is essential in defining the respective resection or irradiating regions for the downstream workflows of surgical resection and radiotherapy for many cancers. Different from the more common enlarged lymph node (LN), GTV$_{LN}$ also includes smaller ones if associated with high positron emission tomography signals and/or any metastasis signs in CT. This is a daunting task. In this work, we propose a unified LN appearance and inter-LN relationship learning framework to detect the true GTV$_{LN}$. This is motivated by the prior clinical knowledge that LNs form a connected lymphatic system, and the spread of cancer cells among LNs often follows certain pathways. Specifically, we first utilize a 3D convolutional neural network with ROI-pooling to extract the GTV$_{LN}$'s instance-wise appearance features. Next, we introduce a graph neural network to further model the inter-LN relationships where the global LN-tumor spatial priors are included in the learning process. This leads to an end-to-end trainable network to detect by classifying GTV$_{LN}$. We operate our model on a set of GTV$_{LN}$ candidates generated by a preliminary 1st-stage method, which has a sensitivity of $>85\%$ at the cost of high false positive (FP) ($>15$ FPs per patient). We validate our approach on a radiotherapy dataset with 142 paired PET/RTCT scans containing the chest and upper abdominal body parts. The proposed method significantly improves over the state-of-the-art (SOTA) LN classification method by $5.5\%$ and $13.1\%$ in F1 score and the averaged sensitivity value at $2, 3, 4, 6$ FPs per patient, respectively.
翻訳日:2022-10-23 17:20:41 公開日:2020-08-29
# 小売業業績の因果ベイズ型ニューラルネットワークにおける損失収束

Loss convergence in a causal Bayesian neural network of retail firm performance ( http://arxiv.org/abs/2008.13038v1 )

ライセンス: Link先を確認
F. Trevor Rogers(参考訳) 本稿では,本論文で公表されている構造方程式モデル(SEM)から,有向非巡回グラフを因果ベイズニューラルネットワークとして実装することにより,店舗購入・小売店運営・企業業績の配分計画 [1] から経験的結果を拡張する。 ニューラルネットワークの収束性は、フリップアウト層で重みを摂動することで変動推論が提供されるとき、最も弱いSEM経路を持つノードの除去により改善され、バダムオプティマイザで出力された重みを摂動した結果は不確定である。

We extend the empirical results from the structural equation model (SEM) published in the paper Assortment Planning for Retail Buying, Retail Store Operations, and Firm Performance [1] by implementing the directed acyclic graph as a causal Bayesian neural network. Neural network convergence is shown to improve with the removal of the node with the weakest SEM path when variational inference is provided by perturbing weights with Flipout layers, while results from perturbing weights at the output with the Vadam optimizer are inconclusive.
翻訳日:2022-10-23 17:03:35 公開日:2020-08-29
# 離散データに対する効率的なロバスト性証明:グラフ、画像等に対する空間的ランダム化平滑化

Efficient Robustness Certificates for Discrete Data: Sparsity-Aware Randomized Smoothing for Graphs, Images and More ( http://arxiv.org/abs/2008.12952v1 )

ライセンス: Link先を確認
Aleksandar Bojchevski, Johannes Klicpera, Stephan G\"unnemann(参考訳) 離散データに対するモデルの堅牢性を証明する既存の技術は、少数のモデルに対してのみ機能するか、効率性や厳密性を犠牲にして一般的なものである。 また,本研究が示すように,非自明な保証を得るためには,入力の疎度を考慮しないことが多い。 本稿では,初期作業を想定したランダム化平滑化フレームワークに基づくモデル非依存の証明書を提案する。 その計算の複雑さは、離散的なカテゴリの数や入力の次元(グラフのサイズなど)には依存せず、高度にスケーラブルである。 さまざまなモデル、データセット、タスクにおいて、このアプローチの有効性を示し、特にグラフニューラルネットワークの利用を強調する。 これまでのところ、グラフデータの離散性や非単位性のため、GNNの証明可能な保証を得ることは困難である。 我々の手法は任意のGNNを認証し、グラフ構造とノード属性の両方に対する摂動を処理できる。

Existing techniques for certifying the robustness of models for discrete data either work only for a small class of models or are general at the expense of efficiency or tightness. Moreover, they do not account for sparsity in the input which, as our findings show, is often essential for obtaining non-trivial guarantees. We propose a model-agnostic certificate based on the randomized smoothing framework which subsumes earlier work and is tight, efficient, and sparsity-aware. Its computational complexity does not depend on the number of discrete categories or the dimension of the input (e.g. the graph size), making it highly scalable. We show the effectiveness of our approach on a wide variety of models, datasets, and tasks -- specifically highlighting its use for Graph Neural Networks. So far, obtaining provable guarantees for GNNs has been difficult due to the discrete and non-i.i.d. nature of graph data. Our method can certify any GNN and handles perturbations to both the graph structure and the node attributes.
翻訳日:2022-10-23 17:02:51 公開日:2020-08-29
# ジェネレーティブ・ディバイサル・ネットワークを用いた教師なしMRI再構成

Unsupervised MRI Reconstruction with Generative Adversarial Networks ( http://arxiv.org/abs/2008.13065v1 )

ライセンス: Link先を確認
Elizabeth K. Cole, John M. Pauly, Shreyas S. Vasanawala, Frank Ong(参考訳) 深層学習に基づく画像再構成法は複数のMRIアプリケーションで有望な結果を得た。 しかし、ほとんどの手法は教師あり訓練のために大規模な完全サンプリングされた真実データを必要とする。 完全サンプリングデータを取得することは、特にダイナミックコントラスト増強(DCE)、3D心筋シン、および4Dフローにおいて困難または不可能であることが多い。 生成的対向ネットワークを用いた完全サンプリングデータのないMRI再構成のためのディープラーニングフレームワークを提案する。 提案手法を2つのシナリオで検証し, 高速スピンエコー膝試験と前向きアンサンプド腹部DCEの2つのシナリオについて検討した。 従来の方法に比べて解剖学的構造が回復する。

Deep learning-based image reconstruction methods have achieved promising results across multiple MRI applications. However, most approaches require large-scale fully-sampled ground truth data for supervised training. Acquiring fully-sampled data is often either difficult or impossible, particularly for dynamic contrast enhancement (DCE), 3D cardiac cine, and 4D flow. We present a deep learning framework for MRI reconstruction without any fully-sampled data using generative adversarial networks. We test the proposed method in two scenarios: retrospectively undersampled fast spin echo knee exams and prospectively undersampled abdominal DCE. The method recovers more anatomical structure compared to conventional methods.
翻訳日:2022-10-23 17:02:05 公開日:2020-08-29
# k-Community Gaussian Mixture Modelにおけるコミュニティ検出の厳密な回復

Exact Recovery of Community Detection in k-Community Gaussian Mixture Model ( http://arxiv.org/abs/2009.01185v1 )

ライセンス: Link先を確認
Zhongyang Li(参考訳) 本研究では,ガウス混合モデルを用いて,頂点を$k\geq 2$の異なるコミュニティに分割したコミュニティ検出問題について検討する。 我々のモデルにおける大きな違いは、ガウス摂動の強度が観測行列の異なるエントリに対して異なることである。 我々は,最大確率推定の正確な回復のためのしきい値を求める。 アプリケーションにはハイパーグラフのコミュニティ検出が含まれる。

We study the community detection problem on a Gaussian mixture model, in which vertices are divided into $k\geq 2$ distinct communities. The major difference in our model is that the intensities for Gaussian perturbations are different for different entries in the observation matrix, and we do not assume that every community has the same number of vertices. We explicitly find the threshold for the exact recovery of the maximum likelihood estimation. Applications include the community detection on hypergraphs.
翻訳日:2022-10-23 17:01:27 公開日:2020-08-29
# ゴーストを通り抜ける:偽陽性による行動のクローニング

Driving Through Ghosts: Behavioral Cloning with False Positives ( http://arxiv.org/abs/2008.12969v1 )

ライセンス: Link先を確認
Andreas B\"uhler, Adrien Gaidon, Andrei Cramariuc, Rares Ambrus, Guy Rosman, Wolfram Burgard(参考訳) 安全な自動運転には、他の交通参加者の堅牢な検出が必要である。 しかし、ロバストとは完全という意味ではなく、安全システムは一般的に誤検出を低く抑え、高い偽陽性率を犠牲にしている。 これにより、想像上の障害を避けるなどの保守的かつ潜在的に危険な行動が生じる。 行動のクローニングの文脈では、訓練時の知覚的誤りは、専門家のデモンストレーションが知覚された世界状態と矛盾する可能性があるため、学習困難や誤った政策につながる可能性がある。 本研究では,不完全な認識を保存することなく安全に活用できる行動クローニング手法を提案する。 私たちのコアコントリビューションは、計画を学ぶための知覚の不確実性の新たな表現です。 物体知覚システムのノイズ出力を符号化する新しい確率的鳥眼視意味グリッドを提案する。 そして、専門家によるデモンストレーションを利用して、この確率的表現を用いて模擬駆動ポリシーを学ぶ。 CARLAシミュレーターを用いて、我々のアプローチは破滅的な失敗や保守的な行動につながる重大な偽陽性を安全に克服できることを示す。

Safe autonomous driving requires robust detection of other traffic participants. However, robust does not mean perfect, and safe systems typically minimize missed detections at the expense of a higher false positive rate. This results in conservative and yet potentially dangerous behavior such as avoiding imaginary obstacles. In the context of behavioral cloning, perceptual errors at training time can lead to learning difficulties or wrong policies, as expert demonstrations might be inconsistent with the perceived world state. In this work, we propose a behavioral cloning approach that can safely leverage imperfect perception without being conservative. Our core contribution is a novel representation of perceptual uncertainty for learning to plan. We propose a new probabilistic birds-eye-view semantic grid to encode the noisy output of object perception systems. We then leverage expert demonstrations to learn an imitative driving policy using this probabilistic representation. Using the CARLA simulator, we show that our approach can safely overcome critical false positives that would otherwise lead to catastrophic failures or conservative behavior.
翻訳日:2022-10-23 17:01:04 公開日:2020-08-29
# 高レベル分類のためのアントコロニー最適化に基づく複雑ネットワークの新機能

New feature for Complex Network based on Ant Colony Optimization for High Level Classification ( http://arxiv.org/abs/2008.12884v1 )

ライセンス: Link先を確認
Josimar E. Chire-Saire(参考訳) 低レベルの分類は、要素から特徴を抽出する。すなわち、後で分類するモデルのトレーニングに物理的に使用する。 高レベル分類は、高レベル特徴、存在パターン、データ間の関係を使い、分類のために低レベル特徴と高レベル特徴を組み合わせる。 データ上に作成された複雑ネットワークから高レベル機能を得ることができる。 局所的およびグローバルな特徴は、複雑ネットワーク、すなわち平均的隣接度、平均的クラスタリングの構造を記述するために使用される。 本稿では,Ant Colony Systemアプローチに従ってネットワークのアーキテクチャを記述するための新機能を提案する。 実験は、異なるクラスのデータに対する感受性から、この機能を使用する利点を示している。

Low level classification extracts features from the elements, i.e. physical to use them to train a model for a later classification. High level classification uses high level features, the existent patterns, relationship between the data and combines low and high level features for classification. High Level features can be got from Complex Network created over the data. Local and global features are used to describe the structure of a Complex Network, i.e. Average Neighbor Degree, Average Clustering. The present work proposed a novel feature to describe the architecture of the Network following a Ant Colony System approach. The experiments shows the advantage of using this feature because the sensibility with data of different classes.
翻訳日:2022-10-23 16:55:06 公開日:2020-08-29
# フィードバック変調TD-STDPによる強化学習

Reinforcement Learning with Feedback-modulated TD-STDP ( http://arxiv.org/abs/2008.13044v1 )

ライセンス: Link先を確認
Stephen Chung, Robert Kozma(参考訳) スパイキングニューロンネットワークは、スパイク刺激依存的可塑性(STDP)に基づく学習規則を適用した、単純な強化学習タスクの解決に成功している。 しかし、これらのモデルのほとんどは、選択されたアクションが連続的なニューロンの発射速度の決定論的関数であると仮定するため、離散的なアクションセットを持つ強化学習タスクには適用できない。 本稿では,フィードバック変調を含むスパイクニューロンネットワークのためのSTDPに基づく新しい学習ルールを提案する。 本稿では,STDPに基づく学習ルールを用いて,CartPoleタスクやLunarLanderタスクに適用した場合に,標準強化学習アルゴリズムと同様の速度で離散的な動作をセットした強化学習タスクを解くことができることを示す。 さらに,学習規則からフィードバック変調を省略した場合,エージェントはこれらの課題を解決できないことを示す。 フィードバック変調は、実行されたアクションとtdエラーに寄与するユニットのみが学習に参加する場合に、より良いクレジット割り当てを可能にすると結論づける。

Spiking neuron networks have been used successfully to solve simple reinforcement learning tasks with continuous action set applying learning rules based on spike-timing-dependent plasticity (STDP). However, most of these models cannot be applied to reinforcement learning tasks with discrete action set since they assume that the selected action is a deterministic function of firing rate of neurons, which is continuous. In this paper, we propose a new STDP-based learning rule for spiking neuron networks which contains feedback modulation. We show that the STDP-based learning rule can be used to solve reinforcement learning tasks with discrete action set at a speed similar to standard reinforcement learning algorithms when applied to the CartPole and LunarLander tasks. Moreover, we demonstrate that the agent is unable to solve these tasks if feedback modulation is omitted from the learning rule. We conclude that feedback modulation allows better credit assignment when only the units contributing to the executed action and TD error participate in learning.
翻訳日:2022-10-23 16:54:36 公開日:2020-08-29
# 画像復元問題に対する自己組織型オペレーショナルニューラルネットワーク

Self-Organized Operational Neural Networks for Severe Image Restoration Problems ( http://arxiv.org/abs/2008.12894v1 )

ライセンス: Link先を確認
Junaid Malik, Serkan Kiranyaz, Moncef Gabbouj(参考訳) 畳み込みニューラルネットワーク(cnns)に基づく判別学習は、雑音-クリーン画像ペアのトレーニング例から学習することで画像復元を行うことを目的としている。 画像復元のためのgo-to方法論となり、従来の非ローカルメソッドよりも優れています。 しかし、トップパフォーマンスネットワークは一般に多数の畳み込み層と数百のニューロンで構成され、数百万以上のトレーニング可能なパラメータを持つ。 これは畳み込みに基づく変換の本質的な線形性によるものであり、深刻な復元問題に対処するには不十分である。 近年、オペレーショナルニューラルネットワーク(ONN)と呼ばれるCNNの非線形一般化が、AWGNデノーミングにおいてCNNより優れていることが示されている。 しかし、その定式化は、よく知られた非線形作用素の固定集合と、与えられたアーキテクチャの最良の構成を見つけるために徹底的な探索によって負担され、その効果は、固定出力層演算子の割り当てによってさらに制限される。 本研究では,テイラー級数に基づく関数近似を用いて,学習過程の一部として新規な結節変換を合成し,演算子探索のための冗長なトレーニング実行を不要とする,画像復元のための自己組織型ONN,Self-ONNを提案する。 さらに、受容野と重みの個々の接続を多様化させることにより、より細かい演算子の不均質性を実現する。 我々は3つの重篤な画像復元作業に対して広範囲にわたるアブレーション実験を行った。 学習可能なパラメータの厳密な等価性を課しても、Self-ONNはすべての問題においてCNNをかなり上回り、PSNRの観点からは最大3dBまで一般化性能を向上させる。

Discriminative learning based on convolutional neural networks (CNNs) aims to perform image restoration by learning from training examples of noisy-clean image pairs. It has become the go-to methodology for tackling image restoration and has outperformed the traditional non-local class of methods. However, the top-performing networks are generally composed of many convolutional layers and hundreds of neurons, with trainable parameters in excess of several millions. We claim that this is due to the inherent linear nature of convolution-based transformation, which is inadequate for handling severe restoration problems. Recently, a non-linear generalization of CNNs, called the operational neural networks (ONN), has been shown to outperform CNN on AWGN denoising. However, its formulation is burdened by a fixed collection of well-known nonlinear operators and an exhaustive search to find the best possible configuration for a given architecture, whose efficacy is further limited by a fixed output layer operator assignment. In this study, we leverage the Taylor series-based function approximation to propose a self-organizing variant of ONNs, Self-ONNs, for image restoration, which synthesizes novel nodal transformations onthe-fly as part of the learning process, thus eliminating the need for redundant training runs for operator search. In addition, it enables a finer level of operator heterogeneity by diversifying individual connections of the receptive fields and weights. We perform a series of extensive ablation experiments across three severe image restoration tasks. Even when a strict equivalence of learnable parameters is imposed, Self-ONNs surpass CNNs by a considerable margin across all problems, improving the generalization performance by up to 3 dB in terms of PSNR.
翻訳日:2022-10-23 16:54:20 公開日:2020-08-29
# 意味的画像合成のためのデュアルアテンションGAN

Dual Attention GANs for Semantic Image Synthesis ( http://arxiv.org/abs/2008.13024v1 )

ライセンス: Link先を確認
Hao Tang, Song Bai, Nicu Sebe(参考訳) 本稿では,セマンティックなラベルマップをフォトリアリスティックな画像に転送することを目的としたセマンティックな画像合成タスクに焦点をあてる。 既存の手法は意味情報を保存するための効果的な意味制約を欠き、空間次元とチャネル次元の両方の構造的相関を無視する。 これらの制約に対処するために,入力レイアウトから精細な細部まで,フォトリアリスティックで意味的に一貫性のある画像を合成する新しいdual attention gan (dagan)を提案する。 また,空間的次元における意味的構造的注意を捉えるための2つの新しいモジュール,すなわち位置的空間的注意モジュール(sam)とスケール的チャネル注意モジュール(cam)を提案する。 具体的には、SAMは、空間的注意マップによって各位置の画素を選択的に相関させ、空間的距離に関係なく、同じ意味ラベルを持つ画素を相互に関連付ける。 一方camは、各チャンネルのスケールワイズ機能をチャンネルアテンションマップによって選択的に強調する。 SAMとCAMの出力を最後にまとめて、機能表現をさらに改善します。 4つの挑戦的なデータセットに関する広範囲な実験により、daganは最先端のメソッドよりも驚くほど優れた結果が得られるが、モデルパラメータは少ない。 ソースコードとトレーニングされたモデルはhttps://github.com/Ha0Tang/DAGAN.comで入手できる。

In this paper, we focus on the semantic image synthesis task that aims at transferring semantic label maps to photo-realistic images. Existing methods lack effective semantic constraints to preserve the semantic information and ignore the structural correlations in both spatial and channel dimensions, leading to unsatisfactory blurry and artifact-prone results. To address these limitations, we propose a novel Dual Attention GAN (DAGAN) to synthesize photo-realistic and semantically-consistent images with fine details from the input layouts without imposing extra training overhead or modifying the network architectures of existing methods. We also propose two novel modules, i.e., position-wise Spatial Attention Module (SAM) and scale-wise Channel Attention Module (CAM), to capture semantic structure attention in spatial and channel dimensions, respectively. Specifically, SAM selectively correlates the pixels at each position by a spatial attention map, leading to pixels with the same semantic label being related to each other regardless of their spatial distances. Meanwhile, CAM selectively emphasizes the scale-wise features at each channel by a channel attention map, which integrates associated features among all channel maps regardless of their scales. We finally sum the outputs of SAM and CAM to further improve feature representation. Extensive experiments on four challenging datasets show that DAGAN achieves remarkably better results than state-of-the-art methods, while using fewer model parameters. The source code and trained models are available at https://github.com/Ha0Tang/DAGAN.
翻訳日:2022-10-23 16:53:50 公開日:2020-08-29
# 最適輸送駆動サイクルGANを用いた加速MRIのための未経験深度学習

Unpaired Deep Learning for Accelerated MRI using Optimal Transport Driven CycleGAN ( http://arxiv.org/abs/2008.12967v1 )

ライセンス: Link先を確認
Gyutaek Oh, Byeongsu Sim, Hyungjin Chung, Leonard Sunwoo, and Jong Chul Ye(参考訳) 近年,実行時複雑性が著しく低下しているにもかかわらず,高性能な再構成により,MRIの高速化のためのディープラーニング手法が広く研究されている。 これらのニューラルネットワークは通常、教師付き方法で訓練されるため、マッチしたサブサンプルと完全にサンプリングされたk空間のデータが必要である。 残念ながら、完全にサンプリングされたk空間データの取得には長い走査時間が必要であり、しばしば取得プロトコルの変更につながるため、一致した完全なk空間データの取得は困難である。 したがって、ラベルデータにマッチしない非ペア型ディープラーニングは、非常に重要な研究テーマとなっている。 本稿では,1組のジェネレータと識別器を用いた最適輸送駆動サイクル一貫性生成対向ネットワーク(OT-cycleGAN)を用いた未ペア深層学習手法を提案する。 提案するOT-cycleGANアーキテクチャは, 特別に設計された最小二乗法を用いて, 最適輸送定式化の双対な定式化から厳密に導かれる。 提案手法は,単一コイルと複数コイルからの加速k空間データから,一致した参照データを必要としない高分解能mr画像を再構成できることを示す。

Recently, deep learning approaches for accelerated MRI have been extensively studied thanks to their high performance reconstruction in spite of significantly reduced runtime complexity. These neural networks are usually trained in a supervised manner, so matched pairs of subsampled and fully sampled k-space data are required. Unfortunately, it is often difficult to acquire matched fully sampled k-space data, since the acquisition of fully sampled k-space data requires long scan time and often leads to the change of the acquisition protocol. Therefore, unpaired deep learning without matched label data has become a very important research topic. In this paper, we propose an unpaired deep learning approach using a optimal transport driven cycle-consistent generative adversarial network (OT-cycleGAN) that employs a single pair of generator and discriminator. The proposed OT-cycleGAN architecture is rigorously derived from a dual formulation of the optimal transport formulation using a specially designed penalized least squares cost. The experimental results show that our method can reconstruct high resolution MR images from accelerated k- space data from both single and multiple coil acquisition, without requiring matched reference data.
翻訳日:2022-10-23 16:53:23 公開日:2020-08-29
# 表現型統計的学習のためのスケーラブルガウス過程の制御

Modulating Scalable Gaussian Processes for Expressive Statistical Learning ( http://arxiv.org/abs/2008.12922v1 )

ライセンス: Link先を確認
Haitao Liu, Yew-Soon Ong, Xiaomo Jiang, Xiaofang Wang(参考訳) 学習タスクにおいて、ガウス過程(GP)は、予測平均だけでなく、関連する変数も提供するので、入力と出力の間の統計的関係の学習に関心がある。 しかし、バニラGPは、ガウス境界と立方体複雑さによる大量のデータからヘテロスセダスティックノイズ、多重モダリティ、非定常性といった性質を持つ複雑な分布を学ぶのに苦労している。 本稿では,非定常ヘテロセダスティックGP,GPと潜在GPの混合を含むスケーラブルなGPパラダイムについて検討し,よりリッチでガウス的でない統計表現を学習するために,出力や入力を変調する潜在変数を追加する。 さらに,解析的あるいはより厳密なエビデンス(elbos)の限界を低くし,効率的かつ効果的なモデルトレーニングを行うために,異なる変分推論戦略を用いる。 様々なタスクにおける最先端GPとニューラルネットワーク(NN)に対する大規模な数値実験により、これらのスケーラブルな変調GP、特にスケーラブルな潜在GPの優位性を検証し、多様なデータ分布を学習する。

For a learning task, Gaussian process (GP) is interested in learning the statistical relationship between inputs and outputs, since it offers not only the prediction mean but also the associated variability. The vanilla GP however struggles to learn complicated distribution with the property of, e.g., heteroscedastic noise, multi-modality and non-stationarity, from massive data due to the Gaussian marginal and the cubic complexity. To this end, this article studies new scalable GP paradigms including the non-stationary heteroscedastic GP, the mixture of GPs and the latent GP, which introduce additional latent variables to modulate the outputs or inputs in order to learn richer, non-Gaussian statistical representation. We further resort to different variational inference strategies to arrive at analytical or tighter evidence lower bounds (ELBOs) of the marginal likelihood for efficient and effective model training. Extensive numerical experiments against state-of-the-art GP and neural network (NN) counterparts on various tasks verify the superiority of these scalable modulated GPs, especially the scalable latent GP, for learning diverse data distributions.
翻訳日:2022-10-23 16:52:46 公開日:2020-08-29
# GRAFFL:ベイズ生成モデルのグラディエントフリーフェデレーション学習

GRAFFL: Gradient-free Federated Learning of a Bayesian Generative Model ( http://arxiv.org/abs/2008.12925v1 )

ライセンス: Link先を確認
Seok-Ju Hahn, Junghye Lee(参考訳) 連合学習プラットフォームの人気が高まっている。 アルゴリズムの学習はデータの収集や共有をせずに実現できるため、プライバシのリスクを軽減することが大きなメリットのひとつだ。 フェデレーション学習(確率的勾配アルゴリズムに基づくものが多い)には大きな期待が持たれているが、特に勾配更新と交換のプロセスにおいて、プライバシを保護する上での課題は数多く残っている。 本稿では,近似ベイズ計算に基づくベイズ生成モデルを学ぶためのgrafflと呼ばれる最初の勾配なし連立学習フレームワークを提案する。 グラデーションに基づく従来のフェデレーション学習アルゴリズムとは異なり、我々のフレームワークはプライバシを保護するためにモデル(リニアコンポーネント)や摂動データ(あるいはアグリゲーションのためのデータの暗号化)を分解する必要がない。 代わりに、このフレームワークは各参加者機関から派生した暗黙の情報を使用して、パラメータの後方分布を学習する。 暗黙的情報は,本研究で開発されたニューラルネットワークであるsuffiaeから派生した要約統計であり,機密情報を漏洩から保護するため,圧縮および線形分離可能な表現を生成する。 十分な次元削減技術として、この手法が十分な要約統計を提供することが証明された。 本稿では,GRAFFLに基づくベイジアン・ガウス混合モデルを提案する。 複数のデータセットを用いて,プライバシ保護と予測性能(理想的な設定に近い)の観点から,モデルの有効性と有用性を実証した。 準グローバルモデルとして訓練されたモデルは、他の機関の情報を含む情報的サンプルを生成し、各機関のデータ分析を強化することができる。

Federated learning platforms are gaining popularity. One of the major benefits is to mitigate the privacy risks as the learning of algorithms can be achieved without collecting or sharing data. While federated learning (i.e., many based on stochastic gradient algorithms) has shown great promise, there are still many challenging problems in protecting privacy, especially during the process of gradients update and exchange. This paper presents the first gradient-free federated learning framework called GRAFFL for learning a Bayesian generative model based on approximate Bayesian computation. Unlike conventional federated learning algorithms based on gradients, our framework does not require to disassemble a model (i.e., to linear components) or to perturb data (or encryption of data for aggregation) to preserve privacy. Instead, this framework uses implicit information derived from each participating institution to learn posterior distributions of parameters. The implicit information is summary statistics derived from SuffiAE that is a neural network developed in this study to create compressed and linearly separable representations thereby protecting sensitive information from leakage. As a sufficient dimensionality reduction technique, this is proved to provide sufficient summary statistics. We propose the GRAFFL-based Bayesian Gaussian mixture model to serve as a proof-of-concept of the framework. Using several datasets, we demonstrated the feasibility and usefulness of our model in terms of privacy protection and prediction performance (i.e., close to an ideal setting). The trained model as a quasi-global model can generate informative samples involving information from other institutions and enhances data analysis of each institution.
翻訳日:2022-10-23 16:52:27 公開日:2020-08-29
# スマート製造プロセスのためのAIに基づくモデリングとデータ駆動評価

AI-based Modeling and Data-driven Evaluation for Smart Manufacturing Processes ( http://arxiv.org/abs/2008.12987v1 )

ライセンス: Link先を確認
Mohammadhossein Ghahramani, Yan Qiao, MengChu Zhou, Adrian OHagan, and James Sweeney(参考訳) スマートマニュファクチャリング(smart manufacturing)とは、高度な分析手法を駆使して製品運用に実装される最適化技術を指す。 産業用IoT(Industrial Internet of Things, IIoT)センサーが製造プロセスに広く導入されるにつれて、データ管理に対する最適かつ効果的なアプローチが徐々に求められている。 機械学習と人工知能を製造業データを活用することは、効率的でインテリジェントな自動化につながる。 本稿では,半導体製造をスマートにするための進化的コンピューティングとディープラーニングアルゴリズムに基づく包括的分析を行う。 半導体製造プロセスに関する有用な知見を得るための動的アルゴリズムを提案し,様々な課題に対処する。 本稿では,遺伝的アルゴリズムとニューラルネットワークを用いて,インテリジェントな特徴選択アルゴリズムを提案する。 我々の目標は、製造プロセスを制御するための高度なソリューションを提供し、製造業者が効果的な予測技術にアクセスできるようにする様々な次元の視点を得ることである。

Smart Manufacturing refers to optimization techniques that are implemented in production operations by utilizing advanced analytics approaches. With the widespread increase in deploying Industrial Internet of Things (IIoT) sensors in manufacturing processes, there is a progressive need for optimal and effective approaches to data management. Embracing Machine Learning and Artificial Intelligence to take advantage of manufacturing data can lead to efficient and intelligent automation. In this paper, we conduct a comprehensive analysis based on Evolutionary Computing and Deep Learning algorithms toward making semiconductor manufacturing smart. We propose a dynamic algorithm for gaining useful insights about semiconductor manufacturing processes and to address various challenges. We elaborate on the utilization of a Genetic Algorithm and Neural Network to propose an intelligent feature selection algorithm. Our objective is to provide an advanced solution for controlling manufacturing processes and to gain perspective on various dimensions that enable manufacturers to access effective predictive technologies.
翻訳日:2022-10-23 16:52:00 公開日:2020-08-29