このサイトではarxivの論文のうち、30ページ以下でCreative Commonsライセンス(CC 0, CC BY, CC BY-SA)の論文を日本語訳しています。 本文がCCでない論文、長すぎる論文はメタデータのみを翻訳しています。(arxivのメタデータは CC 0です。) 翻訳文のライセンスはCC BY-SA 4.0です。 翻訳にはFugu-Machine Translatorを利用しています。

本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。

公開日が20200116となっている論文です。

PDF登録状況(公開日: 20200116)

TitleAuthorsAbstract論文公表日・翻訳日
# 線を越えて読む:スキムと集中的な読解モデルによる含意的なテキスト意味の理解

Read Beyond the Lines: Understanding the Implied Textual Meaning via a Skim and Intensive Reading Model ( http://arxiv.org/abs/2001.00572v2 )

ライセンス: Link先を確認
Guoxiu He, Zhe Gao, Zhuoren Jiang, Yangyang Kang, Changlong Sun, Xiaozhong Liu, Wei Lu(参考訳) テキストの非リテラル解釈は、文脈感度が高く、図形言語を多用しているため、機械モデルでは理解できない。 本研究では,人間の読みの理解に触発されて,暗黙の文章の意味を理解するための,Skim and Intensive Reading Model (SIRM)と呼ばれる,新しい,シンプルで効果的な深層ニューラルネットワークを提案する。 提案したSIRMは,2つの主成分,すなわちスキム読解成分と集中読影成分からなる。 n-gramの特徴は、sim(entire)情報として複数の畳み込みニューラルネットワークの組み合わせであるskim readingコンポーネントから素早く抽出される。 集中的な読み出しコンポーネントは、現在の埋め込みとコンテキスト情報を密接な接続でカプセル化するローカル(連続)表現とグローバル(パラグラフ)表現の両方の階層的調査を可能にする。 より具体的には、コンテキスト情報は、隣接する情報と上記のスキム情報を含む。 最後に,通常の学習損失関数に加えて,スキム読解成分に対するペナルティとして対向損失関数を用いて,訓練データ中の特殊表現語から発生するノイズを除去する。 提案アーキテクチャの有効性,堅牢性,効率性を検証するため,いくつかのサルカズムベンチマークと,メタファー付き産業用スパムデータセットについて広範な比較実験を行った。 実験結果から,(1)図形言語の文脈モデリングと考察の恩恵を生かした提案モデルは,パラメータスケールとトレーニング速度に匹敵する,既存の最先端ソリューションよりも優れ,(2)SIRMはパラメータサイズ感度の点で優れたロバスト性を実現し,(3)SIRMのアブレーションや付加変量と比較すると,最終フレームワークは十分効率的であることがわかった。

The nonliteral interpretation of a text is hard to be understood by machine models due to its high context-sensitivity and heavy usage of figurative language. In this study, inspired by human reading comprehension, we propose a novel, simple, and effective deep neural framework, called Skim and Intensive Reading Model (SIRM), for figuring out implied textual meaning. The proposed SIRM consists of two main components, namely the skim reading component and intensive reading component. N-gram features are quickly extracted from the skim reading component, which is a combination of several convolutional neural networks, as skim (entire) information. An intensive reading component enables a hierarchical investigation for both local (sentence) and global (paragraph) representation, which encapsulates the current embedding and the contextual information with a dense connection. More specifically, the contextual information includes the near-neighbor information and the skim information mentioned above. Finally, besides the normal training loss function, we employ an adversarial loss function as a penalty over the skim reading component to eliminate noisy information arisen from special figurative words in the training data. To verify the effectiveness, robustness, and efficiency of the proposed architecture, we conduct extensive comparative experiments on several sarcasm benchmarks and an industrial spam dataset with metaphors. Experimental results indicate that (1) the proposed model, which benefits from context modeling and consideration of figurative language, outperforms existing state-of-the-art solutions, with comparable parameter scale and training speed; (2) the SIRM yields superior robustness in terms of parameter size sensitivity; (3) compared with ablation and addition variants of the SIRM, the final framework is efficient enough.
翻訳日:2023-01-14 17:28:56 公開日:2020-01-16
# 生体内熱原性反応のリアルタイムナノダイアモンド温度測定

Real-time nanodiamond thermometry probing in-vivo thermogenic responses ( http://arxiv.org/abs/2001.02844v2 )

ライセンス: Link先を確認
Masazumi Fujiwara, Simo Sun, Alexander Dohms, Yushi Nishimura, Ken Suto, Yuka Takezawa, Keisuke Oshimi, Li Zhao, Nikola Sadzak, Yumi Umehara, Yoshio Teki, Naoki Komatsu, Oliver Benson, Yutaka Shikano, Eriko Kage-Nakadai(参考訳) 生体内におけるリアルタイム温度モニタリングは、恒常的な温度調節やエネルギー代謝などの生物活性を直接測定する。 しかし, 生体適合温度計をサブマイクロメートルに縮小することは, 単一セル解像度のサブユニット構造の熱イメージングへの応用の可能性にもかかわらず難しい。 光学信号を介して温度をリモートで感知する発光ナノ温度計は、そのような高空間分解能温度測定においてかなりのポテンシャルを示す。 ここでは、ナノダイアモンド(NDs)における光学的にアクセス可能な電子スピンに基づく量子ナノサーモメータを用いて、 \textit{Caenorhabditis elegans} (\textit{C})内のリアルタイム温度モニタリングを実証する。 elegans (複数形 elegans) そこで我々は,実生の成虫体内の可動ndsの温度を0.22^{\circ}{\rm c}$で測定する温度計測システムを開発した。 このシステムを用いて,ミトコンドリアアンコプラーの化学刺激におけるワームの熱原性反応に基づいて温度の上昇を判定した。 本手法は,生体内における温度情報のマイクロメートル以下の局在と薬理学的熱産生の直接的同定を示す。 その結果, 生体内における細胞内温度変化を探索する手法の開発が促進され, エネルギー支出に基づく生物活性の定量化が可能となった。

Real-time temperature monitoring inside living organisms provides a direct measure of their biological activities, such as homeostatic thermoregulation and energy metabolism. However, it is challenging to reduce the size of bio-compatible thermometers down to submicrometers despite their potential applications for the thermal imaging of subtissue structures with single-cell resolution. Light-emitting nanothermometers that remotely sense temperature via optical signals exhibit considerable potential in such \textit{in-vivo} high-spatial-resolution thermometry. Here, using quantum nanothermometers based on optically accessible electron spins in nanodiamonds (NDs), we demonstrate \textit{in-vivo} real-time temperature monitoring inside \textit{Caenorhabditis elegans} (\textit{C. elegans}) worms. We developed a thermometry system that can measure the temperatures of movable NDs inside live adult worms with a precision of $\pm 0.22^{\circ}{\rm C}$. Using this system, we determined the increase in temperature based on the thermogenic responses of the worms during the chemical stimuli of mitochondrial uncouplers. Our technique demonstrates sub-micrometer localization of real-time temperature information in living animals and direct identification of their pharmacological thermogenesis. The results obtained facilitate the development of a method to probe subcellular temperature variation inside living organisms and may allow for quantification of their biological activities based on their energy expenditures.
翻訳日:2023-01-13 05:43:15 公開日:2020-01-16
# 深層学習とOccupupancy Voxel Grid Mapを用いたHumanoidによるシェルフビンピッキングのための3次元オブジェクト分割

3D Object Segmentation for Shelf Bin Picking by Humanoid with Deep Learning and Occupancy Voxel Grid Map ( http://arxiv.org/abs/2001.05406v2 )

ライセンス: Link先を確認
Kentaro Wada, Masaki Murooka, Kei Okada, Masayuki Inaba(参考訳) 棚箱のような狭い空間でオブジェクトを選択することは、ヒューマノイドが環境からターゲットオブジェクトを抽出するための重要なタスクである。 しかし、これらの状況では、カメラと物体の間には多くの閉塞があり、3つのディメンションセンサ入力がないため、対象オブジェクトを3次元に分割することは困難である。 複数のカメラアングルでセグメンテーション結果を蓄積し、ターゲットオブジェクトのvoxelモデルを生成することで、この問題に対処する。 提案手法は2つのコンポーネントから構成される: 1つは畳み込みネットワークによる入力画像のオブジェクト確率予測、2つ目はオブジェクトセグメンテーション用に設計されたボクセルグリッドマップを生成する。 狭い棚箱内の対象物に対するピッキングタスク実験により,本手法の評価を行った。 本手法は咬合時においても密集した3dオブジェクトセグメントを生成し,実際のロボットは狭い空間から対象オブジェクトを選択した。

Picking objects in a narrow space such as shelf bins is an important task for humanoid to extract target object from environment. In those situations, however, there are many occlusions between the camera and objects, and this makes it difficult to segment the target object three dimensionally because of the lack of three dimentional sensor inputs. We address this problem with accumulating segmentation result with multiple camera angles, and generating voxel model of the target object. Our approach consists of two components: first is object probability prediction for input image with convolutional networks, and second is generating voxel grid map which is designed for object segmentation. We evaluated the method with the picking task experiment for target objects in narrow shelf bins. Our method generates dense 3D object segments even with occlusions, and the real robot successfuly picked target objects from the narrow space.
翻訳日:2023-01-11 06:59:33 公開日:2020-01-16
# 原子の量子移動時間とトンネルイオン化時間

Quantum Travel Time and Tunnel Ionization Times of Atoms ( http://arxiv.org/abs/2001.06071v1 )

ライセンス: Link先を確認
Durmus Demir and Serkan Pacal(参考訳) 量子力学的記述のないある位置から別の位置へ移動するのに要する時間は、特に量子トンネルのために様々なモデル化がなされている。 モデル時間(モデル時間)は、普遍的に有効であれば、サブルミナルでなければならないが、至る所(トンネル領域の内側と外側)に保持しなければならない。 ここでは、状態ベクトルで現れると仮定された量子移動時間が、上記の全ての基準が満たされる確率密度と確率電流の関数であることを示す。 四角いポテンシャル障壁の内側と外側で計算し、物理的に理にかなった結果を見つける。 さらに、最近のイオン化時間の測定値である$\rm he$と$\rm ar$と$\rm kr$とを比較し、データとの良好な一致を見出す。 量子移動時間は定常系に適しており、多くのトンネル駆動現象に応用することができる。

Time it takes to travel from one position to another, devoid of any quantum mechanical description, has been modeled variously, especially for quantum tunneling. The model time, if universally valid, must be subluminal, must hold everywhere (inside and outside the tunneling region), must comprise interference effects, and must have a sensible classical limit. Here we show that the quantum travel time, hypothesized to emerge with the state vector, is a function of the probability density and probability current such that all the criteria above are fulfilled. We compute it inside and outside a rectangular potential barrier and find physically sensible results. Moreover, we contrast it with recent ionization time measurements of the $\rm He$ as well as the $\rm Ar$ and $\rm Kr$ atoms, and find good agreement with data. The quantum travel time holds good for stationary systems, and can have applications in numerous tunneling-driven phenomena.
翻訳日:2023-01-11 01:13:47 公開日:2020-01-16
# 時間依存シュロディンガー方程式に対する高次積分方程式に基づく解法

A high-order integral equation-based solver for the time-dependent Schrodinger equation ( http://arxiv.org/abs/2001.06113v1 )

ライセンス: Link先を確認
Jason Kaye, Alex Barnett, Leslie Greengard(参考訳) ボルテラ積分方程式(volterra integral equation)の再構成に基づく,滑らかなポテンシャルを持つ時間依存シュロディンガー方程式の解の数値解法を提案する。 本手法は, 周期境界条件と, コンパクトにサポートされた初期データとポテンシャルを持つ自由空間問題の両方に対して, バージョンを提案する。 空間的に均一な電場を含むことができ、光源相互作用のシミュレーションに適用できる。 ボルテラ定式化を用いる際の主な計算上の課題は、時空履歴依存積分作用素の適用である。 これは、解をフーリエモードの集合に射影し、その係数を1つのステップから次のステップへ単純な反復によって更新することで達成できる。 周期的な場合、モードは通常のフーリエ級数のモードであり、高速フーリエ変換(FFT)は物理領域格子と周波数領域格子の間で交互に使用される。 自由空間の場合、スペクトルグリーン関数の振動挙動は、逆フーリエ変換の輪郭変形を離散化して得られる複素周波数フーリエモードの集合を使い、FFTに基づく対応する高速変換を開発する。 提案手法は擬スペクトル法と関係があるが,通常の微分定式化よりも積分に応用される。 これは、人工境界条件の必要を回避し、単純で安価な高次の暗黙の時間マーチングスキームを認め、自然に時間に依存したポテンシャルを含む、いくつかの利点がある。 本稿では,空間におけるスペクトル精度と時間における8次精度を示す1次元と2次元の例を示す。

We introduce a numerical method for the solution of the time-dependent Schrodinger equation with a smooth potential, based on its reformulation as a Volterra integral equation. We present versions of the method both for periodic boundary conditions, and for free space problems with compactly supported initial data and potential. A spatially uniform electric field may be included, making the solver applicable to simulations of light-matter interaction. The primary computational challenge in using the Volterra formulation is the application of a space-time history dependent integral operator. This may be accomplished by projecting the solution onto a set of Fourier modes, and updating their coefficients from one time step to the next by a simple recurrence. In the periodic case, the modes are those of the usual Fourier series, and the fast Fourier transform (FFT) is used to alternate between physical and frequency domain grids. In the free space case, the oscillatory behavior of the spectral Green's function leads us to use a set of complex-frequency Fourier modes obtained by discretizing a contour deformation of the inverse Fourier transform, and we develop a corresponding fast transform based on the FFT. Our approach is related to pseudo-spectral methods, but applied to an integral rather than the usual differential formulation. This has several advantages: it avoids the need for artificial boundary conditions, admits simple, inexpensive high-order implicit time marching schemes, and naturally includes time-dependent potentials. We present examples in one and two dimensions showing spectral accuracy in space and eighth-order accuracy in time for both periodic and free space problems.
翻訳日:2023-01-11 01:13:30 公開日:2020-01-16
# 2次非線形結合を有する1次元結合共鳴導波路の2レベル原子を含むナノキャビティとケラー非線形性との単一光子輸送

Single-photon transport in one-dimensional coupled-resonator waveguide with second order nonlinearity coupling to a nanocavity containing a two-level atom and Kerr nonlinearity ( http://arxiv.org/abs/2001.05827v1 )

ライセンス: Link先を確認
Hongyu Lin, Xiaoqian Wang, Zhihai Yao and Dandan Zou(参考訳) 2次非線形材料による1次元導波路とキャビティとのカップリングにおける制御可能な単一光子散乱を非カスケード配置で検討し,キャビティを2レベル原子で埋め込み,カー非線形材料を充填した。 2次非線形カップリングを考えると、3つの異なるカップリングフォームの伝送特性を以下のように分析する。 i) 2レベル原子はカー非線形性なしで励起される。 (ii)ケラー非線形性は2レベル原子なしで励起される。 (iii)2レベル原子とカー非線形性の両方が励起される。 透過振幅と反射振幅は、3つの場合の離散座標アプローチによって得られる。 その結果, 伝送特性は上述の3つの異なる結合形によって調整できることがわかった。このことから, 1次元結合共振導波路における単一光子の透過と反射を制御するために, 単一光子スイッチとして使用できることを示す。 結果は[phys. rev. a 85, 053840(2012)]と比較し,その利点を見いだした。

We study controllable single photon scattering in a one-dimensional waveguide coupling with an additional cavity by second order nonlinear materials in a non-cascading configuration, where the additional cavity is embedded with two-level atom and filled with Kerr-nonlinear materials. Considering the second order nonlinear coupling, we analyze the transmission properties of the three different coupling forms as follows: (i) The two-level atom is excited without the Kerr-nonlinearity. (ii)The Kerr-nonlinearity is excited without the two-level atom. (iii) Both of the two-level atom and Kerr-nonlinearity are excited. The transmission and reflection amplitudes are obtained by the discrete coordinates approach for the three cases. The results showed that the transmission properties can be adjusted by the above three different coupling forms, which indicate our scheme can be used as a single photon switch to control the transmission and reflection of the single photon in the one-dimensional coupled resonant waveguide. We compared the results with [Phys. Rev. A 85, 053840(2012)] and find the advantages.
翻訳日:2023-01-11 01:07:50 公開日:2020-01-16
# 二重二階非線形結合系に基づく非定常光子遮断

Unconventional photon blockade based on double second order nonlinear coupling system ( http://arxiv.org/abs/2001.05831v1 )

ライセンス: Link先を確認
Hongyu Lin, Xiaoqian Wang, Zhuo Yu and Zhihai Yao(参考訳) 最近の論文 [phys. rev. a 92,023838 (2015)] では、低周波モードと高周波モードの非線形結合を持つ2モード2次非線形系において、非慣習的な光子遮断が研究されている。 本稿では, 弱結合非線形空洞を持つ3モード系において, $\chi^{(2)}$ 非線形性による非対称光子遮断について検討する。 安定状態極限における主方程式の解法とゼロ遅延時間2次相関関数の計算により、低周波モードにおける強い光子反バンチ条件を得る。 その結果, 解析結果と比較した結果, 完全に一致していることが判明した。 数値解の解析により, この手法は崩壊速度や貯留温度の変化に敏感ではなく, 3モード駆動により, より制御可能なパラメータが得られ, どちらも実験実施の可能性を高めていることがわかった。

In the recent publications [Phys. Rev. A 92,023838 (2015)], the unconventional photon blockade are studied in a two-mode-second-order-nonlinear system with nonlinear coupling between the low frequency and high frequency modes. In this paper, we study the unconventional photon blockade in a three-mode system with weakly coupled nonlinear cavities via $\chi^{(2)}$ nonlinearity. By solving the master equation in the steady-state limit and calculating the zero-delay time second-order correlation function, we obtain the conditions of strong photon antibunching in the low frequency mode. The numerical result are compared with the analytical results, the results show that they are in complete agreement. By the analysis of numerical solutions, we find that this scheme is not sensitive to the change of decay rates and the reservoir temperature, and the three-mode drives make the system have more adjustable parameters, both of which increases the possibility of experimental implementation.
翻訳日:2023-01-11 01:07:31 公開日:2020-01-16
# 拡張B92プロトコルの有限鍵解析

Finite Key Analysis of the Extended B92 Protocol ( http://arxiv.org/abs/2001.05940v1 )

ライセンス: Link先を確認
Omar Amer and Walter O. Krawec(参考訳) 本稿では,b92量子鍵分散プロトコルの拡張版における鍵レート式を導出し,有限資源を用いた操作の効果を初めて考慮する。 この表現を用いて、様々なノイズやキー長の設定でプロトコルの解析を行い、同等のプロトコル上の以前の境界と比較する。

In this paper we derive a key rate expression for the extended version of the B92 quantum key distribution protocol that takes into account, for the first time, the effects of operating with finite resources. With this expression, we conduct an analysis of the protocol in a variety of different noise and key-length settings, and compare to previous bounds on comparable protocols.
翻訳日:2023-01-11 01:06:47 公開日:2020-01-16
# Rydbergの原子系における量子カオス

Quantum Chaos in a Rydberg Atom System ( http://arxiv.org/abs/2001.06110v1 )

ライセンス: Link先を確認
Yochai Werman(参考訳) Hallamらによる最近の提案では、時間依存変動原理(TDVP)によって得られる半古典的な運動方程式のカオス特性を量子カオスの特徴づけとして用いた。 本稿では,強い相互作用を持つRydberg原子配列の量子力学を近似する半古典理論のリアプノフスペクトルを計算し,周期運動をもたらす。 さらに, この近似の周辺における量子ゆらぎの影響を計算し, 周期軌道からの脱出率を求める。 この速度を、量子論の正確な解から抽出された速度と比較し、桁違いの差を求める。 この場合、tdvp方程式のカオスは系のphsyical特性とは対応しないと結論づける。 この結果は半古典周期軌道からの脱出率に関するHoらを補完するものである。

A recent proposal by Hallam et al. suggested using the chaotic properties of the semiclassical equations of motion, obtained by the time dependent variational principle (TDVP), as a characterization of quantum chaos. In this paper, we calculate the Lyapunov spectrum of the semiclassical theory approximating the quantum dynamics of a strongly interacting Rydberg atom array, which lead to periodic motion. In addition, we calculate the effect of quantum fluctuations around this approximation, and obtain the escape rate from the periodic orbit. We compare this rate to the rate extracted from the exact solution of the quantum theory, and find an order of magnitude discrepancy. We conclude that in this case, chaos in the TDVP equations does not correpond to phsyical properties of the system. Our result complement those of Ho et al. regarding the escape rate from the semiclassical periodic orbit.
翻訳日:2023-01-11 01:06:10 公開日:2020-01-16
# 医療教育における腹痛訓練支援のための技術支援型マルチモーダルトレーニングアプローチとその評価

A Technology-aided Multi-modal Training Approach to Assist Abdominal Palpation Training and its Assessment in Medical Education ( http://arxiv.org/abs/2001.05745v1 )

ライセンス: Link先を確認
A. Asadipour, K. Debattista, V. Patel, A. Chalmers(参考訳) コンピュータ支援マルチモーダルトレーニングは、様々な応用において複雑な運動能力を学ぶ効果的な方法である。 特定の分野(医療など)において、器用なハンズオン検査を行う能力の欠如は、症状の誤診、重傷、さらには死に至る可能性がある。 さらに、高品質な臨床検査は、不要な医用画像の必要性をなくし、重要な病理学を除外し、診断の時間とコストを削減するのに役立つ。 医学的触診は、世界中の効果的な予備診断方法として定期的に用いられるが、能力を得るためには、現在何年もの訓練が必要である。 本稿では,腹部に関する臨床検査スキルの指導と改善を目的としたマルチモーダル触診訓練システムについて述べる。 本研究の目的は,リハーサルの頻度を増大させることで,触覚訓練期間を大幅に短縮することであり,また,医療専門家から収集・モデル化された各種腹腔鏡下手術の実施方法に関する重要なフィードバックを提供することである。 初年度の医学生は,コントロールグループ(n=8),セミビジュアルトレーニンググループ(n=8),フルビジュアルトレーニンググループ(n=7)に分けて3つの手術(上,深,肝)を行った。 医療学生の成績は,r=.62,p(one-tailed)<.05。 視力訓練群は, 視力と掌側位置の抽象的視覚化を学生に提供したコントロール群よりも有意に優れていた(p<.05。 また,j=132,z=2.62,r=0.55の群間で正の傾向が認められた。

Computer-assisted multimodal training is an effective way of learning complex motor skills in various applications. In particular disciplines (eg. healthcare) incompetency in performing dexterous hands-on examinations (clinical palpation) may result in misdiagnosis of symptoms, serious injuries or even death. Furthermore, a high quality clinical examination can help to exclude significant pathology, and reduce time and cost of diagnosis by eliminating the need for unnecessary medical imaging. Medical palpation is used regularly as an effective preliminary diagnosis method all around the world but years of training are required currently to achieve competency. This paper focuses on a multimodal palpation training system to teach and improve clinical examination skills in relation to the abdomen. It is our aim to shorten significantly the palpation training duration by increasing the frequency of rehearsals as well as providing essential augmented feedback on how to perform various abdominal palpation techniques which has been captured and modelled from medical experts. Twenty three first year medical students divided into a control group (n=8), a semi-visually trained group (n=8), and a fully visually trained group (n=7) were invited to perform three palpation tasks (superficial, deep and liver). The medical students performances were assessed using both computer-based and human-based methods where a positive correlation was shown between the generated scores, r=.62, p(one-tailed)<.05. The visually-trained group significantly outperformed the control group in which abstract visualisation of applied forces and their palmar locations were provided to the students during each palpation examination (p<.05). Moreover, a positive trend was observed between groups when visual feedback was presented, J=132, z=2.62, r=0.55.
翻訳日:2023-01-11 01:05:58 公開日:2020-01-16
# big data provided sentiment analysis (somabit) を用いたソーシャルメディアからの知識発見

Knowledge Discovery from Social Media using Big Data provided Sentiment Analysis (SoMABiT) ( http://arxiv.org/abs/2001.05996v1 )

ライセンス: Link先を確認
Mahdi Bohlouli, Jens Dalter, Mareike Dornh\"ofer, Johannes Zenkert, Madjid Fathi(参考訳) 今日の競争力のあるビジネスの世界では、顧客ニーズと市場指向の生産を意識することが、業界にとって重要な成功要因である。 この目的のために、効率的な分析アルゴリズムを用いることで、顧客のフィードバックをよりよく理解し、次世代の製品を改善することができる。 したがって、日常生活におけるソーシャルメディアの利用の劇的な増加は、市場分析に有益な情報源を提供する。 しかし、従来の分析アルゴリズムや手法がこのような異種多構造データソースに対してどのようにスケールアップできるかは、この点において大きな課題である。 本稿では,ビッグデータ技術を用いたソーシャルメディア分析プラットフォームであるSoMABiTの技術的・科学的焦点について論じる。 ソーシャルメディアから知識を見つけるために感情分析が採用されている。 MapReduceの使用と、任意のデータボリュームをスケールし、ソーシャルメディア駆動の知識を提供する統合プラットフォームに向けた分散アルゴリズムの開発は、最先端技術と比較して提案された概念の目新しいところである。

In todays competitive business world, being aware of customer needs and market-oriented production is a key success factor for industries. To this aim, the use of efficient analytic algorithms ensures a better understanding of customer feedback and improves the next generation of products. Accordingly, the dramatic increase in using social media in daily life provides beneficial sources for market analytics. But how traditional analytic algorithms and methods can scale up for such disparate and multi-structured data sources is the main challenge in this regard. This paper presents and discusses the technological and scientific focus of the SoMABiT as a social media analysis platform using big data technology. Sentiment analysis has been employed in order to discover knowledge from social media. The use of MapReduce and developing a distributed algorithm towards an integrated platform that can scale for any data volume and provide a social media-driven knowledge is the main novelty of the proposed concept in comparison to the state-of-the-art technologies.
翻訳日:2023-01-11 01:04:49 公開日:2020-01-16
# 最適設計:自律システムのための適応戦略のモデル駆動合成

Optimal by Design: Model-Driven Synthesis of Adaptation Strategies for Autonomous Systems ( http://arxiv.org/abs/2001.08525v1 )

ライセンス: Link先を確認
Yehia Elrakaiby and Paola Spoletini and Bashar Nuseibeh(参考訳) 多くのソフトウェアシステムは、人間管理者によって効率的に管理されるには大きすぎる複雑化しており、特に不確実で動的な環境で運用され、頻繁な変更を必要とする場合である。 要求駆動適応技術は、要求を満たす方法を自律的に決定するために必要な手段をシステムに与えるために提案されている。 しかし、現在の多くのアプローチは、自律システムの設計、開発、分析に汎用言語、モデルおよび/またはフレームワークに依存している。 残念ながら、これらのツールは自律システムにおける適応問題の特徴に合わせたものではない。 本稿では,自律システムに対する最適適応戦略のモデルベース要求駆動合成のためのフレームワークであるOptimal by Design (ObD)を提案する。 ObDは、自己適応システムの基本的な要素、すなわちシステム、能力、要求、環境の高レベルな記述のためのモデル(および言語)を提案する。 これらの要素に基づいてマルコフ決定プロセス(MDP)が構築され、最適な戦略や最も報いるシステム行動を計算する。 さらに、変更に対するタイムリーな応答を保証する反射コントローラを定義する。 フレームワークの新たな特徴の1つは、要求の引き込み、洗練と分析のために開発されたゴール指向技術と、MDPとその拡張とツールに関する広範な研究の両方の恩恵を受けていることである。 予備評価の結果,フレームワークの実用性と利点が示された。

Many software systems have become too large and complex to be managed efficiently by human administrators, particularly when they operate in uncertain and dynamic environments and require frequent changes. Requirements-driven adaptation techniques have been proposed to endow systems with the necessary means to autonomously decide ways to satisfy their requirements. However, many current approaches rely on general-purpose languages, models and/or frameworks to design, develop and analyze autonomous systems. Unfortunately, these tools are not tailored towards the characteristics of adaptation problems in autonomous systems. In this paper, we present Optimal by Design (ObD ), a framework for model-based requirements-driven synthesis of optimal adaptation strategies for autonomous systems. ObD proposes a model (and a language) for the high-level description of the basic elements of self-adaptive systems, namely the system, capabilities, requirements and environment. Based on those elements, a Markov Decision Process (MDP) is constructed to compute the optimal strategy or the most rewarding system behaviour. Furthermore, this defines a reflex controller that can ensure timely responses to changes. One novel feature of the framework is that it benefits both from goal-oriented techniques, developed for requirement elicitation, refinement and analysis, and synthesis capabilities and extensive research around MDPs, their extensions and tools. Our preliminary evaluation results demonstrate the practicality and advantages of the framework.
翻訳日:2023-01-11 00:57:58 公開日:2020-01-16
# マルチメディエーターによる介入効果の非パラメトリック推論

Nonparametric inference for interventional effects with multiple mediators ( http://arxiv.org/abs/2001.06027v1 )

ライセンス: Link先を確認
David Benkeser(参考訳) 介入が結果に影響を及ぼす経路を理解することは、共通の科学的目標である。 豊富な文献群は、全介入効果を経路特異的効果に分解する。 介入的直接的および間接的効果は、そのような分解をもたらす。 これらの効果の既存の推定は、非パラメトリックブートストラップによる信頼区間推定を容易にするパラメトリックモデルに基づいている。 我々は、より柔軟で、おそらく機械学習に基づく推定技術を検討することができる理論を提供する。 特に,閉形式信頼区間と仮説テストの構築を容易にする弱収束結果を確立する。 最後に,提案した推定器の複数の頑健性特性を示す。 シミュレーションにより、大サンプル理論に基づく推論は十分な小サンプル性能を有することが示された。 本研究は,現代の統計的学習手法を活用し,介入的調停効果を推定する手段を提供する。

Understanding the pathways whereby an intervention has an effect on an outcome is a common scientific goal. A rich body of literature provides various decompositions of the total intervention effect into pathway specific effects. Interventional direct and indirect effects provide one such decomposition. Existing estimators of these effects are based on parametric models with confidence interval estimation facilitated via the nonparametric bootstrap. We provide theory that allows for more flexible, possibly machine learning-based, estimation techniques to be considered. In particular, we establish weak convergence results that facilitate the construction of closed-form confidence intervals and hypothesis tests. Finally, we demonstrate multiple robustness properties of the proposed estimators. Simulations show that inference based on large-sample theory has adequate small-sample performance. Our work thus provides a means of leveraging modern statistical learning techniques in estimation of interventional mediation effects.
翻訳日:2023-01-11 00:57:12 公開日:2020-01-16
# オメガレギュラー目標を用いた強化学習のための報酬シェーピング

Reward Shaping for Reinforcement Learning with Omega-Regular Objectives ( http://arxiv.org/abs/2001.05977v1 )

ライセンス: Link先を確認
E. M. Hahn, M. Perez, S. Schewe, F. Somenzi, A. Trivedi, D. Wojtczak(参考訳) 近年、mdpsオートマトン(b\"uchi automata with a restricted form of non determinism)をモデルフリー強化学習(model free reinforcement learning)に活用する試みが成功している。 これらのB\"uchiautoaの使用の基礎は、B\"uchi"条件が良いMDPオートマトンに対してリーチビリティに変換可能であることである。 この翻訳の欠点は、報酬が平均的に非常に遅れており、学習過程において長いエピソードを必要とすることである。 我々は、この問題を克服する新しい報酬形成アプローチを考案する。 得られたモデルが,この方向の先行作業の簡易化と改善を目的とした偏り値引きによる割引対象値と等価であることを示す。

Recently, successful approaches have been made to exploit good-for-MDPs automata (B\"uchi automata with a restricted form of nondeterminism) for model free reinforcement learning, a class of automata that subsumes good for games automata and the most widespread class of limit deterministic automata. The foundation of using these B\"uchi automata is that the B\"uchi condition can, for good-for-MDP automata, be translated to reachability. The drawback of this translation is that the rewards are, on average, reaped very late, which requires long episodes during the learning process. We devise a new reward shaping approach that overcomes this issue. We show that the resulting model is equivalent to a discounted payoff objective with a biased discount that simplifies and improves on prior work in this direction.
翻訳日:2023-01-11 00:56:36 公開日:2020-01-16
# 4体相互作用とオール・ツー・オール接続による大規模イジングエミュレーション

Large-scale Ising Emulation with Four-Body Interaction and All-to-All Connection ( http://arxiv.org/abs/2001.05680v1 )

ライセンス: Link先を確認
Santosh Kumar, He Zhang, and Yu-Ping Huang(参考訳) 我々は,最大100万本のスピンを含むIsingマシンをエミュレートする非線形光学的手法を提案し,実演する。 空間光変調器を用いて、コヒーレントレーザービームにおけるウェーブレットの2次位相値の形でスピンを符号化し制御し、フーリエ平面の非線形結晶における周波数変換との高次相互作用をエミュレートする。 適応フィードバック制御により、システムは全ての結合多体相互作用を持つイジングハミルトニアンの基底状態をよく近似する効果的なスピン配置へと進化することができる。 われわれの技術は、複雑な多体物理学を探索し、ビッグデータの最適化、計算、分析にエキサイティングな応用をもたらす新しいツールになるかもしれない。

We propose and demonstrate a nonlinear optics approach to emulate Ising machines containing up to a million spins and with tailored two and four-body interactions with all-to-all connections. It uses a spatial light modulator to encode and control the spins in the form of the binary phase values of wavelets in coherent laser beams, and emulates the high-order interaction with frequency conversion in a nonlinear crystal at the Fourier plane. By adaptive feedback control, the system can be evolved into effective spin configurations that well approximate the ground states of Ising Hamiltonians with all-to-all connected many-body interactions. Our technique could serve as a new tool to probe complex, many-body physics and give rise to exciting applications in big data optimization, computing, and analytics.
翻訳日:2023-01-11 00:55:55 公開日:2020-01-16
# 自律走行のための確率的3次元マルチオブジェクトトラッキング

Probabilistic 3D Multi-Object Tracking for Autonomous Driving ( http://arxiv.org/abs/2001.05673v1 )

ライセンス: Link先を確認
Hsu-kuang Chiu, Antonio Prioletti, Jie Li, Jeannette Bohg(参考訳) 3Dマルチオブジェクトトラッキングは、自律運転アプリケーションにおいて重要なモジュールであり、計画モジュールに世界の信頼性の高い動的表現を提供する。 本稿では,ニューオリプス2019で開催されているai driving olympics workshopで開催中のnuscenes tracking challengeにおいて,第1位となったオンライントラッキング手法を提案する。 提案手法はカルマンフィルタを用いて対象状態を推定する。 我々は、状態共分散とプロセスおよび観測ノイズ共分散を、トレーニングセットからの統計と初期化する。 また、予測対象状態と現在の物体検出とのマハラノビス距離を測定することにより、カルマンフィルタからの確率情報をデータアソシエーションステップで利用する。 NuScenes 検証とテストセットの実験結果から,AMOTA(Average Multi-Object Tracking Accuracy) 測定値において,AB3DMOT ベースライン法よりも高い性能を示した。

3D multi-object tracking is a key module in autonomous driving applications that provides a reliable dynamic representation of the world to the planning module. In this paper, we present our on-line tracking method, which made the first place in the NuScenes Tracking Challenge, held at the AI Driving Olympics Workshop at NeurIPS 2019. Our method estimates the object states by adopting a Kalman Filter. We initialize the state covariance as well as the process and observation noise covariance with statistics from the training set. We also use the stochastic information from the Kalman Filter in the data association step by measuring the Mahalanobis distance between the predicted object states and current object detections. Our experimental results on the NuScenes validation and test set show that our method outperforms the AB3DMOT baseline method by a large margin in the Average Multi-Object Tracking Accuracy (AMOTA) metric.
翻訳日:2023-01-11 00:48:10 公開日:2020-01-16
# 適応方向誘導構造テンソル総変動

Adaptive Direction-Guided Structure Tensor Total Variation ( http://arxiv.org/abs/2001.05717v1 )

ライセンス: Link先を確認
Ezgi Demircan-Tureyen and Mustafa E. Kamasak(参考訳) 方向性誘導型構造テンソル総変分(DSTV)は,構造テンソル総変分(STV)の所定の方向への変化に対する感度を高めることを目的とした,最近提案された正規化用語である。 単方向画像で得られた妥当な結果にもかかわらず、dstvモデルは実世界の多方向画像には適用できない。 本研究では,DSTVに適応性をもたらす2段階のフレームワークを構築する。 我々は,空間的に変化する方向記述子(配向および異方性線量)の指導の下で,局所近傍の一階情報を符号化するstvの代替案を設計する。 これらのディスクリプタを推定するために、構造テンソルに基づいて局所幾何をキャプチャする効率的なプリプロセッサを提案する。 本研究は,stvにおける方向情報の関与が,修復品質と計算効率の両面で,提案手法と最先端解析に基づく分別モデルとの比較により,いかに有益であるかを実証する。

Direction-guided structure tensor total variation (DSTV) is a recently proposed regularization term that aims at increasing the sensitivity of the structure tensor total variation (STV) to the changes towards a predetermined direction. Despite of the plausible results obtained on the uni-directional images, the DSTV model is not applicable to the multi-directional images of real-world. In this study, we build a two-stage framework that brings adaptivity to DSTV. We design an alternative to STV, which encodes the first-order information within a local neighborhood under the guidance of spatially varying directional descriptors (i.e., orientation and the dose of anisotropy). In order to estimate those descriptors, we propose an efficient preprocessor that captures the local geometry based on the structure tensor. Through the extensive experiments, we demonstrate how beneficial the involvement of the directional information in STV is, by comparing the proposed method with the state-of-the-art analysis-based denoising models, both in terms of restoration quality and computational efficiency.
翻訳日:2023-01-11 00:47:51 公開日:2020-01-16
# 多目的マニピュレーションのための確率的3次元マルチラベルリアルタイムマッピング

Probabilistic 3D Multilabel Real-time Mapping for Multi-object Manipulation ( http://arxiv.org/abs/2001.05752v1 )

ライセンス: Link先を確認
Kentaro Wada, Kei Okada, Masayuki Inaba(参考訳) 確率的3Dマップは、複数のカメラ視点を持つオブジェクトセグメンテーションに適用されているが、従来の手法では、マルチラベルオブジェクトマッピングのリアルタイム効率と機能に欠けていた。 本稿では,マルチラベル空間を有する3次元地図をリアルタイムに生成する手法を提案する。 対象ラベルの占有率のみをマップしたこれまでの作業を拡張して,アクションを回避して複数ラベルオブジェクトのセグメンテーションを実現する。 実験では,39個の異なるオブジェクトでセグメント化精度を検証し,複数のオブジェクトの操作タスクに適用して評価を行った。 本手法は従来の投影法に比べて40~96 %の相対性(12.6 は$IU_{3d}$)で優れており,ロボットは重閉塞環境下で複数の物体(60.7 %)を認識・操作する。

Probabilistic 3D map has been applied to object segmentation with multiple camera viewpoints, however, conventional methods lack of real-time efficiency and functionality of multilabel object mapping. In this paper, we propose a method to generate three-dimensional map with multilabel occupancy in real-time. Extending our previous work in which only target label occupancy is mapped, we achieve multilabel object segmentation in a single looking around action. We evaluate our method by testing segmentation accuracy with 39 different objects, and applying it to a manipulation task of multiple objects in the experiments. Our mapping-based method outperforms the conventional projection-based method by 40 - 96\% relative (12.6 mean $IU_{3d}$), and robot successfully recognizes (86.9\%) and manipulates multiple objects (60.7\%) in an environment with heavy occlusions.
翻訳日:2023-01-11 00:47:32 公開日:2020-01-16
# 小型無人航空機の追跡に関する比較研究

Tracking of Micro Unmanned Aerial Vehicles: A Comparative Study ( http://arxiv.org/abs/2001.06066v1 )

ライセンス: Link先を確認
Fatih G\"ok\c{c}e(参考訳) 近年、マイクロ無人航空機(mUAV)が一般的になった。 広く利用されているため、ホビイストが違法に飛ばすと、重要なリスクが課せられ、セキュリティシステムによってそのようなmUAVを感知する必要がある。 さらに、mUAVの検知は、ロボット群の中の個人が協調操作のためにお互いを感知し、ローカライズするシステムを必要とする群ロボットの研究にも不可欠である。 このようなシステムを得るためには、視覚、赤外線、音響信号、小型レーダーなどの異なるセンシング媒体を用いてmUAVを検出する研究がある。 しかし、この分野では、精度と計算の複雑さを高めるために、視覚に基づく検出システムへの追跡アプローチを統合するなど、まだ処理が待ち遠しい課題がある。 そこで本研究では,様々なトラッキング手法を文献で利用可能なmUAV検出システムに組み合わせ,精度の面で異なるトラッキング手法を評価するとともに,そのような統合が計算コストに与える影響について検討する。

Micro unmanned aerial vehicles (mUAV) became very common in recent years. As a result of their widespread usage, when they are flown by hobbyists illegally, crucial risks are imposed and such mUAVs need to be sensed by security systems. Furthermore, the sensing of mUAVs are essential for also swarm robotics research where the individuals in a flock of robots require systems to sense and localize each other for coordinated operation. In order to obtain such systems, there are studies to detect mUAVs utilizing different sensing mediums, such as vision, infrared and sound signals, and small-scale radars. However, there are still challenges that awaits to be handled in this field such as integrating tracking approaches to the vision-based detection systems to enhance accuracy and computational complexity. For this reason, in this study, we combine various tracking approaches to a vision-based mUAV detection system available in the literature, in order to evaluate different tracking approaches in terms of accuracy and as well as investigate the effect of such integration to the computational cost.
翻訳日:2023-01-11 00:47:14 公開日:2020-01-16
# グラフマッチングによる加工画像の検出

Fabricated Pictures Detection with Graph Matching ( http://arxiv.org/abs/2002.03720v1 )

ライセンス: Link先を確認
Binrui Shen, Qiang Niu and Shengxin Zhu(参考訳) 研究作業における実験画像の作成は重大な学術的不正行為であり、レビュープロセスで検出すべきである。 しかし、投稿が多いため、画像が作成・再利用されるかどうかの検知は、レビュアーにとって手間がかかり、時には人間の目には見当たらないことがある。 画像間の類似性を検出するツールは、この問題を軽減するのに役立つかもしれない。 局所的な特徴点マッチングに基づくいくつかの手法は、ほとんどの場合、機能間のグローバルな関係の無知により、マッチングが混乱する可能性がある。 グラフマッチング技術を用いて、類似した、あるいは、おそらく製造された画像を検出するためのフレームワークを提案する。 新しい反復法が提案され,そのようなグラフマッチング手法が局所的な特徴のみに基づく手法よりも優れていることを示す実験結果が得られた。

Fabricating experimental pictures in research work is a serious academic misconduct, which should better be detected in the reviewing process. However, due to large number of submissions, the detection whether a picture is fabricated or reused is laborious for reviewers, and sometimes is indistinct with human eyes. A tool for detecting similarity between images may help to alleviate this problem. Some methods based on local feature points matching work for most of the time, while these methods may result in mess of matchings due to ignorance of global relationship between features. We present a framework to detect similar, or perhaps fabricated, pictures with the graph matching techniques. A new iterative method is proposed, and experiments show that such a graph matching technique is better than the methods based only on local features for some cases.
翻訳日:2023-01-11 00:46:57 公開日:2020-01-16
# エンタングル及び非エンタングル光学場を有するベル違反

Bell violations with entangled and non-entangled optical fields ( http://arxiv.org/abs/2001.05886v1 )

ライセンス: Link先を確認
J. Gonzales, P. Sanchez, V. Avalos, and F. De Zela(参考訳) エンタングル状態と非エンタングル状態の両方で用意された古典光によるベル違反を報告した。 その結果,ベル・クラウザー・ホーン・シモニー・ホルトの不等式のような制約の違反は必ずしも局所現実主義を偽っているとは限らない。 古典統計光学の領域における相関はベルタイプではないため、ベル違反につながる可能性がある。

We report Bell violations with classical light prepared in both entangled and non-entangled polarization-path, binary states. Our results show that violations of constraints such as the Bell-Clauser-Horn-Shimony-Holt inequality do not necessarily falsify local-realism. Correlations in the realm of classical statistical optics, which are not of the Bell type, may lead to Bell violations.
翻訳日:2023-01-11 00:40:09 公開日:2020-01-16
# 量子制御ソリューションサブスペースのナビゲーション

Navigating on Quantum Control Solution Subspaces ( http://arxiv.org/abs/2001.05941v1 )

ライセンス: Link先を確認
Martin Larocca and Esteban A. Calzetta and Diego A. Wisniacki(参考訳) 量子最適制御 (quantum optimal control, qoc) は、量子力学を積極的に導く外部制御プロトコルの生成に特化した分野である。 QOC問題の解は、制御空間の連続部分多様体を構成することが示されている。 制御プロトコルの二次機能を達成するためにこの特性を利用するソリューションナビゲーション手法を提案した [larocca \textit{et al}, arxiv:1911.07105]。 もともとこの技術は、正確なヘッセン行列の計算を伴っていた。 本稿では,有限差分近似方式でナビゲーションを実行できることを示す。これにより,正確なヘシアンが到達できないシステムにおいて,この手法の適用が可能となる。

Quantum Optimal Control (QOC) is the field devoted to the production of external control protocols that actively guide quantum dynamics. Solutions to QOC problems were shown to constitute continuous submanifolds of control space. A solution navigation method exploiting this property to achieve secondary features in the control protocols was proposed [Larocca \textit{et al}, arXiv:1911.07105]. Originally, the technique involved the computation of the exact Hessian matrix. In this paper, we show that the navigation can be alternatively performed with a finite-difference approximation scheme, thus enabling the application of this procedure in systems where computing the exact Hessian is out of reach.
翻訳日:2023-01-11 00:39:45 公開日:2020-01-16
# 多空間モード2モードスクイーズ測定における不完全ホモダイン視認性の影響

Effect of imperfect homodyne visibility on multi-spatial-mode two-mode squeezing measurements ( http://arxiv.org/abs/2001.06031v1 )

ライセンス: Link先を確認
Prasoon Gupta, Rory W. Speirs, Kevin M. Jones, Paul D. Lett(参考訳) ホモダイン検出器の視認性が2モード集光光の空間的マルチモード源の四次スクイーズ測定に及ぼす影響について検討した。 光パラメトリック発振器(opo)のような源は、非線形媒質がモード選択光学キャビティ内にあるため、通常単一の空間モードでスクイーズを生成する。 このようなソースに対して、ホモダイン検出器における不完全な干渉可視性は、等価な損失項を導入することで説明できる追加の真空雑音に結合する。 自由空間のマルチ空間モードシステムでは、不完全なホモダイン検出器の可視性は、非相関な圧縮モードで結合し、その結果、測定されたスクイージングの高速な劣化を引き起こす。 85rb蒸気中の自由空間4波混合過程によって生じる2モードのスクイーズ状態の観測に用いられるホモダイン検出器の可視性に測定されたスクイーズレベルの依存性を実験的に示し,簡単な理論モデルが実験データと密接に一致することを実証した。

We study the effect of homodyne detector visibility on the measurement of quadrature squeezing for a spatially multi-mode source of two-mode squeezed light. Sources like optical parametric oscillators (OPO) typically produce squeezing in a single spatial mode because the nonlinear medium is within a mode-selective optical cavity. For such a source, imperfect interference visibility in the homodyne detector couples in additional vacuum noise, which can be accounted for by introducing an equivalent loss term. In a free-space multi-spatial-mode system imperfect homodyne detector visibility can couple in uncorrelated squeezed modes, and hence can cause faster degradation of the measured squeezing. We show experimentally the dependence of the measured squeezing level on the visibility of homodyne detectors used to probe two-mode squeezed states produced by a free space four-wave mixing process in 85Rb vapor, and also demonstrate that a simple theoretical model agrees closely with the experimental data.
翻訳日:2023-01-11 00:38:48 公開日:2020-01-16
# 最適化器の最適化:量子アニーリングのための分解技術

Optimizing the Optimizer: Decomposition Techniques for Quantum Annealing ( http://arxiv.org/abs/2001.06079v1 )

ライセンス: Link先を確認
Gideon Bass, Max Henderson, Joshua Heath, and Joseph Dulny III(参考訳) 量子コンピューティングハードウェアは近年大きく進化し、産業や政府の関心が高まりつつあるが、現在の量子コンピュータのサイズ制限は、関連する現実世界の問題にこれらのデバイスを適用する際の障害となっている。 量子コンピューティングの潜在的な利点を効果的に活用するためには、古典的および量子コンピューティング技術を組み合わせた異種アプローチが必要である。 本研究では,現状の制約を満たす量子コンピュータの活用方法を理解するために,複数の産業関連ベンチマーク問題を解くための多種多様なアプローチについて検討する。 Our results indicate: that solver performance is highly dependent on the structure (size and edge density) of the problem graph; that reusing a single fixed problem embedding, as opposed to dynamically searching for problem embeddings, is key to avoiding computational bottlenecks; that solutions of better quality are produced by algorithms that iteratively propagate the influence that solving an individual sub-problem has to the remainder of the larger problem; and that the Qbsolv algorithm (which implements the aforementioned techniques) is, at this time, the state-of-the-art in producing quality solutions, in a timely fashion, to a variety of theoretical and real-world problems too large to directly embed onto a quantum annealing device.

Although quantum computing hardware has evolved significantly in recent years, spurred by increasing industrial and government interest, the size limitation of current generation quantum computers remains an obstacle when applying these devices to relevant, real-world problems. In order to effectively exploit the potential benefits of quantum computing, heterogeneous approaches that combine both classical and quantum computing techniques are needed. In this work, we explore multiple heterogeneous approaches to solving multiple industry-relevant benchmark problems in order to understand how best to leverage quantum computers given current constraints. Our results indicate: that solver performance is highly dependent on the structure (size and edge density) of the problem graph; that reusing a single fixed problem embedding, as opposed to dynamically searching for problem embeddings, is key to avoiding computational bottlenecks; that solutions of better quality are produced by algorithms that iteratively propagate the influence that solving an individual sub-problem has to the remainder of the larger problem; and that the Qbsolv algorithm (which implements the aforementioned techniques) is, at this time, the state-of-the-art in producing quality solutions, in a timely fashion, to a variety of theoretical and real-world problems too large to directly embed onto a quantum annealing device.
翻訳日:2023-01-11 00:38:27 公開日:2020-01-16
# 強結合電気光学系におけるマイクロ波光絡み合い

Microwave--Optical entanglement in a Strongly Coupled Electro-Optomechanical System ( http://arxiv.org/abs/2001.06107v1 )

ライセンス: Link先を確認
Changchun Zhong, Xu Han, Hong X. Tang, Liang Jiang(参考訳) マイクロ波と光学間の量子トランスダクションは、信頼できるマイクロ波光の絡み合い、すなわち絡み合いに基づく量子トランスダクションが与えられると、量子テレポーテーションによって実現される。 このプロトコルを実現するには、2つの周波数間に高い忠実度を持つ絡み合ったソースが必要である。 本稿では,強結合系における汎用キャビティ電気光学系に基づくマイクロ波および光絡み合い発生について検討する。 マイクロ波および光出力スペクトルに分割を示し、2つのモード間の周波数絡みを定量化する。 エンタングルメントを周波数-ビン自由度で直接エンコードできることを示すとともに、エンタングルされた光子対を検証するための実現可能な実験を提案する。 実験実装を系統的に解析し、絡み合い検証に好適なパラメータレジームを同定する。 不等式は、実用的不完全性の分析を伴う良好な絡み合い検証の基準として与えられる。

Quantum transduction between microwave and optics can be realized by quantum teleportation if given reliable microwave-optical entanglement, namely entanglement-based quantum transduction. To realize this protocol, an entangled source with high-fidelity between the two frequencies is necessary. In this paper, we study the microwave and optical entanglement generation based on a generic cavity electro-optomechanical system in the strong coupling regime. Splittings are shown in the microwave and optical output spectra and the frequency entanglement between the two modes is quantified. We show that entanglement can be straightforwardly encoded in the frequency-bin degree of freedom and propose a feasible experiment to verify entangled photon pairs. The experimental implementation is systematically analyzed, and the preferable parameter regime for entanglement verification is identified. An inequality is given as a criterion for good entanglement verification with analysis of practical imperfections.
翻訳日:2023-01-11 00:38:09 公開日:2020-01-16
# クラウドコンピューティング基盤を用いた協調製品設計の知識統合

Knowledge Integration of Collaborative Product Design Using Cloud Computing Infrastructure ( http://arxiv.org/abs/2001.09796v1 )

ライセンス: Link先を確認
Mahdi Bohlouli, Alexander Holland, Madjid Fathi(参考訳) 製造業の成功の鍵は、持続可能な革新的な製品設計と開発である。 共同設計では、ステークホルダーは不均一に分散チェーンのようなものです。 データと知識の増大により、製品設計と開発で獲得した知識の効果的な管理は、ほとんどの製造業で直面する重要な課題の1つです。 ここ数年、soa、仮想化、グリッドコンピューティング、クラウドコンピューティングといった技術の成熟に伴い、知識や計算といったリソースの集中化によるitベースの製品設計アプリケーションの効率とパフォーマンスを改善する機会が増えている。 本論文の主な焦点は、クラウドコンピューティングインフラを用いた協調製品設計・開発のための知識統合サービスの提供に関する継続的な研究のコンセプトである。 本稿では、製品設計手順における知識マッピング、マージ、検索、転送といった機能を提供することにより、サービスとしての知識統合機能をサポートするクラウドコンピューティングの可能性について述べる。 提案する知識統合サービスは、知識リソースにリアルタイムアクセスを提供することでユーザをサポートする。 フレームワークには可用性、効率性、コスト削減、結果に要する時間削減、スケーラビリティといったメリットがあります。

The pivotal key to the success of manufacturing enterprises is a sustainable and innovative product design and development. In collaborative design, stakeholders are heterogeneously distributed chain-like. Due to the growing volume of data and knowledge, effective management of the knowledge acquired in the product design and development is one of the key challenges facing most manufacturing enterprises. Opportunities for improving efficiency and performance of IT-based product design applications through centralization of resources such as knowledge and computation have increased in the last few years with the maturation of technologies such as SOA, virtualization, grid computing, and/or cloud computing. The main focus of this paper is the concept of ongoing research in providing the knowledge integration service for collaborative product design and development using cloud computing infrastructure. Potentials of the cloud computing to support the Knowledge integration functionalities as a Service by providing functionalities such as knowledge mapping, merging, searching, and transferring in product design procedure are described in this paper. Proposed knowledge integration services support users by giving real-time access to knowledge resources. The framework has the advantage of availability, efficiency, cost reduction, less time to result, and scalability.
翻訳日:2023-01-11 00:37:54 公開日:2020-01-16
# 多機能・多言語融合に基づく音声感情認識

Speech Emotion Recognition Based on Multi-feature and Multi-lingual Fusion ( http://arxiv.org/abs/2001.05908v1 )

ライセンス: Link先を確認
Chunyi Wang(参考訳) 多機能・多言語融合に基づく音声感情認識アルゴリズムを提案し,音声感情認識における大きなデータセットの欠如と音響的特徴のロバスト性による認識精度の低下を解消する。 まず、中国語と英語の音声感情の既存のデータから手工芸品と深い自動特徴を抽出する。 そして、それぞれ異なる特徴を融合させる。 最後に、異なる言語の融合した特徴を再び融合させ、分類モデルで訓練する。 その結果, 融合特徴を未融合特徴と区別すると, 融合特徴は音声認識アルゴリズムの精度を大幅に向上させることがわかった。 提案手法は, 2つの中国語コーパスと2つの英語コーパスで評価し, 元の解に比べて精度の高い予測結果が得られた。 本研究の結果,多機能・多言語融合アルゴリズムは,データセットが小さい場合の音声感情認識精度を大幅に向上させることができる。

A speech emotion recognition algorithm based on multi-feature and Multi-lingual fusion is proposed in order to resolve low recognition accuracy caused by lack of large speech dataset and low robustness of acoustic features in the recognition of speech emotion. First, handcrafted and deep automatic features are extracted from existing data in Chinese and English speech emotions. Then, the various features are fused respectively. Finally, the fused features of different languages are fused again and trained in a classification model. Distinguishing the fused features with the unfused ones, the results manifest that the fused features significantly enhance the accuracy of speech emotion recognition algorithm. The proposed solution is evaluated on the two Chinese corpus and two English corpus, and is shown to provide more accurate predictions compared to original solution. As a result of this study, the multi-feature and Multi-lingual fusion algorithm can significantly improve the speech emotion recognition accuracy when the dataset is small.
翻訳日:2023-01-11 00:37:38 公開日:2020-01-16
# 事前学習語埋め込み空間における文書ネットワーク投影

Document Network Projection in Pretrained Word Embedding Space ( http://arxiv.org/abs/2001.05727v1 )

ライセンス: Link先を確認
Antoine Gourru, Adrien Guille, Julien Velcin and Julien Jacques(参考訳) 本稿では,リンクされた文書の集合(引用ネットワークなど)を事前学習された単語埋め込み空間に投影する新しい手法である正規化線形埋め込み(rle)を提案する。 テキストの内容に加えて,補完的情報(例えば,引用グラフ内の2つの文書のネットワーク近接)を提供するペアワイズ類似性の行列も活用する。 まず、各文書に対して単純な単語ベクトル平均を構築し、この平均表現を変更するために類似性を利用する。 ドキュメント表現は、レコメンデーション、分類、クラスタリングなど、多くの情報検索タスクを解決するのに役立つ。 提案手法は,ノード分類やリンク予測タスクにおいて,既存の文書ネットワーク組込み手法を上回ったり,一致させたりすることを実証する。 さらに、文書クラスを記述するための関連するキーワードを特定するのに役立ちます。

We present Regularized Linear Embedding (RLE), a novel method that projects a collection of linked documents (e.g. citation network) into a pretrained word embedding space. In addition to the textual content, we leverage a matrix of pairwise similarities providing complementary information (e.g., the network proximity of two documents in a citation graph). We first build a simple word vector average for each document, and we use the similarities to alter this average representation. The document representations can help to solve many information retrieval tasks, such as recommendation, classification and clustering. We demonstrate that our approach outperforms or matches existing document network embedding methods on node classification and link prediction tasks. Furthermore, we show that it helps identifying relevant keywords to describe document classes.
翻訳日:2023-01-11 00:30:58 公開日:2020-01-16
# Intweetive Text Summarization

Intweetive Text Summarization ( http://arxiv.org/abs/2001.11382v1 )

ライセンス: Link先を確認
Jean Val\`ere Cossu, Juan-Manuel Torres-Moreno, Eric SanJuan, Marc El-B\`eze(参考訳) さまざまなソーシャルメディアから生成されるユーザ生成コンテンツの量により、アナリストはビジネスに関連するいくつかのトピックに関する幅広い会話を処理できる。 それでも、この量の情報を最新に保つことは、人間には不可能である。 自動要約は、コンテンツのダイナミクスと質量を消化する興味深い手段を提供する。 本稿では,未解決のツイート要約問題に対処する。 本稿では,公開図形E-Reputationを扱うマイクロブログ会話の要約を自動生成する手法を提案する。 これらの要約はキーワードクエリやサンプルツイートを使用して生成され、Micro-Blogネットワーク全体の集中ビューを提供する。 この点において最先端技術が欠如しているため、実験的な評価プロセスに従って、多言語CLEF RepLab Topic-Detectionデータセット上で実験を行い、評価する。

The amount of user generated contents from various social medias allows analyst to handle a wide view of conversations on several topics related to their business. Nevertheless keeping up-to-date with this amount of information is not humanly feasible. Automatic Summarization then provides an interesting mean to digest the dynamics and the mass volume of contents. In this paper, we address the issue of tweets summarization which remains scarcely explored. We propose to automatically generated summaries of Micro-Blogs conversations dealing with public figures E-Reputation. These summaries are generated using key-word queries or sample tweet and offer a focused view of the whole Micro-Blog network. Since state-of-the-art is lacking on this point we conduct and evaluate our experiments over the multilingual CLEF RepLab Topic-Detection dataset according to an experimental evaluation process.
翻訳日:2023-01-11 00:30:46 公開日:2020-01-16
# ディープニューラルネットワークの低精度トレーニングのためのシフト8ビット浮動小数点フォーマット

Shifted and Squeezed 8-bit Floating Point format for Low-Precision Training of Deep Neural Networks ( http://arxiv.org/abs/2001.05674v1 )

ライセンス: Link先を確認
L\'eopold Cambier, Anahita Bhiwandiwalla, Ting Gong, Mehran Nekuii, Oguz H Elibol, Hanlin Tang(参考訳) 高速イテレーションを維持しながら多数のパラメータをトレーニングすることは、より優れたDeep Neural Network(DNN)モデルを開発するための、ますます採用される戦略とトレンドである。 これにより、トレーニングのメモリフットプリントと計算要求が増大する。 本稿では,8ビット浮動小数点数(fp8)を用いた深層ニューラルネットワークの学習手法を提案する。 ビット精度の低減により、より効率的なメモリと計算速度が向上する。 この手法をShifted and Squeezed FP8 (S2FP8) と呼ぶ。 提案手法は,従来の8ビット精度訓練法とは異なり,ResNet-50, Transformer, NCF などの代表モデルに対して最初から動作可能であることを示す。 この方法は、損失スケーリングパラメータの微調整や、特定の層を単一の精度で保持することなく、モデルの精度を維持することができる。 量子化による情報の損失を最小限に抑えるため、8ビットのテンソルの範囲を最適に調整するために用いられるシフト係数と圧縮係数の2つの学習可能な統計を導入する。

Training with larger number of parameters while keeping fast iterations is an increasingly adopted strategy and trend for developing better performing Deep Neural Network (DNN) models. This necessitates increased memory footprint and computational requirements for training. Here we introduce a novel methodology for training deep neural networks using 8-bit floating point (FP8) numbers. Reduced bit precision allows for a larger effective memory and increased computational speed. We name this method Shifted and Squeezed FP8 (S2FP8). We show that, unlike previous 8-bit precision training methods, the proposed method works out-of-the-box for representative models: ResNet-50, Transformer and NCF. The method can maintain model accuracy without requiring fine-tuning loss scaling parameters or keeping certain layers in single precision. We introduce two learnable statistics of the DNN tensors - shifted and squeezed factors that are used to optimally adjust the range of the tensors in 8-bits, thus minimizing the loss in information due to quantization.
翻訳日:2023-01-11 00:30:34 公開日:2020-01-16
# LSTMによる小河川の流れ予測

Stream-Flow Forecasting of Small Rivers Based on LSTM ( http://arxiv.org/abs/2001.05681v1 )

ライセンス: Link先を確認
Youchuan Hu, Le Yan, Tingting Hang and Jun Feng(参考訳) 小さな河川の河川流量予測は、常に非常に重要であるが、より少ない河川の特徴のために比較的困難である。 この分野では人工知能(AI)手法が長い間使われてきたが、予測品質の改善はまだ進行中である。 本稿では,時系列データ分野を対象としたLong-Short Term Memory(LSTM)ディープラーニングモデルを用いて,予測を行う新しい手法を提案する。 LSTMを用いて,中国・湖西省の1つの水文局からの河川流量データと11の降雨局からの降水データを収集し,今後6時間にわたってその水文局からの河川流量データを予測した。 平均二乗誤差 (RMSE) , 平均絶対誤差 (MAE) , 判定係数 (R^2) の3つの基準を用いて予測結果を評価した。 LSTMの予測とSVR(Support Vector Regression)モデルとMLP(Multilayer Perceptions)モデルとの比較により,LSTMは82.007のRMSE,27.752のMAE,0.970のR^2を達成できた。 また,LSTMモデルの拡張実験を行い,その性能への影響について検討した。

Stream-flow forecasting for small rivers has always been of great importance, yet comparatively challenging due to the special features of rivers with smaller volume. Artificial Intelligence (AI) methods have been employed in this area for long, but improvement of forecast quality is still on the way. In this paper, we tried to provide a new method to do the forecast using the Long-Short Term Memory (LSTM) deep learning model, which aims in the field of time-series data. Utilizing LSTM, we collected the stream flow data from one hydrologic station in Tunxi, China, and precipitation data from 11 rainfall stations around to forecast the stream flow data from that hydrologic station 6 hours in the future. We evaluated the prediction results using three criteria: root mean square error (RMSE), mean absolute error (MAE), and coefficient of determination (R^2). By comparing LSTM's prediction with predictions of Support Vector Regression (SVR) and Multilayer Perceptions (MLP) models, we showed that LSTM has better performance, achieving RMSE of 82.007, MAE of 27.752, and R^2 of 0.970. We also did extended experiments on LSTM model, discussing influence factors of its performance.
翻訳日:2023-01-11 00:30:17 公開日:2020-01-16
# コヒーレント散乱による浮遊ナノ粒子の絡み合い

Entangling levitated nanoparticles by coherent scattering ( http://arxiv.org/abs/2001.05769v1 )

ライセンス: Link先を確認
Henning Rudolph, Klaus Hornberger, Benjamin A. Stickler(参考訳) ツイーザー光子のコヒーレント散乱により2つの光共振ナノ粒子間の絡み合いが生成され, 検出可能であることを示す。 ストークス光子の検出により、ツイーザーの変形が青から赤に切り替わり、アンタングル化は、機械的ビート周波数で振動する条件付きアンチストークス光子フラックスによって検証される。 提案手法は近未来技術により実現可能であり,2つ以上のナノスケール物体間の非古典的中心-質量相関に関する最初の実験実験への扉を開く。

We show how entanglement between two optically levitated nanoparticles can be generated and detected by coherent scattering of tweezer photons into a single cavity mode. Triggered by the detection of a Stokes photon, the tweezer detuning is switched from the blue to the red; entanglement is then verified by the conditioned anti-Stokes photon flux, which oscillates with the mechanical beat frequency. The proposed setup is realizable with near-future technology and opens the door to the first experimental observation of non-classical center-of-mass correlations between two or more levitated nanoscale objects.
翻訳日:2023-01-11 00:29:48 公開日:2020-01-16
# 変分ハイブリッド量子古典法による量子純状態トモグラフィ

Quantum Pure State Tomography via Variational Hybrid Quantum-Classical Method ( http://arxiv.org/abs/2001.05806v1 )

ライセンス: Link先を確認
Tao Xin, Xinfang Nie, Xiangyu Kong, Jingwei Wen, Dawei Lu, Jun Li(参考訳) 量子系の完全な記述を得るためには、通常標準量子状態トモグラフィーを用いるが、実行には指数関数的な数の計測を必要とするため、システムのサイズが大きくなると非現実的である。 本研究では,変動型ハイブリッド量子古典法に基づく自己学習トモグラフィー手法を提案する。 このスキームの重要な部分は学習手順であり、未知の目標状態が単純なfiducial状態とコヒーレントに駆動可能な制御シーケンスを学習し、制御シーケンスを逆に適用することで目標状態を直接再構築することができる。 このようにして、状態トモグラフィ問題は状態遷移問題に変換される。 後者の問題を解決するために,閉ループ学習制御方式を用いる。 さらに, 4-qubit核磁気共鳴技術を用いて実験を行った。 実験結果から,提案手法は量子情報の絡み合った状態や,凝縮物質物理学に共通する量子多体系の動的状態を含む,幅広い種類の状態を扱うことができることが示された。

To obtain a complete description of a quantum system, one usually employs standard quantum state tomography, which however requires exponential number of measurements to perform and hence is impractical when the system's size grows large. In this work, we introduce a self-learning tomographic scheme based on the variational hybrid quantum-classical method. The key part of the scheme is a learning procedure, in which we learn a control sequence capable of driving the unknown target state coherently to a simple fiducial state, so that the target state can be directly reconstructed by applying the control sequence reversely. In this manner, the state tomography problem is converted to a state-to-state transfer problem. To solve the latter problem, we use the closed-loop learning control approach. Our scheme is further experimentally tested using techniques of a 4-qubit nuclear magnetic resonance. {Experimental results indicate that the proposed tomographic scheme can handle a broad class of states including entangled states in quantum information, as well as dynamical states of quantum many-body systems common to condensed matter physics.
翻訳日:2023-01-11 00:28:43 公開日:2020-01-16
# 一般語彙を用いた高速コンプライアンスチェック

Fast Compliance Checking with General Vocabularies ( http://arxiv.org/abs/2001.06322v1 )

ライセンス: Link先を確認
P. A. Bonatti, L. Ioffredo, I. M. Petrova, L. Sauro(参考訳) 我々は、個人データをウェブ上で処理・転送しながらGDPRに準拠する問題に対処する。 この目的のために、データ保護ポリシーを表現するためにOWL2の拡張可能なプロファイルを導入する。 この言語により、企業のデータ利用ポリシーは、データ対象者の同意、およびGDPRの形式化された断片をサブスクライブクエリによってチェックすることができる。 ポリシーの外部構造は、高周波データストリームや大規模なデータボリュームを処理する場合に必要となるように、コンプライアンスチェックを高度にスケーラブルにするために制限されている。 しかし、ポリシー特性を特定する語彙はOWL2の表現的なホーン断片からかなり自由に選択できる。 IBQ推論を利用して、ポリシー言語と語彙言語の特殊推論を統合します。 実験の結果,本手法は性能を著しく向上させることがわかった。

We address the problem of complying with the GDPR while processing and transferring personal data on the web. For this purpose we introduce an extensible profile of OWL2 for representing data protection policies. With this language, a company's data usage policy can be checked for compliance with data subjects' consent and with a formalized fragment of the GDPR by means of subsumption queries. The outer structure of the policies is restricted in order to make compliance checking highly scalable, as required when processing high-frequency data streams or large data volumes. However, the vocabularies for specifying policy properties can be chosen rather freely from expressive Horn fragments of OWL2. We exploit IBQ reasoning to integrate specialized reasoners for the policy language and the vocabulary's language. Our experiments show that this approach significantly improves performance.
翻訳日:2023-01-11 00:23:03 公開日:2020-01-16
# カリキュラムによる自己指導型視覚特徴学習

Self-supervised visual feature learning with curriculum ( http://arxiv.org/abs/2001.05634v1 )

ライセンス: Link先を確認
Vishal Keshav and Fabien Delattre(参考訳) 自己教師付き学習技術は、有意義な特徴表現を学ぶ能力を示している。 これは、入力または入力の一部間の相関を見つけることのみを必要とするプリテキストタスクでモデルをトレーニングすることで実現されている。 しかし、このようなプリテキストタスクは、低レベルなシグナルを避けるために、慎重に手動で選択する必要がある。 さらに、これらのショートカットを削除することで、意味的に価値のある情報が失われることがしばしばある。 下流タスクの学習速度に直接影響を与えることを示す。 本稿では,カリキュラム学習から着想を得て低レベル信号の段階的除去を行い,下流タスクの収束速度を大幅に向上させることを示す。

Self-supervised learning techniques have shown their abilities to learn meaningful feature representation. This is made possible by training a model on pretext tasks that only requires to find correlations between inputs or parts of inputs. However, such pretext tasks need to be carefully hand selected to avoid low level signals that could make those pretext tasks trivial. Moreover, removing those shortcuts often leads to the loss of some semantically valuable information. We show that it directly impacts the speed of learning of the downstream task. In this paper we took inspiration from curriculum learning to progressively remove low level signals and show that it significantly increase the speed of convergence of the downstream task.
翻訳日:2023-01-11 00:22:51 公開日:2020-01-16
# 動きの表現を再考する:3D ConvNet を用いた行動認識のための残像フレーム

Rethinking Motion Representation: Residual Frames with 3D ConvNets for Better Action Recognition ( http://arxiv.org/abs/2001.05661v1 )

ライセンス: Link先を確認
Li Tao, Xueting Wang, Toshihiko Yamasaki(参考訳) 近年,3次元畳み込みネットワークの動作認識性能が向上している。 しかし、性能向上のためにはまだ光学フローストリームが必要であり、そのコストは非常に高い。 本稿では,3D ConvNetの入力データとして残留フレームを利用する動画から,高速かつ効果的な動き特徴抽出手法を提案する。 従来の積み重ねられたRGBフレームを残留フレームに置き換えることで、UCF101データセットとHMDB51データセットでトップ1の精度よりも20.5%と12.5%の改善が達成される。 残差フレームは物体の出現に関する情報をほとんど含まないため、さらに2次元畳み込みネットワークを用いて外観特徴を抽出し、残差フレームの結果と組み合わせて2経路解を形成する。 3つのベンチマークデータセットにおいて、我々の2パスソリューションは、追加の光学フロー手法を使用したものよりも、より良いあるいは同等のパフォーマンスを達成した。 さらに解析した結果, 3次元コンベネットを用いた残差フレームを用いてより優れた動作特徴を抽出することができ, 既存のrgbフレーム入力モデルでは残差フレーム入力パスが適当であることがわかった。

Recently, 3D convolutional networks yield good performance in action recognition. However, optical flow stream is still needed to ensure better performance, the cost of which is very high. In this paper, we propose a fast but effective way to extract motion features from videos utilizing residual frames as the input data in 3D ConvNets. By replacing traditional stacked RGB frames with residual ones, 20.5% and 12.5% points improvements over top-1 accuracy can be achieved on the UCF101 and HMDB51 datasets when trained from scratch. Because residual frames contain little information of object appearance, we further use a 2D convolutional network to extract appearance features and combine them with the results from residual frames to form a two-path solution. In three benchmark datasets, our two-path solution achieved better or comparable performances than those using additional optical flow methods, especially outperformed the state-of-the-art models on Mini-kinetics dataset. Further analysis indicates that better motion features can be extracted using residual frames with 3D ConvNets, and our residual-frame-input path is a good supplement for existing RGB-frame-input models.
翻訳日:2023-01-11 00:22:42 公開日:2020-01-16
# scail: クラスインクリメンタル学習のためのスケーリングの重み付け

ScaIL: Classifier Weights Scaling for Class Incremental Learning ( http://arxiv.org/abs/2001.05755v1 )

ライセンス: Link先を確認
Eden Belouadah and Adrian Popescu(参考訳) インクリメンタル学習は、AIエージェントがストリームからデータを統合する必要がある場合に有用である。 エージェントが限られた計算予算で動作し、過去のデータの境界メモリを持つ場合、問題は自明ではない。 ディープラーニングのアプローチでは、一定の計算予算は、すべてのインクリメンタルな状態に対して固定されたアーキテクチャを使用する必要がある。 境界メモリは新しいクラスに有利なデータ不均衡を生成し、それらに対する予測バイアスが現れる。 このバイアスは、基本的なネットワークトレーニングに加えて、データバランシングのステップを導入することで対処される。 このアプローチから離れ、新しいクラスのクラスに匹敵するように、過去のクラス分類器の重み付けの単純かつ効率的なスケーリングを提案する。 スケーリングはインクリメンタルな状態レベルの統計を利用しており、クラスの初期状態で学んだ分類器に適用され、利用可能なすべてのデータから利益を得る。 また,境界メモリの存在下でのバニラ微調整と比較することにより,インクリメンタル学習アルゴリズムの広く用いられている蒸留損失成分の有用性を疑問視する。 4つのパブリックデータセットを使用して、競争ベースラインに対して評価を行う。 以上の結果から, 分類器のスケーリングと蒸留の除去が有用であることが示唆された。

Incremental learning is useful if an AI agent needs to integrate data from a stream. The problem is non trivial if the agent runs on a limited computational budget and has a bounded memory of past data. In a deep learning approach, the constant computational budget requires the use of a fixed architecture for all incremental states. The bounded memory generates data imbalance in favor of new classes and a prediction bias toward them appears. This bias is commonly countered by introducing a data balancing step in addition to the basic network training. We depart from this approach and propose simple but efficient scaling of past class classifier weights to make them more comparable to those of new classes. Scaling exploits incremental state level statistics and is applied to the classifiers learned in the initial state of classes in order to profit from all their available data. We also question the utility of the widely used distillation loss component of incremental learning algorithms by comparing it to vanilla fine tuning in presence of a bounded memory. Evaluation is done against competitive baselines using four public datasets. Results show that the classifier weights scaling and the removal of the distillation are both beneficial.
翻訳日:2023-01-11 00:21:39 公開日:2020-01-16
# フルモーションビデオにおけるシーン分類・検出・イベントの融合によるコンテキストセンス作成

Contextual Sense Making by Fusing Scene Classification, Detections, and Events in Full Motion Video ( http://arxiv.org/abs/2001.05979v1 )

ライセンス: Link先を確認
Marc Bosch, Joseph Nassar, Benjamin Ortiz, Brendan Lammers, David Lindenbaum, John Wahl, Robert Mangum, and Margaret Smith(参考訳) 画像センサの普及に伴い、マルチモーダル画像の容積は、人間の分析者が適切に利用し活用する能力を大きく上回っている。 フルモーションビデオ(FMV)は、大量の冗長な時間データを格納する余分な課題を持つ。 本研究では,航空FMVのデータの利用と活用に関する人間アナリストのニーズに対処することを目的とする。 我々は,fmvフィードの観測基準パターンから逸脱する事象や興味のある活動を検出するシステムの検討と設計を行った。 問題を,(1)コンテキスト認識,(2)オブジェクトカタログ化,(3)イベント検出の3つのタスクに分割した。 コンテキスト認識の目標は,映像データの視覚的検索と検出の問題を制約することにある。 カスタムイメージ分類器は、シーンを1つまたは複数のラベルで分類し、動作コンテキストと環境を識別する。 このステップは、ダウンストリームタスクのセマンティック検索スペースを減らし、精度を高めるのに役立つ。 第2のステップはオブジェクトカタログであり、オブジェクト検出器のアンサンブルが、現場で見つかった既知のオブジェクト(人、車、ボート、飛行機、建物など)を特定し、ラベル付けする。 最後に、コンテキスト情報と検出がイベント検出エンジンに送られ、特定の動作を監視する。 一連の分析は、オブジェクト数とオブジェクトインタラクションを追跡することで、シーンを監視します。 これらのオブジェクトのインタラクションが現在のシーンで一般的に観測されないと宣言された場合、システムはイベントを報告し、ジオロケーションし、ログする。 関心事には、会議や群衆としての人々の集まりの特定、海浜に船が積荷を降ろすときの警告、建物に入る人の数の増加、関心のある車から出入りする人などが含まれる。 地理的領域の異なる解像度の異なるセンサのデータに対して,本手法を適用した。

With the proliferation of imaging sensors, the volume of multi-modal imagery far exceeds the ability of human analysts to adequately consume and exploit it. Full motion video (FMV) possesses the extra challenge of containing large amounts of redundant temporal data. We aim to address the needs of human analysts to consume and exploit data given aerial FMV. We have investigated and designed a system capable of detecting events and activities of interest that deviate from the baseline patterns of observation given FMV feeds. We have divided the problem into three tasks: (1) Context awareness, (2) object cataloging, and (3) event detection. The goal of context awareness is to constraint the problem of visual search and detection in video data. A custom image classifier categorizes the scene with one or multiple labels to identify the operating context and environment. This step helps reducing the semantic search space of downstream tasks in order to increase their accuracy. The second step is object cataloging, where an ensemble of object detectors locates and labels any known objects found in the scene (people, vehicles, boats, planes, buildings, etc.). Finally, context information and detections are sent to the event detection engine to monitor for certain behaviors. A series of analytics monitor the scene by tracking object counts, and object interactions. If these object interactions are not declared to be commonly observed in the current scene, the system will report, geolocate, and log the event. Events of interest include identifying a gathering of people as a meeting and/or a crowd, alerting when there are boats on a beach unloading cargo, increased count of people entering a building, people getting in and/or out of vehicles of interest, etc. We have applied our methods on data from different sensors at different resolutions in a variety of geographical areas.
翻訳日:2023-01-11 00:21:00 公開日:2020-01-16
# a better boundが100ラウンドを提供:$f$-divergencesによるプライバシー保証強化

A Better Bound Gives a Hundred Rounds: Enhanced Privacy Guarantees via $f$-Divergences ( http://arxiv.org/abs/2001.05990v1 )

ライセンス: Link先を確認
Shahab Asoodeh, Jiachun Liao, Flavio P. Calmon, Oliver Kosut, Lalitha Sankar(参考訳) R'enyi差分プライバシー(RDP)のレベルを満たすメカニズムの最適な差分プライバシー(DP)パラメータを導出する。 我々の結果は、近似とR'enyiの差分プライバシーの変動を下支えする2つの$f$-divergencesの合同範囲に基づいている。 この結果をmoments accountant frameworkに適用し,確率的勾配降下のプライバシー保証を特徴付ける。 最新技術と比較すると、同じプライバシー予算でディープラーニングモデルをトレーニングするために、私たちの限界は100回ほど確率的な勾配降下イテレーションにつながります。

We derive the optimal differential privacy (DP) parameters of a mechanism that satisfies a given level of R\'enyi differential privacy (RDP). Our result is based on the joint range of two $f$-divergences that underlie the approximate and the R\'enyi variations of differential privacy. We apply our result to the moments accountant framework for characterizing privacy guarantees of stochastic gradient descent. When compared to the state-of-the-art, our bounds may lead to about 100 more stochastic gradient descent iterations for training deep learning models for the same privacy budget.
翻訳日:2023-01-11 00:13:14 公開日:2020-01-16
# aandp: prolog を利用した3段階変換による能動文と受動的文の変換

AandP: Utilizing Prolog for converting between active sentence and passive sentence with three-steps conversion ( http://arxiv.org/abs/2001.05672v1 )

ライセンス: Link先を確認
Trung Q. Tran(参考訳) 能動的文と受動的文の関係に関する英語文法の批判的側面の1つを,単純かつ効率的な解法として紹介する。 実際、アクティブな文とその対応する受動的文は同じ意味を表現しているが、その構造は異なる。 Prolog [4] と Definite Clause Grammars (DCG) [5] を併用して, 能動的文と受動的文の変換を行った。 余分な議論、余分な目標、語彙など、いくつかの高度な技術も使用されました。私は12の英語の時制、モーダル動詞、否定形など、活発でパッシブな文の様々なケースを解決しようと試みました。 詳細と私の貢献は以下のセクションで述べます。 ソースコードはhttps://github.com/tqtrunghnvn/activeandpassiveで入手できる。

I introduce a simple but efficient method to solve one of the critical aspects of English grammar which is the relationship between active sentence and passive sentence. In fact, an active sentence and its corresponding passive sentence express the same meaning, but their structure is different. I utilized Prolog [4] along with Definite Clause Grammars (DCG) [5] for doing the conversion between active sentence and passive sentence. Some advanced techniques were also used such as Extra Arguments, Extra Goals, Lexicon, etc. I tried to solve a variety of cases of active and passive sentences such as 12 English tenses, modal verbs, negative form, etc. More details and my contributions will be presented in the following sections. The source code is available at https://github.com/tqtrunghnvn/ActiveAndPassive.
翻訳日:2023-01-11 00:12:40 公開日:2020-01-16
# オランダ医療記録の同定のためのルールベース,特徴ベース,ディープニューラル手法の比較

Comparing Rule-based, Feature-based and Deep Neural Methods for De-identification of Dutch Medical Records ( http://arxiv.org/abs/2001.05714v1 )

ライセンス: Link先を確認
Jan Trienes, Dolf Trieschnigg, Christin Seifert, Djoerd Hiemstra(参考訳) 電子健康記録の構造化されていない情報は、医療研究に貴重なリソースを提供する。 患者の機密性を保護し、プライバシ規則に従うために、これらの医療記録から個人識別情報を自動削除する。 しかし、ラベル付きデータの有効性のため、既存の研究のほとんどは英語の医学文献に限られており、言語やドメイン間での非識別法の一般化についてはほとんど知られていない。 本研究は,オランダの9施設と3つの医療領域のデータをサンプリングし,1260人の医療記録からなる多様なデータセットを構築した。 言語とドメイン間での3つの非識別手法の一般化性をテストする。 本実験は,オランダ語に特化して開発された既存のルールベース手法が,この新しいデータに一般化できないことを示す。 さらに、最先端のニューラルネットワークアーキテクチャは、限られたトレーニングデータでも、言語やドメイン間で強く機能する。 機能ベースおよびルールベースメソッドと比較して、ニューラルメソッドは設定作業とドメイン知識の大幅な削減を必要とする。 すべてのコードと事前訓練された非識別モデルを研究コミュニティに提供し、実践者がデータセットに適用し、将来のベンチマークを可能にする。

Unstructured information in electronic health records provide an invaluable resource for medical research. To protect the confidentiality of patients and to conform to privacy regulations, de-identification methods automatically remove personally identifying information from these medical records. However, due to the unavailability of labeled data, most existing research is constrained to English medical text and little is known about the generalizability of de-identification methods across languages and domains. In this study, we construct a varied dataset consisting of the medical records of 1260 patients by sampling data from 9 institutes and three domains of Dutch healthcare. We test the generalizability of three de-identification methods across languages and domains. Our experiments show that an existing rule-based method specifically developed for the Dutch language fails to generalize to this new data. Furthermore, a state-of-the-art neural architecture performs strongly across languages and domains, even with limited training data. Compared to feature-based and rule-based methods the neural method requires significantly less configuration effort and domain-knowledge. We make all code and pre-trained de-identification models available to the research community, allowing practitioners to apply them to their datasets and to enable future benchmarks.
翻訳日:2023-01-11 00:12:06 公開日:2020-01-16
# 局所的意味対応による辞書定義を用いた語彙セメム予測

Lexical Sememe Prediction using Dictionary Definitions by Capturing Local Semantic Correspondence ( http://arxiv.org/abs/2001.05954v1 )

ライセンス: Link先を確認
Jiaju Du, Fanchao Qi, Maosong Sun, Zhiyuan Liu(参考訳) セメムは言語学における人間の言語の最小の意味単位として定義されており、多くのNLPタスクにおいて有用であることが証明されている。 セメム知識ベース(KB)のマニュアル構築と更新はコストがかかるため,セメムアノテーションを支援するために,セメムの自動予測タスクが提案されている。 本稿では,無意味な単語に対するセメムの予測に辞書定義を適用するアプローチについて検討する。 各単語のセメムは通常、辞書定義において異なる単語にセマンティックに一致することが分かり、このマッチング関係の局所意味対応を命名する。 そこで我々は,このようなマッチングを捕捉し,セメムを予測できるセメム対応ポーリング(SCorP)モデルを提案する。 我々は,有名なSememe KB HowNetのモデルとベースライン手法を評価し,そのモデルが最先端のパフォーマンスを実現することを発見した。 さらに,さらに定量的分析により,セメムと単語間の局所的意味対応を辞書定義で適切に学習できることが示され,本モデルの有効性が説明できる。 本論文のソースコードはhttps://github.com/thunlp/scorpから取得できる。

Sememes, defined as the minimum semantic units of human languages in linguistics, have been proven useful in many NLP tasks. Since manual construction and update of sememe knowledge bases (KBs) are costly, the task of automatic sememe prediction has been proposed to assist sememe annotation. In this paper, we explore the approach of applying dictionary definitions to predicting sememes for unannotated words. We find that sememes of each word are usually semantically matched to different words in its dictionary definition, and we name this matching relationship local semantic correspondence. Accordingly, we propose a Sememe Correspondence Pooling (SCorP) model, which is able to capture this kind of matching to predict sememes. We evaluate our model and baseline methods on a famous sememe KB HowNet and find that our model achieves state-of-the-art performance. Moreover, further quantitative analysis shows that our model can properly learn the local semantic correspondence between sememes and words in dictionary definitions, which explains the effectiveness of our model. The source codes of this paper can be obtained from https://github.com/thunlp/scorp.
翻訳日:2023-01-11 00:11:48 公開日:2020-01-16
# 強化された決定木からさらに抽出する:高エネルギー物理ケーススタディ

Extracting more from boosted decision trees: A high energy physics case study ( http://arxiv.org/abs/2001.06033v1 )

ライセンス: Link先を確認
Vidhi Lalchand(参考訳) 粒子識別は、LHC(Large Hadron Collider)のデータ分析パイプラインにおける中核的なタスクの1つである。 統計的には、これは前者の特性を模倣する巨大な背景に埋もれた稀な信号事象を識別する。 機械学習の用語では、粒子識別は重複クラスと不均衡クラスを特徴とする分類問題を表す。 押し上げ決定木(BDT)は粒子識別領域において大きな成功を収めてきたが、最近では深層学習(DNN)アプローチに隠れている。 本研究は, 主要な弱点, 過度な適合性をターゲットとして, 標準の強化された決定木からより多くを抽出するアルゴリズムを提案する。 2014年のhiggs ml challenge (adam-bourdarios et al., 2015) の対象となったatlas higgs (h) to tau-tau data set (atlas et al., 2014) で非常にうまく機能する。 2018年(cms collaboration et al., 2017)、2016年のデータ取得期間に基づく4.9$\sigma$の重要度で、tau leptonsに対するhiggsの崩壊が確立されたが、2014年の公開データセットは、教師付き分類スキームのパフォーマンスをテストするベンチマークデータセットとして機能し続けている。 提案アルゴリズムにより達成されたスコアは,ディープニューラルネットワーク(DNN)のアンサンブルを利用した,発行された勝利スコアに非常に近いことを示す。 本稿では,1つの応用に焦点をあてるが,この単純で堅牢な手法は高エネルギー物理学に広く応用されることが期待される。

Particle identification is one of the core tasks in the data analysis pipeline at the Large Hadron Collider (LHC). Statistically, this entails the identification of rare signal events buried in immense backgrounds that mimic the properties of the former. In machine learning parlance, particle identification represents a classification problem characterized by overlapping and imbalanced classes. Boosted decision trees (BDTs) have had tremendous success in the particle identification domain but more recently have been overshadowed by deep learning (DNNs) approaches. This work proposes an algorithm to extract more out of standard boosted decision trees by targeting their main weakness, susceptibility to overfitting. This novel construction harnesses the meta-learning techniques of boosting and bagging simultaneously and performs remarkably well on the ATLAS Higgs (H) to tau-tau data set (ATLAS et al., 2014) which was the subject of the 2014 Higgs ML Challenge (Adam-Bourdarios et al., 2015). While the decay of Higgs to a pair of tau leptons was established in 2018 (CMS collaboration et al., 2017) at the 4.9$\sigma$ significance based on the 2016 data taking period, the 2014 public data set continues to serve as a benchmark data set to test the performance of supervised classification schemes. We show that the score achieved by the proposed algorithm is very close to the published winning score which leverages an ensemble of deep neural networks (DNNs). Although this paper focuses on a single application, it is expected that this simple and robust technique will find wider applications in high energy physics.
翻訳日:2023-01-11 00:05:38 公開日:2020-01-16
# 置換テストによるパーシステンスペアリングのパワーの理解

Understanding the Power of Persistence Pairing via Permutation Test ( http://arxiv.org/abs/2001.06058v1 )

ライセンス: Link先を確認
Chen Cai, Yusu Wang(参考訳) 近年、トポロジ的データ分析(TDA)の主要なツールである永続化ダイアグラムを機械学習パイプラインに組み込むことに多くの取り組みがなされている。 永続性図のパワーと限界をよりよく理解するために、グラフデータと形状データの両方で様々な実験を行い、関連する要因を分離し、検査することを目的としている。 この目的のために、臨界値と臨界値のペアリングを記述するための永続化ダイアグラムのいわゆる 'emph{permutation test' も提案する。 グラフ分類タスクでは、パーシステンスペアリングは様々なベンチマークデータセットに対して一貫した改善をもたらすが、様々なフィルタ関数のテストでは、ほとんどの識別力は臨界値から生じる。 しかし,形状分割と分類では,パーシステンスペアリングは,ベンチマークデータセットのほとんどにおいて大きなパワーを示し,単に臨界値と置換テストに基づいて,両方の要約を改善できる点に注意が必要である。 私たちの結果は、永続化図に基づく要約がより適切になるかどうかについての洞察を提供するのに役立ちます。

Recently many efforts have been made to incorporate persistence diagrams, one of the major tools in topological data analysis (TDA), into machine learning pipelines. To better understand the power and limitation of persistence diagrams, we carry out a range of experiments on both graph data and shape data, aiming to decouple and inspect the effects of different factors involved. To this end, we also propose the so-called \emph{permutation test} for persistence diagrams to delineate critical values and pairings of critical values. For graph classification tasks, we note that while persistence pairing yields consistent improvement over various benchmark datasets, it appears that for various filtration functions tested, most discriminative power comes from critical values. For shape segmentation and classification, however, we note that persistence pairing shows significant power on most of the benchmark datasets, and improves over both summaries based on merely critical values, and those based on permutation tests. Our results help provide insights on when persistence diagram based summaries could be more suitable.
翻訳日:2023-01-11 00:05:07 公開日:2020-01-16
# 小型電子鼻システムによるワイン品質迅速検出:酢酸による腐敗閾値に着目した応用

Wine quality rapid detection using a compact electronic nose system: application focused on spoilage thresholds by acetic acid ( http://arxiv.org/abs/2001.06323v1 )

ライセンス: Link先を確認
Juan C. Rodriguez Gamboa, Eva Susana Albarracin E., Adenilton J. da Silva, Luciana Leite, Tiago A. E. Ferreira(参考訳) ワイン業界にとって、ワイン中の酢酸のしきい値をリアルタイムに監視し、腐敗を防ぎ、品質を決定するための電子鼻システム(e-noses)のような方法を持つことは重要である。 本稿では,薄膜半導体(SnO2)センサをベースとした携帯型でコンパクトなE-Noseを,深層パーセプトロン(MLP)ニューラルネットワークを用いて学習することにより,ワイン品質管理のルーチンタスクにおいて,ワインの劣化閾値を早期に検出できることを示す。 高速かつオンラインな検出を実現するため,センサ信号の早期部分の認識性能を向上させるために,生データ処理に着目した上昇ウィンドウを提案する。 提案手法は,SVM(Support Vector Machine)分類器の後継となる,前処理データの特徴抽出と選択技術を含むガス認識のためのE-Nosesの従来手法と比較した。 その結果, ガス注入点の2.7秒後に, 従来の方法の63倍の速度で3種類のワインの腐敗レベルを分類できることがわかった。

It is crucial for the wine industry to have methods like electronic nose systems (E-Noses) for real-time monitoring thresholds of acetic acid in wines, preventing its spoilage or determining its quality. In this paper, we prove that the portable and compact self-developed E-Nose, based on thin film semiconductor (SnO2) sensors and trained with an approach that uses deep Multilayer Perceptron (MLP) neural network, can perform early detection of wine spoilage thresholds in routine tasks of wine quality control. To obtain rapid and online detection, we propose a method of rising-window focused on raw data processing to find an early portion of the sensor signals with the best recognition performance. Our approach was compared with the conventional approach employed in E-Noses for gas recognition that involves feature extraction and selection techniques for preprocessing data, succeeded by a Support Vector Machine (SVM) classifier. The results evidence that is possible to classify three wine spoilage levels in 2.7 seconds after the gas injection point, implying in a methodology 63 times faster than the results obtained with the conventional approach in our experimental setup.
翻訳日:2023-01-11 00:04:32 公開日:2020-01-16
# LE-HGR:組み込みARデバイスのための軽量かつ効率的なRGBベースのオンラインジェスチャー認識ネットワーク

LE-HGR: A Lightweight and Efficient RGB-based Online Gesture Recognition Network for Embedded AR Devices ( http://arxiv.org/abs/2001.05654v1 )

ライセンス: Link先を確認
Hongwei Xie, Jiafang Wang, Baitao Shao, Jian Gu, Mingyang Li(参考訳) オンラインハンドジェスチャ認識(hgr)技術は、自然な人間とコンピュータの対話とコミュニケーションを可能にするために拡張現実(ar)アプリケーションにおいて不可欠である。 近年、低価格arデバイスの消費者市場は急速に成長しているが、この分野の技術成熟度はまだ限られている。 これらのデバイスは、低価格、限られたメモリ、リソース制限された計算ユニットの典型であり、オンラインHGRは難しい問題である。 そこで本研究では,低消費電力な組込みデバイス上でのリアルタイムジェスチャー認識を実現するために,軽量で計算効率のよいHGRフレームワークLE-HGRを提案する。 また,提案手法は高精度かつロバストであり,様々な複雑な相互作用環境において,高性能な性能が得られることを示す。 この目的を達成するために,我々はまず,オンライン上でのハンド検出とレグレッシブハンドキーポイントの確率を同時に予測するカスケードマルチタスク畳み込みニューラルネットワーク(cnn)を提案する。 提案するカスケードアーキテクチャ設計により, 偽陽性推定が大幅に除去可能であることを示す。 さらに,マルチハンドネスの干渉に対処する予測位置からハンドトレースを追跡するために,関連するマッピングアプローチが導入された。 次に、追跡されたトレースの動作特徴を利用して手の動きを認識するトレースシーケンスニューラルネットワーク(TraceSeqNN)を提案する。 最後に,モバイル機器やAR/VRヘッドセットなどの低コストな商用機器において,リアルタイムなアプリケーションを実現するための重要な特性である計算コストを大幅に削減して,最先端の精度を実現することができることを示す。

Online hand gesture recognition (HGR) techniques are essential in augmented reality (AR) applications for enabling natural human-to-computer interaction and communication. In recent years, the consumer market for low-cost AR devices has been rapidly growing, while the technology maturity in this domain is still limited. Those devices are typical of low prices, limited memory, and resource-constrained computational units, which makes online HGR a challenging problem. To tackle this problem, we propose a lightweight and computationally efficient HGR framework, namely LE-HGR, to enable real-time gesture recognition on embedded devices with low computing power. We also show that the proposed method is of high accuracy and robustness, which is able to reach high-end performance in a variety of complicated interaction environments. To achieve our goal, we first propose a cascaded multi-task convolutional neural network (CNN) to simultaneously predict probabilities of hand detection and regress hand keypoint locations online. We show that, with the proposed cascaded architecture design, false-positive estimates can be largely eliminated. Additionally, an associated mapping approach is introduced to track the hand trace via the predicted locations, which addresses the interference of multi-handedness. Subsequently, we propose a trace sequence neural network (TraceSeqNN) to recognize the hand gesture by exploiting the motion features of the tracked trace. Finally, we provide a variety of experimental results to show that the proposed framework is able to achieve state-of-the-art accuracy with significantly reduced computational cost, which are the key properties for enabling real-time applications in low-cost commercial devices such as mobile devices and AR/VR headsets.
翻訳日:2023-01-11 00:03:09 公開日:2020-01-16
# マーカーレス深層学習に基づくrgbデータを用いた移動ロボットの6自由度推定

A Markerless Deep Learning-based 6 Degrees of Freedom PoseEstimation for with Mobile Robots using RGB Data ( http://arxiv.org/abs/2001.05703v1 )

ライセンス: Link先を確認
Linh K\"astner, Daniel Dimitrov, Jens Lambrecht(参考訳) 拡張現実(Augmented Reality)は、人間のマシンインタラクションと理解を強化する能力のために、業界内で様々な統合作業の対象となっている。 ニューラルネットワークは、拡張現実(Augmented Reality)体験の強化を支援し、促進する大きな可能性を秘めているコンピュータビジョンの分野で、驚くべき成果を上げている。 しかし、ほとんどのニューラルネットワークは計算量が多く、膨大な処理能力を必要とするため、拡張現実デバイスへのデプロイには適していない。 本研究では,拡張現実デバイス上でリアルタイム3dオブジェクトローカライズを行うための,アートニューラルネットワークの状態を展開する手法を提案する。 その結果,より自動化されたモバイルロボットシステムによるARデバイスの校正方法が得られた。 キャリブレーションプロセスを高速化し、ユーザエクスペリエンスを向上させるために、2d入力のみを使用してオブジェクトの3dポーズを迅速かつ正確に抽出する高速2d検出アプローチに注目する。 結果は、直感的なロボット制御とセンサーデータ可視化のための拡張現実アプリケーションに実装される。 2D画像の6Dアノテーションとして,私たちの知る限り,最初のオープンソースツールであるアノテーションツールを開発した。 我々は、あらゆるarデバイスに適用可能な実現可能な結果を達成し、高需要のニューラルネットワークとモノのインターネットデバイスを組み合わせたさらなる研究に有望である。

Augmented Reality has been subject to various integration efforts within industries due to its ability to enhance human machine interaction and understanding. Neural networks have achieved remarkable results in areas of computer vision, which bear great potential to assist and facilitate an enhanced Augmented Reality experience. However, most neural networks are computationally intensive and demand huge processing power thus, are not suitable for deployment on Augmented Reality devices. In this work we propose a method to deploy state of the art neural networks for real time 3D object localization on augmented reality devices. As a result, we provide a more automated method of calibrating the AR devices with mobile robotic systems. To accelerate the calibration process and enhance user experience, we focus on fast 2D detection approaches which are extracting the 3D pose of the object fast and accurately by using only 2D input. The results are implemented into an Augmented Reality application for intuitive robot control and sensor data visualization. For the 6D annotation of 2D images, we developed an annotation tool, which is, to our knowledge, the first open source tool to be available. We achieve feasible results which are generally applicable to any AR device thus making this work promising for further research in combining high demanding neural networks with Internet of Things devices.
翻訳日:2023-01-11 00:02:42 公開日:2020-01-16
# 音楽信号解析におけるマルコフ論理ネットワークの適用性に関する批判的考察

A Critical Look at the Applicability of Markov Logic Networks for Music Signal Analysis ( http://arxiv.org/abs/2001.06086v1 )

ライセンス: Link先を確認
Johan Pauwels, Gy\"orgy Fazekas, Mark B. Sandler(参考訳) 近年、マルコフ論理ネットワーク (MLN) は、音楽信号解析に有用なパラダイムとして提案されている。 すべての隠れマルコフモデルはMLNとして再編成できるため、後者は、フィールドでの以前の作業を再利用し拡張する全アクセスフレームワークを提供することができる。 しかし、理論上はMLNとして過去の作品を再構成できるからといって、それが有利であるという意味ではない。 本稿では,音楽分析のためのmlnの例をいくつか分析し,(動的)ベイズネットワークと同様の音楽依存関係を定式化した場合の実用上の欠点について考察する。 我々は、列のサポートの欠如や任意の連続確率分布の欠如など、多くの実践的ハードルが、MLNが要求される推論アルゴリズムによる定式化や計算の容易性の両方において、提案された音楽アプリケーションに理想的でないことを論じる。 これらの結論は音楽に特有ではなく、他の分野にも当てはまる。 最後に,提案した例の根底にある概念がベイズネットワークのより一般的な(動的)フレームワークで完全に表現可能であることを示す。

In recent years, Markov logic networks (MLNs) have been proposed as a potentially useful paradigm for music signal analysis. Because all hidden Markov models can be reformulated as MLNs, the latter can provide an all-encompassing framework that reuses and extends previous work in the field. However, just because it is theoretically possible to reformulate previous work as MLNs, does not mean that it is advantageous. In this paper, we analyse some proposed examples of MLNs for musical analysis and consider their practical disadvantages when compared to formulating the same musical dependence relationships as (dynamic) Bayesian networks. We argue that a number of practical hurdles such as the lack of support for sequences and for arbitrary continuous probability distributions make MLNs less than ideal for the proposed musical applications, both in terms of easy of formulation and computational requirements due to their required inference algorithms. These conclusions are not specific to music, but apply to other fields as well, especially when sequential data with continuous observations is involved. Finally, we show that the ideas underlying the proposed examples can be expressed perfectly well in the more commonly used framework of (dynamic) Bayesian networks.
翻訳日:2023-01-11 00:02:01 公開日:2020-01-16
# 見えない3次元物体の物理動力学予測

Predicting the Physical Dynamics of Unseen 3D Objects ( http://arxiv.org/abs/2001.06291v1 )

ライセンス: Link先を確認
Davis Rempe, Srinath Sridhar, He Wang, Leonidas J. Guibas(参考訳) 物理的相互作用が以前見えないオブジェクトインスタンスのダイナミクスに与える影響を予測するマシンは、より良いロボットやインタラクティブな仮想世界を作るのに重要である。 本研究では, インパルス力を受ける平面上での3次元物体の動的挙動の予測に焦点をあてる。 特に, 3次元位置, 回転, 速度, 安定性などの状態変化を予測する。 従来の研究と異なり、本手法はトレーニング中に見つからなかった物体形状や初期条件への動的予測を一般化することができる。 本手法は,3次元物体の形状を点雲とし,その初期線形および角速度を入力とする。 形状特徴を抽出し,再帰的ニューラルネットワークを用いて時間ステップ毎に状態の完全な変化を予測する。 我々のモデルは物理エンジンと実世界の両方のデータによるトレーニングをサポートすることができる。 実験により,被写体ジオメトリおよび初期条件の状態変化を正確に予測できることが示されている。

Machines that can predict the effect of physical interactions on the dynamics of previously unseen object instances are important for creating better robots and interactive virtual worlds. In this work, we focus on predicting the dynamics of 3D objects on a plane that have just been subjected to an impulsive force. In particular, we predict the changes in state - 3D position, rotation, velocities, and stability. Different from previous work, our approach can generalize dynamics predictions to object shapes and initial conditions that were unseen during training. Our method takes the 3D object's shape as a point cloud and its initial linear and angular velocities as input. We extract shape features and use a recurrent neural network to predict the full change in state at each time step. Our model can support training with data from both a physics engine or the real world. Experiments show that we can accurately predict the changes in state for unseen object geometries and initial conditions.
翻訳日:2023-01-10 23:55:49 公開日:2020-01-16
# 適合度依存オプティマイザアルゴリズムの改良

Improved Fitness-Dependent Optimizer Algorithm ( http://arxiv.org/abs/2001.11820v1 )

ライセンス: Link先を確認
Danial A. Muhammed, Soran AM. Saeed, Tarik A. Rashid(参考訳) フィットネス依存オプティマイザ(FDO)アルゴリズムは、2019年に導入された。 改良されたFDO (IFDO) アルゴリズムが提案され、このアルゴリズムは、複雑な最適化問題に対処する元のFDOの能力を改善するのに大いに貢献する。 FDOを改善するために、IFDOはアライメントと凝集度を計算し、FDOがその位置を更新するペースでこれらの挙動を使用する。 さらに、重みを決定する際、FDOは重み係数(wf)を使用し、これはほとんどの場合ゼロであり、わずか数ケースで1つである。 逆に、IFDOは[0-1]範囲でwfランダム化を行い、より良いフィットネスウェイト値が達成された場合の範囲を最小化する。 本研究では,IFDOアルゴリズムとその最適解に収束する手法を示す。 さらに、19の古典的標準テスト関数群を用いてIFDOを試験し、FDOおよび他のよく知られた3つのアルゴリズム、すなわちパーティクルスウォームアルゴリズム(PSO)、トンボアルゴリズム(DA)、遺伝的アルゴリズム(GA)を選択してIFDO結果を評価する。 さらに、IEEE Congress of Evolutionary Computationベンチマークテスト関数のセットであるCECC06 2019コンペティションがIFDOのテストに利用され、その後、FDOと最近の3つのアルゴリズムであるSalp Swarm Algorithm(SSA)、DA、およびWOAがIFDOの結果を測定するために選択される。 その結果、IFDOは実用的であり、ほとんどのケースで改善されている。 最後に、IFDOの実践性を証明するために、実世界のアプリケーションで使用される。

The fitness-dependent optimizer (FDO) algorithm was recently introduced in 2019. An improved FDO (IFDO) algorithm is presented in this work, and this algorithm contributes considerably to refining the ability of the original FDO to address complicated optimization problems. To improve the FDO, the IFDO calculates the alignment and cohesion and then uses these behaviors with the pace at which the FDO updates its position. Moreover, in determining the weights, the FDO uses the weight factor (wf), which is zero in most cases and one in only a few cases. Conversely, the IFDO performs wf randomization in the [0-1] range and then minimizes the range when a better fitness weight value is achieved. In this work, the IFDO algorithm and its method of converging on the optimal solution are demonstrated. Additionally, 19 classical standard test function groups are utilized to test the IFDO, and then the FDO and three other well-known algorithms, namely, the particle swarm algorithm (PSO), dragonfly algorithm (DA), and genetic algorithm (GA), are selected to evaluate the IFDO results. Furthermore, the CECC06 2019 Competition, which is the set of IEEE Congress of Evolutionary Computation benchmark test functions, is utilized to test the IFDO, and then, the FDO and three recent algorithms, namely, the salp swarm algorithm (SSA), DA and whale optimization algorithm (WOA), are chosen to gauge the IFDO results. The results show that IFDO is practical in some cases, and its results are improved in most cases. Finally, to prove the practicability of the IFDO, it is used in real-world applications.
翻訳日:2023-01-10 23:55:35 公開日:2020-01-16
# 人材管理エキスパートシステムとしての能力評価 : 数学的アプローチ

Competence Assessment as an Expert System for Human Resource Management: A Mathematical Approach ( http://arxiv.org/abs/2001.09797v1 )

ライセンス: Link先を確認
Mahdi Bohlouli, Nikolaos Mittas, George Kakarontzas, Theodosios Theodosiou, Lefteris Angelis, Madjid Fathi(参考訳) 効率的な人材管理には、利用可能な能力の正確な評価と表現と、特定の仕事や地位に必要な能力の効果的なマッピングが必要である。 この点において、能力ギャップの適切な定義と識別は、獲得した能力と要求された能力の差を表す。 数学的アプローチとともに詳細な定量化スキームを使用することは、様々な分野や分野に適用可能な、正確な能力分析をサポートする方法である。 本稿では,人間資源情報システムの能力評価・分析におけるソフトウェア技術と数学的・統計的手法の組み合わせについて述べる。 提案するフレームワークは,プロフェッショナル,イノベーティブ,社会的能力木(Professional, Innovative, Social competence tree)と呼ばれる標準的な能力モデルに基づいて,企業環境の専門家に柔軟なツールを提供する。 このシステムは、ComProFITSと呼ばれる欧州プロジェクトのフレーム内の実際の人的資源データセットでテストされている。

Efficient human resource management needs accurate assessment and representation of available competences as well as effective mapping of required competences for specific jobs and positions. In this regard, appropriate definition and identification of competence gaps express differences between acquired and required competences. Using a detailed quantification scheme together with a mathematical approach is a way to support accurate competence analytics, which can be applied in a wide variety of sectors and fields. This article describes the combined use of software technologies and mathematical and statistical methods for assessing and analyzing competences in human resource information systems. Based on a standard competence model, which is called a Professional, Innovative and Social competence tree, the proposed framework offers flexible tools to experts in real enterprise environments, either for evaluation of employees towards an optimal job assignment and vocational training or for recruitment processes. The system has been tested with real human resource data sets in the frame of the European project called ComProFITS.
翻訳日:2023-01-10 23:55:06 公開日:2020-01-16
# 医学における知識管理の実践的アプローチ

Practical Approach of Knowledge Management in Medical Science ( http://arxiv.org/abs/2001.09795v1 )

ライセンス: Link先を確認
Mahdi Bohlouli, Patrick Uhr, Fabian Merges, Sanaz Mohammad Hassani, Madjid Fathi(参考訳) 知識組織、インフラ、知識に基づく活動はすべて、新しい企業のためのビジネス戦略の作成に役立ちます。 本稿では,まず,知識ベースシステムの基礎について述べる。 その後、知識管理(KM)実装の実践的な問題と課題が説明される。 最後に、異なる知識に基づくプロジェクトの比較と、それらの実装、技術、結果に関する抽象化された情報を紹介する。 これらのプロジェクトのほとんどが医学の分野にある。 さまざまなKMプロジェクトの研究と評価に基づいて、KMはあらゆる科学、産業、ビジネスで利用されていると結論づける。 しかし、医学や生活支援プロジェクトにおけるその重要性は、今日ではほとんどの研究機関で強調されている。 ほとんどの医療センターは、将来のイノベーションとサポートのために、ポータルや知識の学習技術のような知識ベースのサービスを使うことに興味を持っている。

Knowledge organization, infrastructure, and knowledge-based activities are all subjects that help in the creation of business strategies for the new enterprise. In this paper, the first basics of knowledge-based systems are studied. Practical issues and challenges of Knowledge Management (KM) implementations are then illustrated. Finally, a comparison of different knowledge-based projects is presented along with abstracted information on their implementation, techniques, and results. Most of these projects are in the field of medical science. Based on our study and evaluation of different KM projects, we conclude that KM is being used in every science, industry, and business. But its importance in medical science and assisted living projects are highlighted nowadays with the most of research institutes. Most medical centers are interested in using knowledge-based services like portals and learning techniques of knowledge for their future innovations and supports.
翻訳日:2023-01-10 23:54:37 公開日:2020-01-16
# 社会的感情を考慮したBitcoin価格の予測分析

Predictive analysis of Bitcoin price considering social sentiments ( http://arxiv.org/abs/2001.10343v1 )

ライセンス: Link先を確認
Pratikkumar Prajapati(参考訳) われわれは、ニュースやソーシャルメディアにおける感情分析を使ってbitcoinの価格を分析、予測している。 bitcoinは主要な暗号通貨であり、デジタル通貨の中でもっとも時価総額が高い。 bitcoinの価値を予測することは、潜在的な市場の動きとテクノロジーの将来の成長を理解し予測するのに役立つかもしれない。 天気のような(主に)繰り返される現象とは異なり、暗号通貨の価値は繰り返しパターンに従わず、Bitcoinの過去の価値は将来のBitcoinの価値の秘密を明かさない。 人間は市場に投資するために一般的な感情と技術分析に従う。 したがって、人々の感情を考えると、かなりの予測ができます。 私たちは、将来のBitcoinの価値を予測する機能として、ソーシャルな感情を使うことに重点を置いています。 ソーシャルな感情は、将来のBitcoinの価値がどう動くかをよく見積もっている。 我々は、各種暗号通貨の歴史的価格、ニュース記事の感情、Reddit投稿の感情を入力するLSTMを用いて、最低の434.87のRMSEを達成する。

We report on the use of sentiment analysis on news and social media to analyze and predict the price of Bitcoin. Bitcoin is the leading cryptocurrency and has the highest market capitalization among digital currencies. Predicting Bitcoin values may help understand and predict potential market movement and future growth of the technology. Unlike (mostly) repeating phenomena like weather, cryptocurrency values do not follow a repeating pattern and mere past value of Bitcoin does not reveal any secret of future Bitcoin value. Humans follow general sentiments and technical analysis to invest in the market. Hence considering people's sentiment can give a good degree of prediction. We focus on using social sentiment as a feature to predict future Bitcoin value, and in particular, consider Google News and Reddit posts. We find that social sentiment gives a good estimate of how future Bitcoin values may move. We achieve the lowest test RMSE of 434.87 using an LSTM that takes as inputs the historical price of various cryptocurrencies, the sentiment of news articles and the sentiment of Reddit posts.
翻訳日:2023-01-10 23:54:27 公開日:2020-01-16
# 高次元一般化線形モデル学習のための支援検出とルート探索手法

A Support Detection and Root Finding Approach for Learning High-dimensional Generalized Linear Models ( http://arxiv.org/abs/2001.05819v1 )

ライセンス: Link先を確認
Jian Huang, Yuling Jiao, Lican Kang, Jin Liu, Yanyan Liu, Xiliang Lu(参考訳) 特徴の選択は、変数の数がサンプルサイズよりもはるかに大きい高次元データのモデリングにおいて重要である。 本稿では,高次元スパース一般化線形モデルを学ぶための支援検出とルート探索手法を開発し,gsdarを用いてこの手法を示す。 GSDARは、$\ell_0$-penalized maximum max estimationsのKKT条件に基づいて、反復的に推定子の列を生成する。 目標係数の最大度関数とスパーシティ仮定に関するいくつかの制限された可逆性条件の下では、提案する推定誤差は最適次数に指数関数的に減少する。 さらに、ターゲット信号が検出可能なレベルよりも強い場合、oracle estimatorを回収することができる。 本稿では,Lasso や MCP などの既存手法に対する提案手法の利点を説明するため,シミュレーションと実データ解析を行う。

Feature selection is important for modeling high-dimensional data, where the number of variables can be much larger than the sample size. In this paper, we develop a support detection and root finding procedure to learn the high dimensional sparse generalized linear models and denote this method by GSDAR. Based on the KKT condition for $\ell_0$-penalized maximum likelihood estimations, GSDAR generates a sequence of estimators iteratively. Under some restricted invertibility conditions on the maximum likelihood function and sparsity assumption on the target coefficients, the errors of the proposed estimate decays exponentially to the optimal order. Moreover, the oracle estimator can be recovered if the target signal is stronger than the detectable level. We conduct simulations and real data analysis to illustrate the advantages of our proposed method over several existing methods, including Lasso and MCP.
翻訳日:2023-01-10 23:53:51 公開日:2020-01-16
# トータルクラウドカバー予測のための機械学習

Machine learning for total cloud cover prediction ( http://arxiv.org/abs/2001.05948v1 )

ライセンス: Link先を確認
\'Agnes Baran, Sebastian Lerch, Mehrez El Ayari and S\'andor Baran(参考訳) 全雲カバー(TCC)の正確な予測は、天文学、エネルギー需要、生産、農業など多くの分野において不可欠である。 しかし、ほとんどの気象センターはTCCのアンサンブル予測を発行しているが、これらの予測は他の気象変数のアンサンブル予測よりも悪い予測スキルを示すことが多い。 したがって、予測性能を改善するためには、ある種の後処理が必要である。 TCCの観測は通常、オクタスと呼ばれる9つの異なる値を取る離散スケールで報告されるが、TCCのアンサンブル予測の統計的キャリブレーションはオクタスの確率によって与えられる出力の分類問題とみなすことができる。 これは機械学習手法が適用される古典的な分野である。 本稿では,多層パーセプトロン(MLP)ニューラルネットワーク,勾配促進機(GBM)およびランダムフォレスト(RF)法を用いた後処理の性能について検討する。 The European Centre for Medium-Range Weather Forecasts Global TCC アンサンブル予測(2002-2014)に基づいて、これらのアプローチを、比例オッズロジスティック回帰(POLR)モデルとマルチクラスロジスティック回帰(MLR)モデル、および生TCC アンサンブル予測と比較する。 さらに,降水予報を付加予測器として組み込むことにより,予報スキルの向上が図れるかについても検討する。 生のアンサンブルと比較して、全てのキャリブレーション手法は予測スキルが大幅に向上する。 RFモデルは予測性能を最小限に向上させるが、MPP、POLR、GBMのアプローチは最適である。 降水予測データの利用は、予測スキルのさらなる向上につながるが、非常に短いリード時間を除くと、拡張MLPモデルは全体的なパフォーマンスが最高である。

Accurate and reliable forecasting of total cloud cover (TCC) is vital for many areas such as astronomy, energy demand and production, or agriculture. Most meteorological centres issue ensemble forecasts of TCC, however, these forecasts are often uncalibrated and exhibit worse forecast skill than ensemble forecasts of other weather variables. Hence, some form of post-processing is strongly required to improve predictive performance. As TCC observations are usually reported on a discrete scale taking just nine different values called oktas, statistical calibration of TCC ensemble forecasts can be considered a classification problem with outputs given by the probabilities of the oktas. This is a classical area where machine learning methods are applied. We investigate the performance of post-processing using multilayer perceptron (MLP) neural networks, gradient boosting machines (GBM) and random forest (RF) methods. Based on the European Centre for Medium-Range Weather Forecasts global TCC ensemble forecasts for 2002-2014 we compare these approaches with the proportional odds logistic regression (POLR) and multiclass logistic regression (MLR) models, as well as the raw TCC ensemble forecasts. We further assess whether improvements in forecast skill can be obtained by incorporating ensemble forecasts of precipitation as additional predictor. Compared to the raw ensemble, all calibration methods result in a significant improvement in forecast skill. RF models provide the smallest increase in predictive performance, while MLP, POLR and GBM approaches perform best. The use of precipitation forecast data leads to further improvements in forecast skill and except for very short lead times the extended MLP model shows the best overall performance.
翻訳日:2023-01-10 23:53:35 公開日:2020-01-16
# 遅延ガウス過程を用いたスケーラブルハイパーパラメータ最適化

Scalable Hyperparameter Optimization with Lazy Gaussian Processes ( http://arxiv.org/abs/2001.05726v1 )

ライセンス: Link先を確認
Raju Ram, Sabine M\"uller, Franz-Josef Pfreundt, Nicolas R. Gauger, Janis Keuper(参考訳) ほとんどの機械学習手法は、優れた一般化能力を持つ高性能モデルを訓練するために、ハイパーパラメータを慎重に選択する必要がある。 したがって、これらのパラメータの面倒な手動(試行錯誤)チューニングを克服するために、いくつかの自動選択アルゴリズムが導入された。 非常に高いサンプル効率のため、ガウス過程のパラメータ空間のモデリングに対するベイズ最適化が選択の方法となっている。 残念なことに、このアプローチは、Colesky因子化の基礎となるため、立方体計算の複雑さに悩まされており、少数のサンプリングステップを超えてスケールすることが非常に困難である。 本稿では,基礎となるガウス過程の新しい高精度近似法を提案する。 立方体から二次体への計算複雑性の低減は、ベイズ最適化の効率的なスケーリングを可能にし、最適化精度に関する以前のアプローチよりも優れている。 最初の実験では、単一ノードにおける162因子の高速化と、並列環境では5因子の高速化が示されている。

Most machine learning methods require careful selection of hyper-parameters in order to train a high performing model with good generalization abilities. Hence, several automatic selection algorithms have been introduced to overcome tedious manual (try and error) tuning of these parameters. Due to its very high sample efficiency, Bayesian Optimization over a Gaussian Processes modeling of the parameter space has become the method of choice. Unfortunately, this approach suffers from a cubic compute complexity due to underlying Cholesky factorization, which makes it very hard to be scaled beyond a small number of sampling steps. In this paper, we present a novel, highly accurate approximation of the underlying Gaussian Process. Reducing its computational complexity from cubic to quadratic allows an efficient strong scaling of Bayesian Optimization while outperforming the previous approach regarding optimization accuracy. The first experiments show speedups of a factor of 162 in single node and further speed up by a factor of 5 in a parallel environment.
翻訳日:2023-01-10 23:46:06 公開日:2020-01-16
# ユニバーサルフレーバーに対するマスキングスキーム

Masking schemes for universal marginalisers ( http://arxiv.org/abs/2001.05895v1 )

ライセンス: Link先を確認
Divya Gautam, Maria Lomeli, Kostis Gourgoulias, Daniel H. Thompson, Saurabh Johri(参考訳) 普遍境界群 (arXiv:1711.00695) を訓練し、$P(x_i |\mathbf x_{\mathbf b})$,$x_i$ は与えられた確率変数であり、$\mathbf x_{\mathbf b}$ は生成的モデルのすべてのランダム変数の任意の部分集合である。 言い換えれば、デノナイズドオートエンコーダの自己教師型トレーニングを模倣し、非競合データのデータセットを部分的な入力として使用し、ニューラル近似器を最適化して再構成損失を最小限に抑える。 トレーニング中のマスキング過程と予測時の観察過程が異なる場合, ニューラルネットワークによる条件分布の学習は, どの程度良好か? 予測性能と一般化特性の観点から異なるマスキングスキームで訓練されたネットワークを比較した。

We consider the effect of structure-agnostic and structure-dependent masking schemes when training a universal marginaliser (arXiv:1711.00695) in order to learn conditional distributions of the form $P(x_i |\mathbf x_{\mathbf b})$, where $x_i$ is a given random variable and $\mathbf x_{\mathbf b}$ is some arbitrary subset of all random variables of the generative model of interest. In other words, we mimic the self-supervised training of a denoising autoencoder, where a dataset of unlabelled data is used as partially observed input and the neural approximator is optimised to minimise reconstruction loss. We focus on studying the underlying process of the partially observed data---how good is the neural approximator at learning all conditional distributions when the observation process at prediction time differs from the masking process during training? We compare networks trained with different masking schemes in terms of their predictive performance and generalisation properties.
翻訳日:2023-01-10 23:45:51 公開日:2020-01-16
# クロスコンフォーマル電子予測

Cross-conformal e-prediction ( http://arxiv.org/abs/2001.05989v1 )

ライセンス: Link先を確認
Vladimir Vovk(参考訳) 本稿ではe値に関する最近の研究に触発されたクロスコンフォーマル予測の簡単な修正について述べる。 1990年代にgammerman、vapnik、vovkによって開発された共形予測の前駆体もe値に基づいており、このノートでは共形 e-prediction と呼ばれる。 e-値をp-値に置き換えることにより、明らかな欠点なく共形e-述語よりも重要な利点を持つ共形予測が導かれる。 クロスコンフォーマル予測の妥当性は経験的事実に過ぎず(過度なランダム化で損なわれる可能性がある)、このメモはクロスコンフォーマルなe-Predictionが有効性の保証された性質を享受しているという明らかな事実に読者の注意を惹きつける。

This note discusses a simple modification of cross-conformal prediction inspired by recent work on e-values. The precursor of conformal prediction developed in the 1990s by Gammerman, Vapnik, and Vovk was also based on e-values and is called conformal e-prediction in this note. Replacing e-values by p-values led to conformal prediction, which has important advantages over conformal e-prediction without obvious disadvantages. The situation with cross-conformal prediction is, however, different: whereas for cross-conformal prediction validity is only an empirical fact (and can be broken with excessive randomization), this note draws the reader's attention to the obvious fact that cross-conformal e-prediction enjoys a guaranteed property of validity.
翻訳日:2023-01-10 23:45:13 公開日:2020-01-16
# オンライン学習のためのバンディットの強化

Better Boosting with Bandits for Online Learning ( http://arxiv.org/abs/2001.06105v1 )

ライセンス: Link先を確認
Nikolaos Nikolaou, Joseph Mellor, Nikunj C. Oza, Gavin Brown(参考訳) アンサンブルの強化によって生じる確率推定は,アルゴリズムのマージン最大化特性のため,調整が不十分である。 アンサンブルの出力は、確率推定として使用できる前に適切に調整する必要がある。 本研究では,オンラインブースティングが歪んだ確率推定を発生させる可能性を示す。 バッチ学習では、校正機能を訓練するためのトレーニングデータの一部を保存して校正を行う。 オンライン設定では、各ラウンドで決定を行う必要がある: 新しい例は、アンサンブルのパラメータまたはキャリブレータのパラメータを更新するために使用される。 我々は,この決定をバンディット最適化アルゴリズムを用いて解決する。 確率推定の面では, オンラインブースティングアンサンブルの非キャリブレーションおよびナイーブキャリブレーションよりも優れた性能を示す。 提案手法は他のタスク(例えばコストに敏感な分類)にも容易に適用でき、キャリブレータとアンサンブルの両方のハイパーパラメータの選択にロバストである。

Probability estimates generated by boosting ensembles are poorly calibrated because of the margin maximization nature of the algorithm. The outputs of the ensemble need to be properly calibrated before they can be used as probability estimates. In this work, we demonstrate that online boosting is also prone to producing distorted probability estimates. In batch learning, calibration is achieved by reserving part of the training data for training the calibrator function. In the online setting, a decision needs to be made on each round: shall the new example(s) be used to update the parameters of the ensemble or those of the calibrator. We proceed to resolve this decision with the aid of bandit optimization algorithms. We demonstrate superior performance to uncalibrated and naively-calibrated on-line boosting ensembles in terms of probability estimation. Our proposed mechanism can be easily adapted to other tasks(e.g. cost-sensitive classification) and is robust to the choice of hyperparameters of both the calibrator and the ensemble.
翻訳日:2023-01-10 23:44:55 公開日:2020-01-16
# 胸部X線分類における領域適応の連続学習

Continual Learning for Domain Adaptation in Chest X-ray Classification ( http://arxiv.org/abs/2001.05922v1 )

ライセンス: Link先を確認
Matthias Lenga, Heinrich Schulz, Axel Saalbach(参考訳) 過去数年間、ディープラーニングは幅広い医療応用にうまく適用されてきた。 特に胸部x線分類の文脈では、経験豊富な放射線科医と同等かそれ以上に良い結果が報告されている。 制御された実験環境での成功にもかかわらず、深層学習モデルが新しいドメイン(潜在的に異なるタスクを含む)のデータに一般化する能力は、しばしば制限されている。 この課題に対処するため,JT(Joint Training)やElastic Weight Consolidation(Elastic Weight Consolidation),LWF(Learning Without Forgetting)など,継続学習(CL)の分野のテクニックを調査した。 我々は、ChestX-ray14とMIMIC-CXRデータセットを用いて、これらの手法が、ターゲットドメインにおけるディープラーニングモデルの性能向上と、ソースドメインの破滅的な忘れを効果的に軽減するための有望なオプションを提供することを実証的に示す。 この結果、ソースドメインからデータにアクセスしなくても、LWFの競争結果が得られる一方で、全体的なパフォーマンスはJTで最高のものになった。

Over the last years, Deep Learning has been successfully applied to a broad range of medical applications. Especially in the context of chest X-ray classification, results have been reported which are on par, or even superior to experienced radiologists. Despite this success in controlled experimental environments, it has been noted that the ability of Deep Learning models to generalize to data from a new domain (with potentially different tasks) is often limited. In order to address this challenge, we investigate techniques from the field of Continual Learning (CL) including Joint Training (JT), Elastic Weight Consolidation (EWC) and Learning Without Forgetting (LWF). Using the ChestX-ray14 and the MIMIC-CXR datasets, we demonstrate empirically that these methods provide promising options to improve the performance of Deep Learning models on a target domain and to mitigate effectively catastrophic forgetting for the source domain. To this end, the best overall performance was obtained using JT, while for LWF competitive results could be achieved - even without accessing data from the source domain.
翻訳日:2023-01-10 23:43:55 公開日:2020-01-16
# 顔に基づく感情認識におけるユーザの匿名性を保つための敵対的学習フレームワーク

An adversarial learning framework for preserving users' anonymity in face-based emotion recognition ( http://arxiv.org/abs/2001.06103v1 )

ライセンス: Link先を確認
Vansh Narula, Zhangyang (Atlas) Wang and Theodora Chaspari(参考訳) 画像とビデオのキャプチャ技術は、毎日の生活に浸透している。 このような技術は、実生活環境での個人の表情を継続的に監視し、感情状態や移行に関する新たな洞察を与えてくれます。 しかし、プライバシーの懸念が強いため、現在の顔に基づく感情認識システムは、感情固有の情報とは別に、ユーザのアイデンティティに関連する重要な情報を保存する傾向にあるため、このような技術の使用には懐疑的な見方が強い。 本稿では,畳み込みニューラルネットワーク(convolutional neural network, cnn)アーキテクチャを学習し,個人固有の情報を最小限にし,感情依存情報を最大化する手法を提案する。 提案手法は感情分類と顔識別指標を用いて評価し,感情認識のみを訓練したcnnと顔識別のみを訓練したcnnと比較した。 Yale Face Dataset と Japanese Women Facial Expression Database を用いて実験を行う。 その結果,提案手法は,感情認識精度を保ち,顔認識を劣化させる畳み込み変換を学習し,プライバシを意識した感情認識技術への基礎を提供することができた。

Image and video-capturing technologies have permeated our every-day life. Such technologies can continuously monitor individuals' expressions in real-life settings, affording us new insights into their emotional states and transitions, thus paving the way to novel well-being and healthcare applications. Yet, due to the strong privacy concerns, the use of such technologies is met with strong skepticism, since current face-based emotion recognition systems relying on deep learning techniques tend to preserve substantial information related to the identity of the user, apart from the emotion-specific information. This paper proposes an adversarial learning framework which relies on a convolutional neural network (CNN) architecture trained through an iterative procedure for minimizing identity-specific information and maximizing emotion-dependent information. The proposed approach is evaluated through emotion classification and face identification metrics, and is compared against two CNNs, one trained solely for emotion recognition and the other trained solely for face identification. Experiments are performed using the Yale Face Dataset and Japanese Female Facial Expression Database. Results indicate that the proposed approach can learn a convolutional transformation for preserving emotion recognition accuracy and degrading face identity recognition, providing a foundation toward privacy-aware emotion recognition technologies.
翻訳日:2023-01-10 23:38:07 公開日:2020-01-16
# X線画像上のニューラルネットワークによる骨の3次元構造の推定と抽象化

Estimating and abstracting the 3D structure of bones using neural networks on X-ray (2D) images ( http://arxiv.org/abs/2001.11499v1 )

ライセンス: Link先を確認
Jana \v{C}avojsk\'a (1), Julian Petrasch (1), Nicolas J. Lehmann (1), Agn\`es Voisard (1), Peter B\"ottcher (2) ((1) Freie Universit\"at Berlin, Institute of Computer Science, 14195 Berlin, Germany, (2) Freie Universit\"at Berlin, Clinic for Small Animals, 14163 Berlin, Germany)(参考訳) 本稿では,骨の3次元構造を2次元X線画像から推定する深層学習手法を提案する。 三重項損失学習ニューラルネットワークは、予め定義された形状から最も近い3d骨形状を選択する。 我々の予測では, 平均根平均平方(RMS)距離が1.08mmであり, 他の8つの3次元骨再建法により得られた平均誤差よりも精度が高い。 私たちが使用している予測プロセスは完全に自動化されており、多くの競合するアプローチとは異なり、骨幾何学に関する以前の知識に依存しない。 さらに、我々のニューラルネットワークは、X線画像のみに基づいて骨の同一性を決定することができる。 それぞれの2次元X線画像の低次元表現(埋め込み)を計算し、その埋め込みのみに基づいて異なるX線画像を比較する。 埋め込みは、入力されたX線画像に属する骨CTを100%精度で識別するのに十分な情報を持ち、そのため、その骨の指紋の一種として機能する。 可能性のあるアプリケーションは、より高速な画像コンテンツベースの骨データベース検索である。

In this paper, we present a deep-learning based method for estimating the 3D structure of a bone from a pair of 2D X-ray images. Our triplet loss-trained neural network selects the most closely matching 3D bone shape from a predefined set of shapes. Our predictions have an average root mean square (RMS) distance of 1.08 mm between the predicted and true shapes, making it more accurate than the average error achieved by eight other examined 3D bone reconstruction approaches. The prediction process that we use is fully automated and unlike many competing approaches, it does not rely on any previous knowledge about bone geometry. Additionally, our neural network can determine the identity of a bone based only on its X-ray image. It computes a low-dimensional representation ("embedding") of each 2D X-ray image and henceforth compares different X-ray images based only on their embeddings. An embedding holds enough information to uniquely identify the bone CT belonging to the input X-ray image with a 100% accuracy and can therefore serve as a kind of fingerprint for that bone. Possible applications include faster, image content-based bone database searches for forensic purposes.
翻訳日:2023-01-10 23:37:46 公開日:2020-01-16
# 遺伝子発現プログラミングによるラビリンスワイアの放電容量の予測

Prediction of Discharge Capacity of Labyrinth Weir with Gene Expression Programming ( http://arxiv.org/abs/2002.02751v1 )

ライセンス: Link先を確認
Hossein Bonakdari, Isa Ebtehaj, Bahram Gharabaghi, Ali Sharifi, Amir Mosavi(参考訳) 本稿では,三角迷路の排出係数を予測するための遺伝子発現プログラムに基づくモデルを提案する。 排出係数予測に影響を及ぼすパラメータをまず検討し, ワイアの頂部における頭頂の高さ比, 流路幅に対する水頂長, ワイアの頂部における頭頂長, フロード数および頂点角の無次元パラメータとして提示した。 この研究で提示された無次元パラメータのそれぞれを調べるために,感度解析を用いて異なるモデルを提示した。 さらに, GEPとの比較のために非線形回帰(NLR)を用いて方程式を提示した。 異なる統計指標を用いて行った研究の結果, GEPはNLRよりも有能であることが示唆された。 これは、GEPが平均相対誤差約2.5%の放電係数を予測し、予測値が最悪のモデルで5%未満の相対誤差を持つ程度である。

This paper proposes a model based on gene expression programming for predicting the discharge coefficient of triangular labyrinth weirs. The parameters influencing discharge coefficient prediction were first examined and presented as crest height ratio to the head over the crest of the weir, a crest length of water to channel width, a crest length of water to the head over the crest of the weir, Froude number and vertex angle dimensionless parameters. Different models were then presented using sensitivity analysis in order to examine each of the dimensionless parameters presented in this study. In addition, an equation was presented through the use of nonlinear regression (NLR) for the purpose of comparison with GEP. The results of the studies conducted by using different statistical indexes indicated that GEP is more capable than NLR. This is to the extent that GEP predicts the discharge coefficient with an average relative error of approximately 2.5% in such a manner that the predicted values have less than 5% relative error in the worst model.
翻訳日:2023-01-10 23:37:05 公開日:2020-01-16
# #metoo on campus: ソーシャルメディアで報告されたデータを使って、大学における性的暴行を大規模に研究する

#MeToo on Campus: Studying College Sexual Assault at Scale Using Data Reported on Social Media ( http://arxiv.org/abs/2001.05970v1 )

ライセンス: Link先を確認
Viet Duong, Phu Pham, Ritwik Bose, Jiebo Luo(参考訳) 近年、ソーシャルメディア上の#MeTooトレンドが出現し、何千人もの人々が自身のセクハラ体験を共有するようになった。 このバイラルな傾向は、Twitter上の大量の個人情報やコンテンツと共に、大学におけるセクハラに関する調査を補完するデータ駆動の洞察を抽出する有望な機会を提供する。 本稿では,#metoo傾向が大学フォロワーのプールに与える影響を分析した。 これらの#metooツイートに埋め込まれた話題の多くはセクシャルハラスメントの話題を詳述しており、この傾向の傾向といくつかの主要地域における公式レポートとの間に有意な相関がある。 さらに、ディープセマンティックな意味表現を用いた#MeTooのツイートの顕著な感情と、異なるタイプのセクシャルハラスメントを経験する影響を受けたユーザへの影響を明らかにする。 この研究は、学界における性行為に関するさらなる認識を高めることを願っている。

Recently, the emergence of the #MeToo trend on social media has empowered thousands of people to share their own sexual harassment experiences. This viral trend, in conjunction with the massive personal information and content available on Twitter, presents a promising opportunity to extract data driven insights to complement the ongoing survey based studies about sexual harassment in college. In this paper, we analyze the influence of the #MeToo trend on a pool of college followers. The results show that the majority of topics embedded in those #MeToo tweets detail sexual harassment stories, and there exists a significant correlation between the prevalence of this trend and official reports on several major geographical regions. Furthermore, we discover the outstanding sentiments of the #MeToo tweets using deep semantic meaning representations and their implications on the affected users experiencing different types of sexual harassment. We hope this study can raise further awareness regarding sexual misconduct in academia.
翻訳日:2023-01-10 23:36:13 公開日:2020-01-16
# 抗癌ハイパーフード予測のためのグラフ注意オートエンコーダ

Graph Attentional Autoencoder for Anticancer Hyperfood Prediction ( http://arxiv.org/abs/2001.05724v1 )

ライセンス: Link先を確認
Guadalupe Gonzalez, Shunwang Gong, Ivan Laponogov, Kirill Veselkov, Michael Bronstein(参考訳) 近年の研究では、タンパク質とタンパク質の相互作用ネットワークに対する効果から食品中の抗がん剤様分子が発見され、病気を負かす食のデザインへの道を開く可能性が示唆されている。 この課題をグラフニューラルネットワーク(gnns)が最先端の結果を得たグラフ分類問題として定式化する。 しかし、我々の経験的証拠によると、GNNは低次元の特徴を訓練することは困難である。 本稿では,グラフ構造情報と生ノード属性を異なる比率で統合し,ネットワークのトレーニングを容易にするグラフ拡張機能を提案する。 さらに,グラフ上に新たなニューラルネットワークアーキテクチャであるgraph attentional autoencoder (gaa)を導入し,摂動タンパク質ネットワークに基づく抗癌作用を有する食品化合物の予測を行う。 本課題では,本手法がベースラインアプローチや最先端グラフ分類モデルを上回ることを実証する。

Recent research efforts have shown the possibility to discover anticancer drug-like molecules in food from their effect on protein-protein interaction networks, opening a potential pathway to disease-beating diet design. We formulate this task as a graph classification problem on which graph neural networks (GNNs) have achieved state-of-the-art results. However, GNNs are difficult to train on sparse low-dimensional features according to our empirical evidence. Here, we present graph augmented features, integrating graph structural information and raw node attributes with varying ratios, to ease the training of networks. We further introduce a novel neural network architecture on graphs, the Graph Attentional Autoencoder (GAA) to predict food compounds with anticancer properties based on perturbed protein networks. We demonstrate that the method outperforms the baseline approach and state-of-the-art graph classification models in this task.
翻訳日:2023-01-10 23:35:54 公開日:2020-01-16
# MIME: 相互情報の最小化探索

MIME: Mutual Information Minimisation Exploration ( http://arxiv.org/abs/2001.05636v1 )

ライセンス: Link先を確認
Haitao Xu and Brendan McCane and Lech Szymanski and Craig Atkinson(参考訳) 驚き(サプライサル)によって学習する強化学習エージェントは、これらの遷移が学習しにくいため、突然の環境遷移境界に留まります。 本研究では,MIME(Mutual Information Minimising Exploration)と呼ばれる,エージェントが将来の状態を予測せずに環境の潜在表現を学習する手法を提案する。 エージェントはシャープな遷移境界よりもはるかに優れた性能を示しながら,他のエージェントと同等性能を示す。 特に,Gravitar,Montezuma's Revenge,Doomなどの難学習ゲームにおいて,最先端のパフォーマンスを示す。

We show that reinforcement learning agents that learn by surprise (surprisal) get stuck at abrupt environmental transition boundaries because these transitions are difficult to learn. We propose a counter-intuitive solution that we call Mutual Information Minimising Exploration (MIME) where an agent learns a latent representation of the environment without trying to predict the future states. We show that our agent performs significantly better over sharp transition boundaries while matching the performance of surprisal driven agents elsewhere. In particular, we show state-of-the-art performance on difficult learning games such as Gravitar, Montezuma's Revenge and Doom.
翻訳日:2023-01-10 23:35:02 公開日:2020-01-16
# 線形ネットワーク最適化における直交初期化の確率的利点

Provable Benefit of Orthogonal Initialization in Optimizing Deep Linear Networks ( http://arxiv.org/abs/2001.05992v1 )

ライセンス: Link先を確認
Wei Hu, Lechao Xiao, Jeffrey Pennington(参考訳) ディープニューラルネットワークの勾配に基づく最適化のための初期パラメータ値の選択は、深層学習システムにおいて最も影響の大きいハイパーパラメータ選択の1つであり、収束時間とモデル性能の両方に影響する。 しかし、有意な経験的および理論的分析にもかかわらず、異なる初期化スキームの具体的な効果については比較的少ない。 本研究では, 深い線形ネットワークにおける初期化の効果を解析し, 直交群から初期重みを引き出すと, 標準ガウス初期化とイド重みとの収束が加速するという厳密な証明を初めて提供する。 深層ネットワークの場合,直交初期化を伴う大域最小値への効率的な収束に必要な幅は深さに依存しないが,ガウス初期化による効率的な収束に必要な幅は深さに線形にスケールする。 この結果から, 非線形ネットワークの初期化による最近の経験的成功を, 動的アイソメトリの原理に則って説明し, 優れた初期化の利点が学習を通して持続することを示す。

The selection of initial parameter values for gradient-based optimization of deep neural networks is one of the most impactful hyperparameter choices in deep learning systems, affecting both convergence times and model performance. Yet despite significant empirical and theoretical analysis, relatively little has been proved about the concrete effects of different initialization schemes. In this work, we analyze the effect of initialization in deep linear networks, and provide for the first time a rigorous proof that drawing the initial weights from the orthogonal group speeds up convergence relative to the standard Gaussian initialization with iid weights. We show that for deep networks, the width needed for efficient convergence to a global minimum with orthogonal initializations is independent of the depth, whereas the width needed for efficient convergence with Gaussian initializations scales linearly in the depth. Our results demonstrate how the benefits of a good initialization can persist throughout learning, suggesting an explanation for the recent empirical successes found by initializing very deep non-linear networks according to the principle of dynamical isometry.
翻訳日:2023-01-10 23:28:28 公開日:2020-01-16
# 冠動脈疾患の診断 : ランダムツリーモデルを用いた重要な特徴のランク付け

Coronary Artery Disease Diagnosis; Ranking the Significant Features Using Random Trees Model ( http://arxiv.org/abs/2001.09841v1 )

ライセンス: Link先を確認
Javad Hassannataj Joloudari, Edris Hassannataj Joloudari, Hamid Saadatfar, Mohammad GhasemiGol, Seyyed Mohammad Razavi, Amir Mosavi, Narjes Nabipour, Shahaboddin Shamshirband, and Laszlo Nadai(参考訳) 心臓病は中年の市民で最も多い病気の1つである。 多くの心臓疾患のうち、冠状動脈疾患(CAD)は、死亡率の高い一般的な心血管疾患であると考えられている。 cadを診断する最も一般的なツールは、医用画像(例えば血管造影)の使用である。 しかし,血管造影は費用がかかり,副作用も多々あることが知られている。 そこで本研究の目的は,冠状動脈疾患の診断の正確性を高めることであり,そのランキング順に有意な予測特徴の選択を行うことである。 本研究では,機械学習を用いた統合手法を提案する。 本研究では,ランダムツリー(RT),C5.0の決定木,サポートベクトルマシン(SVM),Chi-squared Automatic Interaction Detection(CHAID)の決定木を用いた。 提案手法は有望な結果を示し,RTモデルが他のモデルより優れていることを確認した。

Heart disease is one of the most common diseases in middle-aged citizens. Among the vast number of heart diseases, the coronary artery disease (CAD) is considered as a common cardiovascular disease with a high death rate. The most popular tool for diagnosing CAD is the use of medical imaging, e.g., angiography. However, angiography is known for being costly and also associated with a number of side effects. Hence, the purpose of this study is to increase the accuracy of coronary heart disease diagnosis through selecting significant predictive features in order of their ranking. In this study, we propose an integrated method using machine learning. The machine learning methods of random trees (RTs), decision tree of C5.0, support vector machine (SVM), decision tree of Chi-squared automatic interaction detection (CHAID) are used in this study. The proposed method shows promising results and the study confirms that RTs model outperforms other models.
翻訳日:2023-01-10 23:28:08 公開日:2020-01-16
# インストラクタブルデジタルアシスタントにおけるユーザ・イン・ザ・ループ適応インテント検出

User-in-the-loop Adaptive Intent Detection for Instructable Digital Assistant ( http://arxiv.org/abs/2001.06007v1 )

ライセンス: Link先を確認
Nicolas Lair, Cl\'ement Delgrange, David Mugisha, Jean-Michel Dussoux, Pierre-Yves Oudeyer, and Peter Ford Dominey(参考訳) デジタルアシスタント(das)を使ってサービスやコネクテッドオブジェクトと対話する人が増えています。 しかし、プログラミング以外のユーザにとっては、DAをカスタマイズする可能性は限られており、アシスタントに新しいタスクを教える可能性を含まない。 DAの可能性を最大限活用するためには、ユーザーは自然言語(NL)を通じてアシスタントをカスタマイズできる必要がある。 従来のアシスタントにおけるNLの解釈は,(1)意図認識システムでは,既知の意図の新たな形態を認識でき,ユーザによって表現されるように,新たな意図を獲得できなければならない。 2) 新たな意図に適応するために,自然言語理解モジュールはサンプル効率が高く,事前学習されたモデルに依存するべきではない。 むしろ、システムはユーザから新しいインテントを学ぶため、トレーニングデータを継続的に収集するべきです。 本稿では,対話が進行するにつれて,アシスタントが自身の意図を学習することで,ユーザへの適応を可能にする,ループ内適応型意図検出フレームワークであるaime(adaptive intent detection in multi-domain environment)を提案する。 AidMeは意図のレパートリーを構築し、学習した意図を識別し、既知の意図の新たな形態を自律的に発見する意味的類似性評価のモデルをトレーニングするためにデータを集める。 AidMeは、インテントラーニングとユーザ適応という2つの主要な課題に対処する。 ユーザとのインタラクションのシミュレーションを通じて,単発学習システムと事前学習したNLUモジュールとの比較により,AidMeのスタンドアロンシステムとしての能力を示す。 また,既存のインストラクタ可能なデジタルアシスタントとaidmeがスムーズに統合できることを示す。

People are becoming increasingly comfortable using Digital Assistants (DAs) to interact with services or connected objects. However, for non-programming users, the available possibilities for customizing their DA are limited and do not include the possibility of teaching the assistant new tasks. To make the most of the potential of DAs, users should be able to customize assistants by instructing them through Natural Language (NL). To provide such functionalities, NL interpretation in traditional assistants should be improved: (1) The intent identification system should be able to recognize new forms of known intents, and to acquire new intents as they are expressed by the user. (2) In order to be adaptive to novel intents, the Natural Language Understanding module should be sample efficient, and should not rely on a pretrained model. Rather, the system should continuously collect the training data as it learns new intents from the user. In this work, we propose AidMe (Adaptive Intent Detection in Multi-Domain Environments), a user-in-the-loop adaptive intent detection framework that allows the assistant to adapt to its user by learning his intents as their interaction progresses. AidMe builds its repertoire of intents and collects data to train a model of semantic similarity evaluation that can discriminate between the learned intents and autonomously discover new forms of known intents. AidMe addresses two major issues - intent learning and user adaptation - for instructable digital assistants. We demonstrate the capabilities of AidMe as a standalone system by comparing it with a one-shot learning system and a pretrained NLU module through simulations of interactions with a user. We also show how AidMe can smoothly integrate to an existing instructable digital assistant.
翻訳日:2023-01-10 23:27:52 公開日:2020-01-16
# 大きな曲がり角の小さな霧

A Little Fog for a Large Turn ( http://arxiv.org/abs/2001.05873v1 )

ライセンス: Link先を確認
Harshitha Machiraju, Vineeth N Balasubramanian(参考訳) adversarial perturbationと呼ばれる小さな、慎重に作られた摂動は、簡単にニューラルネットワークを騙すことができる。 しかし、これらの摂動は主に添加物であり、自然に見つからない。 我々は、霧などの悪天候がこれらのシステムの予測に劇的な影響を及ぼすような自律航法の分野に注意を向ける。 これらの気象条件は、モデルをテストするのに役立つ自然の敵のように振る舞うことができる。 この目的のために、生成モデルを用いて作成できる対向摂動の一般的な概念を導入し、サイクル一貫性生成対向ネットワークにインスパイアされた方法論を提供し、与えられた画像に対する対向的な気象条件を生成する。 これらの画像は、自律ナビゲーションモデルで使用されるステアリングモデルに適したテストベッドを提供することを示す。 また,本研究は,知覚的類似性に基づく逆摂動をより自然かつ一般的に定義する。

Small, carefully crafted perturbations called adversarial perturbations can easily fool neural networks. However, these perturbations are largely additive and not naturally found. We turn our attention to the field of Autonomous navigation wherein adverse weather conditions such as fog have a drastic effect on the predictions of these systems. These weather conditions are capable of acting like natural adversaries that can help in testing models. To this end, we introduce a general notion of adversarial perturbations, which can be created using generative models and provide a methodology inspired by Cycle-Consistent Generative Adversarial Networks to generate adversarial weather conditions for a given image. Our formulation and results show that these images provide a suitable testbed for steering models used in Autonomous navigation models. Our work also presents a more natural and general definition of Adversarial perturbations based on Perceptual Similarity.
翻訳日:2023-01-10 23:27:24 公開日:2020-01-16
# Code-Bridged Classifier (CBC): CNN分類器を敵攻撃に対してロバストにするための低または負のオーバーヘッド防御

Code-Bridged Classifier (CBC): A Low or Negative Overhead Defense for Making a CNN Classifier Robust Against Adversarial Attacks ( http://arxiv.org/abs/2001.06099v1 )

ライセンス: Link先を確認
Farnaz Behnia, Ali Mirzaeian, Mohammad Sabokrou, Sai Manoj, Tinoosh Mohsenin, Khaled N. Khasawneh, Liang Zhao, Houman Homayoun, Avesta Sasan(参考訳) 本稿では,畳み込みニューラルネットワーク(cnns)を敵の攻撃に対して堅牢にするためのフレームワークであるcbc(code-bridged classifier)を提案する。 より具体的には、まず入力画像がデノージングオートエンコーダのエンコーダモジュールによってエンコーダされ、その後(デコードされていない)潜在表現が画像分類の複雑さの低減cnnに供給されるスタックドエンコーダ畳み込みモデルを提案する。 このネットワークは,敵の例よりも頑健なだけでなく,先行技術に対する防御に比べて計算の複雑さも著しく低下することを示す。

In this paper, we propose Code-Bridged Classifier (CBC), a framework for making a Convolutional Neural Network (CNNs) robust against adversarial attacks without increasing or even by decreasing the overall models' computational complexity. More specifically, we propose a stacked encoder-convolutional model, in which the input image is first encoded by the encoder module of a denoising auto-encoder, and then the resulting latent representation (without being decoded) is fed to a reduced complexity CNN for image classification. We illustrate that this network not only is more robust to adversarial examples but also has a significantly lower computational complexity when compared to the prior art defenses.
翻訳日:2023-01-10 23:25:55 公開日:2020-01-16