このサイトではarxivの論文のうち、30ページ以下でCreative Commonsライセンス(CC 0, CC BY, CC BY-SA)の論文を日本語訳しています。 本文がCCでない論文、長すぎる論文はメタデータのみを翻訳しています。(arxivのメタデータは CC 0です。) 翻訳文のライセンスはCC BY-SA 4.0です。 翻訳にはFugu-Machine Translatorを利用しています。

本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。

公開日が20200128となっている論文です。

PDF登録状況(公開日: 20200128)

TitleAuthorsAbstract論文公表日・翻訳日
# オンライン製品レビューにおけるジェンダー信号とパフォーマンスの影響

The Effects of Gender Signals and Performance in Online Product Reviews ( http://arxiv.org/abs/2001.09955v2 )

ライセンス: Link先を確認
Sandipan Sikdar, Rachneet Singh Sachdeva, Johannes Wachs, Florian Lemmerich and Markus Strohmaier(参考訳) 本研究は,一般的なアマゾン・ショッピング・プラットフォーム上でのレビューの成功に対するシグナリングとジェンダーの実行の影響を定量化する。 評価の高いレビューは、製品の下に目立つので、eコマースにおいて重要な役割を果たす。 ジェンダーシグナリングとジェンダーパフォーマンスレビューの著者の受け取り方の違いは、トップレビューの中でどのコンテンツや視点が表現されるかに重要なバイアスをもたらす可能性がある。 そこで本研究では,著者の性別を推測可能なレビューを識別し,ユーザ名から著者の性別のシグナルを抽出する。 これらの性記号作成者によるレビューを用いて,深層学習分類器を訓練し,ユーザ名による明確な性別信号の送信を行わない著者による評価の男女別文体や性別別評価を定量化する。 一致実験を用いて,性別信号とパフォーマンスがレビュー成功に与える影響を比較検討した。 性別による信号やパフォーマンスが全体のレビュー成功に影響を及ぼす一般的な傾向は見つからないが、強い文脈特異的な影響がある。 例えば、ElectronicsやComputersのような製品カテゴリーのレビューは、著者が女性である可能性を示唆するときにあまり役に立たないと見なされるが、美容や衣服のようなカテゴリーでは、より役に立ちます。 これらの興味深い発見に加えて、さまざまなソーシャルメディアプラットフォームにまたがるジェンダー特有の効果を研究するための一般的なツールも提供しています。

This work quantifies the effects of signaling and performing gender on the success of reviews written on the popular amazon shopping platform. Highly rated reviews play an important role in e-commerce since they are prominently displayed below products. Differences in how gender-signaling and gender-performing review authors are received can lead to important biases in what content and perspectives are represented among top reviews. To investigate this, we extract signals of author gender from user names, distinguishing reviews where the author's likely gender can be inferred. Using reviews authored by these gender-signaling authors, we train a deep-learning classifier to quantify the gendered writing style or gendered performance of reviews written by authors who do not send clear gender signals via their user name. We contrast the effects of gender signaling and performance on review success using matching experiments. While we find no general trend that gendered signals or performances influence overall review success, we find strong context-specific effects. For example, reviews in product categories such as Electronics or Computers are perceived as less helpful when authors signal that they are likely woman, but are received as more helpful in categories such as Beauty or Clothing. In addition to these interesting findings, our work provides a general chain of tools for studying gender-specific effects across various social media platforms.
翻訳日:2023-06-05 11:42:00 公開日:2020-01-28
# 古典的磁場が存在しない場合の磁気力

Magnetic forces in the absence of a classical magnetic field ( http://arxiv.org/abs/2001.10172v1 )

ライセンス: Link先を確認
Ismael L. Paiva, Yakir Aharonov, Jeff Tollaksen, Mordecai Waegell(参考訳) 量子力学におけるフラックス線の離散分布の影響は、特別な対称性を持つ磁場の連続分布の影響と関係があることが示されている。 特に、磁束の任意の値を持つ磁束線は、特別に設計された構成で量子システムを閉じ込めるために用いられるエネルギー障壁を作るのに使うことができる。 これは、そのようなエネルギー障壁が半整数フラックスを持つフラックス線から生じる以前の研究を一般化する。 さらに,フラックスラインの二次元格子からランドウレベルを得る方法を示した。 これらの結果から、古典的磁気力はアハロノフ・ボーム効果から完全に生じていると考えられる。 最後に、特殊対称性を持つ磁場からの古典的磁場の出現をモデル化する半古典的理論の基本要素を紹介する。

It is shown that, in some cases, the effect of discrete distributions of flux lines in quantum mechanics can be associated with the effect of continuous distributions of magnetic fields with special symmetries. In particular, flux lines with an arbitrary value of magnetic flux can be used to create energetic barriers, which can be used to confine quantum systems in specially designed configurations. This generalizes a previous work where such energy barriers arose from flux lines with half-integer fluxons. Furthermore, it is shown how the Landau levels can be obtained from a two-dimensional grid of flux lines. These results suggest that the classical magnetic force can be seen as emerging entirely from the Aharonov-Bohm effect. Finally, the basic elements of a semi-classical theory that models the emergence of classical magnetic forces from fields with special symmetries are introduced.
翻訳日:2023-06-05 11:33:31 公開日:2020-01-28
# スピン系のための任意温度の貯留層工学と最大効率の量子熱機械

Reservoir engineering with arbitrary temperatures for spin systems and quantum thermal machine with maximum efficiency ( http://arxiv.org/abs/2001.10127v1 )

ライセンス: Link先を確認
Taysa M. Mendon\c{c}a, Alexandre M. Martins, Rog\'erio J. de Assis, Norton G. de Almeida, Roberto S. Sarthour, Ivan S. de Oliveira, and Celso J. Villas-boas(参考訳) 抽象的貯留層工学(abstract reservoir engineering)は、量子情報科学および量子熱力学にとって重要な道具であり、単一または多成分系の特別な量子状態の作成と保護、あるいは量子熱機械としての熱力学の基礎的問題とその効率性を調査することができる。 ここでは、この手法を用いて、単一スピン系の任意の(有効)負および正の温度の貯水池を設計する。 この目的のために,我々はまず,量子ビット系,炭素核スピンとフェルミイオン貯水池との適切な相互作用を,多数の水素核スピンがスピン浴として働く場合に設計した。 この炭素-水素構造は, 実験装置で使用した多結晶アダマンタンに存在している。 所要の相互作用工学は、核磁気共鳴(NMR)を用いて特定の周波数パルスを印加することにより達成されるが、浴槽の温度は初期水素スピン状態の適切な準備によって制御でき、予測結果は実験データと非常によく一致している。 アプリケーションとして,量子ビットシステム上で行われるユニタリ変換とは独立に,効率が常に100%の有効負温度の1つの貯留層で動作し,量子ビット状態が変化する限り,単一量子ビットの量子熱機械を実装した。

Abstract Reservoir engineering is an important tool for quantum information science and quantum thermodynamics since it allows for preparing and/or protecting special quantum states of single or multipartite systems or to investigate fundamental questions of the thermodynamics as quantum thermal machines and their efficiencies. Here we employ this technique to engineer reservoirs with arbitrary (effective) negative and positive temperatures for a single spin system. To this end, we firstly engineer an appropriate interaction between a qubit system, a carbon nuclear spin, to a fermionic reservoir, in our case a large number of hydrogen nuclear spins that acts as the spins bath. This carbon-hydrogen structure is present in a polycrystalline adamantane, which was used in our experimental setup. The required interaction engineering is achieved by applying a specific sequence of radio-frequency pulses using Nuclear Magnetic Resonance (NMR), while the temperature of the bath can be controlled by appropriate preparation of the initial hydrogen nuclear spin state, being the predicted results in very good agreement with the experimental data. As an application we implemented a single qubit quantum thermal machine which operates at a single reservoir at effective negative temperature whose efficiency is always 100%, independent of the unitary transformation performed on the qubit system, as long as it changes the qubit state.
翻訳日:2023-06-05 11:33:18 公開日:2020-01-28
# 一般化不確実性原理と運動量依存実効質量 Sch\"{r}odinger 方程式

Generalized Uncertainty principle and momentum-dependent effective mass Sch\"{r}odinger equation ( http://arxiv.org/abs/2001.10239v1 )

ライセンス: Link先を確認
Bijan Bagchi, Rahul Ghosh, Partha Goswami(参考訳) 本稿では,量子力学系における位置と運動量の基本表現を一般化不確実性原理に導かれ,対応する1パラメータ固有値問題へと導くことを,運動量依存質量を具現化する拡張sch\"{r}odinger方程式を用いて解釈する。 単純な結果が指摘されている。

We show in this paper that the basic representations of position and momentum in a quantum mechanical system, that are guided by a generalized uncertainty principle and lead to a corresponding one-parameter eigenvalue problem, can be interpreted in terms of an extended Sch\"{r}odinger equation embodying momentum-dependent mass. Some simple consequences are pointed out.
翻訳日:2023-06-05 09:14:26 公開日:2020-01-28
# 純二量子エンタングル状態の一方的デバイス非依存自己テスト実験

Experimental demonstration of one-sided device-independent self-testing of any pure two-qubit entangled state ( http://arxiv.org/abs/2001.10207v1 )

ライセンス: Link先を確認
Zhihao Bian, A. S. Majumdar, C. Jebaratnam, Kunkun Wang, Lei Xiao, Xiang Zhan, Yongsheng Zhang, Peng Xue(参考訳) 我々は, きめ細かいステアリングの不等式に基づいて, 純絡み合った2量子状態の片側デバイス非依存自己検定を行う。 微粒なステアリングの不等式の最大違反は、純粋な2ビットの絡み合った状態をすべて証明する、ある種のステアブルな相関を見ることができる。 実験では,どの純二量子エンタングル状態が自己試験され,どの測定演算子が信頼できない側に使用されているかを明らかにする。 さらに,本プロトコルのロバスト性境界を解析的に導出し,状態トモグラフィによるロバスト性の実験的検証を可能にした。 最後に,所要の署名制約が実験中に維持されることを保証する。

We demonstrate one-sided device-independent self-testing of any pure entangled two-qubit state based on a fine-grained steering inequality. The maximum violation of a fine-grained steering inequality can be used to witness certain steerable correlations, which certify all pure two-qubit entangled states. Our experimental results identify which particular pure two-qubit entangled state has been self-tested and which measurement operators are used on the untrusted side. Furthermore, we analytically derive the robustness bound of our protocol, enabling our subsequent experimental verification of robustness through state tomography. Finally, we ensure that the requisite no-signalling constraints are maintained in the experiment.
翻訳日:2023-06-05 09:13:47 公開日:2020-01-28
# 発展途上国におけるスマートシティガバナンス : 体系的文献レビュー

Smart City Governance in Developing Countries: A Systematic Literature Review ( http://arxiv.org/abs/2001.10173v1 )

ライセンス: Link先を確認
Si Ying Tan, Araz Taeihagh(参考訳) デジタルテクノロジーを広範に活用するスマートシティは、途上国の多くの都市が直面する人口プレッシャーの解決策として考えられており、サービスやインフラの需要増加に対応できる可能性がある。 それにもかかわらず、インフラ整備、非公式経済の実質規模、および様々なガバナンス課題にかかわる高い財政コストは、スマートシティに関する政府の理想主義を圧迫している。 本稿では、先進国におけるスマートシティ開発の現状を概観し、スマートシティ開発の背後にある概念化、モチベーション、ユニークなドライバーの理解を含む。 2つの学術データベースから識別された3928の社会科学文献の初期プールから、体系的な文献レビューから合計56の研究が特定された。 データはセマティック合成とセマティック分析を用いて分析された。 このレビューでは、発展途上国のテクノロジー対応のスマートシティは、社会経済、人間、法律、規制の改革が同時に行われる場合にのみ実現可能であることが判明した。 政府は、市民の基本的なインフラニーズを満たす努力を段階的に進め、収入を増やし、技術的なリスクを軽減し、人的資本を開発し、デジタル独占性を確保し、環境持続可能性を促進するための明確な規制枠組みを構築する必要がある。 市民参加を促進し、スタートアップを育て、公民パートナーシップを促進する支援的なエコシステムは、スマートシティのビジョンを実現するために構築する必要がある。

Smart cities that make broad use of digital technologies have been touted as possible solutions for the population pressures faced by many cities in developing countries and may help meet the rising demand for services and infrastructure. Nevertheless, the high financial cost involved in infrastructure maintenance, the substantial size of the informal economies, and various governance challenges are curtailing government idealism regarding smart cities. This review examines the state of smart city development in developing countries, which includes understanding the conceptualisations, motivations, and unique drivers behind (and barriers to) smarty city development. A total of 56 studies were identified from a systematic literature review from an initial pool of 3928 social sciences literature identified from two academic databases. Data were analysed using thematic synthesis and thematic analysis. The review found that technology-enabled smart cities in developing countries can only be realised when concurrent socioeconomic, human, legal, and regulatory reforms are instituted. Governments need to step up their efforts to fulfil the basic infrastructure needs of citizens, raise more revenue, construct clear regulatory frameworks to mitigate the technological risks involved, develop human capital, ensure digital inclusivity, and promote environmental sustainability. A supportive ecosystem that encourages citizen participation, nurtures start-ups, and promotes public-private partnerships needs to be created to realise their smart city vision.
翻訳日:2023-06-05 09:12:41 公開日:2020-01-28
# 量子ナノフォトニクス用ハイブリッドデバイス

Hybrid device for quantum nanophotonics ( http://arxiv.org/abs/2001.10480v1 )

ライセンス: Link先を確認
S. Pierini, M. D'Amato, M. Joos, Q. Glorieux, E. Giacobino, E. Lhuillier, C. Couteau and A. Bramati(参考訳) 光子は、偏光エンコーディング、時間エンコーディング、空間エンコーディングといった量子情報のキャリアとして、量子技術応用の非常に優れた候補として早期に特定されてきた。 量子暗号、量子通信、量子ネットワーク、量子コンピューティングは、いわゆる量子フォトニクスがターゲットとする応用の1つである。 それでも初期の段階では、光の量子状態を扱うためのバルク光学がこれらの技術にとって最良の選択肢ではないことも明らかであった。 最近では、量子技術のスケーラビリティ、信頼性、効率性の要求を満たすため、単一の光子、絡み合った光子、一般に量子光が古典光学から来る統合的なアプローチと結合している。 本稿では,光ナノファイバーを用いた最近の進歩について述べる。 また, ペロブスカイトからなるナノ結晶に関する最新の結果を示し, その量子特性について考察する。 最後に, テーパー型光ナノファイバーを基盤としたフォトニックプラットフォームとナノエミッタを効率的に結合するために必要な一般的なステップについて論じる。

Photons have been identified early on as a very good candidate for quantum technologies applications, as carriers of quantum information, either by polarization encoding, time encoding or spatial encoding. Quantum cryptography, quantum communications, quantum networks and quantum computing are some of the applications targeted by the so called quantum photonics. Nevertheless, it was also clear at an early stage that bulk optics for handling quantum states of light would not be the best option for these technologies. More recently, single photons, entangled photons and quantum light in general have been coupled to integrated approaches coming from classical optics in order to meet the requirements of scalability, reliability and efficiency for quantum technologies. In this article, we describe our recent advances using elongated optical nano-fibers. We also present our latest results on nanocrystals made of perovskites and discuss some of their quantum properties. Finally, we will discuss the general steps necessary in order to couple these nanoemitters efficiently with our photonic platform, based on tapered optical nanofibers.
翻訳日:2023-06-05 09:05:05 公開日:2020-01-28
# 点相互作用を持つ3つのボソンに対するハミルトニアンについて

On the Hamiltonian for three bosons with point interactions ( http://arxiv.org/abs/2001.10462v1 )

ライセンス: Link先を確認
Rodolfo Figari, Alessandro Teta(参考訳) ゼロレンジ力と相互作用する3つのボソンからなる量子系の性質について、厳密な結果の探索において最も関係のあるステップを簡潔に要約する。 また、3ボソン系に対する点相互作用ハミルトニアンの非有界性問題を解くための最近の試みについても述べる。

We briefly summarize the most relevant steps in the search of rigorous results about the properties of quantum systems made of three bosons interacting with zero-range forces. We also describe recent attempts to solve the unboundedness problem of point-interaction Hamiltonians for a three-boson system, keeping unaltered the spectrum structure at low energies.
翻訳日:2023-06-05 09:04:47 公開日:2020-01-28
# 非線形導波路における対伝播光子対生成

Counter-propagating photon pair generation in a nonlinear waveguide ( http://arxiv.org/abs/2001.10418v1 )

ライセンス: Link先を確認
Kai-Hong Luo, Vahid Ansari, Marcello Massaro, Matteo Santandrea, Christof Eigner, Raimund Ricken, Harald Herrmann, and Christine Silberhorn(参考訳) 非線形バルク結晶における反伝播パラメトリック変換過程は、効率的な狭帯域周波数変換に特有の性質を有することが示されている。 量子光学において、信号とアイドラー光子が反対方向に伝播する導波路における対向伝搬パラメトリックダウンコンバージョンプロセス(PDC)による光子対の生成は、ユニークな物質に依存しない工学的能力を提供する。 しかし, 反伝播型PDCを実現するには準位相整合 (QPM) が極めて短いポーリング期間を必要とする。 本稿では,ポリング周期を発生波長と同じ等級に設定した周期分極したニオブ酸リチウム導波路における対向伝播単光子対の発生について報告する。 二光子状態ブリッジGHzおよびTHz帯域の単一光子は、分離可能な時間スペクトル挙動を持つ。 さらに、最先端の光子カウンタを持つヘラルド単光子の時間的エンベロープを直接観測することができる。

Counter-propagating parametric conversion processes in non-linear bulk crystals have been shown to feature unique properties for efficient narrowband frequency conversion. In quantum optics, the generation of photon pairs with a counter-propagating parametric down-conversion process (PDC) in a waveguide, where signal and idler photons propagate in opposite directions, offers unique material-independent engineering capabilities. However, realizing counter-propagating PDC necessitates quasi-phase-matching (QPM) with extremely short poling periods. Here, we report on the generation of counter-propagating single-photon pairs in a self-made periodically poled lithium niobate waveguide with a poling period on the same order of magnitude as the generated wavelength. The single photons of the biphoton state bridge GHz and THz bandwidths with a separable joint temporal-spectral behavior. Furthermore, they allow the direct observation of the temporal envelope of heralded single photons with state-of-the art photon counters.
翻訳日:2023-06-05 09:04:41 公開日:2020-01-28
# 合成スピン軌道結合リドバーグ系における密度依存的ピエルス相の実現

Realization of a density-dependent Peierls phase in a synthetic, spin-orbit coupled Rydberg system ( http://arxiv.org/abs/2001.10357v1 )

ライセンス: Link先を確認
Vincent Lienhard, Pascal Scholl, Sebastian Weber, Daniel Barredo, Sylvain de L\'es\'eleuc, Rukmani Bai, Nicolai Lang, Michael Fleischhauer, Hans Peter B\"uchler, Thierry Lahaye, Antoine Browaeys(参考訳) ライドバーグ原子が担持する励起のホッピング振幅におけるパイエルズ相を実験的に認識し、3つの点の最小設定で特徴的なカイラル運動を観測した。 本実験は,双極子交換相互作用のスピン軌道結合と,均質な外部磁場による時間反転対称性の破れに依存する。 驚くべきことに、2つの部位間のホッピング振幅の位相は、第3部位の占有率に強く依存し、密度依存性のパイエルス相に関連する相関ホッピングに繋がる。 我々は, この密度依存ホッピングを実験的に観察し, 励起が非自明な位相のアノニオン粒子として振る舞うことを示した。 最後に,ライドベルク原子の幾何学的配置に対するパイエルス相の依存性を確認した。

We experimentally realize a Peierls phase in the hopping amplitude of excitations carried by Rydberg atoms, and observe the resulting characteristic chiral motion in a minimal setup of three sites. Our demonstration relies on the intrinsic spin-orbit coupling of the dipolar exchange interaction combined with time-reversal symmetry breaking by a homogeneous external magnetic field. Remarkably, the phase of the hopping amplitude between two sites strongly depends on the occupancy of the third site, thus leading to a correlated hopping associated to a density-dependent Peierls phase. We experimentally observe this density-dependent hopping and show that the excitations behave as anyonic particles with a non-trivial phase under exchange. Finally, we confirm the dependence of the Peierls phase on the geometrical arrangement of the Rydberg atoms.
翻訳日:2023-06-05 09:04:13 公開日:2020-01-28
# キラル媒質中のワイル半金属間のカシミール力

Casimir force between Weyl semimetals in a chiral medium ( http://arxiv.org/abs/2001.10329v1 )

ライセンス: Link先を確認
M. Bel\'en Farias, Alexander A. Zyuzin and Thomas L. Schmidt(参考訳) キラル媒質を充填したギャップで分離した2つのワイル半金属(WSM)からなる系におけるカシミール効果について検討した。 カシミール力を計算するために, キラル光子に対する材料の光学応答を計算した。 2つのwsm間の媒体がファラデー材料である場合、反発性カシミール力を得ることができ、リアルな実験パラメータでは、その大きさを数ミクロンの短距離で大幅に向上させることができる。 それらのいくつかは、使用される材料(WSMのホール導電率の絶対値、ファラデー材料のヴェルデット定数)に固有のものであり、そのいくつかは、外部磁場やその導電率の符号を決定するプレートの配向のような固定されたサンプルに対しても、外部で操作することができる。 これらのパラメータの適切な組み合わせは、アトラクションから反発に切り替えたり、プレートに力が作用しないトラップ距離を所望の距離に配置するために使用することができる。

We study the Casimir effect in a system composed of two Weyl semimetals (WSMs) separated by a gap filled with a chiral medium. We calculate the optical response of the material to chiral photons in order to calculate the Casimir force. We find that if the medium between the two WSMs is a Faraday material, a repulsive Casimir force can be obtained, and for realistic experimental parameters its magnitude can be greatly enhanced at short distances of a few microns Moreover, in the system under consideration various parameters can be modified. Some of them are intrinsic to the materials employed (the absolute value of the Hall conductivity of the WSM, the Verdet constant of the Faraday material), while some of them can be manipulated externally even for a fixed sample, such as the external magnetic field and the orientation of the plates which determines the sign of their conductivity. Suitable combinations of these parameters can be used to switch from attraction to repulsion, and to place the trapping distance, in which no force acts on the plates, at any desired distance between them.
翻訳日:2023-06-05 09:03:59 公開日:2020-01-28
# オンライン暗号通貨操作の展望をチャート化する

Charting the Landscape of Online Cryptocurrency Manipulation ( http://arxiv.org/abs/2001.10289v1 )

ライセンス: Link先を確認
Leonardo Nizzoli, Serena Tardelli, Marco Avvenuti, Stefano Cresci, Maurizio Tesconi and Emilio Ferrara(参考訳) 暗号通貨は金融投機にとって最も魅力的な市場の一つだ。 その結果、ソーシャルメディアでは前例のない注目を集めている。 真正な議論や正当な投資活動の他に、いくつかの詐欺活動が盛んに行われている。 この作業では、複数のプラットフォームにまたがるオンライン暗号通貨のランドスケープをグラフ化します。 目標を達成するために、twitter、telegram、discordで約700万人が公開している5000万以上のメッセージからなる大規模なデータセットを3ヶ月にわたって収集しました。 twitterアカウントでボット検出を行い,telegramおよびdiscordチャネルへの招待リンクを共有したところ,その56%以上がボットまたは停止アカウントであることが判明した。 次に,Telegram と Discord メッセージにトピックモデリング手法を適用し,その手法を「ポンポン」と「ポンジ」の2つに分けて明らかにし,これらの不正行為に関連するチャンネルを特定した。 Discordでは無視できるレベルの偽造が見つかったが、Telegramではポンプ&ダンプに関わる296のチャンネルとポンツィスキームに関わる432のチャンネルを回収し、合計の20%を占めた。 さらに、Twitterボットが共有している招待リンクの93%はTelegramのポンプ&ダンプチャンネルを指しており、あまり知られていないソーシャルボットの活動に光を当てている。 オンライン暗号通貨操作の状況を示すことは、そのような悪用と戦うためのアクション可能なポリシーに役立ちます。

Cryptocurrencies represent one of the most attractive markets for financial speculation. As a consequence, they have attracted unprecedented attention on social media. Besides genuine discussions and legitimate investment initiatives, several deceptive activities have flourished. In this work, we chart the online cryptocurrency landscape across multiple platforms. To reach our goal, we collected a large dataset, composed of more than 50M messages published by almost 7M users on Twitter, Telegram and Discord, over three months. We performed bot detection on Twitter accounts sharing invite links to Telegram and Discord channels, and we discovered that more than 56% of them were bots or suspended accounts. Then, we applied topic modeling techniques to Telegram and Discord messages, unveiling two different deception schemes - "pump-and-dump" and "Ponzi" - and identifying the channels involved in these frauds. Whereas on Discord we found a negligible level of deception, on Telegram we retrieved 296 channels involved in pump-and-dump and 432 involved in Ponzi schemes, accounting for a striking 20% of the total. Moreover, we observed that 93% of the invite links shared by Twitter bots point to Telegram pump-and-dump channels, shedding light on a little-known social bot activity. Charting the landscape of online cryptocurrency manipulation can inform actionable policies to fight such abuse.
翻訳日:2023-06-05 09:03:41 公開日:2020-01-28
# バイオメディカルシグナルと健康関連行動のためのソーシャルメディアデータマイニング

Mining social media data for biomedical signals and health-related behavior ( http://arxiv.org/abs/2001.10285v1 )

ライセンス: Link先を確認
Rion Brattig Correia and Ian B. Wood and Johan Bollen and Luis M. Rocha(参考訳) ソーシャルメディアデータは、バイオメディカルおよび健康関連現象の研究にますます利用されている。 状況に関するコホートレベルの議論から、感情の惑星レベルの分析まで、ソーシャルメディアは、様々な健康状態や治療に関連する人間の行動や反応を研究するために、前例のない量のデータを提供してきた。 本稿では,生体医学,疫学,社会現象のソーシャルメディアマイニングにおける最近の研究について概説する。 特に特に注目しているのは,ソーシャルメディアのデータ分析が最も進歩しているトピックである,薬物の移動性,特にメンタルヘルスに関する感情分析などだ。 また、健康関連アプリケーションにおけるソーシャルメディアデータの革新的利用と、ソーシャルメディアデータアクセスおよび利用における重要な制限についても論じる。

Social media data has been increasingly used to study biomedical and health-related phenomena. From cohort level discussions of a condition to planetary level analyses of sentiment, social media has provided scientists with unprecedented amounts of data to study human behavior and response associated with a variety of health conditions and medical treatments. Here we review recent work in mining social media for biomedical, epidemiological, and social phenomena information relevant to the multilevel complexity of human health. We pay particular attention to topics where social media data analysis has shown the most progress, including pharmacovigilance, sentiment analysis especially for mental health, and other areas. We also discuss a variety of innovative uses of social media data for health-related applications and important limitations in social media data access and use.
翻訳日:2023-06-05 09:03:16 公開日:2020-01-28
# 高次元格子上のグローバーウォークの支持について

On the support of the Grover walk on higher-dimensional lattices ( http://arxiv.org/abs/2001.10261v1 )

ライセンス: Link先を確認
Norio Konno and Sarato Takahashi(参考訳) 本稿では,d-次元格子上のグローバーウォークの定常測度に対する状態の最小サポートについて,対応する固有値問題を解くことにより述べる。 移動及びフリップフロップシフトの最小支持数は、それぞれ2^d(d ge1)および4(d ge2)である。

This paper presents the minimum supports of states for stationary measures of the Grover walk on the d-dimensional lattice by solving the corresponding eigenvalue problem. The numbers of the minimum supports for moving and flip-flop shifts are 2^d (d ge 1) and 4 (d ge 2), respectively.
翻訳日:2023-06-05 09:03:04 公開日:2020-01-28
# 非ブロックバンド崩壊とカイラルZenerトンネル

Non-Bloch band collapse and chiral Zener tunneling ( http://arxiv.org/abs/2001.10257v1 )

ライセンス: Link先を確認
Stefano Longhi(参考訳) 非ブロッホバンド理論(non-bloch band theory)は、開境界を持つ非エルミート結晶におけるバルクエネルギースペクトルと位相不変量を記述する。 しかし、非ブロッホバンド理論、スキン効果、コヒーレントブロッホ力学の相互作用は、まだ解明されていない。 2バンド非エルミート格子において、非ブロッホバンドとスキンモードの崩壊は外力下でブロッホダイナミクスを深く変えることが示されている。 特に、非ブロッホ帯の崩壊を強いる共鳴は、ワニエ・スターク・ラダーの合体と2つの分散ブロッホバンド間のキラル・ゼナー・トンネルとなる。

Non-Bloch band theory describes bulk energy spectra and topological invariants in non-Hermitian crystals with open boundaries, where the bulk eigenstates are squeezed toward the edges (skin effect). However, the interplay of non-Bloch band theory, skin effect and coherent Bloch dynamics is so far unexplored. In two-band non-Hermitian lattices, it is shown here that collapse of non-Bloch bands and skin modes deeply changes the Bloch dynamics under an external force. In particular, for resonance forcing non-Bloch band collapse results in Wannier-Stark ladder coalescence and chiral Zener tunneling between the two dispersive Bloch bands.
翻訳日:2023-06-05 09:02:59 公開日:2020-01-28
# トポロジカルフォトニックタム状態とSu-Schrieffer-Heegerモデル

Topological Photonic Tamm-States and the Su-Schrieffer-Heeger Model ( http://arxiv.org/abs/2001.10628v1 )

ライセンス: Link先を確認
J. C. G. Henriques, T. G. Rappoport, Y. V. Bludov, M. I. Vasilevskiy, N. M. R. Peres(参考訳) 本稿では,半無限の1次元フォトニック結晶と金属との界面におけるトポロジカルタム状態の形成について検討する。 トポロジカルに非自明な場合、各バンドギャップに単一のタム状態が存在するのに対し、トポロジカルに自明な場合、バンドギャップはタム状態を持たないことを示す。 我々はタム状態の消失と、トポロジカルに非自明な系からトポロジカルに自明な状態への位相遷移を結びつける。 この位相遷移は、単位セル内の誘電関数の修正によって駆動される。 我々の解釈は、マクスウェル方程式の解とそれらの解の密結合表現の存在の間の正確な写像によってさらに支持される。 マクスウェル方程式に基づく1次元フォトニック結晶の密結合表現は、一対のバンドの組ごとに su-schrieffer-heeger-type model (ssh-model) に対応する。 この表現をバンドエッジの近くに広げると、系はディラックのようなハミルトニアンによって記述できることを示す。 これは、曲がりくねった数によってマクスウェル方程式の解に関連する位相を特徴づけることができる。 また、無限系に対しては、バンドギャップを計算できるフォトニックバンドの解析式を提供する。

In this paper we study the formation of topological Tamm states at the interface between a semi-infinite one-dimensional photonic-crystal and a metal. We show that when the system is topologically non-trivial there is a single Tamm state in each of the band-gaps, whereas if it is topologically trivial the band-gaps host no Tamm states. We connect the disappearance of the Tamm states with a topological transition from a topologically non-trivial system to a topologically trivial one. This topological transition is driven by the modification of the dielectric functions in the unit cell. Our interpretation is further supported by an exact mapping between the solutions of Maxwell's equations and the existence of a tight-binding representation of those solutions. We show that the tight-binding representation of the 1D photonic crystal, based on Maxwell's equations, corresponds to a Su-Schrieffer-Heeger-type model (SSH-model) for each set of pairs of bands. Expanding this representation near the band edge we show that the system can be described by a Dirac-like Hamiltonian. It allows one to characterize the topology associated with the solution of Maxwell's equations via the winding number. In addition, for the infinite system, we provide an analytical expression for the photonic bands from which the band-gaps can be computed.
翻訳日:2023-06-05 08:55:27 公開日:2020-01-28
# マルチ量子NMRにおける多粒子エンタングルメント

Many-particle Entanglement in Multiple Quantum NMR Spectroscopy ( http://arxiv.org/abs/2001.10607v1 )

ライセンス: Link先を確認
S.I. Doronin, E.B Fel'dman, I.D. Lazarev(参考訳) 我々は、多粒子絡み合いの研究のために、ナノキャビティにおけるスピン担持分子の気体の複数の量子(MQ)NMRダイナミクスを用いる。 MQ NMR強度の分布は、201スピン1/2の系において、高温および低温で得られる。 分布の第2の瞬間は、量子フィッシャー情報に下界を与え、系の多粒子の絡み合いに光を当てる。 多粒子絡み合いの温度依存性について検討した。 ほとんど全てのスピンは低温で絡み合っている。

We use multiple quantum (MQ) NMR dynamics of a gas of spin-carrying molecules in nanocavities at high and low temperatures for an investigation of many-particle entanglement. A distribution of MQ NMR intensities is obtained at high and low temperatures in a system of 201 spins 1/2. The second moment of the distribution, which provides a lower bound on the quantum Fisher information, sheds light on the many-particle entanglement in the system. The dependence of the many-particle entanglement on the temperature is investigated. Almost all spins are entangled at low temperatures.
翻訳日:2023-06-05 08:54:01 公開日:2020-01-28
# 非対称損失を有する光チャネル上のツインフィールド量子鍵分布の実証実験

Proof-of-principle experimental demonstration of twin-field quantum key distribution over optical channels with asymmetric losses ( http://arxiv.org/abs/2001.10599v1 )

ライセンス: Link先を確認
Xiaoqing Zhong, Wenyuan Wang, Li Qian and Hoi-Kwong Lo(参考訳) ツインフィールド(TF)量子鍵分布(QKD)は、量子リピータを使わずに、ポイントツーポイントQKDの秘密鍵レートの基本的な限界を超えることができるため、非常に魅力的である。 多くの理論的および実験的研究により、長距離通信におけるtfqkdの優位が示されている。 TFQKDの以前の実験的実装は、対称損失を持つ光チャネル上で行われてきた。 しかし実際には、特にネットワーク環境では、ユーザーと中間ノード間の距離は非常に異なる可能性がある。 本稿では、光チャネル上のTFQKDの非対称な損失を示す最初の実証実験を行う。 我々は,(1)非対称信号強度を適用し,(2)余分な損失を加える2つの補償戦略を比較し,(1)がより優れた鍵レートを提供することを示す。 さらに、損失が増えるほど、キーレートが向上する。 非対称信号強度を適用することで、非対称チャネル損失を持つTFQKDは、50dB全体の損失に対してポイントツーポイントQKDのキーレートの基本的な限界を超えるだけでなく、56dB全体の損失に対して最高2.918\times10^{-6}$のキーレートを持つ。 一方、56dB損失の戦略(2)では鍵は得られない。 非対称チャネル損失を持つTFQKDの鍵レートの増加と拡張された距離カバレッジは、長距離量子ネットワークにおいてその優位性を保証する。

Twin-field (TF) quantum key distribution (QKD) is highly attractive because it can beat the fundamental limit of secret key rate for point-to-point QKD without quantum repeaters. Many theoretical and experimental studies have shown the superiority of TFQKD in long-distance communication. All previous experimental implementations of TFQKD have been done over optical channels with symmetric losses. But in reality, especially in a network setting, the distances between users and the middle node could be very different. In this paper, we perform a first proof-of-principle experimental demonstration of TFQKD over optical channels with asymmetric losses. We compare two compensation strategies, that are (1) applying asymmetric signal intensities and (2) adding extra losses, and verify that strategy (1) provides much better key rate. Moreover, the higher the loss, the more key rate enhancement it can achieve. By applying asymmetric signal intensities, TFQKD with asymmetric channel losses not only surpasses the fundamental limit of key rate of point-to-point QKD for 50 dB overall loss, but also has key rate as high as $2.918\times10^{-6}$ for 56 dB overall loss. Whereas no keys are obtained with strategy (2) for 56 dB loss. The increased key rate and enlarged distance coverage of TFQKD with asymmetric channel losses guarantee its superiority in long-distance quantum networks.
翻訳日:2023-06-05 08:53:54 公開日:2020-01-28
# 繰り返し測定による量子状態の判別と3つの規則

Quantum State Discrimination via Repeated Measurements and the Rule of Three ( http://arxiv.org/abs/2001.10559v1 )

ライセンス: Link先を確認
Tom Bullock, Teiko Heinosaari(参考訳) 互いに直交する純粋状態の集合に対する状態識別のタスクは、対応するシャープな(射影値の)測定へのアクセスがある場合、自明であるが、もし私たちが非シャープな測定に制限されたらどうなるだろうか? 現実的な測定装置が何らかのノイズにさらされることを考えると、そのような問題は考慮に値する。 本稿では,雑音測定による相互直交状態の最小誤差状態判別について検討する。 可換l\"uders測定の繰り返しを同じシステム上で考慮することで、状態の識別を成功させる確率を増加させることができることを示す。 バイナリL\ "uders"測定の場合、任意の繰り返しに対する成功確率の完全な特徴付けを提供する。 これにより、第2の測定値から確率の変化が得られず、第3の測定値以降に顕著な改善が得られない「3のルール」を特定できる。 また,2次測定における一般パターンはもはや満たされないが,3つの規則が残るような$N$の可換性測定に対する部分的な結果も提供する。

The task of state discrimination for a set of mutually orthogonal pure states is trivial if one has access to the corresponding sharp (projection-valued) measurement, but what if we are restricted to an unsharp measurement? Given that any realistic measurement device will be subject to some noise, such a problem is worth considering. In this paper we consider minimum error state discrimination for mutually orthogonal states with a noisy measurement. We show that by considering repetitions of commutative L\"uders measurements on the same system we are able to increase the probability of successfully distinguishing states. In the case of binary L\"uders measurements we provide a full characterisation of the success probabilities for any number of repetitions. This leads us to identify a 'rule of three', where no change in probability is obtained from a second measurement but there is noticeable improvement after a third. We also provide partial results for $N$-valued commutative measurements where the rule of three remains, but the general pattern present in binary measurements is no longer satisfied.
翻訳日:2023-06-05 08:53:30 公開日:2020-01-28
# グラフ特性は指数関数的量子スピードアップを持つか?

Can graph properties have exponential quantum speedup? ( http://arxiv.org/abs/2001.10520v1 )

ライセンス: Link先を確認
Andrew M. Childs, Daochen Wang(参考訳) 量子コンピュータは時として古典的コンピュータを指数関数的に上回ることができるが、十分な構造を持つ問題に限る。 完全置換対称性を持つ問合せ問題は、ほとんどの多項式量子スピードアップ -- 部分関数であっても -- を持つことはよく知られているが、指数的スピードアップを実現するためにこの条件がどの程度緩和されなければならないかは定かではない。 特に、入力がグラフを記述し、出力がその同型類にのみ依存する(部分的)グラフの性質に対して指数的高速化が可能かどうかを問うのは自然である。 この疑問に対する答えは入力モデルに強く依存していることを示す。 隣接行列モデルでは、任意のグラフプロパティの有界エラーランダム化クエリ複雑性 $r$ が $r(\mathcal{p}) = o(q(\mathcal{p})^{6})$ であることを証明する。 このことは、隣接行列モデルにおけるモンタナロとデ・ウルフの開問題を否定的に解決する。 より一般に、随伴行列モデルにおいて、任意の$l$-一様ハイパーグラフプロパティ$\mathcal{p}$に対して、$r(\mathcal{p}) = o(q(\mathcal{p})^{3l})$ が証明される。 対照的に、有界次グラフの隣接リストモデルでは、ランダム化と量子クエリの複雑度の間の指数関数的分離を示すpromise問題を示す。

Quantum computers can sometimes exponentially outperform classical ones, but only for problems with sufficient structure. While it is well known that query problems with full permutation symmetry can have at most polynomial quantum speedup -- even for partial functions -- it is unclear how far this condition must be relaxed to enable exponential speedup. In particular, it is natural to ask whether exponential speedup is possible for (partial) graph properties, in which the input describes a graph and the output can only depend on its isomorphism class. We show that the answer to this question depends strongly on the input model. In the adjacency matrix model, we prove that the bounded-error randomized query complexity $R$ of any graph property $\mathcal{P}$ has $R(\mathcal{P}) = O(Q(\mathcal{P})^{6})$, where $Q$ is the bounded-error quantum query complexity. This negatively resolves an open question of Montanaro and de Wolf in the adjacency matrix model. More generally, we prove $R(\mathcal{P}) = O(Q(\mathcal{P})^{3l})$ for any $l$-uniform hypergraph property $\mathcal{P}$ in the adjacency matrix model. In direct contrast, in the adjacency list model for bounded-degree graphs, we exhibit a promise problem that shows an exponential separation between the randomized and quantum query complexities.
翻訳日:2023-06-05 08:52:48 公開日:2020-01-28
# 量子計算と時間の矢印

Quantum Computation and Arrows of Time ( http://arxiv.org/abs/2001.10517v1 )

ライセンス: Link先を確認
Nathan Argaman(参考訳) 量子物理学は多くの点で驚くべきことです。 1つの驚きはベルの定理によって示唆された地域性への脅威である。 もうひとつの驚きは量子計算の能力であり、複雑性理論のチャーチ・チューリング論に脅威をもたらす。 どちらの場合も、驚きは一定の厳密な時間的仮定を取ることであり、その適用性は古典的領域に限定される可能性がある。 この可能性はベルの定理の文脈で繰り返し言及されている。 量子計算に関する議論はここで述べる。 この強い矢印の仮定に違反し、より弱い矢印で置き換えるモデルの開発が求められている。

Quantum physics is surprising in many ways. One surprise is the threat to locality implied by Bell's Theorem. Another surprise is the capacity of quantum computation, which poses a threat to the complexity-theoretic Church-Turing thesis. In both cases, the surprise may be due to taking for granted a certain strict arrow-of-time assumption, whose applicability may be limited to the classical domain. This possibility has been noted repeatedly in the context of Bell's Theorem. The argument concerning quantum computation is described here. Further development of models which violate this strong arrow-of-time assumption, replacing it by a weaker arrow, is called for.
翻訳日:2023-06-05 08:52:18 公開日:2020-01-28
# タイト結合モデルにおけるタンナブル静電量子スワップゲートの解析的展望

Analytical view on tunnable electrostatic quantum swap gate in tight-binding model ( http://arxiv.org/abs/2001.02513v2 )

ライセンス: Link先を確認
Krzysztof Pomorski(参考訳) 半導体中の単一電子を用いた2重結合量子ドットの連鎖に実装された一般化静電量子スワップゲートは、解析結果と数値結果の両方を規定する強結合単純化モデルで示される。 クーロン静電気反発による反相関原理は単一電子デバイスで利用される。 量子絡み合いの形成は解析結果によって特定され支持される。 古典図と量子図の違いが与えられる。 量子構造の幾何学と絡み合い力学の相関関係を解析的に示す。 単一電子の有効波動関数は2つの電子静電相互作用から抽出される。 提案した結果は,半導体量子コンピュータを大規模に実装するための低温CMOS量子技術において重要である。 キーワード:静電量子スワップゲート、絡み合い、反相関、密結合モデル、二体波動関数、相関反相関クロスオーバー、2電子系密度行列、単一電子デバイス、結合量子ドット

Generalized electrostatic quantum swap gate implemented in the chain of 2 double coupled quantum dots using single electron in semiconductor is presented in tight-binding simplistic model specifying both analytic and numerical results. The anticorrelation principle coming from Coulomb electrostatic repulsion is exploited in single electron devices. The formation of quantum entanglement is specified and supported by analytical results. The difference between classical and quantum picture is given. The correlations between geometry of quantum structures and entanglement dynamics are shown in analytical way. Effective wavefunction of single electrons is extracted from 2 electron electrostatic interactions. The presented results have its significance in cryogenic CMOS quantum technologies that gives perspective of implementation of semiconductor quantum computer on massive scale. Keyword: electrostatic quantum swap gate, entanglement, anticorrelation, tight-binding model, two-body wavefunction, correlation-anticorrelation crossover, density matrix of 2 electron system, single electron devices, coupled quantum dots
翻訳日:2023-01-13 21:29:29 公開日:2020-01-28
# 深部畳み込みニューラルネットワークを用いたMR画像における脊髄転移

Spinal Metastases Segmentation in MR Imaging using Deep Convolutional Neural Networks ( http://arxiv.org/abs/2001.05834v2 )

ライセンス: Link先を確認
Georg Hille and Johannes Steffen and Max D\"unnwald and Mathias Becker and Sylvia Saalfeld and Klaus T\"onnies(参考訳) 本研究の目的は,深層学習を用いた診断MR画像における脊髄転移の分節化である。 このような病変の分節化は、治療計画とバリデーションの強化への重要なステップを示し、また、電波アブレーションのような最小侵襲で画像誘導の手術の介入支援を行うことができる。 この目的のために,麻痺性病変,硬化性病変,各種MRシークエンスを含む40の臨床症例で訓練したU-Net様アーキテクチャを使用した。 提案手法は,使用中のmrシーケンスや入力次元など,セグメンテーション品質に影響を与える様々な要因について評価した。 dice係数,感度,特異度を用いて実験を定量的に評価した。 専門的な注釈付き病変のセグメンテーションと比較すると、Diceの平均値は77.6%、平均感度は78.9%という有望な結果を得た。 我々の知る限り、本研究は、この特定の問題に最初に取り組み、関連する作品との直接の互換性を制限するものである。 肝mri画像や脊髄ct画像など,類似した深層学習に基づく病変分画に関して,本実験では類似性,あるいは良好な分画品質を示した。 全体として、私たちの自動アプローチは、この挑戦的で野心的なタスクにおいて、ほぼ専門家的なセグメンテーション精度を提供することができます。

This study's objective was to segment spinal metastases in diagnostic MR images using a deep learning-based approach. Segmentation of such lesions can present a pivotal step towards enhanced therapy planning and validation, as well as intervention support during minimally invasive and image-guided surgeries like radiofrequency ablations. For this purpose, we used a U-Net like architecture trained with 40 clinical cases including both, lytic and sclerotic lesion types and various MR sequences. Our proposed method was evaluated with regards to various factors influencing the segmentation quality, e.g. the used MR sequences and the input dimension. We quantitatively assessed our experiments using Dice coefficients, sensitivity and specificity rates. Compared to expertly annotated lesion segmentations, the experiments yielded promising results with average Dice scores up to 77.6% and mean sensitivity rates up to 78.9%. To our best knowledge, our proposed study is one of the first to tackle this particular issue, which limits direct comparability with related works. In respect to similar deep learning-based lesion segmentations, e.g. in liver MR images or spinal CT images, our experiments showed similar or in some respects superior segmentation quality. Overall, our automatic approach can provide almost expert-like segmentation accuracy in this challenging and ambitious task.
翻訳日:2023-01-13 09:31:50 公開日:2020-01-28
# オブジェクト検出モデルに対するメンバーシップ推論攻撃

Membership Inference Attacks Against Object Detection Models ( http://arxiv.org/abs/2001.04011v2 )

ライセンス: Link先を確認
Yeachan Park, Myungjoo Kang(参考訳) 機械学習モデルは、トレーニングしたデータセットに関する情報をリークすることができる。 本稿では,ブラックボックスオブジェクト検出モデルに対する最初のメンバシップ推論攻撃を行い,トレーニングに与えられたデータレコードが使用されているかどうかを判定する。 対象検出モデルを攻撃するために,攻撃モデル入力のための空画像に予測された境界ボックスを描画するcanvas法という新しい手法を考案する。 実験の結果, 1段階および2段階検出モデルを用いて, プライベートセンシティブデータのメンバシップ状態を明らかにすることに成功した。 次に,防衛戦略を提案し,モデルとデータセット間の転送攻撃を行う。 その結果,オブジェクト検出モデルは他のモデルのような推論攻撃にも脆弱であることが判明した。

Machine learning models can leak information regarding the dataset they have trained. In this paper, we present the first membership inference attack against black-boxed object detection models that determines whether the given data records are used in the training. To attack the object detection model, we devise a novel method named as called a canvas method, in which predicted bounding boxes are drawn on an empty image for the attack model input. Based on the experiments, we successfully reveal the membership status of privately sensitive data trained using one-stage and two-stage detection models. We then propose defense strategies and also conduct a transfer attack between the models and datasets. Our results show that object detection models are also vulnerable to inference attacks like other models.
翻訳日:2023-01-12 04:58:24 公開日:2020-01-28
# EGGS:ソーシャルネットワークスパムのリレーショナルモデリングへの柔軟なアプローチ

EGGS: A Flexible Approach to Relational Modeling of Social Network Spam ( http://arxiv.org/abs/2001.04909v2 )

ライセンス: Link先を確認
Jonathan Brophy and Daniel Lowd(参考訳) ソーシャルネットワーキングのWebサイトは、スパムや不必要なメッセージが絶え間なく出回っている。 これらのメッセージは非常に短く、分離して識別することが困難になる傾向がある。 さらにスパマーは、メッセージを偽装して正当に見せかけ、ユーザーにリンクをクリックさせ、スパムフィルターを騙して悪質な行動を緩和させる。 したがって、一部のスパムフィルタは、ユーザやメッセージ間の接続のようなドメイン内の関係構造を調べ、偽コンテンツをよりよく識別する。 しかし、たとえ使用しても、リレーショナル構造は不完全あるいはアドホックな方法で利用されることがしばしばある。 本稿では,オンラインソーシャルネットワーク上でスパムを分類する汎用手法であるExpended Group-based Graphical Model for Spam (EGGS)を提案する。 それぞれのメッセージを個別にラベル付けるのではなく、同じ著者、同じコンテンツ、あるいは他のドメイン固有の接続があるときに関連したメッセージをグループ化する。 関連するメッセージを理解するために,stacked graphical learning (sgl) と probabilistic graphical models (pgm) という2つの手法を組み合わせた。 どちらの方法も、関連するメッセージがスパムである場合、メッセージはよりスパムになりやすいという考えを捉えているが、それらは異なる方法で、sglはシーケンシャルな分類子予測を使い、pgmは確率的推論を使う。 本手法を4つの異なるソーシャルネットワークドメインに適用する。 EGGSは、ほとんどの実験的な設定において、特に正確なラベルが不確実な場合において、独立したモデルよりも正確である。 PGMの実装では、マルコフ論理ネットワークと確率的ソフトロジックを比較し、どちらもどちらよりもうまく機能し、SGLとPGMの組み合わせは、通常、単独でより優れた性能を発揮する。

Social networking websites face a constant barrage of spam, unwanted messages that distract, annoy, and even defraud honest users. These messages tend to be very short, making them difficult to identify in isolation. Furthermore, spammers disguise their messages to look legitimate, tricking users into clicking on links and tricking spam filters into tolerating their malicious behavior. Thus, some spam filters examine relational structure in the domain, such as connections among users and messages, to better identify deceptive content. However, even when it is used, relational structure is often exploited in an incomplete or ad hoc manner. In this paper, we present Extended Group-based Graphical models for Spam (EGGS), a general-purpose method for classifying spam in online social networks. Rather than labeling each message independently, we group related messages together when they have the same author, the same content, or other domain-specific connections. To reason about related messages, we combine two popular methods: stacked graphical learning (SGL) and probabilistic graphical models (PGM). Both methods capture the idea that messages are more likely to be spammy when related messages are also spammy, but they do so in different ways; SGL uses sequential classifier predictions and PGMs use probabilistic inference. We apply our method to four different social network domains. EGGS is more accurate than an independent model in most experimental settings, especially when the correct label is uncertain. For the PGM implementation, we compare Markov logic networks to probabilistic soft logic and find that both work well with neither one dominating, and the combination of SGL and PGMs usually performs better than either on its own.
翻訳日:2023-01-11 13:45:01 公開日:2020-01-28
# パーセプトロン学習者を用いた遷移型依存構文解析

Transition-Based Dependency Parsing using Perceptron Learner ( http://arxiv.org/abs/2001.08279v2 )

ライセンス: Link先を確認
Rahul Radhakrishnan Iyer, Miguel Ballesteros, Chris Dyer, Robert Frederking(参考訳) 依存構造を用いた構文解析は、多くの異なる構文解析モデル、特に構文的にアノテートされたコーパスで訓練できるデータ駆動モデルを用いた自然言語処理の標準技術となっている。 本稿では,Perceptron Learner を用いたトランジッションベースの依存性解析に取り組む。 Perceptron Learnerにより関連性の高い機能を追加した提案モデルは,ベースラインのアーク標準パーサよりも優れている。 我々はMALTとLSTMのパーサーのUASを破った。 また、非プロジェクティブツリーのパースに対処する方法も提供します。

Syntactic parsing using dependency structures has become a standard technique in natural language processing with many different parsing models, in particular data-driven models that can be trained on syntactically annotated corpora. In this paper, we tackle transition-based dependency parsing using a Perceptron Learner. Our proposed model, which adds more relevant features to the Perceptron Learner, outperforms a baseline arc-standard parser. We beat the UAS of the MALT and LSTM parsers. We also give possible ways to address parsing of non-projective trees.
翻訳日:2023-01-07 17:45:37 公開日:2020-01-28
# POLARフレームワーク: 事前学習された単語埋め込みの解釈可能性を実現するPolar Opposites

The POLAR Framework: Polar Opposites Enable Interpretability of Pre-Trained Word Embeddings ( http://arxiv.org/abs/2001.09876v2 )

ライセンス: Link先を確認
Binny Mathew, Sandipan Sikdar, Florian Lemmerich and Markus Strohmaier(参考訳) POLAR - 意味微分の導入により、事前学習された単語の埋め込みに解釈可能性を追加するフレームワークを紹介する。 セマンティック微分(Semantic differentials)は、2つの極の反対(例えば、冷たく、柔らかい、硬い)のスケールでその位置を分析することによって、単語の意味を測定するための心理測定構造である。 我々のアプローチの中核となる考え方は、意味微分を通じて既存の事前訓練された単語埋め込みを、そのような極性で定義された解釈可能な次元を持つ新しい「極性」空間に変換することである。 当社のフレームワークでは,oracleが提供する極次元,すなわち外部ソースから,最も識別的な次元を選択することも可能です。 本稿では,従来の単語埋め込みに匹敵する性能を実現するために,様々な下流タスクに展開することで,フレームワークの有効性を実証する。 また,我々の枠組みによって選択された解釈可能な次元が人間の判断と一致していることを示す。 これらの結果から, 性能を損なうことなく, 単語埋め込みに解釈性を加えることができることを示した。 我々の研究は、事前訓練された単語埋め込みの解釈に興味のある研究者やエンジニアに関係している。

We introduce POLAR - a framework that adds interpretability to pre-trained word embeddings via the adoption of semantic differentials. Semantic differentials are a psychometric construct for measuring the semantics of a word by analysing its position on a scale between two polar opposites (e.g., cold -- hot, soft -- hard). The core idea of our approach is to transform existing, pre-trained word embeddings via semantic differentials to a new "polar" space with interpretable dimensions defined by such polar opposites. Our framework also allows for selecting the most discriminative dimensions from a set of polar dimensions provided by an oracle, i.e., an external source. We demonstrate the effectiveness of our framework by deploying it to various downstream tasks, in which our interpretable word embeddings achieve a performance that is comparable to the original word embeddings. We also show that the interpretable dimensions selected by our framework align with human judgement. Together, these results demonstrate that interpretability can be added to word embeddings without compromising performance. Our work is relevant for researchers and engineers interested in interpreting pre-trained word embeddings.
翻訳日:2023-01-06 07:23:23 公開日:2020-01-28
# 深層学習を用いた掘削データからのリアルタイムウェルログ予測

Real-Time Well Log Prediction From Drilling Data Using Deep Learning ( http://arxiv.org/abs/2001.10156v1 )

ライセンス: Link先を確認
Rayan Kanfar, Obai Shaikh, Mehrdad Yousefzadeh, Tapan Mukerji(参考訳) 本研究の目的は, 坑井の地下岩石特性をリアルタイム掘削データから予測することである。 密度、ポロシティ、およびソニックログは、地下資源の推定と搾取において最も重要なものである。 これらのワイヤラインの石油物理測定は、取得に費用がかかるため選択的に展開され、一方、掘削された井戸ごとに掘削情報が記録される。 したがって、ドリルデータからのワイヤラインログ予測の予測ツールは、データ取得に関する意思決定、特にデライン化と生産の井戸における管理に役立つ。 この問題は、掘削パラメータ間の強い非作用を持つ非線形であるため、この問題に対処する深層学習の可能性について検討する。 距離に基づくグローバル感性分析を用いたデータ拡張と特徴工学のためのワークフローを提案する。 本稿では,時間的畳み込みネットワークを併用したインセプションに基づく畳み込みニューラルネットワークを深層学習モデルとして提案する。 このモデルは、データの低周波と高周波の両方の内容を学習するように設計されている。 北海のvolveフィールドのためのequinorデータセットから12の井戸が学習に使われている。 モデル予測はトレンドを捉えるだけでなく、密度、ポロシティ、ソニックログにわたって物理的に一貫性がある。 テストデータでは平均二乗誤差は0.04の低値に達するが、相関係数は0.6である。 しかしこのモデルは、セメント砂岩、未固結砂、シェールなどの異なる種類の岩石を区別することができる。

The objective is to study the feasibility of predicting subsurface rock properties in wells from real-time drilling data. Geophysical logs, namely, density, porosity and sonic logs are of paramount importance for subsurface resource estimation and exploitation. These wireline petro-physical measurements are selectively deployed as they are expensive to acquire; meanwhile, drilling information is recorded in every drilled well. Hence a predictive tool for wireline log prediction from drilling data can help management make decisions about data acquisition, especially for delineation and production wells. This problem is non-linear with strong ineractions between drilling parameters; hence the potential for deep learning to address this problem is explored. We present a workflow for data augmentation and feature engineering using Distance-based Global Sensitivity Analysis. We propose an Inception-based Convolutional Neural Network combined with a Temporal Convolutional Network as the deep learning model. The model is designed to learn both low and high frequency content of the data. 12 wells from the Equinor dataset for the Volve field in the North Sea are used for learning. The model predictions not only capture trends but are also physically consistent across density, porosity, and sonic logs. On the test data, the mean square error reaches a low value of 0.04 but the correlation coefficient plateaus around 0.6. The model is able however to differentiate between different types of rocks such as cemented sandstone, unconsolidated sands, and shale.
翻訳日:2023-01-06 03:09:01 公開日:2020-01-28
# 離散ウェーブレット変換を組み合わせたWave-U-Netに基づく時間領域音源分離

Time-Domain Audio Source Separation Based on Wave-U-Net Combined with Discrete Wavelet Transform ( http://arxiv.org/abs/2001.10190v1 )

ライセンス: Link先を確認
Tomohiko Nakamura and Hiroshi Saruwatari(参考訳) 本稿では,離散ウェーブレット変換(dwt)に基づくダウンサンプリング(ds)とアップサンプリング(us)層を用いた時間領域オーディオソース分離手法を提案する。 提案手法は、現在最先端のディープニューラルネットワークであるWave-U-Netをベースとして、ダウンサンプルとアップサンプルの特徴マップを連続的に作成する。 このアーキテクチャはマルチレゾリューション解析に似ており、Wave-U-NetのDS層がエイリアスを引き起こし、分離に有用な情報を破棄する可能性があることを明らかにした。 これらの問題の影響はトレーニングによって低減される可能性があるが、より信頼性の高いソース分離手法を実現するためには、問題を克服可能なDS層を設計する必要がある。 この考え方では、DWTにはアンチエイリアスフィルタと完全な再構成特性があるという事実に着目し、提案した層を設計する。 音源分離実験は,提案手法の有効性と,アンチエイリアスフィルタと完全復元特性を同時に考慮することの重要性を示す。

We propose a time-domain audio source separation method using down-sampling (DS) and up-sampling (US) layers based on a discrete wavelet transform (DWT). The proposed method is based on one of the state-of-the-art deep neural networks, Wave-U-Net, which successively down-samples and up-samples feature maps. We find that this architecture resembles that of multiresolution analysis, and reveal that the DS layers of Wave-U-Net cause aliasing and may discard information useful for the separation. Although the effects of these problems may be reduced by training, to achieve a more reliable source separation method, we should design DS layers capable of overcoming the problems. With this belief, focusing on the fact that the DWT has an anti-aliasing filter and the perfect reconstruction property, we design the proposed layers. Experiments on music source separation show the efficacy of the proposed method and the importance of simultaneously considering the anti-aliasing filters and the perfect reconstruction property.
翻訳日:2023-01-06 03:08:39 公開日:2020-01-28
# ネットワークトラフィック分析によるIoT行動監視

IoT Behavioral Monitoring via Network Traffic Analysis ( http://arxiv.org/abs/2001.10632v1 )

ライセンス: Link先を確認
Arunan Sivanathan(参考訳) スマートホームや企業、都市には、スマートライトからセキュリティカメラまで、さまざまなiot(internet of things, モノのインターネット)が備わっている。 iotネットワークは私たちの生活に利益をもたらす可能性がありますが、従来のitネットワークでは見られないプライバシとセキュリティの課題を生み出します。 可視性が欠如しているため、このようなスマート環境のオペレータは、各IoTデバイスがサイバー攻撃から適切に機能しているかどうかを言うまでもなく、自身のIoT資産をよく知らない。 この論文は、IoTのネットワーク行動パターンをプロファイリングし、IoT分類を自動化し、運用コンテキストを推定し、サイバー攻撃を示唆する異常な振る舞いを検出する技術を開発するための我々の取り組みの成果である。 この論文はiotエコシステムを調査し、脆弱性評価、侵入検出、行動監視に対する現在のアプローチをレビューしながら開始する。 最初のコントリビューションでは、トラフィックのトレースを収集し、トラフィックパターンの属性を通じてIoTデバイスのネットワーク動作を特徴付ける。 これらの属性をトレーニングした堅牢な機械学習ベースの推論エンジンを開発し、99%以上の精度で28のIoTデバイスをリアルタイムに分類した。 第2の貢献は,iotデバイスの状態を識別しながら属性抽出のコストを削減することで,分類を強化する。 プロトタイプの実装と評価は,5つのIoTデバイスの動作変化を検出するための教師付き機械学習手法の能力を示す。 第3のコントリビュートでは,システム全体の再トレーニングを必要とせずに,新たなiotデバイスの追加や既存デバイスへの更新を動的に適応する,モジュール化された教師なし推論エンジンを開発しました。 実験により、94%以上の精度で10台のiotデバイスの攻撃やファームウェアの変更を自動的に検出できることを実証した。

Smart homes, enterprises, and cities are increasingly being equipped with a plethora of Internet of Things (IoT), ranging from smart-lights to security cameras. While IoT networks have the potential to benefit our lives, they create privacy and security challenges not seen with traditional IT networks. Due to the lack of visibility, operators of such smart environments are not often aware of their IoT assets, let alone whether each IoT device is functioning properly safe from cyber-attacks. This thesis is the culmination of our efforts to develop techniques to profile the network behavioral pattern of IoTs, automate IoT classification, deduce their operating context, and detect anomalous behavior indicative of cyber-attacks. We begin this thesis by surveying IoT ecosystem, while reviewing current approaches to vulnerability assessments, intrusion detection, and behavioral monitoring. For our first contribution, we collect traffic traces and characterize the network behavior of IoT devices via attributes from traffic patterns. We develop a robust machine learning-based inference engine trained with these attributes and demonstrate real-time classification of 28 IoT devices with over 99% accuracy. Our second contribution enhances the classification by reducing the cost of attribute extraction while also identifying IoT device states. Prototype implementation and evaluation demonstrate the ability of our supervised machine learning method to detect behavioral changes for five IoT devices. Our third and final contribution develops a modularized unsupervised inference engine that dynamically accommodates the addition of new IoT devices and/or updates to existing ones, without requiring system-wide retraining of the model. We demonstrate via experiments that our model can automatically detect attacks and firmware changes in ten IoT devices with over 94% accuracy.
翻訳日:2023-01-06 03:06:30 公開日:2020-01-28
# 予測的リスクキャラクタリゼーションに向けた規則的特徴と不可知的特徴の関係の統計的探索

Statistical Exploration of Relationships Between Routine and Agnostic Features Towards Interpretable Risk Characterization ( http://arxiv.org/abs/2001.10353v1 )

ライセンス: Link先を確認
Eric Wolsztynski(参考訳) 他の高スループットシステムの応用分野と同様に、ラジオロジーは、ラジオミクス解析から派生したような、より洗練された予測モデルを理解するという課題に直面している。 解釈は、機械学習モデルからの学習結果によって導かれるが、各テクニックによって大きく異なる可能性がある。 このアウトプットモデルが何であれ、重要な疑問が浮かび上がるだろう。 臨床応用のための予後モデルをどう解釈するか? 臨床的に解釈可能なモデルを作成するために,放射線学的特徴セット内の潜在的な情報構造をどうやって特定できるのか? そして、どのようにして機能間の潜在的な関係を再結合し、活用し、解釈性を改善するのか? 様々な角度から放射線学的特徴間の関係(おそらく非線形)を評価するために、いくつかの統計手法が研究されている。

As is typical in other fields of application of high throughput systems, radiology is faced with the challenge of interpreting increasingly sophisticated predictive models such as those derived from radiomics analyses. Interpretation may be guided by the learning output from machine learning models, which may however vary greatly with each technique. Whatever this output model, it will raise some essential questions. How do we interpret the prognostic model for clinical implementation? How can we identify potential information structures within sets of radiomic features, in order to create clinically interpretable models? And how can we recombine or exploit potential relationships between features towards improved interpretability? A number of statistical techniques are explored to assess (possibly nonlinear) relationships between radiological features from different angles.
翻訳日:2023-01-06 03:01:57 公開日:2020-01-28
# LIMITS: リソース制限付きIoTシステムのための軽量機械学習

LIMITS: Lightweight Machine Learning for IoT Systems with Resource Limitations ( http://arxiv.org/abs/2001.10189v1 )

ライセンス: Link先を確認
Benjamin Sliwa and Nico Piatkowski and Christian Wietfeld(参考訳) 小さなデバイスでビッグデータの知識を爆発させることは、真に認知的なIoT(Internet of Things)システムを構築するための道を開くだろう。 機械学習はiotベースのデータ分析において大きな進歩をもたらしたが、トレーニングされた機械学習モデルのデプロイフェーズには大きな方法論的ギャップがある。 マイクロコントローラユニット(mcu)のようなリソース制約のあるプラットフォームでは、モデルの選択とパラメータ化は通常ヒューリスティックスや分析モデルに基づいて行われる。 しかし、これらのアプローチは、ハードウェア、コンパイラ固有の最適化、およびコード依存の相互作用を考慮しないため、必要なシステムリソースを大まかに見積もることができるだけである。 本稿では,ターゲットとするiotプラットフォームの実際のコンパイルツールチェーンを明示的に考慮した,プラットフォーム・イン・ザ・ループアプローチを適用した,新しいオープンソースフレームワークであるlightweight machine learning for iot systems (limits)を提案する。 LIMITSは、実験自動化、プラットフォーム固有のコード生成、スイートスポット決定などのハイレベルなタスクに焦点を当てている。 検証済みの低レベルモデル実装の確固たる基盤は、よく確立されたデータ分析フレームワークであるWaikato Environment for Knowledge Analysis (WEKA)によって提供される。 ここでは、異なる学習モデルと実世界のIoTプラットフォームと16kBから4MBまでのメモリ制約を比較し、機械学習可能なIoTシステムの開発を触媒する可能性を実証する。

Exploiting big data knowledge on small devices will pave the way for building truly cognitive Internet of Things (IoT) systems. Although machine learning has led to great advancements for IoT-based data analytics, there remains a huge methodological gap for the deployment phase of trained machine learning models. For given resource-constrained platforms such as Microcontroller Units (MCUs), model choice and parametrization are typically performed based on heuristics or analytical models. However, these approaches are only able to provide rough estimates of the required system resources as they do not consider the interplay of hardware, compiler specific optimizations, and code dependencies. In this paper, we present the novel open source framework LIghtweight Machine learning for IoT Systems (LIMITS), which applies a platform-in-the-loop approach explicitly considering the actual compilation toolchain of the target IoT platform. LIMITS focuses on high level tasks such as experiment automation, platform-specific code generation, and sweet spot determination. The solid foundations of validated low-level model implementations are provided by the coupled well-established data analysis framework Waikato Environment for Knowledge Analysis (WEKA). We apply and validate LIMITS in two case studies focusing on cellular data rate prediction and radio-based vehicle classification, where we compare different learning models and real world IoT platforms with memory constraints from 16 kB to 4 MB and demonstrate its potential to catalyze the development of machine learning enabled IoT systems.
翻訳日:2023-01-06 03:01:14 公開日:2020-01-28
# ロバスト登録と深層ループ閉鎖を有するレッグロボットのためのオンラインLiDAR-SLAM

Online LiDAR-SLAM for Legged Robots with Robust Registration and Deep-Learned Loop Closure ( http://arxiv.org/abs/2001.10249v1 )

ライセンス: Link先を確認
Milad Ramezani, Georgi Tinchev, Egor Iuganov and Maurice Fallon(参考訳) 本稿では,産業環境におけるロボットのローカライズとマップ化を実現するために,最先端の深層学習機能に基づくループクロージャ検出装置を組み込んだ因子グラフLiDAR-SLAMシステムを提案する。 これらの設備は、不明瞭な金属構造で構成されており、lidarセンシングのみを使用し、四足ロボットのナビゲーションpc上で動作するように開発された。 点雲はICP登録で整列する前に慣性運動状態推定器を用いて蓄積される。 ループを閉じるために、雲間の個々のセグメントにマッチするループ提案機構を使用します。 これらのセグメントにマッチするように、ディスクリプタをオフラインでトレーニングしました。 本手法の効率性は,ロボットのCPUのみを用いて,この深層学習手法をリアルタイムに展開することのできるパラメータ数を最小化するために,ネットワークアーキテクチャを慎重に設計することに由来する。 ポーズグラフの最適化により、オドメトリーとループ閉鎖係数のセットを更新する。 最後に,登録の信頼性を検証する効率的なリスクアライメント予測手法を提案する。 産業施設における実験結果は,slamマップからの自律追従経路を含む,システムのロバスト性と柔軟性を実証した。

In this paper, we present a factor-graph LiDAR-SLAM system which incorporates a state-of-the-art deeply learned feature-based loop closure detector to enable a legged robot to localize and map in industrial environments. These facilities can be badly lit and comprised of indistinct metallic structures, thus our system uses only LiDAR sensing and was developed to run on the quadruped robot's navigation PC. Point clouds are accumulated using an inertial-kinematic state estimator before being aligned using ICP registration. To close loops we use a loop proposal mechanism which matches individual segments between clouds. We trained a descriptor offline to match these segments. The efficiency of our method comes from carefully designing the network architecture to minimize the number of parameters such that this deep learning method can be deployed in real-time using only the CPU of a legged robot, a major contribution of this work. The set of odometry and loop closure factors are updated using pose graph optimization. Finally we present an efficient risk alignment prediction method which verifies the reliability of the registrations. Experimental results at an industrial facility demonstrated the robustness and flexibility of our system, including autonomous following paths derived from the SLAM map.
翻訳日:2023-01-06 03:00:50 公開日:2020-01-28
# コヒーレント状態受信機のリアルタイム校正:試行錯誤による学習

Real-time calibration of coherent-state receivers: learning by trial and error ( http://arxiv.org/abs/2001.10283v1 )

ライセンス: Link先を確認
M. Bilkis, M. Rosati, R. Morral Yepes and J. Calsamiglia(参考訳) 現在の技術と光のコヒーレント状態の最適識別は、古典的および量子的な通信において鍵となる問題であり、その解決策は、自由空間および光ファイバチャネルにおける長距離通信の効率的な受信機の実現を可能にする。 本稿では,RLプロトコルにより,受動線形光学,光検出器,古典的適応制御などを用いて,エージェントが最適に近いコヒーレント状態の受信機を学習できることを示す。 各エージェントは、いくつかの独立した識別実験を通じて、リアルタイムで訓練およびテストされ、状態のエネルギー、受信機の設定、および実験を管理する量子力学的法則に関する知識を持たない。 観察された光検出器結果のみに基づいて、エージェントは、可能な受信装置のセット~310^3を適応的に選択し、その推測が正しければ各実験の最後に報酬を得る。 量子物理学におけるRLの以前の応用と違い、各ランで収集された情報は本質的に確率的であり、選択された受信機の性能を正確に評価するには不十分である。 それにもかかわらず、我々は以下のエージェントのファミリーを提示する。 i) 3 10^2実験後,最高のガウス受信機を打つ受信機を発見する。 (ii)10^3実験後,最高のガウス受信機の累積報酬を超える。 三) ほぼ最適の受信機を同時に発見し、10^5実験後に累積報酬を得る。 以上の結果から,RL手法は量子受信機のオンライン制御に適した手法であり,未知チャネル上での長距離通信に利用できることがわかった。

The optimal discrimination of coherent states of light with current technology is a key problem in classical and quantum communication, whose solution would enable the realization of efficient receivers for long-distance communications in free-space and optical fiber channels. In this article, we show that reinforcement learning (RL) protocols allow an agent to learn near-optimal coherent-state receivers made of passive linear optics, photodetectors and classical adaptive control. Each agent is trained and tested in real time over several runs of independent discrimination experiments and has no knowledge about the energy of the states nor the receiver setup nor the quantum-mechanical laws governing the experiments. Based exclusively on the observed photodetector outcomes, the agent adaptively chooses among a set of ~3 10^3 possible receiver setups, and obtains a reward at the end of each experiment if its guess is correct. At variance with previous applications of RL in quantum physics, the information gathered in each run is intrinsically stochastic and thus insufficient to evaluate exactly the performance of the chosen receiver. Nevertheless, we present families of agents that: (i) discover a receiver beating the best Gaussian receiver after ~3 10^2 experiments; (ii) surpass the cumulative reward of the best Gaussian receiver after ~10^3 experiments; (iii) simultaneously discover a near-optimal receiver and attain its cumulative reward after ~10^5 experiments. Our results show that RL techniques are suitable for on-line control of quantum receivers and can be employed for long-distance communications over potentially unknown channels.
翻訳日:2023-01-06 03:00:30 公開日:2020-01-28
# RISによる大規模非直交多重アクセスネットワークの展開とパッシブビームフォーミング設計

RIS Enhanced Massive Non-orthogonal Multiple Access Networks: Deployment and Passive Beamforming Design ( http://arxiv.org/abs/2001.10363v1 )

ライセンス: Link先を確認
Xiao Liu, Yuanwei Liu, Yue Chen, and H. Vincent Poor(参考訳) 非直交多重アクセス(NOMA)技術を利用した再構成可能なインテリジェント表面(RIS)の展開と受動ビームフォーミング設計のための新しいフレームワークを提案する。 ユーザの特定のデータ要求を考慮したエネルギー効率を最大化するために、共同配置、位相シフト設計、および電力配分の問題を定式化する。 この問題に対処するために、機械学習アプローチは2つのステップで採用されている。 まず、実データを用いてユーザのテレトラフィック需要を予測するために、新しいlong short-term memory (lstm) ベースのecho state network (esn) アルゴリズムを提案する。 次に,risの展開と設計の共通問題を解くために,位置獲得と位相制御に基づく減衰型二重ディープqネットワーク(d3qn)を提案する。 提案アルゴリズムでは、制御器によってrisを制御するベースステーションがエージェントとして機能する。 エージェントは、ミスやユーザのフィードバックから学習することで、RISの最適な展開と設計方針を達成するためのRIS強化システムの状態を定期的に観察する。 さらに,提案したD3QNに基づく配置設計アルゴリズムは,温和な条件下で収束可能であることを実証した。 LSTMに基づくESNアルゴリズムは,予測精度と計算複雑性のトレードオフを達成可能であることを示すシミュレーション結果を提供する。 最後に,提案するd3qnアルゴリズムがベンチマークを上回っており,一方,noma-enhanced risシステムは直交多重アクセス (oma) 可能なrisシステムよりも高いエネルギー効率を実現することができることを示した。

A novel framework is proposed for the deployment and passive beamforming design of a reconfigurable intelligent surface (RIS) with the aid of non-orthogonal multiple access (NOMA) technology. The problem of joint deployment, phase shift design, as well as power allocation is formulated for maximizing the energy efficiency with considering users' particular data requirements. To tackle this pertinent problem, machine learning approaches are adopted in two steps. Firstly, a novel long short-term memory (LSTM) based echo state network (ESN) algorithm is proposed to predict users' tele-traffic demand by leveraging a real dataset. Secondly, a decaying double deep Q-network (D3QN) based position-acquisition and phase-control algorithm is proposed to solve the joint problem of deployment and design of the RIS. In the proposed algorithm, the base station, which controls the RIS by a controller, acts as an agent. The agent periodically observes the state of the RIS-enhanced system for attaining the optimal deployment and design policies of the RIS by learning from its mistakes and the feedback of users. Additionally, it is proved that the proposed D3QN based deployment and design algorithm is capable of converging within mild conditions. Simulation results are provided for illustrating that the proposed LSTM-based ESN algorithm is capable of striking a tradeoff between the prediction accuracy and computational complexity. Finally, it is demonstrated that the proposed D3QN based algorithm outperforms the benchmarks, while the NOMA-enhanced RIS system is capable of achieving higher energy efficiency than orthogonal multiple access (OMA) enabled RIS system.
翻訳日:2023-01-06 03:00:05 公開日:2020-01-28
# TDEFSI:合成情報を用いた深層学習に基づくエピデミック予測の理論

TDEFSI: Theory Guided Deep Learning Based Epidemic Forecasting with Synthetic Information ( http://arxiv.org/abs/2002.04663v1 )

ライセンス: Link先を確認
Lijing Wang, Jiangzhuo Chen, and Madhav Marathe(参考訳) インフルエンザのような病気(ili)は社会に大きな社会的・経済的負担を負う。 伝統的に、ILI監視データは毎週更新され、空間的に粗い解像度で提供される。 ILIの時間的・信頼性の高い高分解能時空間予測は局所的準備と最適介入に不可欠である。 本稿では,ニューラルネットワークの強みとネットワーク上の流行過程の高分解能シミュレーションを統合する,流行予測フレームワークであるtdefsi(theory guided deep learning based epidemic forecasting with synthetic information)を提案する。 TDEFSIは低分解能時系列データを用いて正確な高分解能時空間予測を行う。 訓練フェーズの間、tdefsiは都市部に固有の空間的・社会的多様性をトレーニングデータの1つとして明示的にモデル化する流行の高分解能シミュレーションを用いている。 我々は,季節内および季節間における低分解能観測を特徴とし,高分解能の詳細な予測を行うために,2分岐型リカレントニューラルネットワークモデルを訓練する。 その結果得られた予測は、観測されたデータによるだけでなく、特定の都市部の複雑な社会的、人口学的、地理的属性や、ネットワーク上の病気伝播の数学的理論も捉えている。 我々は,米国内の州および郡レベルでの総合的および実世界テストデータセットを用いて,iliの発生率の予測とtdefsiの性能評価に焦点を当てた。 その結果, 状態レベルでは, 最先端手法と同等の性能が得られることがわかった。 郡レベルでは、TDEFSIは他の方法よりも優れている。 本手法は他の感染症にも適用可能である。

Influenza-like illness (ILI) places a heavy social and economic burden on our society. Traditionally, ILI surveillance data is updated weekly and provided at a spatially coarse resolution. Producing timely and reliable high-resolution spatiotemporal forecasts for ILI is crucial for local preparedness and optimal interventions. We present TDEFSI (Theory Guided Deep Learning Based Epidemic Forecasting with Synthetic Information), an epidemic forecasting framework that integrates the strengths of deep neural networks and high-resolution simulations of epidemic processes over networks. TDEFSI yields accurate high-resolution spatiotemporal forecasts using low-resolution time series data. During the training phase, TDEFSI uses high-resolution simulations of epidemics that explicitly model spatial and social heterogeneity inherent in urban regions as one component of training data. We train a two-branch recurrent neural network model to take both within-season and between-season low-resolution observations as features, and output high-resolution detailed forecasts. The resulting forecasts are not just driven by observed data but also capture the intricate social, demographic and geographic attributes of specific urban regions and mathematical theories of disease propagation over networks. We focus on forecasting the incidence of ILI and evaluate TDEFSI's performance using synthetic and real-world testing datasets at the state and county levels in the USA. The results show that, at the state level, our method achieves comparable/better performance than several state-of-the-art methods. At the county level, TDEFSI outperforms the other methods. The proposed method can be applied to other infectious diseases as well.
翻訳日:2023-01-06 02:58:59 公開日:2020-01-28
# マルチ組織セグメンテーションにおける深層学習

Deep Learning in Multi-organ Segmentation ( http://arxiv.org/abs/2001.10619v1 )

ライセンス: Link先を確認
Yang Lei, Yabo Fu, Tonghe Wang, Richard L.J. Qiu, Walter J. Curran, Tian Liu, Xiaofeng Yang(参考訳) 本稿では,マルチオーガンセグメンテーションにおけるディープラーニング(dl)について概観する。 医学的画像分割と応用のための最新のDLベースの手法を要約した。 これらの手法はネットワーク設計により6つのカテゴリに分類された。 各カテゴリについて、調査対象の作品をリストアップし、重要なコントリビューションを強調し、特定の課題を特定しました。 各カテゴリの詳細なレビューに続いて,その成果,欠点,将来の可能性について概説した。 我々は,2017 AAPM Thoracic Auto-Segmentation Challengeデータセットと2015 MICCAI Head Neck Auto-Segmentation Challengeデータセットを含むベンチマークデータセットを用いた,胸部・頭頸部の多臓器分割のためのDLベース手法の包括的な比較を行った。

This paper presents a review of deep learning (DL) in multi-organ segmentation. We summarized the latest DL-based methods for medical image segmentation and applications. These methods were classified into six categories according to their network design. For each category, we listed the surveyed works, highlighted important contributions and identified specific challenges. Following the detailed review of each category, we briefly discussed its achievements, shortcomings and future potentials. We provided a comprehensive comparison among DL-based methods for thoracic and head & neck multiorgan segmentation using benchmark datasets, including the 2017 AAPM Thoracic Auto-segmentation Challenge datasets and 2015 MICCAI Head Neck Auto-Segmentation Challenge datasets.
翻訳日:2023-01-06 02:58:33 公開日:2020-01-28
# BioTouchPass2: 時間適応リカレントニューラルネットワークを用いたタッチスクリーンパスワードバイオメトリックス

BioTouchPass2: Touchscreen Password Biometrics Using Time-Aligned Recurrent Neural Networks ( http://arxiv.org/abs/2001.10223v1 )

ライセンス: Link先を確認
Ruben Tolosana, Ruben Vera-Rodriguez, Julian Fierrez, Javier Ortega-Garcia(参考訳) パスワードは、あらゆる種類のアプリケーションで毎日使われています。 しかし、多くの場合、単独では十分に安全ではない。 この作業は、2要素認証によってパスワードのシナリオを強化し、ユーザーが通常どおり入力するのではなく、パスワードの各文字を描くように要求する。 本研究の主な貢献は次のとおりである。 i) 位置,姿勢,デバイスに制約のない,教師なしのモバイルシナリオで取得した新しいMobileTouchDB公開データベースを提案する。 このデータベースには、217人のユーザーが実行した64K以上のオンライン文字サンプルが含まれており、94の異なるスマートフォンモデルと最大6回の買収セッションがある。 二 動的時間ワープ(DTW)のような従来の認証システムとリカレントニューラルネットワーク(RNN)に基づく新しい手法の両方を考慮した提案手法の完全な解析を行う。 さらに,TA-RNN(Time-Aligned Recurrent Neural Networks)という新しい手法を提案する。 このアプローチはDTWとRNNの可能性を組み合わせて、より堅牢なシステムを攻撃に対して訓練する。 提案手法の完全な解析はMobileTouchDBとe-BioDigitDBデータベースの両方を用いて行う。 提案するTA-RNNシステムは,4桁のパスワードと1文字あたりのトレーニングサンプルを用いて,最終的な2.38%の誤り率を達成した。 これらの結果は,同じインポスタットシナリオで攻撃が100%成功率を持つ従来のtypedベースのパスワードシステムと比較して,提案手法の展開を促すものである。

Passwords are still used on a daily basis for all kind of applications. However, they are not secure enough by themselves in many cases. This work enhances password scenarios through two-factor authentication asking the users to draw each character of the password instead of typing them as usual. The main contributions of this study are as follows: i) We present the novel MobileTouchDB public database, acquired in an unsupervised mobile scenario with no restrictions in terms of position, posture, and devices. This database contains more than 64K on-line character samples performed by 217 users, with 94 different smartphone models, and up to 6 acquisition sessions. ii) We perform a complete analysis of the proposed approach considering both traditional authentication systems such as Dynamic Time Warping (DTW) and novel approaches based on Recurrent Neural Networks (RNNs). In addition, we present a novel approach named Time-Aligned Recurrent Neural Networks (TA-RNNs). This approach combines the potential of DTW and RNNs to train more robust systems against attacks. A complete analysis of the proposed approach is carried out using both MobileTouchDB and e-BioDigitDB databases. Our proposed TA-RNN system outperforms the state of the art, achieving a final 2.38% Equal Error Rate, using just a 4-digit password and one training sample per character. These results encourage the deployment of our proposed approach in comparison with traditional typed-based password systems where the attack would have 100% success rate under the same impostor scenario.
翻訳日:2023-01-06 02:52:42 公開日:2020-01-28
# 畳み込みニューラルネットワーク予測によるモザイク画像のロスレス圧縮

Lossless Compression of Mosaic Images with Convolutional Neural Network Prediction ( http://arxiv.org/abs/2001.10484v1 )

ライセンス: Link先を確認
Seyed Mehdi Ayyoubzadeh, Xiaolin Wu(参考訳) デジタルカメラの原色モザイク画像に対するCNNに基づく予測無損失圧縮方式を提案する。 この特殊な応用問題は以前は検討されていなかったが、現代のcnnによる画像復元の手法(例えば、超高解像度、低輝度化、デブラリング)は、元のモザイク画像上で動作し、最良の結果を得る必要があるため、ますます重要になっている。 この論文の重要な革新は、空間-スペクトルモザイクパターンの高次非線形CNN予測器である。 深層学習予測は、空間スペクトルモザイク画像における非常に複雑なサンプル依存をより正確にモデル化し、既存の画像予測装置よりも統計的冗長性を徹底的に除去することができる。 提案するcnn予測器は,カメラraw画像において前例のないロスレス圧縮性能を実現する。

We present a CNN-based predictive lossless compression scheme for raw color mosaic images of digital cameras. This specialized application problem was previously understudied but it is now becoming increasingly important, because modern CNN methods for image restoration tasks (e.g., superresolution, low lighting enhancement, deblurring), must operate on original raw mosaic images to obtain the best possible results. The key innovation of this paper is a high-order nonlinear CNN predictor of spatial-spectral mosaic patterns. The deep learning prediction can model highly complex sample dependencies in spatial-spectral mosaic images more accurately and hence remove statistical redundancies more thoroughly than existing image predictors. Experiments show that the proposed CNN predictor achieves unprecedented lossless compression performance on camera raw images.
翻訳日:2023-01-06 02:51:33 公開日:2020-01-28
# 大規模データセットにおける脊椎レベルの正確な同定

Accurately identifying vertebral levels in large datasets ( http://arxiv.org/abs/2001.10503v1 )

ライセンス: Link先を確認
Daniel C. Elton, Veit Sandfort, Perry J. Pickhardt, and Ronald M. Summers(参考訳) 脊椎の椎骨レベルは、プラーク、筋肉、脂肪、骨のミネラル密度を測定する際に有用な座標系を提供する。 各脊椎の類似の出現、脊椎の曲率、骨折した椎骨、インプラント、仙骨の腰椎化、L5の仙骨化などの異常の可能性から、正確で正確な分類は困難である。 この研究の目的は、大規模な異種データセットのL1レベルを正確かつ堅牢に識別できるシステムを開発することである。 最初のアプローチは、3D U-Netを使ってL1椎骨をスキャンボリューム全体を使って直接分割し、コンテキストを提供する。 また、l1,t12の2つのクラスセグメンテーションと、l1,t12の3つのクラスセグメンテーションと、t12に付随するリブのモデルもテストした。 トレーニングサンプル数を249スキャンに増やし、社内のセグメンテーションツールから疑似セグメンテーションを使用して、l1椎骨の同定に関して98%の精度を達成できた。 次に,3次元U-Netを用いて全脊椎の反復的インスタンス分割と分類を行うアルゴリズムを開発した。 インスタンスベースのアプローチは、ほぼ全脊椎のより良好な分節を得ることができたが、l1の分類精度は低かった。

The vertebral levels of the spine provide a useful coordinate system when making measurements of plaque, muscle, fat, and bone mineral density. Correctly classifying vertebral levels with high accuracy is challenging due to the similar appearance of each vertebra, the curvature of the spine, and the possibility of anomalies such as fractured vertebrae, implants, lumbarization of the sacrum, and sacralization of L5. The goal of this work is to develop a system that can accurately and robustly identify the L1 level in large heterogeneous datasets. The first approach we study is using a 3D U-Net to segment the L1 vertebra directly using the entire scan volume to provide context. We also tested models for two class segmentation of L1 and T12 and a three class segmentation of L1, T12 and the rib attached to T12. By increasing the number of training examples to 249 scans using pseudo-segmentations from an in-house segmentation tool we were able to achieve 98% accuracy with respect to identifying the L1 vertebra, with an average error of 4.5 mm in the craniocaudal level. We next developed an algorithm which performs iterative instance segmentation and classification of the entire spine with a 3D U-Net. We found the instance based approach was able to yield better segmentations of nearly the entire spine, but had lower classification accuracy for L1.
翻訳日:2023-01-06 02:51:19 公開日:2020-01-28
# 視覚的位置認識のための階層的マルチプロセス融合

Hierarchical Multi-Process Fusion for Visual Place Recognition ( http://arxiv.org/abs/2002.03895v1 )

ライセンス: Link先を確認
Stephen Hausler and Michael Milford(参考訳) 複数の補完的なテクニックを組み合わせることは、パフォーマンスを改善する方法として長い間見なされてきた。 視覚ローカライズでは、マルチセンサー融合、単一センシングモードのマルチプロセス融合、さらには異なるローカライズ技術の組み合わせによってパフォーマンスが向上することが示されている。 しかし, 異なる局所化手法を組み合わせるだけでは, 異なる局所化手法の性能特性は説明できない。 本稿では, 局所化手法の3つの特性, 局所化仮説の分布, 外観・視点不変特性, および, それぞれのシステムがよく機能する環境における相違点を顕著に生かした, 階層的局所化システムについて述べる。 2つのテクニックが並列融合よりも階層的にどのように機能するか、一つのテクニックが個々のパフォーマンスに優れていても、2つの異なるテクニックの組み合わせが1つのテクニックの2レベルよりもうまく機能するかを示し、より段階的にローカライズ性能を改善する2層と3層階層構造を開発する。 最後に,各層に相補的特性を持つ手法から局所化仮説を導出する階層的階層的枠組みを構築し,最終的な局所化段階までの正しい仮説の維持を著しく改善する。 2つの挑戦的データセットを用いて,提案手法が最先端技術より優れていることを示す。

Combining multiple complementary techniques together has long been regarded as a way to improve performance. In visual localization, multi-sensor fusion, multi-process fusion of a single sensing modality, and even combinations of different localization techniques have been shown to result in improved performance. However, merely fusing together different localization techniques does not account for the varying performance characteristics of different localization techniques. In this paper we present a novel, hierarchical localization system that explicitly benefits from three varying characteristics of localization techniques: the distribution of their localization hypotheses, their appearance- and viewpoint-invariant properties, and the resulting differences in where in an environment each system works well and fails. We show how two techniques deployed hierarchically work better than in parallel fusion, how combining two different techniques works better than two levels of a single technique, even when the single technique has superior individual performance, and develop two and three-tier hierarchical structures that progressively improve localization performance. Finally, we develop a stacked hierarchical framework where localization hypotheses from techniques with complementary characteristics are concatenated at each layer, significantly improving retention of the correct hypothesis through to the final localization stage. Using two challenging datasets, we show the proposed system outperforming state-of-the-art techniques.
翻訳日:2023-01-06 02:50:54 公開日:2020-01-28
# 確率的シリアルルールの操作における境界インセンティブ

Bounded Incentives in Manipulating the Probabilistic Serial Rule ( http://arxiv.org/abs/2001.10640v1 )

ライセンス: Link先を確認
Zihe Wang and Zhide Wei and Jie Zhang(参考訳) 確率的シリアル機構はその望ましい公正性と効率性でよく知られている。 これはランダム割当問題に対する最も顕著なプロトコルの1つである。 しかし、確率的直列はインセンティブ互換ではないため、これらの望ましい性質はエージェントの宣言された好みに対してのみ保持される。 戦略行動による実質的な実用性の向上は、自己関心のエージェントがメカニズムを操作するきっかけとなり、実際にメカニズムを採用するという基礎を覆すことになる。 本稿では,個々のエージェントが戦略的操作によってその有用性を向上できる程度を特徴付ける。 機構のインセンティブ比が$\frac{3}{2}$であることを示す。 すなわち、その実用性が真に報告する場合の1.5倍以上になるように、その好みを誤って報告することはできない。 この比率は、エージェントが他のエージェントのレポートに関する完全な情報を持ち、計算上一般に難解であっても最良の応答戦略を見出すことによって、最悪の場合の保証である。 この最悪の研究を補完するために, 実験により, エージェントの有効利用率を更に評価した。 実験は、エージェントがルールを操作する動機は非常に限られていることを示している。 これらの結果は、戦略的な操作に対する確率的連続の堅牢性に光を当てた。

The Probabilistic Serial mechanism is well-known for its desirable fairness and efficiency properties. It is one of the most prominent protocols for the random assignment problem. However, Probabilistic Serial is not incentive-compatible, thereby these desirable properties only hold for the agents' declared preferences, rather than their genuine preferences. A substantial utility gain through strategic behaviors would trigger self-interested agents to manipulate the mechanism and would subvert the very foundation of adopting the mechanism in practice. In this paper, we characterize the extent to which an individual agent can increase its utility by strategic manipulation. We show that the incentive ratio of the mechanism is $\frac{3}{2}$. That is, no agent can misreport its preferences such that its utility becomes more than 1.5 times of what it is when reports truthfully. This ratio is a worst-case guarantee by allowing an agent to have complete information about other agents' reports and to figure out the best response strategy even if it is computationally intractable in general. To complement this worst-case study, we further evaluate an agent's utility gain on average by experiments. The experiments show that an agent' incentive in manipulating the rule is very limited. These results shed some light on the robustness of Probabilistic Serial against strategic manipulation, which is one step further than knowing that it is not incentive-compatible.
翻訳日:2023-01-06 02:50:13 公開日:2020-01-28
# 脳波を用いた脳-コンピュータインタフェース(BCIs):信号センシング技術と計算知能アプローチの最近の研究動向とその応用

EEG-based Brain-Computer Interfaces (BCIs): A Survey of Recent Studies on Signal Sensing Technologies and Computational Intelligence Approaches and their Applications ( http://arxiv.org/abs/2001.11337v1 )

ライセンス: Link先を確認
Xiaotong Gu, Zehong Cao, Alireza Jolfaei, Peng Xu, Dongrui Wu, Tzyy-Ping Jung, Chin-Teng Lin(参考訳) Brain-Computer Interface (BCI) はユーザーとシステム間の強力なコミュニケーションツールであり、人間の脳が直接環境と通信し相互作用する能力を高める。 過去数十年間、神経科学とコンピュータ科学の進歩は、bciにおけるエキサイティングな発展につながり、bciは計算神経科学と知能の分野において、学際的な分野となっている。 近年, ウェアラブルセンサ, リアルタイムデータストリーミング, 機械学習, 深層学習などの技術進歩により, 翻訳・医療分野での脳波(EEG)に基づくBCIへの関心が高まっている。 多くの人が脳波に基づくBCIの恩恵を受けており、職場や家庭での単調なタスクの下で認知状態の変動を継続的に監視している。 本研究では,過去5年間(2015-2019)の系統的概要のギャップを補うため,脳波信号センシング技術とBCIアプリケーションにおける計算知能アプローチの最近の文献を調査した。 具体的には,BCIの現状と,その重大な障害について概説する。 次に,脳波信号の収集と洗浄を行うための高度信号センシング技術と拡張技術を提案する。 さらに, 解釈可能なファジィモデル, 転送学習, 深層学習, 組み合わせなど, 人間の認知状態の監視, 維持, 追跡, 一般的な応用における動作性能など, 最先端の計算知能技術を示す。 最後に、脳波に基づくBCI研究の方向性について、革新的なBCIにインスパイアされた医療アプリケーションをいくつか提供します。

Brain-Computer Interface (BCI) is a powerful communication tool between users and systems, which enhances the capability of the human brain in communicating and interacting with the environment directly. Advances in neuroscience and computer science in the past decades have led to exciting developments in BCI, thereby making BCI a top interdisciplinary research area in computational neuroscience and intelligence. Recent technological advances such as wearable sensing devices, real-time data streaming, machine learning, and deep learning approaches have increased interest in electroencephalographic (EEG) based BCI for translational and healthcare applications. Many people benefit from EEG-based BCIs, which facilitate continuous monitoring of fluctuations in cognitive states under monotonous tasks in the workplace or at home. In this study, we survey the recent literature of EEG signal sensing technologies and computational intelligence approaches in BCI applications, compensated for the gaps in the systematic summary of the past five years (2015-2019). In specific, we first review the current status of BCI and its significant obstacles. Then, we present advanced signal sensing and enhancement technologies to collect and clean EEG signals, respectively. Furthermore, we demonstrate state-of-art computational intelligence techniques, including interpretable fuzzy models, transfer learning, deep learning, and combinations, to monitor, maintain, or track human cognitive states and operating performance in prevalent applications. Finally, we deliver a couple of innovative BCI-inspired healthcare applications and discuss some future research directions in EEG-based BCIs.
翻訳日:2023-01-06 02:49:50 公開日:2020-01-28
# 文脈影響検出のためのディープニューラルネットワークフレームワーク

A Deep Neural Framework for Contextual Affect Detection ( http://arxiv.org/abs/2001.10169v1 )

ライセンス: Link先を確認
Kumar Shikhar Deep, Asif Ekbal, Pushpak Bhattacharyya(参考訳) 感情を持たない短い単純なテキストは、その文脈に合わせて読むときに強い感情を表し、すなわち同じ文章はその文脈に応じて極端な怒りと幸福を表現することができる。 本稿では、文中の単語の相互依存を学習すると同時に、対話における文の相互依存を学習する文脈的影響検出(cad)フレームワークを提案する。 提案するcadフレームワークはgru(gated recurrent unit)に基づいており,文脈的単語埋め込みや他の多彩な手作り機能セットによって支援されている。 評価と分析の結果,友人や感情パッシュデータセットでは,最先端の手法を5.49%,9.14%上回った。

A short and simple text carrying no emotion can represent some strong emotions when reading along with its context, i.e., the same sentence can express extreme anger as well as happiness depending on its context. In this paper, we propose a Contextual Affect Detection (CAD) framework which learns the inter-dependence of words in a sentence, and at the same time the inter-dependence of sentences in a dialogue. Our proposed CAD framework is based on a Gated Recurrent Unit (GRU), which is further assisted by contextual word embeddings and other diverse hand-crafted feature sets. Evaluation and analysis suggest that our model outperforms the state-of-the-art methods by 5.49% and 9.14% on Friends and EmotionPush dataset, respectively.
翻訳日:2023-01-06 02:43:28 公開日:2020-01-28
# sequence binary decision diagram を用いた句からのテンプレート抽出

Extraction of Templates from Phrases Using Sequence Binary Decision Diagrams ( http://arxiv.org/abs/2001.10175v1 )

ライセンス: Link先を確認
Daiki Hirano, Kumiko Tanaka-Ishii and Andrew Finch(参考訳) 関連したフレーズの集合から ``regard X as Y'' のようなテンプレートを抽出するには、内部構造を識別する必要がある。 本稿では、SeqBDD(Sequence Binary Decision Diagram)の緩和版を用いて、タグ付きテキストのみからテンプレートを抽出するための教師なしアプローチを提案する。 SeqBDDは、一連のシーケンスを最小のDFAに相当するグラフィカルな構造に圧縮することができるが、よりコンパクトでテンプレート抽出のタスクに適している。 本論文の主な貢献はSeqBDD構築アルゴリズムの緩和形式であり、少量のデータから一般的な表現を作成できる。 Relaxed SeqBDD構築中にテキスト内の共有構造を圧縮するプロセスは、私たちが抽出したいテンプレートを自然に誘導します。 実験により,ソーシャルメディアからの短いメッセージからコーパスやフレーズテンプレートから動詞+前置テンプレートに基づくタスクを高品質に抽出できることがわかった。

The extraction of templates such as ``regard X as Y'' from a set of related phrases requires the identification of their internal structures. This paper presents an unsupervised approach for extracting templates on-the-fly from only tagged text by using a novel relaxed variant of the Sequence Binary Decision Diagram (SeqBDD). A SeqBDD can compress a set of sequences into a graphical structure equivalent to a minimal DFA, but more compact and better suited to the task of template extraction. The main contribution of this paper is a relaxed form of the SeqBDD construction algorithm that enables it to form general representations from a small amount of data. The process of compression of shared structures in the text during Relaxed SeqBDD construction, naturally induces the templates we wish to extract. Experiments show that the method is capable of high-quality extraction on tasks based on verb+preposition templates from corpora and phrasal templates from short messages from social media.
翻訳日:2023-01-06 02:43:15 公開日:2020-01-28
# スーパーキャラクタ法による低消費電力CNN加速器のマルチモーダル感度解析

Multi-modal Sentiment Analysis using Super Characters Method on Low-power CNN Accelerator Device ( http://arxiv.org/abs/2001.10179v1 )

ライセンス: Link先を確認
Baohua Sun, Lin Yang, Hao Sha, Michael Lin(参考訳) 近年NLP研究は、DNNモデルによる記録破りの精度向上を目撃している。 しかし、電力消費はnlpシステムのデプロイにおける現実的な懸念の1つである。 現在の最先端アルゴリズムのほとんどはgpu上に実装されているが、電力効率は高くなく、デプロイメントコストも極めて高い。 一方、CNNドメイン固有加速器(CNN-DSA)は、低消費電力で低コストな計算能力を備えた大量生産を行っている。 本稿では,cnn-dsa 上で super character メソッドを実装する。 さらに,マルチモーダルデータ,すなわち cl-aff sharedtask における表データを利用するために,super character メソッドを変更した。

Recent years NLP research has witnessed the record-breaking accuracy improvement by DNN models. However, power consumption is one of the practical concerns for deploying NLP systems. Most of the current state-of-the-art algorithms are implemented on GPUs, which is not power-efficient and the deployment cost is also very high. On the other hand, CNN Domain Specific Accelerator (CNN-DSA) has been in mass production providing low-power and low cost computation power. In this paper, we will implement the Super Characters method on the CNN-DSA. In addition, we modify the Super Characters method to utilize the multi-modal data, i.e. text plus tabular data in the CL-Aff sharedtask.
翻訳日:2023-01-06 02:43:01 公開日:2020-01-28
# 限られたスーパービジョンによる絶対音源定位学習

Learning Absolute Sound Source Localisation With Limited Supervisions ( http://arxiv.org/abs/2001.10605v1 )

ライセンス: Link先を確認
Yang Chu, Wayne Luk, Dan Goodman(参考訳) 正確な聴覚空間マップは、例えば発達中や変化したピンナのような聴覚手がかりに反応して聴覚経験から学習することができる。 バイノーラルキューを用いて,1つの音源を水平面にローカライズすることを学習するニューラルネットワークモデルについて検討した。 これらの監督は実生活では信頼できないか疎遠である。 まず、新生児の信頼できない聴覚指向応答をシミュレートするために、音源位置の信頼性の低い簡易モデルを構築した。 教師として使われ、信頼できない監督の源となっている。 そして,教師からの雑音や右からのフィードバックに基づいて,連続的な聴覚空間マップを学習することができることを示す。 さらに、環境からの強化報酬をスパース・インスペクションの源泉として利用する。 信頼できない自然応答とスパース強化報酬を組み合わせることで、これらの2種類の監督者のいずれかによって達成が難しい正確な聴覚空間マップを最終的に学習することができる。 その結果,聴覚空間マッピングは明示的な監督なしにも校正できることがわかった。 さらに本研究は,複数のサブモジュールを協調して相互の学習プロセスを促進する,より汎用的な神経機構を示唆する。

An accurate auditory space map can be learned from auditory experience, for example during development or in response to altered auditory cues such as a modified pinna. We studied neural network models that learn to localise a single sound source in the horizontal plane using binaural cues based on limited supervisions. These supervisions can be unreliable or sparse in real life. First, a simple model that has unreliable estimation of the sound source location is built, in order to simulate the unreliable auditory orienting response of newborns. It is used as a Teacher that acts as a source of unreliable supervisions. Then we show that it is possible to learn a continuous auditory space map based only on noisy left or right feedbacks from the Teacher. Furthermore, reinforcement rewards from the environment are used as a source of sparse supervision. By combining the unreliable innate response and the sparse reinforcement rewards, an accurate auditory space map, which is hard to be achieved by either one of these two kind of supervisions, can eventually be learned. Our results show that the auditory space mapping can be calibrated even without explicit supervision. Moreover, this study implies a possibly more general neural mechanism where multiple sub-modules can be coordinated to facilitate each other's learning process under limited supervisions.
翻訳日:2023-01-06 02:42:50 公開日:2020-01-28
# 畳み込みニューラルネットワークを用いた超量子モデルのセグメンテーションと回復

Segmentation and Recovery of Superquadric Models using Convolutional Neural Networks ( http://arxiv.org/abs/2001.10504v1 )

ライセンス: Link先を確認
Jaka \v{S}ircelj, Tim Oblak, Klemen Grm, Uro\v{s} Petkovi\'c, Ale\v{s} Jakli\v{c}, Peter Peer, Vitomir \v{S}truc and Franc Solina(参考訳) 本稿では,パラメータ化された容積形状プリミティブを用いた3次元視覚データ表現の問題に対処する。 具体的には、複雑な深度シーンを超二次モデルで表現できる単純な幾何学構造に分割できる畳み込みニューラルネットワーク(CNN)を中心に構築された(2段階)アプローチを提案する。 第1段階では,マスクrcnnモデルを用いて奥行きシーンにおける超四面体構造を識別し,特別に設計されたcnnレグレッサーを用いて超四面体モデルをセグメント構造に適合させる。 このアプローチを用いることで、少数の解釈可能なパラメータを持つ複雑な構造を記述できる。 提案手法は, 実世界の深度データだけでなく, 実世界の深度データにも適用可能であり, 提案手法は, 最先端技術と比較して競争性能が向上するだけでなく, 競合するアプローチで要求されるわずかな時間で, シーンを複数のスーパークワッドリックモデルに分解できることを示す。 論文で使用されるすべてのデータとモデルは、https://lmi.fe.uni-lj.si/en/research/resources/sq-segから利用可能です。

In this paper we address the problem of representing 3D visual data with parameterized volumetric shape primitives. Specifically, we present a (two-stage) approach built around convolutional neural networks (CNNs) capable of segmenting complex depth scenes into the simpler geometric structures that can be represented with superquadric models. In the first stage, our approach uses a Mask RCNN model to identify superquadric-like structures in depth scenes and then fits superquadric models to the segmented structures using a specially designed CNN regressor. Using our approach we are able to describe complex structures with a small number of interpretable parameters. We evaluated the proposed approach on synthetic as well as real-world depth data and show that our solution does not only result in competitive performance in comparison to the state-of-the-art, but is able to decompose scenes into a number of superquadric models at a fraction of the time required by competing approaches. We make all data and models used in the paper available from https://lmi.fe.uni-lj.si/en/research/resources/sq-seg.
翻訳日:2023-01-06 02:42:10 公開日:2020-01-28
# クラウドコンピュータビジョンの痛点を解釈する - スタックオーバーフローのマイニングスタディ

Interpreting Cloud Computer Vision Pain-Points: A Mining Study of Stack Overflow ( http://arxiv.org/abs/2001.10130v1 )

ライセンス: Link先を確認
Alex Cummaudo, Rajesh Vasa, Scott Barnett, John Grundy, Mohamed Abdelrazek(参考訳) アプリケーション開発者は、コンピュータビジョンのような分野における最新の進歩を活用して、ユーザに新しいサービスや製品を提供したいと考えている。 このようなapiは、簡単に統合可能なオンデマンド機械学習を約束しているが、現在の設計、ドキュメンテーション、開発者インターフェースは、それらを支える機械学習技術の多くを隠している。 このようなAPIは従来のAPIに似ていますが、データ駆動の確率的振る舞いを抽象化します。 この研究の目的は、開発者が最も成熟したインテリジェントサービス、特にコンピュータビジョンを提供するシステムを実装する際に直面する様々な問題点を特定することである。 Stack Overflowを使って、コンピュータビジョンサービスを使用するときに開発者が直面するフラストレーションを掘り下げ、最近の2つの分類(ドキュメント関連および一般的な質問)に対して質問を分類します。 モバイル開発のような成熟した分野とは異なり、開発者からの質問のタイプには対照的な点があります。 これらは、そのようなシステムを強化する基盤となる技術に対する浅い理解を示している。 我々は、ソフトウェア工学コミュニティがこれらのサービスをどのように改善できるかを示唆するために、学習分類のレンズを通してこれらの発見のいくつかの意味を議論し、開発者がそれらを使用する性質についてコメントする。

Intelligent services are becoming increasingly more pervasive; application developers want to leverage the latest advances in areas such as computer vision to provide new services and products to users, and large technology firms enable this via RESTful APIs. While such APIs promise an easy-to-integrate on-demand machine intelligence, their current design, documentation and developer interface hides much of the underlying machine learning techniques that power them. Such APIs look and feel like conventional APIs but abstract away data-driven probabilistic behaviour - the implications of a developer treating these APIs in the same way as other, traditional cloud services, such as cloud storage, is of concern. The objective of this study is to determine the various pain-points developers face when implementing systems that rely on the most mature of these intelligent services, specifically those that provide computer vision. We use Stack Overflow to mine indications of the frustrations that developers appear to face when using computer vision services, classifying their questions against two recent classification taxonomies (documentation-related and general questions). We find that, unlike mature fields like mobile development, there is a contrast in the types of questions asked by developers. These indicate a shallow understanding of the underlying technology that empower such systems. We discuss several implications of these findings via the lens of learning taxonomies to suggest how the software engineering community can improve these services and comment on the nature by which developers use them.
翻訳日:2023-01-06 02:41:16 公開日:2020-01-28
# 原因性債券市場における拡散予測のためのランダム森林に基づくアプローチ

A random forest based approach for predicting spreads in the primary catastrophe bond market ( http://arxiv.org/abs/2001.10393v1 )

ライセンス: Link先を確認
Despoina Makariou, Pauline Barrieu, Yining Chen(参考訳) 一次災害債券市場におけるスプレッドの予測を可能にするために,ランダムな森林アプローチを導入する。 我々は、新規発行に先立って投資家に提供される全ての情報が、その拡散を予測する上で等しく重要であるかどうかを調査する。 2009年12月から2018年5月まで発行された非人生的災害債の全人口が使用されている。 ランダムな森林は、全変動の93%を説明する未確認一次災害結合データに驚くべき予測力を示す。 比較として, 線形回帰モデルでは, 予測性能が劣り, 総変動率の47%しか説明できない。 円形で提供されるすべての詳細は、広がりを予測できるが、程度は様々である。 結果の安定性が研究されている。 ランダムな森林の利用は、破滅的な債券産業における投資決定をスピードアップさせる。

We introduce a random forest approach to enable spreads' prediction in the primary catastrophe bond market. We investigate whether all information provided to investors in the offering circular prior to a new issuance is equally important in predicting its spread. The whole population of non-life catastrophe bonds issued from December 2009 to May 2018 is used. The random forest shows an impressive predictive power on unseen primary catastrophe bond data explaining 93% of the total variability. For comparison, linear regression, our benchmark model, has inferior predictive performance explaining only 47% of the total variability. All details provided in the offering circular are predictive of spread but in a varying degree. The stability of the results is studied. The usage of random forest can speed up investment decisions in the catastrophe bond industry.
翻訳日:2023-01-06 02:40:42 公開日:2020-01-28
# プライバシ保存ガウス過程回帰--準同型暗号の適用へのモジュラーアプローチ

Privacy-Preserving Gaussian Process Regression -- A Modular Approach to the Application of Homomorphic Encryption ( http://arxiv.org/abs/2001.10893v1 )

ライセンス: Link先を確認
Peter Fenner, Edward O. Pyzer-Knapp(参考訳) 機械学習の多くは、予測を行うモデルをトレーニングするために大量のデータを使用することに依存している。 このデータが複数のソースからやってくる場合、例えば、マシンラーニングモデルに対するデータ評価がサービスとして提供される場合、データの共有に関するプライバシーの問題と法的懸念がある可能性がある。 完全同型暗号化(FHE)では、暗号化中にデータを計算でき、データのプライバシの問題に対する解決策を提供することができる。 しかし、FHEは遅くて制限的であるため、既存のアルゴリズムをFHEパラダイムの下で効率的に動作するように操作する必要がある。 ガウス過程回帰のような一般的な機械学習アルゴリズムは、FHEに不適であり、効率的かつ正確に動作するように操作することはできない。 本稿では、FHEを保護を必要とするワークフローの繊細なステップのみに適用するモジュラーアプローチにより、一方が他方のデータから構築されたガウス的プロセス回帰モデルを用いて、他方のデータへのアクセスを得ることなく、他方のデータを正確かつ効率的に予測することができることを示す。 この構成は、我々の知る限り、効果的に暗号化されたガウス過程の最初の例である。

Much of machine learning relies on the use of large amounts of data to train models to make predictions. When this data comes from multiple sources, for example when evaluation of data against a machine learning model is offered as a service, there can be privacy issues and legal concerns over the sharing of data. Fully homomorphic encryption (FHE) allows data to be computed on whilst encrypted, which can provide a solution to the problem of data privacy. However, FHE is both slow and restrictive, so existing algorithms must be manipulated to make them work efficiently under the FHE paradigm. Some commonly used machine learning algorithms, such as Gaussian process regression, are poorly suited to FHE and cannot be manipulated to work both efficiently and accurately. In this paper, we show that a modular approach, which applies FHE to only the sensitive steps of a workflow that need protection, allows one party to make predictions on their data using a Gaussian process regression model built from another party's data, without either party gaining access to the other's data, in a way which is both accurate and efficient. This construction is, to our knowledge, the first example of an effectively encrypted Gaussian process.
翻訳日:2023-01-06 02:34:05 公開日:2020-01-28
# 多臓器機能障害症候群(MODS)高齢者の早期死亡予測のための解釈可能な機械学習モデル : 多施設比較研究とクロスバリデーション

Interpretable Machine Learning Model for Early Prediction of Mortality in Elderly Patients with Multiple Organ Dysfunction Syndrome (MODS): a Multicenter Retrospective Study and Cross Validation ( http://arxiv.org/abs/2001.10977v1 )

ライセンス: Link先を確認
Xiaoli Liu, Pan Hu, Zhi Mao, Po-Chih Kuo, Peiyao Li, Chao Liu, Jie Hu, Deyu Li, Desen Cao, Roger G. Mark, Leo Anthony Celi, Zhengbo Zhang, Feihu Zhou(参考訳) 背景: MODS患者は死亡リスクが高く予後不良である。 MODSの重症度と死亡率を評価する現在の評価システムの性能は相変わらず不満足である。 本研究は,MODS高齢者の早期死亡予測のための解釈可能・一般化可能なモデルを開発することを目的とする。 方法:MIMIC-III, eICU-CRD, PLAGH-Sデータベースを用いてモデル生成と評価を行った。 われわれは,eXtreme Gradient Boosting modelとSHapley Additive exPlanations法を用いて,患者の病院結果の早期かつ解釈可能な予測を行った。 3種類のデータソースの組み合わせと5つの典型的な評価指標を採用し、一般化可能なモデルを開発した。 結果:MIMIC-III, eICU-CRDデータセットとPLAGH-Sデータセットは,MIMIC-III, eICU-CRD, PLAGH-Sデータセットで別々に検証された。 AUCは0.858, 0.834, 特異度0.705, AUCは0.849, 感度0.763, 特異度0.784, AUCは0.838, 感度0.882, 特異度0.691であった。 このモデルとベースラインモデルとのaucの比較とmitho-iiiデータセットの検証は、このモデルの優れた性能を示し、また、このモデルと一般的に使用される臨床スコアとのaucの比較は、このモデルのかなり優れたパフォーマンスを示した。 解釈: 大きなサンプルサイズを持つ融合データセットを用いた解釈可能な機械学習モデルは、堅牢で一般化可能であった。 高齢者ICU患者の早期死亡予測のためのベースラインモデルと臨床成績を比較検討した。 このモデルの解釈的性質は、臨床医に死亡リスクの特徴のランキングを提供した。

Background: Elderly patients with MODS have high risk of death and poor prognosis. The performance of current scoring systems assessing the severity of MODS and its mortality remains unsatisfactory. This study aims to develop an interpretable and generalizable model for early mortality prediction in elderly patients with MODS. Methods: The MIMIC-III, eICU-CRD and PLAGH-S databases were employed for model generation and evaluation. We used the eXtreme Gradient Boosting model with the SHapley Additive exPlanations method to conduct early and interpretable predictions of patients' hospital outcome. Three types of data source combinations and five typical evaluation indexes were adopted to develop a generalizable model. Findings: The interpretable model, with optimal performance developed by using MIMIC-III and eICU-CRD datasets, was separately validated in MIMIC-III, eICU-CRD and PLAGH-S datasets (no overlapping with training set). The performances of the model in predicting hospital mortality as validated by the three datasets were: AUC of 0.858, sensitivity of 0.834 and specificity of 0.705; AUC of 0.849, sensitivity of 0.763 and specificity of 0.784; and AUC of 0.838, sensitivity of 0.882 and specificity of 0.691, respectively. Comparisons of AUC between this model and baseline models with MIMIC-III dataset validation showed superior performances of this model; In addition, comparisons in AUC between this model and commonly used clinical scores showed significantly better performance of this model. Interpretation: The interpretable machine learning model developed in this study using fused datasets with large sample sizes was robust and generalizable. This model outperformed the baseline models and several clinical scores for early prediction of mortality in elderly ICU patients. The interpretative nature of this model provided clinicians with the ranking of mortality risk features.
翻訳日:2023-01-06 02:33:44 公開日:2020-01-28
# 無線ネットワークエッジにおける分散機械学習のためのD2D-Enabled Data Sharing

D2D-Enabled Data Sharing for Distributed Machine Learning at Wireless Network Edge ( http://arxiv.org/abs/2001.11342v1 )

ライセンス: Link先を確認
Xiaoran Cai, Xiaopeng Mo, Junyang Chen, and Jie Xu(参考訳) モバイルエッジ学習は、分散エッジデバイスが、ローカルデータサンプルと通信および計算リソースを活用することで、共有機械学習モデルのトレーニングにおいて協力することを可能にする新興技術である。 本稿では,この手法が直面するストラグラージレンマ問題に対処するために,異なるエッジデバイスがデータサンプルを通信リンク上で共有し,その計算負荷を適切に調整してトレーニング速度を増加させる新しいデータ共有手法を提案する。 本設定では,データ共有と分散トレーニングの両面での無線リソース割り当てを最適化し,局所的およびグローバルなイテレーションの固定数のトレーニング遅延を最小化することを目的としている。 その結果,提案するデータ共有設計はトレーニング遅延を大幅に低減するとともに,データサンプルが非独立でエッジデバイス間で均等に分散した場合のトレーニング精度も向上することがわかった。

Mobile edge learning is an emerging technique that enables distributed edge devices to collaborate in training shared machine learning models by exploiting their local data samples and communication and computation resources. To deal with the straggler dilemma issue faced in this technique, this paper proposes a new device to device enabled data sharing approach, in which different edge devices share their data samples among each other over communication links, in order to properly adjust their computation loads for increasing the training speed. Under this setup, we optimize the radio resource allocation for both data sharing and distributed training, with the objective of minimizing the total training delay under fixed numbers of local and global iterations. Numerical results show that the proposed data sharing design significantly reduces the training delay, and also enhances the training accuracy when the data samples are non independent and identically distributed among edge devices.
翻訳日:2023-01-06 02:33:15 公開日:2020-01-28
# 時系列データの動的クラスタリング

Dynamic clustering of time series data ( http://arxiv.org/abs/2002.01890v1 )

ライセンス: Link先を確認
Victhor S. Sart\'orio and Tha\'is C. O. Fonseca(参考訳) 動的線形モデルに基づく多変量時系列データのクラスタリング手法を提案する。 通常の時系列クラスタリング手法では静的なメンバシップパラメータが得られないが,提案手法では各時系列が時間とともに動的にクラスタメンバシップを変更することができる。 この文脈では、混合モデルは時系列に対して仮定され、混合重みに対する柔軟なディリクレ進化は、時間とともにスムーズなメンバーシップ変化をもたらす。 後方推定と予測はギブスサンプリングによって得ることができるが,より効率的な点推定法として,確率的期待-最大化とグラディエントDescentに基づく。 最後に、eu諸国の再生可能エネルギー消費に関する世界銀行指標と、各国一人当たりの寿命とgdpを含む有名なgapminderデータセットである、不平等時系列と多変量時系列の両方をモデル化する提案モデルの有用性を示す。

We propose a new method for clustering multivariate time-series data based on Dynamic Linear Models. Whereas usual time-series clustering methods obtain static membership parameters, our proposal allows each time-series to dynamically change their cluster memberships over time. In this context, a mixture model is assumed for the time series and a flexible Dirichlet evolution for mixture weights allows for smooth membership changes over time. Posterior estimates and predictions can be obtained through Gibbs sampling, but a more efficient method for obtaining point estimates is presented, based on Stochastic Expectation-Maximization and Gradient Descent. Finally, two applications illustrate the usefulness of our proposed model to model both univariate and multivariate time-series: World Bank indicators for the renewable energy consumption of EU nations and the famous Gapminder dataset containing life-expectancy and GDP per capita for various countries.
翻訳日:2023-01-06 02:32:42 公開日:2020-01-28
# 作業の未来のための作業タスク共有ダイナミクスの学習

Learning Occupational Task-Shares Dynamics for the Future of Work ( http://arxiv.org/abs/2002.05655v1 )

ライセンス: Link先を確認
Subhro Das, Sebastian Steffen, Wyatt Clarke, Prabhat Reddy, Erik Brynjolfsson, Martin Fleming(参考訳) 近年のAIと自動化の波は、職業の基本的なタスク要件と永続的な技術的失業の急激な変化につながる可能性があるという、以前の汎用技術(GPT)とは異なると議論されている。 本稿では,AI革新の過去10年間で,特に高,中,低賃金の職業において,業務上のタスク要求がいかに変化したかを明らかにするために,オンライン求職者の大規模なデータセットに動的タスク共有の新しい方法論を適用する。 ビッグデータとAIは、それぞれ2012年と2016年以来、高賃金の職業の中で著しく増加している。 ARIMAモデルを構築し、将来の職業的タスク要求を予測するとともに、ヘルスケア、管理、ITにおけるいくつかの関連する事例を紹介した。 このような業務要求の予測は、将来の労働力の再訓練において重要な役割を果たす。

The recent wave of AI and automation has been argued to differ from previous General Purpose Technologies (GPTs), in that it may lead to rapid change in occupations' underlying task requirements and persistent technological unemployment. In this paper, we apply a novel methodology of dynamic task shares to a large dataset of online job postings to explore how exactly occupational task demands have changed over the past decade of AI innovation, especially across high, mid and low wage occupations. Notably, big data and AI have risen significantly among high wage occupations since 2012 and 2016, respectively. We built an ARIMA model to predict future occupational task demands and showcase several relevant examples in Healthcare, Administration, and IT. Such task demands predictions across occupations will play a pivotal role in retraining the workforce of the future.
翻訳日:2023-01-06 02:32:26 公開日:2020-01-28
# 飛行中の子豚を捕まえることを学ぶ

Learning to Catch Piglets in Flight ( http://arxiv.org/abs/2001.10220v1 )

ライセンス: Link先を確認
Ozan \c{C}atal, Lawrence De Mol, Tim Verbelen and Bart Dhoedt(参考訳) 飛行中の物体を捕獲することはロボット工学において際立った課題である。 本稿では,RGB-Dカメラとレーダの2つのセンサモードからデータを取り出す閉ループ制御システムを提案する。 この手法の開発とテストのために、我々はまず、簡単に識別できるオブジェクト、すなわちぬいぐるみ子豚から始めます。 対象を検出・追跡し,インターセプション点を予測するための2つのアプローチを実装し,比較する。 ベースラインモデルは、投げられた物体を環境中の位置決めにカラーフィルタリングを用い、インターセプションポイントは物理的な弾道軌道方程式上の最小2乗回帰を用いて予測する。 ディープラーニングベースの手法では、オブジェクト検出とインターセプションポイント予測の両方にニューラルネットワークを使用する。 深層学習アプローチでは,80%の症例で子豚を捕えることができた。

Catching objects in-flight is an outstanding challenge in robotics. In this paper, we present a closed-loop control system fusing data from two sensor modalities: an RGB-D camera and a radar. To develop and test our method, we start with an easy to identify object: a stuffed Piglet. We implement and compare two approaches to detect and track the object, and to predict the interception point. A baseline model uses colour filtering for locating the thrown object in the environment, while the interception point is predicted using a least squares regression over the physical ballistic trajectory equations. A deep learning based method uses artificial neural networks for both object detection and interception point prediction. We show that we are able to successfully catch Piglet in 80% of the cases with our deep learning approach.
翻訳日:2023-01-06 02:32:02 公開日:2020-01-28
# UAVを利用した次世代ネットワークを支援する人工知能

Artificial Intelligence Aided Next-Generation Networks Relying on UAVs ( http://arxiv.org/abs/2001.11958v1 )

ライセンス: Link先を確認
Xiao Liu, Mingzhe Chen, Yuanwei Liu, Yue Chen, Shuguang Cui, and Lajos Hanzo(参考訳) 動的環境において,人工知能(AI)による無人航空機(UAV)による次世代ネットワーク支援が提案されている。 AI対応UAV支援無線ネットワーク(UAWN)では、ユーザの位置やテレトラフィック要求に関する情報を収集し、環境から学び、ユーザから受け取ったフィードバックに基づいて行動することによって、動的環境に迅速に適応できる複数のUAVを航空基地局として採用している。 さらに、AIはシステムの協調最適化のためのUAV群間の相互作用を可能にする。 AIフレームワークの利点として、従来のUAWNのいくつかの課題が回避され、ネットワークパフォーマンスが向上し、信頼性が向上し、アジャイル適応性が向上する。 さらなる利点として、動的軌道設計と資源配分が示される。 最後に、潜在的研究課題と機会について論じる。

Artificial intelligence (AI) assisted unmanned aerial vehicle (UAV) aided next-generation networking is proposed for dynamic environments. In the AI-enabled UAV-aided wireless networks (UAWN), multiple UAVs are employed as aerial base stations, which are capable of rapidly adapting to the dynamic environment by collecting information about the users' position and tele-traffic demands, learning from the environment and acting upon the feedback received from the users. Moreover, AI enables the interaction amongst a swarm of UAVs for cooperative optimization of the system. As a benefit of the AI framework, several challenges of conventional UAWN may be circumvented, leading to enhanced network performance, improved reliability and agile adaptivity. As a further benefit, dynamic trajectory design and resource allocation are demonstrated. Finally, potential research challenges and opportunities are discussed.
翻訳日:2023-01-06 02:31:49 公開日:2020-01-28
# ロスレス最大圧縮としてのマージン最大化

Margin Maximization as Lossless Maximal Compression ( http://arxiv.org/abs/2001.10318v1 )

ライセンス: Link先を確認
Nikolaos Nikolaou, Henry Reeve, Gavin Brown(参考訳) 教師付き学習アルゴリズムの最終的な目標は、新しい例にうまく一般化できるトレーニングデータに基づいて構築されたモデルを作ることである。 分類において、機能的マージンの最大化 -- 可能な限り多くのトレーニング例を最大限の信頼性で正しく分類する -- は、優れた一般化保証を持つモデルを構築することが知られている。 この研究は、ノイズのないトレーニングデータセット上のマージン最大化モデルの情報理論的解釈を、そのデータセットのロスレス最大圧縮(すなわちラベルを予測するのに有用なすべての情報から抽出)を達成するものとして与える。 この接続は、教師付き機械学習の一般化に関する新たな洞察を提供し、より一般的な原則の特別なケース(分類のケース)としてマージン最大化を示し、勾配ブースティングのような一般的な学習アルゴリズムの成功と潜在的な限界を説明する。 理論的な議論と実証的な証拠によって観察を支援し、今後の作業の興味深い方向性を特定する。

The ultimate goal of a supervised learning algorithm is to produce models constructed on the training data that can generalize well to new examples. In classification, functional margin maximization -- correctly classifying as many training examples as possible with maximal confidence --has been known to construct models with good generalization guarantees. This work gives an information-theoretic interpretation of a margin maximizing model on a noiseless training dataset as one that achieves lossless maximal compression of said dataset -- i.e. extracts from the features all the useful information for predicting the label and no more. The connection offers new insights on generalization in supervised machine learning, showing margin maximization as a special case (that of classification) of a more general principle and explains the success and potential limitations of popular learning algorithms like gradient boosting. We support our observations with theoretical arguments and empirical evidence and identify interesting directions for future work.
翻訳日:2023-01-06 02:26:50 公開日:2020-01-28
# 学習型サイバー物理システムにおけるリアルタイム分布検出

Real-time Out-of-distribution Detection in Learning-Enabled Cyber-Physical Systems ( http://arxiv.org/abs/2001.10494v1 )

ライセンス: Link先を確認
Feiyang Cai and Xenofon Koutsoukos(参考訳) サイバー物理システム(CPS)は、現実世界の不確実性と可変性を処理できる機械学習コンポーネントを使用することで、大きな恩恵を受ける。 しかし、ディープニューラルネットワークのような典型的なコンポーネントは、システムの安全性に影響を与える可能性のある新しいタイプのハザードを導入している。 システムの振る舞いは、実行時にのみ利用可能で、トレーニングに使用されるデータとは異なる可能性があるデータに依存する。 アウトオブディストリビューションデータは大きなエラーを引き起こし、安全性を損なう可能性がある。 本稿では,CPS制御システムにおける配電データの効率よく検出する問題について考察する。 検出は堅牢で、リアルタイム監視の計算効率を保ちながら、誤ったアラームの数を制限する必要がある。 提案手法は,誤警報率の高い手法を開発するために,帰納的等角予測と異常検出を利用する。 本研究では,学習セットに対する新しい入力の不整合を効率的に計算できるモデルの学習に変分オートエンコーダとディープサポートベクターデータ記述を用い,分散高次元入力のリアルタイム検出を可能にする。 本手法は,自動運転車用オープンソースシミュレータに実装された緊急ブレーキシステムとエンドツーエンドコントローラを用いて実証する。 シミュレーションの結果,偽陽性と検出遅延の数が極めて少なく,実行時間は元の機械学習コンポーネントの実行時間に匹敵することが分かった。

Cyber-physical systems (CPS) greatly benefit by using machine learning components that can handle the uncertainty and variability of the real-world. Typical components such as deep neural networks, however, introduce new types of hazards that may impact system safety. The system behavior depends on data that are available only during runtime and may be different than the data used for training. Out-of-distribution data may lead to a large error and compromise safety. The paper considers the problem of efficiently detecting out-of-distribution data in CPS control systems. Detection must be robust and limit the number of false alarms while being computational efficient for real-time monitoring. The proposed approach leverages inductive conformal prediction and anomaly detection for developing a method that has a well-calibrated false alarm rate. We use variational autoencoders and deep support vector data description to learn models that can be used efficiently compute the nonconformity of new inputs relative to the training set and enable real-time detection of out-of-distribution high-dimensional inputs. We demonstrate the method using an advanced emergency braking system and a self-driving end-to-end controller implemented in an open source simulator for self-driving cars. The simulation results show very small number of false positives and detection delay while the execution time is comparable to the execution time of the original machine learning components.
翻訳日:2023-01-06 02:25:25 公開日:2020-01-28
# 層融合によるMSE最適ニューラルネットワーク初期化

MSE-Optimal Neural Network Initialization via Layer Fusion ( http://arxiv.org/abs/2001.10509v1 )

ライセンス: Link先を確認
Ramina Ghods, Andrew S. Lan, Tom Goldstein, Christoph Studer(参考訳) ディープニューラルネットワークは、さまざまな分類と推論タスクで最先端のパフォーマンスを実現する。 しかし、確率勾配勾配と基礎となる最適化問題の非凸性の組み合わせは、初期化の影響を受けやすいパラメータ学習を引き起こす。 この問題に対処するために、ランダムパラメータの初期化や知識蒸留に依存する様々な方法が過去に提案されている。 本稿では,より深いネットワーク層をランダムに初期化して訓練することで,より浅いネットワークを初期化するFuseInitを提案する。 本研究では,隣り合う密閉層,畳み込み層,畳み込み畳み込み層の平均二乗誤差(mse)-最適融合に関する理論的結果と効率的なアルゴリズムを開発した。 分類と回帰データセットの多種にわたる実験を行い,fuseinitで初期化した場合,より深いニューラルネットワークは初期化に対する感度が低く,より浅いネットワークはより良く(時にはより深い値にも)機能することが示唆された。

Deep neural networks achieve state-of-the-art performance for a range of classification and inference tasks. However, the use of stochastic gradient descent combined with the nonconvexity of the underlying optimization problems renders parameter learning susceptible to initialization. To address this issue, a variety of methods that rely on random parameter initialization or knowledge distillation have been proposed in the past. In this paper, we propose FuseInit, a novel method to initialize shallower networks by fusing neighboring layers of deeper networks that are trained with random initialization. We develop theoretical results and efficient algorithms for mean-square error (MSE)-optimal fusion of neighboring dense-dense, convolutional-dense, and convolutional-convolutional layers. We show experiments for a range of classification and regression datasets, which suggest that deeper neural networks are less sensitive to initialization and shallower networks can perform better (sometimes as well as their deeper counterparts) if initialized with FuseInit.
翻訳日:2023-01-06 02:24:32 公開日:2020-01-28
# Landmark2Vec: 教師なしニューラルネットワークによるランドマーク位置決め手法

Landmark2Vec: An Unsupervised Neural Network-Based Landmark Positioning Method ( http://arxiv.org/abs/2001.10568v1 )

ライセンス: Link先を確認
Alireza Razavi(参考訳) ランドマークからの計測から教師なしランドマークマップ推定のためのニューラルネットワークに基づく手法を提案する。 ネットワークの訓練に必要な測定値は、エージェントがランドマークから観測/受信する信号である。 ランドマーク(ランドマーク)、エージェント(エージェント)、およびランドマーク(ランドマーク)は、例えば道路沿いのポール、車両(エージェント)に搭載された視覚センサーのランドマークの大きさ、または建物内のWiFiアクセスポイントなどの無線送信機、そして人(エージェント)が携帯するモバイルデバイスから受信した受信信号強度(RSS)によって測定される。 地図推定の目標は、スケール、回転、シフト(すなわち、ランドマークのトポロジカルマップ)までのランドマークの位置を見つけることである。 ランドマークが$L$であれば、その領域で収集された1$ベクトルは$L \times 1$である。 浅いネットワークは、基礎的な真理情報なしで地図を学ぶように訓練される。

A Neural Network-based method for unsupervised landmarks map estimation from measurements taken from landmarks is introduced. The measurements needed for training the network are the signals observed/received from landmarks by an agent. The definition of landmarks, agent, and the measurements taken by agent from landmarks is rather broad here: landmarks can be visual objects, e.g., poles along a road, with measurements being the size of landmark in a visual sensor mounted on a vehicle (agent), or they can be radio transmitters, e.g., WiFi access points inside a building, with measurements being the Received Signal Strength (RSS) heard from them by a mobile device carried by a person (agent). The goal of the map estimation is then to find the positions of landmarks up to a scale, rotation, and shift (i.e., the topological map of the landmarks). Assuming that there are $L$ landmarks, the measurements will be $L \times 1$ vectors collected over the area. A shallow network then will be trained to learn the map without any ground truth information.
翻訳日:2023-01-06 02:23:36 公開日:2020-01-28
# QActor: ノイズラベル付きストリームデータのためのオンラインアクティブラーニング

QActor: On-line Active Learning for Noisy Labeled Stream Data ( http://arxiv.org/abs/2001.10399v1 )

ライセンス: Link先を確認
Taraneh Younesian, Zilong Zhao, Amirmasoud Ghiassi, Robert Birke, Lydia Y. Chen(参考訳) ノイズの多いラベル付きデータは、webやソーシャルメディアで継続的に公開される自己生成コンテンツのラリティというよりは、むしろ規範である。 プライバシーの懸念と政府の規制のため、そのようなデータストリームは限られた期間でのみ保存され、学習目的に使用できる。 このオンラインシナリオにおけるノイズを克服するために、品質モデルによるクリーンなサンプルの選択と、最も情報に富んだ真のラベルに対するオラクルの問い合わせという、斬新な組み合わせのQActorを提案する。 前者はオンラインシナリオの少ないデータボリュームに悩まされるが、後者は人間の専門家の可用性とコストに制約される。 QActorは、データフィルタリングのための品質モデルの利点と、最も情報性の高いデータのクリーニングのためのオラクルクエリを素早く組み合わせます。 QActorの目的は、厳格なオラクル予算を活用して学習精度を強力に最大化することである。 QActorは、さまざまなクエリ割り当てと不確実性対策を組み合わせたさまざまな戦略について検討している。 QActorの中心的な機能は、各データバッチの学習損失に応じてクエリ制限を動的に調整することである。 我々は、標準機械学習モデル(ML)やディープニューラルネットワーク(DNN)のような分類器に入力された異なる画像データセットを、30%から80%のノイズラベル比で広範囲に評価する。 以上の結果から,QActorはクリーンなデータのみを用いて達成される最適精度とほぼ一致し,少なくとも6パーセントの地上真実データがオラクルから得られた。

Noisy labeled data is more a norm than a rarity for self-generated content that is continuously published on the web and social media. Due to privacy concerns and governmental regulations, such a data stream can only be stored and used for learning purposes in a limited duration. To overcome the noise in this on-line scenario we propose QActor which novel combines: the selection of supposedly clean samples via quality models and actively querying an oracle for the most informative true labels. While the former can suffer from low data volumes of on-line scenarios, the latter is constrained by the availability and costs of human experts. QActor swiftly combines the merits of quality models for data filtering and oracle queries for cleaning the most informative data. The objective of QActor is to leverage the stringent oracle budget to robustly maximize the learning accuracy. QActor explores various strategies combining different query allocations and uncertainty measures. A central feature of QActor is to dynamically adjust the query limit according to the learning loss for each data batch. We extensively evaluate different image datasets fed into the classifier that can be standard machine learning (ML) models or deep neural networks (DNN) with noise label ratios ranging between 30% and 80%. Our results show that QActor can nearly match the optimal accuracy achieved using only clean data at the cost of at most an additional 6% of ground truth data from the oracle.
翻訳日:2023-01-06 02:17:04 公開日:2020-01-28
# 薬局側効果予測のためのトリグラフ情報伝搬

Tri-graph Information Propagation for Polypharmacy Side Effect Prediction ( http://arxiv.org/abs/2001.10516v1 )

ライセンス: Link先を確認
Hao Xu, Shengqi Sang and Haiping Lu(参考訳) 薬物の組み合わせは多剤副作用(POSE)を引き起こすことが多い。 近年,薬物やタンパク質のグラフ上でのリンク予測問題としてPOSE予測を定式化し,グラフ畳み込みネットワーク(GCN)を用いて解いた。 しかし,ポーズの複雑な関係から計算コストが高く,メモリ需要も高い。 本稿では,タンパク質-タンパク質グラフからタンパク質-ドラッググラフによる薬物-ドラッググラフへの伝播により,3つのサブグラフで表現を段階的に学習する,柔軟なTIPモデルを提案する。 実験の結果、TIPは精度を7%以上向上し、時間効率は83ドル\times$、空間効率は3ドル\times$である。

The use of drug combinations often leads to polypharmacy side effects (POSE). A recent method formulates POSE prediction as a link prediction problem on a graph of drugs and proteins, and solves it with Graph Convolutional Networks (GCNs). However, due to the complex relationships in POSE, this method has high computational cost and memory demand. This paper proposes a flexible Tri-graph Information Propagation (TIP) model that operates on three subgraphs to learn representations progressively by propagation from protein-protein graph to drug-drug graph via protein-drug graph. Experiments show that TIP improves accuracy by 7%+, time efficiency by 83$\times$, and space efficiency by 3$\times$.
翻訳日:2023-01-06 02:16:25 公開日:2020-01-28
# ASR補正と言語理解のための共同文脈モデリング

Joint Contextual Modeling for ASR Correction and Language Understanding ( http://arxiv.org/abs/2002.00750v1 )

ライセンス: Link先を確認
Yue Weng, Sai Sumanth Miryala, Chandra Khatri, Runze Wang, Huaixiu Zheng, Piero Molino, Mahdi Namazifar, Alexandros Papangelis, Hugh Williams, Franziska Bell, Gokhan Tur(参考訳) 自動音声認識(ASR)の品質は、言語理解(LU)などの下流タスクに伝播し直接影響を与えるため、対話システムにとって重要である。 本稿では、LUと協調してASR出力に対して文脈言語補正を行うマルチタスクニューラルアプローチを提案し、両タスクの性能を同時に改善する。 このアプローチの有効性を測定するために,第2対話状態追跡コーパス(DSTC2)を用いた。 ベースラインアプローチとして,タスク固有統計言語モデル (SLM) と最先端の汎用事前学習 (GPT) 言語モデルを訓練し,n-best ASR仮説を再検討し,次にダイアログ行動とスロットを同定した。 i) GPTモデルと階層型CNN-RNNモデルを用いたランサーモデルをさらに訓練し,n-best仮説の最適出力を検出する。 これらのランカモデルを拡張して,まず最適なasr出力を選択し,最後に対話行為とスロットをエンドツーエンドで識別した。 二)我々はまた,n-best から推定された単語の混乱を消費するマルチヘッドセルフアテンションを持つ単語混乱ポインタネットワーク (wcn-ptr) という,新しい統合 asr 誤り訂正と lu モデルを提案した。 そこで本研究では,市販のASRおよびLUシステムの誤差率を,少量のドメイン内データを用いてトレーニングしたジョイントモデルと比較して14%削減できることを示した。

The quality of automatic speech recognition (ASR) is critical to Dialogue Systems as ASR errors propagate to and directly impact downstream tasks such as language understanding (LU). In this paper, we propose multi-task neural approaches to perform contextual language correction on ASR outputs jointly with LU to improve the performance of both tasks simultaneously. To measure the effectiveness of this approach we used a public benchmark, the 2nd Dialogue State Tracking (DSTC2) corpus. As a baseline approach, we trained task-specific Statistical Language Models (SLM) and fine-tuned state-of-the-art Generalized Pre-training (GPT) Language Model to re-rank the n-best ASR hypotheses, followed by a model to identify the dialog act and slots. i) We further trained ranker models using GPT and Hierarchical CNN-RNN models with discriminatory losses to detect the best output given n-best hypotheses. We extended these ranker models to first select the best ASR output and then identify the dialogue act and slots in an end to end fashion. ii) We also proposed a novel joint ASR error correction and LU model, a word confusion pointer network (WCN-Ptr) with multi-head self-attention on top, which consumes the word confusions populated from the n-best. We show that the error rates of off the shelf ASR and following LU systems can be reduced significantly by 14% relative with joint models trained using small amounts of in-domain data.
翻訳日:2023-01-06 02:15:54 公開日:2020-01-28
# セルフプレイによるマルチエージェント交渉の学習に向けて

Towards Learning Multi-agent Negotiations via Self-Play ( http://arxiv.org/abs/2001.10208v1 )

ライセンス: Link先を確認
Yichuan Charlie Tang(参考訳) 洗練された、堅牢で安全なシーケンシャルな意思決定は、インテリジェントなシステムの中核にある。 これは、エージェントが他のエージェントの意図や将来のアクションを予測する必要がある複雑なマルチエージェント環境での計画において特に重要である。 伝統的な方法はマルコフ決定過程として問題を定式化するが、解はしばしば様々な仮定に依存し、コーナーケースで示されると不安定になる。 対照的に、深層強化学習(Deep RL)は、環境からの探索、相互作用、学習を同時に行うことで、ポリシーを見つけるのに非常に効果的である。 強力な深層rlパラダイムを活用することで,自己プレイの反復的な手順が,段階的に多様な環境を創造し,高度で堅牢なマルチエージェントポリシを学習できることを実証する。 我々は、エージェントが道路上でのマージを成功させるために、他のエージェントと対話し、交渉しなければならない、トラフィックをマージする、挑戦的なマルチエージェントシミュレーションでこれを実証する。 環境はシンプルに始まりますが、トレーニングが進むにつれて、エージェント「動物園」に多様なエージェントを反復的に追加することで複雑さを増します。 質的には、我々のポリシーは、自己再生を通じて、防御的運転、乗っ取り、降伏、および他のエージェントと意図を伝えるための信号灯の使用のような興味深い行動を自動的に学習する。 さらに,63%から98%を超えるマージ操作の成功率に対して,定量的に劇的な改善が見られた。

Making sophisticated, robust, and safe sequential decisions is at the heart of intelligent systems. This is especially critical for planning in complex multi-agent environments, where agents need to anticipate other agents' intentions and possible future actions. Traditional methods formulate the problem as a Markov Decision Process, but the solutions often rely on various assumptions and become brittle when presented with corner cases. In contrast, deep reinforcement learning (Deep RL) has been very effective at finding policies by simultaneously exploring, interacting, and learning from environments. Leveraging the powerful Deep RL paradigm, we demonstrate that an iterative procedure of self-play can create progressively more diverse environments, leading to the learning of sophisticated and robust multi-agent policies. We demonstrate this in a challenging multi-agent simulation of merging traffic, where agents must interact and negotiate with others in order to successfully merge on or off the road. While the environment starts off simple, we increase its complexity by iteratively adding an increasingly diverse set of agents to the agent "zoo" as training progresses. Qualitatively, we find that through self-play, our policies automatically learn interesting behaviors such as defensive driving, overtaking, yielding, and the use of signal lights to communicate intentions to other agents. In addition, quantitatively, we show a dramatic improvement of the success rate of merging maneuvers from 63% to over 98%.
翻訳日:2023-01-06 02:15:24 公開日:2020-01-28
# グラフに基づく協調フィルタリングの再検討:線形残差グラフ畳み込みネットワークアプローチ

Revisiting Graph based Collaborative Filtering: A Linear Residual Graph Convolutional Network Approach ( http://arxiv.org/abs/2001.10167v1 )

ライセンス: Link先を確認
Lei Chen, Le Wu, Richang Hong, Kun Zhang, Meng Wang(参考訳) グラフ畳み込みネットワーク(GCN)は、複数のレイヤの畳み込み集約操作と非線形アクティベーション操作を反復的に積み重ねることで、最先端のグラフベースの表現学習モデルである。 近年,コラボレーティブフィルタリング(cf)ベースのレコメンダシステム(rs)において,ユーザ・項目間インタラクションを2部グラフとして扱うことにより,gcnsを用いた高層協調信号をモデル化する研究者が現れた。 これらのGCNベースのレコメンデータモデルは、従来の作品よりも優れたパフォーマンスを示している。 しかし,これらのモデルでは,大規模ユーザテムグラフに対する非線形アクティベーションのトレーニングが困難である。 さらに、ほとんどのgcnベースのモデルは、グラフ畳み込み操作による過剰な平滑化効果のため、深い層をモデル化できなかった。 本稿では,GCNに基づくCFモデルを2つの側面から再検討する。 まず, 単純なグラフ畳み込みネットワークの理論と整合して, 非線形性を取り除けば推薦性能が向上することを示す。 第2に,sparse user-itemインタラクションデータを用いたグラフ畳み込み集約処理における過剰な平滑化問題を緩和する,ユーザ・テーマ間インタラクションモデルを用いたcf用に特別に設計された残差ネットワーク構造を提案する。 提案したモデルは線形モデルであり、トレーニングし、大規模なデータセットにスケールし、2つの実際のデータセットでより効率と有効性が得られる。 ソースコードはhttps://github.com/newlei/LRGCCFで公開しています。

Graph Convolutional Networks (GCNs) are state-of-the-art graph based representation learning models by iteratively stacking multiple layers of convolution aggregation operations and non-linear activation operations. Recently, in Collaborative Filtering (CF) based Recommender Systems (RS), by treating the user-item interaction behavior as a bipartite graph, some researchers model higher-layer collaborative signals with GCNs. These GCN based recommender models show superior performance compared to traditional works. However, these models suffer from training difficulty with non-linear activations for large user-item graphs. Besides, most GCN based models could not model deeper layers due to the over smoothing effect with the graph convolution operation. In this paper, we revisit GCN based CF models from two aspects. First, we empirically show that removing non-linearities would enhance recommendation performance, which is consistent with the theories in simple graph convolutional networks. Second, we propose a residual network structure that is specifically designed for CF with user-item interaction modeling, which alleviates the over smoothing problem in graph convolution aggregation operation with sparse user-item interaction data. The proposed model is a linear model and it is easy to train, scale to large datasets, and yield better efficiency and effectiveness on two real datasets. We publish the source code at https://github.com/newlei/LRGCCF.
翻訳日:2023-01-06 02:14:44 公開日:2020-01-28
# CLCNet:複合線形符号化を用いた難聴者に対するディープラーニングに基づくノイズ低減

CLCNet: Deep learning-based Noise Reduction for Hearing Aids using Complex Linear Coding ( http://arxiv.org/abs/2001.10218v1 )

ライセンス: Link先を確認
Hendrik Schr\"oter, Tobias Rosenkranz, Alberto N. Escalante B., Marc Aubreville, Andreas Maier(参考訳) ノイズ低減は現代の補聴器の重要な部分であり、ほとんどの市販デバイスに含まれている。 しかし、ディープラーニングに基づく最先端のアルゴリズムは、リアルタイムおよび周波数分解の制約を考慮していないか、あるいは非常にノイズの多い条件下では品質が劣る。 雑音環境下でのモナラ音声強調を改善するために,複素値線形符号化に基づくCLCNetを提案する。 まず、複素周波数領域に適用される線形予測符号化(LPC)によって動機付けられた複素線形符号化(CLC)を定義する。 次に,複雑なスペクトル入力と係数出力を組み込んだフレームワークを提案する。 第3に、低遅延およびオンライン処理に対応する複雑な値のスペクトログラムに対するパラメトリック正規化を定義する。 我々のCLCNetは、従来のWiener-Filterゲインと比較して、EUROMデータベースと補聴器で記録された実世界のノイズデータセットを混合して評価した。

Noise reduction is an important part of modern hearing aids and is included in most commercially available devices. Deep learning-based state-of-the-art algorithms, however, either do not consider real-time and frequency resolution constrains or result in poor quality under very noisy conditions. To improve monaural speech enhancement in noisy environments, we propose CLCNet, a framework based on complex valued linear coding. First, we define complex linear coding (CLC) motivated by linear predictive coding (LPC) that is applied in the complex frequency domain. Second, we propose a framework that incorporates complex spectrogram input and coefficient output. Third, we define a parametric normalization for complex valued spectrograms that complies with low-latency and on-line processing. Our CLCNet was evaluated on a mixture of the EUROM database and a real-world noise dataset recorded with hearing aids and compared to traditional real-valued Wiener-Filter gains.
翻訳日:2023-01-06 02:14:20 公開日:2020-01-28
# 大量ランダムアクセスにおける高速な活動とデータ検出:マルチアームバンドアプローチ

Faster Activity and Data Detection in Massive Random Access: A Multi-armed Bandit Approach ( http://arxiv.org/abs/2001.10237v1 )

ライセンス: Link先を確認
Jialin Dong, Jun Zhang, Yuanming Shi, Jessie Hui Wang(参考訳) 本稿では,大規模なIoTデバイスによる無許可ランダムアクセスについて検討する。 データシンボルをシグネチャシーケンスに埋め込むことで、ジョイントデバイスアクティビティ検出とデータデコードを実現することができるが、計算の複雑さは著しく増大する。 単語毎の複雑性を低くする座標降下アルゴリズムは検出問題を解決するために用いられてきたが、従来の研究ではランダムな座標選択ポリシーを採用しており、収束が遅くなっている。 本稿では,座標降下によるより効率的な検出のためのマルチアームバンディット手法を開発し,座標選択における探索と搾取の微妙なトレードオフを実現する。 具体的には,まず,目標関数のより積極的な降下をもたらす座標を知ることにより,座標降下の収束速度を高速化するためのバンディットに基づく戦略,すなわちベルヌーイサンプリングを提案する。 さらに収束率を向上させるため、ベルヌーイサンプリングの探索方針を学ぶために、内部多腕バンディット問題を確立する。 提案手法は, コンバージェンスレート解析とシミュレーションの結果から, 最先端アルゴリズムと比較して, コンバーゼンスレートが高速で, 時間的複雑性が小さいことを示す。 さらに,提案アルゴリズムは,低精度アナログ-デジタルコンバータ(ADC)を用いた大規模ランダムアクセスなど,様々なシナリオに適用可能である。

This paper investigates the grant-free random access with massive IoT devices. By embedding the data symbols in the signature sequences, joint device activity detection and data decoding can be achieved, which, however, significantly increases the computational complexity. Coordinate descent algorithms that enjoy a low per-iteration complexity have been employed to solve the detection problem, but previous works typically employ a random coordinate selection policy which leads to slow convergence. In this paper, we develop multi-armed bandit approaches for more efficient detection via coordinate descent, which make a delicate trade-off between exploration and exploitation in coordinate selection. Specifically, we first propose a bandit based strategy, i.e., Bernoulli sampling, to speed up the convergence rate of coordinate descent, by learning which coordinates will result in more aggressive descent of the objective function. To further improve the convergence rate, an inner multi-armed bandit problem is established to learn the exploration policy of Bernoulli sampling. Both convergence rate analysis and simulation results are provided to show that the proposed bandit based algorithms enjoy faster convergence rates with a lower time complexity compared with the state-of-the-art algorithm. Furthermore, our proposed algorithms are applicable to different scenarios, e.g., massive random access with low-precision analog-to-digital converters (ADCs).
翻訳日:2023-01-06 02:14:04 公開日:2020-01-28
# 全スライディング血球顕微鏡画像のセマンティックセグメンテーションのためのロバスト法

Robust Method for Semantic Segmentation of Whole-Slide Blood Cell Microscopic Image ( http://arxiv.org/abs/2001.10188v1 )

ライセンス: Link先を確認
Muhammad Shahzad, Arif Iqbal Umar, Muazzam A. Khan, Syed Hamad Shirazi, Zakir Khan, and Waqas Yousaf(参考訳) 走査型電子顕微鏡(SEM)細胞像のセグメンテーションに関する研究は、全スライディング細胞セグメンテーションのセグメンテーションアプローチを無視している。 提案する研究では, セマンティックセグメンテーションアプローチを用いて全スライド血球分画の問題に対処する。 画素レベルの特徴抽出モデルとして,VGG-16とともに新しい畳み込みエンコーダデコーダフレームワークを設計する。 提案するフレームワークは3つの主要なステップで構成されている。 まず, 各血液型を手動で生成した地中真理マスクとともに, 原画像はすべて前処理段階を通り抜ける。 前処理段階では、画素レベルラベリング、RGBをマスク画像のグレースケール変換、画素融合、ユニティマスク生成を行う。 その後、VGG16をシステムにロードし、事前訓練された画素レベルの特徴抽出モデルとして機能する。 3番目のステップでは、提案モデルに基づいてトレーニングプロセスを開始する。 ネットワーク性能を3つの評価指標で評価した。 我々は, 学級別, グローバル化, 平均化について, 優れた結果を得た。 RBC, WBC, 血小板は97.45%, 93.34%, 85.11%, 平均値はそれぞれ97.18%, 91.96%であった。

Previous works on segmentation of SEM (scanning electron microscope) blood cell image ignore the semantic segmentation approach of whole-slide blood cell segmentation. In the proposed work, we address the problem of whole-slide blood cell segmentation using the semantic segmentation approach. We design a novel convolutional encoder-decoder framework along with VGG-16 as the pixel-level feature extraction model. -e proposed framework comprises 3 main steps: First, all the original images along with manually generated ground truth masks of each blood cell type are passed through the preprocessing stage. In the preprocessing stage, pixel-level labeling, RGB to grayscale conversion of masked image and pixel fusing, and unity mask generation are performed. After that, VGG16 is loaded into the system, which acts as a pretrained pixel-level feature extraction model. In the third step, the training process is initiated on the proposed model. We have evaluated our network performance on three evaluation metrics. We obtained outstanding results with respect to classwise, as well as global and mean accuracies. Our system achieved classwise accuracies of 97.45%, 93.34%, and 85.11% for RBCs, WBCs, and platelets, respectively, while global and mean accuracies remain 97.18% and 91.96%, respectively.
翻訳日:2023-01-06 02:08:13 公開日:2020-01-28
# 変動の連続因子による生成モデル制御

Controlling generative models with continuous factors of variations ( http://arxiv.org/abs/2001.10238v1 )

ライセンス: Link先を確認
Antoine Plumerault, Herv\'e Le Borgne, C\'eline Hudelot(参考訳) 最近の深層生成モデルは、コンピュータビジョンや自然言語処理の様々なタスクに対処するのに役立つ視覚またはテキストの埋め込みだけでなく、フォトリアリスティックな画像を提供することができる。 それにもかかわらず、それらの有用性は、生成過程に対する制御の欠如や、学習された表現の理解不足によってしばしば制限される。 これらの主要な問題を克服するために、最近の研究は生成モデルの潜在空間の意味論を研究することに関心を示している。 本稿では, 画像中の物体の位置やスケールなどの生成画像の特徴を正確に制御するために, 生成モデルの潜時空間における有意な方向を求める新しい手法を導入することにより, 生成モデルの潜時空間の解釈可能性を向上させることを提案する。 本手法は,人間のアノテーションを必要とせず,翻訳,ズーム,色変化といった生成画像の簡単な変換を符号化する方向の探索に特に適している。 本稿では,GANと変分自動エンコーダの両方に対して定性的かつ定量的に手法の有効性を示す。

Recent deep generative models are able to provide photo-realistic images as well as visual or textual content embeddings useful to address various tasks of computer vision and natural language processing. Their usefulness is nevertheless often limited by the lack of control over the generative process or the poor understanding of the learned representation. To overcome these major issues, very recent work has shown the interest of studying the semantics of the latent space of generative models. In this paper, we propose to advance on the interpretability of the latent space of generative models by introducing a new method to find meaningful directions in the latent space of any generative model along which we can move to control precisely specific properties of the generated image like the position or scale of the object in the image. Our method does not require human annotations and is particularly well suited for the search of directions encoding simple transformations of the generated image, such as translation, zoom or color variations. We demonstrate the effectiveness of our method qualitatively and quantitatively, both for GANs and variational auto-encoders.
翻訳日:2023-01-06 02:07:45 公開日:2020-01-28
# 食品包装の品質管理のための多ソース深部ドメイン適応

Multi-Source Deep Domain Adaptation for Quality Control in Retail Food Packaging ( http://arxiv.org/abs/2001.10335v1 )

ライセンス: Link先を確認
Mamatha Thota, Stefanos Kollias, Mark Swainson, Georgios Leontidis(参考訳) 小売食品包装には、製品名、食材リスト、栄養情報、アレルゲン、準備ガイドライン、パック重量、貯蔵量、シェルフライフ情報(使用前/使用前)など、消費者健康にとって重要な情報が含まれている。 このような情報の存在と正確さは、製品の詳細な理解の確保と健康リスクの低減に不可欠である。 その結果、不正または不正なラベル付けは、消費者や他のサプライチェーンの利害関係者にとって非常に有害な可能性がある。 本稿では,食品生産ラインに沿って製品が通過する検証プロセスの一環として撮影された食品包装写真から使用日情報の有無と妥当性を識別・検証するために,多元深層学習に基づくドメイン適応システムを提案する。 これは、すべてのドメインに対するドメイン不変表現を抽出し、共通機能空間におけるすべてのソースとターゲットドメインの分布を、クラス境界とともに整列するために、マルチソースデータセットを使用することで、テクニックの一般化を改善することで達成された。 提案システムは,検証プロセスの自動化や,公衆衛生を脅かすようなラベル付けエラーの低減,食品包装情報や正確性に対する法的要件の回避など,実施実験において極めて良好に機能した。 食品包装データセットの総合的な実験により,提案手法は分類精度を著しく向上させ,食品製造制御システムに適用し,有益な影響をもたらす可能性が示唆された。

Retail food packaging contains information which informs choice and can be vital to consumer health, including product name, ingredients list, nutritional information, allergens, preparation guidelines, pack weight, storage and shelf life information (use-by / best before dates). The presence and accuracy of such information is critical to ensure a detailed understanding of the product and to reduce the potential for health risks. Consequently, erroneous or illegible labeling has the potential to be highly detrimental to consumers and many other stakeholders in the supply chain. In this paper, a multi-source deep learning-based domain adaptation system is proposed and tested to identify and verify the presence and legibility of use-by date information from food packaging photos taken as part of the validation process as the products pass along the food production line. This was achieved by improving the generalization of the techniques via making use of multi-source datasets in order to extract domain-invariant representations for all domains and aligning distribution of all pairs of source and target domains in a common feature space, along with the class boundaries. The proposed system performed very well in the conducted experiments, for automating the verification process and reducing labeling errors that could otherwise threaten public health and contravene legal requirements for food packaging information and accuracy. Comprehensive experiments on our food packaging datasets demonstrate that the proposed multi-source deep domain adaptation method significantly improves the classification accuracy and therefore has great potential for application and beneficial impact in food manufacturing control systems.
翻訳日:2023-01-06 02:07:27 公開日:2020-01-28
# 物語を生かす:インタラクティブなフィクションの世界を生み出す

Bringing Stories Alive: Generating Interactive Fiction Worlds ( http://arxiv.org/abs/2001.10161v1 )

ライセンス: Link先を確認
Prithviraj Ammanabrolu, Wesley Cheung, Dan Tu, William Broniec, Mark O. Riedl(参考訳) 世界構築は物語の知性を必要とするあらゆるタスクの基礎を形成する。 本稿では,プレイヤーが自然言語を用いて「見る」こと,「話しかける」ことを目的としたテキストベースの世界である,対話的なフィクションを手続き的に生成することに焦点を当てる。 これらの世界を生成するには、セマンティックに一貫性があり、興味深く、一貫性のあることに加えて、日常的およびテーマ的コモンセンスの事前を参照する必要がある。 既存のストーリープロットをインスピレーションとして,まず位置情報やオブジェクトなどの世界構造に関する基本的な情報を符号化した知識グラフを抽出する手法を提案する。 このナレッジグラフは、テーマ知識を利用して自動的に完成し、世界の他の部分を具体化するニューラルネットワーク生成モデルを導くために使用される。 我々は、人間参加型評価を行い、知識グラフを抽出・埋め込む神経モデルの能力をテストするとともに、それに基づく言語条件をルールベースラインおよびヒューマンメイドベースラインに対して生成する。 私たちのコードはhttps://github.com/rajammanabrolu/worldgenerationで利用可能です。

World building forms the foundation of any task that requires narrative intelligence. In this work, we focus on procedurally generating interactive fiction worlds---text-based worlds that players "see" and "talk to" using natural language. Generating these worlds requires referencing everyday and thematic commonsense priors in addition to being semantically consistent, interesting, and coherent throughout. Using existing story plots as inspiration, we present a method that first extracts a partial knowledge graph encoding basic information regarding world structure such as locations and objects. This knowledge graph is then automatically completed utilizing thematic knowledge and used to guide a neural language generation model that fleshes out the rest of the world. We perform human participant-based evaluations, testing our neural model's ability to extract and fill-in a knowledge graph and to generate language conditioned on it against rule-based and human-made baselines. Our code is available at https://github.com/rajammanabrolu/WorldGeneration.
翻訳日:2023-01-06 02:06:13 公開日:2020-01-28
# 動作速度認識のための内部クロック型時空間ニューラルネットワーク

An Internal Clock Based Space-time Neural Network for Motion Speed Recognition ( http://arxiv.org/abs/2001.10159v1 )

ライセンス: Link先を確認
Junwen Luo and Jiaoyan Chen(参考訳) 本稿では,動き速度認識のための内部クロック型時空間ニューラルネットワークを提案する。 開発したシステムは、スパイクトレインエンコーダ、内部クロック動作を備えたスパイキングニューラルネットワーク(SNN)、パターン変換ブロック、ネットワーク動的依存塑性(NDDP)学習ブロックを備える。 基本原理は、開発したSNNがそのネットワークパターン周波数(内部クロック周波数)を自動的に調整して、速度領域における人間の動きを認識することである。 実世界の動画と漫画の両方をトレーニングのベンチマークとして使ってみた結果、我々のシステムは相当な速度差(ランニング、ウォーク、ジャンプ、ワンダー(ワンダー)、スタンススティルなど)を持つ動きを認識できるだけでなく、ランニングや高速歩行といった微妙なスピードギャップを持つ動きも認識できることがわかりました。 推定精度は83.3%(cartoon video)と75%(real-world videos)である。 一方、このシステムは学習段階では6つのビデオデータセットと最大42のトレーニングトライアルしか必要としない。 ハードウェアの性能評価では、トレーニング時間は0.84-4.35s、消費電力は33.26-201mWである(ARM Cortex M4プロセッサに基づく)。 そこで,本システムは,小規模なデータセット,高速学習,低消費電力性能といった,エッジやスケーラブルなAIベースのアプリケーションに対する大きな可能性を示すユニークな学習の利点を生かしている。

In this work we present a novel internal clock based space-time neural network for motion speed recognition. The developed system has a spike train encoder, a Spiking Neural Network (SNN) with internal clocking behaviors, a pattern transformation block and a Network Dynamic Dependent Plasticity (NDDP) learning block. The core principle is that the developed SNN will automatically tune its network pattern frequency (internal clock frequency) to recognize human motions in a speed domain. We employed both cartoons and real-world videos as training benchmarks, results demonstrate that our system can not only recognize motions with considerable speed differences (e.g. run, walk, jump, wonder(think) and standstill), but also motions with subtle speed gaps such as run and fast walk. The inference accuracy can be up to 83.3% (cartoon videos) and 75% (real-world videos). Meanwhile, the system only requires six video datasets in the learning stage and with up to 42 training trials. Hardware performance estimation indicates that the training time is 0.84-4.35s and power consumption is 33.26-201mW (based on an ARM Cortex M4 processor). Therefore, our system takes unique learning advantages of the requirement of the small dataset, quick learning and low power performance, which shows great potentials for edge or scalable AI-based applications.
翻訳日:2023-01-06 02:05:55 公開日:2020-01-28
# マルチタスク学習によるゴール指向対話への統合埋め込み

Incorporating Joint Embeddings into Goal-Oriented Dialogues with Multi-Task Learning ( http://arxiv.org/abs/2001.10468v1 )

ライセンス: Link先を確認
Firas Kassawat, Debanjan Chaudhuri, Jens Lehmann(参考訳) 注意に基づくエンコーダ・デコーダニューラルネットワークモデルは近年,目標指向対話システムにおいて有望な結果を示している。 しかし、これらのモデルは、エンドツーエンドのテキスト生成機能を保ちながら、ステートフルな知識を取り込むのに苦労しています。 本稿では,ユーザ意図や知識グラフの統合から大きな恩恵を受けることができるため,知識グラフとコーパスを併用して学習したRNNベースのエンド・ツー・エンド・エンド・エンコーダ・デコーダアーキテクチャを提案する。 このモデルは、ユーザ意図のさらなる統合と、マルチタスク学習パラダイムで訓練されたテキスト生成と、間違ったエンティティを出力としてペナル化するための追加の正規化技術を提供する。 このモデルは、提案されたローカル知識グラフに基づいて生成された出力がステートフルであることを保証するために、推論中に知識グラフエンティティのルックアップを組み込む。 我々は最終的にBLEUスコアを用いてモデルの評価を行い、提案アーキテクチャがタスク指向対話システムの性能向上に有効であることを示す実証的な評価を行った。

Attention-based encoder-decoder neural network models have recently shown promising results in goal-oriented dialogue systems. However, these models struggle to reason over and incorporate state-full knowledge while preserving their end-to-end text generation functionality. Since such models can greatly benefit from user intent and knowledge graph integration, in this paper we propose an RNN-based end-to-end encoder-decoder architecture which is trained with joint embeddings of the knowledge graph and the corpus as input. The model provides an additional integration of user intent along with text generation, trained with a multi-task learning paradigm along with an additional regularization technique to penalize generating the wrong entity as output. The model further incorporates a Knowledge Graph entity lookup during inference to guarantee the generated output is state-full based on the local knowledge graph provided. We finally evaluated the model using the BLEU score, empirical evaluation depicts that our proposed architecture can aid in the betterment of task-oriented dialogue system`s performance.
翻訳日:2023-01-06 01:58:51 公開日:2020-01-28
# AutoMLにおける真の自動化に向けた適応的・近接パラメータフリー進化計算手法

An Adaptive and Near Parameter-free Evolutionary Computation Approach Towards True Automation in AutoML ( http://arxiv.org/abs/2001.10178v1 )

ライセンス: Link先を確認
Benjamin Patrick Evans, Bing Xue, Mengjie Zhang(参考訳) 進化的計算手法の一般的な主張は、人間の介入なしに良い結果が得られるということである。 しかし、これに対する批判の1つは、優れたパフォーマンスを達成するために調整しなければならないハイパーパラメータが存在することである。 本研究では,進化を通じてハイパーパラメータ値を手作業で指定することなく適応させる,ほぼ"パラメータフリー"な遺伝的プログラミング手法を提案する。 これを自動機械学習の領域に適用し(TPOTを拡張して)、効果的に人間の入力から解放されるパイプラインを生成し、手選択されたハイパーパラメータ値を使用する既存の最先端技術と競合することを示す。 パイプラインはランダムに選択された推定器から始まり、自動的に競合パイプラインへと進化する。 この作業は、AutoMLに対する真に自動的なアプローチに向かっています。

A common claim of evolutionary computation methods is that they can achieve good results without the need for human intervention. However, one criticism of this is that there are still hyperparameters which must be tuned in order to achieve good performance. In this work, we propose a near "parameter-free" genetic programming approach, which adapts the hyperparameter values throughout evolution without ever needing to be specified manually. We apply this to the area of automated machine learning (by extending TPOT), to produce pipelines which can effectively be claimed to be free from human input, and show that the results are competitive with existing state-of-the-art which use hand-selected hyperparameter values. Pipelines begin with a randomly chosen estimator and evolve to competitive pipelines automatically. This work moves towards a truly automatic approach to AutoML.
翻訳日:2023-01-06 01:58:16 公開日:2020-01-28
# PEL-BERT:プロトコルエンティティリンクのための統合モデル

PEL-BERT: A Joint Model for Protocol Entity Linking ( http://arxiv.org/abs/2002.00744v1 )

ライセンス: Link先を確認
Shoubin Li, Wenzao Cui, Yujiang Liu, Xuran Ming, Jun Hu, YuanzheHu, Qing Wang(参考訳) BERTのような事前訓練されたモデルはNLPタスクで広く使われ、様々なNLPタスクのパフォーマンスを継続的に改善するために微調整されている。 それでも、私たちのプロトコルコーパスでトレーニングされた細調整されたBERTモデルは、Entity Linking (EL)タスクでは依然として弱いパフォーマンスです。 本稿では,細調整言語モデルとRFCドメインモデルとを結合するモデルを提案する。 まず,プロトコルelのガイドラインとしてプロトコル知識ベースを設計する。 次に、プロトコル内の名前付きエンティティをプロトコル知識ベース内のカテゴリにリンクする新しいモデル PEL-BERT を提案する。 最後に,記述文や抽象概念を用いた事前学習言語モデルの性能に関する総合的研究を行う。 実験結果から,アノテートされたデータセット上でのELの最先端性能が得られた。

Pre-trained models such as BERT are widely used in NLP tasks and are fine-tuned to improve the performance of various NLP tasks consistently. Nevertheless, the fine-tuned BERT model trained on our protocol corpus still has a weak performance on the Entity Linking (EL) task. In this paper, we propose a model that joints a fine-tuned language model with an RFC Domain Model. Firstly, we design a Protocol Knowledge Base as the guideline for protocol EL. Secondly, we propose a novel model, PEL-BERT, to link named entities in protocols to categories in Protocol Knowledge Base. Finally, we conduct a comprehensive study on the performance of pre-trained language models on descriptive texts and abstract concepts. Experimental results demonstrate that our model achieves state-of-the-art performance in EL on our annotated dataset, outperforming all the baselines.
翻訳日:2023-01-06 01:58:02 公開日:2020-01-28
# 再帰的最適輸送による構造認識文の類似性

Structural-Aware Sentence Similarity with Recursive Optimal Transport ( http://arxiv.org/abs/2002.00745v1 )

ライセンス: Link先を確認
Zihao Wang, Yong Zhang, Hao Wu(参考訳) 文類似度の測定は自然言語処理における古典的なトピックである。 軽量な類似性は、たとえディープラーニングモデルが他の多くのタスクで成功したとしても、特に実用的な意味を持つ。 より理論的な洞察を持つ軽量な類似性は、教師付きディープラーニングアプローチよりも強いことが示されている。 しかし、Word Mover's Distance (Kusner et al., 2015) や Smooth Inverse Frequency (Arora et al., 2017) のような軽量モデルの成功は、文の構造、すなわち単語の順序との違いを検出することができなかった。 この問題に対処するために、構造情報を従来のOTに組み込むための再帰的最適輸送(ROT)フレームワークを提案する。 さらに,単語ベクトルの重み付け平均のコサイン類似度と最適伝達の関係から,意味的洞察の価値のある文に対する再帰的最適類似度(rots)を開発する。 ROTSは構造を意識しており、最適な輸送に比べて低時間で複雑である。 20文のテキスト類似性(STS)データセットに対する実験は、弱い教師付きアプローチに対するROTSの明確な優位性を示している。 詳細なアブレーション研究は、ROTの有効性と意味的な洞察を示す。

Measuring sentence similarity is a classic topic in natural language processing. Light-weighted similarities are still of particular practical significance even when deep learning models have succeeded in many other tasks. Some light-weighted similarities with more theoretical insights have been demonstrated to be even stronger than supervised deep learning approaches. However, the successful light-weighted models such as Word Mover's Distance [Kusner et al., 2015] or Smooth Inverse Frequency [Arora et al., 2017] failed to detect the difference from the structure of sentences, i.e. order of words. To address this issue, we present Recursive Optimal Transport (ROT) framework to incorporate the structural information with the classic OT. Moreover, we further develop Recursive Optimal Similarity (ROTS) for sentences with the valuable semantic insights from the connections between cosine similarity of weighted average of word vectors and optimal transport. ROTS is structural-aware and with low time complexity compared to optimal transport. Our experiments over 20 sentence textural similarity (STS) datasets show the clear advantage of ROTS over all weakly supervised approaches. Detailed ablation study demonstrate the effectiveness of ROT and the semantic insights.
翻訳日:2023-01-06 01:57:33 公開日:2020-01-28
# Propensity Score Matching を用いたフェイクニュース検出手法の一般化性の向上

Improving Generalizability of Fake News Detection Methods using Propensity Score Matching ( http://arxiv.org/abs/2002.00838v1 )

ライセンス: Link先を確認
Bo Ni, Zhichun Guo, Jianing Li, Meng Jiang(参考訳) 近年、オンライン・ソーシャルネットワークの影響が高まり、偽ニュースの検出が学術界や一般人の両方から大きな注目を集めている。 本稿では,偽ニュースの特徴における共起変数の存在を考察し,共起変数の効果を低減するために一般化可能な特徴を選択するために,protensity score matching (psm) を用いる。 実験結果から, 偽ニュース手法の一般化性は, 生周波数を用いて特徴を抽出するよりも, PSMを用いることで著しく向上した。 本稿では,ロジスティック回帰,ランダムフォレスト,サポートベクターマシンなど,複数種類の偽ニュース手法(分類器)について検討する。 パフォーマンス改善に関する一貫した観察があります。

Recently, due to the booming influence of online social networks, detecting fake news is drawing significant attention from both academic communities and general public. In this paper, we consider the existence of confounding variables in the features of fake news and use Propensity Score Matching (PSM) to select generalizable features in order to reduce the effects of the confounding variables. Experimental results show that the generalizability of fake news method is significantly better by using PSM than using raw frequency to select features. We investigate multiple types of fake news methods (classifiers) such as logistic regression, random forests, and support vector machines. We have consistent observations of performance improvement.
翻訳日:2023-01-06 01:57:13 公開日:2020-01-28
# KEEN Universe:再現性と伝達性に着目した知識グラフ埋め込みのためのエコシステム

The KEEN Universe: An Ecosystem for Knowledge Graph Embeddings with a Focus on Reproducibility and Transferability ( http://arxiv.org/abs/2001.10560v1 )

ライセンス: Link先を確認
Mehdi Ali, Hajira Jabeen, Charles Tapley Hoyt, and Jens Lehman(参考訳) 機械学習タスクに使用するために、連続ベクトル空間に知識グラフ(KG)を埋め込む傾向が出現している。 近年,エッジに依存するノードの類似性など,kgの構造的性質を維持しつつ低次元表現を学習するkgeモデルが提案されている。 KGEは、新しいリンクの予測やエンティティの曖昧さといったKG内のタスクに対処するために使用できる。 質問応答やファクトチェックといった下流タスクにも使用することができる。 全体として、これらのタスクはセマンティックWebコミュニティに関係しています。 その人気にもかかわらず、KGE実験の再現性と、機械学習コミュニティ以外の研究分野への提案されたKGEモデルの転送性は大きな課題である。 そこで我々は,再現性と伝達性を重視した知識グラフ埋め込みのためのエコシステムであるKEEN Universeを紹介した。 KEEN Universeは現在、PythonパッケージPyKEEN(Python KnowlEdge EmbeddiNgs)、BioKEEN(Biological KnowlEdge EmbeddiNgs)、KEEN Model Zoo(KEENモデル動物園)で構成されている。

There is an emerging trend of embedding knowledge graphs (KGs) in continuous vector spaces in order to use those for machine learning tasks. Recently, many knowledge graph embedding (KGE) models have been proposed that learn low dimensional representations while trying to maintain the structural properties of the KGs such as the similarity of nodes depending on their edges to other nodes. KGEs can be used to address tasks within KGs such as the prediction of novel links and the disambiguation of entities. They can also be used for downstream tasks like question answering and fact-checking. Overall, these tasks are relevant for the semantic web community. Despite their popularity, the reproducibility of KGE experiments and the transferability of proposed KGE models to research fields outside the machine learning community can be a major challenge. Therefore, we present the KEEN Universe, an ecosystem for knowledge graph embeddings that we have developed with a strong focus on reproducibility and transferability. The KEEN Universe currently consists of the Python packages PyKEEN (Python KnowlEdge EmbeddiNgs), BioKEEN (Biological KnowlEdge EmbeddiNgs), and the KEEN Model Zoo for sharing trained KGE models with the community.
翻訳日:2023-01-06 01:56:16 公開日:2020-01-28