このサイトではarxivの論文のうち、30ページ以下でCreative Commonsライセンス(CC 0, CC BY, CC BY-SA)の論文を日本語訳しています。 本文がCCでない論文、長すぎる論文はメタデータのみを翻訳しています。(arxivのメタデータは CC 0です。) 翻訳文のライセンスはCC BY-SA 4.0です。 翻訳にはFugu-Machine Translatorを利用しています。

本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。

公開日が20230107となっている論文です。

PDF登録状況(公開日: 20230107)

TitleAuthorsAbstract論文公表日・翻訳日
# オンコロジーにおける腫瘍ダイナミクスモデリングのための翻訳量子マシンインテリジェンス

Translational Quantum Machine Intelligence for Modeling Tumor Dynamics in Oncology ( http://arxiv.org/abs/2202.10919v3 )

ライセンス: Link先を確認
Nam Nguyen and Kwang-Cheng Chen(参考訳) 腫瘍負担の動態の定量化は、治療効果と薬剤耐性に関するがんの進化に関する有用な情報を示し、それはパーソナライズされた医療や精密腫瘍学へのモデルインフォームド医薬品開発(MIDD)の進展に重要な役割を果たしている。 量子機械知能の出現は、量子力学の観点で腫瘍のダイナミクスに対する無論な洞察を与える。 本稿では,治療効果に関する腫瘍負担の量子力学を定量化する,$\eta-$Netという新しいハイブリッド量子古典型ニューラルネットワークを提案する。 提案したニューラルソリューションはコホート特異的および患者特異的モデリングを含む2つの主要なユースケースで評価した。 シリカの数値計算では、定量化された生物学的問題に対する$\eta-$Netの容量と表現性が示される。 さらに、現代AIの成功の基盤である表現学習との密接な関係は、関連するコホートから標的患者への経験的知識の効率的な伝達を可能にする。 最後に,ベイズ最適化を利用してモデル予測の不確かさを定量化し,臨床応用のための意思決定における信頼性の高いaiへの$\eta-$netへの道を開く。

Quantifying the dynamics of tumor burden reveals useful information about cancer evolution concerning treatment effects and drug resistance, which play a crucial role in advancing model-informed drug developments (MIDD) towards personalized medicine and precision oncology. The emergence of Quantum Machine Intelligence offers unparalleled insights into tumor dynamics via a quantum mechanics perspective. This paper introduces a novel hybrid quantum-classical neural architecture named $\eta-$Net that enables quantifying quantum dynamics of tumor burden concerning treatment effects. We evaluate our proposed neural solution on two major use cases, including cohort-specific and patient-specific modeling. In silico numerical results show a high capacity and expressivity of $\eta-$Net to the quantified biological problem. Moreover, the close connection to representation learning - the foundation for successes of modern AI, enables efficient transferability of empirical knowledge from relevant cohorts to targeted patients. Finally, we leverage Bayesian optimization to quantify the epistemic uncertainty of model predictions, paving the way for $\eta-$Net towards reliable AI in decision-making for clinical usages.
翻訳日:2023-02-24 07:57:48 公開日:2023-01-07
# 誤りによる学習における削除の量子証明

Quantum Proofs of Deletion for Learning with Errors ( http://arxiv.org/abs/2203.01610v4 )

ライセンス: Link先を確認
Alexander Poremba(参考訳) 量子情報には、測定が本質的に破壊的なプロセスであるという特性がある。 この特徴は相補性の原理において最も明白であり、相互に非互換な可観測性は同時に測定できないと述べる。 Broadbent and Islam(TCC 2020)による最近の研究は、量子力学のこの側面に基づいて、認証削除と呼ばれる暗号概念を実現する。 この顕著な概念は、古典的検証者が(プライベートキーの)量子暗号文が信頼できない者によって削除されたことを確信することができるが、追加的な機能層は提供されない。 本稿では,完全準同型暗号(fhe)による削除証明パラダイムを補強する。 我々は、信頼できない量子サーバが暗号化されたデータ上で計算し、要求された場合、クライアントへのデータの削除を同時に証明できる対話型プロトコルである、認証された削除を伴う最初の完全同型暗号化スキームを構築した。 私たちのスキームは、削除証明書の検証が公開されているという望ましい特性を持っています。 我々の主要な技術要素は、量子証明器が古典的検証器に量子状態の形でLearning with Errors(LWE)分布のサンプルが削除されたことを納得させる対話的プロトコルである。 本プロトコルの適用例として、認証削除付きDual-Regev公開鍵暗号方式を構築し、同じタイプの(レベル付き)FHE方式に拡張する。 我々は,Uruh (Eurocrypt 2016) で定義されたハッシュ関数の崩壊の特別な場合であるガウス分解ハッシュ関数の概念を導入し,Ajtai ハッシュ関数がリークの有無でガウス崩壊特性を満たすという仮定の下で,我々のスキームの安全性を証明した。

Quantum information has the property that measurement is an inherently destructive process. This feature is most apparent in the principle of complementarity, which states that mutually incompatible observables cannot be measured at the same time. Recent work by Broadbent and Islam (TCC 2020) builds on this aspect of quantum mechanics to realize a cryptographic notion called certified deletion. While this remarkable notion enables a classical verifier to be convinced that a (private-key) quantum ciphertext has been deleted by an untrusted party, it offers no additional layer of functionality. In this work, we augment the proof-of-deletion paradigm with fully homomorphic encryption (FHE). We construct the first fully homomorphic encryption scheme with certified deletion -- an interactive protocol which enables an untrusted quantum server to compute on encrypted data and, if requested, to simultaneously prove data deletion to a client. Our scheme has the desirable property that verification of a deletion certificate is public; meaning anyone can verify that deletion has taken place. Our main technical ingredient is an interactive protocol by which a quantum prover can convince a classical verifier that a sample from the Learning with Errors (LWE) distribution in the form of a quantum state was deleted. As an application of our protocol, we construct a Dual-Regev public-key encryption scheme with certified deletion, which we then extend towards a (leveled) FHE scheme of the same type. We introduce the notion of Gaussian-collapsing hash functions -- a special case of collapsing hash functions defined by Unruh (Eurocrypt 2016) -- and we prove the security of our schemes under the assumption that the Ajtai hash function satisfies a certain strong Gaussian-collapsing property in the presence of leakage.
翻訳日:2023-02-23 05:53:14 公開日:2023-01-07
# Charles Babbage, Ada Lovelace, and the Bernoulli Numbers

Charles Babbage, Ada Lovelace, and the Bernoulli Numbers ( http://arxiv.org/abs/2301.02919v1 )

ライセンス: Link先を確認
Thomas J. Misa(参考訳) この章は、アダ・ラヴレースを不当に否定的な学説に修正する。 ラヴレースとバベッジのクレジットはゼロサムゲームではなく、ラヴレースに追加されたクレジットはバベッジから何らかの理由で引き離される。 バベッジとラヴレスは、それぞれ1843年の有名なバベッジの分析エンジンのスケッチとそれに付随するノートに重要な貢献をした。 さらに、ラヴレスは19世紀の数学で卓越した2人の人物、チャールズ・バベッジとアウグストゥス・ド・モーガンと文通し、数学の背景と洗練を確立した。 Babbage and Lovelace's treatment of the Bernoulli number in Note 'G' は、彼らのコラボレーションのこの側面に注目している。 最後に、Lovelaceを"世界初のコンピュータプログラマ"と呼ぶ際の重要な定義上の問題を認めながら、私はLovelaceが一連のベルヌーイ数を計算するための命令列(つまりアルゴリズム)を作成したと断言します。

This chapter makes needed corrections to an unduly negative scholarly view of Ada Lovelace. Credit between Lovelace and Babbage is not a zero-sum game, where any credit added to Lovelace somehow detracts from Babbage. Ample evidence indicates Babbage and Lovelace each had important contributions to the famous 1843 Sketch of Babbage's Analytical Engine and the accompanying Notes. Further, Lovelace's correspondence with two highly accomplished figures in 19th century mathematics, Charles Babbage and Augustus De Morgan, establish her mathematical background and sophistication. Babbage and Lovelace's treatment of the Bernoulli numbers in Note 'G' spotlights this aspect of their collaboration. Finally, while acknowledging significant definitional problems in calling Lovelace the world's "first computer programmer," I affirm that Lovelace created an elemental sequence of instructions -- that is, an algorithm -- for computing the series of Bernoulli numbers.
翻訳日:2023-02-19 13:31:09 公開日:2023-01-07
# mangngalapp --covid-19対応と農村開発のための技術統合パッケージ: tamを用いた受容性とユーザビリティ

MangngalApp -- An integrated package of technology for COVID-19 response and rural development: Acceptability and usability using TAM ( http://arxiv.org/abs/2301.02893v1 )

ライセンス: Link先を確認
Billy S. Javier, Leo P. Paliuanan, James Karl A. Agpalza, Jesty S. Agoto(参考訳) 新型コロナウイルス(covid-19)のパンデミックは、大学や組織に対して、人々やコミュニティの幸福と福祉を高めるメカニズムを考案するよう求めている。 これに反応して、統合された技術パッケージmangngalapp(webベースのポータルと農村開発のためのモバイルレスポンシブアプリケーション)の設計と開発が機会となった。 漁業や養殖業の分野における研究開発の成果である様々な技術、IP保護されたイノベーション、そしてコミュニティの成長と発展の維持を支援するためにローカルに利用可能な資源を利用する技術を紹介している。 本稿では,MangngalAppがTechnology Acceptance ModelまたはTAMおよびISO 25010ソフトウェア品質標準を用いた記述型研究設計を実装した際のユーザビリティと受容性に着目した。 新型コロナウイルス(COVID-19)による政府の健康制限で制限されたGoogleフォームベースのアンケートは、同意書と評価書を添付したメールを通じて参加者に転送された。 その結果、MangngalAppは非常に受け入れられ、使用でき、ISO 25010のソフトウェア品質特性に適合していることが判明した。 以上の結果から,開発中のMangngalAppは,特に漁民,採集業者,プロセッサ,トレーダー,農夫の農村開発を支援する,実用的でレスポンシブな技術であることが示唆された。 互換性と有用性を考慮すると、MangngalAppはコミュニティでより大きなソーシャル開発を提供するものと期待されている。

The COVID19 pandemic has challenged universities and organizations to devise mechanisms to uplift the well-being and welfare of people and communities. In response, the design and development of an integrated package of technologies, MangngalApp -- A web-based portal and mobile responsive application for rural development served as an opportunity. It showcases different packets of technologies that were outputs of R&D in the field of fisheries and aqua-culture, innovations that were IP-protected, and technologies that harness locally available resources for post-harvest development and aiding in sustaining growth and development in the communities. This paper focused on the usability and acceptability of the MangngalApp implementing a descriptive research design using the Technology Acceptance Model or TAM and ISO 25010 software quality standards. Constrained by government health restrictions due to COVID-19, a Google form-based questionnaire was forwarded to consented participants via an email with the attached consent and evaluation form. Results revealed that the MangngalApp was found to be very acceptable and usable, and compliant to ISO 25010 software quality characteristics to the higher extent. From the results, it is concluded that the developed MangngalApp will be a usable and responsive technology that aids to rural development especially among target users: fishers, gatherers, processors, traders, and farmers. Considering compatibility and usefulness, the MangngalApp is expected to provide greater social development in the community.
翻訳日:2023-02-19 13:30:52 公開日:2023-01-07
# アウトカム・パフォーマティビティに基づく意思決定

Making Decisions under Outcome Performativity ( http://arxiv.org/abs/2210.01745v2 )

ライセンス: Link先を確認
Michael P. Kim and Juan C. Perdomo(参考訳) 意思決定者は、しばしばデータ駆動予測に反応して行動し、好ましい結果を達成することを目標とする。 このような環境では、予測はパッシブに未来を予測するのではなく、予測が予測する結果の分布を積極的に形作る。 このパフォーマンス予測設定は、"最適な"決定ルールを学ぶための新しい課題を提起する。 特に、既存のソリューションの概念は、成果を正確に予測する目標と、望ましい結果を達成するために個人を操る目標の間の明らかな緊張に対処しない。 そこで本研究では,教師付き(非形式的)学習環境から適応した,新しい最適性概念 (performative omniprediction) を提案する。 実効的全量予測器( performative omnipredictor)は、多くの潜在的な目的に対して最適な決定規則を同時に符号化する単一の予測器である。 本研究の主な成果は,性能予測の自然な制約の下で,効率の良い性能予測器が存在することを示す。 技術的レベルでは、結果は結果実行設定と結果の不一致の概念を慎重に一般化することで追従します。 パーフォーマティブ OI の適切な概念から、全方位法や普遍的適応性といった教師付き設定で成り立つことが知られている多くの結果を取り戻す。

Decision-makers often act in response to data-driven predictions, with the goal of achieving favorable outcomes. In such settings, predictions don't passively forecast the future; instead, predictions actively shape the distribution of outcomes they are meant to predict. This performative prediction setting raises new challenges for learning "optimal" decision rules. In particular, existing solution concepts do not address the apparent tension between the goals of forecasting outcomes accurately and steering individuals to achieve desirable outcomes. To contend with this concern, we introduce a new optimality concept -- performative omniprediction -- adapted from the supervised (non-performative) learning setting. A performative omnipredictor is a single predictor that simultaneously encodes the optimal decision rule with respect to many possibly-competing objectives. Our main result demonstrates that efficient performative omnipredictors exist, under a natural restriction of performative prediction, which we call outcome performativity. On a technical level, our results follow by carefully generalizing the notion of outcome indistinguishability to the outcome performative setting. From an appropriate notion of Performative OI, we recover many consequences known to hold in the supervised setting, such as omniprediction and universal adaptability.
翻訳日:2023-02-19 11:29:28 公開日:2023-01-07
# 非マルコフレジームにおける巨大原子の集団放射

Collective Radiance of Giant Atoms in Non-Markovian Regime ( http://arxiv.org/abs/2205.10982v2 )

ライセンス: Link先を確認
Qing-Yang Qiu, Ying Wu, and Xin-You L\"u(参考訳) 1次元(1次元)導波路におけるボソニックモードの連続体と相互作用する2つの巨大人工原子の非マルコフダイナミクスについて検討した。 図式的手法に基づき,集合的放射能のリッチな現象を予測する厳密な解析解を提案する。 特定の集合状態に対して、崩壊速度はディックモデルや標準マルコフのフレームワークで予測されるよりもはるかに遠く、超超越性の発生を示すことが分かる。 巨大原子の交換対称性を調整することで超原子間遷移を実現することができる。 さらに、連続体(bics)には複数の束縛状態が存在し、光子/フォノンは結合点によって形成される空洞状測地線で前後に跳ね返る。 BICの閉じ込められた光子/フォノンは、巨大原子のエネルギーレベル分割を変更することで、都合よく再放出される。 このメカニズムは、コヒーレントな時間遅延フィードバックと巨大原子の結合点間の干渉の結合効果に依存する。 この研究は、非マルコビアン性を導入することによって、巨大原子集合放射の分野を根本的に広げる。 さらに、より複雑な遅延を持つ非線形開量子システムのクリーンな解析的記述への道を開く。

We investigate the non-Markovian dynamics of two giant artificial atoms interacting with a continuum of bosonic modes in a one-dimensional (1D) waveguide. Based on the diagrammatic method, we present the exact analytical solutions, which predict the rich phenomena of collective radiance. For the certain collective states, the decay rates are found to be far beyond that predicted in the the Dicke model and standard Markovian framework, which indicates the occurrence of super-superradiance. The superadiance-to-subradiance transition could be realized by adjusting the exchange symmetry of giant atoms. Moreover, there exists multiple bound states in continuum (BICs), with photons/phonons bouncing back and forth in the cavity-like geometries formed by the coupling points. The trapped photons/phonons in the BICs can also be re-released conveniently by changing the energy level splitting of giant atoms. The mechanism relies on the joint effects of the coherent time-delayed feedback and the interference between the coupling points of giant atoms. This work fundamentally broadens the fields of giant atom collective radiance by introducing non-Markovianity. It also paves the way for a clean analytical description of nonlinear open quantum system with more complex retardation.
翻訳日:2023-02-12 00:56:26 公開日:2023-01-07
# 3粒子捕捉系におけるクエンチダイナミクスに及ぼすエフィモフ状態の影響

Effects of Efimov states on quench dynamics in a three-boson trapped system ( http://arxiv.org/abs/2208.05666v3 )

ライセンス: Link先を確認
A. D. Kerin and A. M. Martin(参考訳) 本研究では,球対称3次元調和トラップにおいて,接触相互作用を伴う3つの同一ボソンのポストクエンチダイナミクスに及ぼすエフィモフ状態の影響について検討した。 静的三体問題に対する既知の超球面解を用いて、ラムゼー信号の半解析結果と粒子分離を、システムのクエンチ後の時間関数として計算する。 我々は、非相互作用から強い相互作用へのクエンチを考慮し、その逆は様々な可能なefimov状態エネルギーについて考える。

We investigate the effects of Efimov states on the post-quench dynamics of a system of three identical bosons with contact interactions, in a spherically-symmetric three-dimensional harmonic trap, which undergoes a quench in interaction strength. Using known hyperspherical solutions to the static three-body problem we calculate semi-analytic results for the Ramsey signal and particle separation as functions of time after the system is quenched. We consider the quench from the non-interacting to strongly interacting and vice versa for a variety of possible Efimov state energies.
翻訳日:2023-01-31 21:11:07 公開日:2023-01-07
# トピックからの法定句生成のためのグラフベースキーワードプランニング

Graph-based Keyword Planning for Legal Clause Generation from Topics ( http://arxiv.org/abs/2301.06901v1 )

ライセンス: Link先を確認
Sagar Joshi, Sumanth Balaji, Aparna Garimella, Vasudeva Varma(参考訳) 最小限のユーザ提供情報に基づく法的条項などのドメイン固有のコンテンツの生成は、法的契約生成の自動化において大きなメリットがある。 本稿では,法的条項の話題や種類のみを用いて法的条項を生成できる制御可能なグラフベースのメカニズムを提案する。 パイプラインはグラフベースのプランナと節生成器の2つのステージから構成される。 プランナーは、制御可能なグラフベースのメカニズムを用いて、入力トピックに基づいて、より特定の節情報に対する汎用的な順のキーワードのシーケンスとして、法律条項の内容の概要を概説する。 生成段階は与えられた計画を受け取り、節を生成する。 パイプラインはグラフベースのプランナーとテキスト生成で構成される。 提案する2段階アプローチが,契約の幅広い節話題に対して有効であることを示す。

Generating domain-specific content such as legal clauses based on minimal user-provided information can be of significant benefit in automating legal contract generation. In this paper, we propose a controllable graph-based mechanism that can generate legal clauses using only the topic or type of the legal clauses. Our pipeline consists of two stages involving a graph-based planner followed by a clause generator. The planner outlines the content of a legal clause as a sequence of keywords in the order of generic to more specific clause information based on the input topic using a controllable graph-based mechanism. The generation stage takes in a given plan and generates a clause. The pipeline consists of a graph-based planner followed by text generation. We illustrate the effectiveness of our proposed two-stage approach on a broad set of clause topics in contracts.
翻訳日:2023-01-29 14:18:02 公開日:2023-01-07
# 農村部をスマート村に転換するデジタル農業の役割

The Role of Digital Agriculture in Transforming Rural Areas into Smart Villages ( http://arxiv.org/abs/2301.10012v1 )

ライセンス: Link先を確認
Mohammad Raziuddin Chowdhury, Md Sakib Ullah Sourav, Rejwan Bin Sulaiman(参考訳) あらゆる国の観点から、農村部は一般的に、適切な医療、教育、生活条件、賃金、市場機会の欠如など、同等の問題を提起している。 過去数十年間、いくつかの国はスマートビレッジの概念を創造し開発してきた。 伝統的な農業の景観はデジタル農業によって根本的に変化しており、農業生産の増加を確実にすることで農家や農村部に住む人々に好意的な経済効果をもたらした。 本章では、近年のデジタル農業のトレンドが農業生産の改善にどのように貢献するかを事例として、農村における現在の課題とスマートビレッジの適用結果について考察した。

From the perspective of any nation, rural areas generally present a comparable set of problems, such as a lack of proper health care, education, living conditions, wages, and market opportunities. Some nations have created and developed the concept of smart villages during the previous few decades, which effectively addresses these issues. The landscape of traditional agriculture has been radically altered by digital agriculture, which has also had a positive economic impact on farmers and those who live in rural regions by ensuring an increase in agricultural production. We explored current issues in rural areas, and the consequences of smart village applications, and then illustrate our concept of smart village from recent examples of how emerging digital agriculture trends contribute to improving agricultural production in this chapter.
翻訳日:2023-01-29 13:40:54 公開日:2023-01-07
# 状態空間における有限温度量子凝縮:一般証明

Finite temperature quantum condensations in the space of states: General Proof ( http://arxiv.org/abs/2209.13244v2 )

ライセンス: Link先を確認
Massimo Ostilli and Carlo Presilla(参考訳) 我々は、状態空間における凝縮として作用する量子相転移のクラスの有限温度への拡張を形式化し、証明し、最近、ゼロ温度~(Ostilli and Presilla 2021 \textit{J)で議論した。 Phys a: 数学。 Theor } \textbf{54} 055005。 In details, we find that if, for a quantum system at canonical thermal equilibrium, one can find a partition of its Hilbert space $\mathcal{H}$ into two subspaces, $\mathcal{H}_\mathrm{cond}$ and $\mathcal{H}_\mathrm{norm}$, such that, in the thermodynamic limit, $\dim \mathcal{H}_\mathrm{cond}/ \dim \mathcal{H} \to 0$ and the free energies of the system restricted to these subspaces cross each other for some value of the Hamiltonian parameters, then, the system undergoes a first-order quantum phase transition driven by those parameters. この証明は、システムの逆温度と同定された想像時間における量子力学の正確な確率的表現に基づいている。 また, 臨界面は高温・低温で普遍的な特徴を持つことを示した。

We formalize and prove the extension to finite temperature of a class of quantum phase transitions, acting as condensations in the space of states, recently introduced and discussed at zero temperature~(Ostilli and Presilla 2021 \textit{J. Phys. A: Math. Theor.} \textbf{54} 055005). In details, we find that if, for a quantum system at canonical thermal equilibrium, one can find a partition of its Hilbert space $\mathcal{H}$ into two subspaces, $\mathcal{H}_\mathrm{cond}$ and $\mathcal{H}_\mathrm{norm}$, such that, in the thermodynamic limit, $\dim \mathcal{H}_\mathrm{cond}/ \dim \mathcal{H} \to 0$ and the free energies of the system restricted to these subspaces cross each other for some value of the Hamiltonian parameters, then, the system undergoes a first-order quantum phase transition driven by those parameters. The proof is based on an exact probabilistic representation of quantum dynamics at an imaginary time identified with the inverse temperature of the system. We also show that the critical surface has universal features at high and low temperatures.
翻訳日:2023-01-25 00:32:00 公開日:2023-01-07
# 非断熱モデルにおける多次元電子分光の振動応答関数

Vibrational response functions for multidimensional electronic spectroscopy in non-adiabatic models ( http://arxiv.org/abs/2210.00786v2 )

ライセンス: Link先を確認
Filippo Troiani(参考訳) 原子核と電子力学の相互作用は、様々な分子および固体系の多次元電子スペクトルを特徴づける。 理論的には、そのような相互作用の観測可能な効果は応答関数によって説明できる。 本稿では,モデルシステムのクラスに対応する応答関数の解析式について報告する。 これらは、ダイアバティック電子状態と対応する調和振動子の線形変位をもたらす自由度との結合と、対のダイアバティック状態間の非断熱結合によって特徴づけられる。 線形応答関数を導出するために,まずハミルトニアンの非断熱成分に関して関連プロパゲータのダイソン展開を行い,次いで,与えられた相互作用時間におけるプロパゲータの変位に関して導出展開を行い,最後に線形応答関数への異なる寄与をもたらす時間積分の解析式を提供する。 このアプローチは、基底状態の漂白、刺激的放出、励起状態の吸収、二重量子コヒーレンスといった異なる物理過程を記述する3次応答関数の導出に適用される。 ダイソン展開の6階までの結果と応答関数の独立数値計算の比較は、いくつかの代表的なケースにおいて直列収束の証拠となる。

The interplay of nuclear and electronic dynamics characterizes the multi-dimensional electronic spectra of various molecular and solid-state systems. Theoretically, the observable effect of such interplay can be accounted for by response functions. Here, we report analytical expressions for the response functions corresponding to a class of model systems. These are characterized by the coupling between the diabatic electronic states and the vibrational degrees of freedom resulting in linear displacements of the corresponding harmonic oscillators, and by nonadiabatic couplings between pairs of diabatic states. In order to derive the linear response functions, we first perform the Dyson expansion of the relevant propagators with respect to the nonadiabatic component of the Hamiltonian, then derive and expand with respect to the displacements the propagators at given interaction times, and finally provide analytical expressions for the time integrals that lead to the different contributions to the linear response function. The approach is then applied to the derivation of third-order response functions describing different physical processes: ground state bleaching, stimulated emission, excited state absorption and double quantum coherence. Comparisons between the results obtained up to sixth order in the Dyson expansion and independent numerical calculation of the response functions provide an evidence of the series convergence in a few representative cases.
翻訳日:2023-01-24 00:45:13 公開日:2023-01-07
# 光電気機械量子トランスダクションのための希土類アルミノシリケートガラスマイクロワイヤの高調波ブリルアン相互作用

Harnessing Brillouin Interaction in Rare-earth Aluminosilicate Glass Microwires for Optoelectromechanic Quantum Transduction ( http://arxiv.org/abs/2210.01581v2 )

ライセンス: Link先を確認
Mrittunjoy Guha Majumdar and C. M. Chandrashekar(参考訳) 量子トランスダクション(quantum transduction)とは、量子信号をあるエネルギーから別のエネルギーに変換するプロセスであり、異なる物理プラットフォームと関連する量子ビットを量子情報処理に利用するための重要なステップである。 オプトエレクトロメカニクスは、原子アンサンブル、集団磁気スピン励起、圧電率、窒化ケイ素膜を用いた電気光学機械共振器など、光-マイクロ波信号からの伝送を効果的に行う方法の1つである。 窒化ケイ素ナノ膜を用いたオプトエレクトロメカニカル法において,光子変換速度が失われる重要な領域の1つが電気光学変換である。 そこで本研究では, 希土類アルミニウムガラスマイクロワイヤの繊維テーパを通すファイバモードでのブリルアン相互作用の利用を提案する。 これは、ブリュアン相互作用の助けを借りて、195.57ドルTHzの光信号を325.08ドルMHzのマイクロ波信号に変換することができ、ブリュアン散乱モードをささやくと$\sim45$\%の変換効率が得られることを示唆している。

Quantum transduction, the process of converting quantum signals from one form of energy to another is a key step in harnessing different physical platforms and the associated qubits for quantum information processing. Optoelectromechanics has been one of the effective approaches to undertake transduction from optical-to-microwave signals, among others such as those using atomic ensembles, collective magnetostatic spin excitations, piezoelectricity and electro-optomechanical resonator using Silicon nitride membrane. One of the key areas of loss of photon conversion rate in optoelectromechanical method using Silicon nitride nanomembranes has been those in the electro-optic conversion. To address this, we propose the use of Brillouin interactions in a fiber mode that is allowed to be passed through a fiber taper in rare-earth Aluminium glass microwires. It suggests that we can efficiently convert a $195.57$ THz optical signal to a $325.08$ MHz microwave signal with the help of Brillouin interactions, with a whispering stimulated Brillouin scattering mode yielding a conversion efficiency of $\sim45$\%.
翻訳日:2023-01-24 00:28:42 公開日:2023-01-07
# 原子と分子の境界状態計算のためのBethe-Salpeter QED波動方程式

The Bethe-Salpeter QED wave equation for bound-state computations of atoms and molecules ( http://arxiv.org/abs/2211.02389v3 )

ライセンス: Link先を確認
Edit M\'atyus, D\'avid Ferenc, P\'eter Jeszenszki, \'Ad\'am Marg\'ocsy(参考訳) 原子と分子系の相互作用は電磁力によって支配され、理論的枠組みは量子状態にある必要がある。 量子力学と電磁気学の組み合わせに関する物理理論、量子電磁力学は20世紀半ばまでに、主に散乱理論として確立された。 原子や分子を記述するには、境界状態を考えることが重要である。 非相対論的量子力学フレームワークでは、束縛状態は、波動方程式を解くために体系的な近似を持つ堅牢で一般的な手法を用いて効率的に計算することができる。 原子と分子の量子電気力学フレームワークの開発を見据えて、時空座標で表される場理論Bethe-Salpeter波動方程式、その正確な等時変と相対論的波動方程式の出現を概観する。 計算フレームワークは、初期の応用と、精密分光に関する今後の課題も強調されている。

Interactions in atomic and molecular systems are dominated by electromagnetic forces and the theoretical framework must be in the quantum regime. The physical theory for the combination of quantum mechanics and electromagnetism, quantum electrodynamics has been established by the mid-twentieth century, primarily as a scattering theory. To describe atoms and molecules, it is important to consider bound states. In the non-relativistic quantum mechanics framework, bound states can be efficiently computed using robust and general methodologies with systematic approximations developed for solving wave equations. With the sight of the development of a computational quantum electrodynamics framework for atomic and molecular matter, the field theoretic Bethe-Salpeter wave equation expressed in space-time coordinates, its exact equal-time variant and emergence of a relativistic wave equation is reviewed. A computational framework, with initial applications and future challenges in relation with precision spectroscopy, is also highlighted.
翻訳日:2023-01-20 09:06:19 公開日:2023-01-07
# 単一光子を用いた電磁誘導透過スペクトルの量子化パラメータ推定に関するフィッシャー情報解析

Fisher information analysis on quantum-enhanced parameter estimation in electromagnetically-induced-transparency spectrum with single photons ( http://arxiv.org/abs/2211.08762v2 )

ライセンス: Link先を確認
Pin-Ju Tsai and Lun-Ping Yuan and Ying-Cheng Chen(参考訳) 電磁誘導透過(EIT)分光法は量子メトロジーにおける感度センサとして用いられている。 センサの感度は、EITスペクトルの測定精度に大きく依存する。 本稿では,フィッシャー情報(FI)分析に基づく3レベル$\Lambda$-type EIT媒体のスペクトル線形状測定に関する理論的研究を行う。 単一光子フォック状態とコヒーレント状態の2種類のプローブ源を用いて、EIT媒体内のFIを計算し、単一光子プローブの量子優位性と制限を定量化する。 FI構造の解析はまた、スペクトル線形状をEITとAulter-Townes splitting (ATS)という2つの異なる状態に分類するための明確な図を提供する。 この研究は、単一光子EITスペクトルを体系的に分析し、EITに基づく量子センシングの本質的な知識を提供し、$\Lambda$-typeメディアのスペクトル特性の理解を深める。

Electromagnetically-induced-transparency (EIT) spectroscopy has been used as a sensitive sensor in quantum metrology applications. The sensitivity of a sensor strongly depends on the measurement precision of EIT spectrum. In this work, we present a theoretical study of the spectral lineshape measurement on a three-level $\Lambda$-type EIT media based on Fisher information (FI) analysis. Using two kinds of probing source: the single-photon Fock state and the coherent state, we calculate the FI in an EIT medium and quantify the quantum advantage and limitations of the single-photon probe. The analysis of FI structure also provides a clear picture to classify the spectral lineshape into two different regimes, the EIT and Aulter-Townes splitting (ATS). This work provides a systematic analysis of the single-photon EIT spectrum, which provides essential knowledge of quantum sensing based on EIT and deepens our understanding of spectral characteristics of $\Lambda$-type media.
翻訳日:2023-01-19 09:44:31 公開日:2023-01-07
# 情報化データ選択による対人訓練

Adversarial training with informed data selection ( http://arxiv.org/abs/2301.04472v1 )

ライセンス: Link先を確認
Marcele O. K. Mendon\c{c}a, Javier Maroto, Pascal Frossard and Paulo S. R. Diniz(参考訳) 利用可能なデータの増加とコンピューティング能力の進歩により、ディープニューラルネットワーク(DNN)は、医療、気候、金融など、さまざまな分野の課題を解決するために、うまく採用されている。 それでも、最先端のdnnは、オリジナルのイメージの準知覚可能な摂動バージョンに影響を受けやすい。 これらのネットワーク入力の摂動は、誤った決定が直接人間の生活に影響を与える重要な領域に悲惨な影響をもたらす可能性がある。 敵の訓練は、悪質な攻撃からネットワークを守る最も効率的な方法だ。 しかし、敵の訓練されたネットワークは通常、よりクリーンな正確さと高い計算複雑性を持つ。 本研究は,ミニバッチトレーニングに適用可能なデータ選択(DS)戦略を提案する。 クロスエントロピー損失に基づいて、バッチで最も関連性の高いサンプルが選択され、バックプロパゲーションでモデルパラメータを更新する。 シミュレーションの結果,バックプロパゲーションパスの計算複雑性が低下する一方,ロバスト性や標準精度に関して良好な妥協が得られることが示された。

With the increasing amount of available data and advances in computing capabilities, deep neural networks (DNNs) have been successfully employed to solve challenging tasks in various areas, including healthcare, climate, and finance. Nevertheless, state-of-the-art DNNs are susceptible to quasi-imperceptible perturbed versions of the original images -- adversarial examples. These perturbations of the network input can lead to disastrous implications in critical areas where wrong decisions can directly affect human lives. Adversarial training is the most efficient solution to defend the network against these malicious attacks. However, adversarial trained networks generally come with lower clean accuracy and higher computational complexity. This work proposes a data selection (DS) strategy to be applied in the mini-batch training. Based on the cross-entropy loss, the most relevant samples in the batch are selected to update the model parameters in the backpropagation. The simulation results show that a good compromise can be obtained regarding robustness and standard accuracy, whereas the computational complexity of the backpropagation pass is reduced.
翻訳日:2023-01-12 17:20:47 公開日:2023-01-07
# パーソナライズされた発話スタイル(PUS)を用いた効率的なサービス要求応答のための対話戦略

A Personalized Utterance Style (PUS) based Dialogue Strategy for Efficient Service Requirement Elicitation ( http://arxiv.org/abs/2301.04582v1 )

ライセンス: Link先を確認
Demin Yu, Min Liu and Zhongjie Wang(参考訳) インターネット上のサービスの普及に伴い、サービスプロバイダが顧客にサービスを正確に提供するための前提条件は、ユーザの要求を包括的、正確に、効率的に捉えることである。 これを ``Service Requirement Elicitation (SRE)' タスクと呼ぶ。 顧客数を考えると、サービスプロバイダが対面ダイアログで各ユーザと対話する上で、非効率な方法である。 したがって、仮想インテリジェントアシスタントの助けを借りてユーザー要求を導き出すことが主流となっている。 ユーザ要求は一般的に異なるレベルの詳細で構成されており、複数のドメインのサービスによって満たされる必要があるため、完全な要求を導き出すためのSREには大きな潜在的な要件スペースがあります。 静的スロットを持つ従来の対話システムはsreタスクに直接適用できないことから,このような巨大な要件空間において,ユーザの完全かつ正確な要求を表現するための効率的な対話戦略を設計することが課題となる。 ユーザが要求を主観的に逐次的に表現する傾向にある現象に基づいて,個人化された要求表現習慣を知覚するパーソナライズド発話スタイル(pus)モジュールを提案し,対話戦略にpusを適用し,sreタスクを効率的に完了させる。 具体的には、対話状態の動的更新に適した応答動作を選択する。 対話履歴から抽出した PUS の助けにより,システムは潜在的な要求空間の探索範囲を縮小することができる。 実験の結果, PUSとの対話戦略は, 対話ラウンドが少なく, より正確なユーザ要求を導出できることがわかった。

With the flourish of services on the Internet, a prerequisite for service providers to precisely deliver services to their customers is to capture user requirements comprehensively, accurately, and efficiently. This is called the ``Service Requirement Elicitation (SRE)'' task. Considering the amount of customers is huge, it is an inefficient way for service providers to interact with each user by face-to-face dialog. Therefore, to elicit user requirements with the assistance of virtual intelligent assistants has become a mainstream way. Since user requirements generally consist of different levels of details and need to be satisfied by services from multiple domains, there is a huge potential requirement space for SRE to explore to elicit complete requirements. Considering that traditional dialogue system with static slots cannot be directly applied to the SRE task, it is a challenge to design an efficient dialogue strategy to guide users to express their complete and accurate requirements in such a huge potential requirement space. Based on the phenomenon that users tend to express requirements subjectively in a sequential manner, we propose a Personalized Utterance Style (PUS) module to perceive the personalized requirement expression habits, and then apply PUS to an dialogue strategy to efficiently complete the SRE task. Specifically, the dialogue strategy chooses suitable response actions for dynamically updating the dialogue state. With the assistance of PUS extracted from dialogue history, the system can shrink the search scope of potential requirement space. Experiment results show that the dialogue strategy with PUS can elicit more accurate user requirements with fewer dialogue rounds.
翻訳日:2023-01-12 14:01:47 公開日:2023-01-07
# ironforge: オープンで、安全で、公平で、分散した連合学習

IronForge: An Open, Secure, Fair, Decentralized Federated Learning ( http://arxiv.org/abs/2301.04006v1 )

ライセンス: Link先を確認
Guangsheng Yu, Xu Wang, Caijun Sun, Qin Wang, Ping Yu, Wei Ni, Ren Ping Liu, Xiwei Xu(参考訳) フェデレートラーニング(FL)は、データプライバシを分散的に保護する効果的な機械学習(ML)アーキテクチャを提供する。 しかし、必然的なネットワークの非同期性、中央コーディネータへの過度な依存、オープンで公平なインセンティブ機構の欠如は、そのさらなる発展を妨げる。 本稿では,DAG(Directed Acyclic Graph)に基づくデータ構造を特徴とする新しいFLフレームワークである‘textsc{IronForge}を提案する。 \textsc{IronForge} は公開かつオープンなネットワークで動作し、DAGにおける状態整合性を有効にすることにより、トレーニングリソースが均一に分散されたネットワークに適合するように、公正なインセンティブメカニズムをローンチする。 さらに、インセンティブフェアネスとデータプライバシに対するFL攻撃に対する専用の防衛戦略が提示され、 \textsc{IronForge} のセキュリティが保証される。 新たに開発されたテストベッド FLSim に基づく実験結果は、パフォーマンス、公正性、セキュリティの様々な仕様の下で、既存のFLフレームワークに対する \textsc{IronForge} の優位性を強調している。 私たちの知識を最大限に活用するために,‘textsc{IronForge} は,現実的なネットワークとトレーニング設定を備えたオープンネットワークに適用可能な,最初のセキュアで完全に分散化された FL フレームワークである。

Federated learning (FL) provides an effective machine learning (ML) architecture to protect data privacy in a distributed manner. However, the inevitable network asynchrony, the over-dependence on a central coordinator, and the lack of an open and fair incentive mechanism collectively hinder its further development. We propose \textsc{IronForge}, a new generation of FL framework, that features a Directed Acyclic Graph (DAG)-based data structure and eliminates the need for central coordinators to achieve fully decentralized operations. \textsc{IronForge} runs in a public and open network, and launches a fair incentive mechanism by enabling state consistency in the DAG, so that the system fits in networks where training resources are unevenly distributed. In addition, dedicated defense strategies against prevalent FL attacks on incentive fairness and data privacy are presented to ensure the security of \textsc{IronForge}. Experimental results based on a newly developed testbed FLSim highlight the superiority of \textsc{IronForge} to the existing prevalent FL frameworks under various specifications in performance, fairness, and security. To the best of our knowledge, \textsc{IronForge} is the first secure and fully decentralized FL framework that can be applied in open networks with realistic network and training settings.
翻訳日:2023-01-11 17:29:08 公開日:2023-01-07
# 量子ハードウェア上での量子エネルギーテレポーテーションの最初の実現

First Realization of Quantum Energy Teleportation on Quantum Hardware ( http://arxiv.org/abs/2301.02666v1 )

ライセンス: Link先を確認
Kazuki Ikeda(参考訳) 物理量を遠隔地へテレポートすることは、量子情報科学と技術にとって依然として重要な課題である。 量子テレポーテーションは量子情報の転送を可能にしたが、量子物理量のテレポーテーションはまだ実現されていない。 本稿では,実量子ハードウェア上での量子エネルギーテレポーテーションを初めて実現・観測する。 我々は、IBMの超伝導量子コンピュータを用いてこれを実現する。 結果は理論の厳密な解と一致し、測定誤差の軽減によって改善される。 量子エネルギーテレポーテーションは局所的な操作と古典的な通信のみを必要とする。 したがって、現在の量子コンピューティングと通信技術で完全に実現可能な現実的なベンチマークを提供する。

Teleporting physical quantities to remote locations is a remaining key challenge for quantum information science and technology. Quantum teleportation has enabled the transfer of quantum information, but teleportation of quantum physical quantities has not yet been realized. Here we report the first realization and observation of quantum energy teleportation on real quantum hardware. We achieve this by using several IBM's superconducting quantum computers. The results are consistent with the exact solution of the theory and are improved by the mitigation of measurement error. Quantum energy teleportation requires only local operations and classical communication. Therefore our results provide a realistic benchmark that is fully achievable with current quantum computing and communication technologies.
翻訳日:2023-01-10 19:09:23 公開日:2023-01-07
# デュアルユニタリ回路における離散ホログラフィ

Discrete holography in dual-unitary circuits ( http://arxiv.org/abs/2301.02825v1 )

ライセンス: Link先を確認
Lluis Masanes(参考訳) 共形場理論の離散アナログを構成する1+1次元の双対単位回路の族を導入する。 これらの回路は量子セルオートマトンであり、ローレンツとスケール変換の合同作用の下で不変である。 双対ユニタリー(英: Dual unitary)は、時空のユニタリティ条件を満たす4本脚テンソルであり、そのモデルが数学的に引くことができる性質である空間方向である。 双対ユニタリを用いることで、1+1 モデルのテンソルネットワーク状態を構築し、曲線 2+1 離散幾何学の空間スライスとして解釈し、その距離は龍高柳の処方に従う状態の絡み合い構造によって定義される。 回路のダイナミクスは、これらの幾何学上の自然なダイナミクスを誘導し、平坦および反ド・ジッター空間、および物質の有無について研究する。 2つ以上の粒子を持つ空間の力学は0または1の粒子と異なり、ブラックホールの存在が示唆される。 しかし、これはモデル群が非カオスであるように見えるという事実とは対照的である。

We introduce a family of dual-unitary circuits in 1+1 dimensions which constitute a discrete analog of conformal field theories. These circuits are quantum cellular automata which are invariant under the joint action of Lorentz and scale transformations. Dual unitaries are four-legged tensors which satisfy the unitarity condition across the time as well as the space direction, a property that makes the model mathematically tractable. Using dual unitaries too, we construct tensor-network states for our 1+1 model, which are interpreted as spatial slices of curved 2+1 discrete geometries, where the metric distance is defined by the entanglement structure of the state, following Ryu-Takayanagi's prescription. The dynamics of the circuit induces a natural dynamics on these geometries, which we study for flat and anti-de Sitter spaces, and in the presence or absence of matter. We observe that the dynamics of spaces with two or more particles differs from that of zero or one, suggesting the presence of black holes. But this contrasts with the fact that the family of models appears to be non-chaotic.
翻訳日:2023-01-10 19:07:06 公開日:2023-01-07
# 奇等高調波発生の普遍性とテラヘルツ波形サンプリングへの応用

Universality in odd-even harmonic generation and application in terahertz waveform sampling ( http://arxiv.org/abs/2301.02910v1 )

ライセンス: Link先を確認
Doan-An Trieu, Ngoc-Loan Phan, Quan-Hao Truong, Hien T. Nguyen, Cam-Tu Le, DinhDuy Vu and Van-Hoang Le(参考訳) レーザーターゲットシステムから放出される奇数な高調波は、システムの動的非対称性を特徴づける微妙な情報であり、解読することが望ましい。 このレターでは、THzレーザーと組み合わされた基本中赤外レーザーパルス中の原子である THz 支援レーザー原子系の奇異調和と非対称性の単純な普遍的関係を見出す。 まず, 系の非対称性の源である THz 電界の関数として高調波等対極比を数値的に, 解析的に擬似化する。 特に、基本パルスと原子標的の両方のパラメータから独立して得られた規則を普遍化するスケーリングを提案する。 この普遍性により、従来のコンパクトな構成で測定可能な偶数対負比からTHz波形をサンプリングするための一般的なポンププローブスキームが提案できる。

Odd-even harmonics emitted from a laser-target system imprint rich, subtle information characterizing the system's dynamical asymmetry, which is desirable to decipher. In this Letter, we discover a simple universal relation between the odd-even harmonics and the asymmetry of the THz-assisted laser-atomic system -- atoms in a fundamental mid-IR laser pulse combined with a THz laser. First, we demonstrate numerically and then analytically formulize the harmonic even-to-odd ratio as a function of the THz electric field, the source of the system's asymmetry. Notably, we suggest a scaling that makes the obtained rule universal, independent of the parameters of both the fundamental pulse and atomic target. This universality facilitates us to propose a general pump-probe scheme for THz waveform sampling from the even-to-odd ratio, measurable within a conventional compact setup.
翻訳日:2023-01-10 19:06:47 公開日:2023-01-07
# 非分離ハミルトン型平均場ゲームのためのディープラーニング

Deep Learning for Mean Field Games with non-separable Hamiltonians ( http://arxiv.org/abs/2301.02877v1 )

ライセンス: Link先を確認
Mouhcine Assouli and Badr Missaoui(参考訳) 本稿では,高次元確率平均場ゲーム (MFG) の解法として,Deep Galerkin Methods (DGM) に基づく新しい手法を提案する。 本研究では,2つのニューラルネットワークを用いて,mfgシステムの未知解と前方逆向き条件を近似する。 提案手法は,少数のイテレーションであっても効率が良く,最大300次元を単一層で処理できるため,他の手法よりも高速である。 対照的に、GAN(Generative Adversarial Networks)に基づく手法は、非分離ハミルトニアンのMFGを解くことはできない。 提案手法は,ニュートン反復法を用いて決定論的にのみ解いたトラヒックフロー問題に適用することにより,本手法の有効性を実証する。 本手法の結果を分析解と従来の手法と比較し,その効率を示す。 また,普遍近似定理を用いて,単一の隠れ層によるニューラルネットワーク近似の収束を証明した。

This paper introduces a new method based on Deep Galerkin Methods (DGMs) for solving high-dimensional stochastic Mean Field Games (MFGs). We achieve this by using two neural networks to approximate the unknown solutions of the MFG system and forward-backward conditions. Our method is efficient, even with a small number of iterations, and is capable of handling up to 300 dimensions with a single layer, which makes it faster than other approaches. In contrast, methods based on Generative Adversarial Networks (GANs) cannot solve MFGs with non-separable Hamiltonians. We demonstrate the effectiveness of our approach by applying it to a traffic flow problem, which was previously solved using the Newton iteration method only in the deterministic case. We compare the results of our method to analytical solutions and previous approaches, showing its efficiency. We also prove the convergence of our neural network approximation with a single hidden layer using the universal approximation theorem.
翻訳日:2023-01-10 18:58:37 公開日:2023-01-07
# 知覚-神経-物理音のマッチング

Perceptual-Neural-Physical Sound Matching ( http://arxiv.org/abs/2301.02886v1 )

ライセンス: Link先を確認
Han Han, Vincent Lostanlen, Mathieu Lagrange(参考訳) 音響マッチングアルゴリズムは、パラメトリック音声合成による目標波形の近似を求める。 ディープニューラルネットワークは、持続的調和音にマッチする有望な結果を達成している。 しかし、ターゲットが非定常かつ非調和である場合、例えばパーカッションの場合、このタスクはより困難である。 この問題は損失関数の不適切さに起因する。 一方、「P-loss」と呼ばれるパラメトリック領域の平均二乗誤差は単純かつ高速であるが、各パラメータの異なる知覚的重要性に対応できない。 一方、スペクトル損失(spectral loss)として知られるスペクトル時間領域の平均二乗誤差は知覚的に動機付けられ、微分可能なデジタル信号処理(ddsp)の役割を果たす。 しかし、スペクトル損失はp損失よりも局所的極小度を持ち、その勾配は計算コストが高いため、収束が遅い。 本症例では,知覚神経機能障害(Perceptual-Neural-Physical Los,PNP)を呈する。 PNPは、トレーニング中のスペクトル損失の最適2次近似であり、P損失と同じ速度である。 我々は,pnpをデコーダとして物理モデリング合成し,スペクトル表現としてjtfs(joint time-frequency scattering transform)をインスタンス化する。 本研究は、他の損失関数と比較して合成ドラム音の整合性を示す。

Sound matching algorithms seek to approximate a target waveform by parametric audio synthesis. Deep neural networks have achieved promising results in matching sustained harmonic tones. However, the task is more challenging when targets are nonstationary and inharmonic, e.g., percussion. We attribute this problem to the inadequacy of loss function. On one hand, mean square error in the parametric domain, known as "P-loss", is simple and fast but fails to accommodate the differing perceptual significance of each parameter. On the other hand, mean square error in the spectrotemporal domain, known as "spectral loss", is perceptually motivated and serves in differentiable digital signal processing (DDSP). Yet, spectral loss has more local minima than P-loss and its gradient may be computationally expensive; hence a slow convergence. Against this conundrum, we present Perceptual-Neural-Physical loss (PNP). PNP is the optimal quadratic approximation of spectral loss while being as fast as P-loss during training. We instantiate PNP with physical modeling synthesis as decoder and joint time-frequency scattering transform (JTFS) as spectral representation. We demonstrate its potential on matching synthetic drum sounds in comparison with other loss functions.
翻訳日:2023-01-10 18:58:22 公開日:2023-01-07
# 乗法マヨラナゼロモード

Multiplicative Majorana zero-modes ( http://arxiv.org/abs/2301.02765v1 )

ライセンス: Link先を確認
Adipta Pal, Joe H. Winter, Ashley M. Cook(参考訳) マヨラナのゼロモードを持つ位相的量子ビットは、実用的な量子計算スキームを実現するために、実験的かつ理論的に精査されている。 本研究では, 位相的量子ビットに対して必要となる最小4つのマヨナ零モードをブレイディングスキームに従って示し, ゲート演算の絡み合いの制御は, 対称保護テンソル積, および最大絡み合うベル状態を実現する乗法的トポロジカル位相に固有のものである。 乗法トポロジーに依存する手法を用いて, 1 および 2 次元の乗法位相相の位相的に保護された境界状態として,乗法マヨルダナゼロモードを導入する。 さらに,バルクのトポロジーと確立した手法の境界を特徴付けると同時に,乗法トポロジーを特徴付ける課題を克服する手法を導入する。 本研究では,これらの乗法位相相のポテンシャルを,位相相転移を通じてゲート演算を行うブレイディングに基づく位相量子計算スキームの代替として検討する。

Topological qubits composed of unpaired Majorana zero-modes are under intense experimental and theoretical scrutiny in efforts to realize practical quantum computation schemes. In this work, we show the minimum four \textit{unpaired} Majorana zero-modes required for a topological qubit according to braiding schemes and control of entanglement for gate operations are inherent to multiplicative topological phases, which realize symmetry-protected tensor products -- and maximally-entangled Bell states -- of unpaired Majorana zero-modes known as multiplicative Majorana zero-modes. We introduce multiplicative Majorana zero-modes as topologically-protected boundary states of both one and two-dimensional multiplicative topological phases, using methods reliant on multiplicative topology to construct relevant Hamiltonians from the Kitaev chain model. We furthermore characterize topology in the bulk and on the boundary with established methods while also introducing techniques to overcome challenges in characterizing multiplicative topology. In the process, we explore the potential of these multiplicative topological phases for an alternative to braiding-based topological quantum computation schemes, in which gate operations are performed through topological phase transitions.
翻訳日:2023-01-10 18:56:11 公開日:2023-01-07
# $SU(\infty)$-QGR:無限可分量子宇宙における重力の発生

$SU(\infty)$-QGR: Emergence of Gravity in an Infinitely Divisible Quantum Universe ( http://arxiv.org/abs/2301.02813v1 )

ライセンス: Link先を確認
Houri Ziaeepour(参考訳) $SU(\infty)$-QGR (SQGR) は重力に対する基本的な量子的アプローチである。 これは、宇宙全体のヒルベルト空間とその部分系が対称性群 $SU(\infty)$ を表すと仮定する。 宇宙は任意の有限ランク対称性群に基づいて無限個のサブシステムに分けられ、これは量子的ゆらぎと状態のクラスタリングによって生じる。 2つの任意の部分系をクロックと参照オブザーバとして選択した後、サブシステムは相対力学を取得し、重力はサブシステムのヒルベルト空間の3+1次元パラメータ空間上で定義される$SU(\infty)$ Yang-Mills量子場理論として現れる。 古典的な極限において、この観測者は時空と見なされる。 その結果、SQGRは時空の次元とシグネチャの両方を説明する。 ヤン・ミルズモデルSQGRは再正規化可能であり、量子レベルでの重力のスピン-1場を予測しているにもかかわらず、低エネルギーでは古典アインシュタインモデルと見なされる。 本研究の目的は、SQGRの基礎をより数学的に厳密にし、初期の研究で報告されたモデルの構築におけるギャップを埋めることである。 特に、大域的な$SU(\infty)$対称性は、宇宙の他の部分系と全ての部分系の絡み合いを通して現れることを示す。 さらに、パラメータ空間の幾何の無関係性を示し、これは無関係定数まで$SU(\infty)$ゲージ変換によって測ることができる。 したがって、SQGRはゲージ重力双対性モデルから逸脱し、知覚される古典時空は量子化されておらず、非可換ではないと考えられる。 一方,量子不確実性関係を用いて,古典時空とその知覚幾何がそのパラメータ空間におけるサブシステムの量子状態の平均経路を示すことを証明した。 また、暗黒エネルギーのSQGR比モデルについても概説する。

$SU(\infty)$-QGR (SQGR) s a foundationally quantum approach to gravity. It assumes that Hilbert spaces of the Universe as a whole and its subsystems represent the symmetry group $SU(\infty)$. The Universe is divided to infinite number of subsystems based on an arbitrary finite rank symmetry group, which arises due to quantum fluctuations and clustering of states. After selection of two arbitrary subsystems as clock and reference observer, subsystems acquire a relative dynamics, and gravity emerges as a $SU(\infty)$ Yang-Mills quantum field theory, defined on the (3+1)-dimensional parameter space of Hilbert spaces of the subsystems. At classical limit, this observer is perceived as the spacetime. Consequently, SQGR explains both the dimension of and signature of spacetime. As a Yang-Mills model SQGR is renormalizable and despite prediction of a spin-1 field for gravity at quantum level, at low energies it is perceived as classical Einstein model. The aim of the present work is to make the foundation of SQGR more mathematically rigorous and fill the gaps in the construction of the model reported in earlier works. In particular, we show that the global $SU(\infty)$ symmetry manifests itself through the entanglement of every subsystem with the rest of the Universe. Moreover, we demonstrate irrelevance of the geometry of parameter space, which can be gauged out by a $SU(\infty)$ gauge transformation up to an irrelevant constant. Therefore, SQGR deviates from gauge-gravity duality models, because the perceived classical spacetime is neither quantized, nor considered to be noncommutative. On the other hand, using quantum uncertainty relations, we demonstrate that the classical spacetime and its perceived geometry present the average path of the ensemble of quantum states of subsystems in their parameter space. We also briefly discuss SQGR specific models for dark energy.
翻訳日:2023-01-10 18:55:48 公開日:2023-01-07
# Rationaleアライメントを用いた忠実で一貫性のあるグラフニューラルネットワークの解説

Faithful and Consistent Graph Neural Network Explanations with Rationale Alignment ( http://arxiv.org/abs/2301.02791v1 )

ライセンス: Link先を確認
Tianxiang Zhao, Dongsheng Luo, Xiang Zhang and Suhang Wang(参考訳) 近年,グラフニューラルネットワーク(GNN)の予測の背後にある理論的根拠が注目されている。 インスタンスレベルのGNN説明は、ターゲットのGNNが予測に頼っているノードやエッジなどの重要な入力要素を発見することを目的としている。 %であり,これらのサブ構造はGNNの振る舞いを解釈することができる。 様々なアルゴリズムが提案されているが、その多くはオリジナルの予測を保存できる最小部分グラフを探索することでこのタスクを形式化する。 しかし、帰納バイアスはこのフレームワークで深く根付いており、いくつかの部分グラフは元のグラフと同じもしくは類似の出力をもたらす。 その結果、彼らは急激な説明をし、一貫した説明をしない危険がある。 弱いパフォーマンスのGNNを説明するためにそれらを適用することは、これらの問題をさらに増幅する。 本稿では,gnnの予測を因果関係の観点から理論的に検討する。 散発的な説明の典型的な2つの理由は、分布シフトのような潜在変数の効果と、元の入力と異なる因果要因である。 コンバウンディング効果と多様な因果的理性の両方が内部表現にエンコードされていることを観察し、我々は、より忠実な説明目的を本質的に最適化することが理論的に証明されている補助的なアライメント損失を持つ新しい説明枠組みを提案する。 具体的には, このアライメント損失に対して, アンカーベースアライメント, ガウス混合モデルに基づく分布アライメント, 相互情報ベースアライメントなど, 様々な視点を探索する。 この新枠組みの有効性について, 信頼性・一貫性の面から総合的な研究を行い, その利点について考察した。

Uncovering rationales behind predictions of graph neural networks (GNNs) has received increasing attention over recent years. Instance-level GNN explanation aims to discover critical input elements, like nodes or edges, that the target GNN relies upon for making predictions. %These identified sub-structures can provide interpretations of GNN's behavior. Though various algorithms are proposed, most of them formalize this task by searching the minimal subgraph which can preserve original predictions. However, an inductive bias is deep-rooted in this framework: several subgraphs can result in the same or similar outputs as the original graphs. Consequently, they have the danger of providing spurious explanations and failing to provide consistent explanations. Applying them to explain weakly-performed GNNs would further amplify these issues. To address this problem, we theoretically examine the predictions of GNNs from the causality perspective. Two typical reasons for spurious explanations are identified: confounding effect of latent variables like distribution shift, and causal factors distinct from the original input. Observing that both confounding effects and diverse causal rationales are encoded in internal representations, \tianxiang{we propose a new explanation framework with an auxiliary alignment loss, which is theoretically proven to be optimizing a more faithful explanation objective intrinsically. Concretely for this alignment loss, a set of different perspectives are explored: anchor-based alignment, distributional alignment based on Gaussian mixture models, mutual-information-based alignment, etc. A comprehensive study is conducted both on the effectiveness of this new framework in terms of explanation faithfulness/consistency and on the advantages of these variants.
翻訳日:2023-01-10 18:47:23 公開日:2023-01-07
# 機械学習における幾何最適化問題に対する部分線形時間アルゴリズム

Sublinear Time Algorithms for Several Geometric Optimization (With Outliers) Problems In Machine Learning ( http://arxiv.org/abs/2301.02870v1 )

ライセンス: Link先を確認
Hu Ding(参考訳) 本稿では,機械学習における幾何最適化問題について検討する。 まず、ユークリッド空間 $\mathbb{R}^d$ における最小閉球(MEB)問題を再考する。 この問題はこれまで広く研究されてきたが、現実の機械学習タスクは大規模なデータセットを扱う必要があり、線形時間アルゴリズムの余裕さえない。 最悪のケース解析以外の最近の研究に動機づけられ、自然で理解しやすいmebの安定性の概念が紹介される。 おおまかに言えば、MEBのインスタンスは安定であり、入力ポイントのごく一部を取り除くことで、結果のボールの半径が著しく減少できない場合である。 安定条件下では,入力点数に依存しないサンプル複素数を持つ半径近似 meb を2つのサンプリングアルゴリズムで計算する。 特に、第2のアルゴリズムは、次元$d$にさえ依存しないサンプル複雑性を持つ。 また、安定性の仮定のない一般の場合についても検討する。 本稿では,半径近似MEBと被覆近似MEBのどちらかを出力できるハイブリッドアルゴリズムを提案する。 提案アルゴリズムは,従来のサブ線形MEBアルゴリズムの動作時間とパス数を改善する。 本手法は一様適応サンプリング法とサンドイッチ補題という2つの新しい手法に依存している。 さらに,これら2つの手法を一般化して,高次元の異常値を持つより広い幾何学的最適化問題に対して,meb と 1-class と 2-class の線形 svm を外れ値付きで,k$-center を外れ値でクラスタリングし,フラットに外れ値と適合する部分線形時間アルゴリズムを設計することができることを示した。 提案アルゴリズムはカーネルにも有効である。

In this paper, we study several important geometric optimization problems arising in machine learning. First, we revisit the Minimum Enclosing Ball (MEB) problem in Euclidean space $\mathbb{R}^d$. The problem has been extensively studied before, but real-world machine learning tasks often need to handle large-scale datasets so that we cannot even afford linear time algorithms. Motivated by the recent studies on {\em beyond worst-case analysis}, we introduce the notion of stability for MEB, which is natural and easy to understand. Roughly speaking, an instance of MEB is stable, if the radius of the resulting ball cannot be significantly reduced by removing a small fraction of the input points. Under the stability assumption, we present two sampling algorithms for computing radius-approximate MEB with sample complexities independent of the number of input points $n$. In particular, the second algorithm has the sample complexity even independent of the dimensionality $d$. We also consider the general case without the stability assumption. We present a hybrid algorithm that can output either a radius-approximate MEB or a covering-approximate MEB. Our algorithm improves the running time and the number of passes for the previous sublinear MEB algorithms. Our method relies on two novel techniques, the Uniform-Adaptive Sampling method and Sandwich Lemma. Furthermore, we observe that these two techniques can be generalized to design sublinear time algorithms for a broader range of geometric optimization problems with outliers in high dimensions, including MEB with outliers, one-class and two-class linear SVMs with outliers, $k$-center clustering with outliers, and flat fitting with outliers. Our proposed algorithms also work fine for kernels.
翻訳日:2023-01-10 18:46:55 公開日:2023-01-07
# 数電子原子エネルギーに対する上界と同値な下界

Lower bounds on par with upper bounds for few-electron atomic energies ( http://arxiv.org/abs/2301.02827v1 )

ライセンス: Link先を確認
Miklos Ronto, Peter Jeszenszki, Edit M\'atyus, and Eli Pollak(参考訳) 計算資源の開発により、原子エネルギーと分子エネルギーの上限を高精度で決定できるようになった。 しかし、計算エネルギーに対する誤差境界は推定としてのみ利用可能である。 本稿では,相関ガウス基底集合と連動して,he,li,be原子の基底エネルギーと励起状態エネルギーのサブパート・パーミリオン収束を提供するために,ポラック・マルティナッツォ下界理論を詳述し,実装する。 下界の質はリッツ法で得られた上界のそれと同等である。 これらの結果は、原子エネルギーを厳密に見積もるために下界の力を例示する。

The development of computational resources has made it possible to determine upper bounds for atomic and molecular energies with high precision. Yet, error bounds to the computed energies have been available only as estimates. In this paper, the Pollak-Martinazzo lower-bound theory, in conjunction with correlated Gaussian basis sets, is elaborated and implemented to provide sub-parts-per-million convergence of the ground- and excited-state energies for the He, Li, and Be atoms. The quality of the lower bounds is comparable to that of the upper bounds obtained from the Ritz method. These results exemplify the power of lower bounds to provide tight estimates of atomic energies.
翻訳日:2023-01-10 18:39:52 公開日:2023-01-07
# qpskデータ変調のための変位演算子を用いた位相空間の量子暗号化

Quantum Encryption in Phase Space using Displacement Operator for QPSK Data Modulation ( http://arxiv.org/abs/2301.02894v1 )

ライセンス: Link先を確認
Randy Kuang and Adrian Chan(参考訳) ランダム化位相シフトゲートを持つ量子公開鍵分布(QPKE)は、2020年にKuangとBettenburgによって提案された。 理論上はシミュレーションと既存の光ファイバネットワーク上で実験的に実装されている。 QPKEは光学アナログ領域におけるRSA型スキームと見なすことができる。 QPKEは、位相空間におけるコヒーレントな状態の暗号化を反映して、QEPS(Quantum Encryption in Phase Space)と改名された。 位相シフトゲートを持つQEPSは、二次位相シフトキーやQPSKのような位相シフトキーを用いたデータ変調方式にのみ適用できる。 二次振幅変調やQAMスキームに適用すれば、振幅でデータ情報を漏洩する。 Kuang氏とChan氏は最近、QEPSの新しいバージョンであるQuantum Encryption in Phase Spaceを提案した。 位相シフトゲートによりQEPSの限界を克服することを示した。 我々は,大域的位相係数を無視して縮小変位演算子を導入し,縮小変位演算子は可換である。 この可搬性は、送信と受信の両方で実装を支援する。 任意の変位演算子を位相シフト変調による標準QAM変調に分解して、暗号化と復号化を容易にする。 本稿では,QPSKデータ変調のためのQEPS-d暗号をシミュレートし,QEPS-dの動作を実証する。

Quantum Public Key Distribution or QPKE with the randomized phase shift gate was proposed by Kuang and Bettenburg in 2020. It has been implemented theoretically with simulations and experimentally over existing fiber optical networks since then. QPKE can be considered as an RSA-type scheme in optical analogue domain. QPKE was renamed as Quantum Encryption in Phase Space or QEPS to reflect the encryption of coherent states in phase space. QEPS with the phase shift gate can only be applied to data modulation scheme with phase shift keying such as quadrature phase shift keying or QPSK. It would leak data information in amplitude once it is applied to quadrature amplitude modulation or QAM schemes. Kuang and Chan recently proposed a new version of QEPS called Quantum Encryption in Phase Space with the displacement gate or QEPS-d. It demonstrated to overcome the limitation of QEPS with the phase shift gate. We introduced a reduced displacement operator by ignoring the global phase factor then the reduced displacement operators are commutable. This commutability helps our implementation at both transmission and receiving. An arbitrary displacement operator can be decoupled into a standard QAM modulation with a phase shift modulation to ease our encryption and decryption. This paper simulates the QEPS-d encryption for QPSK data modulation to demonstrate how QEPS-d works.
翻訳日:2023-01-10 18:39:39 公開日:2023-01-07
# フェルミオンガウス状態を持つ長距離横場イジングモデルの研究

Study of the long-range transverse field Ising model with fermionic Gaussian states ( http://arxiv.org/abs/2301.02939v1 )

ライセンス: Link先を確認
Michael P. Kaicher, Davide Vodola, Simon B. J\"ager(参考訳) 一般化ハートリーフォック(GHF)理論を用いて, 反強磁性(AFM)系における一次元横磁場等化モデル(TFIM)をゼロ温度で数値解析する。 スピンスピン相互作用は格子内のすべてのスピンに拡張され、1/r^\alpha$として崩壊し、$r$は2つのスピン間の距離を表し、$\alpha$はチューナブル指数である。 スピン作用素をマヨラナ作用素に写像し、ハミルトニアン基底状態とフェルミオンガウス状態(FGS)を近似する。 この近似を用いて、基底状態エネルギーと絡み合いエントロピーを計算し、異なる値である$\alpha$ に対して位相図を写像できる。 さらに, エンタングルメントエントロピーとシステムサイズとのスケーリング挙動を計算し, $\alpha>1$の場合の臨界点における中心電荷を決定する。 $\alpha<1$ の場合、遠絡エントロピーの対数的発散は臨界点から遠く離れており、これは長距離相互作用を持つ系の特徴である。 本研究では,密度行列再正規化群 (dmrg) とlinked cluster expansion (lce) 法の結果との比較を行った。 特に、DMRG と LCE とのGHF の弱い長距離政権 $\alpha\geq 1$ と、強い長距離政権 $\alpha \leq 1$ における DMRG との質的合意は優れたものである。 本結果は,相互作用量子系のシミュレーションにおける計算効率のよいGHF法のパワーを強調した。

We numerically study the one-dimensional long-range Transverse Field Ising Model (TFIM) in the antiferromagnetic (AFM) regime at zero temperature using Generalized Hartree-Fock (GHF) theory. The spin-spin interaction extends to all spins in the lattice and decays as $1/r^\alpha$, where $r$ denotes the distance between two spins and $\alpha$ is a tunable exponent. We map the spin operators to Majorana operators and approximate the ground state of the Hamiltonian with a Fermionic Gaussian State (FGS). Using this approximation, we calculate the ground state energy and the entanglement entropy which allows us to map the phase diagram for different values of $\alpha$. In addition, we compute the scaling behavior of the entanglement entropy with the system size to determine the central charge at criticality for the case of $\alpha>1$. For $\alpha<1$ we find a logarithmic divergence of the entanglement entropy even far away from the critical point, a feature of systems with long-range interactions. We provide a detailed comparison of our results to outcomes of Density Matrix Renormalization Group (DMRG) and the Linked Cluster Expansion (LCE) methods. In particular, we find excellent agreement of GHF with DMRG and LCE in the weak long-range regime $\alpha\geq 1$, and qualitative agreement with DMRG in the strong-long range regime $\alpha \leq 1$. Our results highlight the power of the computationally efficient GHF method in simulating interacting quantum systems.
翻訳日:2023-01-10 18:39:19 公開日:2023-01-07
# 分散量子アルゴリズムとしての量子正直ビザンチン合意

Quantum Honest Byzantine Agreement as a Distributed Quantum Algorithm ( http://arxiv.org/abs/2301.02944v1 )

ライセンス: Link先を確認
Marcus Edwards(参考訳) ブロックチェーン技術には、ネットワーク、コンセンサスアルゴリズム、分散データ構造という3つの主要コンポーネントがある。 これらのそれぞれが、スケーラビリティと効率の特に問題をもたらします。 ブロックチェーンのネットワークとコンセンサスアルゴリズムコンポーネントを量子アルゴリズムに再キャストすることにより、強力な量子コンピュータを利用可能にすることなく、ブロックチェーン技術の効率とスケーラビリティを短期的に改善できることを示す。

Blockchain technology has three main components: the network, consensus algorithm and distributed data structure. Each of these brings with it particular issues of scalability and efficiency. By recasting the network and consensus algorithm components of blockchain to a quantum algorithm, we show that the efficiency and scalability of blockchain technology can be improved in the near-term without requiring powerful quantum computers to be available.
翻訳日:2023-01-10 18:38:50 公開日:2023-01-07
# 量子ニューマン・ムーア模型における相転移の境界条件依存性

Boundary conditions dependence of the phase transition in the quantum Newman-Moore model ( http://arxiv.org/abs/2301.02826v1 )

ライセンス: Link先を確認
Konstantinos Sfairopoulos, Luke Causer, Jamie F. Mair, Juan P. Garrahan(参考訳) 本研究では,2次元の周期的境界を持つ格子上に横磁場が存在する場合の三角形プラケットモデル(TPM,Newman-Mooreモデルとも呼ばれる)について検討する。 本稿では, この量子TPM(QTPM, 量子ニューマン・ムーアモデル)の基底状態相転移へのアプローチを, システムサイズと境界条件のタイプとして検討する。 セルセルオートマトン法を用いて,任意のトーラスサイズに対してTPMの最小エネルギー構成をフルに評価する。 QTPMでは、これらのサイクルパターンを用いてモデルの対称性を求め、量子相転移を決定する。 数値がアクセス可能なサイズについては、この分類が正確な対角化、行列積状態、量子モンテカルロシミュレーションと一致することも分かる。

We study the triangular plaquette model (TPM, also known as the Newman-Moore model) in the presence of a transverse magnetic field on a lattice with periodic boundaries in both spatial dimensions. We consider specifically the approach to the ground state phase transition of this quantum TPM (QTPM, or quantum Newman-Moore model) as a function of the system size and type of boundary conditions. Using cellular automata methods, we obtain a full characterization of the minimum energy configurations of the TPM for arbitrary tori sizes. For the QTPM, we use these cycle patterns to obtain the symmetries of the model, which we argue determine its quantum phase transition: we find it to be a first-order phase transition, with the addition of spontaneous symmetry breaking for system sizes which have degenerate classical ground states. For sizes accessible to numerics, we also find that this classification is consistent with exact diagonalization, Matrix Product States and Quantum Monte Carlo simulations.
翻訳日:2023-01-10 18:28:56 公開日:2023-01-07
# 異常値を持つk中心クラスタリングのためのランダム化グリーディアルゴリズムと合成可能コアセット

Randomized Greedy Algorithms and Composable Coreset for k-Center Clustering with Outliers ( http://arxiv.org/abs/2301.02814v1 )

ライセンス: Link先を確認
Hu Ding, Ruomin Huang, Kai Liu, Haikuo Yu, Zixiu Wang(参考訳) 本稿では,異常値を持つk$-centerクラスタリングの問題について検討する。 この問題は現実世界で多くの重要な応用があるが、外れ値の存在は計算の複雑さを大幅に増加させる可能性がある。 過去数十年の間に多くの手法が開発されてきたが、この問題の複雑さが低い品質保証アルゴリズムを設計することは依然として困難である。 我々のアイデアは、通常の$k$-centerクラスタリング問題を解決するために開発されたgreedy法であるGonzalezのアルゴリズムにインスパイアされている。 いくつかの新しい観察結果から,この欲望戦略の単純なランダム化バージョンが,実際には異常値の処理を効率的に行うことができることを示した。 さらに、このランダム化された欲求的アプローチは、(倍の次元が与えられなくても)メトリクスを2倍にする問題に対して小さなコアセットをもたらすことも示し、計算複雑性を大幅に減少させる。 さらに、arXiv:1703.01539で提案されている部分クラスタリングフレームワークとともに、コアセット手法が通信複雑性の低い分散データに適用可能であることを示す。 実験結果から,提案アルゴリズムは近似最適解を導出し,既存手法と比較して低複雑性が得られることが示唆された。

In this paper, we study the problem of {\em $k$-center clustering with outliers}. The problem has many important applications in real world, but the presence of outliers can significantly increase the computational complexity. Though a number of methods have been developed in the past decades, it is still quite challenging to design quality guaranteed algorithm with low complexity for this problem. Our idea is inspired by the greedy method, Gonzalez's algorithm, that was developed for solving the ordinary $k$-center clustering problem. Based on some novel observations, we show that a simple randomized version of this greedy strategy actually can handle outliers efficiently. We further show that this randomized greedy approach also yields small coreset for the problem in doubling metrics (even if the doubling dimension is not given), which can greatly reduce the computational complexity. Moreover, together with the partial clustering framework proposed in arXiv:1703.01539 , we prove that our coreset method can be applied to distributed data with a low communication complexity. The experimental results suggest that our algorithms can achieve near optimal solutions and yield lower complexities comparing with the existing methods.
翻訳日:2023-01-10 18:20:51 公開日:2023-01-07
# REaaS:ロバストエンコーダ・アズ・ア・サービスによる逆ロバストな下流の分類器の実現

REaaS: Enabling Adversarially Robust Downstream Classifiers via Robust Encoder as a Service ( http://arxiv.org/abs/2301.02905v1 )

ライセンス: Link先を確認
Wenjie Qu and Jinyuan Jia and Neil Zhenqiang Gong(参考訳) Encoder as a Serviceは、新しいクラウドサービスだ。 具体的には、サービスプロバイダはまず、教師付き学習または自己教師付き学習のいずれかを通じてエンコーダ(すなわち汎用機能抽出器)を事前トレーニングし、次にクラウドサービスapiとしてデプロイする。 クライアントはクラウドサービスAPIに問い合わせて、その分類器(下流分類器と呼ばれる)をトレーニング/テストする際に、その入力をトレーニング/テストするための特徴ベクトルを取得する。 ダウンストリーム分類器は、ダウンストリーム分類器が誤分類した摂動を慎重に作って入力をテストする逆例に弱い。 したがって、安全およびセキュリティクリティカルなアプリケーションにおいて、クライアントは、堅牢な下流分類器を構築し、その堅牢性を保証することを目的としている。 クライアントが認証方法を使って、APIに対するクエリ数を最小化しながら、ダウンストリームの分類器の堅牢性を証明できるように、クラウドサービスが提供すべきAPIは何ですか? サービスプロバイダがエンコーダを事前にトレーニングすれば、クライアントはより堅牢な下流分類器を構築できるのだろうか? 私たちはこの作品の2つの質問に答えるつもりです。 最初の質問では、クライアントがAPIに対するクエリ数が最小限であるダウンストリーム分類器の堅牢性を証明できるようにするために、クラウドサービスが2つのAPIのみを提供する必要があることを示しています。 第2の質問は、スペクトルノルム正規化項を用いて事前学習されたエンコーダによって、クライアントはより堅牢な下流分類器を構築できることを示す。

Encoder as a service is an emerging cloud service. Specifically, a service provider first pre-trains an encoder (i.e., a general-purpose feature extractor) via either supervised learning or self-supervised learning and then deploys it as a cloud service API. A client queries the cloud service API to obtain feature vectors for its training/testing inputs when training/testing its classifier (called downstream classifier). A downstream classifier is vulnerable to adversarial examples, which are testing inputs with carefully crafted perturbation that the downstream classifier misclassifies. Therefore, in safety and security critical applications, a client aims to build a robust downstream classifier and certify its robustness guarantees against adversarial examples. What APIs should the cloud service provide, such that a client can use any certification method to certify the robustness of its downstream classifier against adversarial examples while minimizing the number of queries to the APIs? How can a service provider pre-train an encoder such that clients can build more certifiably robust downstream classifiers? We aim to answer the two questions in this work. For the first question, we show that the cloud service only needs to provide two APIs, which we carefully design, to enable a client to certify the robustness of its downstream classifier with a minimal number of queries to the APIs. For the second question, we show that an encoder pre-trained using a spectral-norm regularization term enables clients to build more robust downstream classifiers.
翻訳日:2023-01-10 18:20:30 公開日:2023-01-07
# アンサンブルによる表現型化は心臓形態関連遺伝子の発見可能性を高める

Unsupervised ensemble-based phenotyping helps enhance the discoverability of genes related to heart morphology ( http://arxiv.org/abs/2301.02916v1 )

ライセンス: Link先を確認
Rodrigo Bonazzola, Enzo Ferrante, Nishant Ravikumar, Yan Xia, Bernard Keavney, Sven Plein, Tanveer Syeda-Mahmood, and Alejandro F Frangi(参考訳) 最近のゲノムワイド・アソシエーション(GWAS)研究は、心臓磁気共鳴(CMR)画像から得られた遺伝子変異と単純な心臓パラメータの関連を同定することに成功した。 しかし、cmrに関連付けられた遺伝データを含む大規模データベースの出現は、より微妙な形状変化パターンの研究を促進させる。 本稿では,unsupervised Phenotype Ensembles (UPE)という遺伝子発見のための新しいフレームワークを提案する。 UPEは、異なるハイパーパラメータでトレーニングされたディープラーニングモデルを使用して、教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。 これらの表現型は、(GWAS)を介して分析され、アンサンブル全体で高い自信と安定した関連のみを保持する。 本手法を英国バイオバンクデータベースに適用し,画像由来の3次元メッシュから左室(LV)幾何学的特徴を抽出する。 提案手法はLV形状に影響を及ぼす遺伝子の発見可能性を大幅に改善し,研究規模で11座,示唆的意義で8座を同定した。 我々は、このアプローチにより、他の臓器や画像モダリティに対する画像由来表現型との遺伝子関連をより広範囲に発見できると主張している。

Recent genome-wide association studies (GWAS) have been successful in identifying associations between genetic variants and simple cardiac parameters derived from cardiac magnetic resonance (CMR) images. However, the emergence of big databases including genetic data linked to CMR, facilitates investigation of more nuanced patterns of shape variability. Here, we propose a new framework for gene discovery entitled Unsupervised Phenotype Ensembles (UPE). UPE builds a redundant yet highly expressive representation by pooling a set of phenotypes learned in an unsupervised manner, using deep learning models trained with different hyperparameters. These phenotypes are then analyzed via (GWAS), retaining only highly confident and stable associations across the ensemble. We apply our approach to the UK Biobank database to extract left-ventricular (LV) geometric features from image-derived three-dimensional meshes. We demonstrate that our approach greatly improves the discoverability of genes influencing LV shape, identifying 11 loci with study-wide significance and 8 with suggestive significance. We argue that our approach would enable more extensive discovery of gene associations with image-derived phenotypes for other organs or image modalities.
翻訳日:2023-01-10 18:20:03 公開日:2023-01-07
# ニューラルスタイル変換を用いたホログラム処理における非理想的楽器動作の模倣

Mimicking non-ideal instrument behavior for hologram processing using neural style translation ( http://arxiv.org/abs/2301.02757v1 )

ライセンス: Link先を確認
John S. Schreck, Matthew Hayman, Gabrielle Gantos, Aaron Bansemer, David John Gagne(参考訳) ホログラフィー雲プローブは、粒子密度、大きさ、位置に関する前例のない情報を提供する。 それぞれのレーザーショットは大量の粒子を捕捉し、そこでは画像が計算的に再焦点され、粒子のサイズと形状が決定される。 しかし、これらのホログラムを標準的な方法や機械学習(ML)モデルで処理するには、かなりの計算資源、時間、時には人間の介入が必要である。 mlモデルは、真のホログラムには絶対的真理ラベルがないため、プローブの物理モデルから得られたシミュレーションホログラムに基づいて訓練される。 別の処理方法を使用してラベルを生成すると、後にMLモデルが継承するエラーが発生する。 モデルは、訓練中の模擬画像上で画像破損を行う場合にのみ、実際のホログラム上で良好に動作し、実際のプローブにおける非理想条件を模倣する(Schreck et. al, 2022)。 画像の破損を最適化するには、面倒な手作業が必要だ。 ここでは、シミュレーションホログラムへのニューラルスタイル翻訳手法(Gatys et. al, 2016)の適用例を示す。 事前学習された畳み込みニューラルネットワーク(vgg-19)では、シミュレーションされたホログラムは、プローブから得られた実画像に類似する「‘stylized'」であり、同時にシミュレーションされた画像「`content'」(粒子の位置や大きさなど)を保存する。 2つの画像類似度メトリクスは、スタイライズされた画像が合成画像よりも実際のホログラムに近いことを一致させる。 機械学習モデルを用いて、スタイリングされたデータセット上の粒子の位置と形状を予測し、シミュレーションと実ホログラムの両方で同等の性能を示し、手動ラベリングを行う必要性を回避した。 上記のアプローチはホログラム画像に特有ではなく、観測機器のノイズや不完全さを捉える他の領域にも適用でき、シミュレーションデータを現実世界の観測に似せたものにすることができる。

Holographic cloud probes provide unprecedented information on cloud particle density, size and position. Each laser shot captures particles within a large volume, where images can be computationally refocused to determine particle size and shape. However, processing these holograms, either with standard methods or with machine learning (ML) models, requires considerable computational resources, time and occasional human intervention. ML models are trained on simulated holograms obtained from the physical model of the probe since real holograms have no absolute truth labels. Using another processing method to produce labels would be subject to errors that the ML model would subsequently inherit. Models perform well on real holograms only when image corruption is performed on the simulated images during training, thereby mimicking non-ideal conditions in the actual probe (Schreck et. al, 2022). Optimizing image corruption requires a cumbersome manual labeling effort. Here we demonstrate the application of the neural style translation approach (Gatys et. al, 2016) to the simulated holograms. With a pre-trained convolutional neural network (VGG-19), the simulated holograms are ``stylized'' to resemble the real ones obtained from the probe, while at the same time preserving the simulated image ``content'' (e.g. the particle locations and sizes). Two image similarity metrics concur that the stylized images are more like real holograms than the synthetic ones. With an ML model trained to predict particle locations and shapes on the stylized data sets, we observed comparable performance on both simulated and real holograms, obviating the need to perform manual labeling. The described approach is not specific to hologram images and could be applied in other domains for capturing noise and imperfections in observational instruments to make simulated data more like real world observations.
翻訳日:2023-01-10 18:14:49 公開日:2023-01-07
# 体積及び平面質量アンテナアレイ設計におけるGA支援指向性

GA-Aided Directivity in Volumetric and Planar Massive-Antenna Array Design ( http://arxiv.org/abs/2301.02940v1 )

ライセンス: Link先を確認
Bruno Felipe Costa, Taufik Abr\~ao(参考訳) 指向性向上の問題は, ある所望の到着/出発角(AoA/AoD)に対する指向性向上の増大につながると考えられる。 各アンテナ要素と所望の方位角と高さ角を一般成分パターンで記述するための矩形座標を用いて,体積配列指向性問題の新たな定式化を提案する。 このような指向性問題は、アンテナ要素$d_\text{min}$間の最適最小距離を求めるために定式化され、高い指向性ゲインを達成する。 アンテナ要素を(\theta_0$; $\phi_0$)に依存する特異な平面に配置する。 均一平面アレイ (OUPA) の指向性を最適化する新しい概念を導入し, 複雑性の低い非凸最適化問題に対する準最適解を求める。 本手法は,提案した逐次評価検証法(SEV)をデプロイすることによって実現される。 遺伝的アルゴリズム (GA) 法は, 直接的に指向性最適化の解を見つけるために展開された。 少数のアンテナ要素 {, $N\in [4,\dots, 9]$,} に対して、GA最適化による達成可能な指向性は、一様線形配列 (ULA) と一様円配列 (UCA) のステアリングベクトルを用いて従来のビームフォーミング技術と比較して$\sim 3$ dBiの利得を示し、改良されたUCA指向性法と比較すると$\sim1.5$ dBiの利得が得られる。 多数のアンテナ素子 {1, 2つの改良GAプロシージャ,すなわち GA-{\it marginal と GA-{\it stall} が提案され,OUPA法と比較された。 OUPAはまた、大規模なMIMOシナリオで30ドルを超える有望な指向性の向上を示している。

The problem of directivity enhancement, leading to the increase in the directivity gain over a certain desired angle of arrival/departure (AoA/AoD), is considered in this work. A new formulation of the volumetric array directivity problem is proposed using the rectangular coordinates to describe each antenna element and the desired azimuth and elevation angles with a general element pattern. Such a directivity problem is formulated to find the optimal minimum distance between the antenna elements $d_\text{min}$ aiming to achieve as high directivity gains as possible. {An expedited implementation method is developed to place the antenna elements in a distinctive plane dependent on ($\theta_0$; $\phi_0$). A novel concept on optimizing directivity for the uniform planar array (OUPA) is introduced to find a quasi-optimal solution for the non-convex optimization problem with low complexity. This solution is reached by deploying the proposed successive evaluation and validation (SEV) method. {Moreover, the genetic} algorithm (GA) method was deployed to find the directivity optimization solution expeditiously. For a small number of antenna elements {, typically $N\in [4,\dots, 9]$,} the achievable directivity by GA optimization demonstrates gains of $\sim 3$ dBi compared with the traditional beamforming technique, using steering vector for uniform linear arrays (ULA) and uniform circular arrays (UCA), while gains of $\sim1.5$ dBi are attained when compared with an improved UCA directivity method. For a larger number of antenna elements {, two improved GA procedures, namely GA-{\it marginal} and GA-{\it stall}, were} proposed and compared with the OUPA method. OUPA also indicates promising directivity gains surpassing $30$ dBi for massive MIMO scenarios.
翻訳日:2023-01-10 18:11:25 公開日:2023-01-07
# アプリレビューによる共同バグ発見

App Review Driven Collaborative Bug Finding ( http://arxiv.org/abs/2301.02818v1 )

ライセンス: Link先を確認
Xunzhu Tang and Haoye Tian and Pingfan Kong and Kui Liu and Jacques Klein and Tegawend\'e F. Bissyande(参考訳) ソフトウェア開発チームは一般的に、コードベースのバグを公開する努力を歓迎します。 この研究は、同じカテゴリのモバイルアプリ(例えば、2つのWebブラウザアプリ)が、進化過程における同様のバグによって影響を受ける可能性があるという仮説に基づいている。 したがって、ある履歴アプリの体験を移行して、新しいアプリのバグを素早く見つけることができる。 これは文献で共同バグ発見と呼ばれている。 私たちの目新しさは、既存のバグがアプリのレビューでほのめかされていることを考慮して、バグ発見プロセスをガイドすることです。 具体的には、BugRMSysアプローチを設計し、同じカテゴリのアプリの履歴バグレポートとターゲットアプリのユーザアプリレビューをマッチングすることで、ターゲットアプリのバグレポートを推奨する。 このアプローチがBrave(Webブラウザアプリ)のようなターゲットアプリに対して,数十のバグを迅速に公開し,報告することを可能にすることを実験的に示す。 BugRMSysの実装は、自然言語のテキスト埋め込みを生成するためにDistilBERTに依存している。 私たちのパイプラインは、バグレポートとアプリレビューの類似性を考慮し、関連するバグを特定します。 次に、バグを再現する履歴バグレポート(同じカテゴリのアプリから)の、アプリのレビューと、潜在的な再現ステップに焦点を当てます。 全体として、人気のある6つのアプリにbugrmsysを適用した後、新たに20のバグを特定し、再現し、報告することができた。

Software development teams generally welcome any effort to expose bugs in their code base. In this work, we build on the hypothesis that mobile apps from the same category (e.g., two web browser apps) may be affected by similar bugs in their evolution process. It is therefore possible to transfer the experience of one historical app to quickly find bugs in its new counterparts. This has been referred to as collaborative bug finding in the literature. Our novelty is that we guide the bug finding process by considering that existing bugs have been hinted within app reviews. Concretely, we design the BugRMSys approach to recommend bug reports for a target app by matching historical bug reports from apps in the same category with user app reviews of the target app. We experimentally show that this approach enables us to quickly expose and report dozens of bugs for targeted apps such as Brave (web browser app). BugRMSys's implementation relies on DistilBERT to produce natural language text embeddings. Our pipeline considers similarities between bug reports and app reviews to identify relevant bugs. We then focus on the app review as well as potential reproduction steps in the historical bug report (from a same-category app) to reproduce the bugs. Overall, after applying BugRMSys to six popular apps, we were able to identify, reproduce and report 20 new bugs: among these, 9 reports have been already triaged, 6 were confirmed, and 4 have been fixed by official development teams, respectively.
翻訳日:2023-01-10 17:52:52 公開日:2023-01-07
# 共形微分を用いたベイトマン減衰系の量子化

Quantization of the Bateman damping system with conformable derivative ( http://arxiv.org/abs/2301.02769v1 )

ライセンス: Link先を確認
Tariq AlBanwa, Ahmed Al-Jamel, Eqab.M.Rabei and Mohamed.Al-Masaeed(参考訳) 本研究では, 減衰調和振動子系のコンフォーメータブルバトマンラグランジアンについて, コンフォーメータ導関数の概念を用いて提案する。 言い換えると、整数微分は$0<\alpha\leq 1$ の次数 $\alpha$ の共役微分に置き換えられる。 対応する運動のユーラー・ラグランジュ方程式と分数ハミルトン方程式が得られる。 システムは正準量子化され、コンホメータブルシュロディンガー方程式が構築される。 エネルギー固有値 $E_n ^\alpha$ と固有関数 $\psi_n ^\alpha$ の分数次依存性は、適切な変換と拡張されたニキフォロフ・ウバロフ法を用いて得られる。 対応する適合連続式も導出され、その確率密度と確率電流が好適に定義される。 確率密度の進化とその$\alpha$への依存は様々な状況でプロットされ分析される。 その結果, エネルギー固有値は実数であり, 確率密度の挙動には段階的な順序が存在することがわかった。

In this work, the conformable Bateman Lagrangian for the damped harmonic oscillator system is proposed using the conformable derivative concept. In other words, the integer derivatives are replaced by conformable derivatives of order $\alpha$ with $0<\alpha\leq 1$. The corresponding conformable Euler-Lagrange equations of motion and fractional Hamiltonian are then obtained. The system is then canonically quantized and the conformable Schrodinger equation is constructed. The fractional-order dependence of the energy eigenvalues $E_n ^\alpha$ and eigenfunctions $\psi_n ^\alpha$ are obtained using using suitable transformations and the extended fractional Nikiforov-Uvarov method. The corresponding conformable continuity equation is also derived and the probability density and probability current are thus suitably defined. The probability density evolution as well as its dependence on $\alpha$ is plotted and analyzed for various situations. It is found that the energy eigenvalues are real and there are sort of gradual ordering in the behavior of the probability densities.
翻訳日:2023-01-10 17:45:42 公開日:2023-01-07
# キャビティ光磁気力学系における2つのマイクロ波場の高効率絡み合い

High-efficiency entanglement of two microwave fields in cavity opto-magnomechanical systems ( http://arxiv.org/abs/2301.02808v1 )

ライセンス: Link先を確認
Ke Di, Shuai Tan, Liyong Wang, Anyu Cheng, Xi Wang, Yu Liu, Jiajia Du(参考訳) デュアルオプティカル・マグノメカニクスシステムにおいて、2つのマイクロ波場の高効率絡み合いを実現する手法を示す。 マグノンモードは、磁気双極子相互作用と磁歪相互作用を介してマイクロ波共振器モードとフォノンモードとを同時に結合する。 一方、フォノンモードは放射圧を介して光学キャビティモードと結合する。 それぞれのマグノンモードと光キャビティモードは、ビームスプリッタ相互作用を活性化するために強い赤脱調駆動フィールドを採用する。 そのため、光キャビティ内に注入された2モードの圧縮光によって生じる絡み合った状態を、2つのマイクロ波キャビティに転送することができる。 入力された2モード圧縮光学フィールドがスクイーズパラメータr=1を有する場合、静止絡みE_{a_{1}a_{2}}=0.54を得る。 一方、エンタングルメント E_{a_{1}a_{2}} は、スクイーズパラメータ r が増加するにつれて増加する。 これは我々のスキームの柔軟なチューナビリティを示しています。 エンタングルメントは約385mkの環境温度まで存続し,提案手法の頑健性を示す。 この結果は、量子レーダ、量子ナビゲーション、量子テレポーテーションなどのマイクロ波場の高絡みを必要とするアプリケーションに有用である。

We demonstrate a scheme to realize high-efficiency entanglement of two microwave fields in a dual opto-magnomechanical system. The magnon mode simultaneously couples with the microwave cavity mode and phonon mode via magnetic dipole interaction and magnetostrictive interaction, respectively. Meanwhile, the phonon mode couples with the optical cavity mode via radiation pressure. Each magnon mode and optical cavity mode adopts a strong red detuning driving field to activate the beam splitter interaction. Therefore, the entangled state generated by the injected two-mode squeezed light in optical cavities can be eventually transferred into two microwave cavities. A stationary entanglement E_{a_{1}a_{2}}=0.54 is obtained when the input two-mode squeezed optical field has a squeezing parameter r=1. Meanwhile, the entanglement E_{a_{1}a_{2}} increases as the squeezing parameter r increases. This demonstrates the flexible tunability of our scheme. The entanglement survives up to an environmental temperature about 385 mK, which shows high robustness of the proposed scheme. Our result is useful for applications which require high entanglement of microwave fields like quantum radar, quantum navigation, quantum teleportation, etc.
翻訳日:2023-01-10 17:45:26 公開日:2023-01-07
# $n$-photon ブロックと$n$-photon パラメトリックドライブ

$n$-photon blockade with an $n$-photon parametric drive ( http://arxiv.org/abs/2301.02834v1 )

ライセンス: Link先を確認
Yan-Hui Zhou, Fabrizio Minganti, Wei Qin, Qi-Cheng Wu, Junlong Zhao, Yu-Liang Fang, Franco Nori, and Chui-Ping Yang(参考訳) 我々は、n$-photon パラメトリックドライブ $\lambda(\hat{a}^{\dag n}+\hat{a}^n)$ の非線形空洞内で、n$-photon をブロックする機構を提案する。 n$-photon励起共鳴条件が満たされると、キャビティ内のn光子の存在はその後の光子の吸収を抑制する。 本提案の有効性を確認するため,原子空洞系,Kerr非線形共振器,および2カップリングKerr非線形共振器のn光子遮断について検討した。 これらのシステムでは,$n$- Photon bunchingと$(n+1)$- Photon antibunchingが同時に得られることを示した。 この効果は、アンハーモニックエネルギーのラグと$n$-光子ドライブの性質の両方に起因する。 ドライブの重要性を示すために、n$-photonドライブとコヒーレント(1-photon)ドライブの結果を比較し、パラメトリックドライブケースにおけるアンチバンチングの強化を証明する。 この提案は一般論であり、他の非線形系におけるn$-photonブロックを実現するために適用することができる。

We propose a mechanism to engineer an $n$-photon blockade in a nonlinear cavity with an $n$-photon parametric drive $\lambda(\hat{a}^{\dag n}+\hat{a}^n)$. When an $n$-photon-excitation resonance condition is satisfied, the presence of n photons in the cavity suppresses the absorption of the subsequent photons. To confirm the validity of this proposal, we study the n-photon blockade in an atom-cavity system, a Kerr-nonlinear resonator, and two-coupled Kerr nonlinear resonators. Our results demonstrate that $n$-photon bunching and $(n+1)$-photon antibunching can be simultaneously obtained in these systems. This effect is due both to the anharmonic energy ladder and to the nature of the $n$-photon drive. To show the importance of the drive, we compare the results of the $n$-photon drive with a coherent (one-photon) drive, proving the enhancement of antibunching in the parametric-drive case. This proposal is general and can be applied to realize the $n$-photon blockade in other nonlinear systems.
翻訳日:2023-01-10 17:45:07 公開日:2023-01-07
# 大振幅光Schr\odinger-cat状態の決定的生成法

Method to deterministically generate large-amplitude Optical Schr\"odinger-cat states ( http://arxiv.org/abs/2301.02839v1 )

ライセンス: Link先を確認
Zheng-Hong Li, Zhen-Ya Li, Fei Yu, M. Al-Amri, and M. Suhail Zubairy(参考訳) 大振幅光Schr\"odinger-cat状態の決定的準備法を提案する。 鍵となる要素は、片側キャビティに埋もれた原子を大振幅コヒーレント光パルスで絡めることである。 この目的を達成するために、多重反射マイケルソン干渉計を用いる。 光パルスは干渉計内を前後に回って原子と何度も相互作用する。 しかし、全ての相互作用において、原子によって操作される光場の平均光子数は1よりはるかに少ないため、原子キャビティ系が反射場の位相を適切に制御でき、エンタングルメントを達成することができる。 それだけでなく、量子ゼノ効果により、このスキームは原子の自発的放出と原子とキャビティの間のデチューニングの両方に影響を受けないことも示します。 これにより、線形光学系を改善することにより、cat状態の忠実度を高めることができる。

A deterministic preparation method for large-amplitude optical Schr\"odinger-cat state is proposed. The key ingredient is to entangle an atom buried in a single-side cavity with a large-amplitude coherent light pulse. To achieve this purpose, a multiple reflection Michelson interferometer is used. The light pulse can go back and forth inside the interferometer and interact with the atom many times. However, in every interaction, the average photon number of the light field that manipulated by the atom is much less than 1, which ensures that the atom-cavity system can properly control the phase of the reflected field, and thus achieve the entanglement. Not only that, but we also further demonstrate that due to quantum Zeno effect, our scheme is insensitive to both atomic spontaneous emission and detuning between the atom and the cavity. Therefore, the fidelity of the cat state can be increased by improving the linear optical system.
翻訳日:2023-01-10 17:44:43 公開日:2023-01-07
# 双極子相互作用磁気系における幾何学的量子不協和とコヒーレンス

Geometric quantum discord and coherence in a dipolar interacting magnetic system ( http://arxiv.org/abs/2301.02891v1 )

ライセンス: Link先を確認
Clebson Cruz, Maron F. Anka, Hamid-Reza Rastegar-Sedehi and Cleidson Castro(参考訳) 低次元金属錯体の研究はスピンギャップ系によって示される基底状態の交差に関する興味深い特性を明らかにした。 この文脈において、この研究は双極子相互作用系の磁気異方性によって引き起こされる量子レベルの交差が系の量子不一致とコヒーレンスに及ぼす影響を探求する。 二核スピン-1/2系のシャッテン1-ノルムと$l_1$トレースノルム量子コヒーレンスに基づく量子不協和の解析式は、磁気異方性の観点から提供される。 その結果、量子不協和は量子レベル交差の明確なシグネチャを持つが、量子コヒーレンスの基底依存性は測定された基底に関する交差を隠蔽することを示した。 さらに、大域的な量子コヒーレンスは、その参照基底に関係なく、システムの相関に完全に格納される。

The study of low-dimensional metal complexes has revealed fascinating characteristics regarding the ground-state crossover shown by spin-gaped systems. In this context, this work explores the effect of the quantum-level crossing, induced by the magnetic anisotropies of dipolar interacting systems, on the quantum discord and coherence of the system. The analytical expressions for the quantum discord, based on Schatten 1-norm, and the $l_1$ trace-norm quantum coherence for dinuclear spin-1/2 systems, are provided in terms of the magnetic anisotropies. The results show that, while the quantum discord has a clear signature of the quantum level-crossing, the basis dependence of the quantum coherence hides the crossover regarding the measured basis. In addition, the global quantum coherence is wholly stored within the correlations of the system, regardless of its reference basis.
翻訳日:2023-01-10 17:44:27 公開日:2023-01-07
# あなたのレーベルの予算をどう割り当てますか。 異常検出におけるアクティブラーニングと退避学習の選択

How to Allocate your Label Budget? Choosing between Active Learning and Learning to Reject in Anomaly Detection ( http://arxiv.org/abs/2301.02909v1 )

ライセンス: Link先を確認
Lorenzo Perini, Daniele Giannuzzi, Jesse Davis(参考訳) 異常検出は、期待される振る舞いから逸脱する例を見つけようとする。 通常、異常なラベルはまれで取得が困難であるため、教師なしの観点から異常検出に取り組む。 しかし、ラベルの欠如により、一部の地域では異常検知器は高い不確実性を持ち、通常は予測性能の低下や予測に対するユーザの信頼の低下をもたらす。 アクティブラーニング(AL)を使用して特定のラベルを収集することで、検知器の判定境界に近い例をターゲットにすることで、そのような不確実性を低減できる。 あるいは、検知器が極めて不確実な予測をすること、すなわちLearning to Reject (LR) と呼ばれることによって、ユーザの信頼を高めることができる。 この方法の1つは、その性能の低い場所に基づいて検出器の不確かさをしきい値にし、ラベルを評価することである。 ALは明らかに偏りがある戦略ラベルを求め、LRは検出器の性能を評価し拒絶しきい値を設定するためにi.d.ラベルを必要とする。 通常、ラベルの予算がユニークなため、最適な割り当て方法を決定するのは難しいです。 本稿では,ラベルの予算が与えられた場合,予算を用いてALラベルやLRラベルを収集するかを複数ラウンドで決定する混合戦略を提案する。 この戦略は、予算を双方に割り当てるときに期待される利益を測定する報酬関数に基づいている。 私たちは18のベンチマークデータセットで戦略を評価し、いくつかのベースラインと比較します。

Anomaly detection attempts at finding examples that deviate from the expected behaviour. Usually, anomaly detection is tackled from an unsupervised perspective because anomalous labels are rare and difficult to acquire. However, the lack of labels makes the anomaly detector have high uncertainty in some regions, which usually results in poor predictive performance or low user trust in the predictions. One can reduce such uncertainty by collecting specific labels using Active Learning (AL), which targets examples close to the detector's decision boundary. Alternatively, one can increase the user trust by allowing the detector to abstain from making highly uncertain predictions, which is called Learning to Reject (LR). One way to do this is by thresholding the detector's uncertainty based on where its performance is low, which requires labels to be evaluated. Although both AL and LR need labels, they work with different types of labels: AL seeks strategic labels, which are evidently biased, while LR requires i.i.d. labels to evaluate the detector's performance and set the rejection threshold. Because one usually has a unique label budget, deciding how to optimally allocate it is challenging. In this paper, we propose a mixed strategy that, given a budget of labels, decides in multiple rounds whether to use the budget to collect AL labels or LR labels. The strategy is based on a reward function that measures the expected gain when allocating the budget to either side. We evaluate our strategy on 18 benchmark datasets and compare it to some baselines.
翻訳日:2023-01-10 17:37:29 公開日:2023-01-07
# ExcelFormer: タブラルデータ上のGBDTをバイパスするニューラルネットワーク

ExcelFormer: A Neural Network Surpassing GBDTs on Tabular Data ( http://arxiv.org/abs/2301.02819v1 )

ライセンス: Link先を確認
Jintai Chen and Jiahuan Yan and Danny Ziyi Chen and Jian Wu(参考訳) ニューラルネットワークは教師あり学習における様々な分野(コンピュータビジョンなど)において大きなブレークスルーを遂げてきたが、これまでのグラフデータではGBDTのパフォーマンスに追随している。 この問題に目を向けると,表データ上でのニューラルネットワークの成功には,機能インタラクションと機能埋め込みの適切な処理が不可欠であることが分かる。 我々はexcelformerと呼ばれる新しいニューラルネットワークを開発し、注意深い機能インタラクションと機能埋め込み更新をそれぞれ操作する2つのアテンションモジュールを交互に開発した。 モデルパフォーマンスを促進するために,独自にトレーニング手法を共同で導入する。 パラメータを最小値で初期化することにより、これらの注意モジュールはトレーニング開始時に減衰し、トレーニングが進むにつれて、提案された特定の正規化アプローチであるSwap-MixとHidden-Mixの指導の下で、特徴的相互作用と埋め込み更新の影響が徐々に最適なレベルまで増加する。 25の公開表型データセットに関する実験では、私たちのexcelformerは、非常にチューニングされたgbdtsよりも優れていることが示されています。

Though neural networks have achieved enormous breakthroughs on various fields (e.g., computer vision) in supervised learning, they still trailed the performances of GBDTs on tabular data thus far. Delving into this issue, we identify that a proper handling of feature interactions and feature embedding is crucial to the success of neural networks on tabular data. We develop a novel neural network called ExcelFormer, which alternates in turn two attention modules that respectively manipulate careful feature interactions and feature embedding updates. A bespoke training methodology is jointly introduced to facilitate the model performances. By initializing parameters with minuscule values, these attention modules are attenuated when the training begins, and the effects of feature interactions and embedding updates progressively grow up to optimum levels under the guidance of the proposed specific regularization approaches Swap-Mix and Hidden-Mix as the training proceeds. Experiments on 25 public tabular datasets show that our ExcelFormer is superior to extremely-tuned GBDTs, which is an unprecedented achievement of neural networks in supervised tabular learning.
翻訳日:2023-01-10 17:27:39 公開日:2023-01-07
# 緑内障視神経頭部の3次元表現型と視野障害の重症度との関係

The 3D Structural Phenotype of the Glaucomatous Optic Nerve Head and its Relationship with The Severity of Visual Field Damage ( http://arxiv.org/abs/2301.02837v1 )

ライセンス: Link先を確認
Fabian A. Braeu, Thanadet Chuangsuwanich, Tin A. Tun, Shamira A. Perera, Rahat Husain, Aiste Kadziauskiene, Leopold Schmetterer, Alexandre H. Thi\'ery, George Barbastathis, Tin Aung, and Micha\"el J.A. Girard(参考訳) $\bf{purpose}$: 緑内障の異なる段階で発生する視神経頭(onh)の結合組織と神経組織の3d構造変化を記述するために、伝統的およびai駆動のアプローチを用いる。 213名,軽度緑内障204名 (平均偏差 [md] $\ge$ -6.00 db), 中等度緑内障118名 (md: -6.01から-12.00 db), 進行緑内障患者118名 (md < -12.00 db) であった。 全ての被験者は、スペクトル光コヒーレンストモグラフィーで3DでONHを画像化した。 To describe the 3D structural phenotype of glaucoma as a function of severity, we used two different approaches: (1) We extracted human-defined 3D structural parameters of the ONH including retinal nerve fiber layer (RNFL) thickness, lamina cribrosa (LC) shape and depth at different stages of glaucoma; (2) we also employed a geometric deep learning method (i.e. PointNet) to identify the most important 3D structural features that differentiate ONHs from different glaucoma severity groups without any human input. $\bf{Results}$: OnHの構造変化の大部分は早期緑内障期に発生し,その後後期にプラトー効果が認められた。 PointNetを用いて神経組織と結合組織の両方に3D ONH構造変化が認められた。 いずれのアプローチにおいても,ONH上層および下層部では構造変化が顕著であり,特にRCF,プレラミナ,LCでは顕著であった。 緑内障の重症度が高まるにつれて,これらの変化はより拡散し(広範に)、特にLCでは顕著であった。 この研究では、緑内障の重症度として、神経組織と結合組織の両方におけるonhの複雑な3d構造変化を明らかにすることができた。 緑内障の複雑な病態に関する新たな知見を提供し,臨床医の日常診療に役立てることが望まれる。

$\bf{Purpose}$: To describe the 3D structural changes in both connective and neural tissues of the optic nerve head (ONH) that occur concurrently at different stages of glaucoma using traditional and AI-driven approaches. $\bf{Methods}$: We included 213 normal, 204 mild glaucoma (mean deviation [MD] $\ge$ -6.00 dB), 118 moderate glaucoma (MD of -6.01 to -12.00 dB), and 118 advanced glaucoma patients (MD < -12.00 dB). All subjects had their ONHs imaged in 3D with Spectralis optical coherence tomography. To describe the 3D structural phenotype of glaucoma as a function of severity, we used two different approaches: (1) We extracted human-defined 3D structural parameters of the ONH including retinal nerve fiber layer (RNFL) thickness, lamina cribrosa (LC) shape and depth at different stages of glaucoma; (2) we also employed a geometric deep learning method (i.e. PointNet) to identify the most important 3D structural features that differentiate ONHs from different glaucoma severity groups without any human input. $\bf{Results}$: We observed that the majority of ONH structural changes occurred in the early glaucoma stage, followed by a plateau effect in the later stages. Using PointNet, we also found that 3D ONH structural changes were present in both neural and connective tissues. In both approaches, we observed that structural changes were more prominent in the superior and inferior quadrant of the ONH, particularly in the RNFL, the prelamina, and the LC. As the severity of glaucoma increased, these changes became more diffuse (i.e. widespread), particularly in the LC. $\bf{Conclusions}$: In this study, we were able to uncover complex 3D structural changes of the ONH in both neural and connective tissues as a function of glaucoma severity. We hope to provide new insights into the complex pathophysiology of glaucoma that might help clinicians in their daily clinical care.
翻訳日:2023-01-10 17:27:17 公開日:2023-01-07
# ワックスパターンに対するジュエリーの損失推定のための機械学習

Machine Learning to Estimate Gross Loss of Jewelry for Wax Patterns ( http://arxiv.org/abs/2301.02872v1 )

ライセンス: Link先を確認
Mihir Jain, Kashish Jain and Sandip Mane(参考訳) 宝石の大量製造においては、製造前に総損失を推定し、複数の同一の宝石を製造するために鋳造される投資パターンのワックス重量を算出する。 機械学習はAIの一部である技術であり、ユーザー定義データの大規模なセットに基づいて意思決定能力を持つモデルを作成するのに役立つ。 筆者らは, 宝石業界で機械学習を用いて, この重要なGross Lossを推定する方法を発見した。 製造されたリングの小さなデータセットを選択し, 回帰分析により, 設計段階でCADファイルから収集した履歴データと属性からMLアルゴリズムを用いて, 推定誤差を +-2-3 から +-0.5 に減少させる可能性があることがわかった。 アプローチの生存可能性を評価するには、より大きなデータセットでさらなる研究を行う必要がある。

In mass manufacturing of jewellery, the gross loss is estimated before manufacturing to calculate the wax weight of the pattern that would be investment casted to make multiple identical pieces of jewellery. Machine learning is a technology that is a part of AI which helps create a model with decision-making capabilities based on a large set of user-defined data. In this paper, the authors found a way to use Machine Learning in the jewellery industry to estimate this crucial Gross Loss. Choosing a small data set of manufactured rings and via regression analysis, it was found out that there is a potential of reducing the error in estimation from +-2-3 to +-0.5 using ML Algorithms from historic data and attributes collected from the CAD file during the design phase itself. To evaluate the approach's viability, additional study must be undertaken with a larger data set.
翻訳日:2023-01-10 17:26:40 公開日:2023-01-07
# 「マッチだ!」 --共同学習のためのタスク親和性スコアのベンチマーク

"It's a Match!" -- A Benchmark of Task Affinity Scores for Joint Learning ( http://arxiv.org/abs/2301.02873v1 )

ライセンス: Link先を確認
Raphael Azorin, Massimo Gallo, Alessandro Finamore, Dario Rossi, Pietro Michiardi(参考訳) MTL(Multi-Task Learning)の約束は魅力的だが、その成功の条件を特徴づけることは、ディープラーニングにおけるオープンな問題である。 いくつかのタスクは一緒に学習することで利益を享受し、他のタスクは互いに有害である。 タスクの観点からは、競合するタスクを分離しながら協調タスクをグループ化することは、mtlの利点、すなわちトレーニングと推論コストの削減を享受する上で最重要である。 したがって、共同学習におけるタスク親和性の推定は重要な取り組みである。 最近の研究は、訓練条件自体がMTLの結果に重大な影響を与えることを示唆している。 しかし,本研究では,タスク親和性評価手法の有効性と実際のMTL性能との関係を評価するためのベンチマークが欠落している。 本稿では,このギャップを回復する第一歩を踏み出す。 一 前の文献からの貢献を再考し、新文献を提示し、親和性スコアのセットを定義すること。 (ii) Taskonomyデータセットでそれらをベンチマークする。 我々の経験的キャンペーンは、たとえ小規模なシナリオであっても、タスク親和性スコアが実際のMTL性能とどのように相関しないかを明らかにする。 しかし、いくつかの指標は、他の指標よりも暗示的である。

While the promises of Multi-Task Learning (MTL) are attractive, characterizing the conditions of its success is still an open problem in Deep Learning. Some tasks may benefit from being learned together while others may be detrimental to one another. From a task perspective, grouping cooperative tasks while separating competing tasks is paramount to reap the benefits of MTL, i.e., reducing training and inference costs. Therefore, estimating task affinity for joint learning is a key endeavor. Recent work suggests that the training conditions themselves have a significant impact on the outcomes of MTL. Yet, the literature is lacking of a benchmark to assess the effectiveness of tasks affinity estimation techniques and their relation with actual MTL performance. In this paper, we take a first step in recovering this gap by (i) defining a set of affinity scores by both revisiting contributions from previous literature as well presenting new ones and (ii) benchmarking them on the Taskonomy dataset. Our empirical campaign reveals how, even in a small-scale scenario, task affinity scoring does not correlate well with actual MTL performance. Yet, some metrics can be more indicative than others.
翻訳日:2023-01-10 17:26:24 公開日:2023-01-07
# GANによる戦略ゲーム用地図のコンテンツ生成

GAN-Based Content Generation of Maps for Strategy Games ( http://arxiv.org/abs/2301.02874v1 )

ライセンス: Link先を確認
Vasco Nunes, Jo\~ao Dias and Pedro A. Santos(参考訳) 地図は戦略ゲームにおいて非常に重要な要素であり、手作業による作業には時間がかかる。 perlin ノイズや tile ベースの pcg 技術のような従来の pcg 技術によって生成されたマップは不自然に見えず、プレイヤーにとって最高のユーザエクスペリエンスを提供しない。 しかし、地図のリアルで自然なイメージを作成できるジェネレータを持つことは、その方法が訓練されていることを考えると可能である。 本稿では,GAN(Generative Adversarial Networks)に基づく地図生成モデルを提案する。 実装では、highmapsのデータセット上でganベースのネットワークのさまざまな変種をテストしました。 それぞれのアプローチの利点と特性を決定するため,実験的な評価を行った。 得られた結果は有望であり、この種のアプローチで現実的な地図を生成することは実際に可能であることを示している。

Maps are a very important component of strategy games, and a time-consuming task if done by hand. Maps generated by traditional PCG techniques such as Perlin noise or tile-based PCG techniques look unnatural and unappealing, thus not providing the best user experience for the players. However it is possible to have a generator that can create realistic and natural images of maps, given that it is trained how to do so. We propose a model for the generation of maps based on Generative Adversarial Networks (GAN). In our implementation we tested out different variants of GAN-based networks on a dataset of heightmaps. We conducted extensive empirical evaluation to determine the advantages and properties of each approach. The results obtained are promising, showing that it is indeed possible to generate realistic looking maps using this type of approach.
翻訳日:2023-01-10 17:26:04 公開日:2023-01-07
# k-Means SubClustering: クラスタリング品質を改善した差分プライベートアルゴリズム

k-Means SubClustering: A Differentially Private Algorithm with Improved Clustering Quality ( http://arxiv.org/abs/2301.02896v1 )

ライセンス: Link先を確認
Devvrat Joshi, Janvi Thakkar(参考訳) 今日のデータ駆動の世界では、情報の感度が大きな問題となっている。 このデータと人物の背景に関する追加情報により、個人のプライベートデータを容易に推測することができる。 これらの推論攻撃から個人のプライバシを保護するために、インタラクティブな設定で多くの微分的反復アルゴリズムが提案されている。 既存のアプローチでは, 微分プライベート(DP)セントロイドを反復的Llyodのアルゴリズムで計算し, 様々なDP機構で遠心体を摂動させる。 これらのDPメカニズムは、微分プライベート反復アルゴリズムの収束を保証せず、クラスタの品質を劣化させる。 そこで本研究では,本研究のベースラインとして,先行研究である「収束保証付き微分プライベートk-meansクラスタリング」をさらに拡張する。 このアプローチの目新しさは、クラスタをサブクラスタ化して、将来のcentroid方向に移動する確率の高いcentroidを選択することです。 すべてのロイドのステップにおいて、セントロイドは指数DP機構を用いてノイズで注入される。 実験の結果,本手法は,同一の差分プライバシー要件を維持しつつ,クラスタリング品質の観点から,現在の最先端法,すなわちベースラインアルゴリズムを上回っていることが示唆された。 クラスタリングの品質はワインとBreast_Cancerデータセットのベースラインの4.13倍と2.83倍に向上した。

In today's data-driven world, the sensitivity of information has been a significant concern. With this data and additional information on the person's background, one can easily infer an individual's private data. Many differentially private iterative algorithms have been proposed in interactive settings to protect an individual's privacy from these inference attacks. The existing approaches adapt the method to compute differentially private(DP) centroids by iterative Llyod's algorithm and perturbing the centroid with various DP mechanisms. These DP mechanisms do not guarantee convergence of differentially private iterative algorithms and degrade the quality of the cluster. Thus, in this work, we further extend the previous work on 'Differentially Private k-Means Clustering With Convergence Guarantee' by taking it as our baseline. The novelty of our approach is to sub-cluster the clusters and then select the centroid which has a higher probability of moving in the direction of the future centroid. At every Lloyd's step, the centroids are injected with the noise using the exponential DP mechanism. The results of the experiments indicate that our approach outperforms the current state-of-the-art method, i.e., the baseline algorithm, in terms of clustering quality while maintaining the same differential privacy requirements. The clustering quality significantly improved by 4.13 and 2.83 times than baseline for the Wine and Breast_Cancer dataset, respectively.
翻訳日:2023-01-10 17:25:52 公開日:2023-01-07
# 点雲学習のための動的局所特徴集約

Dynamic Local Feature Aggregation for Learning on Point Clouds ( http://arxiv.org/abs/2301.02836v1 )

ライセンス: Link先を確認
Zihao Li, Pan Gao, Hui Yuan, Ran Wei(参考訳) 既存のクラウド学習手法は、空間領域におけるグラフ構築に依存した近傍の点から特徴を集約し、空間的に固定された近隣の層に基づいて各点の特徴を更新する。 本稿では,空間制約を伴わずに特徴領域の局所グラフを構築して情報伝達を行う動的特徴集約(DFA)手法を提案する。 特徴領域内のk-nearest近傍を見つけることで,相対的な位置エンコーディングと意味的特徴エンコーディングを行い,潜在位置と特徴類似性情報を探索し,豊かな局所的特徴を学習する。 同時に、特徴表現を強化するために、元のポイントクラウドから低次元のグローバルな特徴も学習する。 DFA層の間に構築された局所グラフ構造を動的に更新し、よりリッチな情報を学習し、適応性と効率を大幅に向上させる。 我々は,ポイントクラウド分類とセグメンテーションタスクの広範な実験を行うことにより,本手法の優位性を実証する。 実装コードはhttps://github.com/jiamang/DFA。

Existing point cloud learning methods aggregate features from neighbouring points relying on constructing graph in the spatial domain, which results in feature update for each point based on spatially-fixed neighbours throughout layers. In this paper, we propose a dynamic feature aggregation (DFA) method that can transfer information by constructing local graphs in the feature domain without spatial constraints. By finding k-nearest neighbors in the feature domain, we perform relative position encoding and semantic feature encoding to explore latent position and feature similarity information, respectively, so that rich local features can be learned. At the same time, we also learn low-dimensional global features from the original point cloud for enhancing feature representation. Between DFA layers, we dynamically update the constructed local graph structure, so that we can learn richer information, which greatly improves adaptability and efficiency. We demonstrate the superiority of our method by conducting extensive experiments on point cloud classification and segmentation tasks. Implementation code is available: https://github.com/jiamang/DFA.
翻訳日:2023-01-10 17:02:21 公開日:2023-01-07
# 画像制御点のない深層学習型UAV空中三角測量

Deep Learning-Based UAV Aerial Triangulation without Image Control Points ( http://arxiv.org/abs/2301.02869v1 )

ライセンス: Link先を確認
Jiageng Zhong, Ming Li, Jiangying Qin, Hanqi Zhang(参考訳) ドローンによる航空調査は、低コスト、高効率、フレキシブルな利用の利点がある。 しかし、UAVは安価なPOSシステムと非測定カメラを備えており、その飛行姿勢は容易に影響を受ける。 POS がサポートする UAV 画像自由制御の大規模マッピングを実現するには,多くの技術的問題がある。 最も基本的で重要なコア技術は、高度な空中三角測量技術によって画像の絶対方向を正確に認識する方法である。 従来の航空三角測量では、画像マッチングアルゴリズムは事前の知識によって異なる程度に制限される。 近年, 深層学習はフォトグラムコンピュータビジョンの分野で急速に発展してきた。 多くの面で伝統的な手作りの特徴のパフォーマンスを上回っている。 画像ベースのナビゲーションや位置決めタスクの安定性が強く、特にぼやけや照明の変化、幾何学的歪みといった不利な要因に対する抵抗性が向上している。 本稿では,画像制御点のない空中三角測量の重要技術の導入に基づき,ディープラーニング画像特徴に基づく新しいドローン画像登録手法を提案し,従来の手法における高いミスマッチ率の問題を解決する。 特徴検出器としてSuperPointを採用し、CNNの優れた一般化性能を用いてUAV画像から正確な特徴点を抽出し、高精度な空中三角測量を実現する。 実験結果から,SIFT法に基づく従来の手法と比較して,前処理条件と後処理条件が同じで,精度が向上し,大規模調査では画像制御点を使わずにUAV空中三角測量の要件を満たすことが示唆された。

The emerging drone aerial survey has the advantages of low cost, high efficiency, and flexible use. However, UAVs are often equipped with cheap POS systems and non-measurement cameras, and their flight attitudes are easily affected. How to realize the large-scale mapping of UAV image-free control supported by POS faces many technical problems. The most basic and important core technology is how to accurately realize the absolute orientation of images through advanced aerial triangulation technology. In traditional aerial triangulation, image matching algorithms are constrained to varying degrees by preset prior knowledge. In recent years, deep learning has developed rapidly in the field of photogrammetric computer vision. It has surpassed the performance of traditional handcrafted features in many aspects. It has shown stronger stability in image-based navigation and positioning tasks, especially it has better resistance to unfavorable factors such as blur, illumination changes, and geometric distortion. Based on the introduction of the key technologies of aerial triangulation without image control points, this paper proposes a new drone image registration method based on deep learning image features to solve the problem of high mismatch rate in traditional methods. It adopts SuperPoint as the feature detector, uses the superior generalization performance of CNN to extract precise feature points from the UAV image, thereby achieving high-precision aerial triangulation. Experimental results show that under the same pre-processing and post-processing conditions, compared with the traditional method based on the SIFT algorithm, this method achieves suitable precision more efficiently, which can meet the requirements of UAV aerial triangulation without image control points in large-scale surveys.
翻訳日:2023-01-10 17:02:05 公開日:2023-01-07
# 発達障害の早期予測に向けて:幼児の顔触覚と自己適応の計算モデル

Towards early prediction of neurodevelopmental disorders: Computational model for Face Touch and Self-adaptors in Infants ( http://arxiv.org/abs/2301.02911v1 )

ライセンス: Link先を確認
Bruno Tafur, Marwa Mahmoud and Staci Weiss(参考訳) 幼児の神経発達は運動能力に大きく影響されている。 乳児の運動を評価することは、発達障害の発症リスクを理解する鍵となる。 心理学における以前の研究は、赤ちゃんの顔の触覚などの特定の動きやジェスチャーを測定することは、赤ちゃんが自分自身とその文脈をどのように理解しているかを分析するのに不可欠であることを示した。 本研究は,乳幼児の動作やジェスチャーを追跡し,ビデオ記録から顔のタッチを検出する最初の自動アプローチを提案する。 この研究は、空間的特徴と時間的特徴を混合したマルチモーダル特徴融合アプローチを用いており、骨格追跡情報を利用して、手、顔、身体の170以上の集約特徴を生成する。 本研究では,幼児の顔面接触の検出と分類のためのデータ駆動機械学習モデルを提案する。 提案したモデルを評価するために、クロスデータセットテストを使用しました。 モデルはフェイスタッチの検出において87.0%の精度と71.4%のマクロ平均精度を達成し、ゼロルールと均一なランダムチャンスベースラインを大きく改善した。 さらに,より大規模なデータセットの顔触覚周波数を抽出するためにモデルを実行すると,出生後5ヶ月の運動能力の発達を予測できることを示した。

Infants' neurological development is heavily influenced by their motor skills. Evaluating a baby's movements is key to understanding possible risks of developmental disorders in their growth. Previous research in psychology has shown that measuring specific movements or gestures such as face touches in babies is essential to analyse how babies understand themselves and their context. This research proposes the first automatic approach that detects face touches from video recordings by tracking infants' movements and gestures. The study uses a multimodal feature fusion approach mixing spatial and temporal features and exploits skeleton tracking information to generate more than 170 aggregated features of hand, face and body. This research proposes data-driven machine learning models for the detection and classification of face touch in infants. We used cross dataset testing to evaluate our proposed models. The models achieved 87.0% accuracy in detecting face touches and 71.4% macro-average accuracy in detecting specific face touch locations with significant improvements over Zero Rule and uniform random chance baselines. Moreover, we show that when we run our model to extract face touch frequencies of a larger dataset, we can predict the development of fine motor skills during the first 5 months after birth.
翻訳日:2023-01-10 17:01:41 公開日:2023-01-07
# パーキンソン病における脳の解剖学的部分領域の同定と神経活動の計測のためのマルチクラスセマンティクスセグメンテーション

Multiclass Semantic Segmentation to Identify Anatomical Sub-Regions of Brain and Measure Neuronal Health in Parkinson's Disease ( http://arxiv.org/abs/2301.02925v1 )

ライセンス: Link先を確認
Hosein Barzekar, Hai Ngu, Han Hui Lin, Mohsen Hejrati, Steven Ray Valdespino, Sarah Chu, Baris Bingol, Somaye Hashemifar, Soumitra Ghosh(参考訳) 組織像中の細胞や組織を定量化, 評価するためには, 高精度な解剖学的サブ領域の自動分割が必要である。 現在、脳の解剖下領域を分析して2次元組織像を分析する機械学習モデルは利用できない。 研究者たちは、脳の解剖学的サブリージョンを手動で分割することに頼っています。 このようなタスクを達成する上での大きな課題のひとつは、汎用人工知能モデルのトレーニングに使用できる高品質な注釈付きイメージの欠如である。 本研究では, unetベースのアーキテクチャを用いて, エンコーダ, 画像サイズ, サンプル選択技術の組み合わせによるモデル性能の比較を行った。 さらに、サンプルセットを増やすために、データの多様性と堅牢な学習を提供するデータ拡張に頼りました。 本研究では,Nissl/HaematoxylinおよびTyrosine hydroxylase酵素 (TH, ドーパミン作動性ニューロンの生存率の指標) で染色した約1000個のアノテート2次元脳画像の適合性モデルについて検討した。 データセットは、異なるデータセットでモデルをトレーニング可能な、さまざまな動物研究で構成されている。 このモデルは、すべての画像において2つのサブリージョンコンパクト(SNCD)とレチキュラタ(SNr)を効果的に検出できる。 限定的なトレーニングデータにもかかわらず、最良のモデルは結合の平均交点(iou)を79%、平均サイコロ係数を87%達成する。 結論として、effiecientnetをエンコーダとするunetベースのモデルは、他のすべてのエンコーダよりも優れており、2d画像におけるサブブレイン領域のマルチクラスセグメンテーションのための最初のロバストなモデルとなる。

Automated segmentation of anatomical sub-regions with high precision has become a necessity to enable the quantification and characterization of cells/ tissues in histology images. Currently, a machine learning model to analyze sub-anatomical regions of the brain to analyze 2D histological images is not available. The scientists rely on manually segmenting anatomical sub-regions of the brain which is extremely time-consuming and prone to labeler-dependent bias. One of the major challenges in accomplishing such a task is the lack of high-quality annotated images that can be used to train a generic artificial intelligence model. In this study, we employed a UNet-based architecture, compared model performance with various combinations of encoders, image sizes, and sample selection techniques. Additionally, to increase the sample set we resorted to data augmentation which provided data diversity and robust learning. In this study, we trained our best fit model on approximately one thousand annotated 2D brain images stained with Nissl/ Haematoxylin and Tyrosine Hydroxylase enzyme (TH, indicator of dopaminergic neuron viability). The dataset comprises of different animal studies enabling the model to be trained on different datasets. The model effectively is able to detect two sub-regions compacta (SNCD) and reticulata (SNr) in all the images. In spite of limited training data, our best model achieves a mean intersection over union (IOU) of 79% and a mean dice coefficient of 87%. In conclusion, the UNet-based model with EffiecientNet as an encoder outperforms all other encoders, resulting in a first of its kind robust model for multiclass segmentation of sub-brain regions in 2D images.
翻訳日:2023-01-10 17:01:19 公開日:2023-01-07
# 前立腺癌における関節すべり分別と分類

Weakly Supervised Joint Whole-Slide Segmentation and Classification in Prostate Cancer ( http://arxiv.org/abs/2301.02933v1 )

ライセンス: Link先を確認
Pushpak Pati, Guillaume Jaume, Zeineb Ayadi, Kevin Thandiackal, Behzad Bozorgtabar, Maria Gabrani, Orcun Goksel(参考訳) 診断対象の組織学的領域のセグメンテーションと自動同定は、病理学者にとって貴重な助けとなる。 しかし,WSI(Whole-Slide Image)では,ピクセルレベルのアノテーションの取得が困難であることから,セグメンテーションの手法が妨げられている。 これを解決するために、画像レベルで利用できるアノテーションを利用する弱教師付き手法が開発されている。 しかしながら、我々の知る限り、これらの技術はwsisに対応していない。 本稿では,任意の形状と大きさのwsisを同時に分割分類する,弱教師付き手法であるwholesightを提案する。 正式には、wholesightはまずwsiの組織グラフ表現を構築し、そこでは各ノードとエッジがそれぞれ組織領域とその相互作用を描写する。 トレーニング中、グラフ分類ヘッドはWSIを分類し、ポストホック特徴属性を介してノードレベルの擬似ラベルを生成する。 これらの擬似ラベルは、wsiセグメンテーションのためのノード分類ヘッドを訓練するために使用される。 テスト中、両方のヘッドは入力WSIのクラス予測とセグメンテーションを同時にレンダリングする。 前立腺癌3例を対象にWholeSIGHTの評価を行った。 本手法は,全データセットにおける最先端の弱教師付きセグメンテーション性能を実現し,最先端の弱教師付きwsi分類法に対して,同等の分類を行った。 さらに,セグメンテーションと分類性能,不確実性推定,モデルキャリブレーションの観点から,本手法の一般化能力を定量化する。

The segmentation and automatic identification of histological regions of diagnostic interest offer a valuable aid to pathologists. However, segmentation methods are hampered by the difficulty of obtaining pixel-level annotations, which are tedious and expensive to obtain for Whole-Slide images (WSI). To remedy this, weakly supervised methods have been developed to exploit the annotations directly available at the image level. However, to our knowledge, none of these techniques is adapted to deal with WSIs. In this paper, we propose WholeSIGHT, a weakly-supervised method, to simultaneously segment and classify WSIs of arbitrary shapes and sizes. Formally, WholeSIGHT first constructs a tissue-graph representation of the WSI, where the nodes and edges depict tissue regions and their interactions, respectively. During training, a graph classification head classifies the WSI and produces node-level pseudo labels via post-hoc feature attribution. These pseudo labels are then used to train a node classification head for WSI segmentation. During testing, both heads simultaneously render class prediction and segmentation for an input WSI. We evaluated WholeSIGHT on three public prostate cancer WSI datasets. Our method achieved state-of-the-art weakly-supervised segmentation performance on all datasets while resulting in better or comparable classification with respect to state-of-the-art weakly-supervised WSI classification methods. Additionally, we quantify the generalization capability of our method in terms of segmentation and classification performance, uncertainty estimation, and model calibration.
翻訳日:2023-01-10 17:00:45 公開日:2023-01-07
# 深層特徴学習による3次元指ナックル認識の進歩

Advancing 3D finger knuckle recognition via deep feature learning ( http://arxiv.org/abs/2301.02934v1 )

ライセンス: Link先を確認
Kevin H. M. Cheng, Xu Cheng, and Guoying Zhao(参考訳) 無接触の3dフィンガーナックルパターンは、その識別性、距離からの視認性、利便性のために、効果的な生体認証として出現した。 近年,ディープニューラルネットワークの中間機能を複数のスケールで同時に組み込むディープフィーチャーコラボレーションネットワークが開発されている。 しかし,本手法は大きな特徴次元をもたらし,新しいクラスの導入を制限するプローブサンプルの比較には,訓練された分類層が必要である。 本稿では,3次元指のナックル画像を表すため,最小次元の識別特徴ベクトルを学習する可能性について検討する。 実験結果は3Dフィンガーナックル画像データベースを用いて,一般的なディープラーニングアーキテクチャや最先端の3Dフィンガーナックル認識手法との比較を行った。 提案手法は, より実用的な特徴比較シナリオ, すなわち, 抽出した深部特徴を, 試験試料の比較のために, 訓練した分類層ではなく, 抽出した深部特徴を用いて, 分類および識別タスクにおいて優れた結果を与える。 さらに重要なのは、このアプローチが機能テンプレートのサイズを99%削減できることです。 提案手法の有効性と一般化性を確認するために,類似パターンを持つ他の2つの公開バイオメトリックデータベースを用いて実験を行った。

Contactless 3D finger knuckle patterns have emerged as an effective biometric identifier due to its discriminativeness, visibility from a distance, and convenience. Recent research has developed a deep feature collaboration network which simultaneously incorporates intermediate features from deep neural networks with multiple scales. However, this approach results in a large feature dimension, and the trained classification layer is required for comparing probe samples, which limits the introduction of new classes. This paper advances this approach by investigating the possibility of learning a discriminative feature vector with the least possible dimension for representing 3D finger knuckle images. Experimental results are presented using a publicly available 3D finger knuckle images database with comparisons to popular deep learning architectures and the state-of-the-art 3D finger knuckle recognition methods. The proposed approach offers outperforming results in classification and identification tasks under the more practical feature comparison scenario, i.e., using the extracted deep feature instead of the trained classification layer for comparing probe samples. More importantly, this approach can offer 99% reduction in the size of feature templates, which is highly attractive for deploying biometric systems in the real world. Experiments are also performed using other two public biometric databases with similar patterns to ascertain the effectiveness and generalizability of our proposed approach.
翻訳日:2023-01-10 17:00:22 公開日:2023-01-07
# セマンティックマッチングとエッジアライメントによる光リモートセンシング画像における軽量な有向物体検出

Lightweight Salient Object Detection in Optical Remote Sensing Images via Semantic Matching and Edge Alignment ( http://arxiv.org/abs/2301.02778v1 )

ライセンス: Link先を確認
Gongyang Li, Zhi Liu, Xinpeng Zhang, Weisi Lin(参考訳) 近年,畳み込みニューラルネットワーク(cnns)に依存する光リモートセンシング画像(ori-sod)における物体検出手法が数多く提案されている。 しかし、ほとんどの手法はcnnがもたらした膨大なパラメータと計算コストを無視しており、可搬性と移動性に注意を払うのはごくわずかである。 本稿では,セマンティックマッチングとエッジアライメントに基づくORSI-SODのための新しい軽量ネットワークSeaNetを提案する。 具体的には、機能抽出のための軽量MobileNet-V2、高レベルの機能のための動的セマンティックマッチングモジュール(DSMM)、低レベルの機能のためのエッジ自己調整モジュール(ESAM)、推論のためのポータブルデコーダを含む。 まず、高レベルの機能はセマンティックカーネルに圧縮される。 次に,DSMMの動的畳み込み操作により,高次特徴の2つのグループにおける有能なオブジェクト位置を活性化する。 一方,ESAMでは,低レベル特徴群2群から抽出したクロススケールエッジ情報をL2損失により自己整合させ,詳細化に利用する。 最後に、最高レベルの特徴から、デコーダは2つのモジュールの出力に含まれる正確な位置と細部に基づいて、正常なオブジェクトを推論する。 2つの公開データセットに関する大規模な実験によると、私たちの軽量SeaNetは、最先端の軽量メソッドよりも優れているだけでなく、最先端の従来手法と同等の精度を得られる。 私たちのコードと結果はhttps://github.com/mathlee/seanetで入手できます。

Recently, relying on convolutional neural networks (CNNs), many methods for salient object detection in optical remote sensing images (ORSI-SOD) are proposed. However, most methods ignore the huge parameters and computational cost brought by CNNs, and only a few pay attention to the portability and mobility. To facilitate practical applications, in this paper, we propose a novel lightweight network for ORSI-SOD based on semantic matching and edge alignment, termed SeaNet. Specifically, SeaNet includes a lightweight MobileNet-V2 for feature extraction, a dynamic semantic matching module (DSMM) for high-level features, an edge self-alignment module (ESAM) for low-level features, and a portable decoder for inference. First, the high-level features are compressed into semantic kernels. Then, semantic kernels are used to activate salient object locations in two groups of high-level features through dynamic convolution operations in DSMM. Meanwhile, in ESAM, cross-scale edge information extracted from two groups of low-level features is self-aligned through L2 loss and used for detail enhancement. Finally, starting from the highest-level features, the decoder infers salient objects based on the accurate locations and fine details contained in the outputs of the two modules. Extensive experiments on two public datasets demonstrate that our lightweight SeaNet not only outperforms most state-of-the-art lightweight methods but also yields comparable accuracy with state-of-the-art conventional methods, while having only 2.76M parameters and running with 1.7G FLOPs for 288x288 inputs. Our code and results are available at https://github.com/MathLee/SeaNet.
翻訳日:2023-01-10 16:50:22 公開日:2023-01-07
# CGI-Stereo:コンテキストと幾何学的相互作用による正確なリアルタイムステレオマッチング

CGI-Stereo: Accurate and Real-Time Stereo Matching via Context and Geometry Interaction ( http://arxiv.org/abs/2301.02789v1 )

ライセンス: Link先を確認
Gangwei Xu, Huan Zhou, Xin Yang(参考訳) 本稿では,リアルタイム性能,最先端精度,強汎化能力を同時に達成できる新しいニューラルネットワークアーキテクチャであるcgi-stereoを提案する。 cgi-stereoの中核はcontext and geometry fusion(cgf)ブロックで、より正確で効率的なコストアグリゲーションのために、コンテキストと幾何情報を適応的に融合し、さらに、より効果的なコンテキスト特徴抽出を導くために、機能学習にフィードバックを提供します。 提案したCGFは, PSMNet, GwcNet, ACVNetなどの既存のステレオマッチングネットワークに容易に組み込むことができる。 結果として得られるネットワークは、大きなマージンで精度が向上する。 特に、我々のCGFとAVVNetを統合するモデルは、公表されたすべての方法の中で、KITTI 2012のリーダーボードで1位にランクインする可能性がある。 さらに,注意量として相関量を利用して特徴量のフィルタリングを行う,意図的かつ簡潔なコスト容積(AFV)を提案する。 CGFとAFVに基づいて、提案されたCGI-Stereoは、KITTIベンチマークで発表された他のすべてのリアルタイムメソッドよりも優れており、他のリアルタイムメソッドよりも優れた一般化能力を示している。 コードはhttps://github.com/gangweiX/CGI-Stereoで公開されている。

In this paper, we propose CGI-Stereo, a novel neural network architecture that can concurrently achieve real-time performance, state-of-the-art accuracy, and strong generalization ability. The core of our CGI-Stereo is a Context and Geometry Fusion (CGF) block which adaptively fuses context and geometry information for more accurate and efficient cost aggregation and meanwhile provides feedback to feature learning to guide more effective contextual feature extraction. The proposed CGF can be easily embedded into many existing stereo matching networks, such as PSMNet, GwcNet and ACVNet. The resulting networks are improved in accuracy by a large margin. Specially, the model which integrates our CGF with ACVNet could rank 1st on the KITTI 2012 leaderboard among all the published methods. We further propose an informative and concise cost volume, named Attention Feature Volume (AFV), which exploits a correlation volume as attention weights to filter a feature volume. Based on CGF and AFV, the proposed CGI-Stereo outperforms all other published real-time methods on KITTI benchmarks and shows better generalization ability than other real-time methods. The code is available at https://github.com/gangweiX/CGI-Stereo.
翻訳日:2023-01-10 16:49:50 公開日:2023-01-07
# 決定の問題とは何か?

What is a decision problem? ( http://arxiv.org/abs/2301.02758v1 )

ライセンス: Link先を確認
Alberto Colorni and Alexis Tsouki\`as(参考訳) 本稿では,決定問題とは何か,という一般的な枠組みを提案する。 私たちのモチベーションは、意思決定分析と運用研究がメソッドのクラスを中心に(規律として)構成されているという事実に関連しています。 この目的のために、既存のメソッドとは独立した新しいフレームワークを導入し、クライアントによって提供された(あるいは引き出された)プリミティブに基づいています。 本研究は, 決定問題の種類が有限であることを示し, 決定支援手法を提案する。

This paper presents a general framework about what is a decision problem. Our motivation is related to the fact that decision analysis and operational research are structured (as disciplines) around classes of methods, while instead we should first characterise the decision problems our clients present us. For this purpose we introduce a new framework, independent from any existing method, based upon primitives provided by (or elicited from) the client. We show that the number of archetypal decision problems are finite and so the archetypal decision support methods.
翻訳日:2023-01-10 16:40:38 公開日:2023-01-07
# 知識グラフとソフトルールの協調モデリングによる知識推論

Knowledge Reasoning via Jointly Modeling Knowledge Graphs and Soft Rules ( http://arxiv.org/abs/2301.02781v1 )

ライセンス: Link先を確認
Yinyu Lan, Shizhu He, Kang Liu, Jun Zhao(参考訳) 知識グラフ(KG)は、質問応答など多くのアプリケーションにおいて重要な役割を担っているが、その広範なアプリケーションにとって不完全性は緊急の問題である。 知識グラフ補完(KGC)に関する多くの研究がこの問題を解決するために行われている。 kgcの方法は、ルールベース推論と埋め込みベース推論の2つの主要なカテゴリに分類できる。 前者は高い精度と優れた解釈能力を有するが、大きなkgの効果的なルールを得ることが大きな課題である。 後者は優れた効率性とスケーラビリティを持っているが、データ豊かさに大きく依存しており、論理ルールの形でドメイン知識を完全に使用することはできない。 規則と埋め込みを最大限に活用するために,規則を注入し,反復的に表現を学習する新しい手法を提案する。 具体的には、ルールグラウンドの結論を0-1変数としてモデル化し、ルール信頼度調整器を用いて結論の不確実性を取り除く。 提案手法には次のような利点がある。 1) ルールと知識グラフの埋め込み(KGE)の両方の利点を組み合わせ、効率性とスケーラビリティのバランスを良くする。 2) 反復法を用いてKGEを継続的に改善し, 誤った規則結論を除去する。 2つの公開データセットで評価した結果,提案手法は現在の最先端手法よりも優れており,平均相反ランク(MRR)では2.7\%,4.3\%の性能向上が見られた。

Knowledge graphs (KGs) play a crucial role in many applications, such as question answering, but incompleteness is an urgent issue for their broad application. Much research in knowledge graph completion (KGC) has been performed to resolve this issue. The methods of KGC can be classified into two major categories: rule-based reasoning and embedding-based reasoning. The former has high accuracy and good interpretability, but a major challenge is to obtain effective rules on large-scale KGs. The latter has good efficiency and scalability, but it relies heavily on data richness and cannot fully use domain knowledge in the form of logical rules. We propose a novel method that injects rules and learns representations iteratively to take full advantage of rules and embeddings. Specifically, we model the conclusions of rule groundings as 0-1 variables and use a rule confidence regularizer to remove the uncertainty of the conclusions. The proposed approach has the following advantages: 1) It combines the benefits of both rules and knowledge graph embeddings (KGEs) and achieves a good balance between efficiency and scalability. 2) It uses an iterative method to continuously improve KGEs and remove incorrect rule conclusions. Evaluations on two public datasets show that our method outperforms the current state-of-the-art methods, improving performance by 2.7\% and 4.3\% in mean reciprocal rank (MRR).
翻訳日:2023-01-10 16:40:31 公開日:2023-01-07
# 並列コーパスの構築とルガンダと英語間の翻訳モデルの学習

Building a Parallel Corpus and Training Translation Models Between Luganda and English ( http://arxiv.org/abs/2301.02773v1 )

ライセンス: Link先を確認
Richard Kimera, Daniela N. Rim, Heeyoul Choi(参考訳) neural machine translation (nmt)は大規模なデータセットで大きな成功を収めているため、nmtは高リソース言語を前提としている。 これは、高品質な並列コーパスがないために、lugandaのような低リソース言語を継続的に支えているため、この執筆時点では「google translate」でさえlugandaに役立たない。 本稿では,3つの異なるオープンソースコーパスに基づいて,luganda と english のペアセンテンス 41,070 の並列コーパスを構築する。 そして、データセット上で超パラメータ探索を用いてNMTモデルを訓練する。 BLEUのスコアはルガンダから英語まで21.28点、英語からルガンダまで17.47点だった。 いくつかの翻訳例は翻訳の質の高さを示している。 我々のモデルは最初のルガンダ英語NMTモデルであると信じている。 私たちが構築したバイリンガルデータセットが一般公開される予定です。

Neural machine translation (NMT) has achieved great successes with large datasets, so NMT is more premised on high-resource languages. This continuously underpins the low resource languages such as Luganda due to the lack of high-quality parallel corpora, so even 'Google translate' does not serve Luganda at the time of this writing. In this paper, we build a parallel corpus with 41,070 pairwise sentences for Luganda and English which is based on three different open-sourced corpora. Then, we train NMT models with hyper-parameter search on the dataset. Experiments gave us a BLEU score of 21.28 from Luganda to English and 17.47 from English to Luganda. Some translation examples show high quality of the translation. We believe that our model is the first Luganda-English NMT model. The bilingual dataset we built will be available to the public.
翻訳日:2023-01-10 16:31:39 公開日:2023-01-07
# スペクトル範囲とデリバティブオーダーをまたいだ物理情報ニューラルネットワークの収束挙動に関する研究

Investigations on convergence behaviour of Physics Informed Neural Networks across spectral ranges and derivative orders ( http://arxiv.org/abs/2301.02790v1 )

ライセンス: Link先を確認
Mayank Deshpande, Siddharth Agarwal, Vukka Snigdha, Arya Kumar Bhattacharya(参考訳) ニューラル・タンジェント・カーネル(ntk)理論からの重要な推論は、スペクトルバイアス(sb)の存在であり、つまり、訓練中に高い周波数よりもかなり速く学習される完全連結型人工ニューラルネットワーク(ann)のターゲット関数の低周波成分である。 これは、非常に低い学習率パラメータを持つ平均平方誤差(MSE)損失関数に対して確立される。 物理学 Informed Neural Networks (PINN) は任意の順序の微分方程式(DE)の解を学習するために設計されており、PINN では損失関数は DE の保守形式の残余として得られ、方程式の不満の度合いを表す。 ですから 疑問が残っています (a)PINNもSBおよびSBを示す b) もしそうなら、このバイアスはDESの順序によってどのように異なるか。 本研究では, 様々な周波数, 組成, 方程式順序の単純な正弦波関数に関する数値実験を行い, これらの問題を考察した。 正規化条件下では、ピンは強いスペクトルバイアスを示しており、微分方程式の順序に従って増加することが確証されている。

An important inference from Neural Tangent Kernel (NTK) theory is the existence of spectral bias (SB), that is, low frequency components of the target function of a fully connected Artificial Neural Network (ANN) being learnt significantly faster than the higher frequencies during training. This is established for Mean Square Error (MSE) loss functions with very low learning rate parameters. Physics Informed Neural Networks (PINNs) are designed to learn the solutions of differential equations (DE) of arbitrary orders; in PINNs the loss functions are obtained as the residues of the conservative form of the DEs and represent the degree of dissatisfaction of the equations. So there has been an open question whether (a) PINNs also exhibit SB and (b) if so, how does this bias vary across the orders of the DEs. In this work, a series of numerical experiments are conducted on simple sinusoidal functions of varying frequencies, compositions and equation orders to investigate these issues. It is firmly established that under normalized conditions, PINNs do exhibit strong spectral bias, and this increases with the order of the differential equation.
翻訳日:2023-01-10 16:14:43 公開日:2023-01-07
# 効率的なガウスプロセスサロゲートによる能動的深層学習

Active Deep Learning Guided by Efficient Gaussian Process Surrogates ( http://arxiv.org/abs/2301.02761v1 )

ライセンス: Link先を確認
Yunpyo An, Suyeong Park, Kwang In Kim(参考訳) アクティブラーニングの成功は、基礎となるデータ生成分布の探索、疎いラベル付きデータ領域の投入、ベースライン(ニューラルネットワーク)学習者によって得られたタスクに関する情報の活用に依存している。 本稿では,これら2つのアクティブ学習モードを組み合わせた新しいアルゴリズムを提案する。 提案アルゴリズムは,ベースライン学習者に対してベイジアンサロゲートを採用し,新しいラベルによる情報の獲得を最大化して探索プロセスを最適化する。 さらに,新たなデータインスタンス毎にサロゲート学習者を即時更新することにより,学習者の継続的な学習行動を忠実にシミュレートし,活用することができる。 4つのベンチマーク分類データセットを用いた実験で,本手法は最先端技術よりも顕著な性能向上を示した。

The success of active learning relies on the exploration of the underlying data-generating distributions, populating sparsely labeled data areas, and exploitation of the information about the task gained by the baseline (neural network) learners. In this paper, we present a new algorithm that combines these two active learning modes. Our algorithm adopts a Bayesian surrogate for the baseline learner, and it optimizes the exploration process by maximizing the gain of information caused by new labels. Further, by instantly updating the surrogate learner for each new data instance, our model can faithfully simulate and exploit the continuous learning behavior of the learner without having to actually retrain it per label. In experiments with four benchmark classification datasets, our method demonstrated significant performance gain over state-of-the-arts.
翻訳日:2023-01-10 16:05:11 公開日:2023-01-07
# クロスモーダル類似性マッチングを用いた事前学習型マルチモーダル表現の変換

Transferring Pre-trained Multimodal Representations with Cross-modal Similarity Matching ( http://arxiv.org/abs/2301.02903v1 )

ライセンス: Link先を確認
Byoungjip Kim, Sungik Choi, Dasol Hwang, Moontae Lee, Honglak Lee(参考訳) ゼロショット転送における驚くべきパフォーマンスにもかかわらず、大規模なマルチモーダルモデルの事前トレーニングは、大量のデータとコンピューティングリソースを必要とするため、しばしば禁止される。 本稿では,大規模な事前学習型マルチモーダルモデル(CLIP-ViT)の表現を小さなターゲットモデル(ResNet-18など)に効果的に転送する手法を提案する。 教師なしトランスファーには,教師モデルの表現をテキストプロンプト埋め込みの相対的類似度分布にマッチさせることで学習できるクロスモーダル類似度マッチング(CSM)を導入する。 テキストプロンプトをよりよくエンコードするために、入力テキストプロンプトの語彙的曖昧さを軽減するコンテキストベースのプロンプト拡張(CPA)を設計する。 本実験では,事前学習された視覚言語モデルの教師なし表現転送により,視覚のみ自己教師あり学習 (ssl) 法 (simclr: 51.8%, swav: 63.7%) よりも,imagenet-1k top-1線形プローブ精度 (66.2%) が向上し,教師あり学習 (69.8%) でギャップを縮められることを示した。

Despite surprising performance on zero-shot transfer, pre-training a large-scale multimodal model is often prohibitive as it requires a huge amount of data and computing resources. In this paper, we propose a method (BeamCLIP) that can effectively transfer the representations of a large pre-trained multimodal model (CLIP-ViT) into a small target model (e.g., ResNet-18). For unsupervised transfer, we introduce cross-modal similarity matching (CSM) that enables a student model to learn the representations of a teacher model by matching the relative similarity distribution across text prompt embeddings. To better encode the text prompts, we design context-based prompt augmentation (CPA) that can alleviate the lexical ambiguity of input text prompts. Our experiments show that unsupervised representation transfer of a pre-trained vision-language model enables a small ResNet-18 to achieve a better ImageNet-1K top-1 linear probe accuracy (66.2%) than vision-only self-supervised learning (SSL) methods (e.g., SimCLR: 51.8%, SwAV: 63.7%), while closing the gap with supervised learning (69.8%).
翻訳日:2023-01-10 16:04:57 公開日:2023-01-07
# 非パラメトリック部分グラフマッチングによるグラフニューラルネットワークの解説

Explaining Graph Neural Networks via Non-parametric Subgraph Matching ( http://arxiv.org/abs/2301.02780v1 )

ライセンス: Link先を確認
Fang Wu, Siyuan Li, Lirong Wu, Dragomir Radev, Yinghui Jiang, Xurui Jin, Zhangming Niu, Stan Z. Li(参考訳) グラフニューラルネットワーク(GNN)の大きな成功は、説明可能性に関する疑問を引き起こしている。 特に、ブラックボックス(すなわちターゲットGNN)を解読する能力が強いため、パラメトリックな説明器が既存のアプローチで普及している。 本稿では,グラフが通常,いくつかの共同モチーフパターンを共有するという観察に基づいて,MatchExplainerと呼ばれる新しい非パラメトリックサブグラフマッチングフレームワークを提案する。 ターゲットグラフと他のインスタンスを結合し、ノードに対応する距離を最小化することで最も重要な結合部分構造を識別する。 さらに,現在のグラフサンプリングやノードドロップ法は,通常,偽陽性サンプリング問題に悩まされる。 この問題を改善するために、MatchDropという新しい拡張パラダイムを設計する。 MatchExplainerを利用して、グラフの最も情報性の高い部分を修正し、残りの少ない部分でグラフ拡張を単に操作する。 我々は、合成データセットと実世界のデータセットの両方で広範な実験を行い、MatchExplainerの有効性を示す。 また,我々のMatchDropは,性能向上のためにGNNを組み込むための一般的なスキームであることを示す。

The great success in graph neural networks (GNNs) provokes the question about explainability: Which fraction of the input graph is the most determinant of the prediction? Particularly, parametric explainers prevail in existing approaches because of their stronger capability to decipher the black-box (i.e., the target GNN). In this paper, based on the observation that graphs typically share some joint motif patterns, we propose a novel non-parametric subgraph matching framework, dubbed MatchExplainer, to explore explanatory subgraphs. It couples the target graph with other counterpart instances and identifies the most crucial joint substructure by minimizing the node corresponding-based distance. Moreover, we note that present graph sampling or node-dropping methods usually suffer from the false positive sampling problem. To ameliorate that issue, we design a new augmentation paradigm named MatchDrop. It takes advantage of MatchExplainer to fix the most informative portion of the graph and merely operates graph augmentations on the rest less informative part. We conduct extensive experiments on both synthetic and real-world datasets and show the effectiveness of our MatchExplainer by outperforming all parametric baselines with significant margins. Additional results also demonstrate that our MatchDrop is a general scheme to be equipped with GNNs for enhanced performance.
翻訳日:2023-01-10 15:56:52 公開日:2023-01-07
# リレーショナル埋め込みを用いたグラフニューラルネットワークの過平滑化低減

Reducing Over-smoothing in Graph Neural Networks Using Relational Embeddings ( http://arxiv.org/abs/2301.02924v1 )

ライセンス: Link先を確認
Yeskendir Koishekenov(参考訳) グラフニューラルネットワーク(GNN)は、グラフ構造化データで大きな成功を収めています。 しかし,GNNの性能は層数の増加とともに向上しない(あるいはさらに悪化する)ことが観察された。 この効果はオーバー・スムーシング(over-smoothing)として知られており、複数の層を積み重ねると、異なるクラスのグラフノードの表現が区別不能になることを意味する。 本研究では,ノード埋め込み間の関係を明示的に利用することにより,GNNにおけるオーバースムーシング問題の影響を緩和する,シンプルで効率的な手法を提案する。 実世界のデータセットの実験では、ノードの埋め込み関係を利用することで、グラフアテンションネットワークのようなGNNモデルが過度にスムースに堅牢になり、より深いGNNでより良いパフォーマンスを実現することが示されている。 我々の手法は他の手法と組み合わせて最高の性能を与えることができる。 GNNアプリケーションは無限に存在し、ユーザーの目的や保有するデータの種類に依存します。 余計な問題を解くことで、これらのタスクでモデルのパフォーマンスが向上する可能性がある。

Graph Neural Networks (GNNs) have achieved a lot of success with graph-structured data. However, it is observed that the performance of GNNs does not improve (or even worsen) as the number of layers increases. This effect has known as over-smoothing, which means that the representations of the graph nodes of different classes would become indistinguishable when stacking multiple layers. In this work, we propose a new simple, and efficient method to alleviate the effect of the over-smoothing problem in GNNs by explicitly using relations between node embeddings. Experiments on real-world datasets demonstrate that utilizing node embedding relations makes GNN models such as Graph Attention Network more robust to over-smoothing and achieves better performance with deeper GNNs. Our method can be used in combination with other methods to give the best performance. GNN applications are endless and depend on the user's objective and the type of data that they possess. Solving over-smoothing issues can potentially improve the performance of models on all these tasks.
翻訳日:2023-01-10 15:56:32 公開日:2023-01-07
# 強化学習におけるマルコフ連鎖濃度の応用

Markov Chain Concentration with an Application in Reinforcement Learning ( http://arxiv.org/abs/2301.02926v1 )

ライセンス: Link先を確認
Debangshu Banerjee(参考訳) x_1,\cdot ,x_n$ 確率変数のジョイント分布が $\mu$ として与えられると、これらの確率変数に対して任意のリプシッツ関数 $f$ を示すのに martingale 法を使う。 しかし、変数パラメータは特定の条件下で単純な式を持つことができる。 例えば、確率変数がマルコフ連鎖に従うという仮定の下で、関数は重み付きハミング計量の下でリプシッツである。 強化学習における無作為過程のスープレマの集中化から, 一定の知名度の高い手法で結論づける。

Given $X_1,\cdot ,X_N$ random variables whose joint distribution is given as $\mu$ we will use the Martingale Method to show any Lipshitz Function $f$ over these random variables is subgaussian. The Variance parameter however can have a simple expression under certain conditions. For example under the assumption that the random variables follow a Markov Chain and that the function is Lipschitz under a Weighted Hamming Metric. We shall conclude with certain well known techniques from concentration of suprema of random processes with applications in Reinforcement Learning
翻訳日:2023-01-10 15:56:14 公開日:2023-01-07
# 近隣言語モデルはなぜ機能するのか?

Why do Nearest Neighbor Language Models Work? ( http://arxiv.org/abs/2301.02828v1 )

ライセンス: Link先を確認
Frank F. Xu, Uri Alon, Graham Neubig(参考訳) 言語モデル(LM)は、すでに見られる文脈の表現を逐次計算し、この表現を使って次の単語を予測することによって、テキストの確率を計算する。 現在、ほとんどのLMは、直前のコンテキストを消費するニューラルネットワークを通じてこれらの表現を計算する。 しかし、近年、検索拡張されたLMは、標準的なパラメトリックの次の単語予測に加えて、大きなデータストアから取得した情報にアクセスすることで、標準的なニューラルLMよりも改善されている。 本稿では,検索型言語モデル,特にk-nearest近傍言語モデル(knn-lms)が標準パラメトリックlmsよりも優れた性能を発揮する理由について,k-nearest隣接コンポーネントがlmが当初トレーニングしていたのと同じトレーニングセットから例を取り出す場合においても理解する。 この目的のために、kNN-LMが標準のLMから分岐する様々な次元を慎重に分析し、これらの次元を1つずつ調べる。 実験により、kNN-LMが標準のLMよりも優れている主な理由は、次のトークンの予測に異なる入力表現を用いること、kNN探索の近似、kNN分布におけるソフトマックス温度の重要性である。 さらに、これらの知見を標準パラメトリックLMのモデルアーキテクチャやトレーニング手順に組み込んで、明示的な検索コンポーネントを必要とせずに結果を改善する。 コードはhttps://github.com/frankxu2004/knnlm-whyで入手できる。

Language models (LMs) compute the probability of a text by sequentially computing a representation of an already-seen context and using this representation to predict the next word. Currently, most LMs calculate these representations through a neural network consuming the immediate previous context. However recently, retrieval-augmented LMs have shown to improve over standard neural LMs, by accessing information retrieved from a large datastore, in addition to their standard, parametric, next-word prediction. In this paper, we set out to understand why retrieval-augmented language models, and specifically why k-nearest neighbor language models (kNN-LMs) perform better than standard parametric LMs, even when the k-nearest neighbor component retrieves examples from the same training set that the LM was originally trained on. To this end, we perform a careful analysis of the various dimensions over which kNN-LM diverges from standard LMs, and investigate these dimensions one by one. Empirically, we identify three main reasons why kNN-LM performs better than standard LMs: using a different input representation for predicting the next tokens, approximate kNN search, and the importance of softmax temperature for the kNN distribution. Further, we incorporate these insights into the model architecture or the training procedure of the standard parametric LM, improving its results without the need for an explicit retrieval component. The code is available at https://github.com/frankxu2004/knnlm-why.
翻訳日:2023-01-10 15:50:03 公開日:2023-01-07
# RLAS-BIABC:改良ABCアルゴリズムによるBERTモデルを用いた強化学習に基づく回答選択

RLAS-BIABC: A Reinforcement Learning-Based Answer Selection Using the BERT Model Boosted by an Improved ABC Algorithm ( http://arxiv.org/abs/2301.02807v1 )

ライセンス: Link先を確認
Hamid Gharagozlou, Javad Mohammadzadeh, Azam Bastanfard and Saeed Shiry Ghidary(参考訳) 回答選択(AS)は、オープンドメイン質問応答(QA)問題の重要なサブタスクである。 本稿では,事前学習のための改良された人工蜂コロニー(ABC)アルゴリズムと,トレーニングバックプロパゲーション(BP)アルゴリズムのための強化学習に基づくアルゴリズムによって強化された,アテンション機構に基づく長短期記憶(LSTM)と変換器(BERT)ワード埋め込みからの双方向エンコーダ表現に基づいて構築されたRLAS-BIABC for ASを提案する。 BERTは下流の作業で構成することができ、タスク固有の統合アーキテクチャとして微調整され、事前訓練されたBERTモデルは異なる言語的効果を得ることができる。 既存のアルゴリズムは通常、2クラスの分類器に対して正負のペアでASモデルを訓練する。 正のペアは質問と真正の回答を含み、負のペアは質問と偽の回答を含む。 出力は正の対、負の対の対はゼロである。 通常、負のペアはプラス以上であり、システム性能を劇的に低下させる不均衡な分類につながる。 そこで本研究では,エージェントが各ステップでサンプルを取得して分類する逐次的意思決定プロセスとして分類を定義する。 各分類操作において、エージェントは、多数クラスの賞が少数クラスの賞より少ない報酬を受け取る。 最終的に、エージェントはポリシーの重み付けの最適な値を見つける。 abcアルゴリズムの改良により,方針重み付けを初期化する。 初期値技術は、局所的な最適化で行き詰まるような問題を防ぐことができる。 ABCは、ほとんどのタスクでうまく機能するが、隣り合う食料源の位置を見つける際に、関連する個人の適合性を無視するABCアルゴリズムには依然として弱点がある。

Answer selection (AS) is a critical subtask of the open-domain question answering (QA) problem. The present paper proposes a method called RLAS-BIABC for AS, which is established on attention mechanism-based long short-term memory (LSTM) and the bidirectional encoder representations from transformers (BERT) word embedding, enriched by an improved artificial bee colony (ABC) algorithm for pretraining and a reinforcement learning-based algorithm for training backpropagation (BP) algorithm. BERT can be comprised in downstream work and fine-tuned as a united task-specific architecture, and the pretrained BERT model can grab different linguistic effects. Existing algorithms typically train the AS model with positive-negative pairs for a two-class classifier. A positive pair contains a question and a genuine answer, while a negative one includes a question and a fake answer. The output should be one for positive and zero for negative pairs. Typically, negative pairs are more than positive, leading to an imbalanced classification that drastically reduces system performance. To deal with it, we define classification as a sequential decision-making process in which the agent takes a sample at each step and classifies it. For each classification operation, the agent receives a reward, in which the prize of the majority class is less than the reward of the minority class. Ultimately, the agent finds the optimal value for the policy weights. We initialize the policy weights with the improved ABC algorithm. The initial value technique can prevent problems such as getting stuck in the local optimum. Although ABC serves well in most tasks, there is still a weakness in the ABC algorithm that disregards the fitness of related pairs of individuals in discovering a neighboring food source position.
翻訳日:2023-01-10 15:47:30 公開日:2023-01-07
# 最適化のための lite fireworks アルゴリズム

A Lite Fireworks Algorithm for Optimization ( http://arxiv.org/abs/2301.02795v1 )

ライセンス: Link先を確認
Haimiao Mo, Min Zeng(参考訳) 花火アルゴリズムは花火の爆発現象をシミュレーションするための最適化アルゴリズムである。 高速収束と高精度のため、パターン認識、最適スケジューリング、その他の分野で広く使われている。 しかし、既存の花火アルゴリズムの研究のほとんどは、その欠陥に基づいて改善されており、花火アルゴリズムのパラメータ数を減らすことについてはほとんど考慮されていない。 オリジナルの花火アルゴリズムにはパラメータが多すぎるため、アルゴリズム調整のコストが増大し、工学的な応用には適さない。 また、花火の個体群では、未選択の個体が廃棄され、位置情報が浪費される。 そこで本研究では, 花火アルゴリズムのパラメータ数を削減し, 捨てられた個人の位置情報をフル活用するために, 花火アルゴリズムの簡易版を提案する。 花火アルゴリズムの爆発演算子を再設計することでアルゴリズムパラメータの数を削減し、ローカルマイニングとグローバル探索能力のバランスをとるために歴史的な最適情報を用いて適応的な爆発半径を構築する。 関数最適化の比較実験結果から,提案したLFWAの全体的な性能は,花火アルゴリズムや粒子群アルゴリズム,バットアルゴリズムなどの比較アルゴリズムよりも優れていることが示された。

The fireworks algorithm is an optimization algorithm for simulating the explosion phenomenon of fireworks. Because of its fast convergence and high precision, it is widely used in pattern recognition, optimal scheduling, and other fields. However, most of the existing research work on the fireworks algorithm is improved based on its defects, and little consideration is given to reducing the number of parameters of the fireworks algorithm. The original fireworks algorithm has too many parameters, which increases the cost of algorithm adjustment and is not conducive to engineering applications. In addition, in the fireworks population, the unselected individuals are discarded, thus causing a waste of their location information. To reduce the number of parameters of the original Fireworks Algorithm and make full use of the location information of discarded individuals, we propose a simplified version of the Fireworks Algorithm. It reduces the number of algorithm parameters by redesigning the explosion operator of the fireworks algorithm and constructs an adaptive explosion radius by using the historical optimal information to balance the local mining and global exploration capabilities. The comparative experimental results of function optimization show that the overall performance of our proposed LFWA is better than that of comparative algorithms, such as the fireworks algorithm, particle swarm algorithm, and bat algorithm.
翻訳日:2023-01-10 15:40:01 公開日:2023-01-07
# LAGA:地球電磁衛星スケジューリング問題に対する学習適応型遺伝的アルゴリズム

LAGA: A Learning Adaptive Genetic Algorithm for Earth Electromagnetic Satellite Scheduling Problem ( http://arxiv.org/abs/2301.02764v1 )

ライセンス: Link先を確認
Yanjie Song, Jie Chun, Qinwen Yang, Junwei Ou, Lining Xing, Yingwu Chen(参考訳) 地球電磁探査衛星は広い検出範囲と高い検出感度のため、多くの分野で広く利用されている。 複雑な環境と衛星の数の増加は、管理を主要な問題にしている。 地磁気衛星スケジューリング問題(EESSP)に対する学習適応型遺伝的アルゴリズム(LAGA)を提案する。 制御パラメータは進化アルゴリズムにとって不可欠であり、その問題に対する感度は、通常、チューニングパラメータに多くの労力を必要とする。 LAGAでは,GRU人工ニューラルネットワークモデルを用いて変動演算子のパラメータを制御する。 GRUモデルは、オンライン情報を利用して、人口探索中にパラメータを適応的に調整することができる。 さらに、GRUネットワークパラメータを更新するために、ポリシー勾配に基づく強化学習法を設計する。 アルゴリズムの適応的進化機構を用いることで、LAGAはクロスオーバー演算子を自律的に選択できる。 さらに、LAGAにはヒューリスティック初期化法、エリート戦略、局所探索法が採用され、全体的な性能が向上する。 提案手法は,最先端アルゴリズムと比較して十分な実験的検証により,eesspの最適解を得ることができる。

Earth electromagnetic exploration satellites are widely used in many fields due to their wide detection range and high detection sensitivity. The complex environment and the proliferating number of satellites make management a primary issue. We propose a learning adaptive genetic algorithm (LAGA) for the earth electromagnetic satellite scheduling problem (EESSP). Control parameters are vital for evolutionary algorithms, and their sensitivity to the problem makes tuning parameters usually require a lot of effort. In the LAGA, we use a GRU artificial neural network model to control the parameters of variation operators. The GRU model can utilize online information to achieve adaptive adjustment of the parameters during population search. Moreover, a policy gradient-based reinforcement learning method is designed to update the GRU network parameters. By using an adaptive evolution mechanism in the algorithm, the LAGA can autonomously select crossover operators. Furthermore, a heuristic initialization method, an elite strategy, and a local search method are adopted in the LAGA to enhance the overall performance. The proposed algorithm can obtain a more optimal solution on the EESSP through sufficient experimental validations compared to the state-of-the-art algorithms.
翻訳日:2023-01-10 15:39:17 公開日:2023-01-07
# 偽ニュース検出のための言語型アウェアニューラルネットワーク

Linguistic-style-aware Neural Networks for Fake News Detection ( http://arxiv.org/abs/2301.02792v1 )

ライセンス: Link先を確認
Xinyi Zhou, Jiayu Li, Qinzhou Li, Reza Zafarani(参考訳) 本稿では, 心理学的理論が示すように, 事実と区別可能な言語スタイルを学習し, 偽ニュースを予測するための階層的再帰ニューラルネットワーク(HERO)を提案する。 まず、ニュース文書の階層的言語木を作成し、それによって、各ニュース文書の言語スタイルを著者の単語の使用法に翻訳し、これらの単語を句、文、段落、そして最終的にその文書として再帰的に構成する。 階層的言語木をニューラルネットワークと統合することにより,言語的に有意な局所的かつグローバルな再帰的構造を捉えることにより,ニュース文書の表現を学習し,分類する。 これは、階層的言語木と、最良の知識にツリー情報を保存したニューラルネットワークを提供する最初の作品である。 パブリック・リアル・ワールド・データセットに基づく実験結果は、短いニュース文書と長いニュース文書の分類において最先端の技術に勝る提案手法の有効性を実証する。 また,偽ニュースと真理の差異を言語学的に検討し,偽ニュースのパターンを観察した。 コードとデータは公開されています。

We propose the hierarchical recursive neural network (HERO) to predict fake news by learning its linguistic style, which is distinguishable from the truth, as psychological theories reveal. We first generate the hierarchical linguistic tree of news documents; by doing so, we translate each news document's linguistic style into its writer's usage of words and how these words are recursively structured as phrases, sentences, paragraphs, and, ultimately, the document. By integrating the hierarchical linguistic tree with the neural network, the proposed method learns and classifies the representation of news documents by capturing their locally sequential and globally recursive structures that are linguistically meaningful. It is the first work offering the hierarchical linguistic tree and the neural network preserving the tree information to our best knowledge. Experimental results based on public real-world datasets demonstrate the proposed method's effectiveness, which can outperform state-of-the-art techniques in classifying short and long news documents. We also examine the differential linguistic style of fake news and the truth and observe some patterns of fake news. The code and data have been publicly available.
翻訳日:2023-01-10 15:38:38 公開日:2023-01-07
# 推論に基づく質問応答のための脳誘発記憶変換に基づく微分可能なニューラルネットワーク

A Brain-inspired Memory Transformation based Differentiable Neural Computer for Reasoning-based Question Answering ( http://arxiv.org/abs/2301.02809v1 )

ライセンス: Link先を確認
Yao Liang, Hongjian Fang, Yi Zeng and Feifei Zhao(参考訳) 推論と質問応答は、人間の基本的な認知機能でありながら、現在の人工知能にとって大きな課題である。 微分可能なニューラルネットワーク(DNC)モデルはそのような問題をある程度解決できるが、アルゴリズムの複雑さ、収束速度の遅さ、テストの堅牢性に制限されている。 本稿では,脳の学習・記憶機構にヒントを得て,記憶変換に基づく微分ニューラルネットワーク(MT-DNC)モデルを提案する。 mt-dncは作業記憶と長期記憶をdncに取り入れ、作業記憶と長期記憶の間の獲得経験の自律的変換を実現し、獲得した知識を効果的に抽出し推論能力を向上させる。 bAbI質問応答タスクの実験結果から,提案手法は既存のDNNモデルやDNCモデルよりも優れた性能と収束速度を実現することが示された。 アブレーション研究は、作業記憶から長期記憶への記憶変換が推論のロバスト性と安定性を改善する上で重要な役割を果たすことを示した。 この研究は、脳にインスパイアされたメモリ変換をどのように統合し、複雑なインテリジェントな対話と推論システムに適用するかを考察する。

Reasoning and question answering as a basic cognitive function for humans, is nevertheless a great challenge for current artificial intelligence. Although the Differentiable Neural Computer (DNC) model could solve such problems to a certain extent, the development is still limited by its high algorithm complexity, slow convergence speed, and poor test robustness. Inspired by the learning and memory mechanism of the brain, this paper proposed a Memory Transformation based Differentiable Neural Computer (MT-DNC) model. MT-DNC incorporates working memory and long-term memory into DNC, and realizes the autonomous transformation of acquired experience between working memory and long-term memory, thereby helping to effectively extract acquired knowledge to improve reasoning ability. Experimental results on bAbI question answering task demonstrated that our proposed method achieves superior performance and faster convergence speed compared to other existing DNN and DNC models. Ablation studies also indicated that the memory transformation from working memory to long-term memory plays essential role in improving the robustness and stability of reasoning. This work explores how brain-inspired memory transformation can be integrated and applied to complex intelligent dialogue and reasoning systems.
翻訳日:2023-01-10 15:38:18 公開日:2023-01-07
# 感情とキーワードに基づくビジュアルストーリー生成

Visual Story Generation Based on Emotion and Keywords ( http://arxiv.org/abs/2301.02777v1 )

ライセンス: Link先を確認
Yuetian Chen, Ruohua Li, Bowen Shi, Peiru Liu, Mei Si(参考訳) 自動ビジュアルストーリー生成は、キャラクターの感情的発達に対する一貫性、進行、順応性を示す、対応するイラストのストーリーを作成することを目的としている。 本研究は,ユーザとビジュアルストーリーを共同生成するストーリー生成パイプラインを提案する。 パイプラインにより、ユーザは生成されたコンテンツ上のイベントや感情を制御できる。 パイプラインには、物語と画像生成の2つの部分が含まれている。 ナラティブ生成では,ユーザが指定したキーワードと感情ラベルを用いて次の文を生成する。 画像生成には、各生成文に対応する視覚的にアピールする画像を作成するために拡散モデルを用いる。 さらに、生成した画像にオブジェクト認識を適用し、これらの画像内のオブジェクトを将来のストーリー開発で言及できるようにする。

Automated visual story generation aims to produce stories with corresponding illustrations that exhibit coherence, progression, and adherence to characters' emotional development. This work proposes a story generation pipeline to co-create visual stories with the users. The pipeline allows the user to control events and emotions on the generated content. The pipeline includes two parts: narrative and image generation. For narrative generation, the system generates the next sentence using user-specified keywords and emotion labels. For image generation, diffusion models are used to create a visually appealing image corresponding to each generated sentence. Further, object recognition is applied to the generated images to allow objects in these images to be mentioned in future story development.
翻訳日:2023-01-10 15:29:59 公開日:2023-01-07
# 高度データ拡張アプローチ:包括的調査と今後の方向性

Advanced Data Augmentation Approaches: A Comprehensive Survey and Future directions ( http://arxiv.org/abs/2301.02830v1 )

ライセンス: Link先を確認
Teerath Kumar, Muhammad Turab, Kislay Raj, Alessandra Mileo, Rob Brennan and Malika Bendechache(参考訳) ディープラーニング(DL)アルゴリズムは、様々なコンピュータビジョンタスクにおいて大きなパフォーマンスを示している。 しかし、ラベル付きデータに制限があるため、トレーニングデータに比べてネットワーク性能が悪いネットワークオーバーフィッティングの問題が発生する。 その結果、性能改善が制限される。 この問題に対処するため、ドロップアウト、正規化、高度なデータ拡張など様々な手法が提案されている。 これらのうち、サンプルの多様性を含むデータセットのサイズを拡大することを目的としたデータ拡張は、近年ホットな話題となっている。 本稿では,高度なデータ拡張技術に焦点を当てる。 データ拡張の背景、レビューされたデータ拡張技術の新しい包括的分類、および各テクニックの長所と短所(可能であればどこでも)を提供する。 また,画像分類,物体検出,意味セグメンテーションといった3つの一般的なコンピュータビジョンタスクに対するデータ拡張効果を総合的に評価する。 結果再現性のため、すべてのデータ拡張技術の利用可能なコードをコンパイルしました。 最後に,研究コミュニティの課題と課題,今後の方向性について考察する。 この調査はいくつかの利点をもたらします i) オーバーフィッティング問題を解決するためのデータ拡張作業機構を読者が理解する 二 調査結果は、比較目的で研究者の検索時間を節約する。 iii)前述のデータ拡張技術のコードは、https://github.com/kmr2017/advanced-data-augmentation-codesで利用可能である。 四 今後の研究が研究コミュニティに利益をもたらすこと。

Deep learning (DL) algorithms have shown significant performance in various computer vision tasks. However, having limited labelled data lead to a network overfitting problem, where network performance is bad on unseen data as compared to training data. Consequently, it limits performance improvement. To cope with this problem, various techniques have been proposed such as dropout, normalization and advanced data augmentation. Among these, data augmentation, which aims to enlarge the dataset size by including sample diversity, has been a hot topic in recent times. In this article, we focus on advanced data augmentation techniques. we provide a background of data augmentation, a novel and comprehensive taxonomy of reviewed data augmentation techniques, and the strengths and weaknesses (wherever possible) of each technique. We also provide comprehensive results of the data augmentation effect on three popular computer vision tasks, such as image classification, object detection and semantic segmentation. For results reproducibility, we compiled available codes of all data augmentation techniques. Finally, we discuss the challenges and difficulties, and possible future direction for the research community. We believe, this survey provides several benefits i) readers will understand the data augmentation working mechanism to fix overfitting problems ii) results will save the searching time of the researcher for comparison purposes. iii) Codes of the mentioned data augmentation techniques are available at https://github.com/kmr2017/Advanced-Data-augmentation-codes iv) Future work will spark interest in research community.
翻訳日:2023-01-10 15:29:49 公開日:2023-01-07
# EPR-Net: 変動力投影式による非平衡ポテンシャル景観の構築

EPR-Net: Constructing non-equilibrium potential landscape via a variational force projection formulation ( http://arxiv.org/abs/2301.01946v2 )

ライセンス: Link先を確認
Yue Zhao, Wei Zhang, Tiejun Li(参考訳) 本稿では,高次元非平衡定常状態(ness)システムの潜在景観を構築するための,新しい簡易な深層学習手法epr-netを提案する。 このアプローチの重要な考え方は、負ポテンシャル勾配が定常分布に関して重み付きヒルベルト空間における駆動力の直交射影であるという事実を利用することである。 構成された損失関数は、NESS理論のエントロピー生成率(EPR)式とも一致する。 このアプローチは、次元還元と状態依存拡散係数を統一的に扱うように拡張することができる。 提案手法のロバスト性および有効性は,マルチ安定性,リミットサイクル,あるいは非消滅雑音を持つ奇妙な誘引器を有する高次元生体物理モデルの数値的研究により実証された。

We present a novel yet simple deep learning approach, dubbed EPR-Net, for constructing the potential landscape of high-dimensional non-equilibrium steady state (NESS) systems. The key idea of our approach is to utilize the fact that the negative potential gradient is the orthogonal projection of the driving force in a weighted Hilbert space with respect to the steady-state distribution. The constructed loss function also coincides with the entropy production rate (EPR) formula in NESS theory. This approach can be extended to dealing with dimensionality reduction and state-dependent diffusion coefficients in a unified fashion. The robustness and effectiveness of the proposed approach are demonstrated by numerical studies of several high-dimensional biophysical models with multi-stability, limit cycle, or strange attractor with non-vanishing noise.
翻訳日:2023-01-10 13:17:47 公開日:2023-01-07