xGen-VideoSyn-1: High-fidelity Text-to-Video Synthesis with Compressed Representations [120.5] xGen-SynVideo-1(xGen-SynVideo-1)は、テキスト記述からリアルなシーンを生成することができるテキスト・ツー・ビデオ(T2V)生成モデルである。
VidVAEはビデオデータを空間的にも時間的にも圧縮し、視覚トークンの長さを大幅に削減する。
DiTモデルは、空間的および時間的自己アテンション層を取り入れ、異なる時間枠とアスペクト比をまたいだ堅牢な一般化を可能にする。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:55:22 GMT)
Arc2Face: A Foundation Model for ID-Consistent Human Faces [95.0] Arc2Faceは、ID条件のフェイスファンデーションモデルである。
既存のモデルと無矛盾の顔類似度で、多様なフォトリアリスティック画像を生成することができる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 22:06:29 GMT)
QuickLLaMA: Query-aware Inference Acceleration for Large Language Models [94.8] 大規模言語モデルに対するクエリ対応推論(Q-LLM)を導入する。
Q-LLMは、人間の認知に似た広範囲なシーケンスを処理するように設計されている。
特定のウィンドウサイズ内で関連する情報を正確にキャプチャし、クエリに対して正確な回答を提供する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 06:09:53 GMT)
On the Element-Wise Representation and Reasoning in Zero-Shot Image Recognition: A Systematic Survey [82.5] ゼロショット画像認識(ZSIR)は、目に見えない領域の認識と推論をモデルに与えることを目的としている。
本稿では,近年の素子ワイドZSIRの進歩について概説する。
まず、オブジェクト認識、合成認識、基礎モデルに基づくオープンワールド認識という3つの基本的なZSIRタスクを、統一された要素的視点に統合する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:04:29 GMT)
DGMamba: Domain Generalization via Generalized State Space Model [80.8] ドメイン一般化(DG)は、様々な場面における分散シフト問題を解決することを目的としている。
Mambaは、新興状態空間モデル(SSM)として、より優れた線形複雑性と大域的受容場を持つ。
本稿では,DGMamba という新たな DG フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 01:42:08 GMT)
GenderCARE: A Comprehensive Framework for Assessing and Reducing Gender Bias in Large Language Models [73.2] 大規模言語モデル(LLM)は、自然言語生成において顕著な能力を示してきたが、社会的バイアスを増大させることも観察されている。
GenderCAREは、革新的な基準、バイアス評価、リダクションテクニック、評価メトリクスを含む包括的なフレームワークである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:35:46 GMT)
Distilling the Unknown to Unveil Certainty [66.3] 標準ネットワークがトレーニングされるIDデータから逸脱するテストサンプルを特定するためには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
本稿では,IDデータのトレーニングが可能であるか否かを問う,先駆的な学習フレームワークであるOODナレッジ蒸留について紹介する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:58:00 GMT)
GarmentAligner: Text-to-Garment Generation via Retrieval-augmented Multi-level Corrections [63.8] GarmentAlignerは、検索強化マルチレベル補正で訓練されたテキスト間拡散モデルである。
コンポーネントレベルでのセマンティックアライメントを実現するために,自動コンポーネント抽出パイプラインを導入する。
衣服画像内の成分関係を活用すべく,各衣服の検索サブセットを構築した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:50:45 GMT)
CatFree3D: Category-agnostic 3D Object Detection with Diffusion [63.8] 本稿では,2次元検出と深度予測から3次元検出を分離するパイプラインを提案する。
また,3次元検出結果の正確な評価のために,正規化ハンガリー距離(NHD)指標も導入した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 22:05:57 GMT)
Efficient Learning for Linear Properties of Bounded-Gate Quantum Circuits [63.7] d可変RZゲートとG-dクリフォードゲートを含む量子回路を与えられた場合、学習者は純粋に古典的な推論を行い、その線形特性を効率的に予測できるだろうか?
我々は、d で線形にスケーリングするサンプルの複雑さが、小さな予測誤差を達成するのに十分であり、対応する計算の複雑さは d で指数関数的にスケールすることを証明する。
我々は,予測誤差と計算複雑性をトレードオフできるカーネルベースの学習モデルを考案し,多くの実践的な環境で指数関数からスケーリングへ移行した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:21:28 GMT)
Do Responsible AI Artifacts Advance Stakeholder Goals? Four Key Barriers Perceived by Legal and Civil Stakeholders [59.2] 責任あるAI(RAI)コミュニティは、透明性を促進し、AIシステムのガバナンスをサポートするために、多数のプロセスとアーティファクトを導入している。
我々は、責任あるAI活動に関する政策と擁護を通知する19の政府、法律、市民社会の利害関係者と半構造化されたインタビューを行う。
我々は、これらの信念を4つの障壁にまとめて、RAIアーティファクトが(必然的に)市民社会、政府、産業間での権力関係を再構成する方法を説明する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 00:14:37 GMT)
Clarify: Improving Model Robustness With Natural Language Corrections [59.0] モデルを教える標準的な方法は、大量のデータを提供することです。
このアプローチは、データ内の誤解を招く信号を拾うため、モデルに誤ったアイデアを教えることが多い。
モデル誤解をインタラクティブに修正するためのインターフェースと手法であるClarifyを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 01:26:21 GMT)
Not All Samples Should Be Utilized Equally: Towards Understanding and Improving Dataset Distillation [57.7] 我々は,サンプル難易度の観点から,マッチングに基づくDD手法の理解に向けて最初の一歩を踏み出した。
次に、データプルーニングのニューラルネットワークスケーリング法則をDDに拡張し、これらのマッチングベースの手法を理論的に説明する。
SDC(Sampple Difficulty Correction)アプローチを導入し、より簡単なサンプルを生成して、より高いデータセット品質を実現する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:20:32 GMT)
Towards Evaluating and Building Versatile Large Language Models for Medicine [57.5] MedS-Benchは大規模言語モデル(LLM)の性能を臨床的に評価するためのベンチマークである。
MedS-Benchは、臨床報告の要約、治療勧告、診断、名前付きエンティティ認識、医療概念説明を含む、11のハイレベルな臨床タスクにまたがる。
MedS-Insは58の医療指向言語コーパスで構成され、112のタスクで1350万のサンプルを収集している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:01:34 GMT)
A Geometric Perspective on Diffusion Models [57.3] 本稿では,人気のある分散拡散型SDEのODEに基づくサンプリングについて検討する。
我々は、最適なODEベースのサンプリングと古典的な平均シフト(モード探索)アルゴリズムの理論的関係を確立する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:50:09 GMT)
Technology and Performance Benchmarks of IQM's 20-Qubit Quantum Computer [56.4] IQM量子コンピュータはQPUと他のフルスタック量子コンピュータの両方をカバーする。
焦点は、Garnet QPUとそのアーキテクチャを特徴とする20量子ビットの量子コンピュータであり、最大150量子ビットまでスケールする。
QPUとシステムレベルベンチマークは、中央値の2キュービットゲート忠実度99.5%、グリーンバーガー・ホーネ・ザイリンガー(GHZ)状態の20キュービット全てを真のエンハングリングする。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:26:10 GMT)
Understanding the Relationship between Prompts and Response Uncertainty in Large Language Models [55.3] 大規模言語モデル(LLM)は意思決定に広く使用されているが、特に医療などの重要なタスクにおける信頼性は十分に確立されていない。
本稿では,LSMが生成する応答の不確実性が,入力プロンプトで提供される情報とどのように関連しているかを検討する。
本稿では,LLMが応答を生成する方法を説明し,プロンプトと応答の不確実性の関係を理解するためのプロンプト応答の概念モデルを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:23:12 GMT)
A Modular Approach for Multimodal Summarization of TV Shows [55.2] 分離されたコンポーネントが特別なサブタスクを実行するモジュール方式を提案する。
我々のモジュールは、シーン境界の検出、異なるイベント間のカット回数の最小化、視覚情報をテキストに変換すること、各シーンの対話を要約すること、シーン要約をエピソード全体の最終要約に融合することを含む。
我々はまた、生成した要約の精度とリコールを計測し、原子事実に分解する新しい測度であるPRISMAを提示する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:00:53 GMT)
RuleAlign: Making Large Language Models Better Physicians with Diagnostic Rule Alignment [54.9] 本稿では,大規模言語モデルと特定の診断規則との整合性を考慮したルールアラインフレームワークを提案する。
患者と医師間の規則に基づくコミュニケーションを含む医療対話データセットを開発した。
実験の結果,提案手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:44:40 GMT)
Generalized Face Forgery Detection via Adaptive Learning for Pre-trained Vision Transformer [54.3] 適応学習パラダイムの下で,textbfForgery-aware textbfAdaptive textbfVision textbfTransformer(FA-ViT)を提案する。
FA-ViTは、クロスデータセット評価において、Celeb-DFおよびDFDCデータセット上で93.83%と78.32%のAUCスコアを達成する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:23:46 GMT)
Recent Advances on Machine Learning for Computational Fluid Dynamics: A Survey [51.9] 本稿では、基本概念、従来の手法、ベンチマークデータセットを紹介し、CFDを改善する上で機械学習が果たす様々な役割について検討する。
我々は,空気力学,燃焼,大気・海洋科学,生物流体,プラズマ,記号回帰,秩序の低減など,CFDにおけるMLの現実的な応用を強調した。
シミュレーションの精度を向上し、計算時間を短縮し、流体力学のより複雑な解析を可能にすることにより、MLはCFD研究を大きく変革する可能性があるという結論を導いた。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:33:11 GMT)
Scribbles for All: Benchmarking Scribble Supervised Segmentation Across Datasets [51.7] Scribbles for Allは、スクリブルラベルに基づいて訓練されたセマンティックセグメンテーションのためのラベルおよびトレーニングデータ生成アルゴリズムである。
弱い監督の源泉としてのスクリブルの主な制限は、スクリブルセグメンテーションのための挑戦的なデータセットの欠如である。
Scribbles for Allは、いくつかの人気のあるセグメンテーションデータセットのスクリブルラベルを提供し、密集したアノテーションを持つデータセットのスクリブルラベルを自動的に生成するアルゴリズムを提供する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:29:08 GMT)
Diffusion-Based Visual Art Creation: A Survey and New Perspectives [51.5] 本調査は,拡散に基づく視覚芸術創造の新たな領域を探求し,その発展を芸術的,技術的両面から検討する。
本研究は,芸術的要件が技術的課題にどのように変換されるかを明らかにし,視覚芸術創造における拡散法の設計と応用を強調した。
我々は、AIシステムが芸術的知覚と創造性において人間の能力をエミュレートし、潜在的に増強するメカニズムに光を当てることを目指している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:49:50 GMT)
Understanding Reference Policies in Direct Preference Optimization [50.7] DPO(Direct Preference Optimization)は、大規模言語モデル(LLM)の微調整のための訓練手法として広く使われている。
この研究は、参照モデルやポリシーに依存しているDPOの未検討の側面を探求する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:56:15 GMT)
MoTCoder: Elevating Large Language Models with Modular of Thought for Challenging Programming Tasks [50.6] 本稿では,タスクの論理的サブタスクとサブモジュールへの分解を促進するため,MoT命令チューニングの先駆的フレームワークを提案する。
調査の結果,MoTCoderはサブモジュールの栽培と利用を通じて,生成したソリューションのモジュラリティと正しさの両方を著しく向上させることがわかった。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 06:24:12 GMT)
Real-world Image Dehazing with Coherence-based Label Generator and Cooperative Unfolding Network [50.3] 実世界のイメージデハジングは、実世界の設定におけるヘイズによる劣化を軽減することを目的としている。
本研究では,大気散乱と画像シーンを協調的にモデル化する,協調的展開ネットワークを提案する。
また,コヒーレンスに基づくラベルジェネレータと呼ばれるRID指向の反復型平均教師フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:23:37 GMT)
ND-SDF: Learning Normal Deflection Fields for High-Fidelity Indoor Reconstruction [50.1] 微妙な幾何を同時に復元し、異なる特徴を持つ領域をまたいだ滑らかさを保つことは自明ではない。
そこで,ND-SDFを提案する。ND-SDFは通常のドデフレクション場を学習し,通常のシーンとそれ以前のシーンの角偏差を表現する。
本手法は, 壁面や床面などのスムーズなテクスチャ構造を得るだけでなく, 複雑な構造の幾何学的詳細も保存する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:59:01 GMT)
MaVEn: An Effective Multi-granularity Hybrid Visual Encoding Framework for Multimodal Large Language Model [49.9] MaVEnは、マルチモーダル大言語モデル(MLLM)のマルチモーダル推論能力を高めるために設計された革新的なフレームワークである。
MaVEnは複雑なマルチイメージのシナリオにおけるMLLMの理解を著しく向上するとともに,単一イメージのコンテキストにおけるパフォーマンスも向上することを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:57:16 GMT)
Quantum Information Processing with Molecular Nanomagnets: an introduction [49.9] 本稿では,量子情報処理の導入について紹介する。
量子アルゴリズムを理解し設計するための基本的なツールを紹介し、分子スピンアーキテクチャ上での実際の実現を常に言及する。
分子スピンキュートハードウェア上で提案および実装された量子アルゴリズムの例を示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:24:41 GMT)
Enhancing Community Detection in Networks: A Comparative Analysis of Local Metrics and Hierarchical Algorithms [49.2] 本研究は,地域間類似度指標を用いた地域検出の関連性を評価するために,同じ手法を用いている。
これらの指標の有効性は,異なるコミュニティサイズを持つ複数の実ネットワークにベースアルゴリズムを適用して評価した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:28:29 GMT)
Unrolled Decomposed Unpaired Learning for Controllable Low-Light Video Enhancement [48.8] 本稿では,2対の地上真実を使わずに,低照度映像のエンハンスメントを学習する上での取り組みについて述べる。
低照度画像の強調に比べて、空間領域におけるノイズ、露出、コントラストの相互干渉効果により、時間的コヒーレンスの必要性が伴うため、低照度映像の強調は困難である。
本稿では,信号の空間的・時間的関連要因に分解するために,最適化関数を深層ネットワークにアンロールすることで低照度映像の高精細化を実現するUnrolled Decompposed Unpaired Network (UDU-Net)を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:45:11 GMT)
U-KAN Makes Strong Backbone for Medical Image Segmentation and Generation [48.4] Kolmogorov-Arnold Networks (KAN)は、非線形学習可能なアクティベーション関数のスタックを通じてニューラルネットワーク学習を再構築する。
トークン化中間表現であるU-KAN上に専用kan層を統合することにより,確立したU-Netパイプラインを検証,修正,再設計する。
さらに、拡散モデルにおける代替U-Netノイズ予測器としてのU-KANの可能性を探り、タスク指向モデルアーキテクチャの生成にその適用性を実証した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:55:56 GMT)
Can a Bayesian Oracle Prevent Harm from an Agent? [48.1] 我々は、所定の安全仕様に違反する確率に基づいて、文脈依存境界を推定することを検討する。
世界の異なる仮説が全く異なる結果をもたらす可能性があることに注意し、我々は真だが未知の仮説の下で予測される安全違反の確率に基づいて導かれる。
iidの場合と非idの場合の2つの形態を考察し、その結果を実用的なAIガードレールに変換するためのオープンな問題に結論付ける。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 19:14:27 GMT)
Deep Reinforcement Learning for Efficient and Fair Allocation of Health Care Resources [47.6] 医療資源の枯渇は、レーションの避けられない結果をもたらす可能性がある。
医療資源割り当てプロトコルの普遍的な標準は存在しない。
本稿では,患者の疾患進行と患者間の相互作用効果を統合するためのトランスフォーマーベースのディープQネットワークを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 05:05:13 GMT)
RoVRM: A Robust Visual Reward Model Optimized via Auxiliary Textual Preference Data [47.6] 大型視覚言語モデル(LVLM)は人間の好みと一致しないことが多い。
本稿では,LVLMのヒューマン・参照アライメントを改善するロバスト・ビジュアル・リワード・モデル(RoVRM)を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:49:18 GMT)
etuner: A Redundancy-Aware Framework for Efficient Continual Learning Application on Edge Devices [47.4] 推論精度、微調整実行時間、エネルギー効率を最適化する効率的なエッジ連続学習フレームワークであるETunerを提案する。
実験結果から,ETunerは全体の微調整実行時間を64%削減し,エネルギー消費量を56%削減し,即時モデル微調整アプローチよりも平均推定精度を1.75%向上した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 19:46:37 GMT)
Cross-border Commodity Pricing Strategy Optimization via Mixed Neural Network for Time Series Analysis [46.3] クロスボーダー商品の価格設定は、企業の競争力と市場シェアを決定する。
時系列データは商品価格において非常に重要であり、市場のダイナミクスやトレンドを明らかにすることができる。
本稿では,ハイブリッドニューラルネットワークモデルCNN-BiGRU-SSAに基づく新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:59:52 GMT)
Taming Quantum Time Complexity [45.9] 時間複雑性の設定において、正確さと遠心性の両方を達成する方法を示します。
我々は、トランスデューサと呼ばれるものに基づく量子アルゴリズムの設計に新しいアプローチを採用する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:20:24 GMT)
Entanglement structures in disordered chains of nitrogen-vacancy centers [45.0] 本研究では, 最大10個の連結スピンの鎖の接続性について検討した。
周期的に間隔を保ったスピンでは、固有状態の大部分が強い接続性を示し、特にスペクトルの中心と長い鎖に向いている。
位置障害はレジスタの接続性を変化させたり、あるいは減少させるが、ほとんど抑制しない。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:20:35 GMT)
SPARK: Multi-Vision Sensor Perception and Reasoning Benchmark for Large-scale Vision-Language Models [43.8] 本稿では,SPARKと呼ばれるマルチビジョンセンサ知覚と推論ベンチマークの構築を目的とする。
6,248個の視覚言語検定サンプルを自動生成し,多視点感覚知覚と多視点感覚推論を物理センサ知識の熟練度に基づいて検討した。
その結果、ほとんどのモデルでは、様々な範囲で多視点感覚理論の欠陥が見られた。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:59:48 GMT)
Unlocking Intrinsic Fairness in Stable Diffusion [42.7] 安定拡散は本質的に公平性を持ち、不偏出力を達成するためにアンロックできることが示される。
本稿では,安定拡散の本質的公正性を解き放つために,テキスト条件を乱す新しい手法を提案する。
本手法は,画像テキストのアライメントと画質を保ちながら,追加チューニングなしでバイアスを効果的に軽減する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 19:12:52 GMT)
Generating Realistic X-ray Scattering Images Using Stable Diffusion and Human-in-the-loop Annotations [42.5] 我々は、与えられたプロンプトから新しい科学的画像を生成するため、基礎的な安定拡散モデルを微調整した。
生成された画像のいくつかは重要な非現実的なアーティファクトを示しており、一般に「幻覚」として知られている。
非現実的な画像を検出するために、60%の人間が承認した画像と40%の実験画像からなるデータセットを用いて様々なコンピュータビジョンモデルを訓練した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 20:23:04 GMT)
Two-level deep domain decomposition method [41.9] 本研究では,境界値問題を解くために,粗度ネットワークを付加した2レベルディープドメイン分解法を提案する。
粗いレベルのネットワークの追加は、単一レベルの手法と比較してスケーラビリティと収束率を改善する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:20:39 GMT)
MultiMed: Massively Multimodal and Multitask Medical Understanding [41.2] MultiMedは、幅広い医学的モダリティとタスクにわたる大規模学習の評価と有効化を目的として設計されたベンチマークである。
医療報告、病理学、ゲノム学、タンパク質データなど10の医療モダリティにまたがる256万のサンプルで構成されている。
我々はMultiMedを用いて、最先端のユニモーダル、マルチモーダル、マルチタスクモデルのベンチマークを行う。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:41:36 GMT)
Balancing Act: Prioritization Strategies for LLM-Designed Restless Bandit Rewards [41.1] 本稿では,人選好に基づく報酬関数のトレードオフを扱うための社会選択言語モデルを提案する。
実験により、我々のモデルはより効果的で、整合性があり、バランスの取れた報酬関数を確実に選択できることを示した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:54:08 GMT)
Effect of Requirements Analyst Experience on Elicitation Effectiveness: A Family of Empirical Studies [40.2] 本研究の目的は,経験が要求アナリストのパフォーマンスに影響を及ぼすかどうかを判断することであった。
不慣れな領域では、インタビュー、要求、開発、専門的な経験はアナリストの有効性に影響を与えない。
面接経験は肯定的な効果が強いのに対し、プロの体験は中程度の否定的な効果がある。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:48:04 GMT)
Weight Scope Alignment: A Frustratingly Easy Method for Model Merging [40.1] 非I.D.データは平均的なモデル融合にとって大きな課題となる。
本稿では,異なるトレーニング条件下での重量範囲の変化を明らかにする。
幸いなことに、各層のパラメータは基本的にガウス分布に従っており、これは新しく単純な正規化アプローチを刺激している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:13:27 GMT)
The Russian-focused embedders' exploration: ruMTEB benchmark and Russian embedding model design [39.8] 本稿では,ロシア語の埋め込みモデルに関する研究に焦点をあてる。
ru-en-RoSBERTaと呼ばれる新しいロシアの埋め込みモデルとruMTEBベンチマークを導入している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:53:23 GMT)
DimeRec: A Unified Framework for Enhanced Sequential Recommendation via Generative Diffusion Models [39.5] シークエンシャルレコメンデーション(SR:Sequential Recommendation)は、非定常的な歴史的相互作用に基づいてユーザの好みに合わせてレコメンデーションを調整することによって、レコメンデーションシステムにおいて重要な役割を担っている。
誘導抽出モジュール(GEM)と生成拡散凝集モジュール(DAM)を組み合わせたDimeRecという新しいフレームワークを提案する。
我々の数値実験により、DimeRecは3つの公開データセットで確立されたベースライン法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 06:42:09 GMT)
Mixstyle-Entropy: Domain Generalization with Causal Intervention and Perturbation [39.0] ドメイン一般化(DG)は、ドメイン関連情報に依存しない表現を学習することでこの問題を解決し、未知の環境への外挿を容易にする。
既存のアプローチは典型的には、ソースデータから共有された特徴を抽出するための調整済みのトレーニング目標の定式化に重点を置いている。
InPerという因果性に基づく新しいフレームワークを提案する。これは、訓練中の因果的介入と試験中の因果的摂動を組み込むことにより、モデル一般化を強化するために設計された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:13:56 GMT)
Adversarial Examples in the Physical World: A Survey [38.9] ディープニューラルネットワーク(DNN)は、敵の例に高い脆弱性を示し、広範なセキュリティ上の懸念を提起している。
身体的敵対例(PAEs)は、重大な課題と安全性上の懸念を呈する。
本報告では,PAEの具体的な特徴に基づいた包括的分析・分類の枠組みについて述べる。
我々は、PAEを新しく、徹底的に、体系的に理解し、堅牢な対人学習の発展を促進することを目的としている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:12:59 GMT)
The Oscars of AI Theater: A Survey on Role-Playing with Language Models [38.7] 本調査では,言語モデルを用いたロールプレイングの急成長分野について検討する。
それは、初期のペルソナモデルから、Large Language Models(LLMs)によって促進される高度なキャラクタ駆動シミュレーションまでの開発に焦点を当てている。
データやモデル,アライメント,エージェントアーキテクチャ,評価など,これらのシステムを設計する上で重要なコンポーネントを包括的に分類する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:44:27 GMT)
DeMamba: AI-Generated Video Detection on Million-Scale GenVideo Benchmark [38.6] 我々は,AIが生成した最初のビデオ検出データセットであるGenVideoを紹介する。
大量のビデオがあり、その中にはAIが生成し、実際のビデオが100万本以上含まれている。
我々はデテール・マンバ(Detail Mamba)というプラグイン・アンド・プレイ・モジュールを導入し、AI生成ビデオを特定して検出器を強化する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:48:49 GMT)
Enhancing Multi-hop Reasoning through Knowledge Erasure in Large Language Model Editing [38.6] 大規模言語モデル(LLM)は、内部知識の不正確さと時代遅れの情報による課題に直面している。
知識編集はこれらの問題を緩和するための重要なアプローチとして現れてきた。
大規模言語モデル編集(KELE)のための知識消去機構を組み込んだ新しい知識編集手法を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:53:33 GMT)
MedDiT: A Knowledge-Controlled Diffusion Transformer Framework for Dynamic Medical Image Generation in Virtual Simulated Patient [38.3] MedDiTは,患者の症状をシミュレートした医療画像を生成するための,知識制御型会話フレームワークである。
MedDiTは、患者の属性と症状を記述した様々な患者知識グラフ(KGs)を統合し、Large Language Models(LLMs)の振る舞いを動的に促進する。
KGの特定患者属性に応じて医用画像を生成するために、よく調整された拡散変換器(DiT)モデルが組み込まれている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:10:29 GMT)
A Riemannian Approach for Spatiotemporal Analysis and Generation of 4D Tree-shaped Structures [38.0] 木のような4次元オブジェクトにおける時間的形状の変動をモデル化し解析するための、最初の包括的なアプローチを提案する。
我々の重要な貢献は、正方根速度木(SFT)を用いた木のような3次元形状の表現である。
これにより、SRVFT空間における弾性軌道のモデリングや解析よりも、4次元木のような形状のモデリングと解析の問題を低減できる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:39:30 GMT)
Flying with Photons: Rendering Novel Views of Propagating Light [37.1] 本稿では,新しい移動カメラの視点から,シーンを通して伝播する光の映像を合成する画像・ニューラルレンダリング技術を提案する。
我々のアプローチは、ピコ秒レベルの時間分解能を持つファースト・オブ・イットタイプの多視点ビデオデータセットをキャプチャするための、新しい超高速撮像装置に依存している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 05:43:25 GMT)
Towards Deconfounded Image-Text Matching with Causal Inference [36.7] 本稿では、画像テキストマッチングタスクのための革新的なDecon founded Causal Inference Network(DCIN)を提案する。
DCINは、モダル内およびモダル間共同創設者を分解し、それらを視覚的およびテキスト的特徴のエンコーディングステージに組み込む。
データセットバイアスによって引き起こされる刺激的な相関ではなく、因果関係を学ぶことができる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:04:28 GMT)
RDGCL: Reaction-Diffusion Graph Contrastive Learning for Recommendation [36.3] コントラスト学習(CL)はレコメンダシステムを改善するための有望な手法である。
反応拡散グラフコントラスト学習モデル(RDGCL)と呼ばれるリコメンデータシステムのための新しいCL法を提案する。
提案したCLベーストレーニングは, 反応と拡散に基づく埋め込みの間に発生するため, グラフ強化は不要である。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:50:09 GMT)
ConflictBank: A Benchmark for Evaluating the Influence of Knowledge Conflicts in LLM [36.3] 大規模言語モデル (LLM) は、多くの分野にわたって顕著な進歩を遂げてきたが、知識紛争の重大な問題は研究されることはめったにない。
我々は3つの側面から知識衝突を評価するために開発された最初の総合ベンチマークであるConflictBankを紹介する。
本研究は, 誤情報, 時間的相違, 意味的相違から生じる対立を慎重に分析し, 4つのモデルファミリーと12個のLLMインスタンスに分類した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:33:13 GMT)
Transformers are Minimax Optimal Nonparametric In-Context Learners [36.3] 大規模言語モデルのコンテキスト内学習は、いくつかの実証的な例から新しいタスクを学ぶのに驚くほど効果的な方法であることが証明されている。
我々は,ディープニューラルネットワークと1つの線形アテンション層からなる変圧器の近似および一般化誤差境界を開発する。
十分に訓練されたトランスフォーマーは、文脈における最小推定リスクを達成し、改善できることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:02:10 GMT)
Dataset | Mindset = Explainable AI | Interpretable AI [36.0] 機械学習(ML)の出力を支える理由を説明するために、与えられたデータセットにさまざまなXAIツールを適用すると、"説明可能な"人工知能(XAI)と"解釈可能なAI(IAI)"が相反する。
我々は、XAIは、IAIのサブセットであると主張する。IAIの概念はデータセットの範囲を超えており、思考の領域を含んでいる。
我々は、これらの概念を明確にし、将来のAI応用と研究における多くの実践者や政策立案者に対して、XAI、IAI、EAI、TAIの基礎を築いたいと考えています。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:12:53 GMT)
MolX: Enhancing Large Language Models for Molecular Learning with A Multi-Modal Extension [34.6] タスクハンドリング能力の強い大規模言語モデル(LLM)は、様々な分野において顕著な進歩を見せている。
本研究は、分子をマルチモーダルな外部モジュール、すなわちMollXに装備することで、分子の理解能力を高めることを目的とする。
特に,分子の表現にSMILES文字列を直接使用する代わりに,特定のエンコーダを用いて,SMILES文字列と2次元分子グラフ表現の両方から微細な特徴を抽出する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:06:31 GMT)
Human-In-The-Loop Machine Learning for Safe and Ethical Autonomous Vehicles: Principles, Challenges, and Opportunities [33.9] 我々は、カリキュラム学習(CL)、ヒューマン・イン・ザ・ループ強化学習(HITL-RL)、アクティブ・ラーニング(AL)、倫理的原則に焦点を当てる。
CLでは、人間の専門家が単純なタスクから始めて、より難しいタスクへと徐々に進むことで、MLモデルを体系的に訓練する。
HITL-RLは報酬形成、アクションインジェクション、対話型学習といった技術を通じて人間の入力を組み込むことで、RLプロセスを大幅に強化する。
ALは、人間の監視でラベル付けする必要がある特定のインスタンスをターゲットにすることで、アノテーションプロセスを合理化する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:02:29 GMT)
Leveraging Information Consistency in Frequency and Spatial Domain for Adversarial Attacks [33.7] アドリラルな例は、ディープニューラルネットワークを利用するための重要な方法である。
最近の周波数領域変換は、そのような逆例の転送可能性を高めた。
本稿では,単純で効果的でスケーラブルな勾配型対向攻撃アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:24:08 GMT)
Understanding Data Reconstruction Leakage in Federated Learning from a Theoretical Perspective [33.7] フェデレートラーニング(Federated Learning, FL)は、データプライバシ保護を目的とした、新たなコラボレーティブラーニングパラダイムである。
近年の研究では、FLアルゴリズムは深刻なデータ再構成攻撃に弱いことが示されている。
FLに対するデータ再構成攻撃を理解するための理論的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:20:48 GMT)
Hierarchical Attention and Parallel Filter Fusion Network for Multi-Source Data Classification [33.3] マルチソースデータ分類のための階層的注意と並列フィルタ融合ネットワークを提案する。
提案手法は,各データセットの総合精度(OA)の91.44%と80.51%を達成する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 23:14:22 GMT)
VTON-HandFit: Virtual Try-on for Arbitrary Hand Pose Guided by Hand Priors Embedding [32.9] VTON-HandFitは手閉塞症例の外観と構造を再構成する。
手形外乱埋め込みモジュールは、手の構造パラメトリックと視覚的外観の特徴に手先をゆがめる。
モデル画像のハンドテンプレートから、構造エッジの知識をよりよく学習するために、手持ちの制約損失をカスタマイズする。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:36:10 GMT)
ZipGait: Bridging Skeleton and Silhouette with Diffusion Model for Advancing Gait Recognition [31.7] 拡散モデルを用いて, 個々の骨格分布から高密度な体形を復元する試みを初めて行った。
PGI(Perception Gait Integration)を導入し、異なる歩行機能を2段階のプロセスで統合する。
ZipGaitは、クロスドメインとイントラドメインの両方の設定において、最先端のメソッドよりも大きなマージンでパフォーマンスを向上する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:52:44 GMT)
A Scalable Quantum Non-local Neural Network for Image Classification [31.6] 本稿では、量子非局所ニューラルネットワーク(QNL-Net)と呼ばれる、量子古典的スケーラブルな非局所ニューラルネットワークを紹介する。
提案したQNL-Netは、多数の入力特徴の同時処理を可能にするために、固有の量子並列性に依存している。
我々は,提案したQNL-Netを,MNISTとCIFAR-10の2値分類と比較した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:22:05 GMT)
Language Agents as Optimizable Graphs [31.2] 本稿では,Large Language Models (LLM) ベースのエージェントを計算グラフとして記述する。
我々のフレームワークは、様々なLSMエージェントを効率的に開発し、統合し、自動的に改善するために使用することができる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:06:51 GMT)
Linearly Multiplexed Photon Number Resolving Single-photon Detectors Array [31.0] 光子数分解検出器(英: Photon Number Resolving Detector、PNRD)は、入射光ビームに存在する光子数を測定する装置である。
本稿では, 線形多重光子数分解型単一光子検出器アレイの性能と設計について考察する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:41:12 GMT)
Jamba-1.5: Hybrid Transformer-Mamba Models at Scale [30.9] 提案するJamba-1.5は,Jambaアーキテクチャに基づく命令調整型大規模言語モデルである。
94Bのアクティブパラメータを持つJamba-1.5-Largeと12Bのアクティブパラメータを持つJamba-1.5-Miniの2つのモデルサイズをリリースする。
どちらのモデルも様々な対話型および命令追従型キャパビリティのために微調整されており、有効コンテキスト長は256Kである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:38:59 GMT)
Using Part-based Representations for Explainable Deep Reinforcement Learning [30.6] 深層強化学習におけるアクターモデルに対する非負のトレーニング手法を提案する。
本稿では,よく知られたCartpoleベンチマークを用いて提案手法の有効性を示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 05:46:23 GMT)
SQL-GEN: Bridging the Dialect Gap for Text-to-SQL Via Synthetic Data And Model Merging [30.3] 本稿では、方言固有のチュートリアルでガイドされた高品質な方言特化合成データを生成するためのフレームワークを提案する。
当社のアプローチでは,従来の手法に比べて最大20%パフォーマンスが大幅に向上しています。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 20:50:48 GMT)
FIRST: Teach A Reliable Large Language Model Through Efficient Trustworthy Distillation [29.6] 微調整は「微調整による誤校正」により、まだ満足のいく信頼性には程遠い
本稿では,教師の知識のごく一部を有効活用して,信頼性の高い言語モデルを低コストで得るための信頼に値する蒸留(FIRST)を提案する。
実験の結果, 精度が2.3%, 誤校正率が10%以下となる手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:31:00 GMT)
MonoPatchNeRF: Improving Neural Radiance Fields with Patch-based Monocular Guidance [29.3] 最新の正規化ニューラルラジアンス・フィールド(NeRF)アプローチは、大規模なスパース・ビュー・シーンの幾何学とビュー外挿を損なう。
我々は密度に基づくアプローチを採り、個々の光線の代わりにパッチをサンプリングし、単分子深度と通常の推定値をよりよく組み込む。
提案手法はETH3Dベンチマークの幾何精度を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:42:51 GMT)
Natural Language Programming in Medicine: Administering Evidence Based Clinical Workflows with Autonomous Agents Powered by Generative Large Language Models [29.1] ジェネレーティブ・大型言語モデル(LLM)は医療において大きな可能性を秘めている。
本研究は, シミュレーション3次医療センターにおいて, 自律型エージェントとして機能するLSMの可能性を評価した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:49:39 GMT)
LLM-enhanced Scene Graph Learning for Household Rearrangement [28.4] 住宅再配置作業は、場所を間違えた物体を現場に配置し、適切な場所に収容することである。
我々は,シーン自体から直接,ユーザ好みのアライメントでオブジェクト機能をマイニングすることを提案する。
提案手法は, 誤り検出と次の再配置計画における最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:03:04 GMT)
On the Vulnerability of Fairness Constrained Learning to Malicious Noise [28.2] トレーニングデータにおいて、公平性に制約された学習の脆弱性を少数の悪意のある雑音に対して考慮する。
例えば、Demographic Parityでは、$Theta(alpha)$の精度損失しか発生せず、$alpha$は悪意のあるノイズレートであることを示す。
Equal Opportunity に対して、$O(sqrtalpha)$損失を発生させ、一致する$Omega(sqrtalpha)$ lower bound を与える。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:48:33 GMT)
A Survey of Mamba [27.9] 近年,基礎モデル構築の代替手段として,Mambaという新しいアーキテクチャが登場している。
本研究では,マンバモデルの発展,多様なデータにマンバを適応させる技術,およびマンバが優れている応用について検討する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:18:01 GMT)
DeepHQ: Learned Hierarchical Quantizer for Progressive Deep Image Coding [27.9] プログレッシブ画像符号化(PIC)は、画像の様々な品質を単一のビットストリームに圧縮することを目的としている。
ニューラルネットワーク(NN)に基づくPICの研究は、その初期段階にある。
本稿では,まず,学習した量子化ステップサイズを各量子化レイヤの学習により活用するNNベースのプログレッシブコーディング手法を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 06:32:53 GMT)
Preference-Guided Reflective Sampling for Aligning Language Models [27.7] 我々は、Preference-Guided Reflective Smpling (PRS) と呼ばれる新しいサンプリング手法を提案する。
PRSは、自然言語で記述された明示されたユーザー嗜好に対する最適化プロセスとして応答生成をフレーム化する。
命令追従とキーワード中心の文書要約のための嗜好制御テキスト生成について検討する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:18:46 GMT)
Self-Learning for Personalized Keyword Spotting on Ultra-Low-Power Audio Sensors [27.7] 本稿では,超低消費電力スマートオーディオセンサへの展開後,個人化キーワードスポッティング(KWS)モデルを段階的に学習する自己学習フレームワークを提案する。
類似度スコアに基づいて,新たに録音した音声フレームに擬似ラベルを割り当てることにより,ラベル付きトレーニングデータがないという根本的な問題に対処する。
私たちの経験的結果は、極端に自己適応型のKWSセンサを配置する方法を舗装しています。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:17:02 GMT)
Relational decomposition for program synthesis [27.6] 複雑な機能タスクを単純なリレーショナル合成サブタスクに分解する新しいプログラム合成手法を提案する。
本稿では,3つの挑戦的データセットに対して,既製の帰納型論理プログラミング(ILP)システムを用いて提案手法の有効性を実証する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:41:52 GMT)
On the Credibility of Backdoor Attacks Against Object Detectors in the Physical World [27.6] アプリケーション設定における物理オブジェクトトリガーによるバックドア攻撃の有効性について検討する。
我々は、MORPHingと呼ばれる新しいコスト効率の高い攻撃方法を構築し、検出タスクのユニークな性質を取り入れた。
私たちは、現実世界のバックドア攻撃の広範なビデオテストセットをリリースしました。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:29:48 GMT)
FOUND: Foot Optimization with Uncertain Normals for Surface Deformation Using Synthetic Data [27.5] 本研究は,ヒトの足について,少数視点再構成法の開発を試みている。
この課題を解決するためには,RGB画像からリッチな幾何学的手がかりを抽出し,それらを最終3次元オブジェクトに慎重に融合させる必要がある。
通常の予測器は、実際の画像において、既成の等価性を著しく上回ることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:20:20 GMT)
PolyRouter: A Multi-LLM Querying System [27.3] PolylemmaはモノリシックなLLMクエリシステムである。
様々なLLM専門家をシームレスに単一のクエリインターフェースに統合する。
クエリの要求に基づいて、入力クエリを最も高性能な専門家に動的にルーティングする。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:57:07 GMT)
Unlocking Attributes' Contribution to Successful Camouflage: A Combined Textual and VisualAnalysis Strategy [27.3] 本研究は,カモフラージュ特性がカモフラージュパターンの有効性に与える影響を総合的に検討する。
カモフラージュされたオブジェクトとその属性コントリビューションを記述した最初のデータセットをコンパイルした。
我々は,Camouflaged Object Attribution(COS)タスクのためのテキスト情報と視覚情報を組み合わせた堅牢なフレームワークを開発した。
ACUMENは優れたパフォーマンスを示し、3つの広く使用されているデータセットで9つのリードメソッドを上回っている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:51:21 GMT)
Prefix Guidance: A Steering Wheel for Large Language Models to Defend Against Jailbreak Attacks [27.1] 我々は,プリフィックスガイダンス(PG)という,プラグアンドプレイで容易に配置可能なジェイルブレイク防御フレームワークを提案する。
PGは、モデルの出力の最初の数個のトークンを直接設定することで、有害なプロンプトを特定するようモデルに誘導する。
3つのモデルと5つの攻撃方法におけるPGの有効性を実証する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:21:34 GMT)
Controllable Text Generation for Large Language Models: A Survey [27.1] 本稿では,大規模言語モデルにおける制御可能なテキスト生成の最近の進歩を体系的にレビューする。
我々はCTGタスクをコンテンツ制御と制御の2つの主要なタイプに分類する。
現在の研究における重要な課題には、流用率の低減や実用性といった課題に対処する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:59:04 GMT)
A Deconfounding Approach to Climate Model Bias Correction [26.7] 地球温暖化モデル(GCM)は、地球系をシミュレートすることで、将来の気候変動を予測するのに不可欠である。
GCMは、モデルの不確実性、パラメータ化の単純化、複雑な気候現象の不十分な表現による体系的なバイアスを示す。
本稿では,GCMと観測データの両方を用いて,多原因共同創設者を捉える因子モデルを学習するための新しいバイアス補正手法を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 01:53:35 GMT)
Local Conditional Controlling for Text-to-Image Diffusion Models [26.5] 拡散モデルは、テキスト・ツー・イメージのタスクにおいて素晴らしい成果を上げている。
近年の手法では、エッジマップや深度マップなどの画像レベルの構造制御を追加して、テキストプロンプトとともに生成プロセスを操作し、所望の画像を取得する。
この制御プロセスは、制御領域の柔軟性を制限する全画像上でグローバルに操作される。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 06:27:48 GMT)
Sharper Bounds for Chebyshev Moment Matching with Applications to Differential Privacy and Beyond [26.3] 我々は、ワッサーシュタイン距離の正確な回復が、以前よりも多くのノイズで可能であることを証明した。
主な応用として、微分プライベートな合成データ分布を構築するための単純な「線形クエリ」アルゴリズムが得られた。
数値線形代数における新たなモーメントベースリカバリの第二の応用について説明する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:26:41 GMT)
UMAD: University of Macau Anomaly Detection Benchmark Dataset [26.3] 本稿では,ロボットパトロールシナリオにおける参照による異常検出のための最初のベンチマークデータセットを紹介する。
提案するベンチマークデータセットは,ロボットの正確な位置推定に基づいて,各クエリ画像が対応する参照を見つけることができるよう精査されている。
提案するベンチマークデータセットに加えて,このデータセットに基づいてADrのベースラインモデルを評価する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:32:19 GMT)
Understanding the Natural Language of DNA using Encoder-Decoder Foundation Models with Byte-level Precision [26.1] 本稿では,Ensemble Nucleotide Byte-level-Decoder(ENBED)基盤モデルを提案する。
我々はMasked Language Modelingを用いて、参照ゲノム配列を用いて基礎モデルを事前訓練し、以下の下流タスクに適用する。
これらの課題のそれぞれにおいて、既存の最先端の成果と比較して顕著な改善が示される。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 20:18:06 GMT)
Reasoning Factual Knowledge in Structured Data with Large Language Models [26.0] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な進歩を遂げている。
構造化データには、事前学習に使われる非構造化テキストとは異なる独特の特徴がある。
本研究では,LLMの構造的推論能力を評価するためにStructFactというベンチマークを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:05:09 GMT)
MDD-5k: A New Diagnostic Conversation Dataset for Mental Disorders Synthesized via Neuro-Symbolic LLM Agents [26.0] 我々は、精神疾患の診断会話を合成するための神経象徴的マルチエージェントフレームワークを設計する。
提案手法を適用し,中国最大の精神障害診断データセットであるMDD-5kを開発した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 05:59:47 GMT)
A Tighter Complexity Analysis of SparseGPT [25.7] SparseGPT[Frantar, Alistarh ICML 2023]のランニングタイムを$O(d3)$から$O(domega + d2+a+o)$に改善する。
この実行時間は、反復的なメンテナンス問題における遅延更新動作の分析によるものである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 06:40:32 GMT)
Integrating Audio, Visual, and Semantic Information for Enhanced Multimodal Speaker Diarization [25.2] 既存の話者ダイアリゼーションシステムの多くは、単調な音響情報のみに依存している。
本稿では,音声,視覚,意味的手がかりを併用して話者ダイアリゼーションを向上する新しいマルチモーダル手法を提案する。
我々の手法は、最先端の話者ダイアリゼーション法より一貫して優れている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:34:03 GMT)
FlexEdit: Marrying Free-Shape Masks to VLLM for Flexible Image Editing [25.2] 本稿では,フレキシブル編集のための自由形状マスクと言語命令の両方を活用する,エンドツーエンドの画像編集手法であるFlexEditを提案する。
LLMに基づく画像編集において,本手法は最先端(SOTA)性能を実現し,簡単なプロンプト技術はその有効性で際立っている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:22:07 GMT)
TsCA: On the Semantic Consistency Alignment via Conditional Transport for Compositional Zero-Shot Learning [25.2] 本稿では、コンポジションゼロショット学習(CZSL)における条件伝達(CT)理論とそのホモロジーを視覚・セマンティック相互作用に再考する。
本稿では,これらの問題によく適応する新しいTrisets Consistency Alignmentフレームワーク(TsCA)を提案する。
我々は、CTプランをオープンワールド設定に拡張し、モデルが実現不可能なペアを効果的にフィルタリングできるようにする。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:52:56 GMT)
Exploiting Student Parallelism for Low-latency GPU Inference of BERT-like Models in Online Services [25.1] 本稿では,BERT-likeモデルの低レイテンシオンライン推論のためのAcademusを提案する。
アカデマスの中核には新しい学生パラレル主義があり、アンサンブルの強化と蒸留の積み重ねを取り入れている。
その結果、Academusは精度を損なうことなく4.1X1.6Xのレイテンシでベースラインを上回り、ワークロードバーストのスループットは最大22.27倍に向上した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:31:32 GMT)
Addressing Diverging Training Costs using BEVRestore for High-resolution Bird's Eye View Map Construction [24.9] Bird's Eye View (BEV) 融合の大規模機能は、GPUメモリ消費やコンピューティングレイテンシなどのコストを大幅に上昇させる。
本稿では,BEVの高スケール機能におけるエイリアス化とブロッキーなアーティファクトを復元し,ラベルの幅を狭めるBEV復元戦略を紹介する。
実験の結果,提案機構はプラグアンドプレイ型,メモリ効率のよいパイプラインを提供し,広いBEV範囲のHRマップ構築を可能にした。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 06:36:47 GMT)
Graph Partial Label Learning with Potential Cause Discovering [24.7] グラフネットワーク(GNN)は、グラフ表現学習がもたらす課題に対処する可能性について、広く注目を集めている。
グラフ固有の複雑さと相互接続性のため、GNNをトレーニングするためのグラフデータを正確にアノテートすることは極めて困難である。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 01:57:40 GMT)
SUBLLM: A Novel Efficient Architecture with Token Sequence Subsampling for LLM [24.7] SUBLLMは、サブサンプリング、アップサンプリング、バイパスモジュールを組み込むことで、コアデコーダのみのフレームワークを拡張する革新的なアーキテクチャである。
トレーニング中、SUBLLMはスピードを26%向上し、GPU毎にメモリを10GB削減する。
推論では、スピードを最大37%向上し、1GPUあたりのメモリを1GB削減する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:19:20 GMT)
Show-o: One Single Transformer to Unify Multimodal Understanding and Generation [24.6] マルチモーダル理解と生成を統一する統一変換器,すなわちShow-oを提案する。
完全自己回帰モデルとは異なり、Show-oは自己回帰と(離散的な)拡散モデリングを統一し、様々な混合モダリティの入力と出力を適応的に処理する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:32:32 GMT)
Toward the Evaluation of Large Language Models Considering Score Variance across Instruction Templates [24.5] 大規模言語モデル(LLM)の自然言語理解(NLU)性能は,様々なタスクやデータセットで評価されている。
しかし、既存の評価手法では、プロンプトの違いによるスコアのばらつきを考慮に入れていない。
したがって、異なる命令テンプレート間のスコアのばらつきを考慮して、NLU性能を公平に測定する方法を見つける必要がある。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:00:20 GMT)
A Language-agnostic Model of Child Language Acquisition [24.2] この作業は、もともと英語用に設計された、最近のセマンティックブートストラップによる子供用言語獲得モデルを再実装し、新しい言語、ヘブライ語を学ぶように訓練する。
モデルは、意味表現としての発話と論理形式のペアから学習し、構文と単語の意味の両方を同時に取得する。
結果は、モデルが主にヘブライ語に移行することを示しているが、ヘブライ語のより豊かな形態学を含む多くの要因が、学習を遅く、より堅牢にしていることを示している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:48:06 GMT)
Epsilon: Exploring Comprehensive Visual-Semantic Projection for Multi-Label Zero-Shot Learning [24.0] マルチラベルシナリオ(MLZSL)におけるゼロショット学習の課題について検討する。
観察されたクラスと補助的な知識に基づいて、サンプル内の複数の見えないクラスを認識するように訓練されている。
本稿では,エプシロンと呼ばれるMLZSLのための新しいビジュアル・セマンティック・フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:45:24 GMT)
When In-memory Computing Meets Spiking Neural Networks -- A Perspective on Device-Circuit-System-and-Algorithm Co-design [23.8] レビューでは、スパイキングニューラルネットワーク(SNN)とアナログインメモリ・コンピューティング(IMC)ドメインという形で、生物解析可能な人工知能の交差点について考察する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 23:45:40 GMT)
uMedSum: A Unified Framework for Advancing Medical Abstractive Summarization [23.2] 現在の方法では、重要な情報を忠実に犠牲にしたり、情報提供の優先順位付けを行うときに信条を導入する場合が多い。
本稿では,5つの標準メトリクスを用いて,3つの多様なデータセットにまたがる6つの高度な抽象的要約手法のベンチマークを示す。
本稿では, 逐次的な断片化除去に新たなアプローチを導入し, 鍵を欠いた情報追加を行うモジュール型ハイブリッド要約フレームワーク uMedSum を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:08:49 GMT)
RoadFormer+: Delivering RGB-X Scene Parsing through Scale-Aware Information Decoupling and Advanced Heterogeneous Feature Fusion [23.1] RoadFormerは、RGB画像と表面正規地図から不均一な特徴を抽出することに成功した。
RoadFormer+は、ディープ、サーマル、サーフェスノーマル、ポーラライゼーションなどのデータの追加タイプ/モダリティを表す。
RoadFormer+ は KITTI Road ベンチマークで第1位にランクインし、組合間の交差平均で最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:42:14 GMT)
Scalable Autoregressive Image Generation with Mamba [23.0] 本稿では,マンバアーキテクチャに基づく自己回帰(AR)画像生成モデルであるAiMを紹介する。
Mamba(マンバ)は、線形時間による長周期モデリングに特有な性能を特徴とする、新しい状態空間モデルである。
パラメータ数は128Mから1.3Bまで様々である。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:27:49 GMT)
Uncovering Latent Arguments in Social Media Messaging by Employing LLMs-in-the-Loop Strategy [23.0] ソーシャルメディアは世論分析の自動化方法として人気が高まっている。
トピックモデリングのような公共の話題からテーマを抽出する伝統的な教師なしの手法は、しばしば特定のニュアンスを捉えない過度なパターンを明らかにする。
本稿では,大規模言語モデルの高度な機能を活用したLLMs-in-the-Loop戦略を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:52:13 GMT)
BihoT: A Large-Scale Dataset and Benchmark for Hyperspectral Camouflaged Object Tracking [22.5] 我々は、ハイパースペクトルカモフラージュされた物体追跡(HCOT)と呼ばれる新しいタスクを提供する。
大規模HCOTデータセットであるBihoTは,49個のビデオシーケンスをカバーする41,912個のハイパースペクトル画像からなる。
スペクトルプロンプトベースインタラプタ・アウェアネットワーク(SPDAN)という,シンプルだが効果的なベースラインモデルを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:07:51 GMT)
Through-the-Wall Radar Human Activity Micro-Doppler Signature Representation Method Based on Joint Boulic-Sinusoidal Pendulum Model [22.3] 本稿では,Bulic-Sinusoidal pendulum 動作モデルに基づく人間活動型マイクロドップラーシグネチャ表現法を提案する。
またドップラー情報とマイクロドップラー情報を記述するのに必要なキーポイントの最小数を十分に計算する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:33:29 GMT)
TRRG: Towards Truthful Radiology Report Generation With Cross-modal Disease Clue Enhanced Large Language Model [22.3] そこで我々は,大規模言語モデルへのクロスモーダル病ヒントインジェクションの段階的訓練に基づく,真正な放射線学レポート生成フレームワークTRRGを提案する。
提案フレームワークは,IU-XrayやMIMIC-CXRなどのデータセットを用いた放射線学レポート生成において,最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 05:52:27 GMT)
A Comparative Analysis of Faithfulness Metrics and Humans in Citation Evaluation [22.0] 大型言語モデル(LLM)は、しばしば「幻覚」として知られる、サポートされていない、または検証できないコンテンツを生成する。
本稿では,3段階のサポートレベル間での引用を識別する上で,メトリクスの有効性を評価するための比較評価フレームワークを提案する。
以上の結果から,全ての評価において一貫した指標が存在しないことが示唆され,詳細なサポートレベルを正確に評価することの難しさが強調された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:44:31 GMT)
Self-supervised Learning for Geospatial AI: A Survey [21.5] 自己教師付き学習(SSL)は地理空間データに採用されていることで注目を集めている。
本稿では,地理空間ベクトルデータで広く用いられている3種類の一次データ(幾何学)に対して,SSL技術の適用および開発に関する包括的かつ最新の調査を行う。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 05:28:22 GMT)
UNCO: Towards Unifying Neural Combinatorial Optimization through Large Language Model [21.2] 1つのモデルで異なるタイプの最適化問題(COP)を解決するために、統一的なニューラルネットワーク最適化フレームワークを提案する。
我々は自然言語を用いて、異なるCOPに対してテキスト分散インスタンスを定式化し、それらを大言語モデル(LLM)によって同じ埋め込み空間にエンコードする。
実験により、UNCOモデルはシングルセッショントレーニング後に複数のCOPを解決でき、伝統的なベースラインや学習ベースのベースラインに匹敵する満足なパフォーマンスを達成できることが示された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:42:44 GMT)
DH-Bench: Probing Depth and Height Perception of Large Visual-Language Models [21.2] 視覚言語モデル(VLM)の幾何学的理解に焦点を当てる。
我々は,Synthetic 2D,Synthetic 3D,Real-Worldシナリオを含むデータセットを用いて17の最先端VLMをベンチマークする。
我々の重要な洞察は、VLMの深さと高さの推論能力の欠点と、これらのモデルに存在する固有のバイアスを詳細に分析することである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:49:48 GMT)
SST: Multi-Scale Hybrid Mamba-Transformer Experts for Long-Short Range Time Series Forecasting [20.9] 時系列はグローバルなパターンと局所的なバリエーションに分解できる。
我々は,SST(State Space Transformer)モデルを用いたハイブリッド型マンバ・トランスフォーマーを提案する。
SSTは、低メモリフットプリントと計算コストを維持しながら、短距離時系列予測においてSOTA結果を達成することができる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:55:42 GMT)
A Safe and Efficient Self-evolving Algorithm for Decision-making and Control of Autonomous Driving Systems [20.0] 自己進化型自動運転車は、現実世界の環境における未知のシナリオに対処することが期待されている。
強化学習は 最適な政策を学ぶことで 自己進化できる。
本稿では,ハイブリッドなメカニズム-経験-学習型拡張手法を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:05:03 GMT)
Relaxed Rotational Equivariance via $G$-Biases in Vision [19.8] 群同変畳み込み(GConv)は回転対称性データを効果的に扱うことができる。
実世界のデータは、回転対称性(Rotational Symmetry-Breaking)と呼ばれる厳密な回転対称性にほとんど準拠しない。
本稿では,G$-Biasesと呼ばれる学習可能なバイアスの集合を利用して,この問題に対処する,単純かつ高効率な手法を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:52:53 GMT)
Tackling Data Heterogeneity in Federated Learning via Loss Decomposition [19.8] 本研究は,世界的損失を局所的損失,分布シフト損失,集約損失の3つの項に分解することで,FLの学習がFLのパフォーマンスに与える影響を分析する。
本稿では,この3つの損失項を共同で削減するために,FedLDと呼ばれる大域的損失分解に基づく新しいFL法を提案する。
我々の戦略は、他のFLアルゴリズムと比較して網膜および胸部X線分類において、より良い、より堅牢な性能を達成する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:18:11 GMT)
Urban Mobility Assessment Using LLMs [19.6] 本研究は,大規模言語モデル(LLM)を推進し,旅行調査を合成する,革新的なAIベースのアプローチを提案する。
本研究は, 異なるレベルの既存調査データと比較し, 全米各都市圏におけるこのアプローチの有効性について検討した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 19:17:33 GMT)
Robust Principal Component Analysis via Discriminant Sample Weight Learning [19.3] 本稿では,データ平均とPCAプロジェクション行列の両方を,外乱量を含むデータから識別可能なサンプル重みを学習することにより,ロバストな推定法を提案する。
玩具データ,UCIデータセット,顔データセットを用いた実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:06:31 GMT)
Variance reduction of diffusion model's gradients with Taylor approximation-based control variate [19.2] 我々は、学習目標とその勾配に$k$-次テイラー展開を用い、スコアベースモデルの高分散を低減する。
両者の等価性を証明し、低次元問題設定に対するアプローチの有効性を実証的に実証する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:08:34 GMT)
The Curious Case of Nonverbal Abstract Reasoning with Multi-Modal Large Language Models [19.2] MLLM(Multi-modal large language model)は、言語情報と視覚情報を統合したものである。
MLLMの革新的展望にもかかわらず、推論能力に対する我々の理解は限られている。
本研究では,オープンソースおよびクローズドソースMLLMの非言語的抽象的推論能力を評価する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:11:45 GMT)
SoK: An Introspective Analysis of RPKI Security [19.1] Resource Public Key Infrastructure (RPKI)は、BGPによるドメイン間ルーティングをプレフィックスのハイジャックから保護する主要なメカニズムである。
現在、グローバルプレフィックスのほぼ半分はRPKIでカバーされており、27%のネットワークが既にRPKIを使用してBGPの発表を検証していることを示している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:57:09 GMT)
GNN-SKAN: Harnessing the Power of SwallowKAN to Advance Molecular Representation Learning with GNNs [19.0] 我々は、KAN(Kolmogorov-Arnold Networks)を統合したGNNの新しいクラスを導入する。
Kanは、その堅牢なデータ適合能力と、小規模AI + Scienceタスクの高精度で知られている。
本稿では,新たなクラスであるGNN-SKANと,その拡張型であるGNN-SKAN+を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:45:45 GMT)
Cross-Domain Foundation Model Adaptation: Pioneering Computer Vision Models for Geophysical Data Analysis [18.9] コンピュータビジョン領域から地球科学への適応基盤モデル(FM)について検討する。
本研究では,コンピュータビジョンから地学へのFMの適用について検討し,その規模,適応性,地学データ解析の汎用性について考察した。
本稿では,既存のコンピュータビジョンFMを活用し,地学的なタスクを微調整し,開発コストを低減し,精度を向上するワークフローを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:41:18 GMT)
4D Diffusion for Dynamic Protein Structure Prediction with Reference Guided Motion Alignment [18.9] 本研究では分子動力学(MD)シミュレーションデータを用いた動的タンパク質構造学習のための革新的4次元拡散モデルを提案する。
我々の知る限り、これはタンパク質の軌道を複数の時間ステップで同時に予測することを目的とした初めての拡散モデルである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:12:50 GMT)
A Flexible, Equivariant Framework for Subgraph GNNs via Graph Products and Graph Coarsening [18.7] グラフグラフニューラルネットワーク(サブグラフGNN)は,グラフをサブグラフの集合として表現することで,メッセージパスGNNの表現性を向上する。
以前のアプローチでは、ランダムにまたは学習可能なサンプリングによって選択されたサブグラフのサブセットのみを処理することを提案していた。
本稿では,これらの問題に対処する新しいSubgraph GNNフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:39:36 GMT)
New Bounds on Quantum Sample Complexity of Measurement Classes [18.5] 本稿では量子状態からの古典的推論のための量子教師あり学習について研究する。
学習の難しさは、よく知られたほぼ正しい(PAC)量子対して、サンプルの複雑さによって測定される
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:43:13 GMT)
Cell-ontology guided transcriptome foundation model [18.5] to present textbfsingle textbfcell, textbfCell-textbfontology guided TFM scCello。
我々のTFMは、生物学的に重要なタスクにおいて、既存のTFMよりも競争力と伝達性を示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:15:49 GMT)
Regularization for Adversarial Robust Learning [18.5] 我々は,$phi$-divergence正規化を分散ロバストなリスク関数に組み込む,対角訓練のための新しい手法を開発した。
この正規化は、元の定式化と比較して計算の顕著な改善をもたらす。
本研究では,教師付き学習,強化学習,文脈学習において提案手法の有効性を検証し,様々な攻撃に対して最先端の性能を示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:07:50 GMT)
Adaptive Layer Splitting for Wireless LLM Inference in Edge Computing: A Model-Based Reinforcement Learning Approach [18.2] 本研究では、モデルベース強化学習(MBRL)からインスピレーションを得て、エッジとユーザ機器(UE)間の最適分割点を決定するフレームワークを提案する。
報酬代理モデルを導入することで、頻繁な性能評価の計算コストを大幅に削減できる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:40:29 GMT)
Efficient Multivariate Time Series Anomaly Detection Through Transfer Learning for Large-Scale Web services [18.1] 大規模言語モデル(LLM)は、一般的な質問回答(Q&A)では優れているが、ドメイン固有の知識が不足しているため、専門分野では不足することが多い。
本稿では,軽量なオープンソース LLM を活用することで,これらの問題に対処する新しいフレームワークであるSelf-Evolutionを提案する。
我々はQwen1.5-7B-Chat上での自己進化(Self-Evolution)を、China Mobileの豊富なドメイン知識を含む4000のドキュメントを用いて採用する。
中国モバイルの毎日の運用とメンテナンスに117日間、セルフエボリューションが展開され、アラームの発見、問題修正、関連するレポートの発見の効率が向上している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:36:15 GMT)
High-resolution Population Maps Derived from Sentinel-1 and Sentinel-2 [17.8] POPCORN は、Sentinel-1 と Sentinel-2 の衛星画像のみを無料で利用できる人口マッピング手法である。
我々は400人未満の地域国勢調査に基づいて100mのGSDを持つルワンダの人口地図を作成した。
POPCORNは、ビルトアップされたエリアの明示的なマップと、ローカルなビルの占有率を検索する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:04:21 GMT)
Dynamic Gated Recurrent Neural Network for Compute-efficient Speech Enhancement [17.7] 本稿では,資源制約のあるプラットフォーム上で動作する計算効率の高い音声強調モデルのための動的Gated Recurrent Neural Network (DG-RNN) を提案する。
DG-RNNの実現として,追加パラメータを必要としない動的Gated Recurrent Unit (D-GRU)を提案する。
DNSチャレンジデータセットを用いて、最先端の計算効率の高いRNNベースの音声強調アーキテクチャから得られたテスト結果は、D-GRUベースのモデルが、ベースラインのGRUベースのモデルに匹敵する類似の音声インテリジェンスと品質指標を維持していることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:20:11 GMT)
On the connection between least squares, regularization, and classical shadows [17.6] RLS と CS の両者を, 未決定状態の正則化剤とみなすことができることを示す。
RLSとCSを3つの異なる角度から評価し, バイアスと分散のトレードオフ, 期待値と実測値とのミスマッチ, 計測数と撮影数との相互作用について検討した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:15:30 GMT)
Multi-Style Facial Sketch Synthesis through Masked Generative Modeling [17.3] 本稿では,画像と対応するマルチスタイリズドスケッチを効率よく変換する軽量なエンドツーエンド合成モデルを提案する。
本研究では,半教師付き学習を学習プロセスに取り入れることで,データ不足の問題を克服する。
提案手法は,複数のベンチマークで従来アルゴリズムより常に優れていた。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:45:04 GMT)
A Personalized Zero-Shot ECG Arrhythmia Monitoring System: From Sparse Representation Based Domain Adaption to Energy Efficient Abnormal Beat Detection for Practical ECG Surveillance [17.3] 本稿では,ウェアラブルモバイルセンサにおける早期不整脈検出のための低コストで高精度なECGモニタリングシステムを提案する。
ウェアラブルデバイスにパーソナライズされたアルゴリズムが組み込まれている現実のシナリオでは、そのようなトレーニングデータは、心疾患歴のない健康な人には利用できない。
本稿では,既存ユーザの異常信号と正常信号とを新たなユーザ信号空間に投影するために,疎表現に基づくドメイン適応手法を提案する。
ゼロショット不整脈検出のアプローチでは、平均精度は98.2%、F1スコアは92.8%となる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:48:10 GMT)
Adapt CLIP as Aggregation Instructor for Image Dehazing [17.3] ほとんどの脱ヘイジング法は、限られた受容領域に悩まされており、視覚言語モデルにカプセル化される前の豊かな意味を探索しない。
先駆的なハイブリッドフレームワークであるCLIPHazeを紹介し、Mambaの効率的なグローバルモデリングとCLIPの事前知識とゼロショット機能とを相乗化する。
並列状態空間モデルとウィンドウベースの自己アテンションを用いて,グローバルな文脈依存性と局所的な微粒化知覚を得る。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:51:50 GMT)
Query-Efficient Video Adversarial Attack with Stylized Logo [17.3] ディープニューラルネットワーク(DNN)に基づくビデオ分類システムは、敵の例に対して非常に脆弱である。
我々は Stylized Logo Attack (SLA) と呼ばれる新しいブラックボックスビデオアタックフレームワークを提案する。
SLAは3つのステップで実施される。最初のステップはロゴのスタイル参照セットを構築することであり、生成された例をより自然にするだけでなく、ターゲットとする攻撃でより多くのターゲットクラス機能を実行することができる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:19:09 GMT)
EX-DRL: Hedging Against Heavy Losses with EXtreme Distributional Reinforcement Learning [17.0] 分散強化学習(DRL)における一般的なアプローチは、特定のレベルでの損失分布の量子化をQR(Quantile Regression)を用いて学習することである。
この方法は、直接量的リスク評価(VaR)や条件的リスク評価(CVaR)などのオプションヘッジにおいて特に有効である。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:41:49 GMT)
Rank and Align: Towards Effective Source-free Graph Domain Adaptation [16.9] グラフニューラルネットワーク(GNN)は、グラフ領域適応において素晴らしいパフォーマンスを達成した。
しかし、プライバシやストレージ上の懸念から、大規模なソースグラフは現実のシナリオでは利用できない可能性がある。
そこで我々は,Range and Align (RNA)と呼ばれる新しいGNNベースのアプローチを導入し,ロバストセマンティクス学習のためのスペクトルセレーションとグラフ類似性をランク付けする。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:00:50 GMT)
Search-Based LLMs for Code Optimization [16.8] 開発者によって書かれたコードは、通常効率上の問題に悩まされ、様々なパフォーマンス上のバグを含んでいる。
最近の研究は、タスクをシーケンス生成問題とみなし、大規模言語モデル(LLM)のようなディープラーニング(DL)技術を活用している。
改良された最適化手法の反復的洗練と発見を可能にする,SBLLM という検索ベース LLM フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 06:59:46 GMT)
OVA-DETR: Open Vocabulary Aerial Object Detection Using Image-Text Alignment and Fusion [16.8] 航空画像のための高速開語彙検出器OVA-DETRを提案する。
画像テキストアライメントの考え方に基づいて、カテゴリ回帰損失を置き換えるために、領域テキストコントラスト損失を提案する。
Bi-VLFにはデュアルアテンションフュージョンエンコーダとマルチレベルテキスト誘導フュージョンデコーダが含まれる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:33:25 GMT)
Large Language Models as Foundations for Next-Gen Dense Retrieval: A Comprehensive Empirical Assessment [16.4] BERTやT5のような事前訓練された言語モデルは、高密度検索のための重要なバックボーンエンコーダとして機能する。
近年,大規模言語モデル (LLM) をレトリバーとして使用し,様々なタスクでSOTA性能を達成している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:16:07 GMT)
A Survey on Deep Learning for Theorem Proving [16.3] 定理証明は数学の基本的な側面であり、自然言語における非公式な推論から形式体系における厳密な導出にまで及ぶ。
ディープラーニング、特に大きな言語モデルの出現は、定理証明のプロセスを強化するためにこれらの技術を探究する研究の顕著な急増を引き起こした。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:56:45 GMT)
Fair Augmentation for Graph Collaborative Filtering [16.3] 近年のレコメンデーションは,ユーザ-イットネットワークからユーザの好みを学習する上で,グラフニューラルネットワーク(GNN)の協調力を活用している。
自動システムの公正性に対処する新たな規制にもかかわらず、グラフ協調フィルタリングにおける不公平性問題は未解決のままである。
本報告は, グラフ協調フィルタリングにおける不公平性問題に焦点をあてた最近の研究に対して, 最新の緩和手法の1つを再現することによって, 確固たる対応を図ったものである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:35:11 GMT)
Segment anything model 2: an application to 2D and 3D medical images [16.3] Segment Anything Model (SAM) は、プロンプトが与えられた画像に様々なオブジェクトをセグメント化できるため、注目されている。
最近開発されたSAM 2は、この機能をビデオ入力に拡張した。
これにより、SAMを3D画像に適用する機会が開ける。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:38:20 GMT)
Convert and Speak: Zero-shot Accent Conversion with Minimum Supervision [16.2] アクセント変換問題の鍵となる課題は、並列データの低リソースである。
本稿では,意味トークンレベルでのみ変換を行う2段階生成フレームワーク"Convert-and-speak"を提案する。
このフレームワークは、15分程度の弱い並列データでアクセント類似性、音声品質、話者維持の最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:56:20 GMT)
Real-Time Video Generation with Pyramid Attention Broadcast [16.1] ピラミド・アテンション・ブロードキャスト(PAB)は、リアルタイム、高品質、およびトレーニング不要なDiTベースのビデオ生成方式である。
PABはベースラインと比較して3つのモデルで優れた結果を示し、最大720pビデオのリアルタイム生成を実現している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:54:21 GMT)
Data Quality Antipatterns for Software Analytics [16.1] 本研究では,ML固有のデータ品質アンチパターンの分類法を開発する。
ソフトウェア分析モデルのパフォーマンスと解釈への影響を評価する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:21:09 GMT)
A Percolation Model of Emergence: Analyzing Transformers Trained on a Formal Language [15.9] データ、サイズ、計算量の増加は、ニューラルネットワークによる特定の能力の急激な学習につながる可能性がある。
本稿では,ニューラルネットワークの文脈における概念の現象論的定義を提案する。
言語の基礎となる文法と文脈に敏感な構造が学習されると、より狭いタスクのパフォーマンスが急に向上し始めることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:44:22 GMT)
Dynamic PDB: A New Dataset and a SE(3) Model Extension by Integrating Dynamic Behaviors and Physical Properties in Protein Structures [15.8] 約12.6Kタンパク質を含む大規模データセットであるDynamic PDBを導入する。
我々は、原子速度と力、ポテンシャルと運動エネルギー、シミュレーション環境の温度を含む、総合的な物理特性スイートを提供する。
本研究は, 軌道予測の課題に対して, 提案したデータセット上での最先端手法の評価を行う。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:06:01 GMT)
Automatic Organ and Pan-cancer Segmentation in Abdomen CT: the FLARE 2023 Challenge [15.6] 腹部CT検査における臓器・癌の分節化は,正確な癌診断と治療の必要条件である。
既存のベンチマークやアルゴリズムは、特定のがんタイプに合わせて調整されており、包括的ながん分析を提供する能力を制限する。
この研究は、大規模で多様なデータセットを提供することにより、腹部臓器と膵臓の分節に関する最初の国際コンペティションである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:38:45 GMT)
Frame Order Matters: A Temporal Sequence-Aware Model for Few-Shot Action Recognition [15.0] 少ショット動作認識のための時間系列認識モデル(TSAM)を提案する。
シーケンシャルな知覚器アダプタを事前学習フレームワークに組み込んで、空間情報とシーケンシャルな時間的ダイナミクスの両方を特徴埋め込みに統合する。
5つのFSARデータセットに対する実験結果から,提案手法が新たなベンチマークを設定したことが確認された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:13:27 GMT)
SAM-REF: Rethinking Image-Prompt Synergy for Refinement in Segment Anything [14.9] 画像とプロンプトを完全に統合し,グローバルかつローカルにプロンプトする2段階改良フレームワークを提案する。
第一段階のGlobalDiff Refinerは、画像全体とプロンプトを組み合わせた軽量のアーリーフュージョンネットワークだ。
第2ステージのPatchDiff Refinerは、マスクに従ってオブジェクトの詳細ウィンドウを特定してプロンプトし、オブジェクトのローカル詳細を洗練します。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:25:39 GMT)
MuTT: A Multimodal Trajectory Transformer for Robot Skills [14.8] MuTTは、ロボットスキルの環境対応実行を予測するために設計された、新しいエンコーダ・デコーダ変換アーキテクチャである。
我々は、視覚と軌跡の融合を開拓し、新しい軌跡投影を導入した。
このアプローチは,現実的な実行を必要とせずに,現状環境におけるロボットスキルパラメータの最適化を容易にする。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:12:19 GMT)
Mamba Retriever: Utilizing Mamba for Effective and Efficient Dense Retrieval [14.8] 本稿では,Mamba Retrieverを実装して,Mambaが高密度検索(DR)モデルの効率的なエンコーダとして機能するかどうかを検討する。
Mamba RetrieverはTransformerベースの検索モデルと比較すると、同等かより優れた効率を実現している。
Mamba Retrieverは長文検索において推論速度が優れている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:07:40 GMT)
Pruning By Explaining Revisited: Optimizing Attribution Methods to Prune CNNs and Transformers [14.8] 計算要求の削減と効率の向上のための効果的なアプローチは、ディープニューラルネットワークの不要なコンポーネントを創り出すことである。
これまでの研究では、eXplainable AIの分野からの帰属法が、最も関係の低いネットワークコンポーネントを数ショットで抽出し、プルークする効果的な手段であることが示された。
我々は、刈り取り作業における属性メソッドのハイパーパラメータを明示的に最適化し、さらにトランスフォーマーベースのネットワークを解析に含めることにより、現在の状態を拡張した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:35:18 GMT)
Sapiens: Foundation for Human Vision Models [14.7] サピエンス(Sapiens)は、4つの基本的人間中心の視覚タスクのモデル群である。
モデルは1Kの高解像度推論をサポートし、個々のタスクに容易に適応できる。
人間の画像のキュレートされたデータセット上での自己教師付き事前トレーニングは、多種多様な人間中心のタスクのパフォーマンスを著しく向上させる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:37:27 GMT)
Improving Factuality in Large Language Models via Decoding-Time Hallucinatory and Truthful Comparators [14.7] 大きな言語モデル(LLM)は、検証可能な事実に矛盾する応答を生成する傾向がある。
応答幻覚を軽減するために,比較器駆動型復号時間(CDT)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:00:31 GMT)
Towards measuring fairness in speech recognition: Fair-Speech dataset [14.7] 本論文では,ASRモデルの精度評価を支援するために,新たなデータセットであるFair-Speechを紹介した。
私たちのデータセットには、米国593人による録音された音声で約26.5Kの発声が含まれています。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 20:55:17 GMT)
FIDAVL: Fake Image Detection and Attribution using Vision-Language Model [14.4] FIDAVLは、視覚と言語処理の相乗効果に触発された、新規で効率的なマルチタスクアプローチである。
視覚と言語間の相補性と、偽画像を検出するソフトなプロンプトチューニング戦略を利用する。
FIDAVLの平均検出精度は95.42%、F1スコアは95.47%である。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:41:56 GMT)
Stochastic Compositional Minimax Optimization with Provable Convergence Guarantees [14.3] 合成ミニマックス問題は、機械学習において存在するが、このクラスの問題の収束に関してのみ確立されている。
本稿では,ミニマックス損失を合成構造で最適化するミニマックス問題の形式的定義を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:00:31 GMT)
QUSL: Quantum Unsupervised Image Similarity Learning with Enhanced Performance [14.3] QUSLは教師なし学習に類似した三つ子を使用し、アンカー画像の摂動によって正のサンプルを生成する。
臨界量子資源の利用を50%以上削減する。
量子リソースが少ない一方で、QUSLは大規模な教師なしタスクの可能性を示している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:47:11 GMT)
Quantum Shadow Gradient Descent for Variational Quantum Algorithms [14.3] 量子ニューラルネットワーク(QNN)における変分量子回路のトレーニングのための勾配勾配推定法が提案されている。
勾配推定の課題は、状態崩壊や測定の不整合といった特異な量子的特徴のために困難であることが証明されている。
我々は,1イテレーション毎に1つのサンプルを用いて勾配のすべての成分を推定する量子シャドウ降下という新しい手法を開発した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:22:30 GMT)
Lighthouse: A User-Friendly Library for Reproducible Video Moment Retrieval and Highlight Detection [14.2] 再現性のあるビデオモーメント検索とハイライト検出(MR-HD)のためのユーザフレンドリーなライブラリLighthouseを提案する。
1つ目は、さまざまなメソッド、データセット、ビデオテキスト機能にまたがる包括的な再現可能な実験の欠如である。これは、統一されたトレーニングと評価が複数の設定をカバーすることができないためである。
ほとんどの作業はトレーニングコードのみをリリースし、MR-HDの推論プロセス全体を実装する必要がある。Lighthouseは6つのモデル、3つの機能、5つのデータセットを含む統一的な再現可能な実装によってこれらの問題に対処する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 00:31:39 GMT)
Concept Conductor: Orchestrating Multiple Personalized Concepts in Text-to-Image Synthesis [14.2] コンセプトコンダクタは、マルチコンセプトのカスタマイズにおいて、視覚的忠実さと正確なレイアウトを保証するように設計されている。
本稿では,各概念の生成領域を特定するために形状認識マスクを用いた概念注入手法を提案する。
本手法は,様々な概念の組み合わせをサポートし,視覚的に類似した概念を扱う場合でも高い忠実性を維持する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:19:34 GMT)
Identifying the Best Arm in the Presence of Global Environment Shifts [14.1] 本稿では,非定常帯域設定におけるBest-Arm識別問題について定式化する。
予算の固定化を目標として、環境の変化にまたがる最適な腕を特定することを目的とする。
我々は、各環境における全腕にわたるグローバルシフトに関する情報を活用するアロケーションポリシーLinLUCBを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:47:01 GMT)
LLMs are not Zero-Shot Reasoners for Biomedical Information Extraction [14.0] 大規模言語モデル(LLM)は、医療分野のアプリケーションにますます採用されている。
LLMがバイオメディカル領域で伝統的に追求されるタスクでどの程度うまく機能するかは不明である。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:37:40 GMT)
Large Language Models Might Not Care What You Are Saying: Prompt Format Beats Descriptions [13.9] 本稿では,複数のコンテキスト内サンプルの選択基準を記述するためのアンサンブルプロンプトフレームワークを提案する。
6つの翻訳方向にわたる機械翻訳(MT)の予備実験により、このフレームワークがICLの出現を促進することが確認された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:52:28 GMT)
API-guided Dataset Synthesis to Finetune Large Code Models [13.8] 大規模なコードモデル(LCM)は巨大なコードコーパスで事前訓練される。
監視された微調整(SFT)は、これらのモデルを特定の要求と整合させる上で重要な役割を果たす。
高品質のSFTデータセットは、データセットの不均一な品質とドメイン固有のデータセットの不足のため、大きな課題となる。
API誘導型データセット合成フレームワークであるDataScopeを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:29:51 GMT)
Envisioning Class Entity Reasoning by Large Language Models for Few-shot Learning [13.7] 少ないショット学習は、限られた数のビジュアルサンプルを使用して新しい概念を認識することを目的としている。
我々のフレームワークは,Large Language Models(LLMs)から抽出した抽象クラスセマンティクスと具体的なクラスエンティティの両方を組み込んでいる。
難易度の高いワンショット設定では、ResNet-12のバックボーンを利用して、第2の競争相手に比べて平均1.95%の改善を実現しています。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:10:20 GMT)
Contextual Stochastic Optimization for School Desegregation Policymaking [13.7] 本稿では、選択による再限定(RWC)と呼ばれる、共同再限定と選択モデリングの枠組みを開発する。
RWCの主な方法論的貢献は、地域全体の相違を最小化する文脈最適化モデルである。
結果は、学校の選択を予測することは、難しい機械学習の問題であることも明らかにした。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:40:06 GMT)
Can LLMs Understand Social Norms in Autonomous Driving Games? [13.4] 社会規範は、社会において許容される行動の共有標準として定義される。
本稿では,自律走行ゲームにおける社会規範の理解とモデル化におけるLLMの適用について検討する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:39:00 GMT)
Towards Enhancing the Reproducibility of Deep Learning Bugs: An Empirical Study [13.2] 本稿では,ディープラーニングのバグを再現する上で重要な課題について検討する。
重要な問題を改善する可能性のある編集動作と有用な情報を特定します。
165件のバグのうち148件を再現しました。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 20:57:08 GMT)
Adapting MIMO video restoration networks to low latency constraints [13.1] 利用可能な将来のフレームの数を制限することで、低レイテンシ設定に注力する。
出力品質を向上させるための2つの簡単な解を提案する。
計算コストの異なる3つの最先端ビデオデノベーションネットワーク上でテストを行う。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:36:56 GMT)
SPICED: News Similarity Detection Dataset with Multiple Topics and Complexity Levels [13.1] 本研究では,7つのトピックを含む類似ニュースのデータセットSPICEDを提案する。
我々は,ニュース類似度検出タスクに特化して設計した4種類の複雑さを提示する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:27:56 GMT)
TimeMachine: A Time Series is Worth 4 Mambas for Long-term Forecasting [13.1] TimeMachineは時系列データのユニークな特性を利用して、マルチスケールで適切なコンテキストキューを生成する。
TimeMachineは、ベンチマークデータセットを使用して広範囲に検証されるように、予測精度、スケーラビリティ、メモリ効率において優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 23:49:16 GMT)
Dual-path Frequency Discriminators for Few-shot Anomaly Detection [13.0] 本稿では、これらの問題に対処するために、周波数観点からDual-Path Frequency Discriminator (DFD)ネットワークを提案する。
識別者は擬似アノマリーの形で共同表現を学ぶ。
MVTec AD と VisA ベンチマークで行った実験では、DFD が現在の最先端手法を超越していることが示されている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:19:45 GMT)
MUC: Mixture of Uncalibrated Cameras for Robust 3D Human Body Reconstruction [12.9] 複数のカメラは、人物の包括的なマルチビュービデオカバレッジを提供することができる。
以前の研究では、複数の視点の下で自己排除によって生じる課題を見落としていた。
複数のカメラビューから3次元人体を再構築する手法を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:17:42 GMT)
Unmasking Context Injection on Interactive Large Language Models [12.9] 大規模言語モデル(LLM)は、実世界のアプリケーションで普及し、素晴らしいテキスト生成性能を示している。
LLMベースのチャットシステムは、対話的に振る舞うためには、事前に定義された構造に従って、事前のチャット履歴を入力のコンテキストとして統合する必要がある。
本稿では,LLMの会話に,対象モデルの事前知識を必要とせずに,誤解を招くコンテキスト(チャット履歴)を系統的に注入する手法を提案する。
我々は、コンテキストインジェクションを用いて、禁止されたコンテンツを引き出す方法、違法な行為や不適切な反応のリスクを訴える方法について検討する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:17:38 GMT)
Learning Interpretable Models Using Uncertainty Oracles [12.9] 解釈可能なモデルの望ましい性質は、人間によって容易に理解できるように、小さなサイズである。
a) 小さいサイズが正確さを暗示し、(b) サイズを制限するモデルファミリが提供するビースルークレバーは、望ましいサイズ精度のトレードオフに達するには不十分である。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 22:21:38 GMT)
EUIS-Net: A Convolutional Neural Network for Efficient Ultrasound Image Segmentation [12.8] EUIS-Netは、超音波画像を効率的に正確に分割するCNNネットワークである。
4つのエンコーダ・デコーダブロックは計算複雑性を著しく低下させる。
提案されたEUIS-Netは平均IoUとダイススコアが78.12%、85.42%、84.73%、89.01%である。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:57:59 GMT)
Assessing Modality Bias in Video Question Answering Benchmarks with Multimodal Large Language Models [12.8] 我々は、VidQAベンチマークとデータセットのバイアスを特定するために、MIS(Modality importance score)を導入する。
また,最新のMLLMを用いてモダリティの重要度を推定する手法を提案する。
以上の結果から,既存のデータセットでは,モダリティの不均衡による情報統合が効果的に行われていないことが示唆された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 23:32:42 GMT)
On Statistical Rates and Provably Efficient Criteria of Latent Diffusion Transformers (DiTs) [12.8] 低次元線形潜時空間仮定の下で、潜時テキストbfDiffusion textbfTransformers(textbfDiTs)の限界について検討する。
具体的には、潜時空間次元のサブ線形である潜時DiTのスコアネットワークに対して、近似誤差を導出する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 06:25:19 GMT)
TReX- Reusing Vision Transformer's Attention for Efficient Xbar-based Computing [12.6] 本稿では,注目度に基づくViT最適化フレームワークであるTReXを提案する。
We found that TReX achieves 2.3x (2.19x) EDAP reduction and 1.86x (1.79x) TOPS/mm2 improve with 1% accuracy drop in case of DeiT-S (LV-ViT-S) ViT models。
CoLAのようなNLPタスクでは、TReXは、基準線が1.6倍低いEDAPよりも2%高い非理想的精度をもたらす。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 21:51:38 GMT)
LAKD-Activation Mapping Distillation Based on Local Learning [12.2] 本稿では,新しい知識蒸留フレームワークであるローカル注意知識蒸留(LAKD)を提案する。
LAKDは、教師ネットワークからの蒸留情報をより効率的に利用し、高い解釈性と競争性能を実現する。
CIFAR-10, CIFAR-100, ImageNetのデータセットについて実験を行い, LAKD法が既存手法より有意に優れていたことを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:29:58 GMT)
EXAONEPath 1.0 Patch-level Foundation Model for Pathology [12.2] 自己教師付きモデルから抽出された特徴は、個々のスライド画像(WSI)によってクラスタリングされる傾向がある
EXAONEPathは,染色正規化を施したパッチをトレーニングした新しい基礎モデルである。
EXAONEPath は使用した WSI の数とモデルパラメータ数に対して優れた性能を示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 05:07:18 GMT)
Enhancing Transferability of Adversarial Attacks with GE-AdvGAN+: A Comprehensive Framework for Gradient Editing [12.1] 転送可能な敵攻撃は、ディープニューラルネットワークに重大な脅威をもたらす。
本稿では、GE-AdvGAN+という、勾配編集に基づく転送可能な攻撃のための新しいフレームワークを提案する。
我々のフレームワークは、ほとんどすべての主流攻撃手法を統合し、転送可能性を高めながら、計算資源の消費を大幅に削減する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:26:31 GMT)
Recognizing Beam Profiles from Silicon Photonics Gratings using Transformer Model [12.1] 我々は、SiPh格子からの光のビームプロファイルの対応する高さカテゴリを認識するトランスモデルを開発した。
得られた結果は、光ビームの自動焦点付けやz軸ステージの自動調整など、様々な用途に拡張することができる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 05:24:16 GMT)
Better Debugging: Combining Static Analysis and LLMs for Explainable Crashing Fault Localization [12.1] 本稿では,静的解析とLLM手法を組み合わせた説明可能なクラッシュ断層定位手法を提案する。
フレームワークコードで例外をスローするステートメントのセマンティクスを理解することは、バグだらけのメソッドをアプリコードで見つけて認識するのに役立ちます。
この考え方に基づいて、まず、各フレームワーク固有の例外に関連する重要な要素を記述する例外スローの要約(ETS)を設計する。
そして、その重要な要素をデータ追跡して、与えられたクラッシュのバグのある候補を特定し、ソートします。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:18:35 GMT)
Non-Homophilic Graph Pre-Training and Prompt Learning [12.0] 本稿では,好ましくないグラフに対する事前学習と迅速な学習の枠組みであるProNoGを提案する。
まず、既存のグラフ事前学習手法を分析し、事前学習タスクの選択に関する理論的知見を提供する。
第2に,各ノードが特異な非ホモフィル性を示すことを認識し,下流タスクにおけるノード固有のパターンを特徴付ける条件付きネットワークを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:57:31 GMT)
DreamCinema: Cinematic Transfer with Free Camera and 3D Character [12.0] 本稿では,生成AIを映画製作パラダイムに進化させる新しい映画転送フレームワークであるDreamCinemaを提案する。
具体的には、まず、撮影要素(例えば、人間とカメラのポーズ)を抽出し、カメラの軌道を最適化する。
次に,人体構造を持つ3次元高品質キャラクタを効率よく作成するキャラクタ生成手法を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:59:44 GMT)
Fuzzing Microservices: A Series of User Studies in Industry on Industrial Systems with EvoMaster [11.6] 本稿では,約2年間にわたるMeituanのテストプロセスにおけるEvoMasterの統合経験について報告する。
EvoMasterの2つのバージョンを評価するために、2021年と2023年に2つのユーザースタディが実施された。
この2つのユーザスタディは、EvoMasterの明確なメリットと、そのようなファジッターを産業試験で必要としていることを示しています。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:05:06 GMT)
Comparing Graph Transformers via Positional Encodings [11.6] グラフ変換器の識別能力は位置符号化の選択と密接に結びついている。
位置符号化には、絶対位置符号化(APE)と相対位置符号化(RPE)の2種類がある。
APE と RPE を用いたグラフトランスフォーマーは、パワーの区別の点で等価であることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 23:22:33 GMT)
Personalized Federated Learning via ADMM with Moreau Envelope [11.6] モローエンベロープ(FLAME)を用いたPFLモデルの学習のための乗算器(ADMM)の交互方向法を提案する。
我々の理論的分析は、偏りのないクライアント選択戦略と偏りのないクライアント選択戦略の両方の下で、グローバル収束を確立する。
実験により、FLAMEは、異種データに基づいて訓練された場合、モデル性能の点で最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:35:35 GMT)
Quater-GCN: Enhancing 3D Human Pose Estimation with Orientation and Semi-supervised Training [11.5] 本稿では,向きによるポーズ推定を強化するために,有向グラフ畳み込みネットワークであるQuater-GCNを紹介する。
Q-GCNは、座標を通してノード関節間の空間的依存関係をキャプチャするだけでなく、2次元空間における骨の回転の動的コンテキストを統合することで、排他的に優れている。
我々は,ラベルのないデータを活用する半教師付きトレーニング戦略でモデルを補完する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:03:56 GMT)
Generative Diffusion Model-based Downscaling of Observed Sea Surface Height over Kuroshio Extension since 2000 [11.4] 本研究では,高分解能海面高度解析データをトレーニングするための最先端な生成拡散モデルを提案する。
このモデルは、約12kmの波長に対応する0.25oの解像度から1/16oまでの生衛星補間データを効果的にダウンスケールする。
以上の結果から,2004年以降の黒潮拡張地域では,250km未満の水平スケールでの渦運動エネルギーが著しく増加したことが示唆された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:26:19 GMT)
Recovering from Biased Data: Can Fairness Constraints Improve Accuracy? [11.4] 経験的リスク最小化(Empirical Risk Minimization, ERM)は、バイアスがあるだけでなく、真のデータ分布に最適な精度を持つ分類器を生成する。
公平性に制約されたERMによるこの問題の是正能力について検討する。
また、トレーニングデータの再重み付け、等化オッド、復号化パリティなど、他のリカバリ手法についても検討する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:33:28 GMT)
Class-balanced Open-set Semi-supervised Object Detection for Medical Images [11.4] 実世界の医療画像データセットは、しばしばラベル付きで不均衡であり、Semi-Supervised Object Detection (SSOD) はラベル付きデータを利用してオブジェクト検出器を改善することができる。
本稿では,OODクラスを含む未ラベルデータを利用してオブジェクト検出を改善するオープンセット半教師付きオブジェクト検出問題について考察する。
提案手法は最先端のSSOD性能より優れ,公開データセットの4.25mAP改善を実現している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:54:15 GMT)
Runtime Analysis of Single- and Multi-Objective Evolutionary Algorithms for Chance Constrained Optimization Problems with Normally Distributed Random Variables [11.3] 独立して通常は分散しているコンポーネントのシナリオについて研究する。
期待されるコストとその分散をトレードオフする問題を多目的に定式化する。
また,本手法は,木に散らばった最小限の問題に対して最適解の集合を計算するためにも有効であることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 00:24:14 GMT)
An Animation-based Augmentation Approach for Action Recognition from Discontinuous Video [11.3] コンピュータビジョンの重要な構成要素である行動認識は、複数のアプリケーションにおいて重要な役割を果たす。
CNNは、不連続なビデオフレームでトレーニングされた場合、パフォーマンスの低下に悩まされる。
この問題を克服するために、一連の高度な技術を用いた4Aパイプラインを紹介します。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 05:57:25 GMT)
RoundTable: Leveraging Dynamic Schema and Contextual Autocomplete for Enhanced Query Precision in Tabular Question Answering [11.2] 現実世界のデータセットは、大きな属性と複雑な値の配列を特徴とすることが多い。
従来の手法ではデータセットのサイズと複雑さをLarge Language Modelsに完全にリレーすることはできません。
入力テーブル上でFTS(Full-Text Search)を利用する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:13:06 GMT)
You Only Merge Once: Learning the Pareto Set of Preference-Aware Model Merging [11.2] 本稿では,各ベースモデルのタスク上でのマージモデルの性能を目的として扱う,嗜好意識のモデルマージを提案する。
1つのマージプロセスのみにおいて、提案したパラメータ効率構造は、マージされたモデルの集合全体を生成することができる。
提案手法により, 多様なトレードオフモデルを得ることができ, ベースラインの整合性に優れることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:41:14 GMT)
SAM-SP: Self-Prompting Makes SAM Great Again [11.1] Segment Anything Model (SAM)は、ゼロショットセグメンテーションタスクにおいて印象的な機能を示した。
SAMは、医療画像などの特定の領域に適用した場合、顕著な劣化性能に遭遇する。
本稿では,バニラSAMモデルの拡張に適したSAM-SPという,自己プロンプトに基づくファインチューニング手法を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:03:05 GMT)
LaWa: Using Latent Space for In-Generation Image Watermarking [11.1] 知覚不能な画像透かしはそのような問題に対する有効な解決策の1つである。
LaWaは、LCD向けに設計された次世代画像透かし方式である。
また,LaWaは一般的な画像透かしにも利用できることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 20:05:43 GMT)
Subsurface Scattering for 3D Gaussian Splatting [11.0] 散乱材料を用いた物体の3次元再構成とリライティングは、表面下の複雑な光輸送のために大きな課題となる。
本稿では,マルチビューOLAT(1光1つ)データを用いてオブジェクトの形状を最適にするためのフレームワークを提案する。
本手法は,インタラクティブな速度で素材編集,リライティング,新しいビュー合成を可能にする。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:34:01 GMT)
Exploring Robustness of Visual State Space model against Backdoor Attacks [10.7] 我々は、バックドア攻撃のレンズを通して、VSS(Visual State Space Model)の堅牢性を理解する実験を行う。
まず、異なるバックドアトリガに対するVSSの脆弱性を調査し、SSMメカニズムによってVSSモデルがバックドアトリガに対してより影響を受けやすいことを明らかにする。
パッチの摂動に抵抗するために各パッチに再帰するVSSモデルの効果的なバックドアを検討する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:36:39 GMT)
Mental-Perceiver: Audio-Textual Multimodal Learning for Mental Health Assessment [10.6] 不安や抑うつといった精神障害は、さまざまな年齢の人々の生活に影響を及ぼす世界的な問題となっている。
我々は,マンダリン話者の不安と抑うつ評価に関する大規模テキストbfMulti-textbfModal textbfpsychological Assessment corpus (MMPsy)を構築した。
我々のデータセットには、不安評価のためのインタビューの7,700件、うつ病評価のための4,200件以上の記録が含まれています。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:54:52 GMT)
SLM Meets LLM: Balancing Latency, Interpretability and Consistency in Hallucination Detection [10.5] 大規模言語モデル(LLM)は高い能力を持つが、リアルタイムアプリケーションではレイテンシの問題に直面している。
本研究では,実効的なプロンプト技術の導入により,実時間で解釈可能な幻覚検出を最適化する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 22:13:13 GMT)
Generative AI in Evidence-Based Software Engineering: A White Paper [10.5] 1年足らずで、実践者や研究者は、生成人工知能の迅速かつ広範な実装を目撃した。
テキストGAI機能により、研究者は世界中で新しい生成シナリオを探索し、すべての時間を要するテキスト生成と分析タスクを簡素化し、急ぐことができる。
現在の調査に基づいて、EBSE研究者を効果的に支援する包括的モデルスイートの作成と実証検証を行う。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:11:24 GMT)
Geolocation Representation from Large Language Models are Generic Enhancers for Spatio-Temporal Learning [10.4] 普遍表現モデルは、自然言語処理やコンピュータビジョンで広く使われているよりも一般的ではない。
この相違は主に入力された既存の表現モデルに関連する高コストから生じる。
本研究では,大規模言語モデルを用いて位置情報表現を導出する学習自由手法を開発した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:05:02 GMT)
An Infinite-Width Analysis on the Jacobian-Regularised Training of a Neural Network [10.4] 深部ニューラルネットワークの無限幅限界における最近の理論的分析により、ネットワークの初期化、特徴学習、トレーニングに対する理解が深まりました。
この無限幅解析は、ディープニューラルネットワークのヤコビアンにまで拡張可能であることを示す。
我々は、広い有限ネットワークに対する理論的主張の関連性を実験的に示し、核回帰解の性質を実験的に解析し、ヤコビアン正則化の洞察を得る。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 01:54:59 GMT)
Urban Region Pre-training and Prompting: A Graph-based Approach [10.4] 我々は、地域表現学習のためのtextbfG$raph-based $textbfU$rban $textbfR$egion $textbfP$re-training と $textbfP$rompting フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:56:34 GMT)
Basis-independent quantum coherence and its distribution under relativistic motion [10.2] 加速度と結合強度の合計,集合的,局所的なコヒーレンスの影響について示す。
我々は、集合的、局所的で、基底に依存しないコヒーレンスが総合的に三角形の不等式を満たすことを示した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:14:45 GMT)
Exploring the Feasibility of Automated Data Standardization using Large Language Models for Seamless Positioning [10.2] 大規模言語モデル(LLM)を利用したリアルタイム自動データ標準化の実現可能性について検討する。
我々の研究は、拡張カルマンフィルタ(EKF)によるデータの互換性を確保し、位置決め精度を向上させる。
本研究は,センサデータ統合の複雑さを克服する上で,高度なLCMの可能性を示すものである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:40:21 GMT)
MuMA-ToM: Multi-modal Multi-Agent Theory of Mind [10.1] マルチモーダルなマルチエージェント理論である MuMA-ToM を導入する。
本研究では,現実的な家庭環境における人々のマルチモーダル行動について,ビデオとテキストで記述する。
そして、他人の目標、信念、信念について質問する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:41:45 GMT)
Understanding Literary Texts by LLMs: A Case Study of Ancient Chinese Poetry [10.0] 詩、ジョーク、短編小説などのジャンルにおいて、多くのAIツールが登場し、新たな視点を提供する。
文学作品を評価することは、しばしば複雑で、完全に定量化することは困難であり、AI創造のさらなる発展を妨げている。
本稿では,大規模言語モデルの観点から,文学テキストのミステリーを探究する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:25:06 GMT)
Pseudo-Hermitian extensions of the harmonic and isotonic oscillators [9.9] 調和振動子と等速振動子の擬エルミート拡大について述べる。
位置表現における波動関数を明示的に解き、それらの相互関係を探索する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 20:34:03 GMT)
Evidence-backed Fact Checking using RAG and Few-Shot In-Context Learning with LLMs [9.8] 我々はAveritecデータセットを用いてクレームの正確性を評価する。
精度予測に加えて,本システムでは,データセットから抽出した証拠を裏付ける。
本システムでは,ベースラインに対する22%の絶対改善である0.33の「平均」スコアを達成している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 01:42:34 GMT)
DRExplainer: Quantifiable Interpretability in Drug Response Prediction with Directed Graph Convolutional Network [9.6] 薬物反応予測のための新しい解釈可能な予測モデルDRExplainerを提案する。
DRExplainerは、細胞株のマルチオミクスプロファイル、薬物の化学構造、既知の薬物応答を統合した有向二部ネットワークを構築する。
計算実験では、DRExplainerは最先端の予測手法と別のグラフベースの説明手法より優れている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 05:45:48 GMT)
Disentangled Structural and Featural Representation for Task-Agnostic Graph Valuation [9.6] 我々は、共有ノード置換を用いて売り手と買い手のグラフを整列させる、ブラインドメッセージパッシングと呼ばれる新しいフレームワークを導入する。
次に、データ評価のための買い手と売り手のグラフの偉業的な側面を検討し、それらの統計的類似点と相違点を捉える。
当社のアプローチは、買い手と売り手がお互いのデータセットに気付かないことを保証するものです。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:05:41 GMT)
DLCRec: A Novel Approach for Managing Diversity in LLM-Based Recommender Systems [9.4] LLMに基づくレコメンデーションにおいて,多様性のきめ細かい制御を可能にする新しいフレームワークを提案する。
従来の方法とは異なり、DLCRecはきめ細かいタスク分解戦略を採用し、推奨プロセスを3つのサブタスクに分割する。
本稿では,ノイズやアウト・オブ・ディストリビューションデータに対するモデルの堅牢性を高める2つのデータ拡張手法を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:10:56 GMT)
Phase-Based Approaches for Rapid Construction of Magnetic Fields in NV Magnetometry [9.4] 本稿では、光検出磁気共鳴(ODMR)信号から磁場を推定する。
ODMR信号の位相推定へのシフトを計算効率の良い手法として提案する。
その結果,提案手法は既存手法に比べて計算時間を著しく短縮することがわかった。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:21:10 GMT)
Can You Trust Your Metric? Automatic Concatenation-Based Tests for Metric Validity [9.4] GPTをベースとした有害度検出指標は、決定フリッピング現象を示す。
GPT-4oのような高度な計量でさえ、入力順序に非常に敏感である。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:57:57 GMT)
Unlearning Trojans in Large Language Models: A Comparison Between Natural Language and Source Code [9.3] 本研究では、自然言語の大規模言語モデル(Text-LLMs)とコードの大規模言語モデル(Code-LLMs)に埋め込まれたトロイの木馬の影響を緩和するためのマシン・アンラーニング(MU)の適用について検討する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:12:06 GMT)
Achieving the Tightest Relaxation of Sigmoids for Formal Verification [9.1] 本稿では,シグイド関数の上下の調整可能な超平面を導出する。
$alpha$-sigにより、Sigoidアクティベーション関数の可能な、要素単位の凸緩和を形式的な検証フレームワークに容易に組み込むことができる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 00:10:24 GMT)
Assessing the Uncertainty and Robustness of Object Detection Models for Detecting Stickers on Laptops [9.1] ラップトップの改装は、持続的な未来の構築を促進するため、電子廃棄物の削減に寄与しながら、寿命を延ばす。
これには、ラップトップの表面からステッカーを識別して取り除くことを含む、クリーニングを含むいくつかのステップが含まれている。
DTIは、オープンソースオブジェクト検出モデルに基づく6つのステッカー検出モデル(SDM)を訓練し、これらのステッカーを自動的に除去できるように、それらのステッカーを正確に識別した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:36:09 GMT)
Maximal steered coherence in the background of Schwarzschild space-time [9.1] ホーキング温度が上昇するにつれて、物理的にアクセス可能なMSCは低下し、アクセス不可能なMSCは上昇する。
我々の発見は、ブラックホール近傍の量子情報の複雑なダイナミクスを照らしている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:40:33 GMT)
OPTDTALS: Approximate Logic Synthesis via Optimal Decision Trees Approach [9.1] 近似論理合成(ALS)は、正確性を犠牲にして回路の複雑さを低減することを目的としている。
最適決定木を経験的精度で学習することで近似を実現する新しいALS手法を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:23:58 GMT)
A Formal, Symbolic Analysis of the Matrix Cryptographic Protocol Suite [9.0] マトリックスで使用される暗号プロトコルであるOlmとMegolmについて検討する。
私たちはVerifpalを使ってオルムとメゴルムの形式モデルとそれらの構成を構築します。
我々はOlmとMegolmに関する様々な特性を証明し、認証、機密性、フォワード・シークレット、およびポスト・コンプロミズ・セキュリティを含む。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 21:52:08 GMT)
Minor DPO reject penalty to increase training robustness [9.0] 人間の嗜好からの学習は、ダウンストリームタスクにおいて、事前学習されたLLMを人間の嗜好に合わせるために、大規模言語モデル(LLM)の微調整ステップで使用されるパラダイムである。
近年,簡易なRLフリー手法でアライメント問題を解決するために,DPO(Direct Preference Optimization)が提案されている。
本稿では、DPOにおける$beta$の動作メカニズムを分析し、RLアルゴリズムとDPOの構文差を明らかにし、DPOの単純化による潜在的な不足について理解する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:49:15 GMT)
One-shot Video Imitation via Parameterized Symbolic Abstraction Graphs [8.9] 我々は,Sybolicized Abstraction Graphs (PSAG) によるビデオデモの解釈を提案する。
さらに,非幾何学的,視覚的に知覚できない属性を推定するために,シミュレーションによる幾何学的制約を示す。
我々のアプローチは、Avocado、Cutting Vegetable、Pouring Liquid、Rolling Dough、Slicing Pizzaといった様々なタスクで検証されている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:26:47 GMT)
Automatic Test Pattern Generation for Robust Quantum Circuit Testing [8.9] 量子テストパターンを表現するための安定化プロジェクタ分解(SPD)を導入する。
我々はクリフォードのみの回路を用いてテストアプリケーション(すなわち状態準備と測定)を構築する。
我々はSPD生成アルゴリズムと、SPDの生成における局所性と空間性の両方を活用するいくつかの加速技術を開発した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:18:21 GMT)
Simplified Mamba with Disentangled Dependency Encoding for Long-Term Time Series Forecasting [8.8] 長期時系列予測(LTSF)におけるマンバの可能性について検討する。
i)選択メカニズムによって、Mambaは特定の入力に注目したり無視したりし、セマンティック依存を簡単に学習する。
さらに,不整合依存性符号化を用いた単純化されたMambaであるSAMBAを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:14:59 GMT)
Accounts of using the Tustin-Net architecture on a rotary inverted pendulum [8.7] 本研究では,物理的回転逆振り子の同定にTustinニューラルネットワークアーキテクチャ(Tustin-Net)を用いることを検討した。
本稿では、実際の物理機器上での第一原理のグレーボックスモデルと比較して、タスティンネットの利点、限界、性能について議論する。
本稿では,第1原理モデルと競合するTustin-Netsを生成するトランスファー学習に基づくトレーニング戦略を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:04:00 GMT)
Pulse shape discrimination based on the Tempotron: a powerful classifier on GPU [8.7] 研究はGPUアクセラレーションを用いた実験を行い、その結果、CPUベースのモデルに比べて500倍以上高速になった。
この研究は、パルス形状の識別にテンポトロンを利用する将来の発展への制約と可能性について論じている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:24:37 GMT)
Transientangelo: Few-Viewpoint Surface Reconstruction Using Single-Photon Lidar [8.5] ライダーは、ターゲットに光のパルスを放出し、反射光の光速遅延を記録することで、3Dシーンの幾何学を捉えている。
従来のライダーシステムは、後方散乱光の生で捕獲された波形を出力しない。
我々は,光子ノイズに対するロバスト性を向上させる新しい正則化戦略を開発し,画素あたり10光子程度で正確な表面再構成を可能にする。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:12:09 GMT)
The Dark Side of Function Calling: Pathways to Jailbreaking Large Language Models [8.4] 本稿では,大規模言語モデル(LLM)の関数呼び出しプロセスにおける重大な脆弱性を明らかにする。
本稿では,アライメントの相違,ユーザ強制,厳密な安全フィルタの欠如を生かした,新しい"jailbreak function"攻撃手法を提案する。
本研究は,LLMの機能呼び出し機能において,緊急のセキュリティ対策の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:45:34 GMT)
ADRS-CNet: An adaptive models of dimensionality reduction methods for DNA storage clustering algorithms [8.3] 本稿では、DNA配列の特徴を分類し、最適次元減少法をインテリジェントに選択する多層パーセプトロン(MLP)に基づくモデルを提案する。
オープンソースのデータセットで検証した実験結果から,我々のモデルは分類性能に優れるだけでなく,クラスタリングの精度も著しく向上することが示された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 22:26:41 GMT)
Building and better understanding vision-language models: insights and future directions [8.2] 本稿では,現在最先端の視覚言語モデルへのアプローチについて概観する。
Idefics3-8Bは従来のIdefics2-8Bを大きく上回る強力なVLMです。
トレーニング用に作成されたデータセットとともに、モデルをリリースしています。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:47:24 GMT)
Distributed Noncoherent Joint Transmission Based on Multi-Agent Reinforcement Learning for Dense Small Cell MISO Systems [8.1] マルチアンテナ小セル基地局(SBS)が共有帯域上でデータを送信する高密度小セルネットワークを考察する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:11:14 GMT)
LightFF: Lightweight Inference for Forward-Forward Algorithm [8.1] 本稿では,Forward-Forwardアルゴリズムを用いてトレーニングしたANN/DNNを対象とした,軽量な推論手法を提案する。
MNIST と CIFAR のデータセットと2つの実世界のアプリケーションについて,提案手法の評価を行った。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:30:44 GMT)
Dynamics of Meta-learning Representation in the Teacher-student Scenario [8.1] グラディエントベースのメタ学習アルゴリズムは、限られたデータを使って新しいタスクでモデルをトレーニングできることで人気を集めている。
本研究では,教師・学生シナリオにおけるストリーミングタスクを訓練した非線形2層ニューラルネットワークのメタラーニングダイナミクスについて検討する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:59:32 GMT)
Quantization-free Lossy Image Compression Using Integer Matrix Factorization [8.0] 我々は、新しい量子化自由損失画像圧縮法を開発するために、整数行列分解(IMF)の変種を導入する。
IMFは、画像データの低ランク表現を、有界整数要素を持つ2つの小さな因子行列の積として提供する。
我々の手法は、JPEGを低ビットレートで0.25ビット/ピクセル(bpp)以下で連続的に上回り、高いビットレートで比較する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 19:08:08 GMT)
It's Not You, It's Me: The Impact of Choice Models and Ranking Strategies on Gender Imbalance in Music Recommendation [7.9] 本研究では、ランク付け戦略とユーザー選択モデルがジェンダーフェアネス指標に及ぼす影響について検討する。
再ランク戦略は、ユーザの選択モデルよりも、時間の経過とともにリコメンデーションフェアネスに影響を及ぼす。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:44:46 GMT)
Transformers As Approximations of Solomonoff Induction [7.9] Solomonoffインダクションはシーケンス予測のための最適極限アルゴリズムである。
計算シーケンス予測の最適な形式であるため、他のシーケンス予測方法と比較できるモデルとして用いられる可能性が考えられる。
我々は,トランスフォーマーモデルが既存のどのシーケンス予測法よりもソロモノフ誘導を近似する仮説を提示し,検討した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:05:44 GMT)
S-EPOA: Overcoming the Indivisibility of Annotations with Skill-Driven Preference-Based Reinforcement Learning [7.8] 嗜好に基づく強化学習(PbRL)は、直接報酬信号として人間の嗜好を使用する。
従来のPbRLメソッドは、しばしば、学習プロセスを妨げるアノテーションの多様化によって制約される。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:54:25 GMT)
SpecRover: Code Intent Extraction via LLMs [7.7] 仕様推論は、高品質なプログラムパッチを作成するのに役立ちます。
当社のアプローチであるSpecRover(AutoCodeRover-v2)は,オープンソースのLLMエージェントであるAutoCodeRover上に構築されています。
2294のGitHubイシューからなる完全なSWE-Benchの評価では、AutoCodeRoverよりも50%以上改善されている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:54:20 GMT)
Large Investment Model [7.7] 大規模投資モデル(Large Investment Model, LIM)は、大規模における性能と効率性の両方を高めるために設計された新しい研究パラダイムである。
LIMはエンド・ツー・エンドの学習とユニバーサル・モデリングを採用し、多様な財務データから包括的な信号パターンを自律的に学習できる上流基盤モデルを作成する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:57:42 GMT)
Quantum Many-Body Physics Calculations with Large Language Models [7.7] 大規模言語モデル(LLM)は、複数のドメインで複雑なタスクを実行する前例のない能力を示している。
我々は、量子物理学において広く用いられている近似法、Hartree-Fock法に焦点をあてる。
解析計算を標準化されたステップに分解する多段階プロンプトテンプレートを設計する。
我々は過去10年間の15の研究論文の計算におけるGPT-4の性能を評価した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 22:42:40 GMT)
Vaccine: Perturbation-aware Alignment for Large Language Models against Harmful Fine-tuning [7.7] ユーザがアップロードした有害なデータのいくつかは、微調整を簡単に騙してアライメントが壊れたモデルを生成することができる。
本稿では,ユーザが微調整を行う際のセキュリティリスクを軽減するために,摂動を考慮したアライメント手法であるVaccineを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:29:11 GMT)
Interactive DualChecker for Mitigating Hallucinations in Distilling Large Language Models [7.6] 大規模言語モデル(LLM)は、さまざまな機械学習(ML)タスクにまたがる例外的な機能を示している。
これらのモデルは、特に不完全な知識を持つ領域において幻覚を生み出すことができる。
幻覚を緩和し,教師モデルと学生モデルの両方のパフォーマンスを向上させるために設計された,革新的なフレームワークであるDualCheckerを紹介する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:04:04 GMT)
Enhancing Sampling Protocol for Robust Point Cloud Classification [7.6] 実世界のデータは、現在のプロトコルにおける点雲の良性の仮定に反するセンサノイズなど、しばしば干渉に悩まされる。
1)キーポイント識別のためのダウンサンプリング,2)フレキシブルなサンプルサイズのためのリサンプリングの2つのコンポーネントからなるポイントクラウドサンプリングプロトコルであるポイントDRを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 01:48:31 GMT)
Enhanced Expressivity in Graph Neural Networks with Lanczos-Based Linear Constraints [7.6] グラフニューラルネットワーク(GNN)はグラフ構造化データの処理に優れるが、リンク予測タスクでは性能が劣ることが多い。
グラフラプラシア行列の固有基底に誘導された部分グラフを埋め込むことによりGNNの表現性を高める新しい手法を提案する。
提案手法は,PubMedとOGBL-Vesselのデータセットから,5%と10%のデータしか必要とせず,20倍と10倍の高速化を実現する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:22:00 GMT)
Accelerated stochastic approximation with state-dependent noise [7.5] 勾配観測における2次雑音に対する一般仮定の下での滑らかな凸最適化問題を考察する。
このような問題は、統計学におけるよく知られた一般化された線形回帰問題において、様々な応用において自然に発生する。
SAGDとSGEは、適切な条件下で、最適収束率を達成することを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:09:35 GMT)
PRG: Prompt-Based Distillation Without Annotation via Proxy Relational Graph [7.4] 本稿では,LFM(Large Foundation Models)から知識を軽量モデルに抽出する蒸留法を提案する。
まず,テキストのプロンプト埋め込みによって得られた重み付き平均ロジットを計算し,LFMからタスク関連知識を抽出する。
次に, LFMモデルと学生モデルのためのサンプルクラスプロキシグラフを構築し, サンプルとクラスプロキシの相関関係をモデル化する。
我々は, LFMと学生モデルの両方が生成する関係グラフを整列させて, 選択的知識の蒸留を実現する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:36:26 GMT)
Self-Organization in Computation & Chemistry: Return to AlChemy [7.3] 1990年代、Walter Fontana と Leo Buss は $lambda$ として知られる公式な計算モデルに基づく新しいモデリング手法を提案した。
ここでは、この古典的なモデルであるAlChemyを再考する。
複雑で安定した組織は、以前予想されていたよりも頻繁に出現し、これらの組織は、自明な固定点への崩壊に対して堅牢であるが、これらの安定した組織は、より高次のエンティティに簡単に統合できない。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 05:44:27 GMT)
Vanilla Gradient Descent for Oblique Decision Trees [7.2] 決定木(Decision Trees, DT)は、非線形AIモデルの1つである。
DTSemNetは、ニューラルネットワーク(NN)として(ハード、斜め)DTの、意味論的に等価で非可逆な符号化である。
DTSemNetを用いて学習した斜めDTは、最先端技術を用いて学習した同様の大きさの斜めDTよりも正確であることを示す実験である。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:28:39 GMT)
Robotic Eye-in-hand Visual Servo Axially Aligning Nasopharyngeal Swabs with the Nasal Cavity [7.2] 鼻咽喉科検査は、新型コロナウイルス(COVID-19)を含む呼吸器疾患を診断するための培養物を集める方法である。
NPスワブテストの重要な構成要素は、スワブを鼻腔に適切に合わせることで、過度な不快感や怪我を起こさないように、間違った通路を下ることである。
我々の研究は視覚誘導型パイプラインを作成し、ロボットアームが患者の鼻孔に対して適切に位置決めし、NPスワブをオリエントにすることができるようにした。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:36:06 GMT)
Multilevel Interpretability Of Artificial Neural Networks: Leveraging Framework And Methods From Neuroscience [7.2] 生体と人工のニューラルシステムの両方を解釈するには、これらのシステムを複数のレベルで分析する必要がある、と我々は主張する。
生体および人工神経系の解析に使用できる分析ツールのシリーズを提示する。
全体として、マルチレベル解釈可能性フレームワークは、ニューラルネットワークの複雑さに取り組むための原則化された方法を提供する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:17:20 GMT)
Defending Against Unforeseen Failure Modes with Latent Adversarial Training [7.1] 赤いチームと敵の訓練(AT)は、強靭性を改善するために一般的に使用される。
本研究では,LAT(Latent Adversarial Training)を用いて脆弱性に対する防御を行う。
画像分類, テキスト分類, テキスト生成タスクにおいて, LATは通常, 新規攻撃に対する堅牢性と, AT に対するクリーンデータの性能を向上することを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 00:24:50 GMT)
A General Control-Theoretic Approach for Reinforcement Learning: Theory and Algorithms [7.1] 最適政策の直接学習を支援するための制御理論強化学習手法を考案する。
いくつかの古典的強化学習課題に対するアプローチを実証的に評価した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:13:18 GMT)
Can we trust the evaluation on ChatGPT? [7.0] 大量導入した最初の大規模言語モデル(LLM)であるChatGPTは、多くの自然言語タスクにおいて顕著なパフォーマンスを示している。
様々な問題領域におけるChatGPTの性能評価は、モデルが閉じた性質のため、依然として困難である。
本稿では,ChatGPT評価におけるデータ汚染の問題点を,姿勢検出の課題を事例として取り上げる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:19:06 GMT)
Vision-Based Detection of Uncooperative Targets and Components on Small Satellites [7.0] 宇宙デブリと不活性衛星は、運用宇宙船の安全性と完全性に脅威をもたらす。
コンピュータビジョンモデルの最近の進歩は、そのような非協調的な目標を追跡する既存の方法を改善するために利用することができる。
本稿では,これらの物体を学習とコンピュータビジョンを用いて識別・監視する自律検出モデルを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:48:13 GMT)
Robust Policy Learning via Offline Skill Diffusion [6.9] 本稿では,新しいオフラインスキル学習フレームワークDuSkillを紹介する。
DuSkillはガイド付き拡散モデルを使用して、データセットの限られたスキルから拡張された多目的スキルを生成する。
我々は,DuSkillが複数の長期タスクに対して,他のスキルベースの模倣学習やRLアルゴリズムよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:03:10 GMT)
Pareto Inverse Reinforcement Learning for Diverse Expert Policy Generation [6.9] 本稿では,識別器の正則化のための報酬距離推定を用いて,逆強化学習(IRL)を適用する。
本稿では,多目的制御タスクにおいて,ParIRLが他のIRLアルゴリズムより優れていることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:51:39 GMT)
LLM4VV: Exploring LLM-as-a-Judge for Validation and Verification Testsuites [6.8] 大規模言語モデル(LLM)は進化し、ソフトウェア開発のランドスケープに大きな革命をもたらしています。
本稿では,ディレクティブプログラミングモデルのコンパイラ実装を評価するために使用されるテストの判定について考察する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:38:56 GMT)
LaMSUM: Creating Extractive Summaries of User Generated Content using LLMs [6.8] 大規模言語モデル(LLM)は、要約を含む幅広いNLPタスクにおいて、印象的なパフォーマンスを示している。
本稿では,ユーザ生成テキストの集合から抽出要約を生成する新しいフレームワークであるLaMSUMを紹介する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 19:25:51 GMT)
3D Photon Counting CT Image Super-Resolution Using Conditional Diffusion Model [6.8] 本研究の目的は、拡散確率モデル(DDPM)を用いた光子計数CT(PCCT)画像分解能の向上である。
私たちはまずCatSimを利用して,高分解能CTスキャンから現実的な低分解能PCCT画像をシミュレートする。
DDPM性能の最大化は推論とトレーニングの両方に時間を要するため,条件付きDDPMのための2次元ネットワークと3次元ネットワークを探索する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:25:21 GMT)
Benchmarking Counterfactual Interpretability in Deep Learning Models for Time Series Classification [6.7] Counterfactual (CF) メソッドは、モデル予測を変更するインスタンスの最小限の変更を識別するために使用される。
大規模な研究にもかかわらず、時系列領域におけるCFメソッドの既存のベンチマークは存在しない。
本研究では,CFの望ましい特性を正確に把握するために,定量的なメトリクスを再設計する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:17:26 GMT)
MakeupAttack: Feature Space Black-box Backdoor Attack on Face Recognition via Makeup Transfer [6.6] メイクアップアタック(MakeupAttack)と呼ばれるメイクアップトランスファーによる顔認証に対するバックドア攻撃を提案する。
本攻撃では,提案したメイクスタイルトリガーの微妙な特徴を学習するための反復訓練パラダイムを設計する。
提案手法は, モデル性能を損なうことなく, 有効性, 堅牢性, 自然性, ステルス性を保ちながら, 既存の防御を回避できることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:39:36 GMT)
Domain Generalization through Meta-Learning: A Survey [6.5] ディープニューラルネットワーク(DNN)は人工知能に革命をもたらしたが、アウト・オブ・ディストリビューション(OOD)データに直面すると、しばしばパフォーマンスが低下する。
本調査はメタラーニングの領域を掘り下げ,ドメインの一般化への貢献に焦点をあてたものである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:57:32 GMT)
Decentralized Online Learning for Random Inverse Problems Over Graphs [6.4] ヒルベルト空間におけるアルゴリズムの安定性の収束性は、$_$-bounded martingale difference 項で表される。
ネットワークグラフが連結され、フォワード演算子の列が励起条件の無限次元時間持続性を満たすなら、全てのノードの推定は平均平方である。
非定常オンラインデータに基づく分散オンライン学習アルゴリズムをRKHSで提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 06:48:17 GMT)
MEDCO: Medical Education Copilots Based on A Multi-Agent Framework [6.3] MEDCOは、現実世界の医療訓練環境をエミュレートするために特別に開発された、マルチエージェントベースのパトロールシステムである。
本フレームワークでは,熟練した質問応答スキルの習得,複数学際的コラボレーション,学生間のピアディスカッションが重視されている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:41:58 GMT)
Empowering Wireless Network Applications with Deep Learning-based Radio Propagation Models [6.2] 本稿では,深層学習と従来の伝搬モデリング技術を統合することで,無線ネットワークの動作を向上する方法について概説する。
次世代無線ネットワークにおいて、深層学習に基づく電波伝搬モデルが想定する重要な役割を強調することで、この方向へのさらなる研究を推進したいと考えています。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:16:02 GMT)
A Unified Plug-and-Play Algorithm with Projected Landweber Operator for Split Convex Feasibility Problems [6.2] 近年,Plug-and-Play法は,演算子をデノイザに置き換えることで,逆画像問題における最先端性能を実現している。
理論的に保証されたステップサイズを持つ手法の適用は困難であり、アルゴリズムはノイズに制限される。
これらの問題に対処するために、Project Landweber Operator (PLOPLO) が提案されている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:29:51 GMT)
How disentangled are your classification uncertainties? [6.1] 機械学習における不確実性定量化は、予測における不確実性の原因を予測するために進んでいる。
本研究は,失語症およびてんかんの不確かさの解消を評価するための一連の実験を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:42:43 GMT)
skscope: Fast Sparsity-Constrained Optimization in Python [6.1] 本稿では,空間制約付き最適化(SCO)問題を解くためのライブラリ・スコープを提案する。
スコープの利便性は、論文の2つの例を通して示される。
数値実験により、スコスコープで利用可能な解法は最大80倍のスピードアップを達成できることが明らかになった。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:49:20 GMT)
KLoB: a Benchmark for Assessing Knowledge Locating Methods in Language Models [6.0] KLoBは,信頼性の高い知識配置法が満たすべき3つの重要な特性を検証したベンチマークである。
KLoBは、言語モデルにおける既存の位置決め手法を評価するためのベンチマークとして機能し、事実知識の局所性仮説の妥当性を再評価する手法に貢献することができる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:23:15 GMT)
From Lazy to Prolific: Tackling Missing Labels in Open Vocabulary Extreme Classification by Positive-Unlabeled Sequence Learning [6.0] Open-vocabulary Extreme Multi-label Classification (OXMC)は、従来のXMCを拡張し、ラベルセットが103ドルから1012ドルを超える予測を可能にする。
データアノテーションにおける自己選択バイアスは、トレーニングデータとテストデータの両方に重大な欠陥ラベルをもたらす。
本稿では OXMC をキーフレーズ生成タスクとして再構成する PUSL (Positive-Unlabeled Sequence Learning) を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:20:27 GMT)
Optical ISAC: Fundamental Performance Limits and Transceiver Design [6.0] 本稿では,単一入力単出力通信を用いた光ポイントツーポイント(P2P)システムにおける最適容量歪み(C-D)トレードオフを特徴付ける。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 00:56:20 GMT)
Chiral-Extended Photon-Emitter Dressed States in Non-Hermitian Topological Baths [5.9] 非エルミート位相浴に結合した量子エミッタの非伝統的な量子光学挙動を予測した。
中間線間隙におけるエルミート様キラル境界状態と点間隙内のスキンモード様隠れ境界状態に加えて,特異なギャップ内キラルおよび拡張光子-エミッタ型服装状態が同定された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:19:34 GMT)
From Entanglement Purification Scheduling to Fidelity-constrained Multi-Flow Routing [5.8] 量子デコヒーレンスと戦うための有望な技術は、絡み合いの浄化である。
単一ホップケースに対して最適な絡み合わせ浄化スケジューリングアルゴリズムを開発し,マルチホップケースにおけるテキスト・アンド・スワップ戦略を解析する。
我々のアルゴリズムは広範なシミュレーションによって数値的にも実証されている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:22:30 GMT)
$ρ$-GNF: A Copula-based Sensitivity Analysis to Unobserved Confounding Using Normalizing Flows [5.7] 本研究では,コプラと正規化流を用いた観測研究において,観測不能なコンファウンディングに対する新しい感度解析法を提案する。
$rho$-GNFは、学者が平均因果効果(ACE)を$rho$の関数として推定することを可能にする。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:23:14 GMT)
Wave-LSTM: Multi-scale analysis of somatic whole genome copy number profiles [5.7] コピー数プロファイルからマルチスケール表現を導出するためにWave-LSTMを使用できることを示す。
本稿では,単一セルコピー数データからサブクローン構造を解読できるコピー数プロファイルから,Wave-LSTMを用いてマルチスケール表現を導出できることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:14:33 GMT)
Automated Detection of Algorithm Debt in Deep Learning Frameworks: An Empirical Study [5.6] 以前の研究では、ML/DLモデルが、自己受け入れ技術的負債(SATD)と呼ばれるソースコードコメントから技術的負債を検出できることが示されている。
我々の目標は、様々なML/DLモデルのAD検出性能を改善することである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:40:50 GMT)
Month-long-lifetime microwave spectral holes in an erbium-doped scheelite crystal at millikelvin temperature [5.6] レアアースイオン(REI)アンサンブルでは、スペクトルホールバーニング(SHB)として知られる補助レベルへの人口移動に狭線放射が適用される。
Er$3+のドープ材料では、最も長い穴寿命は1分であり、長い穴寿命が望ましい。
マイクロ波およびミリケルビン温度でEr$3+$イオンの電子スピン遷移を励起することにより,CaWO$_4$のシェライト結晶中のSHBおよび蓄積エコー測定を報告する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 23:01:24 GMT)
Robust Implicit Regularization via Weight Normalization [5.4] 重み正規化は、重みが実質的に大規模であっても持続する頑健なバイアスを可能にすることを示す。
実験により, 暗黙バイアスの収束速度とロバスト性の両方の利得は, 重み正規化を用いて劇的に改善されることが示唆された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 22:30:27 GMT)
Video Emotion Open-vocabulary Recognition Based on Multimodal Large Language Model [5.3] 本稿では、MLLM技術を用いてビデオからオープン語彙感情ラベルを生成する方法を紹介する。
MER2024課題のMER-OV(Open-Word Emotion Recognition)において,本手法は重要な優位性を実現し,複雑な感情計算の能力に優れていた。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 01:46:45 GMT)
ALS-HAR: Harnessing Wearable Ambient Light Sensors to Enhance IMU-based Human Activity Recogntion [5.2] 我々は、ウェアラブル光ベースのモーションアクティビティ分類器であるALS-HARを開発した。
ALS-HARは、他のモダリティと同等の精度を達成するが、外乱に対する自然な感度は、日々の使用を困難にしている。
マルチモーダルおよびコントラッシブな分類による環境不変IMUに基づく活動分類を強化する戦略を導入する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:03:13 GMT)
Could Bibliometrics Reveal Top Science and Technology Achievements and Researchers? The Case for Evaluatology-based Science and Technology Evaluation [5.2] 評価学に基づく科学技術評価手法を提案する。
このアプローチの中心には、フィールドから派生した8つの重要なコンポーネントを含む拡張評価条件の概念がある。
チップ技術やオープンソースのような特定の分野において、すべての成果の進化と発展を正確に追跡できる完璧な評価モデルを構築します。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 06:57:46 GMT)
Diverse Part Synthesis for 3D Shape Creation [5.2] 部分ベース表現の形で3次元形状にニューラルネットワークを使用する手法は、ここ数年で導入されている。
現在の方法では、個々の形状部品をユーザの好みに応じて容易に再生することはできない。
ユーザが個別の部品に対して多種多様な提案を生成できるようにする技術について検討する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 21:26:06 GMT)
Towards Estimating Personal Values in Song Lyrics [5.2] 西洋諸国で広く消費されている音楽は、歌詞が含まれており、アメリカのサンプルでは、彼らの楽曲ライブラリのほとんどすべてが歌詞を含んでいると報告している。
本稿では,社会科学理論に導かれたパースペクティビズム的アプローチを用いて,アノテーションの収集,品質評価,集約を行う。
次に、評価値辞書を用いて、事前学習した文/単語の埋め込みモデルに基づく評価値と比較する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 19:22:55 GMT)
Revisiting Cross-Domain Problem for LiDAR-based 3D Object Detection [5.1] 我々は最先端モデルのクロスドメイン性能を深く分析する。
ほとんどのモデルはトレーニングドメインに過度に適合し、それを他のドメインに直接適用することは困難である。
我々は、メソッドの精度レベルにおける過度な低下の中核的な問題を分析するために、サイドビューとフロントビューAPという、さらなる評価指標を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 19:52:44 GMT)
Highly Scalable Quantum Router with Frequency-Independent Scattering Spectra [5.0] 半無限結合共振器導波路(CRW)と巨大原子からなる効率的な量子ルータ方式を提案する。
単一チャネルルータ方式により、CRWの全エネルギー帯域上で100%の転送レートで安定した出力が可能となる。
本稿では,高い安定性と普遍性を有しつつ,多様な機能を実現するマルチチャネルルータ方式を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:09:17 GMT)
Integrating Physics-Based Modeling with Machine Learning for Lithium-Ion Batteries [4.9] 本稿では,LiBの高精度モデリングを実現するために,物理モデルと機械学習を統合する2つの新しいフレームワークを提案する。
これらのフレームワークは、物理モデルの状態情報の機械学習モデルに通知することで特徴付けられる。
この研究はさらに、老化を意識したハイブリッドモデリングの実施へと拡張され、予測を行うために健康状態に意識したハイブリッドモデルの設計につながった。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 05:33:23 GMT)
Spread complexity and dynamical transition in multimode Bose-Einstein condensates [4.9] 2モードのボース・アインシュタイン凝縮における拡散複雑性について検討する。
拡散複雑性は,低い値から高い値への急激な遷移を示すことが明らかとなった。
また,三重井戸ボソニックモデルに対する$overlineC_K$の感度についても検討した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:15:44 GMT)
DeRainGS: Gaussian Splatting for Enhanced Scene Reconstruction in Rainy Environments [4.9] 本研究では, 降雨環境における3次元再構築の課題について紹介する(3DRRE)。
このタスクをベンチマークするために、合成画像と実世界のシーン画像の両方の多様なコレクションからなるHydroViewsデータセットを構築した。
降雨環境の復元に適した3DGS法であるDeRainGSを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 01:21:50 GMT)
Differentiable Logic Programming for Distant Supervision [4.8] 我々はニューラル・シンボリックAI(NeSy)におけるニューラルネットワークと論理プログラミングを統合する新しい手法を提案する。
従来の手法とは違って,提案手法はラベルの欠落を推論するシンボリック・ソルバに依存しない。
この方法は、遠隔の監督下でより効率的な学習を容易にする。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:55:52 GMT)
UMERegRobust -- Universal Manifold Embedding Compatible Features for Robust Point Cloud Registration [4.8] 我々は、剛性変換を推定するために、ユニバーサルマニフォールド埋め込み(UME)フレームワークを採用する。
独自のUMEコントラスト損失とサンプリング等化器を付加したUME互換特徴抽出手法を導入することで、UMEフレームワークを拡張した。
これらのコンポーネントは、UMERegRobustという、包括的で堅牢な登録パイプラインに統合される。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:18:55 GMT)
Research on Improved U-net Based Remote Sensing Image Segmentation Algorithm [4.8] 我々は,U-NetにSimAMとCBAMのアテンション機構を導入することを提案する。
SimAMとCBAMモジュールを単独で追加すると、MIoUでは17.41%と12.23%が改善された。
2台を融合させた後、モデル性能は19.11%まで上昇した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:25:22 GMT)
Quantifying Psychological Sophistication of Malicious Emails [4.8] 悪意あるメールは、サイバー・ソーシャル・エンジニアリング・アタックの重要な種類の1つである。
現在の防衛効果の非効率性は、これらの攻撃を成功させる心理的性質の表面的理解に起因していると考えられる。
本稿では,心理学的手法,PTechs,心理学的戦術,PTacsという,高度化の重要かつ補完的な2つの側面に対応する革新的な枠組みを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:45:46 GMT)
ssProp: Energy-Efficient Training for Convolutional Neural Networks with Scheduled Sparse Back Propagation [4.8] バックプロパゲーション(BP)は、ディープラーニングモデルをトレーニングする際の計算コストの主要な源泉である。
ディープラーニングアーキテクチャにシームレスに統合できる汎用的でエネルギー効率の良い畳み込みモジュールを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:22:59 GMT)
On Early Detection of Hallucinations in Factual Question Answering [4.8] 幻覚は依然として ユーザーの信頼を得るための大きな障害です
本研究では、モデル生成に関連するアーティファクトが、生成が幻覚を含むことを示すヒントを提供することができるかどうかを探索する。
以上の結果から,これらのアーティファクトの分布は,ハロゲン化世代と非ハロゲン化世代の違いが示唆された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:01:29 GMT)
Understanding Generative AI Content with Embedding Models [4.7] この研究は、現代のディープニューラルネットワーク(DNN)の内部表現を、従来の機能エンジニアリングの自動化形式として捉えている。
これらの埋め込みは、非構造化サンプルデータに解釈可能で高レベルな概念を明らかにすることができることを示す。
実データとAIモデルから生成されたデータの間には、本質的に分離性が存在するという実証的な証拠が見つかる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 21:50:46 GMT)
Improving the Utility of Differentially Private Clustering through Dynamical Processing [4.6] この研究は、ユーティリティとプライバシの差分なプライベートクラスタリングのトレードオフを軽減することを目的としている。
既存の作業は、パフォーマンスの低下を示す単純なメソッドに重点を置いている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:22:44 GMT)
AT-SNN: Adaptive Tokens for Vision Transformer on Spiking Neural Network [4.5] AT-SNNは、直接トレーニングでSNNベースのViTで推論中に処理されるトークンの数を動的に調整するように設計されている。
我々は,AT-SNNが画像分類タスクにおける最先端手法と比較して,高エネルギー効率と精度を実現する上で有効であることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:06:18 GMT)
Generalizing Visual Question Answering from Synthetic to Human-Written Questions via a Chain of QA with a Large Language Model [4.4] 人手による質問(CoQAH)に対するQAの連鎖という新しい手法を提案する。
CoQAHは、大言語モデルと合成データに基づいて訓練されたVQAモデルの間の一連のQA相互作用を利用して、人間による質問に対して論理的回答を導出する。
我々は,3Dレンダー画像と胸部X線画像の2種類のVQAデータセットに対するCoQAHの有効性を検証した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:46:33 GMT)
Finding Closure: A Closer Look at the Gestalt Law of Closure in Convolutional Neural Networks [4.4] クロージャは、フィギュアを完全な全体として知覚するギャップを埋める能力である。
最近の研究では、ニューラルネットワークにおけるクロージャ効果が研究されている。
我々は、モーダルとアモーダルの両方を含むクロージャ効果をテストするために、よく計算されたデータセットを導入します。
VGG16とDenseNet-121はクロージャ効果を示し,他のCNNは可変結果を示した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:59:37 GMT)
Distributed quasi-Newton robust estimation under differential privacy [4.4] 本稿では,ノードマシンが5つのベクトルを中央プロセッサに高効率で送信することのみを必要とする,頑健な分散準ニュートン推定法を提案する。
より多くの送信ラウンドを必要とする勾配降下戦略や、ヘッセン行列全体を送信する必要があるニュートン戦略と比較すると、新しい準ニュートン反復はプライバシー予算と送信コストを削減する利点がある。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:51:28 GMT)
ChatGPT and Its Educational Impact: Insights from a Software Development Competition [4.3] われわれはChatGPTを利用したソフトウェア開発コンペティションを組織し、4週間にわたって36人の学生を巻き込んだ。
コンペティションの結果,ChatGPTを様々な開発段階に幅広く利用している学生は,プロジェクト完了率が高く,スコアも良好であることがわかった。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 05:59:59 GMT)
Human-Aware Belief Revision: A Cognitively Inspired Framework for Explanation-Guided Revision of Human Models [4.2] 我々は,人間の信念のリビジョンダイナミクスをモデル化するための認知にインスパイアされたフレームワークであるHuman-Aware Belief Revisionを紹介する。
実世界のシナリオ下で,我々の枠組みを実証的に評価するために,2つの人体実験を行った。
我々の発見は、我々の仮説を支持し、不整合を解決する際に人々が採用する戦略に関する洞察を与え、より効果的な人間対応AIシステムを開発するためのガイダンスを提供する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:17:58 GMT)
Large Language Models Are Self-Taught Reasoners: Enhancing LLM Applications via Tailored Problem-Solving Demonstrations [4.2] 我々は、カスタマイズされたデモを容易にする問題解決フレームワークSELF-TAUGHTを提案する。
複数選択質問の15のタスクにおいて、SELF-TAUGHTは強いベースラインよりも優れたパフォーマンスを達成する。
我々はSELF-TAUGHTの包括的解析を行い、既存のプロンプト法への一般化性について述べる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:41:35 GMT)
Imperceptible Rhythm Backdoor Attacks: Exploring Rhythm Transformation for Embedding Undetectable Vulnerabilities on Speech Recognition [4.2] 近年,音声認識システムにおいて,典型的なバックドア攻撃が研究されている。
攻撃者は、良質な音声スペクトログラムにいくつかの組み込まれた変更を加えたり、ピッチや音色などの音声成分を変更したりする。
データ中毒のステルス性を改善するために,ランダム・スペクトログラム・リズム・トランスフォーメーション (Random Spectrogram Rhythm Transformation) と呼ばれる非ニューラルかつ高速なアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:21:49 GMT)
Estimating Treatment Effects using Multiple Surrogates: The Role of the Surrogate Score and the Surrogate Index [4.2] 治療の長期的な効果を見積もるのは、多くの分野において興味深いことである。
一つのアプローチは、しばしば統計代理と呼ばれる中間結果に対する治療効果を分析することである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:56:16 GMT)
Object Re-identification via Spatial-temporal Fusion Networks and Causal Identity Matching [4.1] 空間時間融合ネットワークと因果同一性マッチング(CIM)を利用した新しいReIDフレームワークを提案する。
本フレームワークは,提案した適応型Parzenウィンドウを用いてカメラネットワークトポロジを推定し,外観特徴と融合ネットワーク内の空間的時間的手がかりを組み合わせる。
このアプローチは、VeRi776、Vine-3I、Market-1501を含むいくつかのデータセットで顕著な性能を示し、99.70%のランク1の精度と95.5%のmAPを達成した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:25:31 GMT)
Towards Threat Modelling of IoT Context-Sharing Platforms [4.1] 汎用IoTコンテキスト共有ソリューションの脅威モデリングとセキュリティ解析のためのフレームワークを提案する。
IoTコンテキスト共有プラットフォームの設計における重要なセキュリティ上の課題を特定します。
我々の脅威モデリングは、これらのシステムを活用するために使用される技術やサブ技術に対する詳細な分析を提供する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:41:06 GMT)
Deep Learning Improvements for Sparse Spatial Field Reconstruction [4.1] 地球科学や流体力学といったいくつかの領域では、スパースデータから地球空間領域を正確に再構築することが長年の問題となっている。
機械学習(ML)の普及に伴い、いくつかの研究者が空間場再構成タスクにMLを適用し、計算効率の向上を観察している。
本研究では,上記のアプローチに対する複数の調整を提案し,地球科学および流体力学シミュレーションデータセットの改善を示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:32:59 GMT)
Dissipation and Interaction-Controlled Non-Hermitian Skin Effects [4.0] 非エルミート皮膚効果 (NHSE) は近年, 単一粒子レベルで広く研究されている。
本研究では,散逸と相互作用によって制御されるNHSEについて理論的に検討する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:49:13 GMT)
Leveraging Unlabeled Data Sharing through Kernel Function Approximation in Offline Reinforcement Learning [3.9] オフライン強化学習(RL)は、固定データセットからポリシーを学ぶが、しばしば大量のデータを必要とする。
本稿では,カーネル関数近似を用いたオフラインRL法において,ラベルなしデータを利用するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:31:51 GMT)
Generalized SAM: Efficient Fine-Tuning of SAM for Variable Input Image Sizes [3.9] 本稿では,Segment Anything Model (SAM) の入力画像サイズを可変化するための,効率的な微調整手法を提案する。
一般化SAM(GSAM)は、SAMを用いたトレーニング中にランダムトリミングを初めて適用し、トレーニングの計算コストを大幅に削減する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:58:08 GMT)
AI-Augmented Predictions: LLM Assistants Improve Human Forecasting Accuracy [3.8] 大規模言語モデル(LLM)は、多くのドメインで人間のパフォーマンスを上回ることがある。
本研究は, 予測課題における人的判断力を高めるLLMの可能性を探るものである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:57:30 GMT)
An Efficient and Explainable Transformer-Based Few-Shot Learning for Modeling Electricity Consumption Profiles Across Thousands of Domains [3.8] 電力流通システムの運用・計画には電力消費プロファイル(ECP)が不可欠である。
従来のECPモデリング手法は、十分なECPデータの可用性を前提としている。
データスカースシナリオにおけるECPモデリングのための有望なソリューションとして、いくつかのショットラーニングが登場した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:29:46 GMT)
Artificial Intelligence (AI) Onto-norms and Gender Equality: Unveiling the Invisible Gender Norms in AI Ecosystems in the Context of Africa [3.7] この研究は、オンノームがデジタル空間における特定のジェンダーの実践を、AI設計、トレーニング、使用を形作る空間の規範と性格を通してどのように伝播するかを検討する。
この研究は、データとコンテンツが、AIエコシステムの特定の社会的規範を促進するために、故意または無意識にどのように使われるかを調べることによって、オンノームは、AIが女性に関連するコンテンツとどのように関わるかを形作っている、と論じている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 22:54:02 GMT)
Two-Timescale Optimization Framework for Decentralized Linear-Quadratic Optimal Control [3.7] 凸パラメータ化凸境界不確実性を考慮した$mathcal$-guaranteed linear decentralized-quadratic optimal controlについて検討した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:16:42 GMT)
Efficient Sensor Placement from Regression with Sparse Gaussian Processes in Continuous and Discrete Spaces [3.7] センサ配置問題は、相関現象を監視する際に発生する一般的な問題である。
本稿では,勾配降下法を用いて最適化可能な変分近似に基づくSP問題に対する新しい定式化を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:39:34 GMT)
Time-Dependent Blackwell Approachability and Application to Absorbing Games [3.7] 平均結果の座標ごとに異なる収束速度が得られる時間依存内積の族を示す。
この枠組みをブラックウェルのアルゴリズムを用いて$varepsilon$-uniformly optimal strategyを構築するゲームに応用する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 20:44:46 GMT)
SiNGR: Brain Tumor Segmentation via Signed Normalized Geodesic Transform Regression [3.7] 本稿では,脳腫瘍近傍の不確かさを捉えるために,新しい基底真理ラベル変換を提案する。
このアイデアを、高次元出力空間における効果的な回帰学習を可能にするFocal-like regression L1-lossと組み合わせる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:04:52 GMT)
On the spectrum of electric quantum walk and related CMV matrices [3.6] 電場を持つ量子ウォークモデルの族に対して、スペクトルは任意の不合理体に対する単位円であることを示す。
この結果は、スキューシフトによって定義される関連するCMV行列についても成り立つ。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 20:33:22 GMT)
Risk Analysis in Customer Relationship Management via Quantile Region Convolutional Neural Network-Long Short-Term Memory and Cross-Attention Mechanism [3.6] 本稿では、QRCNN-LSTM(quantile region convolutional neural network-long short-term memory)と、モデリングのためのクロスアテンション機構の利点を組み合わせた。
QRCNN-LSTMモデルは、シーケンスモデリングと自然言語処理タスクで一般的に使用されるディープラーニングアーキテクチャを組み合わせる。
クロスアテンションメカニズムは、異なる入力データ部分間のインタラクションを強化し、モデルがリスク分析に関連する特定の領域や特徴に集中できるようにする。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:55:28 GMT)
Enhancing LLM-Based Automated Program Repair with Design Rationales [3.6] DRCodePilot は GPT-4-Turbo の APR 機能を DR をプロンプト命令に組み込むことで拡張する手法である。
DRCodePilotはGPT-4を直接利用するよりも4.7倍高いフルマッチ比を達成しています。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 01:13:02 GMT)
Hierarchical Generative Modeling of Melodic Vocal Contours in Hindustani Classical Music [3.5] 音声録音から抽出した歌手の発声旋律の生成モデルに焦点をあてる。
本稿では,ピッチ輪郭生成モデルとピッチ輪郭合成モデルからなるモジュール型2層階層GaMaDHaNiを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:04:29 GMT)
Neural Machine Unranking [3.2] 我々はニューラル・マシン・アンランキング(NuMuR)と呼ばれるニューラル情報検索における機械学習の課題に取り組む。
我々は、CoCoL(Contrastive and Consistent Loss)と呼ばれるNuMuRの方法論を開発する。
実験により,CoCoLは既存の技術よりも効率的かつ制御可能なデータ除去を容易にすることが示された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:48:34 GMT)
Diff-Cleanse: Identifying and Mitigating Backdoor Attacks in Diffusion Models [3.1] 拡散モデル(DM)は、今日では最も先進的な生成モデルの一つと見なされている。
近年の研究では、DMはバックドア攻撃に弱いことが示唆されている。
この脆弱性は、モデル所有者に評判を害するなど、重大なリスクをもたらす。
Diff-Cleanseは、DM用に特別に設計された2段階のバックドア防御フレームワークである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:46:40 GMT)
Multimodal Methods for Analyzing Learning and Training Environments: A Systematic Literature Review [3.1] 本稿では,近年の方法論的進歩を包括する分類学と枠組みを提案する。
我々は,新たなデータ融合カテゴリであるMid fusionを導入し,文献レビューを精査するグラフベースの手法を引用グラフプルーニングと呼ぶ。
マルチモーダル学習とトレーニング研究と基礎的AI研究のギャップを埋めるために、さらなる研究が必要である。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 22:42:23 GMT)
Smartphone-based Eye Tracking System using Edge Intelligence and Model Optimisation [2.9] 我々は、コンボリューショナルニューラルネットワーク(CNN)と2つの異なるリカレントニューラルネットワーク(RNN)を組み合わせることで、ビデオ型視覚のための2つの新しいスマートフォンアイトラッキング技術を開発した。
我々のCNN+LSTMモデルとCNN+GRUモデルは平均根平均角誤差0.955cmと1.091cmを達成した。
スマートフォンの計算制約に対処するため,スマートフォンによるアイトラッキングの性能向上を目的としたエッジインテリジェンスアーキテクチャを開発した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:04:59 GMT)
BankTweak: Adversarial Attack against Multi-Object Trackers by Manipulating Feature Banks [2.9] 我々は、マルチオブジェクトトラッキング(MOT)トラッカー用に設計された新しい敵攻撃であるtextsfBankTweakを提示する。
本手法は,既存の攻撃をはるかに上回り,トラッキング・バイ・ディテクト・フレームワークの脆弱性を露呈する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 20:35:46 GMT)
Active Sensing of Knee Osteoarthritis Progression with Reinforcement Learning [2.8] 変形性関節症(OA)は最も一般的な筋骨格疾患であり、治療法がない。
Knee OA (KOA) は障害の最も高い原因の1つであり、世界社会には数十億ドルの費用がかかる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:25:51 GMT)
Learning Valid Dual Bounds in Constraint Programming: Boosted Lagrangian Decomposition with Self-Supervised Learning [2.8] ラグランジアン分解(LD)は、制約付き最適化問題に対して二重境界を与える緩和法である。
この研究は、制約プログラミングにおいて有効な双対境界を学習するための最初の一般的な方法を示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 19:26:29 GMT)
AI-driven Transformer Model for Fault Prediction in Non-Linear Dynamic Automotive System [2.7] 本稿では,世界規模の非線形動的自動車システムにおけるAIに基づく故障分類と予測モデルを提案する。
モデルでは27の入力ディメンション、64の隠れディメンション、2つのレイヤ9のヘッドを使用して出力ヘッド(1つはフォールトフリーデータ、1つはフォールトフリーデータ、11はフォールトタイプ)を作成しました。
このモデルは5つのNVIDIA V100グラフィックカードを備えたUTSA Arc High-Performance Computeクラスタでトレーニングされ、保持されたテストセットで70.01 %の精度を達成した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:53:32 GMT)
Revisiting the Phenomenon of Syntactic Complexity Convergence on German Dialogue Data [2.7] 会話対話における構文的複雑性の収束現象を再考する。
依存関係解析に基づく構文的複雑性の定量化には、修正されたメトリックを使用する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:49:41 GMT)
Electromagnetically-Induced-Transparency Cooling of High-Nuclear-Spin Ions [2.7] 複雑な基底構造を持つ原子やイオンのEIT冷却は、孤立した$Lambda$システムがないために困難である。
我々は、EITポンプレーザを利用して冷却部分空間を再人口化することで、この問題を克服する。
我々のアプローチは、同様のレベルの構造を持つ原子種に適応することができる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:31:41 GMT)
A Complete Set of Quadratic Constraints for Repeated ReLU and Generalizations [2.6] 完全集合のすべての QC を満たす関数は2つしかなく、 ReLU の繰り返しと ReLU の反転である。
繰り返しReLUに対して、同様の完全集合の増分QCを導出する。
基本構成は、他の部分線型活性化関数に対するQCの完全集合を導出するためにも用いられる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:38:56 GMT)
Similarity of Neural Network Models: A Survey of Functional and Representational Measures [2.6] ニューラルネットワークの類似性を計測して、その振る舞いを理解し、改善することは、非常に重要で研究上の関心事となっている。
ニューラルネットワークの類似性を測定するための2つの相補的視点について概説する: (i) 中間層の活性化の相違を考察する表現的類似性、 (ii) 機能的類似性、そしてモデルが出力の相違を考察する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:52:38 GMT)
Talos: A More Effective and Efficient Adversarial Defense for GNN Models Based on the Global Homophily of Graphs [2.5] グラフニューラルネットワーク(GNN)モデルは、敵攻撃の影響を受けやすい。
そこで我々は,グラフの局所的ホモフィリーを防御としてではなく,グローバル性を高める,Talosという新しい防衛手法を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:53:09 GMT)
Neural networks for insurance pricing with frequency and severity data: a benchmark study from data preprocessing to technical tariff [2.5] 本稿では,複数種類の入力機能が存在する場合に,頻度と重大度を目標とした4つの保険データ集合に関するベンチマーク研究を行う。
本稿では,2つの入力データに対する一般化線形モデル,勾配ブースト木モデル,フィードフォワードニューラルネットワーク(FFNN),複合アクチュエータニューラルネットワーク(CANN)の性能を詳細に比較する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:15:22 GMT)
Multi-Source Knowledge-Based Hybrid Neural Framework for Time Series Representation Learning [2.4] 提案したハイブリッドアーキテクチャは、ドメイン固有の知識とMSSデータに基づく関係構造の暗黙的な知識を組み合わせることで制限に対処する。
このアーキテクチャは、複数のベンチマークデータセットで有望な結果を示し、最先端の予測方法よりも優れています。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:58:55 GMT)
Multi-Knowledge Fusion Network for Time Series Representation Learning [2.4] MTSデータ内の関係構造の暗黙的な知識と事前知識を組み合わせたハイブリッドアーキテクチャを提案する。
提案アーキテクチャは、複数のベンチマークデータセットに対して有望な結果を示し、最先端の予測手法をかなりの差で上回っている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:18:16 GMT)
Joint Hypergraph Rewiring and Memory-Augmented Forecasting Techniques in Digital Twin Technology [2.4] Digital Twin技術は、物理的オブジェクト、プロセス、システムの仮想レプリカを作成し、それらの特性、データ、振る舞いを複製する。
Digital Twin技術は、大規模複雑なセンサーネットワークにおけるグラフ予測技術を活用し、多様なシナリオの正確な予測とシミュレーションを可能にしている。
本稿では,新しいパターンへの高速適応と過去の知識のメモリベース検索を取り入れ,ハイパーグラフ表現学習のバックボーンを強化するハイブリッドアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:08:45 GMT)
Domain Adaptation for Offline Reinforcement Learning with Limited Samples [2.4] オフライン強化学習は、静的ターゲットデータセットから効果的なポリシーを学ぶ。
最先端(SOTA)のオフラインRLアルゴリズムが有望であるにもかかわらず、ターゲットデータセットの品質に強く依存している。
本稿では,各データセットに割り当てられた重みがオフラインRLの性能に与える影響を理論的・実験的に検討した最初のフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 05:38:48 GMT)
PCGRL+: Scaling, Control and Generalization in Reinforcement Learning Level Generators [2.3] 制御可能なデザイナーエージェントを訓練する手段として,PCGRL (Procedural Content Generation) が導入された。
PCGRLはゲームデザイナーにユニークな余裕を提供するが、RLエージェントを訓練する計算集約的なプロセスによって制約される。
我々はJaxにいくつかのPCGRL環境を実装し、GPU上で学習とシミュレーションのあらゆる側面が並列に行われるようにした。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:30:24 GMT)
Neural-ANOVA: Model Decomposition for Interpretable Machine Learning [2.3] 本稿では,ニューラルネットワークをガラス箱モデルに分解するアプローチであるNeural-ANOVAを紹介する。
本手法は,積分の迅速かつクローズドな評価を可能にする学習問題を定式化する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:55:43 GMT)
A Neurosymbolic Framework for Bias Correction in Convolutional Neural Networks [2.2] 我々は、訓練されたCNNにおいて、バイアス補正のためのNeSyBiCorと呼ばれるニューロシンボリックフレームワークを導入する。
我々のフレームワークは、"Places"データセットのサブセットでトレーニングされたCNNのバイアスを修正することに成功した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 23:10:20 GMT)
Pulse characterization at the single-photon level through chronocyclic $Q$-function measurements [2.2] 本稿では, 単光子レベルの光パルスの複素スペクトル振幅を, クロノサイクリック$Q-$関数の測定により求める。
本手法は, 二次位相空間と時間周波数位相空間の類似性を利用して, 量子状態トモグラフィーからインスピレーションを得る。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:30:49 GMT)
Emotion-Agent: Unsupervised Deep Reinforcement Learning with Distribution-Prototype Reward for Continuous Emotional EEG Analysis [2.2] 連続脳波(EEG)信号は、感情脳-コンピュータインターフェース(aBCI)の応用に広く用いられている。
脳波信号から関連性および情報的感情モーメントを自動的に識別する,非教師なしの深層強化学習フレームワーク Emotion-Agent を提案する。
Emotion-AgentはPPO(Proximal Policy Optimization)を用いて訓練され、安定かつ効率的な収束を実現する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:29:25 GMT)
Aligning (Medical) LLMs for (Counterfactual) Fairness [2.1] 大規模言語モデル(LLM)は、医療および臨床決定支援アプリケーションのための有望なソリューションとして登場した。
LLMは様々な種類のバイアスを受けており、個人の不公平な扱い、健康格差の悪化、AIが強化された医療ツールへの信頼の低下につながる可能性がある。
本稿では, 知識蒸留フレームワークにおける優先最適化手法を用いて, LLMの整列化のための新しいモデルアライメント手法を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 01:11:27 GMT)
Enhancing Natural Language Inference Performance with Knowledge Graph for COVID-19 Automated Fact-Checking in Indonesian Language [2.1] 本研究は,インドネシア語の自動ファクトチェックにおいて,知識グラフ(KG)を外部知識として活用し,NLIのパフォーマンスを向上させる。
本研究は,KGsを組み込むことで,NLI性能が有意に向上し,0,8616の精度が達成できることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:27:47 GMT)
Rate-adaptive Reconciliation for Experimental Continuous-variable Quantum Key Distribution with Discrete Modulation over a Free-space Optical Link [2.1] キーを安全に交換する手法として,連続可変量子鍵分布(CV-QKD)が提案されている。
自由空間光(FSO)チャネルはCV-QKDにとって興味深いチャネルであり、無線で鍵を共有できる。
しかし、乱流によって引き起こされるフェーディングは、システムの性能を低下させる可能性がある。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:25:02 GMT)
Contrastive Representation Learning for Dynamic Link Prediction in Temporal Networks [1.9] 本稿では,時間ネットワークの表現を学習するための自己教師付き手法を提案する。
本稿では、時間的ネットワークの時間的参照経路を介して情報の流れをモデル化するための、繰り返しメッセージパッシングニューラルネットワークアーキテクチャを提案する。
提案手法は、Enron、COLAB、Facebookのデータセットでテストされる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 22:50:46 GMT)
Neural interval-censored survival regression with feature selection [1.9] 加速故障時間(AFT)モデルに根ざした区間チャージ回帰タスクに適した新しい予測フレームワークを提案する。
この結果は,特に非線形関係を特徴とするシナリオにおいて,従来のAFTアルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:48:12 GMT)
Decoding Decentralized Finance Transactions through Ego Network Motif Mining [1.9] 本稿では,トークン転送ネットワークからエゴネットワークモチーフを抽出し,ユーザとスマートコントラクト間のトークン転送をキャプチャする手法を提案する。
これらのモチーフを解析することにより,特定のDeFi操作を行うスマートコントラクト手法を効率的に識別できることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:38:59 GMT)
High-Quality Data Augmentation for Low-Resource NMT: Combining a Translation Memory, a GAN Generator, and Filtering [1.9] 本稿では,低リソース環境下でのニューラルネットワーク翻訳(NMT)を支援するために,ソース側でモノリンガルコーパスを利用する新しい手法を提案する。
この概念はGAN(Generative Adversarial Network)を用いて,低品質な合成モノリンガル翻訳とジェネレータとの干渉を緩和しつつ,識別器のトレーニングデータを増強する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:35:47 GMT)
Unsupervised discovery of the shared and private geometry in multi-view data [1.9] 我々は低次元の共有変数とプライベート潜伏変数をアンハングリングする非線形ニューラルネットワークに基づく手法を開発した。
我々は,異なる雑音条件で解釈可能な共有構造とプライベート構造を探索するモデルの能力を実証する。
本手法を海馬と前頭前皮質の同時記録に応用し, マウスが直線軌道を走行している間に, 動物の位置を符号化する低次元の潜伏空間を発見する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:00:21 GMT)
Overfitting In Contrastive Learning? [1.9] オーバーフィッティング(Overfitting)は、モデルがトレーニングデータにあまりにも密接に適合し、結果として一般化が不十分な機械学習現象を記述している。
オーバーフィッティングが実際に起こり、オーバーフィッティングのメカニズムが明らかになる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:56:26 GMT)
Recording Brain Activity While Listening to Music Using Wearable EEG Devices Combined with Bidirectional Long Short-Term Memory Networks [1.6] 本研究は、音楽を聴きながら脳波信号を効率的に記録・分析することの課題に対処することを目的とする。
脳波信号処理のためのBi-LSTMネットワークとアテンション機構を組み合わせた手法を提案する。
Bi-LSTM-AttGWモデルは、SEEDデータセットで98.28%、DEAデータセットで92.46%の精度を達成した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:32:22 GMT)
Which Combination of Test Metrics Can Predict Success of a Software Project? A Case Study in a Year-Long Project Course [1.6] テストはソフトウェア開発プロジェクトの成功を保証する上で重要な役割を担います。
種々のテストが機能的適合性に与える影響を定量化できるかどうかを検討する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:23:51 GMT)
Simplifying Random Forests' Probabilistic Forecasts [1.5] ランダムフォレスト(RF)は分類と回帰の両方に有用であることが証明されている。
本稿では,RFを用いた予測分布の簡易化について検討する。
既存のRFモデルを再訓練することなく、任意の予測タスクに適用することができる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:20:17 GMT)
AI in radiological imaging of soft-tissue and bone tumours: a systematic review evaluating against CLAIM and FUTURE-AI guidelines [1.5] 軟部腫瘍と骨腫瘍 (STBT) は稀で, 診断に難渋する病変であり, 様々な臨床症状と治療のアプローチがある。
本稿では,これらの腫瘍の診断と予後のための放射線画像を用いた人工知能(AI)法の概要について概説する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:31:48 GMT)
Dynamic phases induced by two-level system defects on driven qubits [1.5] 最近の実験的証拠は、超伝導量子ビットにおけるデコヒーレンスの主要な構成要素として2段階の欠陥が指摘されている。
これらの欠陥が外部駆動の存在による量子ビットの進化にどのように影響するかは、あまりよく分かっていない。
駆動によって誘導される連続コヒーレント状態空間におけるデコヒーレンスダイナミクスを解析する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:56:58 GMT)
The $\hbar\to 0$ limit of open quantum systems with general Lindbladians: vanishing noise ensures classicality beyond the Ehrenfest time [1.5] 量子系と古典系は同じ形式的ハミルトニアン$H$の下で進化し、エレンフェストの時間スケールの後に劇的に異なる振る舞いを示す可能性がある。
システムをマルコフ環境に結合すると、量子進化のためのリンドブラッド方程式が得られる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:22:43 GMT)
Hidden Risks: The Centralization of NFT Metadata and What It Means for the Market [1.5] 非偽造トークン(NFT)市場の急速な拡大により、関連するメタデータの保存と流通に関する重要な課題が明らかにされた。
本稿では,NFTメタデータストレージの現状を考察し,集中型プラットフォームに大きく依存していることを明らかにする。
分散ストレージソリューション、特にIPFS(InterPlanetary File System)はよりセキュアでレジリエントな代替品として同定された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:29:29 GMT)
Multi-tool Integration Application for Math Reasoning Using Large Language Model [1.5] 本稿では,数学的推論のための新しいマルチツールアプリケーションフレームワークを提案する。
大規模言語モデル(LLM)と複数の外部ツールの協調効果を利用して、より包括的で正確な数学的推論を実現することを目的としている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 06:27:10 GMT)
Implicit Sentiment Analysis Based on Chain of Thought Prompting [1.5] 本稿では,思考の感覚分析(SAoT)フレームワークを紹介する。
このフレームワークはまず、常識と思考連鎖能力を用いてテキストの暗黙的な側面と意見を分析する。
このモデルは、レストランレビュー1120とラップトップレビュー638からなるSemEval 2014データセットで評価されている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 06:55:29 GMT)
AutoTest: Evolutionary Code Solution Selection with Test Cases [1.5] 本研究では,自動テストケース生成とコードソリューション実行を組み合わせた新しい手法であるAutoTestを提案する。
HumanEvalデータセットは164のプログラミング問題で構成されており、AutoTestはpass@1スコアでベースラインメソッドよりも約10%改善されている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:38:41 GMT)
A Practical Introduction to Benchmarking and Characterization of Quantum Computers [1.4] 量子キャラクタリゼーション、検証、検証(QCVV)
QCVVの手法とプロトコルにより、科学者や技術者は量子情報処理装置の性能を精査し、理解し、向上することができる。
このチュートリアルは、量子コンピュータのベンチマークとキャラクタリゼーションに精通していない研究者のためのガイドブックとして機能する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:00:49 GMT)
Copula-based transferable models for synthetic population generation [1.4] 集団合成は、マイクロエージェントの標的集団の合成的かつ現実的な表現を生成することを含む。
従来の手法は、しばしばターゲットのサンプルに依存し、高いコストと小さなサンプルサイズのために制限に直面している。
本研究では,実験的辺縁分布のみが知られている対象個体群を対象とした合成データを生成するためのコプラに基づく新しい枠組みを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:55:20 GMT)
Machine-learning certification of multipartite entanglement for noisy quantum hardware [1.2] 絡み合いは、概念的にも多くの応用のためにも、量子物理学の基本的な側面である。
ランダムな局所測定の統計データを非線形次元削減アルゴリズムに供給する認証パイプラインを開発した。
我々は、シミュレーションされたテストデータに基づいて予測の精度を検証し、IBM量子コンピューティングハードウェア上で準備された状態に適用する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:47:58 GMT)
Self-Supervised Multiple Instance Learning for Acute Myeloid Leukemia Classification [1.2] 急性骨髄性白血病(AML)のような疾患は、単細胞レベルでのアノテーションが不足し、コストがかかるため困難である。
マルチインスタンス学習(MIL)は、弱いラベル付きシナリオに対処するが、ラベル付きデータで訓練された強力なエンコーダを必要とする。
本研究では,MILをベースとしたサブタイプAML分類のための事前学習手法として,自己監督学習(SSL)について検討する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 21:42:24 GMT)
Concept-based explainability for an EEG transformer model [1.2] 概念ベクトル (Concept Vectors, CAVs) は、深層モデルの内部状態を理解することを目的とした概念である。
両手法が深部脳波モデルで学習した表現に有意義な洞察を与える証拠を提示する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:48:24 GMT)
Quantum memory at nonzero temperature in a thermodynamically trivial system [1.2] 非ゼロ温度における熱力学的相転移は, 定値古典的および量子的低密度パリティチェック符号の族によっては存在しないことを示す。
このようなコードのスローギブスサンプリングは、有限深度回路を用いたフォールトトレラントな量子誤り訂正を可能にする。
この戦略は、測定不要な量子エラー補正に適しており、従来の量子エラー補正に代わる望ましい実験的な選択肢を示す可能性がある。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 19:18:30 GMT)
Covariate-Elaborated Robust Partial Information Transfer with Conditional Spike-and-Slab Prior [1.1] 本研究では,頑健な部分的情報伝達を実現するために,ConCERT'という新しいベイズ変換学習手法を提案する。
情報伝達のためのターゲットパラメータとソースパラメータの共分散に、条件付きスパイク・アンド・スラブ前処理を導入する。
既存の作業とは対照的に、CONCERTは1ステップの手順であり、変数の選択と情報転送を同時に行う。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:42:55 GMT)
Positional Description for Numerical Normalization [1.1] 本稿では,桁列に適した位置記述方式(PDS)を提案し,各桁のプレースホルダ値情報を統合する。
PDSは、ニューラルネットワークモデルの致命的な数値正規化エラーを軽減し、わずかなトレーニングデータしか必要としない。
PDSはテキスト音声と音声認識の両方のテキスト処理に必須であり、生産制約下で有効なTNを実現することを実証する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:24:20 GMT)
From Radiologist Report to Image Label: Assessing Latent Dirichlet Allocation in Training Neural Networks for Orthopedic Radiograph Classification [1.1] 遅延ディリクレ割り当て(LDA)は、自動的に文書をトピックに分類するNLP手法である。
自動MLパイプラインは, 整形外科的外傷のX線写真から, どのように分類できるかを検討した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 19:47:25 GMT)
Advancements in Molecular Property Prediction: A Survey of Single and Multimodal Approaches [1.0] 分子特性予測(MPP)は、薬物発見、物質科学、環境化学など様々な分野において重要な役割を担っている。
近年、化学データの指数的な成長と人工知能の進化によって、MPPの顕著な進歩が見られた。
本稿では,MPPにおける最近のAI/ベースアプローチについて考察する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:59:30 GMT)
Enhancing Uncertainty Communication in Time Series Predictions: Insights and Recommendations [1.0] 本研究では,時系列予測における確率的不確実性を推定する方法を検討する。
個人特性とユーザ報告メトリクスが不確実性評価に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:03:55 GMT)
WCEbleedGen: A wireless capsule endoscopy dataset and its benchmarking for automatic bleeding classification, detection, and segmentation [1.0] 本研究は,WCEbleedGenという医用注釈付きWCEデータセットの開発に焦点を当てた。
さまざまなインターネットリソースや既存のWCEデータセットから収集された2,618個のWCE出血フレームと非出血フレームで構成されている。
データセットは高品質で、クラスバランスが取れており、単一の出血部位と複数の出血部位を含んでいる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:06:50 GMT)
Directed st-connectivity with few paths is in quantum logspace [0.9] 有向グラフ上の$st$-pathをカウントするために、$mathsfBQSPACE(O(log))$-procedureを示す。
比較すると、このケースでよく知られた古典的上界は$st$-connectivityを$mathsfDSPACE(O(log2 n/ log nlog))$と判断するだけである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:11:57 GMT)
Deep Analysis of Time Series Data for Smart Grid Startup Strategies: A Transformer-LSTM-PSO Model Approach [0.9] Transformer-LSTM-PSOモデルはグリッド起動方式における複雑な時間的関係をより効果的に捉えるように設計されている。
Modelは、既存のベンチマークと比較して、複数のデータセットにわたるRMSEとMAE値の低い値を達成する。
Transformer-LSTM-PSOモデルの適用は、スマートグリッド予測分析の大幅な進歩を示している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 04:52:02 GMT)
Macro-Queries: An Exploration into Guided Chart Generation from High Level Prompts [0.8] 本稿では,データビジュアライゼーションと大規模言語モデル(LLM)の交わりについて検討する。
我々は、高レベルのユーザ質問(マクロクエリ)でガイドされた、データ変換のためのガイド付きLLMベースのパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 20:35:42 GMT)
Whole Slide Image Classification of Salivary Gland Tumours [0.8] 本研究は,スライド画像全体の癌分類における唾液腺腫瘍の多症例学習による有望な結果を示す。
CTransPathをパッチレベルの特徴抽出器として、CLAMを特徴集約器として、スライド画像全体の癌を検出するために、F1スコア0.88以上、AUROC0.92以上を得る。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:19:41 GMT)
CGGM: A conditional graph generation model with adaptive sparsity for node anomaly detection in IoT networks [0.7] 本稿では,マイノリティクラスに属するサンプルを生成するために,CGGMと呼ばれる新しいグラフ生成モデルを提案する。
フレームワークは、条件付きグラフ生成モジュールとグラフベースの異常検出モジュールの2つのコアモジュールから構成される。
実験により、CGGMは精度とばらつきの点で最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:45:09 GMT)
Topics as Entity Clusters: Entity-based Topics from Large Language Models and Graph Neural Networks [0.6] 本稿では,エンティティのバイモーダルベクトル表現を用いたトピッククラスタリング手法を提案する。
我々のアプローチは、最先端のモデルと比較してエンティティを扱うのに適している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:07:11 GMT)
High-distance codes with transversal Clifford and $T$-gates [0.6] 我々は、論理的な$textttT$-gateの実装を許容する、高距離三重コード群を提示する。
我々の知る限り、どちらの符号族も同じ距離の他の量子ビット安定化符号よりも低い量子ビットオーバーヘッドを必要とし、それぞれのゲートを実現できる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 22:45:47 GMT)
Controlization Schemes Based on Orthogonal Arrays [0.6] 制御は、最近、未知のハミルトン力学を変換するための量子アルゴリズムで使われている。
未知の2-局所ハミルトニアンに対する配列の助けを借りて、より効率的な制御スキームを構築することができることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:42:34 GMT)
Input-Output Hierarchical Equations Of Motion [0.6] 階層型運動方程式(HEOM)を拡張してボゾン環境の出力物理特性を計算する。
与えられた所望の入力状態と出力可観測値に対して、正規HEOMを拡張するインデックスの範囲は、構成上は有界である。
全体として、この形式主義の目的は、非ガウス的入力状態をモデル化するためのHEOMフレームワークの効率と、ボソニックで非マルコフ的オープン量子系における環境観測可能のダイナミクスを活用することである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:48:04 GMT)
Sampling Strategies based on Wisdom of Crowds for Amazon Deforestation Detection [0.6] 2019年4月、フォレストアイス(FE)と呼ばれる市民科学と機械学習モデルに基づくプロジェクトが立ち上げられた。
FEは、森林破壊監視の取り組みにおいて、政府や非営利団体の専門家を支援する補助データを提供する。
最近の研究では、FEプロジェクトのボランティア/市民科学者のラベル付けが機械学習モデルの調整に役立つことが示されている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:21:47 GMT)
Impact of Usability Mechanisms: A Family of Experiments on Efficiency, Effectiveness and User Satisfaction [0.5] ベースライン実験における結果の精度と一般化を高めるために、3つの実験のファミリーを用いる。
システムのユーザビリティは, 効率, 有効性, ユーザ満足度に関して大きく向上していると考えられる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 21:23:18 GMT)
Computer-Aided Fall Recognition Using a Three-Stream Spatial-Temporal GCN Model with Adaptive Feature Aggregation [0.5] 転倒予防は現代医療において特に高齢者にとって最重要である。
高齢者の生活を救うためには,コンピュータ支援による転倒検知システムが不可欠である。
本稿では,3流時空間特徴量に基づく転倒検出システムを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:40:04 GMT)
Exploring van der Waals cuprate superconductors using a hybrid microwave circuit [0.5] 我々は、ファンデルワールス・フレークとハイブリッド超伝導マイクロ波共振器を統合する。
温度上昇に伴う共振器周波数の顕著なアップシフトと正の非線形性を観察した。
我々の発見は、ファンデルワールスフレークスを用いた高品質ハイブリッド回路の道を開き、新しい材料を探索し、量子技術のための新しいデバイスを開発する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:22:01 GMT)
Enhanced Infield Agriculture with Interpretable Machine Learning Approaches for Crop Classification [0.5] 本研究では、SIFT、ORB、Color Histogramなどの手作り特徴抽出手法を用いた従来のML、カスタムデザインCNN、AlexNetのようなDLアーキテクチャの確立、ImageNetを用いて事前訓練された5つのモデルの移行学習の4つの異なる分類手法を評価する。
Xceptionはこれら全てを一般化し、80.03MBのモデルサイズと0.0633秒の予測時間で98%の精度を達成した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:20:34 GMT)
Developing vocal system impaired patient-aimed voice quality assessment approach using ASR representation-included multiple features [0.5] 本稿では,音声認識と自己教師型学習表現の利用について紹介する。
実験ではPVQDデータセットのチェックを行い、英語における様々な声道系の損傷の原因をカバーし、パーキンソン病の患者に焦点を当てた日本語データセットを作成した。
PVQDの結果, PCCでは0.8, MSEでは0.5と顕著な相関がみられた。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:22:53 GMT)
HyperNeRFGAN: Hypernetwork approach to 3D NeRF GAN [0.5] 本稿では,ガウス雑音をNeRFアーキテクチャの重みに変換するために,ハイパーネットワークパラダイムを用いたGANアーキテクチャであるHyperNeRFGANを紹介する。
既存の最先端の代替モデルと比較して顕著な単純さにもかかわらず、提案モデルは多様な画像データセットにおいて優れた性能を示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 00:41:15 GMT)
A New Chinese Landscape Paintings Generation Model based on Stable Diffusion using DreamBooth [0.4] 本研究では,中国景観絵画の制作方法を紹介する。
LoRAと事前訓練SDM、DreamBoothと事前訓練SDMを組み合わせることにより、トレーニングプロセスが加速される。
ドリームブースと組み合わせたSDMはデータセット上で12.75のFIDを達成し、専門家評価の点で他のモデルよりも優れている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:21:29 GMT)
Observation of electric field induced superradiance slowdown in ultracold Rydberg atomic gases [0.4] 電子的に高いライドバーグ状態に励起された原子は自然放出過程を通じて低エネルギー状態に崩壊する。
電界印加時の超放射能の顕著な低下に関する実験的観察を報告する。
数値シミュレーションにより、超放射光デコヒーレンスは、Rydbergレベルのスタークシフトによって引き起こされることを示した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:04:55 GMT)
Late Breaking Results: On the One-Key Premise of Logic Locking [0.4] ロック技術は、この正しいキーを見つけるための優れた攻撃に抵抗すると、安全であると判断される。
本稿では、より効率的な攻撃手法を導入することで、このワンキー前提に挑戦する。
我々の攻撃は、単一の正しいキーを見つけようとする従来の攻撃と比較して、最大99.6%のランタイム削減を実現している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 19:05:13 GMT)
Improved accuracy for decoding surface codes with matching synthesis [0.4] 本稿では、デコーダのアンサンブルからエラーの高次割当を生成する量子コードデコードのためのマッチング合成法を提案する。
マッチング合成は、最小ウェイトハイパーグラフマッチング問題に対する近似解のアンサンブルの解を取る。
一致合成は,60のアンサンブルサイズで精度が飽和し始め,良好なスケーリング特性を有することを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 05:34:36 GMT)
Quantum Convolutional Neural Networks are (Effectively) Classically Simulable [0.4] 量子畳み込みニューラルネットワーク(QCNN)は量子機械学習(QML)の有望なモデルとして広く見なされている
QCNNは入力状態の低身長測定で符号化された情報のみを操作可能であることを示す。
物質分類のフェーズに対して,QCNNの最大1024ドルキュービットに対するシャドーベースシミュレーションを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 21:46:19 GMT)
Learning Generalizable Program and Architecture Representations for Performance Modeling [0.3] PerfVecは、新しいディープラーニングベースのパフォーマンスモデリングフレームワークである。
高次元および独立/直交プログラムとマイクロアーキテクチャ表現を学習する。
PerfVecは、命令のパフォーマンスの本質をキャプチャする基盤モデルを生成する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:29:35 GMT)
An Evaluation of Deep Learning Models for Stock Market Trend Prediction [0.3] 本研究では,S&P 500指数とブラジルETF EWZの日時閉値を用いた短期トレンド予測のための先進的なディープラーニングモデルの有効性について検討した。
時系列予測に最適化されたxLSTM適応であるxLSTM-TSモデルを導入する。
テストされたモデルの中で、xLSTM-TSは一貫して他のモデルよりも優れており、例えば、テスト精度72.82%、F1スコア73.16%をEWZの日次データセットで達成している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:58:55 GMT)
Segment Anything Model for Grain Characterization in Hard Drive Design [0.3] ハードドライブ設計における新しい材料開発には, 粒分別によるナノスケール材料のキャラクタリゼーションが必要である。
本稿では,MetaのSegment Anything Model(SAM)のこの問題への適用について検討する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 20:48:51 GMT)
Shufflecake: Plausible Deniability for Multiple Hidden Filesystems on Linux [0.2] Shufflecakeは、暗号化されたデータの存在を記憶媒体に隠蔽する、新しい可視的識別性設計である。
TrueCryptやVeraCryptのような道具に対する「霊的な後継者」とみなすことができる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 23:45:05 GMT)
From Clicks to Carbon: The Environmental Toll of Recommender Systems [0.2] 典型的な実験パイプラインを再現することにより,レコメンデータシステム研究の環境影響を推定する。
分析対象は2013年と2023年のACM RecSysカンファレンスの全論文79件である。
平均して、1つのディープラーニングベースの論文は3,297キログラムのCO2等価量を生成する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:14:33 GMT)
A General Framework for Gradient-Based Optimization of Superconducting Quantum Circuits using Qubit Discovery as a Case Study [0.2] 超伝導量子回路の勾配に基づく最適化のための網羅的な枠組みを提案する。
この枠組みをキュービット発見問題に適用し、優れた性能指標を持つキュービット設計の同定の有効性を実証する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 19:46:50 GMT)
Fine-tuning Smaller Language Models for Question Answering over Financial Documents [0.2] 我々は、財務文書に対するマルチホップ数値推論を必要とする質問に答えることの課題に焦点をあてる。
プログラムを生成するために微調整されたいくつかの小型モデルの性能を評価する。
我々の経験的分析は、微調整が学生モデルに要求される財務概念を表現・適用する能力を洗練させることを示している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:23:29 GMT)
Self-supervised Learning for Clustering of Wireless Spectrum Activity [0.2] 実世界の未ラベルデータにおけるスペクトルの探索における自己教師あり学習(SSL)の利用について検討する。
抽出した特徴量やクラスタリング性能に関して,SSLモデルにより優れた性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:10:37 GMT)
Selective Amplification of a Gravitational Wave Signal Using an Atomic Array [0.1] 我々は1次元の原子配列の集合放射動力学を利用して重力波信号を選択的に増幅する。
単一原子とは対照的に、アレイの集合放射動力学は振幅の1次重力波に敏感である。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:36:00 GMT)
Young double-slit interference with single hard x-ray photons [0.1] 実験は、干渉計と検出器の間の距離110mのシンクロトロン源で実施された。
実験の単一粒子バージョンでは、それぞれに1つの登録された光子を持つ100万枚以上の画像フレームが集められた。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:35:17 GMT)
Dynamic Product Image Generation and Recommendation at Scale for Personalized E-commerce [0.1] 遅延拡散に基づく画像生成とコンテキスト帯域の結合により、大規模にアイキャッチされたパーソナライズされた製品イメージを作成することができる。
本稿では,電子商取引のオンラインキャンペーンにおけるレコメンデーションによるユーザエンゲージメントを高めるために,これらの技術をどのように活用したかを紹介する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:37:30 GMT)
Visual Verity in AI-Generated Imagery: Computational Metrics and Human-Centric Analysis [0.0] 我々は,フォトリアリズム,画質,テキスト画像のアライメントを計測するVisual Verityというアンケートを導入,検証した。
また, 色調, 彩度, 明度において, カメラ生成画像が低い値を示した。
その結果,人間の視覚的知覚をよりよく捉えるために,計算メトリクスの精細化の必要性が浮き彫りになった。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 23:29:07 GMT)
Vintern-1B: An Efficient Multimodal Large Language Model for Vietnamese [0.0] Vintern-1Bはベトナム語タスクのための信頼性の高いマルチモーダル大言語モデル(MLLM)である。
このモデルは、300万以上の画像検索と回答のペアからなる広範囲なデータセットに基づいて微調整されている。
Vintern-1Bは、様々なデバイス上のアプリケーションに簡単に適合できるほど小さい。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:15:51 GMT)
Verifiable Homomorphic Linear Combinations in Multi-Instance Time-Lock Puzzles [0.0] マルチインスタンス部分同型TLP(MH-TLP)
マルチインスタンス・マルチクライアント検証部分同型TLP(MMH-TLP)
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:40:28 GMT)
Ultra-broadband non-degenerate guided-wave bi-photon source in the near and mid-infrared [0.0] 中心波長が860,mathrmnm$および2800,mathrmnm$でブロードバンド二光子を生成するTi:LiNbO$_3$導波路をベースとした統合PDC源を提案する。
それらの帯域幅は25,mathrmTHz$を超え、信号とアイドラー場に対する群速度の同時一致と群速度分散のキャンセルによって達成される。
我々は、異なる温度とポンプ波長で源の挙動を研究することによって、その過程を直感的に理解し、シミュレーションとよく一致する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:23:35 GMT)
Two-Time Measurement of Entropy Transfer in Markovian Quantum Dynamics [0.0] いくつかの熱浴とのカップリングにより熱平衡から引き出された量子開系におけるエントロピー観測器の2回測定のためのプロトコルを検討する。
我々は、時間進化のマルコフ近似に集中し、そのような定義されたエントロピー変動の期待値と、レボリッツとスポンによるエントロピー生成のよく知られた表現を関連付ける。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:07:19 GMT)
Tutorial: projector approach to master equations for open quantum systems [0.0] このチュートリアルは、効果的量子力学を導出する自己完結した実用的なツールボックスで、複数の分野にわたって量子理論を提供することを目的としている。
我々は, ブラウン方程式, ボルン・マルコフ方程式, 断熱方程式の3つの共通効用方程式が, 中島・ズワンツィヒ方程式の異なる摂動展開から導出されることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 21:05:37 GMT)
Tripartite entanglement dynamics following a quantum quench [0.0] マルコフギャップのレンズを通した三部体の絡み合いのダイナミクスに焦点をあてる。
XXスピンチェインでは、マルコフギャップが中間時間で正であることを示し、三部体の絡み合いの存在を示唆する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:36:56 GMT)
Topics in Algebra of Synchronous Games, Algebraic Graph Identities and Quantum NP-hardness Reductions [0.0] 同期ゲームとその関連ゲーム代数の対応性について検討する。
我々は、特定のモデルによる完璧な戦略の存在を確認するための計算ツールを構築している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:24:31 GMT)
Tipta uzmanlik sinavinda (tus) büyük dil modelleri insanlardan daha mi başarili? [0.0] 本研究では,トルコの医学的問題に対する3つの異なる人工知能モデルの性能評価を行った。
Geminiは82問、ChatGPT-4は105問、ChatGPT-4oは117問を正解した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:25:08 GMT)
Timelike virtual transition in a static atom by a static mirror in Kasner Universe and in future Kruskal-Szekeres region [0.0] ミンコフスキー時空のカスナー領域における無限反射鏡の存在下での2レベル原子の時間的遷移について検討する。
原子と鏡の分離に対する熱応答とその周期的依存性を観察する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:18:22 GMT)
Time-resolved pairing gap spectroscopy in a quantum simulator of fermionic superfluidity inside an optical cavity [0.0] 我々は、原子の多層構造を利用して、この系におけるクーパー対破壊の物理学を研究する。
後者は内部の原子状態の個体群に依存しており、フェルミオン性超流動で予測される化学的ポテンシャル依存を反映している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:00:00 GMT)
Time Series Clustering with General State Space Models via Stochastic Variational Inference [0.0] 一般状態空間モデル(MSSM)の混合を用いたモデルベース時系列クラスタリングの新しい手法を提案する。
提案手法の利点は,特定の時系列に適した時系列モデルの利用を可能にすることである。
シミュレーションデータセットの実験から,提案手法はクラスタリング,パラメータ推定,クラスタ数推定に有効であることが示された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:50:24 GMT)
The Fock-space landscape of many-body localisation [0.0] 本稿では、量子多体系における多体局在(MBL)の物理の理解の最近の進歩を概観する。
我々は、多体系の力学を、高次元、相関、乱れのあるフォック空間グラフ上の架空の単一粒子の力学にマッピングする。
我々は,Fock空間上の固有状態相関の性質,静的および動的およびエルゴードおよび多体局在相およびMBL遷移近傍について詳細に論じる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:52:21 GMT)
The Bright Side of Timed Opacity [0.0] その結果,1回のTAと1時間のTAとエプシロン交換を除いて,不透明度は主に回収可能であることがわかった。
次に,攻撃者による観察回数が制限された新たな決定可能なサブクラスを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:17:59 GMT)
The 2nd Solution for LSVOS Challenge RVOS Track: Spatial-temporal Refinement for Consistent Semantic Segmentation [0.0] 本稿では,参照対象セグメンテーションモデルの時間的一貫性を高める手法を提案する。
提案手法は,ECCV 2024 LSVOS ChallengeにおいてRVOSトラックの最終ランキングで2位となった。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:43:02 GMT)
Surrogate Constructed Scalable Circuits ADAPT-VQE in the Schwinger model [0.0] 我々は,量子コンピュータ上の周期システムのシミュレーションをさらに進めるため,新しいアプローチ (SC)$2$-ADAPT-VQE を開発した。
我々の手法は、任意に大きいが、任意に小さくない体積に対して定義される座標不変作用素のプールからアンザッツを構築する。
提案手法では,古典的にトラクタブルなサーロゲート構成法を用いて,無関係な演算子をプールから取り除き,拡張性のある回路を定義する最小サイズを小さくする。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:00:00 GMT)
SuperSimpleNet: Unifying Unsupervised and Supervised Learning for Fast and Reliable Surface Defect Detection [0.0] SuperSimpleNetはSimpleNetから進化した革新的な差別モデルである。
これは前任者のトレーニング一貫性、推論時間、検出性能を大幅に向上させる。
SuperSimpleNetは、教師なし設定と教師なし設定の両方で最先端の結果を達成する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:38:28 GMT)
Stochastically bundled dissipators for the quantum master equation [0.0] 本稿では,バンドル計測演算子を用いた散逸器の表現について紹介する。
システムのダイナミクスを捉えた束縛演算子の小さなサンプルを実演する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:06:49 GMT)
Spatio-spectral control of spontaneous emission [0.0] 我々は、軌道角運動量(OAM)を持つ光学渦と原子-渦光相互作用のダイナミクスを研究する。
我々の発見は原子-渦光相互作用のダイナミクスに光を当て、量子レベルでの放出特性の操作に関する洞察を与えてくれた。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 19:36:41 GMT)
Scalable parallel measurement of individual nitrogen-vacancy centers [0.0] ダイヤモンド中の窒素空孔中心は固体スピン欠陥であり、量子センシングや量子情報処理用途に広く採用されている。
複数の光学的に解決されたNV中心を並列に扱う実験プラットフォームを提案する。
本研究では,10NV中心のスピン状態間のショット・ツー・ショット相関を高信号・ノイズ比で検出できることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:36:22 GMT)
SDGym: Low-Code Reinforcement Learning Environments using System Dynamics Models [0.0] SDGymはOpenAI Gymフレームワーク上に構築されたローコードライブラリで、カスタムRL環境の生成を可能にする。
本稿では,電気自動車導入問題のSDモデルを用いて,SDGym環境の性能を実証する。
SDGymをオープンソース化することで、さらなる研究を活性化し、SDおよびRLコミュニティ全体での採用を促進することを目指している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 21:32:03 GMT)
Remote Communication Trends Among Developers and Testers in Post-Pandemic Work Environments [0.0] 新型コロナウイルス(COVID-19)パンデミックへの対応として、リモートとハイブリッドの作業モデルが急速に採用され、ソフトウェア開発チーム内のコミュニケーションと調整に大きな変化をもたらした。
本研究では,ソフトウェア開発者とソフトウェアテスタの遠隔コミュニケーションの特徴と課題について考察する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 20:36:29 GMT)
Randomness control and reproducibility study of random forest algorithm in R and Python [0.0] 毒性学者に対する無作為林の眼耐性評価への統合戦略について論じる。
randomForestとRanger(Rパッケージ)の4つのパッケージを比較し、SKRangerパッケージを介してPythonで適応し、広く使われているScikit-LearnとRandomForestClassifier()関数を比較します。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 07:59:49 GMT)
Quantum phase transitions and cat states in cavity-coupled quantum dots [0.0] 量子ドットと擬似キャビティモードを結合した2つの量子ドットを高モード体積圧縮で検討した。
異なる二重量子ドットの電子は双極子-双極子(クーロン)相互作用を介して互いに相互作用する。
強い結合状態においては、二重量子ドットの配列の基底状態と最初の励起状態の両方がシュリンガー・キャット状態(Schr"odinger cat state)と呼ばれる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:48:10 GMT)
Quantum pathways interference in laser-induced electron diffraction revealed by a semiclassical method [0.0] 本研究では,半古典型Herman-Klukプロパゲータと強磁場近似を組み合わせた,強レーザー場物理学の新しい手法を開発した。
この結果は、レーザー誘起電子回折および他の超高速イメージングおよび強磁場分光技術の現在の機能拡張に利用することができる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 20:23:37 GMT)
Quantum Entanglement, Quantum Teleportation, Multilinear Polynomials and Geometry [0.0] 量子状態は、分解できない多重線型絡み合いと関連していることを示す。
特に,ベル状態が非線形実マルチ線形フレームワークと関連していることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 22:19:03 GMT)
Quantum Circuit Optimization using Differentiable Programming of Tensor Network States [0.0] このアルゴリズムは古典的なハードウェア上で動作し、浅い正確な量子回路を見つける。
すべての回路は、適切なCPU時間と控えめなメモリ要求下で高い状態忠実性を達成する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:48:53 GMT)
Properties of Krylov state complexity in qubit dynamics [0.0] 量子ビット力学におけるKrylov状態の複雑性の性質を,1つの量子ビットと1つの量子ビット対を考慮して解析する。
リードベルク二層原子と相互作用する特定の場合を考えると、実効ハミルトニアンを用いて得られるクリロフ基底が複雑さを最小化することを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:39:58 GMT)
Process tensor approaches to modeling two-dimensional spectroscopy [0.0] 非マルコフ開量子系の光スペクトルをモデル化するための数値計算法を提案する。
提案手法の有効性を実証するために,本手法を用いて生成した2次元電子分光シミュレーションとマルコフマスター方程式シミュレーションを比較した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:21:29 GMT)
Probing topological entanglement on large scales [0.0] トポロジカルに秩序づけられた量子物質は、エンタングルメントの長い範囲のパターンを示し、それがサブシステムエントロピーに現れる。
本研究では, 長尺交絡の普遍的特徴を抽出するハミルトニアンの局所的断熱変形に基づくプロトコルを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:00:01 GMT)
Probabilistic Genotype-Phenotype Maps Reveal Mutational Robustness of RNA Folding, Spin Glasses, and Quantum Circuits [0.0] 本稿では,各遺伝子型を表現型確率ベクトルにマッピングする確率的遺伝子型フェノタイプマップを紹介する。
本研究では,PrGPマップが様々な物理源から生じる不確実性に対処可能な一般化されたフレームワークを提供することを示す3つのモデルシステムについて検討する。
PrGPロバストネスの挙動に関する解析理論を導出し、この理論が経験的ロバストネスの予測性が高いことを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 19:45:33 GMT)
Predicting Solar Energy Generation with Machine Learning based on AQI and Weather Features [0.0] 大気質指数と気象特性が太陽エネルギー発生に与える影響について検討する。
各種機械学習アルゴリズムとConv2D長短期記憶モデルに基づくディープラーニングモデルをこれらの変換に適用する。
我々は,Conv2D Long Short-Term Memoryモデルを用いた0.9691$R2$Score,0.18 MAE,0.10 RMSEを実現する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:13:44 GMT)
Post-quantum hash functions using $\mathrm{SL}_n(\mathbb{F}_p)$ [0.0] 我々は、有限体上の高次元特殊線型群を台として、ティリッヒ・ズーモーハッシュ関数の新しい族を定義する。
これらの群のケイリーグラフは、高速な混合特性と高いガースを結合し、それらが相まって、対応するハッシュ関数の優れた前像と衝突抵抗をもたらす。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 19:32:01 GMT)
Overcoming Noise Limitations in QKD with Quantum Privacy Amplification [0.0] 分散絡み合いの質を向上させることにより、QPAがQKDで達成可能なセキュアな鍵レートを向上できることを実験的に示す。
QPAは従来キー生成を妨げていたノイズレベルにおいてキー生成を可能にする。
結果は、量子プロセッサをリンクするグローバル量子ネットワークの実装と、将来的なデータセキュリティの確保に最重要である。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:21:35 GMT)
Out-Of-Time-Ordered-Correlators for the Pure Inverted Quartic Oscillator: Classical Chaos meets Quantum Stability [0.0] 量子力学系におけるカオス的挙動を診断する手段として、OTOC(Out-of-time-ordered-correlator)が提案されている。
量子力学における逆アンハーモニック(純クォート)発振器のOTOCについて研究する。
高温では, OTOCは2ラングルx2ラングルp2ラングルp2ラングルP2ラングルT$の値と一致した飽和を示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:00:00 GMT)
Optimizing Performance: How Compact Models Match or Exceed GPT's Classification Capabilities through Fine-Tuning [0.0] 非生成の小型モデルは、ゼロショット学習設定でGPT-3.5およびGPT-4モデルより優れている。
細調整されたモデルは、市場感情を決定するタスクに基づいて微調整されたときに、GPT-3.5に匹敵する結果を示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:10:43 GMT)
On the Sample Complexity of Quantum Boltzmann Machine Learning [0.0] モデルと目標との期待値の差からQBM学習の運用的定義を与える。
解は、少なくとも複数のギブス状態を用いて勾配降下で得られることを証明した。
特に,平均場,ガウスフェルミオン,幾何学的局所ハミルトニアンに基づく事前学習戦略を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:18:11 GMT)
New constructive counterexamples to additivity of minimum output Rényi p-entropy of quantum channels [0.0] 我々は、対応する最小出力 R'enyi $p$-エントロピーが加法的でない新しい量子チャネルの族を示す。
我々の写本は Grudka et al., J. Phys. A: Math. Theor. 43 425304 の成果によって動機付けられている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:03:06 GMT)
Neural Networks Assisted Metropolis-Hastings for Bayesian Estimation of Critical Exponent on Elliptic Black Hole Solution in 4D Using Quantum Perturbation Theory [0.0] 楕円型クラス$textSL(2,mathbbR)$変換の4次元アインシュタイン-アキション-ディラトン系の量子摂動理論について検討する。
本稿では, 量子摂動理論に基づくニューラルニューラルネットワークを用いたメトロポリス・ハスティングスアルゴリズムを開発し, 臨界指数の分布を求める。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:06:55 GMT)
Multiple testing for signal-agnostic searches of new physics with machine learning [0.0] 複数のテスト戦略を活用することで信号に依存しない探索をいかに向上させるかという課題を考察する。
我々は,信号に依存しない確率比検定を行う手法であるニュー物理学習機械に着目した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:14:37 GMT)
Multiple non-hermitian phase transitions on quantum torus surface [0.0] 量子トーラス表面上での移動に制限されたディラック方程式によって力学が支配される単一のフェルミオンを考える。
幾何学の影響は、四角形形式とスピン接続を用いて考慮される。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:45:16 GMT)
Multimodal Foundational Models for Unsupervised 3D General Obstacle Detection [0.0] 本稿では,マルチモーダル基礎モデルに基づく障害物セグメンテーションと,従来の教師なし幾何に基づく外乱検出の組み合わせを提案する。
このアプローチはオフラインで動作し、非因果性を活用することができ、トレーニング不要の手法を利用する。
これにより、高価な再トレーニングを必要とせずに、3Dで一般的な障害物を検出することができる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:57:32 GMT)
Momentum-entangled two-photon interference for quantum-limited transverse-displacement estimation [0.0] 本研究では,光子の横モーメントの差分で増大する精度で横変位推定を行うことが可能であることを示す。
小さな変位を推定するためには、横モーメントリゾルバ検出器をバケット検出器に置き換える測定方法を単純化することができる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:52:12 GMT)
Modeling Time-Variant Responses of Optical Compressors with Selective State Space Models [0.0] 本稿では,Selective State Spaceモデルを用いたディープニューラルネットワークを用いた光学ダイナミックレンジ圧縮機のモデル化手法を提案する。
ネットワークを動的に調整するために、機能ワイドリニア変調とゲート付きリニアユニットを統合した洗練された技術が特徴である。
提案アーキテクチャは、ライブオーディオ処理において重要な低レイテンシおよびリアルタイムアプリケーションに適している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:03:08 GMT)
MAC protocol classification in the ISM band using machine learning methods [0.0] ISM無線帯域で最も広く使われているMACサブレイヤプロトコルであるWi-FiおよびBluetoothプロトコルを分類する。
機械学習アルゴリズムであるSupport Vector MachineとK-Nearest Neighborsアルゴリズムを使用して、プロトコルをWi-Fi、Wi-Fi Beacon、Bluetoothの3つのクラスに分類する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 01:26:28 GMT)
Local ergotropy and its fluctuations across a dissipative quantum phase transition [0.0] 局所エルゴトロピーに着目した2ビットオープンなRabiモデルについて検討する。
2ビットシステムの充電、保存、放電のためのプロトコルを定義する。
本研究では, 相転移がエルゴトロピーに及ぼす影響について検討し, 潜在マーカーの同定を行った。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:35:26 GMT)
Local and nonlocal stochastic control of quantum chaos: Measurement- and control-induced criticality [0.0] 古典ベルヌーイ写像に着想を得た量子モデルの族における位相図の普遍性を位相制御の下で研究する。
量子モデルは、古典的なモデルから制御誘起相転移を継承し、また、量子設定への固有の絡み合い相転移を示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 21:51:12 GMT)
Label Noise: Correcting the Forward-Correction [0.0] ラベルノイズのあるデータセット上でニューラルネットワーク分類器を訓練することは、ノイズのあるラベルに過度に適合するリスクをもたらす。
ラベルノイズによる過度適合に対処する手法を提案する。
本研究は, オーバーフィッティングを緩和するために, トレーニング損失に低い限界を課すことを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:30:06 GMT)
Information Scrambling in Bosonic Gaussian Dynamics [0.0] 多重モードボゾン系に対する二次ハミルトン系のランダム性は、特定の情報が診断を揺るがす結果となる。
絡み合い力学における記憶効果の消失と三部情報の負の値を観察した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 02:57:25 GMT)
In-situ characterization of qubit drive-phase distortions [0.0] 本研究では、キュービット自体をプローブとして振幅依存性の位相変化を検出し、補償する手法を示す。
この手法はマイクロ波駆動型トラップイオン量子ビットを用いて実装され、位相歪みの補正により1量子ゲート誤差が3倍改善される。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:24:27 GMT)
Improving Radiography Machine Learning Workflows via Metadata Management for Training Data Selection [0.0] 物理科学では、科学研究サイクルによって生成されるメタデータのプールが永遠に増え続ける。
このメタデータを追跡することで、余分な作業の削減、改善、フィーチャーとトレーニングデータセットエンジニアリングプロセスの支援が可能になる。
動的ラジオグラフィーにおける機械学習メタデータ管理のためのツールを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:01:21 GMT)
Imprecision plateaus in quantum steering [0.0] 測定精度のしきい値まで導入しても不適合なステアリングの不等式について報告する。
本稿では, インプレクション・プラトーがなぜ可能か, それらの存在の簡単な基準, それらの特性を解析するためのツールについて説明する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:26:23 GMT)
If Mixed States Are Secretly Quickly Oscillating Pure States, Weak Measurements Can Detect It [0.0] 我々は、混合状態がすぐに振動する純粋な状態と区別できるかどうかを分析する。
実験は、黒体放射、脱コヒーレンス、固体物質の熱化、ウンルー放射、ホーキング放射から生じる混合状態の性質を決定できる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 14:03:17 GMT)
ISETHDR: A Physics-based Synthetic Radiance Dataset for High Dynamic Range Driving Scenes [0.0] 本稿では,物理に基づく画像システムのためのエンドツーエンドソフトウェアシミュレーションについて述べる。
このソフトウェアを用いて,高ダイナミックレンジ環境における性能向上のためのセンサを探索する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 00:14:50 GMT)
Hell Divers: The Dark Future of Next-Gen Asymmetric Warfighting [0.0] 2024年、マッドサイエンティスト・ライティング・プラットは、次世代の非対称戦闘がどのようなものになるかについて、予測的な議論や架空の物語を要求した。
これは、歴史的文脈、現在の出来事、危機、そして世界的な不確実性から学んだ教訓に従う。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 00:10:03 GMT)
Good Modelling Software Practices [0.0] 私たちは、モデルライフサイクルの実装の初期段階において、単純で簡単なプラクティスのリストをフォローする習慣を主張します。
本研究は, 海洋生物群集の事例として, 海洋生物群集の例を示したものである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:27:45 GMT)
Golden Eye: The Theory of Havana Syndrome [0.0] 2016年頃から、米国外交官は海外勤務中に異常な負傷を報告した。
人体は吐き気、めまい、方向転換などの症状に悩まされた。
ホワイトペーパーは、これらの症状の潜在的な起源に関して競合する仮説を分析する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 00:00:53 GMT)
Geometrical structures of digital fluctuations in parameter space of neural networks trained with adaptive momentum optimization [0.0] 数値的なアーティファクトは,大規模モデルだけでなく,狭い狭いネットワークにおいても観測可能であることを示す。
我々は、この理論を、1600以上のニューラルネットワークで50万回以上のエポックで訓練された実験によって論じる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:14:10 GMT)
FQGA-single: Towards Fewer Training Epochs and Fewer Model Parameters for Image-to-Image Translation Tasks [0.0] 本稿では,SynthRAD Grand Challengeデータセット上で,SEM法を用いてCycleGANを訓練した。
モデル性能は,PSNR,SSIM,MAE,MSEなどの定量的性能指標を用いて質的,定量的に評価した。
本稿では,CycleGANと比較して1/4のパラメータ数を持つFQGAという軽量モデルを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:23:27 GMT)
Extraction of Research Objectives, Machine Learning Model Names, and Dataset Names from Academic Papers and Analysis of Their Interrelationships Using LLM and Network Analysis [0.0] 本研究では,研究論文からタスクや機械学習手法,データセット名を抽出する手法を提案する。
提案手法の表現抽出性能は,Llama3を用いた場合,様々なカテゴリでFスコアが0.8を超えている。
ファイナンシャルドメイン論文のベンチマーク結果は,本手法の有効性を実証した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 03:10:52 GMT)
Extendable optical phase synchronization of remote and independent quantum network nodes over deployed fibers [0.0] シングルクリックのヘラルディングスキームは、光学的に位相同期アーキテクチャを必要とするコストで絡み合い率を高めるために使用できる。
低損失通信Lバンドで動作する大都市圏量子ネットワークの位相同期方式を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:05:23 GMT)
EvalYaks: Instruction Tuning Datasets and LoRA Fine-tuned Models for Automated Scoring of CEFR B2 Speaking Assessment Transcripts [0.0] EvalYaks と呼ばれるモデル群を開発し,CEFR B2 を英語で評価・評価する。
EvalYaksは平均許容精度96%、変量0.35の精度を達成し、次のベストモデルの3倍の精度で実行された。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:57:31 GMT)
Error estimation of different schemes to measure spin-squeezing inequalities [0.0] スピンスクイーズ不等式は、全角運動量の測定だけでなく、2量子相関によって評価できることを示す。
非線形推定器における誤差境界の導出について,その分散の助けを借りて検討する。
また、量子状態の他の非線形パラメータの統計処理にも応用できる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:31:06 GMT)
Domino-cooling Oscillator Networks with Deep Reinforcement Learning [0.0] 我々は、高次強化学習を用いて、発振器ネットワークにおいて結合された高調波発振器の個人的進化を制御する。
本稿では、複数のネットワーク構成における全発振器の熱冷却に関する結果と、量子状態における我々のスキームの有用性を紹介する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:11:48 GMT)
Dissipative phase transition and metrology in collectively pumped superradiance [0.0] 本研究では,励起の集合的崩壊と集合的励起という2つの競合する集合過程を示す多原子系について検討する。
臨界点付近のポンプを走査することで,システムパラメータを測定するための気象プロトコルを考案する。
我々の理論解析は数値的に検証され、無限のスキャンタイムの断熱的な状態を越えている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:20:34 GMT)
Digital quantum simulation of lattice fermion theories with local encoding [0.0] 我々は、フェルミオン格子場理論の量子シミュレーションを行うためのプラットフォームニュートラル一般戦略の有効性を数値解析的に分析する。
我々は,スピンおよび電荷励起の時間スケール分離を,$t-J$モデル極限におけるスピン$frac12$Hubbardはしごで観測する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:19:55 GMT)
Dependency Annotation of Ottoman Turkish with Multilingual BERT [0.0] 本研究は,トルコ語で最初のダンシーツリーバンクのための,事前訓練された大規模言語モデルに基づくアノテーション手法について紹介する。
結果として得られたツリーバンクは、オスマン帝国の文書を自動解析し、この歴史的遺産に埋め込まれた言語的豊かさを解放する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:29:42 GMT)
Demystifying Functional Random Forests: Novel Explainability Tools for Model Transparency in High-Dimensional Spaces [0.0] 本稿では,FRF(Functional Random Forests)の内部メカニズムを照らし出すための,新しい説明可能性ツールについて紹介する。
これらのツールは、個々のFPCがモデル予測にどのように貢献するかを詳細に分析することにより、FRFモデルの透明性を総合的に向上する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:52:32 GMT)
Deep Learning with CNNs: A Compact Holistic Tutorial with Focus on Supervised Regression (Preprint) [0.0] このチュートリアルは、畳み込みニューラルネットワーク(CNN)と教師付き回帰に焦点を当てている。
最も関連する概念を要約するだけでなく、それぞれを深く掘り下げて、完全なアジャイルのアイデアセットを提供する。
本チュートリアルは,Deep Learningの基礎を理解することに関心のある学生,教授,研究者にとって最適な情報源となることを目的としている。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:34:34 GMT)
Deceleration of electrons by an oscillating field [0.0] 振動する電磁場の下での電子力学に対する量子補正は、フロケ理論の中で見られる。
レーザー照射により駆動される様々な電子系について、この現象の可能性を議論する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:49:32 GMT)
Continuously Distributing Entanglement in Quantum Networks with Regular Topologies [0.0] 小さな相互接続量子プロセッサは、量子計算問題に対処するために協力することができる。
ノード間の絡み合いを連続的に分散するプロトコルを解析する。
本研究では,ノード間の絡み合いの頻度を最適化する方法について検討する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 20:05:00 GMT)
Constructions of Optimal-Speed Quantum Evolutions: A Comparative Study [0.0] ブロッホ球面上の最適量子ハミルトニアン進化の2つの異なる構成の比較解析を行う。
どちらのアプローチも、最適ハミルトニアン、最適ユニタリ進化作用素、そして最後に最適な磁場構成を明示的に計算する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:22:18 GMT)
Computing-specific pedagogies and theoretical models: common uses and relationships [0.0] 本論文では,コンピュータ固有の教育と理論モデルとの関係について述べる。
我々のゴールは、フィールド固有の理論や教育の明示的な利用が、その分野をさらに発展させることによって、コンピューティング教育の研究と実践を豊かにすることである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 06:53:22 GMT)
Comparing the cost of violating causal assumptions in Bell experiments: locality, free choice and arrow-of-time [0.0] 本稿は、PNAS 118 e2020569118 (2021) の結果に続いて、局所性と自由選択仮定の等価性を示す。
我々は、特定の仮定に単一矢印型違反を許すような、より困難な因果的シナリオについて考察する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 21:46:40 GMT)
Comparing YOLOv5 Variants for Vehicle Detection: A Performance Analysis [0.0] 本研究は, YOLOv5n6s, YOLOv5s6s, YOLOv5m6s, YOLOv5l6s, YOLOv5x6sの5変種の比較分析を行った。
YOLOv5n6は精度とリコールのバランスが強いことを示した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:06:29 GMT)
Comparative Study of States-based Neural Networks for Virtual Analog Audio Effects Modeling [0.0] 仮想アナログモデリングにおける機械学習の応用について検討する。
我々は、ステートスペースモデルと線形リカレントユニットを、より一般的なLong Short Term Memoryネットワークと比較する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:25:30 GMT)
Classifying Entanglement by Algebraic Geometry [0.0] 論文は代数幾何学的ツールを用いた多部交絡の特徴をカバーしている。
我々は多部交絡を$k$secibilityant variety of the variety $ell$-multilinear rankで分類するアルゴリズムを確立する。
本稿では,このアルゴリズムに基づくマルチキュービットおよびトリパルタイトエンタングルメントの微細構造分類について述べる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:03:22 GMT)
Cheating in quantum Rabin oblivious transfer using delayed measurements [0.0] 我々はRabin oblivious transferと呼ばれる変種を探索する。
従来提案されていたプロトコルでは,遅延測定による攻撃の可能性を示す。
この攻撃によって、プロトコルが変更されない限り、完全な不正行為が可能であることを示し、検査された不正行為戦略の不正行為確率を低くする変更を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:31:16 GMT)
Chatbots and Zero Sales Resistance [0.0] 大規模機械学習アプリケーションにおいて、ますます多くの重みが追求されることは、操作戦略にも寄与する、と論じられている。
機械学習がビジネス上の利益に先立って科学に役立てることを意図しているなら、パラダイムシフトが必要である。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 20:24:07 GMT)
Characterization of Multipartite non-Gaussian Entanglement Structure [0.0] 任意の連続変数状態における多部交絡構造を検出する方法を提案する。
ランダムに生成した10000以上の多モード交絡量子状態に対する本手法の有効性を実証する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:11:13 GMT)
Catalog of General Ethical Requirements for AI Certification [0.0] 我々は、これらの原則を技術に実装するためのツールに対して、全体的な倫理的要件と6つの倫理的原則を価値特有な推奨とともに提示する。
私たちの仕事は、信頼できるAIとAI認定のための最小限の倫理的要件を満たすための、潜在的な青写真として、利害関係者を対象としています。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 10:58:41 GMT)
Can Artificial Intelligence Embody Moral Values? [0.0] 中立論では テクノロジーは価値に恵まれない
本稿では,人工知能,特に自律的に目標を追求する決定を下す人工知能が中立論に挑むことを論じる。
我々の中心的な主張は、人工エージェントの根底にある計算モデルが、公正さ、正直さ、害を避けるといった道徳的価値の表現を統合することができるということである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:39:16 GMT)
Can AI be enabled to dynamical downscaling? A Latent Diffusion Model to mimic km-scale COSMO5.0\_CLM9 simulations [0.0] ダウンスケーリング技術は、地球システムモデリングにおけるディープラーニング(DL)の最も顕著な応用の1つである。
本研究では,イタリア上空のERA5データを2kmまでダウンスケールするために,LDM(Latent Diffusion Model)を適用した。
我々のゴールは、最近の生成モデリングの進歩により、DLが数値力学モデルに匹敵する結果をもたらすことを実証することである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:46:14 GMT)
CLEANANERCorp: Identifying and Correcting Incorrect Labels in the ANERcorp Dataset [0.0] 我々は、広く採用されているアラビアのNERベンチマークデータセット(ANERcorp)の1つを深く掘り下げた。
大量のアノテーションエラー、ラベルの欠如、一貫性がないことが分かりました。
我々はCLEANANERCorpというデータセットのよりクリーンなバージョンを提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 12:59:05 GMT)
Bounds on Petz-Rényi Divergences and their Applications for Device-Independent Cryptography [0.0] 近年、フォン・ノイマンエントロピーにデバイス非依存な条件でより厳密な境界を求めるための変分法が開発されている。
これにより、DIプロトコルのキーレートが、制限と有限サイズの両方で大幅に改善された。
本稿では,DIプロトコルの有限サイズ鍵レートをさらに向上させる方法について述べる。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 11:40:37 GMT)
Beyond Specialization: Assessing the Capabilities of MLLMs in Age and Gender Estimation [0.0] 現在最も強力なMLLM(ShareGPT4V, ChatGPT, LLaVA-Next)の能力を比較する。
この比較は、参加モデルの強みと弱みに関する興味深い結果と洞察をもたらした。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:15:38 GMT)
Bayesian sequential design of computer experiments for quantile set inversion [0.0] 複素数値シミュレータのようなシステムを表現する未知の多変量関数を考える。
我々の目的は、確率が与えられた閾値未満の出力につながる決定論的入力のセットを推定することである。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:24:57 GMT)
Attacks via continuous measurement on the BB84 protocol [0.0] 我々は、この測定によって供給される深部リカレントニューラルネットワークの強力なパターン認識能力とともに、連続測定を利用する新しい攻撃方式を設計する。
BB84プロトコルに適用した場合、スパイが重要な情報を抽出しながらも、我々の攻撃に気づくことは困難であることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:39:26 GMT)
Assessing Lower Limb Strength using Internet-of-Things Enabled Chair [0.0] このプロジェクトは、椅子に取り付けられたセンサーで個人の進捗を計測し、評価することを目指している。
圧力センサーは椅子の様々な場所に装着されるが、座席、背もたれ、手、休息、脚に限らない。
そして、データセットとタイミング情報を機械学習モデルに入力して、動きのさまざまなフェーズにおける相対的な強度と弱さを推定する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:48:56 GMT)
Approximating the eigenvalues of self-adjoint trace-class operators [0.0] 自己随伴のトレースクラス演算子 $O$ に対して、集合 $Lambda_nsubset mathbbR$ を定義する。
弱条件下ではハウスドルフ計量の$O$のスペクトルに収束することを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:50:49 GMT)
Advanced atom-level representations for protein flexibility prediction utilizing graph neural networks [0.0] 我々は,タンパク質の原子レベルでの表現を学習し,タンパク質3D構造からB因子を予測するグラフニューラルネットワーク(GNN)を提案する。
Meta-GNNモデルは、4k以上のタンパク質の大規模かつ多様なテストセット上での相関係数0.71を達成する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 16:15:13 GMT)
Adaptive Spiking Neural Networks with Hybrid Coding [0.0] スパイテンポラルニューラルネットワーク(SNN)は、ニューラルネットワークよりもエネルギー効率が高く効果的なニューラルネットワークである
従来のSNNは、異なる時間ステップで入力データを処理する際に同じニューロンを使用し、時間情報を効果的に統合し活用する能力を制限する。
本稿では,学習に必要な時間を短縮するだけでなく,ネットワーク全体の性能を向上させるためのハイブリッド符号化手法を提案する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 13:58:35 GMT)
A two-dimensional gallium phosphide optomechanical crystal in the resolved-sideband regime [0.0] ガリウムホスフィンヒド(GaP)を用いた2次元光学結晶の作製と特性評価
通信周波数195.6 THzの直線幅$kappa/2pi$ = 2.5 GHzに対応する7.9times 104$の高光学的$Q$-factorを実現する。
このプラットフォームは、低温での通信光子に対する長寿命、決定論的量子メモリの候補として有望である。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 15:13:27 GMT)
A framework for extracting the rates of photophysical processes from biexponentially decaying photon emission data [0.0] 我々は、光学的不活性状態によるキャリアのトラップと放出を含むモデルを開発する。
このモデルはまた、放出動力学に関わる全ての遷移速度の確率間隔を決定できる。
我々はCdSeTe/CdSヘテロ構造の時間分解発光測定にこのモデルを適用した。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 08:14:51 GMT)
A Study on the Implementation Method of an Agent-Based Advanced RAG System Using Graph [0.0] 本研究では、グラフ技術に基づく高度なRAGシステムを実装し、高品質な生成AIサービスを開発する。
検索した情報の信頼性を評価するためにLangGraphを使用し、さまざまなデータを合成して、より正確で拡張されたレスポンスを生成する。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 09:03:36 GMT)
A Short Introduction to Quantum Computing for Physicists [0.0] 主な対象はプロの物理学者と物理学の上級学生であるが、技術者や計算機科学者もその恩恵を受けるかもしれない。
これらのノートは、既に量子力学の基礎知識を持っている人のために、量子計算と通信に関する標準的なトピックを紹介している。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 17:33:50 GMT)
A Monte Carlo Tree Search approach to QAOA: finding a needle in the haystack [0.0] 変分量子アルゴリズム(VQA)は、短期量子ハードウェアの限られた能力に対応するために設計された、ハイブリッド量子古典法の一種である。
本稿では,正規パラメータパターンの活用が決定木構造に深く影響し,フレキシブルかつノイズ耐性のある最適化戦略を可能にすることを示す。
論文参考訳(メタデータ) (Thu, 22 Aug 2024 18:00:02 GMT)