MM-Vet v2: A Challenging Benchmark to Evaluate Large Multimodal Models for Integrated Capabilities [146.5] MM-Vet v2は、"image-text sequence understanding"と呼ばれる新しい"image-text sequence understanding"機能を含んでいる。
MM-Vet v2を用いて大規模マルチモーダルモデルのベンチマークを行った結果,Claude 3.5 Sonnetはスコア71.8の最良のモデルであり,スコア71.0のGPT-4oより若干優れていた。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:59:54 GMT)
A Survey of Text Watermarking in the Era of Large Language Models [91.4] テキスト透かしアルゴリズムは、テキストコンテンツの著作権を保護するために不可欠である。
大規模言語モデル(LLM)の最近の進歩は、これらの技術に革命をもたらした。
本稿では,テキスト透かし技術の現状を包括的に調査する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:35:52 GMT)
Enabling High Data Throughput Reinforcement Learning on GPUs: A Domain Agnostic Framework for Data-Driven Scientific Research [90.9] 我々は、強化学習の適用において重要なシステムのボトルネックを克服するために設計されたフレームワークであるWarpSciを紹介する。
我々は、CPUとGPU間のデータ転送の必要性を排除し、数千のシミュレーションを同時実行可能にする。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 21:38:09 GMT)
AgentGen: Enhancing Planning Abilities for Large Language Model based Agent via Environment and Task Generation [89.7] LLM(Large Language Model)ベースのエージェントは注目され、ますます人気が高まっている。
本稿では,LLMの学習指導による計画能力の向上について検討する。
この制限に対処するために,多様な環境の自動合成と段階的な計画課題について検討する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:59:46 GMT)
Leveraging Weak Cross-Modal Guidance for Coherence Modelling via Iterative Learning [66.3] クロスモーダル・コヒーレンス・モデリングは、知的なシステムが情報を整理し構造化するのに不可欠である。
クロスモーダル・コヒーレンス・モデリングに関するこれまでの研究は、目標モーダルのコヒーレンス回復を支援するために、他のモーダルからの順序情報を活用することを試みた。
本報告では,コヒーレンシーに金のラベルを付けることなく,クロスモーダルガイダンスを活用する新しい手法について検討する。
論文参考訳(メタデータ) (Thu, 01 Aug 2024 06:04:44 GMT)
Contextual Bandits with Packing and Covering Constraints: A Modular Lagrangian Approach via Regression [65.9] 本稿では,線形制約付きコンテキスト帯域(CBwLC)について考察する。これは,アルゴリズムが全消費の線形制約を受ける複数のリソースを消費するコンテキスト帯域の変種である。
この問題はknapsacks (CBwK) を用いてコンテキスト的帯域幅を一般化し、制約のパッケージ化とカバー、および正および負のリソース消費を可能にする。
本稿では,回帰オラクルに基づくCBwLC(CBwK)のアルゴリズムについて述べる。このアルゴリズムは単純で,計算効率が良く,統計的に最適である。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:49:04 GMT)
GalleryGPT: Analyzing Paintings with Large Multimodal Models [65.0] 美術品の分析は、個人の審美性を豊かにし、批判的思考能力を促進することができる芸術鑑賞のための重要かつ基本的な技術である。
アートワークを自動解析する以前の作業は、主に分類、検索、その他の単純なタスクに焦点を当てており、AIの目標とは程遠い。
LLaVAアーキテクチャに基づいて微調整されたGalleryGPTと呼ばれる,絵画解析のための優れた大規模マルチモーダルモデルを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:52:56 GMT)
SAM 2: Segment Anything in Images and Videos [63.4] 本稿では,画像やビデオにおける迅速な視覚的セグメンテーションの解決に向けた基礎モデルであるセグメンション・エキシング・モデル2(SAM2)を提案する。
ユーザインタラクションを通じてモデルとデータを改善するデータエンジンを構築し、これまでで最大のビデオセグメンテーションデータセットを収集します。
我々のモデルは、リアルタイムビデオ処理のためのストリーミングメモリを備えたシンプルなトランスフォーマーアーキテクチャである。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:00:08 GMT)
M^2ConceptBase: A Fine-Grained Aligned Concept-Centric Multimodal Knowledge Base [61.5] 最初の概念中心型マルチモーダル知識ベース(MMKB)であるM2ConceptBaseを紹介する。
画像テキストデータセットのコンテキスト情報を用いて,概念イメージと概念記述ペアを協調するコンテキスト認識手法を提案する。
人間の研究は95%以上のアライメントの精度を確認し、その品質を裏付けている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:03:48 GMT)
LICM: Effective and Efficient Long Interest Chain Modeling for News Recommendation [59.4] ニュースレコメンデーション(licM)のための効率的かつ効率的な長鎖モデリング法を提案する。
licMは、近隣の関心と、グローバルなニュースクリックグラフから抽出したロングチェーンの関心を、類似のユーザのコラボレーションに基づいて組み合わせて、ニュースレコメンデーションを強化している。
実世界のデータセットによる実験結果から,提案モデルの有効性と有効性を検証し,ニュースレコメンデーションの性能を向上させる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:17:25 GMT)
Tamper-Resistant Safeguards for Open-Weight LLMs [57.9] オープンウェイトLLMにタンパ耐性保護具を組み込む方法を開発した。
本手法は良性を保持しながらタンパー抵抗を大幅に改善する。
以上の結果から, タンパー抵抗はトラクタブルな問題であることがわかった。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:59:12 GMT)
Switching the Loss Reduces the Cost in Batch (Offline) Reinforcement Learning [57.2] 本稿では,FQI-log を用いた準最適政策の学習に必要なサンプル数と,最適政策の累積コストについて述べる。
我々は,FQI-logが目標を確実に達成する問題に対して,2乗損失を訓練したFQIよりも少ないサンプルを用いていることを実証的に検証した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:02:06 GMT)
The Manga Whisperer: Automatically Generating Transcriptions for Comics [55.5] 我々は,パネル,テキストボックス,文字ボックスを検出可能な統一モデル Magi を提案する。
本稿では,検出したテキストボックスを読み順にソートし,対話文を生成する手法を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 05:18:48 GMT)
When AI Meets Finance (StockAgent): Large Language Model-based Stock Trading in Simulated Real-world Environments [55.2] LLMによって駆動される、StockAgentと呼ばれるマルチエージェントAIシステムを開発した。
StockAgentを使えば、ユーザーはさまざまな外部要因が投資家取引に与える影響を評価することができる。
AIエージェントに基づく既存のトレーディングシミュレーションシステムに存在するテストセットのリーク問題を回避する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:13:00 GMT)
Converging Paradigms: The Synergy of Symbolic and Connectionist AI in LLM-Empowered Autonomous Agents [54.2] コネクショニストと象徴的人工知能(AI)の収束を探求する記事
従来、コネクショナリストAIはニューラルネットワークにフォーカスし、シンボリックAIはシンボリック表現とロジックを強調していた。
大型言語モデル(LLM)の最近の進歩は、人間の言語をシンボルとして扱う際のコネクショナリストアーキテクチャの可能性を強調している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 02:29:50 GMT)
Large Language Models for Next Point-of-Interest Recommendation [53.9] 位置情報ベースのソーシャルネットワーク(LBSN)データは、しばしば次のPoint of Interest(POI)レコメンデーションタスクに使用される。
しばしば無視される課題の1つは、LBSNデータに存在する豊富なコンテキスト情報を効果的に利用する方法である。
本稿では,この課題に対処するために,LLM(Large Language Models)を用いたフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:54:15 GMT)
Navigating Text-to-Image Generative Bias across Indic Languages [53.9] 本研究ではインドで広く話されているIndic言語に対するテキスト・ツー・イメージ(TTI)モデルのバイアスについて検討する。
これらの言語における主要なTTIモデルの生成的パフォーマンスと文化的関連性を評価し,比較する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 04:56:13 GMT)
A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.3] コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:40:00 GMT)
Tails Tell Tales: Chapter-Wide Manga Transcriptions with Character Names [53.2] 本論文は,マンガ全章の対話書き起こしを完全自動生成することを目的とする。
i) 言っていることを識別し、各ページのテキストを検出し、それらが本質的か非本質的かに分類する。
また、章を通して同じ文字が一貫した名前で呼ばれることも保証している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 05:47:04 GMT)
Coarse Correspondence Elicit 3D Spacetime Understanding in Multimodal Language Model [52.3] マルチモーダル言語モデル(MLLM)は、現実の環境でますます実装されている。
その可能性にもかかわらず、現在のコミュニティ内のトップモデルは、空間的次元と時間的次元を十分に理解できないままです。
本稿では,3次元・時間的理解を喚起するための訓練不要,効果的,汎用的な視覚刺激法である粗対応について紹介する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:57:12 GMT)
Vivim: a Video Vision Mamba for Medical Video Segmentation [52.1] 本稿では、医用ビデオセグメンテーションタスクのためのビデオビジョンマンバベースのフレームワークVivimを提案する。
我々のビビムは、長期表現を様々なスケールのシーケンスに効果的に圧縮することができる。
超音波検査では甲状腺分節,乳房病変分節,大腸内視鏡検査ではポリープ分節が有効で有効であった。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:56:43 GMT)
MotionFix: Text-Driven 3D Human Motion Editing [52.1] 人間の3D動作を前提として,テキストに記述された編集動作を生成することが目的である。
課題には、トレーニングデータの欠如と、ソースの動きを忠実に編集するモデルの設計が含まれる。
我々は、ソースモーションの形でトリップレットのデータセットを半自動で収集する手法を構築し、(ii)ターゲットモーションと(iii)編集テキストを作成し、新しいMotionFixデータセットを作成する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:58:50 GMT)
Deepfake Media Forensics: State of the Art and Challenges Ahead [51.9] AIが生成する合成メディア、別名Deepfakesは、エンターテイメントからサイバーセキュリティまで、多くの領域に影響を与えている。
法医学的ディープフェイク技術の研究は、検出、属性と認識、受動的認証、現実的なシナリオにおける検出、アクティブ認証の5つの主要な領域を含んでいる。
本稿では,これらの課題に対処する主要なアルゴリズムについて,その利点,限界,今後の展望について検討する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:57:47 GMT)
Empowering Snapshot Compressive Imaging: Spatial-Spectral State Space Model with Across-Scanning and Local Enhancement [51.6] AsLE-SSMという,グローバルな局所的バランスの取れたコンテキストエンコーディングとチャネル間相互作用の促進に空間スペクトルSSMを用いる状態空間モデルを導入する。
実験の結果,ASLE-SSMは既存の最先端手法よりも優れており,推定速度はTransformerベースのMSTより2.4倍速く,パラメータの0.12(M)を節約できることがわかった。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:14:10 GMT)
Towards Certified Unlearning for Deep Neural Networks [50.8] 認定されていない未学習は、凸機械学習モデルで広く研究されている。
認定アンラーニングとディープニューラルネットワーク(DNN)のギャップを埋める手法をいくつか提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 21:22:10 GMT)
Optimizing Diffusion Models for Joint Trajectory Prediction and Controllable Generation [49.5] 拡散モデルは、自律運転における共同軌道予測と制御可能な生成を約束する。
最適ガウス拡散(OGD)と推定クリーンマニフォールド(ECM)誘導を導入する。
提案手法は生成過程の合理化を図り,計算オーバーヘッドを低減した実用的な応用を実現する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:59:59 GMT)
Towards Explainable and Interpretable Musical Difficulty Estimation: A Parameter-efficient Approach [49.3] 音楽コレクションの整理には曲の難易度を推定することが重要である。
シンボリックな音楽表現の難易度推定には説明可能な記述子を用いる。
ピアノレパートリーで評価したアプローチは,平均2乗誤差(MSE)が1.7。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:23:42 GMT)
Unsupervised Pairwise Causal Discovery on Heterogeneous Data using Mutual Information Measures [49.2] 因果発見(Causal Discovery)は、構成変数の統計的性質を分析することで、この問題に取り組む手法である。
教師付き学習によって得られたことに基づいて,現在の(おそらく誤解を招く)ベースライン結果に疑問を呈する。
その結果、堅牢な相互情報測定を用いて、教師なしの方法でこの問題にアプローチする。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:11:08 GMT)
Thermodynamic Roles of Quantum Environments: From Heat Baths to Work Reservoirs [49.2] 量子熱力学における環境は通常、熱浴の役割を担う。
同じモデルでは、環境が3つの異なる熱力学的役割を担っていることが示される。
環境の正確な役割は結合の強さと構造によって決定される。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:39:06 GMT)
DATENeRF: Depth-Aware Text-based Editing of NeRFs [49.1] 我々は、NeRFシーンの深度情報を利用して異なる画像に2D編集を分散する塗装手法を提案する。
以上の結果から,本手法は既存のテキスト駆動型NeRFシーン編集手法よりも,より一貫性があり,ライフライクで,詳細な編集が可能であることが判明した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:17:28 GMT)
Verification of Machine Unlearning is Fragile [48.7] 両タイプの検証戦略を回避できる2つの新しい非学習プロセスを導入する。
この研究は、機械学習検証の脆弱性と限界を強調し、機械学習の安全性に関するさらなる研究の道を開く。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 21:37:10 GMT)
Towards End-to-End Explainable Facial Action Unit Recognition via Vision-Language Joint Learning [48.7] 本稿では,AU認識のためのエンドツーエンドのビジョン・ランゲージ共同学習ネットワークを提案する。
提案手法は,ほとんどのメトリクスにおける最先端手法よりも優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:35:44 GMT)
An Empirical Analysis of Compute-Optimal Inference for Problem-Solving with Language Models [47.0] 計算最適推論について検討する:モデルと推論戦略を設計し、さらなる推論時間計算を最適にトレードオフし、性能を向上する。
新たな木探索アルゴリズムを用いたより小さな言語モデルでは,パレート・最適トレードオフが典型的に達成されることがわかった。
例えば,MATH500 上の Llemma-34B モデルと競合する精度を Llemma-7B モデルで実現できることを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:16:04 GMT)
DDU-Net: A Domain Decomposition-based CNN for High-Resolution Image Segmentation on Multiple GPUs [46.9] ドメイン分解に基づくU-Netアーキテクチャを導入し、入力イメージを重複しないパッチに分割する。
空間コンテキストの理解を高めるために、パッチ間情報交換を容易にするための通信ネットワークが追加される。
その結果、この手法は、パッチ間通信のない同一ネットワークと比較して、IoU(Universal over Union)スコアよりも2~3,%高い交点を達成できることが判明した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 01:59:58 GMT)
SentenceVAE: Faster, Longer and More Accurate Inference with Next-sentence Prediction for Large Language Models [46.6] 本稿では,エンコーダとデコーダからなる小型モデルであるSentenceVAEを紹介する。
エンコーダは文内の情報を特異トークンに凝縮し、デコーダは圧縮されたデータを元のセンテンシャル形式に再構成する。
その結果,SentenceVAEは推定速度を204365%向上し,PPL(Perplexity)を4675%削減し,メモリオーバーヘッドを8691%削減できることがわかった。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:45:19 GMT)
DisTrack: a new Tool for Semi-automatic Misinformation Tracking in Online Social Networks [46.4] DisTrackは、自然言語処理(NLP)ソーシャル・ネットワーク・アナリティクス(SNA)とグラフ視覚化を組み合わせることで、誤情報の拡散に対抗するように設計されている。
このツールは、デジタル環境に散在する誤報のダイナミックな性質を捉え、分析するために調整されている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:17:33 GMT)
Towards Physically Consistent Deep Learning For Climate Model Parameterizations [46.1] パラメータ化は、気候予測において、系統的なエラーと大きな不確実性の主な原因である。
深層学習(DL)に基づくパラメータ化は、計算に高価で高解像度のショートシミュレーションのデータに基づいて訓練されており、気候モデルを改善するための大きな可能性を示している。
本稿では,DLに基づくパラメータ化のための効率的な教師付き学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:29:42 GMT)
End-to-End Reinforcement Learning of Koopman Models for Economic Nonlinear Model Predictive Control [45.8] 本研究では, (e)NMPCの一部として最適性能を示すために, Koopman シュロゲートモデルの強化学習法を提案する。
エンドツーエンドトレーニングモデルは,(e)NMPCにおけるシステム識別を用いてトレーニングしたモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:41:27 GMT)
Textualized and Feature-based Models for Compound Multimodal Emotion Recognition in the Wild [45.3] マルチモーダルな大言語モデル(LLM)は、異なる非テクストのモダリティからテキストに変換される可能性のある明示的な非言語的手がかりに依存している。
本稿では,ビデオにおける複合マルチモーダルERのテキストと特徴に基づくアプローチの可能性について比較する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:51:26 GMT)
Decoder-only Architecture for Streaming End-to-end Speech Recognition [45.2] ブロックワイド自動音声認識(ASR)におけるデコーダのみのアーキテクチャを提案する。
提案手法では,ブロックワイズ音声サブネットワークを用いて,CTC出力とコンテキスト埋め込みを用いて音声特徴を圧縮し,デコーダのプロンプトとして順次提供する。
提案するデコーダのみのストリーミングASRは,ベースラインモデルの2倍の速度で,LibriSpeechテストの他セットの単語誤り率を8%削減する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:55:54 GMT)
Low energy excitations in bosonic quantum quasicrystals [45.0] ボソニック自己組織結晶に対する低エネルギー有効作用の第一原理を提示する。
我々の一般化された弾力性アプローチは、相と共役の量子密度の次数-自由度を適切に保持する。
量子準結晶相を制限する低密度および高密度相転移における各励起モードの運命について論じる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:25:25 GMT)
Improving entanglement purification through coherent superposition of roles [45.0] 量子通信技術の潜在能力を最大限活用するためには、絡み合いの浄化と蒸留プロトコルが不可欠である。
本稿では, 密閉状態の役割を密着した重畳を利用して, 密閉状態の浄化効率を向上する, 新規な密閉浄化設計戦略を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:00:52 GMT)
Sentence-wise Speech Summarization: Task, Datasets, and End-to-End Modeling with LM Knowledge Distillation [44.3] Sen-SSumは文単位で音声文書からテキスト要約を生成する。
We present two datasets for Sen-SSum: Mega-SSum and CSJ-SSum。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 00:18:21 GMT)
Inducing Generalization across Languages and Tasks using Featurized Low-Rank Mixtures [44.0] Featurized Low-rank Mixtures (FLix) はマルチタスク多言語適応のための新しいPEFT法である。
FLixは、データセットの言語やタスクなど、それぞれのユニークなデータセット機能と、独自の低ランクの重み更新パラメータを関連付ける。
実験の結果,FLixは教師付き学習とゼロショット設定の両方において,様々なタスクに対して大幅な改善をもたらすことがわかった。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 05:52:51 GMT)
Improving Retrieval-Augmented Generation in Medicine with Iterative Follow-up Questions [42.7] i-MedRAGは、過去の情報検索の試みに基づいてフォローアップクエリを反復的に要求するシステムである。
ゼロショットのi-MedRAGは、GPT-3.5上で既存のプロンプトエンジニアリングと微調整の方法をすべて上回ります。
ケーススタディでは,i-MedRAG が追従クエリを柔軟に問合せして推論連鎖を形成できることが示されている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:18:17 GMT)
Classification of joint quantum measurements based on entanglement cost of localization [42.7] 本稿では,絡み合いコストに基づく関節計測の体系的分類を提案する。
数値的に高次元を探索し、高次元と多部構成への一般化を構築する方法について述べる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:00:01 GMT)
SynesLM: A Unified Approach for Audio-visual Speech Recognition and Translation via Language Model and Synthetic Data [42.5] 我々は3つのマルチモーダル言語理解タスクを実行できる統一モデルであるSynesLMを提案する。
ゼロショットのAV-ASRでは、SynesLMはワードエラー率(WER)を43.4%から39.4%に下げることでSOTAのパフォーマンスを達成した。
VSTとVMTの成績は,VSTの37.2からBLEUスコアを43.5,VMTの54.4から54.8に改善した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:09:32 GMT)
A dual-task mutual learning framework for predicting post-thrombectomy cerebral hemorrhage [42.2] 患者の初回CT検査のみを用いて術後脳出血を計測するための新しい予測枠組みを提案する。
本手法では, 最新診断法よりも追跡CTの精度が向上し, 追跡診断ラベルの精度が86.37%向上した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 22:08:52 GMT)
A causal intervention framework for synthesizing mobility data and evaluating predictive neural networks [42.2] 本研究では,次の位置予測のために設計されたニューラルネットワークに対する移動関連因子の影響を評価するための因果介入フレームワークを提案する。
移動行動の異なる位置列を生成し、多様な空間的・時間的変化のシミュレーションを容易にする。
このフレームワークは、モビリティアプリケーションにおけるニューラルネットワークの解釈可能性と堅牢性を高めるために、因果推論の使用を促進することが期待されている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:37:13 GMT)
Modelling Assessment Rubrics through Bayesian Networks: a Pragmatic Approach [40.1] 本稿では,学習者モデルを直接評価ルーリックから導出する手法を提案する。
本稿では,コンピュータ思考のスキルをテストするために開発された活動の人的評価を自動化するために,この手法を適用する方法について述べる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:12:14 GMT)
Untangling the Effects of Down-Sampling and Selection in Genetic Programming [40.1] 遺伝的プログラミングシステムは、選択のための候補解の品質を評価するために、しばしば大きなトレーニングセットを使用する。
近年の研究では、ランダム・ダウンサンプリングとインフォメーション・ダウンサンプリングの両方が問題解決の成功を大幅に改善できることが示されている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:13:42 GMT)
SynthVLM: High-Efficiency and High-Quality Synthetic Data for Vision Language Models [39.6] 視覚大言語モデル(VLLM)のための新しいデータ合成パイプラインであるSynthVLMを紹介する。
画像からキャプションを生成する既存の方法とは異なり、SynthVLMは高度な拡散モデルと高品質なキャプションを使用して、キャプションから高解像度の画像を自動的に生成し、選択する。
我々は、様々な視覚的質問応答タスクにおける最先端(SoTA)のパフォーマンスを達成し、高いアライメント品質を維持し、高度な言語能力を維持する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 04:01:39 GMT)
KeyVideoLLM: Towards Large-scale Video Keyframe Selection [38.4] KeyVideoLLMは、ビデオLLMデータを効率的に管理するためのテキストフレーム類似性に基づく選択方法である。
データ圧縮速度は最大60.9倍に向上し、ディスクスペースの要求を大幅に低減する。
既存の選択方法と比較して、処理速度を最大200倍に向上させる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:08:43 GMT)
CIResDiff: A Clinically-Informed Residual Diffusion Model for Predicting Idiopathic Pulmonary Fibrosis Progression [38.1] 特発性肺線維症(IPF)は患者の死亡率に大きく相関する。
現在の臨床基準では1年間隔で2回のCT検査を必要とする疾患の進行を規定している。
そこで我々は, 患者のCT画像からIPFの進行を正確に予測する新しい拡散モデルを開発した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 22:01:42 GMT)
OmniParser for Pure Vision Based GUI Agent [37.9] 複数のオペレーティングシステムの汎用エージェントとしてGPT-4Vのようなパワーマルチモーダルモデルは、堅牢なスクリーン解析技術が欠如しているため、大部分は過小評価されている。
textsc OmniはScreenSpotベンチマークでGPT-4Vのパフォーマンスを大幅に改善した。
textsc Omni スクリーンショットは GPT-4V ベースラインを上回り、スクリーンショット以外の追加情報を必要とする。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 00:00:43 GMT)
SF3D: Stable Fast 3D Mesh Reconstruction with UV-unwrapping and Illumination Disentanglement [37.6] SF3Dは,単一画像から0.5秒で高速かつ高品質なテクスチャ化されたオブジェクトメッシュ再構成手法である。
実験では、既存の技術よりもSF3Dの方が優れた性能を示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:41:57 GMT)
Hierarchically Structured Neural Bones for Reconstructing Animatable Objects from Casual Videos [37.5] カジュアルなビデオを用いて任意のオブジェクトの3Dモデルを作成し,操作するための新しいフレームワークを提案する。
我々の中核となる要素は、木構造骨で物体の動きをキャプチャする新しい変形階層モデルである。
筆者らのフレームワークは,(1) 任意のオブジェクトのアニマタブルな3Dモデルを得ることができ,(2) ユーザは最小限のコストで直感的に3Dモデルを操作でき,(3) ユーザーは必要に応じてインタラクティブに制御ポイントを追加・削除することができる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:42:45 GMT)
Pistis-RAG: A Scalable Cascading Framework Towards Trustworthy Retrieval-Augmented Generation [36.5] Pistis-RAGは、大規模検索拡張生成(RAG)システムの課題に対処するために設計されたスケーラブルなマルチステージフレームワークである。
私たちのフレームワークは、マッチング、序列、ランク付け、推論、集約という、異なるステージで構成されています。
我々の新しいランキングステージは、情報検索の原則を取り入れたRAGシステムに特化して設計されている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 06:56:15 GMT)
The Devil is in the Statistics: Mitigating and Exploiting Statistics Difference for Generalizable Semi-supervised Medical Image Segmentation [36.5] この課題に対処するために、半教師付きドメインの一般化が提案されている。
医療機関間のドメインシフトが、異なる特徴統計を引き起こすことを観察する。
この現象は、目に見えない領域の一般化を促進するために利用することができる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:58:29 GMT)
Mitigating Multilingual Hallucination in Large Vision-Language Models [35.8] 大規模視覚言語モデル(LVLM)のための2段階多言語幻覚除去(MHR)フレームワークを提案する。
多言語リソースの複雑な手動アノテーションに頼る代わりに,新しい言語間アライメント手法を提案する。
当社のフレームワークは,13言語で平均19.0%の精度向上を実現しています。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:34:35 GMT)
UniMoT: Unified Molecule-Text Language Model with Discrete Token Representation [35.5] トークン化アーキテクチャを採用した統一分子テキストLLMであるUniMoTを紹介する。
ベクトル量子化駆動型トークン化器は、分子を因果依存性を持つ分子トークンの配列に変換する。
UniMoTは、分子間テキストとテキスト間タスクの両方を実行するマルチモーダル・ジェネラリストとして登場した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:31:31 GMT)
Temporally Disentangled Representation Learning under Unknown Nonstationarity [35.2] 我々は、時間遅れの潜伏因果変数を再構成するために、原則的推定フレームワークNCTRLを導入する。
経験的評価は、時間遅れの潜伏因果関係の信頼性を実証した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:43:57 GMT)
Task-Adapter: Task-specific Adaptation of Image Models for Few-shot Action Recognition [34.9] 簡単なタスク固有適応法(Task-Adapter)を提案する。
提案したTask-Adapterをバックボーンの最後のいくつかのレイヤに導入することで、フル微調整によるオーバーフィッティング問題を軽減します。
実験結果から,提案したタスクアダプタが標準の4つのアクション認識データセットに対して有効であることを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 03:06:56 GMT)
Utilizing Quantum Processor for the Analysis of Strongly Correlated Materials [34.6] 本研究では,従来の量子クラスター法を量子回路モデルに適用することにより,強い相関関係を解析するための体系的アプローチを提案する。
我々は、クラスタのグリーン関数を計算するためのより簡潔な公式を開発し、複雑な演算ではなく、量子回路上の実数計算のみを必要とする。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 06:11:18 GMT)
You Can't Ignore Either: Unifying Structure and Feature Denoising for Robust Graph Learning [34.5] 我々は、構造と特徴のデッドロックを解き放つために、統一グラフ復調(UGD)フレームワークを開発する。
具体的には、ノイズエッジを認識するために、高次近傍評価法を提案する。
また,グラフオートエンコーダをベースとした,ノイズの多い特徴の再現も提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:43:55 GMT)
An AI-Enabled Framework Within Reach for Enhancing Healthcare Sustainability and Fairness [34.5] 視覚生理学的モニタリング技術を利用したカメラベースの公衆衛生(CBPH)フレームワークを提案する。
CBPHは、国連持続可能な開発目標を推進し、公衆衛生のための便利で普遍的な枠組みと見なすことができる。
CBPHは、大規模で人間中心の医療データベースを構築するための包括的なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:57:28 GMT)
DiscipLink: Unfolding Interdisciplinary Information Seeking Process via Human-AI Co-Exploration [34.2] 本稿では,研究者と大規模言語モデル(LLM)の協調を支援する対話型システムであるDiscipLinkを紹介する。
ユーザの関心事に基づいて、DiscipLinkは、関連する研究分野の観点から探索的な質問を開始する。
本評価は, 対象内比較実験とオープンエンド探索研究からなり, ディシプリンクは, 学際境界を断ち切る上で, 研究者を効果的に支援できることを示した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:36:00 GMT)
SaludConectaMX: Lessons Learned from Deploying a Cooperative Mobile Health System for Pediatric Cancer Care in Mexico [33.9] SaludConectaMXは、メキシコのがん患児に対する化学療法を通しての合併症の要因を追跡し、理解するための総合的なシステムである。
本システムは,Webアプリケーション(病院職員用)とモバイルアプリケーション(家族介護者用)から構成される。
本稿では,1.5年間のパイロット実験によるシステム設計およびユーザビリティ評価結果について述べる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 19:13:49 GMT)
Revocable Backdoor for Deep Model Trading [33.9] 本稿では,新しい回避可能なバックドアとディープモデルトレーディングシナリオを提案する。
パフォーマンスを損なうことなく、ディープモデルを妥協することを目指しています。
毒性のあるモデルを再訓練することなく容易に解毒できる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 03:27:48 GMT)
Diff3DETR:Agent-based Diffusion Model for Semi-supervised 3D Object Detection [33.6] 3次元物体検出は3次元シーンの理解に不可欠である。
半教師付き手法の最近の発展は、教師による学習フレームワークを用いて、未ラベルの点群に対する擬似ラベルを生成することにより、この問題を緩和しようとしている。
半教師付き3次元物体検出のためのエージェントベース拡散モデル(Diff3DETR)を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 05:04:22 GMT)
KRF: Keypoint Refinement with Fusion Network for 6D Pose Estimation [33.2] そこで本研究では,6次元ポーズ推定のための新しいポーズ改善パイプラインであるPoint Cloud Completion and Keypoint Refinement with Fusion Data (PCKRF)を提案する。
PCKRFパイプラインは、フルフロー双方向融合ネットワークのような、既存の一般的な6Dポーズ推定手法と統合することができる。
提案手法は,初期ポーズを比較的高精度に最適化する場合に,既存手法と比較して優れた安定性を示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 06:02:27 GMT)
Low-Power Vibration-Based Predictive Maintenance for Industry 4.0 using Neural Networks: A Survey [33.1] 本稿では,予測保守のための振動センサデータの低消費電力オンデバイス計算のためのニューラルネットワークの可能性について検討する。
予測メンテナンスタスクでニューラルネットワークを評価するのに十分な標準ベンチマークデータセットは存在しない。
我々は、低消費電力の予測保守アプリケーションのためのニューラルネットワークのハードウェア実装に関する将来の研究の必要性を強調した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:46:37 GMT)
On the Relationship Between Monotone and Squared Probabilistic Circuits [32.4] InceptionPCsはモノトーン回路と2乗回路の両方を特別に含む新しいタイプの回路である。
InceptionPCは画像データセット上でモノトーン回路と正方形回路の両方より優れていることを実証的に検証する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:56:08 GMT)
PrivateGaze: Preserving User Privacy in Black-box Mobile Gaze Tracking Services [32.2] PrivateGazeは、ブラックボックスの視線追跡サービスにおいて、ユーザのプライバシを効果的に保護する最初のアプローチである。
本研究では,顔画像から難読化画像に変換するプライバシー保護者を訓練するための新しい枠組みを提案する。
難読化画像は、本人性や性別などの個人情報を、不正な分類から保護することができることを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 23:11:03 GMT)
EmoTalk3D: High-Fidelity Free-View Synthesis of Emotional 3D Talking Head [30.1] 本稿では,3次元音声頭部を制御可能な感情で合成する新しい手法を提案する。
本モデルでは,生成した音声の感情を制御可能とし,広視野で表現することができる。
実験により,高忠実度・感情制御可能な3次元音声頭部の創出におけるアプローチの有効性を実証した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 05:46:57 GMT)
DriveArena: A Closed-loop Generative Simulation Platform for Autonomous Driving [30.0] DriveArenaは、実際のシナリオをナビゲートするエージェントを駆動するために設計された、高忠実なクローズドループシミュレーションシステムである。
グローバルなストリートマップ上で現実的なトラフィックフローを生成することのできる交通シミュレータであるTraffic Managerと、無限の自己回帰を持つ高忠実な条件生成モデルであるWorld Dreamerが特徴である。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:32:01 GMT)
AlignRec: Aligning and Training in Multimodal Recommendations [30.0] マルチモーダル・レコメンデーションは 相互作用を超えて 豊かなコンテキストを活用できる
既存の手法では、主に多モーダル情報を補助的なものとみなし、それを用いてIDの特徴を学習する。
マルチモーダルコンテンツの特徴とIDベースの特徴の間にはセマンティックなギャップがあり、それによってユーザやアイテムの表現の誤調整につながる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 03:32:49 GMT)
Adaptive Self-training Framework for Fine-grained Scene Graph Generation [29.4] シーングラフ生成(SGG)モデルは、ベンチマークデータセットに関する固有の問題に悩まされている。
SGG (ST-SGG) のための自己学習フレームワークを導入し, 注釈のない三つ子に擬似ラベルを割り当てる。
各種SGGモデルにおけるST-SGGの有効性を検証する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 03:57:24 GMT)
Open-Set Video-based Facial Expression Recognition with Human Expression-sensitive Prompting [28.7] 本稿では,未知の表情と未知の表情の両方を識別することを目的とした,オープンセット映像に基づく表情認識タスクを提案する。
既存のアプローチでは、CLIPのような大規模な視覚言語モデルを使用して、目に見えないクラスを特定する。
本稿では,CLIPの映像ベース表情詳細を効果的にモデル化する能力を大幅に向上させる新しいHuman Expression-Sensitive Prompting(HESP)機構を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 06:46:04 GMT)
Augmenting Channel Simulator and Semi- Supervised Learning for Efficient Indoor Positioning [28.6] 本研究は,屋内位置決めにおける労働集約的・資源消費的課題に,効率的なアプローチを提案することを目的としている。
提案手法は、ラベル付きとラベルなしの両方のチャネルデータを効果的に活用する、バイアス付き教師アルゴリズム(SSLB)による半教師付き学習(SSL)の導入を含む。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:06:02 GMT)
Generalized Kernel Thinning [27.4] Dwivedi and Mackeyのカーネルスライニングアルゴリズム(2021年)
我々は、ターゲットRKHSに直接適用されるKTが、任意のカーネルに対してより厳密で次元に依存しない保証を与えることを示す。
我々は、KT が分数核を持つと、非滑らかなカーネルに対してモンテカルロ MMD の保証がより良くなることを証明した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 01:49:47 GMT)
Rapid and Power-Aware Learned Optimization for Modular Receive Beamforming [27.1] マルチインプット・マルチアウトプット(MIMO)システムは無線通信技術において重要な役割を果たす。
モジュールハイブリッドシステムにおけるビームフォーミングのための電力指向最適化アルゴリズムを提案する。
低分解能位相シフトによる計算の高速化を通じて、学習者によって効率の良いビームフォーミングがいかに促進されるかを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:19:25 GMT)
From Unsupervised to Few-shot Graph Anomaly Detection: A Multi-scale Contrastive Learning Approach [27.0] グラフデータからの異常検出は、ソーシャルネットワーク、金融、eコマースなど、多くのアプリケーションにおいて重要なデータマイニングタスクである。
マルチスケールcONtrastive lEarning(略してANEMONE)を用いた新しいフレームワーク, graph Anomaly dEtection フレームワークを提案する。
グラフニューラルネットワークをバックボーンとして、複数のグラフスケール(ビュー)から情報をエンコードすることで、グラフ内のノードのより良い表現を学習する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 01:42:10 GMT)
VecAug: Unveiling Camouflaged Frauds with Cohort Augmentation for Enhanced Detection [26.4] 既存の不正検出方法は、グラフベースまたはシーケンスベースアプローチに依存している。
VecAugは、新しいコホート強化学習フレームワークである。
当社のフレームワークをeコマースプラットフォーム上に展開し、3つの不正検出データセットで評価する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:39:27 GMT)
High Performance Im2win and Direct Convolutions using Three Tensor Layouts on SIMD Architectures [26.1] 本稿では, NHWC, CHWN, CHWN8の3つの新しいデータレイアウトを提案する。
我々は、SIMDマシン上の最適化したim2win畳み込みとPyTorchのim2colベースの畳み込みを比較した。
最適化した im2win と direct の畳み込みは, 機械の最大性能の95% と 94% をそれぞれ達成した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 04:37:03 GMT)
Lost in Translation: Latent Concept Misalignment in Text-to-Image Diffusion Models [25.9] テキスト・ツー・イメージの拡散モデルは、しばしばテキストと画像のミスアライメント問題に遭遇する。
我々は拡散モデルの潜在意味論をテキストプロンプトに整合させる自動パイプラインを開発する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 01:54:17 GMT)
Head360: Learning a Parametric 3D Full-Head for Free-View Synthesis in 360° [25.9] アーティストが設計した高忠実度頭部のデータセットを構築し,それを用いた新しいパラメトリック頭部モデルを提案する。
本手法は,従来のパラメトリック3Dメッシュモデルと付加された神経テクスチャで表される顔の動き・形状・顔の外観を分離する。
実験により、パラメトリック空間では顔の動きや外観がうまく絡み合っていることが示され、SOTAのレンダリングとアニメーション品質が向上した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 05:46:06 GMT)
Towards Assessing Data Replication in Music Generation with Music Similarity Metrics on Raw Audio [25.3] データ複製を評価するために,様々なオーディオ音楽類似度指標に基づくモデル非依存のオープン評価手法を提案する。
提案手法は,10%以上の比率で正確なデータ複製を推定できることを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:16:30 GMT)
GRU-Net: Gaussian Attention Aided Dense Skip Connection Based MultiResUNet for Breast Histopathology Image Segmentation [24.9] 本稿では病理組織像分割のためのMultiResU-Netの修正版を提案する。
複雑な機能を複数のスケールで分析し、セグメント化できるため、バックボーンとして選択される。
乳がんの病理組織像データセットの多様性について検討した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:55:49 GMT)
Improving Steering and Verification in AI-Assisted Data Analysis with Interactive Task Decomposition [24.8] LLMを利用するChatGPT Data Analysisのようなツールは、ユーザがデータ分析プログラミングの難しいタスクに取り組むのに役立つ可能性がある。
しかし、私たちのフォーマティブな研究は、AI生成結果の検証とAIの運営において深刻な課題を明らかにしました。
これらの課題に対処する2つの対照的なアプローチを開発した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:56:00 GMT)
Towards Reliable Advertising Image Generation Using Human Feedback [24.8] 生成した画像を自動的に検査するマルチモーダル信頼フィードバックネットワーク(RFNet)を提案する。
生産効率をさらに高めるため, 革新的一貫性条件正則化を用いた微調整拡散モデルを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:39:27 GMT)
Technical Note: Defining and Quantifying AND-OR Interactions for Faithful and Concise Explanation of DNNs [24.1] 我々は、入力変数間の符号化された相互作用を定量化し、ディープニューラルネットワーク(DNN)を説明することを目的とする。
具体的には、まず相互作用の定義を再考し、次に相互作用に基づく説明に対する忠実さと簡潔さを正式に定義する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:54:29 GMT)
Self-Supervised Learning Based Handwriting Verification [24.0] ResNetベースの変分オートエンコーダ(VAE)は76.3%の精度で他の生成手法よりも優れていることを示す。
著者検証の下流作業にVAEとVICRegを併用し,ResNet-18の教師付きベースラインを10%のライターラベルで比較したところ,精度は6.7%,9%向上した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:43:19 GMT)
DPIS: An Enhanced Mechanism for Differentially Private SGD with Importance Sampling [23.9] ディファレンシャルプライバシ(DP)は、プライバシ保護の十分に受け入れられた標準となり、ディープニューラルネットワーク(DNN)は、機械学習において非常に成功した。
この目的のための古典的なメカニズムはDP-SGDであり、これは訓練に一般的に使用される勾配降下(SGD)の微分プライベートバージョンである。
DPISは,DP-SGDのコアのドロップイン代替として使用できる,微分プライベートなSGDトレーニングのための新しいメカニズムである。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 05:09:34 GMT)
Feedback-Driven Automated Whole Bug Report Reproduction for Android Apps [23.5] ReBLは、Androidのバグレポートを再現するための、フィードバック駆動のアプローチである。
従来のステップバイステップのエンティティマッチングアプローチよりも柔軟でコンテキスト対応です。
非クラッシュな機能的なバグレポートを処理できる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:32:12 GMT)
Spectral-Spatial Mamba for Hyperspectral Image Classification [23.2] スペクトル空間マンバ(SS-Mamba)は高スペクトル画像(HSI)分類に適用される。
提案されたSS-マンバは、主にスペクトル空間トークン生成モジュールと、いくつかの積層スペクトル空間マンバブロックから構成される。
広く利用されているHSIデータセットを用いた実験結果から,提案モデルが競合する結果が得られることが明らかになった。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:04:39 GMT)
Deblurring Neural Radiance Fields with Event-driven Bundle Adjustment [23.2] 本稿では,学習可能なポーズとNeRFパラメータを協調的に最適化するために,Bundle Adjustment for Deblurring Neural Radiance Fields (EBAD-NeRF)を提案する。
EBAD-NeRFは露光時間中に正確なカメラ軌跡を得ることができ、従来よりもシャープな3D表現を学習することができる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:14:17 GMT)
Lite-Mind: Towards Efficient and Robust Brain Representation Network [23.1] Lite-Mindは離散周波数変換(DFT)に基づく軽量で効率的で堅牢な脳表現学習パラダイムである
我々は、Lite-Mindが被写体1のNSDデータセットに対して94.6%のfMRI-to-image検索精度を実現し、MindEyeよりも98.7%少ないパラメータを持つことを示した。
Lite-Mindはまた、より小さなfMRIデータセットに移行できることが証明されており、GODデータセット上でゼロショット分類のための新しい最先端技術を確立している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:29:47 GMT)
Text Image Inpainting via Global Structure-Guided Diffusion Models [22.9] 現実世界のテキストは、環境や人為的な要因によって引き起こされる腐食問題によって損傷を受けることがある。
現在の塗装技術は、しばしばこの問題に適切に対処するのに失敗する。
我々は,新たなニューラルネットワークフレームワークであるGlobal Structure-Guided Diffusion Model (GSDM) を潜在的ソリューションとして開発する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:46:43 GMT)
Autonomous LLM-Enhanced Adversarial Attack for Text-to-Motion [22.7] テキスト・トゥ・モーション(T2M)モデルはテキスト・プロンプトからリアルな動きを生成する。
T2Mへの関心が高まったが、敵の攻撃からこれらのモデルを保護することに焦点を当てる手法はほとんどなかった。
ALERT-Motionは,ブラックボックスT2Mモデルに対する敵攻撃を標的とする自律的フレームワークである。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:44:11 GMT)
KGLens: Towards Efficient and Effective Knowledge Probing of Large Language Models with Knowledge Graphs [22.5] 大きな言語モデル(LLMs)は事実を幻覚させるが、キュレートされた知識グラフ(KGs)は一般的に事実に信頼性がある。
KGsとLLMsのアライメントを測定することで、その事実を効果的に調査し、LLMsの知識盲点を特定することができる。
我々は、KGsとLLMsのアライメントを効果的かつ効率的に測定することを目的とした、トンプソンにインスパイアされたフレームワークであるKGLensを紹介する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 03:19:03 GMT)
DNTextSpotter: Arbitrary-Shaped Scene Text Spotting via Improved Denoising Training [22.4] 任意のテキストスポッティングのための新しいDenoising Training(DNTextSpotter)を提案する。
DNTextSpotterは、denoising部のクエリをノイズのある位置クエリとノイズのあるコンテンツクエリに分解する。
4つのベンチマークで最先端の手法よりも優れています。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:52:07 GMT)
Harnessing Uncertainty-aware Bounding Boxes for Unsupervised 3D Object Detection [22.3] 教師なしの3Dオブジェクト検出は、LiDARポイントのようなラベル付けされていない生データから興味のあるオブジェクトを識別することを目的としている。
最近のアプローチでは、クラスタリングアルゴリズムから擬似3Dバウンディングボックス(3D bbox)を採用してモデルトレーニングを初期化し、擬似ラベルと訓練されたモデルの両方を反復的に更新する。
疑似bboxの悪影響を軽減するための新しい不確実性認識フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:01:07 GMT)
MimiQ: Low-Bit Data-Free Quantization of Vision Transformers with Encouraging Inter-Head Attention Similarity [22.1] データフリー量子化(DFQ)は、元のトレーニングデータなしで、しばしば合成データセットを通じて、フル精度のネットワークから軽量なネットワークを作成するテクニックである。
視覚変換器(ViT)アーキテクチャにはいくつかのDFQ法が提案されているが、低ビット設定では有効性は得られていない。
そこで我々は,視覚障害者を対象とした新しいDFQ手法であるMimiQを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:13:45 GMT)
Narrowing the Knowledge Evaluation Gap: Open-Domain Question Answering with Multi-Granularity Answers [21.8] 本稿では,複数粒度回答の集合に対する精度と情報性の観点から,予測された回答を評価できる新しい評価手法を提案する。
実験の結果, 標準復号化を伴う大規模言語モデルでは, しばしば誤解となるような特定の解を生成する傾向が示された。
多粒度回答で評価すると、DRAGは平均で20ポイント近く精度が上昇し、希少物質はさらに増加する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 06:23:58 GMT)
Are Bigger Encoders Always Better in Vision Large Models? [21.8] マルチモーダルな大言語モデル (MLLM) は、現実世界の応用において大きな可能性を示している。
現在の主流パラダイム下での視覚言語モデル(VLM)のスケーリング傾向は、広く研究されていない。
我々は,異なるエンコーダサイズと大言語モデル(LLM)サイズを用いて,MLLMの事前学習段階の実験を行う。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:05:42 GMT)
Distilling Mathematical Reasoning Capabilities into Small Language Models [21.8] 本研究は,その数学的推論能力をサブビリオンパラメータ(SLM)に圧縮することにより,先進大言語モデル(LLM)の民主化という課題に対処する。
EoTD(Equation-of-Thought Distillation, EoTD)は, 理論過程を方程式ベース表現にカプセル化し, 微調整SLMのためのEoTDデータセットを構築する手法である。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 04:03:32 GMT)
Adversarial Text Rewriting for Text-aware Recommender Systems [21.7] アイテム記述への依存は、eコマースプラットフォーム上での敵の売り手による操作に対して、レコメンデーターシステムに脆弱性をもたらすと論じる。
本稿では,テキスト認識レコメンデータシステムに対する新たなテキスト書き換えフレームワークを提案する。
本研究は,人的評価者から現実的と認識されつつも,販売者が不当に商品を上乗せするために書き直し攻撃を活用できることを実証する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 06:14:42 GMT)
Alleviating Hallucination in Large Vision-Language Models with Active Retrieval Augmentation [21.3] 本稿では,幻覚に対処するための新しいフレームワークであるActive Retrieval-Augmented Large Vision-Language Model(ARA)を紹介する。
実験により, 適応した検索機構とタイミングを加味することにより, 幻覚の問題を効果的に緩和できることが示唆された。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:38:58 GMT)
ADBM: Adversarial diffusion bridge model for reliable adversarial purification [21.3] 近年,拡散型浄化法(DiffPure)は,敵の事例に対する効果的な防御法として認識されている。
DiffPureは, 元の事前学習拡散モデルを用いて, 逆流浄化を最適に行う。
本稿では,ADBMと呼ばれる新しいAdrialversa Diffusion Bridge Modelを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 06:26:05 GMT)
Grasp, See and Place: Efficient Unknown Object Rearrangement with Policy Structure Prior [21.2] ロボットがオブジェクトをRGB-D画像で指定された目標設定に再構成することを想定する、未知のオブジェクト再構成のタスクに焦点をあてる。
近年の研究では、学習に基づく知覚モジュールを組み込んだ未知の物体再構成システムについて検討している。
本稿では,結合構造を持つ二重ループシステム GSP を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:31:00 GMT)
A Policy-Gradient Approach to Solving Imperfect-Information Games with Iterate Convergence [21.2] 政策勾配法は, シングルエージェント強化学習ツールボックスの基盤となっている。
政策勾配法が自己プレイにおける正規化ナッシュ均衡に証明可能なベストイテレート収束をもたらすことを初めて示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:54:01 GMT)
A new approach for encoding code and assisting code understanding [21.0] GPTは、タスクや出力のグローバルな理解なしに、次の単語を生成する局所的で欲求的なプロセスに依存している。
我々は、次の単語予測パラダイムを超えて、コード理解のための新しいパラダイムを提案する。
我々は、そのコードを、画像とタンパク質構造の両方を模倣するグローバル情報の記憶を持つ異種画像パラダイムとしてエンコードする。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:52:48 GMT)
In-Context Example Selection via Similarity Search Improves Low-Resource Machine Translation [20.7] 機械翻訳(MT)は、テキスト内翻訳の例から恩恵を受けることが示されているタスクである。
サンプルの選択方法に関する体系的な研究は発表されておらず、類似性に基づく選択の有用性について混合の結果が報告されている。
文の埋め込み類似性は,特に低リソース言語方向においてMTを改善することができる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:07:32 GMT)
Genetic Algorithms with Neural Cost Predictor for Solving Hierarchical Vehicle Routing Problems [20.7] 車両の経路決定が高次決定と連動する場合、結果の最適化問題は計算に重大な課題をもたらす。
本稿では,ニューラルコスト予測器を用いた遺伝的アルゴリズム(GANCP)という,ディープラーニングに基づく新しいアプローチを提案する。
特に,提案するニューラルネットワークは,静電容量化車両ルーティング問題を解決するHGS-CVRPオープンソースパッケージの目的値について学習する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:37:22 GMT)
Discretizing Continuous Action Space with Unimodal Probability Distributions for On-Policy Reinforcement Learning [20.5] ポアソン確率分布を用いて離散的なポリシーを一元的に制約する素直なアーキテクチャを導入する。
本研究では, 単調な確率分布を持つ離散ポリシーが, オンライン強化学習アルゴリズムにおいて, より高速な収束と高い性能をもたらすことを示す実験を行った。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 06:06:53 GMT)
CERT-ED: Certifiably Robust Text Classification for Edit Distance [19.7] 我々は、ランダム化された削除(Huang et al., 2023)を適用し、自然言語分類のためのCERT-ED(CERTified Edit Distance Defense)を提案する。
5つのダイレクトおよび5つの転送攻撃を含む様々な脅威モデルをカバーすることにより、50設定中38の試験的堅牢性を向上する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:20:24 GMT)
IN-Sight: Interactive Navigation through Sight [19.6] IN-Sightは自己監督型パスプランニングの新しいアプローチである。
可逆性のスコアを計算し、セマンティックマップに組み込む。
障害物を正確に回避するために、IN-Sightはローカルプランナーを使用している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:27:54 GMT)
DefInt: A Default-interventionist Framework for Efficient Reasoning with Hybrid Large Language Models [19.5] 我々は,ハイブリッド大規模言語モデル(LLM)の相乗的ポテンシャルを解き放つために,デフォルト・インターベンショニスト・フレームワーク(DefInt)を提案する。
Defintは、最先端の推論精度とソリューションの多様性を一貫して達成する。
トークンのコストは第2の正確なベースラインに比べて49%-79%削減される。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:46:54 GMT)
Online Detection of Anomalies in Temporal Knowledge Graphs with Interpretability [19.5] AnoTは時間知識グラフにおけるオンライン異常検出の解釈に適した効率的なTKG要約法である。
4つの実世界のデータセットの実験結果は、AnoTが既存の手法を精度と相互運用性の点ではるかに上回っていることを示している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:46:05 GMT)
Identifying the Hierarchical Emotional Areas in the Human Brain Through Information Fusion [19.1] 本研究の目的は、脳領域間の相互作用を最大化する方法についての詳細な理論グラフを同定することである。
包括的実験により、階層的な感情領域(低レベルから高レベル)が感情知覚の基本的なプロセスを促進することが明らかとなった。
本研究は, 精神構成主義者の仮説に基づく, 特定の感情の基礎となる脳のメカニズムについて, 独自の知見を提供するものである。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:57:12 GMT)
Psychoacoustic Challenges Of Speech Enhancement On VoIP Platforms [19.1] この研究は、Deep Noise Suppression (DNS) 2020データセットに基づいており、様々なデノナイジング設定やレシーバインターフェースに合わせて、構造化された検査を確実にする。
Blinder-Oaxaca分解(Blinder-Oaxaca decomposition)は、従来のエコノメトリーツールであり、VoIPシステム内の音響・音響的摂動を解析するための手法である。
主な発見に加えて、さまざまな指標が報告され、研究のパースペクションが拡張された。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:37:16 GMT)
Online Linear Programming with Batching [19.0] オンライン線形プログラミング(OLP)をOmegaで研究する。
後悔によって測定されたように、意思決定を遅らせる能力は、より良い運用パフォーマンスをもたらすことが示されます。
提案されたアルゴリズムはすべて、最初のバッチと最後のバッチにのみ到着する顧客の決定を遅らせる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 06:13:24 GMT)
DECIDER: Leveraging Foundation Model Priors for Improved Model Failure Detection and Explanation [18.8] 本稿では,大規模言語モデル (LLM) と視覚言語モデル (VLM) の先行情報を利用した画像モデルの故障検出手法であるDECIDERを提案する。
DECIDERは一貫して最先端の故障検出性能を達成し、マシューズ相関係数全体のベースラインを著しく上回っている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:08:11 GMT)
Multimodal Fusion and Coherence Modeling for Video Topic Segmentation [18.2] ビデオトピックセグメンテーション(VTS)タスクは、ビデオを理解不能で重複しないトピックにセグメントする。
VTSは、下流の様々なビデオ理解タスクに欠かせない。
我々はマルチモーダル融合とマルチモーダルコヒーレンスモデリングにより教師付きVTSを改善する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:10:32 GMT)
SynthoGestures: A Novel Framework for Synthetic Dynamic Hand Gesture Generation for Driving Scenarios [17.9] 本論文では,Unreal Engine を用いて現実的な手ジェスチャーを合成するフレームワークを提案する。
当社のフレームワークはカスタマイズオプションを提供し、オーバーフィッティングのリスクを低減する。
データセット作成に要する時間と労力を節約することにより、当社のツールは、自動車アプリケーションのためのジェスチャー認識システムの開発を加速する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:52:31 GMT)
A Dual-way Enhanced Framework from Text Matching Point of View for Multimodal Entity Linking [17.8] マルチモーダルエンティティリンク(MEL)は、ウィキペディアのような知識グラフ(KG)のエンティティに曖昧な言及を多モーダル情報にリンクすることを目的としている。
我々は、各マルチモーダル情報(テキストと画像)をクエリとして扱うニューラルテキストマッチング問題として、マルチモーダルエンティティリンクを定式化する。
本稿では,MELのための双方向拡張(DWE)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 02:49:00 GMT)
Non Verbis, Sed Rebus: Large Language Models are Weak Solvers of Italian Rebuses [17.8] リバス(Rebus)とは、画像や文字の集合から隠されたフレーズを識別するために、制約付き多段階推論を必要とするパズルである。
本稿では,イタリア語に対する言語化リバスの大規模なコレクションを導入し,それを用いて,最先端の大規模言語モデルのリバス解決能力を評価する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:14:15 GMT)
ReLUs Are Sufficient for Learning Implicit Neural Representations [17.8] 暗黙的神経表現学習におけるReLUアクティベーション関数の使用について再考する。
2次B-スプラインウェーブレットにインスパイアされ、ディープニューラルネットワーク(DNN)の各層にReLUニューロンに一連の簡単な制約を組み込む。
我々は、一般的な信念とは対照的に、ReLUニューロンのみからなるDNNに基づいて最先端のINRを学習できることを実証した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 20:53:09 GMT)
HiMTM: Hierarchical Multi-Scale Masked Time Series Modeling with Self-Distillation for Long-Term Forecasting [17.7] HiMTMは長期予測のための自己蒸留を用いた階層型マルチスケールマスク時系列モデリングである。
HiMTMは,(1)階層型マルチスケールトランスフォーマー (HMT) と,2) エンコーダを特徴抽出へ向ける分離エンコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダデコーダ(DED)デコンダデコーダデコンダデコーダデコーダデコーダデコンダデコーダ(DED) の4つのキーコンポーネントを統合する。
7つの主流データセットの実験によると、HiMTMは最先端の自己教師とエンドツーエンドの学習手法を3.16-68.54%上回っている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:18:17 GMT)
Defending Jailbreak Attack in VLMs via Cross-modality Information Detector [17.7] 視覚言語モデル(VLM)は、視覚情報を包括的に理解するためにLLMの能力を拡張する。
近年の研究では、これらのモデルがジェイルブレイク攻撃の影響を受けやすいことが示されている。
悪意ある摂動画像の入力を識別するプラグイン・アンド・プレイのジェイルブレイク検知器を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:22:28 GMT)
Preparation of high fidelity entangled cat states with composite pulses [17.6] 本研究では, 複合パルスを用いた高忠実な絡み合った猫状態の調製のためのプロトコルを提案する。
パラメータを適切に設計することにより、各カー非線形共振器はキャット状態部分空間に閉じ込められる。
複数振幅の複合2光子駆動を導入し, 絡み合った猫状態の忠実度を向上させる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:17:35 GMT)
Inverse Concave-Utility Reinforcement Learning is Inverse Game Theory [17.6] 凹凸ユーティリティによる逆強化学習問題を考察する。
CURLは古典的なベルマン方程式を無効にするため、標準IRLの結果のほとんどは一般には適用されない。
平均場ゲームサブクラスにおける逆ゲーム理論問題と等価であることを示すことによって,I-CURLに対する実現可能な報酬の新たな定義を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 22:45:45 GMT)
AFreeCA: Annotation-Free Counting for All [17.6] 対象物に関連する特徴を学習するための教師なしソート手法を導入する。
また,画像を確実にカウント可能な被写体を含むパッチに分割する密度分類器誘導方式を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:55:16 GMT)
Predicting the Geolocation of Tweets Using transformer models on Customized Data [17.6] 本研究は、ツイート/ユーザ位置情報予測タスクを解決することを目的としている。
提案手法は、自然言語処理のためのニューラルネットワークを実装し、位置を推定する。
提案されたモデルの範囲は、Twitterデータセットで微調整されている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:14:04 GMT)
Block-Operations: Using Modular Routing to Improve Compositional Generalization [17.5] フィードフォワードニューラルネットワーク(FNN)を強化した新しいアーキテクチャコンポーネントであるMultiplexerを紹介する。
我々は,Multiplexersが強い構成一般化を示すことを実験的に確認した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:28:22 GMT)
Towards Flexible Evaluation for Generative Visual Question Answering [17.3] 本稿では,視覚質問応答(VQA)データセット上で,制約のないオープンエンド応答を評価するためにセマンティクスに基づく評価手法を提案する。
さらに,本論文では,VQA評価のユニークな特徴を基礎として,精巧な設計を施したセマンティックフレキシブルVQA評価器(SFVE)を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 05:56:34 GMT)
DeliLaw: A Chinese Legal Counselling System Based on a Large Language Model [16.6] DeliLawは、大きな言語モデルに基づく中国の法律カウンセリングシステムである。
ユーザーはDeliLawシステム上で、専門家の法的質問や法的記事の検索、関連する判断事例などを対話モードで参照することができる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:54:52 GMT)
Aligning Multiple Knowledge Graphs in a Single Pass [16.4] 複数の知識グラフの整合性を解決するために,MultiEAという効果的なフレームワークを提案する。
特に,アライメント性能を向上させるために,革新的な推論拡張手法を提案する。
その結果,MultiEAは1回のパスで複数のKGを効果的かつ効率的にアライメントできることがわかった。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:58:05 GMT)
Memorization Capacity for Additive Fine-Tuning with Small ReLU Networks [16.3] Fine-Tuning Capacity (FTC)は、ニューラルネットワークが微調整できるサンプルの最大数として定義される。
2層ネットワークの$m=Theta(N)$ニューロンと3層ネットワークの$m=Theta(sqrtN)$ニューロンで、$K$がいくら大きいとしても、$N$サンプルを微調整できることが示される。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:58:51 GMT)
DMESA: Densely Matching Everything by Segmenting Anything [16.2] 本稿では,新しい特徴マッチング手法としてMESAとDMESAを提案する。
MESAはSAMの高度な画像理解に基づいて、点マッチングの前に暗黙のセマンティック領域マッチングを確立する。
繰り返し計算が少ないため、DMESAはMESAと比較して約5倍の速度向上を示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 04:39:36 GMT)
YourMT3+: Multi-instrument Music Transcription with Enhanced Transformer Architectures and Cross-dataset Stem Augmentation [16.0] マルチストラクチャメント音楽の書き起こしは、ポリフォニック音楽の録音を各楽器に割り当てられた楽譜に変換することを目的としている。
本稿では、マルチストラクチャメント音楽の書き起こし強化のためのモデルの組であるYourMT3+を紹介する。
実験では,音声分離前処理装置の不要さを排除し,直接音声書き起こし機能を示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:32:05 GMT)
MoE-Infinity: Offloading-Efficient MoE Model Serving [15.8] MoE-Infinity(モエ・インフィニティ)は、Sparse Mixed-of-Experts(MoE)モデルのためのオフロード効率の高いサービスシステムである。
オフロードを最適化するために、MoE-Infinityはエキスパートアクティベーションのための新しい要求レベルのトレースを実現する。
MoE-Infinityはより優れたレイテンシ性能を示し、様々なMoEモデルを提供する際に2-20倍の改善を提供する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:21:24 GMT)
SegStitch: Multidimensional Transformer for Robust and Efficient Medical Imaging Segmentation [15.8] 最先端の手法、特にトランスフォーマーを利用した手法は、3Dセマンティックセグメンテーションにおいて顕著に採用されている。
しかし、局所的な特徴や計算の複雑さが無視されているため、普通の視覚変換器は困難に直面する。
本稿では,SegStitchを提案する。SegStitchは変圧器とODEブロックを結合した革新的なアーキテクチャである。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:05:02 GMT)
Multi-Aspect Reviewed-Item Retrieval via LLM Query Decomposition and Aspect Fusion [15.6] 本稿では,自然言語製品クエリに対処する新しいアスペクト融合戦略を提案する。
不均衡なレビューコーパスでは、AF は MAP@10 を 0.36 から 0.52 に増加させ、バランスの取れたレビューコーパスに対して同等のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 01 Aug 2024 19:04:10 GMT)
Jailbreaking Text-to-Image Models with LLM-Based Agents [15.6] 我々は、生成AIモデルをターゲットにした効率的なファジングワークフローを統合する、高度なマルチエージェントフレームワークであるAtlasを提案する。
我々の評価は、Atlasがいくつかの最先端のT2Iモデルをブラックボックス設定でジェイルブレイクすることに成功していることを示している。
さらにAtlasは、クエリ効率と生成された画像の品質の両方において、既存の方法よりも優れています。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:54:46 GMT)
Neyman-Pearson Multi-class Classification via Cost-sensitive Learning [15.6] ローンデフォルトの予測では、異なるタイプのエラーがさまざまな結果をもたらす可能性がある。
この非対称性問題に対処するために、ネイマン・ピアソン(NP)パラダイムとコストセンシティブ(CS)パラダイムという2つの一般的なパラダイムが開発された。
我々は,強い双対性によるCS問題との接続を確立することで,マルチクラスNP問題に取り組み,2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:38:06 GMT)
multiGradICON: A Foundation Model for Multimodal Medical Image Registration [15.2] We developed multiGradICON as a first step to universal *multimodal* medical image registration。
1)モノモーダル*および*マルチモーダル登録に適したDL登録モデルをトレーニングし,2)損失関数のランダム化によりマルチモーダル登録精度が向上し,3)マルチモーダルデータを用いたモデルトレーニングがマルチモーダル一般化に役立つことを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 01:23:02 GMT)
Fool Your (Vision and) Language Model With Embarrassingly Simple Permutations [14.8] 本研究は,複数選択プロンプトに対する応答集合の逆置換に対して,人気モデルが脆弱であることを示す。
これらの脆弱性は、様々なモデルサイズにまたがって持続し、非常に最近の言語とビジョン言語モデルに存在する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 21:41:44 GMT)
MuJoCo MPC for Humanoid Control: Evaluation on HumanoidBench [14.7] 我々は最近, MuJoCo MPC を用いたヒューマノイドベンチ(HumanoidBench)に関するベンチマークを行った。
我々は,HumanoidBenchのスパース報酬関数が最適化された場合,望ましくない,非現実的な振る舞いをもたらすことを発見した。
本稿では,タスク間のロボットの動作を安定化させる一連の正規化用語を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:27:18 GMT)
Enhancing Online Road Network Perception and Reasoning with Standard Definition Maps [14.5] 我々は,オンラインベクトル化HDマップ表現の開発において,軽量でスケーラブルな事前規格定義(SD)マップを活用することに注力する。
重要な発見は、SDマップエンコーダがモデル非依存であり、鳥の目視(BEV)エンコーダを利用する新しいアーキテクチャに迅速に適応できることである。
この結果から,オンライン地図作成タスクの先行作業としてSDマップを使用すると,コンバージェンスが大幅に向上し,オンラインセンターライン認識タスクの性能が30%向上する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 19:39:55 GMT)
HG-PIPE: Vision Transformer Acceleration with Hybrid-Grained Pipeline [13.8] フィールドプログラマブルゲートアレイ(FPGA)を用いたビジョントランスフォーマー(ViT)アクセラレーションは有望だが難しい。
HG-PIPEは、高スループットかつ低レイテンシなViT処理のためのパイプラインFPGAアクセラレータである。
VCK190 FPGAでは、HG-PIPEは単一のデバイス上でエンドツーエンドのViTアクセラレーションを実現し、V100 GPUの2.81倍の7118イメージ/sを達成する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:18:57 GMT)
Tiered Reward: Designing Rewards for Specification and Fast Learning of Desired Behavior [13.4] Tiered Rewardは環境に依存しない報酬関数のクラスである。
我々は、我々の嗜好関係に応じて最適な政策を誘導することが保証されていることを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:47:24 GMT)
Focus, Distinguish, and Prompt: Unleashing CLIP for Efficient and Flexible Scene Text Retrieval [13.3] シーンテキスト検索は、画像ギャラリーからクエリテキストを含むすべての画像を見つけることを目的としている。
現在の取り組みでは、複雑なテキスト検出および/または認識プロセスを必要とする光学文字認識(OCR)パイプラインを採用する傾向にある。
我々は,OCRのないシーンテキスト検索のためのCLIP(Contrastive Language- Image Pre-Trening)の本質的な可能性について検討する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:25:14 GMT)
Intermittent Semi-working Mask: A New Masking Paradigm for LLMs [13.3] マルチターン対話は人間と大規模言語モデル(LLM)の鍵となる対話手法である
これらの問題に対処するために,ISM (Intermittent Semi-working Mask) と呼ばれる新しいマスキング手法を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:22:01 GMT)
HBot: A Chatbot for Healthcare Applications in Traditional Chinese Medicine Based on Human Body 3D Visualization [13.2] 本研究では,人体モデルに基づく3Dおよびナレッジグラフに基づくHBot(textbfhealthcare chattextbfbot)を開発した。
HBotは、ナレッジQ&A、処方の勧告、モキシバスト療法の勧告、およびアキューポイント検索などの会話サービスを提供する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:36:18 GMT)
Learning Backdoors for Mixed Integer Linear Programs with Contrastive Learning [13.1] 多くの実世界の問題は、MILP(Mixed Linear Programs)として効率的にモデル化でき、ブランチ・アンド・バウンド法で解決できる。
以前の研究はMILPバックドアの存在を示しており、可能であれば分岐の優先順位付けが実行時間の短縮につながるような変数の小さなセットである。
過去の研究は、ランダムにサンプリングされたバックドアの相対的な解法速度をランク付けして推定し、最高ランクのバックドア候補を使うかどうかを決定する。
本稿では,モンテカルロ木探索法を用いて,ランダムサンプリングに頼るのではなく,学習用バックドアを収集し,コントラストに適応する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 01:07:35 GMT)
Robust Unsupervised Multi-task and Transfer Learning on Gaussian Mixture Models [13.1] GMMにおけるマルチタスク学習問題について検討する。
本稿では,EMアルゴリズムに基づくマルチタスクGMM学習手法を提案する。
我々はGMMにおける伝達学習の課題に取り組むためのアプローチを一般化する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:54:39 GMT)
AutoPV: Automatically Design Your Photovoltaic Power Forecasting Model [12.9] ニューラルアーキテクチャサーチ(NAS)技術に基づくPVPFモデルの自動探索と構築のための新しいフレームワークであるAutoPVを紹介する。
我々は、最先端(SOTA)TSFモデルと典型的なPVPF深層学習モデルから様々なデータ処理技術を取り入れたNAS検索空間を開発した。
オートPVの有効性は、中国の大慶太陽光発電所のデータセットを用いて、多種多様なPVPFタスクで評価される。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:35:24 GMT)
Granular-Balls based Fuzzy Twin Support Vector Machine for Classification [12.7] 本稿では,2つのサポートベクタマシン(TWSVM)とグラニュラーボールコンピューティング(GBC)を統合した,グラニュラーボールツインサポートベクタマシン(GBTWSVM)の分類手法を提案する。
Pythagorean fuzzy set を用いて粒状球のメンバシップと非メンバシップ機能を設計し,各領域における粒状球の寄与を区別する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:43:21 GMT)
Generative AI for Health Technology Assessment: Opportunities, Challenges, and Policy Considerations [12.7] 本稿では、医療技術評価(HTA)のための生成人工知能(AI)と大規模言語モデル(LLM)を含む基礎モデルについて紹介する。
本研究は, 4つの重要な領域, 合成証拠, 証拠生成, 臨床試験, 経済モデリングにおける応用について検討する。
約束にもかかわらず、これらの技術は急速に改善されているものの、まだ初期段階にあり、HTAへの適用には慎重な評価が引き続き必要である。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:10:22 GMT)
SpatialBot: Precise Spatial Understanding with Vision Language Models [12.7] 視覚言語モデル (VLM) は2次元画像理解において優れた性能を発揮している。
彼らはまだ、Embodied AIの基盤である空間的理解に苦戦している。
本稿では,RGB画像と深度画像の両方をフィードすることで,空間的理解を向上させるためのSpatialBotを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 04:46:58 GMT)
Prover-Verifier Games improve legibility of LLM outputs [12.5] 小学校数学の問題を解く上での妥当性について検討する。
本稿では,Anil et al の Prover-Verifier Game にヒントを得たトレーニングアルゴリズムを提案する。
本研究は,解の正当性を検証することを目的とした,時間制約のある人間への正当性訓練の伝達を示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:18:54 GMT)
Text-Guided Video Masked Autoencoder [12.3] 本稿では,ペア字幕に高い対応で映像領域をマスキングする新しいテキスト誘導マスキングアルゴリズム(TGM)を提案する。
既存のマスキングアルゴリズム、統一MAE、マスキングビデオテキストコントラスト学習により、純粋なMAEと比較して下流性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:58:19 GMT)
High-Quality, ROS Compatible Video Encoding and Decoding for High-Definition Datasets [12.3] 本稿では,ロボット・データセットにおける最新のビデオエンコーダの利用について検討する。
ROS 1 と ROS 2 のフレームワーク内で mp4 ビデオを再生できるソフトウェアを提供する。
適切なストレージ制約下で,高品質なビデオデータセットの保存と共有が可能であることを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:21:34 GMT)
Enhancing Whole Slide Pathology Foundation Models through Stain Normalization [12.2] Stain Normalized Pathology Foundational Model is training using 285,153,903 patch from a total of 34,795 whole slide image (WSIs)
本実験は,Stain Normalized Pathology Foundational Modelが特徴崩壊問題を著しく軽減することを示した。
このことは、染色正規化の適用によりモデルの効率性と一般化能力が大幅に向上したことを示唆している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:41:13 GMT)
A Systematic Review on Long-Tailed Learning [12.1] 長い尾の学習は、長い尾の分布を持つデータセット上で高性能なモデルを構築することを目的としている。
本研究では,8つの異なる次元からなる長期学習のための新しい分類法を提案する。
本稿では,長期学習手法の体系的レビューを行い,それらの共通点と整合性の違いについて論じる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:39:45 GMT)
Depth-Wise Convolutions in Vision Transformers for Efficient Training on Small Datasets [12.0] Vision Transformer (ViT)は、イメージをパッチに分割することで、グローバルな情報をキャプチャする。
ViTは、画像やビデオデータセットのトレーニング中に誘導バイアスを欠く。
本稿では,ViTモデルのショートカットとして,軽量なDepth-Wise Convolutionモジュールを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 04:22:29 GMT)
Point-supervised Brain Tumor Segmentation with Box-prompted MedSAM [11.9] セマンティック・アウェア・ポイント管理型MedSAMを実現するための反復的フレームワークを提案する。
Box-prompt generator (SBPG)モジュールは、ポイント入力を潜在的に擬似境界ボックス提案に変換する能力を持つ。
Prompt-Guided Space refinement (PGSR)モジュールは、MedSAMの例外的な一般化性を利用して、セグメンテーションマスクを推測する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:52:39 GMT)
Pathway to Secure and Trustworthy 6G for LLMs: Attacks, Defense, and Opportunities [11.5] 6Gネットワークの細調整大型言語モデル(LLM)に関連するセキュリティ脆弱性について検討する。
LLMをサービスとして使用する場合の個人データ漏洩につながる可能性のあるダウンストリームタスクに対して,メンバシップ推論攻撃が有効であることを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:15:13 GMT)
Segment anything model 2: an application to 2D and 3D medical images [11.2] Segment Anything Model (SAM) は、様々なオブジェクトを画像にセグメント化できることから注目されている。
最近開発されたSAM 2は、この機能をビデオ入力に拡張した。
これにより、SAMを3D画像に適用する機会が開ける。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:57:25 GMT)
Insurance Portfolio Pursuit with Reinforcement Learning [11.2] 本稿では,ポートフォリオ探索を逐次決定問題として定式化し,その解法のための新しい強化学習アルゴリズムを考案する。
本手法は複雑な総合市場環境において試行し,ポートフォリオ追求への現在の産業的アプローチを模したベースライン手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:58:54 GMT)
Towards Self-Supervised FG-SBIR with Unified Sample Feature Alignment and Multi-Scale Token Recycling [11.1] FG-SBIRは、埋め込み空間におけるスケッチと対応する画像の距離を最小化することを目的としている。
両領域間のギャップを狭める効果的なアプローチを提案する。
主に、イントラサンプルとインターサンプルの両方を共有する統一的な相互情報共有を促進する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:00:04 GMT)
FloorSet -- a VLSI Floorplanning Dataset with Design Constraints of Real-World SoCs [10.3] システム・オン・ア・チップ(SoC)とそのサブシステムのフロアプランニングは、物理的設計フローの重要かつ非自明なステップである。
FloorSet -- 合成固定アウトラインフロアプランレイアウトの包括的なデータセットを2つ紹介する。
FloorSetは、大規模制約付き最適化問題の基礎研究を促進することを目的としている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 22:57:53 GMT)
1-Form Symmetric Projected Entangled-Pair States [10.2] 射影エンタングルペア状態(PEPS)における1型対称性の役割について検討する。
以上の結果から, 1-形式対称性はテンソルネットワーク表現に厳密な制約を課し, 対称性行列が持つ異常なブレイディング位相を導出した。
これらの対称性がPEPSの基底状態や接点空間にどのように影響するかを実証し、それらの物理的意味について新たな洞察を与える。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:51:17 GMT)
Dataset Distillation for Offline Reinforcement Learning [10.2] オフラインの強化学習には、しばしばポリシーをトレーニングできる品質データセットが必要です。
我々は、データ蒸留を用いてより良いデータセットを訓練し、それからより良いポリシーモデルをトレーニングするために使用できることを提案する。
提案手法では,トレーニングしたモデルが,全データセットでトレーニングしたモデルと同じような性能を達成できるようなデータセットを合成することができる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 01:33:48 GMT)
Reputation Gaming in Stack Overflow [10.0] 本稿は,Stack Overflowで実施される可能性のある評価操作シナリオの報告について,包括的に調査する。
同様の投稿でコミュニティが互いに投票を繰り返す投票リングなど,評価詐欺のシナリオは4種類あった。
我々は、プラットフォームマネージャが不審な評判ゲームシナリオを自動的に識別してレビューできるアルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:02:31 GMT)
eSPARQL: Representing and Reconciling Agnostic and Atheistic Beliefs in RDF-star Knowledge Graphs [10.0] RDF-starと呼ばれるステートメントに対するステートメントを認めるRDFへの最近の拡張は、W3C標準になるように改訂されている。
これらのRDF星のステートメントのセマンティクスや、それらを操作するためのビルトイン・ファシリティの提案はない。
本稿では,eSPARQLと呼ばれる4値論理に基づくRDF-starメタデータのクエリ言語を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:22:58 GMT)
Digital Twin-Empowered Task Assignment in Aerial MEC Network: A Resource Coalition Cooperation Approach with Generative Model [9.9] 本稿では,航空移動エッジコンピューティングネットワークにデジタルツイン(DT)を導入し,資源連携協力手法について検討する。
具体的には,アプリケーションプレーン,物理プレーン,仮想プレーンで構成される新しいネットワークフレームワークを提案する。
提案手法の有効性を,エネルギー消費と資源利用の観点から検証した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:54:46 GMT)
Improving Image De-raining Using Reference-Guided Transformers [9.9] 本稿では,参照クリーンイメージをガイダンスとして,デレーニング結果を向上するトランスフォーマネットワークであるレファレンス誘導型デレーニングフィルタを提案する。
提案手法を3つのデータセット上で検証し,既存の事前ベース,CNNベース,トランスフォーマーベースのアプローチにより,モジュールの性能を向上できることを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 03:31:45 GMT)
RoCo:Robust Collaborative Perception By Iterative Object Matching and Pose Adjustment [9.8] 複数の車両との協調自動運転は通常、複数のモードからのデータ融合を必要とする。
協調的な知覚では、モダリティに基づく物体検出の品質は、エージェント間の相対的なポーズ誤差に非常に敏感である。
反復的なオブジェクトマッチングとエージェントポーズ調整を行うための新しい教師なしフレームワークであるRoCoを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 03:29:33 GMT)
MonoMM: A Multi-scale Mamba-Enhanced Network for Real-time Monocular 3D Object Detection [9.8] リアルタイムモノクロ3Dオブジェクト検出のための革新的なネットワークアーキテクチャであるMonoMMを提案する。
MonoMM は Focused Multi-Scale Fusion (FMF) と Depth-Aware Feature Enhancement Mamba (DMB) モジュールで構成されている。
提案手法は,従来の単分子法よりも優れ,リアルタイム検出を実現する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:16:58 GMT)
Evaluating Neural Radiance Fields (NeRFs) for 3D Plant Geometry Reconstruction in Field Conditions [9.8] 我々は,様々な環境下で3D植物を再構築するための異なるニューラル・レージアンス・フィールド(NeRF)技術を評価する。
NeRFは、GPUでの30分間のトレーニングで74.65%のF1スコアを獲得し、挑戦的な環境でのNeRFの効率と精度を強調している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:34:51 GMT)
A Preliminary Investigation of MLOps: Initial Insights into Developer Perception and Adoption [9.8] MLOps(Machine Learning and Operations)ガイドラインがこの分野の主要なリファレンスとして登場した。
MLOpsガイドラインの導入にも拘わらず、その実装には懐疑論の程度がある。
この研究は、MLOpsとその機械学習におけるイノベーションの次のフェーズへの影響について、より深い洞察を提供することを目的としている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:08:29 GMT)
Parkinson's Disease Detection from Resting State EEG using Multi-Head Graph Structure Learning with Gradient Weighted Graph Attention Explanations [9.5] 静止状態脳波を用いたパーキンソン病(PD)検出のための新しいグラフニューラルネットワーク(GNN)手法を提案する。
コントラスト学習を用いた構造化グローバル畳み込みを用いて,データ制限による複雑な特徴をモデル化する。
UCサンディエゴ・パーキンソン病脳波データセットを用いて本手法を開発,評価し,主観的離脱検診において69.40%の精度で検出した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 20:54:33 GMT)
Translating Imaging to Genomics: Leveraging Transformers for Predictive Modeling [9.4] 我々はトランスフォーマーネットワークを利用して画像とゲノムデータのギャップを埋めることを目指している。
利用可能なCT/MRI画像のみを用いてゲノム配列を予測することを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 06:14:37 GMT)
Neural Octahedral Field: Octahedral prior for simultaneous smoothing and sharp edge regularization [9.2] そこで本研究では,オクタヘドラル場(Octahedral field)の新たな変種下での表面再構成を導くことを提案する。
暗黙の幾何とともに八面体を同時に嵌め、滑らかにすることで、二元フィルタリングと類似して振る舞う。
提案手法は, 様々な実験において, 従来型, ニューラルなアプローチより優れている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 06:02:59 GMT)
Reenact Anything: Semantic Video Motion Transfer Using Motion-Textual Inversion [9.1] 本研究では、動きから外見を遠ざけるために、事前訓練された画像間映像モデルを提案する。
動作テキストインバージョン(Motion-textual Inversion)と呼ばれるこの手法は、画像から映像へのモデルが、主に(相対的な)画像入力から外観を抽出する、という観察を生かしている。
フレームごとの複数のテキスト/画像埋め込みトークンを含むインフレーションされたモーションテキスト埋め込みを操作することにより、高時間運動粒度を実現する。
動作参照ビデオと対象画像の間に空間的アライメントを必要とせず,様々な領域にまたがって一般化し,様々なタスクに適用することができる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:55:20 GMT)
Benchmarking Attacks on Learning with Errors [9.0] 誤りを伴う学習(LWE)に基づく格子暗号スキームは、後量子暗号システムとして使われるためにNISTによって標準化されている。
標準化されたパラメータのLWEシークレットリカバリのための最初のベンチマークを、小さくて低ウェイトな(スパースな)シークレットに対して提供します。
SALSAとCool & Cruelの攻撃を大きな形で拡張し、MitM攻撃の実装とスケールアップを初めて行います。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 19:21:20 GMT)
Towards Scalable GPU-Accelerated SNN Training via Temporal Fusion [9.0] スパイキングニューラルネットワーク(SNN)は、人工知能の変革的発展として出現する。
SNNは、特別なスパース計算ハードウェア上で有望な効率を示すが、その実践訓練は、しばしば従来のGPUに依存している。
本稿では,GPUプラットフォーム上でのSNNの伝搬ダイナミクスを高速化する新しい時間融合法を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 04:41:56 GMT)
Segment-Based Test Case Prioritization: A Multi-objective Approach [9.0] TCP(Test Case Prioritization)は、目的関数を最大化する実行順序でテストケースをスケジュールするコスト効率の高いソリューションである。
進化的検索アルゴリズムと4つのカバレッジ基準を用いてUIテストケースを優先する多目的最適化手法を提案する。
提案手法は,APFD(Average Percentage of Faults Detected)とAPFD(APFD with Cost)において,他の手法よりも優れている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:51:01 GMT)
Hybrid Querying Over Relational Databases and Large Language Models [8.9] 実世界の4つのデータベースに対する120以上の問合せを含む最初のクロスドメインベンチマークであるSWANを提示する。
本稿では、ハイブリッドクエリのための予備的なソリューションであるHQDLを紹介し、将来的な方向性についても論じる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 19:29:18 GMT)
COKE: Causal Discovery with Chronological Order and Expert Knowledge in High Proportion of Missing Manufacturing Data [8.9] 現実世界のデータセットは、最大90%の欠落したデータと数百のセンサーから高次元性を示す。
現実の状況に類似したシナリオで欠落したデータを扱う従来の方法は、専門家の知識を効果的に活用することができなかった。
我々は,センサ間の専門知識と時間順を利用して,データ不足を抑えることにより,データセットの因果グラフを構築することを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 01:21:57 GMT)
Graph Representation Learning via Causal Diffusion for Out-of-Distribution Recommendation [8.8] グラフニューラルネットワーク(GNN)ベースのレコメンデーションアルゴリズムは、トレーニングとテストデータは独立して同じ分散空間から引き出されると仮定する。
この仮定は、アウト・オブ・ディストリビューション(OOD)データの存在でしばしば失敗し、パフォーマンスが大幅に低下する。
OODレコメンデーションのための因果拡散によるグラフ表現学習(CausalDiffRec)を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:51:52 GMT)
Research on Image Super-Resolution Reconstruction Mechanism based on Convolutional Neural Network [8.7] 超解像アルゴリズムは、同一シーンから撮影された1つ以上の低解像度画像を高解像度画像に変換する。
再構成過程における画像の特徴抽出と非線形マッピング手法は,既存のアルゴリズムでは依然として困難である。
目的は、高解像度の画像から高品質で高解像度の画像を復元することである。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 03:07:49 GMT)
Exploration of LLMs, EEG, and behavioral data to measure and support attention and sleep [8.6] 本研究では,大きな言語モデル(LLM)を用いて注意状態,睡眠ステージ,睡眠の質を推定する。
以上の結果から,LLMは人間のテキスト行動特性に基づいて睡眠の質を推定できることがわかった。
しかし、脳波と活動データに基づいて注意、睡眠ステージ、睡眠品質を検出するには、さらなるトレーニングデータとドメイン固有の知識が必要である。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:17:54 GMT)
Vision-based Wearable Steering Assistance for People with Impaired Vision in Jogging [8.5] 高速モビリティの需要は、視覚ベースのウェアラブルステアリング支援を開発するきっかけとなった。
線路や障害物を同時に検出できる軽量マルチタスクネットワークを設計した。
我々のシステムは組み込みデバイスであるJetson Orin NXにデプロイされている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:10:45 GMT)
Low-Rank Covariance Completion for Graph Quilting with Applications to Functional Connectivity [8.5] 多くのカルシウムイメージングデータセットでは、ニューロンの全個体数は同時に記録されるのではなく、部分的に重なるブロックに記録される。
本稿では、まず、低ランクココンプリートを用いた原子核構造行列を暗示するグラフ量子化法について述べる。
カルシウムイメージングデータから接続性を推定するためのこれらの手法の有効性を示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:07:03 GMT)
Image Super-Resolution with Taylor Expansion Approximation and Large Field Reception [8.5] 自己相似性計算における高次元行列乗算は、膨大な計算コストを消費する。
本稿では,クエリとキーの行列乗算を分離する2階Taylor拡張近似(STEA)を提案する。
また,STEAによる性能劣化を補うため,MLFR(Multi-scale large field reception)を設計した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:16:26 GMT)
Actor-Critic Physics-informed Neural Lyapunov Control [8.4] 重要なパフォーマンス指標は、結果のアトラクション領域のサイズである。
本稿では,アトラクション領域の最大化を目的とした,安定化ニューラルネットワークコントローラのトレーニング手法を提案する。
いくつかの設計問題に対する数値実験により, 得られたアトラクション領域のサイズが一貫した, 顕著な改善が見られた。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:16:26 GMT)
Mobility-Aware Federated Self-supervised Learning in Vehicular Network [8.3] Federated Learning(FL)は、高度な分散機械学習アプローチである。
ロードサイドユニット(RSU)にすべてのデータをアップロードすることなく、モデルを複数のデバイスで同時にトレーニングすることで、各車両のプライバシを保護する。
本稿では,ラベルを必要とせず,車載環境下での自己教師型学習のための事前学習段階として機能するFLSimCoという,画像ボケレベルからアグリゲーションへのFLアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 03:28:10 GMT)
Learning in Multi-Objective Public Goods Games with Non-Linear Utilities [8.2] 我々は,エージェントが異なるリスク嗜好を持つ,新しい多目的型Public Goods Gameの学習について研究する。
このような嗜好モデルと環境不確実性の間の相互作用をゲーム内のインセンティブアライメントレベルにおいて検討する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:24:37 GMT)
DFE-IANet: A Method for Polyp Image Classification Based on Dual-domain Feature Extraction and Interaction Attention [8.2] スペクトル変換と特徴相互作用の両方に基づく新しいネットワークDFE-IANetを提案する。
DFE-IANetは4Mのパラメータしか持たないため、効率の面では最新のネットワークや古典的ネットワークよりも優れている。
DFE-IANetは、挑戦的なKvasirデータセットで最新技術(SOTA)の結果を達成し、Top-1の精度は93.94%である。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:43:11 GMT)
Contrastive Learning with Dynamic Localized Repulsion for Brain Age Prediction on 3D Stiffness Maps [8.1] そこで本研究では,サンプルの局所的な領域に着目して,トレーニングプロセス中に動的に適応する新たなコントラスト損失を提案する。
この研究は、脳の年齢を予測するために、コンパイルされた剛性マップを用いて、脳の機械的特性に対する自己教師あり学習の最初の応用を示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:58:19 GMT)
Towards Zero-Shot Annotation of the Built Environment with Vision-Language Models (Vision Paper) [8.1] 適切な都市交通アプリケーションは、構築された環境の高忠実度デジタル表現を必要とする。
衛星画像から多様な都市特徴を注釈付けするためのメカニズムとして視覚言語モデルを考える。
我々は、最先端のビジョン言語モデルとプロンプト戦略の変種を組み合わせた概念実証を実証する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 21:50:23 GMT)
Osmosis: RGBD Diffusion Prior for Underwater Image Restoration [8.1] 色と深さの結合空間に先立って無条件拡散モデルを訓練する。
クリーン画像の後部サンプルを生成し,水の影響を除去する。
本手法は,難易度の高いシーンにおいて,画像復元のための最先端のベースラインよりも優れる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 20:01:58 GMT)
Enhancing Stability for Large Models Training in Constrained Bandwidth Networks [8.0] 我々は、階層分割(hpZ)方式における競合状態が、数十億のパラメータを持つモデルのトレーニング時に不安定を引き起こす可能性を示す。
次に、これらの収束問題に対処し、競争力のあるトレーニング効率を維持しながら、分割アルゴリズムの変更を提案する。
このアルゴリズムは、98%のスループットを持つ大型モデルの堅牢なトレーニングを可能にし、収束の質を犠牲にすることなく、モデルのトレーニング速度を向上する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 02:56:58 GMT)
Clover-2: Accurate Inference for Regressive Lightweight Speculative Decoding [8.0] レグレッシブ・ライトウェイトな投機的復号化は、テキスト生成タスクにおける顕著な効率改善のために注目を集めている。
Clover-2は、RNNベースのドラフトモデルであり、アテンションデコーダ層モデルと同等の精度を達成するように設計されている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 03:43:32 GMT)
OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack [7.8] ディープニューラルネットワーク(DNN)は入力の小さな逆方向の摂動に対して脆弱である。
本稿では,2段階の最適輸送誘導敵防衛モデルを提案する。
OTADは、ローカルリプシッツ連続性を保ちながら、トレーニングデータを正確に適合させることができる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:04:18 GMT)
On the Limitations and Prospects of Machine Unlearning for Generative AI [7.8] Generative AI(GenAI)は、潜伏変数やその他のデータモダリティから現実的で多様なデータサンプルを合成することを目的としている。
GenAIは自然言語、画像、オーディオ、グラフなど、さまざまな領域で顕著な成果を上げている。
しかし、データプライバシ、セキュリティ、倫理に課題やリスクも生じている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:35:40 GMT)
Abductive Reasoning in a Paraconsistent Framework [7.5] 有名なベルナップ・ダンパラ一貫性の4値論理の2つの拡張を考える。
古典命題論理では、$mathsfBD_circ$ と $mathsfBD_triangle$ で abduction を減らす方法を示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:12:52 GMT)
PCNN: Probable-Class Nearest-Neighbor Explanations Improve Fine-Grained Image Classification Accuracy for AIs and Humans [7.4] 最も近い隣人(NN)は、伝統的に最終決定を計算するために使用される。
本稿では, 冷凍, 事前訓練された分類器Cの予測を改善するため, 近隣住民の新たなユーティリティを示す。
CUB-200, Cars-196, Dogs-120における画像分類精度を常に改善する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 21:49:31 GMT)
Data-Driven Traffic Simulation for an Intersection in a Metropolis [7.3] 道路交差点における交通をモデル化するための新しいデータ駆動シミュレーション環境を提案する。
エージェントの相互作用と環境制約を学習するために,軌道予測モデルを訓練する。
シミュレーションは、自律的に、または、生成分布に条件付けされた明示的な人間の制御の下で実行することができる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 22:25:06 GMT)
Analyzing the Effectiveness of Quantum Annealing with Meta-Learning [7.3] メタラーニングモデルに基づく量子アニーリング(QA)の有効性を検討するための新しい手法を提案する。
10の異なる最適化問題の5万以上のインスタンスからなるデータセットを構築します。
それらの特徴を説明するために100以上の特徴のセットを定義し、QAと3つの古典的解法を用いてそれらを解決する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:03:11 GMT)
DynamoLLM: Designing LLM Inference Clusters for Performance and Energy Efficiency [7.1] そこで我々はDynamoLLMを提案する。DynamoLLMは、生成型大規模言語モデルのための最初のエネルギー管理フレームワークである。
サービスレベルでは、DynamoLLMは53%のエネルギーと38%の運転二酸化炭素を節約し、顧客へのコストを61%削減する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:40:45 GMT)
CDFGNN: a Systematic Design of Cache-based Distributed Full-Batch Graph Neural Network Training with Communication Reduction [7.0] グラフニューラルネットワークトレーニングは、主にミニバッチとフルバッチのトレーニング方法に分類される。
分散クラスタでは、機能とグラデーションの頻繁なリモートアクセスが、通信オーバーヘッドを大きくします。
キャッシュベースの分散フルバッチグラフニューラルネットワークトレーニングフレームワーク(CDFGNN)を紹介する。
本結果は,CDFGNNが分散フルバッチGNNトレーニングタスクを高速化する大きな可能性を示唆している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 01:57:09 GMT)
Persistent de Rham-Hodge Laplacians in the Eulerian representation [7.0] 略語としてde Rham-Hodge Laplacian,Persistent Hodge Laplacian(PHL)を提案する。
我々は、進化的ド・ラム=ホッジ理論をラグランジュの定式化からユーレの定式化まで拡張する。
提案したPHLは,ボリュームデータの機械学習とディープラーニング予測を容易にする。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 01:15:52 GMT)
Quantum Program Testing Through Commuting Pauli Strings on IBM's Quantum Computers [6.9] 量子ソフトウェアテストの新しいアプローチであるQOPSを提案する。
QOPSは、異なる量子プログラムとの互換性を改善するために、パウリ文字列に基づいた新しいテストケースの定義を導入した。
我々は、194,982個の実量子プログラム上でQOPSを実証的に評価し、完全F1スコア、精度、リコールによる最先端技術と比較して、テストアセスメントにおける効果的な性能を実証した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:10:10 GMT)
Enhancing convolutional neural network generalizability via low-rank weight approximation [6.8] 十分なノイズ処理は、画像処理にとって重要な第一歩であることが多い。
ディープニューラルネットワーク(DNN)は画像のノイズ化に広く利用されている。
本研究では,タッカー低ランクテンソル近似に基づく自己教師付き画像復調フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:53:43 GMT)
Granting GPT-4 License and Opportunity: Enhancing Accuracy and Confidence Estimation for Few-Shot Event Detection [6.7] 大規模言語モデル(LLM)は、"銀"データの生成に使用を提案するために、数ショットの学習コンテキストで十分な可能性を示している。
信頼度推定は、GPT-4のようなモデルの弱点を文書化したものである。
本研究は,車両としてのBETTERライセンスにおけるイベント検出のための少数ショット学習によるGPT-4による効果的な信頼度推定手法について検討する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 21:08:07 GMT)
Discovering Car-following Dynamics from Trajectory Data through Deep Learning [6.5] 本稿では,変数交叉選択(VIS)法と統合された深部記号回帰(DSR)に基づく表現探索フレームワークを提案する。
本稿では,自動車追従力学モデルの学習における提案手法の性能について述べるとともに,その限界と今後の研究方向性について考察する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 03:15:08 GMT)
How Effective are Self-Supervised Models for Contact Identification in Videos [6.5] この研究は、8つの異なるCNNベースのビデオSSLモデルを使用して、特にビデオシーケンス内の物理的接触のインスタンスを特定することを目的としている。
Some-Something v2 (SSv2) と Epic-Kitchen (EK-100) のデータセットがこれらのアプローチを評価するために選ばれた。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:08:20 GMT)
AutoM3L: An Automated Multimodal Machine Learning Framework with Large Language Models [6.5] 本稿では,革新的マルチモーダル機械学習フレームワークAutoM3Lを紹介する。
AutoM3Lはデータモダリティを理解し、ユーザ要求に基づいて適切なモデルを選択する。
6つの多様なマルチモーダルデータセット上でのAutoM3Lの性能評価を行った。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:01:51 GMT)
Generating three-photon Rabi oscillations without a large-detuning condition [6.4] 量子ラビモデルにおいて、3光子共鳴は、空洞磁場の素周波数が原子遷移周波数の約1/3であるときに起こる。
また, 変換可能な遷移周波数を有する人工原子を用いることで, 1/3条件がない場合にも共鳴が生じることを示す。
我々は、エネルギー分割の大きさと共鳴位置を決定する効果的なハミルトニアンを導出する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:13:02 GMT)
Gaussian Processes Sampling with Sparse Grids under Additive Schwarz Preconditioner [6.4] 本稿では,GPモデルの前と後をランダムに実現するためのスケーラブルなアルゴリズムを提案する。
提案アルゴリズムはスパースグリッドを用いた点近似と加法的シュワルツプレコンディショナーを利用する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 00:19:36 GMT)
Aggregation Models with Optimal Weights for Distributed Gaussian Processes [6.4] 本稿では,分散GPにおける集約予測のための新しい手法を提案する。
提案手法は, 専門家間の相関関係を取り入れ, 管理可能な計算条件で予測精度を向上する。
実証的な研究によって実証されたように、提案手法は、最先端の一貫した集約モデルよりも少ない時間でより安定した予測をもたらす。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 23:32:14 GMT)
Can Developers Prompt? A Controlled Experiment for Code Documentation Generation [6.4] 2つのPython関数のためのコードドキュメンテーション生成を専門とする20人のプロと30人のコンピュータサイエンス学生による制御実験について報告する。
その結果, プロや学生は, 素早い工学的手法を知らないか, 適用できなかったことが明らかとなった。
一部のプロフェッショナルは、アドホックなプロンプトにDocstringというキーワードを含めることで、高品質なドキュメントを作成しました。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:28:14 GMT)
Social and Ethical Risks Posed by General-Purpose LLMs for Settling Newcomers in Canada [6.1] 汎用生成AIは、このニーズに対処するための新参者やサービス提供者の間で一般的なプラクティスになる可能性がある。
これらの道具は入植地に適したものではなく、移民や難民に有害な影響を及ぼす可能性がある。
われわれは、これらのツールが初心者にもたらすリスクを調査し、まずは、生成AIの未防衛使用に対して警告し、次に、AIリテラシープログラムの作成においてさらなる研究と開発のインセンティブを与える。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 19:44:38 GMT)
Temporal Evolution of Knee Osteoarthritis: A Diffusion-based Morphing Model for X-ray Medical Image Synthesis [6.0] 患者の健康な膝と重度のKOAステージ間の中間X線画像の合成を目的とした新しい深層学習モデルを提案する。
テストフェーズでは,健常な膝X線に基づいて,KOAX線画像の連続的かつ効果的なシーケンスを生成することができる。
提案手法は拡散モジュールと変形モジュールを統合し,X線源画像とターゲット画像との空間的変形の詳細を抽出する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 20:00:18 GMT)
Multi-label Sewer Pipe Defect Recognition with Mask Attention Feature Enhancement and Label Correlation Learning [5.9] マスク注意誘導特徴強調とラベル相関学習に基づくマルチラベルパイプ欠陥認識を提案する。
提案手法は,Swer-MLトレーニングデータセットの1/16のみを用いて,現在の最先端の分類性能を実現する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:51:50 GMT)
Contrastive Graph Representation Learning with Adversarial Cross-view Reconstruction and Information Bottleneck [5.7] 本稿では,CGRL (Contrastive Graph Representation Learning with Adversarial Cross-view Reconstruction and Information Bottleneck) を用いたノード分類手法を提案する。
提案手法は既存の最先端アルゴリズムを著しく上回っている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 05:45:21 GMT)
Neural Graph Matching for Video Retrieval in Large-Scale Video-driven E-commerce [5.5] ビデオによるeコマースは、消費者の信頼を刺激し、販売を促進する大きな可能性を秘めている。
本稿では,ノードレベルのグラフマッチングと優先レベルのグラフマッチングを主とする,新しい二レベルグラフマッチングネットワーク(GMN)を提案する。
総合的な実験によって提案されたGMNの優位性を示し、最先端のアプローチよりも大幅に改善された。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:31:23 GMT)
A Prior Embedding-Driven Architecture for Long Distance Blind Iris Recognition [5.5] 遠距離ブラインドアイリス認識のための埋め込み駆動型アーキテクチャを提案する。
われわれはまずアイリス画像復元ネットワークIris-PPRGANを提案した。
ブラインドアイリスのテクスチャを効果的に復元するために、Iris-PPRGANは、プリミティブデコーダとして使用されるジェネレーティブアドリアネットワーク(GAN)と、エンコーダとして使用されるDNNとを含む。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 00:40:17 GMT)
Joint Neural Networks for One-shot Object Recognition and Detection [5.4] 本稿では,一発物体の認識と検出に難渋する課題に対処する,新しい結合ニューラルネットワーク手法を提案する。
Siameseのニューラルネットワークと最先端のマルチボックス検出アプローチにインスパイアされたジョイントニューラルネットワークは、トレーニングプロセス中に見つからないカテゴリのオブジェクト認識と検出を行うことができる。
提案手法は,MiniImageNetデータセット上での1ショットオブジェクト認識における61.41%の精度と,データセット上でトレーニングしてテストした場合の1ショットオブジェクト検出における47.1%のmAPを実現する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:48:03 GMT)
A Cross-Domain Benchmark for Active Learning [5.4] Active Learningは、データアノテーションのコストを削減するためにラベル付けの最も有益なサンプルを特定する。
最初のアクティブラーニングベンチマークであるemphCDALBenchを提案する。
emphCDALBenchは効率よく欲望のオラクルを提供することで、実験毎に50回のランで評価することができる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:57:48 GMT)
An Open-Source Library for Information Reconciliation in Continuous-Variable QKD [5.3] C++で書かれたこのライブラリは、情報和解の重要なタスクを単純化する。
多次元の和解、エラー修正、データの整合性チェックのためのモジュールを含む、包括的なツールセットを提供する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:02:03 GMT)
Leveraging Large Language Models (LLMs) for Traffic Management at Urban Intersections: The Case of Mixed Traffic Scenarios [5.2] 本研究では,都市交差点における交通管理を改善するため,大規模言語モデル(LLM)の能力について検討する。
我々はGPT-4o-miniを雇い、リアルタイムで交差点の紛争を分析し、予測し、検出し、解決した。
その結果, GPT-4o-miniは交通量, 混雑量, 混合速度条件の衝突を効果的に検出し, 解決することができた。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 23:06:06 GMT)
An introduction to reinforcement learning for neuroscience [5.0] 強化学習は、時間差学習のための報酬予測エラー信号としてドーパミンに関する初期の研究から、神経科学において豊富な歴史を持っている。
近年の研究は、ドーパミンが深層学習で普及した「分散強化学習」の形式を実装できる可能性を示唆している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:07:02 GMT)
DistillGrasp: Integrating Features Correlation with Knowledge Distillation for Depth Completion of Transparent Objects [4.9] RGB-Dカメラは透明な物体の深さを正確に捉えられない。
近年の研究では、新しい視覚的特徴を探求し、深度を再構築するための複雑なネットワークを設計する傾向にある。
本稿では,教師から学生への知識を蒸留するディスティルグラフという,効率的な深度補完ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:17:10 GMT)
Evolutionary Reinforcement Learning via Cooperative Coevolution [4.9] 本稿では,CoERLアルゴリズムを提案する。
協調的共進化に触発されて、CoERLは周期的に適応的にポリシー最適化問題を複数のサブプロブレムに分解する。
遺伝子操作子を使う代わりに、CoERLはポリシーを更新するために部分的な勾配を直接検索する。
6つのベンチマークロコモーションタスクの実験は、CoERLが7つの最先端アルゴリズムとベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:35:22 GMT)
Medical SAM 2: Segment medical images as video via Segment Anything Model 2 [4.9] 医用SAM2(MedSAM-2)は,2次元および3次元の医用画像のセグメンテーション作業に対処する高度なセグメンテーションモデルである。
MedSAM-2は、3Dの医療画像だけでなく、新しいOne-prompt機能をアンロックする。
以上の結果から,MedSAM-2は既存モデルに勝るだけでなく,医療画像のセグメンテーションタスクにも優れることがわかった。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:49:45 GMT)
T-Mamba: A unified framework with Long-Range Dependency in dual-domain for 2D & 3D Tooth Segmentation [4.9] 歯のセグメンテーションは、2次元および3次元の歯データに固有の高ノイズと低コントラストのために困難に満ちている。
本稿では,T-Mambaを導入し,周波数ベースの特徴と共有バイポジションエンコーディングを視覚マンバに統合する。
T-Mambaは、視覚マンバに周波数ベースの機能を導入する最初の試みであり、その柔軟性により、2Dと3Dの歯のデータの両方を、別個のモジュールを必要とせずに処理できる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:01:49 GMT)
Temporal Transfer Learning for Traffic Optimization with Coarse-grained Advisory Autonomy [4.8] 本稿では,人間ドライバーに対してリアルタイム運転アドバイザリを発行するアドバイザリ自律性について検討する。
ゼロショット転送のためのソースタスクを選択するために,TTLアルゴリズムを導入する。
様々な混合交通シナリオでアルゴリズムを検証する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 20:19:29 GMT)
Exploiting Preferences in Loss Functions for Sequential Recommendation via Weak Transitivity [4.8] 最適化の目的の選択は、レコメンダシステムの設計において極めて重要である。
そこで本研究では,スコア間の相対的な順序として,異なる選好レベルを明示的に活用するために,本来の目的を拡張した新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 06:55:19 GMT)
Efficient Patient Fine-Tuned Seizure Detection with a Tensor Kernel Machine [4.8] ウェアラブルデバイスでは、そのような患者固有のデータが利用可能になるまで、通常、患者に依存しないモデルから始まる。
本稿では,テンソルカーネルマシンを用いたトランスファー学習手法を提案する。
本手法は, 正準多進分解法を用いて, 圧縮形態で主重みを学習する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:16:57 GMT)
Advancing Medical Image Segmentation: Morphology-Driven Learning with Diffusion Transformer [4.7] 本稿では,雑音の存在下での頑健なセグメンテーションのためのトランスフォーマー拡散(DTS)モデルを提案する。
画像の形態的表現を解析する本モデルでは, 種々の医用画像モダリティにおいて, 従来のモデルよりも良好な結果が得られた。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:35:54 GMT)
Conformal Trajectory Prediction with Multi-View Data Integration in Cooperative Driving [4.6] 軌道予測に関する現在の研究は、主にエゴ車両の搭載センサーによって収集されたデータに依存している。
V2INetは、既存の単一ビューモデルを拡張することで、マルチビューデータをモデル化するための新しい軌道予測フレームワークである。
以上の結果から,FDE(Final Displacement Error)とMR(Miss Rate)において,単一GPUを用いた優れた性能を示した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:32:03 GMT)
rCanary: Detecting Memory Leaks Across Semi-automated Memory Management Boundary in Rust [4.6] Rustはコンパイル時の検証を通じてメモリ安全性を保証するシステムプログラミング言語である。
本稿では,半自動境界を越えたリークを検出する静的,非自動,完全自動モデルチェッカーであるrCanaryを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:02:04 GMT)
Quantum state tracking and control of a single molecular ion in a thermal environment [4.6] 単一分子の個々の状態間の熱放射誘起遷移のリアルタイム観測を報告する。
これらの「ジャンプ」はマイクロ波駆動の遷移によって逆転し、分子が選択された状態に居住する時間に20倍の改善がもたらされた。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 22:43:50 GMT)
Expressive MIDI-format Piano Performance Generation [4.5] この研究は、MIDIフォーマットで表現力のあるピアノ演奏を生成することができる生成型ニューラルネットワークを示す。
音楽の表現性は、鮮明なマイクロタイピング、豊かなポリフォニックテクスチャ、様々なダイナミクス、持続的なペダル効果によって反映される。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 20:36:37 GMT)
Enhancing Ethereum Fraud Detection via Generative and Contrastive Self-supervision [4.5] 本稿では,メタIFD(Meta-IFD)という2つの自己スーパービジョン強化詐欺検出フレームワークを提案する。
この枠組みは、最初はアカウントの相互作用を増強する生成的自己スーパービジョン機構を導入し、続いて様々な行動パターンを区別する対照的な自己スーパービジョン機構を導入した。
ソースコードは近いうちにGitHubでリリースされる予定だ。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:30:43 GMT)
UniTalker: Scaling up Audio-Driven 3D Facial Animation through A Unified Model [4.4] さまざまなアノテーションを持つデータセットを活用するために設計されたマルチヘッドアーキテクチャを特徴とする統一モデルUniTalkerを提案する。
トレーニング安定性の向上とマルチヘッド出力の整合性確保のために,PCA,モデルウォームアップ,ピボットIDの埋め込みという3つのトレーニング戦略を採用した。
単一の訓練されたUniTalkerモデルでは、BIWIデータセットでは9.2%、Vocasetでは13.7%の実質的なリップ頂点エラー削減を実現している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:59:27 GMT)
A Survey on the Applications of Zero-Knowledge Proofs [4.4] ゼロ知識計算(ゼロ知識計算、ZKP)は、計算の完全性とプライバシ技術における革命的な進歩である。
ZKPには、普遍性と最小限のセキュリティ仮定の点で、ユニークな利点がある。
この調査はzk-SNARKSと呼ばれるZKPのサブセットに焦点を当てている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 02:47:30 GMT)
A Hybrid Intelligence Method for Argument Mining [4.3] 我々は、意見テキストから議論を抽出するハイブリッド(人間+AI)手法であるHyEnAを提案する。
市民フィードバックコーパスを用いたHyEnAの評価を行った。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:24:13 GMT)
Open Set Recognition for Random Forest [4.3] 実世界の分類タスクでは、全てのクラスを消費するトレーニング例を収集することは困難である。
ランダム森林に対するオープンセット認識機能を実現するための新しい手法を提案する。
提案手法は,合成データセットと実世界のデータセットの両方で検証される。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 04:21:14 GMT)
On Inter-dataset Code Duplication and Data Leakage in Large Language Models [4.1] 本稿では,データセット間の重複現象とその大規模言語モデル(LLM)評価への影響について検討する。
この結果から,複数のSEタスクにまたがるLCMの評価は,データ間重複現象に起因する可能性が示唆された。
オープンソースモデルがデータセット間の重複に影響される可能性があることを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:49:43 GMT)
The opportunities and risks of large language models in mental health [3.9] メンタルヘルスの国際レートは上昇している。
既存のメンタルヘルスのモデルは、需要を満たすために十分に拡大しない、という認識が高まっている。
大規模言語モデル(LLM)の出現は、メンタルヘルスをサポートする新しい大規模ソリューションを作成するという彼らの約束に関して、非常に楽観的になっている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:15:34 GMT)
Bailing-TTS: Chinese Dialectal Speech Synthesis Towards Human-like Spontaneous Representation [3.9] Bailing-TTSは、高品質の中国語方言を生成できる大規模なTSモデルのファミリーである。
中国語の方言表現学習は、特定のトランスフォーマーアーキテクチャと多段階学習プロセスを用いて開発されている。
実験により、Bailing-TTSは人のような自然表現に向けて中国語の方言音声を生成することが示された。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 04:57:31 GMT)
Leveraging Entailment Judgements in Cross-Lingual Summarisation [3.8] クロスLingual Summarisation (CLS)データセットは、参照要約が対応する文書に不信であるような文書-要約ペアを含む傾向にある。
この低いデータ品質はモデル学習を誤解させ、評価結果を曖昧にする。
我々は,参照の忠実さとモデル生成要約を評価するために,既成の言語間自然言語推論(X-NLI)を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:18:09 GMT)
The Susceptibility of Example-Based Explainability Methods to Class Outliers [3.7] 本研究は,ブラックボックス機械学習モデルにおける実例に基づく説明可能性手法の有効性に及ぼすクラスアウトレーヤの影響について検討する。
本稿では,特に実例に基づく手法の正当性や妥当性などの既存の説明可能性評価尺度を改訂し,新しい尺度,識別可能性を導入する。
これらの指標を用いて、クラス外れを抑えようとする者を含む、現在の例に基づく説明可能性手法の欠点を強調した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:09:12 GMT)
"Patriarchy Hurts Men Too." Does Your Model Agree? A Discussion on Fairness Assumptions [3.7] グループフェアネスの文脈では、このアプローチはデータへのバイアスの導入方法に関する暗黙の仮定を曖昧にすることが多い。
我々は偏りの過程が公正スコアの単調関数であり、感度属性のみに依存すると仮定している。
偏見過程の振舞いは単なる単調性よりも複雑であり、つまり暗黙の仮定を特定し、否定する必要がある。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:06:30 GMT)
Convergence Analysis of Natural Gradient Descent for Over-parameterized Physics-Informed Neural Networks [3.7] 勾配勾配勾配(GD)や二次勾配勾配(SGD)のような一階法はニューラルネットワークのトレーニングに有効であることが証明されている。
回帰問題である$L2$の場合、学習率は$mathcalO(lambda_n2)$から$mathcalO(1/|bmHinfty|_2)$に改善できる。
我々はさらに、2層物理情報ニューラルネットワーク(PINN)の訓練におけるGDの手法を一般化する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:06:34 GMT)
ChunkAttention: Efficient Self-Attention with Prefix-Aware KV Cache and Two-Phase Partition [3.7] ChunkAttentionは、大きな言語モデルのためのプレフィックス対応のセルフアテンションモジュールである。
複数のリクエストにまたがる一致したプロンプトプレフィックスを検出し、実行時にそのキー/値テンソルをメモリで共有する。
実験の結果、ChunkAttentionは最先端の実装と比較して、自己保持カーネルを3.2-4.8$times$で高速化できることがわかった。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:51:25 GMT)
Ultra-High-Resolution Detector Simulation with Intra-Event Aware GAN and Self-Supervised Relational Reasoning [3.6] イベント内適応型ネットワーク(IEA-GAN)を提案する。
IEA-GANは検出器シミュレーションにおける事象を近似し、適切な誘導バイアスを伴う文脈化された高分解能フル検出器応答を生成する。
超高粒度画素頂点検出器(PXD)のためのセンサ依存画像生成におけるIEA-GANの適用を実証する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 05:15:43 GMT)
Quantum thermalization and Floquet engineering in a spin ensemble with a clock transition [3.6] 結晶中の数百万のイッテルビウム-171イオンの強い相互作用を持つアンサンブルを含む,光学的に対応可能な固体スピン系について検討した。
我々の研究結果は、希土類イオンのアンサンブルが多体物理学の多目的テストベッドとして機能し、量子技術の進歩に有用な洞察をもたらすことを示唆している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 03:16:25 GMT)
RepCNN: Micro-sized, Mighty Models for Wakeword Detection [3.5] 常時オンの機械学習モデルは、非常に少ないメモリと計算フットプリントを必要とする。
より大規模なマルチブランチアーキテクチャへの計算によって、小さな畳み込みモデルをよりよく訓練できることが示される。
我々は、常時起動するウェイクワード検出モデルであるRepCNNが、推論中のレイテンシと精度のトレードオフを良好に提供することを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 22:39:20 GMT)
Enhancing Multistep Prediction of Multivariate Market Indices Using Weighted Optical Reservoir Computing [3.4] 重み付き光貯水池計算システムを用いて,革新的な株価指数予測手法を提案し,実験的に実証した。
我々は、マクロ経済データと技術指標を組み合わせた基本的な市場データを構築し、株式市場のより広い振る舞いを捉える。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:41:08 GMT)
ShellFuzzer: Grammar-based Fuzzing of Shell Interpreters [3.4] ShellFuzzerは、多数のシェルスクリプトを自動的に生成することによって、Unixシェルインタプリタをテストするテクニックである。
私たちの評価では、ShellFuzzerは、mksh POSIX準拠のシェルの最新バージョンに影響を及ぼす、これまで知られていなかった8つの問題を明らかにするシェルプログラムを生成した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:10:24 GMT)
Beyond Silent Letters: Amplifying LLMs in Emotion Recognition with Vocal Nuances [3.4] 本稿では,Large Language Models (LLM) を用いた音声における感情検出の新しいアプローチを提案する。
音声の特徴を自然言語記述に変換することで音声入力処理におけるLLMの限界に対処する。
提案手法はこれらの記述をテキストプロンプトに統合し,LLMがアーキテクチャ変更なしにマルチモーダル感情分析を行うことを可能にする。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 01:17:34 GMT)
Invariant Discovery of Features Across Multiple Length Scales: Applications in Microscopy and Autonomous Materials Characterization [3.4] 可変オートエンコーダ(VAE)は、画像データの変動の基本的な要因を特定する強力なツールとして登場した。
異なる長さスケールでサンプル化した記述子を用いて,VAEの漸進的トレーニングに基づいて,SI-VAEアプローチを導入する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 01:48:46 GMT)
Demonstrating the Potential of Adaptive LMS Filtering on FPGA-Based Qubit Control Platforms for Improved Qubit Readout in 2D and 3D Quantum Processing Units [3.3] 本稿では,2次元および3次元量子処理ユニット(QPU)の読み出しパルス忠実度を最適化する研究を要約する。
我々は、量子状態検出の精度と効率を高めるために、LMS適応フィルタリングアルゴリズムの適用に焦点をあてる。
我々の予備的な結果は、FPGAリソースを効率的に管理しながら高い読み出し精度を維持するLMSフィルタの機能を示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 20:42:49 GMT)
An Experimental Evaluation of TEE technology Evolution: Benchmarking Transparent Approaches based on SGX, SEV, and TDX [3.3] Trusted Execution Environment (TEE)技術は、間違いなく最も有望なソリューションとして登場した。
本稿では,TDX,SEV,Gramine-SGX,Occlum-SGXの比較評価を行う。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:29:11 GMT)
Load Balancing in Federated Learning [3.3] Federated Learning(FL)は、複数のリモートデバイスに分散したデータからの学習を可能にする、分散機械学習フレームワークである。
本稿では,情報時代に基づくスケジューリングポリシーの負荷指標を提案する。
マルコフ連鎖モデルの最適パラメータを確立し、シミュレーションによりアプローチを検証する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 00:56:36 GMT)
Label merge-and-split: A graph-colouring approach for memory-efficient brain parcellation [3.3] 脳のパーセル化には、数百のセグメンテーションラベルを大きな画像量で推測する必要がある。
まず,学習に基づく全脳のパーセレーションに必要なラベルの有効数を大幅に削減する手法であるラベルマージ・アンド・スプリットを導入する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:34:47 GMT)
Infrequent Resolving Algorithm for Online Linear Programming [3.2] 本稿では,LPを時間的水平線上でのO(loglog T)$倍だけ解きながら,常に後悔するアルゴリズムを提案する。
我々のアルゴリズムは、LPの$O(loglog T)$ timesと$Oleft(T(1/2+epsilon)Mright)$ regretを、LPの$M$ timesを解くことで、絶え間ない後悔を保証できる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:09:01 GMT)
TriDeNT: Triple Deep Network Training for Privileged Knowledge Distillation in Histopathology [3.2] 提案するTriDeNTは,推論中に利用できない特権データを利用した,パフォーマンス向上のための自己教師型手法である。
本研究では, 空間化学, 空間転写学, 専門的核アノテーションなど, 様々なデータに対して本手法の有効性を実証する。
あらゆる設定において、TriDeNTは、ダウンストリームタスクにおける他の最先端メソッドよりも優れており、最大101%の改善が観察されている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:01:56 GMT)
MUFASA: Multi-View Fusion and Adaptation Network with Spatial Awareness for Radar Object Detection [3.1] レーダー点雲の空間は 正確な物体検出に 困難を生じさせます
本稿では,レーダポイント雲の包括的特徴抽出手法を提案する。
我々は、VoDデータセット上のレーダベース手法のmAPが50.24%である場合、最先端の結果を得る。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:52:18 GMT)
Penzai + Treescope: A Toolkit for Interpreting, Visualizing, and Editing Models As Data [3.1] Penzaiは、モデル操作を簡単にするためのニューラルネットワークライブラリである。
Treescopeはインタラクティブなビュートプリンダーであり、モデルインプット/アウトプットとモデル自体を視覚化できる配列ビジュアライザである。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 00:45:37 GMT)
An Empirical Study on Challenges of Event Management in Microservice Architectures [3.0] 本稿では,イベント管理の実践と課題の包括的特徴について述べる。
開発者は大きなイベントペイロード、イベントフローの監査、イベントの順序付けといった多くの問題に直面している。
このことは、開発者は最先端の技術で十分に機能していないことを示唆している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:19:37 GMT)
Co-designing an AI Impact Assessment Report Template with AI Practitioners and AI Compliance Experts [3.0] 我々は,EU AI Act, NIST's AI Risk Management Framework, ISO 42001 AI Management Systemに根ざしたインパクトアセスメントレポートのテンプレートを提案する。
同一企業の8人のAI実践者と業界と学界の5人のAIコンプライアンス専門家によるユーザスタディによると、私たちのテンプレートは、インパクトアセスメントに必要な情報を効果的に提供しています。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 22:11:48 GMT)
End-to-End Protocol for High-Quality QAOA Parameters with Few Shots [2.9] 複数パラメータ設定と大規模数値実験を組み合わせたエンドツーエンドプロトコルを開発した。
最大32ドルのキュービットと5ドルのQAOAレイヤを使って、最適化されたイオンプロセッサを実装します。
これらは、トラップされたイオンプロセッサ上でのQAOAパラメータチューニングの最大のデモである。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:39:40 GMT)
A deep learning-enabled smart garment for versatile sleep behaviour monitoring [2.9] スマート衣服にプリントされた頑丈で耐久性のある超感光性ひずみセンサを, 首輪部で報告した。
6つの睡眠状態(鼻呼吸、口呼吸、かゆみ、ブラキシズム、中枢性睡眠時無呼吸症(CSA)、閉塞性睡眠時無呼吸症(OSA))を98.6%の精度で正確に識別することができる。
スケーラブルな製造プロセス、堅牢性、高精度、スマートウェアの優れた一般化により、次世代の連続睡眠監視に有望なツールとなっている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:56:25 GMT)
Downstream bias mitigation is all you need [2.8] 本稿では,大規模言語モデル(LLM)による事前学習および微調整後のタスク固有行動におけるバイアスの程度について検討する。
事前トレーニングが重要であることは分かっていますが、モデルが事前トレーニングされた後、微調整データセットにおける共起率のわずかな変化でさえ、モデルのバイアスに大きな影響を及ぼします。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:52:04 GMT)
To reset, or not to reset -- that is the question [2.7] テキストブックの量子誤差補正は、測定後にキュービットがリセットされることを要求する。
多くの最先端の量子誤り補正実験は、非リセットアプローチを選択している。
非条件リセット量子ビットは、フォールトトレラント論理演算の持続時間を最大2倍に削減できる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:57:56 GMT)
Learned Compression of Point Cloud Geometry and Attributes in a Single Model through Multimodal Rate-Control [2.7] 我々は単一適応オートエンコーダモデルを用いて幾何学と属性の合同圧縮を学習する。
本評価は, 形状と属性に対する最先端圧縮手法に匹敵する性能を示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:31:06 GMT)
The Impact of Quantization on Retrieval-Augmented Generation: An Analysis of Small LLMs [2.7] 学習後の量子化は、Large Language Models (LLM) の計算需要を減らすが、その能力の一部を弱める可能性がある。
本稿では、量子化がより小さなLLMの検索強化生成(RAG)能力にどのように影響するかを考察する。
この結果から, 7B LLM がそのタスクをうまく実行した場合, 量子化ではその性能や長文推論能力が損なわれないことが判明した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:27:20 GMT)
Optimally robust shortcuts to population inversion in cat-state qubits [2.7] 立方体量子ビットはバイアスノイズチャネルを持ち、ビットフリップエラーは他の全てのエラーに支配される。
キャット状態量子ビットにおけるほぼ完全な個体数逆転を実現するために, 近近距離法と近距離法を併用した最適ロバストプロトコルを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:08:39 GMT)
A Unified Framework for Pattern Recovery in Penalized and Thresholded Estimation and its Geometry [2.6] 実数値多面体ゲージによるペナルティ項の与えられるペナルティ推定の枠組みを考察する。
サブディファレンシャルに基づいてパターンの新規かつ一般的な概念を定義し,パターンの複雑さを測定するアプローチを定式化する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:03:44 GMT)
Analysis of Functional Insufficiencies and Triggering Conditions to Improve the SOTIF of an MPC-based Trajectory Planner [2.6] SOTIF(Safety-of-the-intended-function)は、2022年にリリースされたISO21448の標準規格である。
本研究の目的は,(1)汎用MPCベーストラジェクトリプランナのSOTIF解析と(2)ISO21448で記述された汎用手順の解釈と具体的適用である。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:43:34 GMT)
Robust Implementation of Discrete-time Quantum Walks in Any Finite-dimensional Quantum System [2.5] 離散時間量子ウォーク(DTQW)は、回路実装に最も適した選択の1つである。
本稿では,ゲート数および回路深さに関する回路コストを半減することに成功した。
提案手法の工学的卓越性には、近似効率を持つ任意の有限次元量子系にDTQWを実装している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:07:13 GMT)
A Notion of Complexity for Theory of Mind via Discrete World Models [2.5] ToM(Theory of Mind)は、社会的推論が必要な複雑なシナリオにおいて、LLM(Large Language Models)の機能を評価するために用いられる。
本稿では,ToMタスクの複雑さを計測するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:44:19 GMT)
Ontological Relations from Word Embeddings [2.4] BERTのような一般的なニューラルモデルから得られる単語埋め込みの類似性は、それらの単語の意味の意味的類似性の形で効果的に近似することが確実に示されている。
これらの埋め込みの上に単純なフィードフォワードアーキテクチャを組み込むことで、入力データに応じて様々な一般化能力を持つ有望な精度が得られることを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:31:32 GMT)
ReSi: A Comprehensive Benchmark for Representational Similarity Measures [2.4] 本稿では,表現類似度評価のための最初の総合的ベンチマークを提案する。
表現類似度(ReSi)ベンチマークは、(i)類似度測定のための慎重に設計された6つのテスト、(ii)23の類似度測定、(iii)ニューラルネットワークアーキテクチャー、(iv)グラフ、言語、ビジョンドメインにまたがる6つのデータセットからなる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:08:02 GMT)
D-CDLF: Decomposition of Common and Distinctive Latent Factors for Multi-view High-dimensional Data [2.2] 複数の高次元データビューの合同解析における典型的なアプローチは、各ビューのデータマトリックスを3つの部分に分解することである。
本稿では,2視点データに対する非相関性を効果的に実現するために,D-CDLF (Decomposition of Common and Distinctive Latent Factors) と呼ばれる新しい分解法を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 21:39:05 GMT)
MAARS: Multi-Rate Attack-Aware Randomized Scheduling for Securing Real-time Systems [2.2] 現代のサイバー物理システム(CPS)は、通信ネットワークによって相互接続される多数の制御ユニットで構成されている。
安全クリティカルなタスクの多くは、その安全性とパフォーマンス分析に役立つ決定論的タイミング動作を保証するために、固定サンプリング期間で実行される。
敵は、安全クリティカルなタスクのこの決定論的行動を利用して、推論ベースの攻撃を起動することができる。
本稿では,このようなタイミング予測やスケジュールに基づく攻撃を防止し,最小限に抑え,制御ユニットを危険にさらすことを目的とする。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:25:15 GMT)
DiM-Gesture: Co-Speech Gesture Generation with Adaptive Layer Normalization Mamba-2 framework [2.2] 生音声のみから、高度にパーソナライズされた3Dフルボディジェスチャーを作成するために作られた生成モデル。
Modelは、Mambaベースのファジィ特徴抽出器と非自己回帰適応層正規化(AdaLN)Mamba-2拡散アーキテクチャを統合している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:22:47 GMT)
MPT-PAR:Mix-Parameters Transformer for Panoramic Activity Recognition [2.2] 本稿では,各タスクのユニークな特徴と異なるタスク間の相乗効果を同時に考慮したMPT-PARモデルを提案する。
提案手法は,JRDB-PARデータセットの粒度とF1総合スコアを47.5%とした。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:42:44 GMT)
Future Directions in Human Mobility Science [2.1] 空間認知がモビリティパターンをどのように形成するかをよりよく理解する必要性について論じる。
我々は新しい交通形態をよりよく理解することの重要性を論じる。
我々は、アルゴリズムがモビリティの振る舞いをどのように形成し、モデリングに有用なツールを提供するかについて論じる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:49:24 GMT)
Multi-Modal Parameter-Efficient Fine-tuning via Graph Neural Network [2.1] 本稿では,グラフネットワークに基づくマルチモーダルパラメータ効率の微調整手法を提案する。
提案したモデルでは,OxfordPets,Flowers102,Food101の各データセットでそれぞれ4.45%,2.92%,0.23%の改善が達成されている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 05:24:20 GMT)
Deep Learning Approach for Changepoint Detection: Penalty Parameter Optimization [2.1] 動的プログラミング変化点検出アルゴリズムは、シーケンス内の変化点の位置を特定するために使用される。
本研究では、ペナルティパラメータを予測するための新しい深層学習手法を導入し、大規模ベンチマークによるラベル付きデータセットにおける変更点検出精度を明らかに向上させた。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:10:05 GMT)
AMAES: Augmented Masked Autoencoder Pretraining on Public Brain MRI Data for 3D-Native Segmentation [2.1] 本研究では,3次元セマンティックセグメンテーションモデルの自己教師付き事前学習が大規模・ドメイン固有データセットに与える影響について検討した。
我々は、公開ソースから44,756個の脳MRIボリュームのデータセットであるBRAINS-45Kを紹介した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:27:48 GMT)
What comes after transformers? -- A selective survey connecting ideas in deep learning [1.9] 2017年以降、トランスフォーマーは人工知能のデファクトスタンダードモデルとなっている。
研究者にとって、こうした発展をより広いレベルで追跡することは困難である。
深層学習の基本的な理解をすでに持っている人たちに対して、これらの領域における多くの重要かつ最近の研究の概要を包括的に紹介する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:50:25 GMT)
Annotator in the Loop: A Case Study of In-Depth Rater Engagement to Create a Bridging Benchmark Dataset [1.8] 本稿では,アノテーションのための新規かつ協調的かつ反復的なアノテーション手法について述べる。
以上の結果から,アノテータとの連携によりアノテーションの手法が強化されることが示唆された。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 19:11:08 GMT)
Graph neural network-based surrogate modelling for real-time hydraulic prediction of urban drainage networks [1.8] 物理モデルに基づくモデルは、計算に時間がかかり、都市排水網のリアルタイムシナリオには有効ではない。
完全に接続されたニューラルネットワーク(NN)は、潜在的な代理モデルであるが、複雑なターゲットに適合する際の解釈可能性と効率の低下に悩まされる可能性がある。
本研究は, 排水網の水理予測問題に対する流路モデルのGNNに基づくサロゲートを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:10:45 GMT)
Few-shot Defect Image Generation based on Consistency Modeling [1.8] DefectDiffuは、複数の製品にまたがる欠陥の一貫性をモデル化する、新しいテキスト誘導拡散法である。
DefectDiffuは、世代品質と多様性の点で最先端の手法を超越している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:29:42 GMT)
Unlocking Guidance for Discrete State-Space Diffusion and Flow Models [1.8] 本稿では、離散状態空間モデルにガイダンスを適用するための汎用的および原則的手法を提案する。
提案手法は, 画像のガイド生成, 小分子, DNA配列, タンパク質配列など, 様々な用途に応用できることを実証する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 03:29:32 GMT)
A Qualitative Study on Using ChatGPT for Software Security: Perception vs. Practicality [1.8] ChatGPTは大きな言語モデル(LLM)であり、目覚ましい意味理解と精度で様々なタスクを実行できる。
本研究は,ソフトウェアセキュリティを支える新技術としてChatGPTの可能性を理解することを目的としている。
セキュリティ実践者は、ChatGPTを脆弱性検出、情報検索、侵入テストなど、さまざまなソフトウェアセキュリティタスクに有用であると判断した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:14:05 GMT)
3D U-KAN Implementation for Multi-modal MRI Brain Tumor Segmentation [1.7] 我々は,元の2次元U-KANモデルを3Dタスクに適用し,Squeeze-and-Excitationモジュールを組み込んだUKAN-SEという変種を導入する。
我々は、BraTS 2024データセットを用いて、U-KANとU-KAN-SEの性能を、U-Net、Attention U-Net、Swin UNETRといった既存の手法と比較した。
U-KANとUKAN-SEは約1060万のパラメータを持ち、U-NetとAttention U-Netのトレーニング時間の1/4と1/6しか必要とせず、例外的な効率を実現している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 04:27:10 GMT)
QuestGen: Effectiveness of Question Generation Methods for Fact-Checking Applications [1.7] 機械学習による質問は、事実確認のクレームに有効であることを示す。
意外なことに、機械による質問で得られた証拠は、人間が書いた質問よりも、事実チェックにかなり効果的であることが証明されている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:35:57 GMT)
Deep Learning in Medical Image Classification from MRI-based Brain Tumor Images [1.6] 脳腫瘍は世界で最も致命的な疾患の一つである。磁気共鳴イメージング(MRI)は、脳腫瘍を検出する最も効果的な方法の1つである。
MRIスキャンによる脳腫瘍の正確な検出は、多くの命を救う可能性があり、疾患の初期段階におけるより良い意思決定を促進するため、非常に重要である。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:20:20 GMT)
RDP: Ranked Differential Privacy for Facial Feature Protection in Multiscale Sparsified Subspace [1.6] 顔認識システムは、ユーザーの顔画像にアクセスし、それを顔認識システムに侵入できる潜在的な敵に侵入されるという真の脅威に直面している。
本稿では,Ranked Differential Privacy (RDP) と名づけられた顔の特徴を保護するため,マルチスケールの特徴空間における新たなプライバシ保護手法を提案する。
非線形LM問題を解くための2つの手法を提案し, 最適な雑音スケールパラメータを求める。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 05:41:59 GMT)
A Unifying Privacy Analysis Framework for Unknown Domain Algorithms in Differential Privacy [1.6] 我々は、未知のドメイン上でヒストグラムをリリースするための、既存の微分プライベートアルゴリズムのいくつかを再検討する。
未知の領域でヒストグラムをリリースする主な実用的利点は、アルゴリズムが欠落したラベルを埋める必要がないことである。
いくつかの既存アルゴリズムのプライバシー分析のための統一的なフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 20:58:02 GMT)
Rank Is All You Need: Estimating the Trace of Powers of Density Matrices [1.5] 同一の$k$密度行列のパワーのトレースを推定することは、多くのアプリケーションにとって重要なサブルーチンである。
The Newton-Girard method, we developed a algorithm that only $mathcalO(r)$ qubits and $mathcalO(r)$ multi-qubit gates。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 06:23:52 GMT)
Conformal prediction for frequency-severity modeling [1.5] 本稿では,保険請求の予測間隔を構築するためのモデルに依存しない枠組みを提案する。
我々は2段階の周波数重大度モデリングの領域に共形予測を分割する手法を拡張した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:51:44 GMT)
The State of the Art in transformer fault diagnosis with artificial intelligence and Dissolved Gas Analysis: A Review of the Literature [1.5] 変圧器故障診断(TFD)は、電力系統の保守と管理において重要な側面である。
本稿では,人工知能(AI)と溶存ガス分析(DGA)を用いたTFDにおける技術の現状を概観する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 22:49:23 GMT)
What makes for good morphology representations for spatial omics? [1.4] 本稿では,空間オミクスと形態学の組み合わせ法を分類する枠組みを提案する。
翻訳によって、空間的に遺伝子発現パターンと相関する形態的特徴を見つけることを意味する。
統合によって、遺伝子発現パターンを空間的に補完する形態的特徴を見つけることを意味する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:56:15 GMT)
Designing Efficient LLM Accelerators for Edge Devices [1.4] 大きな言語モデル(LLM)は、リソース制約のあるエッジデバイスにデプロイすることで、ネットワーク接続への依存を低減し、よりプライバシーを提供する。
この問題に対処するため、LLM推論のための新しい効率的なエッジアクセラレータを設計することが重要である。
本稿では,効率的なFPGAベースのLCMアクセラレータの設計,統合,展開プロセスの合理化にSECDA手法を用いるSECDA-LLMを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:06:05 GMT)
Grappa -- A Machine Learned Molecular Mechanics Force Field [1.3] Grappaは、分子グラフから分子パラメータを予測する機械学習フレームワークである。
最先端の分子力学の精度で、小さな分子、ペプチド、RNA、ラジカルのエネルギーと力を予測する。
我々の力場は、化学精度に近い生体分子シミュレーションの段階を定式化されたタンパク質力場と同じ計算コストで設定する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:14:27 GMT)
The Monetisation of Toxicity: Analysing YouTube Content Creators and Controversy-Driven Engagement [1.3] 本稿では, 論争, 毒性, 収益化の関連性に着目し, 論争を巻き起こす内容の定量的分析を行う。
16,349本の動画と1億5500万以上のコメントを含む、Redditの議論から抽出された20の議論のあるYouTubeチャンネルからなるキュレートされたデータセットを紹介します。
我々は、ビデオ記述からアフィリエイトマーケティングや直接販売を含む様々なモデルに収益化の手がかりを特定し、分類する。
以上の結果から,有毒なコメントは高いエンゲージメントと相関するが,収益化に悪影響を及ぼすことが明らかとなった。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:10:35 GMT)
Longitudinal Evaluation of Child Face Recognition and the Impact of Underlying Age [1.3] 様々な新興アプリケーションにおける子供の信頼できる識別の必要性が、子供の顔認証技術を活用したいという関心を喚起している。
本研究は,クラークソン大学CITeR研究グループによって収集されたYFAデータベースを6ヶ月間隔で収集した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 19:40:55 GMT)
Outlier Detection in Large Radiological Datasets using UMAP [1.2] バイオメディカルデータでは、画像の品質、ラベル付け、レポート、アーカイブのバリエーションは、エラー、矛盾、繰り返しサンプルにつながる可能性がある。
ここでは、一様多様体近似および射影アルゴリズムが、本質的には独立クラスタを形成することによってこれらの異常を見つけることができることを示す。
結果はアーカイブとふりかえりですが、グラフベースのメソッドはどんなデータ型でも機能します。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 01:59:39 GMT)
Towards Automated Continuous Security Compliance [1.2] 高度に規制されたドメインにおける主要な関心事である、特にセキュリティ規制の遵守は、業界や研究に高い関連性を持つ継続的セキュリティコンプライアンスをもたらす。
業界で継続的ソフトウェアエンジニアリングを採用する上で重要な障壁の1つは、従来の手動のセキュリティコンプライアンスアクティビティのリソース集約的でエラーを起こしやすい性質である。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:13:38 GMT)
Unlocking Fair Use in the Generative AI Supply Chain: A Systematized Literature Review [1.2] この研究は、異なる利害関係者がGenAIサプライラインへのコントリビューションでどのような価値を見出しているかを明らかにすることを目的としている。
この評価により、GenAI企業によって提唱された公正利用が、科学と芸術の振興を目的とした著作権法の進歩を訓練するかどうかを理解することができる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:53:11 GMT)
Classical Benchmarks for Variational Quantum Eigensolver Simulations of the Hubbard Model [1.1] 電子相関が強ければ大きいほど, 基底状態エネルギーと波動関数プラトーの誤差が大きくなることを示す。
本研究は,量子ハードウェア上でのHubbardモデルを解くための現在のアプローチの能力と限界を強調した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:00:04 GMT)
Accelerating Full Waveform Inversion By Transfer Learning [1.1] フルウェーブフォーム・インバージョン (FWI) は、波動伝搬によって得られた疎測定データに基づいて材料フィールドを再構築する強力なツールである。
特定の問題に対して、ニューラルネットワーク(NN)による材料フィールドの識別は、対応する最適化問題の堅牢性と再構築品質を向上させる。
本稿では,NNベースのFWIをさらに改善するために,新しいトランスファー学習手法を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:39:06 GMT)
A higher-order transformation approach to the formalization and analysis of BPMN using graph transformation systems [1.1] 本稿ではBPMNの実行セマンティクスの形式化を提案する。
私たちのアプローチは、BPMNモデルからグラフ変換システムへの高次の変換に基づいています。
このアプローチの能力を示すため、オープンソースのWebベースツールとして実装しました。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 20:48:46 GMT)
Adaptive Quantum Generative Training using an Unbounded Loss Function [1.0] 本稿では,適応微分組立問題Talored ansatzフレームワークを用いた生成量子学習アルゴリズムR'enyi-ADAPTを提案する。
ランダムな2局所熱状態の学習により,この手法を他の最先端適応アルゴリズムと比較した。
R'enyi-ADAPTは、既存の手法と競合する浅い量子回路を構築することができるが、R'enyi分散損失関数により勾配は良好であることを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 01:04:53 GMT)
Perfect Wave Transfer in Continuous Quantum Systems [1.0] 反射対称性は任意の不均一共形場理論における完全波動伝達(PWT)に必要であることを示す。
ボゾン化を用いて、これらの概念を相互作用する場の量子論に拡張する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:15:44 GMT)
Improving Text Embeddings for Smaller Language Models Using Contrastive Fine-tuning [1.0] 我々はNLIデータセットに対して対照的な微調整を行う。
MiniCPMは、平均56.33%のパフォーマンス向上の最も重要な改善を示している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:31:35 GMT)
OpenUAS: Embeddings of Cities in Japan with Anchor Data for Cross-city Analysis of Area Usage Patterns [1.0] このデータセットは、市場分析、都市計画、交通インフラ、感染予測といった分野における地域機能の分析に有用である。
オフィス地区や住宅地区など市内各地区の特徴を、埋設技術を用いて捉えている。
障害の1つは、異なる都市や時代からのデータを、生の位置情報を共有することなく統一された空間に統合することである。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:38:35 GMT)
Enhanced Local Explainability and Trust Scores with Random Forest Proximities [0.9] 我々は任意のランダム森林回帰モデルと分類モデルを適応重み付きK近傍モデルとして数学的に定式化できるという事実を利用する。
この線形性は、トレーニングセットの観測における任意のモデル予測に対する属性を生成するRF予測の局所的な説明可能性を促進する。
本稿では, モデル予測だけでなく, サンプル外性能を説明するために, SHAPと組み合わせて, この近接性に基づく説明可能性のアプローチをいかに活用できるかを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:38:27 GMT)
Quantum Hamiltonian Embedding of Images for Data Reuploading Classifiers [0.9] 最初の考慮事項の1つは、量子機械学習モデル自体の設計である。
最近の研究は、スピードアップによる量子アドバンテージが量子機械学習の正しい目標かどうかを疑問視し始めた。
本稿では,古典的なディープラーニングアルゴリズムの設計を量子ニューラルネットワークの設計に取り入れることで,代替手法を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 02:19:08 GMT)
Beyond full statevector simulation with Qibo [0.8] 我々は最近、Qiboにオプションバックエンドとして追加された2つの新しい量子回路シミュレーションプロトコルを提案する。
クリフォードとテンソルネットワークのシミュレーションのための2つの新しいバックエンドを提示し、最先端技術に対してベンチマークする。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:47:01 GMT)
Smoothed Energy Guidance: Guiding Diffusion Models with Reduced Energy Curvature of Attention [0.8] 条件付き拡散モデルは、視覚コンテンツ生成において顕著な成功を収めている。
非条件ガイダンスを拡張しようとする最近の試みはテクニックに依存しており、その結果、最適以下の生成品質が得られる。
Smoothed Energy Guidance (SEG) を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:59:09 GMT)
Enhancing Solar Driver Forecasting with Multivariate Transformers [0.8] 我々は、時系列変換器(PatchTST)を用いたF10.7、S10.7、M10.7、Y10.7ソーラードライバ予測のためのフレームワークを開発する。
太陽活動の高レベルと低レベルを均等に表現するために、太陽運転者の歴史的分布とトレーニングセットの間の距離に基づいて、試料を重み付けするためのカスタム損失関数を構築した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 20:54:46 GMT)
A Search for High-Threshold Qutrit Magic State Distillation Routines [0.8] 我々は、奇妙な状態として知られる高対称性のクエット魔法状態に対する高閾値魔法状態蒸留ルーチンを探索する。
11-qutritのGolayコード以外は、線形ノイズ抑制よりも優れた奇妙な状態を蒸留する$n23$のqutritsのコードは見つからなかった。
これらの符号はいずれも 11-qutrit の Golay 符号のしきい値を超えないが、その存在は、大きな符号に対して、石英の奇妙な状態を蒸留する能力が幾らか汎用的であることを示唆している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:16:34 GMT)
Embedded FPGA Developments in 130nm and 28nm CMOS for Machine Learning in Particle Detector Readout [0.7] フィールドプログラマブルゲートアレイ(eFPGA)技術は、アプリケーション固有の集積回路(ASIC)の設計における再構成可能なロジックの実装を可能にする
FABulous"と呼ばれるオープンソースのフレームワークは、130nmと28nmのCMOS技術ノードを用いたeFPGAの設計に使用された。
ソースにおけるセンサデータの削減のために設計された機械学習ベースの分類器を合成し、eFPGA上に構成した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 19:41:07 GMT)
Investigating Brain Connectivity and Regional Statistics from EEG for early stage Parkinson's Classification [0.7] 脳波データ(EEG)を用いたパーキンソン病早期分類における脳機能指標と信号統計値の併用の有効性を評価する。
位相ラグ指数がN1データに対して最大86%の個人分類精度を達成し,各覚醒状態に最適な接続距離を求める。
パーキンソン病の分類におけるN1脳波の有用性は明らかであり, PDにおけるN1睡眠の障害によるものと考えられた。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:58:21 GMT)
Regional quality estimation for echocardiography using deep learning [0.7] 過去の研究はしばしば、心エコー図の視線精度と画質の区別に失敗する。
従来の研究は、その実用性を制限するグローバルな画像品質の値しか提供していない。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:20:47 GMT)
Enhancing Semantic Similarity Understanding in Arabic NLP with Nested Embedding Learning [0.7] この研究は、Matryoshka Embedding Learningを通じてアラビア語の入れ子埋め込みモデルをトレーニングするための新しいフレームワークを提示している。
我々の革新的な貢献には、様々な文類似性データセットをアラビア語に翻訳することが含まれる。
アラビア自然言語推論三重項データセットの埋め込みモデルを訓練し、その性能を評価した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:24:01 GMT)
Enhanced Structured State Space Models via Grouped FIR Filtering and Attention Sink Mechanisms [0.7] 本稿では,A-乗算を複数のグループに分解することで課題を軽減する高度なアーキテクチャを提案する。
ストリーミング言語モデルで特定される「アテンションシンク」現象にインスパイアされ、モデルの安定性と性能を高めるための同様のメカニズムを組み込んだ。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 02:49:58 GMT)
UlRe-NeRF: 3D Ultrasound Imaging through Neural Rendering with Ultrasound Reflection Direction Parameterization [0.6] 従来の3D超音波イメージング法には、解像度の固定化、ストレージ効率の低さ、コンテキスト接続性の不足といった制限がある。
暗黙的なニューラルネットワークと明示的な超音波レンダリングアーキテクチャを組み合わせた新しいモデルUlRe-NeRFを提案する。
実験の結果,UlRe-NeRFモデルは高忠実度超音波画像再構成の現実性と精度を著しく向上させることがわかった。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:22:29 GMT)
The hBN defects database: a theoretical compilation of color centers in hexagonal boron nitride [0.6] 六方晶窒化ホウ素(hBN)の発色中心は、量子技術への応用の可能性から、集中的に研究されている。
本稿では,hBN欠陥の電子構造を網羅した密度汎関数理論(DFT)に基づく検索可能なオンラインデータベースを公表する。
実験的に観察された欠陥シグネチャを入力でき、データベースは縮小可能な候補を出力する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:45:31 GMT)
Coherence as entropy increment for Tsallis and Renyi entropies [0.5] 原状態のTsallisエントロピーとそれに最も近い非コヒーレント状態との差をTsallis相対エントロピーで測定した場合に定義する。
Tsallisエントロピーは、非常に制限的な操作のクラスでない限り、真のコヒーレンスモノトンさえ生成しないことを示す。
我々は,Tsallis あるいは R'enyi の相対エントロピーによる測定において,最も近い非コヒーレント状態に基づく2つのコヒーレンス測度を示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:21:22 GMT)
Noise-Resilient and Reduced Depth Approximate Adders for NISQ Quantum Computing [0.5] NISQ量子コンピューティングにおける量子加算器回路のノイズレジリエンスの近似計算による改善について検討する。
雑音耐性を保ちながら、深さを減らすために、近似量子加算器の5つの設計を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 21:34:02 GMT)
A Nested Model for AI Design and Validation [0.5] 新しい規制の必要性にもかかわらず、規制科学とAIの間にはミスマッチがある。
AI設計と検証のための5層ネストモデルが、これらの問題に対処することを目指している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:46:26 GMT)
Speed Limit Reduction Enhances Urban Worker Safety: Evidence from a Decade of Traffic Incidents in Santiago, Chile [0.5] 本研究では,チリのサンティアゴにおける10年間の労働関連交通事故データを分析した。
オートバイとサイクルは、それぞれ26.94日と13.06日の医療休暇で、より重傷を負っている。
女性労働者は重傷を負いがちで、平均で7.57日間の医療休暇を減らしている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:29:35 GMT)
Boosted generalized normal distributions: Integrating machine learning with operations knowledge [0.5] 医療業務文献から得られた知見を活用すれば,患者待ち時間とサービス時間の分布予測が有意に改善できることが示唆された。
具体的には、$b$GNDは、それぞれ待ち時間とサービス時間を予測するために使用される分散に依存しないMLベンチマークよりも6%と9%パフォーマンスがよい。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 23:12:50 GMT)
Understanding Vector-Valued Neural Networks and Their Relationship with Real and Hypercomplex-Valued Neural Networks [0.5] 本稿では,ベクトル値ニューラルネットワーク(V-nets)の広範なフレームワークを提案する。
我々は、超複素数値ニューラルネットワークを含むV-netが、現在のディープラーニングライブラリにおいて、実数値ネットワークとしてどのように実装できるかを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:16:23 GMT)
Nonparametric Strategy Test [0.5] 本稿では,エージェントが与えられた混合戦略に従っているかどうかを,エージェントのプレイのサンプルが与えられた繰り返し戦略形式のゲームで判定する非パラメトリック統計的テストを提案する。
これには、エージェントの純粋な戦略の頻度がターゲットのイテレーションに十分近いかどうかを判断し、選択された純粋な戦略が異なるゲームイテレーション間で独立であるかどうかを決定する2つのコンポーネントが含まれる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 19:50:37 GMT)
ChordSync: Conformer-Based Alignment of Chord Annotations to Music Audio [0.5] ChordSyncはコンバータベースのモデルで、コードアノテーションとオーディオトラックをシームレスにアライメントするように設計されている。
また,事前に訓練されたモデルとユーザフレンドリーなライブラリを提供し,コードアノテーションとオーディオトラックをシームレスに同期させることができる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:16:29 GMT)
The Energy Cost of Artificial Intelligence of Things Lifecycle [0.5] そこで本研究では,AIoTシステムのライフサイクル全体にわたって,推論のエネルギーコストを計測する新しい指標を提案する。
eCALでは、モデルが良くなるほど、それが使われるほど、推論のエネルギー効率が良くなることを示す。
また、エネルギー消費と炭素強度(CI)に基づいて、同等のCO$2$排出量を計算し、AIoTシステムの炭素フットプリントを評価する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:23:15 GMT)
The DSA Transparency Database: Auditing Self-reported Moderation Actions by Social Media [0.5] データベースの最初の100日間で、EUの8大ソーシャルメディアプラットフォームから提出された353.12万レコードを分析した。
さまざまな分野にわたる政策立案者や学者にとって,本研究は大きな意味を持つ。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:22:11 GMT)
Illustrating Classic Brazilian Books using a Text-To-Image Diffusion Model [0.4] 潜在拡散モデル(LDMs)は、AI能力の領域におけるパラダイムシフトを意味する。
本稿は、文学作品の描写に安定拡散 LDM を用いることの可能性について考察する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:28:15 GMT)
CARMIL: Context-Aware Regularization on Multiple Instance Learning models for Whole Slide Images [0.4] 複数のインスタンス学習モデルは、全スライド画像のがん予後に有効であることが証明されている。
元のMILの定式化は、同じ画像のパッチが独立であると誤って仮定する。
空間知識を任意のMILモデルにシームレスに統合する多目的正規化手法を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:59:57 GMT)
Y Social: an LLM-powered Social Media Digital Twin [0.4] われわれは、オンラインソーシャルメディアプラットフォームを再現するために設計された次世代デジタルツインYを紹介する。
Yはユーザエンゲージメント、情報拡散、プラットフォームポリシーの影響に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:16:21 GMT)
Advancing Multimodal Data Fusion in Pain Recognition: A Strategy Leveraging Statistical Correlation and Human-Centered Perspectives [0.4] 本研究では、痛み行動認識のための新しいマルチモーダルデータ融合手法を提案する。
1)データ駆動型統計関連度重みを融合戦略に統合し,2)マルチモーダル表現学習に人間中心の運動特性を取り入れた。
本研究は,患者中心型医療介入を推進し,説明可能な臨床意思決定を支援するために重要な意味を持つ。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:07:45 GMT)
Early Stopping Based on Repeated Significance [0.2] 成功のための単一の基準を持つバケットテストでは、成功基準に対する$alpha$よりも小さい$p$-valueを要求すると、レベル1 - α$で統計的信頼が得られる。
複数の基準に対して、$alpha$を基準に分割するボネロニ補正は、各基準に対してより低い$p$-値を必要とするコストで統計的信頼を生み出す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 20:58:07 GMT)
Application of Transformers for Nonlinear Channel Compensation in Optical Systems [0.2] 変換器をベースとした非線形光チャネル等化器を提案する。
並列計算の活用とシンボル列間の直接メモリへの接続により,変換器を非線形補償に有効に利用できることを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:52:32 GMT)
Prognosis of COVID-19 using Artificial Intelligence: A Systematic Review and Meta-analysis [0.2] この研究は、新型コロナウイルスの予後のためのAIの使用に関する論文を同定し、評価し、合成する。
例えば、Siamenseモデル、サポートベクターマシン、ランダムフォレスト、eXtreme Gradient Boosting、畳み込みニューラルネットワークなどである。
その結果, 死亡率71%, 88%, 67%の感度, 重症度評価, 換気の必要性が確認された。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 00:33:32 GMT)
Emergence of a second law of thermodynamics in isolated quantum systems [0.2] 熱力学の第2法則は、孤立系のエントロピーは時間とともにしか増加しないと述べている。
これは、Schr"odinger方程式の下で孤立量子系の可逆進化と矛盾しているように見える。
与えられた可観測性に関するエントロピーは、系のユニタリ進化の過程でその平衡値に傾向を示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 20:34:45 GMT)
Implementing a synthetic magnetic vector potential in a 2D superconducting qubit array [0.2] 多くの興味深い凝縮マター現象は、電磁場の存在によってのみ現れる。
超伝導量子シミュレータを用いて電磁場における荷電粒子の動力学をエミュレートする。
電界中を伝播する荷電粒子の逆偏向であるホール効果が, 合成電磁場の存在下では存在することを実証する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:23:05 GMT)
Remote sensing of a levitated superconductor with a flux-tunable microwave cavity [0.2] 超伝導量子干渉装置はマイクロ波共振器に埋め込まれ、ピックアップループを介して磁気浮上した超伝導球に結合される。
磁気トラップにおける球の運動は、SQUIDキャビティ系の周波数シフトを誘導する。
測定された10-7, Mathrmm / sqrtmathrmHz$は、ミリケルビン環境温度でプランクスケールの質量を持つ浮遊粒子の地中冷却への道を定義する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:25:23 GMT)
Do language models plan ahead for future tokens? [0.2] トランスフォーマーは、フォワードパスの隠された状態の情報をステップ$t$で準備し、将来のフォワードパス$t+tau$で使用される。
トレーニング中に発生する非対角勾配項は、現在の推論タスクとは無関係に$t$のモデル計算機能をもたらすが、将来に役立つ。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 21:21:28 GMT)
Privacy-preserving datasets by capturing feature distributions with Conditional VAEs [0.1] 条件付き変分オートエンコーダ(CVAE)は、大きな事前学習された視覚基盤モデルから抽出された特徴ベクトルに基づいて訓練される。
本手法は, 医用領域と自然画像領域の両方において, 従来のアプローチよりも優れている。
結果は、データスカースおよびプライバシに敏感な環境におけるディープラーニングアプリケーションに大きな影響を与える生成モデルの可能性を強調している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:26:24 GMT)
Token Interdependency Parsing (Tipping) -- Fast and Accurate Log Parsing [0.1] ほとんどの自動分析ツールには、ログテンプレートをパラメータから分離するように設計されたコンポーネントが含まれている。
タイピング"は、ルールベースのトークンライザ、相互依存トークングラフ、強く接続されたコンポーネント、そして、迅速でスケーラブルで正確なログ解析を保証するための様々な技術を組み合わせています。
ラップトップマシン上では、20秒以内で1100万行のログを解析できる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:37:22 GMT)
On the Classification of Bosonic and Fermionic One-Form Symmetries in $2+1$d and 't Hooft Anomaly Matching [0.1] ボゾンとフェルミオンの自己統計量を持つトポロジカルラインからなる(非可逆的な)一形式対称性を2+1$dで研究する。
これらの線をBFB(Bose-Fermi-Braided)対称性と呼び、分類できると主張している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:37:24 GMT)
Improving Retrieval for RAG based Question Answering Models on Financial Documents [0.0] 本稿では,RAGパイプラインの既存の制約について検討し,テキスト検索の方法を紹介する。
高度なチャンキングテクニック、クエリ拡張、メタデータアノテーションの組み込み、再ランク付けアルゴリズムの適用、埋め込みアルゴリズムの微調整などの戦略を練っている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 03:02:44 GMT)
WHITE PAPER: A Brief Exploration of Data Exfiltration using GCG Suffixes [0.0] 模擬XPIAシナリオでGCGサフィックスとインジェクションを組み合わせて実行可能な攻撃モデルを実証した。
以上の結果から,GCG接尾辞の存在がデータ抽出の成功確率を約20%増加させる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 21:28:27 GMT)
Using low-cost Blu-Ray Optical Pickup Units for Measurement of Single Photon Emission from NV-Centers [0.0] 本研究は, ナノダイヤモンド中の単一窒素空孔中心から放出される単一光子を, 低コストで回収する方法を提案する。
顕微鏡目的物やピエゾ翻訳段階などの共焦点レーザー走査顕微鏡の従来の構成部品を2つの安価なブルーレイ光ピックアップユニットに置き換える。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:23:55 GMT)
Using CSNNs to Perform Event-based Data Processing & Classification on ASL-DVS [0.0] ASL-DVSジェスチャデータセットにおける空間的および時間的関係を学習するための畳み込みスパイクニューラルネットワークアーキテクチャを開発した。
ASL-DVSデータセットの事前処理したサブセットの分類を行い、文字記号を識別し、100%の訓練精度を得た。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:49:43 GMT)
Unveiling quantum steering by quantum-classical uncertainty complementarity [0.0] 系の量子的不確実性と古典的不確実性の間に新しい相補性関係を導入する。
本研究では, エントロピー不確実性関係と比較して, ステアリング検出効率が優れていることを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:56:50 GMT)
Tunneling dynamics of $^{164}$Dy supersolids and droplets [0.0] 磁気的164$Dy量子ガスのトンネル力学を, 長尺またはパンケーキスキュードダブルウェルトラップを用いて検討した。
伸長トラップと十分に大きなオフセットでは、異なる構成が集合的なマクロなトンネルを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:55:14 GMT)
Transmission of quantum information through quantum fields in curved spacetimes [0.0] 相対論的量子場を介する2つの局所量子ビット系間の量子通信チャネルを構築する。
本稿では、場の相関関数と波動方程式の因果プロパゲータの観点から、量子通信チャネルの量子容量を純粋に表現する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:48:48 GMT)
Towards Evolutionary-based Automated Machine Learning for Small Molecule Pharmacokinetic Prediction [0.0] 小分子の性質は、医薬品開発の初期段階において不可欠である。
既存のメソッドにはパーソナライゼーションがなく、手作業によるMLアルゴリズムやパイプラインに依存している。
分子特性の予測に特化して設計された進化型自動ML法(AutoML)を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:46:06 GMT)
Topological Phases of Many-Body Localized Systems: Beyond Eigenstate Order [0.0] 多体局在は物質の非平衡相に顕著な堅牢性を与える。
このような位相は、その基底と励起状態における位相的および対称性の破れ秩序を示すことができる。
また、扇状局所化位相(ALT相)に属することもある。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:00:00 GMT)
To Change Or To Stick: Unveiling The Consistency Of Cyber Criminal Signatures Through Statistical Analysis [0.0] 本研究は,サイバー空間における犯罪署名の存在を明白に明らかにし,その存在を統計的証拠を通じて初めて検証した。
本研究は,サイバー攻撃における現時点の人間の行動理解における重要なギャップを埋める,先進的なサイバー犯罪に関連するユニークな署名の存在を検証するものである。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:08:40 GMT)
The dynamical alpha-Rényi entropies of local Hamiltonians grow at most linearly in time [0.0] 我々は、厳密な局所的な相互作用を持つ長さ L の一般一次元スピン系を考える。
初期積状態のα-R'enyiエントロピー 0 α 1 が、最も線形に時間的に増加することを証明した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:45:12 GMT)
Synthetic dual image generation for reduction of labeling efforts in semantic segmentation of micrographs with a customized metric function [0.0] 材料分析のためのセマンティックセグメンテーションモデルの訓練には、マイクログラフとそれに対応するマスクが必要である。
マスクと組み合わせた合成微細構造画像の生成による意味的セグメンテーションモデルの改善のためのワークフローを実証する。
このアプローチは、少数の実画像を持つモデルをトレーニングするためのユーザフレンドリなソリューションとして機能するなど、さまざまな種類の画像データに一般化することができる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:54:11 GMT)
Survival Probability, Particle Imbalance, and Their Relationship in Quadratic Models [0.0] この研究は、多体状態における観測可能な状態のダイナミクスによって、単一粒子の生存と遷移確率の特徴を測定できるかどうかという疑問に対して、肯定的な答えを与える。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:55:34 GMT)
Surface Code with Imperfect Erasure Checks [0.0] 表面符号を用いたフォールトトレラント量子誤り訂正において,不完全だがオーバーヘッド効率の高い消去チェックを用いた結果について検討する。
物理的に妥当な仮定の下では、しきい値誤差率はパウリ雑音の少なくとも2倍以上であることを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:00:37 GMT)
Stable-to-unstable transition in quantum friction [0.0] 本研究では,2つの散逸金属板をせん断運動に設定した場合の量子揺らぎに起因する摩擦力について検討する。
初期の研究では、量子摩擦機構の電磁場が非平衡定常状態に達することが示されているが、他の研究は定常状態に到達できないことを示した。
摂動近似のない完全量子力学理論を開発し、安定な状態から不安定な状態への遷移を明らかにする。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 05:28:17 GMT)
Sparks of Quantum Advantage and Rapid Retraining in Machine Learning [0.0] 我々はAdiabatic quantum computer を利用してKolmogorov-Arnold Networks を最適化する。
トレーニングサンプルの数とは無関係に、固定サイズのソリューションスペースを作成します。
私たちのアプローチは、古典よりも速いトレーニング時間を通じて、量子的優位性を生み出します。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:40:36 GMT)
Seed Kernel Counting using Domain Randomization and Object Tracking Neural Networks [0.0] 本稿では,低コストなメカニカルホッパー,トレーニングされたYOLOv8ニューラルネットワークモデル,およびStrongSORTおよびByteTrack上のオブジェクト追跡アルゴリズムを用いて,ビデオからの穀物収量を推定するシードカーネルカウンタを提案する。
この実験では、StrongSORTアルゴリズムでそれぞれ95.2%、Wheatで93.2%、ByteTrackアルゴリズムでそれぞれ96.8%、Wheatで92.4%の精度でシードカーネル数が得られる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:46:38 GMT)
Securing the Diagnosis of Medical Imaging: An In-depth Analysis of AI-Resistant Attacks [0.0] 機械学習分類器のインプットを意図的に生成することで、攻撃者が誤分類を引き起こすという一般的な知識である。
近年の議論は、医療画像解析技術に対する敵対的攻撃が可能であることを示唆している。
医療用DNNタスクが敵の攻撃に対してどれほど強いかを評価することが不可欠である。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:37:27 GMT)
Second-order nonlocal shifts of scattered wave-packets: What can be measured by Goos-Hänchen and Imbert-Fedorov effects ? [0.0] 等質材料には、グース・ファンチェンとイムベルト・フェドロフ効果が欠如していることが判明した。
ウィグナー遅延時間と時間パルス幅の縮小により、ビーム幾何学に依存しない誘電関数にアクセスすることができる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:32:37 GMT)
Scaling and assigning resources on ion trap QCCD architectures [0.0] イオントラップ技術は量子情報処理の候補として大きな注目を集めている。
提案手法は,従来の手法と比較して最大50%の精度向上を図り,初期量子ビット配置に対する新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 01:35:55 GMT)
SLIP: Securing LLMs IP Using Weights Decomposition [0.0] 大規模言語モデル(LLM)は、最近、アカデミックと産業の両方で広く採用されている。
これらのモデルが成長するにつれて、彼らは価値ある知的財産権(IP)となり、所有者による巨額の投資を反映している。
エッジ上のモデルのIPを保護する現在の方法は、実用性、精度の低下、要求に対する適合性の制限がある。
我々は,エッジデデプロイされたモデルを盗難から保護するために,SLIPという新しいハイブリッド推論アルゴリズムを導入する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 20:34:18 GMT)
Role of seeding in the generation of polarization squeezed light by atomic Kerr medium [0.0] 我々はKerr媒体と光を相互作用させることにより偏光量子状態の生成を検討した。
実験はTi:サファイアレーザーによるコヒーレントな状態に基づいている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:36:57 GMT)
Risks, Causes, and Mitigations of Widespread Deployments of Large Language Models (LLMs): A Survey [0.0] 大規模言語モデル(LLM)は、テキスト生成、要約、分類において優れた能力を持つ自然言語処理(NLP)を変革した。
彼らの普及は、学術的完全性、著作権、環境への影響、データバイアス、公正性、プライバシといった倫理的考察など、多くの課題をもたらす。
本稿は、Google Scholarから体系的に収集・合成されたこれらの主題に関する文献に関する総合的な調査である。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 21:21:18 GMT)
Redefining Lexicographical Ordering: Optimizing Pauli String Decompositions for Quantum Compiling [0.0] 転化時間進化演算子を合成するための新しいアルゴリズムを提案する。
我々の合成手順は、ターゲット量子コンピュータの量子ビット接続を考慮に入れている。
ランダム化回路と異なる分子アンサーゼに有意な改善が認められた。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:50:16 GMT)
Rate-fidelity trade-off in cavity-based remote entanglement generation [0.0] 量子コンピューティングモジュール間のフォトニック相互接続は、量子ビットスケーラビリティ問題に対する解決策を提供する。
光子発生に使用するポンプパルスの波形と自然放出による絡み合いについて検討した。
本稿では, 一般多部構造における絡み合い分布に解析を拡張し, 両部構造解析が直接適用可能であることを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:11:12 GMT)
Randomised benchmarking for universal qudit gates [0.0] 単一および複数量子系に対する対角形非クリフォードゲートを特徴付けるスケーラブルなスキームを確立する。
巡回演算子とキューディットTゲートを用いることで、シングルおよびマルチキューディット回路に対する二面体ベンチマークスキームを一般化する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 02:57:31 GMT)
Quantum Algorithm For Solving Nonlinear Algebraic Equations [0.0] 非線形代数方程式系を解くための量子アルゴリズムを与える。
本手法は,変数数に対して,多言語時間(polylogarithmic time)を推定するために,詳細な解析を行った。
特に,本手法は様々な種類の問題に対処する努力をほとんど行わずに修正可能であることを示し,本手法の汎用性を示唆する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:16:05 GMT)
Properties of Krylov state complexity in qubit dynamics [0.0] 実効ハミルトニアンを用いて得られるクリロフ基底は、元のハミルトニアンから得られるものと比べて複雑さを最小化することを示す。
相互作用するリドベルク原子の特定の場合を考えると、実効ハミルトニアンを用いて得られるクリロフ基底は、元のハミルトニアンから得られるものと比べて複雑さを最小化することを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:03:26 GMT)
Predictive maintenance solution for industrial systems -- an unsupervised approach based on log periodic power law [0.0] 再正規化グループアプローチに基づく教師なし予測保守分析手法。
往復圧縮機システムから収集した産業データの予測保守解析のための新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:01:27 GMT)
Prediction Instability in Machine Learning Ensembles [0.0] 我々は、任意のアンサンブルが以下の予測不安定性の少なくとも1つの形式を示すことを示す定理を証明している。
基礎となるすべてのモデル間の合意を無視したり、基礎となるモデルが存在しない場合、その考えを変更したり、実際に予測することのないオプションを除外したりすることで、操作可能になります。
この分析はまた、特定のアンサンブルアルゴリズムから予測される特定の形の予測不安定性にも光を当てている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:08:53 GMT)
Petz map recovery for long-range entangled quantum many-body states [0.0] いくつかの物理的に関連する長距離量子状態におけるペッツ写像の不完全性について検討する。
この結果は、ペッツ写像の忠実度が物質の量子位相の有用な診断であることを示している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:11:17 GMT)
Peptide Sequencing Via Protein Language Models [0.0] アミノ酸の限られた配列の測定に基づいてペプチドの完全配列を決定するためのタンパク質言語モデルを提案する。
本手法は, 特定が困難であるアミノ酸を選択的にマスキングすることにより, 部分的シークエンシングデータをシミュレートする。
アミノ酸が4つしか知られていない場合、アミノ酸当たりの精度は90.5%に達する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 20:12:49 GMT)
Optimized Deep Learning Models for Malware Detection under Concept Drift [0.0] ドリフトに対するベースラインニューラルネットワークを改善するためのモデルに依存しないプロトコルを提案する。
本稿では,最新の検証セットによる特徴量削減とトレーニングの重要性を示し,Drift-Resilient Binary Cross-Entropyという損失関数を提案する。
改良されたモデルは有望な結果を示し、ベースラインモデルよりも15.2%多いマルウェアを検出する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:53:48 GMT)
Operator on Operator Regression in Quantum Probability [0.0] 回帰モデルでは、応答と独立変数はある種の作用素値観測可能であり、未知のスカラー係数($beta$で示される)と線形に関連付けられる。
我々は、$beta$の推定器のクラス($M$ estimatorで示される)の量子バージョンを提案し、それらの推定器の量子バージョンの大きなサンプル挙動を導出する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 05:22:49 GMT)
One-Time Certificates for Reliable and Secure Document Signing [0.0] 本稿では,長期的かつ無効なデジタル証明書を用いた新たな暗号鍵管理モデルを提案する。
我々のモデルは、署名すべき新しい文書ごとにユニークなデジタル証明書を発行する。
これらの証明書は、信頼できる取り消しメカニズムを必要としないことを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:12:53 GMT)
Nonlinear spectroscopy of semiconductor moiré materials [0.0] 我々は、時間分解非線形ポンプ-プローブ測定を用いて、半導体モワール材料の特性を明らかにする。
我々は、様々なモーアのミニバンドにおいて、高密度の仮想励起子や励起子-ポラロンを生成する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:41:28 GMT)
Neuromorphic detection and cooling of microparticle arrays [0.0] 我々は、単一イベントベースカメラによるニューロモルフィック検出を用いて、浮動小球のアレイの動きを記録する。
本稿では,3つの物体の運動を同時に冷却するリアルタイムフィードバックを実装することで,マルチ粒子制御のための最初の真にスケーラブルな手法を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:49:37 GMT)
Near-quantum limited axion dark matter search with the ORGAN experiment around 26 $μ$eV [0.0] The ORGAN Experimentの最新の成果は、アクシオンハロスコープである。
この実験は、流束駆動のジョセフソンパラメトリック増幅器を用いてミリケルビン温度で動作する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:52:26 GMT)
Multiple Greedy Quasi-Newton Methods for Saddle Point Problems [0.0] ヘッセン点問題の解法としてMultiple Greedysi-SP(MGSR1-SP)法を提案する。
本手法は安定性と効率性を両立させる。
その結果、MGSR1-SPの性能は幅広い機械学習アプリケーションで確認された。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 02:40:37 GMT)
Multi-controlled single-qubit unitary gates based on the quantum Fourier transform [0.0] マルチコントロール (MC) 特殊ユニタリ (U) ゲートは量子アルゴリズムや回路で広く使われている。
MCUゲートの最先端分解には、非元素の$C-R_x$と$C-U1/2m-1$ Gateを使用するものはほとんどない。
提案手法は,マルチコントロールX(MCX)ゲートの2つの一般化に基づいている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 21:56:02 GMT)
Modeling stochastic eye tracking data: A comparison of quantum generative adversarial networks and Markov models [0.0] 本稿では,眼球運動速度データのモデル化に量子生成対向ネットワークQGANの利用について検討する。
我々は,QGANの高度な計算能力が,従来の数学的モデルを超えた複雑な分布のモデリングを促進できるかどうかを評価する。
その結果,QGANは複雑な分布を近似する可能性を示したが,マルコフモデルは実データ分布を正確に再現する上で常に優れていた。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:15:07 GMT)
Methods to Estimate Advanced Driver Assistance System Penetration Rates in the United States [0.0] 本稿では,米国における高度運転支援システム(ADAS)搭載車両の割合を推定する方法を検討する。
2022年、車両の8%から25%に様々なADAS機能が搭載されたが、実際の使用率は運転者の不活性化により低下した。
本研究は,事故データの解析,イベントデータレコーダ機能の拡張,自然主義運転研究の実施,メーカーとの協力による設置率の決定など,予測を向上する戦略を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:17:33 GMT)
Metadata Integration for Spam Reviews Detection on Vietnamese E-commerce Websites [0.0] レビューのメタデータを含むViSpamReviews v2データセットを紹介します。
本稿では,テキスト属性と分類属性を同時に分類モデルに統合する手法を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:46:25 GMT)
Memory loss is contagious in open quantum systems [0.0] マルコビアン性は、相互に相互作用するシステムを通じて、ある浴槽から別の浴槽へ移動可能であることを示す。
ブロッホ・レッドフィールドに着想を得たアプローチを導入し、このマルコビアン性の起源を説明する。
この方法では、損失系と非マルコフ浴との相互作用の記述を大幅に改善する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:47:37 GMT)
Measuring Technical Debt in AI-Based Competition Platforms [0.0] AIベースの競争プラットフォームは、迅速なプロトタイピングと、参加者によるソフトウェアエンジニアリング原則の遵守の欠如によって、課題に直面している。
我々は、スクーピングレビューを通じて、AIシステムにおける技術的負債のタイプを特定し分類する。
技術的負債を管理するための枠組みは、これらのプラットフォームの持続可能性と有効性を改善することを目的としています。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:48:35 GMT)
Magic transition in measurement-only circuits [0.0] 我々は、クリフォードと非クリフォード測定の競合するタイプの量子回路を用いて、測定のみの量子回路においてマジックを研究する。
大規模数値シミュレーションを用いて1次元格子と2次元格子の双方において,この回路の魔法の遷移を研究する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 19:51:22 GMT)
Low-depth, compact and error-tolerant photonic matrix-vector multiplication beyond the unitary group [0.0] 非単体転送行列を実装可能なフォトニック回路のアーキテクチャを提案する。
我々のアーキテクチャは、バルクで完全に連結されたミキシングブロックではなく、小型の低深さビームスプリッターメッシュを利用する。
我々のアーキテクチャで設計されたフォトニック回路は、標準回路よりも奥行きが低く、ハードウェアエラーに非常に耐性があることが示されている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:06:51 GMT)
Low loss hybrid Nb/Au superconducting resonators for quantum circuit applications [0.0] ニオブ回路と10nmの金カッピング層を組み合わせた超伝導デバイスについて検討した。
以上の結果から,Au層の追加は2レベルのシステム欠陥の密度を低下させることが明らかとなった。
金の存在により、アルキルチオール基を固定して自己集合単分子膜を形成することができ、ハイブリッド量子プロセッサの開発のための分子スピン量子ビットとの統合が向上する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 22:08:08 GMT)
Learning to Embed Distributions via Maximum Kernel Entropy [0.0] 固有データは、確率分布の集合からのサンプルと見なすことができる。
カーネルメソッドは、これらの分布を分類する学習の自然なアプローチとして現れてきた。
データ依存分散カーネルの教師なし学習のための新しい目的を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:34:19 GMT)
Leaf Angle Estimation using Mask R-CNN and LETR Vision Transformer [0.0] 現代の研究では、高収量作物品種と直立葉角の植物との間に高い相関関係が示されている。
直立葉角を持つ植物は直立葉角を持たない植物よりも多くの光を遮断し、光合成の速度が高まることが観察された。
植物科学者や育種者は、現場の植物パラメータを直接測定できるツール、即ち現場での表現型化の恩恵を受ける。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:52:10 GMT)
LLMs as Hackers: Autonomous Linux Privilege Escalation Attacks [0.0] 言語モデル(LLM)と浸透試験の共通点について検討する。
本稿では,LLMの(倫理的)ハッキングに対する有効性を評価するための,完全自動特権エスカレーションツールを提案する。
我々は,異なるコンテキストサイズ,コンテキスト内学習,任意の高レベルメカニズム,メモリ管理技術の影響を分析する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 06:42:27 GMT)
Krylov complexity of purification [0.0] 精製は混合状態を純状態に、非単体進化をヒルベルト空間を拡大してユニタリ状態に写す。
混合状態の演算子と状態複雑性の不等式とその精製を提案する。
熱場二重状態が 0 から有限温度に進化するのに対して、1) 状態の複雑さはロイド境界に従い、2) クリロフ状態/演算複雑性はホログラフィック体積の複雑さとは対照的に部分加法的であることを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:00:00 GMT)
Investigating the quantum discord dynamics with a bipartite split of the multiqubit system in the correlated photon-matter model [0.0] 本研究では、Tavis-Cummings-Hubbardモデルから修正した複素相関光子-マターモデルにおける量子不協和ダイナミクスについて検討する。
我々は、より複雑な量子系の研究の基盤として、量子相関の正則性を同定することに専念している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:28:58 GMT)
Improving Machine Learning Based Sepsis Diagnosis Using Heart Rate Variability [0.0] 本研究の目的は、心拍変動(HRV)機能を用いて、敗血症検出のための効果的な予測モデルを開発することである。
ニューラルネットワークモデルは、HRVの特徴に基づいてトレーニングされ、F1スコアは0.805、精度は0.851、リコールは0.763である。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 01:47:29 GMT)
If It Looks Like a Rootkit and Deceives Like a Rootkit: A Critical Examination of Kernel-Level Anti-Cheat Systems [0.0] 本稿では,カーネルレベルのアンチチートシステムが根根の性状を反映する程度を体系的に評価する。
我々の分析は、ルートキットのような振る舞いを示し、システムのプライバシーと整合性を脅かす4つのアンチチートソリューションのうちの2つを示している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:10:03 GMT)
How quantum and evolutionary algorithms can help each other: two examples [0.0] 量子回路設計におけるバイオインスパイアされた進化的アルゴリズムの可能性について検討する。
我々は、異なる数の量子ゲートに対するセルオートマトンによる量子実装のロバスト性をテストする。
進化的アルゴリズムを用いて、マイヤー・ワラッハの絡み合い尺度で定義された適合関数に対して回路を最適化する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:36:38 GMT)
How Ethical Should AI Be? How AI Alignment Shapes the Risk Preferences of LLMs [0.0] 本研究では,Large Language Models(LLMs)のリスク嗜好と,それらと人間の倫理基準の整合が,その経済的な意思決定にどのように影響するかを検討する。
LLMと人的価値の整合性、無害性、有用性、誠実性を重視し、それらをリスク回避にシフトしていることが分かりました。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 21:28:48 GMT)
How Are LLMs Mitigating Stereotyping Harms? Learning from Search Engine Studies [0.0] 商業モデル開発は、社会的影響評価を犠牲にして、法的負債に関する「安全」の訓練に重点を置いている。
これは、数年前に検索エンジンのオートコンプリートを観測できる同様の傾向を模倣している。
LLMにおけるステレオタイピングを評価するために,オートコンプリート方式の新たな評価課題を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:09:12 GMT)
Hilbert curves for efficient exploratory landscape analysis neighbourhood sampling [0.0] 高品質な秩序標本を効率よく得る方法として,ヒルベルト空間充填曲線を提案する。
サンプルとしてヒルベルト曲線の有効性を検討した結果,計算コストのごく一部で有意な特徴を抽出できることが判明した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:57:35 GMT)
High-Impact Innovations and Hidden Gender Disparities in Inventor-Evaluator Networks [0.0] 私たちは何百万もの科学、技術、芸術の革新を研究し、女性が直面するイノベーションのギャップは普遍的ではないことに気付きました。
女性検査官は、男性検査官よりも女性の発明者による非伝統的な革新を最大33%拒絶している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 20:52:40 GMT)
Hacked in Translation -- from Subtitles to Complete Takeover [0.0] Check Pointの研究者たちは、世界中の数百万のユーザーを脅かす新たな攻撃ベクトルを明らかにした。
悪意のある字幕ファイルを作成することで、攻撃者はあらゆる種類のデバイスを完全に制御できる。
Check Pointによると、現在この脆弱性のあるソフトウェアを運用しているビデオプレーヤーやストリーマーは2億人だ。
本研究は,ユーザのメディアプレーヤがオンラインレポジトリから映画の字幕を自動的に読み込むと,サイバー攻撃が完全に見落とされてしまう新たな攻撃ベクトルを明らかにする。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:12:25 GMT)
Generic Analysis of Model Product Lines via Constraint Lifting [0.0] 本稿では,制約が生成される可能性のあるすべての変種に対して同時に保持されるかどうかを確認する機構を提案する。
この論文の主な貢献は、すべての変種によって満たされる制約を仮定し、製品ラインの制約から(リフト)を生成する関数である。
本稿では,モデル製品ラインと制約を自動的に翻訳することで,SMT解決を用いた昇降制約の検証方法を示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 07:34:13 GMT)
Generalized hydrodynamics of integrable quantum circuits [0.0] 原型可積分モデルであるXXZハイゼンベルクスピン鎖の可積分トロッター化について検討する。
接合部における単一微細な欠陥、例えば1量子ビットの追加は、遅く出現する非平衡マクロ状態を変化させる可能性がある。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:25:26 GMT)
Generalisation of Total Uncertainty in AI: A Theoretical Study [0.0] この研究は、AIの中に存在する不確実性の性質を解き放つことを目指している。
創発理論から現在の方法論に至るまで、本論文はより優れた総合的不確実性を扱うための統合的な視点を提供する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 22:55:40 GMT)
GLiNER multi-task: Generalist Lightweight Model for Various Information Extraction Tasks [0.0] 我々は,小さなエンコーダモデルであると同時に,様々な情報抽出タスクに使用できる新しい種類のGLiNERモデルを導入する。
我々のモデルは,ゼロショットNERベンチマークにおけるSoTA性能を達成し,質問応答,要約,関係抽出タスクにおける主要な性能を実現した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 10:09:15 GMT)
Future of Artificial Intelligence in Agile Software Development [0.0] AIは、LLM、GenAIモデル、AIエージェントを活用することで、ソフトウェア開発マネージャ、ソフトウェアテスタ、その他のチームメンバーを支援することができる。
AIは効率を高め、プロジェクト管理チームが直面するリスクを軽減する可能性がある。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:49:50 GMT)
From Counting Stations to City-Wide Estimates: Data-Driven Bicycle Volume Extrapolation [0.0] ストリートレベルの自転車量情報は、都市が自転車を奨励するためのインフラの改善を計画するのに役立つだろう。
現在市や市民が利用できるデータは、わずかに数える駅からしか得られないことが多い。
本論文は,ベルリン全都市における自転車の容積を推定するために,これらの数箇所を超える自転車の容積を推定する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:09:40 GMT)
Explainable Emotion Decoding for Human and Computer Vision [0.0] 説明可能なAI(XAI)を使用して、マシンラーニング(ML)モデルの内部決定プロセスの理解を支援します。
本稿では,機能的磁気共鳴イメージング(fMRI)と映画フレームに基づく2つのMLモデルの訓練と説明を行う。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:53:44 GMT)
Experimental relative entanglement potentials of single-photon states [0.0] エンタングルメントポテンシャル(EP)は、単一モード光場の非古典性の特徴づけと定量化を可能にする。
実験により単光子状態が生成され、トモグラフィで対応する2量子状態が再構成され、EPが決定された。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 06:10:44 GMT)
Exceptional Luttinger Liquids from sublattice dependent interaction [0.0] 例外点(EP)は自然にルッティンガー液体(LL)理論に現れる。
EPは単一粒子グリーン関数(GF)の非エルミート位相的性質である
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:00:01 GMT)
Evaluate Fine-tuning Strategies for Fetal Head Ultrasound Image Segmentation with U-Net [0.0] 本稿では,CNNネットワークをスクラッチからトレーニングするためのTransfer Learning(TL)手法を提案する。
我々のアプローチは、エンコーダとして軽量なMobileNetを持つU-Netネットワークを微調整(FT)することである。
提案したFT戦略は、トレーニング可能なパラメータが440万未満の他の戦略よりも優れている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:09:50 GMT)
Estimating quantum Markov chains using coherent absorber post-processing and pattern counting estimator [0.0] 量子マルコフ連鎖の一次元動的パラメータを推定する手法を提案する。
我々は、推定器が大きな出力サイズの極限で有界な量子Cram'eRaoを達成するという強い理論的および数値的な証拠を提供する。
これは、連続時間力学における同様の推定戦略の道を開く。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:12:01 GMT)
Error budget of parametric resonance entangling gate with a tunable coupler [0.0] 可変カプラアーキテクチャにおけるパラメトリック共振ゲートの実験誤差予算を解析する。
主に2ビットの緩和と白色雑音による劣化に起因する不整合誤差は、2ビットのゲートの忠実さを制限する。
非計算状態への漏洩は、2ビットゲートの不忠実性に対する2番目に大きな寄与である。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:52:22 GMT)
Equivariant neural networks and piecewise linear representation theory [0.0] 等価ニューラルネットワークは対称性を持つニューラルネットワークである。
群表現の理論により、同変ニューラルネットワークの層を単純な表現に分解する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 23:08:37 GMT)
Driving of an open quantum system at finite temperature across first- and second-order quantum phase transitions [0.0] 非零温度でのクビットの開系は有限時間間隔で駆動される。
駆動は、第1および第2次量子相転移の有限サイズの前駆体を通過する。
以上の結果から, 熱浴の存在と通過回避パターンが組み合わさることで, 対象地中状態の生成精度が著しく向上する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:19:57 GMT)
Distance-Preserving Generative Modeling of Spatial Transcriptomics [0.0] 本稿では,空間転写学における距離保存型生成モデルについて紹介する。
得られた空間情報を用いて、類似した対距離構造を持つ遺伝子表現の学習表現空間を正規化する。
我々のフレームワークは、遺伝子発現モデリングのためのあらゆる変分推論に基づく生成モデルとの互換性を付与する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 21:04:27 GMT)
Disentangling Dense Embeddings with Sparse Autoencoders [0.0] スパースオートエンコーダ(SAE)は、複雑なニューラルネットワークから解釈可能な特徴を抽出する可能性を示している。
大規模言語モデルからの高密度テキスト埋め込みに対するSAEの最初の応用の1つを提示する。
その結果,解釈可能性を提供しながら意味的忠実さを保っていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:46:22 GMT)
Digital capabilities assessment for supporting the transformation of the customer experience [0.0] 本稿では、顧客ライフサイクルを通して顧客体験とエンゲージメントを向上させるために、組織がデジタル能力を評価することができる成熟度モデルの設計と検証について述べる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 23:26:48 GMT)
Diffusion Models for Offline Multi-agent Reinforcement Learning with Safety Constraints [0.0] マルチエージェント強化学習パラダイムに拡散モデルを統合する革新的なフレームワークを導入する。
このアプローチは、協調動作をモデル化しながらリスク軽減を通じて、複数のエージェントが取るべき行動の安全性を特に向上させる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 20:15:37 GMT)
Diffracting molecular matter-waves at deep-ultraviolet standing-light waves [0.0] 分子との物質波干渉法は、基本的な量子現象を示すことと、物理化学における量子強度測定への道を開くことからも興味深い。
このような実験における大きな課題の1つは、幅広い粒子に効率よく適用可能な物質波ビーム分割機構を確立することである。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:05:42 GMT)
Differentiable master equation solver for quantum device characterisation [0.0] 物理系の微分モデルは勾配に基づくアルゴリズムのための強力なプラットフォームを提供する。
量子システムはそのような特性化と制御に特に挑戦する。
本稿では、多種多様な微分可能な量子マスター方程式解法を提案し、この解法をデバイス特性化のためのフレームワークに組み込む。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:34:02 GMT)
Decomposition of Nonlinear Collision Operator in Quantum Lattice Boltzmann Algorithm [0.0] 本稿では,LB(Lattice Boltzmann)衝突作用素の2次非線形性に対処する量子アルゴリズムを提案する。
提案手法は,1次元流れの不連続性と2次元コルモゴロフ様流れ試験により検証された。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:56:38 GMT)
CultureVo: The Serious Game of Utilizing Gen AI for Enhancing Cultural Intelligence [0.0] 本稿では,オープンソースのLarge Langauge Modelを用いたジェネレーティブAIが,Integrated Culture Learning Suite内でどのように活用されているかを検討する。
このスイートは、学習者の知識の評価を自動化し、行動パターンを分析し、非プレイヤーキャラクターとのインタラクションを管理するために、ジェネレーティブAI技術を使用している。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:34:15 GMT)
Cosmic muon flux attenuation methods for superconducting qubit experiments [0.0] 超伝導量子ビットを含む実験と互換性のある宇宙ムーンフラックスを減衰させる2つの実用的な緩和法を提案し,実証する。
特別に構築された宇宙ムーン検出器を用いて、都市環境に広く存在する地下地を同定し、宇宙ムーンフラックスの大きな減衰を達成できる。
地上実験室では2つのゲルマニウムウェハを用い,それぞれに粒子センサを装着し,天空に対するチップの配向が基板上に堆積したエネルギー量と種類にどのように影響するかを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 08:26:08 GMT)
Chaos destroys the excited state quantum phase transition of the Kerr parametric oscillator [0.0] 外部駆動とシステムの非線形性の間の相互作用から生じるカオスが、励起状態量子相転移(ESQPT)を破壊することを示す。
本研究は, より大きな非線形性を持つ新しいパラメトリック発振器の設計における理論モデルの解析の重要性を実証するものである。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 21:56:00 GMT)
Calibrating Bayesian Generative Machine Learning for Bayesiamplification [0.0] ベイズ生成機械学習モデルのキャリブレーションを定量化するための明確なスキームを示す。
十分に校正された不確実性は、大まかに非相関真理サンプルの数を推定するために用いられる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:00:05 GMT)
Benchmarking Quantum Annealers with Near-Optimal Minor-Embedded Instances [0.0] 本稿では,D-Wave Quantum Annealersに関連付けられた準最適部分埋め込みマッピングを用いてグラフインスタンスを生成するための新しいプロトコルを確立する。
この手法を用いて、制約のない最適化問題の大規模インスタンス上でQAをベンチマークし、QPUの性能を効率的な古典的解法と比較する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 11:01:47 GMT)
Bayesian mitigation of measurement errors in multi-qubit experiments [0.0] 本稿では,近距離量子デバイス上でのマルチビット実験に適したベイズ測定誤差軽減手法を提案する。
提案手法では,キュービットのバイナリ状態代入前に利用できる読み出し信号から完全情報を利用する。
我々は,このプロトコルを超伝導量子ビットを用いて,実際の量子コンピュータ上でベンチマークする。そこでは,読み出し信号が,量子ビット状態割り当ての前にIQ雲の計測情報を符号化する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:41:49 GMT)
Automatic Pull Request Description Generation Using LLMs: A T5 Model Approach [0.0] 本稿では,コミットメッセージとソースコードコメントに基づくPR記述の自動生成手法を提案する。
我々は,33,466個のPRを含むデータセットを用いて,事前学習したT5モデルを微調整した。
以上の結果から,T5モデルはLexRankより有意に優れていた。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 21:22:16 GMT)
Assessing the Variety of a Concept Space Using an Unbiased Estimate of Rao's Quadratic Index [0.0] 「バラエティ」は、デザイナーが探求する概念空間の幅を定量化できるパラメータの1つである。
この記事では、エンジニアリングデザインの文献から既存のさまざまなメトリクスについて詳しく、そして批判的に考察する。
評価プロセスを支援するための規範的フレームワークとともに,新しい距離に基づく多様性指標を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:25:54 GMT)
Artifical intelligence and inherent mathematical difficulty [0.0] まず、計算可能性と複雑性理論による制限的な結果が証明発見が本質的に難しい問題であることを示す従来の議論の更新版を提示する。
次に、人工知能にインスパイアされた最近のいくつかの応用が、数学的な証明の性質に関する新しい疑問を実際に提起する方法について説明する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 20:08:31 GMT)
An effect analysis of the balancing techniques on the counterfactual explanations of student success prediction models [0.0] 学習分析における主要な研究方向の1つは、様々な機械学習手法を用いて学習者の成功を予測することである。
いくつかのカウンターファクト生成手法は、多くの可能性を秘めているが、その特徴は効果的に動作可能で、因果的でなければならない。
本稿では, 対実説明法, 多目的対実説明法, 最近対実説明法など, 一般的に用いられている対実生成法の有効性を考察する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:19:08 GMT)
An FDA for AI? Pitfalls and Plausibility of Approval Regulation for Frontier Artificial Intelligence [0.0] 我々は、フロンティアAIの規制に対する承認規制、すなわち、実験的なミニマと、その実験で部分的にまたは完全に条件付けられた政府のライセンスとを組み合わせた製品の適用性について検討する。
承認規制が単に適用されたとしても、フロンティアAIのリスクには不適当であると考える理由はいくつかある。
規制開発における政策学習と実験の役割を強調して締めくくる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:54:57 GMT)
Alpha-VI DeepONet: A prior-robust variational Bayesian approach for enhancing DeepONets with uncertainty quantification [0.0] 一般化変分推論(GVI)を組み込んだ新しいディープオペレータネットワーク(DeepONet)を提案する。
分岐ネットワークとトランクネットワークのビルディングブロックとしてベイズニューラルネットワークを組み込むことで,不確実な定量化が可能なDeepONetを実現する。
変動目的関数の修正は平均二乗誤差を最小化する点で優れた結果をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 16:22:03 GMT)
Adaptive traffic signal safety and efficiency improvement by multi objective deep reinforcement learning approach [0.0] 本研究では,多目的深部強化学習(DRL)技術を活用した適応交通信号制御(ATSC)の革新的手法を提案する。
提案手法は, 安全, 効率, 脱炭目標に対処しながら, 交差点における制御戦略を強化することを目的としている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 13:10:41 GMT)
ABC Align: Large Language Model Alignment for Safety & Accuracy [0.0] 大規模言語モデル(LLM)のための新しいアライメント手法ABC Alignを提案する。
合成データ生成、選好最適化、ポストトレーニングモデル量子化における最近のブレークスルーの上に構築された一連のデータとメソッドを組み合わせる。
我々の統一的なアプローチは、標準ベンチマークに対して測定されたように、バイアスを軽減し、推論能力を保ちながら精度を向上させる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 06:06:25 GMT)
A tractable model of monitored fermions with conserved $\mathrm{U}(1)$ charge [0.0] U(1)対称性を持つ自由フェルミオン系の測定誘起相について検討した。
広い空間と時間スケールにおける純度と二分性絡み合いの場の理論記述を導出する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:45:29 GMT)
A self-adaptive system of systems architecture to enable its ad-hoc scalability: Unmanned Vehicle Fleet -- Mission Control Center Case study [0.0] システム・オブ・システム(SoS)はコンスティチュート・システム(CS)から構成され、単一のCSを超えるユニークな能力を提供する。
本研究は、ミッション変更、レンジ拡張、UV故障などの不確実性に対処するため、実用的なSoSの例として無人車両艦隊(UVF)に焦点を当てる。
提案手法は、UVFアーキテクチャを動的に調整し、Mission Control Centerが自動的にUVFサイズをスケールできるようにする自己適応システムを含む。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 12:51:26 GMT)
A Zero-Knowledge Proof of Knowledge for Subgroup Distance Problem [0.0] ハミング計量における部分群距離問題の硬さに基づく新しいゼロ知識同定手法を提案する。
提案したプロトコルは、SDZKP (Subgroup Distance Zero Knowledge Proof) と名付けられ、暗号的にセキュアな擬似乱数生成器を用いて秘密を隠蔽する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 09:04:50 GMT)
A Short Guide to Quantum Mechanics -- Some Basic Principles [0.0] 量子物理学が重要か、奇妙か、理解不能か、という問いから始まります。
これはなぜ粒子が波のように振る舞うのか、また不確実性やランダム性が物理学に入るのかを説明する。
磁気共鳴イメージング(MRI)や量子コンピューティングといった最近の話題も取り上げられている。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:14:54 GMT)
A Novel Use of Pseudospectra in Mathematical Biology: Understanding HPA Axis Sensitivity [0.0] 視床下部-Pituitary-Adrenal(HPA)軸は主要な神経内分泌系である。
この研究は、初めて擬似スペクトルを用いてHPA軸を探索した。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 18:01:14 GMT)
A Natural Language Processing Framework for Hotel Recommendation Based on Users' Text Reviews [0.0] このフレームワークは、BERT(Bidirectional Representations from Transformers)と微調整/バリデーションパイプラインに基づいている。
提案するホテルレコメンデーションシステムは,予約施設のユーザエクスペリエンスを著しく向上させることができる。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 17:01:29 GMT)
A Likelihood-Based Generative Approach for Spatially Consistent Precipitation Downscaling [0.0] この研究は、生成モデルで使用される可能性に基づく強みと敵対的損失の強みを融合させることにより、新しいアプローチを探求する。
その結果,両手法の利点を生かし,降水量削減のための可能性に基づく生成手法を提案する。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 14:18:32 GMT)
A Dirichlet stochastic block model for composition-weighted networks [0.0] 合成重みベクトルの直接モデリングに基づく合成重み付きネットワークのブロックモデルを提案する。
推論は分類期待-最大化アルゴリズムの拡張によって実装される。
このモデルはシミュレーション研究を用いて検証され,Erasmus交換プログラムのネットワークデータと,ロンドン市における自転車共有ネットワークで実証された。
論文参考訳(メタデータ) (Thu, 1 Aug 2024 15:41:07 GMT)