Logic Query of Thoughts: Guiding Large Language Models to Answer Complex Logic Queries with Knowledge Graphs [102.4] LGOT(Logic-Query-of-Thoughts)は知識グラフ推論と大規模言語モデルを組み合わせた最初の方法である。
実験の結果,ChatGPTよりも20%向上した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 01:06:20 GMT)
Downstream Transfer Attack: Adversarial Attacks on Downstream Models with Pre-trained Vision Transformers [95.2] 本稿では、事前訓練されたViTモデルから下流タスクへのこのような逆の脆弱性の伝達可能性について検討する。
DTAは攻撃成功率(ASR)が90%を超え、既存の手法をはるかに上回っていることを示す。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 08:07:03 GMT)
MiniCPM-V: A GPT-4V Level MLLM on Your Phone [83.1] MiniCPM-Vは、エンドサイドデバイスにデプロイ可能な効率的なMLLMのシリーズである。
アーキテクチャ、事前トレーニング、アライメントに最新のMLLM技術を統合することで、MiniCPM-V 2.5にはいくつかの注目すべき特徴がある。
MiniCPM-V は有望な傾向の代表的な例と見なすことができる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 15:02:21 GMT)
MarkLLM: An Open-Source Toolkit for LLM Watermarking [80.0] MarkLLMは、LLMウォーターマーキングアルゴリズムを実装するためのオープンソースのツールキットである。
評価のために、MarkLLMは3つの視点にまたがる12のツールと、2種類の自動評価パイプラインを提供する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 03:52:48 GMT)
VIP: Versatile Image Outpainting Empowered by Multimodal Large Language Model [76.0] 本研究は,ユーザの要求に応じて結果のカスタマイズが可能な,新たな画像出力フレームワークを提案する。
画像のマスキング部分とマスキング部分のテキスト記述を自動的に抽出し整理するマルチモーダル大言語モデル(MLLM)を利用する。
さらに、画像の特定の空間領域とテキストプロンプトの対応する部分との相互作用を強化するために、特別にCentral-Total-Surrounding (CTS) と呼ばれるCentral-Attentionモジュールが精巧に設計されている。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 08:52:32 GMT)
LAMBO: Large AI Model Empowered Edge Intelligence [71.6] 次世代エッジインテリジェンスは、オフロード技術を通じて様々なアプリケーションに恩恵をもたらすことが期待されている。
従来のオフロードアーキテクチャは、不均一な制約、部分的な認識、不確実な一般化、トラクタビリティの欠如など、いくつかの問題に直面している。
我々は、これらの問題を解決するための10億以上のパラメータを持つLarge AI Model-Based Offloading (LAMBO)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 13:43:01 GMT)
Graph Stochastic Neural Process for Inductive Few-shot Knowledge Graph Completion [63.7] I-FKGC(inductive few-shot knowledge graph completion)と呼ばれる課題に焦点をあてる。
帰納的推論(inductive reasoning)の概念に着想を得て,I-FKGCを帰納的推論問題とした。
本稿では,仮説の連成分布をモデル化したニューラルプロセスに基づく仮説抽出器を提案する。
第2のモジュールでは、この仮説に基づいて、クエリセットのトリプルが抽出された仮説と一致するかどうかをテストするグラフアテンションベースの予測器を提案する。
論文参考訳(メタデータ) (Sat, 03 Aug 2024 13:37:40 GMT)
Is Generative Communication between Embodied Agents Good for Zero-Shot ObjectNav? [60.8] Zero-Shot ObjectNavでは、エンボディされた接地エージェントが自然言語ラベルで指定されたターゲットオブジェクトにナビゲートされる。
司法探索のための2つの協調ナビゲーション方式を提案する。
我々は,この具体的設定に特有な「プリエンプティブ・幻覚」の特徴を識別する。そこでは,オーバヘッドエージェントが,まだ動作していないときに,地上エージェントが対話の中でアクションを実行したと仮定する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 22:55:26 GMT)
SynopGround: A Large-Scale Dataset for Multi-Paragraph Video Grounding from TV Dramas and Synopses [58.5] ビデオグラウンディングは、特定の自然言語クエリを、トリミングされていないビデオにローカライズすることを目的としている。
本稿では,SynopGroundという大規模ビデオグラウンドデータセットを提案する。
我々はMPVG(Multi-Paragraph Video Grounding)と呼ばれるより複雑なビデオグラウンドについて紹介する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 05:35:13 GMT)
TranDRL: A Transformer-Driven Deep Reinforcement Learning Enabled Prescriptive Maintenance Framework [58.5] 産業システムは、運用効率を高め、ダウンタイムを減らすための信頼性の高い予測保守戦略を要求する。
本稿では,Transformerモデルに基づくニューラルネットワークと深部強化学習(DRL)アルゴリズムの機能を活用し,システムの保守動作を最適化する統合フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 01:34:15 GMT)
iControl3D: An Interactive System for Controllable 3D Scene Generation [57.0] iControl3Dは、ユーザがカスタマイズ可能な3Dシーンを正確なコントロールで生成およびレンダリングできるようにする、新しいインタラクティブシステムである。
我々は3Dメッシュを仲介プロキシとして利用し、個別の2D拡散生成画像を結合的で統一された3Dシーン表現に反復的にマージする。
私たちのニューラルレンダリングインターフェースは、ユーザが自分のシーンのラディアンスフィールドをオンラインで構築し、シーン全体をナビゲートすることを可能にする。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 06:35:09 GMT)
Leading correction to the relativistic Foldy-Wouthuysen Hamiltonian [55.2] 我々は、既知の相対論的 Foldy-Wouthuysen Hamiltonian に対する弱場近似の先導的な補正を厳格に導き出す。
ディラック粒子の場合、2階の相対的波動方程式はFoldy-Wouthuysen Hamiltonian と同様の補正で得られる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 12:53:41 GMT)
A Primal-Dual Approach to Solving Variational Inequalities with General Constraints [54.6] Yang et al. (2023) は最近、一般的な変分不等式を解決するために一階勾配法を使う方法を示した。
この方法の収束性を証明し、演算子が$L$-Lipschitz と monotone である場合、この手法の最後の繰り返しのギャップ関数が$O(frac1sqrtK)$で減少することを示す。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 17:54:40 GMT)
Large Multi-modality Model Assisted AI-Generated Image Quality Assessment [53.2] 本稿では,AI生成画像品質評価モデル(MA-AGIQA)を提案する。
セマンティックインフォームドガイダンスを使用して意味情報を感知し、慎重に設計されたテキストプロンプトを通してセマンティックベクターを抽出する。
最先端のパフォーマンスを実現し、AI生成画像の品質を評価する上で優れた一般化能力を示す。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 02:49:36 GMT)
Large AI Model-Based Semantic Communications [48.7] 現在のセマンティックコミュニケーションシステムでは、知識ベース(KB)の構築はいくつかの問題に直面している。
本稿では、画像データ用に設計されたLAMベースのSCフレームワーク(LAM-SC)を提案し、まず、SAMベースのKB(SKB)を適用する。
そこで本研究では,SKBが生成する意味セグメントを人間の参加なしに評価し,意味認識画像として統合するための注意ベースセマンティック統合(ASI)を提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 13:59:24 GMT)
Graph Unfolding and Sampling for Transitory Video Summarization via Gershgorin Disc Alignment [48.1] 携帯電話からYouTubeやTikTokなどのソーシャルメディアサイトにアップロードされたユーザー生成ビデオ(UGV)は、短くて繰り返しではない。
我々は、ガーシュゴリンディスクアライメント(GDA)に基づく高速グラフサンプリングにより、遷移UGVを複数のディスクに線形時間で要約する。
提案アルゴリズムは,最先端の手法と比較して,映像の要約性能が向上し,複雑さが大幅に低減されていることを示す。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 20:08:02 GMT)
Re-Invoke: Tool Invocation Rewriting for Zero-Shot Tool Retrieval [47.8] Re-Invokeは、トレーニングなしで大規模ツールセットに効果的にスケールするために設計された教師なしツール検索手法である。
我々は、クエリ毎に最も関連性の高いツールを特定するために、意図に基づいて、新しいマルチビュー類似度ランキング戦略を採用する。
評価の結果、Re-Invokeはシングルツールとマルチツールの両方のシナリオにおいて、最先端の代替よりも大幅に優れていた。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 22:49:27 GMT)
Dialog Flow Induction for Constrainable LLM-Based Chatbots [46.3] 本稿では,ドメイン固有のダイアログフローを自動的に誘導するための教師なしアプローチを提案する。
高品質なデータ誘導ダイアログフローにより、ドメインカバレッジが向上することを示す。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 01:15:50 GMT)
Multi-Branch Generative Models for Multichannel Imaging with an Application to PET/CT Synergistic Reconstruction [43.0] 本稿では,マルチブランチ生成モデルを用いた医用画像の相乗的再構築のための新しい手法を提案する。
我々は,MNIST (Modified National Institute of Standards and Technology) とPET (positron emission tomography) とCT (Computed tomography) の2つのデータセットに対するアプローチの有効性を実証した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 13:50:40 GMT)
Using Linearized Optimal Transport to Predict the Evolution of Stochastic Particle Systems [42.5] 我々は,確率測度の時間発展を,その進化を管理する演算子を明示的に学習することなく近似するアルゴリズムを開発した。
特に興味深い応用は、粒子系から生じる離散測度$mu_tN$である。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 20:00:36 GMT)
STBLLM: Breaking the 1-Bit Barrier with Structured Binary LLMs [42.4] 本稿では,Large Language Models (LLM) を1ビット未満の精度で圧縮するための,最初の構造バイナライズフレームワークSTBLLMを提案する。
両値化LDMの重み付けは,性能劣化を伴わずにランダムに反転することが可能であり,さらなる圧縮の可能性を示している。
我々は,STBLLMの有効性を評価するために,LLaMA-1/2/3,OPTファミリ,Mistralなど様々な言語モデルに関する広範な実験を行った。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 15:07:44 GMT)
Generating High-quality Symbolic Music Using Fine-grained Discriminators [42.2] 本稿では,メロディとリズムを音楽から分離し,それに対応する微粒な識別器を設計することを提案する。
具体的には、ピッチ増強戦略を備えるメロディ判別器は、生成されたサンプルによって提示されるメロディ変動を識別する。
バーレベルの相対的な位置エンコーディングで強化されたリズム判別器は、生成された音符の速度に焦点を当てる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 07:32:21 GMT)
A Semantic-Aware and Multi-Guided Network for Infrared-Visible Image Fusion [41.3] マルチモダリティ画像融合は、2つのソース画像から特定のモダリティ情報と共有モダリティ情報を融合することを目的としている。
本稿では,3分岐エンコーダデコーダアーキテクチャと,それに対応する融合層を融合戦略として提案する。
可視・近赤外画像融合および医用画像融合タスクにおける最先端手法と比較して,本手法は競争力のある結果を得た。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 05:46:29 GMT)
Unmasking Bias in Diffusion Model Training [40.9] 拡散モデルが画像生成の主流のアプローチとして登場した。
トレーニングの収束が遅く、サンプリングのカラーシフトの問題に悩まされている。
本稿では,これらの障害は,既定のトレーニングパラダイムに固有のバイアスや準最適性に大きく起因していると考えられる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 06:05:38 GMT)
Quantum Generative Diffusion Model: A Fully Quantum-Mechanical Model for Generating Quantum State Ensemble [40.1] 本稿では,量子生成拡散モデル (QGDM) を単純かつエレガントな量子モデルとして紹介する。
QGDMはQGAN(Quantum Generative Adversarial Network)よりも高速な収束を示す
混合状態発生ではQGANよりも53.02%高い忠実性が得られる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 15:22:12 GMT)
Diff-PIC: Revolutionizing Particle-In-Cell Simulation for Advancing Nuclear Fusion with Diffusion Models [39.6] Diff-PICは、条件付き拡散モデルを活用する新しいパラダイムであり、高忠実度科学データを生成するために、PICシミュレーションに代わる計算効率の良い代替品である。
具体的には,PICシミュレーションによって得られた物理パターンを拡散モデルに蒸留する蒸留パラダイムを設計し,理論的および実用的実現可能性の両立を実証する。
我々は,(1)数学的に連続した物理条件に対して意味のある埋め込みを学習し,生成できる物理的インフォームドな条件拡散モデルを開発し,(2)修正フロー技術を用いて,モデルを一段階の条件拡散モデルとする。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 19:42:31 GMT)
HPC: Hierarchical Progressive Coding Framework for Volumetric Video [39.4] ニューラルレージアンスフィールド(NeRF)に基づくボリュームビデオは、様々な3Dアプリケーションに対して大きな可能性を秘めている。
現在のNeRF圧縮は、ビデオ品質を調整できる柔軟性に欠けており、様々なネットワークやデバイス能力のための単一のモデル内である。
単一モデルを用いて可変性を実現する新しい階層型プログレッシブビデオ符号化フレームワークであるHPCを提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 02:22:34 GMT)
Complexity of Minimizing Projected-Gradient-Dominated Functions with Stochastic First-order Oracles [38.5] 本稿では,$(alpha,tau,mathcal)$-projected-dominanceプロパティの下で関数を最小化する一階法の性能限界について検討する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 18:34:23 GMT)
N-Agent Ad Hoc Teamwork [36.1] 協調的マルチエージェント行動の学習への現在のアプローチは、比較的限定的な設定を前提としている。
本稿では,この問題を定式化し,エージェントモデリングを用いたポリシー最適化(POAM)アルゴリズムを提案する。
POAMは、NAHT問題に対するポリシーグラデーションであり、マルチエージェント強化学習アプローチであり、多様なチームメイト行動への適応を可能にする。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 05:50:47 GMT)
Automated Phishing Detection Using URLs and Webpages [35.7] LLMエージェントフレームワークの開発により,従来の参照型フィッシング検出の制約に対処する。
このエージェントは、Large Language Modelsを利用して、積極的にオンライン情報を取得し、活用する。
我々の手法は0.945の精度で達成され、既存の解(DynaPhish)を0.445で大幅に上回っている。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 05:08:27 GMT)
Impact of polarization mode dispersion on entangled photon distribution [34.8] 光ファイバにおける偏光モード分散(PMD)は、量子通信における量子状態の忠実性を維持する上で大きな課題となる。
本研究は、広帯域光子に対するPMD効果を低減し、高次PMD効果の影響を評価するための効果的な方法を提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 11:29:45 GMT)
Investigating and Mitigating the Multimodal Hallucination Snowballing in Large Vision-Language Models [33.2] 視覚情報を人間の言語で理解する手法は進歩しているが、LVLM(Large Vision-Language Models)は多モード幻覚に悩まされている。
生成した幻覚に遭遇する際のLVLMの挙動を評価するためのMMHalballというフレームワークを提案する。
本稿では,LVLMの出力分布を残差視覚入力から導出した値で修正する,Residual Visual Decodingと呼ばれるトレーニング不要な手法を提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 17:52:43 GMT)
Joint Model Pruning and Resource Allocation for Wireless Time-triggered Federated Learning [31.6] タイムトリガー付きフェデレーション学習は、一定時間間隔に基づいてユーザーを階層に編成する。
無線時間トリガーシステムにモデルプルーニングを適用し、プルーニング比と帯域幅割り当ての最適化に関する問題を共同研究する。
提案するTT-Pruneは,モデルプルーニングを伴わない非同期多層FLと比較して,通信コストを40%削減することを示した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 12:19:23 GMT)
SAT3D: Image-driven Semantic Attribute Transfer in 3D [31.1] 参照画像からセマンティック属性を編集し,画像駆動型セマンティック属性変換法を3D(SAT3D)で提案する。
指導のために、各属性をフレーズベースの記述子群に関連付け、定量測定モジュール(QMM)を開発する。
本稿では,複数の領域にまたがる3次元属性変換結果について述べるとともに,従来の2次元画像編集手法との比較を行う。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 04:41:46 GMT)
AttackEval: How to Evaluate the Effectiveness of Jailbreak Attacking on Large Language Models [29.9] 本稿では,大規模言語モデルに対するジェイルブレイク攻撃の有効性を評価するための,革新的なフレームワークを提案する。
粗粒度評価と細粒度評価の2つの異なる評価フレームワークを提案する。
我々は、ジェイルブレイクのプロンプトに特化して、総合的な真実データセットを開発する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 06:39:25 GMT)
Deep Patch Visual SLAM [29.8] 本稿では,1つのGPU上でのモノクロ視覚SLAMの手法であるDeep Patch Visual (DPV) SLAMを紹介する。
DPV-SLAMは、既存の深いSLAMシステムと比較して、最小限のフレームレートとメモリオーバーヘッド(5-7G)を維持している。
EuRoC と TartanAir の DROID-SLAM に匹敵する精度を実現し,メモリ の 2.5 倍高速動作を実現した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 03:51:47 GMT)
AVESFormer: Efficient Transformer Design for Real-Time Audio-Visual Segmentation [29.3] AVESFormerは、高速、効率的、軽量を同時に実現した最初のリアルタイム視覚効率変換器である。
AVESFormerはモデル性能を大幅に向上させ、S4では79.9%、MS3では57.9%、AVSSでは31.2%を達成した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 08:25:26 GMT)
Towards A Generalizable Pathology Foundation Model via Unified Knowledge Distillation [29.1] Generalizable Pathology Foundation Model (GPFM)は、34の組織タイプにわたる約86,000の公開H&Eスライドから1億9000万の画像からなる大規模なデータセットに事前訓練されている。
GPFMの平均ランクは1.36で29タスクが1位、第2位のUNIは2.96で4タスクのみが1位である。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 13:36:24 GMT)
Motion Mamba: Efficient and Long Sequence Motion Generation [26.8] 状態空間モデル(SSM)の最近の進歩は、長いシーケンスモデリングにおいてかなりの可能性を秘めている。
我々は,SSMを用いた先駆的な動き生成モデルを示す,シンプルで効率的な手法であるモーション・マンバを提案する。
提案手法は,HumanML3DおよびKIT-MLデータセットの最大50%のFID改善と最大4倍の高速化を実現する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 07:48:15 GMT)
MCPDepth: Omnidirectional Depth Estimation via Stereo Matching from Multi-Cylindrical Panoramas [26.7] マルチシリンダパノラマ深さ推定(MCPDepth)
平均絶対誤差(MAE)を18.8%削減した最先端の性能は、屋外の合成データセットDeep360上での深度である。
屋内リアルタイムデータセット3D60の19.9%削減。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 03:35:37 GMT)
GLDiTalker: Speech-Driven 3D Facial Animation with Graph Latent Diffusion Transformer [26.6] 3D音声による顔アニメーション生成は、産業応用と学術研究の両方で注目されている。
本稿では,モーダル間マッピングの不確実性を低減するために,前もって動きを導入するGLDiTalkerを提案する。
空間情報の異なるレベルを統合するために、空間ピラミッドスピラルコンブは、マルチスケールの特徴を抽出するように設計されている。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 17:18:26 GMT)
WorkBench: a Benchmark Dataset for Agents in a Realistic Workplace Setting [26.5] 職場環境でタスクを実行するエージェントの能力を評価するためのベンチマークデータセットであるWorkBenchを紹介した。
WorkBenchにはサンドボックス環境があり、5つのデータベース、26のツール、690のタスクがある。
各タスクの正しい結果はユニークで曖昧で、堅牢で自動化された評価を可能にします。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 12:41:29 GMT)
IDNet: A Novel Dataset for Identity Document Analysis and Fraud Detection [26.0] IDNetは、プライバシー保護詐欺検出の取り組みを促進するために設計されたベンチマークデータセットである。
合成されたID文書の837,060枚の画像からなり、合計で約490ギガバイトである。
本研究は,プライバシ保護不正検出手法の訓練にどのように役立つかを示すとともに,データセットの有用性と利用事例を評価した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 07:05:40 GMT)
E$^3$NeRF: Efficient Event-Enhanced Neural Radiance Fields from Blurry Images [25.3] E$3$NeRFの高効率イベント強化型NeRFを提案する。
イベントストリームからの時空間情報を利用して,時間的ぼやけから学習注意を均等に分散する。
合成データと実世界のデータの両方の実験により、E$3$NeRFはぼやけた画像から鋭いNeRFを効果的に学習できることを示した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 18:47:31 GMT)
ALIF: Low-Cost Adversarial Audio Attacks on Black-Box Speech Platforms using Linguistic Features [25.3] ALIFは、最初のブラックボックス対応言語機能ベースのアタックパイプラインである。
本稿では,デジタルドメインと物理再生環境の両方で攻撃を開始するためのALIF-OTLおよびALIF-OTAスキームを提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 15:30:16 GMT)
Class-incremental Learning for Time Series: Benchmark and Evaluation [24.4] 本稿では,時系列クラスインクリメンタルラーニング(TSCIL)問題の概要を述べる。
標準化された設定に基づいて,新しいアルゴリズムの迅速な開発を支援する統一的な実験フレームワークを開発する。
このフレームワークを用いて、標準およびプライバシに敏感なシナリオにおいて、様々な汎用および時系列固有のCIL手法を包括的に評価する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 13:29:50 GMT)
AOTree: Aspect Order Tree-based Model for Explainable Recommendation [24.1] 本稿では,認知心理学や意思決定心理学のオーダーエフェクト理論に触発された,アスペクト・オーダー・ツリー・ベース(AOTree)の説明可能なレコメンデーション手法を提案する。
提案手法は,特定の順序で説明を表示することによって,ユーザの意思決定プロセスと一貫性を保ち,解釈可能性を高める。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 05:40:20 GMT)
Consistency-guided Prompt Learning for Vision-Language Models [23.5] 視覚言語モデルのための新しい微調整手法であるConsistency-Guided Prompt Learning (CoPrompt)を提案する。
提案手法は,下流タスクを数ショットで微調整した場合に,大規模な基礎モデルの一般化を改善する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 18:48:43 GMT)
Data-Centric Human Preference Optimization with Rationales [23.2] 人間のフィードバックからの強化学習は、言語モデルを人間の好みに合わせる上で重要な役割を担っている。
この作業は、データ中心のアプローチによる好み学習の改善に重点を移す。
我々は、選択の背景にある理由を説明する機械生成論理を用いて、既存の嗜好データセットを豊かにすることを提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 17:32:08 GMT)
Curriculum-Driven Edubot: A Framework for Developing Language Learning Chatbots Through Synthesizing Conversational Data [23.2] 本稿では,チャットボットの対話的特徴と英語教科書の体系的素材を組み合わせたチャットボットを開発するためのフレームワークであるCurriculum-Driven EduBotを紹介する。
まず、教科書から関連するトピックを抽出し、大きな言語モデルを用いてこれらのトピックに関連する対話を生成する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 17:13:24 GMT)
Landmark-guided Diffusion Model for High-fidelity and Temporally Coherent Talking Head Generation [22.2] 本稿では2段階拡散モデルを提案する。
第1段階では、与えられた音声に基づいて、同期された顔のランドマークを生成する。
第二段階では、これらの生成されたランドマークは、口のジッタ問題を最適化し、高忠実で、よく同期し、時間的に一貫性のあるトーキーヘッドビデオを生成することを目的として、デノナイジングプロセスにおける条件として機能する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 10:19:38 GMT)
VRSO: Visual-Centric Reconstruction for Static Object Annotation [21.7] 本稿では静的オブジェクトアノテーションのための視覚中心型アプローチであるVRSOを紹介する。
VRSOは低コスト、高効率、高品質である。
カメライメージのみを入力として、3D空間の静的オブジェクトを復元する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 03:59:33 GMT)
U-MedSAM: Uncertainty-aware MedSAM for Medical Image Segmentation [21.1] 我々は、MedSAMモデルと不確実性認識損失関数とシャープネス認識最小化(SharpMin)を統合した新しいモデルU-MedSAMを提案する。
SharpMinは、ロスランドスケープにフラットなミニマを見つけることで、一般化を改善し、オーバーフィッティングを減らす。
The CVPR24 MedSAM on Laptop Challengeでは,U-MedSAMが有望な性能を示した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 20:41:35 GMT)
Domain Reduction Strategy for Non Line of Sight Imaging [20.5] 非視線イメージング(NLOS)では、対象物体の可視光面は顕著に希薄である。
隠れ空間から連続的にサンプリングされた点集合からの部分的伝播を通して過渡現象を描画する手法を設計する。
本手法は,表面標準値を用いたビュー依存リフレクタンスを高精度かつ効率的にモデル化することができる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 10:50:21 GMT)
Integrating Physician Diagnostic Logic into Large Language Models: Preference Learning from Process Feedback [19.6] プロセスフィードバックから選好学習というアプローチを提案する。
PLPFは医師の診断ロジックをLSMに統合する。
PLPFは医療会話におけるベースラインモデルの診断精度を17.6%向上させる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 01:52:51 GMT)
KERMIT: Knowledge Graph Completion of Enhanced Relation Modeling with Inverse Transformation [19.3] 大規模言語モデルを用いてコヒーレントな記述を生成し,クエリと回答のセマンティックなギャップを埋める。
また、逆関係を利用して対称グラフを作成し、KGCのための強化トレーニングサンプルを提供する。
提案手法は,WN18RRではHit@1が4.2%,FB15k-237ではHit@3が3.4%向上し,優れた性能を示した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 13:34:24 GMT)
Offline Imitation of Badminton Player Behavior via Experiential Contexts and Brownian Motion [19.2] RallyNetは、バドミントンプレーヤーの振る舞いに対する階層的なオフライン模倣学習モデルである。
我々はRallyNetを世界最大規模のバドミントンデータセットで広く検証する。
その結果、オフラインの模倣学習法や最先端のターンベースアプローチよりもRallyNetの方が優れていることが明らかになった。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 06:36:17 GMT)
Joint Universal Adversarial Perturbations with Interpretations [19.1] 本稿では,JUAP(Universal Reversarial Perturbation)を生成する新たな攻撃フレームワークを提案する。
我々の知る限りでは、これはDNNと解釈の両方を共同攻撃するUAPを研究する最初の試みである。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 08:58:04 GMT)
Self-Emotion Blended Dialogue Generation in Social Simulation Agents [18.8] 本研究では,大規模言語モデル(LLM)に基づくシミュレーションフレームワークにおける対話戦略と意思決定において,自己感情がエージェントの行動にどのように影響するかを検討する。
その結果、自己感情を取り入れることで、エージェントはより人間的な対話戦略を提示できることがわかった。
エージェントが複数のトピックについて議論する仮想シミュレーション環境では,エージェントの自己感情がエージェントの意思決定プロセスに大きな影響を及ぼすことを示す。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 02:11:48 GMT)
Landau-Zener-Stückelberg interference in edge state pumping [18.6] 1次元モデルにおける断熱エッジ状態ポンプ(ESP)は、位相相転移と量子シミュレーションにおいて重要な応用である。
我々はESPのこの問題を再考し、断熱状態が崩壊するバンドレベルにおいて、一対の非断熱点をピンポイントする。
障害の存在下では、ESPは、非断熱性が分岐するエッジとバルクレベルの抗交差のために崩壊する可能性がある。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 01:59:46 GMT)
DiarizationLM: Speaker Diarization Post-Processing with Large Language Models [18.3] DiarizationLMは、大きな言語モデル(LLM)を利用して話者ダイアリゼーションシステムから出力を後処理するフレームワークである。
このフレームワークは、市販のASRや話者ダイアリゼーションシステムにも容易に適用できる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 14:59:40 GMT)
Leveraging GNSS and Onboard Visual Data from Consumer Vehicles for Robust Road Network Estimation [18.2] 本稿では,自動運転車における道路グラフ構築の課題について述べる。
本稿では,これらの標準センサから取得したグローバルナビゲーション衛星システム(GNSS)のトレースと基本画像データについて提案する。
我々は、畳み込みニューラルネットワークを用いて、道路中心のセマンティックセグメンテーションタスクとして問題をフレーミングすることで、データの空間情報を利用する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 02:57:37 GMT)
Holistic Dynamic Frequency Transformer for Image Fusion and Exposure Correction [18.0] 露出関連問題の修正は、画像の品質向上における重要な要素である。
本稿では、周波数領域を利用して露出補正タスクの処理を改善し、統一する新しい手法を提案する。
提案手法は, 露光補正においてより高度で統一された解を実現する方法である。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 06:18:23 GMT)
On the Self-Verification Limitations of Large Language Models on Reasoning and Planning Tasks [17.3] ゲーム・オブ・24(Game of 24)とグラフカラー化(Graph Coloring)とSTRIPSプランニング(STRIPS Planning)の3分野において,GPT-4の性能に関する実証的研究を行った。
我々は,自己批判による顕著なパフォーマンス崩壊と,音外検証による顕著なパフォーマンス向上を観察した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 21:25:31 GMT)
Resilience and Security of Deep Neural Networks Against Intentional and Unintentional Perturbations: Survey and Research Challenges [17.2] 高度なシナリオでは、ディープニューラルネットワーク(DNN)が外部の摂動に対して堅牢な推論を提供することが必須である。
このギャップを埋めるために,技術の現状を調査し,提案手法の類似点を強調する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 02:23:32 GMT)
MALADE: Orchestration of LLM-powered Agents with Retrieval Augmented Generation for Pharmacovigilance [17.0] 本稿ではPhV(Pharmacovigilance)の問題に焦点をあて,さまざまなテキストソースからADE(Adverse Drug Events)を特定することの重要性と課題について述べる。
MALADEは,薬物ラベルデータからADEを抽出するための大規模言語モデルと検索拡張生成を用いた,最初の効果的な協調型マルチエージェントシステムである。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 22:14:13 GMT)
FreeDrag: Feature Dragging for Reliable Point-based Image Editing [16.8] 我々は、ポイントトラッキングの負担を軽減すべく、FreeDragという機能ドラッグ手法を提案する。
FreeDragには、アダプティブ更新によるテンプレート機能と、バックトラックによるライン検索という、2つの重要な設計が含まれている。
提案手法は既存の手法よりも優れており,様々な複雑なシナリオにおいても信頼性の高い点ベースの編集が可能である。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 15:49:01 GMT)
radarODE: An ODE-Embedded Deep Learning Model for Contactless ECG Reconstruction from Millimeter-Wave Radar [16.5] レーダノードと呼ばれる新しいディープラーニングフレームワークは、レーダ信号から抽出された時間的および形態的特徴を融合させ、ECGを生成するように設計されている。
レーダノードは,検出率の欠落,ルート平均二乗誤差,ピアソン相関係数の9%,16%,19%で,ベンチマークよりも優れた性能を実現している。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 06:07:15 GMT)
CoEdPilot: Recommending Code Edits with Learned Prior Edit Relevance, Project-wise Awareness, and Interactive Nature [15.2] 我々は、関連する編集を識別してコード編集を推奨するLLM駆動のソリューションであるCoEdPilotを提案する。
CoEdPilotは、複数のニューラルトランスフォーマーをオーケストレーションして、ロケーションの編集とコンテントの編集の両方に関して、プロジェクトの中で何とどのように編集するかを特定する。
実験の結果、CoEdPilotは編集位置を70.8%-85.3%の精度で予測でき、正確なマッチングレートは41.8%、BLEU4スコアは60.7である。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 10:23:05 GMT)
Contestable AI needs Computational Argumentation [15.2] 最先端のアプローチは、AIシステムが競合する必要性をほとんど無視する。
競合可能なAIには、動的(ヒューマンマシンおよび/またはマシンマシン)の説明可能性と意思決定プロセスが必要である、と我々は主張する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 23:06:33 GMT)
A Novel Evaluation Framework for Image2Text Generation [15.1] 本稿では,画像生成が可能な現代大規模言語モデル(LLM)に根ざした評価フレームワークを提案する。
高い類似度スコアは、画像キャプションモデルが正確にテキスト記述を生成することを示唆している。
類似度の低いスコアは相違点を示し、モデルの性能の潜在的な欠点を明らかにする。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 09:27:57 GMT)
One-Way Functions Imply Secure Computation in a Quantum World [14.8] 我々は、量子ハード片道関数が、シミュレーション-セキュアな量子オブリバスト転送(QOT)を暗示することを証明する。
我々の構成は、量子ハード片道関数をブラックボックスでのみ利用する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 01:06:03 GMT)
ALPS: Improved Optimization for Highly Sparse One-Shot Pruning for Large Language Models [14.3] ALPSは,演算子分割法と事前条件付き勾配共役型後処理法を用いて,プルーニング問題に対処する最適化ベースのフレームワークである。
提案手法はベクトル化とGPU並列性を有効利用しながら収束を加速し理論的に保証する新しい手法を取り入れている。
OPT-30Bモデルでは70%の間隔で、ALPSはWikiTextデータセットにおけるテストの難易度を13%削減し、既存の手法と比較してゼロショットベンチマークのパフォーマンスを19%改善した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 20:20:52 GMT)
Transforming Slot Schema Induction with Generative Dialogue State Inference [14.1] スロットインジェクション(SSI)は、ラベルのない対話データからスロットを自動的に誘導することを目的としている。
本手法は,対話状態を表すための高品質な候補情報を検出する。
MultiWOZデータセットとSGDデータセットの実験的比較により、生成対話状態推論(Generative Dialogue State Inference, GenDSI)が従来の最先端よりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 02:41:10 GMT)
Molecular relaxation by reverse diffusion with time step prediction [13.8] 逆拡散による分子緩和であるMoreRedを提案する。
モレレッドは複雑な物理PSSの代わりに単純な擬ポテンシャルエネルギー曲面(PES)を学習する。
得られた平衡構造と参照平衡構造とエネルギーとのルート平均二乗偏差を評価した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 13:26:31 GMT)
PrimeComposer: Faster Progressively Combined Diffusion for Image Composition with Attention Steering [13.8] 我々は、画像合成を主観的な局所的な編集タスクとして定式化し、前景生成にのみ焦点をあてる。
本研究では,様々なノイズレベルに対して注意制御を適切に設計することで,画像の合成を行う高速なトレーニングフリーディフューザであるPrimeComposerを提案する。
提案手法は,最も高速な推論効率を示し,定性的かつ定量的に,我々の優位性を実証する広範囲な実験を行った。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 05:08:14 GMT)
PLUGH: A Benchmark for Spatial Understanding and Reasoning in Large Language Models [13.6] 現在5つのタスクからなる最新のベンチマークであるPLUGHについて,48種類のゲームから125個の入力テキストを抽出した。
APIベースおよびオープンソース LLM の評価は,いくつかの商用 LLM には強い推論能力があるが,オープンソースコンペティタは,ほぼ同じレベルの品質を示すことができることを示している。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 13:21:08 GMT)
Differentially Private Gomory-Hu Trees [13.6] 我々は,近似Gomory-Hu木を演算する差分プライベート(DP)アルゴリズムを設計する。
我々のアルゴリズムは$varepsilon$-DPであり、時間内で動作し、$tildeO(n/varepsilon)$-additive approximations of the Min-s$-$t$-Cuts in $G$ for all different $s.
論文参考訳(メタデータ) (Sat, 3 Aug 2024 14:50:03 GMT)
Multi-Frame Vision-Language Model for Long-form Reasoning in Driver Behavior Analysis [13.6] 我々は,新しいマルチモーダル・インストラクション・チューニング・データセットとドライバ・コーチング・システムを構築した。
我々のデータセットは、言語モデルが様々な危険な運転シナリオで視覚的な指示を学習することを可能にする。
本モデルは,ダッシュカム搭載車両における運転行動の包括的範囲を把握し,路面カメラおよび運転者向けRGBカメラ映像の訓練を行う。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 06:40:00 GMT)
Distributionally Robust Policy and Lyapunov-Certificate Learning [13.4] 不確実なシステムに対する安定性を保証するコントローラの設計における重要な課題は、オンラインデプロイメント中のモデルパラメトリック不確実性の変化の正確な決定と適応である。
我々は、リアプノフ証明書の単調な減少を保証するために、リアプノフ微分チャンス制約を分布的に頑健に定式化することで、この問題に取り組む。
得られた閉ループシステムに対して、その平衡のグローバルな安定性は、アウト・オブ・ディストリビューションの不確実性があっても高い信頼性で証明できることを示す。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 18:43:14 GMT)
Building Trust in Mental Health Chatbots: Safety Metrics and LLM-Based Evaluation Tools [13.3] 100のベンチマーク質問と理想的な回答を備えた評価フレームワークを作成しました。
このフレームワークはメンタルヘルスの専門家によって検証され、GPT-3.5ベースのチャットボットでテストされた。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 19:57:49 GMT)
PyBench: Evaluating LLM Agent on various real-world coding tasks [13.3] PyBenchは、現実世界のタスクの5つの主要なカテゴリをカバーするベンチマークで、10種類以上のファイルをカバーする。
我々の評価は、現在のオープンソースLLMがこれらのタスクに苦戦していることを示している。
微調整された8Bサイズモデル: textbfPyLlama3はPyBench上でエキサイティングなパフォーマンスを実現します。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 03:00:43 GMT)
SSUMamba: Spatial-Spectral Selective State Space Model for Hyperspectral Image Denoising [13.1] HSI復調のためのメモリ効率の良い空間スペクトル(SSUMamba)を導入する。
Mambaは、その顕著な長距離依存性モデリング機能で知られている。
SSUMambaは、トランスフォーマーベースの手法に比べて、バッチ当たりのメモリ消費が低い優れたデノナイズ結果が得られる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 09:18:32 GMT)
MMPKUBase: A Comprehensive and High-quality Chinese Multi-modal Knowledge Graph [13.1] MMPKUBaseは中国のマルチモーダルな知識グラフで、鳥類、哺乳類、シダなどさまざまな領域を網羅している。
画像データを改良するために,原型コントラスト学習と分離フォレストアルゴリズムを用いる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 06:35:54 GMT)
FBINeRF: Feature-Based Integrated Recurrent Network for Pinhole and Fisheye Neural Radiance Fields [13.0] 本稿では,ラジアル歪みに適応した柔軟なバンドル調整法により適応的なGRUを提案する。
ピンホールカメラおよび魚眼カメラ用NeRFの高忠実度化について検討した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 23:11:20 GMT)
eCeLLM: Generalizing Large Language Models for E-commerce from Large-scale, High-quality Instruction Data [12.9] 電子商取引のための,最初のオープンソース,大規模,高品質なベンチマークインストラクションデータセットであるECInstructを構築した。
我々は,eコマース LLM のシリーズである eCeLLM を開発した。
eCeLLMは、目に見えない製品や目に見えない命令を含む、ドメイン外の設定に優れた一般化性を示す。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 23:29:26 GMT)
SkyDiffusion: Street-to-Satellite Image Synthesis with Diffusion Models and BEV Paradigm [12.8] 本研究では,ストリートビュー画像から衛星画像を合成する新しいクロスビュー生成手法であるSkyDiffusionを紹介する。
SkyDiffusionは郊外(CVUSAとCVACT)と都市横断的なデータセットの両方において最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 15:43:56 GMT)
Controllable Unlearning for Image-to-Image Generative Models via $\varepsilon$-Constrained Optimization [12.6] 画像合成モデル(I2I)における機械学習問題について検討する。
従来の研究は主に、単独のソリューションを提供する単一目的最適化問題として扱われていた。
本稿では、制御係数$varepsilon$を用いてトレードオフを制御する制御可能なアンラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 07:04:55 GMT)
JambaTalk: Speech-Driven 3D Talking Head Generation Based on Hybrid Transformer-Mamba Language Model [12.3] 本稿では,ハイブリッドトランスフォーマー・マンバモデルであるJambaを用いて3次元顔のアニメーションを作成することを目的とする。
基礎となるJambaブロックに基づいて、マルチモーダル統合による動きの多様性と速度を高めるためにJambaTalkを提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 01:38:11 GMT)
SiamMo: Siamese Motion-Centric 3D Object Tracking [12.3] 動作中心追跡の手法であるSiamMoを紹介する。
従来のシングルストリームアーキテクチャとは異なり、動作中心追跡のためのSiamese特徴抽出を導入する。
SiamMoは、KITTI追跡ベンチマークで90.1%の精度で新しい記録を樹立し、推論速度は108 FPSである。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 07:02:01 GMT)
CM2-Net: Continual Cross-Modal Mapping Network for Driver Action Recognition [11.9] 本稿では,新たにやってくる各モダリティを継続的に学習する連続的クロスモーダルマッピングネットワーク(CM2-Net)を提案する。
我々は,識別的・情報的特徴を地図化するために,累積クロスモーダルマッピング・プロンプト(ACMP)を開発した。
Drive&Actデータセットで行った実験は、ユニモーダルドライバとマルチモーダルドライバの両方でCM2-Netの性能上の優位性を示す。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 12:23:25 GMT)
Transform Arbitrary Good Quantum LDPC Codes into Good Geometrically Local Codes in Any Dimension [11.7] 重要な課題は、寸法と距離の両方を最大化する最適なコード構造を特定することです。
最近の進歩はいくつかの構成を生み出しているが、これらは特定の良い量子低密度パリティチェック(qLDPC)符号に依存しているか、3次元に限定されている。
我々は、優れたqLDPCコードを最適な幾何学的局所量子コードに変換することができる構成を導入する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 12:46:05 GMT)
Reassessing Evaluation Functions in Algorithmic Recourse: An Empirical Study from a Human-Centered Perspective [11.5] アルゴリズム・リコースの基礎的前提を批判的に検討する。
参加者のリコース受け入れは,リコース距離と相関しないことがわかった。
これらの結果は、アルゴリズム的リコース研究の一般的な仮定に疑問を投げかけた。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 12:46:57 GMT)
TreeCSS: An Efficient Framework for Vertical Federated Learning [11.5] VFLは、データサンプルの特徴が異なる参加者で分割されている場合を考慮している。
本稿では2つの主要なステップを加速する効率的なVFLフレームワークとしてTreeCSSを提案する。
結果は、バニラVFLと比較して、TreeCSSはトレーニングを最大2.93倍加速し、同等のモデルの精度を達成することを示している。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 07:11:57 GMT)
Robust Qubit Mapping Algorithm via Double-Source Optimal Routing on Large Quantum Circuits [11.4] Duostraは、実際のハードウェアデバイスで大規模量子回路を実装するという課題に対処するために設計されている。
ダブルキュービットゲートの最適経路を効率よく決定し、SWAPゲートを挿入することで動作する。
合理的なランタイム内で、良質な結果が得られます。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 14:34:36 GMT)
Investigation on a quantum algorithm for linear differential equations [11.4] 本稿では、線形微分方程式を最適誤差耐性で解くための先駆的量子アプローチ(BCOWアルゴリズム)を提案する。
もともとは対角化可能な線形微分方程式の特定のクラスのために設計され、このアルゴリズムは[Kro23]でクロヴィによって拡張され、より広範なクラスを包含した。
我々は、Kroviアルゴリズムで概説された境界を導出し、BCOWアプローチの利点を再考する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 11:59:22 GMT)
STDA: Spatio-Temporal Dual-Encoder Network Incorporating Driver Attention to Predict Driver Behaviors Under Safety-Critical Scenarios [11.3] ドライバーの注意は、安全クリティカルなシナリオのためにSTDAという2つの行動コーダ-enネットワークに組み込まれた。
STDAにはドライバの注意予測モジュールと、ドライバの注意と生画像とを融合させるために設計された融合モジュールと、動的シーンを解釈する能力を高めるために使用される一時的なエンコーダモジュールの4つの部分が含まれている。
その結果、STDAはドライバーの注意を取り入れて時間エンコーダモジュールを採用すると、G平均を0.659から0.719に改善することがわかった。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 13:06:04 GMT)
TS-SAM: Fine-Tuning Segment-Anything Model for Downstream Tasks [10.8] 微調整されたSAMとドメイン固有のモデルの間には、依然として大きなパフォーマンスギャップがあります。
本稿では,SAM の強力な特徴をサイドネットワークトレーニングに統合し,包括的特徴融合を実現する Two-Stream SAM (TS-SAM) を提案する。
3つのタスクから得られた10の公開データセットに対する大規模な実験により、TS-SAMは、最近提案されたSAM-AdapterとSSOMよりも大幅に優れているだけでなく、SOTAドメイン固有のモデルとの競合性能も達成している。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 18:08:51 GMT)
Where Are Large Language Models for Code Generation on GitHub? [10.4] ChatGPTとCopilotは、GitHub上でコードを生成するために最も頻繁に使用される。
ほとんどのChatGPT/Copilot生成コードスニペットは比較的短く、複雑さが低い。
バグによる修正は、さまざまな言語でわずか3%から8%まで、さらに少ない。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 00:40:02 GMT)
On the Rationale and Use of Assertion Messages in Test Code: Insights from Software Practitioners [10.3] 単体テストは、一連のテストケースを通じてその振る舞いを検証することによって、ソフトウェアシステムの品質を保証するための重要なプラクティスである。
これらのテストケースの中核となるのはアサーションステートメントであり、それによってソフトウェア実践者がシステムの振る舞いの正しさを検証することができる。
テストケース障害の理解とトラブルシューティングを支援するため、実践者はアサーションステートメントにメッセージ(すなわちアサーションメッセージ)を含めることができる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 11:13:36 GMT)
Demystifying Device-specific Compatibility Issues in Android Apps [10.1] GitHub上の94のオープンソースリポジトリから収集した197のDSC問題に関する実証的研究を行った。
本稿では,これらの問題を,機能的ブレークとOEM機能という2つの主要なグループに分類することで,理解する新たな視点を紹介する。
機能の性質の相違によって問題が発生し、OEMの機能は問題に対処する上でユニークな問題を引き起こします。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 15:34:58 GMT)
Quality Issues in Machine Learning Software Systems [10.1] 機械学習ソフトウェアシステムの品質を保証するためには、強いニーズがある。
本稿では,実践者の視点から,MLSSにおける実際の品質問題の特徴について考察する。
我々は18の反復的な品質問題と21の戦略を特定し、それらを緩和する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 14:52:22 GMT)
MultiFuser: Multimodal Fusion Transformer for Enhanced Driver Action Recognition [10.1] 我々はMultiFuserという新しいマルチモーダル核融合トランスを提案する。
マルチモーダルカーキャビンビデオ間の相互関係と相互作用を識別する。
Drive&Actデータセットで大規模な実験を行う。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 12:33:21 GMT)
Bayesian Active Learning for Semantic Segmentation [9.6] スパースピクセルレベルのアノテーションに基づくベイズ能動的学習フレームワークを提案する。
BalEntは、予測された限界化確率分布とピクセルラベルの間の情報をキャプチャする。
私たちは、Cityscapes、Camvid、ADE20K、VOC2012ベンチマークデータセットのために提案したアクティブラーニングフレームワークをトレーニングします。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 07:26:10 GMT)
Preference-Based Abstract Argumentation for Case-Based Reasoning (with Appendix) [9.5] ケースベース推論(AA-CBR-Pと呼ぶ)のための参照ベース抽象記述法を提案する。
これにより、ユーザーはケースを比較するための複数のアプローチを、これらの比較アプローチよりも好みを指定する順序付けと定義することができる。
我々は、実際の医療データセット上で、我々のアプローチが他の解釈可能な機械学習モデルより優れていることを実証的に示す。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 08:51:46 GMT)
ST-SACLF: Style Transfer Informed Self-Attention Classifier for Bias-Aware Painting Classification [9.5] 絵画分類は、デジタル美術館や古典美術館の美術品を整理し、発見し、提案する上で重要な役割を担っている。
既存の手法は、トレーニング中に実世界の知識を芸術的イメージに適応させることに苦労し、異なるデータセットを扱う際にはパフォーマンスが低下する。
適応インスタンス正規化(AdaIN)を使用したスタイル転送(Style Transfer)により、さまざまなスタイル間のギャップを埋める、より多くのデータを生成します。
40のトレーニングエポック上でResNet-50のバックボーンを使用して、87.24%の精度を実現した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 17:31:58 GMT)
Large Language Models for Equivalent Mutant Detection: How Far Are We? [9.1] 我々は3,302個のメソッドレベルのJavaミュータントペアについて実験的検討を行い、等価なミュータント検出のための大規模言語モデル(LLM)の有効性と効率について検討した。
以上の結果から,LLM技術は既存の技術よりも優れており,コード埋め込み戦略が最も効果的であることが示唆された。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 11:58:16 GMT)
Invariant Graph Learning Meets Information Bottleneck for Out-of-Distribution Generalization [9.1] 本研究では,情報ボトルネック理論に基づく不変グラフ学習(Invariant Graph Learning)という新しいフレームワークを提案する。
具体的には,環境要因に関連するタスク関連情報を圧縮する冗長フィルタを提案する。
合成と実世界の両方のデータセットを用いた実験により,OODの一般化による最先端性能の実現が実証された。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 07:38:04 GMT)
Do Generative AI Models Output Harm while Representing Non-Western Cultures: Evidence from A Community-Centered Approach [8.8] 本研究では,生成人工知能(GAI)モデル,特にテキスト・ツー・イメージ・ジェネレータ(T2Is)が非西洋文化の表現に与える影響について検討する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 21:49:57 GMT)
A Deep CNN Model for Ringing Effect Attenuation of Vibroseis Data [8.7] 振動子の周波数帯域に制限があるため,バイブロサイスデータ処理において「リング効果」は一般的な問題である。
我々は深部畳み込みニューラルネットワーク(CNN)を用いたビブロセイスデータの新しい導出モデルを提案した。
実験結果から,深部CNNモデルはリング効果を効果的に減らし,ビブロセイスデータの帯域幅を拡大できることがわかった。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 17:50:13 GMT)
Visual-Inertial SLAM for Agricultural Robotics: Benchmarking the Benefits and Computational Costs of Loop Closing [8.7] 本稿では,ORB-SLAM3,VINS-Fusion,OpenVINS,Kimera,SVO ProなどのオープンソースのVisual-Inertial SLAMシステムを用いて,農業環境における性能評価を行う。
本稿では,ループ閉鎖が局所化精度と計算要求に与える影響に着目し,実環境におけるこれらのシステムの有効性を包括的に分析する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 09:10:38 GMT)
Transformer-Based Classification Outcome Prediction for Multimodal Stroke Treatment [8.7] 本研究では,Transformerアーキテクチャと自己保持機構に基づくマルチモーダル融合フレームワークであるMultitransを提案する。
このアーキテクチャは、非コントラストCT(non-contrast Computed tomography)画像の研究と、脳卒中治療中の患者の退院診断報告を組み合わせたものである。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 14:53:25 GMT)
MSA$^2$Net: Multi-scale Adaptive Attention-guided Network for Medical Image Segmentation [8.4] MSA$2$Netは、スキップ接続を適切に設計した新しいディープセグメンテーションフレームワークである。
本稿では,空間的特徴を選択的に強調するために,MASAG(Multi-Scale Adaptive Space Attention Gate)を提案する。
MSA$2$Netは、最先端のSOTA(State-of-the-art)よりも優れています。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 22:22:30 GMT)
Positive-Unlabeled Constraint Learning (PUCL) for Inferring Nonlinear Continuous Constraints Functions from Expert Demonstrations [8.4] 本稿では,実証から連続的な任意の制約関数を推論する,新しいPositive-Unlabeled Constraint Learning (PUCL)アルゴリズムを提案する。
フレームワーク内では、すべてのデータをポジティブな(実現可能な)データとして扱うとともに、潜在的に不可能なトラジェクトリを生成するための制御ポリシーを学ぶ。
連続的な非線形制約を推論し、転送し、制約精度とポリシー安全性の点で他のベースライン法より優れている。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 01:09:48 GMT)
Managing Human-Centric Software Defects: Insights from GitHub and Practitioners' Perspectives [8.3] HCD(Human-centric defect)は、エンドユーザの認識や違いによってしばしば発生する、ニュアンスで主観的な欠陥である。
開発チームはこれらの問題に対する理解が限られており、これらの欠陥を無視することになります。
欠陥報告ツールは、HCDのキャプチャと修正を適切に処理しない。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 01:08:38 GMT)
VersusDebias: Universal Zero-Shot Debiasing for Text-to-Image Models via SLM-Based Prompt Engineering and Generative Adversary [8.2] テキスト・ツー・イメージモデルにおいて,1つの生成逆数機構 (GAM) と1つの生成逆数生成機構 (SLM) からなるバイアスに対する新しい普遍的バイアス発生機構を導入する。
SLMはプロンプトエンジニアリングを使用してT2Iモデルのデバイアスドプロンプトを生成し、異なるモデルのゼロショットデバイアス機能とカスタム最適化を提供する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 14:36:06 GMT)
Entanglement scaling behaviors of free fermions on hyperbolic lattices [8.2] 双曲格子上のタイト結合モデルは、双曲的バンド理論と非アベリアブロッホ状態をもたらす。
本稿では,物質のエキゾチック相への強力な量子情報プローブとして考えられてきたエンタングルメントエントロピー(EE)のスケーリングに焦点を当てる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 08:17:51 GMT)
Symmetric Graph Contrastive Learning against Noisy Views for Recommendation [7.9] 本稿では, 対称性理論をグラフのコントラスト学習に適用し, ノイズ干渉に耐性のある対称形式とコントラスト損失を提案する。
我々のアプローチは、他の9つの競合モデルに比べて、相対的な改善が最大12.25%に達することによって、推奨精度を大幅に向上させる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 06:58:07 GMT)
Real-time Hybrid System Identification with Online Deterministic Annealing [7.2] 本稿では、入力出力領域と状態空間領域の両方において、離散時間状態依存切替システムに対するリアルタイム識別手法を提案する。
スイッチングシステムにおける標準的な識別アルゴリズムとは対照的に,提案手法は徐々にモード数を推定し,リアルタイムシステム識別に適している。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 10:02:49 GMT)
Neural Network Enumerator for Atmospheric Chemical ODE [6.8] 近年,デジタル信号処理におけるディープニューラルネットワークの成功を踏まえ,高速な化学濃度モデリングのためのニューラルネットワークを提案する。
初期状態と今後の時間進化の間の隠れた相関関係を抽出するために,ChemNNEを提案する。
提案手法は,モデリング精度と計算速度において最先端の性能を実現する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 17:43:10 GMT)
Efficient Solutions For An Intriguing Failure of LLMs: Long Context Window Does Not Mean LLMs Can Analyze Long Sequences Flawlessly [6.7] 大規模言語モデル(LLM)は、長い逐次入力の解釈と解析において顕著な能力を示した。
本稿では,長い入力シーケンスを扱う場合,LLMが短くなるという,驚くべき制限を明らかにする。
本稿では,LLMの性能を最大50%向上させるアドホックな手法を提案し,評価する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 21:31:34 GMT)
CAR: Contrast-Agnostic Deformable Medical Image Registration with Contrast-Invariant Latent Regularization [6.3] 本稿では,任意のコントラスト画像に一般化可能な,コントラストに依存しない新しい画像登録フレームワークを提案する。
特に、画像の任意のコントラストを1つの画像コントラスト上でシミュレートするランダム畳み込みに基づくコントラスト拡張方式を提案する。
実験により、CARは登録精度に関するベースラインアプローチよりも優れており、画像のコントラストが見えないような一般化能力も優れていることが示された。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 19:46:23 GMT)
Walk Wisely on Graph: Knowledge Graph Reasoning with Dual Agents via Efficient Guidance-Exploration [6.1] 階層的強化学習(HRL)に基づく二重エージェントを用いたマルチホップ推論モデルを提案する。
FULORAは、二重エージェント間のeFficient GUidance-ExpLORAtionによる上記の推論課題に取り組む。
3つの実単語知識グラフデータセットで実施された実験では、FULORAがRLベースのベースラインより優れていることが示された。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 23:15:57 GMT)
Mitigating the Impact of Malware Evolution on API Sequence-based Windows Malware Detector [6.0] APIシーケンスに基づく手法は、マルウェア予防において重要な役割を果たす。
進化したマルウェアサンプルは、しばしば、進化前のサンプルのAPIシーケンスを使用して、同様の悪意のある振る舞いを達成する。
本稿では,既存のAPIシーケンスに基づくマルウェア検出機能を拡張可能なフレーム(MME)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 04:21:24 GMT)
Improved Belief Propagation Decoding Algorithms for Surface Codes [5.9] 信念伝播(BP)は、ほぼ線形時間の複雑さで有名である。
BPの復号精度は後処理無しで、ほとんどの状況では不十分である。
本稿では,表面符号のGF(4)よりもBPの復号精度を向上させることに焦点を当てる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 05:45:27 GMT)
Something from Nothing: Enhanced Laser Cooling of a Mechanical Resonator via Zero-Photon Detection [5.9] 光子の欠如の測定は、幅広い新しい実験的方向性に有意な可能性を秘めている。
ゼロ光子検出による機械共振器の冷却を実験的に実証し、この冷却を反ストークス散乱光場の測定により検証する。
我々の測定はマスター方程式によってよく捉えられ、ここで導入された技術は、冷却、量子熱力学、量子状態工学、量子計測と制御のための新しい道を開く。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 10:25:10 GMT)
Something from Nothing: A Theoretical Framework for Enhancing or Enabling Cooling of a Mechanical Resonator via the anti-Stokes or Stokes Interaction and Zero-Photon Detection [5.9] 我々は、ゼロ光子検出が反ストークス相互作用によるレーザー冷却を高めるためにどのように利用されるかを記述するための理論的枠組みを開発する。
冷却が検出効率や最適協調性などのシステムパラメータにどのように依存するかを論じる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 10:25:15 GMT)
Voices from the Frontier: A Comprehensive Analysis of the OpenAI Developer Forum [5.7] OpenAIの先進的な大規模言語モデル(LLM)は自然言語処理に革命をもたらし、開発者は革新的なアプリケーションを作成できるようになった。
本稿では,OpenAI Developer Forumを包括的に分析する。
本研究では,(1)人気傾向とユーザエンゲージメントパターン,(2)開発者が直面する課題や関心事の分類に焦点をあてる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 06:57:43 GMT)
Multiple Contexts and Frequencies Aggregation Network forDeepfake Detection [5.7] ディープフェイク検出は、大量で多様なディープフェイク技術の開発において、生成モデルの急速な成長以来、課題に直面している。
近年の進歩は、バックボーン内の一般的な偽造特徴をモデル化するのではなく、空間領域や周波数領域からの特徴の導入に依存している。
2つのコアモジュールからなるMkfaNetという顔偽造検出のための効率的なネットワークを提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 05:34:53 GMT)
MedUHIP: Towards Human-In-the-Loop Medical Segmentation [5.5] 医用画像のセグメンテーションは、固有の不確実性によって特に複雑である。
我々はtextbfuncertainty-aware モデルと textbf Human-in-the-loop 相互作用を統合する新しいアプローチを提案する。
提案手法は,決定論的および不確実性を考慮したモデルよりも優れたセグメンテーション能力を示す。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 01:06:02 GMT)
Past, Present, and Future of Citation Practices in HCI [5.5] 我々は,2016年のACM CHIカンファレンスで導入された編集方針の変更が,CHIコミュニティを拡大する道のりでどのように開始したかを示す証拠を提供する。
もしこのほぼ直線的な傾向が相変わらず続くなら、CHI 2030の記事には平均130の参照が含まれている。
本稿では,研究コミュニティにおけるメタリサーチの価値と,メソレベルの政策調整が科学分野や規律の進化にもたらす大きな影響について述べる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 14:12:04 GMT)
LAM3D: Leveraging Attention for Monocular 3D Object Detection [5.4] LAM3Dはモノクロ3Dオブジェクト検出のための自己認識機構をレバレッジするフレームワークである。
提案手法をKITTI 3D Object Detection Benchmark上で評価する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 10:50:07 GMT)
Coordinating Planning and Tracking in Layered Control Policies via Actor-Critic Learning [5.2] 本稿では,(1)軌道プランナと(2)階層型制御アーキテクチャにおけるトラッキングコントローラを協調訓練するための強化学習(RL)に基づくアルゴリズムを提案する。
本アルゴリズムは,アクター・クリティカルな学習手法を取り入れた最適制御問題の書き直しから自然に生じる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 02:53:24 GMT)
Can LLMs predict the convergence of Stochastic Gradient Descent? [5.2] 大規模なランダム化モデルは、様々なタスクにまたがる優れたパフォーマンスで有名です。
このような驚くべきパフォーマンスの1つの驚くべき例は、マルコフシステムの原則を満たす、最近特定されたタスクである。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 10:35:59 GMT)
Enhancing Commentary Strategies for Imperfect Information Card Games: A Study of Large Language Models in Guandan Commentary [5.1] 強化学習(RL)と大規模言語モデル(LLM)を組み合わせた新しい注釈手法を提案する。
本システムでは,RLを利用して複雑なカード再生シナリオを生成し,LLMを用いて対応する注釈文を生成する。
オープンソース LLM に適用した場合,提案する注釈フレームワークによって達成される性能の大幅な向上を示す。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 07:59:33 GMT)
JOSENet: A Joint Stream Embedding Network for Violence Detection in Surveillance Videos [4.9] 監視ビデオにおける暴力検出は、様々な実戦シーンのような追加の問題を提示する。
本稿では、監視ビデオにおける暴力検出に優れたパフォーマンスを提供する自己監視フレームワークJOSENetを紹介する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 18:49:02 GMT)
Dreaming of Many Worlds: Learning Contextual World Models Aids Zero-Shot Generalization [4.9] 本稿では,ゼロショット一般化(ZSG)によるエンボディシステムにおける非表示ダイナミクスの課題に対処する。
本研究では,Dreamerの世界モデルに変化をもたらす文脈的リカレント状態空間モデル(cRSSM)を提案する。
実験により,このような文脈の体系的な組み入れにより,世界モデルの「夢」に基づいて訓練された政策のZSGが向上することが示された。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 14:25:42 GMT)
Batch Active Learning in Gaussian Process Regression using Derivatives [4.4] ガウス過程回帰モデルにおけるバッチアクティブラーニングにおける微分情報の利用について検討する。
提案手法では,データバッチの選択に予測共分散行列を用いて,サンプルの完全相関を利用する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 20:13:47 GMT)
How Generalizable are Deepfake Image Detectors? An Empirical Study [4.4] 本研究は,ディープフェイク検出器の一般化性に関する最初の実証的研究である。
本研究では,6つのディープフェイクデータセット,5つのディープフェイク画像検出手法,および2つのモデル拡張アプローチを用いた。
検出器は, 合成法に特有の不要な特性を学習し, 識別的特徴の抽出に苦慮していることがわかった。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 06:05:56 GMT)
Zero-Shot Surgical Tool Segmentation in Monocular Video Using Segment Anything Model 2 [4.4] Segment Anything Model 2 (SAM2)は、画像とビデオのセグメンテーションのための最新の基礎モデルである。
内視鏡検査や顕微鏡検査など,異なるタイプの手術におけるSAM2モデルのゼロショット映像分割性能について検討した。
1) SAM2は, 各種手術ビデオのセグメンテーション能力を示す。2) 新たなツールが現場に入ると, セグメンテーションの精度を維持するために追加のプロンプトが必要であり, 3) 手術ビデオに固有の課題はSAM2のロバスト性に影響を与える。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 03:19:56 GMT)
Evaluating Quantumness, Efficiency and Cost of Quantum Random Number Generators via Photon Statistics [4.2] 本稿ではQRNGメーカーとユーザの視点から,2つの重要な貢献について述べる。
製造業者にとって、単一光子ベースのQRNGの量子性を評価する従来の方法は、有限サンプルサイズのため統計的に信頼性が低い。
QRNGの基本的なパラメータは、量子性(セキュリティ)、効率性(ランダム性と乱数生成率)、コストである。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 18:34:47 GMT)
NuLite -- Lightweight and Fast Model for Nuclei Instance Segmentation and Classification [4.2] 病理学では、ヘマトキシリンとエオシン(H&E)スライドの正確かつ効率的な解析は、タイムリーかつ効果的ながん診断に不可欠である。
我々は,SOTA(State-of-the-art)軽量CNNであるFast-ViT上に明示的に設計された,新しい畳み込みニューラルネットワークであるNuLiteを導入する。
我々は、PanNukeデータセットでトレーニングしたNuLite-S、NuLite-M、NuLite-Hの3つのモデルを得た。実験結果、我々のモデルは、汎視的品質と検出の点でCellViT(SOTA)と同等であることが証明された。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 14:48:34 GMT)
Discovery of Rare Causal Knowledge from Financial Statement Summaries [4.2] 本稿では,企業の財務諸表から稀な因果知識を抽出する手法を提案する。
まず、拡張言語オントロジーに基づく機械学習手法を用いて、要約から因果知識を含む文を抽出する。
第2に、構文パターンを用いて抽出された文から因果知識を取得し、最後に、得られた知識から最も稀な因果知識を抽出する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 11:08:53 GMT)
Summarization of Investment Reports Using Pre-trained Model [4.1] トランスフォーマーモデルを用いた月次レポートからの投資要約に取り組む。
要約法には、抽出的要約と抽象的要約の2つの主な種類がある。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 11:04:04 GMT)
Music2P: A Multi-Modal AI-Driven Tool for Simplifying Album Cover Design [3.7] Music2Pは、オープンソースでマルチモーダルなAI駆動のアルバムカバー作成ツールである。
言語イメージ事前学習(BLIP)、音楽からテキストへの変換(LP-music-caps)、イメージセグメンテーション(LoRA)、アルバムカバー、QRコード生成(ControlNet)などの技術を用いて設計プロセスを自動化する。
私たちの究極のゴールは、ミュージシャンやプロデューサー、特に限られたリソースや専門知識を持つ人たちに、魅力的なアルバムカバーを作るためのツールを提供することです。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 03:30:57 GMT)
Chain of Stance: Stance Detection with Large Language Models [3.5] スタンス検出は自然言語処理(NLP)におけるアクティブタスクである
我々は、Stance (CoS) の textitChain と呼ばれる新しいプロンプト手法を提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 16:30:51 GMT)
Squeezing-enhanced quantum sensing with quadratic optomechanics [3.5] Cavity Opomechanical (COM) センサーは、量子スクイーズや絡み合いによって強化され、超弱力を測定するための強力なツールとなっている。
ここでは、量子圧縮光を用いて、標準量子限界を超え、そのようなシステムの性能をさらに向上させることができることを示す。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 12:34:53 GMT)
Safe Semi-Supervised Contrastive Learning Using In-Distribution Data as Positive Examples [3.5] 本稿では,大量のラベルのないデータを完全に活用するための,自己教師付きコントラスト学習手法を提案する。
その結果,自己指導型コントラスト学習は分類精度を著しく向上させることがわかった。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 22:33:13 GMT)
Optimizing Intrusion Detection System Performance Through Synergistic Hyperparameter Tuning and Advanced Data Processing [3.3] 侵入検知は、悪意のある活動に対するコンピュータネットワークの確保に不可欠である。
そこで本研究では,ディープラーニングとデータバランシング,高次元化を組み合わせたシステムを提案する。
CIC IDS 2018やCIC IDS 2017のような広範なデータセットをトレーニングすることで、当社のモデルは堅牢なパフォーマンスと一般化を示している。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 14:09:28 GMT)
Weak force sensing based on optical parametric amplification in a cavity optomechanical system coupled in series with two oscillators [3.2] 劣化型光パラメトリック増幅器(OPA)と補助機械振動器を共振器に結合して量子ノイズを低減する弱力センシング方式について検討する。
OPAのノイズ低減機構は、光子数の変動を低減し、キャビティ場のスクイージングを強化することである。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 11:43:55 GMT)
Integrating Large Language Models and Knowledge Graphs for Extraction and Validation of Textual Test Data [3.1] タレス・アレニア・スペース (Thales Alenia Space) のような航空宇宙製造会社は、製品の設計、開発、統合、検証、検証を行っている。
本稿では,Large Language Models (LLMs) と協調して知識グラフ(KGs)を活用してデータの抽出と検証を行うハイブリッド手法を提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 07:42:53 GMT)
Fair Risk Minimization under Causal Path-Specific Effect Constraints [3.0] 本稿では,機械学習を用いて最適な予測を推定するためのフレームワークを提案する。
平均二乗誤差とクロスエントロピーリスク基準に基づく制約付き最適化のための閉形式解を導出する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 02:05:43 GMT)
Signal-SGN: A Spiking Graph Convolutional Network for Skeletal Action Recognition via Learning Temporal-Frequency Dynamics [3.0] 骨格に基づく行動認識では、グラフ畳み込みネットワーク(GCN)はその複雑さと高エネルギー消費のために制限に直面している。
本稿では、骨格配列の時間次元をスパイキング時間ステップとして活用するSignal-SGN(Spiking Graph Convolutional Network)を提案する。
実験により,提案モデルが既存のSNN法を精度で上回るだけでなく,学習時の計算記憶コストも低減できることがわかった。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 07:47:16 GMT)
Indexing and Visualization of Climate Change Narratives Using BERT and Causal Extraction [2.7] 本稿では,2つの自然言語処理手法であるBERT(Bidirectional Representations from Transformers)と因果抽出を用いて,気候変動に関する新聞記事の分析を行う。
方法論の斬新さは、新聞の著者が仮定する因果関係を抽出し、定量化することができた。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 11:05:41 GMT)
Policy Optimization with Smooth Guidance Learned from State-Only Demonstrations [2.7] 報酬フィードバックの幅は、オンラインの深層強化学習において依然として難しい問題である。
Smooth Guidance (POSG) を用いたポリシー最適化手法を提案する。
4つのスパース・リワード環境におけるPOSGの制御性能と収束速度の顕著な優位性を示す。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 01:14:11 GMT)
State-of-the-art in Robot Learning for Multi-Robot Collaboration: A Comprehensive Survey [2.7] この基盤上に構築されたマルチロボットシステム(MRS)は劇的な進化を遂げている。
人工知能技術とロボットハードウェアの融合は、MSSに幅広い応用可能性をもたらしている。
本稿では,マルチロボット協調におけるロボット学習の現状について概説する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 21:22:08 GMT)
Robust Implementation of Discrete-time Quantum Walks in Any Finite-dimensional Quantum System [2.6] 離散時間量子ウォーク(DTQW)は、回路実装に最も適した選択の1つである。
本稿では,ゲート数および回路深さに関する回路コストを半減することに成功した。
提案手法の工学的卓越性には、近似効率を持つ任意の有限次元量子系にDTQWを実装している。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 08:08:47 GMT)
A Narrative Review of Identity, Data, and Location Privacy Techniques in Edge Computing and Mobile Crowdsourcing [2.6] このレビューでは、モバイルクラウドソーシングとエッジコンピューティングにおける現在のトレンドとプライバシに関する懸念について理解している。
我々は、プライバシ保護技術、アイデンティティ、データ、位置情報のプライバシーに関する洞察と強調を提示する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 20:22:29 GMT)
VR-GPT: Visual Language Model for Intelligent Virtual Reality Applications [2.5] 本研究では,VR環境における視覚言語モデルを用いたユーザインタラクションとタスク効率向上のための先駆的アプローチを提案する。
本システムは,視覚的テキスト命令に頼ることなく,自然言語処理によるリアルタイム・直感的なユーザインタラクションを支援する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 10:19:54 GMT)
Principal component analysis balancing prediction and approximation accuracy for spatial data [2.5] 我々は、下流モデルにおける元のデータに対する近似の近接性と低次元スコアの有用性を定式化する。
最適トレードオフを実現するフレキシブル次元削減アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 04:24:48 GMT)
Review of Cloud Service Composition for Intelligent Manufacturing [2.3] インテリジェントな製造のためのクラウドサービス最適化のプロセスを要約する。
11の最適化指標は、持続可能なインテリジェントな製造プラットフォームの開発における緊急要件から定義される。
2つのカテゴリを比較した後、現在のサービス最適化のキーとなるテクニックがターゲットとなっている。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 14:39:40 GMT)
Image Generative Semantic Communication with Multi-Modal Similarity Estimation for Resource-Limited Networks [2.3] 本研究では,多様な意味情報を利用したマルチモーダル画像伝送方式を提案する。
提案手法は,原画像からマルチモーダルな意味情報を抽出し,それを受信機に送信する。
受信機は画像生成モデルを用いて複数の画像を生成し、意味的類似性に基づいて出力画像を選択する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 04:49:55 GMT)
EmoWrite: A Sentiment Analysis-Based Thought to Text Conversion for Paralytic People [2.3] EmoWriteは、既存のBCIベースのシステムの限界に対処することを目的とした、新しい脳コンピュータインタフェース(BCI)システムである。
タイピング速度は6.6ワード毎分(WPM)と31.9文字毎分(CPM)で、精度は90.36%である。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 06:18:39 GMT)
Building Living Software Systems with Generative & Agentic AI [2.2] 現在のソフトウェアシステムは静的で柔軟性がないため、人間の目標を計算アクションに翻訳する際の課題に繋がる。
生成AIを利用した「ソフトウェアシステム開発」は、コンピューティングにおけるこの根本的な問題の解決策を提供する。
生成的AI、特に大きな言語モデルは、人間の意図とコンピュータ操作の間の普遍的なトランスレータとして機能する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 12:35:30 GMT)
Stimulating Imagination: Towards General-purpose Object Rearrangement [2.1] 汎用オブジェクト配置は、インテリジェントロボットの基本的な能力である。
我々はこの課題を達成するためにSPORTというフレームワークを提案する。
Sportは、物理的に現実的な結果を保証するために拡散に基づく3Dポーズ推定器を学習する。
シミュレーションと実世界の実験により、汎用オブジェクト再構成を実現するためのアプローチの可能性を示す。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 03:53:05 GMT)
The Drama Machine: Simulating Character Development with LLM Agents [2.0] 本稿では,多言語モデル (LLM) エージェントを用いたドラマティックシナリオにおける複雑な動的キャラクタのシミュレートについて検討する。
我々は,異なるエゴを演じるLLMエージェントとスーパーエゴの心理的役割を協調するドラママシンの枠組みを紹介する。
結果は、このマルチエージェントアプローチがよりニュアンスで適応的な物語を生み出すことを示唆している。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 09:40:26 GMT)
Domain penalisation for improved Out-of-Distribution Generalisation [2.0] ドメインの一般化(DG)は、多種多様な未確認のターゲットドメインにおける堅牢なパフォーマンスを保証することを目的としている。
本稿では、複数のソースドメインからデータをサンプリングすると仮定した、オブジェクト検出のタスクのためのフレームワークを提案する。
より多くの注意を必要とするドメインを優先することで、私たちのアプローチはトレーニングプロセスのバランスを効果的に保ちます。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 11:06:47 GMT)
Large Language Model based Agent Framework for Electric Vehicle Charging Behavior Simulation [1.9] 本稿では,電気自動車(EV)の充電動作をシミュレーションするための LLM ベースのエージェントフレームワークを提案する。
課金プロセスを最適化するために、ユーザの好み、心理的特徴、環境要因を統合する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 03:52:05 GMT)
Cost-constrained multi-label group feature selection using shadow features [1.9] 複数ラベル分類における特徴選択の問題について,特徴群に割り当てられたコストを考慮した検討を行った。
このタスクでは、ラベルベクトルを予測するのに有用な機能のサブセットを選択することを目的としているが、同時に、選択した機能に関連するコストは、想定される予算を超えない。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 19:31:59 GMT)
Should We Fine-Tune or RAG? Evaluating Different Techniques to Adapt LLMs for Dialogue [1.9] 本研究では,人間と機械の対話における応答生成作業におけるLarge Language Models (LLMs) の限界について検討する。
我々は,異なる対話型に適用する場合に,異なるLLM適応手法を広範囲に分析する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 15:12:02 GMT)
Enhancing Tracking Robustness with Auxiliary Adversarial Defense Networks [1.8] 視覚的物体追跡におけるアドリアック攻撃は、高度なトラッカーの性能を著しく低下させた。
本稿では,入力画像に対して,トラッカーに入力する前に防御変換を行う,効果的な補助前処理防衛ネットワークであるAADNを提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 01:18:07 GMT)
Supervised Image Translation from Visible to Infrared Domain for Object Detection [1.8] 本研究の目的は,2つのモダリティ間の領域ギャップを埋めることで,可視から赤外線への変換を学習することである。
我々は,ジェネレーティブ・アドバイサル・ネットワークとオブジェクト検出モデルを用いた2段階のトレーニング戦略を採用する。
このような画像は、Yolov5、Mask、Faster RCNNなどの標準オブジェクト検出フレームワークのトレーニングに使用される。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 18:51:04 GMT)
Advanced Intelligent Optimization Algorithms for Multi-Objective Optimal Power Flow in Future Power Systems: A Review [1.5] 多目的最適潮流(MOPF)へのインテリジェント最適化アルゴリズムの適用について
再生可能エネルギーの統合、スマートグリッド、エネルギー需要の増加による課題を掘り下げている。
アルゴリズムの選択は、現在ある特定のMOPF問題に近づき、ハイブリッドアプローチは大きな可能性を秘めている。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 10:04:25 GMT)
NiNformer: A Network in Network Transformer with Token Mixing as a Gating Function Generator [1.4] このアテンション機構はコンピュータビジョンでビジョントランスフォーマー ViT として使用された。
コストがかかり、効率的な最適化のためにかなりのサイズのデータセットを必要とするという欠点がある。
本稿では,新しい計算ブロックを標準ViTブロックの代替として導入し,計算負荷を削減する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 23:05:44 GMT)
Privacy in networks of quantum sensors [1.2] 我々は、量子フィッシャー情報行列の操作の観点から、プライバシの分析を開発する。
量子センサネットワークにおける未知パラメータの線形結合の推定において、最適状態が最大プライバシーを達成することを発見した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 08:39:44 GMT)
Meta-Posterior Consistency for the Bayesian Inference of Metastable System [1.2] ベイジアンフレームワークにおけるメタ一貫性の導入,議論,定量化を行う。
大規模システムのサブシステムのモデルを効率的に推論するために,メタ一貫性をどのように活用するかを論じる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 21:39:43 GMT)
Distinguishing Chatbot from Human [1.1] 我々は,75万以上の人文文からなる新しいデータセットを開発した。
このデータセットに基づいて、テキストの起源を決定するために機械学習(ML)技術を適用する。
提案手法は高い分類精度を提供し,テキスト解析に有用なツールである。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 13:18:04 GMT)
Classical Machine Learning: Seventy Years of Algorithmic Learning Evolution [1.1] 機械学習(ML)は多くの分野を変えてきたが、その基礎研究を理解することは、その継続的な進歩に不可欠である。
本稿では,古典的MLアルゴリズムの概要を概説し,12年間にわたる最先端の出版物について考察する。
我々は、著名なMLカンファレンスやジャーナルから引用された論文のデータセットを分析し、引用とキーワード分析を用いて批判的な洞察を明らかにした。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 11:07:10 GMT)
A General Ambiguity Model for Binary Edge Images with Edge Tracing and its Implementation [1.0] 両端画像における交差点, 接合, その他の構造に対する汎用的, 直感的なあいまいさモデルを提案する。
モデルはエッジトレースと組み合わせられ、エッジは接続されたピクセルの順序列である。
単純な原則の小さなセットだけを使用することで、結果は直感的に説明できる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 08:41:07 GMT)
MathLearner: A Large Language Model Agent Framework for Learning to Solve Mathematical Problems [0.9] 本稿では,帰納的推論に基づく数学的問題を解くためのエージェントフレームワークを提案する。
学習情報の一般化に関する人間の学習過程をエミュレートすることにより、この枠組みは数学的推論プロセスにおいて優れた性能を発揮する。
我々のモデルは個人化された学習支援として利用でき、教育資源の不平等を軽減できる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 13:28:19 GMT)
Advancing Mental Health Pre-Screening: A New Custom GPT for Psychological Distress Assessment [0.8] サイコアナリティスト」はOpenAIのGPT-4をベースとしたカスタムGPTモデルであり、スクリーニング前の精神疾患に最適化されている。
このモデルは、精神疾患のニュアンス言語指標を正しくデコードする。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 00:38:30 GMT)
Automated Code-centric Software Vulnerability Assessment: How Far Are We? An Empirical Study in C/C++ [0.7] C/C++における関数レベルのSV評価のための機械学習(ML)モデルとディープラーニング(DL)モデルの性能を調査・比較するための最初の実証的研究を行った。
MLは,関数レベルのSV評価のための多クラスDLモデルと比較して,トレーニング時間を大幅に短縮して,マッチングや性能が向上していることを示す。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 18:31:37 GMT)
MK-SGN: A Spiking Graph Convolutional Network with Multimodal Fusion and Knowledge Distillation for Skeleton-based Action Recognition [0.6] 本稿では,MK-SGN(Multimodal Fusion and Knowledge Distillation)を用いたスポーキンググラフ畳み込みネットワークを提案する。
提案手法は、スパイキングニューラルネットワーク(SNN)のエネルギー効率とGCNのグラフ表現能力とを融合することにより、認識精度を維持しながらエネルギー消費量を削減する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 05:37:43 GMT)
Deep Reinforcement Learning for Dynamic Order Picking in Warehouse Operations [0.6] 本研究は動的順序決定問題に対処する。
固定順序集合を仮定する伝統的な手法は、この動的環境において不足する。
顧客の要求に固有の不確実性を扱うためのソリューション手法として,Deep Reinforcement Learning (DRL) を利用する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 03:56:46 GMT)
On the Hardness of Measuring Magic [0.5] デバイスが使用する魔法の量を測定することで、その潜在的な計算能力の定量化が可能になります。
パウリ不安定を魔法の尺度として紹介し、IBMイーグル量子プロセッサ上で実験的に測定する。
我々の結果は、量子コンピュータがスピードアップを提供していない場合にのみマジックを測定することができることを示唆している。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 04:29:34 GMT)
Real World Application of Quantum-Classical Optimization for Production Scheduling [0.4] この研究は、産業からの現実の最適化問題を伴う量子古典計算手法のベンチマーク研究である。
問題は、異なるマシン上のジョブのスケジューリングとバランシングであり、非線形な目的関数である。
古典解法のモデリングは混合整数凸プログラムとして行われ、量子古典解法では二項二次プログラムとしてモデル化する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 02:58:01 GMT)
A Comparative Analysis of Wealth Index Predictions in Africa between three Multi-Source Inference Models [0.0] 我々は,ChiらによるRWIとLee,Braithwaite,Esp'in-Noboaらによる国際ウェルス指数(IWI)を比較した。
我々の分析は、時間とともに富の予測の傾向と相違点を特定することに焦点を当てている。
これらの不一致は、富を予測するモデルを厳格に監査する政策立案者やアフリカの利害関係者の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 02:07:39 GMT)
Wigner-negative states in the steady-state emission of a two-level system driven by squeezed light [0.0] 負値のウィグナー分布を持つ光の伝播モードは、量子光学において基本的な関心を持つ。
有限帯域の二次的光によって駆動される2レベル系の定常放出の時間モードにおけるウィグナー負性率の決定論的生成の可能性を示す。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 07:39:46 GMT)
Tracking Emotional Dynamics in Chat Conversations: A Hybrid Approach using DistilBERT and Emoji Sentiment Analysis [0.0] 本稿では,テキストの感情検出と絵文字の感情分析を組み合わせることによって,チャット会話における感情動態を追跡するハイブリッドアプローチについて検討する。
Twitterデータセットは、SVM、Random Forest、AdaBoostなど、さまざまな機械学習アルゴリズムを使用して分析された。
以上の結果から,テキストと絵文字分析の統合は,顧客サービス,ワークチャット,ソーシャルメディアのインタラクションに応用可能なチャット感情の追跡に有効な方法であることが示唆された。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 18:28:31 GMT)
Towards an ontology of state actors in cyberspace [0.0] 既存のサイバーセキュリティのオンロジカルツールは、法律、規制、政府機関、文書などの近隣のドメインに接続することで改善することができる。
これらの現象をモデル化することで、多様なソースから来るデータのコヒーレントな統合、そのようなデータに対する自動推論、インテリジェンス抽出と再利用が可能になる、と私は論じます。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 13:56:20 GMT)
Topological origin of non-Hermitian skin effect in higher dimensions and uniform spectra [0.0] 非エルミート皮膚効果は、非エルミート系における系の境界付近の固有状態の凝集によって特徴づけられる。
この研究は点ギャップの観点を採用し、すべての空間次元における非エルミート皮膚効果は点ギャップから生じることを明らかにしている。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 08:50:34 GMT)
Thermalization propagation front and robustness against avalanches in localized systems [0.0] 本研究では,多体局所化相の雪崩不安定性に対する堅牢性について検討した。
局所磁化を解析することにより、鎖の熱化セクターのサイズを推定する。
局所化を測定するグローバルな量である不均衡は、障害強度とシステムサイズの両方において、時間スケールで指数関数的に熱化します。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 11:35:56 GMT)
Sólo Escúchame: Spanish Emotional Accompaniment Chatbot [0.0] 自殺は、2019年に15歳から29歳で世界で4番目に多い死因となった。
スペイン初の感情支援ロボットであるS'olo Esc'uchameを提案する。
我々のシステムは、スペイン語の心理的補助を提供する上で、様々な最先端のモデルより優れています。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 19:33:33 GMT)
Survey on Emotion Recognition through Posture Detection and the possibility of its application in Virtual Reality [0.0] 様々な技術を用いた感情認識におけるポーズ推定手法と、リアルタイムの深度カメラ、ベクトル空間に記述された画像、ビデオ、三次元ポーズを含むVRおよびインプットの潜在的な利用に焦点を当てた調査を行った。
本研究では,その方法論,分類アルゴリズム,および感情認識とポーズ推定に関連する使用済みデータセットに着目し,選択した雑誌やデータベースから収集した19の研究論文について考察した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 10:01:29 GMT)
Scalable tomography of many-body quantum environments with low temporal entanglement [0.0] 本研究では,量子プロセッサ上でシミュレーションされた多体環境のIMを再構築するための学習アルゴリズムについて検討する。
1次元スピンチェーン環境の例を用いて、古典的に生成されたトレーニングデータセットを用いて、このアルゴリズムが長い進化期間にわたってIMのスケーラブルな再構築を可能にすることを実証する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 09:07:47 GMT)
Rapid Discovery of Graphene Nanocrystals Using DFT and Bayesian Optimization with Neural Network Kernel [0.0] 材料発見においては、望まれる性質を持つ材料を見つけるために、大規模で高次元の化学空間をスクリーニングする必要があることが多い。
本稿では,ベイズ最適化(BO)とニューラルネットワークカーネルを併用して,スマート検索を実現する手法を提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 20:39:34 GMT)
Quantum algorithms for the variational optimization of correlated electronic states with stochastic reconfiguration and the linear method [0.0] 本稿では、ユニタリ作用素の積に相関した波動関数の変動最適化のための量子アルゴリズムを提案する。
古典的なコンピューティングハードウェアの実装には、指数関数的に計算コストが増加する必要があるが、量子アルゴリズムのコスト(回路数とショット数)はシステムサイズである。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 17:53:35 GMT)
Open quantum systems with non-commuting coupling operators: An analytic approach [0.0] 非可換系演算子を介して複数の環境に強く結合したオープン量子系を扱うための解析的アプローチを提案する。
散逸性環境と脱コヒーレンス環境の両方に結合したスピン不純物に対して、実効ハミルトニアンは脱コヒーレンスによる緩和の抑制を予測する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 20:56:35 GMT)
On Using The Path Integral Formalism to Interpret Synchronization in Quantum Graph Networks [0.0] 同期中のシステムにラグランジアン力学を用いるという概念について議論する。
最小作用の概念を最小シグナリング項に置き換えることで、経路積分表現が同期力学の研究にどのように適用できるかを検討する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 00:15:31 GMT)
Notions of Fermionic Entropies of a Causal Fermion System [0.0] フェルミオンフォンノイマンエントロピー、フェルミオンエンタングルメントエントロピー、フェルミオン相対エントロピーは、因果フェルミオン系に対して定義される。
我々の定義は、2次元および4次元ミンコフスキー空間のディラックスピノル、シュワルツシルトブラックホール幾何学、フェルミオン格子の様々な例で示される。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 08:34:23 GMT)
Neural Term Structure of Additive Process for Option Pricing [0.0] 加法過程は、時相増分という仮定を緩和することにより、L'evy過程を一般化する。
加法モデルの校正の課題は、時間依存のパラメータ化から生じる。
本稿では,この用語構造を表現するために,フィードフォワードニューラルネットワークを利用するニューラルネットワークモデルを提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 03:00:50 GMT)
Exploring strong locality : Quantum state discrimination regime and beyond [0.0] 1つのクラスが、前述の非局所的な特徴を示し、一つのグループによる局所的な操作を活用していることを示す。
別のクラスは、複数の局所的な観測者の間で、その非局所的な属性を明らかにするために協力的な取り組みを要求する。
この分析は、量子状態判別の枠組みにおける局所現象と非局所現象の間の微妙な相互作用に光を当てる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 20:11:14 GMT)
Efficient nuclear spin - photon entanglement with optical routing [0.0] 量子ネットワークと分散量子コンピュータは、光子と長寿命量子メモリの間の絡み合い生成に依存している。
ここでは、ダイヤモンド中の原子スピン量子ビットとフォトニック時間ビン量子ビットとのハイブリッド絡みの検出効率を最大化する。
この結果から,将来の高性能量子ネットワークへの道が開けた。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 17:01:03 GMT)
Efficacy of Large Language Models in Systematic Reviews [0.0] 本研究では,既存文献の解釈におけるLarge Language Models(LLMs)の有効性について検討した。
私たちは2020年3月から2024年5月までに88の関連論文のデータベースを作成・手書きで作成しました。
そこで我々は,Meta AIのLlama 38BとOpenAIのGPT-4oの2つの現状のLLMを,その解釈精度に基づいて評価した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 00:01:13 GMT)
Dressed to Gamble: How Poker Drives the Dynamics of Wearables and Visits on Decentraland's Social Virtual World [0.0] Decentralandはブロックチェーンベースのソーシャルバーチャルワールドで、コミュニティが所有するクリエイティブなスペースだと言われている。
ユーザーはアバターをカスタマイズするために使用するウェアラブルをパブリッシュできる。
Decentral Games(DG)は、世界で有名なカジノを所有している単一のプロジェクトだが、同社の旗艦ゲームICE Pokerで暗号通貨を稼ぐのに必要な、最も優れたウェアラブルを開発した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 07:41:11 GMT)
Data-Driven Machine Learning Approaches for Predicting In-Hospital Sepsis Mortality [0.0] 本研究の目的は,臨床専門家が院内死亡を予測できるように,解釈可能かつ正確なMLモデルを開発することである。
特定基準に基づいてMIMIC-IIIデータベースからICU患者の記録を分析し,関連データを抽出した。
ランダムフォレストモデルは敗血症関連院内死亡の予測に最も効果的であった。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 00:28:25 GMT)
DDIM Redux: Mathematical Foundation and Some Extension [0.0] このノートは、一般化拡散型暗黙的モデル(gDDIM)の基礎となる数学的概念の批判的レビューを提供する。
確率フローODEにおける逆軌道の正確な表現を含む拡張された数学的結果を示す。
我々は、主軸DDIM(paDDIM)と呼ばれるDDIMの新しいスキームを提案する。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 02:55:49 GMT)
Cooperative emission from two coupled solid-state quantum emitters and its effect on random number generation [0.0] ナノピラーに閉じ込められた2つの窒素空孔中心系からの発光光の挙動協調効果について検討した。
2つのエミッタ間の相互作用を示す因子である$approx 6$により, 一重項と三重項の寿命の劇的な減少を実験的に観察した。
我々は、結合エミッタ系から、低ポンプパワーで、信頼できる量子乱数生成率$sim 200$ kHzを発見した。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 14:57:58 GMT)
Comparison of Embedded Spaces for Deep Learning Classification [0.0] 本稿では,組込み空間を設計するための様々な手法のコンパクトな概要について述べる。
組込み空間の達成可能な幾何学的構造に関して、ネットワークパラメータの異なる損失関数と制約を比較する。
これらの技術は、MNIST、Fashion MNIST、CIFAR-10データセットのための2次元および3次元の埋め込みで実証され、埋め込み空間を視覚的に検査することができる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 12:34:30 GMT)
Attention is all you need for an improved CNN-based flash flood susceptibility modeling. The case of the ungauged Rheraya watershed, Morocco [0.0] 本研究では,畳み込みブロックアテンションモジュール(CBAM)を用いて,フラッシュフラッドに対するCNNモデルの強化について検討する。
データセットには16の条件因子と522のフラッシュフラッドインベントリポイントが含まれていた。
その結果, CBAMはモデル性能を著しく向上し, DenseNet121は各畳み込みブロックにCBAMを組み込んで最良の結果を得た。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 16:57:01 GMT)
An Alternative to Multi-Factor Authentication with a Triple-Identity Authentication Scheme [0.0] 二重パスワードログイン認証システム内に三値認証方式を設計する。
従来のサーバ検証に加えて、システムはユーザー名とパスワードフォームの識別子を連続して検証することができる。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 08:15:23 GMT)
Advancing Green AI: Efficient and Accurate Lightweight CNNs for Rice Leaf Disease Identification [0.0] 米は世界の人口の半数以上にとって主要な食料源として重要な役割を担っている。
本研究では,イネ葉病分類のための3つの移動型CNNアーキテクチャについて検討した。
最高のパフォーマンスは、99.8%の精度でEfficientNet-B0モデルによって達成された。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 11:16:00 GMT)
A Comparative Analysis of CNN-based Deep Learning Models for Landslide Detection [0.0] インド北部とネパールの地すべりは大きな破壊をもたらし、インフラを損傷し、地域社会に脅威を与えている。
近年のインド北部とネパールの地すべりは、大きな破壊を招き、インフラを損傷し、地域社会に脅威を与えている。
ディープラーニング技術の一種であるCNNは、画像処理において顕著な成功を収めている。
論文参考訳(メタデータ) (Sat, 3 Aug 2024 07:20:10 GMT)