OpenHands: An Open Platform for AI Software Developers as Generalist Agents [109.9] 私たちは、人間の開発者と同じような方法で世界と対話するAIエージェントを開発するためのプラットフォームであるOpenHandsを紹介します。
プラットフォームが新しいエージェントの実装を可能にし、コード実行のためのサンドボックス環境との安全なインタラクション、評価ベンチマークの導入について説明する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 18:14:31 GMT)
How Learnable Grids Recover Fine Detail in Low Dimensions: A Neural Tangent Kernel Analysis of Multigrid Parametric Encodings [106.4] フーリエ特徴符号化(FFE)とマルチグリッドパラメトリック符号化(MPE)の2つの手法を比較した。
MPEは低次元マッピングの標準と見なされるが、MPEはそれらを上回り、高解像度で詳細な表現を学習することが多い。
我々は,MPEが学習可能な埋め込みではなく,グリッド構造を通じてネットワークの性能を向上させることを証明した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:18:08 GMT)
Assessing Judging Bias in Large Reasoning Models: An Empirical Study [99.9] DeepSeek-R1やOpenAI-o1のような大きな推論モデル(LRM)は、顕著な推論能力を示している。
本稿では、主観的嗜好アライメントデータセットと客観的事実ベースデータセットの両方において、LLMとLRMの偏りを判定するベンチマークを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:05:38 GMT)
Syntactic and Semantic Control of Large Language Models via Sequential Monte Carlo [90.8] 広い範囲のLMアプリケーションは、構文的制約や意味論的制約に適合するテキストを生成する必要がある。
我々は、連続モンテカルロ(SMC)に基づく制御LM生成のためのアーキテクチャを開発する。
我々のシステムはLew et al. (2023) のフレームワーク上に構築されており、言語モデル確率型プログラミング言語と統合されている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 18:45:25 GMT)
AgentHarm: A Benchmark for Measuring Harmfulness of LLM Agents [85.0] LLMエージェントは誤用された場合、より大きなリスクを引き起こすが、その堅牢性は未発見のままである。
我々は, LLMエージェント誤用の研究を容易にするために, AgentHarmと呼ばれる新しいベンチマークを提案する。
主要なLLMは、ジェイルブレイクなしで悪意のあるエージェント要求に驚くほど準拠している。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 14:30:31 GMT)
DoomArena: A framework for Testing AI Agents Against Evolving Security Threats [84.9] 本稿では,AIエージェントのセキュリティ評価フレームワークであるDoomArenaを紹介する。
プラグインフレームワークであり、現実的なエージェントフレームワークと簡単に統合できる。
モジュールであり、エージェントがデプロイされる環境の詳細から攻撃の開発を分離する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 20:36:10 GMT)
VCR: A Task for Pixel-Level Complex Reasoning in Vision Language Models via Restoring Occluded Text [80.2] 画像内の画素レベルのヒントを用いて、部分的に隠されたテキストを正確に復元するモデルに挑戦する視覚言語タスクであるVisual Caption Restoration (VCR)を導入する。
この課題は、画像に埋め込まれたテキストは、視覚、テキスト、および画像に埋め込まれたテキストのモダリティを整合させる必要があるため、共通の視覚要素や自然言語とは本質的に異なるという観察に由来する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:42:48 GMT)
CheXWorld: Exploring Image World Modeling for Radiograph Representation Learning [77.0] 我々は,放射線画像の自己教師型世界モデルに向けた最初の取り組みであるCheXWorldを紹介する。
本研究は,放射線科医に必要な医学知識の3つの側面を同時にモデル化する統合的枠組みの開発である。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 17:50:43 GMT)
Token-Level Density-Based Uncertainty Quantification Methods for Eliciting Truthfulness of Large Language Models [76.2] 不確実性定量化(英: Uncertainty Quantification、UQ)は、大規模言語モデル(LLM)から真正性を求めるための顕著なアプローチである。
本研究では,テキスト生成のために,分類タスクのUQ技術であるMahalanobis Distance (MD)を適用した。
提案手法は,複数レイヤのLCMからトークン埋め込みを抽出し,各トークンのMDスコアを計算し,これらの特徴を訓練した線形回帰を用いてロバストな不確実性スコアを提供する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:21:41 GMT)
Learning to Attribute with Attention [75.6] 本稿では,異なる注目頭部の注意重みを特徴として扱うことを提案する。
このようにして、属性に注意重みを効果的に活用する方法を学ぶことができる。
提案手法であるAtribution with Attention (AT2) は,多くのアブリケーションを含むアプローチと確実に同等に機能する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:36:28 GMT)
Improving Sequential Recommenders through Counterfactual Augmentation of System Exposure [75.5] シーケンシャルレコメンデーション(CaseRec)のためのシステム露出に対する反ファクト改善を提案する。
CaseRecは、異なる露出報酬を考慮に入れた強化学習を導入する。
拡張項目に対するユーザフィードバック報酬を予測するために,トランスフォーマーベースのユーザシミュレータを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 05:46:27 GMT)
When is Task Vector Provably Effective for Model Editing? A Generalization Analysis of Nonlinear Transformers [64.2] タスク算術は、タスクベクトルの重み付き和を追加することで、事前訓練されたモデルを編集することを指す。
本稿では,非関連タスクと非関連タスクのセットを同時に学習する上で,タスク追加の有効性を理論的に証明する。
ドメイン外タスクの否定を実現するために,タスク演算の適切な選択を証明した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:14:13 GMT)
LaMD: Latent Motion Diffusion for Image-Conditional Video Generation [63.3] LaMDフレームワークは、モーション分解されたビデオオートエンコーダと拡散に基づくモーションジェネレータで構成される。
LaMDは、BAIR、Landscape、NATOPS、MUG、CATER-GENなど、さまざまなベンチマークデータセットで高品質なビデオを生成する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 05:58:47 GMT)
Rethinking Temporal Fusion with a Unified Gradient Descent View for 3D Semantic Occupancy Prediction [62.7] 視覚に基づく3次元意味的占有予測(VisionOcc)のための時間融合法であるGAFusionを提案する。
これは、VisionOccフレームワーク内の時間融合の未調査の側面を開き、時間的手がかりと融合戦略の両方に焦点を当てる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:58:20 GMT)
AILuminate: Introducing v1.0 of the AI Risk and Reliability Benchmark from MLCommons [62.4] 本稿ではAI製品リスクと信頼性を評価するための業界標準ベンチマークとして,AIluminate v1.0を紹介する。
このベンチマークは、危険、違法、または望ましくない行動を12の危険カテゴリーで引き起こすように設計されたプロンプトに対するAIシステムの抵抗を評価する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 22:04:46 GMT)
Aligning Language Models with Demonstrated Feedback [58.8] Demonstration ITerated Task Optimization (DITTO)は、言語モデルの出力とユーザの実証された振る舞いを直接調整する。
我々は,DITTOがニュース記事やメール,ブログ記事などのドメイン間できめ細かいスタイルやタスクアライメントを学習する能力を評価する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 19:45:34 GMT)
Language Representations Can be What Recommenders Need: Findings and Potentials [57.9] 先進的なLM表現から線形にマッピングされた項目表現は、より優れたレコメンデーション性能が得られることを示す。
この結果は、先進言語表現空間と効果的な項目表現空間との同型性を示唆している。
本研究は,自然言語処理とリコメンデーションシステムコミュニティの両方に刺激を与える言語モデリングと行動モデリングの関連性を強調した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 05:54:01 GMT)
Few-Shot Referring Video Single- and Multi-Object Segmentation via Cross-Modal Affinity with Instance Sequence Matching [57.4] ビデオオブジェクトセグメンテーション(RVOS)の参照は、自然言語記述でガイドされたビデオ内のオブジェクトをセグメントすることを目的としている。
本稿では,トランスフォーマーベースモデルであるFS-RVOSを提案する。
実験の結果、FS-RVOSとFS-RVMOSは様々なベンチマークで最先端の手法より優れており、優れた堅牢性と精度を示している。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 14:19:07 GMT)
Does Spatial Cognition Emerge in Frontier Models? [56.5] 本研究では,フロンティアモデルにおける空間認知を体系的に評価するベンチマークSPACEを提案する。
その結果、現代のフロンティアモデルは動物の空間知能に劣っていることが示唆された。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 03:53:04 GMT)
RefComp: A Reference-guided Unified Framework for Unpaired Point Cloud Completion [53.3] 未完成のポイントクラウドコンプリートタスクは、基礎的な真実を持たないモデルを使用して、部分的なポイントクラウドを完成させることを目的としている。
既存の未ペアのポイントクラウド補完メソッドはクラスアウェアであり、すなわち、各オブジェクトクラスに別々のモデルが必要である。
そこで本稿では,Reference-guided Completion (RefComp) フレームワークを新たに提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:40:16 GMT)
A Theory of LLM Sampling: Part Descriptive and Part Prescriptive [53.1] 大規模言語モデル(LLM)は、自律的な意思決定にますます活用されている。
このサンプリング行動が人間の意思決定と類似していることが示される。
統計的ノルムから規範的成分へのサンプルの偏りは、様々な現実世界の領域にまたがる概念に一貫して現れることを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 14:01:42 GMT)
Part-aware Shape Generation with Latent 3D Diffusion of Neural Voxel Fields [50.1] ニューラルボクセル場に対する潜在3次元拡散過程を導入し,高分解能で生成を可能にする。
部分符号を神経ボクセル場に統合し、正確な部分分解を導出するために、部分認識形状復号器を導入する。
その結果,既存の最先端手法よりも優れた部品認識形状生成において,提案手法の優れた生成能力を示した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 14:07:56 GMT)
HAECcity: Open-Vocabulary Scene Understanding of City-Scale Point Clouds with Superpoint Graph Clustering [49.6] 階層的ボクサブ・アグノスティック・エキスパート・クラスタリング(HAEC)について,「それら」のラテン語の後に紹介する。
この高度にスケーラブルなアプローチを,SensatUrbanの都市規模データセット上でのオープン語彙シーン理解の最初の応用に適用する。
我々の技術は、高密度の都市3Dシーンでの複雑な操作を解き放ち、デジタル双生児の処理に新たな道を開くのに役立つ。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:48:42 GMT)
Reinforcement Learning with Graph Attention for Routing and Wavelength Assignment with Lightpath Reuse [49.2] フレキシブルレートトランスポンダを用いた固定グリッドネットワーク上でのルーティングとスペクトル割り当ての強化学習について検討する。
RWA-LRは総長ではなくホップ数によって候補経路が順序づけられたときのスループットが6%向上することを示す。
我々はRWA-LRのためのRLエージェントをポリシーと値関数のためのグラフアテンションネットワークで訓練し、グラフ構造化データを利用する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:51:53 GMT)
Global restrictions under local state discrimination [49.2] 局所的な識別性は、二粒子状態のグローバルな性質を制限することができる。
グローバルな行動を制限する強力なツールとなり得ることを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 14:44:07 GMT)
EmoVoice: LLM-based Emotional Text-To-Speech Model with Freestyle Text Prompting [48.6] EmoVoiceは感情制御可能なTSモデルで、大きな言語モデル(LLM)を利用して、きめ細かい自然言語の感情制御を可能にする。
EmoVoice-DBは、表現力のある音声と自然言語記述によるきめ細かい感情ラベルを特徴とする、高品質な40時間感情データセットである。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 08:18:11 GMT)
Adversarial Style Augmentation via Large Language Model for Robust Fake News Detection [48.5] 本研究は, 偽ニュース検知器の訓練を目的とした, 対向型拡張AdStyleを提案する。
主要なメカニズムは、LLMを戦略的に利用して、多様で一貫性のあるスタイル変換攻撃プロンプトを自動生成することである。
実験結果から,我々の拡張戦略は,偽ニュースベンチマークデータセットで評価した場合のロバストネスと検出性能を著しく向上させることが示された。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:15:33 GMT)
Understanding Epistemic Language with a Language-augmented Bayesian Theory of Mind [47.0] ベイジアン推論に基づく認識的言語解釈モデルを導入する。
実験では,エージェントが迷路をナビゲートして,目標達成に必要な箱に隠されたキーを見つけ,エージェントの信念を判断する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:31:32 GMT)
From Token to Line: Enhancing Code Generation with a Long-Term Perspective [47.0] 大規模言語モデル(LLM)は、コード生成タスクの開発を著しく促進している。
本稿では,MCTS を利用した textbfLSR-MCTS アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 17:03:01 GMT)
DialogGen: Multi-modal Interactive Dialogue System for Multi-turn Text-to-Image Generation [46.1] 市販のMLLMとT2Iモデルを連携させてマルチモーダル対話システムを構築するためのDialogGenを提案する。
描画プロンプトアライメント、注意深いトレーニングデータキュレーション、エラー修正で構成されている。
ダイアログジェネレーションとユーザスタディに関する実験は、他の最先端モデルと比較してダイアログジェネレーションの有効性を実証している。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 11:51:22 GMT)
Towards Robust Alignment of Language Models: Distributionally Robustifying Direct Preference Optimization [45.6] 本研究は、DPO(Direct Preference Optimization)のためのトレーニングデータセットにおけるノイズの課題に対処する。
ノイズを低品質なデータポイントを含むポイントワイズノイズと、誤ったデータペアアソシエーションを含むペアワイズノイズに分類する。
本稿では、最悪の場合のペアワイズシナリオに対して最適化することで、ペアワイズロバストネスを統合した分散ロバスト化DPOを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 08:05:53 GMT)
ESPLoRA: Enhanced Spatial Precision with Low-Rank Adaption in Text-to-Image Diffusion Models for High-Definition Synthesis [45.6] 拡散モデルはテキスト・ツー・イメージ(T2I)合成に革命をもたらし、高品質でフォトリアリスティックな画像を生成する。
しかし、テキストプロンプトで記述された空間的関係を適切に表現するのに依然として苦労している。
我々のアプローチは、LAION-400Mから精密に抽出され、合成された空間的明示的なプロンプトのキュレートされたデータセットの上に構築されている。
生成モデルにおける空間整合性を高めるために,低ランク適応に基づくフレキシブルな微調整フレームワークであるESPLoRAを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:21:37 GMT)
Quantum theory of the Josephson junction between finite islands [45.0] 有限サイズの島々の間のジョセフソン接合に対して量子化されたハミルトニアンを導出する。
我々は、この理論をテストするために、キュービット周波数と電荷感受性の計測可能な補正を予測した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:27:10 GMT)
Learning Through Retrospection: Improving Trajectory Prediction for Automated Driving with Error Feedback [41.9] 自動走行では、周囲の車両の軌道予測がシーンダイナミクスの推論をサポートし、エゴ車両の安全な計画を可能にする。
既存のモデルは、観測された情報に基づいて将来の軌跡を予測するための瞬間的なタスクとして予測を扱う。
提案手法は,推論中の誤差を補正し,再現する手法である。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:35:12 GMT)
Generating new coordination compounds via multireference simulations, genetic algorithms and machine learning: the case of Co(II) molecular magnets [41.9] 本稿では,電子・磁気特性が望ましい新しい配位化合物の発見を加速する計算戦略を提案する。
我々のアプローチは、高スループットab initio法、遺伝的アルゴリズム、機械学習の組み合わせに基づいている。
本研究は,Co(II) 単核配位化合物の磁気特性を実験およびブライト力アブイニシアト法で測定した時間に記録し, 自動生成することで, このアプローチの効率を実証するものである。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:33:48 GMT)
Unleashing the Power of CNN and Transformer for Balanced RGB-Event Video Recognition [41.7] TSCFormer と呼ばれる新しい RGB-Event ベースの認識フレームワークを提案する。
主に、バックボーンネットワークとしてCNNを採用し、まずRGBとイベントデータをエンコードします。
両方のモダリティの間のグローバルな長距離関係をうまく捉え、モデルアーキテクチャ全体の単純さを維持します。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 10:03:55 GMT)
Dense Backpropagation Improves Training for Sparse Mixture-of-Experts [41.1] そこで本研究では,MoEルータのパラメータを緩やかに活性化しながら,高密度勾配更新を行う軽量近似法を提案する。
私たちのデフォルトのMoEは、計算オーバーヘッドをかなり必要とせずに、様々な設定で標準のTopKルーティングより優れています。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:58:46 GMT)
Long-context Non-factoid Question Answering in Indic Languages [39.7] 質問回答タスクは、与えられたコンテキストから回答を抽出する。
長期のコンテキストは、自己認識機構の複雑さのために課題を引き起こす。
Indic言語におけるQA性能向上のための文脈ショートニング手法について検討した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 10:43:21 GMT)
WeatherGen: A Unified Diverse Weather Generator for LiDAR Point Clouds via Spider Mamba Diffusion [39.4] 3Dシーン認識は、大量の悪天候LiDARデータを要求する。
しかし、LiDARデータ収集のコストは、スケールアップに重大な課題をもたらします。
本稿では,初の多種多様なLiDARデータ拡散生成フレームワークであるWeatherGenについて述べる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:01:07 GMT)
ReaRAG: Knowledge-guided Reasoning Enhances Factuality of Large Reasoning Models with Iterative Retrieval Augmented Generation [38.6] 大きな推論モデル(LRM)は、顕著な推論能力を示すが、主にパラメトリック知識に依存し、事実の正確性を制限する。
本稿では,過剰な反復を伴わない多様なクエリを探索する,事実性強化推論モデルReaRAGを提案する。
我々の研究は、レトリーバル強化世代(RAG)のロバスト推論を効果的に統合しつつ、LRMの事実性を向上する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 04:45:44 GMT)
Is In-Context Learning Sufficient for Instruction Following in LLMs? [38.3] 実効性はあるものの, MT-Bench の命令微調整と比較すると, ICL とAL とのアライメントは依然として不十分であることがわかった。
我々は、我々の知識、ICLの体系的比較、低データ体制における命令追従のための命令微調整(IFT)を初めて提供する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 12:31:18 GMT)
WaterFlow: Learning Fast & Robust Watermarks using Stable Diffusion [37.6] WaterFlowは、学習した潜伏依存の透かしに基づいて、高忠実度視覚透かしのための高速かつ極めて堅牢なアプローチである。
WaterFlowは、一般的な堅牢性に対して最先端のパフォーマンスを示し、難しい組み合わせ攻撃に対して効果的に防御できる最初の方法である。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:12:50 GMT)
BRIGHT: A globally distributed multimodal building damage assessment dataset with very-high-resolution for all-weather disaster response [37.4] ビル被害評価(BDA)は、人的被害を減らすために災害後の重要な能力である。
近年の研究では、目に見えない災害事象の正確なマッピングを実現するためのAIモデルの開発に焦点が当てられている。
本稿では, veRy-hIGH-resoluTion Optical and SAR image (BRIGHT) を用いたBDAデータセットを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 12:07:58 GMT)
Where is the answer? Investigating Positional Bias in Language Model Knowledge Extraction [36.4] 大規模な言語モデルでは、更新を最新状態に保つか、あるいは新しいドメインに適応する必要がある。
1つの鍵は、記憶された情報がクエリプロンプトで抽出可能な方法で最新の情報を記憶することである。
微調整中に文書の難易度を最小化しているにもかかわらず、LLMはプロンプト文を通して情報を取り出すのに苦労している。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 00:24:19 GMT)
Finding Flawed Fictions: Evaluating Complex Reasoning in Language Models via Plot Hole Detection [35.6] ストーリーにおけるプロットホール検出は、大規模言語モデルにおける言語理解と推論を評価するためのプロキシである。
FlawedFictionsMakerは人書きストーリーのプロットホールを制御し、慎重に合成する新しいアルゴリズムである。
現状のLLMは、理屈によらず、FlawedFictionsを正確に解くのに苦労している。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 08:44:04 GMT)
Neural Ganglion Sensors: Learning Task-specific Event Cameras Inspired by the Neural Circuit of the Human Retina [35.3] 我々は従来のイベントカメラの拡張であるNeural Ganglion Sensorsを紹介する。
以上の結果から,従来のイベントカメラと比較して生物学的にインスパイアされた感覚によって性能が向上することが示唆された。
これらの発見は、エッジデバイスや他の低消費電力でリアルタイムなアプリケーションに対して、RGCにインスパイアされたイベントセンサーの可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 04:22:58 GMT)
A Predictive Services Architecture for Efficient Airspace Operations [35.2] 将来の空港容量と空域密度の正確な推定は、より良い空域管理に不可欠である。
データ管理とクエリ処理は、大量の高速航空交通データのために、依然として複雑である。
本稿では,大容量,非相関性,ノイズの多いストリーミングデータを取り込み,将来的な空域システム状態を予測するデータ処理および予測サービスアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 19:15:45 GMT)
Can Tool-augmented Large Language Models be Aware of Incomplete Conditions? [33.7] 本研究では,大規模言語モデルが不完全条件を識別し,いつツールの使用を控えるかを適切に判断できるかどうかを検討する。
実験の結果,LSMは特定のツールを利用するために必要な情報の欠如を特定するのに苦慮していることがわかった。
本研究は,人間とLLMの相互作用における共通シナリオに対処することで,信頼性の高いLLMの進展に寄与することができる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 13:07:08 GMT)
If LLMs Would Just Look: Simple Line-by-line Checking Improves Vulnerability Localization [33.4] 手動のコード監査やルールベースのツールなど、従来の脆弱性のローカライゼーションの方法は、多くの場合、時間をかけてスコープに制限される。
本稿では,大規模言語モデルに固有の自己認識機構を活用する新しいフレームワークであるLOVAを紹介する。
LOVA は既存の LLM ベースのアプローチよりも大幅に優れており,F1 スコアの最大 5.3 倍の改善が達成されている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 04:46:00 GMT)
SkyReels-V2: Infinite-length Film Generative Model [33.0] Infinite-length Film Generative Model である SkyReels-V2 を提案し,マルチモーダル大言語モデル(MLLM),マルチステージ事前学習,強化学習,拡散強制フレームワークを提案する。
我々は,基本映像生成のためのプログレッシブ・レゾリューション・プレトレーニングを確立し,その後4段階のポストトレーニング強化を行った。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:46:32 GMT)
Minimax Optimal Convergence of Gradient Descent in Logistic Regression via Large and Adaptive Stepsizes [32.6] 線形分離可能なデータに対して,現在のリスクに適応する段差を持つロジスティック回帰のために,$textitgradient descent$(GD)について検討した。
我々は、GDが$exp(-Theta(eta))$で上限付けられたリスクを達成していることを示し、$gamma$はデータセットのマージンである。
特に、古典的な$textitPerceptron$ (Novikoff, 1962)は、一階オンライン法であり、定数でもGDと一致する1/gamma2$のステップ複雑性も達成している。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 03:35:46 GMT)
Not All Rollouts are Useful: Down-Sampling Rollouts in LLM Reinforcement Learning [32.6] 強化学習(Reinforcement Learning, RL)は、大規模言語モデルにおける推論能力を高めるための強力なパラダイムとして登場した。
推論はメモリフットプリントが最小限であるのに対して、ポリシー更新は大規模な同期を必要とし、メモリ集約である。
PODS(Policy Optimization with Down-Sampling)は,複数のロールアウトを並列に生成し,情報的サブセットにのみ更新することで,これらのフェーズを戦略的に分離するフレームワークである。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 17:49:55 GMT)
Early Timestep Zero-Shot Candidate Selection for Instruction-Guided Image Editing [32.6] ELECT (Early-timestep Latent Evaluation for Candidate Selection) は、早期拡散時の背景ミスマッチを推定することにより、信頼性の高い種を選択するフレームワークである。
バックグラウンドの不整合スコアによってシード候補をランク付けし、編集性を維持しながら、バックグラウンド一貫性に基づいて、不適切なサンプルを早期にフィルタリングする。
実験の結果、ELECTは計算コスト(平均で41%削減)を削減し、バックグラウンドの一貫性と命令の順守を改善し、外部の監督や訓練なしに失敗するケースで約40%の成功率を達成した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 05:59:01 GMT)
Thought Manipulation: External Thought Can Be Efficient for Large Reasoning Models [32.5] 大規模推論モデル(LRM)は一般に「過大な」問題に悩まされる。
本研究では, LRMが不要な中間ステップを回避できるように, シンプルで効率的なパイプラインであるThoughtManiを提案する。
ThoughtManiは安全性のアライメントを平均10%向上させる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 11:07:19 GMT)
POET: Supporting Prompting Creativity and Personalization with Automated Expansion of Text-to-Image Generation [31.9] 最先端のビジュアル生成AIツールは、クリエイティブなタスクの初期のアイデア段階において、ユーザーを支援する大きな可能性を秘めている。
多くの大規模テキスト・ツー・イメージシステムは幅広い適用性のために設計されており、創造的な探索を制限するような従来の出力が得られる。
テキストから画像への生成モデルにおいて,同質性の次元を自動的に検出するリアルタイム対話型ツールPOETを紹介する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 00:54:36 GMT)
Order is All You Need for Categorical Data Clustering [31.9] 本稿では,属性値間の順序関係がクラスタリング精度の決定的要因であることを示す。
本稿では,クラスタと注文の協調学習を可能にする新しい学習パラダイムを提案する。
このアルゴリズムは収束保証によりより優れたクラスタリング精度を実現する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 12:15:25 GMT)
Everything You Wanted to Know About LLM-based Vulnerability Detection But Were Afraid to Ask [30.8] 大規模言語モデルは、自動脆弱性検出のための有望なツールである。
LLMは現実世界の脆弱性を検出するのに本当に効果的か?
本稿では, LLM は (i) 信頼できないこと, (ii) コードパッチに敏感であること, (iii) モデルスケールにまたがる性能評価の3つを, 広く支持されているコミュニティの信念に異議を唱える。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 05:32:47 GMT)
SurFhead: Affine Rig Blending for Geometrically Accurate 2D Gaussian Surfel Head Avatars [30.3] SurFheadは、RGBビデオから2Dガウス波のサーベルを使って、トリガ可能な頭部形状を再構築する。
SurFheadは、極端なポーズであっても、通常と画像の両方の高忠実なレンダリングを保証する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 04:11:33 GMT)
Subgraph Aggregation for Out-of-Distribution Generalization on Graphs [29.9] SubGraph Aggregation (SuGAr)は、グラフ上のOOD一般化に不可欠な、多様なサブグラフの集合を学ぶように設計されている。
合成と実世界の両方のデータセットの実験では、SuGArは最先端の手法より優れており、グラフ上のOOD一般化を最大24%改善している。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 04:32:42 GMT)
DisCoRD: Discrete Tokens to Continuous Motion via Rectified Flow Decoding [29.6] 本稿では,離散的な動きトークンを復号化するための新しい手法であるDisCoRD: Discrete Tokens to Continuous Motion via Rectified Flow Decodingを紹介する。
私たちの中核となる考え方は、トークンのデコーディングを条件生成タスクとしてフレーム化し、DisCoRDがよりきめ細かなダイナミックスとよりスムーズで自然な動きをキャプチャすることを保証することです。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 08:49:08 GMT)
Improving LLM-powered Recommendations with Personalized Information [29.4] 我々は,2つの主要なChain-of-ThoughtプロセスとLLMによるレコメンデーションを統合したCoT-Recというパイプラインを提案する。
CoT-Recは,(1)パーソナライズされた情報抽出と(2)パーソナライズされた情報利用の2段階からなる。
実験結果から,CoT-RecはLLMによるレコメンデーションを改善する可能性が示唆された。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:45:55 GMT)
When Machine Learning Meets Importance Sampling: A More Efficient Rare Event Estimation Approach [29.3] 定常状態におけるタンデム待ち行列の希少事象確率を推定するシミュレーションタスクについて検討する。
既存の文献では、経路依存確率関数の爆発的分散のため、重要サンプリング法が非効率であることを認識している。
本稿では,定常分布における限界確率比を有効利用し,過度な分散の問題を効果的に回避する新しい重要サンプリング手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:25:56 GMT)
Foundational theories of hesitant fuzzy sets and families of hesitant fuzzy sets [24.9] ヘジットファジィ集合は、不確実性やためらいを含む特定のシナリオにおいて広範な応用を見出す。
集合の型として、ヘジット・ファジィ集合は包含関係の明確かつ明示的な定義を必要とする。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 01:10:32 GMT)
Differential Contrastive Training for Gaze Estimation [24.5] CLIPの助けを借りて視線推定性能を向上させる新しい微分コントラスト訓練戦略を提案する。
視覚的外観認識ブランチとセマンティック微分認識ブランチからなる微分コントラストゲイズ推定ネットワーク(DCGaze)を導入する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 06:28:11 GMT)
Integrating Locality-Aware Attention with Transformers for General Geometry PDEs [24.3] 偏微分方程式(PDE)を用いた学習用局所性意識変換器(LA2Former)を提案する。
効率的なグローバルコンテキスト符号化のための線形アテンションと、複雑な局所的相互作用を捉えるためのペアワイズアテンションを組み合わせることで、LA2Formerは計算効率と予測精度の最適なバランスを実現する。
この研究は、複雑で不規則なドメイン上のPDEを解決するために、Transformerベースのニューラル演算子を前進させる上で、局所的特徴学習が重要であることを強調する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 05:43:49 GMT)
Quantum error correction for long chains of trapped ions [23.9] トラップイオンの長い鎖を持つ量子コンピューティングのモデルを提案し、このモデルのための量子エラー補正スキームを設計する。
量子エラー補正スキームの主な構成要素は、量子コードとシンドローム抽出回路と呼ばれる量子回路である。
約50ドルの量子ビットのチェーンでは、最先端の量子コードよりも優れた新しい量子コードを構築します。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 01:54:05 GMT)
MambaMIM: Pre-training Mamba with State Space Token Interpolation and its Application to Medical Image Segmentation [23.7] 我々はMambaMIMと呼ばれる汎用的な事前学習フレームワークを提案する。
MambaMIMはマスキングシーケンス内の状態空間の因果関係を学習する。
我々は6.8KCTの大規模データセットでMambaMIMを事前訓練する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 13:21:39 GMT)
BadApex: Backdoor Attack Based on Adaptive Optimization Mechanism of Black-box Large Language Models [23.6] 従来の挿入方式のバックドアは攻撃効果に大きな成功を収めたが、毒性のあるテキストとクリーンなテキスト間のテキスト品質とセマンティック一貫性は無視されている。
ブラックボックス大言語モデル(BadApex)の適応最適化機構に基づく新しいバックドア攻撃を提案する。
6つのバックドアアタックと2つのディフェンスによる3つのデータセットに対する広範な実験を行った。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:22:41 GMT)
PTDiffusion: Free Lunch for Generating Optical Illusion Hidden Pictures with Phase-Transferred Diffusion Model [23.5] 光錯視隠れ画像は、画像が他の画像に巧妙に統合される興味深い視覚現象であり、視聴者にとってすぐには明らかではない。
隠れアート合成のための新しいトレーニングフリーなテキスト誘導画像変換フレームワークである textbfPhase-textbfTransferred textbfDiffusion Model (PTDiffusion) を提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 03:50:36 GMT)
From Large to Super-Tiny: End-to-End Optimization for Cost-Efficient LLMs [23.3] 大規模言語モデル(LLM)は、非常に高度な人工知能を持つ。
本稿では,3段階の低コストエンドツーエンドLCMデプロイメントパイプラインを提案する。
我々のアプローチは、オンラインシステムにおけるコストとパフォーマンスに最適化された超小型モデルを生み出します。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 05:25:22 GMT)
OpenDeception: Benchmarking and Investigating AI Deceptive Behaviors via Open-ended Interaction Simulation [23.2] オープンなシナリオデータセットを備えた,新たな偽装評価フレームワークであるOpenDeceptionを紹介する。
OpenDeception は LLM をベースとしたエージェントの偽装意図と能力の両方を, 内部推論過程を検査することによって共同評価する。
そこで本研究では, エージェントシミュレーションによるマルチターン対話をシミュレートする手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 14:11:27 GMT)
Beyond One-Hot Labels: Semantic Mixing for Model Calibration [22.4] キャリブレーションを意識したデータ拡張を導入し、多様なサンプルの合成データセットを作成し、その基盤・真実の不確実性を検証した。
本稿では,アノテート信頼度と混合率の相違に対処するために,校正再注釈を提案する。
実験により, CSMは最先端のキャリブレーション手法よりも優れたキャリブレーションを実現することが示された。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 08:26:18 GMT)
Large Language Bayes [22.4] 本稿では,大言語モデルと確率型プログラミング言語を組み合わせた非公式な問題記述を入力として取り上げる。
後続の潜伏変数は、観測されたデータに条件付けし、形式的モデルを越えて統合することによって従う。
これにより,形式モデルを指定する必要がなく,合理的な予測が可能であることを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 18:30:29 GMT)
MobileCity: An Efficient Framework for Large-Scale Urban Behavior Simulation [22.3] 複数の機能的な建物と交通手段を備えた仮想都市を提示する。
次に、集団間の行動選択と移動選好をモデル化するための広範な調査を行う。
拡張性を維持しながら都市移動の複雑さを捉えるシミュレーションフレームワークを導入し,4,000以上のエージェントのシミュレーションを可能にする。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:01:05 GMT)
SciLitLLM: How to Adapt LLMs for Scientific Literature Understanding [22.1] 大言語モデルの成功にもかかわらず、科学文献理解の課題に直面している。
連続事前学習(CPT)と教師付き微調整(SFT)を統合したハイブリッド戦略を提案する。
我々は科学文献理解に特化したLLMスイートSciLitLLMを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:56:16 GMT)
Feature Alignment and Representation Transfer in Knowledge Distillation for Large Language Models [21.0] 知識蒸留(KD)は、複雑な教師モデルからより単純な学生モデルへ知識を伝達する技術である。
注意に基づくアプローチのようなKD手法の最近の革新は、学生モデルの性能を顕著に改善した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 17:54:33 GMT)
Learning from Noisy Pseudo-labels for All-Weather Land Cover Mapping [21.0] SAR画像は詳細な情報がなく、大きなスペックルノイズに悩まされている。
近年、擬似ラベルを生成するために、ペアの光学SAR画像のアノテートが試みられている。
半教師付き学習を新たな画像解像度アライメント拡張と共に組み込むことにより、擬似ラベルを生成するためのより正確な方法を提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 04:24:47 GMT)
Fairness and Robustness in Machine Unlearning [20.8] 機械学習アルゴリズムにおける公平性と堅牢性に焦点を当てる。
実験では、現在の最先端の非学習アルゴリズムが敵攻撃に対する脆弱性を実証している。
中間層と最後の層でのアンラーニングが時間とメモリの複雑さに十分で費用対効果があることを実証する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 10:31:44 GMT)
Framework, Standards, Applications and Best practices of Responsible AI : A Comprehensive Survey [20.6] RAIは、共通のフレームワークと標準フレームワークに合わせた人工知能の使用に関連する倫理の組合せである。
現在、RAIの倫理基準と実装は分離されており、各業界が倫理的にAIを使用するための独自の標準に従うことを推奨している。
社会的プレッシャーと非倫理的なAIの使用方法は、実装よりもRAI設計を強制する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 03:23:52 GMT)
Conformal Prediction Regions are Imprecise Highest Density Regions [19.2] このようなクレダル集合に付随する高密度領域(Imprecise)は,雲のIP可視性を通じて,古典的コンフォーマル予測領域(IP)理論に対応することを示す。
プレゼンテーションは、子音プラウス関数が、IPツールの新しい代数的性質であるモノイド準同型であることの発見である。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 12:46:29 GMT)
Optical engineering and detection of magnetism in moiré semiconductors [19.0] 本稿では,モーア系におけるスピン状態の光学的誘導,制御,探索のための枠組みを提案する。
遷移金属ジアルコゲナイド二層膜にラマン光ドライブを適用することで、スピンモデルのクラスを実現することができる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:49:06 GMT)
ODHSR: Online Dense 3D Reconstruction of Humans and Scenes from Monocular Videos [18.7] 最近のニューラルレンダリングの進歩により、全体的人間シーンの再構築が可能になったが、事前に校正されたカメラと人間のポーズが必要である。
本稿では,オンライン形式でカメラトラッキング,ポーズ推定,ヒューマンシーン再構築を同時に行う新しい統合フレームワークを提案する。
具体的には,人間の変形モジュールを設計し,細部を再構築し,分布外への一般化性を高める。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 17:00:33 GMT)
Evolution of Optimization Algorithms for Global Placement via Large Language Models [18.4] 本稿では,グローバル配置のための最適化アルゴリズムを進化させる自動フレームワークを提案する。
まず,大規模言語モデル(LLM)を用いて多種多様な候補アルゴリズムを生成する。
検出された最適化アルゴリズムは、多くのベンチマークで大幅に性能が向上した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:57:14 GMT)
Variational Autoencoder Framework for Hyperspectral Retrievals (Hyper-VAE) of Phytoplankton Absorption and Chlorophyll a in Coastal Waters for NASA's EMIT and PACE Missions [17.6] 本研究では、ESMやPACEを含むNASAのハイパースペクトルミッションに対する機械学習に基づく新しいソリューションを提案する。
我々は、光学的に複雑な沿岸海域における高スペクトルRrsからアフィとChl-aのハイパースペクトル検索を実現するために、革新的な設計によるVAEモデルを初めて調整する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 05:37:14 GMT)
STAMP Your Content: Proving Dataset Membership via Watermarked Rephrasings [17.2] STAMPはデータセットのメンバシップを検出するフレームワークである。
1つのバージョンは公開され、他のバージョンは非公開にされる。
トレーニングデータに1回しか表示されない4つのベンチマークにおける汚染を,我々のフレームワークが検出できることが示される。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:25:08 GMT)
Only Send What You Need: Learning to Communicate Efficiently in Federated Multilingual Machine Translation [17.2] 本稿では,言語固有のデータを持つクライアントが,高品質なニューラルマシン翻訳(NMT)モデルを協調的に構築することを目的とした,実践的なフェデレーション型多言語学習システムを提案する。
FLベースの多言語NMTトレーニングにおいて,クライアントからのモデル送信の通信効率を向上させるメタ学習に基づく適応パラメータ選択手法であるMetaSendを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:41:23 GMT)
Towards Cardiac MRI Foundation Models: Comprehensive Visual-Tabular Representations for Whole-Heart Assessment and Beyond [17.1] ViTaは、短軸長軸ビューから3D+Tスタックを統合することで、心臓循環を完全に捉えることができる。
このマルチモーダルパラダイムは、心臓表現型や生理的特徴予測など、幅広い下流タスクをサポートする。
リッチな画像特徴と患者コンテキストを橋渡しする共有潜在表現を学習することで、ViTaは従来のタスク固有のモデルを超えることができる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:26:55 GMT)
Variational Stochastic Gradient Descent for Deep Neural Networks [17.0] 変分勾配Descent (VSGD) は、効率的な勾配に基づく画像最適化手法である。
我々は、VSGDがAdamとSGDを2つの分類データセットと4つのディープニューラルネットワークアーキテクチャで上回っていることを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 10:32:24 GMT)
Q-FAKER: Query-free Hard Black-box Attack via Controlled Generation [16.9] 言語モデルの脆弱性を検証するために,逆攻撃手法を提案する。
多数のクエリとターゲットモデルに関する情報が必要です。
ブラックボックス攻撃方法でさえもターゲットモデルの出力情報を必要とする。
対象モデルにアクセスすることなく、敵の例を生成する、新規で効率的な方法であるQ-fakerを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 08:36:38 GMT)
C-MTCSD: A Chinese Multi-Turn Conversational Stance Detection Dataset [16.9] C-MTCSDは中国最大のマルチターン会話姿勢検出データセットである。
最先端モデルでさえ、挑戦的なゼロショット設定で64.07%のF1スコアしか達成していない。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:44:20 GMT)
Improved Quantum Lattice Boltzmann Method for Advection-Diffusion Equations with a Linear Collision Model [16.9] 対流拡散方程式に対するアンシラ自由量子格子ボルツマン法を提案する。
特定のループのマクロ変数が必要な場合、前回のループで量子状態トモグラフィを行う必要はない。
DQ_3$とDQ_5$モデルの数値シミュレーションにより,提案アルゴリズムの有効性が確認された。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:42:31 GMT)
Meta-Learning and Knowledge Discovery based Physics-Informed Neural Network for Remaining Useful Life Prediction [16.8] 回転機械の残りの有用寿命(RUL)を予測することは、産業の安全と維持に不可欠である。
既存の手法では、ターゲットドメインの少ないデータと不明瞭な劣化のダイナミクスに悩まされている。
これらの課題に対処する物理情報ニューラルネットワーク(MKDPINN)を提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:58:38 GMT)
GUI-R1 : A Generalist R1-Style Vision-Language Action Model For GUI Agents [16.7] nameは、高レベルな現実世界のタスクシナリオにおけるLVLMの能力を高めるために設計された最初の強化学習フレームワークである。
従来のOS-Atlasのような最先端のメソッドと比較して、データの0.02%しか使っていない。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:57:48 GMT)
Revealing the Intrinsic Ethical Vulnerability of Aligned Large Language Models [16.3] プレトレーニング中に埋め込まれた有害な知識は、大きな言語モデルのパラメトリックメモリにおいて、信頼できない「暗黒パターン」として持続することを示す。
本研究ではまず,LLMの本質的な倫理的脆弱性を理論的に解析する。
本研究は,分布変化下での意味的コヒーレンス誘導を用いて実験により検証した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:10:21 GMT)
Towards Accurate and Interpretable Neuroblastoma Diagnosis via Contrastive Multi-scale Pathological Image Analysis [16.3] CMSwinKANは、病理画像分類に適したコントラスト学習に基づくマルチスケール機能融合モデルである。
臨床所見から導かれるソフト投票機構を導入し,パッチレベルの予測をスライド画像全体の分類にシームレスにブリッジする。
その結果、CMSwinKANは、既存の最先端の病理モデルよりも、大規模なデータセットで事前訓練されたモデルよりもパフォーマンスがよいことが示された。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:39:46 GMT)
Multi-class Item Mining under Local Differential Privacy [16.1] 本稿では,不正データの影響を低減するための妥当性と,ラベルとアイテムの関係を維持するための相関摂動の2つのメカニズムとともに,マルチクラスアイテムマイニングのためのフレームワークを提案する。
また、これらの最適化手法を2つのマルチクラスアイテムマイニングクエリ(周波数推定とトップ$k$アイテムマイニング)に適用する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:37:06 GMT)
Tight upper bound and monogamy relation for the maximum quantum value of the parity-CHSH inequality and applied to device-independent randomness [16.0] 3量子系に対するパリティ-CHSH不等式の最大量子値を導出する。
特定の状態がパリティCHSH不平等に反するために必要な、かつ十分な条件を提示する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:58:59 GMT)
Traffic Adaptive Moving-window Service Patrolling for Real-time Incident Management during High-impact Events [15.8] 本稿では,スポーツトーナメントやコンサートなどのイベントにおけるリアルタイムインシデント管理を改善するために,交通適応型移動ウィンドウパロリングアルゴリズム(TAMPA)を提案する。
動的プログラミングを用いて、短い計画ウィンドウ内のパトロール戦略を継続的に調整し、即時応答と効率的なルーティングを効果的にバランスさせる。
都市交通ネットワークによるシミュレーションの結果は、TAMPAの優れた性能を示し、定常的手法で約87.5%、ランダム戦略で114.2%の改善を示した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 18:52:09 GMT)
PathVLM-R1: A Reinforcement Learning-Driven Reasoning Model for Pathology Visual-Language Tasks [15.5] 病理画像に特化して設計された視覚言語モデルPathVLM-R1を提案する。
我々は,Qwen2.5-VL-7B-インストラクタをベースとして,厳密に設計したポストトレーニング戦略により,病理的タスクのパフォーマンスを向上させた。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:21:19 GMT)
Babysit A Language Model From Scratch: Interactive Language Learning by Trials and Demonstrations [15.4] 本稿では,学生の試行,教師のデモンストレーション,および様々な発達段階における言語能力に配慮した報酬という,3つの要素を取り入れたトライアル・アンド・デモレーション(TnD)学習フレームワークを提案する。
実験の結果,TnD手法は,等数あるいは少人数の学生モデルの単語獲得を促進させ,試行錯誤と実演の両方の重要性を強調した。
この結果から,対話型言語学習は,教師による実演や積極的試行によって,言語モデルにおける効率的な単語学習を促進することが示唆された。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:06:57 GMT)
Testing the Fault-Tolerance of Multi-Sensor Fusion Perception in Autonomous Driving Systems [14.9] 我々は、カメラとLiDARの故障モデルを構築し、それらをMSF認識ベースのADSに注入し、テストシナリオでその挙動をテストする。
フィードバック誘導型差動ファジタを設計し, インジェクションセンサの故障によるMRF知覚に基づくADSの安全性違反を検出する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:37:55 GMT)
CoT-RAG: Integrating Chain of Thought and Retrieval-Augmented Generation to Enhance Reasoning in Large Language Models [14.8] CoT-RAGは3つの重要な設計を持つ新しい推論フレームワークである。
知識グラフ駆動のCoT生成、学習可能な知識ケース対応RAG、擬似プログラム実行などを備えている。
最先端の方法と比較すると、CoT-RAGは4.0%から23.0%の精度で大幅に改善されている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:55:09 GMT)
Prejudge-Before-Think: Enhancing Large Language Models at Test-Time by Process Prejudge Reasoning [13.9] 我々は LLM 推論に新しい Emphprocess prejudge 戦略を導入する。
我々は、推論ステップを表す理性において、事前判断ノードを定義する。
動的木探索戦略を用いた自動推論フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 06:42:30 GMT)
JL1-CD: A New Benchmark for Remote Sensing Change Detection and a Robust Multi-Teacher Knowledge Distillation Framework [13.7] JL1-CDデータセットは5,000対の512 x 512ピクセルの画像で構成され、解像度は0.5から0.75メートルである。
この全包括的データセットは、建物、道路、硬化した表面、森林、草地、農地、水域、光電パネルを含む、幅広い人為的および自然の変化をカバーしている。
本稿では,O-P(Origin-Partition)戦略を利用してCD性能を向上させる,新しいマルチティーチンガー知識蒸留(MTKD)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 03:19:34 GMT)
KAN or MLP? Point Cloud Shows the Way Forward [13.7] 我々は、クラウド分析タスクにKAN(Kolmogorov-Arnold Learning Networks)を適用したPointKANを提案する。
我々は、ModelNet40、ScanNN、ShapeNetPartなどのベンチマークデータセットにおいて、PointKANがPointMLPより優れていることを示す。
この研究は、3Dビジョンにおけるkansベースのアーキテクチャの可能性を強調し、ポイントクラウド理解における研究のための新たな道を開く。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:52:22 GMT)
Bounded and Uniform Energy-based Out-of-distribution Detection for Graphs [13.4] NODESAFE: 負のエネルギースコアを有界化し、ロジットシフトを緩和する2つの最適化項を追加することにより、ノードの極端なスコアの生成を減らす。
実験結果から,本手法はノードレベルでのOODデータ検出能力を大幅に向上することが示された。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 03:01:00 GMT)
LangCoop: Collaborative Driving with Language [13.3] LangCoopは、自然言語をエージェント間通信のためのコンパクトで表現力のある媒体として活用する、協調自律運転の新しいパラダイムである。
LangCoopは、画像ベースの通信に比べて、通信帯域幅(メッセージあたり2KB)が96%減少している。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:03:14 GMT)
The Athenian Academy: A Seven-Layer Architecture Model for Multi-Agent Systems [13.2] 本稿では,「アテネ学術」の多層7層構造を提案する。
人工知能(AI)アート創造におけるマルチエージェントシステム(MAS)の課題に対処する。
このフレームワークは、AIアート作成におけるマルチエージェントコラボレーションのための構造化された方法論を提供し、アート分野における革新的な応用を促進する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:45:06 GMT)
Argumentative Large Language Models for Explainable and Contestable Claim Verification [13.0] 本稿では,議論的推論を用いた大規模言語モデルの拡張手法であるArgLLMsを紹介する。
ArgLLMsは議論フレームワークを構築し、意思決定を支援するための公式な推論の基礎となる。
我々はArgLLMsの性能を最先端技術と比較して実験的に評価した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 11:20:24 GMT)
Radio-Frequency Pseudo-Null Induced by Light in an Ion Trap [12.6] 我々は、イオンが真のイオンヌルであるかのように光に反応する点の軌跡である、イオン擬似ヌルの出現について報告する。
この現象は、マイクロモーションの一般的な2次元構造を考慮することで完全に説明できる。
真のイオンヌルは、異なる光源によって誘導される擬似ヌル線の並行点において一意に起こる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 13:58:16 GMT)
MIG: Automatic Data Selection for Instruction Tuning by Maximizing Information Gain in Semantic Space [12.6] データ品質と多様性は、効果的な命令チューニングデータセットの構築の鍵となる。
我々は,textbfInformation textbfGain(MIG)を意味空間内で最大化するために,データサンプルを反復的に選択する効率的なサンプリング手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 17:59:46 GMT)
Exploring the Potential for Large Language Models to Demonstrate Rational Probabilistic Beliefs [12.5] 大規模言語モデル(LLM)の現在のバージョンには,確率論的信念の合理的かつ一貫性のある表現が欠如していることが示されている。
確率論的推論の基本的な性質に固執するLLMの能力を測定するために, 不確実性定量化のための確立された手法を適用した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 11:50:30 GMT)
Are you SURE? Enhancing Multimodal Pretraining with Missing Modalities through Uncertainty Estimation [12.5] 我々は、遅延空間再構成と不確実性推定を導入して、事前訓練されたマルチモーダルモデルの能力を拡張した新しいフレームワークSUREを提案する。
SuREは、不完全なデータが存在する場合でも、常に最先端のパフォーマンスを達成し、堅牢な予測を確実にすることを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 05:07:20 GMT)
Exploring Multimodal Prompt for Visualization Authoring with Large Language Models [12.4] 可視化オーサリングの文脈において,大言語モデル(LLM)が不明瞭あるいは不完全なテキストプロンプトをどのように解釈するかを検討する。
テキストプロンプトに補完的な入力モダリティとして視覚的プロンプトを導入し,ユーザの意図を明らかにする。
テキストやスケッチ,直接操作など,マルチモーダルなプロンプトを使って視覚化を簡単に作成できるVisPilotを設計する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 14:00:55 GMT)
System of Agentic AI for the Discovery of Metal-Organic Frameworks [12.4] 生成モデルと機械学習は、CO2捕捉と水収穫のためのMOFにおける物質発見を加速させた。
我々は,相互接続エージェントからなるエージェントAIシステムMOFGenを提案する。
何十万もの新しいMOF構造と合成可能な有機リンカーを生成しました。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 23:54:25 GMT)
Collective Learning Mechanism based Optimal Transport Generative Adversarial Network for Non-parallel Voice Conversion [12.0] 本研究では,集団学習機構に基づく最適輸送GAN(CLOT-GAN)モデルという新しいGANモデルを提案する。
様々な識別器を統合する目的は、集団学習機構によって促進されるメル-スペクトログラムの定型分布を理解する能力にある。
CLOT-GAN-VCモデルは、客観的および主観的評価において、既存のVoice Conversion(VC)モデルより優れている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:44:01 GMT)
FocusNet: Transformer-enhanced Polyp Segmentation with Local and Pooling Attention [12.0] 大腸内視鏡は大腸ポリープの早期診断に不可欠である。
定期スクリーニングは良性ポリープがCRCに進行するのを効果的に防ぐことができる。
本研究では,ポリプのセグメンテーションを改善するために,トランスフォーマー強化型フォーカスアテンションネットワークであるFocusNetを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:59:26 GMT)
Criteria for optimal entanglement-assisted long baseline imaging protocols [12.0] 本稿では,異なる絡み合い支援型テレスコーププロトコルを体系的に特徴付けるためのNovalフレームワークを提案する。
提案手法では, 干渉縞の推定を量子フィッシャー情報を用いて厳密に定量化する。
これらのプロトコルは線形光学技術と互換性があり、改良された量子テレスコープ方式の開発を促す可能性がある。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 17:40:40 GMT)
Algorithms for mean-field variational inference via polyhedral optimization in the Wasserstein space [10.3] ワッサーシュタイン空間上の有限次元多面体部分集合の理論を開発し、一階法による函数の最適化を行う。
我々の主な応用は平均場変動推論の問題であり、これは分布の$pi$ over $mathbbRd$を製品測度$pistar$で近似しようとするものである。
解析の副産物として,MFVIのための勾配に基づくアルゴリズムの最初のエンドツーエンド解析を求める。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:55:11 GMT)
ID-Booth: Identity-consistent Face Generation with Diffusion Models [10.0] 我々はID-Boothと呼ばれる新しい生成拡散に基づくフレームワークを提案する。
このフレームワークは、事前訓練された拡散モデルの合成能力を保ちながら、アイデンティティ一貫性のある画像生成を可能にする。
本手法は、画像の多様性を向上しつつ、競合する手法よりもアイデンティティ間の一貫性とアイデンティティ間の分離性を向上する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 23:24:31 GMT)
Visual Theory of Mind Enables the Invention of Proto-Writing [10.0] エビデンスによれば、一部の書記システムの初期の形態は、元々は象徴的なピクトグラフで構成されていた。
私たちのモデルは、原著の出現の背景にある認知的・文化的プロセスに光を当てています。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 19:18:17 GMT)
MetaDSE: A Few-shot Meta-learning Framework for Cross-workload CPU Design Space Exploration [10.0] クロスワークロード設計空間探索(DSE)はCPUアーキテクチャ設計において重要である。
モデルに依存しないメタラーニングを活用することで、MetaDSEは新しいターゲットワークロードに迅速に適応する。
その結果,MetaDSEは最先端技術と比較して予測誤差を44.3%削減できることがわかった。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:11:16 GMT)
Discovering Effective Policies for Land-Use Planning with Neuroevolution [9.9] 森林、都市部、農業など、異なる用途の土地がどのように配分されているかは、地球上の炭素収支に大きな影響を及ぼす。
意思決定者が利用できるさまざまな選択肢を効率的に評価できるようにする代理モデルを学ぶことができる。
進化的探索プロセスは、特定の場所に対する効果的な土地利用政策を発見するために使用できる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 21:39:11 GMT)
EG-Gaussian: Epipolar Geometry and Graph Network Enhanced 3D Gaussian Splatting [9.9] EG-Gaussianは3次元シーン再構成にエピポーラ幾何学とグラフネットワークを利用する。
提案手法は3DGS法と比較して再構成精度を著しく向上させる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 08:10:39 GMT)
Understanding Adolescents' Perceptions of Benefits and Risks in Health AI Technologies through Design Fiction [9.5] 本研究は,青年期における健康AI技術のメリットとリスクについて考察する。
肯定的かつ慎重な態度で、思春期の若者は、年齢層に特有の独自の利益とリスクを想定する。
ヘルスAI技術は貴重な学習リソースと見なされたが、両親との機密性への懸念も持ち上がった。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 00:41:11 GMT)
Do Prompt Patterns Affect Code Quality? A First Empirical Assessment of ChatGPT-Generated Code [9.4] 本稿では,Dev-GPTデータセットを用いて,コード品質,特に保守性,セキュリティ,信頼性に対するプロンプトパターンの影響を実証的に検討する。
その結果、Zero-Shotプロンプトが最も一般的であり、Zero-ShotとChain-of-Thought、Few-Shotが続くことがわかった。
品質指標に対する7583のコードファイルの解析では、最小限の問題が示され、Kruskal-Wallisテストでは、パターン間の顕著な違いは示されなかった。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 12:37:02 GMT)
Zebrafish Counting Using Event Stream Data [9.2] 本稿では,イベントストリームデータに基づくゼブラフィッシュカウントアルゴリズムを提案する。
従来のアルゴリズムと比較すると、提案アルゴリズムはより単純な実装を提供し、高い精度を実現する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 13:51:29 GMT)
How Breakable Is Privacy: Probing and Resisting Model Inversion Attacks in Collaborative Inference [9.1] 協調推論は、中間機能をクラウドモデルに伝達することでエッジデバイスの計算効率を向上させる。
モデル逆攻撃(MIA)の難しさを評価するための確立された基準はない。
本稿では、CIにおけるMIAの難易度を評価するための最初の理論的基準を提案し、相互情報、エントロピー、有効情報量などを重要な要因として同定する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:06:06 GMT)
A Model-Based Approach to Imitation Learning through Multi-Step Predictions [8.9] モデル予測制御に着想を得たモデルベース模倣学習フレームワークを提案する。
本手法は,従来のクローン型数値ベンチマークよりも優れる。
提案手法の複雑さと誤差境界について理論的に保証し,その収束特性について考察する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:19:30 GMT)
Insecurity Through Obscurity: Veiled Vulnerabilities in Closed-Source Contracts [8.8] 本稿では、クローズドソースおよび難読化コントラクトに適した新しいバイトコード解析ツールであるSKANFを紹介する。
SKANFは、コントロールフローの難読化、シンボリック実行、そして過去のトランザクションに基づくコンコリック実行を組み合わせて、資産管理の脆弱性を特定して活用する。
実世界の最大抽出値(MEV)ボットの評価では、SKANFが1,028の契約で脆弱性を検出し、373件のエクスプロイトをうまく生成し、潜在的な損失は9.0億ドルを超えた。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 01:22:58 GMT)
CodeVisionary: An Agent-based Framework for Evaluating Large Language Models in Code Generation [8.8] 大規模言語モデル(LLM)は、コード生成において強力な能力を示している。
既存の評価アプローチは、人間中心、メートル法、LLMベースの3つのカテゴリに分類される。
コード生成における LLM 評価のための最初の LLM ベースのエージェントフレームワークである CodeVisionary を提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 05:26:32 GMT)
SCRAG: Social Computing-Based Retrieval Augmented Generation for Community Response Forecasting in Social Media Environments [8.7] SCRAGは、ソーシャルコンピューティングにインスパイアされた予測フレームワークである。
リアルまたは仮説的なソーシャルメディア投稿に対するコミュニティの反応を予測する。
公開関係の専門家が意図しない誤解を避ける方法でメッセージを作成するために使用することができる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:02:31 GMT)
The Binary and Ternary Quantization Can Improve Feature Discrimination [8.7] 機械学習では、量子化はデータの表現を単純化し、ハードウェア上でのアルゴリズムの展開を容易にするために広く使われている。
現在の研究は量子化エラーに焦点を当てており、高い量子化エラーは一般的により低い分類性能をもたらすという前提のもとに運用されている。
例えば、$0,1$-binary Quantization や$0, pm1$-ternary Quantization のような非常に低いビット幅量子化法は、同等またはそれ以上の分類精度が得られることを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:44:12 GMT)
Spatial457: A Diagnostic Benchmark for 6D Spatial Reasoning of Large Multimodal Models [8.5] 空間推論のための4つの重要な機能を備えた,スケーラブルで偏りのない合成データセットを提案する。
本研究では,5つの難易度にまたがって7つの質問型を構成するカスケード評価構造を構築した。
特に3次元推論や6次元空間的タスクにおいて,タスクの複雑さが増大するにつれて,パフォーマンスの全般的な低下が観察される。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:48:58 GMT)
Association between nutritional factors, inflammatory biomarkers and cancer types: an analysis of NHANES data using machine learning [8.4] 本研究では,機械学習(ML)データを用いた栄養因子,炎症性バイオマーカー,癌状態との関連について検討した。
貧血や肝臓の病状、タンパク質やいくつかのビタミンなどの栄養因子とともに、がん状態の予測因子となった。
これらの知見は,栄養マーカーと炎症マーカーをMLと組み合わせてがん予防戦略を通知する可能性を示している。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:22:33 GMT)
Large Language Models for Validating Network Protocol Parsers [8.0] プロトコル標準は一般的に自然言語で書かれるが、実装はソースコードで書かれている。
大規模言語モデル(LLM)に基づくフレームワークであるPARVALを提案する。
プロトコル標準とそれらの実装の両方を、フォーマット仕様と呼ばれる統一された中間表現に変換する。
実装とRFC標準の矛盾をうまく識別し、偽陽性率は5.6%と低い。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:09:56 GMT)
LogicTree: Structured Proof Exploration for Coherent and Rigorous Logical Reasoning with Large Language Models [8.0] LogicTreeは、アルゴリズム誘導探索を用いて構造化された証明探索を自動化する推論時モジュラーフレームワークである。
前提優先度付けのための2自由導出を導入し、戦略的証明探索を可能にする。
LogicTreeでは、GPT-4oは平均7.6%でo3-miniを上回っている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 22:10:02 GMT)
Cybersquatting in Web3: The Case of NFT [7.8] 本報告では,NFT サイバースクワットの詳細な測定結果について述べる。
1億5000万のNFTトークンで220万以上のNFTコレクションを分析し,654件のNFTプロジェクトを対象とした8,019件のNFTコレクションを特定した。
我々の分析によると、これらのNFTサイバースクワット活動は、重大な経済的影響をもたらし、670万以上の犠牲者がこれらの詐欺に遭い、合計で5926万ドル(約54億円)の金銭的搾取に繋がった。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:14:59 GMT)
On the Shift Invariance of Max Pooling Feature Maps in Convolutional Neural Networks [7.8] ガボル型フィルタによるサブサンプル畳み込みはエイリアスしがちであり、小さな入力シフトに敏感である。
安定性を実現する上で,フィルタの周波数と向きが果たす重要な役割を強調した。
二重ツリー複合ウェーブレットパケット変換に基づく決定論的特徴抽出器を設計し,本理論を実験的に検証する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 08:31:03 GMT)
OBIFormer: A Fast Attentive Denoising Framework for Oracle Bone Inscriptions [7.7] オラクルの骨碑文(Oracle bone inscriptions, OBIs)は漢字の最も古い形であり、人類学や考古学研究の貴重な資料となっている。
従来は画素レベルの情報に重点を置いていたり、バニラトランスフォーマーをグリフベースのOBIデノナイズに用いたりしていた。
本論文は,OBIFormerの骨碑文を高速に記述する枠組みを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:24:35 GMT)
DocAgent: A Multi-Agent System for Automated Code Documentation Generation [7.7] 本稿では、トポロジ的コード処理によるインクリメンタルコンテキスト構築のための新しいマルチエージェント協調システムDocAgentを紹介する。
特殊なエージェント(Reader、Searcher、Writer、Verifier、Orchestrator)が共同でドキュメントを生成する。
また, 完全性, ヘルプ性, 真実性を評価する多面的評価フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 04:32:43 GMT)
Extending the SAREF4ENER Ontology with Flexibility Based on FlexOffers [7.6] エネルギーシステムにおける再生可能エネルギーの増加を支える重要な要素は、柔軟性、すなわち時間と量におけるエネルギー負荷の変化の可能性である。
多くのフレキシビリティモデルが設計されているが、正確なモデルは長期間の水平線や多くのデバイスでスケールできない。
完全FlexOfferモデルを完全にサポートするSAREF for Energy Flexibility(SAREF4ENER)の拡張を提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 21:02:57 GMT)
LoRA-Based Continual Learning with Constraints on Critical Parameter Changes [7.6] LoRAベースの連続学習は、下流の連続学習タスクで事前学習されたモデルを活用するための有望な道である。
本研究では,視力変換器(ViT)における最重要パラメータ行列の凍結について,事前タスクの学習に先立って提案する。
提案手法は,いくつかのよく知られた連続学習ベンチマークにおいて,最先端(SOTA)性能を実現することを示唆している。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:08:19 GMT)
A Comprehensive Survey of Mixture-of-Experts: Algorithms, Theory, and Applications [7.4] 本稿では,ゲーティング機能,エキスパートネットワーク,ルーティング機構,トレーニング戦略,システム設計など,MoEの基本設計を紹介する。
次に,継続学習,メタ学習,マルチタスク学習,強化学習など,機械学習の重要なパラダイムにおけるMoEのアルゴリズム設計について検討する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:53:01 GMT)
SLAM&Render: A Benchmark for the Intersection Between Neural Rendering, Gaussian Splatting and SLAM [7.3] SLAM&Renderは、SLAMとビューレンダリングの交差点でメソッドをベンチマークするために設計された、新しいデータセットである。
40のシーケンスで構成され、同期RGB、深さ、IMU、ロボットキネマティックデータ、グラウンドトルースポーズストリームで構成されている。
ロボットキネマティックデータをリリースすることにより、ロボットマニピュレータに適用した場合に、新しいSLAM戦略の評価が可能になる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 14:28:34 GMT)
On the Relationship Between Robustness and Expressivity of Graph Neural Networks [7.2] グラフニューラルネットワーク(GNN)はビットフリップ攻撃(BFA)に対して脆弱である
建築的特徴, グラフ特性, 相互作用の影響を研究するための分析フレームワークを提案する。
我々は、データセット上でGNN表現性を劣化させるために必要なビットフリップ数に関する理論的境界を導出する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:38:33 GMT)
Temporal Propagation of Asymmetric Feature Pyramid for Surgical Scene Segmentation [7.2] 手術シーンのセグメンテーションは,ロボットによる腹腔鏡下手術理解に不可欠である。
現在のアプローチでは、(i)静的な画像制限ときめ細かい構造的詳細という2つの課題に直面している。
クロスフレーム特徴伝搬を実現する双方向アテンションアーキテクチャである時間非対称特徴伝搬ネットワークを提案する。
本フレームワークは外科的シーン理解のための時間的指導と文脈的推論の両方を可能にする。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 03:41:23 GMT)
RoPETR: Improving Temporal Camera-Only 3D Detection by Integrating Enhanced Rotary Position Embedding [7.1] 本稿では,速度推定の高速化を目的としたStreamPETRフレームワークの改良について紹介する。
改良されたアプローチでは、VT-Lバックボーンを用いて70.86%の最先端NDSを実現し、カメラのみの3Dオブジェクト検出のための新しいベンチマークを設定した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 06:53:59 GMT)
Transformers Can Overcome the Curse of Dimensionality: A Theoretical Study from an Approximation Perspective [7.1] Transformerモデルは自然言語処理などの機械学習の様々な応用分野で広く利用されている。
本稿では、変換器によるH'older連続関数クラス $mathcalH_Qbetaleft([0,1]dtimes n,mathbbRdtimes nright)$ の近似を調査し、次元性の呪いを克服できるいくつかの変換器を構築する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 08:56:53 GMT)
Detecting Malicious Source Code in PyPI Packages with LLMs: Does RAG Come in Handy? [6.7] PyPIのようなオープンソースのエコシステムにおける悪意あるソフトウェアパッケージは、セキュリティ上のリスクを増大させる。
本研究では,Large Language Models (LLM) とRetrieval-Augmented Generation (RAG) の有効性を実証的に評価する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:11:59 GMT)
6G WavesFM: A Foundation Model for Sensing, Communication, and Localization [6.7] 本稿では,無線基礎モデル(WFM)フレームワークについて紹介する。
提案アーキテクチャでは,共有ビジョントランスフォーマー(ViT)バックボーンとタスク固有の多層パーセプトロンヘッドを組み合わせるとともに,パラメータ効率の良い微調整のためのローランド適応(LoRA)を組み込む。
我々は、統一WFMが多様なタスクをサポートし、性能と効率の両方において大きな利益をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 22:51:35 GMT)
U-Shape Mamba: State Space Model for faster diffusion [6.1] U-Shape Mambaは、U-Netのような階層構造内でMambaベースの層を利用する新しい拡散モデルである。
USMは強力な生成能力を維持しながら計算オーバーヘッドを大幅に削減する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 06:38:12 GMT)
Relevance-driven Decision Making for Safer and More Efficient Human Robot Collaboration [6.0] 人-ロボットコラボレーション(HRC)に関する新しい概念を紹介する。
関連性(Relevance)とは、連続的に動作する知覚モジュールを組み込んだ次元還元プロセスである。
本稿では,リアルタイム処理と非同期処理を統合し,関連性を定量化する2ループフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 18:40:16 GMT)
NeuroNAS: Enhancing Efficiency of Neuromorphic In-Memory Computing for Intelligent Mobile Agents through Hardware-Aware Spiking Neural Architecture Search [6.0] スパイキングニューラルネットワーク(SNN)は、イベントベースの計算を活用して、超低消費電力/エネルギー機械学習アルゴリズムを実現する。
NeuroNASは、インテリジェントな移動体エージェントのためのエネルギー効率の良いニューロモルフィックMCを開発するための新しいフレームワークである。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:00:39 GMT)
Robust Decentralized Quantum Kernel Learning for Noisy and Adversarial Environment [6.0] 本稿では、量子カーネル学習のための汎用分散フレームワーク(QKL)を提案する。
量子ノイズに対する堅牢性を持ち、RDQKLという堅牢なアプローチを形成する敵情報攻撃を保護するように設計されている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:33:07 GMT)
Prioritizing Security Practice Adoption: Empirical Insights on Software Security Outcomes in the npm Ecosystem [5.9] 本研究の目的は、実践者や政策立案者がどのセキュリティプラクティスを採用するべきかを判断するのを支援することである。
npm GitHubリポジトリにおけるセキュリティプラクティスの採用を自動的に測定するために、OpenSSF Scorecardメトリクスを選択しました。
12Scorecard測定値とその集計スコアを用いて回帰分析および因果解析を行った。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 18:31:31 GMT)
Bake Two Cakes with One Oven: RL for Defusing Popularity Bias and Cold-start in Third-Party Library Recommendations [5.9] サードパーティ製ライブラリ(TPL)は現代のソフトウェア開発において不可欠な部分となり、開発者の生産性を高め、市場投入までの時間を短縮している。
通常、コラボレーティブ・フィルタリング(CF)に依存しており、レコメンデーションを行う際に2次元のプロジェクト・ライブラリ・マトリックス(一般的にはユーザ・イテム)を利用する。
本稿では,TPLレコメンデーションにおける人気バイアスとコールドスタート問題に対処するための強化学習(RL)に基づくアプローチを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:17:20 GMT)
Can LLMs assist with Ambiguity? A Quantitative Evaluation of various Large Language Models on Word Sense Disambiguation [5.8] 本研究では,Large Language Models (LLMs) を用いた単語センス曖昧化(WSD)の改善について検討する。
提案手法では,プロンプトをPOSタグ,曖昧な単語のシノニム,アスペクトベース・センス・フィルタリング,少数ショットプロンプトで支援する。
数ショットのChain of Thought (COT)プロンプトベースのアプローチを利用することで、本研究はパフォーマンスを大幅に改善したことを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 10:26:12 GMT)
Bitcoin's Edge: Embedded Sentiment in Blockchain Transactional Data [5.8] パターンを分析し、検出し、ブロックチェーントランザクションデータにエンコードされた公開感情を抽出するために、自然言語処理技術を使用します。
われわれの発見は、これまで未調査だった、可利用で透明で不変なデータのソースに光を当てた。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 10:06:21 GMT)
Semantic Matters: Multimodal Features for Affective Analysis [5.7] 本研究では,情緒的ミミリティ・インテンシティ・アセスメント・チャレンジ(EMI)と行動的あいまいさ・ヘシデンシー・アセスメント・チャレンジ(BAH)の2つの課題について提案する。
我々は,大規模なポッドキャストデータセット上で事前学習したWav2Vec 2.0モデルを用いて,様々な音声特徴を抽出する。
テキストと視覚のモダリティを分析に統合し、意味的コンテンツが貴重な文脈的手がかりを提供すると認識する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 06:46:03 GMT)
Calliope: An Online Generative Music System for Symbolic Multi-Track Composition [5.6] Calliopeは、様々なマルチトラックコンポジションタスクの実行を支援するWebアプリケーションである。
ユーザはMIDIファイルをアップロードし(Musical Instrument Digital Interface)、MIDIトラックを視覚化して編集し、部分的な(バーインフィル)または完全なマルチトラックコンテンツを生成することができる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 20:06:18 GMT)
Apollo: An Interactive Environment for Generating Symbolic Musical Phrases using Corpus-based Style Imitation [5.6] 本研究では,従来の西洋音楽の記号句を生成する対話型音楽アプリケーションApolloを紹介する。
このシステムにより、音楽アーティストや研究者は、提案したコーパスのスタイルで新しい音楽フレーズを作成できる。
MIDIフォーマットでエンコードされた生成されたシンボリック・ミュージック・マテリアルは、様々な目的でエクスポートまたはストリーミングすることができる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 19:53:51 GMT)
Continual Pre-Training is (not) What You Need in Domain Adaption [5.6] 本稿では,法定大言語モデル(LLM)の法的推論能力向上におけるDACP(Domain-Adaptive Continual Pre-Training)の有効性について検討する。
DACPはドメイン固有の知識を高めるが、すべての法的タスクにおけるパフォーマンスを均一に改善するわけではないことを実証する。
本稿では,DACPに関わるトレードオフ,特にモデル一般化と迅速なタスクのパフォーマンスへの影響について論じ,法的なAIにおけるドメイン適応戦略を最適化するための今後の研究の方向性を提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 10:14:51 GMT)
Terminal Lucidity: Envisioning the Future of the Terminal [5.6] 本稿では,15年間に投稿された端末関連質問の分析を行い,総計で約4000万回閲覧した。
ウィンドウ化された端末エミュレータである端末が、現在のグラフィカル環境に完全に適応していないことや、以前の環境のインカーネーションにより適した機能から完全に切り離されていることの証拠が見つかった。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 17:28:40 GMT)
Evaluation Report on MCP Servers [5.5] 我々は,MPPサーバの有効性と効率を評価するため,MPPBenchと呼ばれる評価フレームワークを提案する。
実験の結果,最も有効なMPPであるBing Web Searchの精度は64%であった。
この研究は、最適化されたMPPの実装に関するさらなる調査の道を開くもので、最終的にはAI駆動のアプリケーションとデータ検索ソリューションの改善につながります。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 10:39:23 GMT)
Landscape of Quantum Information Science and Engineering Education: From Physics Foundations to Interdisciplinary Frontiers [5.5] 量子情報科学・工学(QISE)は多くの分野において急速に関心を集めている。
米国におけるQISEと量子関連教育の全体像は存在しない。
全施設で「量子」と言及する講座は8000以上あったが、調査対象施設の約3分の1は存在しなかった。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 14:41:58 GMT)
Large Language Models are Good Multi-lingual Learners : When LLMs Meet Cross-lingual Prompts [5.5] 本稿では,MLプロンプトという新しいプロンプト戦略を提案する。
MLPromptは、LLMが他の言語に追従するのに苦労するエラーを起こしやすいルールを翻訳する。
本稿では,MLPromptを構造化データ生成の自動チェック機構に統合するフレームワークと,テキストからMIPインスタンスへの特定のケーススタディを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:50:08 GMT)
Entropic Time Schedulers for Generative Diffusion Models [5.4] 本稿では,一様時間間隔ではなく,エントロピーに基づくサンプリングポイントを選択する時間スケジューラを提案する。
本研究では、(再スケール)エントロピー時間を用いることで、トレーニングされたモデルの推論性能が大幅に向上することを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 10:35:19 GMT)
Equi-Euler GraphNet: An Equivariant, Temporal-Dynamics Informed Graph Neural Network for Dual Force and Trajectory Prediction in Multi-Body Systems [5.4] 物理インフォームドグラフニューラルネットワーク(GNN)であるEqui-Euler GraphNetを提案する。
Equi-Euler GraphNetはトレーニングディストリビューションを超えて一般化され、目に見えない速度、負荷、設定の下でロードとトラジェクトリを正確に予測する。
トラジェクトリ予測に重点を置く最先端のGNNよりも優れており、エラーの蓄積を最小限に抑えながら、数千のタイムステップで安定したロールアウトを実現する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:09:57 GMT)
A mean teacher algorithm for unlearning of language models [5.4] 平均教師アルゴリズムは, 緩やかな自然勾配勾配の軌跡を近似することができることを示す。
遅いNGDは、勾配の消失に悩まされるが、この問題を回避するために、"負の対数非類似性(NLUL)"と呼ばれる新たな未学習の損失を導入する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 00:34:19 GMT)
Mixture of Scale Experts for Alignment-free RGBT Video Object Detection and A Unified Benchmark [5.1] 既存のRGB-Thermal Video Object Detection (RGBT VOD) 法は、画像ペアの手動アライメントに依存している。
我々はMixture of Scale Experts Network(MSENet)と呼ばれる新しいフレームワークを提案する。
MSENetは、異なる知覚スケールで訓練された複数の専門家を統合し、RGBと熱画像のペア間のスケールの差異をキャプチャすることを可能にする。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:11:49 GMT)
Robust image classification with multi-modal large language models [4.7] 逆の例では、ディープニューラルネットワークが不正確な予測を高い信頼性で行う可能性がある。
これらの脆弱性を軽減するために、事前にモデルを強化するために、敵の訓練と検出に基づく防御が提案されている。
本稿では,これらの防衛を多モード情報と組み合わせ,補完する新しい防衛手法であるMultiShieldを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 13:02:52 GMT)
LeOCLR: Leveraging Original Images for Contrastive Learning of Visual Representations [4.7] 画像分類やオブジェクト検出などの下流タスクにおける教師あり学習よりも優れている。
対照的な学習における一般的な強化手法は、ランダムな収穫とそれに続くリサイズである。
本稿では,新しいインスタンス識別手法と適応型損失関数を用いたフレームワークであるLeOCLRを紹介する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 11:46:18 GMT)
Monitor and Recover: A Paradigm for Future Research on Distribution Shift in Learning-Enabled Cyber-Physical Systems [4.6] 本稿では,今後の研究の方向性として,モニタリングとリカバリのパラダイムを提案する。
この哲学は,1) 分布シフト検出ではなく, 頑健な安全監視, 2) 停止ではなく, 分布シフト回復を重視している。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 05:48:35 GMT)
Remedy: Learning Machine Translation Evaluation from Human Preferences with Reward Modeling [4.5] 本稿では、報酬モデリングタスクとして翻訳評価を再構成する新しいMTメトリックフレームワークであるReMedyを提案する。
ReMedyは、不完全な人間のレーティングを直接回帰するのではなく、ペアの好みデータを使って相対的な翻訳品質を学習する。
WMT22-24共有タスクの広範な実験において、ReMedyはセグメントレベルの評価とシステムレベルの評価の両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 11:11:14 GMT)
Efficient Parameter Adaptation for Multi-Modal Medical Image Segmentation and Prognosis [4.5] 変圧器ベースセグメンテーションモデルの軽量アップグレードのためのパラメータ効率・マルチモーダル適応(PEMMA)フレームワークを提案する。
本手法は初期核融合に匹敵する性能を示すが、トレーニング可能なパラメータの8%しか持たず、単一モードで訓練した場合のPETスキャンにおけるDiceスコアが28%向上したことを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 11:52:21 GMT)
PC-DeepNet: A GNSS Positioning Error Minimization Framework Using Permutation-Invariant Deep Neural Network [4.5] 非線形(NLOS)伝搬、マルチパス効果、低受信電力レベルは、高非線形および非ガウス測定誤差分布をもたらす。
これらの課題を克服するために、我々は、置換不変(PI)ディープニューラルネットワーク(DNN)を用いて位置補正を推定する、新しい学習ベースのフレームワークであるPC-DeepNet(PC-DeepNet)を考案した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 14:18:02 GMT)
DMind Benchmark: The First Comprehensive Benchmark for LLM Evaluation in the Web3 Domain [4.4] DMind Benchmarkは、9つの主要なカテゴリにまたがる大規模言語モデル(LLM)を体系的にテストする新しいフレームワークである。
DMind Benchmarkは、ドメイン固有の主観的タスクを取り入れることで、従来の複数の選択の質問を越えている。
我々はDMind Benchmarkで15の人気のあるLCMを評価し、Web3固有の推論とアプリケーションの性能ギャップを明らかにする。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:40:39 GMT)
Point-Driven Interactive Text and Image Layer Editing Using Diffusion Models [4.4] DanceTextは、画像の多言語テキスト編集のためのトレーニング不要のフレームワークである。
複雑な幾何学的変換をサポートし、シームレスに前景と背景の統合を実現する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 23:46:32 GMT)
MAAM: A Lightweight Multi-Agent Aggregation Module for Efficient Image Classification Based on the MindSpore Framework [4.3] 我々はMindSporeフレームワークと統合された軽量アテンションアーキテクチャを提案する。
Multi-Agent Aggregation Module (MAAM) は3つの並列エージェントブランチを独立にパラメータ化してヘテロジニアスな特徴を抽出する。
MindSporeの動的計算グラフと演算子融合を用いて、MAAMはCIFAR-10データセット上で87.0%の精度を達成する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:19:07 GMT)
Access control for Data Spaces [4.3] アクセス制御ポリシーの継続的な評価を保証するアクセス制御機構の設計と実装を行う。
データ所有者が独自のポリシー管理ポイントを維持できるように拡張します。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:09:53 GMT)
Evaluating Human-AI Interaction via Usability, User Experience and Acceptance Measures for MMM-C: A Creative AI System for Music Composition [4.2] 本稿では,音楽作曲家のための共創型AIツールとして,MMM(Multi-Track Music Machine)のユーザ利用に関する徹底的な評価について報告する。
これを実現するために、我々は、Steinbergの人気のDigital Audio Workstation(DAW)であるCubaseにMMMを統合する。
本研究は,ユーザビリティ,ユーザエクスペリエンス,およびシステムの技術受容度を計測する3部構成の混合手法として,方法論の組立に貢献する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 20:41:02 GMT)
Fast microwave-driven two-qubit gates between fluxonium qubits with a transmon coupler [4.1] 2つの量子ビットゲートは、大規模量子デバイスの実現における基本的な構成要素を構成する。
中間容量結合トランスモンにより実現された2つのフラクソニウム量子ビット間の高忠実な2量子ビットゲートを実証する。
以上の結果から,制御パルスが周波数選択ゲートの高速化をいかに慎重に行うかが示唆された。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 14:41:03 GMT)
SysCaps: Language Interfaces for Simulation Surrogates of Complex Systems [4.0] 代理モデルは複雑なエネルギー系の振舞いを予測するために用いられる。
本稿では,システムキャプションやSysCapsと呼ばれる言語記述を用いて,そのようなサロゲートと対話する手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:49:44 GMT)
On the Complexity of Neural Computation in Superposition [4.0] ニューラルネットワークがニューロンよりも多くの特徴を表現する能力である重ね合わせは、大規模モデルの効率の鍵であると考えられている。
本稿では、重ね合わせにおける計算の理論的基礎を考察し、明示的で証明可能な正しいアルゴリズムの複雑性境界を確立する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 18:13:39 GMT)
Contextual Embedding-based Clustering to Identify Topics for Healthcare Service Improvement [4.0] 本研究では,米国ウィスコンシン州の医療システムから収集した439件のアンケート結果から,意味のあるトピックを抽出するための教師なし手法について検討した。
キーワードに基づくフィルタリング手法を,ドメイン固有辞書を用いた苦情関連フィードバックの分離に適用した。
データが不足していて、短文からなるコヒーレンスと解釈可能性を改善するため、kBERTを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 20:38:24 GMT)
CytoFM: The first cytology foundation model [3.6] 本稿では,デジタル細胞学のための初の自己教師型基礎モデルであるCytoFMを紹介する。
我々はCytoFMをさまざまなデータセットで事前訓練し、堅牢で転送可能な表現を学習する。
以上の結果から,CytoFMは3つの下流課題のうち2つの課題において,病理組織学で事前訓練された既存の基礎モデルよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 01:37:50 GMT)
Contextualizing Spotify's Audiobook List Recommendations with Descriptive Shelves [3.2] 本稿では,オーディオブック分野における記述棚を用いた文脈的リストレコメンデーションを生成するパイプラインを提案する。
私たちはLarge Language Models(LLMs)を使用して、各項目のメタデータを、このドメインで作成された分類に基づいて強化しています。
A/Bテストでは、ユーザエンゲージメントとオーディオブック発見メトリクスが改善されている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:12:46 GMT)
Context-Awareness and Interpretability of Rare Occurrences for Discovery and Formalization of Critical Failure Modes [3.1] 視覚システムは、監視、法執行、交通といった重要な領域にますます配備されている。
これらの課題に対処するために,レアオカレンス(CAIRO)の文脈認識と解釈可能性を導入する。
CAIROは、AIブラックボックスモデルにおける誤検出、敵攻撃、幻覚から生じる臨界性のテストと評価のために、ループ内の人間にインセンティブを与える。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 17:12:37 GMT)
The Road to Hybrid Quantum Programs: Characterizing the Evolution from Classical to Hybrid Quantum Software [3.1] 量子マシン上で有意義に実行できる量子候補コードフラグメントを識別する努力は、主に静的コード解析に依存している。
本稿では,古典的プログラムにおける量子候補とその適切な符号化過程を体系的に定式化することを目的とする。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 10:05:05 GMT)
Risk-aware black-box portfolio construction using Bayesian optimization with adaptive weighted Lagrangian estimator [3.1] 既存のポートフォリオ管理アプローチは、しばしば業界における安全と商業上の問題のためにブラックボックスモデルである。
この研究は、限られた観測の下でブラックボックスポートフォリオ管理モデルを最適化するための新しいベイズ最適化フレームワークを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:40:24 GMT)
Metacognition and Uncertainty Communication in Humans and Large Language Models [3.0] 大規模言語モデル(LLM)は、高い意思決定コンテキストに組み込まれている。
メタ認知能力を示すかどうか、どのように、どの程度の程度で評価することが重要である。
ヒトとLDMはメタ認知能力と行動にかなり整合している場合もあるが、多くの相違点が残っていることは明らかである。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 19:24:17 GMT)
Amplify Initiative: Building A Localized Data Platform for Globalized AI [3.0] 現在のAIモデルは、トレーニングデータに英語と西洋のインターネットコンテンツが優勢であることを考えると、しばしばローカルコンテキストと言語を説明できない。
データプラットフォームと方法論であるAmplify Initiativeは、専門家コミュニティを活用して、さまざまな高品質なデータを収集し、これらのモデルの限界に対処する。
このプラットフォームは、データセットの共同作成を可能にし、高品質な多言語データセットへのアクセスを提供し、データ作者に認識を提供するように設計されている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 23:20:52 GMT)
Optimizing Electric Vehicle Charging Station Locations: A Data-driven System with Multi-source Fusion [3.0] オーストラリア,ニューサウスウェールズ州(NSW)における既存のEV旅行に基づくデータ駆動システムを開発した。
本システムでは,EV旅行データ,ルートデータなどの地理的データ,LGA(Local Government Area)境界などのデータソースを統合している。
この研究の結果は、将来のEV充電ステーションの位置に関するガイダンスを提供するために、新しい洞察を開発するための議論のためのプラットフォームを提供することができる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:10:48 GMT)
Analysing the Robustness of Vision-Language-Models to Common Corruptions [2.9] 視覚言語モデル(VLM)は、視覚的およびテキスト的コンテンツに対する理解と推論の優れた能力を実証している。
我々は、ImageNet-Cベンチマークから、19種類の汚職タイプにまたがるVLMのロバスト性について、初めて包括的解析を行った。
シーンテキスト理解とオブジェクトベース推論にどのように影響するかを評価するために,2つの新しいベンチマークであるTextVQA-CとGQA-Cを導入する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 13:46:32 GMT)
Latent Tensor Factorization with Nonlinear PID Control for Missing Data Recovery in Non-Intrusive Load Monitoring [2.9] 非侵入負荷モニタリング(NILM)が重要なスマートグリッド技術として登場した。
本稿では,2次元のアイデアを持つテンソル(NPIL)モデルのPID-Incorporated Latent factorizationを提案する。
実世界のNILMデータセットを用いた実験結果から,提案したNPILモデルは,欠落したNILMデータを予測する際に,収束率と精度において最先端のモデルを上回ることを示した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 05:48:14 GMT)
Fragile Watermarking for Image Certification Using Deep Steganographic Embedding [2.9] 国際民間航空機関(ICAO)が定める厳格な基準に従わなければならない。
これらの画像は意図しない劣化や悪意のある操作を受け、顔認識システムを騙す可能性がある。
本研究は,ICAO 対応顔画像の真正性を証明するための能動的メカニズムとして,深部ステガノグラフィーの埋め込みに基づく脆弱な透かしについて検討する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:51:56 GMT)
A Multilevel Framework for Partitioning Quantum Circuits [2.9] 本稿では、量子回路分割のための既存の構成を定式化し、拡張する。
複数レベルの粒度でハイパーグラフや分割を粗くする多層手法について検討する。
これにより、ランタイムが減少し、標準パーティショニングのソリューション品質が向上します。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 18:14:00 GMT)
DP2Unlearning: An Efficient and Guaranteed Unlearning Framework for LLMs [2.8] 大規模言語モデル(LLM)は、最近言語処理タスクに革命をもたらしたが、倫理的および法的問題ももたらした。
DP2Unlearningは、保存するデータのスクラッチから再トレーニングするよりもはるかに低コストで、正式な忘れる保証を提供する新しいLLMアンラーニングフレームワークである。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:22:20 GMT)
Complexity of Post-Quantum Cryptography in Embedded Systems and Its Optimization Strategies [2.8] NIST(National Institute of Standards and Technology)は、ポスト量子暗号(PQC)アルゴリズムの標準化プロセスを開始した。
本稿ではまず,組込みシステムにおけるポスト量子暗号(PQC)のハードウェア複雑性を包括的に解析する。
これらの課題に対処するために、パイプライニング、並列化、高レベル合成などの最適化戦略について論じる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 08:02:13 GMT)
Unification of Finite Symmetries in Simulation of Many-body Systems on Quantum Computers [2.8] 本稿では,量子コンピュータ上に対称群変換を導入し,多体系をシミュレートする枠組みを提案する。
我々のアプローチの核は対称性適応射影のための効率的な量子回路の開発にある。
具体的には、ノイズのあるハードウェア上での第一量子化において、小さな分子に対する対称性適応量子サブルーチンを実行する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 01:22:55 GMT)
Predicting Stock Prices using Permutation Decision Trees and Strategic Trailing [2.7] NIFTY50指数の上位50株について,5分間のキャンドルスティックを用いた高周波データに着目した。
我々は、短期市場の変動に乗じて、より安値で株を買い、より高価格で売ることを目的としたトレーディング戦略を実践する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:00:06 GMT)
Towards Optimal Orders for Entanglement Swapping in Path Graphs: A Greedy Approach [2.6] 本稿では,量子リピータの不均一経路におけるエンタングルメントスワップの最適順序を求める問題について考察する。
まず,一定時間で動作可能な2つの絡み合い分布間のスワップ結果の簡易な近似法を提案する。
第2に、経路内のリピータの数とともに可能な順序の数が指数関数的に増加するにつれて、スワップを逐次実行するノードの欲求選択に基づいて効率が向上する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 19:10:13 GMT)
Multimodal machine learning with large language embedding model for polymer property prediction [2.5] 本稿では,高分子特性予測タスクに対して,単純で効果的なマルチモーダルアーキテクチャであるPolyLLMemを提案する。
PolyLLMemは、Llama 3によって生成されたテキスト埋め込みとUni-Mol由来の分子構造埋め込みを統合する。
その性能は、グラフベースのモデルやトランスフォーマーベースのモデルと同等であり、場合によってはそれ以上である。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:07:52 GMT)
MSTIM: A MindSpore-Based Model for Traffic Flow Prediction [2.5] 本稿では,Mindspore フレームワークに基づくマルチスケール時系列情報モデリングモデル MSTIM を提案する。
長期記憶ネットワーク(LSTM)、畳み込みニューラルネットワーク(CNN)、アテンションメカニズムを統合して、モデリング精度と安定性を向上させる。
MSTIMモデルは平均絶対誤差(MAE)、平均正方誤差(MSE)、ルート平均正方誤差(RMSE)の計測値においてより良い結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:19:51 GMT)
SynLlama: Generating Synthesizable Molecules and Their Analogs with Large Language Models [2.4] 我々はSynLlamaを作成するために,MetaのLlama3 Large Language Modelsを微調整した新しいアプローチを提案する。
SynLlamaは、一般的にアクセス可能なビルディングブロックと堅牢な有機反応テンプレートからなる完全な合成経路を生成する。
外部のビルディングブロックをトレーニングしなくても、SynLlamaが効果的に一般化され、見つからず、購入可能なビルディングブロックとなることが分かりました。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 22:32:14 GMT)
Few-shot Model Extraction Attacks against Sequential Recommender Systems [2.4] 本研究では、シーケンシャルレコメンデータに対する新しい数ショットモデル抽出フレームワークを提案する。
数ショットデータを利用して優れたサロゲートモデルを構築するように設計されている。
3つのデータセットの実験により、提案された数ショットモデル抽出フレームワークが優れたサロゲートモデルを生成することが示された。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 08:15:34 GMT)
Towards Federated Multi-Armed Bandit Learning for Content Dissemination using Swarm of UAVs [2.3] 提案アーキテクチャは,固定型アンカーUAVと移動型マイクロUAVのハイブリッドネットワークをユビキタスコンテンツの普及に活用する。
コンテンツ可用性を最大化するために最適なキャッシュポリシを動的に学習するコンテンツ拡散システムの開発に重点を置いている。
選択キャッシングアルゴリズムも導入され、UAV間の情報共有を組み込むことで冗長なコンテンツの複製を減らすことができる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 05:13:52 GMT)
Spin glass model of in-context learning [2.3] 線形アテンションを持つ変圧器について検討し、この構造を実数値スピンを持つスピンガラスモデルにマッピングする。
我々の理論は、単一インスタンス学習においてタスクの多様性の増大がコンテキスト内学習の出現に繋がることを示している。
提案した解析的抽出可能なモデルでは,大言語モデルの多くの興味をそそる性質をどう解釈するかを考える上で,有望な道筋が提供される。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 08:16:22 GMT)
EXAM: Exploiting Exclusive System-Level Cache in Apple M-Series SoCs for Enhanced Cache Occupancy Attacks [2.2] キャッシュ占有攻撃は、キャッシュ階層の共有特性を利用して、全体のキャッシュ使用状況を監視することで、被害者のアクティビティを推測する。
敵が自身のCPUクラスタからGPUや他のCPUクラスタのアクティビティを監視することができる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 00:21:00 GMT)
Flowco: Rethinking Data Analysis in the Age of LLMs [2.2] 大規模言語モデル(LLM)は、単純なルーチン解析のためにそのようなコードを生成することができるようになった。
LLMは、限られたプログラミングの専門知識を持つ者がデータ分析を行うことで、データサイエンスの民主化を約束する。
多くの実世界のアナリストは、特定の分析手順をきめ細かな制御をしなければならない。
本稿では,これらの課題に対処する新たな混合開始システムであるFlowcoを紹介する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 19:01:27 GMT)
How to Achieve Higher Accuracy with Less Training Points? [2.2] 本稿では,学習セットにどのトレーニングサンプルを含めるべきかを決定するための影響関数に基づく手法を提案する。
当社のアプローチでは、データセット全体のトレーニングに匹敵するパフォーマンスを示しながら、データの10%しか使用していません。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:38:26 GMT)
The Emerging Generative Artificial Intelligence Divide in the United States [2.0] 我々は,米国住民の新たな生成AIツールChatGPTの知識を特徴付けるために,大規模検索クエリデータベースを活用している。
沿岸部におけるChatGPTの探索量の増加は,アメリカ南部,アパラチア,中西部では寒冷地が顕著である。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 19:41:52 GMT)
Effects of noise-induced coherence on the performance of a four-level laser heat engine [2.0] 縮退した4段量子熱機関の性能に及ぼすノイズ誘起コヒーレンスの影響について検討する。
最初の線型項 $eta_c/2$ の普遍性は頑健であり、すべての条件に対して一貫して成り立つ。
2次項 $eta_C2/8$ は制御パラメータに課される制約に依存することを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:34:02 GMT)
Ascribe New Dimensions to Scientific Data Visualization with VR [1.9] この記事では、Immersive Browsing & Explorationを使ったAutonomous Solutions for Computational ResearchのVRプラットフォームであるASCRIBE-VRを紹介する。
ASCRIBE-VRはマルチモーダル解析、構造評価、没入型可視化を可能にし、X線CT、磁気共鳴、合成3D画像などの高度なデータセットの科学的可視化をサポートする。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 03:59:39 GMT)
Quantum Fisher Information and the Curvature of Entanglement [1.9] 量子フィッシャー情報(QFI)と2つの量子ビット間の結合に関する第2の収束の導関数の関係を考察する。
単純な相互作用ハミルトニアンで現れるカップリング定数を推定するために用いられる2量子量子プローブの場合、ある時点ではCoE = -QFIであり、この時間はカップリングパラメータの関数として、最大であると見なされるコンカレンスに関連付けられる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 14:55:42 GMT)
Beneath the Surface: The Role of Underwater Image Enhancement in Object Detection [1.8] 本研究の目的は、最先端の画像強調モデルの評価、水中物体検出への影響調査、検出性能向上の可能性を探ることである。
本研究は、画像強調が検出性能を向上させる可能性を示し、研究者がデータセットレベルではなく、個々の画像レベルでの検出に対する強調の効果をさらに探求するための貴重な洞察を提供するものである。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 01:11:28 GMT)
A Dataset of the Representatives Elected in France During the Fifth Republic [1.6] このデータベースは、フランスにおける政治的表現の進化を分析するための前例のない資源となっている。
フランスが選出した代表者の縦断的な見解を提供することで、このデータベースは第5共和政の制度的安定性の研究を促進する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 05:48:27 GMT)
Towards a Reward-Free Reinforcement Learning Framework for Vehicle Control [1.6] 強化学習は、最適な制御戦略を学ぶためのエージェントを導くことによって、車両制御において重要な役割を担っている。
車両制御アプリケーションでは、通常、報酬は複数の暗黙的要因を考慮して手動で設計する必要がある。
本稿では,これらの問題に対処するためのRFRLF(Regend-free Regressed Learning framework)を提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:12:56 GMT)
RAG Without the Lag: Interactive Debugging for Retrieval-Augmented Generation Pipelines [1.6] Retrieval-augmented Generation (RAG)パイプラインは、外部のドメイン固有の知識にアクセス可能なAIアシスタントを構築するためのデファクトなアプローチになっている。
RAGGYは,構成可能なRAGプリミティブのPythonライブラリと,リアルタイムデバッグのためのインタラクティブインターフェースを組み合わせたツールである。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:38:49 GMT)
Transformation of audio embeddings into interpretable, concept-based representations [1.5] 音声ニューラルネットワークから抽出した音声埋め込みのセマンティック解釈可能性について検討する。
我々はCLAP埋め込みを意味論的解釈性を備えた概念ベースでスパースな表現に変換する。
音声埋め込みの概念に基づく解釈可能性のための3つの音声固有語彙を公表する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 21:00:50 GMT)
Gradual Binary Search and Dimension Expansion : A general method for activation quantization in LLMs [1.5] 大規模言語モデル(LLM)は、推論、理解、データ生成において強力な能力を示す人工知能において重要な存在となっている。
量子化はメモリ使用量と推論時間を削減するために広く用いられている手法であるが、LCMはアクティベーションにおける異常値の出現により、ユニークな課題を示す。
我々は、アダマール行列が、低ビット量子化を達成する上で重要な障害である外れ値を減らすのにより効果的であることを実証した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 13:46:58 GMT)
Large Language Models Will Change The Way Children Think About Technology And Impact Every Interaction Paradigm [1.3] 本稿は,大規模言語モデルが教育に与える影響を概観し,今後の変化に比較して,これらの効果が軽微であることを示す。
我々は,これらの変化の影響を実証する小さなシナリオと自己エスノグラフィー研究を行い,対話型システム設計者が将来対応しなければならない5つの重要な考慮事項を定義した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 13:01:27 GMT)
Towards End-to-End Network Intent Management with Large Language Models [1.3] 大規模言語モデル(LLM)は、Intent-Based Networking(IBN)において重要な役割を果たす可能性が高い
クローズドソース言語モデル(Google Gemini 1.5 Pro、ChatGPT-4)とオープンソースモデル(LLama、Mistral)を活用して、E2Eネットワーク構成を生成する能力を調査します。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:41:35 GMT)
DrivAer Transformer: A high-precision and fast prediction method for vehicle aerodynamic drag coefficient based on the DrivAerNet++ dataset [1.2] 本研究では、DrivAer Transformerと呼ばれるポイントクラウド学習フレームワークを提案する。
DAT構造はDrivAerNet++データセットを使用しており、産業標準の3D車両形状の高忠実なCFDデータを含んでいる。
この枠組みは車両設計プロセスの加速と開発効率の向上が期待されている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 04:24:54 GMT)
Transformer Encoder and Multi-features Time2Vec for Financial Prediction [1.1] 我々は、Time2VecとTransformerモデルを統合することで、新しいニューラルネットワークアーキテクチャを開発する。
異なる市場の研究に基づいて,新たな相関特徴選択法を提案する。
提案手法は、位置符号化など、他の最先端の符号化手法よりも優れていると結論付けている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 17:07:41 GMT)
An OpenMind for 3D medical vision self-supervised learning [1.1] 我々は114kの3D脳MRIボリュームからなる公開事前学習データセットを公表した。
我々は、最新のCNNおよびTransformerアーキテクチャのための既存の3次元自己教師型学習手法をこのデータセット上でベンチマークする。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 13:14:59 GMT)
Can Local Representation Alignment RNNs Solve Temporal Tasks? [1.1] リカレントニューラルネットワーク(RNN)は、リアルタイム処理、ストリーミングデータ、トレーニングサンプルの量を制限するケースに一般的に使用される。
BPTTはRNNを訓練するための主要なアルゴリズムであるが、爆発し、勾配が消えやすいとしばしば批判されている。
本稿では,ローカル更新を用いて,その不安定性を低減しようとするRNNに対して,ターゲット伝搬に基づく手法を提示し,評価する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:48:48 GMT)
Infrared Vision Systems for Emergency Vehicle Driver Assistance in Low-Visibility Conditions [1.1] 本研究は、低視認性環境で運転する緊急車両の運転安全性を高めるための赤外線カメラ技術の可能性について検討する。
この評価は、制御された実験室実験、実世界のフィールドテスト、緊急車両運用者の調査を組み合わせたものである。
結果は、ドライバーの認識を高め、スケーラブルなデプロイメントのためにデータ駆動のレコメンデーションを提供するIR技術の有用性を強調している。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 21:06:41 GMT)
Multi-Stage Retrieval for Operational Technology Cybersecurity Compliance Using Large Language Models: A Railway Casestudy [1.1] 本稿では,Large Language Models(LLM)と多段階検索を活用し,コンプライアンス検証のプロセスを強化するシステムを提案する。
まず, OTCSコンプライアンスクエリに応答するベースラインコンプライアンスアーキテクチャ(BCA)を評価し, 並列コンプライアンスアーキテクチャ(PCA)と呼ばれる拡張アプローチを開発した。
我々は,PCAがコンプライアンス検証における正当性と理性の両方を著しく改善することを実証した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 19:24:17 GMT)
Variational Quantum Eigensolver: A Comparative Analysis of Classical and Quantum Optimization Methods [1.1] 実験ベッドモデルとしてIsingモデルに対する変分量子固有解法(VQE)の適用について検討した。
計算勾配フビニスタディメトリック(QN-SPSA)とシフトルール(PSR)による収束の正確な評価を組み合わせた新しい最適化手法QN-SPSA+PSRを提案する。
我々の結果は、量子機械学習の最適化セクションでさえ、VQAの最適化サブルーチンにおいて、新しい潜在的な量子超越性を提供する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 10:27:02 GMT)
Adaptive Long-term Embedding with Denoising and Augmentation for Recommendation [1.0] 本稿では,ALDA4Rec法(Adaptive Long-term Embedding with Denoising and Augmentation for Recommendation)を提案する。
ALDA4Recは、アイテム-イムグラフを構築し、コミュニティ検出を通じてノイズをフィルタリングし、ユーザ-イムインタラクションを強化する新しいモデルである。
4つの実世界のデータセットで実施された実験は、ALDA4Recが最先端のベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 10:42:16 GMT)
A Survey for What Developers Require in AI-powered Tools that Aid in Component Selection in CBSD [1.0] 最初のコンポーネントベースソフトウェア開発(CBSD)研究が実施されたのは40年以上前である。
業界で広く受け入れられているコンポーネント選択の標準的な方法やツールはまだ存在しない。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:35:31 GMT)
MMformer with Adaptive Transferable Attention: Advancing Multivariate Time Series Forecasting for Environmental Applications [0.9] 適応トランスファーブルマルチヘッドアテンション(ATMA)を用いたメタラーニング MTS モデル MMformer を導入する。
MMformerは2018年1月から2021年6月まで、中国の331都市で7つの大気質指標の時系列をモデル化し、予測するために使用されている。
気候データセットのTransformerとSARIMAXと比較して,MSE,MAE,MAPEは30%減少し,iTransformerに比べて改善されている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 19:42:42 GMT)
Chemically Motivated Simulation Problems are Efficiently Solvable by a Quantum Computer [0.8] 量子コンピュータはこのボトルネックを克服する計算方法として提案されている。
本稿では, 化学的シミュレーション問題を解くために, 本質的に効率的なルーチンに基づくガイド付きアプローチを提案する。
プロセスの量子シミュレーション後に測定できる化学的な関心の量について論じる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:23:33 GMT)
Divergent LLM Adoption and Heterogeneous Convergence Paths in Research Writing [0.8] LLM(Large Language Models)は、コンテンツ作成と学術的執筆を変革する。
本研究は,AIによる生成リビジョンが研究原稿に与える影響について検討する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 11:09:16 GMT)
EvRT-DETR: Latent Space Adaptation of Image Detectors for Event-based Vision [0.7] イベントベースのカメラ(EBC)は、従来のカメラに代わるバイオインスパイアされた代替品として登場した。
EBCの画像解析手法の開発は,データの疎結合性や非同期性により困難である。
I2EvDetは、時間的イベントデータ処理で主流のオブジェクト検出をブリッジする新しい適応フレームワークである。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 22:01:56 GMT)
Persistence-based Hough Transform for Line Detection [0.7] 永続ホモロジーに基づくHough空間のピークを検出するための代替投票手法を提案する。
この研究は、将来の研究を2つの重要な方向に刺激することを目指している。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 10:00:08 GMT)
VideoPASTA: 7K Preference Pairs That Matter for Video-LLM Alignment [0.7] ビデオ言語モデル(Video-LLMs)は、ビデオコンテンツを理解するのに優れているが、空間的関係、時間的順序付け、フレーム間の連続性に苦慮している。
対象の選好最適化を通じてビデオLLMを強化するフレームワークであるVideoPASTAを紹介する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 22:28:03 GMT)
HybridoNet-Adapt: A Domain-Adapted Framework for Accurate Lithium-Ion Battery RUL Prediction [0.6] 本稿では,ドメイン適応(DA)技術を組み込んだ新しいRUL予測フレームワークを提案する。
本フレームワークは,ノイズ低減,特徴抽出,正規化を含む信号前処理パイプラインを,堅牢なディープラーニングモデルと統合する。
実験の結果、HybridoNet Adaptは従来のモデルよりも大幅に優れていた。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 13:22:18 GMT)
SLAM-Based Navigation and Fault Resilience in a Surveillance Quadcopter with Embedded Vision Systems [0.6] 我々は、フォールトトレラントなクアッドコプターシステムとして設計された自律型空中監視プラットフォームであるVegを紹介する。
GPSに依存しないナビゲーションのためのビジュアルSLAM、動的安定性のための高度な制御アーキテクチャ、リアルタイムオブジェクトと顔認識のための組み込み視覚モジュールを統合する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 17:10:26 GMT)
Quantum Walks-Based Adaptive Distribution Generation with Efficient CUDA-Q Acceleration [0.6] 本稿では,量子ウォークに基づく手法を用いて,目標確率分布の高精度かつ効率性を実現する適応分布生成器を提案する。
本手法は,量子ウォークと離散時間量子ウォーク,特にスプリットステップの量子ウォークとそのエンタングル拡張を統合し,コインパラメータを動的にチューニングし,量子状態の進化を所望の分布へと導く。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:53:03 GMT)
Post Quantum Cryptography (PQC) Signatures Without Trapdoors [0.5] 現在の公開キーメソッドのいくつかは、デジタルシグネチャメソッドを実装するためにトラップドアを使用しています。
バックドアの問題は、実際のトラップドア法が最終的に見つけられることだ。
PQCの台頭により、トラップドアを使用しず、より強力なセキュリティ証明を提供する様々な方法が見つかるでしょう。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 18:10:17 GMT)
Fighting Fires from Space: Leveraging Vision Transformers for Enhanced Wildfire Detection and Characterization [0.5] 森林火災は、人為的な気候変動の結果、世界中の広い地域での強度、頻度、持続時間が増加している。
近年の研究では、衛星画像に基づいて訓練された畳み込みニューラルネットワーク(CNN)による自動山火事検出が、精度の高い結果をもたらすことが証明されている。
ビジョントランスフォーマー (ViT) は, 学習の効率化と, 地域情報とグローバル情報の両方を組み込む能力で, 人気を博している。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:25:54 GMT)
CPR: Leveraging LLMs for Topic and Phrase Suggestion to Facilitate Comprehensive Product Reviews [0.5] 本稿では,ユーザによる洞察に富んだレビュー作成を支援する新しい手法であるCPRについて述べる。
まず、製品固有の評価用語をユーザに提示し、次に、これらの評価に基づいて目的のフレーズ提案を生成する。
我々は、テキストからテキストへのLLMを用いてCPRを評価し、その性能をWalmartの実際の顧客レビューと比較した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 17:11:38 GMT)
The relativity of color perception [0.5] ユルマスの主張する相対論的色彩知覚現象を純粋に理論的に説明できる厳密な数学的モデルを提案する。
我々は、この理論を、三次公理(trichromacy axiom)と呼ばれる一つの仮定と共に、色知覚の量子解釈に基づく。
このアプローチによって、ヘリングの正当性と三次関係を整合させることができ、また、追加の数学的あるいは実験的仮定なしで知覚される色の相対論的性質を導出することができることを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 14:46:29 GMT)
Efficient separate quantification of state preparation errors and measurement errors on quantum computers and their mitigation [0.5] 現在のノイズ量子コンピュータは、状態準備、測定/読み出し、ゲート操作で発生する複数のタイプのエラーを持つ。
本稿では,状態準備と読み出しエラー率を別々に定量化する,シンプルで資源効率のよい手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 20:14:33 GMT)
Convergence of the majorized PAM method with subspace correction for low-rank composite factorization model [0.4] 本稿では,部分空間補正を伴うPAM法の収束証明書について述べる。
PAMにより生成された因子対の列と列の部分空間列の完全収束を確立する。
1ビット行列補完問題に対して, PALM法との比較を行った。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:23:32 GMT)
Breaking ECDSA with Two Affinely Related Nonces [0.4] k_m = a cdot k_n + b の形でアフィン関係が存在する場合、$k$ に対して別の値が使われたとしても、秘密鍵を復元できることを示す。
これは、ナンス間の既知のアフィン関係の下で、同じメッセージ上の2つのシグネチャのみからECDSAプライベートキーの最初のクローズド形式である。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:05:22 GMT)
A Novel Hybrid Approach for Retinal Vessel Segmentation with Dynamic Long-Range Dependency and Multi-Scale Retinal Edge Fusion Enhancement [0.4] 既存の方法は、マルチスケールの船の変動性、複雑な曲率、曖昧な境界といった課題に対処する。
本稿では,CNNとMambaを相乗的に統合した新しいハイブリッドフレームワークを提案する。
本手法は血管の連続性維持と低コントラスト領域の血管の分断を効果的に行う上で,最先端の性能を実現する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 08:41:35 GMT)
A Survey on Self-supervised Contrastive Learning for Multimodal Text-Image Analysis [0.3] 近年のテキストイメージモデルにおけるコントラスト学習のアプローチの概要について述べる。
第3に、プロセスで使用されるテクニックの最新の進歩を紹介し、議論する。
テキスト画像に基づく自己教師付きコントラスト学習モデルの最近の技術応用について論じる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 05:35:31 GMT)
Accelerated Optimization of Implicit Neural Representations for CT Reconstruction [0.3] 低用量/スパース・ビューX線CT(CT)における暗黙的神経表現(INR)の再構成について最近提案されている。
INRはCT画像を小さなニューラルネットワークとして表現し、空間座標を入力として取り、減衰値を出力する。
本稿では,CT再構成のためのINRの最適化を高速化する戦略について検討する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 00:52:56 GMT)
BeetleVerse: A study on taxonomic classification of ground beetles [0.3] 地上の甲虫は、非常に敏感で特異な生物学的指標であり、生物多様性のモニタリングに不可欠である。
本稿では,4つの多種多様な長い尾を持つデータセットの分類分類に関する12の視覚モデルを評価する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 01:06:37 GMT)
Using Machine Learning and Neural Networks to Analyze and Predict Chaos in Multi-Pendulum and Chaotic Systems [0.2] カオスシステムは現在、気象パターンや病気の発生、金融市場など、世界中で普及している。
我々は、これらのシステムのうちの1つであるマルチ振り子を予測するために、10種類の異なる機械学習モデルとニューラルネットワークを評価した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 04:12:14 GMT)
Leakage and Interpretability in Concept-Based Models [0.2] 概念ボトルネックモデルは、高レベルの中間概念を予測することによって解釈可能性を改善することを目的としている。
それらは情報漏洩に悩まされ、学習された概念の中で符号化された意図しない情報を利用するモデルで知られている。
漏洩を厳格に特徴づけ定量化するための情報理論フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 22:21:06 GMT)
Establishing a Foundation for Tetun Ad-Hoc Text Retrieval: Stemming, Indexing, Retrieval, and Ranking [0.0] この研究は、Tetunテキスト検索に適したソリューションの基礎となるコンポーネントとして機能する、ストップワード、ストリーマー、テストコレクションのリストを含む、不可欠な言語リソースの開発から始まった。
文書タイトルとコンテンツの両方を用いて,検索の有効性を評価する。
効率は31.37%、効率はMAP@10では+9.40%、NDCG@10では+30.35%、DFR BM25では+9.40%向上する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 13:58:24 GMT)
Picosecond synchronization of mode-locked lasers for metropolitan-scale quantum networks [0.0] WR-PTP(White Rabbit Precision Time Protocol)による2つのモード同期Ti:Sapphireレーザーのピコ秒レベルの同期を実証する。
WR-PTPはスケーラブルなネットワーク同期プロトコルとして機能し、その性能は従来のローカル同期方式と比較される。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:19:47 GMT)
Word Embedding Techniques for Classification of Star Ratings [0.0] 本研究は、顧客レビューの新たなデータセットを用いて、異なる単語埋め込みアルゴリズムがテキスト分類プロセスにどのように影響するかを示す広範な研究を行う。
BERT、Word2Vec、Doc2Vecなど、最先端のワード埋め込み技術やいくつかの分類アルゴリズムが検討されている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 12:26:28 GMT)
Ultrabroad resonance of localized plasmon on a nanoparticle coupled with surface plasmon on a nanowire enabling two-photon excited emission via continuous-wave laser [0.0] 銀ナノ粒子(NPs)と銀ナノワイヤ(NWs)の間のプラズモンホットスポットは、2光子励起放出を生成する。
連続波(CW)近赤外(NIR)レーザー励起による色素分子の2光子蛍光を観察した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:26:29 GMT)
Transformation trees -- documentation of multimodal image registration [0.0] マルチモーダル画像登録は、デジタル患者モデルの作成において重要な役割を果たす。
本稿では,変換木を構造化記録および変換管理の手法として用いることを提案する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:47:07 GMT)
Towards a Multi-Agent Vision-Language System for Zero-Shot Novel Hazardous Object Detection for Autonomous Driving Safety [0.0] 視覚言語推論とゼロショットオブジェクト検出を統合したマルチモーダル手法を提案する。
予測ハザードとバウンディングボックスアノテーションを一致させるために,OpenAIのCLIPモデルを取り入れたオブジェクト検出を改良する。
その結果,現在の視覚言語に基づくアプローチの長所と短所が明らかになった。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 01:25:02 GMT)
Towards Stateless Clients in Ethereum: Benchmarking Verkle Trees and Binary Merkle Trees with SNARKs [0.0] 本稿では、現在議論されている2つのアプローチを比較して、ステートレス性を実現する。
ベンチマークに使用されるVerkle Treeの実装では、秒単位の証明時間と1MB単位の証明サイズが提供されている。
SNARKベースのMerkleツリーは、一定かつ高速な検証時間を提供しながら、遅い証明生成時間を示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 20:40:02 GMT)
Towards Explainable and Lightweight AI for Real-Time Cyber Threat Hunting in Edge Networks [0.0] 本研究では,エッジネットワークにおけるリアルタイムサイバー脅威検出のために設計された,説明可能な軽量AI(ELAI)フレームワークを紹介する。
我々の手法は、解釈可能な機械学習アルゴリズムと最適化された軽量ディープラーニング技術を統合し、透明性と計算効率の両立を保証する。
我々は、CICIDSやUNSW-NB15などのベンチマークサイバーセキュリティデータセットを用いてELAIを評価し、多様なサイバー攻撃シナリオでその性能を評価する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 23:45:39 GMT)
SupResDiffGAN a new approach for the Super-Resolution task [0.0] SupResDiffGANは、GAN(Generative Adversarial Networks)の長所と超解像度タスクの拡散モデルを組み合わせた、新しいハイブリッドアーキテクチャである。
SupResDiffGANは、遅延空間表現を活用し、拡散ステップの数を減らし、他の拡散ベースの超解像モデルよりもはるかに高速な推論時間を達成する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 10:55:24 GMT)
Statistical Validation in Cultural Adaptations of Cognitive Tests: A Multi- Regional Systematic Review [0.0] 本総説では,ヨーロッパ,アジア,アフリカ,南米における文化適応の方法論に関する6つの専門的研究について考察する。
その結果、適切な適応には、人口統計学的変化を伴う全体論的モデルが必要であることが示唆された。
このレビューは、より多様なグローバルな健康環境における認知評価のさらなる適応のためのエビデンスベースのフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 06:25:02 GMT)
Stabilizer Rényi Entropy and Conformal Field Theory [0.0] 本研究では,R'enyi entropy (SRE) の場理論的枠組みを$(1+1)$-dimensional many-body system で開発する。
本研究では,SREが境界条件変化演算子のスケーリング次元によって与えられる普遍係数で対数スケーリングを示すことを示す。
これらの結果は、量子多体系における非安定化器の普遍的特徴を理解するための場理論的アプローチを確立する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 04:32:30 GMT)
Short remarks on shallow unitary circuits [0.0] 体積$V$のD$次元格子の任意の量子セルオートマトンは、O(V)$ローカルゲートのみを用いて実装可能であることを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 18:00:09 GMT)
Sentiment Analysis of Airbnb Reviews: Exploring Their Impact on Acceptance Rates and Pricing Across Multiple U.S. Regions [0.0] Airbnbのゲストの肯定的かつ否定的なコメントが、米国の6つの地域での受け入れ率とレンタル価格に影響を及ぼすかどうかを調査する。
各地域のレビューの90%以上が肯定的であり、追加レビューを行うことで価格が大幅に上昇しないことを示している。
予算リストは競争価格を維持しながら広範なレビューを収集することが多いが、プレミアムリストは低いが非常に肯定的なレビューでより高い価格を維持できる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 19:52:24 GMT)
Scoring Azure permissions with metric spaces [0.0] Microsoft Azureにおける特権リスクの定量化と評価のための2つの補完的な指標を紹介します。
Control Planeでは、WAR距離、Write、Action、Readコントロールパーミッションに対する超増分距離を定義します。
データプレーンでは,データ抽出と偽造の最大幅を計測するためのブラスト半径距離を提示する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:29:51 GMT)
Robust Universum Twin Support Vector Machine for Imbalanced Data [0.0] 機械学習手法の大きな問題の1つは、不均衡なデータセットを分類することである。
不均衡データ(IFUTSVM-ID)に対する直観的ファジィUTSVMを提案する。
雑音や外周の影響を軽減するため,直観主義的なファジィ・メンバシップ・スキームを用いる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 11:35:50 GMT)
RiboGen: RNA Sequence and Structure Co-Generation with Equivariant MultiFlow [0.0] RiboGenはRNA配列と全原子3D構造を同時に生成する最初のディープラーニングモデルである。
実験の結果,RiboGenは化学的に可塑性かつ自己持続的なRNAサンプルを効率的に生成できることがわかった。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:16:48 GMT)
Realizing string breaking dynamics in a $Z_2$ lattice gauge theory on quantum hardware [0.0] 我々は、Kogut-Susskindスタッガードフェルミオンに結合した$Z$格子ゲージ理論における弦の破れの静的および動的側面について検討する。
我々は、理論の基礎状態を確実に準備できる変分量子固有解法を開発した。
本研究では,2つの静電荷間のフラックス管のリアルタイムダイナミクスをネットワークと量子ハードウェアの両方を用いて検討する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:52:31 GMT)
QuatE-D: A Distance-Based Quaternion Model for Knowledge Graph Embedding [0.0] QuatE-Dは、従来の内積法ではなく、距離に基づくスコアリング機能を利用する、新しい四元数モデルである。
実験結果から,QuatE-Dは効率のよいパラメータ化を維持しつつ,競争性能を発揮することが示された。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:54:10 GMT)
Quantum Contextuality for Contextual Word Embeddings [0.0] 本稿では,量子文脈性を利用した代替フレームワークを提案する。
ワードはヒルベルト空間内の単一の静的ベクトルとして符号化される。
単語ベクトルは、それが占有するベース(コンテキスト)に基づいて、その特定の意味を取得する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 17:53:48 GMT)
Ptychographic estimation of qudit states encoded in the angular position and orbital angular momentum of single photons [0.0] プチコグラフィー(Ptychography)は、主に光学顕微鏡や電子顕微鏡で用いられる計算イメージング技術である。
単光子の角位置と軌道角運動量に符号化された$D$-dimensional qudit状態に対するptychographyの実装方法について述べる。
中間射影は、角道内の単純な二分空間フィルタで行い、フーリエ基底での計測は、$D$OAMモードをポストセレクトすることで行うことを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 20:47:32 GMT)
Prompt-Based Cost-Effective Evaluation and Operation of ChatGPT as a Computer Programming Teaching Assistant [0.0] この記事では、そのようなアプリケーションに関連する3つの側面について研究する。
GPT-3.5T と GPT-4T の2つのモデルの性能評価を行った。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 10:35:50 GMT)
Probing Complex Decoherence Processes in Materials for Quantum Applications [0.0] 本稿では、量子系におけるデコヒーレンスの概念と、光周波数におけるデコヒーレンスの評価方法を紹介する。
次に,多次元コヒーレント分光法を,デコヒーレンス力学の完全複雑性を明らかにするユニークなプローブとして導入する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 18:53:34 GMT)
Predictors of Childhood Vaccination Uptake in England: An Explainable Machine Learning Analysis of Longitudinal Regional Data (2021-2024) [0.0] 小児予防接種は公衆衛生の基盤であるが、イングランド全土で予防接種が継続されている。
これまでの研究は主に断面データと伝統的な統計手法に依存していた。
2021年から2024年にかけて、イングランドの150地区にまたがる小児ワクチン接種状況の縦断的機械学習解析を行った。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:41:26 GMT)
Predicting fermionic densities using a Projected Quantum Kernel method [0.0] 本研究では,1次元フェルミオン系の密度構造を予測するために,投射量子カーネル法に基づく支持ベクトル回帰器を用いる。
核は、相互作用するライドバーグ原子で実装可能な量子貯水池の可観測物で構築されている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 18:00:03 GMT)
Particle-Hole Creation in Condensed Matter: A Conceptual Framework for Modeling Money-Debt Dynamics in Economics [0.0] 本稿では, 凝縮物質物理学における粒子ホール生成と直接類似して, 経済システムにおける金銭負債のダイナミクスをモデル化する場の理論的枠組みを提案する。
この枠組みは、量的緩和(QE)と金に支えられた金融体制、そして量子のような統一的な定式化の下で、ミクロ経済の信用創造を含むマクロ経済現象をうまく捉えている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 04:07:22 GMT)
Optimal Transport for $ε$-Contaminated Credal Sets: To the Memory of Sayan Mukherjee [0.0] モンジェとカンロビッチは、確率が低い確率に置き換わる最適な輸送問題を起こした。
より低い確率が$epsilon$-contaminated setのより低いエンベロープである場合、Mongeの我々のバージョン、そして関東ロビッチの問題の限定バージョンは、それぞれの古典バージョンと一致することを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 13:12:20 GMT)
OpCode-Based Malware Classification Using Machine Learning and Deep Learning Techniques [0.0] 本報告では,OpCodeシークエンスを用いたマルウェア分類の包括的解析を行う。
Support Vector Machine(SVM)を用いたn-gram解析を用いた従来の機械学習、K-Nearest Neighbors(KNN)、Decision Tree分類器、畳み込みニューラルネットワーク(CNN)を用いたディープラーニングアプローチの2つのアプローチが評価されている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 02:09:57 GMT)
One Jump Is All You Need: Short-Cutting Transformers for Early Exit Prediction with One Jump to Fit All Exit Levels [0.0] 本稿では,1つのOne-Jump-Fits-All(OJFA)低ランクショートカットを提案する。
OJFAの選択は、推論中に複数のショートカットジャンプを維持できる性能と大体一致していることを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 08:02:40 GMT)
On the redundancy of short and heterogeneous sequences of belief revisions [0.0] 特定の信念修正エピソードを忘れることは、他のリビジョンが同じ情報を提供したり、推論を許したりするため、情報を消去することができない。
任意の2つのレキソグラフィーリビジョンのシーケンスや、任意の長いレキソグラフィーリビジョンのために、coNP-hardが証明された。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 10:12:04 GMT)
On the Convergence of Irregular Sampling in Reproducing Kernel Hilbert Spaces [0.0] 本稿では,カーネルと入力データの両方に対する最小主義的仮定の下で,カーネル回帰の近似特性について論じる。
我々はまず、カーネルのRKHS基準でエラー推定を証明した。
これにより、コンパクト領域上でのカーネル回帰の均一収束に関する新たな結果が導かれる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 10:57:16 GMT)
Observation of gyroscopic coupling in a non-spinning levitated ferromagnet [0.0] 非スピン永久強磁性体は、十分に低い周波数でジャイロスコープとして振る舞うと予測される。
超伝導トラップ内で浮遊する非スピン永久強磁性体の回転力学におけるジャイロ効果を観察する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:18:08 GMT)
Logical channel for heralded and pure loss with the Gottesman-Kitaev-Preskill code [0.0] 低レベルの損失でも、他のコードが処理しなければならない修正不可能なエラーが発生する可能性がある。
本研究では,論理チャネルの解析式を導出することにより,これらの誤りを特徴づける。
ランダムな変位ノイズとは異なり、損失誘起論理チャネルはパウリチャネルではない。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 06:25:37 GMT)
Learning when to rank: Estimation of partial rankings from sparse, noisy comparisons [0.0] 偏位を学習するための原理的ベイズ手法を開発した。
我々の枠組みはいかなる統計的ランキング法にも適応できる。
従来のランキングよりも、データの微妙な要約が提供される。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 09:26:21 GMT)
Large Language Model-Based Knowledge Graph System Construction for Sustainable Development Goals: An AI-Based Speculative Design Perspective [0.0] 本研究では,サステナブル開発目標を解析するための知識グラフシステムを開発する。
新たな目標を見つけ、それをオンラインで視覚化する。
株式、レジリエンス、技術主導の包摂を中心に、6つの新たな目標が提案されている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 05:38:41 GMT)
Knitting Robots: A Deep Learning Approach for Reverse-Engineering Fabric Patterns [0.0] この研究は、繊維生産とロボット自動化のギャップを埋めるために、逆編みのための新しいディープラーニングベースのパイプラインを提案する。
このパイプラインは2段階のアーキテクチャを採用しており、ロボットはまず、完全なラベルを推測する前にフロントラベルを識別することができる。
この研究は、完全に自動化されたロボット編み物のシステムの基礎を確立し、カスタマイズ可能で柔軟な生産プロセスを可能にする。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 18:00:37 GMT)
Irregular Sampling of High-Dimensional Functions in Reproducing Kernel Hilbert Spaces [0.0] 我々は、カーネルヒルベルト空間の再現における高次元関数のサンプリング式を開発する。
より高次元における不規則なサンプルを決定するテンソルを得るために、低次元における不規則なサンプルを決定することができることを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 08:18:15 GMT)
Internal noise in hardware deep and recurrent neural networks helps with learning [0.0] ニューラルネットワークのトレーニング中の内部ノイズは、リカレントおよびディープニューラルネットワークの最終性能に影響を与える。
ほとんどの場合、ディープ状態とエコー状態のネットワークは、トレーニング中の内部ノイズの恩恵を受ける。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:26:46 GMT)
Impact of dynamics, entanglement, and Markovian noise on the fidelity of few-qubit digital quantum simulation [0.0] IBM-Q量子ハードウェアプラットフォーム上で実行される量子ソートゥースマップのハミルトンシミュレーション。
IBM-Q量子ハードウェアプラットフォーム上で実行される量子ソートゥースマップのデジタルハミルトンシミュレーション。
ゲートベースリンドブラッドノイズモデルでは, ゲート動作中の緩和と劣化の効果的な変化を捉えている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 18:08:21 GMT)
Imitation Learning with Precisely Labeled Human Demonstrations [0.0] この研究は、ハンドヘルドグリップを使って効率的なデータ収集を行うことの可能性を実証する先行研究に基づいている。
我々は、グリップの外観に対するユーザの制御を、特にユニークで、セグメンタブルな色を割り当てることで、正確なエンドエフェクタポーズ推定を可能にする。
本研究は,ロボットによる実演における性能の88.1%に到達可能な政策を,人間による実演を正確にラベル付けしたシミュレーションで示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 17:12:00 GMT)
Human-aligned Deep Learning: Explainability, Causality, and Biological Inspiration [0.0] この作業は、ディープラーニング(DL)を人間の推論能力と整合させ、より効率的で解釈可能で堅牢な画像分類を可能にする必要がある。
説明可能性、因果性、生物学的ビジョンの3つの視点からアプローチする。
i) シンプルなアクティベーションは医療画像DLモデルの洞察を欠く; (ii) プロトタイプ部分学習は効果的で、放射線学的に整列; (iii) XAIと因果MLは深く結びついている; (iv) 先行情報なしで弱い因果シグナルを利用でき、性能と解釈性が向上する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 14:40:58 GMT)
How to seed ergodic dynamics of interacting bosons under conditions of many-body quantum chaos [0.0] 光格子における超低温原子の初期状態がエルゴード動力学の出現をいかに制御するかを実証する。
相互作用強度と比較してトンネル化の観点から初期状態のカオスしきい値が特定される。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:52:01 GMT)
HMPE:HeatMap Embedding for Efficient Transformer-Based Small Object Detection [0.0] 本稿では,新しいトランスフォーマー最適化手法であるHeatMap Position Embedding (HMPE)を紹介する。
HMPEは熱マップ誘導適応学習により位置符号化と意味検出情報を動的に統合する。
HMPEエンハンス埋め込みを利用することで,デコーダ層を8層から3層に減らし,推論とトレーニングのコストを大幅に削減できる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 05:24:08 GMT)
Going Whole Hog: A Philosophical Defense of AI Cognition [0.0] 我々は、AI哲学における一般的な方法論に反対し、低レベルの計算の詳細に基づく開始点を拒絶する。
認知状態の全スイートについて論じるために,我々は「ホリスティック・ネットワーク・アセスメント」を採用している。
我々は、人間の概念的スキームを超えた「アリアン」コンテンツを有するLLMの可能性について推測することで結論付ける。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 11:36:25 GMT)
Four Bottomless Errors and the Collapse of Statistical Fairness [0.0] この議論は、統計的公平さの中で4つの繰り返し発生する誤りを特定することによって進められる。
平等と公正を混同し、類似が同様に扱われる考え方を限定する。
第2と第3の誤りは、他者とその視点を否定することによって機能する観念的倫理観に由来する。
最終的な誤りは、制約のない公正さが後にグループ構成を定義することを許すのではなく、事前に定義された社会グループ内で働くようフェアネスを制約する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:42:49 GMT)
First and Second Order Approximations to Stochastic Gradient Descent Methods with Momentum Terms [0.0] 勾配 Descent (SGD) 法は最適化問題に多くの応用がある。
学習速度と運動量パラメータを時間に応じて変化させることができるSGDの弱い仮定の下で近似結果を示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:49:46 GMT)
Enhancing Pothole Detection and Characterization: Integrated Segmentation and Depth Estimation in Road Anomaly Systems [0.0] 道路異常検出は、道路維持とドライバーと車両の安全性向上において重要な役割を担っている。
道路異常検出のための最近の機械学習アプローチは、手動解析と異常カウントの面倒で時間を要するプロセスを克服している。
本稿では,予め訓練したYOLOv8-segモデルを用いて移動学習を行い,ポットホールの自動評価を行う。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 11:59:38 GMT)
Enhancing Multilingual Sentiment Analysis with Explainability for Sinhala, English, and Code-Mixed Content [0.0] 既存のモデルは、Sinhalaのような低リソース言語と競合し、実用的な使用には解釈性がない。
本研究は,多言語機能と説明可能な出力を両立させるハイブリッドアスペクトベース感情分析フレームワークを開発する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 08:21:12 GMT)
Enhancing Math Learning in an LMS Using AI-Driven Question Recommendations [0.0] 本稿では,近年のLMS(Learning Management System)における算数学習をAIによって強化する手法を提案する。
数学問題の深い埋め込みはメタのLlama-3.2-11B-Vision-Instructモデルを用いて生成される。
類似した質問を識別するために、コサイン類似性、自己組織化マップ(SOM)、ガウス混合モデル(GMM)の3つの推奨手法を適用した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 22:48:26 GMT)
Designing a reliable lateral movement detector using a graph foundation model [0.0] 機械学習(ML)の新しいパラダイムとして、ファンデーションモデルが最近登場した。
これらのモデルは、大規模で多様なデータセットで事前トレーニングされ、その後、ほとんどまたは全くリトレーニングすることなく、さまざまな下流タスクに適用できる。
サイバーセキュリティにおけるグラフ基盤モデル(GFM)の有用性について,ある特定のユースケース,すなわち横移動検出のレンズを用いて検討した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:39:21 GMT)
Deep Learning on Graphs for Mobile Network Topology Generation [0.0] 本稿では,実世界のモバイルネットワークに適用された異なるグラフベースの深層学習手法の精度と精度を評価することに焦点を当てる。
実運用Telecom Networksから得られたTelecomデータセットに関する実験により,グラフニューラルネットワーク(GNN)モデルと多層パーセプトロンの有効性が示された。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 15:49:56 GMT)
Deep Learning Models Meet Financial Data Modalities [0.0] 本研究では、ディープラーニングモデルと財務データモダリティの統合について検討する。
画像に基づく表現において,埋め込み技術を開発し,逐次リミット順序帳のスナップショットを異なる入力チャネルとして扱う。
制約順序帳データを処理する手法は,高周波トレーディングアルゴリズムの最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 07:19:44 GMT)
Beyond Misinformation: A Conceptual Framework for Studying AI Hallucinations in (Science) Communication [0.0] 本稿では,AI幻覚を誤情報の一形態として理解するための概念的枠組みを提案する。
これらのAI幻覚は単なる技術的失敗ではなく、社会的帰結を伴うコミュニケーション現象として扱われるべきである、と私は主張する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 16:26:02 GMT)
AutoAdv: Automated Adversarial Prompting for Multi-Turn Jailbreaking of Large Language Models [0.0] 大規模言語モデル(LLM)は、ジェイルブレイク攻撃の脆弱性を示し続けている。
本稿では,敵対的即時生成を自動化する新しいフレームワークであるAutoAdvを紹介する。
我々の攻撃は、有害なコンテンツ生成に対して最大86%のジェイルブレイク成功率を達成したことを示す。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 08:38:56 GMT)
Adiabatic Fine-Tuning of Neural Quantum States Enables Detection of Phase Transitions in Weight Space [0.0] 我々は,位相図上でNQSを訓練し,異なるモデル間で強く相関する重み表現をもたらすアディバティック微調整を導入する。
この重み空間の相関により、トレーニングされたネットワーク重みだけを解析することによって量子系の相転移を検出することができる。
この結果は,物理相転移とニューラルネットワークパラメータの幾何の関連性を確立し,物理における機械学習モデルの解釈可能性の新しい方向性を開拓する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 13:30:49 GMT)
Adaptive Lattice Gas Algorithm: Classical and Quantum implementations [0.0] 格子ガスアルゴリズム(LGA)は非線形系をシミュレートするために用いられる。
我々は、線形衝突演算子を伴い、同じ現象をシミュレートできる量子アルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 08:29:47 GMT)
Absence of Entanglement Growth in Dicke Superradiance [0.0] Dicke superradiance(英語版)は、ピーク放射強度スケーリングで放射を放射する2レベル系の置換不変な$N$のアンサンブルをN2$と記述している。
個々のディック状態は典型的には絡み合っているが、超ラジカル崩壊中の密度行列はそのような状態の混合であり、全体状態が絡み合っているか分離可能であるかという微妙な疑問を提起する。
このことは、ディック超放射能における絡み合いの役割に関する長年にわたる疑問に答え、集合的な散逸にもかかわらず、分離可能な状態はこれらの力学の下で分離可能であることを強調する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 11:57:50 GMT)
A synthetic dataset of French electric load curves with temperature conditioning [0.0] 本稿では,条件付き潜伏拡散によって生成された新しい合成負荷曲線データセットを提案する。
また, 発電に使用する契約電力, 使用時間, 局部温度も提供する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 19:28:49 GMT)
A streamlined demonstration that stabilizer circuits simulation reduces to Boolean linear algebra [0.0] Gottesman-Knillの定理は、安定化回路上の計算は古典的なコンピュータ上でシミュレートできるというものである。
このノートは、安定化回路とブール線型代数の間の接続をより明確にすることを目的としている。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 22:57:24 GMT)
A CMOS Probabilistic Computing Chip With In-situ hardware Aware Learning [0.0] 本稿では,チメラグラフに440本のスピンを配置し,0.44mm2の領域を占有する確率的ビット物理による解法を実証する。
論理ゲートや完全加算器などの確率的計算タスクやMaxCutなどの最適化タスクの実行能力を検証する。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 20:40:48 GMT)
A Blockchain-Based Approach for Secure and Transparent e-Faktur Issuance in Indonesia's VAT Reporting System [0.0] 本稿では,インドネシアのVAT報告プロセスにおける納税請求書の発行と検証の課題に対処することを目的とした,ブロックチェーンベースのe-Fakturシステムの設計について述べる。
提案システムは,NSFPの発行を簡素化し,集中型サーバへの依存を低減し,単一障害点を排除し,監査性を向上させる。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 11:13:12 GMT)
A Baseline for Self-state Identification and Classification in Mental Health Data: CLPsych 2025 Task [0.0] 4ビットの量子化 Gemma 2 9B モデルとデータ前処理のステップで数ショットの学習を行う。
我々は、文が適応的あるいは不適応な自己状態の証拠であるかどうかを判断するために二項分類を行う。
本システムでは,タスクA.1に提出された14のシステムのうち3分の1を配置し,0.579のテストタイムリコールを実現した。
論文参考訳(メタデータ) (Fri, 18 Apr 2025 20:37:14 GMT)