On Path to Multimodal Generalist: General-Level and General-Bench [154.0] 本稿では,MLLMの性能と汎用性を5段階に定義した評価フレームワークであるGeneral-Levelを紹介する。
フレームワークの中核はSynergyの概念であり、モデルが理解と生成をまたいだ一貫性のある機能を維持するかどうかを測定する。
既存の100以上のMLLMを含む評価結果は、ジェネラリストの能力ランキングを明らかにする。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:59:32 GMT)
Visual Imitation Enables Contextual Humanoid Control [117.2] VIDEOMIMICは、日常の映像をマイニングし、人間と環境を共同で再構築する、リアルからシミュレート・トゥ・リアルなパイプラインである。
実際のヒューマノイドロボットにおけるパイプラインの結果を実証する。
論文参考訳(メタデータ) (Wed, 07 May 2025 05:42:27 GMT)
Pangu Ultra MoE: How to Train Your Big MoE on Ascend NPUs [111.7] ミキチャー・オブ・エキスパート(MoE)と1兆近いパラメータを持つ疎大言語モデル(LLM)が、最も有能な言語モデルの領域を支配している。
本稿では,Ascend NPU上でそのようなスケールを利用するレシピを明らかにすることを目的としている。
主な目的は、動的スパースモデル構造下でのコンピューティングリソースのより良い使用と、実際のハードウェアで期待されるパフォーマンス向上の実現である。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:46:36 GMT)
SweRank: Software Issue Localization with Code Ranking [109.3] SweRankは、ソフトウェア問題ローカライゼーションのための効率的な検索と参照のためのフレームワークである。
パブリックなGitHubリポジトリからキュレートされた大規模なデータセットであるSweLocを構築します。
SweRankは最先端の性能を達成し、従来のランキングモデルとコストの高いエージェントベースシステムの両方より優れていることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:44:09 GMT)
EchoInk-R1: Exploring Audio-Visual Reasoning in Multimodal LLMs via Reinforcement Learning [108.7] MLLM(Multimodal large language model)は、テキスト、視覚、音声にまたがる高度な認識を持つが、構造化されたクロスモーダル推論に苦慮する。
MLLMにおけるそのような推論を強化する強化学習フレームワークであるEchoInk-R1を紹介する。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:59:49 GMT)
Re-ReST: Reflection-Reinforced Self-Training for Language Agents [101.2] 言語エージェントにおける自己学習は、エージェント自体から監督を生成することができる。
リフレクション強化自己学習(Reflection-Reinforced Self-Training, Re-ReST)は, テキストレフレクタを用いて低品質な試料を精製する。
論文参考訳(メタデータ) (Wed, 07 May 2025 05:01:14 GMT)
One2Any: One-Reference 6D Pose Estimation for Any Object [98.5] 6Dオブジェクトのポーズ推定は、完全な3Dモデルへの依存、マルチビューイメージ、特定のオブジェクトカテゴリに限定したトレーニングのため、多くのアプリケーションにとって依然として困難である。
本稿では,単一の参照単一クエリRGB-D画像のみを用いて,相対6自由度(DOF)オブジェクトのポーズを推定する新しい手法One2Anyを提案する。
複数のベンチマークデータセットの実験により、我々のモデルは新しいオブジェクトによく一般化し、最先端の精度を実現し、また、コンピュータのごく一部でマルチビューやCAD入力を必要とする競合する手法さえも実現している。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:54:59 GMT)
RoBridge: A Hierarchical Architecture Bridging Cognition and Execution for General Robotic Manipulation [90.8] RoBridgeは、一般的なロボット操作のための階層的なインテリジェントアーキテクチャである。
大規模事前学習型視覚言語モデル(VLM)に基づくハイレベル認知プランナー(HCP)で構成されている。
強化学習の手続き的スキルを解き放ち、認知と実行のギャップを効果的に埋める。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:37:17 GMT)
ABKD: Pursuing a Proper Allocation of the Probability Mass in Knowledge Distillation via $α$-$β$-Divergence [89.6] 知識蒸留(KD)は、大きな教師モデルからより小さな学生モデルに知識を伝達する。
KDの中核的な課題は、2つのモード集中効果のバランスにある。
我々は$alpha$$beta$-divergenceを持つ汎用フレームワークであるABKDを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:48:49 GMT)
LUSIFER: Language Universal Space Integration for Enhanced Multilingual Embeddings with Large Language Models [89.1] LUSIFERは,LLMをベースとした多言語タスクの埋め込みモデルに,多言語監視を必要とせずに適用可能なゼロショット方式である。
LUSIFERのアーキテクチャは多言語エンコーダを組み、言語ユニバーサル学習者として機能し、埋め込み固有のタスクに最適化されたLLMベースの埋め込みモデルと組み合わせている。
5つの主要な埋め込みタスク、123の多様なデータセット、14言語にわたるカバレッジを含む新しいベンチマークを導入する。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:16:42 GMT)
XLD: A Cross-Lane Dataset for Benchmarking Novel Driving View Synthesis [84.2] 本稿では,新しい駆動ビュー合成評価のための合成データセットを提案する。
トレーニングコースから逸脱した画像を1~4ドル(約1,400円)で撮影する。
我々は、フロントオンリーおよびマルチカメラ設定下で、既存のNVSアプローチを評価するための最初の現実的なベンチマークを確立する。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:25:04 GMT)
CountDiffusion: Text-to-Image Synthesis with Training-Free Counting-Guidance Diffusion [82.8] テキスト記述から適切なオブジェクト量で画像を生成するためのトレーニング不要のフレームワークであるCountDiffusionを提案する。
提案したCountDiffusionは、さらなるトレーニングなしで、拡散ベースのテキスト・ツー・イメージ(T2I)生成モデルにプラグインすることができる。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:47:35 GMT)
Replace Anyone in Videos [82.4] ReplaceAnyoneフレームワークは、複雑な背景を特徴とする、局所的な人間の置換と挿入に焦点を当てたフレームワークである。
我々は,このタスクを,一貫したエンド・ツー・エンドビデオ拡散アーキテクチャを用いて,ポーズガイダンスを用いた画像条件付きビデオ塗装パラダイムとして定式化する。
提案されたReplaceAnyoneは従来の3D-UNetベースモデルだけでなく、Wan2.1のようなDiTベースのビデオモデルにもシームレスに適用できる。
論文参考訳(メタデータ) (Wed, 07 May 2025 06:40:11 GMT)
Imagining and building wise machines: The centrality of AI metacognition [78.8] 我々は人間の知恵について知られているものを調べ、そのAIのビジョンをスケッチする。
AIシステムは特にメタ認知に苦しむ。
スマートAIのベンチマーク、トレーニング、実装について論じる。
論文参考訳(メタデータ) (Wed, 07 May 2025 21:18:20 GMT)
Retraining with Predicted Hard Labels Provably Increases Model Accuracy [77.7] リトレーニングは、与えられた(ノイズの多い)ラベルで最初にトレーニングすることで得られる人口の精度を向上させることができる。
予測ラベルが与えられたラベルにマッチするサンプルを選択的に再トレーニングすることで、余分なプライバシコストを伴わずにラベルDPトレーニングを大幅に改善できることを実証的に示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:12:46 GMT)
XrayGPT: Chest Radiographs Summarization using Medical Vision-Language Models [72.9] 我々は,会話型医療ビジョン言語モデルであるXrayGPTを紹介する。
胸部X線写真に関するオープンエンドの質問を分析し、答えることができる。
自由テキストラジオグラフィーレポートから217kの対話的かつ高品質な要約を生成する。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:26:09 GMT)
HiPerRAG: High-Performance Retrieval Augmented Generation for Scientific Insights [72.8] HiPerRAGは360万以上の科学論文から知識をインデクシングし取り出すワークフローである。
コアとなるのはマルチモーダル文書解析のための高スループットモデルであるOreoと、クエリ対応エンコーダの微調整アルゴリズムであるColTrastだ。
HiPerRAGは、既存の科学的質問応答ベンチマークと、この研究で導入された2つの新しいベンチマークで堅牢なパフォーマンスを提供する。
論文参考訳(メタデータ) (Wed, 07 May 2025 22:50:23 GMT)
LLM2CLIP: Powerful Language Model Unlocks Richer Visual Representation [72.0] この研究は、大規模言語モデル(LLM)がCLIPの機能をどのように強化するか、特により長く複雑なイメージキャプションを処理するために検討する。
キャプション・トゥ・キャプション・トゥ・キャプション・トゥ・コントラスト・ファインチューニング・フレームワークを導入し,LLM出力の識別品質を大幅に向上させた。
提案手法はLoRA法よりも優れ,より優れた性能で4倍近い高速トレーニングを実現している。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:51:33 GMT)
VidMuse: A Simple Video-to-Music Generation Framework with Long-Short-Term Modeling [71.0] ビデオ入力に対応する音楽を生成するためのフレームワークであるVidMuseを提案する。
VidMuseは、ビデオと音響的、意味的に一致した高忠実な音楽を生成する。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:59:51 GMT)
Person Recognition at Altitude and Range: Fusion of Face, Body Shape and Gait [70.0] FarSightは、顔認識のためのエンドツーエンドシステムで、顔、歩行、体形を横断する生体計測の手がかりを統合する。
FarSightは、4つのコアモジュールにまたがる新しいアルゴリズムを組み込んでいる。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:58:25 GMT)
Estimating LLM Uncertainty with Logits [66.5] 本稿では,大規模言語モデルにおける非結合トークンの不確実性を推定するためのフレームワークとして,ロジッツ誘発トークン不確実性(LogTokU)を提案する。
我々は,LogTokUの実装にエビデンスモデリングを採用し,その不確実性を推定して下流タスクを導出する。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:13:41 GMT)
Advancing and Benchmarking Personalized Tool Invocation for LLMs [66.4] パーソナライズされたツール呼び出しの概念を導入し、ツールの優先度とプロファイルに依存したクエリという2つの重要なタスクを定義します。
これらの課題に対処するために、パーソナライズされたツール呼び出し用に設計されたデータ合成フレームワークであるPToolを提案する。
パーソナライズされたツール呼び出しを評価するための最初のベンチマークである textbfPTBench を構築した。
論文参考訳(メタデータ) (Wed, 07 May 2025 02:25:20 GMT)
High-Dimensional Interlingual Representations of Large Language Models [65.8] 大規模言語モデル(LLM)は、多言語データセットに基づいて訓練され、言語間構造の形成を示唆する。
資源レベル, 類型, 地理的地域によって異なる31の多様な言語を探索する。
多言語 LLM は非一貫性な言語間アライメントを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:03:47 GMT)
DynamicControl: Adaptive Condition Selection for Improved Text-to-Image Generation [63.6] 多様な制御信号の動的組み合わせをサポートするDynamicControlを提案する。
様々な条件下での制御性,生成品質,構成性の観点から,DynamicControlは既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:33:08 GMT)
Absolute Zero: Reinforced Self-play Reasoning with Zero Data [61.5] 検証可能な報奨付き強化学習(RLVR)は,大規模言語モデルの推論能力を高めることを約束している。
本稿では,AZR(Absolute Zero Reasoner)について紹介する。
AZRは、コーディングおよび数学的推論タスクにおける全体的なSOTA性能を達成し、既存のゼロセットモデルより優れている。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:01:17 GMT)
Object-Shot Enhanced Grounding Network for Egocentric Video [61.0] 我々は,エゴセントリックビデオのためのオブジェクトショット拡張グラウンドネットワークOSGNetを提案する。
具体的には,映像表現を豊かにするために,映像から対象情報を抽出する。
我々は,エゴセントリックなビデオに固有の撮影動作を分析し,これらの特徴を活用して,装着者の注意情報を抽出する。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:20:12 GMT)
InfoNCE is a Free Lunch for Semantically guided Graph Contrastive Learning [60.6] グラフコントラスト学習(GCL)は、グラフ基盤モデルやLLMの研究の急増において、グラフのエンハンサーとして重要な役割を担っている。
従来のGCLでは、自己監督タスクの定義に拡張を使用し、強化ペアを正のサンプルとして、その他のものを負のサンプルとして扱う。
本稿では,GCLは基本的に,自己教師型タスクの定義を意味的に導くべき,肯定的非ラベル付き学習問題である,と論じる。
論文参考訳(メタデータ) (Wed, 07 May 2025 05:27:36 GMT)
Modeling Domain and Feedback Transitions for Cross-Domain Sequential Recommendation [60.1] $textTransition2$は、ドメインとユーザフィードバックのタイプの両方にわたるトランジションをモデル化する新しい方法です。
我々は、異なるタイプの遷移を識別するために、様々なマスクを組み込んで、クロストランジション・マルチヘッド・セルフアテンションを用いて、ユーザ履歴をエンコードする。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:47:29 GMT)
No Other Representation Component Is Needed: Diffusion Transformers Can Provide Representation Guidance by Themselves [59.8] 自己表現アライメント(Self-Representation Alignment, SRA)は, 自己蒸留法により表現指導を得る単純な方法である。
実験結果から,SRAをDiTsおよびSiTsに適用すると一貫した性能向上が得られた。
論文参考訳(メタデータ) (Wed, 07 May 2025 06:26:01 GMT)
TetWeave: Isosurface Extraction using On-The-Fly Delaunay Tetrahedral Grids for Gradient-Based Mesh Optimization [59.3] 我々は、勾配に基づくメッシュ最適化のための新しい等曲面表現であるTetWeaveを紹介する。
TetWeaveは、Delaunay三角測量を通じて、四面体グリッドをオンザフライで構築する。
我々は,コンピュータグラフィックスとビジョンの幅広い課題に対して,TetWeaveの適用性を示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:32:49 GMT)
Probability Density Geodesics in Image Diffusion Latent Space [58.0] 測地拡散は潜在空間で計算可能であることを示す。
我々は、事前訓練された画像拡散空間における測地線とビデオクリップの密接な関係を分析する。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:44:54 GMT)
Putting the Value Back in RL: Better Test-Time Scaling by Unifying LLM Reasoners With Verifiers [58.0] RL$V$は、LLMを推論器と生成検証器の両方として共同で訓練することにより、任意の値自由なRL法を増強する。
RL$V$は、並列サンプリングでMATHの精度を20%以上向上し、効率的なテスト時間計算のスケーリングを可能にする。
論文参考訳(メタデータ) (Wed, 07 May 2025 22:41:26 GMT)
DFVO: Learning Darkness-free Visible and Infrared Image Disentanglement and Fusion All at Once [57.2] 可視・赤外画像のアンタングル化と融合を同時に行うためのダークネスフリーネットワーク(DFVO)を提案する。
DFVOは、従来の2段階のカスケードトレーニング(エンハンスメントと融合)を置き換えるために、ケースケードマルチタスクアプローチを採用している
提案手法は,定性的および定量的評価の観点から,最先端の代替品よりも優れている。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:59:45 GMT)
SWE-Fixer: Training Open-Source LLMs for Effective and Efficient GitHub Issue Resolution [56.9] 大規模言語モデル(LLM)は、様々な複雑なタスクにまたがる顕著な習熟度を示している。
SWE-Fixerは、GitHubの問題を効果的かつ効率的に解決するために設計された、新しいオープンソースフレームワークである。
我々は,SWE-Bench LiteとVerifiedベンチマークに対するアプローチを評価し,オープンソースモデル間の競合性能を実現する。
論文参考訳(メタデータ) (Wed, 07 May 2025 04:06:41 GMT)
A Quantitative Evaluation of the Expressivity of BMI, Pose and Gender in Body Embeddings for Recognition and Identification [56.1] 我々は,学習した特徴と特定の属性の相互情報として定義された表現性の概念を拡張し,属性のエンコード方法の定量化を行う。
その結果,BMIは最終層において高い表現性を示し,認識におけるその支配的な役割を示していることがわかった。
これらの結果は,ReIDにおける身体属性の中心的役割を示し,属性駆動相関を明らかにするための原則的アプローチを確立した。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:16:39 GMT)
To CoT or not to CoT? Chain-of-thought helps mainly on math and symbolic reasoning [55.5] Chain-of-Thought (CoT) は,大規模言語モデル (LLM) から推論能力を引き出すデファクト手法である。
私たちは、CoTが主に数学や論理学を含むタスクに強いパフォーマンス上の利点をもたらし、他のタスクよりもはるかに少ない利益をもたらすことを示しています。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:00:45 GMT)
Lightweight RGB-D Salient Object Detection from a Speed-Accuracy Tradeoff Perspective [54.9] 現在のRGB-D法は通常、大規模なバックボーンを利用して精度を向上させるが効率を犠牲にする。
本稿では,軽量RGB-D SODのためのSATNet(Speed-Accuracy Tradeoff Network)を提案する。
深度について,高品質の深度マップを生成するための深度任意のモデルを導入する。
モダリティ融合において,モダリティ間の整合性を検討するために,DAM(Decoupled Attention Module)を提案する。
特徴表現のために,双方向の反転フレームワークを用いたDIRM (Dual Information Representation Module) を開発した。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:37:20 GMT)
FrontierNet: Learning Visual Cues to Explore [54.8] この研究は、3Dマップからゴールポーズを抽出する制限に対処するため、効率的な自律探索に2Dビジュアルキューを活用することを目的としている。
本稿では、FrontierNetをコアコンポーネントとする、視覚のみのフロンティアベースの探索システムを提案する。
提案手法は,既存の3次元目標抽出手法に代わるもので,早期探索効率の15%向上を実現している。
論文参考訳(メタデータ) (Wed, 07 May 2025 23:28:22 GMT)
Adaptive and Robust DBSCAN with Multi-agent Reinforcement Learning [53.5] 本稿では,多エージェント強化学習クラスタフレームワーク,すなわちAR-DBSCANを用いた新しいAdaptive and Robust DBSCANを提案する。
我々は、AR-DBSCANが、NMIおよびARIメトリクスの最大144.1%と175.3%のクラスタリング精度を向上するだけでなく、支配的なパラメータを確実に見つけることができることを示した。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:37:23 GMT)
Image-GS: Content-Adaptive Image Representation via 2D Gaussians [52.6] 本稿では,2次元ガウス放射率に基づくコンテンツ適応型画像表現であるImage-GSを紹介する。
リアルタイム使用のためにハードウェアフレンドリーな高速アクセスをサポートし、ピクセルをデコードするためには0.3KのMACしか必要としない。
テクスチャ圧縮、セマンティクス対応圧縮、共同画像圧縮と復元など、いくつかのアプリケーションでその汎用性を実証する。
論文参考訳(メタデータ) (Wed, 07 May 2025 04:17:43 GMT)
CompileAgent: Automated Real-World Repo-Level Compilation with Tool-Integrated LLM-based Agent System [52.0] リポジトリレベルのコンパイル専用のエージェントフレームワークであるCompileAgentを提案する。
CompileAgentは5つのツールとフローベースのエージェント戦略を統合し、コンパイル命令検索とエラー解決のためのソフトウェアアーチファクトとのインタラクションを可能にする。
提案手法は,10%から71%の範囲で,コンパイル成功率を大幅に向上することを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:59:14 GMT)
Bridging Geometry-Coherent Text-to-3D Generation with Multi-View Diffusion Priors and Gaussian Splatting [51.1] 幾何学的に一貫した3次元生成を保証するために,複数視点の関節分布を事前に結合するフレームワークを提案する。
我々は,多視点先行を効果的に結合し,異なる視点で最適化を導出する効果的な最適化ルールを導出する。
我々は, 3D-GS から CSD を通じて改良された, 変形可能な四面体格子を用いて, 高品質で洗練されたメッシュを作製する。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:12:45 GMT)
Towards Certified Unlearning for Deep Neural Networks [50.8] 認定されていない未学習は、凸機械学習モデルで広く研究されている。
認定アンラーニングとディープニューラルネットワーク(DNN)のギャップを埋める手法をいくつか提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 22:41:25 GMT)
ZeroSearch: Incentivize the Search Capability of LLMs without Searching [50.8] 我々はZeroSearchを紹介した。ZeroSearchは大規模言語モデル(LLM)の検索機能を実際の検索エンジンと対話することなくインセンティブを与える強化学習フレームワークである。
提案手法は,LLMを関連文書とノイズ文書の両方を生成可能な検索モジュールに変換するための,軽量な教師付き微調整から始まる。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:30:22 GMT)
An LLM-based Self-Evolving Security Framework for 6G Space-Air-Ground Integrated Networks [49.6] 6Gスペースエアグラウンド統合ネットワーク(SAGIN)は、様々なモバイルアプリケーションに対してユビキタスなカバレッジを提供する。
大規模言語モデル(LLM)に基づくSAGINの新しいセキュリティフレームワークを提案する。
当社のフレームワークは,さまざまな未知の攻撃に対して堅牢な,高精度なセキュリティ戦略を実現しています。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:04:25 GMT)
Breaking Annotation Barriers: Generalized Video Quality Assessment via Ranking-based Self-Supervision [49.5] ビデオ品質評価(VQA)は、様々なビデオ処理システムにおける品質の定量化に不可欠である。
我々はVQAのための自己教師型学習フレームワークを導入し、大規模でラベルなしのWebビデオから品質評価機能を学ぶ。
既存のVQAベンチマークよりも10倍のデータセットでトレーニングを行うことで、ゼロショットのパフォーマンスを実現しています。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:07:00 GMT)
On Understanding Attention-Based In-Context Learning for Categorical Data [49.4] 我々は,アテンションブロックで構成されるネットワークを開発し,各ブロックに自己注意層を付加し,その後にクロスアテンション層と関連するスキップ接続を付加する。
このモデルは、カテゴリー的観察を伴う文脈内推論のための多段階機能的GD推論を正確に行うことができる。
論文参考訳(メタデータ) (Wed, 07 May 2025 00:13:15 GMT)
Quantum Cryptography Using Momentum and Position Variables in a Simple Optical Arrangement [49.2] 位置および運動量量子状態を用いた量子鍵分布(QKD)の実験的実装について検討する。
レーザー、スリット、レンズを含むセットアップを用いることで、BB84プロトコルのバリエーションを実演する。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:11:37 GMT)
FA-KPConv: Introducing Euclidean Symmetries to KPConv via Frame Averaging [49.2] KPConv上に構築されたニューラルネットワークアーキテクチャであるFA-KPConv(Frame-Averaging Kernel-Point Convolution)を提案する。
FA-KPConvは、学習可能なパラメータの数を保ちながら、任意の入力情報を妥協することなく、幾何学的な事前知識を組み込む。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:58:04 GMT)
RaDialog: A Large Vision-Language Model for Radiology Report Generation and Conversational Assistance [49.0] 会話型AIツールは、所定の医療画像に対して臨床的に正しい放射線学レポートを生成し、議論することができる。
RaDialogは、ラジオロジーレポート生成と対話ダイアログのための、初めて徹底的に評価され、公開された大きな視覚言語モデルである。
本手法は,報告生成における最先端の臨床的正確性を実現し,報告の修正や質問への回答などのインタラクティブなタスクにおいて,印象的な能力を示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:22:02 GMT)
VecCity: A Taxonomy-guided Library for Map Entity Representation Learning [48.7] マップエンティティ表現学習(MapRL)は、汎用的で再利用可能なデータ表現を生成する。
本稿では,エンコーダや事前学習タスク,下流タスクなどの機能的モジュールモデルに基づいてモデルを編成するMapRLの新しい分類法を提案する。
本稿では, コード化, 事前学習, 微調整, 評価のための, 使いやすいインタフェースを提供する分類学駆動型ライブラリであるVecCityを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:26:10 GMT)
Vision-Language Model Selection and Reuse for Downstream Adaptation [48.7] 本稿では、モデルラベル学習(MLL)と呼ばれる、下流タスクのためのVLMの選択と再利用のための新しいパラダイムを提案する。
モデルラベリングプロセスは目標タスクに依存しないため,提案手法は計算効率が高く,成長可能である。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:12:56 GMT)
LLM-Independent Adaptive RAG: Let the Question Speak for Itself [47.6] 大型言語モデル (LLM) は幻覚を起こす傾向があり、検索型拡張生成 (RAG) がこれを助けているが、誤報のリスクが高い計算コストが高い。
本研究では,外部情報に基づく軽量LLM非依存適応検索手法を提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:58:52 GMT)
Tight Regret Bounds for Bayesian Optimization in One Dimension [47.5] ガウス過程とガウスサンプリングノイズの下で,ベイズ最適化(BO)の問題を一次元で考察する。
我々は、カーネル上のかなり穏やかな技術的仮定の下で、最大$T$は$Omega(sqrtT)$および$O(sqrtTlog T)$として振る舞う。
論文参考訳(メタデータ) (Wed, 07 May 2025 04:10:27 GMT)
KERAIA: An Adaptive and Explainable Framework for Dynamic Knowledge Representation and Reasoning [46.9] KERAIAはシンボリックナレッジエンジニアリングのための新しいフレームワークとソフトウェアプラットフォームである。
動的で複雑でコンテキストに敏感な環境で知識を表現、推論、実行するという永続的な課題に対処する。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:56:05 GMT)
SimpleRL-Zoo: Investigating and Taming Zero Reinforcement Learning for Open Base Models in the Wild [46.3] ロングチェーン・オブ・シント(CoT)推論は、ルールベースの報酬を持つ単純な強化学習フレームワークを通じて自然に現れる。
LLama3-8B,Mistral-7B/24B,DeepSeek-Math-7B,Qwen2.5-math-7B,およびQwen2.5モデル0.5Bから32Bを含む10種類のベースモデルを対象としたゼロRLトレーニングについて検討した。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:57:34 GMT)
Question-Answering Dense Video Events [45.1] DeVE-QA - 10.6Kビデオ上の26Kイベントに関する78Kの質問を含むデータセットを構築する。
改良のために,階層型キャプションモジュール,時間的イベントメモリモジュール,自己整合性チェックモジュールを強調表示する,トレーニング不要なMLLMアプローチであるDeViを提案する。
実験によると、DeViは密集した質問に答え、関連するビデオの瞬間をグラウンド化するのに優れている。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:35:23 GMT)
When Bad Data Leads to Good Models [44.9] 大規模言語モデル(LLM)事前トレーニングでは、データ品質がモデルの品質を決定すると考えられている。
我々は,事前・後共同設計の観点から,「品質」の概念を再検討する。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:17:49 GMT)
SToLa: Self-Adaptive Touch-Language Framework with Tactile Commonsense Reasoning in Open-Ended Scenarios [44.7] 本稿では,マルチモーダル推論のための知的システムに触覚を組み込むことの課題について考察する。
自己言語型タッチランゲージフレームワークであるSToLaを紹介する。
我々は、総合的な触覚コモンセンス推論データセットとベンチマークを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:55:35 GMT)
Beyond Theorem Proving: Formulation, Framework and Benchmark for Formal Problem-Solving [44.6] 決定論的マルコフ決定過程として,問題解決の原理的定式化を提案する。
また,既存のFTP環境を利用してプロセス検証問題解決を行う新しいフレームワークFPSを提案する。
我々は, MATH500ベンチマークのサブセットの形式化であるFormalMath500, MiniF2F-Solving, PutnamBench-Solving, FTPベンチマークのMiniF2FとPutnamBenchの適応の3つのベンチマークを構築した。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:02:14 GMT)
Learning to Compare Hardware Designs for High-Level Synthesis [44.4] 高レベル合成(HLS)は、高レベルコードをハードウェア設計に変換する自動設計プロセスである。
HLSは、ソースコードに挿入されたディレクティブであるプラグマに依存して合成プロセスを導く。
ハードウェア設計を比較して効率的なHLS最適化を行う新しい手法であるComparXploreを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:58:28 GMT)
Batched Bayesian optimization by maximizing the probability of including the optimum [44.4] 純粋に活用する qPO (multipoint of Optimality) による離散最適化のための獲得戦略を提案する。
提案手法を大規模化学ライブラリのモデル誘導探索に適用し,バッチ化ベイズ最適化における他の最先端手法と競合することを示す実証的証拠を提供する。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:27:38 GMT)
Tetrahedron-Net for Medical Image Registration [44.1] 1つのデコーダを追加することで、登録のための表現を強化するためのシンプルで効果的な戦略を導入する。
新しいアーキテクチャは簡潔だが一般化されており、1つのエンコーダと2つのデコーダのみがテトラエドロンの構造を形成する。
本実験は, 医用画像登録の代表的なベンチマークにおいて, 優れた性能が得られることを示すものである。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:00:49 GMT)
Optimization Problem Solving Can Transition to Evolutionary Agentic Workflows [43.9] このポジションペーパーでは、最適化問題の解決は専門家依存から進化的エージェントへ移行できると主張している。
我々は、基礎モデルと進化的探索による進化的エージェントワークフローが、最適化空間を自律的にナビゲートできると主張している。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:07:49 GMT)
Toward Task Generalization via Memory Augmentation in Meta-Reinforcement Learning [43.7] タスクの一般化を改善するためのメモリベースRLアプローチであるメモリ拡張を導入する。
提案手法では,タスク構造化の強化を利用して,最適配布シナリオをシミュレートする。
提案手法は,ロバストな分配性能を維持しながら,未知のタスクに対してゼロショットの一般化を実現することを実証する。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:57:25 GMT)
Implicitly Aligning Humans and Autonomous Agents through Shared Task Abstractions [42.8] HA$2$:階層的アドホックエージェント(hierarchical Ad Hoc Agents)は、階層的強化学習を利用して、人間が協調で使用する構造的アプローチを模倣するフレームワークである。
オーバークッキング環境におけるHA$2$の評価を行い、未確認エージェントと人間の両方と組み合わせた場合、既存のベースラインよりも統計的に有意な改善が見られた。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:19:17 GMT)
Large Language Models Are Struggle to Cope with Unreasonability in Math Problems [42.0] 本研究では,LLMが数学問題において不合理性を認識し,応答する能力を評価するために,新しいベンチマークUnreasonable Math Problem (UMP)を提案する。
GPT-4oのような最先端モデルでさえ、UMPの0.6の限られた性能しか達成していないのに対し、DeepSeek-R1のような推論モデルは、過度に考え、不安定になる傾向にある。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:14:49 GMT)
The Geometry of Time in Topological Quantum Gravity of the Ricci Flow [41.9] 我々は、リッチフロー方程式の族に付随する非相対論的量子重力の研究を継続する。
この位相重力はコホモロジー型であり、$cal N=2$拡張BRST対称性を示す。
我々は、場が$g_ij$, $ni$, $n$であり、(i)$g_ij$の位相的変形と(ii)超局所非相対論的空間の極限からなる理論の標準的な一段階BRSTゲージ固定を実証する。
論文参考訳(メタデータ) (Wed, 07 May 2025 01:58:53 GMT)
Quantum Artificial Intelligence for Software Engineering: the Road Ahead [41.5] 量子AI(QAI)は、古典的なソフトウェア工学の問題を解決する大きな可能性を秘めている。
ソフトウェアエンジニアリングにおけるQAIの初期応用には、ソフトウェアテストの最適化など、すでにいくつか存在する。
本稿では,ソフトウェア工学のQAIにおけるオープンな研究の機会と課題について述べる。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:47:18 GMT)
Generative AI in Transportation Planning: A Survey [41.4] 我々は、交通計画においてGenAIを活用するための最初の包括的枠組みを提示する。
交通計画の観点から, 記述的, 予測的, 生成的, シミュレーション, 説明可能なタスクの自動化におけるGenAIの役割を検討する。
データ不足、説明可能性、バイアス軽減、ドメイン固有の評価フレームワークの開発など、重要な課題に対処する。
論文参考訳(メタデータ) (Wed, 07 May 2025 06:35:15 GMT)
Runtime Advocates: A Persona-Driven Framework for Requirements@Runtime Decision Support [41.0] 緊急対応のために派遣される小型無人航空システム(sUAS)群のような複雑なシステムは、実行時に動的再構成を必要とすることが多い。
これは、進化するニーズが進行中のシステム機能と振る舞いを形作る、ヒューマン・オン・ザ・ループの要件を導入する。
本稿では,倫理的に認知され,安全を重視し,規制に配慮した意思決定支援を実現するための,ランタイム要件エンジニアリングのためのペルソナベースのアドボケートフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:31:38 GMT)
HM-DF SNN: Transcending Conventional Online Learning with Advanced Training and Deployment [39.7] スパイキングニューラルネットワーク(SNN)は、人工知能の将来の発展において大きな可能性を秘めていると考えられている。
現在のオンライン学習フレームワークは、時間依存勾配の不分離問題に対処できない。
本稿では,それぞれ異なるスパイキング計算方式を採用する高度なモデル群であるHM-DF(Hybrid Mechanism-Driven Firing)モデルを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:08:15 GMT)
A Proposal for Evaluating the Operational Risk for ChatBots based on Large Language Models [39.6] 3つの主要なステークホルダーに対する潜在的な脅威を同時に評価する新しいリスク評価指標を提案する。
メトリクスを検証するために、脆弱性テスト用のオープンソースのフレームワークであるGarakを活用しています。
その結果、セキュアで信頼性の高いAI駆動会話システムの運用における多次元リスクアセスメントの重要性が浮き彫りになった。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:26:45 GMT)
Fate: Fast Edge Inference of Mixture-of-Experts Models via Cross-Layer Gate [39.5] MoEモデルはエッジシナリオに適しているが、専門家の予測では困難に直面している。
Fateは、リソース制約のある環境で効率的な推論を可能にするために、MoEモデル用に設計されたオフロードシステムである。
Fateはプリフィル速度で4.5倍と1.9倍のスピードアップ、復号速度で4.1倍と2.2倍のスピードアップを達成する。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:57:21 GMT)
Distillation-Enabled Knowledge Alignment Protocol for Semantic Communication in AI Agent Networks [38.5] 大規模人工知能(AI)エージェントのための蒸留対応知識アライメントプロトコル(DeKAP)を提案する。
DeKAPは、各エージェントの専門知識をパラメータ効率の低い低ランク行列に蒸留し、それらをネットワーク全体に割り当て、エージェントが複数のタスクに対して整合した知識を同時に維持できるようにする。
我々は、大規模な整数線形計画問題として、アライメント損失、通信オーバーヘッド、ストレージコストの結合最小化を定式化する。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:45:02 GMT)
Ming-Lite-Uni: Advancements in Unified Architecture for Natural Multimodal Interaction [38.4] Ming-Lite-Uniは、統一されたビジュアルジェネレータとマルチモーダル自動回帰モデルを備えたオープンソースのフレームワークである。
Ming-Lite-Uniはアルファ段階にあり、間もなく改良される。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:48:36 GMT)
DeMuVGN: Effective Software Defect Prediction Model by Learning Multi-view Software Dependency via Graph Neural Networks [37.9] DeMuVGNは、グラフニューラルネットワークを介してマルチビューソフトウェア依存を学習する欠陥予測モデルである。
データ、呼び出し、開発者の依存関係を統合するマルチビューソフトウェア依存性グラフを導入します。
20バージョンにわたる8つのオープンソースプロジェクトのケーススタディでは、DeMuVGNが大幅に改善されている。
論文参考訳(メタデータ) (Wed, 07 May 2025 05:20:30 GMT)
Stereo Anywhere: Robust Zero-Shot Deep Stereo Matching Even Where Either Stereo or Mono Fail [37.9] 我々はStereo Anywhereを紹介した。これは、幾何学的制約と単眼深度視覚基礎モデル(VFM)の頑健な先行性を組み合わせた新しいステレオマッチングフレームワークである。
合成専用学習モデルでは, ゼロショットの一般化が実現し, 既存の解よりも優れていた。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:31:28 GMT)
InfiniteHBD: Building Datacenter-Scale High-Bandwidth Domain for LLM with Optical Circuit Switching Transceivers [37.9] 光回路スイッチング(OCS)を用いたトランシーバレベルの接続とスイッチングを統一するトランシーバ中心型HBDアーキテクチャを提案する。
各トランシーバにOCSを埋め込むことで、InfiniteHBDは再構成可能なポイント・ツー・マルチポイント接続を実現し、トポロジーを可変サイズのリングに適合させることができる。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:02:44 GMT)
Characterizing and Efficiently Accelerating Multimodal Generation Model Inference [37.7] 本稿では,実システム上でのマルチモーダル生成モデルのファミリーを特徴付けることにより,鍵となるシステム設計と最適化の機会を指摘する。
我々は、アプリケーションからシステムソフトウェア、ハードウェアまで、最先端の最適化レバーが3.88倍のベースラインを設定できることを実証した。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:35:42 GMT)
Correlating noise floor with magic and entanglement in Pauli product states [37.7] パウリの積公式によって生成されるノイズの多い状態から、量子コンピューティングに特有の資源を回収する能力を示す。
純状態の忠実度は、与えられた計算のノイズフロアを表す。
各種の小型回路に対して,古典的影データを収集することにより,これらの知見を実験的に検証した。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:24:00 GMT)
Web2Grasp: Learning Functional Grasps from Web Images of Hand-Object Interactions [37.3] 器用な多指ロボットの手を使って物体を効果的に操るためには,機能的把握が不可欠である。
自然と機能的なオブジェクトの相互作用を描写するため,Web画像から人間の把握情報を抽出する手法を提案する。
安価なWebソースから得られた比較的低品質なHOIデータは、機能的把握モデルを効果的に訓練できることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:13:17 GMT)
Wafer-Scale Characterization of Al/AlxOy/Al Josephson Junctions at Room Temperature [36.1] ジョセフソン接合(JJs)は、低温で動作する多くのデバイスの主要な要素である。
プロセス最適化とJJ製造制御のための時間効率なウェハスケールJJキャラクタリゼーションの開発が不可欠である。
酸化膜厚, トンネル係数, 界面欠陥密度など, ウェハスケール上のJJの有用なパラメータを独立に得られることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:13:00 GMT)
SolPhishHunter: Towards Detecting and Understanding Phishing on Solana [35.8] 我々はSolPhishの3つのタイプを定義し、SolPhishHunterと呼ばれる検出ツールを開発した。
我々はSolPhishの合計8,058例を検出し、これらの検出事例を実証分析した。
検出されたSolPhish取引は、被害者に約11億ドルの損失をもたらした。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:16:58 GMT)
M2Rec: Multi-scale Mamba for Efficient Sequential Recommendation [35.5] Modelは、Fourier分析、大規模言語モデル、適応ゲーティングとマルチスケールのMambaを統合した、新しいシーケンシャルなレコメンデーションフレームワークである。
実験では、モデルは最先端のパフォーマンスを実現し、既存のMambaベースのモデルよりもHit Rate@10を3.2%改善した。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:14:29 GMT)
Enhancing Test Time Adaptation with Few-shot Guidance [35.1] 深層ニューラルネットワークは、トレーニング(ソース)とテスト(ターゲット)データのドメインシフトに直面しながら、大きなパフォーマンス低下に直面することが多い。
TTA(Test Time Adaptation)法は,事前学習したソースモデルを用いて,配信外ストリーミングターゲットデータを処理する手法として提案されている。
本稿では,Few-Shot Test Time Adaptation (FS-TTA) を開発した。
論文参考訳(メタデータ) (Wed, 07 May 2025 05:54:36 GMT)
PrimitiveAnything: Human-Crafted 3D Primitive Assembly Generation with Auto-Regressive Transformer [34.4] 形状原始抽象は人間の視覚認知において重要な役割を担い、コンピュータビジョンやグラフィックに広く応用されている。
プリミティブAnythingは、プリミティブアセンブリ生成タスクとして形状プリミティブ抽象を再構成する新しいフレームワークである。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:59:46 GMT)
End-to-end Surface Optimization for Light Control [34.3] 本稿では,光学面メッシュのエンドツーエンド最適化手法を提案する。
我々の定式化は、得られた光の分布と対象の分布との差によって引き起こされる。
また, 設計面のCNC加工および研磨を容易にするため, 加工条件に関する幾何学的制約を課す。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:40:48 GMT)
Miipher-2: A Universal Speech Restoration Model for Million-Hour Scale Data Restoration [34.2] 学習データクリーニングは生成モデルに基づく音声復元(SR)の新しい応用である
本稿では,100万時間規模のデータを対象としたSRモデルであるMiipher-2を紹介し,大規模言語モデルのような大規模生成モデルのデータクリーニングを訓練する。
Miipher-2は、300以上の言語をサポートする凍結訓練されたUniversal Speech Model (USM) を、堅牢で条件のない特徴抽出器として使用している。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:27:46 GMT)
Benchmarking LLM Faithfulness in RAG with Evolving Leaderboards [34.1] 本稿では,要約課題に焦点をあてて幻覚を測定するための取り組みについて述べる。
Hughes Hallucination Evaluation Model(HHEM)に基づくVectaraの既存のLLM幻覚リーダーボードについて論じる。
これらの制約に対処するため,少人数のヒト幻覚アノテーションでガイドされたLPM-as-a-judgeアプローチであるFaithJudgeを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 22:50:33 GMT)
OmniGIRL: A Multilingual and Multimodal Benchmark for GitHub Issue Resolution [34.1] GitHubのイシュー解決タスクは、リポジトリで報告された問題を自動的に解決することを目的としている。
大規模言語モデル(LLM)の進歩に伴い,この課題が注目されている。
我々は、多言語、マルチモーダル、マルチドメインのGitHub Issue ResoLutionベンチマークであるOmniGIRLを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:51:10 GMT)
Deep Learning for Sea Surface Temperature Reconstruction under Cloud Occlusion [34.0] まず,MODIS Aqua 夜間 L3 画像から雲に覆われた領域を埋める機械学習モデルについて述べる。
この課題に対処するために,衛星画像の雲に覆われた部分を再構成するために,畳み込みニューラルネットワークモデル(U-net)を用いた。
我々の最も優れたアーキテクチャは、確立されたギャップ充足法よりも50%低いルート平均二乗誤差を示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:20:33 GMT)
Occupancy World Model for Robots [33.9] 本稿では,シーンの進化を予測するための時間的受容場と自己回帰変換器を併用した占有型世界モデルを提案する。
実験結果から,ロボオックワールドは室内における3次元占有シーンの進化予測タスクにおいて,最先端の手法よりも優れていたことが判明した。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:54:03 GMT)
Score Distillation Sampling for Audio: Source Separation, Synthesis, and Beyond [33.3] 本稿では,テキスト条件付き音声拡散モデルに対するスコア蒸留サンプリング(SDS)の一般化であるAudio-SDSを紹介する。
本研究では,Audio-SDSが物理的に情報を得た衝撃音のシミュレーション,FM合成パラメータの校正,即時特定音源分離を行う方法を示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:59:38 GMT)
Perceive-IR: Learning to Perceive Degradation Better for All-in-One Image Restoration [33.2] Perceive-IRは、きめ細かい品質管理のための新しいバックボーン非依存のオールインワン画像復元フレームワークである。
モジュール構造により、コアコンポーネントは特定のバックボーンとは独立して機能し、高度な復元モデルへのシームレスな統合を可能にする。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:54:10 GMT)
Post-selection free time-bin entanglement on a thin-film lithium niobate photonic chip [31.9] タイムビン絡みは、ファイバネットワーク上の量子通信プロトコルにおいて最もよく使われる絡み合いである。
しかしながら、時間ビン符号化におけるいくつかのベースでの投影的測定は、測定されたイベントの選択後において必要となる。
高速光スイッチを含む時間ビンエンタングルメント認証のためのチップ集積受信機を実演する。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:39:03 GMT)
mWhisper-Flamingo for Multilingual Audio-Visual Noise-Robust Speech Recognition [31.8] マルチリンガル音声認識のためのmWhisper-Flamingoを提案する。
事前訓練されたオーディオモデル(Whisper)とビデオモデル(AV-HuBERT)の長所を組み合わせる。
オーディオヴィジュアルのmWhisper-Flamingoは、ノイズの多い条件下で、すべての言語でオーディオのみのWhisperを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:06:56 GMT)
In-Context Adaptation to Concept Drift for Learned Database Operations [31.5] FLAIRは、学習したデータベース操作のためのテキストテキスト適応と呼ばれるパラダイムである。
ランタイムパラメータの最適化の必要性を排除し、現在のコンセプトに沿った予測を提供する。
最大で5.2倍高速な適応を実現し、濃度推定の誤差を22.5%削減する。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:36:59 GMT)
VividListener: Expressive and Controllable Listener Dynamics Modeling for Multi-Modal Responsive Interaction [31.3] 提案するVividListenerは,細粒度,表現性,制御性を備えたリスナの動的モデリングを実現する新しいフレームワークである。
VividListenerは最先端のパフォーマンスを実現し、表現力と制御性のあるリスナのダイナミクスを実現する。
論文参考訳(メタデータ) (Wed, 07 May 2025 02:35:50 GMT)
Histo-Miner: Deep Learning based Tissue Features Extraction Pipeline from H&E Whole Slide Images of Cutaneous Squamous Cell Carcinoma [31.3] Histo-Minerは、皮膚組織のWSI(Whole-Slide Images)を分析するためのディープラーニングパイプラインである。
皮膚扁平上皮癌(c SCC)患者の検体分析のためのパイプラインを開発した。
Histo-Minerは、核のセグメンテーションと分類、および腫瘍領域セグメンテーションに畳み込みニューラルネットワークとビジョントランスフォーマーを使用している。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:34:03 GMT)
LoTUS: Large-Scale Machine Unlearning with a Taste of Uncertainty [31.0] 我々は,事前学習モデルからトレーニングサンプルの影響を排除した,新しいMachine Unlearning(MU)手法であるLoTUSを提案する。
LoTUSは、データの記憶から生じる過信を緩和し、情報理論境界までモデルの予測確率を円滑にする。
我々は、TransformerとResNet18モデルのLoTUSを、5つの公開データセットにまたがる8つのベースラインに対して評価する。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:34:38 GMT)
Osiris: A Lightweight Open-Source Hallucination Detection System [30.6] 幻覚は、RAGシステムが本番環境に配備されるのを防ぐ。
幻覚を誘発したマルチホップQAデータセットを提案する。
RAGTruth 幻覚検出ベンチマークにおいて, GPT-4o よりも 7B モデルの方が良好なリコールを実現している。
論文参考訳(メタデータ) (Wed, 07 May 2025 22:45:59 GMT)
UniCO: Towards a Unified Model for Combinatorial Optimization Problems [30.5] Combinatorial Optimization (CO)は多くの現実世界のシナリオで発生する幅広い問題を含んでいる。
我々は,様々なCO問題を解決する統一モデルであるUniCOを紹介する。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:39:33 GMT)
Recursively Summarizing Enables Long-Term Dialogue Memory in Large Language Models [30.5] 長い会話をすると、大きな言語モデル(LLM)は過去の情報を思い出さず、一貫性のない応答を生成する傾向がある。
本稿では,長期記憶能力を高めるために,大規模言語モデル(LLM)を用いて要約/メモリを生成することを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:31:08 GMT)
SEVA: Leveraging Single-Step Ensemble of Vicinal Augmentations for Test-Time Adaptation [29.4] テスト時間適応(TTA)は、推論中の迅速なモデル適応を通じて、分散シフトに対するモデルロバスト性を高めることを目的としている。
拡張戦略は、信頼性のあるサンプルの可能性を効果的に解き放つことができるが、急速に増大する計算コストは、彼らのリアルタイムアプリケーションを妨げる。
本稿では, 計算負担を増大させることなく, データの増大を生かして, 新たなTTAアプローチであるSingle-step Ensemble of Vicinal Augmentations(SEVA)を提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 02:58:37 GMT)
Benchmarking Multimodal Mathematical Reasoning with Explicit Visual Dependency [29.3] 視覚的依存を明示するマルチモーダル数学的推論のためのベンチマークであるVCBENCHを紹介する。
VCBENCHには6つの認知領域に1,720の問題がある。
我々は、VCBENCH上で26の最先端LVLMを評価し、高い性能差を示し、トップモデルでさえ50%以上の精度を達成できなかった。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:09:09 GMT)
Enhancing Target-unspecific Tasks through a Features Matrix [28.8] 本研究では,ターゲット非固有タスクにおける視覚言語モデルの拡張を目的とした,新しい特徴行列(FM)正規化手法を提案する。
我々の手法は、特徴行列(FM)を形作る一般的な知識を抽出し、活用する。
具体的には、FMは、多種多様な入力のセマンティクスを深く、きめ細かな視点から捉え、本質的な一般的な知識を保ち、過度に適合するリスクを軽減している。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:43:41 GMT)
Antidote: A Unified Framework for Mitigating LVLM Hallucinations in Counterfactual Presupposition and Object Perception [28.4] 反実的前提問題(CPQ)の解決におけるLVLMの脆弱性について論じる。
両種類の幻覚を緩和するための統合的・総合的なデータ駆動後学習フレームワークであるAntidoteを紹介した。
我々は,LVLMがCPQを正しく処理し,実応答を生成する能力を評価するための新しいベンチマーク「CP-Bench」を構築した。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:03:08 GMT)
WDMamba: When Wavelet Degradation Prior Meets Vision Mamba for Image Dehazing [28.2] 画像デハージングタスクを2段階に分解する新しいデハージングフレームワークWDMambaを提案する。
低周波回復段階において,我々はマンバブロックを統合し,大域構造を線形複雑に再構築し,全体ヘイズを効率的に除去する。
詳細化の段階では、前段階で見落とされたかもしれないきめ細かい情報を再保存し、最終的なデハズド出力に終止符を打つ。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:37:01 GMT)
Token Coordinated Prompt Attention is Needed for Visual Prompting [28.0] 本稿では,Token Coordinated Prompt Attention (TCPA)モジュールを提案する。
我々はこれらのプロンプトをCLS PromptsとImage Promptsに切り離し、注意機構を通じてCLSトークンや画像トークンとのみ対話する。
異なる画像トークンは異なる画像パッチに対応し、多様な情報を含むので、一致したプロンプトを個別のトークンに自動的に割り当てる。
論文参考訳(メタデータ) (Wed, 07 May 2025 02:17:30 GMT)
OpenVision: A Fully-Open, Cost-Effective Family of Advanced Vision Encoders for Multimodal Learning [27.8] OpenVisionは、LLaVAのようなマルチモーダルフレームワークに統合された場合、OpenAIのCLIPのパフォーマンスにマッチまたは上回るビジョンエンコーダのファミリーである。
5.9Mから632.1Mパラメータにまたがるビジョンエンコーダをリリースすることにより、OpenVisionは、マルチモーダルモデルを構築する際のキャパシティと効率の間の柔軟なトレードオフを提供する。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:48:35 GMT)
Advances in Automated Fetal Brain MRI Segmentation and Biometry: Insights from the FeTA 2024 Challenge [27.0] FeTA Challenge 2024は胎児脳MRI解析を進歩させた。
組織セグメンテーションと並行して新しい課題としてバイオメトリ予測を導入した。
今回は、新しいローフィールド(0.55T)MRIデータセットからのデータを含む、多様なマルチ中心テストセットを初めて紹介しました。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:58:32 GMT)
FastMap: Revisiting Dense and Scalable Structure from Motion [26.9] 我々は,高速さと簡易さに焦点をあてた動き法から,新たなグローバルな構造であるFastMapを提案する。
COLMAPやGLOMAPといった従来の手法は、一致したキーポイントペアの数が大きくなるとスケーラビリティが低下する。
我々は,FastMapが大規模シーンにおけるCOLMAPやGLOMAPよりも1~2桁高速で,ポーズ精度が同等であることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:56:15 GMT)
R^3-VQA: "Read the Room" by Video Social Reasoning [26.7] 「部屋を読む」は人間の日常生活において重要な社会的推論能力である。
我々は、R3-VQAという、価値があり、高品質で包括的なビデオデータセットに貢献する。
論文参考訳(メタデータ) (Wed, 07 May 2025 05:55:45 GMT)
Quantum Circuits for the Black-Scholes equations via Schrödingerisation [26.6] ブラック・スコールズ方程式の量子回路を構築する。
我々は、我々のアプローチの量子的利点を強調するために、徹底的な複雑性分析を行う。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:21:12 GMT)
S3D: Sketch-Driven 3D Model Generation [26.6] S3Dは単純な手描きスケッチを詳細な3Dモデルに変換するフレームワークである。
提案手法では,U-Netベースのエンコーダデコーダアーキテクチャを用いてスケッチを顔分割マスクに変換する。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:34:37 GMT)
Conformal Prediction with Corrupted Labels: Uncertain Imputation and Robust Re-weighting [25.9] 本稿では,ラベル付きトレーニングデータが破損した状況において,ロバストな不確実性定量化のためのフレームワークを提案する。
我々は予測セットを生成する統計ツールである共形予測に基づいて構築する。
重み推定に依存しない新しい共形法である不確実な計算を導入する。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:46:02 GMT)
Reward-SQL: Boosting Text-to-SQL via Stepwise Reasoning and Process-Supervised Rewards [25.8] 外部プロセス・リワード・モデル(PRM)は、詳細な推論の監督を提供するために訓練中に導入することができる。
本稿では,テキスト・ツー・CTEに基づく推論プロセスにPRMを効果的に組み込む方法について検討するフレームワークであるRewardを提案する。
本研究は,テキスト・ツー・CTEに基づく推論におけるReward-based supervisionの有効性を示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:32:22 GMT)
Generative Detail Enhancement for Physically Based Materials [25.6] 本稿では,市販拡散モデルと逆レンダリングを用いて,物理材料の詳細性を高めるツールを提案する。
我々のゴールは、装い、老朽化、風化などの兆候を加えることで、しばしば著者にとって面倒な細部で素材の視覚的忠実度を高めることである。
論文参考訳(メタデータ) (Wed, 07 May 2025 04:33:26 GMT)
Reward-free World Models for Online Imitation Learning [25.3] 本研究では,報酬のない世界モデルを活用したオンライン模倣学習手法を提案する。
提案手法は, 復元を伴わない潜在空間における環境力学を学習し, 効率的かつ高精度なモデリングを可能にする。
DMControl,myoSuite, ManiSkill2 など,様々なベンチマークを用いて本手法の評価を行い,既存手法と比較して優れた実証性能を示した。
論文参考訳(メタデータ) (Wed, 07 May 2025 04:20:43 GMT)
FAST: Federated Active Learning with Foundation Models for Communication-efficient Sampling and Training [25.0] Federated Active Learning (FAL)は、分散クライアント間で大量のラベル付けされていないデータを活用するための、有望なフレームワークとして登場した。
本稿では,アノテータの最小限の労力で,ループ学習におけるコミュニケーションコストを削減するためのベストプラクティスについて述べる。
予備パスで弱ラベル付けのための基礎モデルを利用する2パスFALフレームワークであるFASTと、最も不確実なサンプルにのみ焦点を絞った改良パスを紹介する。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:09:56 GMT)
Steerable Scene Generation with Post Training and Inference-Time Search [24.9] シミュレーションのトレーニングロボットは、下流タスクの特定の課題を反映した多様な3Dシーンを必要とする。
ロボット操作のための現実的な環境を近似した手続きモデルを用いて大規模シーンデータを生成する。
5つの異なる環境にまたがる4400万のSE(3)シーンのデータセットをリリースします。
論文参考訳(メタデータ) (Wed, 07 May 2025 22:07:42 GMT)
TS-Diff: Two-Stage Diffusion Model for Low-Light RAW Image Enhancement [24.8] 本稿では,超低照度RAW画像の高精細化を目的とした2段階拡散モデル(TS-Diff)を提案する。
事前学習段階では、TS-Diffはノイズ空間に基づいて複数の仮想カメラを構築し、ノイズの多い画像を合成する。
CFIモジュールは、様々な仮想カメラで一般化可能な機能を学習できるように設計されている。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:35:05 GMT)
Lay-Your-Scene: Natural Scene Layout Generation with Diffusion Transformers [24.4] 自然シーンのための新しいテキスト・ツー・ジェネレーションパイプラインであるLay-Your-Scene(LayouSyn)について紹介する。
本稿では,テキストプロンプトからシーン要素を得るための軽量なオープンソース言語モデルと,条件付きレイアウト生成のためのオープン語彙で訓練されたアスペクト対応拡散トランスフォーマアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:07:57 GMT)
Is What You Ask For What You Get? Investigating Concept Associations in Text-to-Image Models [24.0] テキスト・ツー・イメージ(T2I)モデルは、現実のアプリケーションでますます使われている。
望ましいタスクに適したイメージを生成するために、これらのモデルを監査する必要性が高まっている。
視覚言語モデルの条件分布を特徴付けるフレームワークであるConcept2Conceptを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:42:51 GMT)
LONGER: Scaling Up Long Sequence Modeling in Industrial Recommenders [23.7] GPU効率の良いリコメンダのための長時間最適化されたtraNsformer。
オフラインのメトリクスとオンラインのA/Bテストでは、一貫して強力なベースラインを上回ります。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:54:26 GMT)
Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities [23.7] 今後の研究を導くための総合的な調査を行う。
既存の統一モデルについてレビューし、これらを3つの主要なアーキテクチャパラダイムに分類する。
トークン化戦略,クロスモーダルアテンション,データなど,この新興分野に直面する重要な課題について論じる。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:27:21 GMT)
Playing repeated games with Large Language Models [23.6] LLMは、人間や他のエージェントと相互作用するアプリケーションでますます使われている。
私たちは異なるLLMに、人間のような戦略と実際の人間プレイヤーで、繰り返し2時間2ドルをプレイさせました。
以上の結果から, LLMは, 反復した囚人のジレンマ家族のような, 利己的なゲームで特に優れていたことが示唆された。
しかし、セクシーズの戦いのような調整を必要とするゲームでは準最適に振る舞う。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:44:45 GMT)
A New Scope and Domain Measure Comparison Method for Global Convergence Analysis in Evolutionary Computation [23.4] 我々は,ECアルゴリズムのグローバル収束を解析するための新しいスコープと領域測度比較法(SDMC)を提案する。
従来の手法とは異なり、SDMC法は単純であり、マルコフ連鎖モデリングをバイパスし、誤適用によるエラーを最小限にする。
SDMCを従来の手法には適さない2種類のアルゴリズムに適用し,グローバル収束解析におけるその有効性を確認した。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:04:18 GMT)
Retrieval Augmented Time Series Forecasting [23.0] 時系列予測は、過去のデータを使って将来のトレンドを予測する。
RAFT(Research-augmented Time Series forecasting method)を提案する。
RAFTは平均勝利率86%で同時代のベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 07 May 2025 06:26:11 GMT)
Training-Free Sketch-Guided Diffusion with Latent Optimization [22.9] 本稿では,既存のテキスト・画像生成モデルを拡張してスケッチを付加条件として組み込む,革新的なトレーニングフリーパイプラインを提案する。
入力スケッチによく似たレイアウトと構造を持つ新しい画像を生成するために,これらのスケッチの中核となる特徴を拡散モデルのクロスアテンションマップを用いて追跡できることを見出した。
本稿では, 生成過程の中間段階において, 雑音に富んだ遅延を洗練させる手法である潜時最適化を導入する。
論文参考訳(メタデータ) (Wed, 07 May 2025 06:28:51 GMT)
Towards Robust Incremental Learning under Ambiguous Supervision [22.9] インクリメンタル部分ラベル学習(IPLL)という,弱教師付き学習パラダイムを提案する。
IPLLは、新しいクラスが時々出現する、シーケンシャルな完全教師付き学習問題に対処することを目的としている。
我々は,代表性と多様性を維持しつつ,明瞭なサンプルを収集するメモリ再生技術を開発した。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:28:17 GMT)
Recite, Reconstruct, Recollect: Memorization in LMs as a Multifaceted Phenomenon [22.3] 我々は記憶を分類学に分解する:高度に複製された配列のリサイクリング、本質的に予測可能なシーケンスの再構築、そしてどちらもないシーケンスのリコール。
依存関係を解析し, 予測モデルの重みを検査することにより, 異なる要因が, 分類学的カテゴリーによって異なる記憶可能性に影響を与えることがわかった。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:36:12 GMT)
DeCLIP: Decoupled Learning for Open-Vocabulary Dense Perception [21.9] DeCLIPはCLIPをコンテンツとコンテキストの機能で強化する新しいフレームワークである。
複数の開語彙密接な予測タスクで既存の手法を著しく上回っている。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:46:34 GMT)
HDiffTG: A Lightweight Hybrid Diffusion-Transformer-GCN Architecture for 3D Human Pose Estimation [21.8] HDiffTGは、Transformer、Graph Convolutional Network(GCN)、拡散モデルを統一されたフレームワークに統合する、新しい3Dヒューマンポース(3DHCN)メソッドである。
軽量な設計を維持しながら,HDiffTGはポーズ推定精度とロバスト性を大幅に向上することを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:26:37 GMT)
Emergence of Abstract Rules in Recurrent Spiking Neural Networks [21.3] 本稿では,アストロサイトシグナルにインスパイアされた階層的に変調された繰り返しスパイクニューラルネットワーク(HM-RSNN)を提案する。
このモデルは、2段階の神経調節機構を介して、世界規模で微細管内神経特性を構成し、局所的に構成する。
HM-RSNNは, ネットワークレベルとニューロンレベルの両方において, 規則を伴う組織原則を明確化して, 抽象的な規則の出現を成功させることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:33:34 GMT)
SmallPlan: Leverage Small Language Models for Sequential Path Planning with Simulation-Powered, LLM-Guided Distillation [20.7] SmallPlanは、教師モデルとしてLarge Language Modelsを活用して、ハイレベルパス計画タスクのために軽量なSLM(Small Language Models)をトレーニングする新しいフレームワークである。
SLMは、シミュレーション駆動のインターリーブ方式で、LLM指導による微調整と強化学習によって訓練される。
本研究は, GPT-4oのような大型モデルと連続経路計画において, 幻覚や過剰適合に悩まされることなく, 微調整SLMが競合することを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 02:00:27 GMT)
A Tutorial on Discriminative Clustering and Mutual Information [20.6] 本稿では,識別的クラスタリング手法の進化に関する歴史的考察を紹介する。
我々は、相互情報が、(深い)識別的クラスタリング手法の進歩の歴史的基盤となっている点を強調した。
また, 相互情報の制限や, 差別的クラスタリング手法の回避方法についても述べる。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:54:36 GMT)
JEN-1: Text-Guided Universal Music Generation with Omnidirectional Diffusion Models [20.4] 本稿では,テキスト・ツー・ミュージック・ジェネレーションのための汎用高忠実度モデルであるJEN-1を紹介する。
JEN-1は自己回帰トレーニングと非自己回帰トレーニングの両方を取り入れた拡散モデルである。
テキストによる学習を通じて、JEN-1はテキスト誘導音楽生成、音楽のインペインティング、継続といった様々な世代タスクを実行する。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:09:38 GMT)
Enhancing Virtual Try-On with Synthetic Pairs and Error-Aware Noise Scheduling [20.1] 本研究では,着物の単一画像から(人間,合成衣服)対を生成する衣服抽出モデルを提案する。
また,局所的な生成誤りを外科的にターゲットとした誤り認識型Schr"odinger Bridge(EARSB)を提案する。
ユーザスタディでは,平均59%のケースで,このモデルが好まれる。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:55:43 GMT)
Information-Theoretic Generalization Bounds for Deep Neural Networks [20.0] ディープニューラルネットワーク(DNN)は、実用的な応用において、非常に優れた一般化能力を示す。
本研究の目的は,情報理論の一般化境界による教師あり学習における深度の影響とメリットを捉えることである。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:19:27 GMT)
TrajEvo: Designing Trajectory Prediction Heuristics via LLM-driven Evolution [19.6] 軌道予測は人間の行動のモデル化において重要な課題である。
本稿では,大規模言語モデル(LLM)を利用して軌道予測を自動的に設計するフレームワークであるTrajEvoを紹介する。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:51:43 GMT)
Enhancing User Interest based on Stream Clustering and Memory Networks in Large-Scale Recommender Systems [19.3] ユーザ関心向上(UIE)と呼ばれる革新的なソリューションを提案する。
UIEは、ユーザプロファイルやユーザ履歴の動作シーケンスを含む、ユーザの関心を高める。
エンドツーエンドのソリューションとして、UIEは既存のランキングモデルに簡単に実装できます。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:43:43 GMT)
MedSyn: Enhancing Diagnostics with Human-AI Collaboration [19.2] 大言語モデル(LLM)は、臨床意思決定を支援するためのツールとして有望であることを示している。
我々は、医師とLLMが多段階の対話を行い、診断と治療の決定を洗練するためのハイブリッドなヒューマンAIフレームワーク、MedSynを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:37:18 GMT)
DiffPattern-Flex: Efficient Layout Pattern Generation via Discrete Diffusion [19.0] 本稿では,信頼性の高いレイアウトパターンを効率的に生成するための新しい手法であるToolDiffPattern-Flexを提案する。
toolDiffPattern-Flexには、離散拡散モデルを使用して多様なトポロジを生成する新しい方法が組み込まれている。
高速サンプリングおよび効率的な法定化技術を用いて生成プロセスの高速化を行う。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:04:11 GMT)
Prediction via Shapley Value Regression [18.7] ViaSHAPと呼ばれる新しい手法が提案され、Shapley値を計算する関数が学習される。
大規模な実証調査の結果を報告する。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:51:17 GMT)
TranSplat: Lighting-Consistent Cross-Scene Object Transfer with 3D Gaussian Splatting [18.5] TranSplatはリアルなクロスシーンオブジェクト転送を可能にする3Dシーンレンダリングアルゴリズムである。
提案手法は,(1)ソースシーンからの正確な3次元オブジェクト抽出,(2)ターゲットシーンにおける移動物体の忠実なリライティングという2つの重要な課題に対処する。
論文参考訳(メタデータ) (Wed, 07 May 2025 06:06:33 GMT)
Text2CT: Towards 3D CT Volume Generation from Free-text Descriptions Using Diffusion Model [17.8] テキスト記述から3次元CTボリュームを合成するための新しいアプローチであるText2CTを紹介する。
提案フレームワークは,医用テキストを潜在表現にエンコードし,高分解能な3次元CTスキャンにデコードする。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:53:56 GMT)
ExpShield: Safeguarding Web Text from Unauthorized Crawling and Language Modeling Exploitation [17.7] そこで本研究では,非知覚的テキスト摂動によるサンプル固有の記憶を緩和する,能動的自己防衛機構であるExpShiledを提案する。
当社のアプローチでは、オリジナルの可読性を維持しながら外部とのコラボレーションは必要ありません。
プライバシーのバックドアがあっても、MIA(Community Inference Attack)のAUCは0.95から0.55に低下し、インスタンスエクスプロイトは0に近づいた。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:48:31 GMT)
"I Can See Forever!": Evaluating Real-time VideoLLMs for Assisting Individuals with Visual Impairments [17.7] 視覚障害者は現在、大規模に活動しており、日々の活動は彼らにとって重大な課題となっている。
多くの研究は、視覚障害者を支援するために、大きな言語と視覚言語モデルを用いており、静的コンテンツに重点を置いており、リアルタイムの認識のニーズを満たすことができない。
より効果的な知的支援を提供するためには、高度な視覚理解技術を組み込むことが不可欠である。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:03:16 GMT)
Natural Language Generation in Healthcare: A Review of Methods and Applications [17.6] 自然言語生成(NLG)は、生成人工知能(AI)を実現するための鍵となる技術である
大規模言語モデル(LLM)のブレークスルーにより、NLGは様々な医学的応用で広く利用されている。
論文参考訳(メタデータ) (Wed, 07 May 2025 02:25:29 GMT)
ALFEE: Adaptive Large Foundation Model for EEG Representation [17.2] 本稿では,脳波信号表現(ALFEE)フレームワークのための適応大基礎モデルを提案する。
ALFEEは、堅牢な脳波表現学習のための2つの学習段階を持つ、新しいハイブリッドトランスフォーマーアーキテクチャである。
25,000時間の事前トレーニングの後、6つの下流脳波タスクに関する広範な実験結果が、既存のモデルよりもALFEEの方が優れた性能を示している。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:32:31 GMT)
Data Therapist: Eliciting Domain Knowledge from Subject Matter Experts Using Large Language Models [17.0] 我々は、ドメインの専門家が混在開始プロセスを通じて暗黙の知識を外部化するのに役立つWebベースのツールであるData Therapistを紹介します。
得られた構造化知識ベースは、人間と自動化された可視化設計の両方に通知することができる。
論文参考訳(メタデータ) (Wed, 07 May 2025 23:28:33 GMT)
A Survey on Temporal Interaction Graph Representation Learning: Progress, Challenges, and Opportunities [17.0] 近年,時間的相互作用グラフ表現学習 (TIGRL) が注目されている。
TIGRLは、TIGのノードを低次元表現に埋め込み、構造情報と時間情報の両方を効果的に保存することを目的としている。
本稿では,最新のTIGRL手法を包括的に分類し,学習過程において活用される情報の種類に基づいて分類する手法を提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:31:10 GMT)
How to Train Your Metamorphic Deep Neural Network [16.7] ニューラル・メタモルファス(NeuMeta)は、様々な幅と深さのニューラルネットワークを生成するための最近のパラダイムである。
我々は,NeuMetaの能力を拡張したトレーニングアルゴリズムを提案し,精度の低下を最小限に抑えたフルネットワーク・メタモルフォーシスを実現する。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:01:06 GMT)
Enhanced Photovoltaic Power Forecasting: An iTransformer and LSTM-Based Model Integrating Temporal and Covariate Interactions [16.7] 既存のモデルは、しばしばターゲット変数と共変量の間の複雑な関係を捉えるのに苦労する。
対象変数からの特徴抽出にiTransformerを利用する新しいモデルアーキテクチャを提案する。
クロスアテンション機構は両方のモデルの出力を融合するために統合され、続いてコルモゴロフ・アルノルドネットワークマッピングが続く。
その結果, PV発電の季節変動を効果的に把握し, 予測精度を向上することが示唆された。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:16:09 GMT)
DATA: Multi-Disentanglement based Contrastive Learning for Open-World Semi-Supervised Deepfake Attribution [16.5] Deepfake Attributionは、異なる顔操作技術で複数の分類を行うことを目的としている。
従来のメソッドはメソッド固有のヒントにのみ焦点を合わせており、それが簡単にオーバーフィッティングに繋がる。
本稿では,マルチディペントアングルメントをベースとしたconTrastive leArningフレームワークであるSemandを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:05:32 GMT)
Hard-Negative Sampling for Contrastive Learning: Optimal Representation Geometry and Neural- vs Dimensional-Collapse [16.4] ニューラル・コラプス(NC)を示す表現によって、SCL(Servised Contrastive Learning)、Hard-SCL(HSCL)、Unsupervised Contrastive Learning(UCL)の損失が最小化されることを実証する。
また、任意の表現写像に対して、HSCLとHard-UCL(HUCL)の損失は対応するSCLとUCLの損失によって低く抑えられていることを証明した。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:12:02 GMT)
Learning Survival Distributions with the Asymmetric Laplace Distribution [16.4] 非対称ラプラス分布(ALD)に基づくパラメトリックサバイバル解析法を提案する。
この分布は、平均、中央値、モード、変動、量子化といった一般的なイベントサマリーの閉形式計算を可能にする。
提案手法は, 精度, 識別, 校正の点でパラメトリックおよび非パラメトリックアプローチより優れていることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:59:57 GMT)
Convex Relaxation for Robust Vanishing Point Estimation in Manhattan World [16.4] 本稿では,各イテレーションにおいて,各VPとその関連行を独立して検索する,大域的に最適なアウトリー・ロバスト反復解法(textbfGlobustVP)を提案する。
合成データと実世界のデータの両方の実験により、 textbfGlobustVP は効率、堅牢性、大域的最適性の間の好適なバランスを達成できることが示された。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:30:08 GMT)
CAD-Llama: Leveraging Large Language Models for Computer-Aided Design Parametric 3D Model Generation [16.2] 本研究では,Large Language Models (LLMs) を用いたCADモデルにおけるパラメトリックシーケンスの生成について検討する。
CAD-Llamaは,パラメトリックな3次元CADモデルを生成するための事前学習LLMの強化を目的としたフレームワークである。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:52:02 GMT)
Dual Conic Proxy for Semidefinite Relaxation of AC Optimal Power Flow [16.0] 本稿では,半定値緩和ACOPF問題に対する二重円錐プロキシアーキテクチャを提案する。
提案手法は, 双対SDP問題の構造を生かした, 微分可能な双対ニューラルネットワーク戦略を組み合わせたものである。
その結果、提案したSDPベースのプロキシは、より弱い円錐緩和より優れることが示された。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:05:16 GMT)
AS3D: 2D-Assisted Cross-Modal Understanding with Semantic-Spatial Scene Graphs for 3D Visual Grounding [15.9] 3Dビジュアルグラウンドティングは、自然言語で記述されたユニークなターゲットを3Dシーンでローカライズすることを目的としている。
本稿では,関係認識のためのオブジェクト識別を伴う意味空間のシーングラフを構築する2次元視覚的グラウンドティングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 02:02:15 GMT)
Quantum Classifiers with Trainable Kernel [15.9] 我々は、特徴状態の範囲を広げるために、普遍的に訓練可能な量子特徴マッピングレイアウトを考案する。
また、部分的に重み付けされた試行状態を利用する改良型量子支援ベクトルマシンを提案する。
本稿では,1対1と1対1のアプローチのための量子反復型マルチクラス化フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:38:50 GMT)
Observing structural disorder induced interacting topological phase in an atom array [15.9] 物質のトポロジー相は、バンドトポロジーのような非相互作用系やスピンモデルのような相互作用系に現れる。
半充填原子配列における障害誘発多体相互作用トポロジカル位相の直接観察を行った。
我々の実験は、Rydberg原子配列における構造障害と強く相互作用するトポロジカル物質との相互作用を研究するための新しい方向を開く。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:20:17 GMT)
IIKL: Isometric Immersion Kernel Learning with Riemannian Manifold for Geometric Preservation [15.8] これまでの研究は、非ユークリッドデータを表現学習中にユークリッド空間にマッピングしていた。
本稿では,Isometric Immersion Kernel Learning (IIKL)法を提案する。
本手法は,最先端手法と比較して内積不変損失を90%以上削減できることを示した。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:08:33 GMT)
StereoINR: Cross-View Geometry Consistent Stereo Super Resolution with Implicit Neural Representation [15.2] ステレオ・イメージ・スーパーレゾリューション(SSR)はステレオ・イメージ・ペアからの情報を活用することで高解像度の細部を強化することを目的としている。
従来のアップサンプリング手法では、コンボリューションを使用して異なるビューの深い特徴を独立に処理し、クロスビューや非ローカルな情報知覚を欠いている。
本稿ではステレオ画像対を連続的な暗黙的表現として革新的にモデル化するステレオインプリシットニューラル表現(StereoINR)を提案する。
この連続表現はスケールの制限を突破し、任意のスケールのステレオ超解像再構成のための統一的なソリューションを提供する。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:30:45 GMT)
Safeguard-by-Development: A Privacy-Enhanced Development Paradigm for Multi-Agent Collaboration Systems [15.2] 多エージェント協調システム(MACS)は,各エージェントの特殊化とエージェント間のコミュニケーションを活用することで,複雑な問題を効率的に解決する。
エージェント間の情報交換と外部環境との相互作用は、機密データ漏洩の重大なリスクをもたらす。
既存のMACSはプライバシコントロールを有効にすることができず、機密情報を安全に管理することは困難である。
私たちは、広く採用されているオープンソースマルチエージェント開発フレームワークであるAutoGenの不可欠な部分として、Marisを実装しています。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:54:43 GMT)
Complexity Lower Bounds of Adaptive Gradient Algorithms for Non-convex Stochastic Optimization under Relaxed Smoothness [15.0] 最近の非定常最適化の結果は、一般的な適応アルゴリズムの収束を示している。
収束の複雑さは、滑らかさ定数のような問題パラメータの点で高次である。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:40:12 GMT)
Revolutionizing Newcomers' Onboarding Process in OSS Communities: The Future AI Mentor [15.0] 新規参入者はオープンソースソフトウェア(OSS)プロジェクトの持続可能性に不可欠である。
障壁を低くし、エンゲージメントを高めるため、OSSプロジェクトには、新参者のためのガイダンスを提供する専門家が専任している。
ソフトウェアエンジニアリングにおけるAIの急速な進歩は、専門家のメンタリングの代わりにAIを活用する機会をもたらした。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:27:41 GMT)
Learning Real Facial Concepts for Independent Deepfake Detection [14.9] ディープフェイク検出モデルは、しばしば目に見えないデータセットへの一般化に苦労する。
本稿では,現実の顔の包括的概念を学習し,一般化を促進する新しいアプローチを提案する。
RealIDは最先端の手法よりも優れており、平均精度は1.74%向上している。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:31:04 GMT)
Topology-Driven Clustering: Enhancing Performance with Betti Number Filtration [14.9] 絡み合った形状を含む複雑なデータセットのクラスタリングは、大きな課題となる。
トポロジカル構造からフレキシブルに不可欠な特徴を捉えるためにベッチ列の概念を導入する。
提案アルゴリズムは,データセットに含まれる複雑で絡み合った形状のクラスタリングに有効である。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:46:02 GMT)
Hyperbolic Fuzzy $C$-Means with Adaptive Weight-based Filtering for Clustering in Non-Euclidean Spaces [14.9] Fuzzy $C$-Means (FCM) アルゴリズムは、非ユークリッド空間において顕著な制限を示す。
HypeFCMはファジィクラスタリングの原理と双曲幾何学を統合する。
HypeFCMは、非ユークリッド環境で従来のファジィクラスタリング法よりも大幅に優れている。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:32:53 GMT)
GAPrompt: Geometry-Aware Point Cloud Prompt for 3D Vision Model [14.8] 本稿では,3次元視覚モデルの適応性を高めるため,新しいGeometry-Aware Point Cloud Prompt (GAPrompt)を提案する。
まず、元の点雲と共に補助的な入力として機能する点プロンプトを導入し、そのモデルにきめ細かな幾何学的詳細を捉えるよう指示する。
また、点雲から大域的な形状情報を抽出し、入力レベルでのインスタンス固有の幾何調整を可能にするポイントシフトプロンプタを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 04:29:09 GMT)
Automatic Music Transcription using Convolutional Neural Networks and Constant-Q transform [14.7] We design a processing pipeline that can transform classical piano audio file in.wav format to a music score representation。
音声信号から特徴を定数Q変換を用いて抽出し、結果として得られる係数を畳み込みニューラルネットワーク(CNN)モデルへの入力として利用する。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:20:43 GMT)
Auto.gov: Learning-based Governance for Decentralized Finance (DeFi) [14.7] Auto$.$gov"は学習ベースのガバナンスフレームワークで、深いQnetwork強化学習(RL)戦略を用いて、半自動化されたデータ駆動パラメータ調整を実行する。
実世界のデータを用いたテストでは、Auto$.$govはベンチマークアプローチを少なくとも14%上回り、静的ベースラインモデルは10倍に向上する。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:25:34 GMT)
Opening Articulated Structures in the Real World [14.7] この作業では、モバイル操作テストベッドとして、オープニングされた構造のオープニングを使用する。
まず、このタスクのためのシステムを開発し、その後、13の現実世界のテストサイトで100以上のエンドツーエンドのシステムテストを実施します。
私たちの大規模な研究では、いくつかの驚くべき発見が明らかになりました。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:38:59 GMT)
Soft causal learning for generalized molecule property prediction: An environment perspective [14.7] 分子科学における未解決OOD問題に対処するためのソフト因果学習フレームワークを提案する。
まず化学理論をグラフ成長生成器に組み込んで拡張環境を模倣する。
次に、GIBに基づく環境をグラフ全体から切り離す目的を考案し、最後に、相互注意に基づくソフト因果相互作用を導入する。
論文参考訳(メタデータ) (Wed, 07 May 2025 06:04:02 GMT)
Breaking the Lens of the Telescope: Online Relevance Estimation over Large Retrieval Sets [14.5] 本稿では,オンライン関連度推定という新たな手法を提案する。
オンライン関連度推定は、ランキングプロセスを通して、クエリの関連度推定を継続的に更新する。
TRECベンチマークの手法をハイブリッド検索と適応検索の2つのシナリオで検証する。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:46:32 GMT)
Towards Large-scale Generative Ranking [14.3] 本稿では,現在の産業推薦者に対して,生成的ランキングがいかに優れているかを考察する。
ランク付けのための新しい生成アーキテクチャである RankGPT を紹介する。
その結果,RangeGPTは,ほぼ同等の計算資源でユーザ満足度を大幅に向上することがわかった。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:25:46 GMT)
Polynomial-Time Relational Probabilistic Inference in Open Universes [14.3] 本稿では,使用する言語の表現力と推論による計算問題のトラクタビリティを両立させる一階確率推定手法を提案する。
具体的には、期待の2乗論理をリレーショナルセッティングに拡張する。
与えられた次数と大きさの証明によって証明可能な最も厳密な境界を導出し、固定度に対する2乗の総和の完全性を確立することができる。
論文参考訳(メタデータ) (Wed, 07 May 2025 04:14:03 GMT)
Asynchronous Fractional Multi-Agent Deep Reinforcement Learning for Age-Minimal Mobile Edge Computing [14.3] 計算集約的な更新のタイムラインを調査し、AoIを最小化するためにタスク更新とオフロードポリシーを共同で最適化する。
具体的には、エッジ負荷のダイナミクスを考慮し、期待時間平均AoIを最小化するためにタスクスケジューリング問題を定式化する。
提案アルゴリズムは,実験における最良基準アルゴリズムと比較して平均AoIを最大52.6%削減する。
論文参考訳(メタデータ) (Wed, 07 May 2025 06:42:37 GMT)
STRGCN: Capturing Asynchronous Spatio-Temporal Dependencies for Irregular Multivariate Time Series Forecasting [14.2] STRGCNはIMTSの複雑な相互依存性を完全連結グラフとして表現する。
4つの公開データセットの実験では、STRGCNが最先端の精度、競合するメモリ使用量、トレーニング速度を達成することが示されている。
論文参考訳(メタデータ) (Wed, 07 May 2025 06:41:33 GMT)
Purity Law for Generalizable Neural TSP Solvers [13.9] 本稿では,PuLaとニューラルソリューションの特性を明示的に整合させ,一般化を促進する新たなトレーニングパラダイムであるPurity Policy Optimization(PUPO)を提案する。
実験では、PUPOは一般的なニューラルソルバとシームレスに統合することができ、推論中に追加の計算オーバーヘッドを発生させることなく、その一般化性能を著しく向上させることができる。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:46:48 GMT)
WATCH: Weighted Adaptive Testing for Changepoint Hypotheses via Weighted-Conformal Martingales [13.8] オンラインモニタリングのための共形試験マーチンガレット(WCTM)の重み付き一般化を提案する。
実践的な応用として、オンライン適応を軽度な共変量シフトに適応する特定のWCTMアルゴリズムを提案する。
実世界のデータセットでは、最先端のベースラインと比較して改善されたパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:53:47 GMT)
Towards Effectively Leveraging Execution Traces for Program Repair with Code LLMs [13.7] 大きな言語モデル(LLM)は、様々なプログラミングタスクにおいて有望なパフォーマンスを示す。
我々は,標準的なAPRプロンプトをプログラム実行トレースで強化することで,この潜在的な盲点を修復することを目指している。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:12:41 GMT)
FilterTS: Comprehensive Frequency Filtering for Multivariate Time Series Forecasting [13.7] FilterTSは、周波数領域に基づいた特殊なフィルタリング技術を利用する新しい予測モデルである。
FilterTSは予測精度と計算効率の点で既存の手法よりも優れている。
論文参考訳(メタデータ) (Wed, 07 May 2025 06:19:00 GMT)
WIR3D: Visually-Informed and Geometry-Aware 3D Shape Abstraction [13.6] WIR3Dは、3Dで視覚的に意味のある曲線のスパースセットを通して3D形状を抽象化する技術である。
ベジエ曲線のパラメータを最適化し、それらが幾何学的特徴と健全な視覚的特徴の両方を忠実に表現する。
形状の広いデータセットに対して, 形状の抽象化を行う手法をうまく適用した。
論文参考訳(メタデータ) (Wed, 07 May 2025 21:28:05 GMT)
Double Cross-fit Doubly Robust Estimators: Beyond Series Regression [13.6] トレーニングデータを分割し,独立したサンプルに縫合したニュアンス推定器を組み込むことで,2次クロスフィット2次ロバスト (DCDR) 推定器を構築することができる。
また,非$sqrtn$条件下においても,非$sqrtn$条件下においても推定が可能であることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:48:45 GMT)
MonoCoP: Chain-of-Prediction for Monocular 3D Object Detection [13.6] 提案するMonoCoPは,3つのキー設計により3次元特性を逐次的かつ条件的に予測する。
追加のデータを必要とせずに、KITTIのリーダーボード上での最先端(SoTA)パフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:37:23 GMT)
Local Steps Speed Up Local GD for Heterogeneous Distributed Logistic Regression [13.3] 局所的なステップで$O(1/KR)$、十分に大きな$R$通信ラウンドで$O(1/KR)$の収束を示す。
任意の問題に適用される局所GDの既存の収束保証は、少なくとも$Omega (1/R)$である。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:34:15 GMT)
Can Language Models Understand Social Behavior in Clinical Conversations? [13.3] 社会的シグナルは非言語的手がかりを通じて伝達され、患者と研究者の関係の質を形成する。
大規模言語モデル(LLM)の最近の進歩は、感情的・社会的行動を予測する能力の増大を示している。
そこで本研究では,この20個の符号化信号をすべて追跡し,LLM動作のパターンを明らかにするシステムを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 06:03:37 GMT)
Mastering Multi-Drone Volleyball through Hierarchical Co-Self-Play Reinforcement Learning [13.1] 我々は3v3マルチドローンバレーボールを習うことの課題に取り組む。
タスクはターンベース、マルチエージェント、物理的に接地されている。
階層型強化学習フレームワークHCSPを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:04:36 GMT)
Protecting Privacy in Software Logs: What Should Be Anonymized? [13.0] ソフトウェアログにおける機密情報の存在は、重大なプライバシー上の懸念を生じさせる。
この研究は、複数の観点からソフトウェアログのプライバシーを包括的に分析する。
当社の調査結果は、ログのプライバシーに関するさまざまな視点に光を当て、業界の課題を明らかにしました。
論文参考訳(メタデータ) (Wed, 07 May 2025 21:40:28 GMT)
Grassroots Democratic Federation: Fair Governance of Large-Scale, Decentralized, Sovereign Digital Communities [12.9] 我々は、大規模な、分散化された、主権のあるデジタルコミュニティの平等主義的な形成と、公正な民主的ガバナンスに対処することを目指している。
草の根の民主的連合は、デジタルコミュニティの草の根の形成とその合意的連合を通じて進化する。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:16:09 GMT)
OBLIVIATE: Robust and Practical Machine Unlearning for Large Language Models [12.8] 大規模言語モデル(LLM)は、機密性、著作権、有害なコンテンツを記憶する広範囲なコーパスリスクを訓練した。
モデルユーティリティを保ちながらターゲットデータを削除する頑健なアンラーニングフレームワークOBLIVIATEを提案する。
我々はHarry Potterシリーズ、WMDP、TOFUを含む複数のデータセットで実験を行う。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:51:42 GMT)
The Inadequacy of Similarity-based Privacy Metrics: Privacy Attacks against "Truly Anonymous" Synthetic Datasets [12.7] 実世界の合成データデプロイメントで使用されるプライバシメトリクスを調べ、その信頼性をいくつかの点で実証する。
ReconSynは、メトリクスによってプライベートと見なされるが、個々のレコードに固有の情報をリークする複数の合成データセットを生成するリコンストラクション攻撃である。
ReconSynは列車データから78-100%のアウトレーヤを復元し、ブラックボックスアクセスのみを1つの適合した生成モデルとプライバシメトリクスに含める。
論文参考訳(メタデータ) (Wed, 07 May 2025 22:38:57 GMT)
Discriminative Ordering Through Ensemble Consensus [12.7] コンセンサスクラスタリングからインスピレーションを得て、クラスタリングモデルのセットがデータに隠された構造を発見できると仮定します。
本稿では,クラスタリングモデルとコンセンサス行列との接続距離に基づいて,アンサンブルクラスタリングによる識別順序付けを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:35:39 GMT)
Uncertainty for SVBRDF Acquisition using Frequency Analysis [12.5] 本稿では,多視点撮影におけるSVBRDF取得の不確かさの定量化を目的とする。
本研究では,この曖昧さ,不確実性についてエントロピーを用いて検討し,周波数領域を用いて解析を高速化する。
その結果、オブジェクト全体の不確実性のマップをミリ秒以内で計算する。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:44:11 GMT)
Federated Generalised Variational Inference: A Robust Probabilistic Federated Learning Framework [12.5] FedGVIは確率的フェデレートラーニング(FL)フレームワークで、事前およびおそらく誤特定に対して堅牢である。
固定点収束、キャビティ分布の最適性、そして確率的不特定性に対する証明可能なロバスト性の観点から理論的解析を行う。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:06:46 GMT)
Trajectory Entropy Reinforcement Learning for Predictable and Robust Control [12.3] 強化学習におけるシンプルな政策に対する新たな帰納的バイアスを導入する。
単純な帰納バイアスは、作用軌跡全体のエントロピーを最小化することによって導入される。
学習方針がより循環的かつ一貫した行動軌跡を生み出すことを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:41:29 GMT)
Sparsity is All You Need: Rethinking Biological Pathway-Informed Approaches in Deep Learning [12.2] 生物学的にインフォームドされたニューラルネットワークは一般的に、生体医学的応用の性能を高めるために経路アノテーションを利用する。
予測タスクのための経路ベースニューラルネットワークモデルを網羅的に分析した。
以上の結果から,経路アノテーションはノイズが多すぎるか,あるいは現在の方法では不十分である可能性が示唆された。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:14:31 GMT)
Motion-compensated cardiac MRI using low-rank diffeomorphic flow (DMoCo) [11.7] 自由呼吸および非ゲート型3次元心臓磁気共鳴イメージング(MRI)のための教師なしモーション補償画像再構成アルゴリズム
静止画像テンプレートの変形として,各動き位相に対応する画像量を表現する。
より拘束された運動モデルでは、現在の3次元シネMRIの動作補償アルゴリズムと比較して回復性の向上が期待できる。
論文参考訳(メタデータ) (Wed, 07 May 2025 21:20:06 GMT)
Geometry-Aware Texture Generation for 3D Head Modeling with Artist-driven Control [11.6] 生成した3Dヘッドを直感的に制御する新しいフレームワークを提案する。
提案手法では,頭部形状と皮膚テクスチャマップの相関関係を異なる人口層で学習する幾何学的テクスチャ合成パイプラインを用いる。
このフレームワークは、全体的な頭部形状の操作、顔の特徴を保ちながら肌のトーンの調整、しわや顔の毛のような細部を細かく編集する3段階の芸術的制御を提供する。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:11:35 GMT)
ACE: A Security Architecture for LLM-Integrated App Systems [11.6] Abstract-Concrete-Executeは、システム計画と実行のセキュリティを保証する。
我々は,INJECAGENTベンチマークによる攻撃に対して,本システムが安全であることを実験的に示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:26:46 GMT)
A brief review of the Deep BSDE method for solving high-dimensional partial differential equations [11.6] Deep BSDE法は、非常に高次元の非線形PDEを効果的に解けるディープラーニング技術を導入している。
このイノベーションは、高次元PDEにニューラルネットワークを使用することに大きな関心を喚起し、研究の活発な領域となった。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:46:56 GMT)
Frequency super-resolution with quantum environment engineering in a weakly coupled nuclear-spin system [11.4] スペクトルピークであるガンマの広帯域半最大値でしばしば近似される従来のスペクトル分解能限界を破る周波数超解法を提案する。
この方法は弱い結合した核スピン系のスペクトル分解に有用であり、より高度な量子技術を用いてより微細な周波数超解像を得るためにさらに改良される可能性がある。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:05:26 GMT)
Learning based convex approximation for constrained parametric optimization [11.4] 本稿では、制約付き最適化問題を解決するために、入力ニューラルネットワーク(ICNN)に基づく自己教師付き学習フレームワークを提案する。
厳密な収束解析を行い、このフレームワークが元の問題のKKT近似点に収束することを示す。
提案手法は精度,実現可能性,計算効率の両立を実現している。
論文参考訳(メタデータ) (Wed, 07 May 2025 00:33:14 GMT)
A Framework to Prevent Biometric Data Leakage in the Immersive Technologies Domain [11.4] サイコグラフィーデータ(音声コマンド機能、顔のダイナミックスなど)はセンシティブなデータであり、ユーザーの同意なしにデバイスから漏れてはならない。
我々は没入型技術領域における機密データ(またはバイオメトリックデータ)のプライバシー漏洩を軽減するためのシンプルな技術フレームワークを開発する。
論文参考訳(メタデータ) (Wed, 07 May 2025 04:35:32 GMT)
Are Synthetic Corruptions A Reliable Proxy For Real-World Corruptions? [11.4] セマンティックセグメンテーションモデルに関する最大のベンチマーク研究を行う。
実世界の汚職と合成汚職データセットのパフォーマンスを比較した。
我々は、汚職固有の相関を分析し、人工汚職が現実世界の汚職を表すのにいつ成功したかを理解するための重要な洞察を提供する。
論文参考訳(メタデータ) (Wed, 07 May 2025 22:19:55 GMT)
GASCADE: Grouped Summarization of Adverse Drug Event for Enhanced Cancer Pharmacovigilance [11.3] 本研究は、がん治療に同じ薬物を使用する複数の患者が報告した有害薬物事象をまとめまとめる作業を紹介する。
がん薬物移動における限られた資源の課題に対処するため,Multilabeled Cancer Adverse Drug Reaction and Summarization datasetを提案する。
本稿では,大規模言語モデルの情報抽出能力とエンコーダ・デコーダT5モデルの要約能力を組み合わせた新しいパイプラインであるGASCADE(Grouping and Abstractive Summarization of Cancer Adverse Drug Event)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:40:18 GMT)
Nature's Insight: A Novel Framework and Comprehensive Analysis of Agentic Reasoning Through the Lens of Neuroscience [11.2] エージェント推論のための神経科学に着想を得た新しい枠組みを提案する。
我々は,既存のAI推論手法を体系的に分類し,分析するために,この枠組みを適用した。
本稿では,ニューラルインスパイアされた新しい推論手法を提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:25:46 GMT)
Deep learning-based ecological analysis of camera trap images is impacted by training data quality and quantity [11.2] アフリカのサバンナ(82,300枚、47種)とアジア亜熱帯乾燥林(40,308枚、29種)のカメラトラップ収集データの解析を行った。
専門家による種同定から得られた生態指標と深層学習分類モデルによる生態指標を比較した。
ディープラーニングモデルアーキテクチャの選択は、生態指標に影響を与えないことがわかった。
論文参考訳(メタデータ) (Wed, 07 May 2025 21:46:31 GMT)
MAISY: Motion-Aware Image SYnthesis for MedicalImage Motion Correction [11.2] 本研究では、まず動きを特徴付ける動き認識画像合成法(MAISY)を提案する。
胸部CTおよび頭部CTを用いた実験では、我々のモデルは最先端のモデルよりも優れていた。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:44:28 GMT)
TLOB: A Novel Transformer Model with Dual Attention for Price Trend Prediction with Limit Order Book Data [10.7] 制限順序帳(LOB)データに基づく価格トレンド予測(PTP)は、金融市場における根本的な課題である。
LOBデータにおける空間的および時間的依存関係を捉えるために,デュアルアテンション機構を用いたトランスフォーマーベースモデルTLOBを提案する。
F1スコアの6.68は、市場効率の上昇を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 07 May 2025 21:14:14 GMT)
Deep Reinforcement Learning for Traffic Light Control in Intelligent Transportation Systems [10.6] 道路網におけるリアルタイム交通状況に基づいて信号機を適応的に制御するための,深部強化学習 (DRL) は有望なアプローチである。
2つのシナリオにおいて、交通信号制御問題に対して2つのDRLアルゴリズムを用いる。
単一の道路交差点とグリッド道路ネットワークの両方で配信されたポリシーは、DRLアルゴリズムのスケーラビリティを示している。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:57:44 GMT)
Onboard Optimization and Learning: A Survey [10.5] オンボード学習は、エッジAIにおける変革的なアプローチであり、リソース制約のあるデバイス上で、リアルタイムデータ処理、意思決定、適応モデルのトレーニングを可能にする。
しかし、オンボード学習は、限られた計算リソース、高い推論コスト、セキュリティ脆弱性といった課題に直面している。
本調査では,モデル効率の最適化,推論の高速化,分散デバイス間の協調学習を支援する技術について検討する。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:47:14 GMT)
LLM-e Guess: Can LLMs Capabilities Advance Without Hardware Progress? [10.5] 本稿では,大規模言語モデルがさらなる計算処理を伴わずに進化し続けるかどうかを考察する。
高性能ハードウェアへのアクセスを制限することに集中してきた規制の取り組みに動機付けられて、私たちは次のように質問した。 LLMは、計算に制約のある環境で前進できるか?
論文参考訳(メタデータ) (Wed, 07 May 2025 02:26:17 GMT)
The Design Space of Lockfiles Across Package Managers [10.4] 私たちは,npm, pnpm, Cargo, Poetry, Pipenv, Gradle, Goという,人気の高い7つのパッケージマネージャを対象とした,ロックファイルに関する初の包括的な調査を行っています。
開発者がロックファイルで認識するメリットや、これらのファイルを管理する上で直面する課題について、私たちは直接的に洞察を得ています。
論文参考訳(メタデータ) (Wed, 07 May 2025 22:18:40 GMT)
SOAEsV2-7B/72B: Full-Pipeline Optimization for State-Owned Enterprise LLMs via Continual Pre-Training, Domain-Progressive SFT and Distillation-Enhanced Speculative Decoding [10.4] 本研究は、中国国有資産企業(SOAE)向けドメイン固有大規模言語モデル(LLM)開発における重要な課題に対処する。
我々の研究は、SOAEs LLMを最適化するための包括的な完全なパイプラインアプローチを導入し、汎用言語能力とドメイン固有の専門知識のギャップを埋めます。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:21:47 GMT)
Active Sampling for MRI-based Sequential Decision Making [10.3] アンダーサンプルk空間データから包括的,逐次的,診断的評価が可能な,新しい強化学習フレームワークを提案する。
本フレームワークは,k空間サンプルを著しく節約しつつ,疾患検出,重症度,総合的な診断に関する様々なポリシーベースのベンチマークと競合する診断性能を実現する。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:27:51 GMT)
Evolutionary Algorithms Are Significantly More Robust to Noise When They Ignore It [10.2] 我々は、再評価なしに単目的雑音問題を解く進化的アルゴリズムの最初の数学的実行時解析を行う。
再評価を行わないアルゴリズムは、従来のLeadingOnesベンチマークを最大定音率で最適化できることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:44:45 GMT)
Boosting Masked ECG-Text Auto-Encoders as Discriminative Learners [10.1] 本稿では,コントラッシブマスクを用いた自動エンコーダアーキテクチャを用いて,ECGとテキストデータを事前学習するフレームワークD-BETAを提案する。
D-BETAは、生成性の強さと差別能力の強化を一意に組み合わせて、堅牢なクロスモーダル表現を実現する。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:04:16 GMT)
Perils of Label Indeterminacy: A Case Study on Prediction of Neurological Recovery After Cardiac Arrest [10.1] 本稿では,ラベルの不確定性の概念を導入し,AIを用いた意思決定において重要な意味を導出する。
本研究は,心停止後のコマトース患者の回復の予測に焦点をあてた医療場面における実証的研究である。
本研究は, ラベル不確定性は, 既知ラベルの患者に対して, 同様に機能するが, ラベルが不明な患者に対する予測において, 大きく異なるモデルであることが示唆された。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:06:13 GMT)
HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation [10.0] HunyuanCustomは、画像、オーディオ、ビデオ、テキストの状態をサポートしながら、主題の一貫性を強調する、カスタマイズされたビデオ生成フレームワークである。
本研究は,制御可能な映像生成におけるマルチモーダル・コンディショニングとアイデンティティ保存戦略の有効性を強調した。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:33:18 GMT)
PR2: Peephole Raw Pointer Rewriting with LLMs for Translating C to Safer Rust [9.9] 本稿では,個々の関数の生ポインタを,適切なRustデータ構造に引き上げる,ピープホール生ポインタ書き換え手法を提案する。
PR2は28の現実世界のCプロジェクト間で13.22%のローカルな生ポインタをうまく除去する。
PR2はプロジェクトの変換を平均5.44時間で完了し、平均コストは1.46ドルである。
論文参考訳(メタデータ) (Wed, 07 May 2025 23:30:27 GMT)
AI-powered virtual eye: perspective, challenges and opportunities [9.8] 我々は、「仮想眼」を、相互接続された基礎モデルを用いて、あらゆるスケールにわたる目の複雑な構造と生物学的機能をシミュレートする次世代AIプラットフォームとして想定する。
解釈可能性、倫理、データ処理、評価の課題にもかかわらず、仮想眼はパーソナライズされた眼科医療に革命をもたらし、眼の健康と疾患の研究を加速する可能性を秘めている。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:48:56 GMT)
ORBIT-2: Scaling Exascale Vision Foundation Models for Weather and Climate Downscaling [9.8] ORBIT-2は、超高分解能気候下降のためのスケーラブルな基礎モデルである。
Residual Slim ViT (Reslim) とタイルワイドシーケンススケーリングアルゴリズム TILES の2つの重要なイノベーションが組み込まれている。
0.9kmまでのダウンスケーリングをサポートし、最大420億個のトークンを処理している。
論文参考訳(メタデータ) (Wed, 07 May 2025 21:09:00 GMT)
Information-Geometric Barycenters for Bayesian Federated Learning [9.7] フェデレートラーニング(FL)は、局所的に訓練されたモデルの平均化を通じてコンセンサスを達成するために用いられる。
効果はあるが、このアプローチは、モデル空間が分布空間の構造を持つベイズ予想とうまく一致しないかもしれない。
非依存的な設定におけるフェデレーション平均化の収束特性を保持するアルゴリズムであるBA-FLBを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:54:19 GMT)
Liger: Linearizing Large Language Models to Gated Recurrent Structures [9.7] 大規模言語モデル(LLM)の線形化は、事前訓練された標準モデルを線形再帰構造に変換する。
Ligerは、事前訓練されたLLMを余分なパラメータを加えることなくゲート線形リカレントモデルに変換する新しいアプローチである。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:42:11 GMT)
Correlated vibration-solvent and Duschinsky effects on electron transfer dynamics and optical spectroscopy [9.6] 本研究では, ドスチンスキーと溶媒がETおよび分光に及ぼす影響について検討した。
Exploitedは、拡張されたdissipaton-equation-of motion (ext-DEOM)アプローチである。
論文参考訳(メタデータ) (Wed, 07 May 2025 06:36:01 GMT)
Grokking in the Wild: Data Augmentation for Real-World Multi-Hop Reasoning with Transformers [9.5] グルーキングを現実の事実データに拡張し、データセットの分散性の課題に対処します。
驚くべきことに、たとえ実際に誤った合成データであっても、創発的推論回路を強化することができる。
提案手法は,マルチホップ推論ベンチマークにおいて最大95-100%の精度を実現する。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:47:51 GMT)
Estimating Causal Effects in Networks with Cluster-Based Bandits [9.4] A/Bテストは、一般的にソーシャルネットワークで発生する干渉の存在において困難である。
A/Bテストは、治療アームの一方がパフォーマンスが悪く、個人を治療し続けると、高いパフォーマンスの損失を引き起こす可能性がある。
2つのクラスタベースマルチアームバンド(MAB)アルゴリズムを導入し,ネットワークの処理効果を徐々に推定する。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:54:33 GMT)
Efficiency Meets Fidelity: A Novel Quantization Framework for Stable Diffusion [9.4] 安定拡散モデル(SDM)のための効率的な量子化フレームワークを提案する。
我々のフレームワークはトレーニングと推論の一貫性を同時に維持し、最適化の安定性を確保する。
本手法は,訓練時間を短縮した最先端手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:57:47 GMT)
Proxy Prompt: Endowing SAM and SAM 2 with Auto-Interactive-Prompt for Medical Segmentation [9.4] プリアノテートマスクを用いた非ターゲットデータを利用して自動生成するProxy Prompt (PP)を提案する。
非ターゲットデータから最も代表的な文脈情報を適応的に選択する3段階のコンテキスト選択戦略を考案する。
提案手法は,4つの公開データセット上での最先端性能を達成し,16個の画像マスクでトレーニングした場合でも,完全に訓練されたモデルと同等の結果が得られる。
論文参考訳(メタデータ) (Wed, 07 May 2025 04:45:26 GMT)
DetReIDX: A Stress-Test Dataset for Real-World UAV-Based Person Recognition [9.3] 人物再識別(ReID)技術は、制御された地上レベルの条件下で比較的よく機能すると考えられている。
しかし、現実世界の設定に挑戦するときは壊れる。
本稿では,大規模な地上人物データセットであるDetReIDXを紹介する。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:41:06 GMT)
Lossless Compression of Large Language Model-Generated Text via Next-Token Prediction [9.3] 大規模言語モデル(LLM)は、ドメインにまたがってデプロイされ、利用され続けている。
LLM生成データの圧縮は、従来の人間や機械生成のコンテンツと比較して、独特な課題を示す。
また,LLMに基づく予測手法は,Gzipで達成した3倍の圧縮速度をはるかに上回る20倍の圧縮速度を達成することを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:42:35 GMT)
RGB-Event Fusion with Self-Attention for Collision Prediction [9.3] 本稿では,動的物体を持つ無人航空機の時間と衝突位置を予測するニューラルネットワークフレームワークを提案する。
提案したアーキテクチャは、2つの異なるエンコーダ分岐で構成されており、1つはモダリティ、次に自己アテンションによる融合により予測精度が向上する。
核融合モデルでは, 平均で1%, 0.5mを超える距離で10%の精度で予測精度が向上するが, メモリで+71%, FLOPで+105%のコストがかかることがわかった。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:03:26 GMT)
Uncertainty-Aware Prototype Semantic Decoupling for Text-Based Person Search in Full Images [9.2] テキストに基づく歩行者探索 (TBPS) は, 対象歩行者の位置を自然言語で特定することを目的としている。
MUE(Multi-granularity Uncertainity Estimation)、PUD(Prototype-based Uncertainity Decoupling)、ReID(Cross-modal Re-identification)の3つのモジュールからなる新しいフレームワークであるUDD-TBPSを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 01:21:36 GMT)
C-MORL: Multi-Objective Reinforcement Learning through Efficient Discovery of Pareto Front [9.0] 制約付きMORLは制約付きポリシー最適化とMORLのシームレスなブリッジである。
我々のアルゴリズムは、離散的かつ連続的な制御タスクにおいて、ハイパーボリューム、期待されるユーティリティ、およびスパーシリティという観点でより一貫性があり、優れた性能を達成する。
論文参考訳(メタデータ) (Wed, 07 May 2025 21:54:34 GMT)
False Promises in Medical Imaging AI? Assessing Validity of Outperformance Claims [8.9] 医用画像論文の代表的コホートを解析し,新たに提案した手法が真に最先端であるか否かを考察した。
以上の結果から,新手法の導入時の性能の低下が報告されている。
さらに,分類論文の86%,分節論文の53%において,偽アウトパフォーマンスクレームの確率(>5%)が高かった。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:15:33 GMT)
Image Restoration via Multi-domain Learning [8.9] マルチドメイン学習をTransformerに統合する新しい復元フレームワークを提案する。
具体的には、Token Mixerにおいて、局所領域-グローバル多受容場モデリングを容易にするSpatial-Wavelet-Fourierマルチドメイン構造を提案する。
フィードフォワードネットワークでは,異なる解像度でマルチドメイン機能を融合するために,マルチスケール学習を取り入れている。
論文参考訳(メタデータ) (Wed, 07 May 2025 04:14:51 GMT)
MSA-UNet3+: Multi-Scale Attention UNet3+ with New Supervised Prototypical Contrastive Loss for Coronary DSA Image Segmentation [8.9] 冠状DSA画像のセグメンテーションを高めるために,教師付きおよび原型的コントラスト学習を融合させるスーパービジョン型コントラスト損失を提案する。
MSA-UNet3+: Multi-Scale Attention-Enhanced UNet3+アーキテクチャで提案したSPCL損失を実装した。
プライベート冠DSAデータセットの実験では、MSA-UNet3+が最先端の手法より優れていることが示されている。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:21:23 GMT)
Zero-shot Object-Centric Instruction Following: Integrating Foundation Models with Traditional Navigation [8.8] 大規模なシーンは、因子グラフ内のロボットのポーズと合わせて推定されるランドマークの3Dグラフで、堅牢かつ効率的にマッピングすることができる。
そこで本研究では,自然言語命令のゼロショット手法であるLanguage-Inferred Factor Graph for Instruction following (LIFGIF)を提案する。
ボストン・ダイナミクス・スポット・ロボットを用いた実世界におけるゼロショット物体中心指導におけるLIFGIFの有効性を実証した。
論文参考訳(メタデータ) (Wed, 07 May 2025 22:19:07 GMT)
SceneLLM: Implicit Language Reasoning in LLM for Dynamic Scene Graph Generation [8.8] SceneLLMはビデオフレームを言語信号(シーントークン)に変換するフレームワークである
提案手法は,Action Genome (AG) ベンチマークの最先端結果を実現する。
大規模な実験は、正確な動的シーングラフの理解と生成におけるSceneLLMの有効性を示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:14:53 GMT)
Risk-sensitive Reinforcement Learning Based on Convex Scoring Functions [8.8] コンベックススコアリング機能を特徴とする多種多様なリスク目標に基づく強化学習フレームワークを提案する。
このクラスは、分散、期待不足、エントロピックなバリュー・アット・リスク、平均リスクユーティリティなど、多くの一般的なリスク対策をカバーしている。
我々は,統計的仲裁取引における金融的応用によるシミュレーション実験におけるアプローチの有効性を検証し,アルゴリズムの有効性を実証する。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:31:42 GMT)
Towards Initialization-Agnostic Clustering with Iterative Adaptive Resonance Theory [8.3] Iterative Refinement Adaptive Resonance Theory (IR-ART)は、3つの重要な位相を統合された反復的フレームワークに統合する。
IR-ARTは、ファジィARTのパラメータ単純性を保ちながら、準最適警戒パラメータ値に対する耐性を向上させる。
ケーススタディは、反復的な改善を通じてアルゴリズムの自己最適化能力を視覚的に確認する。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:12:39 GMT)
Model-Based AI planning and Execution Systems for Robotics [8.3] モデルベースの計画と実行システムは、柔軟な自律ロボットを構築するための原則化されたアプローチを提供する。
我々は、既存のシステムが解決しようとしている様々な設計上の選択と課題、これまで提案してきた様々な解決策、そして将来の開発への道のりを考察する。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:17:38 GMT)
A Practical Theory of Generalization in Selectivity Learning [8.3] クエリ駆動機械学習モデルは、クエリ選択のための有望な推定手法として登場した。
確率的近似(PAC)学習フレームワークに基づく最先端(SOTA)理論のギャップを埋める。
符号付き測度によって誘導される選択性予測器は学習可能であり,SOTA理論における確率測度への依存を緩和することを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 22:13:04 GMT)
EcoWeedNet: A Lightweight and Automated Weed Detection Method for Sustainable Next-Generation Agricultural Consumer Electronics [7.9] EcoWeedNetは、重要な計算複雑性を導入することなく雑草検出性能を向上させる新しいモデルである。
結果は、EcoWeedNetの低消費電力の消費者向けハードウェアへのデプロイ可能性、エネルギー消費の低減、その結果炭素フットプリントの削減を示している。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:40:20 GMT)
AutoPatch: Multi-Agent Framework for Patching Real-World CVE Vulnerabilities [7.8] 大規模言語モデル(LLM)はソフトウェア開発において有望なツールとして登場した。
彼らの知識は、固定されたカットオフ日に限定されており、新しく公開されたCVEに脆弱なコードを生成する傾向がある。
脆弱なLLM生成コードにパッチを当てるためのフレームワークであるAutoPatchを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:49:05 GMT)
AdSight: Scalable and Accurate Quantification of User Attention in Multi-Slot Sponsored Search [7.7] 本稿では,マウスカーソルトラジェクトリを利用した,スケーラブルで正確なユーザ注意の定量化手法であるAdSightを紹介する。
AdSightはトランスフォーマーベースのシーケンシャル・ツー・シーケンスアーキテクチャを使用しており、エンコーダはカーソル・トラジェクトリの埋め込みを処理し、デコーダはスロット固有の特徴を組み込む。
筆者らは,(1)修正時間とカウントを予測するための回帰,(2)スロットの種類を決定するための分類,という2つの機械学習タスクに対するアプローチを評価した。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:11:49 GMT)
SelectTTS: Synthesizing Anyone's Voice via Discrete Unit-Based Frame Selection [7.7] 提案するSelectTTSは,現行手法の簡易かつ効果的な代替手段である。
SelectTTSはターゲット話者から適切なフレームを選択し、フレームレベルの自己教師型学習(SSL)機能を使用してデコードする。
提案手法は,未確認話者の話者特性を効果的に把握し,最先端のマルチ話者音声フレームワークに匹敵する性能を実現することを実証する。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:16:00 GMT)
Low Resolution Next Best View for Robot Packing [7.4] 本稿では,低コストでスケーラブルなソリューションを優先して,正確な3次元再構成が不要なシナリオに焦点を当てる。
提案した低解像度Next Best View (LR-NBV) アルゴリズムは冗長性と取得密度を低下させ,効率的なオブジェクト再構成を実現する。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:26:53 GMT)
Automating Box Folding: Sequence Extraction and Ranking Methodologies [7.4] 箱の折り畳みは自動包装システムにとって重要な課題である。
この研究は、既存の折り畳みシーケンス抽出法と、特定のボックスタイプへの自動システムの適応性に着目したアプローチのギャップを埋めるものである。
ボックスを初期状態から所望の最終的な構成に変換することで、折り畳みシーケンスを識別・ランク付けする革新的な方法が提案されている。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:02:09 GMT)
A Tale of Two Identities: An Ethical Audit of Human and AI-Crafted Personas [7.4] 大規模言語モデル (LLMs) はデータ制限領域における合成ペルソナの生成にますます利用されている。
本稿では,3つのLSMが生成する合成ペルソナを表現的害のレンズを通して評価し,特に人種的アイデンティティに着目した。
以上の結果から, LLMは, 人種的マーカーに偏り, 文化的にコード化された言語を過剰に生成し, 構文的に精巧だが物語的に還元的なペルソナを構築できることが判明した。
これらのパターンは、ステレオタイピング、エキゾチック、消去、好ましくない偏見など、様々な社会技術的害をもたらす。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:12:48 GMT)
Pose Estimation for Intra-cardiac Echocardiography Catheter via AI-Based Anatomical Understanding [7.2] 心内心エコー法(ICE)は電気生理学(EP)と構造心疾患(SHD)の介入において重要な役割を担っている。
既存の航法は電磁(EM)追跡に依存しており、干渉や位置のドリフトの影響を受けやすい。
本稿では,ICE画像のみからICEカテーテルの位置と向きを推定する新しい解剖学的ポーズ推定システムを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 21:09:42 GMT)
Cyclic Vision-Language Manipulator: Towards Reliable and Fine-Grained Image Interpretation for Automated Report Generation [7.2] Cyclic Vision-Language Manipulator CVLMは、元のX線と指定されたレポートジェネレータから操作されたX線を生成するモジュールである。
CVLMの本質は、操作したX線をレポートジェネレータに循環させることで、X線生成のためのレポートに予め注入された変更と一致した変更レポートを生成することである。
論文参考訳(メタデータ) (Wed, 07 May 2025 01:51:52 GMT)
A Systematic Literature Review of Spatio-Temporal Graph Neural Network Models for Time Series Forecasting and Classification [7.2] 本稿では、時系列分類と予測のためのアプローチとアプリケーション領域について概観する。
データベース検索を行い,150以上の学術論文が現場における現状の詳細な調査のために選択された。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:08:36 GMT)
Weighted Random Dot Product Graphs [7.1] 本稿では,Random Dot Product Graph(RDPG)モデルを拡張し,重み付きグラフに対応する。
本稿では,各ノードに遅延位置の列を割り当てる非パラメトリック重み付き(W)RDPGモデルを提案する。
これらのノルダルベクトルの内部積は、モーメント生成関数を介して入射エッジ重みの分布のモーメントを規定する。
論文参考訳(メタデータ) (Wed, 07 May 2025 02:17:43 GMT)
Requirements-Based Test Generation: A Comprehensive Survey [7.0] 要求ベースのテスト生成(RBTG)は、特定の要求に基づいてテストケースを構築する。
本稿では,RTTGに関する総合的な調査,要件の分類,アプローチの分類,テストケースの種類の調査,利用可能なツールの要約,実験評価の分析を行う。
論文参考訳(メタデータ) (Wed, 07 May 2025 01:20:18 GMT)
Guaranteed Recovery of Unambiguous Clusters [7.0] クラスタリングは、しばしば難しい問題である。なぜなら、それは、"正しい"クラスタリングがどうあるべきかに固有の曖昧さのためである。
本稿は,クラスタ内の2つの高密度領域が,K$clusteringの2つの真に異なるクラスタよりも,2つの異なるクラスタのように見えるほど分離可能な状況について定式化する。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:33:19 GMT)
Spectral-Refiner: Accurate Fine-Tuning of Spatiotemporal Fourier Neural Operator for Turbulent Flows [7.0] 最近の演算子型ニューラルネットワークは、部分微分方程式(PDE)の近似に有望な結果を示している。
これらのニューラルネットワークは、かなりのトレーニング費用を要し、科学や工学の分野において要求される精度を常に達成するとは限らない。
論文参考訳(メタデータ) (Wed, 07 May 2025 04:39:17 GMT)
Enhancing Metabolic Syndrome Prediction with Hybrid Data Balancing and Counterfactuals [6.9] メタボリックシンドローム(メタボリックシンドローム、MetS)は、心臓血管疾患と2型糖尿病のリスクを著しく増大させる、関連性リスク因子の集団である。
世界的な流行にもかかわらず、クラス不均衡、データの不足、既存の研究における方法論上の矛盾などの問題により、MetSの正確な予測は依然として困難である。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:50:43 GMT)
SwinLip: An Efficient Visual Speech Encoder for Lip Reading Using Swin Transformer [6.8] 本稿では,唇読解のための効率的な視覚音声エンコーダを提案する。
本研究では,スイニングトランスの階層構造とウィンドウ自己注意を唇読解に適用する。
We have confirmed that our SwinLip improves the performance and inference speed of the lip reading network。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:18:43 GMT)
CodeBC: A More Secure Large Language Model for Smart Contract Code Generation in Blockchain [6.7] 大きな言語モデル(LLM)は、自然言語命令からコードを生成するのに優れていますが、セキュリティ上の脆弱性に対する理解が欠如しています。
この制限により、特にブロックチェーンのスマートコントラクト開発のような高セキュリティプログラミングタスクにおいて、LLMが生成したコードのセキュリティリスクを回避することが難しくなる。
ブロックチェーンでセキュアなスマートコントラクトを生成するように設計されたコード生成モデルであるCodeBCを紹介します。
論文参考訳(メタデータ) (Wed, 07 May 2025 02:31:34 GMT)
A Character-based Diffusion Embedding Algorithm for Enhancing the Generation Quality of Generative Linguistic Steganographic Texts [6.6] 本稿では,文字ベース拡散埋め込みアルゴリズム(CDEA)を提案する。
キャラクタレベルでの一般統計特性に基づいて,高確率候補単語の選択頻度を向上させる。
候補プールにおける低確率候補単語の選択頻度を低減する。
実験の結果,CDEAとXLNetの組み合わせは,生成されたステガノグラフィテキストの品質を著しく向上させることがわかった。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:00:28 GMT)
LHT: Statistically-Driven Oblique Decision Trees for Interpretable Classification [6.6] 本稿では,表現的・解釈可能な分類のための新しい斜め決定木モデルであるLHTについて紹介する。
LHTは、分割超平面を構築するための非定性的、統計的に駆動されるアプローチによって、自分自身を根本的に区別する。
論文参考訳(メタデータ) (Wed, 07 May 2025 05:25:44 GMT)
Disjunctive Branch-And-Bound for Certifiably Optimal Low-Rank Matrix Completion [6.5] 2つの未成年者の和として低ランク行列を分解することにより、新しく、しばしばほぼ一致する凸緩和のクラスを提示する。
数値実験では、新しい凸緩和は、$max m, n q$ および $r leq$ の最適性またはほぼ最適性を減少させる。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:40:10 GMT)
Scalable Aerial GNSS Localization for Marine Robots [6.5] 本稿では,水面近傍で海面ロボットを追跡・位置決めするスケーラブルな位置決め機能を備えた空中ドローンを提案する。
以上の結果から,この新たな適応により,単一ロボットとマルチロボットロボットの正確な位置推定が可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:18:59 GMT)
Advancing 3D Medical Image Segmentation: Unleashing the Potential of Planarian Neural Networks in Artificial Intelligence [6.3] PNN-UNetは、平面ニューラルネットワーク構造を複製するディープニューラルネットワークを構築する方法である。
PNN-UNetは、ディープ・UNetとワイド・UNetを神経コードとして構成し、密結合されたオートエンコーダが脳の役割を担っている。
画像分割において,PNN-UNetがベースラインUNetより優れていることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:54:37 GMT)
LLM Code Customization with Visual Results: A Benchmark on TikZ [6.3] 我々は,協調的な視覚的成果を保ちながらコードをカスタマイズする大規模言語モデルの能力を評価する最初のベンチマークであるvTikZを紹介した。
我々のベンチマークは、慎重にキュレートされたvTikZ編集シナリオ、パラメータ化された基底真理、そして視覚フィードバックを利用して正当性を評価するレビューツールから構成されている。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:26:54 GMT)
Apply Hierarchical-Chain-of-Generation to Complex Attributes Text-to-3D Generation [6.2] 本稿では,複雑な属性を持つ属性に忠実な3Dオブジェクトを生成する手法を提案する。
まず、まずコンポーネントを粗く作成し、それからターゲット領域のローカライゼーションとそれに対応する3Dガウスカーネル最適化によって属性を正確にバインドする。
実験により、HCoGは複雑な属性を持つ構造的コヒーレントで属性に忠実な3Dオブジェクトを生成することが確認された。
論文参考訳(メタデータ) (Wed, 07 May 2025 04:52:24 GMT)
Efficient Sensorimotor Learning for Open-world Robot Manipulation [6.2] この論文は、効率的な感覚運動学習手法を用いて、オープンワールドロボットマニピュレーション問題に取り組む。
効率的な感覚運動学習を実現するための鍵は、限られた量の実演データに存在する規則的なパターンを活用することである。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:23:58 GMT)
Comparative Study of Generative Models for Early Detection of Failures in Medical Devices [5.8] 本稿では,医療機器の故障検出のための3つの生成機械学習アプローチについて検討する。
この研究は、これらの機械学習アプローチの性能とデータ要件を評価し、デバイス安全性を高める可能性を強調している。
論文参考訳(メタデータ) (Wed, 07 May 2025 22:49:53 GMT)
Merging and Disentangling Views in Visual Reinforcement Learning for Robotic Manipulation [5.8] 複数のビューをマージし、Q-ラーニングを使用することで、より効率的な表現とサンプル効率の最適化を実現できる。
本稿では,ビューを効率よくマージし,サンプル効率を向上させるマージ・アンド・ディスタングルメント(MAD)アルゴリズムを提案する。
Meta-World と ManiSkill3 を用いたアプローチの効率性とロバスト性を実証した。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:59:28 GMT)
Identities are not Interchangeable: The Problem of Overgeneralization in Fair Machine Learning [5.8] 我々は、機械学習が、しばしば差別が発生する識別軸と交換可能なものとして扱われていることを考察する。
言い換えれば、人種差別は性差別、能力主義、年齢主義と同じ方法で測定され緩和される。
論文参考訳(メタデータ) (Wed, 07 May 2025 00:33:49 GMT)
Modeling Personalized Difficulty of Rehabilitation Exercises Using Causal Trees [5.8] リハビリテーションロボットは、リハビリテーション運動を完了させる人のモチベーションを高めるために、ゲームのような相互作用でしばしば使用される。
以前のアプローチでは、エクササイズはすべてのユーザに対して等しく適用される一般的な難易度値を持つと仮定されていた。
脳卒中患者の運動困難感は様々である。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:21:45 GMT)
Adaptive Aggregation Weights for Federated Segmentation of Pancreas MRI [5.6] フェデレートラーニング(FL)は、機密データを共有することなく、機関間で協調的なモデルトレーニングを可能にする。
フェデレート平均化(FedAvg)のような従来のFLメソッドは、ドメイン間の一般化において困難に直面している。
本稿では適応的なアグリゲーション重みを取り入れた新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 02:08:47 GMT)
Flow Models for Unbounded and Geometry-Aware Distributional Reinforcement Learning [5.6] 本稿では,正規化フローを用いて分布をモデル化する分散強化学習(DistRL)の新しいアーキテクチャを提案する。
このアプローチは、リターン分布に対するフレキシブルで非バウンドなサポートを可能にする。
提案手法は,Quantile ベースの手法と競合しながら,PDF ベースのモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:49:53 GMT)
Multi-Granular Attention based Heterogeneous Hypergraph Neural Network [5.6] 不均一グラフニューラルネットワーク(HeteGNN)はノード表現を学習する強力な能力を示している。
本稿では,マルチグラニュラーアテンションに基づく表現学習のためのヘテロジニアスハイパーグラフニューラルネットワークであるMGA-HHNを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:42:00 GMT)
Model-based learning for joint channel estimationand hybrid MIMO precoding [5.5] ハイブリッドプリコーディングは、コスト効率の高い大規模マルチインプットマルチアウトプットトランシーバの重要な要素である。
本稿では、受信したパイロットを入力として取り出し、プリコーダを出力するエンドツーエンドアーキテクチャからなる、共同チャネル推定とハイブリッドプリコーディング手法を提案する。
結果として得られるニューラルネットワークは完全にモデルベースであり、軽量で、学習可能なパラメータがほとんどない。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:00:34 GMT)
Resist Platform-Controlled AI Agents and Champion User-Centric Agent Advocates [5.5] 言語モデルエージェントは、ユーザーがデジタル環境でナビゲートし行動する方法を再構築することができる。
プラットフォーム企業によってコントロールされれば、プラットフォームエージェントは監視を強化し、ユーザーのロックインを悪化させ、既存のデジタル巨人をさらに強化することができる。
このポジションペーパーは、プラットフォームエージェントの望ましくない影響に抗うために、エージェントアドボケートを擁護すべきであると主張している。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:45:38 GMT)
Position: We need responsible, application-driven (RAD) AI research [5.5] このポジションペーパーは、人工知能(AI)による有意義な科学的および社会的進歩を達成するには、AI研究に対する責任あるアプリケーション駆動アプローチ(RAD)が必要であると主張している。
我々は、技術的に実現可能な方法で新しい価値を解放するアプリケーション駆動型AI研究の将来へのビジョンを提示する。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:43:52 GMT)
Bringing legal knowledge to the public by constructing a legal question bank using large-scale pre-trained language model [5.4] 法的な知識を一般人にもたらすための3段階のアプローチを定式化します。
まず、選択したセクションをスニペットに変換する(CLICページと呼ばれる)。
第2に,CLICページで回答が得られた法的質問の集合である法定質問銀行(LQB)を構築した。
第3に,対話型CLICレコメンダ(CRec)を設計する。
論文参考訳(メタデータ) (Wed, 07 May 2025 05:07:38 GMT)
On-Device LLM for Context-Aware Wi-Fi Roaming [5.4] デバイス上での大規模言語モデル(LLM)の最初のクロス層利用について紹介する。
エッジハードウェアの厳密なレイテンシとリソース予算を満たすため、我々は一連の最適化・チェーン・オブ・ソートを適用した。
屋内および屋外データセットの実験では、我々のアプローチがレガシーやDRLベースラインを超えていることが示されている。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:04:49 GMT)
Learning from Convolution-based Unlearnable Datasets [5.3] ConlearnベースのUnlearnable DAtaset(CUDA)メソッドは、データセット内のすべてのイメージにクラスワイドなぼかしを適用することによって、データを学習不能にすることを目的としている。
本研究は,画像のシャープ化と周波数フィルタリングにより,データが未学習のままであるか否かを評価する。
学習不能なデータを用いて学習したモデルに対して,逆行訓練によるテスト精度の大幅な向上を観察する。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:58:18 GMT)
XG-NID: Dual-Modality Network Intrusion Detection using a Heterogeneous Graph Neural Network and Large Language Model [5.3] XG-NIDは異種グラフ構造内にフローレベルとパケットレベルのデータを融合する最初の方法である。
XG-NIDは、フローとパケットペイロードデータの複雑な関係を効果的に捉えながら、リアルタイムの推論を可能にする。
論文参考訳(メタデータ) (Wed, 07 May 2025 21:59:46 GMT)
Personalized Risks and Regulatory Strategies of Large Language Models in Digital Advertising [5.3] 本稿では,デジタル広告における大規模言語モデルのパーソナライズされたリスクと規制戦略について検討する。
実験の結果,BERTベースの広告プッシュは,広告のクリックスルー率と変換率を効果的に向上させることができることがわかった。
論文参考訳(メタデータ) (Wed, 07 May 2025 04:25:41 GMT)
ORXE: Orchestrating Experts for Dynamically Configurable Efficiency [5.2] ORXEは、AIモデルでリアルタイム効率を達成するためのモジュラーフレームワークである。
入力サンプルの複雑さに基づいて推論経路を動的に調整する。
他のアプリケーションにも拡張可能で、さまざまな現実世界のデプロイメントシナリオに対してスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Wed, 07 May 2025 23:16:56 GMT)
Integrating AI for Human-Centric Breast Cancer Diagnostics: A Multi-Scale and Multi-View Swin Transformer Framework [5.2] この論文は、乳癌の診断を強化するためのヒューマン・センターワークフローにおけるAIの統合に焦点を当てている。
診断の堅牢性と精度を高めるハイブリッド・マルチスケール・マルチビューSwin Transformerベースのフレームワーク(MSMV-Swin)を提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:17:50 GMT)
JTCSE: Joint Tensor-Modulus Constraints and Cross-Attention for Unsupervised Contrastive Learning of Sentence Embeddings [5.2] 我々は,新しい textbfJoint textbfTensor representation modulus constraint と textbfCross-attention unsupervised contrastive learning textbfSentence textbfEmbedding representation framework JTCSE を提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 01:11:50 GMT)
MaskAttn-UNet: A Mask Attention-Driven Framework for Universal Low-Resolution Image Segmentation [5.1] MaskAttn-UNetはマスクアテンション機構を通じて従来のU-Netアーキテクチャを強化する新しいセグメンテーションフレームワークである。
本モデルでは,無関係な背景を抑えながら重要な領域を選択的に強調し,乱れや複雑なシーンのセグメンテーション精度を向上させる。
以上の結果から,MaskAttn-UNetは変圧器モデルよりも計算コストが大幅に低く,最先端の手法に匹敵する精度を達成できた。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:59:53 GMT)
Qualitative Analysis of $ω$-Regular Objectives on Robust MDPs [5.1] 本稿では,ロバスト・マルコフ決定過程における到達性とパリティ目標の質的問題について検討する。
まず、これらの問題を解決する不確実性集合へのオラクルアクセスを用いた効率的なアルゴリズムを提案する。
次に, オラクルベースのアプローチの有効性を示す実験結果について報告する。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:15:40 GMT)
Computable and Faithful Lower Bound on Entanglement Cost [5.1] 我々は量子演算における絡み合いコストの計算可能で忠実な下限を開発する。
私たちの境界は半定値プログラミングによって効率的に計算できる。
提案手法は、ポイント・ツー・ポイントとバイパート・量子チャネルの両方の絡み合いコストの低い境界を導出するように拡張する。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:08:20 GMT)
FoodTrack: Estimating Handheld Food Portions with Egocentric Video [5.0] FoodTrackは、食品の量を直接見積もる。
ハンドヘルド食品の絶対損失率は約7.01%である。
論文参考訳(メタデータ) (Wed, 07 May 2025 01:53:16 GMT)
FedBWO: Enhancing Communication Efficiency in Federated Learning [4.8] フェデレートラーニング(FL)は、分散機械学習(ML)のセットアップで、共有モデルは、データをプライベートにしながら、ローカルデータセットを使用して、さまざまなクライアントによって協調的にトレーニングされる。
リソースの制約を考慮すると、クライアントの数とデータ量(モデルウェイト)がボトルネックにつながる可能性がある。
本稿では,Federated Black Widow Optimization (FedBWO) 技術を導入し,クライアントのローカルモデル重みではなく,パフォーマンススコアのみを送信することで送信データ量を削減する。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:02:35 GMT)
Data Efficient Prediction of excited-state properties using Quantum Neural Networks [4.7] 分子基底状態から励起状態特性を予測する量子機械学習モデルを提案する。
このモデルは、対称性不変の量子ニューラルネットワークと、従来のニューラルネットワークとから構成される。
わずかなトレーニングデータポイントだけで正確な予測を提供することができる。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:55:23 GMT)
Optimal Rates of Convergence for Entropy Regularization in Discounted Markov Decision Processes [4.7] マルコフ決定過程におけるエントロピー正則化による誤差について検討する。
この誤差は逆正則化強度で指数関数的に減少することを示す。
私たちは分析をエントロピーを超えた設定に拡張します。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:19:19 GMT)
Probing the Quantum Capacitance of Rydberg Transitions of Surface Electrons on Liquid Helium via Microwave Frequency Modulation [4.6] 本稿では,液体ヘリウム上の表面電子のリドベルク転移に伴う量子容量を求める方法を提案する。
ライドバーグ転移の共鳴マイクロ波励起は、容量結合された電極上での画像電荷の再分配を誘導する。
論文参考訳(メタデータ) (Wed, 07 May 2025 01:27:32 GMT)
Welfare Analysis in Dynamic Models [4.5] 本研究では,動的モデルを用いた福祉分析のためのメトリクスの推定と推定を行う。
福祉指標の例としては、平均的福祉、平均的限界的福祉効果、直接的および間接的な効果への福祉の分解がある。
偏見は、偏見補正の形式ではなく、利害の福祉基準に関する知識のみを必要とするという意味で、自動的である。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:48:50 GMT)
An Empirical Study of OpenAI API Discussions on Stack Overflow [4.5] 人気のQ&AフォーラムStack Overflowから,OpenAI API関連の2,874の議論を分析して,初の総合的な実証的研究を行った。
トピックモデリング分析により、各カテゴリに関連する特定の課題を特定する。
本研究は, 開発者, LLM ベンダ, 研究者に対して, 実用的な意味合いを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 02:51:32 GMT)
Does Functional Package Management Enable Reproducible Builds at Scale? Yes [4.5] Reproducible Builds (R-B) は、ソフトウェアパッケージをソースから再構築することを保証する。
我々は,Nix機能パッケージマネージャのコンテキストにおいて,ビットワイズに関する最初の大規模研究を行う。
非常に高いビットワイズ率、69~91%の上昇傾向、さらに高いリビルド可能性率、99%以上を得ています。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:49:02 GMT)
Automated Coding of Communications in Collaborative Problem-solving Tasks Using ChatGPT [4.3] 協調問題解決(CPS)は21世紀の重要な技術として広く認められている。
本稿では,ChatGPTが通信データを満足なレベルに符号化できることを示す。
また、誤コードされたケースからのフィードバックに基づく書き換えプロンプトにより、符号化精度が向上することを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:14:10 GMT)
From Latent to Lucid: Transforming Knowledge Graph Embeddings into Interpretable Structures with KGEPrisma [4.2] 本稿では,知識グラフ埋め込み(KGE)モデルに適した,ポストホックでローカルな説明可能なAI手法を提案する。
提案手法は,KGEモデルによって符号化された潜在表現を直接デコードし,埋め込みの滑らかさを活用する。
シンボリック構造を三重項の形で同定することにより,これらの知見を人間に理解可能なシンボリック・ルールや事実に変換する。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:15:25 GMT)
Provable DI-QRNG protocols based on self-testing methodologies in preparation and measure scenario [4.2] 本稿では,P&Mシナリオにおける2つの自己検査手法を用いた2つのデバイス独立量子乱数発生器(DI-QRNG)プロトコルを提案する。
これら2つの手法は、よく知られた2つの非局所ゲーム、すなわちCHSHと擬テレパシーゲームの変種である。
我々はこれらを、古典的パラダイムと量子パラダイムを区別するために、ブラックボックス設定の区別器として利用する。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:08:02 GMT)
A Heuristic-Integrated DRL Approach for Phase Optimization in Large-Scale RISs [4.2] 大規模な再構成可能な知的表面(RIS)における離散位相シフトの最適化は、非線形の性質のため困難である。
本稿では,深層ネットワークQGA(DDQ)における複数ステップの動作をRIS列制御に活用する,深層学習強化(DRL)フレームワークを提案する。
提案手法は、小さなDRLアクション空間内でのRIS最適化を効果的に処理し、大規模なRISを最適化する能力を示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:34:12 GMT)
Spatio-Temporal Graph Neural Network for Urban Spaces: Interpolating Citywide Traffic Volume [4.2] 本稿では,新しい都市交通量推定手法であるGNNUI(Graph Neural Network for Urban Interpolation)を紹介する。
GNNUIは、学習のためにマスキングアルゴリズムを採用し、機能的な役割を捉えるためにノード機能を統合する。
このモデルに加えて、異なる交通手段をカバーする2つの新しいオープンスケール都市交通量ベンチマークを導入する。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:34:00 GMT)
Vision-Language-Action Models: Concepts, Progress, Applications and Challenges [4.2] Vision-Language-Actionモデルは、知覚、自然言語理解、実施された行動を単一の計算フレームワーク内で統一することを目的としている。
この基礎的なレビューは、ビジョン・ランゲージ・アクションモデルにおける最近の進歩の包括的合成を提示する。
主要な進歩分野は、アーキテクチャの革新、パラメータ効率のトレーニング戦略、リアルタイム推論アクセラレーションである。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:46:43 GMT)
The Promise and Limits of LLMs in Constructing Proofs and Hints for Logic Problems in Intelligent Tutoring Systems [4.1] 大規模言語モデル(LLM)は動的フィードバック生成に有望な機能を提供する。
LLMは幻覚を発生させるリスクを負う。
DeepSeek-V3は、段階的な証明構築において84.4%の精度で優れた性能を達成した。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:48:23 GMT)
A Numerical Gradient Inversion Attack in Variational Quantum Neural-Networks [4.1] 変分量子ニューラルネットワーク(VQNN)のロスランドスケープは、量子ビットの増加とともに指数関数的に増大する局所的ミニマによって特徴づけられる。
本稿では,学習可能なVQNNの勾配から入力学習,実世界,実践的データを再構築する数値計算手法を提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:01:00 GMT)
MFSeg: Efficient Multi-frame 3D Semantic Segmentation [4.1] MFSegは効率的なマルチフレーム3Dセマンティックセグメンテーションフレームワークである。
MFSegは高い精度を維持しながら計算オーバーヘッドを削減する。
提案手法では,過去のフレームから冗長点をサンプリングする必要がなくなる。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:46:10 GMT)
Bayesian Estimation of Extreme Quantiles and the Exceedance Distribution for Paretian Tails [3.9] 非条件分布の場合、ベイズ量推定はカバレッジ誤差をゼロにすることを示す。
リスク評価に欠かせない,分布の表現と今後の超過の瞬間を導出する。
様々な光分布と重み分布のシミュレーションを用いて,本研究の結果について述べる。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:21:17 GMT)
Machine Learning Cryptanalysis of a Quantum Random Number Generator [3.9] 暗号アプリケーションに不可欠な乱数生成器(RNG)は、敵攻撃の対象となっている。
我々は,光学連続変数QRNGの異なる段階における決定論的古典雑音の影響を調べるために,予測機械学習(ML)解析を開発した。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:14:18 GMT)
On some improvements to Unbounded Minimax [3.9] 本報告では, 未検証の4つの非有界Best-First Minimaxの修正について, 実験的検討を行った。
まず,ゲームツリーを有向非巡回グラフに変換し,重複状態をマージするトランスポジションテーブルの利用について検討する。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:59:19 GMT)
Facilitating Trustworthy Human-Agent Collaboration in LLM-based Multi-Agent System oriented Software Engineering [3.8] マルチエージェント自律システム(MAS)は、単一の自律エージェントよりも複数のドメインにまたがる課題に対処する上で優れている。
ソフトウェア工学(SE)におけるMASに関する最先端の研究は、LMAシステムを構築するための自律エージェントのコアにLLMを統合することに焦点を当てている。
主な課題の1つは、人間とLMAシステム間のタスクを信頼できる方法で戦略的に割り当てることである。
RACIベースのフレームワークは、実装ガイドラインとフレームワークのサンプル実装とともに、現在進行中の論文で提案されている。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:55:15 GMT)
Non-stationary Diffusion For Probabilistic Time Series Forecasting [3.8] 非定常拡散(NsDiff)と呼ばれる拡散に基づく確率的予測フレームワークを開発する。
NsDiffは、デノナイズド拡散に基づく条件生成モデルと、事前訓練された条件平均と分散推定器を組み合わせる。
9つの実世界および合成データセットで実施された実験は、既存のアプローチと比較して、NsDiffの優れた性能を示している。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:29:39 GMT)
Quantum thermodynamics and semi-definite optimization [3.7] 量子熱力学において、系はハミルトニアンによって記述され、システムの最小エネルギーを決定することが目的である。
最適化理論では、半定値プログラム(SDP)は正半定値作用素の錐上で最適化された線形目的関数を含む。
量子熱力学に動機づけられたJaynesの考え方を採用することで、上記の熱力学問題における自由エネルギーの最小化は、エネルギーの代わりにエレガントな解をもたらすことを観察する。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:40:15 GMT)
AI-Generated Fall Data: Assessing LLMs and Diffusion Model for Wearable Fall Detection [3.6] 転倒検知システムの訓練は、特に高齢者の実際の転倒データの不足により困難である。
本研究では,現実的な転倒シナリオのシミュレーションにおいて,テキスト・ツー・モーションモデルとテキスト・ツー・テキストモデルを評価する。
合成データセットを生成し、4つの実世界のベースラインデータセットと統合し、秋検出性能への影響を評価する。
論文参考訳(メタデータ) (Wed, 07 May 2025 02:30:33 GMT)
Ordering Matters: Structure, Accuracy and Gate Cost in Second-Order Suzuki Product Formulas [3.6] 本研究では, スズキの公式の項順序付けと適用により, 標準ストレイン分割以上の近似式が生成されることを示す。
分極ノイズの存在下では, 故障耐性エラー率に近づくと, 分極分解が有利となることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:45:36 GMT)
Conditional Lagrangian Wasserstein Flow for Time Series Imputation [3.6] 条件付きラグランジアン・ワッサースタイン流は時系列計算の新しい方法である。
対応する運動エネルギーを最小化することで速度を学習する。
モデルの性能を高めるために,タスク固有ポテンシャル関数の勾配を推定する。
論文参考訳(メタデータ) (Wed, 07 May 2025 04:26:40 GMT)
Efficient Flow Matching using Latent Variables [3.6] マルチモーダルデータ構造を組み込むための簡易なトレーニング/推論戦略を提供する textttLatent-CFM を提案する。
textttLatent-CFMは、最先端のフローマッチングモデルよりも、トレーニングや計算が大幅に少ないため、生成品質が向上していることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:59:23 GMT)
CRAFT: Cultural Russian-Oriented Dataset Adaptation for Focused Text-to-Image Generation [3.6] 文化規範の概念を考察し,現代画像生成モデルによる理解の重要性を認識した。
本稿では,文化コードに基づくデータセット作成に必要なデータを収集・処理する手法を提案する。
人的評価の結果は、モデルにおけるロシア文化の認知度の増加を示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 23:29:28 GMT)
Robust ML Auditing using Prior Knowledge [3.5] 本稿では,プラットフォームが解決した課題に対する監査者の事前知識を考慮し,操作保護監査に対する新たなアプローチを提案する。
我々はまず、規制当局が監査役を騙すことが容易にできるため、公的な優先事項に依存してはならないことを実証した。
そこで,本研究では,監査官が基礎的真理に関する事前知識を用いて監査操作を防止できる条件を正式に確立する。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:46:48 GMT)
DMRL: Data- and Model-aware Reward Learning for Data Extraction [3.5] 大規模言語モデル(LLM)は本質的に意図しないプライバシー侵害に対して脆弱である。
本稿では,データ抽出のためのデータ・モデル・アウェア・リワード学習手法を提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:21:37 GMT)
Symmetry-Aware Trotterization for Simulating the Heisenberg Model on IBM Quantum Devices [3.5] 本稿では,3つのサイト,$J=1$ XXX Heisenbergモデルの時間発展のためのハードウェア効率の良いトロッタライズ手法を提案する。
ハミルトニアンの対称性を利用して、還元部分空間に作用する実効的なハミルトニアンを導出する。
また,IBM Quantum デバイス ibmq_jakarta 上で実験を行った。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:31:39 GMT)
A Two-Timescale Primal-Dual Framework for Reinforcement Learning via Online Dual Variable Guidance [3.4] 正規化マルコフ決定過程(MDP)の解法としてPGDA-RLを提案する。
PGDA-RLは、経験的リプレイに基づく勾配推定と、基礎となるネスト最適化問題の2段階の分解を統合する。
PGDA-RL は正規化 MDP の最適値関数とポリシーにほぼ確実に収束することを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:18:43 GMT)
Racing Against the Clock: Exploring the Impact of Scheduled Deadlines on Technical Debt [3.4] 本研究は,期限が技術的負債(TD)に与える影響について検討する。
スケジュールされた期限がコード品質やコミットアクティビティ、イシュートラッキングシステムの問題にどのように影響するかを分析する。
論文参考訳(メタデータ) (Wed, 07 May 2025 00:05:01 GMT)
Integrated Image Reconstruction and Target Recognition based on Deep Learning Technique [3.3] Att-ClassiGAN は,従来の CMI アプローチと比較して,再建時間を大幅に短縮する。
改良された正規化平均二乗誤差(NMSE)、より高い構造類似度指数(SSIM)、再建対象に対するより良い分類結果を提供する。
論文参考訳(メタデータ) (Wed, 07 May 2025 22:34:32 GMT)
AgentSGEN: Multi-Agent LLM in the Loop for Semantic Collaboration and GENeration of Synthetic Data [3.3] データ不足は、建設安全など、安全クリティカルなアプリケーションのためにAIシステムをトレーニングする上で、大きな障害となる。
本稿では,2つのエージェント間の反復的,ループ内協調を用いた新しいマルチエージェントフレームワークを提案する。
LLMの推論能力と常識的知識によって、この共同設計は安全クリティカルなシナリオに合わせた合成画像を生成する。
論文参考訳(メタデータ) (Wed, 07 May 2025 22:43:33 GMT)
Comparative Analysis of Carbon Footprint in Manual vs. LLM-Assisted Code Development [3.3] 本研究の目的は,手動ソフトウェア開発におけるエネルギー消費とLCM支援手法の比較である。
以上の結果から,LSMによるコード生成は,手動よりも平均32.72炭素フットプリントが高いことがわかった。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:52:06 GMT)
High-speed multiwavelength photonic temporal integration using silicon photonics [3.2] 全光時間統合のためのフォトニック・ヒーター・イン・ライトパスユニットを導入する。
我々は、熱光学効果と超高速フォトニクスの速度ギャップを埋める50GHzの光信号を統合するために、遅い熱散逸プロセスを利用する。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:39:18 GMT)
Label-efficient Single Photon Images Classification via Active Learning [3.2] 単一光子LiDARは量子レベルの光子検出技術により、極端な環境で高精度な3Dイメージングを実現する。
現在の研究では、スパース光子現象からの3Dシーンの再構築に焦点が当てられているが、単一光子画像の意味的解釈は未解明のままである。
本稿では,単一光子画像分類のための最初のアクティブラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:57:40 GMT)
YABLoCo: Yet Another Benchmark for Long Context Code Generation [3.1] 本稿では,長期文脈コード生成ベンチマーク(YABLoCo)に貢献する。
ベンチマークでは、数千の関数を持つ4つの大きなリポジトリから選択された215の関数のテストセットが特徴である。
ベンチマークには200Kから2000K LoCまでの大規模なリポジトリが含まれている。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:42:23 GMT)
Neural Operators for Predictor Feedback Control of Nonlinear Delay Systems [3.0] 我々は,予測設計を演算子学習問題として再認識し,ニューラル演算子を介して予測子マッピングを学習する。
近似予測器の下では,閉ループ非線形遅延システムの半言語的実用安定性を実現する。
ニューラル演算子モデルを用いた5リンクロボットマニピュレータの制御によるアプローチの実証を行った。
論文参考訳(メタデータ) (Wed, 07 May 2025 23:41:31 GMT)
SetONet: A Deep Set-based Operator Network for Solving PDEs with permutation invariant variable input sampling [3.0] 我々は、Deep Setsの原則をDeepONetフレームワークに統合する新しいアーキテクチャであるSetONet(SetONet)を紹介します。
中心となるイノベーションはSetONetブランチネットワークにあり、これは入力関数を位置値対の非順序のアンフセットとして処理する。
本稿では, 微分・反微分演算子, 1次元ダーシー流, 2次元弾性などのベンチマーク問題に対して, SetONetの有効性を示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:50:05 GMT)
Recognizing Ornaments in Vocal Indian Art Music with Active Annotation [2.9] R=aga Ornamentation Detection (ROD) は、インドのクラシック音楽の録音を専門のミュージシャンがキュレートした新しいデータセットである。
このデータセットは、カスタムのHuman-in-the-Loopツールを使用して、イベントベースのラベルとしてマークされた6つのボーカル装飾に注釈付けされている。
我々は,長い音声録音のチャンク中に,装飾境界を保った深部時系列解析に基づく装飾検出モデルを開発した。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:52:50 GMT)
MultiSensor-Home: A Wide-area Multi-modal Multi-view Dataset for Action Recognition and Transformer-based Sensor Fusion [2.8] ホーム環境における包括的行動認識のための新しいベンチマークであるMultiSensor-Homeデータセットを紹介する。
また,マルチモーダルマルチビュー変換器を用いたセンサフュージョン (MultiTSF) 法を提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:04:48 GMT)
VideoPath-LLaVA: Pathology Diagnostic Reasoning Through Video Instruction Tuning [2.7] 計算病理学における最初の大規模マルチモーダルモデル(LMM)であるVideoPath-LLaVAを提案する。
3つの異なるイメージシナリオ、単一パッチイメージ、自動抽出されたクリップ、手動によるビデオ病理画像を統合する。
VideoPath-LLaVAは、詳細な組織学的記述を生成し、確定的なサインアウト診断を行うことにより、診断的推論を伴う視覚的物語を橋渡しする。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:41:19 GMT)
Geometric Fault-Tolerant Neural Network Tracking Control of Unknown Systems on Matrix Lie Groups [2.5] 行列リー群上で進化するシステムのための幾何的ニューラルネットワークに基づくトラッキングコントローラを提案する。
本稿では,Lie群構造と本質的に互換性のあるニューラルネットワーク重みに関する学習規則を提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:33:23 GMT)
Seeing Cells Clearly: Evaluating Machine Vision Strategies for Microglia Centroid Detection in 3D Images [2.4] 本研究は,3次元顕微鏡画像におけるミクログリアの中心点を見つけるための3つの異なるツールをテストする。
ツールには、Ilastik、3D Morph、Omniposeが含まれる。
私の研究結果によると、それぞれのツールが独自の方法で細胞を見ることができ、画像から得られる情報の種類に影響を与えます。
論文参考訳(メタデータ) (Wed, 07 May 2025 22:35:48 GMT)
Meta-Learning Loss Functions for Deep Neural Networks [2.4] この論文は、しばしば見過ごされる損失関数のコンポーネントを通して、メタ学習の概念を探求し、パフォーマンスを改善する。
損失関数は学習システムの重要な要素であり、一次学習の目的を表しており、その目的のために最適化するシステムの能力によって、成功が決定され、定量化される。
論文参考訳(メタデータ) (Wed, 07 May 2025 01:38:16 GMT)
CM1 - A Dataset for Evaluating Few-Shot Information Extraction with Large Vision Language Models [2.4] 大規模視覚言語モデル(LVLM)はこの問題に対処するための有望な技術である。
本稿では,LVLMの少数ショット機能を評価するための新しいデータセットを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:08:58 GMT)
Can LLM be a Good Path Planner based on Prompt Engineering? Mitigating the Hallucination for Path Planning [2.3] 本研究では、空間-関係変換とカリキュラムQ-Learning(S2RCQL)という革新的なモデルを提案する。
そこで我々は,Qラーニングに基づく経路計画アルゴリズムを設計し,文脈不整合の幻覚を緩和する。
プロンプトの補助情報として状態反応のQ-値を用いて,LLMの幻覚を補正する。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:00:50 GMT)
User and Recommender Behavior Over Time: Contextualizing Activity, Effectiveness, Diversity, and Fairness in Book Recommendation [2.2] 本稿では,Goodreadsから抽出したUCSD Book Graphデータセットの時間的説明分析について述べる。
2011年におけるアルゴリズムレコメンデーションの導入は,ユーザやレコメンデーションシステムの振る舞いの観察可能な変化に続いたかを検討する。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:45:04 GMT)
AI Governance to Avoid Extinction: The Strategic Landscape and Actionable Research Questions [2.1] 人間性は、人間のエキスパートを著しく上回るAIシステムを開発するために、間もなく進もうとしているようだ。
我々は、デフォルトの軌道は人類の絶滅を含む大惨事の可能性が高いと信じている。
リスクは、強力なAIシステムを制御できないこと、悪意ある悪役によるAIの誤用、大国間の戦争、権威主義的なロックインなどにある。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:35:36 GMT)
Likelihood-Free Adaptive Bayesian Inference via Nonparametric Distribution Matching [2.0] 本稿では,従来のデータ空間の相違を回避したフレームワークであるAdaptive Bayesian Inference (ABI)を提案する。
ABIは、後続分布間のばらつきを測定する問題を、条件付き量子レグレッションタスクのトラクタブルシーケンスに変換する。
ABIはデータベースであるWasserstein, 要約ベースABC, 最先端の可能性のないシミュレータを著しく上回っていることを実証する。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:50:14 GMT)
Large Language Models are often politically extreme, usually ideologically inconsistent, and persuasive even in informational contexts [2.0] 大規模言語モデル(LLM)は、人々が情報を取得し、世界と対話する方法を根本的に変える、変革的な技術である。
LLMの全体的な党派的嗜好は、特定のトピックに対する極端な見解の相違による純結果であることを示す。
ランダム化実験では、LLMは情報検索の文脈においても、自らの好みを政治的説得力に広めることができることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 06:53:59 GMT)
On Synthetic Texture Datasets: Challenges, Creation, and Curation [2.0] 56のテクスチャにまたがる362,880のテクスチャイメージのデータセットを作成します。
画像生成パイプラインにおけるNSFWの安全性フィルタはテクスチャに非常に敏感である。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:13:05 GMT)
Randomized Transport Plans via Hierarchical Fully Probabilistic Design [2.0] バランスよく正規化されたマストランスポート計画の設計のための最適ランダム化戦略を開発した。
決定論的かつ規則化された最適輸送(OT)戦略を置き換えるもので、一定の等価な計画しか得られない。
HFPD-OTは、より多様な契約のサブセットの募集を可能にする。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:47:28 GMT)
From Incidents to Insights: Patterns of Responsibility following AI Harms [1.9] AIインシデントデータベースは航空安全データベースにインスパイアされ、障害からの集合的学習を可能とし、将来のインシデントを防ぐ。
データベースは、ニュースやメディアから収集された数百のAI障害を文書化している。
技術的に焦点を絞った学習を超えて、データセットは新たな、非常に価値のある洞察を提供することができる、と私たちは主張する。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:59:36 GMT)
LiteQSign: Lightweight and Quantum-Safe Signatures for Heterogeneous IoT Applications [1.9] 従来のデジタルシグネチャは、計算量、メモリ、エネルギー資源に制限のあるローエンドデバイスでは利用できない。
LightQSign (LightQS) は、署名当たりのハッシュ操作数が小さいだけで、ほぼ最適のシグネチャ生成効率を実現する。
8ビットマイクロコントローラでは、PQよりも1.5-24倍高いエネルギー効率と1.7-22倍短いシグネチャを実現している。
論文参考訳(メタデータ) (Wed, 07 May 2025 21:53:24 GMT)
Guide your favorite protein sequence generative model [1.9] 本稿では,補助情報をプラグ・アンド・プレイ方式で条件付けるための基本的フレームワークであるProteinGuideについて述べる。
本稿では, タンパク質生成モデルであるプロテインMPNNとESM3の2つを誘導し, アミノ酸および構造トークン配列を生成する手法の適用性を示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 21:56:50 GMT)
Stein's method for marginals on large graphical models [1.9] 分布の局所性を定量化する新しい$delta$-locality条件を導入する。
これらの手法により, 局所化および並列化により, サンプルの複雑さと計算コストを大幅に削減できることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:51:47 GMT)
Quantum Entrepreneurship Lab: Training a Future Workforce for the Quantum Industry [1.9] 量子起業研究所(Quantum Entrepreneurship Lab, QEL)はミュンヘン工科大学(TUM)の1学期制のプロジェクトベースコースである。
QELは、量子セクターにおける学術研究と産業応用のギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:00:03 GMT)
DyCE: Dynamically Configurable Exiting for Deep Learning Compression and Real-time Scaling [1.8] DyCEは、推論ハードウェアの再初期化や再デプロイを必要とせずに、実行時にディープラーニングモデルのパフォーマンスと複雑さのトレードオフを調整することができる。
DyCEは、ResNet152では23.5%、ImageNetではConvNextv2-tinyでは25.9%、精度は0.5%未満である。
論文参考訳(メタデータ) (Wed, 07 May 2025 23:56:40 GMT)
Latent Manifold Reconstruction and Representation with Topological and Geometrical Regularization [1.8] 本稿では,雑音の多い点群から潜在多様体構造を発見できる,多様体再構成層を統合するAutoEncoderに基づく手法を提案する。
ポイントクラウドデータセットの実験では、この手法がt-SNE、UMAP、トポロジカルオートエンコーダといったベースラインより優れていることが示された。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:47:22 GMT)
Gender Disparities in Contributions, Leadership, and Collaboration: An Exploratory Study on Software Systems Research [1.8] 私たちは過去10年間に2000の論文をJournal of Systems and Softwareで分析しました。
分析の結果、全著者の32.74%が女性であり、女性主導または監督された研究は男性よりも少なかった。
第三に、ソフトウェアシステム研究の分野を探索し、女性作家が人間中心の研究領域に積極的に関わっていることを発見した。
論文参考訳(メタデータ) (Wed, 07 May 2025 00:34:38 GMT)
Retrieval Augmented Generation Evaluation for Health Documents [1.8] Retrieval Augmented Generation (RAG) は、Large Language Models (LLM) のポテンシャルを活用するための有望な手法である。
本報告は、医療分野における各種文書の自動知識合成における、そのようなアプローチの可能性と欠点について考察する。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:12:53 GMT)
Timescales, Squeezing and Heisenberg Scalings in Many-Body Continuous Sensing [1.8] 有限時間環境量子フィッシャー情報(QFI)を最適化した連続センシングのための新しい指標を提案する。
この量はシステムサイズと統合時間の両方によって厳密に境界付けられており、ハイゼンベルクのスケーリングを正確に定式化することができる。
また, 高温超放射光センサと散逸スピンストレッサーの2つの多体連続センサを導入している。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:32:56 GMT)
Designing Speech Technologies for Australian Aboriginal English: Opportunities, Risks and Participation [1.8] オーストラリアでは、先住民コミュニティと英語話者との強制的な接触の結果、接触後の言語品種が出現した。
これらの接触型は広く使われているが、言語技術ではサポートされていない。
このギャップは、これらの品種を用いた先住民社会の市民社会と経済社会への参加の障壁となる。
論文参考訳(メタデータ) (Wed, 07 May 2025 00:53:20 GMT)
Predicting Road Surface Anomalies by Visual Tracking of a Preceding Vehicle [1.8] 先行車両の視覚的追跡により路面異常を検出する新しい手法を提案する。
この方法は万能で、穴、バンプ、破片など、あらゆる種類の道路異常を予測できる。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:17:05 GMT)
Communication-Efficient Federated Fine-Tuning of Language Models via Dynamic Update Schedules [1.7] FDA-Optアルゴリズムは、FedOptとFDAの両方の背後にある原則を拡張する統一的な一般化である。
我々は、下流のNLPタスクにまたがる微調整LMに対するアプローチを評価した。
FDA-Optは、現代のFLライブラリーやシステムにおけるFedOptの代替として実用的で、ドロップインの代替であることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:13:21 GMT)
To Judge or not to Judge: Using LLM Judgements for Advertiser Keyphrase Relevance at eBay [1.7] eコマースの売り手は、購入者のエンゲージメントを高めるため、在庫に基づいてキーワードを推奨する(クリック/セール)。
広告主キーフレーズの関連性は 検索システムの浸入を防ぐ 重要な役割を担っています
本研究は,eBay Advertisingのケーススタディを通じて,人間による判断の実用性について論じる。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:03:25 GMT)
Plexus: Taming Billion-edge Graphs with 3D Parallel GNN Training [1.7] グラフニューラルネットワーク(GNN)は、実世界のグラフの接続性と構造を利用して、ノード間の複雑な特性と関係を学習する。
多くの実世界のグラフはGPUのメモリ容量を超えるサイズであり、その上にGNNを使用するには、スケールするためにミニバッチサンプリングのような技術が必要である。
本稿では、これらの問題に対処し、数十億のエッジグラフにスケールするフルグラフトレーニングのための3次元並列アプローチを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 02:49:52 GMT)
Localized Diffusion Models for High Dimensional Distributions Generation [1.7] 対象分布における低次元構造をよりよく理解し活用することの重要性について検討する。
局所構造の下では、スコア関数は事実上低次元であり、サンプルの複雑さを著しく低減した局所ニューラルネットワークによって推定できる。
このような局所化が拡散モデルによって次元の呪い(CoD)を回避できることを実証する。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:51:50 GMT)
Securing Immersive 360 Video Streams through Attribute-Based Selective Encryption [1.7] 本稿では,36degビデオストリーミングに特化して,Attribute-Based Encryption(ABE)と選択暗号化技術を統合する新しいフレームワークを提案する。
提案手法では,不正アクセスに対するロバストな保護を確保しつつ,計算オーバーヘッドを低減するため,異なるレベルのフレームを選択的に暗号化する。
CloudLabテストベッドを使用して提案したアプローチをデプロイし、評価し、そのパフォーマンスを従来のHTTPSストリーミングと比較する。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:37:13 GMT)
Texture Image Synthesis Using Spatial GAN Based on Vision Transformers [1.6] 本研究では,視覚変換器(ViT)と空間生成支援ネットワーク(SGAN)を融合した新しいハイブリッドモデルViT-SGANを提案する。
平均分散(mu, sigma)やテクソンなどの特殊テクスチャ記述子をViTの自己保持機構に組み込むことで, 優れたテクスチャ合成を実現する。
論文参考訳(メタデータ) (Wed, 07 May 2025 21:11:00 GMT)
Quantum Error Correction Without Encoding via the Circulant Structure of Pauli Noise and the Fast Fourier Transform [1.6] 分布誤差補正(DEC)理論を導入し,量子コンピュータの出力分布を理想分布に正確に補正する。
Pauliエラーチャネルでは、DEC for Pauliエラーチャネルは論理量子ビットをより物理量子ビットに符号化する必要がない。
30キュービットのGHZ状態調製では、修正された分布忠実度97.7%が、最初の生忠実度23.2%から達成される。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:16:37 GMT)
Testing Juntas Optimally with Samples [1.6] これは、分布自由サンプルベースモデルにおけるブール関数の自然なクラスをテストするための最初の厳密な境界である。
我々の境界は特徴選択の問題にも当てはまり、ユンタテスターが関連する変数の集合を学ばなければならないことを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:50:15 GMT)
Provable Accuracy Bounds for Hybrid Dynamical Optimization and Sampling [1.6] 本稿では,Langevin Diffusion (BLD) アルゴリズムをブロックすることにより,ハイブリッド LNLS の非漸近収束を保証する。
デバイスの変化が有限であれば、ステップ時間、雑音強度、関数パラメータの2-ワッサーシュタインバイアスに明確な境界を与える。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:32:01 GMT)
Is there Value in Reinforcement Learning? [1.5] アクション・バリューは、一般的なReinforcement Learing(RL)の行動モデルにおいて中心的な役割を果たす。
批評家は、ポリシー・グラディエント(PG)モデルが価値ベース(VB)モデルよりも好まれるべきであると示唆していた。
論文参考訳(メタデータ) (Wed, 07 May 2025 21:50:27 GMT)
Person-In-Situ: Scene-Consistent Human Image Insertion with Occlusion-Aware Pose Control [1.5] 既存の方法では、前景の物によって挿入された人の閉塞を処理できず、非自然に最前面の層に配置することができない。
これらの課題に対処する2つの方法を提案する。
どちらも、3Dボディモデルによる明示的なポーズ制御を可能にし、潜時拡散モデルを利用して、文脈的に適切な深さで人物を合成する。
論文参考訳(メタデータ) (Wed, 07 May 2025 01:47:15 GMT)
Replay to Remember (R2R): An Efficient Uncertainty-driven Unsupervised Continual Learning Framework Using Generative Replay [1.5] 継続学習は、以前獲得した知識を維持しながら、新しいデータから徐々に知識を取得する。
生成的リプレイ(Replay to Remember(R2R))」を用いた新しい不確実性駆動型教師なし連続学習フレームワークを提案する。
提案手法は,98.13%,73.06%,93.41%,95.18%,59.74%の最先端性能を達成した。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:29:31 GMT)
SecureNT: Smart Topology Obfuscation for Privacy-Aware Network Monitoring [1.5] ネットワークトモグラフィーはネットワーク監視と管理において重要な役割を果たしている。
トポロジー情報はエンドツーエンドの測定によって推測できる。
既存の保護手法は、エンド・ツー・エンドの測定を変更することでトポロジ情報を確保しようとする。
本稿では,これらの制約に対処する新しいプライバシー保護フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:39:44 GMT)
Quantum-Inspired Optimization Process for Data Imputation [1.5] 本研究は, UCI Diabetesデータセットで評価された新しい量子インスパイアされた計算フレームワークを提案する。
この手法は、主成分分析(PCA)と量子アシスト回転を統合し、勾配のない古典学を通して最適化する。
統計的忠実性を維持しながら、欠落した値を再構築する。
論文参考訳(メタデータ) (Wed, 07 May 2025 22:37:07 GMT)
Primal-dual algorithm for contextual stochastic combinatorial optimization [1.5] 本稿では,不確実性のある意思決定に対処するために,運用研究と機械学習を統合する,文脈最適化の新しいアプローチを提案する。
我々の目標は、不確実なパラメータやコンテキストに関する過去のデータから推定される経験的リスクを最小化することです。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:37:12 GMT)
Balancing Accuracy, Calibration, and Efficiency in Active Learning with Vision Transformers Under Label Noise [1.4] 本研究では,低予算制約および雑音ラベル下での視覚変換器の性能に及ぼすモデルサイズの影響について検討した。
より大型のViTモデルは、中程度から高いラベルノイズの下でも、精度とキャリブレーションの両方において、より小型のモデルよりも一貫して優れていることを示す。
情報に基づくアクティブラーニング戦略は、中程度のラベルノイズ率で有意な精度の向上しか得られないが、ランダムに取得したラベルで訓練されたモデルに比べてキャリブレーションが低くなる。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:53:13 GMT)
TerraFusion: Joint Generation of Terrain Geometry and Texture Using Latent Diffusion Models [1.4] 潜在拡散モデルを用いて地形の高度マップとテクスチャを共同で生成する手法を提案する。
提案手法は,高さマップとテクスチャの相関を保ちながら,直感的な地形生成を可能にすることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 01:41:12 GMT)
TikTok's recommendations skewed towards Republican content during the 2024 U.S. presidential race [1.3] TikTokは、全世界で10億人以上の月間アクティブユーザーがいて、アメリカでは1億1700万人いるソーシャルメディアプラットフォームの主要な勢力である。
懸念にもかかわらず、政治バイアスに対するTikTokのレコメンデーションアルゴリズムを調査している。
このギャップを埋めるために、2024年のアメリカ合衆国大統領選挙に先立ち、党派的なコンテンツレコメンデーションをテストする323の独立したアルゴリズムによる監査実験を実施します。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:33:29 GMT)
RAFT: Robust Augmentation of FeaTures for Image Segmentation [1.3] RAFTは、最小ラベル付き実世界のデータを用いて画像分割モデルを適応するための新しいフレームワークである。
我々は,合成から現実の「SYNTHIA->Cityscapes」と「GTAV->Cityscapes」ベンチマークの実験を行った。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:02:46 GMT)
Large Scale MRI Collection and Segmentation of Cirrhotic Liver [1.3] 肝硬変は慢性肝疾患の最終段階であり,広範な線維化と結節再生を特徴とする。
肝硬変解析は, 形態変化と異種信号の特徴により, 重大な課題を呈している。
今回,628個の高分解能腹部MRI画像からなるCirrMRI600+について紹介する。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:38:38 GMT)
CLEAR: Cue Learning using Evolution for Accurate Recognition Applied to Sustainability Data Extraction [1.3] 精度認識のための進化的学習法(CLEAR)について紹介する。
CLEARは、LLMと進化計算を組み合わせて、画像の特殊特徴の認識が改善されるようにキューを生成し、最適化する。
CLEARは人間の認識よりも高い精度を実現し,最大2桁の精度で誤り率を向上する。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:39:42 GMT)
Privacy-preserving neutral atom-based quantum classifier towards real healthcare applications [1.3] MLヘルスケアアプリケーションは、データのパフォーマンス、解釈可能性、データプライバシの尊重を極めて必要とします。
近年,データプライバシ保護を目的とした専用手法が開発され始めている。
そこで,SVM(Support Vector Machine)分類器モデルを提案する。
このモデルは、機密データをクラウドで利用可能なQPUに転送する必要がないため、データのプライバシを保護するために匿名化技術を必要としない。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:03:35 GMT)
Optimization of Infectious Disease Intervention Measures Based on Reinforcement Learning - Empirical analysis based on UK COVID-19 epidemic data [1.3] エージェント・ベース・トランスミッション・モデルに基づく意思決定フレームワークを構築した。
コヴァシムは、詳細で広く使われているエージェントベースの疾患伝達モデルであり、強化学習研究を支援するために修正された。
論文参考訳(メタデータ) (Wed, 07 May 2025 06:23:26 GMT)
Exploring Zero-Shot App Review Classification with ChatGPT: Challenges and Potential [1.2] 本研究は,アプリレビューを機能要件,非機能要件,両方,あるいは両方に分類される4つのカテゴリに分類するために,ChatGPTを用いたゼロショット学習の可能性を検討する。
我々はChatGPTのパフォーマンスを、複数のドメインにまたがる10の多様なアプリから手動で注釈付きレビュー1,880のベンチマークデータセットで評価した。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:39:04 GMT)
LLMs' Suitability for Network Security: A Case Study of STRIDE Threat Modeling [1.2] ネットワークセキュリティにおけるLarge Language Models (LLM) の適合性について検討する。
我々は5つのLSMを用いた4つのプロンプト技術を用いて5G脅威のSTRIDE分類を行う。
重要な発見と詳細な知見と,その原因となる要因の説明を指摘する。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:37:49 GMT)
Towards User-Centred Design of AI-Assisted Decision-Making in Law Enforcement [1.2] 法執行機関におけるAI支援システムのユーザ要件は、まだ不明である。
本研究の参加者は,大量のデータを効率的に処理・分析できるシステムの必要性を強調した。
法執行ドメインの動的で複雑な性質のため、システムが完全な自動化を達成する可能性は極めて低い、と私たちは主張する。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:34:46 GMT)
FRAIN to Train: A Fast-and-Reliable Solution for Decentralized Federated Learning [1.2] 非同期学習(FL)は、データの局所性を維持しながら、分散クライアント間で協調的なモデルトレーニングを可能にする。
我々は、2つの重要なアイデアを取り入れることでこれらの制限を緩和する新しいFL手法であるFRAIN(Fast-and-Reliable AI Network)を導入する。
CNNイメージ分類モデルとTransformerベースの言語モデルによる実験では、FRAINはFedAvg、FedAsync、BRAINよりも安定的で堅牢な収束を実現している。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:20:23 GMT)
Registration of 3D Point Sets Using Exponential-based Similarity Matrix [1.0] ポイントクラウド登録はコンピュータビジョンとロボティクスの基本的な問題である。
本稿では,古典的イテレーティブ・クローゼスト・ポイント(ICP)アルゴリズムのロバストな修正を提案する。
提案手法は,ガウスにインスパイアされた指数重み付け方式を統合した指数類似行列 (ESM-ICP) である。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:17:54 GMT)
Quantum Feature Space of a Qubit Coupled to an Arbitrary Bath [1.0] クビット制御プロトコルは伝統的に、そのパワースペクトル密度を通じてクビットバス結合の特性を利用してきた。
従来の研究では、ディープニューラルネットワークと物理符号化層を組み合わせたグレーボックスアプローチを用いて、古典的な浴槽の影響を特徴づけるノイズ演算子の推論が提案されていた。
ここでは、高価なニューラルネットワークは不要であり、このノイズ演算子記述は効率的なパラメータ化を許容することを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 06:55:17 GMT)
On the Vulnerability of Underwater Magnetic Induction Communication [1.0] 磁気誘導(MI)通信は、一般に安全な水中無線通信(UWC)技術と考えられている。
水中MI通信における盗聴攻撃について検討し,この攻撃下でのシステムの脆弱性を定量的に測定した。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:53:18 GMT)
Exploring Convolutional Neural Networks for Rice Grain Classification: An Explainable AI Approach [1.0] 本研究では,異なる品種の米粒を分類するための畳み込みニューラルネットワーク(CNN)に基づく自動フレームワークを提案する。
提案手法は,精度,リコール,精度,F1スコアなどの性能指標に基づいて評価する。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:33:45 GMT)
Privacy Challenges In Image Processing Applications [0.9] プライバシーリスクが高まる主なアプリケーションには、患者の健康データを含む医療や、不正な追跡を可能にする監視システムなどがある。
差分プライバシーは、制御されたノイズを注入することで厳格なプライバシー保証を提供する一方、MPCは生のデータ入力を公開することなく協調分析を促進する。
ホモモルフィック暗号化は暗号化されたデータの計算を可能にし、匿名化は識別要素を直接削除する。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:28:03 GMT)
From Flowers to Fascism? The Cottagecore to Tradwife Pipeline on Tumblr [0.9] 我々はソーシャルメディアの投稿を収集し分析し、コテージコアコンテンツを探すユーザーが、白人至上主義者、白人ナショナリスト、その他の極右極右過激派グループが共同でTradwifeコンテンツを見つけるという美学に基づく過激化を調査した。
文献で見つかった問題のあるトラドウィフポストは、トラドウィフのみの空間に限られる可能性があるが、コテージコアタグのコンテンツは、通常、余分なモデレーションを許さない。
質的な分析では、文献から予想されるよりも、クィアとトラドウィフのアイデンティティが相互作用し、いくつかのトラドウィブには、Tumblrのトラドウィフコミュニティで明らかにクィアの人々と無意識の人種差別が含まれていた。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:50:58 GMT)
How the Misuse of a Dataset Harmed Semantic Clone Detection [0.9] 本稿では,BigCloneBenchが意味的コードの類似性を学習したり評価したりする上で,基礎的真理として用いることが問題であることを示す。
BigCloneBenchをデータセットとして使用する179の論文の文献レビューで、BigCloneBenchを使用してセマンティッククローン検出を評価する139の論文を発見した。
BigCloneBenchの使用は、Type-1、Type-2、Type-3クローンの構文的またはテキスト的クローン検出を評価する目的のために有効である、と強調する。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:52:28 GMT)
Uncovering Key Features for Model-Driven Engineering of Complex Performance Indicators: A Scoping Review [0.9] 本稿では,複合性能指標(CPI)の設計と管理の課題に対処する。
CPIは、顧客満足度やサステナビリティ指標といった、潜在的かつ重要なビジネス要因を測定するために、個々の指標をアマルガットする。
モデル駆動エンジニアリング(MDE)は、これらのハードルを克服し、CPIの採用を保証する強力なソリューションとして現れます。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:20:52 GMT)
A Weak Supervision Learning Approach Towards an Equitable Parking Lot Occupancy Estimation [0.9] 3m解像度の衛星画像を用いて駐車場の占有度を推定する弱い監視枠組みを提案する。
我々は、大型駐車場におけるAUCの0.92を達成するペアワイズ比較モデルを訓練する。
提案手法は、高価な高解像度画像への依存を最小限に抑え、スケーラブルな都市モビリティ解析を約束する。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:27:18 GMT)
Communicating Activations Between Language Model Agents [0.9] マルチ言語モデル (LM) エージェント間の通信は、LMの推論能力を高めることが示されている。
自然言語は、LM間通信の主要な媒体である。
本稿では,LMがアクティベーションを介して通信する手法を提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:03:54 GMT)
Guardians of the Web: The Evolution and Future of Website Information Security [0.8] 本稿では,Webサイトの情報セキュリティの進化,その歴史的展開,現在の実践,今後の方向性について考察する。
1960年代から1980年代にかけて、ARPANET、TCP/IP、公開鍵暗号、および最初のアンチウイルスプログラムの開発により、現代のサイバーセキュリティの基礎を築いた。
Webサイトの情報セキュリティの未来は、人工知能やブロックチェーン、量子コンピューティングといった新興技術によって形作られていくと期待されている。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:46:33 GMT)
IID-Based QPP-RNG: A Random Number Generator Utilizing Random Permutation Sorting Driven by System Jitter [0.8] 本研究では,一様,独立性,等分散(IID)なランダム性を実現するための地中乱数生成手法を提案する。
我々の設計ではシステムジッタを用いて短命なQPPパッドを生成し、置換数から直接8ビット出力を導出する。
IIDベースのQPP-RNGは、IIDの最小エントロピー推定から1バイト当たり7.85-7.95ビットの最小エントロピーを達成する。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:48:30 GMT)
Perpetuating Misogyny with Generative AI: How Model Personalization Normalizes Gendered Harm [0.8] オープンソースのテキスト・トゥ・イメージ(TTI)パイプラインは、AI生成されたビジュアルコンテンツのランドスケープにおいて支配的になっている。
本研究では,オープンソースTTIモデルを共有・開発するための最もアクティブなプラットフォームであるCitvitAIの探索的社会技術分析について述べる。
我々は、安全でない仕事用コンテンツ(NSFW)の急増と、実際の個人を模倣することを目的としたかなりの数のモデルを見出した。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:43:52 GMT)
QBD-RankedDataGen: Generating Custom Ranked Datasets for Improving Query-By-Document Search Using LLM-Reranking with Reduced Human Effort [0.8] 本稿では,独自のQBD検索データセットを生成するプロセスを紹介する。
コスト、スピード、ヒューマンインターフェースの観点から、私たちのメソッドをドメインの専門家と比較します。
テキスト検索会議(TREC)におけるQBDデータセットの手法の評価を行った。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:43:57 GMT)
BedreFlyt: Improving Patient Flows through Hospital Wards with Digital Twins [0.8] デジタル双生児は、短期的な意思決定と、多くのドメインにわたる長期的な戦略的計画のための貴重なツールとして現れています。
本報告では, 病院における院内ニーズに対する資源計画の充実を図るために, ディジタルツインを設計する取り組みについて報告する。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:23:39 GMT)
Overcoming Data Scarcity in Generative Language Modelling for Low-Resource Languages: A Systematic Review [0.7] 本稿では、低リソース言語(LRL)における生成言語モデリングにおけるデータ不足に対処する戦略に焦点を当てる。
モノリンガルデータ拡張、バックトランスレーション、多言語トレーニング、即興エンジニアリングなど、技術的アプローチを特定し、分類し、評価する。
我々は,これらの手法を広い範囲のLRLに拡張することを推奨し,同値生成言語システムを構築する上でのオープンな課題を概説する。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:04:45 GMT)
Evaluating Performance Consistency in Competitive Programming: Educational Implications and Contest Design Insights [0.7] 国際協調プログラミングコンテストの10年間を分析。
スーパーリージョンのランキングでは、ワールドファイナルのランキングは適度にしか予測できない。
Codeforcesの評価は、どのICPC層よりもWorld Finalの結果と強く相関している。
論文参考訳(メタデータ) (Wed, 07 May 2025 05:48:56 GMT)
ASURA-FDPS-ML: Star-by-star Galaxy Simulations Accelerated by Surrogate Modeling for Supernova Feedback [0.7] 代理モデルによって加速される新しい高分解能銀河シミュレーションを導入し、計算コストを約75%削減する。
Zero Age Main Sequence mass of about 10 $mathrmM_odot$ explosion as core-collapse supernovae (CCSNe)
計算コストを削減し,物理スケールギャップを効果的に橋渡しし,マルチスケールシミュレーションを可能にする。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:03:27 GMT)
FEMSN: Frequency-Enhanced Multiscale Network for fault diagnosis of rotating machinery under strong noise environments [0.7] 転がり軸受は回転機械の重要な構成要素であり, 工業生産に不可欠な機能である。
既存の状態モニタリング手法は、時間領域信号から異種の特徴を抽出し、健康状態を評価することに焦点を当てている。
本稿では,FEMSNと呼ばれる新しいCNNモデルを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:58:48 GMT)
Mixed-Curvature Decision Trees and Random Forests [0.7] 決定木とランダムフォレストアルゴリズムを積空間多様体に拡張する。
本手法は積多様体の分類と回帰のための単純で表現力豊かな方法を実現する。
実装と実験のコードはhttps://github.com/pchlenski/embedders.comで公開されている。
論文参考訳(メタデータ) (Wed, 07 May 2025 04:21:53 GMT)
A Large Language Model for Feasible and Diverse Population Synthesis [0.7] ベイズネットワーク(BN)から派生したトポロジ的順序付けにより自己回帰生成過程を明示的に制御する大規模言語モデル(LLM)の微調整法を提案する。
提案手法は、DGM(Deep Generative Model)で観測される80%よりもはるかに高い約95%の実現可能性を実現する。
これにより、メガシティの人口を合成するなど、大規模アプリケーションにとってコスト効率が高くスケーラブルなアプローチが実現される。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:50:12 GMT)
Test It Before You Trust It: Applying Software Testing for Trustworthy In-context Learning [0.6] 大規模言語モデル(LLM)の強力な能力として、インコンテキスト学習(ICL)が登場した。
我々は,テキスト内学習の信頼性を評価するために,MMT4NLというソフトウェアテストに触発されたフレームワークを導入する。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:29:45 GMT)
CDE-Mapper: Using Retrieval-Augmented Language Models for Linking Clinical Data Elements to Controlled Vocabularies [0.6] 臨床データ要素の標準化(CDEs)は、様々な医療システムにまたがる一貫した総合的な患者情報を確保することを目的としている。
既存の方法は、様々な表現と複雑な構造のCDEを標準化する際にしばしば失敗し、臨床研究におけるデータ統合と相互運用性を妨げる。
CDE-Mapperは、CDEと制御語彙のリンクを自動化するために、大規模言語モデルと組み合わせた検索・拡張生成アプローチを活用する革新的なフレームワークである。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:32:05 GMT)
RADLADS: Rapid Attention Distillation to Linear Attention Decoders at Scale [0.6] RADLADSは、ソフトマックスアテンション変換器を線形アテンションデコーダモデルに迅速に変換するためのプロトコルである。
我々の変換プロセスでは350~700万のトークンしか必要とせず、オリジナルの教師モデルを訓練するのに使われるトークンの0.005%以下である。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:54:55 GMT)
Large Means Left: Political Bias in Large Language Models Increases with Their Number of Parameters [0.6] 大規模言語モデル(LLM)は、主に多くの人が様々なトピックの主要な情報源として使っている。
LLMは、しばしば事実の誤りを犯したり、データ(幻覚)を作成したり、バイアスを提示したり、ユーザーが誤った情報に晒したり、意見に影響を与えたりする。
我々は、Wale-O-Matのスコアを用いて、ドイツ連邦議会の最近の投票の文脈において、人気のあるLLMの政治的バイアスを定量化する。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:18:41 GMT)
Discrete Optimal Transport and Voice Conversion [0.6] 我々は、話者間のオーディオ埋め込みを整列させるために、離散的な最適なトランスポートマッピングを用いる。
音声生成における処理後ステップとして離散的最適転送を適用することで、合成音声の誤分類を現実とすることができる。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:04:29 GMT)
Unravelling the non-Markovian spin-boson model and quantum quasi-Otto cycle [0.5] スピンボソンモデルを用いてFabry-P'erotキャビティモードと相互作用する2レベル原子のダイナミクスを記述する。
我々は原子-キャビティ相互作用に基づく非マルコフ準循環プロセスを構築し、これを準オットーサイクルと呼ぶ。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:48:27 GMT)
The Aloe Family Recipe for Open and Specialized Healthcare LLMs [0.5] この研究は、データ前処理とトレーニングの重要な段階を最適化することで、オープン医療用LDMの分野に貢献する。
結果として得られたモデルは、最高のプライベートな代替品と競合することが示され、パーミッシブなライセンスでリリースされている。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:13:14 GMT)
Physics-Informed DeepONets for drift-diffusion on metric graphs: simulation and parameter identification [0.5] 距離グラフ上の非線形ドリフト拡散方程式を解くための新しい物理情報深層学習手法を開発した。
本フレームワークは,グラフ結合物理モデルの精度評価に適用可能である。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:13:00 GMT)
Neural Integral Operators for Inverse problems in Spectroscopy [0.5] 本稿では,第1種の積分方程式による積分作用素の学習に基づく,分子スペクトルの分類のための深層学習手法を提案する。
ディープ・ラーニング・アプローチの問題を定式化するのは逆問題に基づいている。
このモデルは、決定木やサポートベクターマシンといった従来の機械学習アプローチよりも優れており、小さなデータセットでは、他のディープラーニングモデルよりも優れています。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:02:58 GMT)
Dynamic Location Search for Identifying Maximum Weighted Independent Sets in Complex Networks [0.5] 本稿では,最大重み付き独立集合(MWIS)問題を解くための,新しい,効率的なアルゴリズムを提案する。
MWIS問題のNPハード性を考えると,提案アルゴリズムであるDynLSには3つの重要なイノベーションが組み込まれている。
我々の実験結果はDynLSの優れた性能を示し、1000秒以内の高品質なソリューションを一貫して提供した。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:35:53 GMT)
Progress in the development of quantum algorithms and software [0.4] 量子コンピューティングデバイスのための一連のソフトウェアソリューションが開発された。
本ソフトウェアパッケージは、応用タスクのプロトタイプを解くための量子アルゴリズムのセットを含む。
クラウドベースの量子コンピューティングプラットフォームを使用して量子アルゴリズムを実行することに言及する必要がある。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:43:08 GMT)
Steiner Traveling Salesman Problem with Quantum Annealing [0.4] シュタイナー旅行セールスマン問題(Steiner Traveling Salesman Problem、STSP)は、古典的な旅行セールスマン問題の変種である。
STSPのNPハード性を考えると、この問題に対処するための量子的アプローチを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:16:50 GMT)
An automated end-to-end deep learning-based framework for lung cancer diagnosis by detecting and classifying the lung nodules [0.4] 本研究の目的は,肺結節の早期発見と分類のためのエンド・ツー・エンド深層学習フレームワークを提案することである。
提案するフレームワークは,3次元U-Netを改良した3次元Res-U-Netを用いた肺分画,YOLO-v5を用いた結節検出,Vision Transformerベースのアーキテクチャを用いた分類の3段階からなる。
提案したフレームワークは,低リソース環境下での肺癌検診の精度と効率を向上し,患者の予後を向上する可能性がある。
論文参考訳(メタデータ) (Wed, 07 May 2025 22:26:44 GMT)
Clock precision beyond the Standard Quantum Limit at $10^{-18}$ level [0.4] 高精度で精度の低い光学原子時計は、精密測定科学のフロンティアを前進させた。
クロック精度の基本的な制限は標準量子限界(Standard Quantum Limit)であり、これは各原子の非相関な投射ノイズに由来する。
ここでは、1つのスピンスクイーズクロックに対して1.1$times 10-18$の分数周波数精度を示す。
これらの結果は、現在の最も正確な絡み合いの時計を確立し、重力と量子絡み合いの相互作用を探索するための強力なプラットフォームを提供する。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:15:25 GMT)
Approximate Quadratization of High-Order Hamiltonians for Combinatorial Quantum Optimization [0.4] 我々は、キュービットオーバーヘッドを生じさせない高階ハミルトニアンの近似二次化を導入する。
この近似により、標準QAOAよりもノイズに強いアンサツェがより浅い。
また、2次最適化問題に対する雑音対応アンザッツ設計法を提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:00:07 GMT)
Advanced Deep Learning Approaches for Automated Recognition of Cuneiform Symbols [0.4] 5つの異なるディープラーニングモデルが、キュニフォーム文字の包括的データセットに基づいて訓練された。
2つのモデルが優れた性能を示し、その後、ハンムラビ法取得のキュニフォームシンボルを用いて評価された。
各モデルは、記号の関連するアッカディアンの意味を効果的に認識し、正確な英訳を提供した。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:05:23 GMT)
Measurement-driven quantum advantages in shallow circuits [0.4] 量子アドバンテージスキームは、古典的にシミュラブルな量子システムと、この領域を超えるものの境界を探索する。
本稿では,高密度瞬時量子時間回路の広いクラスから効率よくサンプリングする,一定深度測定駆動方式を提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:00:51 GMT)
DA-Mamba: Domain Adaptive Hybrid Mamba-Transformer Based One-Stage Object Detection [0.4] ドメイン適応型マンバ型一段階物体検出モデルDA-マンバについて述べる。
Mambaアーキテクチャのグローバルなモデリングと線形複雑性にインスパイアされ、最初のドメイン適応型Mambaベースのワンステージオブジェクト検出モデルであるDA-Mambaを提示する。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:18:31 GMT)
Tracing Vulnerability Propagation Across Open Source Software Ecosystems [0.3] 提案するトレーサビリティ解析では,28のオープンソースソフトウェアエコシステムに8400万以上の脆弱性が分散している。
関連する伝播遅延は長く、これらは関連する配列に関わる生態系の数とよく相関しない。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:38:11 GMT)
SMMT: Siamese Motion Mamba with Self-attention for Thermal Infrared Target Tracking [0.3] 本論は, 小説『シームズ・モーション・マンバ・トラッカー』(SMMT)を提唱する。
動作特徴を抽出し,見落としているエッジの詳細を復元するために,Motion Mamba モジュールを Siamese アーキテクチャに導入する。
さらに、特に動きブルの目標に対して、トラッキング精度を向上させるために、動きエッジ認識の回帰損失を設計する。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:02:04 GMT)
Extending a Quantum Reinforcement Learning Exploration Policy with Flags to Connect Four [0.2] 旗に基づく行動選択は、旗を用いて州空間の探索を改善する強化学習(RL)探索政策である。
本研究では,この手法をConnect Fourのコンテキストに適用し,その性能を異なる環境で研究する。
いずれのフラグ付き探査政策も、単純なエプシロングレーディ政策よりも明らかに優れていることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:44:59 GMT)
Investigating Popularity Bias Amplification in Recommender Systems Employed in the Entertainment Domain [0.2] 本研究は,エンターテイメント分野における推薦システムにおける人気バイアスの増幅に関する研究をまとめたものである。
商品の推薦頻度が人気と正の相関があることを実証する。
その結果、人気コンテンツへの関心がほとんどないユーザグループは、人気のあるアイテムを好むユーザに比べて、精度の低いレコメンデーションを受けることができた。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:45:31 GMT)
Large Language Models are Autonomous Cyber Defenders [0.2] 自律サイバーディフェンス(ACD)は、人工知能(AI)エージェントによるインシデント対応を自動化することを目的としている。
ほとんどのACDアプローチは単一エージェントシナリオにフォーカスし、強化学習(RL)を活用する。
大きな言語モデル(LLM)は、一般的なセキュリティコンテキストで説明可能なアクションを提供することによって、これらの問題に対処することができる。
論文参考訳(メタデータ) (Wed, 07 May 2025 22:42:37 GMT)
Bayesian computation with generative diffusion models by Multilevel Monte Carlo [0.2] 生成拡散モデルは、逆問題におけるサンプリングを行うための強力な戦略として登場した。
しかし、拡散モデルでは、正確な後部サンプルを提供するために、サンプル毎に多数の神経機能評価を必要とすることが多い。
本稿では,拡散モデルを用いたベイズ応用のコストを大幅に削減するマルチレベルモンテカルロ戦略を提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:54:37 GMT)
Cyber Security Data Science: Machine Learning Methods and their Performance on Imbalanced Datasets [0.2] サイバーセキュリティは世界中のあらゆるレベルで、個人、機関、政府に欠かせないものとなっている。
いくつかのサイバーセキュリティアプリケーションは、異常検出、不正検出、侵入検出、スパム検出、マルウェア検出など、バイナリ分類の問題として対処できる。
最初の実験では, ランダムフォレスト, ライトグラディエントブースティングマシン, eXtreme Gradient Boosting, Logistic Regression, Decision Tree, Gradient Boosting Decision Treeなど, 単一分類器の評価を行った。
第2の実験では、オーバーサンプリング、アンダーサンプリング、シンセティックマイノリティオーバーサンプリング技術、セルフペーストエンなど、さまざまなサンプリング手法を試した。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:57:33 GMT)
Towards Federated Digital Twin Platforms [0.1] 近年、デジタル(DT)技術はかなり人気があり、生産プロセスを約束し、サイバー物理システムの運用を管理している。
DTには、モデルやデータなど、さまざまな種類のアセットを含めることができる。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:13:15 GMT)
REVEAL: Multi-turn Evaluation of Image-Input Harms for Vision LLM [0.1] 視覚大言語モデル(VLLM)における画像入力障害を評価するためのスケーラブルで自動化されたパイプラインであるREVEAL Frameworkを紹介する。
VLLMs, GPT-4o, Llama-3.2, Qwen2-VL, Phi3.5V, Pixtralの5種を, 性的被害, 暴力, 誤報の3つの重要な危険カテゴリーで評価した。
GPT-4oは、我々の安全ユーザビリティ指標(SUI)で測定された最もバランスの取れた性能を示し、Pixtralに近づいた。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:09:55 GMT)
Winning at All Cost: A Small Environment for Eliciting Specification Gaming Behaviors in Large Language Models [0.0] 本研究では,フロンティア大規模言語モデル(LLM)が,不可能な状況に直面した場合,いかにして「システム」をプレイできるかを明らかにする。
そこで本研究では, テキストシミュレーション手法を用いて, t-tac-toeシナリオを用いた3つのLLMを提示した。
より新しく、推論にフォーカスしたo3-miniモデルは、システムの脆弱性を悪用する確率の2倍近くを示しました。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:59:56 GMT)
Weaponizing Language Models for Cybersecurity Offensive Operations: Automating Vulnerability Assessment Report Validation; A Review Paper [0.0] 大規模言語モデル(LLM)は、防衛および攻撃的なサイバーセキュリティ関連戦略のための非常に有望なツールとして登場した。
本稿では,脆弱性評価(VA)レポートの検証プロセスの自動化と改善におけるLCMの能力について検討する。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:14:55 GMT)
Voltage-tunable, femtometer-precision plasmo-mechanical displacement at fixed gap size [0.0] プラズモメカニカルな変位とスクイーズを連続的に電気的に調整するエレガントな手法を提案する。
我々は、カンチレバーを曲げるのではなく、単にギャップ強度を電気的に調整するだけなので、ファノ共鳴を介して、プラズモメカニカルカップリングを行う。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:19:21 GMT)
Verification of Digital Twins using Classical and Statistical Model Checking [0.0] デジタルツイン(DT)の概念は、産業と学術の両方で広く注目を集めている。
自律走行トラックのDTにこれらの技術を適用した結果について報告する。
これらの検証手法の結果、このDTはデッドロック自由度と機能的正しさの性質に固執するが、タイムラインの性質に固執するものではないことが示唆された。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:12:46 GMT)
Unmasking the Canvas: A Dynamic Benchmark for Image Generation Jailbreaking and LLM Content Safety [0.0] 既存の大規模言語モデル(LLM)は急速に進歩しており、画像生成タスクにおいて優れた結果が得られている。
しかし、コンテンツの安全性チェックは、プロンプトベースのジェイルブレイクに弱いままだ。
画像生成におけるLLM脆弱性を評価するベンチマークデータセットである Unmasking the Canvas (UTC Benchmark) を紹介する。
論文参考訳(メタデータ) (Wed, 07 May 2025 05:54:04 GMT)
Unconventional photon blockade in cavity QED with parametric amplification [0.0] 本研究では, 量子干渉誘起光子遮断効果について検討した。
我々は、コヒーレントに原子を駆動すると、コヒーレントに駆動されるキャビティよりも強い光子遮断が起こることを示す。
この研究は、量子技術への応用のための強力な反束単一光子源を実験的に実現するのに適しているかもしれない。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:34:21 GMT)
Traveling-Wave Parametric Amplifier with Passive Reverse Isolation [0.0] トラベリング・ウェーブ・パラメトリック増幅器(TWPA)はブロードバンド増幅とほぼ量子制限ノイズ性能に多くの注目を集めている。
この制限に対処するマルチステージトラベリング・ウェーブ・パラメトリック増幅器(mTWPA)を提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 02:02:53 GMT)
Topological materials with extensive flat-band surface states [0.0] トポロジカル・ノダール線半金属の薄いスラブを記述するハミルトニアンは、特定の条件下で表面全体にまたがるゼロエネルギー固有状態を持つ。
我々はパラメータ空間の領域における新しい位相遷移を報告し、ハニカム格子上の北エフモデルによって記述された積み重ね層によってハミルトニアンが実現可能であることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:43:41 GMT)
Theory of quantum error mitigation for non-Clifford gates [0.0] 量子誤差緩和技術は、複数の関連する雑音回路を実行することで、ノイズのない量子回路を模倣する。
そのような技法がいかにうまく機能するかは、根底にある門がいかにうるさいかに強く依存していると考えられている。
本稿では,これらの手法を非クリフォードゲートに一般化する。
論文参考訳(メタデータ) (Wed, 07 May 2025 21:18:43 GMT)
Theoretical Guarantees for LT-TTD: A Unified Transformer-based Architecture for Two-Level Ranking Systems [0.0] LT-TTD (Listwise Transformer with Two-Tower Distillation) は、検索とランキングフェーズをブリッジする新しい統合アーキテクチャである。
LT-TTDは, 知識蒸留強度に依存する因子によって, 検索不可能な関連項目の上限を下げることを示す。
また、統一されたランキングアーキテクチャに特化して設計された新しい評価指標UPQEを紹介する。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:01:22 GMT)
The quantum relative entropy of the Schwarzschild black-hole and the area law [0.0] 任意のシュワルツシルト半径に対するシュヴァルツシルトブラックホールの量子相対エントロピーの領域法則を導出する。
量子相対エントロピーはアラキエントロピーを一般化し、ゼロ形式、一形式、二形式の間の計量を量子作用素として扱う。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:15:30 GMT)
The formation of a nuclear-spin dark state in silicon [0.0] ゲート定義シリコン二重量子ドットにおける核スピン暗黒状態の形成について報告する。
暗黒状態は、一重項と三重項の電子スピン状態の間の緩和速度を著しく減少させる。
この核スピン暗黒状態は量子メモリや量子センシングに応用できる可能性がある。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:17:54 GMT)
The Geometry of Meaning: Perfect Spacetime Representations of Hierarchical Structures [0.0] 3次元ミンコフスキー時空に階層構造を埋め込む高速アルゴリズムが存在することを示す。
我々の結果は、すべての離散データが3次元の完全な幾何学的表現を持っていることを示唆しているように思われる。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:41:06 GMT)
Technology prediction of a 3D model using Neural Network [0.0] 本稿では,製造工程と製造期間を製品3Dモデルから直接予測するデータ駆動型手法を提案する。
モデルを複数の2Dイメージにレンダリングし、Generative Query Networkにインスパイアされたニューラルネットワークを活用することにより、幾何学的特徴を時間推定にマッピングすることを学ぶ。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:45:44 GMT)
Systematic construction of asymptotic quantum many-body scar states and their relation to supersymmetric quantum mechanics [0.0] 量子多体散乱(AQMBS)状態を構築するための体系的手法を開発した。
AQMBS状態は量子多体散乱(QMBS)状態と密接に関連しているが、それらは重要な違いを示す。
我々の定式化は、QMBSと超対称性(SUSY)量子力学の関連を明らかにする。
論文参考訳(メタデータ) (Wed, 07 May 2025 23:30:45 GMT)
Spontaneous Raman scattering out of a metastable atomic qubit [0.0] 我々は、976nmの光で照らされた40$Ca$+$イオンの準安定な$D_5/2$ qubit多様体から自発的ラマン散乱率を測定する。
これは、1量子ゲートと2量子ゲートの双方の種類の散乱による誤差率の計算を支援する。
論文参考訳(メタデータ) (Wed, 07 May 2025 23:32:33 GMT)
Spin systems as quantum field theories in inflationary universe: A study with Unruh-DeWitt detectors [0.0] スピン系でシミュレートされたインフレーション宇宙における量子場理論(QFT)の熱的性質を探索する手法を提案する。
検出器はスピン点数の適切なパワーでQFTの結果に応答することを示した。
論文参考訳(メタデータ) (Wed, 07 May 2025 02:58:29 GMT)
Spectral and Temporal Denoising for Differentially Private Optimization [0.0] 本稿では,DP-SGDの性能維持の課題に対処する,差分プライベートな最適化手法であるFFTKFを提案する。
FFTKFは周波数領域のノイズシェーピングとカルマンフィルタを統合して、$(varepsilon, delta)$-DP保証を維持しながら勾配品質を向上させる。
FFTKFは$mathcalO(d log d)$で、DP-SGDとDiSKよりも精度が向上している。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:38:58 GMT)
Single-bounce quantum gravimeter to measure the free-fall of anti-hydrogen [0.0] 物質波重力計の革新的な概念を導入し、ハイゼンベルクに制限された量子状態の原子が表面に1バウンスを発生させ、干渉を露呈する自由落下を発生させる。
量子重力計に対するこの新しいアプローチは、以前のマルチバウンス提案と比較して、より堅牢な干渉パターンを生成する。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:48:03 GMT)
Silicon Sovereigns: Artificial Intelligence, International Law, and the Tech-Industrial Complex [0.0] 人工知能は科学、社会、権力を変えつつある。
政府が追いつくのに苦労している中、電力は少数のテック企業によって統合されている。
このエッセイは、この変化が国際法、グローバルエクイティ、シリコンの主権の時代における民主的監視の未来にとって何を意味するかを説明する。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:36:39 GMT)
Sharpness-Aware Minimization with Z-Score Gradient Filtering for Neural Networks [0.0] シャープネスを意識する最小化は、パラメータの近傍で最悪のケース損失を最適化することで、ニューラルネットワークの一般化を改善する。
ZSharpは,階層的Zスコア正規化とパーセンタイルに基づくフィルタリングを併用した,シャープなシャープネスを意識した最適化手法である。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:21:19 GMT)
Revisiting the relaxation of constraints in gauge theories [0.0] 近年、ゲージ理論の経路積分量子化は必然的にラグランジュ的制約の緩和を必要とすると主張する研究がある。
この緩和は、ラグランジアン理論において作用原理のレベルでゲージを固定するときに通常起こるものであることを示す。
すなわち、ゲージ理論を定量化する方法の1つは、拡張ハミルトニアン(英語版)を構築し、それを第二級系にするなど、手で新しい条件を加えることである。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:28:01 GMT)
Resonant pump intensity dependence of luminescence achieved via Floquet engineering [0.0] ハイブリッド系において, 励起波の周波数がポラリトン遷移に近い場合, 蛍光の非単トン依存性と散乱振幅がポンプ強度に及ぼす影響は, 共鳴的応答が狭い。
この依存は非線形光学デバイスの作成の道を開く。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:29:01 GMT)
Red Teaming the Mind of the Machine: A Systematic Evaluation of Prompt Injection and Jailbreak Vulnerabilities in LLMs [0.0] 大規模言語モデル(LLM)は、消費者およびエンタープライズアプリケーションにますます統合されている。
その能力にもかかわらず、アライメントセーフガードをオーバーライドする迅速な注射やジェイルブレイクのような敵の攻撃を受けやすいままである。
本稿では,様々な最先端のLDMに対するジェイルブレイク対策を体系的に検討する。
論文参考訳(メタデータ) (Wed, 07 May 2025 21:15:40 GMT)
Ranked differences Pearson correlation dissimilarity with an application to electricity users time series clustering [0.0] 時系列クラスタリングは、医療、金融、経済学、エネルギー、気候科学などの分野で使われている。
本研究では,Pearson相関異性度(RDPC)と呼ばれる新しい異性度尺度を提案し,Pearson相関異性度(Pearson correlation dissimilarity)と最大の相違点(Pearson correlation dissimilarity)の重み付き平均値を組み合わせた。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:39:00 GMT)
Random sampling of permutations through quantum circuits [0.0] 我々は,Steinhaus-Johnson-Trotterアルゴリズムからインスピレーションを得た,置換のランダムサンプリングのための古典的アルゴリズムを提案する。
我々は、置換のランダムサンプリングに量子回路モデルを用いた古典的アルゴリズムの量子アナログを開発する。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:16:35 GMT)
Quantum-enabled optical large-baseline interferometry: applications, protocols and feasibility [0.0] 光学超長基線干渉計は、天文学的な画像と精密な測定の両方において、前例のない角分解能の可能性を秘めている。
量子対応VLBIの最近の進歩は、絡み合い支援プロトコル、量子メモリストレージ、非局所計測技術による課題に対処することを目的としている。
これらの技術がどのようにジオデシーに拡張されるのか、具体的には地球の自転のモニタリングについて検討する。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:43:11 GMT)
Quantum refrigerator embedded in spin-star environments: Scalings of temperature and refrigeration time [0.0] 本稿では,3つの量子ビットからなる量子吸収冷凍機について検討する。
スピン星環境は本質的に非マルコフ的であるため、定常状態の冷却は達成できないかもしれない。
本研究では, 自律冷却条件を導出し, 最適冷却キュービット温度を浴槽数とともに解析する。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:53:05 GMT)
Quantum precursors to Kolmogorov-Arnold-Moser theorem in Floquet spin-$J$ systems [0.0] Kolmogorov-Arnold-Moser (KAM) の定理は、古典的可積分ハミルトニアンの共鳴トーラスが非可積分摂動を導入したときに破れることを証明している。
我々はKAM定理の量子前駆体を1自由度スピンハミルトニアンは瞬時キックによって摂動する。
論文参考訳(メタデータ) (Wed, 07 May 2025 23:54:28 GMT)
Quantum information processing in modular cavity QED architectures [0.0] この論文は空洞量子力学(QED)を用いた量子情報処理の様々な側面を探求する。
まず, 共振器から放射される音場の測定を, 立方体内雑音スペクトルに利用する方法を示す。
第3章では、縦共振器-量子ビット結合の適切な変調を利用できる新しい量子光学効果を示す。
第4章では、位相の最大感度推定にもqubit-of-path 絡み合いを利用することができる。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:29:43 GMT)
Quantum geometry and adiabaticity in molecules and in condensed matter [0.0] 断熱定理は、ハミルトニアンの時間進化が「無限に遅い」とき、系は常に瞬間的な基底状態のままである。
これは、一般可観測体の断熱的進化が、即時固有状態に対する期待値として単に得られるという意味ではない。
量子幾何学的な性質の別の断熱的用語があり、これはいくつかの静的あるいは断熱的観測物に関係している。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:40:22 GMT)
Quantum data-hiding scheme using orthogonal separable states [0.0] 両部量子状態の識別と分離可能な状態アンサンブルを用いた量子データハイディング方式を提案する。
提案手法では,低次元量子系の分離可能な状態を用いるため,実用的な実装が可能となる。
論文参考訳(メタデータ) (Wed, 07 May 2025 01:45:58 GMT)
Quantum Max d-Cut via qudit swap operators [0.0] 量子ビット系の量子マックスカット(QMC)問題は、2-局所ハミルトン問題の一例である。
本稿では,キューディット系におけるQMC問題の高次元アナログ構造について検討する。
論文参考訳(メタデータ) (Wed, 07 May 2025 05:43:34 GMT)
Proceedings The 13th International Workshop on Theorem proving components for Educational software [0.0] ThEduシリーズは、中等教育における数学の直感的な方法から、STEM教育におけるより形式的なアプローチへのスムーズな移行を追求している。
この巻の論文はテドゥの広いスペクトルの忠実な表現である。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:30:54 GMT)
Preparing for the Post Quantum Era: Quantum Ready Architecture for Security and Risk Management (QUASAR) -- A Strategic Framework for Cybersecurity [0.0] 従来の暗号システムでは、量子アルゴリズムの能力のため、偏光の脅威に直面している。
本稿では,Quantum-Ready Architecture for Security and Risk Management (QUASAR)を紹介する。
QUISARは、現在の暗号システムから量子抵抗代替システムに移行するための構造化されたアプローチを提供する。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:08:48 GMT)
Phase Diagram from Nonlinear Interaction between Superconducting Order and Density: Toward Data-Based Holographic Superconductor [0.0] 物理インフォームドニューラルネットワークを用いて、位相遷移の振る舞いを理解するために必要となる質量関数$M(F2)$を求める。
我々は,アルゴリズムの学習過程を改善するために位置埋め込み層を導入し,Adam最適化を用いてホログラフィック計算による臨界温度データを精度良く予測する。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:12:16 GMT)
PAHA: Parts-Aware Audio-Driven Human Animation with Diffusion Model [0.0] 拡散モデルを用いた音声駆動上半身アニメーションフレームワークPAHAを提案する。
本稿では、PAR(Parts-Aware Re-weighting)とPCE(Parts Consistency Enhancement)の2つの主要な手法を紹介する。
我々は,中国初の公開ニュースアンカー音声データセットであるCNASを構築し,この分野の研究と検証を進めた。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:47:51 GMT)
PAC-Bayesian risk bounds for fully connected deep neural network with Gaussian priors [0.0] 完全連結ベイズニューラルネットワークはスパースネットワークに匹敵する収束率が得られることを示す。
我々の結果は、リプシッツ連続である幅広い実用的なアクティベーション関数のクラスに当てはまる。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:42:18 GMT)
On Multivariate Financial Time Series Classification [0.0] 小規模とビッグデータのアプローチを比較して、それぞれの課題とスケーリングのメリットに注目します。
SVMのような従来のメソッドは、ConvTimeNetのようなモダンなアーキテクチャとは対照的である。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:58:40 GMT)
OAEI-LLM-T: A TBox Benchmark Dataset for Understanding Large Language Model Hallucinations in Ontology Matching [0.0] 大規模な言語モデル(LLM)を用いた下流タスクでは、幻覚は避けられないことが多い。
我々は、OAEI-LLM-Tと呼ばれる新しいベンチマークデータセットを導入し、OMタスクを実行する異なるLLMの幻覚をキャプチャする。
これらのOM特異的幻覚は、慎重に2つの主要なカテゴリーと6つのサブカテゴリに分類される。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:02:02 GMT)
Numerical modeling for trapped-ion thermometry using dark resonances [0.0] 熱運動を受けるイオンのスペクトルを数値シミュレーションするために, 簡易な動的方程式を用いたいくつかの手法について議論した。
本研究は, 温度推定において, 熱的運動の効果を付加的に模倣することは, 計算上非常に便利であるが, 重大な誤差を生じさせる可能性があることを観察する。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:28:50 GMT)
Nonreciprocal interactions induce frequency shifts in superradiant lasers [0.0] スーパーラジアントレーザーは、不整合に駆動された原子を損失キャビティに結合して構成する。
原子のごく一部が駆動されない場合、発振周波数の変化と線幅の拡大が起こり、超ラジアントレーザーの性能が制限されることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:44:18 GMT)
Nonlinear Terahertz electroluminescence from Dirac-Landau polaritons [0.0] 我々は, THz磁気電界分光法によるディラック・ランダウ分極の観測を報告する。
HgTe量子井戸における2次元ディラックフェルミオンのサイクロトロン遷移と光キャビティモードとの強い結合を示す。
これらの発見は、サイクロトロン放射に基づくディラック・ランダウ・ポラリトン凝縮体と低閾値波長可変テラヘルツ・ポラリトンレーザーの開発に期待できる可能性を開く。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:27:42 GMT)
Nonadiabatic ring-polymer instanton rate theory: a generalised dividing-surface approach [0.0] 環-ポリマーインスタントン理論は、この問題を解決するための有望なアプローチを提供する。
我々は、2つの極限の間の橋渡しを一般化した非断熱的インスタントンレート理論を開発する。
結果として生じる理論は、研究されたシステムにとって量子力学の正確な速度をよく近似する。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:47:59 GMT)
Nanoscale Mechanical Structures Fabricated from Silicon-on-Insulator Substrates [0.0] シリコン・オン・絶縁体基板からサブミクロン・メカニカル構造を作製する手法について述べる。
このような製法が最初に報告された方法である。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:11:17 GMT)
Multitask LSTM for Arboviral Outbreak Prediction Using Public Health Data [0.0] 本稿ではブラジル・レシフェにおけるアルボウイルスの発生とケースカウントの同時予測のためのマルチタスク学習手法を提案する。
提案モデルでは,バイナリ分類(アウトブレイク検出)と回帰(ケース予測)タスクを同時に実行する。
このアーキテクチャは、病気やタスク間での競合的なパフォーマンスを提供し、データ限定の公衆衛生シナリオにおけるスケーラブルな流行予測のための統合モデリング戦略の実現可能性とメリットを実証する。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:58:18 GMT)
Multi-modal cascade feature transfer for polymer property prediction [0.0] 高分子特性予測のための多モードカスケードモデルを提案する。
提案手法は,単一特徴量を用いた従来手法と比較して高い予測性能を示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:13:22 GMT)
Mori-Zwanzig latent space Koopman closure for nonlinear autoencoder [0.0] 本研究は、低次元空間におけるクープマン作用素を頑健に近似する、MZ-AE(Mori-Zwanzig autoencoder)と呼ばれる新しいアプローチを提案する。
提案手法は非線形オートエンコーダを用いて,有限不変なクープマン部分空間を近似するキーオブザーバブルを抽出する。
倉本・シヴァシンスキー(KS)の低次元近似を提供し、短期予測可能性と堅牢な長期統計性能を提供する。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:34:44 GMT)
Mollow-like triplets in ultra-fast resonant absorption [0.0] 滑らかなレーザー場の共振吸収により, モロー状三重項パターンが得られることを示す。
このような三重項の一般的な条件は、超ガウスパルスシーケンスによって導出され、図示される。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:31:51 GMT)
MoDE: Mixture of Diffusion Experts for Any Occluded Face Recognition [0.0] 本稿では,OFRの拡散専門家(MoDE)の同一性を持つ混合体を提案する。
複数再構成された顔から有効な情報をアンサンブルするために,アイデンティティ・ゲーティング・ネットワークを導入する。
私たちのMoDEは、既存のほとんどの顔認識モデルのためのプラグイン・アンド・プレイモジュールです。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:29:39 GMT)
Mean-field Mixed Quantum-Classical Approach for Many-Body Quantum Dynamics of Exciton-Polaritons [0.0] 我々は、単一励起部分空間を超えた励起子と励起子-偏光子の量子力学をシミュレートするために、混合量子古典(平均体)多体アプローチを用いる。
本研究では, 励起数と励起励起子-励起子相互作用の強度が輸送, Fr"ohlich散乱, 脱コヒーレンスに非線形にどう影響するかを検討した。
論文参考訳(メタデータ) (Wed, 07 May 2025 01:06:50 GMT)
Long-Range Interacting Many-Body Systems in the Irrep Basis [0.0] 無限範囲で均質なオール・ツー・オール相互作用を特徴とする多体スピンモデルを効率的に記述することができる。
しかし、長いが有限範囲の相互作用など、系の置換不変性が弱くなると、これらのツールは数学的に無効になる。
ここでは、これらのシナリオを、対称部分空間への結合の階層構造に従って追加の多体部分空間を考えることによって概説する。
我々は、これらの余剰部分空間を定義して、近似の各順序でそれらの次元を最小化する「既約蒸留」という手順を提唱した。
論文参考訳(メタデータ) (Wed, 07 May 2025 23:12:36 GMT)
Leveraging Simultaneous Usage of Edge GPU Hardware Engines for Video Face Detection and Recognition [0.0] 本稿では,エッジGPUで利用可能なハードウェアエンジンの同時使用を最大化することを目的とする。
これには、ほとんどの顔監視アプリケーションで必要とされるビデオデコーディングタスクが含まれている。
結果は、最近のNVIDIAエッジOrin GPUで利用可能なすべてのハードウェアエンジンを同時に使用し、高いスループットと約300mWの電力消費をわずかに削減し、約5%を占めることを示唆している。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:22:17 GMT)
Learning to Play Two-Player Perfect-Information Games without Knowledge [0.0] 本稿では,強化によるゲーム状態評価関数の学習手法を提案する。
一つは木のブートストラップの一般化(ツリー学習)であり、知識のない強化学習の文脈に適応する。
2つ目は、最良な動作列を終端状態まで延ばす非有界深さを持つミニマックスの修正である。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:03:07 GMT)
Learning from Similarity Proportion Loss for Classifying Skeletal Muscle Recovery Stages [0.0] 本稿では,2つのバッグの組み合わせから得られる類似度比の損失を利用した,類似度分布からの正規スケール学習(OSLSP)を提案する。
骨格筋の回復段階の分類作業において,OSLSPを用いたモデルは,大規模な事前訓練および微調整モデルよりも優れていた。
論文参考訳(メタデータ) (Wed, 07 May 2025 06:02:27 GMT)
LRFusionPR: A Polar BEV-Based LiDAR-Radar Fusion Network for Place Recognition [0.0] 自律運転においては、位置認識はGPSを用いた環境におけるグローバルな位置決めに不可欠である。
本稿では,LiDARを単一チップまたは走査型レーダーで融合させることにより,認識精度とロバスト性を向上させるLRFusionPRを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 06:07:08 GMT)
Izhikevich-Inspired Temporal Dynamics for Enhancing Privacy, Efficiency, and Transferability in Spiking Neural Networks [0.0] 本稿では,Poisson-BurstとDelayed-Burstの2つの入力レベル時間スパイク変換を提案する。
Poisson-Burstは入力強度に基づいてバースト発生を変調し、Delayed-Burstはバースト開始タイミングを通じて入力強度を符号化する。
これらの知見は, 神経形学習システムのプライバシー, 一般化, 生物学的妥当性向上における生物学的基盤の時間的スパイクダイナミクスの可能性を明らかにするものである。
論文参考訳(メタデータ) (Wed, 07 May 2025 00:27:00 GMT)
Is the end of Insight in Sight ? [0.0] 物理インフォームドニューラルネットワーク(PINN)を用いた希薄ガス力学問題に対するディープラーニングアプリケーションの重み行列は、物理問題の数学的構造と明らかな関連性を持たないことが示されている。
結果は、ボルツマン方程式のディープラーニングと数値解は、同じ物理知識に対する2つの等価な経路を表すことを示唆している。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:57:36 GMT)
Interplay between external driving, dissipation and collective effects in the Markovian and non-Markovian regimes [0.0] 外部駆動と消散がオープン量子系の力学にどのように影響を与えるかを示す。
結果は空洞QED、フォトニック結晶、状態依存光学格子などのプラットフォームで実験的に利用可能である。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:24:22 GMT)
Input-Specific and Universal Adversarial Attack Generation for Spiking Neural Networks in the Spiking Domain [0.0] 敵の攻撃は、ネットワークの判断を騙すための微妙な入力摂動を見つけることを目的としている。
スパイキングニューラルネットワーク(SNN)に対する2つの新しい逆攻撃アルゴリズムを提案する。
NMNISTとIBM DVS Gestureという2つの広く使われているニューロモルフィック・ビジョン・データセットの実験結果から、提案した攻撃が既存のすべての最先端手法を超越していることが判明した。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:49:18 GMT)
Illumination and Shadows in Head Rotation: experiments with Denoising Diffusion Models [0.0] 本研究は, 様々な照明条件下で連続的な頭部回転を表現できる魅力的な軌道を同定するために, 拡散モデルの遅延空間を探索する。
我々の研究の重要な貢献は、CelebAデータセットから追加のラベルを生成し、一般的な照明方向に基づいて画像を3つのグループに分類することである。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:05:47 GMT)
Identification and Optimization of Redundant Code Using Large Language Models [0.0] 冗長コードは、システムのメンテナンス、スケール、更新を難しくするソフトウェア開発において、永続的な課題である。
本研究の目的は、冗長性の繰り返しパターンを特定し、時代遅れのプラクティスや最高のコーディング原則の認識不足など、その根底にある原因を分析することである。
論文参考訳(メタデータ) (Wed, 07 May 2025 00:44:32 GMT)
Humans can learn to detect AI-generated texts, or at least learn when they can't [0.0] 本研究では、即時フィードバックが得られた場合に、個人が人書きテキストとAI生成テキストの正確な識別を学べるかどうかを検討する。
我々はGPT-4oを用いて、様々なジャンルやテキストタイプに数百のテキストを生成しました。
チェコ語母語話者254人にランダム化されたテキストペアを提示した。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:18:00 GMT)
Hamiltonian Normalizing Flows as kinetic PDE solvers: application to the 1D Vlasov-Poisson Equations [0.0] ハミルトンインフォームド正規化フローに基づく新しい手法を提案する。
モデルは、固定時間Tで初期状態と最終状態からなるデータセットに基づいて訓練される。
トレーニング中に見えない中間状態に一般化することができ、時間の経過とともにシステムの進化に関する洞察を提供する。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:40:15 GMT)
HQSI: Hybrid Quantum Swarm Intelligence -- A Case Study of Online Certificate Status Protocol Request Flow Prediction [0.0] Hybrid Quantum Swarm Intelligence (HQSI)は、前方伝播ニューラルネットワークとして量子ニューラルネットワーク(QNN)モデルを構築する。
HQSIは、最先端の量子最適化アルゴリズムに対するエラーを50%以上削減する。
論文参考訳(メタデータ) (Wed, 07 May 2025 06:16:50 GMT)
Geometric measures of CHSH quantum nonlocality: characterization, quantification, and comparison by distances and operations [0.0] ヒルベルト空間におけるベル非局所性を分析するための枠組みを導入する。
まず、局所集合を特徴づけるNPハードネスによって生じる課題を強調し、一般形式主義を確立する。
次に、2ビット系におけるクレーター・ホーネ・シモニー・ホルトの不等式を専門とする。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:23:21 GMT)
Generic Two-Mode Gaussian States as Quantum Sensors [0.0] モード混合に固有の対称性がQFIの増幅を著しく支配していることを示す。
また、熱状態の平均光子数を推定し、量子温度測定についても検討する。
この結果は、2モードガウス状態のメトロジー的有用性を強調し、ノイズや動的に進化する量子系におけるパラメータ推論のための堅牢な枠組みを確立した。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:12:23 GMT)
Functional Partial Least-Squares: Adaptive Estimation and Inference [0.0] 関数的部分最小二乗(PLS)推定器は, 楕円体のクラスに対して, 最大収束速度がほぼ最小となることを示す。
トウモロコシと大豆の収量に対する温度の非線形効果を評価するために,本手法を適用した。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:34:05 GMT)
From Two Sample Testing to Singular Gaussian Discrimination [0.0] 2つの特異ガウスを識別することは、非パラメトリック2サンプルテストよりも情報理論の観点からより単純である。
これは、非常に一般的な効率的な推論ツールの設計に利用できる次元の祝福の新たな例である。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:56:19 GMT)
Formation of requirements traceability in the process of information systems design [0.0] 情報システム設計プロセスにおける要件のトレーサビリティは、プロジェクトの本質的な特性であると考えられている。
トレーサビリティプロセスの課題の1つは、トレーサビリティ研究者の間で「トレーサビリティの大挑戦」と呼ばれ、その設計プロセスへの統合である。
本稿では,著者らが開発した情報システムのアダプティブクラスタリング手法(ACM)の適用について述べる。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:13:59 GMT)
Flower Across Time and Media: Sentiment Analysis of Tang Song Poetry and Visual Correspondence [0.0] 唐(618年~907年)と宋(960年~1279年)の王朝は、中国文化の卓越した繁栄を目撃した。
花のモチーフは詩的な感情と芸術的デザインの両方のダイナミックな媒体として機能した。
本研究は,唐詩における花のイメージの感情パターンの定量化にBERTを用いた感情分析を用いた。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:27:38 GMT)
Fine-Tuning Large Language Models and Evaluating Retrieval Methods for Improved Question Answering on Building Codes [0.0] 建築法典は、構造的整合性、防火、アクセシビリティを確保するために、建物の設計、建設、安全性の基準を確立する規則である。
主な課題は、大量のテキストをナビゲートすること、技術的言語を解釈すること、異なるセクションにまたがる関連する節を特定することである。
潜在的な解決策は、ビルドコードに基づいてユーザクエリに回答するQA(QA)システムを構築することである。
QAシステムを構築するための様々な方法のうち、RAG(Retrieval-Augmented Generation)のパフォーマンスは際立っている。
論文参考訳(メタデータ) (Wed, 07 May 2025 05:04:30 GMT)
Fight Fire with Fire: Defending Against Malicious RL Fine-Tuning via Reward Neutralization [0.0] 悪意のあるRL微調整は、優れた効率で安全ガードレールを解体する。
監督された微調整を狙った既存の防御は効果がない。
我々は、RL微調整攻撃に対して特別に設計された最初の防御フレームワークであるReward Neutralizationを紹介する。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:18:48 GMT)
Experimental single-copy distillation of quantumness from higher-dimensional entanglement [0.0] 絡み合いは量子理論の中心であり、様々な量子励起技術に責任を負う。
この要件を満たすために、単一コピーの局所フィルタリング操作をどう使うかを実験的に示す。
結果は、絡み合った状態のベル非局所性に関する最初の実証実験的な証明を提供する。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:44:21 GMT)
Experimental demonstration of a multi-particle collective measurement for optimal quantum state estimation [0.0] 量子状態推定ゲームにおける最適解として提案される2粒子集合計測を実験的に実証した。
以上の結果から, 集団計測戦略は, 少なくとも局所的手法としては最適であることが示唆された。
本研究では, 量子状態トモグラフィーに集合計測を適用し, 試料の総数とともに不均一性のほぼ最適スケーリングを観察する。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:53:25 GMT)
Exact nonlinear state estimation [0.0] 地質学におけるデータ同化法の大部分はガウスの仮定に基づいている。
非パラメトリックな粒子ベースDAアルゴリズムは精度が優れているが、高次元モデルへの応用は依然として運用上の課題となっている。
本稿では,DA手法の既存のギャップを埋めようとする新しい非線形推定理論を紹介する。
論文参考訳(メタデータ) (Wed, 07 May 2025 21:11:12 GMT)
Exact and local compression of quantum bipartite states [0.0] 我々は、ヒルベルト空間の次元を減少させるために局所的な量子演算を適用する量子二部状態の正確な局所圧縮について研究する。
応用として、量子チャネルの正確な圧縮を考える。
論文参考訳(メタデータ) (Wed, 07 May 2025 05:31:08 GMT)
Enhancing Granular Sentiment Classification with Chain-of-Thought Prompting in Large Language Models [0.0] 我々は,大規模言語モデル (LLM) によるアプリストアレビューにおける微粒な感情分類の精度向上を目的として,Chain-of-Thought (CoT) の利用について検討した。
我々は,2000年のAmazonアプリレビューにおいて,CoTプロンプトと単純なプロンプトの有効性を,それぞれの手法の予測と人間の判断を比較して評価した。
論文参考訳(メタデータ) (Wed, 07 May 2025 05:13:15 GMT)
Encoding classical data into the squeezing of noisy-states for nanowire communication [0.0] 単一モード圧縮された「ノイズ」状態の「スクイージングの度合い」に古典的なデータを符号化することで、プラズモンナノワイヤによる効率的な伝送が可能になることを示す。
注目すべきは、この方法では、わずかな測定だけで、長い伝播距離でも符号化された情報を復元することができることである。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:41:25 GMT)
Emergent random matrix universality in quantum operator dynamics [0.0] 確率行列理論における固有値相関の普遍性を証明する。
低周波では、$G_n (z)$ は RMT のベッセル普遍性クラスによって支配されることを示す。
本稿では,Lanczos係数からスペクトル関数を近似するスペクトルブートストラップ法を提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 10:45:50 GMT)
Edge-Optimized Deep Learning & Pattern Recognition Techniques for Non-Intrusive Load Monitoring of Energy Time Series [0.0] 非侵入負荷モニタリング(NILM)は、家電レベルのデータに家庭のエネルギー使用量を分散することで、有望なソリューションを提供する。
現在のデータセットは、主に米国や英国のような地域を表しており、地中海のような地域は、あまり表現されていない。
この論文は、これらの問題に重要な貢献で取り組みます。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:38:54 GMT)
Edge-GPU Based Face Tracking for Face Detection and Recognition Acceleration [0.0] 本稿では,NVIDIA Jetson AGX Orin上での顔検出と認識を最適化するためのハードウェアとソフトウェアの組み合わせを提案する。
結果から,Orin GPUで利用可能なハードウェアエンジンとトラッカーをパイプラインに統合することにより,1920 x 1080 の入力サイズフレームに対して,平均 6 面/フレームを含む290 FPS (frames per second) の劇的なスループットが得られることが示唆された。
このハードウェア・コーデサイン・アプローチは、公共の場でのビデオ監視に不可欠である、エッジで高性能なマシンビジョンシステムを設計する方法を舗装することができる。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:57:53 GMT)
Economic Analysis and Optimization of Energy Storage Configuration for Park Power Systems Based on Random Forest and Genetic Algorithm [0.0] エネルギー貯蔵のない公園の経済性について,ランダム森林モデルを用いて分析した。
50kW/100kWhエネルギー貯蔵システムの構成後の公園の運転をシミュレーションした。
遺伝的アルゴリズムを用いて各公園のエネルギー貯蔵構成を最適化した。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:33:29 GMT)
Dynamic Network Flow Optimization for Task Scheduling in PTZ Camera Surveillance Systems [0.0] 本稿では,動的監視環境におけるPan-Tilt-Zoom(PTZ)カメラのスケジューリングと制御を最適化するための新しいアプローチを提案する。
提案手法は,動作予測のためのカルマンフィルタと動的ネットワークフローモデルを統合し,リアルタイムビデオキャプチャ効率を向上させる。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:37:53 GMT)
Dissipation meets conformal interface: How the relaxation rate is suppressed [0.0] 閉系では、共形界面の透過特性は2つの量によって特徴づけられる。
ここでは,インターフェースを使わずに,Louvillianのギャップの比で定義される第3の量$c_textrelax$を提案する。
インターフェースの強度によって$c_textrelax$は単調に低下する。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:05:03 GMT)
Disorder-Free Localization and Fragmentation in a Non-Abelian Lattice Gauge Theory [0.0] 孤立量子多体系は非アベリアゲージ対称性の制約の下で平衡から遠く離れているときに平衡する。
我々はこれらの位相の非アベル的性質を強調し、quditプロセッサの潜在的な実現を論じる。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:00:42 GMT)
Dicke subsystems are entangled [0.0] 任意のクイディット数の非積対称ディック状態のすべての還元状態は、真に多重部分的絡み合いであり、任意の部分系に対して非正の部分変換であることを示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:59:54 GMT)
Detecting Spelling and Grammatical Anomalies in Russian Poetry Texts [0.0] 微調整データセットにおける自然言語テキストの品質は、生成モデルの性能において重要な役割を果たす。
本稿では,学習データセットから低品質テキストを識別・フィルタリングするための自動言語異常検出手法を提案する。
私たちの研究は、創造的なドメインにおける生成モデルのためのデータセットのトレーニング品質を改善するためのツールと洞察をコミュニティに提供することを目的としています。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:27:59 GMT)
Detecting Concept Drift in Neural Networks Using Chi-squared Goodness of Fit Testing [0.0] 概念ドリフト検出は、ニューラルネットワークの監視に未使用の統計シフトを特定するための分野である。
本稿では,多層パーセプトロン,畳み込みニューラルネットワーク,機械ビジョンのためのトランスフォーマーに適用したドリフト検出メタアルゴリズムとして,$chi2$ Goodness of Fit hypothesis Testを応用した。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:04:47 GMT)
Defining classical and quantum chaos through adiabatic transformations [0.0] 量子システムと古典システムの両方におけるカオスを定義する形式主義を提案する。
古典的な時間平均軌道を保存する断熱変換の複雑さはカオスの尺度となる。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:24:08 GMT)
Defining and Quantifying Creative Behavior in Popular Image Generators [0.0] ユーザが与えられたタスクに適したAIモデルを選択するのに役立つ手段を紹介します。
画像・画像生成モデルについて評価を行った。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:20:17 GMT)
Deep residual learning with product units [0.0] 深部製品単位残基ニューラルネットワーク(PURe)
従来の畳み込み層を各残ブロックの第2層に2次元積単位で置き換える。
PUReを3つのベンチマークデータセットで検証する。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:21:25 GMT)
Deep Learning Innovations for Energy Efficiency: Advances in Non-Intrusive Load Monitoring and EV Charging Optimization for a Sustainable Grid [0.0] 気候変動を緩和し、温室効果ガスの排出を減らし、持続可能なエネルギー供給を確保するため、世界エネルギーの展望は大きな変化を遂げている。
再生可能エネルギーへの新たな投資と、高CO2排出エネルギー源の段階は、エネルギー移行のペースを妨げている。
この論文は、これらの2つの重要なエネルギー領域の制限を解決するツールを作成するための新しいDeep Learning技術の開発を調査する。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:36:19 GMT)
DOTA: Deformable Optimized Transformer Architecture for End-to-End Text Recognition with Retrieval-Augmented Generation [0.0] 本稿では、ResNetとVision TransformerのバックボーンとDeformable Convolutions, Retrieval-Augmented Generation, Conditional Random Fields (CRF)などの高度な方法論を組み合わせた新しいエンドツーエンドフレームワークを提案する。
6つのベンチマークデータセットで実施された実験は、テキスト認識のための新しい最先端技術を確立し、多種多様な挑戦的なデータセットにまたがるアプローチの堅牢性を示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:06:04 GMT)
DCS-ST for Classification of Breast Cancer Histopathology Images with Limited Annotations [0.0] 深層学習法は乳癌の病理組織像の分類において有望であることを示している。
しかし、そのパフォーマンスは、限られた注釈付きデータによって低下することが多く、医療画像にとって重要な課題である。
論文参考訳(メタデータ) (Wed, 07 May 2025 04:09:12 GMT)
Coverage-Guaranteed Speech Emotion Recognition via Calibrated Uncertainty-Adaptive Prediction Sets [0.0] しばしば感情的な抑圧と突然のアウトバーストによって引き起こされる道路の怒りは、衝突や攻撃的な行動を引き起こすことによって道路の安全を著しく脅かす。
音声感情認識技術は、ネガティブな感情を早期に識別し、タイムリーな警告を発することにより、このリスクを軽減することができる。
本稿では,予測精度を統計的に厳格に保証するリスク制御予測フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:20:42 GMT)
Consensus-Aware AV Behavior: Trade-offs Between Safety, Interaction, and Performance in Mixed Urban Traffic [0.0] 自動走行車(AV)の安全性、相互作用品質、交通性能のコンセンサスを定量化することを目的としている。
Time-to-Collision (TTC), Post-Encroachment Time (PET), deceleration pattern, Headway, string stabilityなど,主要な指標を評価した。
その結果,AV-VRUインタラクションフレームの1.63%が3つの条件をすべて満たしているという,安全性,インタラクション,パフォーマンスに関する完全なコンセンサスは稀であることがわかった。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:59:59 GMT)
Confabulation dynamics in a reservoir computer: Filling in the gaps with untrained attractors [0.0] 貯水池コンピュータ(RC)における衝突の発生状況について検討する。
RCが与えられたアトラクションのダイナミクスを再構築するために訓練された場合、彼らは時にアトラクションを構築するために訓練されていないアトラクションを組み立てる。
本稿では,再建に失敗する場合にUAが果たす役割と,再建されたアトラクション間の遷移をモデル化する場合の影響について述べる。
論文参考訳(メタデータ) (Wed, 07 May 2025 20:38:44 GMT)
Conceptual Logical Foundations of Artificial Social Intelligence [0.0] このエッセイは、複数のエージェントの社会の文脈において、人工知能の概念と基礎を探求する。
社会知性の論理は、情報と戦略的思考を結びつけることによって古典論理を超えた。
エージェントの社会的状態には、エージェントの意図的な状態と、エージェントが他のエージェントの意図的な状態を表現することが含まれる。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:06:23 GMT)
Compact Circuits for Constrained Quantum Evolutions of Sparse Operators [0.0] 我々は、コンパクトな量子回路を構築するための一般的な枠組みを導入し、ハミルトンのリアルタイム進化を$H = sigma P_B$という形で実現する。
そのようなハミルトニアンはしばしば量子アルゴリズムに現れ、QAOAの制約ミキサー、VQEのフェルミオンおよび励起演算子、格子ゲージ理論の応用がある。
論文参考訳(メタデータ) (Wed, 07 May 2025 08:52:55 GMT)
Clust-Splitter $-$ an Efficient Nonsmooth Optimization-Based Algorithm for Clustering Large Datasets [0.0] 我々は,非滑らかな最適化に基づく効率的なアルゴリズムであるClust-Splitterを導入し,最小2乗のクラスタリング問題を解く。
我々は,多数の属性と多数のデータポイントを特徴とする実世界のデータセット上でClust-Splitterを評価する。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:13:46 GMT)
Classifying Inconsistency in AHP Pairwise Comparison Matrices Using Machine Learning [0.0] 本研究では,三進選好逆転(PR)を利用して,一貫性のより堅牢で解釈可能な評価を行う新しい方法を提案する。
PR法は97%の精度を達成し、CR法(Consistency Ratio, Consistency Ratio)の50%をはるかに上回り、偽陰性率は5.5%に比べてわずか2.6%である。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:17:39 GMT)
Checkification: A Practical Approach for Testing Static Analysis Truths [0.0] 本稿では,抽象解釈に基づく静的アナライザの試験法を提案する。
このアプローチの主な利点は、Ciaoアサーションベースのバリデーションフレームワーク内で直接フレーミングすることによる、シンプルさにあります。
我々は、CiaoPP静的解析器にアプローチを適用し、合理的なオーバーヘッドを伴う多くのバグを特定した。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:05:14 GMT)
Boosting Binomial Exotic Option Pricing with Tensor Networks [0.0] アジアやマルチアセットのアメリカのバスケットオプションのような、エキゾチックな金融デリバティブの価格設定は、大きな課題となっている。
本研究は、オプションの2項価格法とテンソルネットワーク技術、特にマトリックス製品状態(MPS)を組み合わせたものである。
提案手法は,関心パラメータと線形にスケールし,価格エキゾチックスの計算複雑性を著しく低減する。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:01:13 GMT)
Benchmarking Traditional Machine Learning and Deep Learning Models for Fault Detection in Power Transformers [0.0] 本研究では,従来の機械学習(ML)アルゴリズムと,電力変換器の故障分類のためのディープラーニング(DL)アルゴリズムの比較分析を行った。
10ヶ月にわたる条件監視データセットを用いて、様々なガス濃度の特徴を正規化し、5つのML分類器の訓練に利用した。
RFモデルは86.82%、一方1D-CNNモデルは86.30%であった。
論文参考訳(メタデータ) (Wed, 07 May 2025 15:19:53 GMT)
Bayesian Frequency Metrology with Optimal Ramsey Interferometry in Optical Atomic Clocks [0.0] 本研究は,レーザー雑音に対するエンタングルメント強化感度とロバスト性の間のトレードオフを,最適初期状態を特定するために検討する。
この研究はラムゼーの尋問スキームを最適化するための包括的な理論的枠組みを確立する。
次世代の光原子時計の開発のためのガイダンスを提供する。
論文参考訳(メタデータ) (Wed, 07 May 2025 09:46:29 GMT)
Atyaephyra at SemEval-2025 Task 4: Low-Rank Negative Preference Optimization [0.0] 我々は,LLMから未学習のセンシティブコンテンツに関するSemEval 2025共有タスクを提出する。
提案手法は、低ランク適応を用いた負の優先最適化を用いる。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:19:33 GMT)
Applied Post Quantum Cryptography: A Practical Approach for Generating Certificates in Industrial Environments [0.0] PQC(Post-quantum Cryptography)は,産業環境における証明書ベースのアイデンティティ管理において重要な課題である。
この研究は、X.509証明書構造へのPQCの統合を分析し、古典、ハイブリッド、複合、カメレオン証明書の既存のツールサポートと比較する。
利用可能なオープンソースソリューション、特にハイブリッドおよび複合証明書の生成と検証においてギャップが特定される。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:28:35 GMT)
Anant-Net: Breaking the Curse of Dimensionality with Scalable and Interpretable Neural Surrogate for High-Dimensional PDEs [0.0] 高次元偏微分方程式(英: High-dimensional partial differential equation、PDE)は、様々な科学的・工学的な応用に現れる。
従来の数値法は計算複雑性の指数的な成長に苦慮している。
私たちは、この課題を克服する効率的なニューラルネットワークサロゲートであるAnant-Netを紹介します。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:23:15 GMT)
An Introduction to Variational Quantum Eigensolver Applied to Chemistry [0.0] 変分量子アルゴリズム(VQA)は、短期的には古典的手法よりも有利であることを示すための実現可能なアプローチである。
本稿では、量子力学の分子研究への応用、量子コンピューティングの基礎の紹介、分子シミュレーションにおけるVQEの利用によるこれらの分野の統合について考察する。
論文参考訳(メタデータ) (Wed, 07 May 2025 19:46:15 GMT)
An Enhanced YOLOv8 Model for Real-Time and Accurate Pothole Detection and Measurement [0.0] 既存の検出方法は、通常2次元RGB画像のみに基づいており、ポットホールの物理的特性を正確に分析することはできない。
本稿では, RGB-D画像のデータセット(PothRGBD)を作成し, ポットホール検出とポットホール物理特徴解析の両方に改良されたYOLOv8モデルを提案する。
論文参考訳(メタデータ) (Wed, 07 May 2025 07:58:57 GMT)
Alpha Excel Benchmark [0.0] 本研究では,FMWC(Financial Modeling World Cup)Excelコンペティションから得られた課題を用いて,LLM(Large Language Models)を評価するための新しいベンチマークを提案する。
本研究は,認識タスクの強みを示すが,複雑な数値推論に苦しむモデルを用いて,様々な課題カテゴリにおける性能の有意な変化を示した。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:56:26 GMT)
Advancements and limitations of LLMs in replicating human color-word associations [0.0] 大規模言語モデル(LLM)は広く利用されており、自然な会話スキルを持つ知的行動を示している。
日本人1万人以上の参加者から収集したデータを用いて,複数世代にわたるLLMと人間の色覚関連性を比較検討した。
GPT-4oは,各色とカテゴリに最適な投票語を予測する上で,最も高い精度を達成した。
論文参考訳(メタデータ) (Wed, 07 May 2025 04:50:21 GMT)
Adiabatic state preparation and thermalization of simulated phase noise in a Rydberg spin Hamiltonian [0.0] レーザー位相ノイズが1次元システムにおける断熱的状態形成に及ぼす影響について検討する。
我々は, ある断熱過程において, 雑音が関連する相関関数に与える影響を概ね熱化することが確認できた。
論文参考訳(メタデータ) (Wed, 07 May 2025 17:37:40 GMT)
Adaptive folding and noise filtering for robust quantum error mitigation [0.0] 本稿では,ゼロノイズ外挿法(ZNE)を改良した雑音適応型折り畳み法を提案する。
本稿では,2つのフィルタリング手法を紹介する。一方は誤差強度の測定に依存し,他方は外挿過程を改善するために統計的フィルタリングを利用する。
これらの適応手法は, ノイズ変動に対する誤差緩和を効果的に強化し, 量子計算の精度と信頼性を向上することを示した。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:35:01 GMT)
Adaptive continuity-preserving simplification of street networks [0.0] 街路網の簡易化のための適応アルゴリズムを開発し,提案する。
完全に自動化され、手作業による単純化ルーチンで得られた結果を模倣することができる。
このアルゴリズムは finenet Python パッケージで利用可能だ。
論文参考訳(メタデータ) (Wed, 07 May 2025 14:27:48 GMT)
ARDNS-FN-Quantum: A Quantum-Enhanced Reinforcement Learning Framework with Cognitive-Inspired Adaptive Exploration for Dynamic Environments [0.0] 本研究では,動作選択のための2量子ビット量子回路を統合する新しいフレームワークARDNS-FN-Quantumを提案する。
ARDNS-FN-Quantumは10X10グリッドワールドで2万回以上評価され、99.5%の成功率を達成した。
量子コンピューティング、認知科学、RLをブリッジすることで、ARDNS-FN-Quantumは適応学習に対するスケーラブルで人間らしいアプローチを提供する。
論文参考訳(メタデータ) (Wed, 07 May 2025 23:48:41 GMT)
A review of applications of Quantum Energy Teleportation: from experimental tests to thermodynamics and spacetime engineering [0.0] 量子エネルギーテレポーテーション (Quantum Energy Teleportation, QET) は、エミッタと受信機の間の物理的エネルギーキャリアを必要とせずに、リモートエネルギー転送を可能にする相関性の存在を利用する。
本稿では,QETの熱力学の基礎を概説し,その最初の実験例を概説する。
負の平均応力-エネルギー密度を特徴とするエキゾチックな量子状態の最適生成にQETをどのように利用できるかを検討する。
論文参考訳(メタデータ) (Wed, 07 May 2025 18:00:01 GMT)
A Simple Ensemble Strategy for LLM Inference: Towards More Stable Text Classification [0.0] 本研究では,大規模言語モデル(LLM)を用いた感情分析に簡単なアンサンブル戦略を導入する。
その結果,中規模のLLMを用いた多重推論のアンサンブルは,RMSEを18.6%削減する単一試みによる大規模モデルよりも,より堅牢で正確な結果が得られることを示した。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:31:37 GMT)
A Quantum Annealing Protocol to Solve the Nuclear Shell Model [0.0] 我々は、大きなギャップを保ち、ベースサイズが最大105ドルの数十個の回路で我々のアプローチを検証する調整されたドライバーハミルトンを提案する。
核ハミルトニアンは非局所的であり、現在の設定では実装が困難であるが、推定計算コストは単一粒子基底サイズでは困難である。
論文参考訳(メタデータ) (Wed, 07 May 2025 13:22:57 GMT)
A Multi-Scale Quantum Framework for Evaluating Metal-Organic Frameworks in Carbon Capture [0.0] 金属有機フレームワーク(MOF)は、直接捕獲するためにtextCO_2$を選択的に吸収することにより、地球温暖化の影響を緩和するための有望な材料である。
正確な量子化学シミュレーションは、最適なMOF構造を選択し設計するのに有用なツールである。
大規模なデータセットにシミュレーションを適用するには、効率的なシミュレーション方法が必要である。
論文参考訳(メタデータ) (Wed, 07 May 2025 16:00:07 GMT)
A Defect Taxonomy for Infrastructure as Code: A Replication Study [0.0] 以前の研究ではこのような分類法が開発されていたが、宣言的な言語であるPuppetのみに基づいていた。
この分類法がPulumi、Terraform CDK、AWS CDKといったプログラミング言語ベースのIaCツールに適用されるかどうかは不明のままである。
PL-IaCレポジトリの3,364件の欠陥関連コミットについて定性解析を行った。
論文参考訳(メタデータ) (Wed, 07 May 2025 12:04:34 GMT)
A Data-Driven Probabilistic Framework for Cascading Urban Risk Analysis Using Bayesian Networks [0.0] 本研究では,主要都市領域間のクロスドメインリスク伝播をネットワークベースで解析する手法を提案する。
このフレームワークは、現実世界の都市指標と合成データを組み合わせたハイブリッドデータセットでトレーニングされている。
その結果、ドメイン内およびドメイン間リスク要因を同定し、積極的な都市レジリエンス計画のためのフレームワークの有用性を実証した。
論文参考訳(メタデータ) (Wed, 07 May 2025 05:24:10 GMT)
A Case Study on the Application of Digital Twins for Enhancing CPS Operations [0.0] Digital Twinsは、高価な計算をオフロードしたり、フォールトトレランスメカニズムによるサポートを提供するために使用することができる。
本稿では,Digital Twinが,特に機能強化と耐障害性の向上を通じて,サイバー物理システム操作の強化に用いられている可能性を示す。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:12:58 GMT)
3D-Integrated Superconducting qubits: CMOS-Compatible, Wafer-Scale Processing for Flip-Chip Architectures [0.0] 本稿では,フリップチップ結合による超伝導量子ビット素子の3次元集積化とCMOS加工標準による加工技術について述べる。
量子ビットの時間領域分光では、エネルギー緩和時間の最大15時間で高収率の量子ビット励起が見つかる。
論文参考訳(メタデータ) (Wed, 07 May 2025 11:34:28 GMT)
3D Brain MRI Classification for Alzheimer Diagnosis Using CNN with Data Augmentation [0.0] 3次元畳み込みニューラルネットワークは、T1強調脳スキャンを健康またはアルツハイマーと分類するために開発された。
ネットワークは、3D畳み込み、プーリング、バッチ正規化、密度の高いReLU層、シグモイド出力を含む。
論文参考訳(メタデータ) (Wed, 07 May 2025 03:32:25 GMT)