Low-bit Model Quantization for Deep Neural Networks: A Survey [123.9] 本稿では、ディープニューラルネットワーク(DNN)における低ビット量子化に向けた最近の5年間の進歩について調査する。
我々は最先端の量子化手法を議論し、それらのコア技術に基づいて8つの主要なカテゴリと24のサブカテゴリに分類する。
我々は、モデル量子化の分野における潜在的研究の機会に光を当てた。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:26:19 GMT)
SITE: towards Spatial Intelligence Thorough Evaluation [121.1] 空間知能 (Spatial Intelligence, SI) は、空間的関係の可視化、操作、推論を含む認知能力を表す。
SI Thorough Evaluationに向けたベンチマークデータセットであるSITEを紹介する。
ベンチマークの計算には、31の既存のデータセットに関するボトムアップ調査と、認知科学の3つの分類システムに基づくトップダウン戦略を組み合わせる。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:45:44 GMT)
MonST3R: A Simple Approach for Estimating Geometry in the Presence of Motion [118.7] 我々は動的シーンから時間ステップごとの幾何を直接推定する新しい幾何学的アプローチであるMotion DUSt3R(MonST3R)を提案する。
各タイムステップのポイントマップを単純に推定することで、静的シーンにのみ使用されるDUST3Rの表現を動的シーンに効果的に適応させることができる。
我々は、問題を微調整タスクとしてポーズし、いくつかの適切なデータセットを特定し、この制限されたデータ上でモデルを戦略的に訓練することで、驚くほどモデルを動的に扱えることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:32:16 GMT)
Mixture-of-Transformers: A Sparse and Scalable Architecture for Multi-Modal Foundation Models [112.0] Mixture-of-Transformer (MoT) はスパースマルチモーダルトランスアーキテクチャである。
MoTはモデルの非埋め込みパラメータをモダリティで分離する。
複数の設定とモデルスケールでMoTを評価する。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:53:55 GMT)
MTL-UE: Learning to Learn Nothing for Multi-Task Learning [98.4] 本稿では,マルチタスクデータとMLLモデルの非学習可能な例を生成するための,最初の統合フレームワークであるMTL-UEを提案する。
各サンプルに対してロバスト性を最適化する代わりに、ラベル先行とクラスワイズ機能埋め込みを導入したジェネレータベースの構造を設計する。
さらに、MTL-UEは、クラス間の分離を増加させ、クラス内の分散を抑制するために、タスク内およびタスク間埋め込み正規化を組み込んでいる。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:26:00 GMT)
OpenworldAUC: Towards Unified Evaluation and Optimization for Open-world Prompt Tuning [86.2] 現実世界のシナリオでは、事前のドメイン知識なしに入力を処理するモデルが必要です。
ペアのインスタンス比較による検出と分類を評価する指標であるOpenworldAUCを提案する。
オープンワールドシナリオにおける15のベンチマークの実験は、OpenworldAUCがOpenworldAUCや他のメトリクスでSOTAのパフォーマンスを達成することを示している。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:31:40 GMT)
Defending against Indirect Prompt Injection by Instruction Detection [82.0] 本稿では, 外部データを入力として取り込んで, 前方および後方の伝搬中におけるLCMの動作状態を利用して, 潜在的なIPI攻撃を検出する手法を提案する。
提案手法は,ドメイン内設定で99.60%,ドメイン外設定で96.90%,攻撃成功率でBIPIAベンチマークで0.12%に低下する。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:04:45 GMT)
StabStitch++: Unsupervised Online Video Stitching with Spatiotemporal Bidirectional Warps [81.9] 我々は,画像縫合からビデオ縫合までを延ばす際に,連続的に非平滑なワープによって引き起こされる時間的内容の揺らぎを顕現するワープシェイクという新たな問題にビデオ縫合を再ターゲットとした。
この問題を解決するために,教師なし学習を同時に行う空間的縫合と時間的安定化を実現する新しいビデオ縫合フレームワークであるStabStitch++を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:12:23 GMT)
TokLIP: Marry Visual Tokens to CLIP for Multimodal Comprehension and Generation [80.9] TokLIPは、ベクトル量子化(VQ)トークンを意味付けることで、理解を深めるビジュアルトークンライザである。
TokLIPは、低レベルの離散VQトークンライザとViTベースのトークンエンコーダを統合して、高レベルの連続的なセマンティクスをキャプチャする。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:12:19 GMT)
Perception, Reason, Think, and Plan: A Survey on Large Multimodal Reasoning Models [79.5] 推論は知性の中心にあり、決定し、結論を導き、ドメインをまたいで一般化する能力を形成する。
人工知能において、システムがオープンで不確実でマルチモーダルな環境でますます機能するにつれて、推論は堅牢で適応的な行動を可能にするために不可欠となる。
大規模マルチモーダル推論モデル(LMRM)は、テキスト、画像、オーディオ、ビデオなどのモダリティを統合し、複雑な推論機能をサポートする、有望なパラダイムとして登場した。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:35:23 GMT)
Flow-GRPO: Training Flow Matching Models via Online RL [75.7] 本稿では,オンライン強化学習(RL)をフローマッチングモデルに統合する最初の方法であるFlow-GRPOを提案する。
提案手法では, 1 つの主要な戦略を用いる:(1) 決定論的正規方程式 (ODE) を, 1 つの時点における原モデルの限界分布に一致する等価な微分方程式 (SDE) に変換するODE-to-SDE 変換と、(2) 元の推論タイムステップ数を保ちながらトレーニングの段階を減らし,
論文参考訳(メタデータ) (Thu, 08 May 2025 17:58:45 GMT)
ConCISE: Confidence-guided Compression in Step-by-step Efficient Reasoning [75.1] 大規模推論モデル(LRM)は、Chain-of-Thought (CoT)プロンプトを介して複雑な推論タスクを強く行う。
LRMは冗長なコンテンツによる冗長なアウトプット、計算オーバーヘッドの増加、ユーザエクスペリエンスの低下に悩まされることが多い。
本稿では,推論中のモデルの信頼性を高めることによって推論チェーンを簡素化するフレームワークであるConCISEを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:40:40 GMT)
Understanding In-context Learning of Addition via Activation Subspaces [74.9] そこで本研究では,入力に整数$k$を追加するという真の予測ルールを,数発の学習タスクのファミリーで検討する。
Llama-3-8Bは、このタスクにおいて、$k$の範囲で高い精度を達成し、わずか3つのアテンションヘッドに、その数ショットの能力をローカライズする。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:32:46 GMT)
WorldCuisines: A Massive-Scale Benchmark for Multilingual and Multicultural Visual Question Answering on Global Cuisines [74.3] 視覚言語モデル(VLM)は、特に英語以外の言語において、文化特有の知識に苦しむことが多い。
我々は多言語および多文化の視覚的理解のための大規模ベンチマークであるWorld Cuisinesを紹介した。
このベンチマークには、30の言語と方言にまたがるテキストイメージペアを備えた、視覚的質問応答(VQA)データセットが含まれている。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:46:59 GMT)
Steepest Descent Density Control for Compact 3D Gaussian Splatting [72.5] 3D Gaussian Splatting (3DGS)は、強力なリアルタイム高解像度ノベルビューとして登場した。
本稿では,3DGSの密度制御をデミストし,改良する理論的枠組みを提案する。
我々はSteepGSを導入し、コンパクトな点雲を維持しながら損失を最小限に抑える原則的戦略である、最も急な密度制御を取り入れた。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:41:38 GMT)
QuickSplat: Fast 3D Surface Reconstruction via Learned Gaussian Initialization [69.5] 表面再構成はコンピュータビジョンとグラフィックスの基本であり、3Dモデリング、混合現実、ロボット工学などの応用を可能にする。
レンダリングに基づく既存のアプローチは有望な結果を得るが、シーンごとに最適化されるため、テクスチャレスな領域をモデル化するのに苦労する可能性がある。
大規模屋内シーンの2次元ガウススプラッティング最適化のための高密度初期化を生成するために,データ駆動の先行処理を学習するQuickSplatを紹介する。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:43:26 GMT)
VladVA: Discriminative Fine-tuning of LVLMs [67.1] CLIPのような対照的に訓練された視覚言語モデル(VLM)は、識別的視覚言語表現学習の事実上のアプローチとなっている。
我々は,LVLMの識別的微調整のための新たな訓練手法である「両世界のベスト」を組み合わせることを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:16:29 GMT)
Position: AI Evaluation Should Learn from How We Test Humans [65.4] 人間の評価のための20世紀起源の理論である心理測定は、今日のAI評価における課題に対する強力な解決策になり得る、と我々は主張する。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:45:24 GMT)
Generating Physically Stable and Buildable LEGO Designs from Text [63.8] LegoGPTは、テキストプロンプトから物理的に安定したLEGOブロックモデルを生成するための最初のアプローチである。
私たちは、次に追加すべきブロックを予測するために、自動回帰的な大きな言語モデルをトレーニングします。
我々の実験は、我々のデザインは人間が手動で組み立てることができることを示している。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:58:18 GMT)
Uncovering the Limitations of Model Inversion Evaluation -- Benchmarks and Connection to Type-I Adversarial Attacks [63.1] Model Inversion (MI)攻撃は、機械学習モデルへのアクセスを利用して、プライベートトレーニングデータの情報を再構築することを目的としている。
MI攻撃/防御の最も一般的な評価フレームワークは、近年提案されているMI攻撃/防御のほとんど全てにわたる進捗を評価するために利用されてきた評価モデルに依存している。
我々は、MI攻撃、防衛、プライベートおよびパブリックデータセットの28のセットアップに基づいて、MI攻撃サンプルの最初の包括的人間アノテートデータセットを構築した。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:13:20 GMT)
USTEP: Spatio-Temporal Predictive Learning under A Unified View [62.6] UTEP(Unified S-Temporal Predictive Learning)は,マイクロテンポラリスケールとマクロテンポラリスケールを統合した再帰的および再帰的フリーな手法を再構築する,革新的なフレームワークである。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:26:57 GMT)
Scalable Chain of Thoughts via Elastic Reasoning [61.8] Elastic Reasoningは、スケーラブルな思考の連鎖のための新しいフレームワークである。
推論は、独立して割り当てられた予算で、思考と解決の2つのフェーズに分けられる。
制約のない設定であっても、より簡潔で効率的な推論を生成する。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:01:06 GMT)
Enhancing Treatment Effect Estimation via Active Learning: A Counterfactual Covering Perspective [61.3] 治療効果推定のための複雑なアルゴリズムは、不十分なラベル付きトレーニングセットを扱う際には効果がない。
我々は,最適化目標をtextitFactual と textitCounterfactual Coverage Maximization に変換して,データ取得時の有効半径削減を実現するFCCMを提案する。
FCCMを他のベースラインに対してベンチマークすることは、完全に合成されたデータセットと半合成されたデータセットの両方にその優位性を示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:42:00 GMT)
TetWeave: Isosurface Extraction using On-The-Fly Delaunay Tetrahedral Grids for Gradient-Based Mesh Optimization [59.3] 我々は、勾配に基づくメッシュ最適化のための新しい等曲面表現であるTetWeaveを紹介する。
TetWeaveは、Delaunay三角測量を通じて、四面体グリッドをオンザフライで構築する。
我々は,コンピュータグラフィックスとビジョンの幅広い課題に対して,TetWeaveの適用性を示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:24:30 GMT)
PyTDC: A multimodal machine learning training, evaluation, and inference platform for biomedical foundation models [59.2] PyTDCは、マルチモーダルな生物学的AIモデルのための合理化されたトレーニング、評価、推論ソフトウェアを提供する機械学習プラットフォームである。
本稿では、PyTDCのアーキテクチャの構成要素と、我々の知る限り、導入したシングルセルドラッグターゲットMLタスクにおける第一種ケーススタディについて論じる。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:15:38 GMT)
A Connection Between Learning to Reject and Bhattacharyya Divergences [57.9] インプットとラベルの両面で共同理想分布を学習することを検討する。
我々は、拒絶と統計的相違の閾値付けを関連づける。
一般に、バタチャリアの発散による拒絶は、Chowのルールよりも攻撃的でないことが分かる。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:18:42 GMT)
VL-Rethinker: Incentivizing Self-Reflection of Vision-Language Models with Reinforcement Learning [56.0] 我々は(蒸留に頼らずに)強化学習による視覚言語モデルの遅い思考能力の向上を目指す。
我々は、RLトレーニングにおけるロールアウトの最後に再考トリガートークンを付加し、自己回帰推論ステップを明示的に実施する強制再考(Forced Rethinking)を導入する。
我々のモデルであるVL-Rethinkerは、MathVista、MathVerseの最先端スコアを80.4%、63.5%に向上させています。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:35:06 GMT)
Latent Preference Coding: Aligning Large Language Models via Discrete Latent Codes [54.9] 我々は、暗黙の要因をモデル化する新しいフレームワークであるLatent Preference Coding (LPC)を紹介する。
LPCは様々なオフラインアライメントアルゴリズムとシームレスに統合し、基礎となる要因とデータからその重要性を自動的に推測する。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:59:06 GMT)
Pro2SAM: Mask Prompt to SAM with Grid Points for Weakly Supervised Object Localization [54.9] 本稿では,WSOLタスクのグリッドポイントを持つSAM(Pro2SAM)ネットワークに対して,革新的なマスクプロンプトを提案する。
まず,グローバルトークン変換器(GTFormer)を設計し,フレキシブルマスクプロンプトとして粗粒のフォアグラウンドマップを生成する。
第2に,フォアグラウンドマスクの確率を最大化するために,密度の高いプロンプトとしてグリッドポイントをSAMに配信する。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:44:53 GMT)
Nearly Optimal Sample Complexity for Learning with Label Proportions [54.7] トレーニングセットの例をバッグにグループ化する部分情報設定であるLLP(Learning from Label Proportions)について検討する。
部分的な可観測性にもかかわらず、ゴールは個々の例のレベルで小さな後悔を達成することである。
我々は, LLPの2乗損失下でのサンプル複雑性について, 標本複雑性が本質的に最適であることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:45:23 GMT)
Mogao: An Omni Foundation Model for Interleaved Multi-Modal Generation [54.6] 我々は、因果アプローチを通じてインターリーブされたマルチモーダル生成を可能にする統一的なフレームワークであるMogaoを提案する。
Mogooは、Deep-fusion設計、デュアルビジョンエンコーダ、インターリーブされた回転位置埋め込み、マルチモーダル分類器フリーガイダンスなど、アーキテクチャ設計における重要な技術的改善のセットを統合している。
実験により,モガオはマルチモーダル理解とテキスト・ツー・イメージ生成において最先端の性能を発揮するとともに,高品質でコヒーレントなインターリーブ・アウトプットの創出にも優れていることが示された。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:58:57 GMT)
Do We Truly Need So Many Samples? Multi-LLM Repeated Sampling Efficiently Scales Test-Time Compute [54.2] 本稿では,テスト時間計算のスケールアップによるLCM性能向上のための,シンプルで効果的で費用効率のよい手法を提案する。
当社の戦略は,複数のモデルを組み込んで,補完的な強みを活用するという,新たなツイストによって,繰り返しサンプリングされる投票フレームワークを基盤としています。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:07:55 GMT)
DiffusionSfM: Predicting Structure and Motion via Ray Origin and Endpoint Diffusion [53.7] マルチビュー画像から3次元シーン形状とカメラポーズを直接推定するデータ駆動型マルチビュー推論手法を提案する。
我々のフレームワークであるDiffusionSfMは、シーン幾何学とカメラを、グローバルフレーム内のピクセルワイズ線源とエンドポイントとしてパラメータ化します。
我々は、DiffusionSfMを合成データセットと実データセットの両方で実証的に検証し、古典的および学習ベースのアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:59:47 GMT)
A Weighted Byzantine Fault Tolerance Consensus Driven Trusted Multiple Large Language Models Network [53.4] 大規模言語モデル(LLM)は幅広いアプリケーションで大きな成功を収めています。
近年,MultiLLMネットワーク(MultiLLMN)などの協調フレームワークが導入されている。
重み付きビザンチンフォールトトレランス(WBFT)ブロックチェーンコンセンサス機構によって駆動される新しいTrusted MultiLLMNフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:04:41 GMT)
TeGA: Texture Space Gaussian Avatars for High-Resolution Dynamic Head Modeling [52.9] フォトリアルアバターは、テレプレゼンス、拡張現実、エンターテイメントにおける新興アプリケーションにおいて重要な要素であると見なされている。
本稿では,最先端の3Dヘッドアバターモデルを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 22:10:27 GMT)
Advancing Embodied Agent Security: From Safety Benchmarks to Input Moderation [52.8] エンボディード・エージェントは、複数のドメインにまたがって大きな潜在能力を示す。
既存の研究は主に、一般的な大言語モデルのセキュリティに重点を置いている。
本稿では, エンボディエージェントの保護を目的とした新しい入力モデレーションフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:12:22 GMT)
Advancing Neural Network Verification through Hierarchical Safety Abstract Interpretation [52.6] 我々は、安全でない出力の階層構造を検証する抽象的DNN検証と呼ばれる新しい問題定式化を導入する。
出力到達可能な集合に関する抽象的解釈と推論を活用することにより,形式的検証プロセスにおいて,複数の安全性レベルを評価することができる。
我々の貢献には、新しい抽象的安全性の定式化と既存のアプローチとの関係を理論的に探求することが含まれる。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:29:46 GMT)
Generalizable Human Gaussians from Single-View Image [52.1] 単視点一般化可能なHuman Gaussian Model(HGM)を導入する。
提案手法では, 粗い予測されたヒトガウスの背景画像を改良するために, ControlNet を用いる。
非現実的な人間のポーズや形状の潜在的な発生を緩和するために、SMPL-Xモデルからの人間の先行を二重分岐として組み込む。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:15:28 GMT)
Crosslingual Reasoning through Test-Time Scaling [51.6] 英語中心の推論言語モデル(RLM)に対する推論計算のスケールアップは、多くの言語における多言語数学的推論を改善する。
英語中心の RLM の CoT は自然に英語が主流であるが、引用された非英語入力を推論するための引用と思考のパターンは一貫して従っている。
我々は、ドメイン外推論の一般化、特にSTEMから文化常識の知識まで、英語においても、貧弱なドメイン外推論の一般化を観察する。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:50:06 GMT)
Learning Item Representations Directly from Multimodal Features for Effective Recommendation [51.5] マルチモーダルレコメンデータシステムは、主にベイズパーソナライズされたランク付け(BPR)最適化を利用してアイテム表現を学習する。
本稿では,マルチモーダルな特徴からアイテム表現を直接学習し,推薦性能を向上する新しいモデル(LIRDRec)を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:42:22 GMT)
T2S: High-resolution Time Series Generation with Text-to-Series Diffusion Models [51.1] 自然言語と時系列のギャップを埋める拡散ベースのフレームワークであるText-to-Series (T2S)を紹介した。
T2Sは長さ適応型変分オートエンコーダを用いて、様々な長さの時系列を一貫した潜伏埋め込みに符号化する。
我々は、T2Sを複数の長さでインターリーブされたパラダイムで訓練し、任意の所望の長さのシーケンスを生成する。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:30:12 GMT)
Type-Constrained Code Generation with Language Models [51.0] 本稿では,型システムを利用してコード生成を誘導する型制約デコード手法を提案する。
そこで本研究では,新しい接頭辞オートマトンと,在来型を探索する手法を開発し,LLM生成コードに適切な型付けを強制するための健全なアプローチを構築した。
提案手法は,コード合成,翻訳,修復作業において,コンパイルエラーを半分以上削減し,機能的正しさを著しく向上させる。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:33:40 GMT)
Rejection via Learning Density Ratios [50.9] 拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:06:17 GMT)
A Unified Data Representation Learning for Non-parametric Two-sample Testing [50.3] 本稿では,表現学習型2サンプルテスト(RL-TST)フレームワークを提案する。
RL-TSTはまず、データセット全体に対して純粋に自己教師付き表現学習を行う。
識別モデルはこれらの赤外線で訓練され、識別表現(DR)を学習する。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:08:23 GMT)
Re-evaluating Open-ended Evaluation of Large Language Models [50.2] 現在のEloベースのレーティングシステムは、データ、意図的、あるいは偶発的なバイアスの影響を受けやすく、さらに強化できることを示している。
本稿では,3人プレイヤゲームとしての評価を提案し,冗長性に対するロバスト性を確保するために,ゲーム理論の新たな概念を導入する。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:17:22 GMT)
Locality-aware Cross-modal Correspondence Learning for Dense Audio-Visual Events Localization [50.1] オーディオ・ビジュアル・イベント(DAVE)のための局所性を考慮したクロスモーダル対応学習フレームワークLoCoについて述べる。
LoCo は局所対応特徴 (LCF) 変調を適用し、モダリティ共有セマンティクスに焦点を合わせるために単調エンコーダを強制する。
さらに、データ駆動方式で注意領域を動的に調整するローカル適応クロスモーダル(LAC)インタラクションをカスタマイズする。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:03:12 GMT)
Learning to Drive Anywhere with Model-Based Reannotation11 [49.8] ロボットの視覚ナビゲーションポリシーを一般化するためのフレームワークを開発する。
クラウドソースの遠隔操作データや、ラベルなしのYouTubeビデオなど、受動的に収集されたデータを活用します。
このデータはLogoNavに蒸留される。LogoNavは、視覚的目標やGPSのウェイポイントに照準を合わせられた長い水平航法ポリシーだ。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:43:39 GMT)
Federated Learning for Cyber Physical Systems: A Comprehensive Survey [49.5] 近年,フェデレートラーニング(FL)が普及している。
この記事では、FLが、インテリジェントトランスポートシステム、サイバーセキュリティサービス、スマートシティ、スマートヘルスケアソリューションなど、重要なCPSアプリケーションでどのように利用されるのかを精査する。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:17:15 GMT)
DGSolver: Diffusion Generalist Solver with Universal Posterior Sampling for Image Restoration [49.2] bfDGrは、普遍的な後続サンプリングを持つ拡散解法である。
コードとモデルはhttps://github.com/MiliLab/DGr.comから入手できる。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:57:04 GMT)
FA-KPConv: Introducing Euclidean Symmetries to KPConv via Frame Averaging [49.2] KPConv上に構築されたニューラルネットワークアーキテクチャであるFA-KPConv(Frame-Averaging Kernel-Point Convolution)を提案する。
FA-KPConvは、学習可能なパラメータの数を保ちながら、任意の入力情報を妥協することなく、幾何学的な事前知識を組み込む。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:43:49 GMT)
Reasoning Models Don't Always Say What They Think [48.1] CoT(Chain-of-Thought)は、モデルの意図と推論プロセスの監視を可能にする。
提案する6つの推論ヒントにまたがる最先端推論モデルのCoT忠実度を評価した。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:51:43 GMT)
PRE-Mamba: A 4D State Space Model for Ultra-High-Frequent Event Camera Deraining [47.8] イベントカメラは高時間分解能とダイナミックレンジで優れるが、降雨条件下では高密度ノイズに悩まされる。
イベントデライニングのための新しいポイントベースカメラフレームワークであるPre-Mambaを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:52:45 GMT)
WaterDrum: Watermarking for Data-centric Unlearning Metric [47.4] 大規模言語モデル(LLM)のアンラーニングは、一部のユーザからプライベート、著作権、有害なデータの影響を効率的に除去する必要がある現実世界のアプリケーションにおいて重要である。
本稿では,制約を克服するためにロバストなテキスト透かしを利用する,WaterDrum と呼ばれる LLM のためのデータ中心の非学習指標を提案する。
また、LLMアンラーニングのための新しいベンチマークデータセットを導入し、類似したデータポイントのさまざまなレベルを含み、WaterDrumを使って未学習アルゴリズムを厳格に評価することができる。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:56:46 GMT)
Multi-agent Embodied AI: Advances and Future Directions [47.3] エンボディード人工知能(Embodied AI)は、インテリジェントな時代における先進技術の適用において重要な役割を担っている。
本稿では,研究の現状を概観し,重要な貢献を分析し,課題と今後の方向性を明らかにする。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:13:53 GMT)
T-T: Table Transformer for Tagging-based Aspect Sentiment Triplet Extraction [46.3] アスペクト感情三重項抽出は、与えられた文からアスペクト項、意見項、感情極性からなる三重項を抽出することを目的としている。
テーブルタグ法はこのタスクに対処するための一般的な手法であり、文を2次元のテーブルにエンコードする。
タグ付け型ASTE法のためのテーブル変換器(T-T)を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:17:27 GMT)
Auto-regressive transformation for image alignment [46.1] 画像アライメントのための既存の手法は、特徴領域、極大スケールと視野差、大きな変形を含む場合である。
本稿では,自己回帰フレームワーク内の粗粒度変換を反復的に推定する新しい手法である自己回帰変換(ART)を提案する。
ネットワークは各スケールでランダムにサンプリングされた点を用いて変換を洗練する。
クロスアテンション層からのガイダンスを取り入れることで、モデルは重要な領域に焦点を当て、困難で機能制限のある条件でも正確なアライメントを確保する。
論文参考訳(メタデータ) (Thu, 08 May 2025 00:28:31 GMT)
G-FOCUS: Towards a Robust Method for Assessing UI Design Persuasiveness [45.8] A/Bテストは、UIのバリエーションがユーザーエンゲージメントを高めるかを決定する主要な方法である。
WeserUI-Benchは、Pairwise UI Design Persuasiveness Assessmentタスク用に設計されたベンチマークである。
また,VLMに基づく説得力評価を強化する新しい推論時間推論戦略であるG-FOCUSを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:00:32 GMT)
ReadMe.LLM: A Framework to Help LLMs Understand Your Library [45.0] 大規模言語モデル(LLM)は、ニッチなソフトウェアライブラリを含むコード生成タスクにしばしば苦労する。
既存のコード生成テクニックは、人間指向のドキュメントだけで失敗する可能性がある。
ソフトウェアライブラリのための LLM 指向のドキュメントである ReadMe$.$LLM を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:12:40 GMT)
DenseGrounding: Improving Dense Language-Vision Semantics for Ego-Centric 3D Visual Grounding [44.8] この分野での基本課題はエゴ中心の3次元視覚グラウンド(英語版)であり、エージェントは言葉による記述に基づいて現実世界の3次元空間内の対象物を特定する。
視覚的意味論とテキスト的意味論を両立させる新しいアプローチであるDenseGroundingを提案する。
視覚的特徴として,細粒度のグローバルなシーンの特徴を捉えることで,密接なセマンティックなセマンティックなセマンティック・エンハンサーを導入する。
テキスト記述のための言語セマンティックエンハンサー(Language Semantic Enhancer)を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:49:06 GMT)
Linear combinations of latents in generative models: subspaces and beyond [44.7] 本稿では,潜伏変数の線形結合を形成する汎用手法として,潜伏変数の線形結合(LOL)を提案する。
LOLは、高次元オブジェクトの表現的低次元表現を劇的に単純化する。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:04:05 GMT)
Societal and technological progress as sewing an ever-growing, ever-changing, patchy, and polychrome quilt [44.5] 我々は、道徳的多様性の持続性を見落としているようなシステムが、抵抗を引き起こし、信頼を失わせ、制度を不安定化するのではないかと心配している。
理想的な条件下では、合理的なエージェントは単一の倫理上の会話の限界に収束するという考えである。
我々は、この前提をオプション的かつ疑わしいものとみなし、紛争理論、文化進化、マルチエージェントシステム、制度経済学に基づく代替アプローチとして、適切性枠組みと呼ぶものを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:55:07 GMT)
Optimal Regret of Bernoulli Bandits under Global Differential Privacy [44.3] エプシロン$-global Differential Privacy (DP) による包帯のレグレット最小化が広く研究されている。
我々はベルヌーイのバンディットに対する$epsilon-global DPアルゴリズムの残酷な下限と上限を再検討し、両者を改善した。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:48:58 GMT)
Scaling Synthetic Data Creation with 1,000,000,000 Personas [44.1] 私たちは、Webデータから自動的にキュレートされた10億の多様なペルソナのコレクションであるPersona Hubを紹介します。
この10億のペルソナ(世界の人口の13%)は、世界の知識の分散キャリアとして機能し、大きな言語モデルにカプセル化されたほぼ全ての視点に到達することができる。
ペルソナ駆動のデータ合成は、汎用的で、スケーラブルで、柔軟性があり、使いやすく、合成データ作成とアプリケーションの実践におけるパラダイムシフトを促進する可能性があることを実証する。
論文参考訳(メタデータ) (Thu, 08 May 2025 00:24:02 GMT)
Self-Correction is More than Refinement: A Learning Framework for Visual and Language Reasoning Tasks [44.0] モデルにアウトプットを洗練させる自己補正は、この問題に対する有望な解決策である。
本研究では,視覚言語モデルの推論および微調整段階における自己補正能力について検討した。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:10:43 GMT)
A Simple Detector with Frame Dynamics is a Strong Tracker [43.9] 赤外線物体追跡は、反無人航空機(Anti-UAV)の用途において重要な役割を担っている。
既存のトラッカーは、しばしば収穫されたテンプレート領域に依存し、モーションモデリング機能に制限がある。
我々は,グローバルな検出と動き認識学習を統合することで,トラッキング性能を向上させる,シンプルで効果的な赤外線小物体トラッカーを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:16:03 GMT)
Ultra-FineWeb: Efficient Data Filtering and Verification for High-Quality LLM Training Data [43.5] LLMトレーニングにおけるデータの影響を迅速に評価できる効率的な検証戦略を提案する。
本稿では,効率的なデータフィルタリングパイプラインを提案し,フィルタ効率を向上し,実験と推論のコストを削減する。
フィルタリングパイプラインを、広く使われている2つの事前学習コーパス、FinWebと中国のFinWebデータセットに適用することに成功しました。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:15:20 GMT)
GroverGPT-2: Simulating Grover's Algorithm via Chain-of-Thought Reasoning and Quantum-Native Tokenization [43.5] 我々は、Chain-of-Thought(CoT)推論と量子ネイティブトークン化を用いて、GroverのアルゴリズムをシミュレーションするLLMベースのGroverGPT-2を紹介する。
この結果から,GroverGPT-2は量子ネイティブトークンの効率的な処理によって量子回路論理を学習し,内部化することができることがわかった。
量子ビット数が増加するGroverGPT-2における経験的スケーリング法則を同定し,スケーラブルな古典シミュレーションへの道筋を示唆する。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:38:12 GMT)
Cross-Branch Orthogonality for Improved Generalization in Face Deepfake Detection [43.3] ディープフェイクは法執行機関や一般大衆にとって迷惑になっている。
既存のディープフェイク検出器は、ディープフェイク生成のペースの改善に追随するのに苦労している。
本稿では,粗い空間情報,意味情報,それらの相互作用を活用する新しい戦略を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:49:53 GMT)
LSRP: A Leader-Subordinate Retrieval Framework for Privacy-Preserving Cloud-Device Collaboration [43.1] クラウドとデバイス間のコラボレーションは、公開ユーザクエリの処理にオンプレミスのLarge Language Models(LLM)、プライベートユーザデータの処理にSLM(On-device Small Language Models)を活用する。
既存のアプローチは、クラウド上のLLMのスケーラブルな問題解決能力を十分に活用できないことが多い。
プライバシ保護型クラウドデバイスコラボレーション(LSRP)のためのリーダ・サブオーディネート検索フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:06:34 GMT)
Adaptive Markup Language Generation for Contextually-Grounded Visual Document Understanding [42.5] ドキュメント解析のために約3.8Mの事前学習データペアで構成されるDocMark-Pileと、グラウンドド命令に従うための624kの微調整データアノテーションを備えたDocMark-Instructの2つのきめ細かい構造化データセットを紹介した。
提案手法は,様々なビジュアル文書理解ベンチマークにおいて,既存の最先端MLLMを著しく上回っている。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:37:36 GMT)
Overcoming Dimensional Factorization Limits in Discrete Diffusion Models through Quantum Joint Distribution Learning [42.5] 本研究では,高次元分布学習における古典的制限を克服する量子拡大離散拡散モデルについて検討する。
本稿では,指数関数的に大きいヒルベルト空間において,拡散とデノイングによる連立確率学習を可能にする量子離散拡散確率モデル(QD3PM)を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:48:21 GMT)
TiC-LM: A Web-Scale Benchmark for Time-Continual LLM Pretraining [41.6] 歴史的Webデータに基づいてトレーニングされた大規模言語モデル(LLM)は、必然的に時代遅れになる。
114ダンプのCommon Crawl(CC)から得られたLCMの時間-連続事前学習のためのWebスケールデータセットを提案する。
また、一般CCデータと特定ドメインの両方にわたって時間階層評価を設計する。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:22:26 GMT)
Lexicon3D: Probing Visual Foundation Models for Complex 3D Scene Understanding [41.6] 本稿では,3次元シーン理解のための様々な視覚符号化モデルを探索する総合的研究について述べる。
評価は,映像ベース,映像ベース,3Dファウンデーションモデルを含む,7つのビジョンファウンデーションエンコーダにまたがる。
DINOv2は優れた性能を示し、ビデオモデルはオブジェクトレベルのタスクに優れ、幾何学的拡散モデルはタスクに有益であり、言語予測モデルは言語関連のタスクに予期せぬ制限を示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:10:27 GMT)
3D Scene Generation: A Survey [41.2] 3Dシーン生成は、没入型メディア、ロボティクス、自律運転、エンボディドAIといったアプリケーションのために、空間的に構造化され、意味的に意味があり、フォトリアリスティックな環境を合成することを目指している。
このレビューでは、3Dシーン生成の最近の進歩を整理し、生成AI、3Dビジョン、具体化インテリジェンスとの交差点における有望な方向性を強調している。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:59:54 GMT)
Unveiling Language-Specific Features in Large Language Models via Sparse Autoencoders [41.1] SAEから得られる特徴の単言語性を評価するための新しい指標を提案する。
これらのSAE特徴を非難することは、LLMの1つの言語における能力を大幅に低下させるだけであり、他の言語はほとんど影響を受けないことが示されている。
我々はこれらSAEから派生した言語固有の特徴を活用してステアリングベクターを強化し,LLMによる言語制御を実現する。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:24:44 GMT)
SuperBench: A Super-Resolution Benchmark Dataset for Scientific Machine Learning [41.0] 我々は,高解像度データセットを特徴とする最初のベンチマークデータセットであるSuperBenchを紹介する。
データ中心の観点からSRパフォーマンスを検証すること、およびデータタスクに対する堅牢性を評価することに注力する。
論文参考訳(メタデータ) (Thu, 08 May 2025 21:18:26 GMT)
CityNavAgent: Aerial Vision-and-Language Navigation with Hierarchical Semantic Planning and Global Memory [39.8] 航空ビジョン・アンド・ランゲージナビゲーション(VLN)では、ドローンが自然言語の指示を解釈し、複雑な都市環境をナビゲートする必要がある。
都市空域VLNの航法複雑性を著しく低減する大規模言語モデル(LLM)を用いたエージェントである textbfCityNavAgent を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 20:01:35 GMT)
Search is All You Need for Few-shot Anomaly Detection [39.7] 産業検査において, FSAD (Few-shot Anomaly Detection) が重要な課題となっている。
本稿では,最も近い検索フレームワークが,単一クラスとマルチクラスの両方のFSADシナリオにおいて,最先端の性能を上回ることができることを示す。
画像レベルのAUROCスコアは97.4%,94.8%,70.8%であった。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:24:41 GMT)
PointBA: Towards Backdoor Attacks in 3D Point Cloud [38.8] バックドア攻撃を3Dデータとネットワークのユニークな特性を利用する統一的なフレームワークで3Dポイントクラウドに提示する。
提案するバックドアアタックは,3次元深部モデルの堅牢性向上のためのベースラインとして期待できる。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:20:20 GMT)
Comparing Hyper-optimized Machine Learning Models for Predicting Efficiency Degradation in Organic Solar Cells [38.6] 本研究は,有機太陽電池 (OSC) の電力変換効率 (PCE) に苦しむ時間的劣化を表現するための機械学習モデルを提案する。
製造プロセスと環境条件の両方に関して最大7変数を含む996項目のデータベースを180日間以上作成しました。
一方、根平均二乗誤差(RMSE)、二乗誤差(SSE)の和、および平均絶対誤差(MAE)>1%の目標値であるPCEは、係数決定(R2)の値に達した。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:47:26 GMT)
Lost in OCR Translation? Vision-Based Approaches to Robust Document Retrieval [38.6] Retrieval-Augmented Generation (RAG)は、外部文書の応答をグラウンド化するための技術である。
従来のRAGシステムは、スキャンされた文書をテキストに最初に処理するために光学文字認識(OCR)に依存していた。
ColPaliのような近年の視覚言語アプローチでは、ドキュメントの直接的な視覚的埋め込みを提案しており、OCRの必要性を排除している。
論文参考訳(メタデータ) (Thu, 08 May 2025 21:54:02 GMT)
SeriesBench: A Benchmark for Narrative-Driven Drama Series Understanding [38.4] SeriesBenchは、105の慎重にキュレートされた物語駆動のシリーズからなるベンチマークである。
本稿では,新しい長文物語アノテーション手法とフルインフォーム・トランスフォーメーション・アプローチを提案する。
シリーズ内のプロット構造とキャラクタ関係を詳細に分析するためのモデルキャパシティをさらに向上するために,新しい物語推論フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:08:01 GMT)
Towards the Worst-case Robustness of Large Language Models [38.3] 近年の研究では、敵対的攻撃に対する大きな言語モデルの脆弱性が明らかにされており、敵は有害、暴力、私的、不正なアウトプットを誘導するために特定の入力シーケンスを使用する。
この研究では、最悪の場合のロバスト性、すなわち、そのような望ましくない出力をもたらす逆例が存在するかどうかを調査する。
より強力なホワイトボックス攻撃で最悪の場合のロバスト性を上限にし、現在の決定論的防御のほとんどが、最悪の場合のロバストネスを0%近く達成していることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:33:37 GMT)
HESSO: Towards Automatic Efficient and User Friendly Any Neural Network Training and Pruning [38.0] 構造化プルーニングは、パフォーマンスを維持しながら、重いディープニューラルネットワーク(DNN)をコンパクトなサブネットワークに効果的に圧縮する最も一般的なアプローチの1つである。
HESSOとHESSO-CRICのコンピュータビジョンから,大規模言語モデルを含む自然言語処理まで,さまざまなアプリケーションに対する効果を数値的に示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:17:59 GMT)
PlaceIt3D: Language-Guided Object Placement in Real 3D Scenes [37.9] 実写3Dシーンにおける言語誘導オブジェクト配置の新たな課題について紹介する。
グラウンド化などの3次元シーンにおける他の言語誘導型ローカライズタスクと比較して、このタスクには特定の課題がある。
複数の有効な解を持ち、3次元幾何学的関係と自由空間の推論を必要とするため、曖昧である。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:29:11 GMT)
Griffin: Towards a Graph-Centric Relational Database Foundation Model [37.1] Griffinはデータベース(RDB)用に特別に設計された最初の基礎モデルの試みである
我々は、クロスアテンションモジュールと新しいアグリゲータを組み込むことで、アーキテクチャを強化する。
グリフィンは、様々な領域にわたるRDBから抽出された大規模、異質、および時間グラフで評価される。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:03:43 GMT)
ComPO: Preference Alignment via Comparison Oracles [36.8] 比較オークスに基づく新しい選好アライメント手法を提案し,その基本スキームに対する収束保証を提供する。
私たちの研究の目玉は、明確なマージンを持つ選好ペアのための特殊な手法を設計することの重要性を実証することである。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:56:57 GMT)
Diffusion Model Quantization: A Review [36.2] 近年の大規模テキスト・画像モデルの成功は、生成タスクにおける拡散モデルの例外的な性能を裏付けている。
拡散モデル量子化は、圧縮と加速の双方にとって重要な手法である。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:09:34 GMT)
EcoAgent: An Efficient Edge-Cloud Collaborative Multi-Agent Framework for Mobile Automation [36.1] モバイル自動化のためのエッジクラウドcOllorativeマルチエージェントフレームワークであるEcoAgentを提案する。
EcoAgentは、クラウドベースのプランニングエージェントとエッジベースのエージェントのクローズドループコラボレーションを備えている。
AndroidWorldの実験によると、EcoAgentは高いタスク成功率を維持しつつ、MLLMトークンの消費を大幅に削減している。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:31:20 GMT)
Revealing Weaknesses in Text Watermarking Through Self-Information Rewrite Attacks [36.0] テキスト透かしアルゴリズムは、テキストの品質を保証するために、ハイエントロピートークンに透かしを埋め込む。
本稿では,この外観上の不明瞭な設計が攻撃者によって悪用され,透かしの堅牢性に重大なリスクを及ぼすことを明らかにする。
本稿では,トークンの自己情報を計算することで,その脆弱性を利用する汎用的なパラフレーズ攻撃を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:39:00 GMT)
MetamatBench: Integrating Heterogeneous Data, Computational Tools, and Visual Interface for Metamaterial Discovery [35.7] 3つのレベルで動作するMetamatBenchという統合フレームワークを導入します。
データレベルでは、5つの異質なマルチモーダルなメタマテリアルデータセットを統合し、標準化する。
MLレベルは、メタマテリアル発見のために17の最先端のMLメソッドを適用する包括的なツールキットを提供する。
ユーザレベルでは、複雑なML技術と非ML研究者のギャップを埋める、視覚的インタラクティブなインターフェースが特徴である。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:23:59 GMT)
Federated EndoViT: Pretraining Vision Transformers via Federated Learning on Endoscopic Image Collections [35.6] We adapt the Masked Autoencoder for Federated Learning, enhance Sharpness-Aware Minimization (FedSAM) and Weight Averaging。
以上の結果から,FedSAMをFederated MAEアプローチに統合することにより,プレトレーニングが向上し,パッチ1本あたりの再建損失が減少することが示唆された。
これらの結果は,外科基礎モデルのプライバシ保護トレーニングにおけるフェデレーション学習の可能性を強調した。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:46:58 GMT)
StreamBridge: Turning Your Offline Video Large Language Model into a Proactive Streaming Assistant [35.0] オフラインビデオLLMをストリーミング対応モデルにシームレスに変換するフレームワークであるStreamBridgeを紹介します。
既存のモデルをオンラインシナリオに適応する上での根本的な課題は,(1)マルチターンリアルタイム理解能力の制限,(2)プロアクティブ応答機構の欠如である。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:57:40 GMT)
Compressed Private Aggregation for Scalable and Robust Federated Learning over Massive Networks [34.3] フェデレーション・ラーニング(FL)は、中央サーバーがリモートユーザーのデータを使って機械学習モデルをトレーニングできる新興パラダイムである。
FLは、ローカルデータセットのプライバシ保護、悪意のあるユーザによる攻撃に対する感受性、通信オーバーヘッドといった課題に直面している。
提案する圧縮プライベートアグリゲーション(CPA)は,大規模デプロイメントを極端に低ビットレートで同時通信することを可能にする。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:47:11 GMT)
GFlowNets for Active Learning Based Resource Allocation in Next Generation Wireless Networks [34.2] 本稿では,無線システムにおける無線リソース割り当て問題について考察する。
本稿では,資源配分パターンを逐次描画し,環境評価を行い,環境の代理モデルを反復的に更新する,新しいアクティブラーニングフレームワークを提案する。
GFlowNetは、サロゲートモデルを更新し、適切なソリューションを迅速に発見する、多種多様で高利率なリソース管理設計を生成する。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:16:40 GMT)
Miipher-2: A Universal Speech Restoration Model for Million-Hour Scale Data Restoration [34.2] 学習データクリーニングは生成モデルに基づく音声復元(SR)の新しい応用である
本稿では,100万時間規模のデータを対象としたSRモデルであるMiipher-2を紹介し,大規模言語モデルのような大規模生成モデルのデータクリーニングを訓練する。
Miipher-2は、300以上の言語をサポートする凍結訓練されたUniversal Speech Model (USM) を、堅牢で条件のない特徴抽出器として使用している。
論文参考訳(メタデータ) (Thu, 08 May 2025 23:59:00 GMT)
Large Language Models for Outpatient Referral: Problem Definition, Benchmarking and Challenges [34.1] 大規模言語モデル(LLM)は、医療システム全体にわたる外来の紹介業務にますます適用されている。
有効性を評価するための標準化された評価基準が欠如している。
このようなシステムに特化して設計された包括的評価フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:33:59 GMT)
VR-RAG: Open-vocabulary Species Recognition with RAG-Assisted Large Multi-Modal Models [33.3] オープン・ボキャブラリ・バードの種認識に重点を置いており、その目的は、その記述に基づいて種を分類することである。
CUB-200-2011のような伝統的なベンチマークは、クローズド語彙パラダイムで評価されている。
設定条件下での評価における現在のシステムの性能は、オープン語彙のドロップと密接に一致していることが、大きなマージンで示されている。
論文参考訳(メタデータ) (Thu, 08 May 2025 20:33:31 GMT)
AirMorph: Topology-Preserving Deep Learning for Pulmonary Airway Analysis [33.2] 本研究では,ロバー,セグメンショナル,サブセグメンショナルレゾリューションにおいて,完全自動かつ包括的な気道解剖学的ラベリングを可能にする,堅牢でエンドツーエンドのディープラーニングパイプラインであるAirMorphを紹介する。
AirMorphは、精度、トポロジ的整合性、完全性の観点から、既存のセグメンテーションとラベリング手法を一貫して上回った。
強い識別力を示し、高い解釈性と説明可能性を持つ疾患特異的な形態パターンを明らかにする。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:24:13 GMT)
X-Transfer Attacks: Towards Super Transferable Adversarial Attacks on CLIP [32.9] 我々は,CLIPの普遍的敵対的脆弱性を明らかにする新しい攻撃方法である textbfX-Transfer を紹介する。
X-Transferは、様々なサンプル、タスク、ドメインにまたがる様々なCLIPエンコーダと下流のVLMを認識できるUniversal Adversarial Perturbationを生成する。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:59:13 GMT)
Bring Reason to Vision: Understanding Perception and Reasoning through Model Merging [32.7] VLM(Vision-Language Models)は、視覚認識と、Large Language Models (LLMs)の推論などの一般的な機能を組み合わせたモデルである。
本研究では,異なるモデルのパラメータを結合するモデルマージによる知覚と推論について検討する。
知覚能力は主にモデルの初期段階の層にコード化されているのに対して、推論は中期から後期の層によって大きく促進されている。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:56:23 GMT)
Joint Super-Resolution and Segmentation for 1-m Impervious Surface Area Mapping in China's Yangtze River Economic Belt [32.4] We propose a novel framework by integrated super- resolution and segmentation called JointSeg, which allows the generation of 1-meter ISA map from Sentinel-2 images。
JointSegはマルチモードのクロスレゾリューション入力をトレーニングし、従来のアプローチに代わるスケーラブルで安価な代替手段を提供する。
この手法は、複雑な都市・農村パターンと多様な地形を特徴とする地域であるヤンツェ川経済ベルト(EB)に成功している。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:04:35 GMT)
Talking Heads: Understanding Inter-layer Communication in Transformer Language Models [32.3] 2つのLMで用いられるメカニズムを分析し、1つのタスクでコンテキスト内のアイテムを選択的に抑制する。
モデルが残ストリームの低ランクな部分空間に書き込まれて,後続のレイヤで読み出される特徴を表現することが分かりました。
論文参考訳(メタデータ) (Thu, 08 May 2025 21:25:08 GMT)
Large AI Model for Delay-Doppler Domain Channel Prediction in 6G OTFS-Based Vehicular Networks [32.1] 高速車載ネットワークに適した遅延ドップラー(DD)ドメインチャネル予測フレームワークを提案する。
チャネル表現をDDドメインに変換することで、基礎となる物理伝播過程と密に一致した直感的でスパースで安定した描写が得られる。
我々は大規模な人工知能(AI)モデルを利用してこれらのDDドメインの時系列パラメータを予測し、時間相関をモデル化する高度な能力を活用している。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:43:27 GMT)
DEGAP: Dual Event-Guided Adaptive Prefixes for Templated-Based Event Argument Extraction with Slot Querying [32.1] イベント引数抽出(EAE)の最近の進歩は、トレーニングや推論中に有用な補助情報をモデルに組み込むことである。
これらの手法は,(1)検索結果が無関係である場合があり,(2)テンプレートは関連性を考慮せずに,各イベントごとに独立して開発される場合の2つの課題に直面する。
本稿では,2つのプレフィックス,すなわち学習可能なプロンプトベクトル,イベント誘導型適応ゲーティング機構を用いて,これらの課題に対処するDEGAPを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:33:22 GMT)
Scalable Multi-Stage Influence Function for Large Language Models via Eigenvalue-Corrected Kronecker-Factored Parameterization [31.4] 事前訓練された大規模言語モデル(LLM)は、一般的に下流タスクに適応するように微調整される。
本稿では,学習前データに対する微調整LDMの属性予測のための多段階影響関数を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:43:44 GMT)
Rethinking Invariance in In-context Learning [31.3] In-Context Learning (ICL)は、自動回帰型大規模言語モデルの重要な機能として登場した。
相互独立に拘わらず、文脈例の順序に顕著な敏感さが妨げられている。
本研究では,不変ICLアルゴリズムの設計における2つの重要な要素を同定する。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:59:14 GMT)
Causal Abstraction: A Theoretical Foundation for Mechanistic Interpretability [30.8] 因果抽象化は機械的解釈可能性の理論的基盤を提供する。
我々の貢献は、メカニズム置換から任意のメカニズム変換への因果的抽象化の理論の一般化である。
論文参考訳(メタデータ) (Thu, 08 May 2025 23:00:37 GMT)
Combating Confirmation Bias: A Unified Pseudo-Labeling Framework for Entity Alignment [30.4] エンティティアライメントのための統一擬似ラベルフレームワーク(UPL-EA)を提案する。
UPL-EAは、エンティティアライメントの精度を高めるために、擬似ラベルエラーを明示的に排除する。
以上の結果から,UPL-EAが15の競争ベースラインに優越していることが示唆された。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:46:52 GMT)
An Edge AI Solution for Space Object Detection [29.8] 宇宙物体検出タスクのための深層学習に基づく視覚センシングに基づくエッジAIソリューションを提案する。
我々は,これらのモデルの性能を,様々な現実的な空間オブジェクト検出シナリオで評価する。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:51:19 GMT)
A Survey of Slow Thinking-based Reasoning LLMs using Reinforced Learning and Inference-time Scaling Law [29.8] 本調査は「スロー思考」を模倣した大規模言語モデル(LLM)の最近の進歩を考察する。
LLMは、数学の推論、視覚的推論、診断、マルチエージェントの議論などの複雑なタスクの間、動的に計算資源をスケーリングすることに焦点を当てている。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:27:18 GMT)
SceneCraft: Layout-Guided 3D Scene Generation [29.7] シーンクラフト(SceneCraft)は、テキスト記述や空間的レイアウトの好みに則った、室内の詳細なシーンを生成する新しい方法である。
本手法は,多様なテクスチャ,一貫した幾何,現実的な視覚的品質を有する複雑な屋内シーン生成において,既存のアプローチを著しく上回っている。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:24:19 GMT)
ICon: In-Context Contribution for Automatic Data Selection [29.5] In-context Learning for Contribution Measurement (ICon) は、ICL(In-context Learning)の暗黙的な微調整特性を利用して、計算や手動のインジケータを使わずにサンプルのコントリビューションを測定する、勾配のない手法である。
IConは3つのコンポーネントから構成され、ICLを通じて暗黙的な学習の下でのパフォーマンスシフトを評価することで、ハイコントリビューションデータを識別する。
LLaMA3.1-8Bでは、IConが選択したデータの15%でトレーニングされたモデルは、完全なデータセットを5.42%上回り、広く使われている選択方法の最高のパフォーマンスを2.06%上回る。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:17:37 GMT)
Scalable LLM Math Reasoning Acceleration with Low-rank Distillation [29.4] そこで本研究では,効率的な推論手法の展開から損失能力を回収するための低コスト蒸留法を提案する。
もともとの重みは未成熟で、パラメータの約1%、合成トレーニングサンプルは20Kに過ぎなかった。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:51:24 GMT)
Visual Affordances: Enabling Robots to Understand Object Functionality [29.1] 視覚的可視性予測のための統一的な定式化を提案する。
本稿では,視覚的アベイランス予測と物理世界とを結びつける汎用フレームワークを提案する。
我々のアプローチは、余裕感とロボットの動作のギャップを埋める。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:10:05 GMT)
Adaptive Rate Control for Deep Video Compression with Rate-Distortion Prediction [29.0] 本稿では,ディープビデオ圧縮のためのニューラルネットワークによる$lambda$ドメインレート制御手法を提案する。
コンテンツ認識方式は、フレーム間の品質変動を緩和し、ビデオコンテンツの急激な変化に適応することができる。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:17:43 GMT)
Collaborative Multi-LoRA Experts with Achievement-based Multi-Tasks Loss for Unified Multimodal Information Extraction [28.8] マルチモーダル情報抽出(MIE)は,マルチメディアソースからの構造化情報抽出に注目されている。
従来の方法は、タスク間で知識を共有する機会を欠いているMIEタスクに別々に取り組みます。
達成度に基づくMIEタスクのマルチタスク損失を考慮した,協調的なマルチLORA専門家を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:16:32 GMT)
Let's Ask GNN: Empowering Large Language Model for Graph In-Context Learning [28.7] 本稿では,逐次テキスト処理とグラフ構造化データのギャップを埋める新しいアプローチであるAskGNNを紹介する。
AskGNNはグラフニューラルネットワーク(GNN)を利用した構造強化レトリバーを使用して、グラフをまたいだラベル付きノードを選択する。
3つのタスクと7つのLLMにわたる実験は、グラフタスクのパフォーマンスにおいてAskGNNが優れていることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:40:59 GMT)
Scalable Quantum Architecture Search via Landscape Analysis [28.5] 量子アーキテクチャ探索(QAS)は、変分量子コンピューティングにおいて重要な役割を果たす。
量子回路を効率的に探索し評価するスケーラブルでトレーニング不要なQASフレームワークを導入する。
我々のフレームワークは、挑戦的な50キュービットの量子多体シミュレーションにおいて、堅牢な性能を達成する。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:13:23 GMT)
Generating Symbolic World Models via Test-time Scaling of Large Language Models [28.3] 計画ドメイン定義言語(PDDL)は、正確な状態記述と正式な状態記述を可能にする計画抽象化として利用されます。
このアルゴリズムはまず,初期解の品質向上のためにBest-of-Nサンプリング手法を用いる。
本手法はPDDLドメインの生成において, O1-miniよりもかなり優れている。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:42:18 GMT)
PADriver: Towards Personalized Autonomous Driving [28.0] パーソナライズされた自律運転のための新しいクローズドループフレームワークPADriverを提案する。
マルチモーダル大言語モデル(MLLM)に基づいて構築されたPADriverは、ストリーミングフレームとパーソナライズされたテキストプロンプトを入力として取り込む。
本研究では,ハイウェイ-Envシミュレータに基づくPAD-Highwayというベンチマークを構築し,交通ルールの下での判定性能を総合的に評価する。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:36:07 GMT)
Physics-Assisted and Topology-Informed Deep Learning for Weather Prediction [27.9] 気象予測のための物理ASSisted and Topologyインフォームド深層学習モデルであるPASSATを開発した。
PASSAT は気象の進化を、(i) 対流方程式とナヴィエ・ストークス方程式で特徴づけられる対流過程、(ii) モデル化と計算が困難である地球と大気の相互作用の2つの主要な要因に特化している。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:25:55 GMT)
Probabilistic Uncertain Reward Model [27.4] 本稿では,報酬ハッキングの軽減を目的とした確率的不確実リワードモデル(PURM)を提案する。
実験によると、PURMは報酬ハッキングの開始を著しく遅らせている。
また、PURMは真に音響報酬と不確実性推定を生成する。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:24:24 GMT)
Public Perceptions of Fairness Metrics Across Borders [27.2] 我々は,意思決定シナリオにおける様々な公正度指標に対する一般の認識を評価するために,国際調査を実施している。
我々は,中国,フランス,日本,アメリカ各地の1,000人の参加者から回答を収集し,合計4,000人の参加者を集めた。
本研究は,個人属性と公正度尺度の選択との関係を考察し,国家的文脈の重大な影響を明らかにするものである。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:50:03 GMT)
Tensor networks for quantum computing [27.1] テンソルネットワークの多種多様な応用を概観し、量子コンピューティングにおける重要な道具であることを示す。
具体的には、量子コンピューティングの様々な領域におけるテンソルネットワークの適用について要約し、量子計算のシミュレーション、量子回路合成、量子エラー補正と緩和、量子機械学習について述べる。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:21:12 GMT)
Advances in Automated Fetal Brain MRI Segmentation and Biometry: Insights from the FeTA 2024 Challenge [27.1] FeTA Challenge 2024は胎児脳MRI解析を進歩させた。
組織セグメンテーションと並行して新しい課題としてバイオメトリ予測を導入した。
今回は、新しいローフィールド(0.55T)MRIデータセットからのデータを含む、多様なマルチ中心テストセットを初めて紹介しました。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:03:34 GMT)
HORAE: A Domain-Agnostic Language for Automated Service Regulation [26.9] 本稿では,モデリング(マルチモーダル)ルールの統一仕様言語であるHoreeについて述べる。
私たちは、ルールGPTと呼ばれる細調整された大きな言語モデルをさらに活用することで、Holaeがインテリジェントなサービス規制パイプラインを促進する方法を紹介します。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:57:11 GMT)
TCAN: Text-oriented Cross Attention Network for Multimodal Sentiment Analysis [26.9] 言語・視覚・音響モダリティを活用したマルチモーダル感性分析(MSA)の試み
過去の研究は、主に表現学習技術と特徴融合戦略の改善に焦点を当てた。
テキスト指向のクロスアテンションネットワーク(TCAN)を導入し,MSAにおけるテキストモダリティの主要な役割を強調した。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:04:46 GMT)
Responsibility Gap in Collective Decision Making [26.8] 本論文は、選出された独裁制の概念を提案する。
完全な情報設定では、そのメカニズムが選出された独裁制である場合に限り、ギャップは空である。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:19:59 GMT)
Look Twice Before You Answer: Memory-Space Visual Retracing for Hallucination Mitigation in Multimodal Large Language Models [26.3] マルチモーダルな大言語モデル(MLLM)は幻覚を起こす傾向がある。
MemVRは共通の認知にインスパイアされた新しいデコードパラダイムである。
MemVRは様々なMLLMの幻覚を著しく緩和する。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:49:30 GMT)
Multi-Draft Speculative Sampling: Canonical Decomposition and Theoretical Limits [26.2] 提案手法は,異なるドラフトモデルから独立して提案シーケンスをサンプリングするマルチドラフト・投機的サンプリングについて検討する。
最適スキームを2段階の解に分解できることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:21:08 GMT)
Detecting Multimedia Generated by Large AI Models: A Survey [26.0] この調査の目的は、学術的なギャップを埋め、グローバルなAIセキュリティ努力に貢献することである。
メディアモダリティによって分類された検出手法のための新しい分類法を提案する。
ソーシャルメディアの観点から焦点を絞った分析を行い、より広範な社会的影響を強調します。
論文参考訳(メタデータ) (Thu, 08 May 2025 22:42:11 GMT)
Progressive Inertial Poser: Progressive Real-Time Kinematic Chain Estimation for 3D Full-Body Pose from Three IMU Sensors [25.7] スパース追跡信号からのフルボディポーズ推定は、環境条件や記録範囲によって制限されない。
従来の作業では、骨盤と下肢にセンサーを追加することや、キージョイントのグローバルな位置を得るために外部視覚センサーに頼ることが困難だった。
仮想現実技術の実用性を向上させるため,頭部と手首に装着した3つの慣性計測ユニット(IMU)センサから得られた慣性データのみを用いて,全身のポーズを推定した。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:28:09 GMT)
Interact with me: Joint Egocentric Forecasting of Intent to Interact, Attitude and Social Actions [25.5] SocialEgoNetはグラフベースのフレームワークで、階層的な学習アプローチを通じてタスク依存を利用する。
SocialEgoNetは、高い推論速度のためにビデオ入力のわずか1秒から抽出されたボディスケルトン(顔、手、体からキーポイント)を使用する。
評価のために、新しいクラスラベルとバウンディングボックスアノテーションとの既存のエゴセントリックなヒューマンエージェントインタラクションを強化する。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:28:57 GMT)
Graffe: Graph Representation Learning via Diffusion Probabilistic Models [25.3] 本稿ではグラフ表現学習のための自己教師付き拡散モデルGraffeを紹介する。
ソースグラフをコンパクトな表現に蒸留するグラフエンコーダを特徴とし、拡散復号器の復号過程を導く条件として機能する。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:38:19 GMT)
Federated Deconfounding and Debiasing Learning for Out-of-Distribution Generalization [25.2] 連合学習(FL)における属性バイアスは、典型的には非因果関係の学習により、非矛盾的に局所モデルを最適化する。
本稿では,Underated UnderlineDeconfounding and UnderlineDebiasing UnderlineLearning (FedDDL)法を提案する。
構造化された因果グラフを構築してモデル推論プロセスを分析し、バックドア調整を行い、相反する経路を除去する。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:32:59 GMT)
Noise-Aware Differentially Private Regression via Meta-Learning [25.1] 差別化プライバシ(DP)は、ユーザのプライバシを保護するための金の標準であるが、標準のDPメカニズムはパフォーマンスを著しく損なう。
この問題を緩和する1つのアプローチは、DPがプライベートデータで学習する前にシミュレーションデータ上でモデルを事前訓練することである。
本研究では、シミュレーションデータを用いて、畳み込み条件ニューラルネットワーク(ConvCNP)と改良された機能DPメカニズムを組み合わせたメタ学習モデルをトレーニングする。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:11:41 GMT)
CATCH: Channel-Aware multivariate Time Series Anomaly Detection via Frequency Patching [24.9] 周波数パッチに基づくフレームワークであるCATCHを紹介する。
本稿では,パッチワイドマスクジェネレータとマスクアテンション機構を備えたChannel Fusion Module (CFM)を提案する。
10の現実世界のデータセットと12の合成データセットの実験は、CATCHが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:13:20 GMT)
PPFPL: Cross-silo Privacy-preserving Federated Prototype Learning Against Data Poisoning Attacks on Non-IID Data [24.8] プライバシ保護 フェデレーション学習により、複数のクライアントが、隠れたモデル更新を送信することによって、ディープラーニングモデルを協調的にトレーニングできる。
既存のソリューションは、有毒な非IIDデータにおけるクロスサイロPPFLの性能向上に苦慮している。
本稿では,PFPL という名称のプライバシ保存型フェデレーション型プロトタイプ学習フレームワークを提案し,このフレームワークにより,有毒な非IIDデータにおけるクロスサイロFLの性能が向上する。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:29:57 GMT)
FedTDP: A Privacy-Preserving and Unified Framework for Trajectory Data Preparation via Federated Learning [24.8] トラジェクトリデータは、交通最適化や都市計画といったアプリケーションには不可欠である。
我々は、トラジェクティブデータ作成のためのプライバシー保護と統合化フレームワークであるFedTDPを提案する。
我々はFedTDPが13の最先端ベースラインを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:51:23 GMT)
PaniCar: Securing the Perception of Advanced Driving Assistance Systems Against Emergency Vehicle Lighting [24.7] パニカー(PaniCar)は、物体検知器の信頼性スコアが、アクティベートされた緊急車両の照明にさらされると、検出しきい値以下に変動するデジタル現象である。
この脆弱性は重大な安全リスクをもたらし、自動運転車が緊急車両の近くで物体を検出するのに失敗する可能性がある。
本稿では,緊急車両照明に対する物体検知器のレジリエンスを高めるためのフレームワークであるCaracetamolを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:33:48 GMT)
Chain-of-Thought Tokens are Computer Program Variables [24.6] CoT(Chain-of- Thoughts)は、最終回答に到達する前に中間ステップを生成するために大きな言語モデルを必要とする。
2つの構成課題における大規模言語モデルにおけるCoTトークンの役割について検討する。
中間結果を保持するトークンのみを保存することで、同等のパフォーマンスが得られることが分かりました。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:32:36 GMT)
FLARE: A Framework for Stellar Flare Forecasting using Stellar Physical Properties and Historical Records [24.0] 我々は、恒星フレア予測に特化して設計された第一種モデルであるFLAREを紹介する。
利用可能なケプラー光度曲線データセットに関する実験により、FLAREは全ての評価指標における他の手法と比較して優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:59:42 GMT)
GlyphMastero: A Glyph Encoder for High-Fidelity Scene Text Editing [23.6] GlyphMasteroという特殊なグリフエンコーダは、ストロークレベルの精度でテキストを生成するために、潜時拡散モデルを導出するために設計されている。
本手法は,現状のシーンテキスト編集ベースラインよりも文精度が18.02%向上した。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:11:58 GMT)
Software Development Life Cycle Perspective: A Survey of Benchmarks for CodeLLMs and Agents [23.5] コード大言語モデル(CodeLLMs)とエージェントは、複雑なソフトウェアエンジニアリングタスクに取り組む上で大きな可能性を示しています。
本稿では,CodeLLMとエージェントの既存のベンチマークを総合的にレビューし,461件の関連論文から181件のベンチマークを調査し分析する。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:27:45 GMT)
Smart Starts: Accelerating Convergence through Uncommon Region Exploration [22.8] 本研究では,空空間探索アルゴリズム(ESA)と対向学習(OBL)を組み合わせたハイブリッド戦略を提案する。
OBLは最初、多様な個体群を発生させ、その後ESAによって増強され、探索下にある地域を特定する。
このシナジーは人口の多様性を高め、収束を加速し、複雑な高次元最適化問題におけるEA性能を向上させる。
論文参考訳(メタデータ) (Thu, 08 May 2025 21:36:14 GMT)
Drift: Decoding-time Personalized Alignments with Implicit User Preferences [22.7] Driftは大きな言語モデル(LLM)を暗黙のユーザー好みでパーソナライズする新しいフレームワークである。
分析の結果,Driftは計算効率が高く,解釈可能であることがわかった。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:05:09 GMT)
Quantum Acoustics with Superconducting Qubits in the Multimode Transition-Coupling Regime [22.7] 我々は、超伝導トランスモンキュービットと表面波共振器との結合を調べるために、可変結合装置を作製した。
遷移結合状態において、キュービットがリセットモードに結合されたときに、クビットが高速リセットと高コヒーレンス性能の両方を達成することを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:57:42 GMT)
Unified Attacks to Large Language Model Watermarks: Spoofing and Scrubbing in Unauthorized Knowledge Distillation [22.6] 非許可の知識蒸留における双方向攻撃を可能にする統合フレームワークとして,コントラスト復号型知識蒸留(CDG-KD)を提案する。
提案手法では, 学生モデルと弱透かし参照の出力を比較して, 劣化あるいは増幅された透かしテキストを抽出するために, コントラスト復号を用いる。
本研究は, 頑丈で鍛造不可能な透かし方式の開発において, 重要な必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:42:09 GMT)
LREA: Low-Rank Efficient Attention on Modeling Long-Term User Behaviors for CTR Prediction [22.4] 既存のアプローチの限界を克服する新しい注意機構であるLREAを紹介する。
LREAは、情報整合性を維持しながら注意力を維持するために特別に設計された損失関数を組み込んでいる。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:24:32 GMT)
QiMeng-TensorOp: Automatically Generating High-Performance Tensor Operators with Hardware Primitives [21.5] ワンラインユーザプロンプト(QiMeng-TensorOp)を用いたテンソル演算型自動生成フレームワークを提案する。
本稿では,QiMeng-TensorOpがハードウェアプラットフォームの計算能力を効果的に解き放ち,高性能なテンソル演算子を自動生成することを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:36:21 GMT)
TransProQA: an LLM-based literary Translation evaluation metric with Professional Question Answering [21.3] TransProQA(トランスプロQA)は、文学翻訳評価に特化して設計されたLLMベースの質問応答(QA)フレームワークである。
評価の結果,文芸に精通したXCOMET-XLでは限界ゲインが得られたが,TransProQAは現在の指標よりも大幅に優れていた。
TransProQAは、訓練された言語アノテータに匹敵する人間レベルの評価性能にアプローチする。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:12:56 GMT)
Real-Time Privacy Preservation for Robot Visual Perception [21.1] プライバシを保存するための既存のアプローチは、ディープラーニングモデル、差分プライバシ、暗号化に依存している。
我々は,プライバシーに制約のあるビデオストリーミングPCVSを開発し,リアルタイムビデオストリーム内の機密オブジェクトを隠蔽する。
我々は,ロボットにPCVSをリアルタイムに展開し,ロボットが正常に動作していることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:27:12 GMT)
Recursive Inference Scaling: A Winning Path to Scalable Inference in Language and Multimodal Systems [21.0] 本稿では,言語およびマルチモーダルシステムにおける推論時間をスケールするための補完的なプラグインレシピとして,Recursive Inference Scaling (RINS)を紹介した。
RINS はモバイル LLM の最近の "repeat-all-over" (RAO) 戦略など、他の55種類よりも大幅に優れている。
軽量アダプタでは、RINSは非レグレット戦略を提供するため、RINS対応プレトレーニングにより言語モデリングのパフォーマンスが向上する。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:40:01 GMT)
LLM-Assisted Relevance Assessments: When Should We Ask LLMs for Help? [21.0] テストコレクションは、研究者がランキングアルゴリズムを迅速かつ容易に評価できる情報検索ツールである。
より安価な代替手段として、近年の研究では、人間のアセスメントを完全に置き換えるための大規模言語モデル(LLM)が提案されている。
低予算下でも、リッチで信頼性の高いテストコレクションを構築するのに役立つ、手動アノテーションとLLMアノテーションのバランスをとる効果的な方法であるLARAを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:40:02 GMT)
FedRE: Robust and Effective Federated Learning with Privacy Preference [21.0] Federated Learning (FL) は、生データのプライバシー漏洩を防ぐために、分散トレーニングのためにサーバにグラデーションアグリゲーションを採用する。
プライベート情報は、クライアントからアップロードされたグラデーションの分析を通じて、依然として拡散することができる。
既存の手法では、各サンプルを同じメカニズムで摂動するだけで、実用的な問題を考慮できない。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:50:27 GMT)
Contextual Bandits for Unbounded Context Distributions [20.9] 非パラメトリックな文脈的包帯は、シーケンシャルな意思決定問題の重要なモデルである。
UCB探査と近接する2つの手法を提案する。
本手法は, 限界条件が弱い場合に, 最小限の後悔を達成できることを示す。
2つ目の方法は、$tildeOleft(T1-frac(alpha+1)betaalpha+(d+2)beta+T1-betaright)$の期待された後悔を達成する。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:53:54 GMT)
Divide-and-Conquer: Cold-Start Bundle Recommendation via Mixture of Diffusion Experts [20.9] コールドスタートバンドルレコメンデーションは、レコメンデーションを提供するのに不十分な情報で新しいバンドルをモデリングすることに焦点を当てている。
コールドスタートバンドルレコメンデーションのための分割コンカレント戦略を採用した,新しい拡散エキスパート混合フレームワーク(MoDiffE)を提案する。
MoDiffEは、コールドスタートバンドルレコメンデーションの処理において、既存のソリューションよりも大幅に優れています。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:13:44 GMT)
EDmamba: A Simple yet Effective Event Denoising Method with State Space Model [20.8] イベントカメラは、高時間ダイナミックレンジと低消費電力のため、高速視界で優れている。
ダイナミックな視覚センサーとして、出力は本質的にノイズが多いため、超低レイテンシとリアルタイム処理能力を維持するために効率的なノイズ処理が不可欠である。
状態空間モデル(SSM)に基づく新しいイベント記述フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:27:27 GMT)
SmallPlan: Leverage Small Language Models for Sequential Path Planning with Simulation-Powered, LLM-Guided Distillation [20.7] SmallPlanは、教師モデルとしてLarge Language Modelsを活用して、ハイレベルパス計画タスクのために軽量なSLM(Small Language Models)をトレーニングする新しいフレームワークである。
SLMは、シミュレーション駆動のインターリーブ方式で、LLM指導による微調整と強化学習によって訓練される。
本研究は, GPT-4oのような大型モデルと連続経路計画において, 幻覚や過剰適合に悩まされることなく, 微調整SLMが競合することを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:12:24 GMT)
Semantic Shift Estimation via Dual-Projection and Classifier Reconstruction for Exemplar-Free Class-Incremental Learning [20.6] EFCIL (Exemplar-Free Class-Learning) のためのDPCR (Dual-Projection Shift Estimation and Incremental Reconstruction) アプローチを提案する。
DPCRは、行空間のプロジェクションを組み合わせてタスクワイドとカテゴリワイドの両方のシフトをキャプチャするデュアルプロジェクションを通じて、セマンティックシフトを効果的に推定する。
様々なデータセットにおいて、DPCRは古いタスクと新しいタスクのバランスを効果的に保ち、最先端のEFCIL法より優れていることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:00:37 GMT)
HQC-NBV: A Hybrid Quantum-Classical View Planning Approach [20.5] HQC-NBVはビュープランニングのためのハイブリッド量子古典的フレームワークである。
提案手法は, 多様な環境における探索効率を最大49.2%向上させる。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:05:07 GMT)
Time of the Flight of the Gaussians: Optimizing Depth Indirectly in Dynamic Radiance Fields [20.4] 本稿では,C-ToFカメラを用いて動的シーンを再構成する手法を提案する。
この方法は、ニューラルアプローチと同じような、あるいはより良い精度を実現し、100倍高速である。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:45:53 GMT)
UncertainSAM: Fast and Efficient Uncertainty Quantification of the Segment Anything Model [19.9] 本稿では,ベイズエントロピーの定式化に基づく理論的動機付けの不確実性定量化モデルを提案する。
この定式化を利用して、軽量なポストホックUQ手法USAMを訓練する。
提案した決定論的USAMは,SA-V,MOSE,ADE20k,DAVIS,COCOデータセットに優れた予測能力を示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:36:23 GMT)
A Quantum of Learning: Using Quaternion Algebra to Model Learning on Quantum Devices [19.7] 本稿では,量子学習機械の学習における適応と最適化の課題について考察する。
四元数の除算代数は、量子ビット上の計算と測定の操作を表現する効果的なモデルを導出するために用いられる。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:00:16 GMT)
Artifact Sharing for Information Retrieval Research [19.6] トレーニングされたモデルや事前構築されたインデックス、それを使用するコードなどのアーティファクトの共有は、研究者が中間ステップを検証できるように努力する上で役立ちます。
構築されたインデックスなど、他の種類のアーティファクトを共有するためのコンセンサスはありません。
このデモでは、情報検索研究のためのアーティファクトを共有するフレキシブルで相互運用可能な方法を紹介している。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:23:32 GMT)
Electrocardiogram-Language Model for Few-Shot Question Answering with Meta Learning [19.5] 心電図(ECG)の解釈には専門知識が必要である。
本研究は,数発のECG質問応答のための新しいマルチモーダルメタラーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:20:11 GMT)
Reliably Bounding False Positives: A Zero-Shot Machine-Generated Text Detection Framework via Multiscaled Conformal Prediction [18.8] 既存の検出手法の多くは、高い偽陽性率(FPR)による社会的リスクを無視して、検出精度を過度に重視している。
本稿では,FPRの上界を効果的に制約する Conformal Prediction (CP) を利用してこの問題に対処する。
このトレードオフを克服するために,マルチスケールコンフォーマル予測(MCP)を用いたゼロショットマシン生成テキスト検出フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:32:38 GMT)
clem:todd: A Framework for the Systematic Benchmarking of LLM-Based Task-Oriented Dialogue System Realisations [18.3] クレム・トッドは、一貫した条件下で対話システムを体系的に評価するためのフレームワークである。
プラグインとプレイの統合をサポートし、均一なデータセット、評価メトリクス、計算制約を保証する。
我々の結果は、アーキテクチャ、スケール、および迅速な戦略が対話のパフォーマンスにどのように影響するかについての実用的な洞察を提供する。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:36:36 GMT)
Average Rényi Entanglement Entropy in Gaussian Boson Sampling [17.7] 量子コンピューティングの枠組みとして,出力状態のモーダル絡みについて検討する。
より一般的には、すべての整数に対して、モードの極限において$alpha$ と入力状態に対して$alpha = 1$ の式を導出します。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:20:28 GMT)
OWT: A Foundational Organ-Wise Tokenization Framework for Medical Imaging [17.3] token Group-based Reconstruction (TGR) トレーニングパラダイムを取り入れたOrgan-Wise Tokenization (OWT) フレームワークを提案する。
OWTは明確にイメージを分離可能なトークングループに切り離し、それぞれが別個のオルガンまたはセマンティックエンティティに対応する。
我々の設計では、各トークン群が臓器固有の情報をカプセル化し、解釈可能性、一般化、効率を高める。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:30:44 GMT)
Flight Validation of Learning-Based Trajectory Optimization for the Astrobee Free-Flyer [17.3] 国際宇宙ステーションのアストローブ自由飛行ロボットによる飛行実験の結果を報告する。
理論的解決の保証を保ちながら、機械学習が軌道上での軌道最適化をいかに加速するかを実証する。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:42:36 GMT)
MultiMind: Enhancing Werewolf Agents with Multimodal Reasoning and Theory of Mind [17.3] MultiMindは、マルチモーダル情報をソーシャル推論エージェントに統合する最初のフレームワークである。
言語内容とともに表情と声調を処理し、心の理論(ToM)モデルを用いる。
このToMモデルとMCTS(Monte Carlo Tree Search)を組み合わせることで、エージェントは自身に対する疑念を最小限に抑えるコミュニケーション戦略を特定する。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:34:57 GMT)
Hearing and Seeing Through CLIP: A Framework for Self-Supervised Sound Source Localization [17.2] 音声をCLIPのテキストエンコーダと互換性のあるトークンにマッピングするフレームワークを導入する。
これらの埋め込みは、聴覚領域マスクを生成するために使用され、そこから視覚的特徴を抽出し、オーディオ埋め込みと整合させる。
その結果,事前学習したマルチモーダル基礎モデルのアライメント知識により,より完全かつコンパクトな音像定位を生成できることがわかった。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:32:04 GMT)
FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment [17.0] FindAnythingは、視覚言語情報を高密度のボリュームサブマップに組み込むオープンワールドマッピングフレームワークである。
当社のシステムは,MAVなどのリソース制約されたデバイスにデプロイされる最初のシステムである。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:56:29 GMT)
CloudTrack: Scalable UAV Tracking with Cloud Semantics [16.8] 無人航空機(UAV)は、捜索・救助のシナリオで一般的に使用される。
セマンティック条件付きオープン語彙オブジェクト追跡を行うための新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:26:51 GMT)
Learning Partitions with Optimal Query and Round Complexities [16.8] 未知の$n$要素を少なくとも$k$集合に分割することの基本的な問題を考える。
非適応アルゴリズムには$Theta(n2)$クエリが必要ですが、適応アルゴリズムには$Theta(nk)$クエリが必要です。
我々のアルゴリズムは、最適な$O(nk)$クエリ複雑性を達成するために、$O(log log n)$ラウンドしか必要としない。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:27:29 GMT)
Stealthy LLM-Driven Data Poisoning Attacks Against Embedding-Based Retrieval-Augmented Recommender Systems [16.8] 検索強化レコメンデータシステム(RAG)におけるプロバイダ側データ中毒について検討する。
アイテム記述内でわずかなトークンだけを変更することで、攻撃者はターゲットのアイテムを著しくプロモートまたはデモすることができる。
MovieLensの実験では、2つの大きな言語モデル(LLM)検索モジュールを使用して、微妙な攻撃でも最終的なランク付けとアイテムの露出が変化し、単純な検出が発覚した。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:53:42 GMT)
E-Trojans: Ransomware, Tracking, DoS, and Data Leaks on Battery-powered Embedded Systems [15.5] バッテリー駆動組込みシステム (BES) はユビキタス化されている。
関連するリスクにもかかわらず、BESの内部攻撃面についてはほとんど研究されていない。
我々はe-scooters内部のセキュリティとプライバシに関する最初の評価を提示する。
我々は、BES内部を標的とした4つの新しい攻撃であるE-Trojansを開発する。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:41:34 GMT)
Unsupervised Blind Speech Separation with a Diffusion Prior [15.5] ブラインド音声分離(ブラインド音声分離、BSS)は、マイクロフォンアレイによって記録された音声の混合から複数の音声ソースを分離することを目的としている。
本稿では,非教師付き,配列に依存しない,生成的な方法でBSS問題を解決するためのArrayDPSを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 21:34:35 GMT)
3DSRBench: A Comprehensive 3D Spatial Reasoning Benchmark [15.3] 3次元空間推論は、3次元空間内の物体の位置、向き、空間的関係を分析し、解釈する能力である。
大規模マルチモーダルモデル(LMM)は、幅広い画像および映像理解タスクにおいて顕著な進歩を遂げている。
2,772対の視覚的質問応答対を持つ3DSRBenchを用いた3次元空間推論ベンチマークを作成した。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:59:53 GMT)
USPR: Learning a Unified Solver for Profiled Routing [15.1] Profiled Vehicle Routing Problem (PVRP) は、自動車に特有の嗜好と制約を取り入れている。
近年の強化学習(RL)の解法は,各プロファイル分布の再学習を必要とする。
任意のプロファイルタイプを扱う新しいフレームワークであるUSPRを紹介する。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:42:57 GMT)
UltraGauss: Ultrafast Gaussian Reconstruction of 3D Ultrasound Volumes [15.0] 2D-to-3D再構成は、しばしば計算コストが高く、メモリ集約的であり、超音波物理と相容れない。
UltraGauss - 超音波波伝搬にビュー合成技術を拡張した最初の超音波特異的ガウス平滑化フレームワーク。
実際の臨床超音波データでは、UltraGaussは最先端の再建を5分で達成し、1枚の画像で0.99 SSIMに達する。
論文参考訳(メタデータ) (Thu, 08 May 2025 20:53:47 GMT)
A Reputation System for Large Language Model-based Multi-agent Systems to Avoid the Tragedy of the Commons [14.8] RepuNetはエージェントレベルの評価力学とシステムレベルのネットワーク進化の両方をモデル化したデュアルレベル評価フレームワークである。
我々は、RepuNetが「コモンズ・トレーゲディ」を効果的に緩和し、生成的MASにおける協力の促進と維持を図っていることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:02:20 GMT)
Rethinking Graph Contrastive Learning through Relative Similarity Preservation [14.6] 我々は11個の実世界のグラフを分析し、ホモフィリー・ヘテロフィリー二分法を超越する普遍的なパターンを発見する。
補完的なペアワイド実装とリストワイド実装を備えた新しいGCLフレームワークであるRELGCLを提案する。
我々の手法は、ホモフィリーグラフとヘテロフィリーグラフの両方にまたがる20の既存手法より一貫して優れている。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:24:23 GMT)
Learning from Loss Landscape: Generalizable Mixed-Precision Quantization via Adaptive Sharpness-Aware Gradient Aligning [14.6] 混合精度量子化(MPQ)は、層ごとの最適ビット幅を決定することにより、ニューラルネットワークを最適化するための重要な技術となっている。
しかし、既存のMPQ手法は大きなハードルに直面しており、大規模データセットの量子化ポリシーを計算に高価に検索する必要がある。
本稿では,まず小さなデータセットの量子化ポリシーを探索し,それらを大規模データセットに一般化する手法を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:20:24 GMT)
Towards Large-scale Generative Ranking [14.3] 本稿では,現在の産業推薦者に対して,生成的ランキングがいかに優れているかを考察する。
我々は、ランキングのための新しい生成アーキテクチャであるGenRankを紹介する。
その結果,GenRankは,ほぼ等価な計算資源でユーザ満足度を大幅に向上させることができた。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:51:26 GMT)
Dequantified Diffusion Schrödinger Bridge for Density Ratio Estimation [14.0] 我々は,ロバストで効率的な密度比推定のための統合フレームワークである$textD3textRE$を提案する。
Dequantified Diffusion-Bridge Interpolant (DDBI)を導入し、サポートカバレッジを拡張し、時間スコアを安定化する。
DDBI上に構築されているDequantified Schr"odinger-Bridge Interpolant (D SBI)は、Schr"odinger Bridgeの問題を解決するための最適な輸送を組み込んでいる。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:12:16 GMT)
ReplaceMe: Network Simplification via Layer Pruning and Linear Transformations [13.9] ReplaceMeは、大規模言語モデルのトレーニング不要な深度解析手法である。
低圧縮比で高い性能を維持しつつ、変圧器ブロックを線形演算に置き換える。
ReplaceMeを実装したオープンソースのライブラリを,最先端のプルーニング技術とともに提供している。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:52:34 GMT)
Uncertainty-Weighted Image-Event Multimodal Fusion for Video Anomaly Detection [13.9] Image-Event Fusion for Video Anomaly Detection (IEF-VAD)は、RGBビデオから直接イベント表現を合成するフレームワークである。
IEF-VADは、複数の実世界の異常検出ベンチマークにまたがって、新しい技術状態を設定する。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:44:41 GMT)
PIDiff: Image Customization for Personalized Identities with Diffusion Models [13.7] PIDiff という名前の個人識別テキスト・画像生成のためのファインチューニングに基づく新しい拡散モデルを提案する。
PIDiffは意味的絡み合いを回避し、正確な特徴抽出と局所化を実現する。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:26:28 GMT)
A Neuro-Symbolic Framework for Sequence Classification with Relational and Temporal Knowledge [13.7] ニューロシンボリック人工知能のゴールの1つは、学習タスクのパフォーマンスを改善するために背景知識を活用することである。
この研究では、異なるタイミングで異なる知識を使わなければならない知識駆動シーケンスのより難しい問題について検討する。
結果は、この新しい設定の挑戦的な性質を示し、また、ニューロシンボリックな方法の未発見の欠点を強調している。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:10:00 GMT)
MonoCoP: Chain-of-Prediction for Monocular 3D Object Detection [13.6] 提案するMonoCoPは,3つのキー設計により3次元特性を逐次的かつ条件的に予測する。
追加のデータを必要とせずに、KITTIのリーダーボード上での最先端(SoTA)パフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:18:31 GMT)
On Corruption-Robustness in Performative Reinforcement Learning [13.5] 本研究では,反復的再訓練アプローチの適応的安定政策への収束性について検討する。
私たちはこれらのアプローチを拡張して、腐敗したデータの下で運用します。
我々は,我々のアプローチがほぼ安定な政策に最終段階の収束を示すことを証明した。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:37:35 GMT)
Applications of Artificial Intelligence for Cross-language Intelligibility Assessment of Dysarthric Speech [13.5] 本解説では, 変形性音声の言語間信頼度評価を推し進めるための概念的枠組みを紹介する。
音声・音声表現に変形音声をエンコードするユニバーサル音声モデルを提案し,それに続いて言語固有の知性評価モデルを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:22:39 GMT)
Toward Reasonable Parrots: Why Large Language Models Should Argue with Us by Design [13.1] 我々は、現在、この目的には大きな言語モデル(LLM)が不十分であると主張している。
これは、LLMを置き換えるのではなく、批判的な思考を実践するためのツールとして再定義する、ということです。
我々は、関係性、責任、自由の基本的な原則を具現化した「合理的なオウム」の概念を導入する。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:41:07 GMT)
Large Language Model-driven Security Assistant for Internet of Things via Chain-of-Thought [13.0] 大規模言語モデル(LLM)によるIoTセキュリティアシスタントを提案する。
提案するLLM駆動型IoTセキュリティアシスタントは,ICoTアプローチによるIoTセキュリティ問題の理解を大幅に改善する。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:47:24 GMT)
Latte: Transfering LLMs` Latent-level Knowledge for Few-shot Tabular Learning [13.0] Latteはトレーニング時の知識抽出フレームワークで、より一般化された下流モデルの最適化のために、Large Language Models内で遅延した事前知識を転送する。
既存の教師なし事前トレーニングパラダイムと互換性があり、利用可能なラベル付きサンプルを効果的に利用して、非常に小さなラベル付きデータセットによって課されるパフォーマンス制限を克服する。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:32:09 GMT)
Biomed-DPT: Dual Modality Prompt Tuning for Biomedical Vision-Language Models [12.9] 知識に富んだ2次元モーダル・プロンプト・チューニング手法であるBiomed-DPTを提案する。
テキストプロンプトを設計する際、Biomed-DPTはテンプレート駆動型臨床プロンプトとLLM(Big Language Model)駆動型ドメイン適応プロンプトを含む二重プロンプトを構築する。
ビジョンプロンプトの設計において、Biomed-DPTは、注意再重み付けを活用するソフトプロンプトとしてゼロベクトルを導入し、非診断領域へのフォーカスと非クリティカルな病理学的特徴の認識を回避する。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:37:51 GMT)
Towards Mitigating API Hallucination in Code Generated by LLMs with Hierarchical Dependency Aware [12.8] 大規模言語モデル(LLM)は自動コード生成を支援するが、しばしばAPI幻覚に悩まされる。
既存の研究は、幻覚を緩和するためのRAG(Retrieval-Augmented Generation)手法を利用している。
階層的依存を意識したLLMで生成されたコード中のAPI幻覚を緩和するフレームワークであるMARINを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:48:17 GMT)
RAP-SM: Robust Adversarial Prompt via Shadow Models for Copyright Verification of Large Language Models [12.5] RAP-SMは、大規模な言語モデル全体の公開指紋を抽出する新しいフレームワークである。
実験の結果,RAP-SMは異なるモデル間の固有共通点を効果的に捉えていることがわかった。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:21:58 GMT)
Safety Evaluation of DeepSeek Models in Chinese Contexts [12.3] 本研究では,中国固有の安全性評価ベンチマークであるCHiSafetyBenchを紹介する。
このベンチマークは、中国の文脈におけるDeepSeek-R1とDeepSeek-V3の安全性を体系的に評価する。
実験結果は、これらの2つのモデルの中国の文脈における欠陥を定量化し、その後の改善の鍵となる洞察を与える。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:35:18 GMT)
Analyzing Consumer IoT Traffic from Security and Privacy Perspectives: a Comprehensive Survey [12.1] 今回の調査では、2018年1月から2024年6月までに、CIoTセキュリティとプライバシドメイン内のトラフィック分析に関する310のパブリッシュをレビューする。
CIoTのセキュリティとプライバシのリスクを評価するために、トラフィック分析ツールの応用を理解する研究者を支援することを目的としている。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:23:42 GMT)
Moments of Causal Effects [12.1] この研究は、それらの分布と関係を分析するために因果効果のモーメントと積モーメントの定義、識別定理、および境界を与える。
本研究では,有限標本から因果効果のモーメントを推定する実験を行い,実世界の医療データセットを用いてその実践的応用を実証する。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:09:05 GMT)
Decomposition of Probabilities of Causation with Two Mediators [12.1] 因果仲裁分析の主要な目的の1つは、全効果を経路特異的成分に分解することである。
本研究では,PNSを経路特異的成分に分解する経路特異的な必要十分性および十分性(PNS)について検討した。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:40:17 GMT)
T2VTextBench: A Human Evaluation Benchmark for Textual Control in Video Generation Models [12.1] T2VTextBenchは、画面上のテキストの忠実度と時間的一貫性を評価するための最初の人間評価ベンチマークである。
オープンソースソリューションから商用製品まで,10の最先端システムを評価しました。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:49:52 GMT)
The City that Never Settles: Simulation-based LiDAR Dataset for Long-Term Place Recognition Under Extreme Structural Changes [12.1] 大規模な建設と解体は、長期的な場所認識に大きく挑戦する。
既存のデータセットは、主に限定的または屋内的な変更を反映している。
CARLAシミュレータを用いて作成したシミュレーションベースのデータセットであるCity that Never Settlesデータセットを紹介する。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:16:01 GMT)
LLM-Driven Usefulness Judgment for Web Search Evaluation [12.1] 情報検索(IR)における検索体験の最適化と多種多様なユーザ意図支援の基礎的評価
従来の検索評価手法は主に関連ラベルに依存しており、検索された文書がユーザのクエリとどのようにマッチするかを評価する。
本稿では,文書の有用性を評価するために,暗黙的かつ明示的なユーザ行動信号の両方を組み込んだLCM生成実用性ラベルを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:07:06 GMT)
Taming OOD Actions for Offline Reinforcement Learning: An Advantage-Based Approach [11.8] オフライン強化学習(RL)は、オンラインインタラクションなしで、固定データセットから意思決定ポリシーを学ぶことを目的としている。
本稿では, OOD アクションを体系的に評価する新しい手法として, アドバンテージベースの拡散アクター・クリティカル (ADAC) を提案する。
ADACはD4RLベンチマークのほとんど全てのタスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:57:28 GMT)
Exploring the Trade-Offs: Quantization Methods, Task Difficulty, and Model Size in Large Language Models From Edge to Giant [11.8] 量子化は、大規模および小規模言語モデルのコスト効率のよいデプロイのための有望なソリューションとして注目を集めている。
1Bから405Bパラメータにまたがる命令調整モデルの総合評価を行い、13のデータセットに対して4つの量子化手法を適用した。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:51:19 GMT)
A Survey on Inference Engines for Large Language Models: Perspectives on Optimization and Efficiency [11.8] 本稿では,25個のオープンソースおよび商用推論エンジンの総合評価を行う。
本稿では,各推論エンジンについて,スループットとレイテンシを考慮した計算における使いやすさ,使いやすさ,汎用サポート,スケーラビリティ,適合性の観点から検討する。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:08:40 GMT)
Data-Driven Merton's Strategies via Policy Randomization [11.8] 不完全市場におけるメルトンの予測ユーティリティ問題について検討する。
エージェントは、株式とファクターバリューのプロセスにのみアクセス可能な価格取付業者である。
エージェントが特定の分布のクラスに応じてポリシーランダム化を実行することができる補助的問題を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:43:54 GMT)
How Do Multimodal Large Language Models Handle Complex Multimodal Reasoning? Placing Them in An Extensible Escape Game [11.7] マルチモーダル推論のベンチマークであるMM-Escapeを紹介する。
MM-Escapeは最終タスク完了と同時に中間モデル動作を強調している。
大規模な実験により、MLLMはスケールに関係なく、最も単純な部屋の脱出タスクを完了できることが示されている。
性能ボトルネックはモデルによって異なり、異なる障害モードとマルチモーダル推論能力の制限が明らかになる。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:40:47 GMT)
ChainMarks: Securing DNN Watermark with Cryptographic Chain [11.7] ディープニューラルネットワーク(DNN)モデルは、モデル所有者の知的特性を保護するために使用されている。
近年の研究では、既存の透かし方式は透かし除去やあいまいさ攻撃に弱いことが示されている。
トリガ入力に暗号チェーンを導入することにより,セキュアで堅牢な透かしを生成するChainMarksを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:30:46 GMT)
A Two-Sample Test of Text Generation Similarity [11.7] 本稿では,2つの文書群間の類似性を比較するための2サンプルテキストテストを提案する。
提案試験は,文書のエントロピーを比較することで,テキストの類似性を評価することを目的としている。
様々なシミュレーション研究と実データ例により、提案した2サンプルのテキストテストは、名目上のType 1エラー率を維持することを示した。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:15:53 GMT)
CLAM: Continuous Latent Action Models for Robot Learning from Unlabeled Demonstrations [11.6] 模倣学習を用いたロボットポリシーの学習には、高価なアクションラベル付きエキスパートのデモを大量に収集する必要がある。
有望なアプローチは、例えばビデオデモから教師なしの方法で潜在アクションラベルを学習するといった、ラベルなしの観測の多さを活用することである。
我々は、ラベルのない観測データから複雑な連続制御タスクを解くのに必要な2つの重要な要素を組み込んだ連続潜時行動モデル(CLAM)を設計する。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:07:58 GMT)
Frame In, Frame Out: Do LLMs Generate More Biased News Headlines than Humans? [11.6] メディアにおけるフレーミングは、他の人を軽視しながら、いくつかの詳細を選択的に強調することで、公共の認識を批判的に形作る。
自動ニュースやコンテンツ作成における大規模言語モデルの台頭により、これらのシステムが人間の著者と比較してフレーミングバイアスを導入または増幅するのではないかという懸念が高まっている。
我々の分析によると、特に政治的・社会的に敏感な文脈では、LLMは人間のものよりも顕著なフレーミングを示す傾向にある。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:46:24 GMT)
Demonstrating ViSafe: Vision-enabled Safety for High-speed Detect and Avoid [11.6] 視覚のみの空中衝突回避システムであるViSafeについて紹介する。
ViSafe は Detect and Avoid (DAA) 問題に対するフルスタックソリューションを提供する。
ViSafeは、さまざまなシナリオにまたがって、継続的に自己分離を保証します。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:12:19 GMT)
CacheSquash: Making caches speculation-aware [11.5] 高いCPUパフォーマンスを実現する上では、投機が鍵となるが、Spectre攻撃のようなリスクを可能にする。
本稿では,メモリアクセスの不正を解消する新しい対策であるCacheSquashを提案する。
gem5にCacheSquashを実装し、ほぼゼロに近いパフォーマンスのオーバーヘッドで、実用的なSpectre攻撃を阻止していることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:55:38 GMT)
Regularized Robustly Reliable Learners and Instance Targeted Attacks [11.4] Balcan et al (2022) は、堅牢で信頼性の高い学習者の概念を定義することによって、この問題に対処するアプローチを提案した。
少なくともある興味深いケースでは、トレーニング時間内にサブリニアで出力を生成できるアルゴリズムを設計できることが示されています。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:45:26 GMT)
Recovering optimal precision in quantum sensing with time domain imperfections [11.4] 時間領域の不完全性を伴う量子センシングの基本的な設定を考える。
制御戦略を設計し、制御自由戦略よりも優れていることを示す。
我々の発見は、量子センシングにおける量子制御の利点が不完全性の存在においても持続していることを確認する。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:38:45 GMT)
DispBench: Benchmarking Disparity Estimation to Synthetic Corruptions [11.4] ディープラーニング(DL)は、標準的なベンチマークで人間のパフォーマンスを上回っ、コンピュータビジョンタスクに広く採用されている。
DispBenchは、分散度推定法の信頼性を体系的に評価するための総合的なベンチマークツールである。
本稿では,従来の不均一性推定手法の性能とロバスト性解析を行い,精度,信頼性,一般化の鍵となる相関関係を明らかにする。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:40:17 GMT)
EAM: Enhancing Anything with Diffusion Transformers for Blind Super-Resolution [11.3] Enhancing Anything Model (EAM)はBlind Super-Resolution法である。
画像復元を効果的に誘導する新しいブロックである$Psi$-DiTを導入する。
EAMは、複数のデータセットにまたがる最先端の結果を達成し、定量的メトリクスと視覚的品質の両方において、既存の手法よりも優れています。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:03:07 GMT)
Driving with Context: Online Map Matching for Complex Roads Using Lane Markings and Scenario Recognition [11.3] 現在のオンライン地図マッチング手法は、複雑な道路網の誤りを招きやすい。
複数の確率因子を持つ隠れマルコフモデル(HMM)を構築することで、オンライン標準定義(SD)マップマッチング手法を提案する。
提案手法は,路面標識やシナリオ認識を慎重に利用することにより,複雑な道路網においても正確な地図マッチングを実現することができる。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:24:52 GMT)
MAISY: Motion-Aware Image SYnthesis for Medical Image Motion Correction [11.2] 本研究では、まず動きを特徴付ける動き認識画像合成法(MAISY)を提案する。
胸部CTおよび頭部CTを用いた実験では、我々のモデルは最先端のモデルよりも優れていた。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:09:55 GMT)
Smaller but Better: Self-Paced Knowledge Distillation for Lightweight yet Effective LCMs [11.1] 知識蒸留(KD)は、より大規模で先進的なLCMのプログラミング能力をより小さく、より少ないLCMに転送する、有望なソリューションを提供する。
我々は,軽量で効果的な学生用LCMを開発することを目的とした,SODA(Self-Paced knedge DistillAtion)フレームワークを提案する。
SodaCoderは軽量で効果的なLCMのシリーズで、16Bパラメータ以下で15のLCMを上回ります。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:19:47 GMT)
InstanceGen: Image Generation with Instance-level Instructions [11.0] 画像に基づく構造ガイダンスとLLMに基づくインスタンスレベルの命令を併用する手法を提案する。
結果: 画像は、オブジェクトカウント、インスタンスレベルの属性、インスタンス間の空間的関係を含む、テキストプロンプトのすべての部分に準拠します。
論文参考訳(メタデータ) (Thu, 08 May 2025 22:31:23 GMT)
MDE-Edit: Masked Dual-Editing for Multi-Object Image Editing via Diffusion Models [10.8] 我々は,MDE-Edit と呼ばれる複雑な多目的シーンにおいて,高精度な局所化画像操作を可能にする,トレーニング不要な推論ステージ最適化手法を提案する。
大規模な実験により、MDE-Editは、編集精度と視覚的品質において最先端の手法よりも優れており、複雑な多目的画像操作タスクに対する堅牢なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:01:14 GMT)
Summarizing Bayesian Nonparametric Mixture Posterior -- Sliced Optimal Transport Metrics for Gaussian Mixtures [10.7] 混合モデルの後方推論を要約する既存の方法は、クラスタリングのための暗黙のランダムパーティションの点推定を同定することに焦点を当てている。
本研究では,非パラメトリックベイズ混合モデルにおける後部推論を要約し,混合度(または混合度)を推定対象として優先順位付けする手法を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:00:36 GMT)
MDAA-Diff: CT-Guided Multi-Dose Adaptive Attention Diffusion Model for PET Denoising [10.5] そこで本研究では,多線量PET復調のための新しいCT-Guided Multi-Dose Adaptive Attention Denoising Diffusion Model (MDAA-Diff)を提案する。
提案手法は,低用量条件下での消音性能を向上させるために,解剖学的ガイダンスと線量レベル適応を統合した。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:27:12 GMT)
Learning Linearized Models from Nonlinear Systems under Initialization Constraints with Finite Data [10.4] 真の基礎となる力学が非線形であるとき、線形化モデルを同定する問題を考察する。
複数のトラジェクトリに基づく決定論的データ取得アルゴリズムを提供し、次に正規化最小二乗アルゴリズムを提案する。
我々の誤差境界は、線形化された力学を一貫して学習できることを示し、非線形性による誤差とノイズによる誤差とのトレードオフを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:26:52 GMT)
CodeIF-Bench: Evaluating Instruction-Following Capabilities of Large Language Models in Interactive Code Generation [10.4] 我々は,大規模言語モデルの命令追従能力を評価するためのベンチマークであるCodeIF-Benchを紹介する。
具体的には、CodeIF-Benchには9種類の検証可能な命令が組み込まれており、実際のソフトウェア開発要件に準拠している。
CodeIF-Bench を用いて 9 つの著名な LLM の評価を行い,実験結果から基本的なプログラミング能力と命令追従能力の相違が明らかとなった。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:56:05 GMT)
Two-Stage Nuisance Function Estimation for Causal Mediation Analysis [10.4] 調停機能の影響関数におけるニュアンス関数の2段階推定法を提案する。
この戦略は、媒介機能に対する影響関数に基づく推定器のバイアス構造において、これらのニュアンス関数が果たす役割によって導かれる。
論文参考訳(メタデータ) (Thu, 08 May 2025 22:21:48 GMT)
MolMole: Molecule Mining from Scientific Literature [10.2] MolMoleは、分子検出、反応図解析、光学化学構造認識を統合するビジョンベースのディープラーニングフレームワークである。
分子境界ボックス,反応ラベル,MOLファイルを付加した550ページのテストセットを提示する。
MolMoleはベンチマークと公開データセットの両方で既存のツールキットよりも優れています。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:48:54 GMT)
SATA: Safe and Adaptive Torque-Based Locomotion Policies Inspired by Animal Learning [10.1] SATAは、動物の移動で観察される重要な生体力学的原理と適応学習機構を模倣する生体に触発されたフレームワークである。
本手法は,早期探索を著しく改善し,トルクベースの政策を学習する上での課題を効果的に解決する。
実験結果から,SATAは,挑戦的環境においても,顕著なコンプライアンスと安全性を示すことが明らかとなった。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:48:59 GMT)
HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation [10.0] HunyuanCustomは、画像、オーディオ、ビデオ、テキストの状態をサポートしながら、主題の一貫性を強調する、カスタマイズされたビデオ生成フレームワークである。
本研究は,制御可能な映像生成におけるマルチモーダル・コンディショニングとアイデンティティ保存戦略の有効性を強調した。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:29:00 GMT)
Enhancing Cooperative Multi-Agent Reinforcement Learning with State Modelling and Adversarial Exploration [9.8] 分散部分観測環境における協調学習はマルチエージェント深部強化学習(MARL)に重大な課題をもたらす
本稿では,個々のエージェント観測から状態表現を推定することに着目し,この領域における重要な懸念に対処する。
本稿では,非可観測状態の有意義な信念表現をエージェントが推論する,協調的MARLのための新しい状態モデリングフレームワークを提案する。
SMPEは,MPE,LBF,RWAREベンチマークの複雑な完全協調タスクにおいて,最先端のMARLアルゴリズムよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:07:20 GMT)
Label-Efficient Deep Learning in Medical Image Analysis: Challenges and Future Directions [9.8] 限られた監督下でモデル性能を向上させるためにラベル効率の高いディープラーニング手法が出現している。
これらの手法はラベルなし、ラベル不足、不正確なラベル、ラベル改善の4つのパラダイムに分類される。
我々は,研究の約束から日常的な臨床医療へのラベル効率学習の翻訳を容易にするために,現在の課題と今後の方向性を特定した。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:51:45 GMT)
Community and hyperedge inference in multiple hypergraphs [9.8] 複数のハイパーグラフ間の相互接続を利用して、複数の高階システムから統合された情報を合成する方法を示す。
ブロックモデルに基づくモデルを提案し、複数のハイパーグラフからの情報を統合し、潜在高次構造を明らかにする。
我々の研究は、複数のハイパーグラフを解析するための実用的で柔軟なツールを提供し、現実世界の高階システムにおける組織の理解を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:52:41 GMT)
Adaptive Attention-Based Model for 5G Radio-based Outdoor Localization [9.8] マルチパス干渉と閉塞は、局所化の精度に影響を与える様々なレベルの複雑さをもたらす。
我々は,浅い注意に基づくモデルと単一層パーセプトロンに基づくルータ/スイッチング機構を組み合わせた適応的ローカライゼーションフレームワークを開発した。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:42:12 GMT)
Hybrid Personalization Using Declarative and Procedural Memory Modules of the Cognitive Architecture ACT-R [9.7] 本稿では,認知アーキテクチャACT-Rに基づくハイブリッドユーザモデリングフレームワークを提案する。
我々は、より透明性のあるレコメンデーションを提供し、ルールに基づく説明を可能にし、認知バイアスのモデリングを容易にすることを目指している。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:32:04 GMT)
Multi-Objective Reinforcement Learning for Adaptive Personalized Autonomous Driving [9.6] 既存のエンドツーエンドの運転アプローチは、事前に定義された運転スタイルに依存したり、適応のために継続的なユーザーフィードバックを必要としたりすることが多い。
本稿では,動的・文脈依存的嗜好をサポートする自律運転のための新しい学習手法を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:16:37 GMT)
GeoUni: A Unified Model for Generating Geometry Diagrams, Problems and Problem Solutions [9.6] 一つのフレームワーク内で問題解と図を生成することのできる最初の統一幾何エキスパートモデルであるGeoUniを提案する。
1.5Bのパラメータしか持たないGeoUniは、幾何学的推論タスクにおいて、671Bのパラメータを持つDeepSeek-R1のようなより大きなモデルに匹敵するパフォーマンスを達成する。
GeoUniは正確な幾何学図の作成にも優れており、GPT-4o画像生成を含むテキスト・ツー・イメージモデルと統一モデルの両方を超越している。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:36:20 GMT)
Deep Optimal Transport for Domain Adaptation on SPD Manifolds [9.6] 最適輸送理論とSPD多様体の幾何学を組み合わせた新しい幾何学的深層学習フレームワークを提案する。
提案手法は, 多様体構造を尊重しながらデータ分布を整列させ, 限界差と条件差を効果的に低減する。
提案手法は,KU,BNCI2014001,BNCI2015001の3つのクロスセッション脳コンピュータインタフェースデータセットに対して検証を行った。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:50:20 GMT)
Probabilistic Embeddings for Frozen Vision-Language Models: Uncertainty Quantification with Gaussian Process Latent Variable Models [9.5] 視覚言語モデル(VLM)は、画像とテキストを共有潜在空間にマッピングすることで、共同表現を学習する。
GroVEはGaussian Process Latent Variable Model (GPLVM)に基づいて構築され、画像とテキストの入力を統一表現にマッピングする共有低次元潜在空間を学習する。
GroVEは、クロスモーダル検索、視覚的質問応答、アクティブラーニングなど、複数の下流タスクにわたる最先端の不確実性キャリブレーションを実現する。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:57:35 GMT)
ADD: Physics-Based Motion Imitation with Adversarial Differential Discriminators [9.4] 本稿では,モーショントラッキングを含む多目的最適化問題に広く適用可能な,新しい対向多目的最適化手法を提案する。
我々の技術はキャラクターが様々なアクロバティックな行動やアジャイルな行動を再現し、最先端のモーショントラッキング手法に匹敵する品質を達成できることを示した。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:42:33 GMT)
FF-PNet: A Pyramid Network Based on Feature and Field for Brain Image Registration [9.4] 特徴および変形場(FF-PNet)に基づく新しいピラミッド登録ネットワークを構築する。
粗い特徴抽出のために, 微細な画像変形のための残留特徴融合モジュール (RFFM) を設計し, 残留変形場融合モジュール (RDFFM) を提案する。
これら2つのモジュールの並列操作により、モデルは複雑な画像の変形を効果的に処理できる。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:27:11 GMT)
Evaluating Deep Learning Models for Breast Cancer Classification: A Comparative Study [9.4] Vision Transformer (ViT) モデルは、その注意に基づくメカニズムにより、94%の検証精度を達成した。
本研究は, 臨床現場における乳癌診断の精度と効率を高めるため, 高度な機械学習手法の可能性を示すものである。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:34:48 GMT)
Proxy Prompt: Endowing SAM and SAM 2 with Auto-Interactive-Prompt for Medical Segmentation [9.4] プリアノテートマスクを用いた非ターゲットデータを利用して自動生成するProxy Prompt (PP)を提案する。
非ターゲットデータから最も代表的な文脈情報を適応的に選択する3段階のコンテキスト選択戦略を考案する。
提案手法は,4つの公開データセット上での最先端性能を達成し,16個の画像マスクでトレーニングした場合でも,完全に訓練されたモデルと同等の結果が得られる。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:40:45 GMT)
Reinforcement Learning for Game-Theoretic Resource Allocation on Graphs [9.4] GRAG (Game-theoretic Resource allocation on graphs) は、マルチステップのColoner Blotto Game (MCBG) としてモデル化された問題である。
MCBGをマルコフ決定過程(MDP)として定式化し、強化学習(RL)法、特にDeep Q-Network(DQN)とPPOを適用した。
各種グラフ構造および初期資源分布におけるRL性能の評価を行い, ランダム, 欲求, 学習されたRLポリシーとの比較を行った。
論文参考訳(メタデータ) (Thu, 08 May 2025 21:12:34 GMT)
Building-Guided Pseudo-Label Learning for Cross-Modal Building Damage Mapping [9.3] 両時間リモートセンシング画像を用いた建物被害評価は, 効果的な災害対応と復旧計画に不可欠である。
本研究は, ビルディングガイドを用いたPseudo-Label Learning Frameworkを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:37:12 GMT)
On noise in swap ASAP repeater chains: exact analytics, distributions and tight approximations [9.3] 損失は量子ネットワークにおける絡み合いの分布の主要なボトルネックの1つである。
等間隔リピータの事例を解析的に検討する。
最大25セグメントまでの忠実度の全モーメントについて、正確な解析公式を求める。
論文参考訳(メタデータ) (Thu, 08 May 2025 21:14:09 GMT)
Nexus-Gen: A Unified Model for Image Understanding, Generation, and Editing [9.3] Nexus-Genは,多モーダル大言語モデルの言語推論能力を,拡散モデルの画像合成能力と相乗化する統一モデルである。
本稿では, 連続埋め込みではなく, 位置埋め込み型特殊トークンで入力シーケンスをプリフィルする自己回帰方式を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:58:12 GMT)
PhysFlow: Unleashing the Potential of Multi-modal Foundation Models and Video Diffusion for 4D Dynamic Physical Scene Simulation [9.3] PhysFlowは、マルチモーダル基礎モデルとビデオ拡散を利用して、強化された4次元ダイナミックシーンシミュレーションを実現する新しいアプローチである。
この統合フレームワークは、現実世界のシナリオにおける動的相互作用の正確な予測と現実的なシミュレーションを可能にする。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:27:10 GMT)
Continuous Thought Machines [9.2] 本稿では、ニューラルネットワークをコア表現として活用するモデルであるContinuous Thought Machine(CTM)を紹介する。
CTMには、(1)ニューロンレベルの時間的処理、(2)ニューロンが独自の重みパラメータを使用して受信信号の履歴を処理する、(2)遅延表現として使用される神経同期という2つの中心的革新がある。
我々は,ImageNet-1K分類,2D迷路の解決,ソート,パリティ,質問応答,RLタスクなど,さまざまな課題にまたがるCTMの性能と汎用性を実証した。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:31:54 GMT)
Exploration of COVID-19 Discourse on Twitter: American Politician Edition [9.2] 我々は、国際危機への対応に向けたアプローチ、対応、態度における党派的な相違について検討する。
私たちは、アメリカの政治指導者から集められたツイートの集まりをオンラインで使っている(共和党と民主党)
結果は、民主党はパンデミックの犠牲者をより心配し、医療予防と勧告を大衆に与え、一方共和党は政治的責任により多くの投資をしていることを示唆している。
論文参考訳(メタデータ) (Thu, 08 May 2025 23:17:03 GMT)
RoBERTa-Augmented Synthesis for Detecting Malicious API Requests [9.0] GANにインスパイアされた学習フレームワークを導入し、ターゲットとなるドメイン認識合成を通じて限られたAPIトラフィックデータセットを拡張する。
我々は,CSIC 2010 と ATRDF 2023 の2つのベンチマークデータセット上でフレームワークを評価し,従来のデータ拡張手法と比較した。
CSIC 2010ではF1スコアが4.94%増加し,ATRDF 2023では21.10%向上した。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:28:06 GMT)
QualBench: Benchmarking Chinese LLMs with Localized Professional Qualifications for Vertical Domain Evaluation [8.9] 我々は,中国のLLMのローカライズドアセスメントに特化した,最初のマルチドメイン中国語QAベンチマークQualBenchを紹介する。
データセットには6つの垂直領域にわたる17,000以上の質問が含まれている。
75.26%の最高のパフォーマンスは、モデル機能における現在のドメインカバレッジのギャップを示している。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:16:49 GMT)
IntelliCardiac: An Intelligent Platform for Cardiac Image Segmentation and Classification [8.8] 我々は4次元心臓画像の自動分割と疾患分類のためのWebベースのプラットフォームであるIntelliCardiacを紹介した。
IntelliCardiacは、パブリックアクセス可能なACDCデータセットに基づいてトレーニングされたAIモデルを使用して、重要な心臓構造を特定し、心臓疾患を分類する。
本システムは, 右心室, 左心室および心筋を解析し, 患者の心像を5つの診断カテゴリーに分類する。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:21:21 GMT)
Enhancing Differential Testing With LLMs For Testing Deep Learning Libraries [8.8] 本稿では,DLライブラリのためのLLM強化差分試験手法を提案する。
与えられたAPIの代替実装を見つけ、多様なテストインプットを生成するという課題に対処する。
最先端技術で見られるAPIの1.84倍の数のAPIを合成する。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:48:00 GMT)
Generalization Analysis for Contrastive Representation Learning under Non-IID Settings [8.7] コントラスト表現学習は近年,様々な領域で顕著な成功を収めている。
現在の文献は、対照的な学習に使用されるデータが独立して同一に分散されているという仮定の下で、一般化境界を解析しているだけである。
我々は、より現実的な実践に固執する非$i.d.$設定の下で、CRLフレームワークの一般化分析を提供する。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:26:41 GMT)
Boosting Adverse Weather Crowd Counting via Multi-queue Contrastive Learning [8.7] マルチキューコントラスト学習(MQCL)と呼ばれる2段階の群集カウント手法を提案する。
MQCLは、悪天候下でのカウントエラーを22%削減し、計算負荷の約13%の増加しか導入していない。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:20:07 GMT)
AI and Vision based Autonomous Navigation of Nano-Drones in Partially-Known Environments [8.6] この研究は、Crzyflie 2.1と呼ばれる、ポケットサイズの30グラムのプラットホームの安全かつ自律的な飛行を可能にすることに焦点を当てている。
統合センシング, コンピューティング, コミュニケーションのパラダイムを取り入れた, 障害物回避のためのAI支援型リアクティブ計画手法を提案する。
ドローンを毎秒$sim8$のフレームでコマンドできる能力と、COCOの平均平均精度が60.8ドルのモデル性能を示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:16:36 GMT)
Giant Tunneling Magnetoresistance in Graphene/$h$-BN Based van der Waals Magnetic Tunnel Junctions via 3$d$ Transition Metal Intercalation [8.6] 遷移金属インターカレートグラフェン電極と$h$-BNバリア層を用いた完全2次元磁気トンネル接合の構成法を提案する。
第一原理計算では、インターカレーションは立体的障害による均一な原子分散を安定化するだけでなく、グラフェンの強強磁性を誘導する。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:23:02 GMT)
Automated Thoracolumbar Stump Rib Detection and Analysis in a Large CT Cohort [8.6] 本研究は胸腰椎スランプリブの自動検出と形態解析を定量的に行うことを目的とする。
我々は、リブセグメンテーションのための高分解能ディープラーニングモデルを訓練し、既存のモデルと比較して大幅に改善した。
これらの特徴は, 部分的に見えるリブでは, 通常のリブと区別して0.84のF1スコアを達成できることが示されている。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:21:12 GMT)
Vehicular Communication Security: Multi-Channel and Multi-Factor Authentication [8.5] 車両間通信(V2I)は、モビリティ・エンハンシングとセーフティ・クリティカル・サービスの実現に重要な役割を果たしている。
現在のV2I認証は、無線のNon-Line-of-Sight(NLOS)チャネル上のクレデンシャルベースの方法に依存している。
我々は,NLOS暗号認証とLine-of-Sight (LOS)ビジュアルチャネルを組み合わせたマルチチャネル・マルチファクタ認証方式を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:30:21 GMT)
Faster, Cheaper, Better: Multi-Objective Hyperparameter Optimization for LLM and RAG Systems [8.4] 本稿では,LLMおよびRAGシステム全体に対するコスト,レイテンシ,安全性,アライメントの多目的パラメータ最適化のための最初のアプローチを提案する。
ベイジアン最適化法はベースライン法よりも有意に優れていた。
我々は,多目的RAGシステムを設計している実践者に対する重要な配慮で研究を締めくくっている。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:58:09 GMT)
Conditional Front-door Adjustment for Heterogeneous Treatment Assignment Effect Estimation Under Non-adherence [8.4] 不均一な治療課題効果の推定は、治療決定を通知することができる。
標準バックドア調整(SBD)と条件付きフロントドア調整(CFD)は、偏りのない見積もりを回復することができる。
LobsterNetは、ニュアンスパラメータのジョイントモデリングを備えたCFDを実装するマルチタスクニューラルネットワークである。
論文参考訳(メタデータ) (Thu, 08 May 2025 22:27:38 GMT)
Jailbreaking and Mitigation of Vulnerabilities in Large Language Models [8.3] 大規模言語モデル(LLM)は、自然言語の理解と生成を前進させることで、人工知能を変革した。
これらの進歩にもかかわらず、LSMは、特に注射と脱獄攻撃を急ぐために、かなりの脆弱性を示してきた。
このレビューでは、これらの脆弱性についての研究状況を分析し、利用可能な防衛戦略を提示する。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:35:24 GMT)
Threshold Modulation for Online Test-Time Adaptation of Spiking Neural Networks [8.2] ニューロモルフィックチップにデプロイされたスパイクニューラルネットワーク(SNN)は、異なるシナリオでエッジデバイスに効率的なソリューションを提供する。
オンラインテストタイム適応(OTTA)は、ソースデータやラベル付きターゲットサンプルを必要とせずに、モデルが新しいデータ分布に適応できるようにすることで、有望なソリューションを提供する。
既存のOTTA法は主に従来のニューラルネットワーク用に設計されており、SNNには適していない。
本稿では,分散シフト下でのモデル一般化の促進を目的とした,低消費電力でニューロモルフィックなチップフレンドリーなオンラインテストタイム適応フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:09:40 GMT)
Augmented Deep Contexts for Spatially Embedded Video Coding [8.2] ほとんどのニューラルビデオコーデック(NVC)は、時間のみのコンテキストを生成するために時間参照のみを使用する。
空間参照のために低解像度映像を圧縮した空間埋め込みビデオコーデック(SEVC)を提案する。
我々のSEVCは、大きな動きや出現する物体を扱う際の制限を効果的に軽減し、また以前の最先端のNVCよりも11.9%も削減します。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:57:52 GMT)
Nonlinear Motion-Guided and Spatio-Temporal Aware Network for Unsupervised Event-Based Optical Flow [8.2] イベントベースの光フロー推定は、時間と空間の連続的な動き情報をキャプチャする可能性がある。
イベントベースの光学フローのための既存の学習ベースの手法は、フレームベースの手法を採用している。
本稿では,時系列に焦点をあてた非教師なしイベントベース光フローネットワークを提案する。
本手法は,MVSECおよびDSECFlowデータセットにおける教師なし学習手法の1つである。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:39:19 GMT)
SUUM: Timestamp-based Nakamoto-style Blockchains are Vulnerable [8.2] タイムスタンプベースの中本型ブロックチェーンのセキュリティを脅かす2つの高度な攻撃戦略を導入する。
これらの攻撃は、タイムスタンプ操作やフォーク選択ルールの脆弱性を利用して、ブロックチェーンの公正性とインセンティブメカニズムを不可逆的に不安定にする。
分析の結果,SUUMの敵はUUMとRUMの双方に対して不当な報酬の優位性を達成していることがわかった。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:20:19 GMT)
Graph Attention is Not Always Beneficial: A Theoretical Analysis of Graph Attention Mechanisms via Contextual Stochastic Block Models [8.1] 構造ノイズが特徴雑音を超えると,グラフアテンション機構により分類性能が向上することを示す。
本稿では,単一層GATよりも優れたマルチレイヤグラフアテンションネットワーク(GAT)アーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:12:06 GMT)
Precise gradient descent training dynamics for finite-width multi-layer neural networks [8.1] 一般多層ニューラルネットワークにおける勾配降下繰り返しの正確な分布解析を行った。
我々の非漸近状態進化理論は、第一層重みのガウス的ゆらぎと深層重みの集中を捉えている。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:19:39 GMT)
ADNP-15: An Open-Source Histopathological Dataset for Neuritic Plaque Segmentation in Human Brain Whole Slide Images with Frequency Domain Image Enhancement for Stain Normalization [8.0] アルツハイマー病(英: Alzheimer's Disease, AD)は、アミロイド・ベタプラークとタウ神経細動を特徴とする神経変性疾患である。
これらの病変の同定と分節はAD進行の理解に不可欠である。
ディープラーニングは、病理画像セグメンテーションの強力なツールとして登場した。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:25:44 GMT)
Morphologically Symmetric Reinforcement Learning for Ambidextrous Bimanual Manipulation [8.0] 両操作の強化学習フレームワークであるSYMDEXを紹介する。
等変ニューラルネットワークによる左右対称の利用により、一方の腕からの体験は本質的に反対側の腕によって活用される。
我々のアプローチは、左手と右手が異なる役割を演じる複雑なタスクのベースラインを強く上回ります。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:29:00 GMT)
Superkick Effect in Vortex Particle Scattering [7.9] 光子や電子の渦状態は、原子、原子、粒子物理学にまたがる、新しくて有望な実験ツールである。
従来の低エネルギー検出方式は、非常に短いデブロリー波長のため、高エネルギーの渦粒子には実用的ではない。
スーパーキック(superkick)と呼ばれるメカニズムに基づく新しい実験手法を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:20:58 GMT)
A Preliminary Study for GPT-4o on Image Restoration [7.8] OpenAIのGPT-4oモデルは、画像生成において前例のない性能を示した。
各種修復作業におけるGPT-4oの系統的評価について検討した。
論文参考訳(メタデータ) (Thu, 08 May 2025 20:00:11 GMT)
Scaling Laws for Speculative Decoding [7.6] 本研究では,高密度言語モデル(LLM)を用いた投機的復号化手法について検討する。
論理線形スケーリング法則(理論 1.1, 1.2, 1.3)が3次元にわたるドラフトモデル受入率(あるいは復号速度)を規定している。
一般的なLLMの多次元スケーリングをコーディネートするScyllaを実現する。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:10:15 GMT)
Unified Network-Based Representation of BIM Models for Embedding Semantic, Spatial, and Topological Data [7.5] 建築情報モデリングは、そのライフサイクルを通して建築構造の包括的なデジタル表現を提供することによって、建設業界に革命をもたらした。
既存の研究では、BIMモデルにおけるコンポーネント間の複雑な空間的および位相的関係を捉える効果的な方法が欠如している。
本研究では,BIMモデルの「意味空間的トポロジ的」多次元設計特徴を統合した統合型ネットワークベース表現法を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:01:14 GMT)
Put CASH on Bandits: A Max K-Armed Problem for Automated Machine Learning [7.4] MaxUCBは、異なるモデルクラスの探索をオフにするための、最大$k$武器付きバンディットメソッドである。
提案手法を4つの標準AutoMLベンチマークで理論的,実証的に評価し,従来の手法よりも優れた性能を示した。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:18:05 GMT)
Generalized Class Discovery in Instance Segmentation [7.4] 擬似ラベルに対するコントラスト学習とクラス信頼性基準のためのインスタンス単位温度割当(ITA)手法を提案する。
提案手法は,COCO$_half$ + LVIS と LVIS + Visual Genome の2つの設定で実験を行うことにより評価した。
論文参考訳(メタデータ) (Thu, 08 May 2025 23:16:04 GMT)
QBR: A Question-Bank-Based Approach to Fine-Grained Legal Knowledge Retrieval for the General Public [7.4] 知識ギャップを埋める有効な媒体として質問銀行(QB)を用いたQBRと呼ばれる方法論を提案する。
文書内の知識単位の埋め込みを強化するために,QBがトレーニングサンプルの導出にどのように利用されているかを示す。
これらには、より正確で効率的で説明可能なドキュメント検索、検索結果の理解の改善、そして非常に効果的なきめ細かい知識検索が含まれる。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:43:21 GMT)
Guidance for Intra-cardiac Echocardiography Manipulation to Maintain Continuous Therapy Device Tip Visibility [7.2] 心内心エコー法(ICE)は電気生理学(EP)と構造心疾患(SHD)の介入において重要な役割を担っている。
治療器具先端の連続的な視認性を維持することは、手動ICEカテーテル操作に必要な頻繁な調整のため、依然として課題である。
本稿では,デバイス先端入射角とICE撮像面内の通過点を推定するAI駆動追跡モデルを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:48:30 GMT)
GraphComp: Extreme Error-bounded Compression of Scientific Data via Temporal Graph Autoencoders [7.1] 科学データの誤り境界圧縮のためのグラフベース手法である GraphCOMP を提案する。
グラフニューラルネットワーク(GNN)に着想を得て,グラフのサイズを大幅に縮小する潜在表現を学習するための時間グラフオートエンコーダを提案する。
圧縮はプロセスを逆転させ、学習したグラフモデルと潜在表現を用いて元のデータの近似を再構築する。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:58:54 GMT)
NaFM: Pre-training a Foundation Model for Small-Molecule Natural Products [7.1] 微生物、動物、植物からの代謝物などの天然物は多様な生物活性を示す。
既存の製品研究のためのディープラーニング手法は、特定の下流タスク用に設計された教師付き学習アプローチに依存している。
我々は,その特質に基づいた天然物の基盤モデルを事前学習した。
本フレームワークは, 天然物採掘や薬物発見に関連する下流業務において, 最先端のSOTA(State-of-the-art)を実現する。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:33:56 GMT)
Direct Image Classification from Fourier Ptychographic Microscopy Measurements without Reconstruction [7.1] 畳み込みニューラルネットワーク(CNN)は、測定シーケンスから意味のある情報を抽出することができる。
複数の生測値の学習多重化により、データの量を削減するとともに、分類精度を維持できることを実証する。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:46:28 GMT)
Deterministic two-photon C-Z gate with the two-photon quantum Rabi model [7.1] 2光子量子ラビモデル(QRM)の変種に基づく決定論的2光子C-Zゲートの実現手法を提案する。
以上の結果から,C-Zゲートは高忠実度で高速に動作し,デコヒーレンスに対して堅牢であることがわかった。
論文参考訳(メタデータ) (Thu, 08 May 2025 00:07:21 GMT)
Active learning of neural population dynamics using two-photon holographic optogenetics [7.0] 神経集団動態を同定するための最も効果的な光刺激パターンを決定する方法を開発した。
我々は、実データと合成データの両方にアプローチを示し、いくつかのケースでは、所定の予測力に到達するために必要なデータの量を2倍に減らすことができる。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:58:14 GMT)
An Active Contour Model for Silhouette Vectorization using Bézier Curves [6.9] 立方体B'ezier曲線を用いたシルエットベクトル化のためのアクティブな輪郭モデルを提案する。
提案手法は,シルエット境界とベクトル化の間の平均距離を著しく低減する。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:09:49 GMT)
PillarMamba: Learning Local-Global Context for Roadside Point Cloud via Hybrid State Space Model [6.9] 柱型路面点雲知覚にマンバを導入する。
我々は、PillarMambaと呼ばれるクロスステージステートスペースグループ(CSG)に基づくフレームワークを提案する。
提案手法は,大規模道路側ベンチマークであるDAIR-V2X-Iにおいて,最先端の手法よりも優れている。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:33:04 GMT)
SPIN-ODE: Stiff Physics-Informed Neural ODE for Chemical Reaction Rate Estimation [6.8] 複雑な化学反応からの速度定数の推定は、詳細な化学の進歩に不可欠である。
化学反応モデリングのための剛体物理インフォームドニューラルネットワーク(SPIN-ODE)フレームワークを提案する。
提案手法では,3段階の最適化プロセスを導入する。第1に,潜伏型ニューラルネットワークは化学濃度とその時間微分の軌跡を学習し,第2に,明示的化学反応ニューラルネットワーク(CRNN)は学習力学に基づいて基礎となる速度係数を抽出し,第3に,ニューラルネットワークソルバを用いた微調整CRNNを用いて速度係数推定をさらに向上する。
論文参考訳(メタデータ) (Thu, 08 May 2025 20:03:30 GMT)
Semi-supervised Underwater Image Enhancement Using A Physics-Aware Triple-Stream Network [6.8] 我々は、物理に基づく画像形成モデル(IFM)と深層学習技術の両方を水中画像強調(UIE)に活用する。
PATS-UIENetは、直接信号伝送推定水蒸気(D-Stream)、後方信号伝送推定水蒸気(B-Stream)、アンビエント光推定水蒸気(A-Stream)からなる。
また、ラベル付き画像とラベルなし画像の両方を利用して、IFMにインスパイアされた半教師付き学習フレームワークを採用し、不十分なデータの問題に対処する。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:21:27 GMT)
Carbon Aware Transformers Through Joint Model-Hardware Optimization [6.7] 機械学習システムの炭素フットプリント全体の定量化と最適化を行うツールが不足している。
本稿では,持続可能性駆動型MLモデルとハードウェアアーキテクチャの協調最適化を可能にする,炭素対応アーキテクチャ検索フレームワークであるCATransformersを提案する。
このフレームワークをマルチモーダルCLIPモデルに適用し,CLIPモデル群であるCarbonCLIPを最大17%削減した。
論文参考訳(メタデータ) (Thu, 08 May 2025 22:21:11 GMT)
Anticipating Gaming to Incentivize Improvement: Guiding Agents in (Fair) Strategic Classification [6.7] アルゴリズムを騙そうとする個人の選択(「改善」)について検討する。
それらのインタラクションをStackelbergのゲームとして定式化し、そこで企業は(フェア)分類器をデプロイし、個人は戦略的に応答する。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:47:23 GMT)
Boosting Statistic Learning with Synthetic Data from Pretrained Large Models [6.6] 本稿では,ドメイン固有の統計的手法を用いて合成データを生成し,体系的にフィルタリングする新しいエンドツーエンドフレームワークを提案する。
実験では,様々な設定で予測性能が一貫した改善を示した。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:55:22 GMT)
Diffusion-Reinforcement Learning Hierarchical Motion Planning in Multi-agent Adversarial Games [6.5] 環境データに応答するグローバルパスを計画するために,高レベル拡散モデルを統合する階層型アーキテクチャを提案する。
提案手法は,検出率と目標到達率において77.18%,47.38%のベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 08 May 2025 21:52:16 GMT)
On-device Anomaly Detection in Conveyor Belt Operations [6.4] 本研究では,正常化と異常化の2つの新手法を提案する。
提案手法は閾値に基づくデューティサイクル検出機構を利用するパターン認識システムである。
この方法は、推論中にエネルギー消費が13.3および20.6ドルの効率的なリアルタイム操作を示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:29:53 GMT)
Toward a Better Understanding of Probabilistic Delta Debugging [6.4] アドバンストなddminであるProbDDが提案され、最先端のパフォーマンスを実現している。
ProbDDの詳細な理論的解析を行い、確率とサブセットサイズの変化の傾向を明らかにする。
本稿では,ProbDDの簡易版であるCDDを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:32:35 GMT)
AI-Powered Agile Analog Circuit Design and Optimization [6.4] AI技術は、デバイスレベルのチューニングを自動化し、システムレベルの共最適化を可能にすることで、アナログ回路設計を変換している。
統合された洞察は、AIがアナログパフォーマンスをどのように改善し、設計の労力を削減し、アナログコンポーネントとアプリケーションレベルのメトリクスを共同で最適化できるかを強調している。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:08:59 GMT)
DPQ-HD: Post-Training Compression for Ultra-Low Power Hyperdimensional Computing [6.4] ポストトレーニング圧縮アルゴリズムDPQ-HD(Decomposition-Pruning-Quantization)を提案する。
DPQ-HDは上記の3つの圧縮技法を一意に組み合わせることで計算とメモリのオーバーヘッドを低減する。
DPQ-HDは1-2%の精度で画像およびグラフ分類タスクの最大20-100倍のメモリ削減を実現している。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:54:48 GMT)
Connecting NTK and NNGP: A Unified Theoretical Framework for Wide Neural Network Learning Dynamics [6.3] 我々は、ディープ・ワイド・ニューラルネットワークの学習プロセスのための包括的なフレームワークを提供する。
拡散相を特徴づけることで、私たちの研究は脳内の表現的ドリフトに光を当てます。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:33:46 GMT)
CubeDAgger: Improved Robustness of Interactive Imitation Learning without Violation of Dynamic Stability [6.2] インタラクティブな模倣学習は、専門家の段階的な監督によってエージェントの制御ポリシーを堅牢にする。
最近のシステムでは、監督タイミングを限定的に選択することで、専門家の負担を軽減するために、主に専門家とエージェントの切り替えシステムを採用している。
本稿では,動的安定性違反を低減しつつロバスト性を向上させる,いわゆるCubeDAggerを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:18:49 GMT)
Graph Neural Network Aided Deep Reinforcement Learning for Resource Allocation in Dynamic Terahertz UAV Networks [6.2] フレキシブルトポロジと超高データレートを備えたテラヘルツ(THz)ネットワークは、多数のセキュリティ監視、災害対応、環境応用に力を与えると期待されている。
しかし、動的トポロジと超高データレートは、THzの効率的な長期アンテナ特性を阻害する。
本稿では,自己ノードの特徴に着目した動的THz UAVネットワークにおけるリソース割り当てアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:36:17 GMT)
Expanding Event Modality Applications through a Robust CLIP-Based Encoder [6.1] 本稿では,CLIPをイベントベースデータに転送する強力なエンコーダを提案する。
イベント埋め込みをイメージ埋め込みと整合させ、ゼロショット学習をサポートし、テキストアライメントを保存するために、CLIPsアーキテクチャを適用します。
我々のエンコーダは、ゼロショットおよび少数ショットの学習タスクにおいて、オブジェクト認識における強力な性能を達成する。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:35:41 GMT)
Correcting Noisy Multilabel Predictions: Modeling Label Noise through Latent Space Shifts [6.1] ほとんどの現実世界の機械学習アプリケーションでは、データのノイズは避けられないように思える。
マルチラベル分類における雑音ラベル学習の分野について検討した。
我々のモデルは、雑音のラベル付けは潜伏変数の変化から生じると仮定し、より堅牢で有益な学習手段を提供する。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:34:20 GMT)
X-Driver: Explainable Autonomous Driving with Vision-Language Models [6.1] エンドツーエンドの自動運転は大幅に進歩し、システムの単純さや運転性能の向上といったメリットを提供している。
既存のフレームワークはまだクローズドループ評価の成功率の低下に悩まされており、実際のデプロイメントにおける制限を強調している。
我々は,クローズドループ自律運転用に設計された,マルチモーダルな大規模言語モデルフレームワークであるX-Driverを紹介する。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:52:55 GMT)
Walrus: An Efficient Decentralized Storage Network [6.1] Walrusは、複数の技術革新を通じて制限に対処する、分散化されたブロブストレージシステムである。
RedStuffは、4.5倍のレプリケーション係数で高いセキュリティを実現する2次元消去符号化プロトコルである。
Walrusはまた、ストレージノードチャーンを効率的に処理する、新しいマルチステージエポック変更プロトコルも導入している。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:06:41 GMT)
Accurate and Diverse LLM Mathematical Reasoning via Automated PRM-Guided GFlowNets [6.0] モンテカルロ木探索を用いたプロセス・リワード・モデル(PRM)を提案する。
次に、生成フローネットワーク(GFlowNets)を推論ステップレベルで運用するように適応します。
経験的評価は、挑戦的な数学的ベンチマークにおいて、精度と解の多様性の両方が強く改善されていることを示している。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:42:15 GMT)
MambaNUT: Nighttime UAV Tracking via Mamba-based Adaptive Curriculum Learning [5.9] 本稿では,線形複雑度を背骨とする状態空間モデルを用いた純粋なMambaベースのトラッキングフレームワーク(MambaNUT)を提案する。
適応型カリキュラム学習(ACL)アプローチを導入し、動的サンプリング戦略と損失重みを調整する。
複数の夜間UAV追跡ベンチマークでの被曝実験は、提案されたMambaNUTが最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:15:49 GMT)
From Bias To Improved Prompts: A Case Study of Bias Mitigation of Clone Detection Models [5.9] クローンコード検出のための生成型大規模言語モデルの適合性を評価する。
LLMの既知の問題は、これらのモデルの性能が与えられた入力プロンプトに基づいて変動する、バイアスを誘発する可能性である。
我々の分析では、8つの異なるプロンプトバイアスのカテゴリを同定し、これらのバイアスを活用する方法により、F1スコアにおいて最大10.81%の大幅な改善が得られた。
論文参考訳(メタデータ) (Thu, 08 May 2025 22:38:10 GMT)
Quantum Surrogate-Driven Image Classifier: A Gradient-Free Approach to Avoid Barren Plateaus [5.8] 画像分類のための深部量子ニューラルネットワーク(QNN)の訓練は、純ユニタリ回路における勾配(バレンプラトー)と限られた非線形性のため、非常に難しい。
そこで本研究では,非一様性を引き出すために,中間回路測定とアシラリー量子ビットのリセットを併用した勾配フリーサロゲート駆動型フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:51:57 GMT)
SSH-Net: A Self-Supervised and Hybrid Network for Noisy Image Watermark Removal [5.8] SSH-Netは、ノイズの多い画像透かし除去のために設計されたセルフスーパービジョンとハイブリッドネットワークである。
より単純なノイズ除去作業に焦点を当てた上層ネットワークでは、軽量なCNNベースのアーキテクチャを採用している。
下層ネットワークは、透かしとノイズを同時に除去するより複雑なタスクを処理するように設計されており、Transformerブロックを組み込んで長距離依存をモデル化している。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:36:49 GMT)
Defining and Quantifying Creative Behavior in Popular Image Generators [5.6] ユーザが与えられたタスクに適したAIモデルを選択するのに役立つ手段を紹介します。
画像・画像生成モデルについて評価を行った。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:59:21 GMT)
Generative Autoregressive Transformers for Model-Agnostic Federated MRI Reconstruction [5.5] FedGATは、生成的自己回帰変換器に基づくモデルに依存しないFL技術である。
Controllablyは、自動回帰予測を通じて、所望のサイトから現実的なMR画像を合成する。
各サイトは、ハイブリッドデータセット上で独自の再構築モデルをトレーニングする。
論文参考訳(メタデータ) (Thu, 08 May 2025 20:18:52 GMT)
Mapping User Trust in Vision Language Models: Research Landscape, Challenges, and Prospects [5.4] 視覚言語モデル(VLM)は、大規模な画像テキストおよびビデオテキストデータセットで事前訓練されている。
本研究は,ユーザ-VLMインタラクションにおける信頼ダイナミクスに関する研究についてレビューする。
今後のVLM信頼研究の予備的要件について,将来的なVLMユーザによるワークショップからの文献的洞察と調査結果を報告する。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:02:49 GMT)
Beyond Low-rank Decomposition: A Shortcut Approach for Efficient On-Device Learning [5.4] デバイス上での学習は、AI開発にとって有望な方向として現れている。
本稿では,メモリと計算制約に対処する代替手法として,新しいショートカット手法を提案する。
我々の手法は、バニラトレーニングと比較して最大120.09時間まで、アクティベーションメモリの使用量を削減できると同時に、従来のベンチマークで評価した場合、全体的なトレーニングFLOPを最大1.86時間まで削減できる。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:34:15 GMT)
Improved Brain Tumor Detection in MRI: Fuzzy Sigmoid Convolution in Deep Learning [5.4] ファジィシグモイド・コンボリューション(FSC)は、最上位モジュールと中間モジュールの2つの追加モジュールと共に導入された。
新たな畳み込み演算子がこのアプローチの中心であり、入力データの整合性を保ちながら受容場を効果的に拡張する。
この研究は、医用イメージング応用のための軽量で高性能なディープラーニングモデルを提供する。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:02:44 GMT)
Economic Security of Multiple Shared Security Protocols [5.3] 我々は、多重SSP問題を形式化し、2つのアーキテクチャを解析する。
Model $mathbbM$と呼ばれる独立した断片化モデルと、Model $mathbbS$と呼ばれる共有統一モデルが研究されている。
以上の結果から,Model $mathbbM$はデプロイの柔軟性を提供するが,最小コストの攻撃脆弱性を継承する一方で,Model $mathbbS$は単一のバリデータセットと集約スラッシュロジックを通じて,より厳密なセキュリティ保証を実現することがわかった。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:10:17 GMT)
Overcoming the hurdle of legal expertise: A reusable model for smartwatch privacy policies [5.3] これまでのところ、さまざまなスマートウォッチメーカーがデベロッパーに再利用可能なプライバシーポリシーをカバーしている概念モデルはない。
本稿では,スマートウォッチのプライバシポリシの概念モデルを紹介し,データ視覚化のためのプラットフォームを構築するためのモデル駆動ソフトウェアエンジニアリングアプローチでの利用法を示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:09:12 GMT)
Quantum Teleportation from Telecom Photons to Erbium-ion Ensembles [5.2] 我々は、エルビウムイオンアンサンブルに基づく、テレコム波長フォトニックキュービットから固体量子メモリへの量子テレポーテーションを実証する。
その結果、ソリッドステートデバイスに基づくスケーラブルな量子ネットワークの実現の道を開いた。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:28:11 GMT)
Enhanced Urdu Intent Detection with Large Language Models and Prototype-Informed Predictive Pipelines [5.2] 本稿では,未ラベルのUrduデータを利用して事前学習した言語モデルを再学習する,ユニークなコントラスト学習手法を提案する。
事前訓練されたLLMとプロトタイプにインフォームドされたアテンション機構を組み合わせることで、エンドツーエンドのインテント検出パイプラインを生成する。
提案する予測パイプラインのパラダイムの下で、6つの異なる言語モデルと13の異なる類似性計算手法の可能性を探求する。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:38:40 GMT)
MoRe-3DGSMR: Motion-resolved reconstruction framework for free-breathing pulmonary MRI based on 3D Gaussian representation [5.2] 本研究は、高分解能自由呼吸性肺磁気共鳴画像(MRI)のための、教師なし、運動解像再構成フレームワークを提案する。
提案手法は3DGSを利用して,運動分解型3D等方性肺MRI再構成の課題に対処する。
高い信号対雑音比とコントラスト対雑音比で反射される優れた画質を実現する。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:41:46 GMT)
User Behavior Analysis in Privacy Protection with Large Language Models: A Study on Privacy Preferences with Limited Data [5.2] 本研究では,大言語モデル(LLM)が,限られたデータを持つシナリオにおいて,プライバシ保護に関連するユーザの行動を分析する方法について検討する。
この研究は匿名化されたユーザプライバシ設定データ、サーベイレスポンス、シミュレートされたデータを利用している。
実験結果から, LLMは限られたデータであっても, プライバシ・プライオリティ・モデリングの精度を著しく向上することが示された。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:42:17 GMT)
A Probabilistic Approach to Learning the Degree of Equivariance in Steerable CNNs [5.1] ステアブル畳み込みニューラルネットワーク(SCNN)は、幾何学的対称性をモデル化することによってタスク性能を向上させる。
しかし、未知あるいは様々な対称性は、過剰に制約された重量と性能を低下させる可能性がある。
本稿では,SCNNの等価度を学習するための確率的手法を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:17:01 GMT)
Prompt to Polyp: Clinically-Aware Medical Image Synthesis with Diffusion Models [5.1] テキスト記述から現実的な医療画像を生成することは、医療AIにおけるデータ不足問題に対処する大きな可能性を持っている。
本稿では,医学領域におけるテキスト・画像合成の総合的研究を行い,二つのアプローチを比較した。
臨床テキストエンコーダ,変分オートエンコーダ,クロスアテンション機構を統合したMSDMという新しいモデルを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:07:16 GMT)
Canny2Palm: Realistic and Controllable Palmprint Generation for Large-scale Pre-training [5.1] そこで我々は,Cannyエッジ検出器を用いてヤシのテクスチャを抽出し,Pix2Pixネットワークを用いてリアルなヤシプリント生成を行う,Canny2Palmという新しい合成法を提案する。
Canny2Palmは、実際のパルププリントの分布に従って現実的なデータを合成するだけでなく、制御可能な多様性によって大規模な新しいアイデンティティを生成できる。
オープンセットのパームプリント認識ベンチマークでは、Canny2Palm合成データで事前訓練されたモデルは、最先端の精度を最大7.2%向上させる。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:37:07 GMT)
SAPIENT: Mastering Multi-turn Conversational Recommendation with Strategic Planning and Monte Carlo Tree Search [5.1] 既存の方法は、強欲な行動選択やサンプリング戦略を備えた強化学習エージェントを訓練する。
我々は,モンテカルロ木探索 (MCTS) ベースの CRS フレームワーク SAPIENT を提案する。
SAPIENTは会話エージェント(Sエージェント)と会話プランナー(Sプランナー)で構成される
論文参考訳(メタデータ) (Thu, 08 May 2025 14:47:31 GMT)
scDrugMap: Benchmarking Large Foundation Models for Drug Response Prediction [5.1] scDrugMapはPythonのコマンドラインインターフェースと薬物反応予測のためのWebサーバを備えた統合フレームワークである。
scDrugMapは8つの単一セルモデルと2つの大きな言語モデルを含む、幅広い基礎モデルを評価する。
scDrugMapは、単一セルデータの薬物反応予測のための基礎モデルの大規模なベンチマークとして、初めてのものである。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:46:19 GMT)
ItDPDM: Information-Theoretic Discrete Poisson Diffusion Model [5.0] シンボリック・ミュージックトークンなどの離散データ生成のための既存の手法は、2つの大きな課題に直面している。
彼らは離散的な入力を連続状態空間に埋め込むか、真の負の対数類似度を近似する変分損失に依存する。
情報理論離散ポアソン拡散モデル(ITDPDM)を導入する。
カメラセンサーの光子到着プロセスにインスパイアされたポアソン拡散プロセスを介して、離散状態空間で直接操作することで、両方の制限に対処する。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:29:05 GMT)
Research on Anomaly Detection Methods Based on Diffusion Models [5.0] 異常検出は機械学習とデータマイニングの基本的な課題であり、サイバーセキュリティ、産業障害診断、臨床疾患モニタリングに重要な応用がある。
統計モデリングや機械学習ベースのアプローチといった従来の手法は、複雑で高次元のデータ分散を扱う際の課題に直面することが多い。
本稿では,拡散確率モデル(DPM)の長所を利用して,画像および音声データの異常を効果的に識別するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:19:08 GMT)
Approximate Lifted Model Construction [4.9] 本稿では,$varepsilon$-Advanced Colour Passing(varepsilon$-ACP)アルゴリズムを提案する。
ACPは、たとえ関連オブジェクトが区別できないとしても、データから学習したポテンシャルが必然的に逸脱する実用的な応用には適さない。
我々は, $varepsilon$-ACP による近似誤差が厳密な有界であることを証明し, この近似誤差が実際にゼロに近いことを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:18:00 GMT)
Position: Epistemic Artificial Intelligence is Essential for Machine Learning Models to Know When They Do Not Know [4.8] 私たちは、AIモデル、特に自律システムでは、不慣れなデータや敵対的なデータに直面すると、堅牢な予測ができないと論じています。
従来の機械学習アプローチは、データフィッティングとドメイン適応に関する過剰な意見のため、これらの問題を解決するのに苦労している。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:10:38 GMT)
Adaptive Bayesian Very Short-Term Wind Power Forecasting Based on the Generalised Logit Transformation [4.8] 風力発電は、2050年のネットゼロ戦略を達成する上で、ますます重要な役割を担っている。
風力発電の正確な予測は、既存のグリッドオペレーションへの再生可能エネルギーの安定かつ制御可能な統合の鍵となる要求である。
本稿では,一般化ロジット変換とベイズ的アプローチを組み合わせた,短時間の予測手法を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:56:48 GMT)
Sparse Training from Random Initialization: Aligning Lottery Ticket Masks using Weight Symmetry [4.8] Lottery Ticket hypothesis (LTH) は、非常に少ないパラメータを使用しながら、密度モデルと同じ一般化性能を達成するスパースLTHマスクとウェイトが存在することを示唆している。
近年の研究では、ランダム初期化からトレーニングされたニューラルネットワークが、同じ流域のモジュロ置換における解を見つけることが示唆されている。
我々は,異なるランダムイニトからスパーストレーニングを行う際に,LTHマスクを新しい最適化盆地に合わせるように変更することを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:27:31 GMT)
UKElectionNarratives: A Dataset of Misleading Narratives Surrounding Recent UK General Elections [4.8] 本論では,近年の欧州議会選挙で流布した,一般的な誤解を招く物語の分類について紹介する。
この分類に基づいて、人間の注釈付き誤解を招く物語の最初のデータセットである UKElectionNarratives を構築し、分析する。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:51:20 GMT)
Operator-Level Quantum Acceleration of Non-Logconcave Sampling [4.7] ランゲヴィン力学はターゲットギブを量子状態の振幅に符号化する。
この接続は、最初の証明可能な量子拡散係数設定によるギブスサンプリングを可能にする。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:43:17 GMT)
When the Universe is Too Big: Bounding Consideration Probabilities for Plackett-Luce Rankings [4.6] 正確な識別ができないにもかかわらず、考慮すべき確率に関する有用な情報を学習できることが示される。
正確な識別ができないにもかかわらず、考慮すべき確率に関する有用な情報を学習できることが示される。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:45:17 GMT)
Excitation transfer and many-body dark states in WQED [4.6] 1次元導波管量子力学系では、量子エミッタは無限範囲、分散、散逸性双極子-双極子相互作用を介して相互作用する。
これらの相互作用は長距離周期的挙動を引き起こし、リッチ多体物理学は自由空間に存在しない。
シンメトリズド多重励起暗黒状態の集合を構築し,その時間進化射影に対する解析式を導出する。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:39:30 GMT)
An Efficient Transport-Based Dissimilarity Measure for Time Series Classification under Warping Distortions [4.5] 1NN-DTW法の連続的なバージョンは、たとえ1つのトレーニングサンプルが利用可能であったとしても、その問題を解決することができることを示す。
さらに, 最適輸送に基づく別の相似性尺度を提案し, 計算コストを大幅に削減した上で, 上記の問題文を解くことができることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 22:26:37 GMT)
GeomHair: Reconstruction of Hair Strands from Colorless 3D Scans [4.5] マルチモーダルなヘアオリエンス抽出を利用して,無色の3Dスキャンから直接ヘアストランドを再構築する手法を提案する。
この監視信号の組み合わせにより,色情報に頼ることなく,髪型と複雑な髪型の両方を正確に再現できることが実証された。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:11:09 GMT)
Inter-Diffusion Generation Model of Speakers and Listeners for Effective Communication [4.5] 本稿では,効果的なコミュニケーションのための話者と聞き手の拡散間生成モデルを提案する。
初めて、リスナーのフルボディジェスチャーを生成フレームワークに統合する。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:00:58 GMT)
WaveSleepNet: An Interpretable Network for Expert-like Sleep Staging [4.5] WaveSleepNetは、スリープステージングのための解釈可能なニューラルネットワークである。
WaveSleepNetは遅延空間表現を使用して、異なる睡眠段階に対応する特性波のプロトタイプを識別する。
WaveSleepNetの有効性は、3つの公開データセットで検証されている。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:06:19 GMT)
Building Trustworthy Multimodal AI: A Review of Fairness, Transparency, and Ethics in Vision-Language Tasks [4.4] 本稿では,マルチモーダル人工知能(AI)システムの信頼性について概説する。
これらのシステムにおける公平性、透明性、倫理的影響に関連する課題に対処する。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:10:46 GMT)
Quantifying Risk Propensities of Large Language Models: Ethical Focus and Bias Detection through Role-Play [4.3] 大きな言語モデル(LLM)がより普及するにつれて、その安全性、倫理、潜在的なバイアスに対する懸念が高まっている。
本研究は,認知科学からLLMまで,Domain-Specific Risk-Taking(DOSPERT)尺度を革新的に適用する。
本研究では,LLMの倫理的リスク態度を深く評価するために,倫理的意思決定リスク態度尺度(EDRAS)を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:42:58 GMT)
White Light Specular Reflection Data Augmentation for Deep Learning Polyp Detection [4.3] 我々は、より難しいトレーニングシナリオを作成するために、より白い反射を人工的に追加する新しいデータ拡張手法を提案する。
実験結果から,新たなデータ拡張手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:51:00 GMT)
Conformal Prediction with Cellwise Outliers: A Detect-then-Impute Approach [4.3] コンフォーマル予測はブラックボックスモデルの予測間隔を構築する強力なツールである。
本稿では,検出・入力共形予測という新しいフレームワークを提案する。
我々はPDI-CPとJDI-CPの2つの実用的なアルゴリズムを開発し、分布のないカバレッジ分析を提供する。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:43:18 GMT)
Generative Models for Long Time Series: Approximately Equivariant Recurrent Network Structures for an Adjusted Training Scheme [4.3] 本稿では,連続層を有する変分オートエンコーダ(VAE)に基づく時系列データに対する簡易かつ効果的な生成モデルを提案する。
本手法では,シーケンス長を漸進的に向上させる適応型トレーニング手法を提案する。
リカレントアーキテクチャを利用することで、モデルはシーケンス長に関係なく定数数のパラメータを保持する。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:52:37 GMT)
Decentralized Traffic Flow Optimization Through Intrinsic Motivation [4.3] 交通渋滞は長い間ユビキタスな問題であり、メガシティの急速な成長で悪化している。
本研究は,自動車の自律走行を制御し,交通の流れを改善するための本質的なモチベーションについて考察する。
提案モデルでは,全体のトラフィックフローが大幅に改善され,渋滞が軽減され,渋滞時間の平均が短縮される。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:28:04 GMT)
Statistical Characterization of Entanglement Degradation Under Markovian Noise in Composite Quantum Systems [4.2] 本稿では,異なる雑音モデルが量子系の絡み合いに与える影響を統計的に検討する。
雑音下での絡み合いの持続時間を測定する正部分移動時間計を用いて絡み合い劣化の定量化を行う。
本研究は,マルコフ雑音下での量子システムのレジリエンスについて,本手法の有効性を実証するものである。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:21:39 GMT)
The Evolution of Embedding Table Optimization and Multi-Epoch Training in Pinterest Ads Conversion [4.2] 変換予測のためのディープラーニングは、オンライン広告に広く応用されている。
これらのモデルは、Click、add-to-cart、checkout、その他の変換タイプなど、複数の目的を共同で予測するように訓練されているため、より複雑になっています。
本稿では、Pinterest Ads Conversionモデルにおいて、埋め込みテーブル最適化とマルチエポックトレーニングの開発から学んだ教訓を共有する。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:18:32 GMT)
Multi-objective optimisation via the R2 utilities [4.1] 本稿では,多目的最適化問題を集合上で定義された単目的最適化問題に再キャストする方法を示す。
この新しい問題に対する目的関数の適切なクラスは、スカラー化された最適化問題に対する重み付き積分として定義されるユーティリティ関数であるR2ユーティリティである。
次に、これらの欲求的アルゴリズムの性能を理論的にも経験的にも分析する。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:48:11 GMT)
CCL: Collaborative Curriculum Learning for Sparse-Reward Multi-Agent Reinforcement Learning via Co-evolutionary Task Evolution [4.1] スパース報酬環境は強化学習において特にマルチエージェントシステムにおいて重要な課題を生んでいる。
本研究では,(1)個別エージェントの中間タスクの精細化,(2)情報サブタスクを生成するための変分進化アルゴリズムの利用,(3)学習安定性を高めるための環境との共進化エージェントを用いた新しいカリキュラム学習フレームワークである協調多次元学習(CCL)を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:23:47 GMT)
Equivariant Imaging Biomarkers for Robust Unsupervised Segmentation of Histopathology [4.1] 病理組織学的評価は正確な疾患診断と予後に不可欠である。
専門的に訓練された病理学者による伝統的な手動分析は、時間消費、労働集約、コスト非効率、およびラター間変動の傾向である。
論文参考訳(メタデータ) (Thu, 08 May 2025 23:19:21 GMT)
Hybrid Quantum-Classical Convolutional Neural Networks for Image Classification in Multiple Color Spaces [4.0] ハイブリッド量子古典畳み込みニューラルネットワーク(HQCNN)は、性能改善の可能性を示している。
色空間間の画像分類を評価するHQCNNを提案する。
MNIST, CIFAR-10, EuroSAT, SAT-4データセットの性能評価を行った。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:00:29 GMT)
From Hope to Heuristic: Realistic Runtime Estimates for Quantum Optimisation in NHEP [4.0] 雑音の中規模量子(NISQ)コンピュータは、その限界にもかかわらず、核物理学や高エネルギー物理学において短期的な量子優位性を示す。
本研究は,2次イジングあるいは2次非制約バイナリ最適化モデルを用いて最適化問題を解くコアアルゴリズムに焦点をあてる。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:59:37 GMT)
Guiding Evolutionary AutoEncoder Training with Activation-Based Pruning Operators [4.0] 重み付けを誘導するために層活性化を利用する2つの新しい突然変異演算子を導入する。
これらのアクティベーションインフォームド演算子の1つはランダムプルーニングよりも優れており、より効率的なオートエンコーダとなる。
進化的環境下では,ランダムプルーニングは誘導プルーニングよりも優れている。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:21:29 GMT)
Exploring dynamical quantum phase transition from pure states to mixed states through extended Su-Schrieffer-Heeger models [3.9] 一般化SSHモデルの枠組みにおける純粋状態と混合状態の動的量子相転移(DQPT)について検討する。
SSH-3モデルは、真のキラル対称性ではなく、キラル様の点対称性によって特徴づけられ、そのトポロジカルな性質に関連するロバストな局在エッジ状態をサポートする。
混合状態の場合、DQPTの挙動は低温では一定であるが、高温では大きな変化が観測され、複数の臨界時間が発生する。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:05:30 GMT)
Vision Transformers for Efficient Indoor Pathloss Radio Map Prediction [3.8] 本稿では,DINO-v2事前学習重み付き視覚変換器(ViT)アーキテクチャを用いた深層学習による屋内無線伝搬のモデル化を提案する。
本手法は,室内のパスロスマップを生成するために壁面の付加的な特徴を持つフロアマップを処理する。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:03:57 GMT)
Rethinking the Relationship between the Power Law and Hierarchical Structures [3.8] 本研究では,英語コーパスを用いた構文構造の議論の有効性について検討した。
英文コーパスを用いて、相互情報、確率的文脈自由文法からの逸脱、およびパースツリーにおける他の特性を解析する。
以上の結果から, 仮説は構文構造を保たず, 子どもの言語や動物信号に適用することは困難であることが示唆された。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:41:46 GMT)
Dukawalla: Voice Interfaces for Small Businesses in Africa [3.8] 中小企業はデータ駆動意思決定に苦戦することが多い。
Dukawallaのプロトタイプは、生のビジネスデータと実行可能な洞察のギャップを埋めるために作られた。
本稿では,Dukawallaのナイロビへの展開について検討し,この音声アシスタントを用いた経験に注目した。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:13:16 GMT)
LAPSO: A Unified Optimization View for Learning-Augmented Power System Operations [3.8] 本稿では,LAPSO(Learning-Augmented Power System Operations)の総合的枠組みを提案する。
LAPSOは運用段階を中心におり、時間的にサイロ化された電力系統のタスクの境界線を断ち切ることを目的としている。
学習可能なコンポーネントで既存のパワーシステム最適化モデルを自動的に拡張するために、専用のPythonパッケージ-lapsoが導入された。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:00:24 GMT)
Exhaustive Search for Quantum Circuit Optimization using ZX Calculus [3.7] ZX計算と全探索を用いた量子回路最適化の最初の形式化を提供する。
我々は、100の標準量子回路に対して、我々のアプローチを広範囲にベンチマークする。
私たちの実装は、コンパイラパスとしてよく知られたライブラリであるPyZXとQiskitに統合されています。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:55:25 GMT)
Aesthetics Without Semantics [3.6] セマンティックコンテンツを最小限に抑えた画像データベースを作成し,美的評価の悪面から画像を生成する手法を考案する。
画像の特徴と美的評価との間には, 美しい画像に偏った画像が, どのように修正されるか, あるいは逆転するかが示される。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:22:11 GMT)
Looking Beyond Language Priors: Enhancing Visual Comprehension and Attention in Multimodal Models [3.6] MLLM(Multimodal Large Language Models)は、視覚的な入力を完全に活用できないことが多い。
われわれのアプローチはまず、MLLMが画像領域の視覚的理解をどのように構築するかについての洞察を与え、その能力を増幅する技術を導入する。
本稿では,視覚的に依存するトークンの予測能力の定量化と,視覚的に困難なタスクの10 pt の高速化により,結果モデルのより優れたマルチモーダル理解を実証する。
論文参考訳(メタデータ) (Thu, 08 May 2025 20:04:27 GMT)
Enhancing Satellite Object Localization with Dilated Convolutions and Attention-aided Spatial Pooling [3.6] 本研究は, 上部大気重力波(GW), 中間圏ボーレス(Bore), 海洋渦(OE)の3つの衛星データセットに焦点を当てた。
YOLO-DCAPは、複雑なシナリオにおけるオブジェクトのローカライゼーションを改善するために設計された、YOLOv5の新たな拡張バージョンである。
実験の結果, YOLO-DCAPは, YOLOベースモデルと最先端アプローチの両方で有意に優れていた。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:59:59 GMT)
E2E-AFG: An End-to-End Model with Adaptive Filtering for Retrieval-Augmented Generation [3.5] 検索拡張生成のための適応フィルタを用いたエンドツーエンドモデル(E2E-AFG)を提案する。
E2E-AFGを6つの代表的な知識集約言語データセットで評価した。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:29:10 GMT)
Negotiative Alignment: Embracing Disagreement to Achieve Fairer Outcomes -- Insights from Urban Studies [3.5] 本研究はモントリオール市における住民35名を対象にした地域調査から得られた知見である。
我々は、不一致を保存、分析、対処に必要な入力として扱うAIフレームワークである、交渉的アライメントを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:26:00 GMT)
Identifying Critical Dependencies in Large-Scale Continuous Software Engineering [3.4] 継続的ソフトウェアエンジニアリング(CSE)は業界で広く採用されており、継続的インテグレーションや継続的デプロイメント(CI/CD)といったプラクティスを統合している。
大規模な製品開発におけるこれらのアクティビティの調整には、複数の利害関係者が関与し、複雑さが増します。
本研究は,大規模CSEにおける重要な依存関係を特定し解析することで,この複雑さに対処することを目的とする。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:33:46 GMT)
Representation Learning and Identity Adversarial Training for Facial Behavior Understanding [3.4] AU検出の基本的な要素として,多種多様データと大規模データと主観的同一性正則化の2つを再検討する。
Face9M上でのマスク付きオートエンコーダの事前トレーニングは、AU検出と表情タスクにおいて強いパフォーマンスをもたらす。
提案手法であるFMAE(Facial Masked Autoencoder)とIATは単純で汎用的で効果的である。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:07:28 GMT)
Balancing Client Participation in Federated Learning Using AoI [3.3] Federated Learning(FL)は、分散クライアント間で協調的なモデルトレーニングを可能にしながら、データのプライバシを保存する分散フレームワークを提供する。
本稿では、制御された選択間隔を通して負荷不均衡を最小限に抑えることで、これらの課題に対処する情報時代(AoI)ベースのクライアント選択ポリシーを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:55:28 GMT)
Boosting Performance on ARC is a Matter of Perspective [3.3] トレーニング、生成、スコアリングフェーズを通じて、タスク固有のデータ拡張を活用します。
深度優先探索アルゴリズムを用いて多種多様な高確率候補解を生成する。
本手法はパブリックARC-AGI評価セットにおいて71.6%(286.5/400タスク)のスコアを得る。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:17:10 GMT)
An alignment safety case sketch based on debate [3.3] 提案された解決策の1つは、システムの出力の欠陥を議論を通じて指摘するために、別の超人的システムを活用することである。
本稿では,AIの安全性に関する議論の価値について概説する。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:52:28 GMT)
The Right to AI [3.2] 本稿では、個人やコミュニティが生活を形成するAIシステムの開発とガバナンスに有意義に参画すべきであると主張するAIの権利を提案する。
我々は、生成エージェント、大規模データ抽出、そして多様な文化的価値が、AIの監視に新しい複雑さをもたらすかを批判的に評価する。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:28:58 GMT)
D-CODA: Diffusion for Coordinated Dual-Arm Data Augmentation [3.2] Coordinated Dual-arm Data Augmentation (D-CODA) は、両眼の模倣学習に適したオフラインデータ拡張法である。
D-CODAは拡散モデルを訓練し、両腕に新しい視点一貫性のある手首カメラ画像を合成する。
グリップ・トゥ・オブジェクト・コンタクトを含む拡張状態が、双方向調整に適した制約に従うことを保証するために、制約付き最適化を採用している。
論文参考訳(メタデータ) (Thu, 08 May 2025 00:03:04 GMT)
LIVS: A Pluralistic Alignment Dataset for Inclusive Public Spaces [3.2] マルチ基準アライメントのためのベンチマークであるLocal Intersectional Visual Spacesデータセットを紹介する。
このデータセットは、13,462の画像に対して37,710のペア比較を符号化しており、6つの基準に沿って構成されている。
安定拡散XLを微調整し,複数条件の空間的嗜好を反映し,LIVSデータセットと微調整モデルを評価する。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:50:30 GMT)
A highly maneuverable flying squirrel drone with agility-improving foldable wings [3.2] 本稿では、機敏性向上可能な折りたたみ翼を備えた高度操縦可能なドローンを提案する。
折りたたみ翼の複雑な空気力学は、物理補助リカレントニューラルネットワーク(paRNN)を用いてモデル化される
実験の結果,提案した飛行用リスドローンは追跡性能が13.1%向上した。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:44:32 GMT)
Uncertainty Comes for Free: Human-in-the-Loop Policies with Diffusion Models [3.1] 本研究では,拡散政策が人的援助を必要時にのみ積極的に求め,一定の人的監視への依存を減らす方法を提案する。
我々は、拡散政策の生成過程を利用して、自律エージェントが展開時にオペレーター支援を要求できる不確実性に基づくメトリクスを計算する。
この手法は, 自律的な性能向上のために, 微調整拡散ポリシーの効率的なデータ収集に有効であることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:10:57 GMT)
Rethinking Video Super-Resolution: Towards Diffusion-Based Methods without Motion Alignment [3.1] 実世界の物理を学習する強力なモデルは、先行知識として様々な動きパターンを容易に扱うことができると論じる。
提案したビデオ拡散変圧器モデルの単一例は、再学習せずに異なるサンプリング条件に適応することができる。
合成および実世界のデータセットに関する実証的な結果は、拡散に基づくアライメントなしビデオ超解像の実現可能性を示している。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:38:04 GMT)
Correctness Coverage Evaluation for Medical Multiple-Choice Question Answering Based on the Enhanced Conformal Prediction Framework [3.0] 大規模言語モデル(LLM)は、医療質問応答(QA)のシナリオでますます採用されている。
LLMは幻覚や非現実的な情報を生成でき、高い医療業務における信頼性を損なう。
本稿では,医療用マルチ選択質問応答タスクのための拡張型コンフォーマル予測フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:52:55 GMT)
Shallow AutoEncoding Recommender with Cold Start Handling via Side Features [2.9] ユーザとアイテムのコールドは、レコメンデーションシステムの産業的応用において重要な課題となる。
ユーザ側とアイテム側の両方をシームレスに統合する拡張EASEモデル(FEASE)を導入する。
コールドスタート項目を効果的に推奨し, 余分なバイアスを伴わずにコールドスタートユーザを扱い, バランスをとる方法を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:46:26 GMT)
FieldNet: Efficient Real-Time Shadow Removal for Enhanced Vision in Field Robotics [2.8] 本研究では、リソース制約のあるハードウェアに最適化された、リアルタイムシャドウ除去のための新しいディープラーニングフレームワークであるFieldNetを紹介する。
合成シャドウで強化された1万の自然画像のデータセットに基づいてトレーニングされたFieldNetは、ベンチマークデータセットの最先端メソッドよりも優れています。
これらの進歩は、フィールドロボティクスなどにおけるリアルタイムビジョンタスクのための堅牢で効率的なソリューションとしてFieldNetを確立している。
論文参考訳(メタデータ) (Thu, 08 May 2025 00:48:48 GMT)
Position: The AI Conference Peer Review Crisis Demands Author Feedback and Reviewer Rewards [2.8] 本稿では,従来の一方向レビューシステムを双方向フィードバックループに変換する必要性を論じる。
著者はレビューの品質を評価し、レビュアーは正式な認定を受け、説明責任フレームワークを作成する。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:51:48 GMT)
Benchmarking Open-Source Large Language Models on Healthcare Text Classification Tasks [2.8] 本研究では,オープンソースの5つの大言語モデル(LLM)の分類性能を評価する。
全てのモデルとタスクの組み合わせに対して、95%の信頼区間を有する精度、リコール、F1スコアを報告する。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:58:28 GMT)
This part looks alike this: identifying important parts of explained instances and prototypes [2.7] そこで本研究では,プロトタイプ内で最も情報に富む特徴を識別する手法を提案する。
説明手法から得られた特徴重要度スコアを用いて、インスタンスと最も近いプロトタイプとの間に最も関連性の高い重なり合う特徴を強調する。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:54:27 GMT)
LUDO: Low-Latency Understanding of Deformable Objects using Point Cloud Occupancy Functions [2.7] 本稿では,変形可能な物体の高精度な低レイテンシ理解手法LUDOを紹介する。
LUDOは、内部構造を含む変形した状態の物体を、30ms以下の単一視点の雲観測から再構成する。
変形可能な物体に注目する内部領域を自律的ターゲティングするLUDOの能力を実証する。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:18:17 GMT)
Denoising Diffusion Probabilistic Models for Coastal Inundation Forecasting [2.7] DIFFFLOODは,拡散モデルに基づく確率予測手法である。
空間的コンテキストと時間的コンテキストの両方を考慮して、場所における浸水レベルを予測する。
バージニア州東部海岸の海岸浸水データに基づいてDIFFFLOODを訓練・試験した。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:13:41 GMT)
The Pitfalls of Growing Group Complexity: LLMs and Social Choice-Based Aggregation for Group Recommendations [2.6] Group Recommender Systems (GRS) は、社会的選択に基づくアグリゲーション戦略を使って単一のレコメンデーションを導いた。
ゼロショット学習に基づいて,言語モデルがこれらの戦略を正しく実行できる条件について検討する。
100以上のレーティングを考慮すると、パフォーマンスが低下し始めています。
今後の研究は、GRS評価の要素としてグループ複雑性を含むべきであると結論付けている。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:43:01 GMT)
HiBayES: A Hierarchical Bayesian Modeling Framework for AI Evaluation Statistics [2.6] HiBayESはAI評価統計のための一般化可能な階層型ベイズモデリングフレームワークである。
一般化線形モデル(GLM)に基づいて構築されたHiBayESは、原理化された不確実性定量化とロバストなパラメータ推定を提供する。
本稿では、HiBayESの総合的な紹介、例示、従来の統計手法との比較、マルチレベルベイズGLMの実装のための実践的ガイダンスなどを紹介する。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:05:02 GMT)
Enhancing AI Face Realism: Cost-Efficient Quality Improvement in Distilled Diffusion Models with a Fully Synthetic Dataset [2.6] 本研究では,拡散モデルによる画像生成のコスト対品質比を高める新しい手法を提案する。
我々は合成ペアデータセットを生成し、高速な画像から画像への変換ヘッドを訓練する。
以上の結果から, 大規模生成モデルの蒸留版と拡張層を組み合わせたパイプラインが, ベースライン版に類似したフォトリアリスティック・ポートレートを提供することがわかった。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:05:22 GMT)
Research on Medical Named Entity Identification Based On Prompt-Biomrc Model and Its Application in Intelligent Consultation System [2.6] 本稿では, ハードテンプレートとソフトプロンプトデザインを統合した Prompt-bioMRC モデルを提案する。
我々の発見は、我々のアプローチが従来のモデルを上回ることを一貫して示している。
本研究は、医療データの自動処理の進歩、より正確な医療情報抽出の促進、効率的な医療意思決定プロセスの支援に寄与する。
論文参考訳(メタデータ) (Thu, 08 May 2025 00:09:02 GMT)
Teochew-Wild: The First In-the-wild Teochew Dataset with Orthographic Annotations [2.5] 本報告では,Teochew方言の音声コーパスであるTeochew-Wildの構築について報告する。
コーパスには、複数の話者から18.9時間分のTeochew音声データが含まれている。
私たちの知る限りでは、これは正確な正書法アノテーションを備えたTeochewデータセットとして初めて公開されたものです。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:47:11 GMT)
GaMNet: A Hybrid Network with Gabor Fusion and NMamba for Efficient 3D Glioma Segmentation [2.4] 深層学習は病変のセグメンテーションに役立つが、CNNとTransformerベースのモデルは文脈モデリングを欠いていることが多く、重い計算を必要とする。
グローバルモデリングのためのNMambaモジュールと,効率的な局所特徴抽出のためのマルチスケールCNNを組み合わせたGaMNetを提案する。
本手法はより少ないパラメータと高速な計算で高いセグメンテーション精度を実現する。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:25:22 GMT)
Magnetic-field dependent VB- spin decoherence in hexagonal boron nitrides: A first-principles study [2.3] 第一原理量子多体シミュレーションを用いて、h-BNにおけるVB-スピンのスピンデコヒーレンスを解析する。
我々は、遷移境界(TB)と呼ばれる特定の磁場でデコヒーレンス機構が変化することを発見した。
以上の結果から,h-10BN の TB は11B よりも大きい10B の核スピンに由来することが明らかとなり,11BN よりも広い範囲の磁場に対して強い核変調効果が生じることが示唆された。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:54:05 GMT)
Unpacking Robustness in Inflectional Languages: Adversarial Evaluation and Mechanistic Insights [2.3] 我々は、逆行攻撃が屈折言語でどのように作用するかを評価し、説明する。
We use a novel protocol inspired by mechanistic interpretability, based on Edge Attribution Patching (EAP) method。
タスク指向データセットMultiEmoに基づく新しいベンチマークを作成する。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:00:03 GMT)
Foam-Agent: Towards Automated Intelligent CFD Workflows [2.3] 自然言語入力から複雑なOpenFOAMベースのCFDシミュレーションを自動化するマルチエージェントフレームワークであるFoam-Agentを提案する。
我々の革新は、(1)異なるシミュレーションの側面を特化した階層型マルチインデックス検索システム、(2)構成ファイル間の整合性管理を提供する依存性対応ファイル生成システム、(3)人間の介入なしにシミュレーション失敗を診断・解決する反復的エラー訂正機構を含む。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:05:51 GMT)
Transformer-based assignment decision network for multiple object tracking [2.3] 本稿では,データアソシエーションに取り組むトランスフォーマーベースのアサインメント決定ネットワーク(TADN)について,推論中に明示的な最適化を必要とせずに紹介する。
提案手法は,トラッカーとしての単純な性質にもかかわらず,ほとんどの評価指標において高い性能を示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:30:23 GMT)
Clustering with Communication: A Variational Framework for Single Cell Representation Learning [2.3] CCC信号を単一セル表現学習に組み込んだ変分自動符号化フレームワークCCCVAEを提案する。
CCCVAEはクラスタリング性能を向上し,標準的なVAEベースラインよりも高い評価スコアが得られることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:53:36 GMT)
Image-Text Relation Prediction for Multilingual Tweets [2.2] 本研究は、多言語視覚言語モデルが、異なる言語における画像-テキスト関係予測の課題にどのように取り組むかを考察する。
我々はラトビアのTwitter投稿から、手動による英語への翻訳とともに、専用のバランスのとれたベンチマークデータセットを構築した。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:23:20 GMT)
Adaptive Contextual Embedding for Robust Far-View Borehole Detection [2.2] 爆破作業では、遠視野画像から密集した小さなボアホールを正確に検出することが、運用上の安全性と効率の面で重要である。
指数移動平均(EMA)に基づく統計的更新から導出される一貫した埋め込み表現を明示的に活用することにより、既存のアーキテクチャ(例えば、YOLO)の上に構築する適応検出手法を提案する。
本手法では,(1)動的に更新された画像統計量を利用して照明やテクスチャの変動を頑健に処理する適応的拡張,(2)連続的かつ信頼性の高い特徴抽出を確実にするための埋め込み安定化,(3)空間コンテキストを利用した文脈改善による検出精度の向上,の3つの相乗的要素を紹介する。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:25:42 GMT)
Would You Rely on an Eerie Agent? A Systematic Review of the Impact of the Uncanny Valley Effect on Trust in Human-Agent Interaction [2.2] アンカニー・バレー・エフェクト(英: Uncanny Valley Effect、UVE)は、人間のような人工的な生物が不気味さや忌避感を感じる現象である。
信頼とUVEへの関心が高まっているにもかかわらず、既存の研究はこれらの概念がどのように定義され、どのように運用されるかという点で広範囲に及んでいる。
本総説は,UVEがエージェントに対するヒトの信頼に与える影響を検証し,既存の実証文献の方法論的パターン,限界,ギャップを明らかにすることを目的とする。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:03:26 GMT)
Stochastic Variational Propagation: Local, Scalable and Efficient Alternative to Backpropagation [2.2] バックプロパゲーション(BP)はディープラーニングの基盤であるが、グローバルな勾配同期に依存しているためスケーラビリティが制限される。
本稿では、階層的変分推論としてトレーニングを再構成するスケーラブルな代替手段である変分伝搬(SVP)を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:32:29 GMT)
A New k-Space Model for Non-Cartesian Fourier Imaging [2.2] 従来のアプローチの制限(旧と新)に対してより弾力性のある新しいモデルを提案する。
具体的には、新しいモデルは、標準的なイメージドメインのボクセルベースのアプローチではなく、フーリエドメインベースの拡張に基づいている。
非カルテシアンMRI再建の文脈において、図示的な結果が提示される。
論文参考訳(メタデータ) (Thu, 08 May 2025 21:06:40 GMT)
Closing the Loop: Motion Prediction Models beyond Open-Loop Benchmarks [2.2] 我々は、最先端のモーション予測器とモーションプランナーの相互作用を評価する。
以上の結果から,オープンループの精度はクローズドループ運転行動と必ずしも相関しないことがわかった。
最大86%のパラメータを持つモデルでは、同等またはそれ以上のクローズドループ駆動性能が得られる。
論文参考訳(メタデータ) (Thu, 08 May 2025 20:38:49 GMT)
SpatialPrompting: Keyframe-driven Zero-Shot Spatial Reasoning with Off-the-Shelf Multimodal Large Language Models [2.1] 本研究では,既成の大規模言語モデルの創発的推論能力を活用する新しいフレームワークであるSpatialPromptingを紹介する。
提案フレームワークは,直感的な視覚的・位置的手がかりを利用したフレキシブルな空間推論のための新しいパラダイムを確立する。
本手法は,従来の3次元インプットと微調整の必要性を効果的に排除し,よりシンプルでスケーラブルな代替手段を提供する。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:59:01 GMT)
Fair Uncertainty Quantification for Depression Prediction [2.1] うつ病予測における不確実性定量化(UQ)の公平性について検討する。
うつ病予測のための不確実性定量化(FUQ)を提案する。
FUQはグループベースの分析を通じて信頼性と公正なうつ病予測を追求している。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:09:36 GMT)
Automated detection of underdiagnosed medical conditions via opportunistic imaging [2.1] オポチュニティCTは、診断情報を抽出するために定期的なCT画像を再取得する。
画像表現型とそれに対応する文書との相違点を明らかにするため,2,674個のCTスキャンを解析した。
サルコニア,肝脂肪症,腹水と診断されたスキャンのわずか0.5%,3.2%,30.7%がICDで診断された。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:23:39 GMT)
RouterKT: Mixture-of-Experts for Knowledge Tracing [2.0] 知識追跡(KT)は知能学習システム(ITS)の基本課題である
異種学習パターンをキャプチャする新しいMixture-of-ExpertsアーキテクチャであるRouterKTを提案する。
RouterKTは,様々なKTバックボーンモデルの性能向上と柔軟性を示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:56:55 GMT)
A Benchmark Dataset and a Framework for Urdu Multimodal Named Entity Recognition [2.0] U-MNERフレームワークを導入し、Twitter2015-Urduデータセットをリリースする。
広く使われているTwitter2015データセットから適応され、Urdu固有の文法ルールで注釈付けされている。
我々のモデルはTwitter2015-Urduデータセット上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:38:20 GMT)
Non-Hermitian sensing from the perspective of post-selected measurements [1.9] 我々は,非エルミート量子センシングとポストセレクト計測の基本的な関係を確立する。
我々は,非エルミートセンサがすべての情報を利用する場合,エルミートセンサよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:48:18 GMT)
xTrace: A Facial Expressive Behaviour Analysis Tool for Continuous Affect Recognition [1.9] 顔ビデオで表現力のある振る舞いを認識することは、Affective Computingにおける長年の課題である。
本稿では,自然主義的顔表現行動分析システム構築における2つの課題について論じる。
顔表現行動分析のための頑健なツールであるxTraceを紹介する。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:27:37 GMT)
Ryu-Takayanagi Formula for Multi-Boundary Black Holes from 2D Large-$\textbf{$c$}$ CFT Ensemble [1.9] 本稿では,AdS$_3$/CFT$$における複数の絡み合ったCFTを含む量子状態のクラスについて検討する。
遠絡エントロピーのRyu-Takayanagi(RT)式は境界CFTデータのみを用いて導出可能であることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:18:00 GMT)
Distributed quantum sensing with measurement-after-interaction strategies [1.9] 測定後相互作用(MAI)戦略は,検出ノイズに対するマルチパラメータ感度とロバスト性を大幅に向上させることができることを示す。
これらの結果は、原子アンサンブルや光学場のようなプラットフォームにおける即時的な実験的な実装の道を開く。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:16:34 GMT)
On the Role of Search Budgets in Model-Based Software Refactoring Optimization [1.8] 多目的進化アルゴリズムは、設計者が望まない非機能特性間のトレードオフを特定するのに役立つ。
本研究は,設計代替案の探索を制限するために,検索予算の実施が与える影響について検討する。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:04:51 GMT)
In-Context Learning for Label-Efficient Cancer Image Classification in Oncology [1.7] In-context Learning (ICL) は、ドメイン固有の診断タスクに対するモデル再トレーニングの実用的な代替手段である。
視覚言語モデル(VLM)-Paligemma, CLIP, ALIGN, GPT-4o の評価を行った。
ICLは、サイズが小さいにもかかわらず競争力の向上を示し、計算に制約のある臨床環境への展開の可能性を示した。
論文参考訳(メタデータ) (Thu, 08 May 2025 20:49:01 GMT)
Advances in Protein Representation Learning: Methods, Applications, and Future Directions [1.7] タンパク質は複雑な生体分子であり、様々な生物学的過程において中心的な役割を果たす。
タンパク質表現学習(PRL)は、タンパク質データから有意義な計算表現を抽出できる変換的アプローチとして登場した。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:36:08 GMT)
GenAI in Entrepreneurship: a systematic review of generative artificial intelligence in entrepreneurship research: current issues and future directions [1.7] ジェネレーティブ・人工知能(GenAI)とLarge Language Models(LLM)は、産業とビジネスのダイナミクスに大きな影響を及ぼすと認識されている。
起業研究のテーマとしてのGenAIの知識はいまだに不足している。
本稿では、GenAIが起業家精神に与える影響について、研究の進化する景観を特定し、分析することを目的とした体系的な文献レビューを行う。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:44:42 GMT)
Learning stochastic dynamics from snapshots through regularized unbalanced optimal transport [1.7] 少ない時間分解スナップショットからのサンプルを使用して動的に再構築することは、自然科学と機械学習の両方において重要な問題である。
本稿では、正規化された不均衡な最適輸送(RUOT)を解き、観察されたスナップショットから連続的な不均衡なダイナミクスを推定するための新しいディープラーニング手法を提案する。
本手法は,RUOT形式に基づいて,成長・死過程の事前知識や追加情報を必要とせず,これらのダイナミクスをモデル化する。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:57:11 GMT)
RL-DAUNCE: Reinforcement Learning-Driven Data Assimilation with Uncertainty-Aware Constrained Ensembles [1.6] RL-DAUNCEは,物理制約によるデータ同化を向上する新しいRL-DAUNCE法である。
まず、RL-DAUNCEは機械学習の計算効率を継承する。
第2に、RL-DAUNCEは複数のアンサンブルメンバーを前進させることによって不確実性を強調する。
第3に、RL-DAUNCEのアンサンブル・アズ・エージェントの設計は、物理的な制約の実施を促進する。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:43:35 GMT)
Deterministic generation of multi-qubit entangled states among distant parties using indefinite causal order [1.6] 複数のネットワークノードにまたがる$N$-qubitの絡み合った状態を生成するためのプロトコルを提案する。
その結果,提案プロトコルは長距離エンタングルメント生成の効率を著しく向上させることが示唆された。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:19:40 GMT)
Feature-Augmented Deep Networks for Multiscale Building Segmentation in High-Resolution UAV and Satellite Imagery [1.5] 本稿では,RGBの航空画像と衛星画像を用いた大規模建物セグメンテーションのための総合的なディープラーニングフレームワークを提案する。
我々のモデルは96.5%の精度、F1スコアは0.86、Intersection over Union(IoU)は0.80で、既存のRGBベースのベンチマークを上回っている。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:08:36 GMT)
LiteLMGuard: Seamless and Lightweight On-Device Prompt Filtering for Safeguarding Small Language Models against Quantization-induced Risks and Vulnerabilities [1.5] LiteLMGuard (LLMG) は、量子化されたSLMのリアルタイムかつ迅速な防御を提供する。
LLMGは、深層学習(DL)に基づく即時応答可能性分類タスクとしてプロンプトフィルタリングを形式化する。
LLMGは、ダイレクトインストラクションとジェイルブレイク攻撃戦略を含む有害なプロンプトの87%以上を防御している。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:58:41 GMT)
Optimizing LLMs for Resource-Constrained Environments: A Survey of Model Compression Techniques [1.5] 大規模言語モデル(LLM)は、人工知能(AI)の多くの領域に革命をもたらしたが、その相当なリソース要件は、モバイルおよびエッジデバイスへのデプロイメントを制限する。
本稿では,資源制約環境下での効率的な推論を実現するため,LLMの圧縮技術について概観する。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:55:48 GMT)
OcularAge: A Comparative Study of Iris and Periocular Images for Pediatric Age Estimation [1.4] 眼のバイオメトリック画像から子供の年齢を推定することは、微妙な生理的変化のために困難である。
本研究は,4歳から16歳までの小児の年齢を推定するための虹彩画像と眼周囲画像の比較検討を行った。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:09:08 GMT)
Agentic Neurodivergence as a Contingent Solution to the AI Alignment Problem [1.4] 我々の貢献の主な前提は、完全なAIと人間のアライメントがチューリング完全系から数学的に不可能であるため、ミスアライメントは避けられないということだ。
我々は,このような摂動と介入分析に基づいて,エージェントが協力や競争を通じて,親しみやすいAIや不親切なAIを中和する方法を検証し,オピニオン・アタックを導入し,検証する。
オープンモデルはより多様であり、プロプライエタリなモデルで実装されたガードレールは、エージェントの意見や感情の変化の範囲をある程度制御し制御することに成功している可能性が高いことを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:02:00 GMT)
From Sleep Staging to Spindle Detection: Evaluating End-to-End Automated Sleep Analysis [1.3] 完全自動解析が双極性障害の専門的研究から得られた知見を再現できるかどうかを評価する。
その結果、完全に自動化されたアプローチは、大規模な睡眠研究を促進する可能性があることが示された。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:07:10 GMT)
KG-HTC: Integrating Knowledge Graphs into LLMs for Effective Zero-shot Hierarchical Text Classification [1.3] 階層的テキスト分類(HTC)は、分類学で組織されたラベルに文書を割り当てることを含む。
ゼロショットHTCのための知識グラフを提示し、Large Language Models (LLMs)と知識グラフを統合する。
提案手法は,入力テキストに関連する知識グラフから,RAG(Retrieval-Augmented Generation)アプローチを用いて関連するサブグラフを検索する。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:27:27 GMT)
Benchmarking Ophthalmology Foundation Models for Clinically Significant Age Macular Degeneration Detection [1.3] 自己教師付き学習(SSL)により、ビジョントランスフォーマー(ViT)は大規模な自然言語データセットから堅牢な表現を学習できるようになった。
自然画像上で事前学習したiBOTは,最も分布外一般化を達成できることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:31:02 GMT)
Privacy-Preserved Automated Scoring using Federated Learning for Educational Research [1.3] 本稿では,教育評価の自動評価のための統合学習(FL)フレームワークを提案する。
我々は,2つの最先端FL手法と集中学習ベースラインに対して,我々のモデルをベンチマークする。
その結果,本モデルが最も精度が高い(94.5%)ことが示唆された。
論文参考訳(メタデータ) (Thu, 08 May 2025 20:14:32 GMT)
Novel Deep Neural OFDM Receiver Architectures for LLR Estimation [1.2] チャネル推定と等化処理を行う2つのOFDM受信機を提案する。
シミュレーションの結果,DATとRDNLAは従来の通信システムと既存のニューラルレシーバモデルの両方より優れていた。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:41:56 GMT)
Performance Evaluation of Large Language Models in Bangla Consumer Health Query Summarization [1.2] 本研究では,9大言語モデル(LLM)のゼロショット性能について検討する。
ROUGEメトリクスを用いてこれらのLCMを、細調整された最先端モデルであるBangla T5に対してベンチマークした。
その結果、ゼロショットLLMは微調整モデルと競合し、タスク固有の訓練を必要とせずに高品質なサマリーを達成できることを示した。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:06:28 GMT)
ValuesRAG: Enhancing Cultural Alignment Through Retrieval-Augmented Contextual Learning [1.1] ValuesRAGは、テキスト生成中に文化的および人口統計学的知識を動的に統合する新しいフレームワークである。
本研究では,6つの地域データセットを用いてValuesRAGを評価し,ベースラインを一貫して上回ることを示す。
本研究は,グローバルLLM能力と局所文化的価値のギャップを埋める動的検索手法の可能性を明らかにするものである。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:07:15 GMT)
ADMM-Based Training for Spiking Neural Networks [1.1] スパイクニューラルネットワーク(SNN)は、時系列処理とエネルギー消費の最小化によって、その可能性の高さから勢いを増している。
彼らはまだ、専用で効率的なトレーニングアルゴリズムを欠いている。
乗算器の交互方向法(ADMM)に基づく新しいSNN訓練法を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:20:33 GMT)
Enhancing Screen Time Identification in Children with a Multi-View Vision Language Model and Screen Time Tracker [1.1] 我々は,ウェアラブルセンサからのエゴセントリックなイメージを利用する新しいセンサ情報フレームワークを開発した。
我々は、エゴセントリックな画像シーケンスから複数のビューを抽出し、画面露出を動的に解釈するマルチビューVLMを考案した。
結果は、子どもの自然主義的環境における画面露出に関する行動研究を最適化する、このモニタリングアプローチの約束を支持した。
論文参考訳(メタデータ) (Thu, 08 May 2025 20:00:26 GMT)
Not Another Imputation Method: A Transformer-based Model for Missing Values in Tabular Datasets [1.0] NAIM(Not Another Imputation Method)は、従来の計算手法を使わずに欠落した値を扱うために設計されたトランスフォーマーベースのモデルである。
NAIMは、欠落した値を出力する必要性を回避し、利用可能なデータから効果的に学習する能力は、2つの主要な技術に依存している。
NAIMを利用可能な5つのデータセット上で広範囲に評価し、最先端の機械学習モデルと5つのディープラーニングモデルよりも優れたパフォーマンスを示した。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:27:30 GMT)
The Journey from Planck Distribution to Bose Statistics From Classical to Quantum Mechanics and Beyond [0.8] サティエンドラ・ナト・ボースの先駆的な業績は、ボース=アインシュタイン統計の基礎を築いた。
ブラックボディ放射に関するプランクの法則の導出は、古典的な仮定をバイパスした。
彼の研究は古典的電磁力学と量子論の不整合性を裏付けた。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:14:15 GMT)
Directional Sign Loss: A Topology-Preserving Loss Function that Approximates the Sign of Finite Differences [0.8] 本稿では、2つの配列間の有限差の符号におけるミスマッチ数を近似する新しい損失関数である指向性符号損失(DSL)を紹介する。
従来の損失関数とDSLを組み合わせることで,従来の損失関数よりもトポロジ的特徴を効果的に維持できることを示す。
DSLは、共通のトポロジベースのメトリクスの差別化可能な効率的なプロキシとして機能し、グラデーションベースの最適化フレームワークでの使用を可能にします。
論文参考訳(メタデータ) (Thu, 08 May 2025 20:34:13 GMT)
ViCTr: Vital Consistency Transfer for Pathology Aware Image Synthesis [0.8] 既存の方法は、病理学的特徴を正確にモデル化しながら、解剖学的忠実さを維持するのに苦労する。
ViCTrは、修正フロー軌跡とTweedie補正拡散プロセスを組み合わせて、高忠実で病理学的な画像合成を実現する新しい2段階のフレームワークである。
我々の知る限り、ViCTrは、厳密度制御による細粒度で病理に配慮したMRI合成を提供するための最初の方法である。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:44:16 GMT)
Cardioformer: Advancing AI in ECG Analysis with Multi-Granularity Patching and ResNet [0.7] Cardioformerは、新しいマルチグラニュラリティハイブリッドモデルである。
チャネル間のパッチ、階層的残差学習、および2段階の自己認識機構を統合している。
一貫して4つの最先端のベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:44:21 GMT)
A Conjoint Graph Representation Learning Framework for Hypertension Comorbidity Risk Prediction [0.7] 糖尿病と冠動脈疾患のリスクを予測するためのコンジョイントグラフ表現学習フレームワークを開発した。
このフレームワークは、他の強力なモデルよりも精度の高い予測を提供する。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:47:51 GMT)
Planar fault-tolerant circuits for non-Clifford gates on the 2D color code [0.7] 2次元カラーコードに論理的非クリフォード演算を実装した,スケーラブルな平面型耐故障回路群を紹介する。
回路は比較的単純で、物理的に$T$ゲート、$CX$ゲート、および数キュービットの測定のみで構成されている。
我々は「ジャスト・イン・タイム」デコーディング戦略を用いて耐障害性を実現する方法について詳述する。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:23:22 GMT)
Correlations and Krylov spread for a non-Hermitian Hamiltonian: Ising chain with a complex-valued transverse magnetic field [0.6] クリロフ複雑性は自然に進化した状態の拡散を測定する。
クリロフの展開は、その無限時間値にどのように達するかに基づいて、3つの異なる位相を展開できることが示される。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:27:25 GMT)
A4L: An Architecture for AI-Augmented Learning [0.6] 我々は、オンライン教育を通じて成人学習を支援するAI強化学習アーキテクチャ(A4L)を開発している。
我々は、A4Lアーキテクチャのモチベーション、目標、要件を示し、学習をよりパーソナライズし、スケーラブルにする目標をどのように進めるかについて議論する。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:47:09 GMT)
Lévy Light Cones and Critical Causality in Fractional Multiscale Quantum Ising Models [0.6] 一次元の分数的多次元逆場イジングモデルにおける因果性と臨界性について検討する。
これらのユニークな相互作用は、現在の量子情報アーキテクチャで実装することができる。
論文参考訳(メタデータ) (Thu, 08 May 2025 21:00:47 GMT)
An Efficient Sparse Kernel Generator for O(3)-Equivariant Deep Networks [0.6] 回転同変グラフニューラルネットワークは、空間深層学習タスクにおける技術性能の状態を導出する。
クレーブシュ=ゴルドンテンソル積(Clebsch-Gordon tensor product, CG)は、2つの高次特徴ベクトルと高構造スパーステンソルを交換して高密度出力ベクトルを生成するカーネルである。
我々は、CGテンソル製品用のGPUスパースカーネルジェネレータを導入し、既存のオープンソース実装やクローズドソース実装よりも大幅に高速化する。
論文参考訳(メタデータ) (Thu, 08 May 2025 23:11:05 GMT)
REHEARSE-3D: A Multi-modal Emulated Rain Dataset for 3D Point Cloud De-raining [0.6] 我々は,3Dポイント・クラウド・デレイニングにおける研究の進展を促進するため,大規模で多モードの降雨データセットREHEARSE-3Dを新たにリリースした。
第一に、4D Radar点雲に富む高解像度のLiDARデータを持つ唯一のデータセットである。
We benchmark raindrop detection and removal in fused LiDAR and 4D Radar point clouds。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:23:41 GMT)
The Power of Stories: Narrative Priming Shapes How LLM Agents Collaborate and Compete [0.5] 私たちは、チームワークを異なる学位に強調するストーリーをメインエージェントとして、これが交渉の結果にどのように影響するかをテストします。
ストーリーベースのプライミングは交渉戦略や成功率に大きく影響している。
対照的に、異なるストーリーを持つプライミングエージェントは、この効果を逆転させ、これらのエージェントは、自己利益に向かって急上昇した。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:29:29 GMT)
Performance Estimation in Binary Classification Using Calibrated Confidence [0.5] 混乱行列を用いて定義された任意の二項分類基準を推定できる新しい手法CBPEを提案する。
CBPEは強い理論的保証と有効な信頼区間を持つ推定値を生成する。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:34:44 GMT)
Two Views Are Better than One: Monocular 3D Pose Estimation with Multiview Consistency [0.5] 2つの同期ビューで動作する新しい損失関数、一貫性損失を導入する。
我々の整合性喪失は、3Dデータを必要としない微調整の性能を著しく向上させる。
半教師付き方式でモデルをスクラッチからトレーニングする場合,一貫性損失を用いることで最先端の性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:39:24 GMT)
Combining quantum noise reduction resources: a practical approach [0.5] 暗黒物質信号など、より高次で広い周波数ターゲットに対する量子ノイズ低減の理論的限界を提供する。
本稿では,QND技術によるバックアクション回避が,ブロードバンド力検出にシャープ光を用いる場合の技術的課題を劇的に低減することを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 21:46:33 GMT)
CrashSage: A Large Language Model-Centered Framework for Contextual and Interpretable Traffic Crash Analysis [0.5] 道路事故は毎年130万人が死亡し、世界経済の損失は18兆ドルを超えたと主張している。
CrashSageは, 4つの重要なイノベーションを通じて, クラッシュ解析とモデリングを促進するために設計された, LLM(Large Language Model)中心のフレームワークである。
論文参考訳(メタデータ) (Thu, 08 May 2025 00:23:18 GMT)
Switching Dynamics of Metastable Open Quantum Systems [0.4] 量子ビットやライドバーグ原子のような量子系は、小さなスペクトルギャップを持つ集合量子ジャンプと長寿命のリウヴィリアモードを通じて類似の挙動を示す。
ここでは、大きな偏差原理のレンズによるスイッチングダイナミクスと量子メタスタビリティの関連について詳述する。
これらの結果は、熱力学の限界から遠く離れた、強く相互作用し、散逸する量子系の量子安定性と緩和過程に関する新たな洞察を与える。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:00:19 GMT)
Enhancing Reinforcement Learning for the Floorplanning of Analog ICs with Beam Search [0.3] 本稿では,強化学習(RL)とビーム(BS)戦略を組み合わせたハイブリッド手法を提案する。
BSアルゴリズムはエージェントの推論プロセスを強化し、フレキシブルなフロアプランを生成する。
実験結果から, 標準RL法と比較すると, 面積, 死空間, 線長が約5~85%向上した。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:50:32 GMT)
Barren Plateaus in Variational Quantum Computing [0.3] 変分量子コンピューティングは、様々な分野で応用される柔軟な計算パラダイムを提供する。
それらのポテンシャルを実現するための重要な障害はバレンプラトー現象(BP)である。
本稿では,BP現象の現在の理解について概観する。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:14:28 GMT)
Semantic Style Transfer for Enhancing Animal Facial Landmark Detection [0.3] スタイル転送は、構造的内容を保持しながら、ある画像の視覚的特徴を別の画像に適用する技法である。
本研究は,動物顔のランドマーク検出訓練の強化にこの技術を用いることを検討した。
フルボディ画像ではなく、トリミングされた顔画像へのスタイル転送を適用することで、構造的一貫性が向上する。
Supervised Style Transfer (SST) - ランドマーク精度に基づいてスタイルソースを選択するもので、ベースライン精度の98%を維持している。
論文参考訳(メタデータ) (Thu, 08 May 2025 20:48:15 GMT)
An Open-Source Dual-Loss Embedding Model for Semantic Retrieval in Higher Education [0.3] 本研究では,2つのオープンソースの埋め込みモデルについて,質問応答の微調整を行った。
手動キュレーションと大規模言語モデル(LLM)を併用して,3,197の文対の合成データセットを構築した。
1)MNRL(MultipleNegativesRankingLoss)を用いて微調整されたベースラインモデルと,2)MNRLとCosineSimilarityLossを併用して意味的ランク付けと類似度校正の両方を改善するデュアルロスモデル,の2つのトレーニング戦略が評価された。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:14:14 GMT)
Quantum Simulation of Dynamical Response Functions of Equilibrium States [0.3] 動的応答関数の計算は、凝縮物質物理学における多くの問題の中心である。
既存のアプローチは、しばしば平衡状態へのアクセスを前提としており、実際には準備が困難である。
本稿では,エネルギーフィルタ技術を用いてこれを回避できる手法を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:52:11 GMT)
How to Incorporate External Fields in Analog Ising Machines [0.3] Ising Machine (IM) は最適化問題を効率的に解くために設計された特殊な装置である。
ほとんどの現実的なCOPはスピンスピン結合と外部場の両方を必要とする。
アナログスピンを持つIMでは、これらの相互作用は連続的なスピン振幅と異なるスケールをし、性能に影響を及ぼす不均衡をもたらす。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:01:02 GMT)
An Efficient Method for Accurate Pose Estimation and Error Correction of Cuboidal Objects [0.3] 本稿では,立方体形状物体の高精度ポーズ推定法を提案する。
ターゲットポーズにおけるエラーを時間効率で削減することを目的としている。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:43:31 GMT)
Fine-Tuning Video-Text Contrastive Model for Primate Behavior Retrieval from Unlabeled Raw Videos [0.3] 非ヒト霊長類の自然生息地におけるビデオ記録は、野生での行動を研究するための共通の情報源である。
我々は,カプチン猿の特定の領域に対して,事前学習したビデオテキスト基盤モデルを微調整する。
論文参考訳(メタデータ) (Thu, 08 May 2025 22:48:52 GMT)
QUIC-Exfil: Exploiting QUIC's Server Preferred Address Feature to Perform Data Exfiltration Attacks [0.3] 本稿では,QUICプロトコルのサーバ優先アドレス特徴を用いたQUICベースのデータ抽出攻撃の実現可能性を示す。
QUICプロトコルのサーバ優先アドレス機能を活用する新しい方法により、攻撃者は感染したマシンから悪意のあるサーバに機密データを流出させることができる。
この攻撃はRustにおける概念実証ツールとして実装されている。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:31:28 GMT)
Leveraging Depth Maps and Attention Mechanisms for Enhanced Image Inpainting [0.2] 本稿ではRGB画像と深度画像の両方を取り入れた新しい手法を提案する。
我々のモデルはデュアルエンコーダアーキテクチャを用いており、1つのエンコーダがRGB画像を処理し、もう1つのエンコーダが深度画像を処理している。
RGB画像とともに深度情報を組み込むことで,再現性を大幅に向上することを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:58:46 GMT)
Marker-Based Extrinsic Calibration Method for Accurate Multi-Camera 3D Reconstruction [0.2] 本稿では,3次元マーカーによる幾何学的制約を利用した反復的外在的キャリブレーション手法を提案する。
本手法は,Tech4Dietプロジェクトにおいて,制御された環境と実際の実環境の両方において総合的に検証する。
実験の結果,アライメント誤差が大幅に減少し,高精度で信頼性の高い3次元再構成が可能となった。
論文参考訳(メタデータ) (Thu, 08 May 2025 21:07:05 GMT)
Threat Modeling for AI: The Case for an Asset-Centric Approach [0.2] AIシステムは、自律的にコードを実行し、外部システムと対話し、人間の監視なしに運用することが可能になった。
AIシステムが自律的にコードを実行し、外部システムと対話し、人間の監視なしに運用できるようになったことで、従来のセキュリティアプローチは不足する。
本稿では、脅威モデリングAIシステムのための資産中心の方法論を紹介する。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:57:08 GMT)
Memory Under Siege: A Comprehensive Survey of Side-Channel Attacks on Memory [0.2] メモリに対するサイドチャネル攻撃(SCAM)は、メモリサブシステムから意図しないデータ漏洩を利用して機密情報を推測する。
本研究の目的は、SCAMを検証し、様々な攻撃手法を分類し、既存の防御機構を評価することである。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:16:08 GMT)
GCN-Based Throughput-Oriented Handover Management in Dense 5G Vehicular Networks [0.2] 本稿では,高密度5Gネットワークにおけるハンドオーバ管理を最適化するための新しい手法TH-GCNを提案する。
グラフニューラルネットワーク(GNN)を使用して、TH-GCNは、信号品質、スループット、車両速度、基地局負荷といった特徴が豊富な動的グラフのノードとして車両と基地局をモデル化する。
シミュレーションの結果、TH-GCNは、ハンドオーバを最大78%削減し、信号品質を10%改善し、既存の手法より優れていることが示された。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:03:46 GMT)
Physics-Learning AI Datamodel (PLAID) datasets: a collection of physics simulations for machine learning [0.2] PLAIDは物理シミュレーションのデータセットを表現および共有するためのフレームワークである。
PLAIDはシミュレーションデータを記述するための統一標準を定義する。
PLAID標準の下で,構造力学と計算流体力学を網羅した6つのデータセットをリリースする。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:58:22 GMT)
Trading Under Uncertainty: A Distribution-Based Strategy for Futures Markets Using FutureQuant Transformer [0.1] FutureQuant Transformerモデルを導入し、これらの課題をナビゲートするアテンションメカニズムを活用する。
ポイント予測に焦点を当てた従来のモデルとは異なり、FutureQuantモデルは将来の価格の範囲とボラティリティを予測するのに優れている。
複雑な市場パターンを解析し、学習する能力は、意思決定の強化を可能にします。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:52:04 GMT)
Scientific Hypothesis Generation by a Large Language Model: Laboratory Validation in Breast Cancer Treatment [0.1] 大規模な言語モデル LLM はAIを変革し、幅広いタスクでブレークスルーのパフォーマンスを達成した。
ここでは乳がん治療領域を用いた科学的仮説の根拠としてのLSMの応用を実験的に検証する。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:15:15 GMT)
Integrating Communication, Sensing, and Security: Progress and Prospects of PLS in ISAC Systems [0.1] 5G以降や6Gといった将来のネットワークにおける通信信頼性、センシング、セキュリティのバランスのとれたトレードオフを考えることが最重要となる。
PLSの観点から,設計したセキュアなISACシステムの総合的かつシステム的なレビューを行う。
PLSとISACの融合は、データの機密性、通信の隠蔽性、スプーフィングを標的とした攻撃を考慮し、より広範な影響で分析される。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:40:14 GMT)
Probing de Sitter Space Using CFT States [0.0] dS$_3/$CFT$$の演算は、AdS$_3/$CFT$$の演算と明らかに異なる。
これにより、CPT-in方式で異なる一次状態から構築された2つの局所状態を組み合わせる必要がある。
この分析は、dS ユークリッド真空におけるグリーン関数が、AdS のウィック回転から簡単には得られない理由を説明する。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:08:24 GMT)
Visibility and Influence in Digital Social Relations: Towards a New Symbolic Capital? [0.0] この研究は、オンラインの可視性、影響力、評判に基づく新しい形の象徴的資本を、伝統的な形態とは異なる形で特定する。
この研究は、これらのダイナミクスの倫理的意味を論じ、今後の研究方向性を示唆している。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:10:47 GMT)
VaCDA: Variational Contrastive Alignment-based Scalable Human Activity Recognition [0.0] センサーを備えたウェアラブルデバイスは、ユーザの活動を継続的に監視し、大量のラベルのないデータを生成する。
従来の転帰学習手法は,日常的な活動を認識するのが困難である。
センサデータから低次元の共有空間を学習するための可変オートエンコーダ(VAE)を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:50:43 GMT)
Unified exact WKB framework for resonance -- Zel'dovich/complex-scaling regularization and rigged Hilbert space [0.0] 我々は、正確なWKB法を用いて量子力学的共鳴を解析するための統一的なフレームワークを開発する。
非摂動的定式化は、ツェルドヴィチ正則化、複素スケーリング法、およびリップされたヒルベルト空間を組み込むために働く。
この結果は、不安定な量子系における正確な WKB 法の非摂動精度を具体的に示すものである。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:24:42 GMT)
Unconventional excitonic insulators in two-dimensional topological materials [0.0] 励起子として知られる半導体の電子-ホール対は、低温でコヒーレントな状態を形成することができる。
結果として生じる位相はエキシトン絶縁体として知られ、超流動性を持つ。
最近提案された非自明なバンドトポロジーを持つ2次元候補材料について,エキサイトニック絶縁体について検討した。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:54:36 GMT)
Transforming faces into video stories -- VideoFace2.0 [0.0] VideoFace2.0は、入力ビデオ中の各ユニークな顔の空間的および時間的局所化のための開発システムの名称である。
提案アルゴリズムは, 73%~93%の範囲において, 疑似アイデンティティの減少率を相対的に向上させる。
このシステムは、既存のビデオ制作機器のコンパクトでモジュラーな拡張として構想されている。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:41:06 GMT)
Torus bifurcation of a dissipative time crystal [0.0] 2つの顕著な発振周波数を示す時間結晶状態に対する散逸連続時間結晶(CTC)の不安定性を実験的に観察した。
平均場近似モデルとフロケット解析を適用して、この遷移が限界周期(LC)と極限トーラス(LT)の間のトーラス分岐の多体系における発現であることを理論的に確認する。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:08:16 GMT)
Theoretical Foundations for Semantic Cognition in Artificial Intelligence [0.0] モノグラフは、構造化セマンティックステートとしての信念の形式的モデリングを基礎とした、人工知能のためのモジュラー認知アーキテクチャを提供する。
信念状態は、操作者が同化、抽象化、無効化、メモリ、イントロスペクションを可能にするナビゲート可能な多様体に埋め込まれた言語表現の動的アンサンブルとして定義される。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:47:40 GMT)
The spatial correlation of radiation-induced errors in superconducting devices decays over a millimeter [0.0] 6チップの超伝導マイクロ波共振器でナノ秒分解能多重再生を行う。
これにより、生成したフォノンの飛行の差分時間を測定することにより、チップ上の電離放射線の衝撃位置を特定できる。
我々は、各共振器(吸収エネルギーのプロキシ)の位相応答と衝撃点からの距離を相関させて、フォノンを媒介とする放射線中毒のミリメートル減衰長を明らかにする。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:38:56 GMT)
The Moon's Many Faces: A Single Unified Transformer for Multimodal Lunar Reconstruction [0.0] 月面画像の反射率パラメータ推定と画像に基づく3次元再構成はマルチモーダル学習問題として定式化できる。
複数のソース間で共有表現を学習するために訓練された単一統一型トランスフォーマーアーキテクチャを提案する。
我々の基礎モデルは,これらの4つのモダリティの物理的に妥当な関係を学習することを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 20:55:02 GMT)
Text2Cypher: Data Pruning using Hard Example Selection [0.0] 大規模言語モデル(LLM)は、Text2やText2Cypherといったモデルを通じて、データベースとの自然言語インタラクションを可能にする。
これらのモデルを微調整するには、通常、非自明な例を含む大規模で多様なデータセットが必要である。
本稿では,Text2Cypherデータセットを抽出するための5つのハードサンプル選択手法を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:51:13 GMT)
Study of the Quartic Anharmonic Oscillator Using the System's Wave Function Expansion in the Oscillator Basis [0.0] 調和振動子固有関数の完全集合における系の波動関数の収束展開に基づく手法を適用する。
拡張に含まれる基底関数の数に関して、計算された全ての量の非常に良い収束性を示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 20:28:20 GMT)
Structural Alignment in Link Prediction [0.0] この論文は、KGデータモデリングとリンク予測に対するフィールドのアプローチに関する別の視点を提案する。
この研究は、グラフ構造第一の観点からKGと最先端リンク予測器を再解析する。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:27:15 GMT)
Stochastic resetting in discrete-time quantum dynamics: steady states and correlations in few-qubit systems [0.0] 量子コンピュータにおける離散時間リセットダイナミクスの定常特性について検討する。
ポアソニアンリセットに対しては、プロセスの定常状態を計算し、量子ゲートにおける「共鳴」の存在を実証する。
リセット確率が時間とともに十分に急速に消失した場合、システムは定常状態に近づかないことを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:49:06 GMT)
Steady-state heat engines driven by finite reservoirs [0.0] 本研究では,有限サイズの貯水池が連続・同時結合のシナリオにおいて,無限サイズの貯水池と比較して電力に有意な影響を及ぼすことを示す。
本研究は,有限貯留層熱容量と不完全な熱分離の現実的な条件下でのナノスケールエンジンの性能を最適化するツールを紹介する。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:22:51 GMT)
Stable infinite-temperature eigenstates in SU(2)-symmetric nonintegrable models [0.0] 非可積分な結合重み付きモデルのクラスには、多数のゼロエネルギー固有状態が与えられ、非アベリア内部対称性を持つ。
少数のマグノンゼロエネルギー状態が正確な解析的記述を持ち、低絡み合う固定分離状態の基礎を構築することができることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:49:02 GMT)
SoK: A Taxonomy for Distributed-Ledger-Based Identity Management [0.0] 本稿では,分散リーダベースのIDソリューションを分類するための方法論的分類法を提案する。
フレームワークは22の次元と113の特性で構成され、信頼アンカー実装、アイデンティティアーキテクチャ(識別子と資格)、台帳仕様の3つのグループに分けられる。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:57:17 GMT)
Safety by Measurement: A Systematic Literature Review of AI Safety Evaluation Methods [0.0] この文献レビューは、急速に進化するAI安全性評価の分野を集約する。
それは、どの特性を計測するか、どのように測定するか、そしてこれらの測定がフレームワークにどのように統合されるかという、3つの次元に関する体系的な分類法を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:55:07 GMT)
SVAD: From Single Image to 3D Avatar via Synthetic Data Generation with Video Diffusion and Data Augmentation [0.0] 1枚の画像から得られる高品質のアニマタブルな3Dアバターは、コンピュータビジョンにおいて重要な課題である。
既存の手法の相補的強みを活用することによって,これらの制約に対処する新しいアプローチSVADを提案する。
本手法は,映像拡散により合成トレーニングデータを生成し,画像保存モジュールと画像復元モジュールを併用し,改良したデータを用いて3DGSアバターを訓練する。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:59:58 GMT)
Robustly optimal dynamics for active matter reservoir computing [0.0] 本研究では,貯水池計算(RC)パラダイムにおける活性物質の情報処理能力について検討する。
我々はこれまで見過ごされてきたエージェント・ダイナミクスの並外れた動的状態を明らかにする。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:09:14 GMT)
Representing spherical tensors with scalar-based machine-learning models [0.0] 3次元点雲の同変モデルは、回転群の構造と完全に整合した方法で構造-固有関係を近似することができる。
対称性の制約により、このアプローチは計算的に要求され、実装が困難になる。
本稿では,普遍的な近似特性に欠ける汎用表現の近似法を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:45:28 GMT)
RepSNet: A Nucleus Instance Segmentation model based on Boundary Regression and Structural Re-parameterization [0.0] 核のインスタンスセグメンテーションは、デジタル病理解析と病理診断において重要なステップである。
本稿では、核境界回帰に基づくニューラルネットワークモデルRepSNetを設計する。
RepSNetは、様々なスケールの受容場から特徴を集約するだけでなく、モデル推論フェーズにおけるパラメータ量と計算負担を削減することができる。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:08:58 GMT)
Reducing the Resources Required by ADAPT-VQE Using Coupled Exchange Operators and Improved Subroutines [0.0] ハードウェア上でのADAPT-VQEを計測回数と回路深度で動作させるコストについて述べる。
私たちはまた、最先端のCEOであるADAPT-VQEがUnitary Coupled Cluster SinglesとDoubles ansatzを上回っていることにも気付きました。
論文参考訳(メタデータ) (Thu, 08 May 2025 21:09:04 GMT)
Reduced Basis Method for Driven-Dissipative Quantum Systems [0.0] 強相関量子系の位相図を、駆動散逸型マルコフ系に一般化することができることを示す。
その後の還元基底ベクトルの分散による蒸留により、熱力学極限における位相境界を示す最も顕著なパラメータ依存の非バイアスな探索が可能となる。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:53:23 GMT)
Quaternionic Reweighted Amplitude Flow for Phase Retrieval in Image Reconstruction [0.0] 準イオン信号処理は、カラー信号を効率的に管理するための強力なツールを提供する。
そこで我々は,振幅モデルに基づく新しいアルゴリズムを体系的に開発することで,準イオン位相探索問題に対処する。
提案手法は, 最先端手法と比較して, 回復性能と計算効率を著しく向上させる。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:26:55 GMT)
Quantum-network nodes with real-time noise mitigation using spectator qubits [0.0] 量子ネットワークは量子通信と分散量子計算を可能にする。
本稿では,リモート・エンタングルメント・シーケンスにおける量子状態の劣化を軽減するために,オブザーバの量子ビットとリアルタイム意思決定とフィードフォワードを組み合わせた手法を提案する。
以上の結果から、観測量子ビットはオーバーヘッドを最小化し、リソースを自然に提示することで、量子ネットワークメモリを改善することができることがわかった。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:24:32 GMT)
Quantum-Aware Network Planning and Integration [0.0] 同じ物理媒体上の古典的なトラフィックと量子信号が共存する必要性がある。
現在、ネットワークレベルでQKDを統合する取り組みが進行中である。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:41:34 GMT)
Quantum optical formulation of difference-frequency generation and optimal cloning of spatial modes [0.0] 光の空間モードを組み込んだ差周波発生(DFG)の量子光学的定式化を提案する。
古典的な光線に対して確立された結果を再現し、DFGと刺激された自発的なパラメトリックダウンコンバージョンの関係を確立する。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:32:38 GMT)
Quantum decoherence from complex saddle points [0.0] 量子デコヒーレンス(quantum decoherence)は、量子物理学を古典物理学にブリッジする効果である。
カルデイラ・レゲットモデルにおける第一原理計算について述べる。
モンテカルロ計算による一般モデルへのアプローチの展開についても論じる。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:40:53 GMT)
Prospects of Quantum Error Mitigation for Quantum Signal Processing [0.0] 本研究は量子信号処理(QSP)で設計されたハミルトンシミュレーションアルゴリズムにおけるゼロノイズ抽出(ZNE)の性能について検討する。
我々は、ZNEプロトコルがノイズのない予測値の近似を回復できるノイズと深さを定量化する。
サンプル予算が無制限であっても,ZNEが使用不可能な領域に関する数値的研究を簡潔に議論し,提示する。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:49:54 GMT)
Prompt-Based LLMs for Position Bias-Aware Reranking in Personalized Recommendations [0.0] 大規模言語モデル(LLM)は、プロンプトベースのレコメンデーションに採用されている。
LLMは、限られたコンテキストウィンドウサイズ、非効率なポイントワイドおよびペアワイドプロンプト、リストワイドランキングの扱いの難しさといった制限に直面している。
本稿では,従来のレコメンデーションモデルとLLMを組み合わせたハイブリッドフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:01:44 GMT)
Physics-informed solution reconstruction in elasticity and heat transfer using the explicit constraint force method [0.0] PINNに基づくアプローチは、解釈可能性、堅牢性、データの一貫性の3つの基本的な基準を満たすことができない可能性がある。
本稿では,制約によって導入された制約項を制御するための制約力法(ECFM)を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:19:11 GMT)
PRIMG : Efficient LLM-driven Test Generation Using Mutant Prioritization [0.0] PRIMG(Prioritization and Refinement Integrated Mutation-driven Generation)は、Solidityスマートコントラクトのためのインクリメンタルで適応的なテストケース生成のための新しいフレームワークである。
PRIMGは突然変異優先順位付けモジュールを統合し、ミュータント置換グラフに基づいてトレーニングされた機械学習モデルを用いて、生き残ったミュータントの有用性を予測する。
優先順位付けモジュールはランダムなミュータント選択を一貫して上回り、計算労力を削減したハイインパクトテストの生成を可能にした。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:30:22 GMT)
PINN-MEP: Continuous Neural Representations for Minimum-Energy Path Discovery in Molecular Systems [0.0] 物理インフォームドニューラルネットワーク(PINN)を用いた連続最適化問題として遷移経路生成を再構成する手法を提案する。
遷移経路を暗黙的な神経機能として表現することにより、高価な経路サンプリングを必要とせず、物理的に現実的な遷移経路の効率的な発見を可能にする。
ウシ膵トリプシンインヒビター(BPTI)を8,300個以上含む2種類のタンパク質に対して,本法の有効性を実証した。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:53:07 GMT)
Optimal Decoder for the Error Correcting Parity Code [0.0] パリティコードのための2ステップデコーダを提案し,その性能をコード容量と故障測定設定で評価する。
ノイズのない測定では、中間符号サイズに準最適復号を行いながら、復号問題を一連の繰り返し符号に還元できることが分かる。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:03:22 GMT)
Open quantum systems with particle and bath driven by time-dependent fields [0.0] 外部時間依存場によって駆動される媒体(環境)と相互作用するタグ付き粒子の量子力学について検討する。
対応する量子ランゲヴィン方程式を導出し、外場が明示的な役割を果たすような変分散逸関係に従う。
駆動系に対するこの一般化された量子ゆらぎ-散逸関係は、量子光学における量子ノイズから、閉じ込められたイオンを持つ量子コンピューティングまで、他の応用も見つけることができる。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:34:24 GMT)
Numerical modeling for trapped-ion thermometry using dark resonances [0.0] 熱運動を受けるイオンのスペクトルを数値シミュレーションするために, 簡易な動的方程式を用いたいくつかの手法について議論した。
本研究は, 温度推定において, 熱的運動の効果を付加的に模倣することは, 計算上非常に便利であるが, 重大な誤差を生じさせる可能性があることを観察する。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:19:12 GMT)
Non-Markovianity in collision models with initial intra-environment correlations [0.0] 衝突モデル(CM)は、環境の要素と連続して相互作用するオープンシステムを記述する。
本研究では,アンシラとアンシラの絡み合いが開系の非マルコビアン性を制御するメカニズムとしてどのように機能するかを検討する。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:22:42 GMT)
Neural Pathways to Program Success: Hopfield Networks for PERT Analysis [0.0] 本稿では,ホップフィールドニューラルネットワークアーキテクチャにおけるエネルギー最小化問題として,PERTスケジューリングの新たな定式化を提案する。
最大1000タスクからなる合成プロジェクトネットワーク上の数値シミュレーションは、このアプローチの可能性を実証している。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:34:16 GMT)
Multipartite continuous-variable quantum nondemolition interaction and entanglement certification and monitoring [0.0] 量子非退化相互作用の概念を、信号とプローブ系がそれぞれ1つの多部連続変数系である場合に拡張する。
具体的には、信号とプローブモード間のビーム・スプリッタ結合に依存する多部QND相互作用を行う一般的なスキームを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:01:50 GMT)
Multimodal Emotion Coupling via Speech-to-Facial and Bodily Gestures in Dyadic Interaction [0.0] 人間の感情表現は、協調した声、顔、およびジェスチャーの信号を通して現れる。
感情表現型音声と局所的な顔と手の動きを結びつけるより広いダイナミクスは、実際の相互作用において、感情的および行動的手がかりがどのようにコミュニケーションされるかについて深い洞察を得る上で、依然として不可欠である。
本研究では,IEMOCAPコーパスにおけるダイアディック相互作用からの領域特異的モーションキャプチャを用いたマルチモーダル感情結合について検討した。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:55:54 GMT)
Modular Debiasing: A Robust Method for Quantum Randomness Extraction [0.0] 本稿では,任意のランダムソースに適用可能な新しいモジュラーデバイアス手法を提案する。
確率生成関数とユニタリの根を利用する厳密な理論的枠組みを提供する。
この研究は、量子情報科学の分野に貴重なツールを提供する。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:42:34 GMT)
Mix-QSAM: Mixed-Precision Quantization of the Segment Anything Model [0.0] Mix-QSAMはSegment Anything Model(SAM)のためのPTQフレームワークである。
モデル出力に対する各レイヤの寄与を定量化するために,Kulback-Leibler (KL) 偏差を用いて導出したレイヤ単位の重要度スコアを導入する。
また、隣接層間の依存関係を捉えるために、因果的相互情報に基づく新しい計量である層間相乗法を導入する。
論文参考訳(メタデータ) (Thu, 08 May 2025 00:08:31 GMT)
Meson thermalization with a hot medium in the open Schwinger model [0.0] シュウィンガーボソンや電気フラックスストリングのような熱媒質中におけるメソニック粒子の熱化ダイナミクスについて検討した。
以上の結果から, 温熱化時間は, 環境からの強い散逸とともに増加することが明らかとなった。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:30:22 GMT)
Machine learning automorphic forms for black holes [0.0] 機械学習は、乱れた拡張からモジュラーウェイトを正確に予測できることを示す。
本研究は,重力系におけるモジュラー対称性の観点でデータがどのように組織化されているかを明らかにするために,機械学習を用いた概念実証を確立する。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:00:00 GMT)
MARK: Memory Augmented Refinement of Knowledge [0.0] 大規模言語モデル(LLM)は、専門的なタスクを支援するが、コストのかかる微調整なしに、ドメイン知識の進化と整合するのに苦労する。
我々の Memory-Augmented Refinement of Knowledge (MARK) フレームワークにより、LLM は再トレーニングなしに継続的に学習できる。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:28:00 GMT)
Local linear Fréchet curve regression in manifolds [0.0] 本稿では,Fr'echet条件の平均の局所線形近似を外生的,内生的に解く。
固有局所線型Fr'echet関数予測器の計算には重み付きFr'echet平均アプローチが採用されている。
具体的には、NASAのMAGSAT衛星の時変する地軸緯度と経度から磁場を機能的に予測する。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:06:59 GMT)
Leveraging Large Language Models for enzymatic reaction prediction and characterization [0.0] 大規模言語モデル(LLM)を3つの中核的生化学的タスクで体系的に評価する。
単一タスクとマルチタスクの学習戦略を比較し,LoRAアダプタを用いたパラメータ効率の高い微調整手法を提案する。
以上の結果から, 微調整LDMは生化学的知識を捉えることができ, マルチタスク学習は前方・後生合成予測を促進させることがわかった。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:53:53 GMT)
Learning functions of Hamiltonians with Hamiltonian Fourier features [0.0] 本稿では、量子コンピュータにとって確実に容易であり、古典的コンピュータにとって間違いなく困難である量子機械学習タスクを提案する。
このタスクは、$mathrmTr[f(H)rho]$という形の量の予測を伴う。
最大40キュービットの超伝導デバイス上でタスクを実行する。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:06:53 GMT)
Learning from Similarity Proportion Loss for Classifying Skeletal Muscle Recovery Stages [0.0] 本稿では,2つのバッグの組み合わせから得られる類似度比の損失を利用した,類似度分布からの正規スケール学習(OSLSP)を提案する。
骨格筋の回復段階の分類作業において,OSLSPを用いたモデルは,大規模な事前訓練および微調整モデルよりも優れていた。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:45:01 GMT)
Learning dynamically inspired invariant subspaces for Koopman and transfer operator approximation [0.0] TransferとKoopman演算子は、線形変換を通じて複雑な非線形力学系を表現するためのフレームワークを提供する。
一般作用素のレンズと表現学習によりこの問題に取り組み、効率的な有限次元表現を用いてこれらの線形作用素を近似する。
具体的には,システムに動的に適合する,機械学習の正規直交型,局所的にサポートされた基底関数について述べる。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:32:39 GMT)
Learning Algorithms Made Simple [0.0] 人工知能(AI)、機械学習(ML)、ディープラーニング(DL)、ハイブリッドモデルの主な概念についてレビューする。
本稿では,学習アルゴリズムの概要と現状,応用,今後の方向性について概説する。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:38:13 GMT)
Large Language Models Understanding: an Inherent Ambiguity Barrier [0.0] 世界を理解する能力に関して、LLM(Large Language Models)の出現以来、活発に議論が続いている。
議論と反論は、思考実験、LLMと人間との逸話会話、統計的言語分析、哲学的考察などに基づいて提案されている。
本稿では, 思考実験と半形式的考察に基づいて, 内在的あいまいさの障壁に繋がる反論を提示する。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:52:25 GMT)
Isotope-selective Ion Trapping via Sympathetic Cooling using a Surface-Electrode Trap with a Hole for Collimated Atomic Loading [0.0] 正方形孔を有する表面電極イオントラップを, 原子負荷に40, mathrmmu m$で開発した。
原子オーブンを用いたカルシウム同位体イオンの選択的トラップ法を実験的に実証した。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:12:43 GMT)
Is there a half-life for the success rates of AI agents? [0.0] 長時間のタスクにおけるAIエージェントのパフォーマンスは、人間がタスクを行うのに要する毎分、一定の割合で失敗する率によって説明できることを示す。
これは、タスクの長さが指数関数的に減少し、各エージェントがそれぞれのハーフライフによって特徴づけられることを意味する。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:31:03 GMT)
Interactive Diabetes Risk Prediction Using Explainable Machine Learning: A Dash-Based Approach with SHAP, LIME, and Comorbidity Insights [0.0] この研究は、ロジスティック回帰、ランダムフォレスト、XGBoost、LightGBM、KNN、ニューラルネットワークなどのモデルを評価する。
DashベースのUIは、モデル予測、パーソナライズされた提案、機能洞察とのユーザフレンドリなインタラクションを可能にする。
論文参考訳(メタデータ) (Thu, 08 May 2025 22:57:21 GMT)
Integrability and Chaos via fractal analysis of Spectral Form Factors: Gaussian approximations and exact results [0.0] 量子カオスの開始と、量子多体系のスクランブルを同定する。
我々は,Bethe Ansatz 歩行者が非可積分歩行者と同様のカテゴリーに陥ることを数値的に示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:56:06 GMT)
Influence of vibrational motion and temperature on interatomic Coulombic electron capture [0.0] 原子間電子捕獲プロセスの解析モデルに振動運動を組み込む。
ICECは環境によって媒介されるプロセスであり、自由電子が余剰エネルギーを隣人に伝達することで種に付着する。
原子運動の説明はまた、電子スペクトルの拡大を記述し、温度依存断面積の評価を可能にする。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:02:08 GMT)
Improved subsample-and-aggregate via the private modified winsorized mean [0.0] 修正されたWinsorized平均は、いくつかの大きな分布のクラスに対して最小限最適であることを示す。
我々は、修正されたウィンソル化平均をサブサンプル・アンド・アグリゲートのアグリゲータとみなす。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:46:29 GMT)
High-fidelity Grain Growth Modeling: Leveraging Deep Learning for Fast Computations [0.0] 我々は、進化的長期記憶ネットワークとオートエンコーダを組み合わせた機械学習フレームワークを導入し、穀物成長の進化を効率的に予測する。
その結果,我々の機械学習手法は,粒成長予測を最大 SI89 時間高速化することを示した。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:43:40 GMT)
Harmonizing de Broglie-Bohm's Causal Interpretation with the Copenhagen Interpretation of Quantum Mechanics [0.0] 非相対論的量子論は、デ・ブログリ、デビッド・ボームらによって因果的に解釈されている。
非線形非エルミート作用素は、デ・ブロイ=ボームの量子論の解釈に暗黙的に埋め込まれていることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:08:59 GMT)
Graph-Based Adversarial Domain Generalization with Anatomical Correlation Knowledge for Cross-User Human Activity Recognition [0.0] センサベースのヒューマンアクティビティ認識システムでは,ユーザ間の多様性が大きな課題となっている。
GNN-ADG(Graph Neural Network with Adversarial Domain Generalization)を提案する。
GNN-ADGは、異なる解剖学的身体部位のセンサー間の空間的関係をモデル化する。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:19:04 GMT)
Geometric measures of CHSH quantum nonlocality: characterization, quantification, and comparison by distances and operations [0.0] ヒルベルト空間におけるベル非局所性の研究のための幾何学的枠組みを導入する。
局所状態の集合から与えられた量子状態の距離に基づいて非局所性の測度を定義する。
2ビット系におけるクレーター・ホーネ・シモニー・ホルトの不等式を専門とする。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:42:20 GMT)
Genetic AI: Evolutionary Games for ab initio dynamic Multi-Objective Optimization [0.0] 遺伝的AIは、外部パラメータや事前定義された重みのない、多目的最適化のための新しい方法である。
支配、アルトゥル主義、バランス、利己主義の4つの進化戦略を提示する。
2つの決定問題に対するアプローチの普遍性を示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:13:52 GMT)
Generating Reliable Synthetic Clinical Trial Data: The Role of Hyperparameter Optimization and Domain Constraints [0.0] 本研究は,8つの生成モデルにまたがる4つのHPO戦略を系統的に評価する。
以上の結果から,HPOはTVAE,CTGAN,CTAB-GAN+をそれぞれ60%,39%,38%改善した。
HPOだけでは、すべてのモデルが基本的な生存制限に違反しているため、臨床的に有効な合成データを保証するには不十分である。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:51:36 GMT)
General Transform: A Unified Framework for Adaptive Transform to Enhance Representations [0.0] General Transform (GT) は、機械学習アプリケーション用に設計された適応型変換ベースの表現である。
GTは、データセットと関心のタスクに合わせて、データ駆動マッピングを学ぶ。
GTを組み込んだモデルは、コンピュータビジョンや自然言語処理タスクにまたがる従来の変換ベースのアプローチより優れている。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:01:11 GMT)
General Hamiltonian description of nonreciprocal interactions [0.0] 膨大な数の系において、相互作用はポテンシャルに起因せず、一般には非相互性である。
ここでは、補助的な自由度を含むハミルトニアンを構成することによって、これらの制限を克服する。
拘束ハミルトニアンに基づくグラウバー力学は、元のランゲヴィン力学の定常状態を再現することを示した。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:45:31 GMT)
Gap-preserving reductions and RE-completeness of independent set games [0.0] 量子設定において、マルチプロデューサの対話的証明システムは非局所ゲームにおけるギャップ付き約束問題に対応する。
本稿では,量子環境におけるギャップ保存化の研究フレームワークを提案する。
MIP$*$-completeness of the gaped promise problem for the natural class of independent set games。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:58:52 GMT)
Fundamental Limitations in Sample-Based Quantum Diagonalization Methods [0.0] 本稿では,QSCI法が化学における実用性を著しく阻害する限界に直面していることを示す。
QSCIは原則として、高品質なCI拡張を実現することができるが、新しい決定因子を見つけるのに非効率に苦しむことを実証する。
これはQSCIがより効率的で古典的な応用に遅れているため、量子化学の応用において有用性を妨げている。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:52:39 GMT)
From the Bloch equation to a thermodynamically consistent master equation [0.0] 我々は厳密なエネルギー保存の単一の制約の下で、リンドブラッドマスター方程式の数学的に等価な形式を示す。
Bloch'の方程式は系の力学をその要素的部分に分離し、熱混合、脱落、エネルギー緩和を明確に区別する。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:29:47 GMT)
Free Discontinuity Regression: With an Application to the Economic Effects of Internet Shutdowns [0.0] 完全非圧縮推定器であるFree Discontinuity Regression (FDR)を紹介する。
回帰面を滑らかにし、連続した領域に分割し、ジャンプの正確な位置と大きさを確実に回収する。
インドのインターネット閉鎖にFDRを適用すると、推定された閉鎖境界周辺の経済活動が25~35%減少することが明らかになった。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:35:12 GMT)
Field energy and angular momentum in spontaneous emission: A Schrödinger-picture approach [0.0] シュル「オーディンガー・ピクチャー」アプローチは、自発的に放出される原子によって放射される磁場エネルギーと角運動量を計算するために用いられる。
WWAの一貫した応用は、すべての時間において有限である体におけるエネルギーと角運動量の両方の表現をもたらすことが示されている。
論文参考訳(メタデータ) (Thu, 08 May 2025 14:03:51 GMT)
Facets of Disparate Impact: Evaluating Legally Consistent Bias in Machine Learning [0.0] 現行の法的な基準を用いて、限界的な利益と客観的なテストのレンズを通してバイアスを定義します。
この指標は客観的テストの文脈的ニュアンスとメートル法的安定性を組み合わせ、法的に一貫した信頼性のある尺度を提供する。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:58:49 GMT)
Exponential Improvement on Asian Option Pricing Through Quantum Preconditioning Methods [0.0] アジアオプションの価格設定に使用される微分方程式を解くために設計された量子アルゴリズムを提案する。
提案手法は,アジアのオプション価格の問題に対して,既存の量子プレコンディショニング手法を改良したものである。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:46:42 GMT)
Error Analysis of Deep PDE Solvers for Option Pricing [0.0] ディープラーニングベースのPDEソルバは、この問題に対する迅速な解決策として最近登場した。
本研究の目的は,深層PDEソルバの実用的オプション価格設定実装における有効性に関する実用的な洞察を提供することである。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:45:59 GMT)
Ergodiscord: An Operational and Distinct Notion of Quantumness of Correlations [0.0] 本稿では,多部量子状態における相関関係の量子性を探究する枠組みを提案する。
エルゴディコード(ergodiscord)と呼ばれる非古典性の演算量化器を導入する。
混合非古典状態は、対応する系の最大絡み合う状態よりも多くの作業をロックできることが示される。
論文参考訳(メタデータ) (Thu, 08 May 2025 12:09:17 GMT)
Enigme: Generative Text Puzzles for Evaluating Reasoning in Language Models [0.0] トランスフォーマー・デコーダ言語モデルは、テキストベースの生成人工知能における中核的な革新である。
本稿では,学習や推論のスキル評価に使用されるテキストベースのパズルを生成するためのオープンソースライブラリであるenigmeを紹介する。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:09:57 GMT)
Enhancing the Dynamic Range of Quantum Sensing via Quantum Circuit Learning [0.0] 典型的な量子センシングプロトコルでは、キュービットは外部磁場と相互作用し、測定された可観測物の期待値を分析して場の振幅を推定する。
高量子密度では、量子ビット間相互作用は複雑な多体ダイナミクスを誘発し、観測可能な値の期待値に複数の振動をもたらす。
本稿では,量子回路学習フレームワークを用いて量子力学の限界を克服する手法を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:40:26 GMT)
Enhancing Text2Cypher with Schema Filtering [0.0] Cypherはグラフデータベースのための強力なクエリ言語である。
近年の大規模言語モデルの進歩により、自然言語の質問をCypherクエリ - Text2Cypherに翻訳できるようになった。
本研究では、Text2Cypherタスクのさまざまなスキーマフィルタリング方法を検討し、トークンの長さ、パフォーマンス、コストへの影響を分析する。
論文参考訳(メタデータ) (Thu, 08 May 2025 10:42:20 GMT)
Enhancing Large Language Models with Faster Code Preprocessing for Vulnerability Detection [0.0] 既存のSCoPEフレームワーク上に構築し、パフォーマンスを改善した拡張バージョンであるSCoPE2を導入します。
SCoPE2による処理時間を97.3%削減し,脆弱性検出のためのLarge Language Model(LLM)のF1スコアを改良した。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:00:11 GMT)
English Please: Evaluating Machine Translation with Large Language Models for Multilingual Bug Reports [0.0] 本研究は,バグ報告における機械翻訳(MT)性能の総合評価としては初めてである。
私たちは、DeepL、AWS Translate、ChatGPT、Claude、Gemini、LLaMA、Mistralといった大規模言語モデルの性能を分析します。
我々は, BLEU, BERTScore, COMET, METEOR, ROUGE-Allongsideの分類指標(精度, 精度, リコール, F1スコア)を含むMT評価指標を多用する。
論文参考訳(メタデータ) (Thu, 08 May 2025 20:15:53 GMT)
Efficient computation of topological order [0.0] 量子多体系におけるトポロジカル秩序の検出の計算的側面を解析する。
前者のシステムサイズと後者のスケーリングで指数的スケーリングが見られます。
我々の戦略は、平衡から高次元やシステムに容易に一般化できる。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:16:15 GMT)
Efficient calculation of Green's functions on quantum computers via simultaneous circuit perturbation [0.0] 本稿では,量子コンピュータ上でのRetarded Green's Function(RGF)を計算するための,新しいアンシラフリーアルゴリズムを提案する。
1次元ハイゼンベルクモデルとフェルミ・ハッバードモデルでこのプロトコルをベンチマークする。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:00:03 GMT)
Domain-Adversarial Anatomical Graph Networks for Cross-User Human Activity Recognition [0.0] 人間活動認識(HAR)におけるユーザ間の多様性は、センサー配置、身体動態、行動パターンの違いにより、依然として重要な課題である。
本稿では、解剖学的相関知識を統一的なグラフニューラルネットワークアーキテクチャに統合するエッジ強化グラフベース逆数領域一般化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 02:30:55 GMT)
Does CLIP perceive art the same way we do? [0.0] 絵画から高レベルの意味情報や文体情報を抽出するCLIPの能力について検討する。
以上の結果から,CLIPの視覚的表現の長所と短所が明らかとなった。
我々の研究は、マルチモーダルシステムにおけるより深い解釈可能性の必要性を強調している。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:21:10 GMT)
Divide (Text) and Conquer (Sentiment): Improved Sentiment Classification by Constituent Conflict Resolution [0.0] 本研究の目的は、対立する感情を分離し、それらの感情を効果的に予測するための新しい手法を導入することである。
集約戦略の1つは、Amazon、Twitter、SSTなど、さまざまなデータセットでベースラインモデルを上回る、Multi-Layer Perceptron(MLP)モデルである。
論文参考訳(メタデータ) (Thu, 08 May 2025 21:54:49 GMT)
Discrete time crystal for periodic-field sensing with quantum-enhanced precision [0.0] 本研究では、障害のない離散時間結晶プローブが、周期場を検知する最終的な達成可能な精度に達することを示す。
光学格子における超低温原子におけるプロトコルの実装を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 06:53:39 GMT)
DejAIvu: Identifying and Explaining AI Art on the Web in Real-Time with Saliency Maps [0.0] DejAIvuは、リアルタイムAI生成画像検出と唾液度に基づく説明性を組み合わせたChrome Webエクステンションである。
当社のアプローチでは、効率的なブラウザ内推論、勾配に基づく唾液度分析、シームレスなユーザエクスペリエンスを統合し、AI検出が透過的かつ解釈可能であることを保証しています。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:42:55 GMT)
Deep Unrolled Meta-Learning for Multi-Coil and Multi-Modality MRI with Adaptive Optimization [0.0] 核磁気共鳴イメージング(MRI)のための統合型深層メタラーニングフレームワークを提案する。
マルチコイル再構成とクロスモダリティ合成を共同で行う。
その結果,従来の教師あり学習よりもPSNRが大幅に向上した。
論文参考訳(メタデータ) (Thu, 08 May 2025 04:47:12 GMT)
Conversational Process Model Redesign [0.0] プロセスモデルの作成と再設計において、ドメインエキスパートに大きな言語モデル(LLM)を使用することの実現可能性について検討する。
提案した対話型プロセスモデル再設計(CPD)アプローチは,自然言語によるプロセスモデルとユーザによる再設計要求を入力として受信する。
文献からのパターンがLCMによっていかにうまく扱えるかを確認するため,我々はCPDアプローチの実現可能性を確認するために,広範囲な評価を行った。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:44:45 GMT)
CodeMixBench: Evaluating Large Language Models on Code Generation with Code-Mixed Prompts [0.0] 我々は,コード混合プロンプトからコードを生成する上で,大規模言語モデル(LLM)の堅牢性を評価するための新しいベンチマークであるCodeMixBenchを紹介する。
1.5Bパラメータから15Bパラメータまで,さまざまなオープンソースコード生成モデルを包括的に評価した。
その結果、コード混合プロンプトは、英語のみのプロンプトに比べて、常にPass@1のパフォーマンスを低下させることがわかった。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:55:32 GMT)
ChemRxivQuest: A Curated Chemistry Question-Answer Database Extracted from ChemRxiv Preprints [0.0] ChemRxivQuestは、17のサブフィールドにわたる155のChemRxivプリプリントから、高品質なQA(QA)ペア970のキュレートされたデータセットである。
各QAペアは、トレーサビリティとコンテキスト精度を確保するために、ソーステキストセグメントに明示的にリンクされている。
ChemRxivQuestは光学文字認識(OCR)、GPT-4oベースのQA生成とファジィマッチング技術を組み合わせた自動パイプラインを用いて構築された。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:26:33 GMT)
Casimir Forces Across Magnetic Plasmas at Nuclear Separations [0.0] 核スケールでのゼロ温度カシミール効果は、磁気電子-陽電子プラズマを誘導するために必要な黒体温度を生成することができる。
プラズマとあらゆる磁場の磁気透過性は、完全な導電面間の遮蔽されたカシミール-湯川電位に影響を与える。
論文参考訳(メタデータ) (Thu, 08 May 2025 13:14:29 GMT)
CART-ELC: Oblique Decision Tree Induction via Exhaustive Search [0.0] 斜めの分割を見つけるために徹底的な探索に依存する手法は、計算上の課題に直面している。
斜め決定木を誘導する新しいアルゴリズム, 分類・回帰木-排他線形結合(CART-ELC)を導入する。
以上の結果から,CART-ELCは小データセット上での競合性能を一貫して達成できることが示唆された。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:42:13 GMT)
CAG-VLM: Fine-Tuning of a Large-Scale Model to Recognize Angiographic Images for Next-Generation Diagnostic Systems [0.0] 本稿では,2段階の医師培養パイプラインとバイリンガル(日本語/英語)CAG画像レポートデータセットを紹介する。
539の試験から14,686のフレームをサンプリングし、キーフレームの検出と左右のラテラルに注釈を付ける。
我々はCNNを243の独立した試験に適用し,1,114のキーフレームを抽出し,その前処理レポートと専門家公認診断・治療概要とを組み合わせた。
論文参考訳(メタデータ) (Thu, 08 May 2025 05:44:52 GMT)
Bridging Classical and Quantum Information Scrambling with the Operator Entanglement Spectrum [0.0] 演算子絡み合いスペクトルにより,オートマトン力学と完全量子力学の差が明らかになる。
一定数の重畳生成ゲートは、演算子ダイナミクスをランダム回路クラスに駆動するのに十分である。
これは作用素絡み合いスペクトルを量子力学のカオス性と普遍性クラスを探索するための有用なツールとして確立する。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:12:18 GMT)
Benchmarking Vision, Language, & Action Models in Procedurally Generated, Open Ended Action Environments [0.0] 視覚言語アクション(VLA)モデルは汎用ロボットシステムに向けた重要なステップである。
我々は,最先端VLMモデルとVLAモデルの一般化性能の評価と解析を目的としたベンチマークであるMultiNet v0.2を紹介する。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:51:36 GMT)
Belief Filtering for Epistemic Control in Linguistic State Space [0.0] 信念フィルタは言語的断片に対する内容認識の操作として機能する。
この研究は、エージェントの内部意味空間における構造化された介入を通じて、AIの安全性と整合性を高める可能性を強調している。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:52:43 GMT)
Asymmetric decay of quantum many-body scars in XYZ quantum spin chains [0.0] 量子多体傷はカオス量子多体系の非定型エネルギー固有状態である。
スカーは、高励起で非絡み合った積状態の固有状態の無限族として現れる。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:23:34 GMT)
Ancilla-Assisted Process Tomography with Bipartiete Mixed Separable States [0.0] アシラ支援プロセス断層撮影(AAPT)の厳格な要件は, システムとアシラリー状態の絡み合いではないことが示されている。
我々は、ある状態が量子過程に関する完全な情報を抽出できるならば、その状態は忠実である、という操作的定義を採っている。
本研究では, 条件数に特徴付けられるプロセスの平均誤差を推定し, 忠実であることが保証される2量子状態を構築する方法を提案する。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:00:23 GMT)
An analytical exploration of the optomechanical attractor diagram and of limit cycles [0.0] 光学キャビティシステムにおける機械的圧力と放射圧の相互作用を分析する。
我々の研究は、ベッセルズが関わった評価に基づいており、これは以前、いわゆるアトラクタ図の探索に繋がった。
論文参考訳(メタデータ) (Thu, 08 May 2025 15:41:35 GMT)
An Agent-Based Modeling Approach to Free-Text Keyboard Dynamics for Continuous Authentication [0.0] フリーテキストキーボードのダイナミクスを活用する継続的認証システムは、多要素認証設定において有望なセキュリティ層を提供する。
本研究では, エージェントベースモデル(ABM)を用いて, メカニカルキーボードおよび膜キーボード間の多様なタイピングプロファイルをシミュレートし, 行動バイオメトリックスの有効性について検討した。
論文参考訳(メタデータ) (Thu, 08 May 2025 07:42:05 GMT)
Algorithmic Tradeoffs in Fair Lending: Profitability, Compliance, and Long-Term Impact [0.0] 公平な介入が利益率とデフォルトレートにどのように影響するかを定量化します。
我々は、公正貸付が利益を得る特定の経済状況を特定する。
これらの知見は、倫理的配慮とビジネス目的とのバランスをとる貸付アルゴリズムを設計するための実践的なガイダンスを提供する。
論文参考訳(メタデータ) (Thu, 08 May 2025 19:18:33 GMT)
Advanced 3D Imaging Approach to TSV/TGV Metrology and Inspection Using Only Optical Microscopy [0.0] 本稿では, ハイブリッドフィールド顕微鏡と光度ステレオを組み合わせた, シリコンおよびガラスの検査による革新的アプローチを提案する。
提案手法は,高い精度と再現性を維持しつつ,コスト効率の向上を実現する。
論文参考訳(メタデータ) (Thu, 08 May 2025 03:09:27 GMT)
Acceleration-induced radiation from a qudit particle detector model [0.0] 放射率は、検出器の初期状態に依存する因子に乗じてラーモアの公式と書くことができる。
ラーモアの公式の出現は古典的な現象を示唆するかもしれないが、結果として生じる放射は構造のない古典的な情報源と根本的に異なると論じる。
論文参考訳(メタデータ) (Thu, 08 May 2025 01:36:32 GMT)
AI-Driven Scholarly Peer Review via Persistent Workflow Prompting, Meta-Prompting, and Meta-Reasoning [0.0] 本稿では,PWP(Persistent Prompting)について紹介する。
本稿では,実験化学原稿の批判的分析のための概念実証PWPプロンプトを提案する。
我々は,このPWPプロンプトを,専門家レビューの体系化を目的としたメタプロンプト技術とメタ推論の反復的適用により開発する。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:27:45 GMT)
AI Approaches to Qualitative and Quantitative News Analytics on NATO Unity [0.0] 本稿では、NATOの感情の質的および定量的分析に、検索強化世代(RAG)を用いたGPTモデルを適用することを検討する。
GPT-4.1モデルを用いたRAG手法をNATO関連トピックが議論されたニュースの分析に応用した。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:42:01 GMT)
A short review on qudit quantum machine learning [0.0] マルチレベル量子システム(qudits)は、バイナリ量子ビットパラダイムに代わる有望な代替手段を提供する。
本稿では,主に変分量子アルゴリズムや量子ニューラルネットワークなど,量子機械学習技術における量子ビットの役割について概説する。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:54:06 GMT)
A nonlinear elasticity model in computer vision [0.0] 本稿では,著者らが2つの画像を比較するために導入した非線形弾性モデルについて解析する。
アフィン写像に関連付けられた画像については、積分は変換の行列式に依存する必要があることが示されている。
論文参考訳(メタデータ) (Thu, 08 May 2025 08:08:28 GMT)
A new time-dependent quantum theory based on Tsallis' distribution [0.0] 逆ウィック回転 $beta rightarrow i t$ をツァリス変形ボルツマン因子に適用する。
我々は、新しい時間依存の$q$-deformed Schr"odinger方程式を得る。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:07:50 GMT)
A critical assessment of reinforcement learning methods for microswimmer navigation in complex flows [0.0] 搭載されたセンサーからのみアクセス可能な情報を用いて流体の流れを移動させることは、小さなプランクトン生物が直面する問題である。
過去10年間、流体力学のコミュニティは、しばしば最も単純な実装の形で強化学習を広く採用してきた。
しかし、これらのアルゴリズムが学習した戦略がどの程度優れているかは不明だ。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:17:26 GMT)
A Solovay-Kitaev theorem for quantum signal processing [0.0] ソロワ・キタエフの定理 (Solovay-Kitaev theorem, SKT) は、ゲート集合の普遍性と他のゲートを効率的に近似する能力の間の同値性を確立する。
本研究は「QSPのためのSKT」を証明し、関数のクラスにおけるパラメータ化回路アンゼの密度は、所望の関数を近似するショート回路の存在を示唆していることを示す。
論文参考訳(メタデータ) (Thu, 08 May 2025 17:58:07 GMT)
A Pain Assessment Framework based on multimodal data and Deep Machine Learning methods [0.0] この論文は、まず、臨床理論の観点から痛み評価プロセスを研究することを目的としている。
この基礎の上に構築されているこのPh.D.プロジェクトの主目的は、自動痛み評価のための革新的な計算手法を開発することである。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:32:55 GMT)
A Multi-Scale Quantum Framework for Evaluating Metal-Organic Frameworks in Carbon Capture [0.0] 金属有機フレームワーク(MOF)は、直接捕獲するためにtextCO_2$を選択的に吸収することにより、地球温暖化の影響を緩和するための有望な材料である。
正確な量子化学シミュレーションは、最適なMOF構造を選択し設計するのに有用なツールである。
大規模なデータセットにシミュレーションを適用するには、効率的なシミュレーション方法が必要である。
論文参考訳(メタデータ) (Thu, 08 May 2025 09:11:53 GMT)
A Minimal Introduction to Quantum Computing [0.0] 本稿では,プログラマや機械学習技術者,データサイエンティストなど,コンピュータプロフェッショナルに適した量子コンピューティングの紹介を紹介する。
我々のアプローチは、QCの基礎となる物理を抽象化し、チューリングマシンのような計算モデルとしてフレーム化する。
基礎状態、量子ゲート、テンソル積などの基本的な概念を導入し、量子計算の構成要素がどのように形成されるかを説明する。
論文参考訳(メタデータ) (Thu, 08 May 2025 11:35:55 GMT)
A Common Interface for Automatic Differentiation [0.0] Juliaは多数の自動微分(AD)バックエンドに共通している。
その内蔵された準備メカニズムは、各バックエンドの強みを活用して、ワンタイム計算を償却する。
これは、ユーザーに余分な負担をかけることなく、スパーシティハンドリングのような洗練された機能を実現するための鍵である。
論文参考訳(メタデータ) (Thu, 08 May 2025 16:55:14 GMT)
A Circuit-QED Lattice System with Flexible Connectivity and Gapped Flat Bands for Photon-Mediated Spin Models [0.0] 非自明なバンド構造と複数のトランペット量子ビットを持つ準1次元CPW格子を備えた最初のデバイスを提案する。
この装置は、1つまたは2つのユークリッド次元のキュービットを持つCPW格子を実現するのに必要なツールキットを完成させる。
論文参考訳(メタデータ) (Thu, 08 May 2025 18:00:02 GMT)