Transformers Boost the Performance of Decision Trees on Tabular Data across Sample Sizes [137.3] 本稿では,大規模言語モデルと勾配ブースト決定木を融合させる,シンプルで軽量な手法を提案する。
融合法を LLM-Boost と PFN-Boost と命名した。
多数のベースラインとアンサンブルアルゴリズムに対して最先端の性能を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:30:41 GMT)
Getting More Juice Out of Your Data: Hard Pair Refinement Enhances Visual-Language Models Without Extra Data [122.3] コントラスト言語-画像事前学習 (CLIP) は, クロスモーダルな画像-テキスト表現学習の標準となっている。
HELIPは、CLIPモデルを改善するためのコスト効率のよい戦略であり、継続的なトレーニングにおいて既存のデータセット内の挑戦的なテキストイメージペアを利用することで、CLIPモデルを改善する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:54:38 GMT)
InterLCM: Low-Quality Images as Intermediate States of Latent Consistency Models for Effective Blind Face Restoration [106.7] 拡散前駆体は、低画質画像の復元のために、復元データセットの微細調整拡散モデル(DM)によってブラインドフェイス復元(BFR)に使用されている。
我々は,その優れたセマンティック一貫性と効率のために潜在一貫性モデル(LCM)を活用するために,InterLCMを提案する。
InterLCMは、合成データセットと実世界のデータセットの両方において既存のアプローチより優れており、推論速度も高速である。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:51:20 GMT)
SimBEV: A Synthetic Multi-Task Multi-Sensor Driving Data Generation Tool and Dataset [101.5] 近年,自律運転に対するBEV(Bird's-eye view)の認識が注目されている。
我々は,複数の情報源からの情報を組み込んだ合成データ生成ツールであるSimBEVを紹介した。
我々はSimBEVデータセットを作成するためにSimBEVを使用します。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 00:00:06 GMT)
Mosaic3D: Foundation Dataset and Model for Open-Vocabulary 3D Segmentation [92.2] 我々は、新しいデータ生成パイプラインとトレーニングフレームワークを導入することで、オープンな3Dシーン理解に取り組む。
本手法は, 正確な3次元領域分割, 包括的テキスト記述, 十分なデータセットスケールの3つの重要な要件に対処する。
このパイプラインを複数の3Dシーンデータセットに適用すると、Mosaic3D-5.6Mが生成される。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:18:50 GMT)
GaussNav: Gaussian Splatting for Visual Navigation [92.1] インスタンスイメージゴールナビゲーション(IIN)では、エージェントが探索されていない環境で、目標画像に描かれた特定のオブジェクトを見つける必要がある。
視覚ナビゲーションのためのガウススティング(GaussNav)であるIINの新しいフレームワークを提案し、3次元ガウススティング(DGS)に基づく新しい地図表現を構築した。
当社のGaussNavフレームワークは,Habitat-Matterport 3D(HM3D)データセットにおいて,SPL(Path Length)によるSuccessの重み付けを0.347から0.578に増加させ,大幅なパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:50:04 GMT)
Evaluating the Robustness of the "Ensemble Everything Everywhere" Defense [90.7] あらゆるものをアンサンブルすることは、敵の例に対する防御である。
この防御は敵の攻撃に対して堅牢ではないことを示す。
次に、標準的なアダプティブアタック技術を用いて、防御の堅牢な精度を低下させる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:30:13 GMT)
QLASS: Boosting Language Agent Inference via Q-Guided Stepwise Search [90.0] 提案するQLASS(Q-guided Language Agent Stepwise Search)は,Q-valueを推定してアノテーションを自動的に生成する。
ステップワイズガイダンスにより、言語エージェントが長期的価値に適応できるようにQ誘導型生成戦略を提案する。
我々はQLASSが質的分析によってより効果的な意思決定につながることを実証的に実証した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:58:31 GMT)
Field Matching: an Electrostatic Paradigm to Generate and Transfer Data [88.1] 本研究では, 静電場マッチング(EFM)を提案する。
私たちのアプローチは、電気コンデンサの物理学にインスパイアされています。
実際に,おもちゃおよび画像データ実験におけるEMFの性能を実演する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:50:16 GMT)
Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3] コンテキスト is Key" (CiK) は、数値データを多種多様なテキストコンテキストと組み合わせた予測ベンチマークである。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
実験では,LLMに基づく予測モデルを用いた場合,文脈情報の導入の重要性を強調した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:12:13 GMT)
AdaSVD: Adaptive Singular Value Decomposition for Large Language Models [84.6] Singular Value Decomposition (SVD) は,大規模言語モデル(LLM)の有望な圧縮手法として登場した。
既存のSVDベースの手法は、SVDトランケーションによって引き起こされるエラーを効果的に軽減するために苦労することが多い。
適応SVDに基づくLLM圧縮手法であるAdaSVDを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:51:28 GMT)
Distributional Diffusion Models with Scoring Rules [83.4] 拡散モデルは高品質な合成データを生成する。
高品質な出力を生成するには、多くの離散化ステップが必要です。
クリーンデータサンプルの後部エム分布を学習し,サンプル生成を実現することを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:59:03 GMT)
Medical Multimodal Model Stealing Attacks via Adversarial Domain Alignment [79.4] 医療マルチモーダル大言語モデル(MLLM)は医療システムにおいて重要な要素となっている。
医療データはプライバシー規制によって保護されていないため、医療MLLMは貴重な知的財産である。
本稿では,医療MLLMに対する最初の盗難攻撃であるAdversarial Domain Alignment(ADA-STEAL)を紹介する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:04:48 GMT)
Demons in the Detail: On Implementing Load Balancing Loss for Training Specialized Mixture-of-Expert Models [77.8] 本稿では、Mixture-of-Experts(MoEs)モデルをトレーニングする際に、$textbfL$oad-$textbfb$alancing $textbfL$oss(LBL)の実装を再検討する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:07:37 GMT)
Trajectory Flow Matching with Applications to Clinical Time Series Modeling [77.6] Trajectory Flow Matching (TFM) は、シミュレーションのない方法でニューラルSDEを訓練し、ダイナミックスを通してバックプロパゲーションをバイパスする。
絶対的性能と不確実性予測の観点から,3つの臨床時系列データセットの性能向上を実証した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:54:45 GMT)
Ranking-aware adapter for text-driven image ordering with CLIP [76.8] 本稿では,CLIPモデルを学習からランクへのタスクに再構成する,効率的かつ効率的な手法を提案する。
我々のアプローチは、ランキングの目的のために新しい指示に適応するための学習可能なプロンプトを取り入れている。
私たちのランキングアウェアアダプタは、様々なタスクにおいて微調整されたCLIPよりも一貫して優れています。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 06:39:26 GMT)
LongDPO: Unlock Better Long-form Generation Abilities for LLMs via Critique-augmented Stepwise Information [76.3] 学術論文やリポジトリレベルのコード生成には,長文生成が不可欠だ。
選好学習と結果管理を併用する既存の手法は、拡張された文脈に対して詳細なフィードバックを提供するのに失敗することが多い。
プロセスの監督を取り入れた長文生成の促進を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:25:17 GMT)
Aggregation Artifacts in Subjective Tasks Collapse Large Language Models' Posteriors [74.0] In-context Learning (ICL) は、Large Language Models (LLM) を用いた自然言語処理の主要な手法となっている。
本研究は,低アグリゲーション,異質なアノテーションを組み合わせたアグリゲーションの結果が,プロンプトに有害なノイズを生じさせるアノテーションのアーティファクトに繋がるかどうかを考察する。
この結果から,アグリゲーションは主観的タスクのモデル化において不明瞭な要因であり,代わりに個人をモデリングすることを重視することが示唆された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:59:05 GMT)
SeedVR: Seeding Infinity in Diffusion Transformer Towards Generic Video Restoration [73.7] SeedVRは、任意の長さと解像度で現実世界のビデオ再生を処理するために設計された拡散トランスフォーマーである。
合成ベンチマークと実世界のベンチマーク、AI生成ビデオで高い競争力を発揮する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:29:36 GMT)
The Energy Loss Phenomenon in RLHF: A New Perspective on Mitigating Reward Hacking [72.5] この研究は、人間からのフィードバックからの強化学習におけるエネルギー損失現象と、そのハッキング報酬への関連を識別する。
報酬計算において最終層におけるエネルギー損失の増加をペナルティ化し,過大なエネルギー損失を防止するEnergy Los-Aware PPOアルゴリズム(EPPO)を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:22:43 GMT)
VideoJAM: Joint Appearance-Motion Representations for Enhanced Motion Generation in Video Models [72.0] VideoJAMは、ビデオジェネレータの前に効果的な動きを注入する新しいフレームワークである。
VideoJAMは動きコヒーレンスにおける最先端のパフォーマンスを達成する。
これらの知見は、外観と動きが相補的であり、効果的に統合されると、映像生成の視覚的品質とコヒーレンスの両方を高めることを強調した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:07:10 GMT)
AIN: The Arabic INclusive Large Multimodal Model [71.3] AIN (英語: AIN) は、英語とアラビア語で卓越するように設計された英語とアラビア語のバイリンガルLMMである。
AINは最先端のアラビア語のパフォーマンスを実証する一方で、英語の視覚能力も優れている。
AINの優れた能力は、先進的なマルチモーダル生成AIツールでアラビア語話者を強化するための重要なステップである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:05:23 GMT)
Certifying LLM Safety against Adversarial Prompting [71.0] 大規模言語モデル(LLM)は、入力プロンプトに悪意のあるトークンを追加する敵攻撃に対して脆弱である。
我々は,認証された安全保証とともに,敵のプロンプトを防御する最初の枠組みである消去・チェックを導入する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:47:09 GMT)
Dissecting Adversarial Robustness of Multimodal LM Agents [70.2] 我々は、VisualWebArena上に現実的な脅威モデルを用いて、200の敵タスクと評価スクリプトを手動で作成する。
我々は,クロボックスフロンティアLMを用いた最新のエージェントを,リフレクションやツリーサーチを行うエージェントを含む,壊すことに成功している。
AREを使用して、新しいコンポーネントの追加に伴うロバスト性の変化を厳格に評価しています。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:02:17 GMT)
Large Language Models for Recommendation with Deliberative User Preference Alignment [69.1] 本稿では,ユーザの嗜好に関する明確な推論を新たなアライメント目標として組み込んだ,新たなDeliberative Recommendationタスクを提案する。
次に,言語化されたユーザフィードバックを段階的に活用して推論能力を高めるために設計された,Deliberative User Preference Alignmentフレームワークを紹介する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:17:54 GMT)
Transolver++: An Accurate Neural Solver for PDEs on Million-Scale Geometries [67.6] Transolver++は、百万のスケールでPDEを解くことができる、非常に並列で効率的なニューラルソルバである。
Transolver++は、シングルGPU入力能力を初めて100万ポイントに拡張する。
数百万スケールの高忠実度産業シミュレーションで20%以上の性能向上を実現している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:33:50 GMT)
FLOWTS: Time Series Generation via Rectified Flow [67.4] FlowTSは、確率空間における直線輸送を伴う整流フローを利用するODEベースのモデルである。
非条件設定では、FlowTSは最先端のパフォーマンスを達成し、コンテキストFIDスコアはStockとETThデータセットで0.019と0.011である。
条件設定では、太陽予測において優れた性能を達成している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:49:33 GMT)
SepLLM: Accelerate Large Language Models by Compressing One Segment into One Separator [65.6] 大規模言語モデル(LLM)は、自然言語処理タスクの範囲で例外的な性能を示した。
特定の意味のない特別なトークン(セパレータ)は、意味的に意味のあるトークンと比較して注意点に不均等に寄与する。
SepLLMは,これらのセグメントを圧縮し,冗長なトークンを除去することによって推論を高速化する,プラグイン・アンド・プレイのフレームワークである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:16:31 GMT)
On the Expressivity of Selective State-Space Layers: A Multivariate Polynomial Approach [64.0] 選択的なステートスペースレイヤは、Mambaアーキテクチャの重要なコンポーネントである。
マンバは長い列に対する線形注意に基づくモデルよりも優れた表現力を提供する。
本研究は,各種データセットの総合的な実験により検証した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:46:39 GMT)
Uncovering Challenges of Solving the Continuous Gromov-Wasserstein Problem [64.0] グロモフ=ワッサーシュタイン最適輸送(Gromov-Wasserstein Optimal Transport, GWOT)問題は、MLコミュニティの特別な関心を集めている。
既存の連続GWOTアプローチをさまざまなシナリオでクラッシュテストし、結果を注意深く記録し分析し、問題を特定します。
本稿では,離散的手法に依存しない新たな連続GWOT法を提案し,競合の問題を部分的に解決する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:26:04 GMT)
BiMaCoSR: Binary One-Step Diffusion Model Leveraging Flexible Matrix Compression for Real Super-Resolution [63.8] 本稿では,バイナライゼーションと1段階蒸留を組み合わせたBiMaCoSRを提案する。
BiMaCoSRはFPに比べて23.8倍圧縮率と27.4倍スピードアップ比を達成した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:58:30 GMT)
StyleSinger: Style Transfer for Out-of-Domain Singing Voice Synthesis [63.2] ドメイン外歌唱音声合成(SVS)のためのスタイル転送は、目に見えないスタイルで高品質な歌唱音声を生成することに焦点を当てている。
StyleSingerは、ドメイン外参照音声サンプルのゼロショットスタイル転送のための最初の歌声合成モデルである。
ゼロショット・スタイル・トランスファーにおける評価は、StyleSingerが基準歌唱音声サンプルの音質と類似性の両方でベースライン・モデルより優れていることを不確実に証明している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:26:46 GMT)
Adversarial ML Problems Are Getting Harder to Solve and to Evaluate [62.3] 過去10年間で、敵の環境で動く機械学習(ML)モデルの確保にかなりの研究努力が注がれている。
しかし、単純な"toy"問題でさえ進歩は遅くなっています。
今日、敵対的ML研究はより大きな汎用言語モデルの研究へと移行している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:17:08 GMT)
Dual Ensembled Multiagent Q-Learning with Hypernet Regularizer [62.0] マルチエージェント設定における過大評価は、比較的ほとんど注目されていない。
本稿では,超ネットワーク重みとバイアスに関する新しいハイパーネット正規化器を提案し,オンライングローバルQ-ネットワークの最適化を制約し,過大な推定の蓄積を防止する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:14:58 GMT)
Model Supply Chain Poisoning: Backdooring Pre-trained Models via Embedding Indistinguishability [61.5] そこで我々は,PTMに埋め込まれたバックドアをモデルサプライチェーンに効率的に移動させる,新しい,より厳しいバックドア攻撃であるTransTrojを提案する。
実験の結果,本手法はSOTAタスク非依存のバックドア攻撃より有意に優れていた。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:25:18 GMT)
$ε$-VAE: Denoising as Visual Decoding [61.3] 生成モデリングにおいて、トークン化は複雑なデータをコンパクトで構造化された表現に単純化し、より効率的で学習可能な空間を作り出す。
現在の視覚的トークン化手法は従来のオートエンコーダフレームワークに依存しており、エンコーダはデータを潜在表現に圧縮し、デコーダは元の入力を再構築する。
具体的には,デコーダを拡散処理に置き換え,ノイズを反復的に除去して元のイメージを復元し,エンコーダが提供する潜伏者によって誘導される。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:54:07 GMT)
On Teacher Hacking in Language Model Distillation [61.2] 我々は,教師のハッキングと呼ばれる同様の現象が,知識蒸留中に起こりうるかどうかを考察する。
これは、教師LMがそれ自体が真の分布の完全な近似であるからである。
オンラインデータ生成技術は、教師のハッキングを効果的に軽減する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:26:28 GMT)
One Diffusion Step to Real-World Super-Resolution via Flow Trajectory Distillation [60.5] FluxSRはフローマッチングモデルに基づく新しい一段階拡散リアルISRである。
まず,フロートラジェクトリ蒸留(FTD)を導入し,多段階のフローマッチングモデルを1段階のリアルISRに蒸留する。
第2に、画像リアリズムを改善し、生成画像の高周波アーティファクト問題に対処するために、テレビLPIPSを知覚的損失として提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:11:29 GMT)
Unity in Diversity: Multi-expert Knowledge Confrontation and Collaboration for Generalizable Vehicle Re-identification [60.2] 一般化可能な車両再識別(ReID)は、微調整や再訓練を必要とせず、未知のターゲットドメインに適応可能なモデルの開発を目指している。
これまでの研究は主に、ソースドメイン間のデータ分散を調整することで、ドメイン不変の機能の抽出に重点を置いてきた。
そこで本研究では,この問題を解決するために,2段階のMulti-expert Knowledge Confrontation and Collaboration(MiKeCoCo)手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:30:12 GMT)
On the Emergence of Position Bias in Transformers [59.9] 本稿では,多層アテンションにおける位置バイアスを解析するための新しいグラフ理論フレームワークを提案する。
我々は,トークンが逐次位置に基づいてコンテキスト情報とどのように相互作用するかを定量化する。
我々のフレームワークは、トランスにおける位置バイアスを理解するための原則的な基盤を提供する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:53:07 GMT)
Dobi-SVD: Differentiable SVD for LLM Compression and Some New Perspectives [59.5] SVDの最適利用は、単にアクティベーションを最適化距離として使うのではなく、停止するアクティベーションに関係していると論じる。
本稿では, SVD に基づく LLM 圧縮に対して, 新たな原理的アプローチを確立する Dobi-SVD を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 21:17:51 GMT)
Online Clustering of Dueling Bandits [59.1] 本稿では、優先フィードバックに基づく協調的な意思決定を可能にするために、最初の「デュエルバンディットアルゴリズムのクラスタリング」を導入する。
本稿では,(1)ユーザ報酬関数をコンテキストベクトルの線形関数としてモデル化する線形デューリング帯域のクラスタリング(COLDB)と,(2)ニューラルネットワークを用いて複雑な非線形ユーザ報酬関数をモデル化するニューラルデューリング帯域のクラスタリング(CONDB)の2つの新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:55:41 GMT)
TCSinger: Zero-Shot Singing Voice Synthesis with Style Transfer and Multi-Level Style Control [59.0] スタイル転送とスタイル制御を備えたゼロショット歌唱音声合成(SVS)は、目に見えない音色とスタイルで高品質な歌唱音声を生成することを目的としている。
言語間音声および歌唱スタイル間のスタイル伝達のための,最初のゼロショットSVSモデルであるTCSingerを紹介する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:30:16 GMT)
Fully Autonomous AI Agents Should Not be Developed [58.9] 本稿では,完全自律型AIエージェントを開発すべきではないと主張している。
この立場を支持するために、我々は、従来の科学文献と現在の製品マーケティングから、異なるAIエージェントレベルを規定するために構築する。
分析の結果,システムの自律性によって人へのリスクが増大することが明らかとなった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:00:06 GMT)
ParetoQ: Scaling Laws in Extremely Low-bit LLM Quantization [58.8] 本稿では,1ビット,1.58ビット,2ビット,3ビット,4ビットの量子化設定に対して厳密な比較を行う統一フレームワークを提案する。
3次、2ビット、3ビット量子化は、サイズと精度のトレードオフにおいて同等のパフォーマンスを維持していることを示す。
ハードウェアの制約を考慮すると、2ビット量子化はメモリの削減とスピードアップに有望な可能性を秘めている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:59:26 GMT)
Geometric Neural Process Fields [58.8] 幾何学的ニューラル・プロセス・フィールド(Geometric Neural Process Fields, G-NPF)は、ニューラル・ラディアンス・フィールドの確率的フレームワークである。
これらの基盤の上に構築された階層型潜在変数モデルにより、G-NPFは複数の空間レベルにまたがる構造情報を統合できる。
3次元シーンと2次元画像と1次元信号レグレッションの新規ビュー合成実験により,本手法の有効性を実証した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:17:18 GMT)
GRAPE: Generalizing Robot Policy via Preference Alignment [58.4] GRAPE: 優先度アライメントによるロボット政策の一般化について述べる。
GRAPEはドメイン内および未確認操作タスクにおける成功率をそれぞれ51.79%、58.20%向上させる。
GRAPEは安全性や効率、衝突速度の37.44%、ロールアウト長さの11.15%といった様々な目標に合わせることができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:49:11 GMT)
Reusing Embeddings: Reproducible Reward Model Research in Large Language Model Alignment without GPUs [58.2] 大規模言語モデル (LLM) は強化学習 (RL) を通じて構造化タスクに大きく進歩した。
チャットボットやコンテンツ生成といった幅広い分野にRLを適用することは、ユニークな課題だ。
埋め込み型報酬モデルを用いた既存の報酬モデルアンサンブル研究の再現事例について述べる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:37:35 GMT)
Synthetic-To-Real Video Person Re-ID [57.9] 人物再識別(Re-ID)は重要な課題であり、公衆の安全と情報法医学に重要な応用がある。
本稿では、Re-IDの新規かつ挑戦的な設定、すなわちドメイン間ビデオベースの人物Re-IDについて検討する。
我々は、テストのためのトレーニングや実世界のビデオのソースドメインとして、合成ビデオデータセットを使用します。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 06:00:12 GMT)
Satori: Reinforcement Learning with Chain-of-Action-Thought Enhances LLM Reasoning via Autoregressive Search [57.3] 大規模言語モデル(LLM)は、様々な領域にまたがる顕著な推論能力を示している。
近年の研究では、テスト時間計算の増加はLLMの推論能力を高めることが示されている。
そこで我々は,1)COAT推論形式を内部化するための小規模な形式調整段階,2)強化学習を活用した大規模自己改善段階を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:26:58 GMT)
Peri-LN: Revisiting Layer Normalization in the Transformer Architecture [57.1] Pre-LNとPost-LNは、大規模なトレーニングの制限にもかかわらず、長い間標準のプラクティスを支配してきた。
いくつかのオープンソースの大規模モデルは、最近、多くの説明なしに第3の戦略を静かに採用し始めた。
Peri-LNは、よりバランスの取れた分散成長、より安定な勾配流、収束安定性を実現する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 21:29:47 GMT)
Exploring Concept Depth: How Large Language Models Acquire Knowledge and Concept at Different Layers? [57.0] 大規模言語モデル(LLM)は、幅広いタスクで顕著なパフォーマンスを示している。
しかし、これらのモデルが様々な複雑さのタスクを符号化するメカニズムは、いまだに理解されていない。
概念深さ」の概念を導入し、より複雑な概念が一般的により深い層で得られることを示唆する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:34:30 GMT)
Reinforcement Learning for Long-Horizon Interactive LLM Agents [57.0] インタラクティブデジタルエージェント(IDA)は、ステートフルなデジタル環境のAPIを利用して、ユーザの要求に応じてタスクを実行する。
対象環境で直接IDAを訓練する強化学習(RL)手法を提案する。
我々は、近似ポリシー最適化のデータおよびメモリ効率の亜種である LOOP を導出する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:28:50 GMT)
CITER: Collaborative Inference for Efficient Large Language Model Decoding with Token-Level Routing [57.0] CITERはトークンレベルのルーティング戦略を通じて、小規模および大規模言語モデル(SLMs & LLMs)間の効率的な協調を可能にする。
実時間および資源制約のあるアプリケーションに対して有望なソリューションを提供するため、CITERは高品質な生成を保ちながら推論コストを削減できることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:36:44 GMT)
AutoGUI: Scaling GUI Grounding with Automatic Functionality Annotations from LLMs [54.6] 本稿では,UI要素を自動的に注釈付けするためのメソッド名パイプラインを提案する。
具体的には、大きな言語モデル(LLM)を利用して、特定のUI要素との対話の前後のUI内容の変化を比較して要素機能を推測する。
提案したパイプラインを用いて,マルチレゾリューション,マルチデバイススクリーンショット,多様なデータドメイン,以前のデータセットで提供されていない詳細な機能アノテーションを特徴とするメソッドネーム704kデータセットを構築した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:39:59 GMT)
A Provably Efficient Option-Based Algorithm for both High-Level and Low-Level Learning [54.2] 異なる(高低と高低の)時間的抽象化において,後悔最小化アルゴリズムのメタアルゴリズムを交互に提案する。
高いレベルでは、半マルコフ決定プロセス(SMDP)として、固定された低レベルポリシーで、低いレベルでは内部オプションポリシーを固定された高レベルポリシーで学習する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:24:29 GMT)
Efficient Training of Self-Supervised Speech Foundation Models on a Compute Budget [53.9] 本稿では,限定的な計算予算の下で,自己教師付き学習(SSL)を用いて音声基礎モデルを効率的に訓練する方法を検討する。
モデルアーキテクチャ、モデルサイズ、データサイズなど、予算に影響を与えるSSLの重要な要因について検討する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:47:23 GMT)
GTSinger: A Global Multi-Technique Singing Corpus with Realistic Music Scores for All Singing Tasks [52.3] GTSingerは、グローバルで、多技術で、無料で使える、高品質な歌唱コーパスで、リアルな音楽スコアがある。
高品質な歌声を80.59時間収集し、最大の歌唱データセットを形成する。
我々は,技術制御可能な歌唱音声合成,技術認識,スタイル伝達,音声歌唱変換の4つのベンチマーク実験を行った。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:55:53 GMT)
Internal Activation as the Polar Star for Steering Unsafe LLM Behavior [50.5] SafeSwitchは、モデルの内部状態を監視し、利用することによって、安全でない出力を動的に制御するフレームワークである。
実証実験の結果,SafeSwitchは安全性ベンチマークで80%以上の有害な出力を削減し,有効性を維持していることがわかった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:47:38 GMT)
Gender Bias and Property Taxes [50.2] 我々は、10万人以上の不動産税告訴審理記録と2.7年以上の関連音声記録を分析した。
女性のアパレルは、聴聞会で男性アパレルよりも体系的に劣る。
我々の結果は、性別バイアスは、少なくとも部分的には、ABBパネリストの一部に関する無声の信念と認識によって引き起こされるという考え方と一致している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:04:46 GMT)
RieszBoost: Gradient Boosting for Riesz Regression [49.7] 本稿では,Riesz表現子を直接推定するために,その明示的な解析形式を必要とせず,新たな勾配向上アルゴリズムを提案する。
提案アルゴリズムは,様々な関数を対象とした間接推定手法と同等以上の性能を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:04:32 GMT)
Movie Weaver: Tuning-Free Multi-Concept Video Personalization with Anchored Prompts [49.6] マルチコンセプト統合に基づくビデオパーソナライズのための新しい手法を提案する。
Movie Weaverは、顔、体、動物画像を含む複数のコンセプトをシームレスに1つのビデオに織り込み、1つのモデルで柔軟な組み合わせを可能にする。
評価の結果,Movie Weaverはアイデンティティの保存と全体的な品質において,既存のマルチコンセプトビデオパーソナライズ手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:03:26 GMT)
Flow Graph-Based Classification of Defects4J Faults [49.4] Defects4Jのようなソフトウェア障害データセットは、個々の障害の位置と修復を提供するが、障害の特徴は示さない。
本稿では,プログラムの制御およびデータフローグラフ表現に基づく,新たな直接故障分類手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:10:28 GMT)
Rate-reliability functions for deterministic identification [49.1] 正の指数に対して線形スケーリングが復元され、信頼指数の関数であるレートが復元される。
製品入力制限付き古典量子チャネルや量子チャネルに結果を拡張します。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:09:14 GMT)
Deterministic identification over channels with finite output: a dimensional perspective on superlinear rates [49.1] 有限出力であるが任意の入力アルファベットを持つメモリレスチャネルに対する一般性の問題を考える。
主な発見は、メッセージの最大長が$R,nlog n$、ブロック長$n$と超直線的にスケールすることである。
出力分布のペアの信頼性を保証し、DIコードを構築するのに十分であることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:17:30 GMT)
Articulate AnyMesh: Open-Vocabulary 3D Articulated Objects Modeling [48.8] Articulate Anymeshは,剛性のある3Dメッシュを,オープンな語彙で表現されたものに変換可能な,自動フレームワークである。
実験の結果、Articulate Anymeshは、ツール、おもちゃ、機械装置、車両など、大規模で高品質な3D関節オブジェクトを生成できることがわかった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:59:55 GMT)
Towards Accurate Post-Training Quantization of Vision Transformers via Error Reduction [48.7] ビジョントランスフォーマー(ViT)のPTQ(Post-training Quantization)は,学術的,産業的にも注目されている。
現在の方法は、量子化された重みとアクティベーションの間の複雑な相互作用を考慮できないため、量子化エラーと準最適性能をもたらす。
本稿では,活性化と重み量子化による量子化誤差を逐次低減する2段階PTQ法であるERQを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:50:20 GMT)
ActSafe: Active Exploration with Safety Constraints for Reinforcement Learning [48.5] 本稿では,安全かつ効率的な探索のためのモデルベースRLアルゴリズムであるActSafeを提案する。
本稿では,ActSafeが学習中の安全性を保証しつつ,有限時間で準最適政策を得ることを示す。
さらに,最新のモデルベースRLの進歩に基づくActSafeの実用版を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:02:24 GMT)
LoRA-X: Bridging Foundation Models with Training-Free Cross-Model Adaptation [48.2] 新しいアダプタであるCross-Model Low-Rank Adaptation (LoRA-X)は、ソースモデルとターゲットモデル間のLoRAパラメータのトレーニング不要転送を可能にする。
本実験は,テキスト・ツー・イメージ生成におけるLoRA-Xの有効性を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:43:24 GMT)
SAISA: Towards Multimodal Large Language Models with Both Training and Inference Efficiency [47.0] トレーニングと推論の効率を両立させる新しいアーキテクチャであるSAISAを紹介する。
LLaVA-1.5と同じ構成で、SAISAは推測FLOPを66%削減し、トレーニング予算を26%削減した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:28:53 GMT)
PolarQuant: Quantizing KV Caches with Polar Transformation [46.4] 大きな言語モデル(LLM)はキーバリューの埋め込みをKVキャッシュに格納するために大きなメモリを必要とする。
これらのKV埋め込みの量子化は、メモリ消費を減らすための一般的な手法である。
この研究は、ランダムプレコンディショニングと極変換を用いた新しい量子化法であるPolarQuantを紹介する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:52:13 GMT)
The Price of Linear Time: Error Analysis of Structured Kernel Interpolation [46.3] 構造化カーネル補間 (Structured Kernel Interpolation, SKI) はガウス過程 (GP) のスケールを支援する。
本稿では,SKIグラム行列の誤差境界を証明し,過度パラメータに対する誤差の影響について検討する。
本研究では,SKIグラムのスペクトル標準誤差と計算複雑性のトレードオフを規定する2つの次元規則を同定する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:07:24 GMT)
Interactive Tools Substantially Assist LM Agents in Finding Security Vulnerabilities [46.3] 本稿では,CTF(Capture The Flag)課題を自律的に解決するLMエージェントであるEnIGMAを紹介する。
セキュリティ脆弱性を発見して悪用するエージェントの能力を改善するために、新しいツールとインターフェースを導入します。
390 CTF課題に関する実証分析により,これらの新しいツールとインターフェースがエージェントの性能を大幅に向上することが示された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:49:41 GMT)
Modular Training of Neural Networks aids Interpretability [45.8] 我々は,クラスタビリティの尺度を定義し,事前学習したモデルがスペクトルグラフクラスタリングによって高度に集積されたクラスタを形成することを示す。
自動解釈可能性技術を用いることで,よりモジュール化され,異なる,不連続な,より小さな回路を学習するモデルの学習を支援することができることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:44:38 GMT)
Analyzing Similarity Metrics for Data Selection for Language Model Pretraining [45.8] トレーニング例間の類似性は、言語モデルの事前トレーニングデータセットをキュレートするために使用される。
本稿では,言語モデル事前学習環境におけるデータキュレーションに特化した埋め込みモデルの適合性を分析するためのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:09:44 GMT)
AI-Powered, But Power-Hungry? Energy Efficiency of LLM-Generated Code [45.8] 本稿では,Python,Java,C++の3つのプログラミング言語に対して,LLM生成コードのエネルギー効率と性能を初めて解析する。
結果から,C++ コードよりも Python と Java の生成に成功していることがわかった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:32:34 GMT)
Streaming Speaker Change Detection and Gender Classification for Transducer-Based Multi-Talker Speech Translation [45.5] 本稿では,トランスデューサをベースとしたストリーム・ツー・エンド音声翻訳モデルに話者埋め込みを組み込むことで,ストリーミング話者変化の検出と性別分類に取り組むことを提案する。
提案手法は,話者変化検出と性別分類の両面で高い精度を実現することができることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:50:15 GMT)
Addressing Label Shift in Distributed Learning via Entropy Regularization [45.3] マルチノード分散学習における真のリスクを最小限に抑えるという課題に対処する。
本稿では,テスト・ツー・トレインのラベル密度比の最大推定量を向上させるVersatile Robust Label Shift (VRLS)法を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:14:27 GMT)
MergeME: Model Merging Techniques for Homogeneous and Heterogeneous MoEs [45.2] 本稿では,パラメータ干渉を緩和する手法,ルーティング,アーキテクチャの異なる専門家をマージするための新しい手法など,新たなMoEマージ手法を提案する。
複数の領域にわたる実験により,提案手法の有効性,微調整コストの低減,最先端手法の性能向上,MoEマージの適用性の向上が示された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:44:49 GMT)
The Ball-Proximal (="Broximal") Point Method: a New Algorithm, Convergence Theory, and Applications [45.0] 非滑らかな制約と非グローバルな最適化は、様々なアプリケーションに重大な課題をもたらす。
我々は,BallProximal Point, Broximal Method (BPM) (Rock Wafel) (Rock Wafel) (Rock Wafel) (Rock Wafel) (Rock Wafel) (Rock Wafel) (Rock Wafel) (Rock Wafel) (Rock Wafel) (Rock Wafel) (Rock Wafel) (Rock Wafel) (Rock Wafel) (Rock Wafel) (Rock Wafel) (Rock Wafel) (Rock Wafel) (Rock Wafel) (Rock Wafel) (Rock Wafel)を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:30:03 GMT)
Multilingual Attribute Extraction from News Web Pages [45.0] 本稿では,複数の言語にまたがるニュース記事ページから属性を自動的に抽出するという課題に対処する。
我々は6言語(英語、ドイツ語、ロシア語、中国語、韓国語、アラビア語)にわたる3,172のマークアップニュースページからなる多言語データセットを作成した。
学習済みの最先端モデルであるMarkupLMを微調整し、これらのページからニュース属性を抽出し、ページを英語に翻訳することが抽出品質に与える影響を評価した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:43:40 GMT)
STAIR: Improving Safety Alignment with Introspective Reasoning [44.8] SafeTyアライメントとItrospective Reasoningを統合したフレームワークSTAIRを提案する。
その結果,STAIRは本能的アライメント戦略と比較して,有害なアウトプットを効果的に軽減し,有用性を保っていることがわかった。
テスト時のスケーリングでは、STAIRは一般的なジェイルブレイク攻撃に対して、Claude-3.5に匹敵する安全性能を達成する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:02:55 GMT)
Learning to Route LLMs with Confidence Tokens [43.6] 大規模言語モデルが回答の信頼性を確実に示すことができる範囲について検討する。
本稿では,LLMの信頼性を確実に表現するための軽量トレーニング戦略であるSelf-REFを提案する。
信頼度を言語化したり、トークンの確率を調べるといった従来の手法と比較して、信頼度トークンは下流のルーティングや拒否学習タスクにおいて著しく改善されていることを実証的に示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 21:38:52 GMT)
Explosive neural networks via higher-order interactions in curved statistical manifolds [43.5] 曲線ニューラルネットワークは,パラメータ数に制限のあるプロトタイプモデルのクラスとして導入する。
これらの曲線ニューラルネットワークは、メモリ検索を高速化する自己制御プロセスを実装している。
強磁性相とスピングラス相の境界付近のレプリカ手法を用いて, メモリ・検索能力の解析を行った。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:13:46 GMT)
Vision-centric Token Compression in Large Language Model [43.4] テキストトークンのシーケンスに直接適用される小さなビジョンエンコーダは、テキストタスク上でテキストエンコーダと競合する可能性があることを示す。
VISTはFLOPを16%削減し、メモリ使用量を50%削減した。
このアプローチは、TriviaQA、NQ、PopQA、TREF、SST2、SST5といったベンチマークよりも平均5.7%、従来のテキストエンコーダベースの手法よりも優れた結果をもたらす。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:45:52 GMT)
Efficient Supernet Training with Orthogonal Softmax for Scalable ASR Model Compression [43.3] 我々は、スーパーネットトレーニングを用いて、様々なサイズの複数のエンコーダを共同で訓練し、冗長なトレーニングをすることなく、動的モデルサイズ調整をハードウェア制約に適合させることができる。
我々は,複数のソフトマックス関数を適用して,スーパーネット内の最適点を効率的に同定するOrthoSoftmaxという新しい手法を提案する。
CTC on Librispeech と TED-Lium-v2 による結果から,FLOPs を意識したコンポーネント選択が全体的な性能を向上させることが示唆された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:20:23 GMT)
UNIP: Rethinking Pre-trained Attention Patterns for Infrared Semantic Segmentation [43.2] 我々は、事前学習モデルの性能を高めるために、統一赤外線事前学習フレームワークUNIPを提案する。
UNIPは,3つの赤外線セグメンテーションタスクにおいて,平均mIoUの13.5%の事前学習方法よりも優れることを示す。
UNIP-Sは、計算コストの1/10しか必要とせず、MAE-Lと同等の性能を達成する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:08:20 GMT)
Privacy Amplification by Structured Subsampling for Deep Differentially Private Time Series Forecasting [43.1] トレーニングシーケンスモデルにおける構造化サブサンプリングによって達成されるプライバシーの増幅について検討する。
シーケンスモデルの自己教師型トレーニングにおいて,データ拡張がいかに活用できるかを実証する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:29:00 GMT)
Task Diversity Shortens the ICL Plateau [43.0] In-context Learning (ICL)は、一連の入力デモとその後のクエリに基づいて出力を生成する言語モデルの能力を記述する。
複数の多様なICLタスクのトレーニングが同時に損失高原を短縮し、各タスクの学習が容易になることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 00:16:43 GMT)
Emerging Microelectronic Materials by Design: Navigating Combinatorial Design Space with Scarce and Dispersed Data [42.5] 材料設計には計算モデリングと機械学習が用いられている。
物理機構、第一原理計算のコスト、データの分散は、物理に基づく材料モデリングとデータ駆動材料モデリングの両方に課題をもたらす。
本稿では,これらの課題に対処し,材料設計を加速するために,データ駆動および物理に基づく手法を統合するフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:38:31 GMT)
Memory Efficient Transformer Adapter for Dense Predictions [42.4] 本稿では,メモリ効率を向上し,メモリ消費を低減できるメモリ効率の良いViTアダプタMETAを提案する。
提案するブロック内では、モデルの頻繁な再形成操作を減らすために、断面形状の自己注意が使用される。
METAは予測される品質を大幅に向上し、新しい最先端の精度効率トレードオフを実現している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:19:33 GMT)
Tuning LLM Judge Design Decisions for 1/1000 of the Cost [42.1] 大きな言語モデル(LLM)は、しばしば人為的なアノテーションを必要とする。
この問題に対処するため、2つのLLMの出力を比較するLLMベースの審査員が提案されている。
いくつかのアプローチが提案されているが、異なる論文の間には多くの相反する要因が存在する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:21:00 GMT)
Design and Simulation of the Adaptive Continuous Entanglement Generation Protocol [41.8] 量子ネットワークにおける重要なパフォーマンス指標は、ユーザのEP要求に対するTTS(Time-to-serve)である。
本稿では,適応型連続絡み合い生成プロトコル(ACP)について検討し,量子ネットワークノードが隣人と連続的にEPを生成できるようにする。
TTS(最大94%減少)と分散絡み合いの忠実度(最大0.05増加)の両面で有意な改善を示した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:22:27 GMT)
LoR-VP: Low-Rank Visual Prompting for Efficient Vision Model Adaptation [41.8] 視覚プロンプトのための低ランク行列乗算を導入した新しい視覚プロンプト設計法(LoR-VP)を提案する。
LoR-VPは、画像ピクセルの行と列をまたいだ共有およびパッチ固有の情報を可能にする。
実験では、最先端の視覚的プロンプト法と比較して、性能と効率の両面で大きな改善が示されている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:36:34 GMT)
OVERTHINKING: Slowdown Attacks on Reasoning LLMs [41.7] OVERTHINK攻撃は、推論モデルを操作するサードパーティアプリケーションのコストを増幅する可能性がある。
我々は、クローズド(OpenAI o1, o1-mini, o3-mini)とオープン(DeepSeek R1)の重み付けモデルを用いて、FreshQAおよびSQuADデータセットによる攻撃を評価した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:12:41 GMT)
Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies [41.2] 対話やコラボレーションを行う複数のエージェントとして使用される大規模な言語モデルは、複雑なタスクの解決に優れています。
マルチエージェントシステム(MAS)のプロンプトやトポロジーの設計は本質的に複雑である。
複雑なMAS設計空間を効率的に活用するMAS最適化フレームワークであるMulti-Agent System Search (MASS)を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:56:44 GMT)
Transformers represent belief state geometry in their residual stream [40.8] 本稿では,この構造が,データ生成過程の隠蔽状態を更新する信念のメタ力学によって与えられることを示す。
我々の研究は、トレーニングデータの構造とトランス内のアクティベーションの幾何学的構造を結びつける一般的なフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:38:57 GMT)
SimPER: A Minimalist Approach to Preference Alignment without Hyperparameters [40.6] SimPERは言語モデルアライメントのための効果的な選好最適化アルゴリズムである。
SimPERは実装が容易で、高価なハイパーパラメータチューニングと参照モデルを必要としない。
SimPERは、既存のアプローチよりも一貫して、大幅に優れています。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:02:53 GMT)
Deep Linear Network Training Dynamics from Random Initialization: Data, Width, Depth, and Hyperparameter Transfer [40.4] 我々は,枝を1/sqrttextdepth$にスケールした場合に無限の深さ制限を可能にする非残留ニューラルネットワークと残留ニューラルネットワークの両方について記述する。
本モデルでは, 電力法構造データに対する高速化された電力法則トレーニングのダイナミクスを, 最近の研究で観測されたリッチな状態下で回復することを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:50:55 GMT)
Forest-of-Thought: Scaling Test-Time Compute for Enhancing LLM Reasoning [40.1] 我々はフォレスト・オブ・サート(FoT)と呼ばれる新しい推論フレームワークを提案する。
FoTは複数の推論木を統合し、複雑な論理問題を解くために集合的な意思決定を活用する。
本稿では,リアルタイムの誤り訂正を可能にする動的自己補正戦略と,コンセンサス誘導による意思決定戦略を導入する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 06:53:38 GMT)
A Family-Based Approach to Safety Cases for Controlled Airspaces in Small Uncrewed Aerial Systems [40.0] 本稿では,SUASから制御空域への入域要求を管理するための,自動でカスタマイズされた安全確保支援の確立に向けた取り組みについて述べる。
当社のアプローチであるSafeSPLE(セーフケースソフトウェア製品ラインエンジニアリング)について述べる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:34:17 GMT)
Adapting While Learning: Grounding LLMs for Scientific Problems with Intelligent Tool Usage Adaptation [39.8] 大規模言語モデル(LLM)は、単純な科学的問題を解決する上で有望な能力を示すが、ドメイン固有の微調整でさえも、複雑な言語に対する幻覚を生み出すことが多い。
本稿では,AWL(Adapting While Learning)という2成分微調整手法を提案する。
最初のコンポーネントであるWorld Knowledge Learning (WKL)では、LLMはツール生成ソリューションから学習することで、科学的知識を内部化する。
第2のコンポーネントであるツール・ユース・アダプテーション(TUA)では、WKL学習モデルの精度に基づいて質問を簡単または困難に分類し、ツールに切り替えながら簡単な問題に対する直接的な推論を維持するよう訓練する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 06:11:55 GMT)
ClarAVy: A Tool for Scalable and Accurate Malware Family Labeling [39.7] 家族のラベル付けは、サイバー攻撃の調査、帰属、修復に不可欠な要素である。
ClarAVyは悪意のあるファイルが属する家族を決定するツールである。
ClarAVyは、MOTIFとMalPediaデータセットのラベル付けにおいて、以前のリードツールよりも8~12パーセント高い精度を持つ。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:55:39 GMT)
RankFlow: A Multi-Role Collaborative Reranking Workflow Utilizing Large Language Models [39.7] RankFlowは、LLM(Large Language Models)の機能とロール特殊化を活用して、パフォーマンスを向上するマルチロールリグレードワークフローである。
RankFlowは、クエリRewriter、擬似Answerer、Summarizer、Rerankerの4つの異なる役割を達成するためにLLMを登録する。
RankFlow は TREC-DL や BEIR,NovereEval など,広く認識されている IR ベンチマークにおいて,既存の先進的なアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:37:20 GMT)
Generative Data Mining with Longtail-Guided Diffusion [39.5] トレーニング中に追加データを想像することで,プロアクティブなロングテール発見プロセスを開発する。
我々はこれらの信号をガイダンスとして利用し、潜在拡散モデルから追加のトレーニングデータを生成する。
LTGが生成したデータは意味論的に意味のある変化を示し、画像分類のベンチマークで大幅に一般化された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:51:00 GMT)
Diffusion Transformer Captures Spatial-Temporal Dependencies: A Theory for Gaussian Process Data [39.4] ビデオ生成のためのSoraのバックボーンであるDiffusion Transformerは、拡散モデルのキャパシティをうまく拡張する。
空間的・時間的依存関係を捉えるための拡散変圧器のブリッジ化に向けた第一歩を踏み出す。
空間的時間的依存が学習効率にどのように影響するかを強調した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:00:20 GMT)
Meta-Learning Objectives for Preference Optimization [39.2] より単純なベンチマークにおいて、選好最適化アルゴリズムの有効性についての洞察を得ることが可能であることを示す。
我々はミラー優先最適化(MPO)と呼ばれるミラー降下に基づく新しいPOアルゴリズム群を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:02:01 GMT)
Harness Local Rewards for Global Benefits: Effective Text-to-Video Generation Alignment with Patch-level Reward Models [39.0] 本稿では,パッチ報酬モデルからの局所的なフィードバックを明示的に取り入れた,VGMのためのポストトレーニング戦略HALOを提案する。
効果的なパッチ報酬モデルを開発するために,GPT-4oを蒸留し,映像報酬モデルを継続的に訓練する。
VGM最適化にパッチ報酬を調和的に組み込むため、DMのための粒度DPO(Gran-DPO)アルゴリズムを導入する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 21:10:25 GMT)
Demystifying Language Model Forgetting with Low-rank Example Associations [38.9] 大規模言語モデル(LLM)は、微調整時に上流データを忘れることに悩まされる。
我々は、言語モデリングや微調整後の命令チューニングの上流の例で発生する忘れを実証的に分析する。
経験的関連性に対して行列補完を伴う未知のタスクを微調整した場合,上流の例を忘れないように予測する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:07:09 GMT)
DCT-Mamba3D: Spectral Decorrelation and Spatial-Spectral Feature Extraction for Hyperspectral Image Classification [38.5] ハイパースペクトル画像分類は、スペクトル冗長性と複雑な空間スペクトル依存性による課題を提示する。
本稿では,高スペクトル画像分類のための新しいフレームワークDCT-Mamba3Dを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:00:08 GMT)
COCONut-PanCap: Joint Panoptic Segmentation and Grounded Captions for Fine-Grained Understanding and Generation [38.1] COCONut-PanCapデータセットは、細粒度で領域レベルのキャプションをパン光学セグメンテーションマスクに格納する。
COCONut-PanCapは、画像理解のための視覚言語モデルのトレーニングの改善と、テキスト・ツー・イメージタスクのための生成モデルをサポートする。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:59:46 GMT)
QUAR-VLA: Vision-Language-Action Model for Quadruped Robots [38.0] 中心となるアイデアは、ロボットの全体的な知性を高めることだ。
本稿では,VLAモデルのファミリである Quadruped Robotic Transformer (QUART) を提案する。
提案手法は,動作可能なロボットポリシーを導き,一貫した能力の獲得を可能にする。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:33:56 GMT)
Generalization Error Bound for Quantum Machine Learning in NISQ Era -- A Survey [37.7] 我々は、NISQ時代における教師付き量子機械学習(QML)の最先端の一般化について、システムマッピング研究(SMS)を実施している。
本研究は,既存の計算プラットフォームを,量子ハードウェア,データセット,最適化手法,文献に見られる境界の共通特性で体系的に要約する。
SMSはまた、NISQ時代のQMLの限界と課題を強調し、分野を前進させる今後の研究の方向性について論じている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:56:15 GMT)
DIME:Diffusion-Based Maximum Entropy Reinforcement Learning [37.4] 最大エントロピー強化学習(MaxEnt-RL)は,RLの探索特性から標準的アプローチとなっている。
本稿では,拡散に基づく最大エントロピーRL(DIME)を提案し,その限界エントロピー計算の難しさを克服する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:37:14 GMT)
LightTransfer: Your Long-Context LLM is Secretly a Hybrid Model with Effortless Adaptation [37.2] 長いコンテキストを扱うために言語モデルをスケールすることは、かなりのメモリ課題をもたらす。
LLaMAなどのモデルからハイブリッドなモデルに変換するLightTransferを提案する。
当社のアプローチでは,最近のトークンや初期トークンに注目した遅延レイヤを特定して,その全注目をストリーミングの注目に置き換えています。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:45:37 GMT)
Responsible Artificial Intelligence Systems: A Roadmap to Society's Trust through Trustworthy AI, Auditability, Accountability, and Governance [37.1] 本稿では, 包括的観点から, 責任あるAIシステムの概念を考察する。
論文の最終目標は、責任あるAIシステムの設計におけるロードマップの提案である。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:47:30 GMT)
Reinfier and Reintrainer: Verification and Interpretation-Driven Safe Deep Reinforcement Learning Frameworks [36.7] 本稿では,信頼性の高いDRLモデルを開発するために,検証駆動型ループ内解釈フレームワークReintrainerを提案する。
各イテレーションにおいて、このフレームワークは、トレーニング中のモデルと事前定義されたプロパティの間のギャップをフォーマルな検証を使って測定する。
Reinfierは、簡潔な制約エンコーディング言語DRLPに関連する、ブレークポイント検索と検証駆動型解釈を備えている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:01:02 GMT)
MaintaAvatar: A Maintainable Avatar Based on Neural Radiance Fields by Continual Learning [36.0] 連続学習によるニューラルラジアンス場に基づく保守可能なアバターを提案する。
我々のモデルは、モデルを素早く微調整するために限られたデータ収集しか必要としません。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:52:34 GMT)
A Scalable Crawling Algorithm Utilizing Noisy Change-Indicating Signals [35.5] 提案手法は, (i) 雑音側情報を軽度な仮定で最適に利用するスケーラブルなクローリングアルゴリズム, (ii) 重心集中型計算を使わずにデプロイできる, (iii) 任意の時間間隔で全帯域使用量をスパイクすることなくWebページを一定の総レートでクロールできる,という手法である。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:55:10 GMT)
SoftSRV: Learn to Generate Targeted Synthetic Data [35.2] 本稿では,タスク固有モデルを対象とした合成微調整データを生成するための新しいフレームワークであるSoftSRVを提案する。
We found that SoftSRV improve on typical prompt engineering approach, generated target data that led to fine-tuned model。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:48:54 GMT)
Learning the RoPEs: Better 2D and 3D Position Encodings with STRING [35.0] STRING: 分離可能なトランスレーショナル不変位置 s。
STRING: Separable Translationally Invariant Position s。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:37:17 GMT)
ChartMoE: Mixture of Expert Connector for Advanced Chart Understanding [34.8] 本稿では,従来の線形プロジェクタを置き換えるために,専門家(MoE)アーキテクチャの混合を用いたChartMoEを提案する。
具体的には、異なるアライメントタスクを通じて複数の線形コネクタを訓練する。
ChartMoE-Alignも導入しています。これは900K以上のチャートテーブル-JSON-コードの4倍数を持つデータセットで、3つのアライメントタスクを実行します。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:22:34 GMT)
TrojanDec: Data-free Detection of Trojan Inputs in Self-supervised Learning [34.6] TrojanDecは、トリガに埋め込まれたテスト入力を識別し、復元する最初のデータフリーメソッドである。
評価の結果,TrojanDecは与えられたテスト入力からトロイの木馬を効果的に識別し,最先端のトロイの木馬攻撃で回収できることがわかった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:23:17 GMT)
Rotation-Adaptive Point Cloud Domain Generalization via Intricate Orientation Learning [34.4] 本稿では,3次元点雲解析のための回転適応型領域一般化フレームワークを提案する。
本手法は,反復学習プロセスにおける複雑なサンプルを活用することにより,方向転換を緩和することを目的としている。
我々は、配向整合性損失とマージン分離損失を組み込んだ配向型コントラスト学習フレームワークを採用する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:46:32 GMT)
Are we making much progress? Revisiting chemical reaction yield prediction from an imbalanced regression perspective [33.9] 我々は,高収率予測における性能差は,低収率反応に歪んだ実世界のデータの不均衡分布から生じると論じる。
簡易なコスト依存再重み付け手法を組み込むことで, 未表現高収率領域における収率予測モデルの性能を大幅に向上できることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:24:05 GMT)
SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model [33.9] SmolLM2は、最先端の"小" (170億のパラメータ) 言語モデルである。
我々はSmolLM2を1兆のトークンでオーバートレーニングし、Webテキストと特殊な算数、コード、命令追従データとを混合する多段階のトレーニングプロセスを用いた。
我々は、SmolLM2がQwen2.5-1.5BやLlama3.2-1Bなど、最近の小さなLMよりも優れていることを示した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 21:43:16 GMT)
Deep Learning Library Testing: Definition, Methods and Challenges [33.6] ディープラーニング(DL)ライブラリは、基礎となる最適化と計算を行う。
DLライブラリはバグに免疫がなく、ユーザの個人資産や安全性に深刻な脅威をもたらす可能性がある。
本稿では,各種DLライブラリに関する試験研究の概要について述べる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:26:27 GMT)
STP: Self-play LLM Theorem Provers with Iterative Conjecturing and Proving [33.6] セルフプレイ・セオレム・プロバー(STP)は、予想と証明という2つの役割を担っている。
STPは同時に、予想と証明という2つの役割を担っている。
私たちはLeanとIsabelleの2つの形式的検証ツールで評価します。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:20:28 GMT)
Is poisoning a real threat to LLM alignment? Maybe more so than you think [33.6] そこで我々は,異なるシナリオ下での中毒攻撃に対するDPOの脆弱性を調査し,嗜好中毒の有効性を比較検討した。
PPOベースの手法とは異なり、バックドア攻撃では、有害な行動を誘発するために、少なくとも4%のデータを汚染する必要がある。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:57:59 GMT)
Asymptotic theory of in-context learning by linear attention [33.5] インコンテキスト学習はトランスフォーマーの成功の土台である。
ICLを成功させるためには、必要なサンプルの複雑さ、事前学習タスクの多様性、コンテキストの長さに関する質問は未解決のままである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:29:10 GMT)
50 Shades of Deceptive Patterns: A Unified Taxonomy, Multimodal Detection, and Security Implications [33.3] 認知パターン (DP) は意図しない決定にユーザを操作するために意図的に設計されたユーザインタフェースである。
セキュリティとプライバシの観点から、偽造パターンの分類を拡大し、カテゴリとスコープを洗練しました。
我々は,商用マルチモーダル・大規模言語モデル(MLLM)を利用した,認識パターン検出のための新しい自動ツールDPGuardを開発した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:33:36 GMT)
Vector Magnetometry Using Shallow Implanted NV Centers in Diamond with Waveguide-Assisted Dipole Excitation and Readout [33.2] ダイヤモンド中の窒素-空孔(NV)中心は、ダイヤモンド基板への3次元導波路のスケーラブルな統合を必要とする。
我々は、NV信号の励起と読み出しのためのレーザー書き導波路のアレイと統合された浅いNV中心のアンサンブルを持つセンサアレイ装置を開発した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 21:33:00 GMT)
IMDPrompter: Adapting SAM to Image Manipulation Detection by Cross-View Automated Prompt Learning [33.2] Segment Anything Model (SAM) は例外的な一般化とゼロショット機能を示した。
我々はSAMに基づくIMDPrompterと呼ばれるクロスビュープロンプト学習パラダイムを開発した。
IMDPrompterは手動によるガイダンスに依存しなくなり、自動検出とローカライゼーションが可能になった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:20:41 GMT)
DeepAveragers: Offline Reinforcement Learning by Solving Derived Non-Parametric MDPs [33.1] 静的な経験データセットから得られる有限表現型MDPを最適に解くことに基づくオフライン強化学習(RL)へのアプローチについて検討する。
我々の主な貢献は、Deep Averagers with Costs MDP (DAC-MDP)を導入し、オフラインRLに対するソリューションを検討することである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:39:40 GMT)
MPIC: Position-Independent Multimodal Context Caching System for Efficient MLLM Serving [32.6] 本稿では,マルチモーダル情報管理におけるより効果的な手法として,位置独立キャッシングを提案する。
我々は,システムレベルの課題とアルゴリズムレベルの課題に対処するため,MPICというキャッシングシステムの設計と実装を行った。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:13:09 GMT)
Slow and Steady Wins the Race: Maintaining Plasticity with Hare and Tortoise Networks [32.3] 訓練性を維持して可塑性を高める方法は、一般化に限られた利益をもたらす。
本稿では,脳の補完学習システムにインスパイアされたHare & Tortoiseを紹介する。
我々の方法は一般的な知識を維持しながら可塑性を保ちます。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:13:43 GMT)
Exploring the latent space of diffusion models directly through singular value decomposition [31.9] 拡散モデルにおけるテキストプロンプトによって決定される1組の潜在符号から任意の属性を学習できる新しい画像編集フレームワークを提案する。
この分野のさらなる研究と応用を促進するため、まもなくコードをリリースします。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:04:36 GMT)
ControlFace: Harnessing Facial Parametric Control for Face Rigging [31.8] フレキシブルで高忠実な制御を可能にする3DMMレンダリングに条件付けされた新しい顔リグ手法であるControlFaceを導入する。
ひとつはFaceNetと呼ばれ、アイデンティティと詳細をキャプチャし、もうひとつは生成に焦点を当てています。
顔ビデオデータセットをトレーニングすることで、FaceNetのリッチな表現を完全に活用し、コントロールの順守を確保します。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:24:15 GMT)
Compressed Image Generation with Denoising Diffusion Codebook Models [31.6] 本稿では,高品質な画像サンプルと非圧縮ビットストリーム表現を生成する新しい生成手法を提案する。
これは、逆拡散における標準ガウスノイズサンプリングを、固定イドガウスベクトルの予め定義されたコードブックから選択したノイズサンプルに置き換えることによって得られる。
DDCMを利用して、与えられた画像に最もよくマッチするコードブックからノイズを抽出し、生成モデルを高能率な損失画像に変換する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 06:55:42 GMT)
Catoni Contextual Bandits are Robust to Heavy-tailed Rewards [31.4] 頑健な統計量からカトニ推定器上にアルゴリズム的アプローチを構築する。
我々は、累積的な報酬分散と対数的に報酬範囲の$R$にのみ依存する後悔境界を確立する。
アルゴリズムはまた、対数的報酬範囲依存を伴う分散ベースのバウンダリも享受する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:03:32 GMT)
DAMO: Data- and Model-aware Alignment of Multi-modal LLMs [31.1] 本稿では,データとモデルを考慮したDPO(DAMO)を提案し,最適化プロセスを2つの重要な側面から調整する。
この2つの戦略を組み合わせることで、DAMOはモデルが様々なレベルの硬さを持つデータに効果的に適応できるようにする。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:30:36 GMT)
Event-aided Semantic Scene Completion [31.0] DSEC-SSCは,イベント支援セマンティックシーンコンプリート(SSC)に特化して設計された,世界初の実世界のベンチマークである。
提案するRGB-Event融合フレームワークであるEvSSCでは,2D RGB-Event 機能を 3D 空間に効果的にブリッジする Event-Aided Lifting Module (ELM) が導入された。
運動ぼけおよび極端気象条件下でのEvSSCの優位性を定量的に定性的に検証した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:12:24 GMT)
TabPFN Unleashed: A Scalable and Effective Solution to Tabular Classification Problems [30.6] TabPFNは、有望なコンテキスト内学習モデルとして登場した。
ラベル付きトレーニング例からテストサンプルのラベルを直接予測することができる。
これは、特に小規模の分類タスクにおいて、競争力を発揮している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:49:44 GMT)
ImageNet-RIB Benchmark: Large Pre-Training Datasets Don't Always Guarantee Robustness after Fine-Tuning [30.4] 我々は、新しい堅牢な微調整ベンチマーク ImageNet-RIB (Robustness Inheritance Benchmark) を導入する。
最適なトランスポートによって測定された事前トレーニングデータセットと下流データセットの距離は、事前トレーニングデータセットでこのパフォーマンス劣化を予測する。
対照的に、関連する下流タスクを微調整した後のモデルロバスト性は、トレーニング前のデータセットが最も豊かで、最も多様である場合に最悪のものとなる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 21:37:53 GMT)
Rethinking Homogeneity of Vision and Text Tokens in Large Vision-and-Language Models [29.6] 本稿では,視覚とテキストの埋め込みを別々に処理する新しい手法であるDe Attention (D-Attn)を提案する。
D-Attn は視覚と視覚の自己注意を対角化し、計算を $mathcalO(|V|2)$から $mathcalO(|V|)$ for $|V|$ に還元する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 00:46:11 GMT)
Can LLMs Maintain Fundamental Abilities under KV Cache Compression? [29.5] 我々は,KVキャッシュ圧縮手法を,世界知識,コモンセンス推論,算術推論,コード生成,安全性,長文理解・生成など多種多様なタスクにわたって評価する。
解析の結果,KVキャッシュ圧縮手法はタスク固有の性能劣化を示すことがわかった。
ショットレベルのセマンティックコヒーレンスを維持しつつ、プリフィルとデコードフェーズを明確に扱う新しい圧縮手法ShotKVを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:23:06 GMT)
Orientation-Aware Graph Neural Networks for Protein Structure Representation Learning [29.4] タンパク質構造の幾何学的特性をよりよく把握するために,オリエンテーション対応グラフニューラルネットワーク(OAGNN)を提案する。
スカラーから3次元ベクトルへの1つの重みを拡張し、幾何学的に意味のある演算のリッチなセットを構築する。
実験により、OAGNNは古典的ネットワークと比較して幾何方向の特徴を感知する優れた能力を持っていることが示された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:19:43 GMT)
Multi-objective Evolution of Heuristic Using Large Language Model [29.3] 探索を多目的最適化問題としてモデル化し、最適性能を超える追加の実践的基準を導入することを検討する。
我々は,最初の多目的探索フレームワークである多目的ヒューリスティック進化(MEoH)を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:06:39 GMT)
PhysPart: Physically Plausible Part Completion for Interactable Objects [28.9] 我々は、相互作用可能なオブジェクトに対する物理的に妥当な部分補完の問題に取り組む。
幾何学的条件付けを利用した拡散型部分生成モデルを提案する。
また、3Dプリンティング、ロボット操作、シーケンシャル部分生成にも応用しています。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:39:54 GMT)
Comparative Analysis of FPGA and GPU Performance for Machine Learning-Based Track Reconstruction at LHCb [28.6] 大型ハドロン衝突型加速器における光度と粒度の増加は、より効率的なデータ処理ソリューションの必要性を喚起している。
荷電粒子トラックのための有望なツールとして機械学習が登場した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:18:51 GMT)
UD-Mamba: A pixel-level uncertainty-driven Mamba model for medical image segmentation [28.4] 不確実性駆動型マンバ(UD-Mamba)は、走査機構にチャネル不確かさを組み込むことで、画素順走査プロセスを再定義する。
UD-Mambaは, 1) 連続走査, 連続走査, 行ごとの走査による高不確実性領域の優先順位付け, 2) カラムを垂直に処理し, 一定間隔でハイ・ロー・ロー・ハイ・ハイ・ハイ・インテリジェンスから移動させるスキップ走査という2つの重要な走査手法を導入している。
本手法は, 病理, 皮膚疾患, 心的タスクを含む3つの異なる医用画像データセットにまたがって, 堅牢なセグメンテーション性能を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:20:33 GMT)
Token Cleaning: Fine-Grained Data Selection for LLM Supervised Fine-Tuning [28.3] 事前トレーニングの後、高品質なサンプルであっても、タスク関連のないパターンやフレーズは冗長あるいは非形式的である可能性がある。
本稿では,ノイズ-ラベルの観点からトークンの品質を調査し,SFTタスクのための汎用的なトークンクリーニングパイプラインを提案する。
私たちのフレームワークは、複数のダウンストリームタスクのパフォーマンスを継続的に改善します。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:26:58 GMT)
Layer by Layer: Uncovering Hidden Representations in Language Models [28.3] 中間層がよりリッチな表現をエンコードできることを示し、ダウンストリームタスクの幅広いパフォーマンスを改善することがよくある。
本フレームワークでは,各モデル層が情報圧縮と信号保存のバランスをとる方法を強調している。
これらの知見は、最終層埋め込みに標準的焦点をあて、モデル解析と最適化のための新しい方向を開くことに挑戦する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:03:42 GMT)
Do Graph Diffusion Models Accurately Capture and Generate Substructure Distributions? [28.2] 拡散モデルは、複素グラフデータの分布スコアを正確にモデル化する普遍的な表現性を持っていない。
本研究は,対象とするグラフ分布の鍵となる特徴として,特定の部分構造の周波数に着目して,この制限に対処する。
グラフニューラルネットワーク(GNN)の表現性とグラフ拡散モデル全体の性能との理論的関係を確立する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:04:16 GMT)
Towards Pixel-Level Prediction for Gaze Following: Benchmark and Approach [27.8] 本稿ではGazeSegという新しい視線目標予測手法を提案する。
人物の空間的視野を案内情報として完全に活用し、徐々に粗い視線目標のセグメンテーションと認識プロセスへと導くことができる。
本手法は、視線目標セグメンテーションにおける0.325のDiceと、71.7%のトップ5認識を実現する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:24:56 GMT)
VisionTS: Visual Masked Autoencoders Are Free-Lunch Zero-Shot Time Series Forecasters [27.8] 本稿では,リッチで高品質な自然画像からTSFファンデーションモデルを構築するための新しい道を探る。
画像再構成タスクとしてTSFを再構成することにより、画像事前学習とTSF下流タスクのギャップを埋める。
提案されたVisionTSは、既存のTSFファンデーションモデルよりもゼロショット予測性能が向上する可能性がある。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:37:48 GMT)
Adaptive Prompt: Unlocking the Power of Visual Prompt Tuning [27.7] Visual Prompt Tuning (VPT)は、トレーニング済みの視覚モデルを下流タスクに適応するための強力な方法として登場した。
入力の適応関数としてプロンプトを再定義する新しい世代のプロンプトであるVisual Adaptive Prompt Tuning (VAPT)を提案する。
我々の理論解析は,VAPTが最適な試料効率を実現することを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:30:35 GMT)
Using Random Noise Equivariantly to Boost Graph Neural Networks Universally [27.5] グラフニューラルネットワーク(GNN)は、様々なタスクにおける表現性を高めるために、入力機能としてランダムノイズの可能性を探っている。
本稿では,GNNにランダムノイズを発生させる際のサンプルの複雑さの増大を,慎重に設計することなく解明する理論的枠組みについて述べる。
本稿では, 雑音の対称特性を利用して, サンプルの複雑さとボスターの一般化を実現するアーキテクチャであるEquivariant Noise GNN (ENGNN)を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:54:28 GMT)
ReSpark: Leveraging Previous Data Reports as References to Generate New Reports with LLMs [27.3] 既存のデータレポートを参照として活用して新しいデータを生成するLLMベースの手法であるReSparkを提案する。
データテーブルが与えられた後、ReSparkは類似のトピックレポートを検索し、分析対象に対応する相互依存セグメントに解析し、新しいデータで実行する。
ReSparkを使うと、ユーザはリアルタイムのアウトプットをレビューしたり、新しい目的を挿入したり、レポートの内容を変更することができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:00:32 GMT)
TUMTraffic-VideoQA: A Benchmark for Unified Spatio-Temporal Video Understanding in Traffic Scenes [26.9] 複雑なトラフィックシナリオを理解するために設計されたデータセットとベンチマークであるTUMTraffic-VideoQAを提案する。
データセットには85,000対の複数選択ペア、2,300のオブジェクトキャプション、5,700のオブジェクトアノテーションが含まれており、悪天候や交通異常などのさまざまな現実世界の状況を含んでいる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:14:40 GMT)
Three-dimensional signal processing: a new approach in dynamical sampling via tensor products [26.4] 本稿では3次元信号回復の文脈における動的サンプリング問題に焦点をあてる。
具体的には、3次元信号の回復を確実にするサンプリングセットに必要な条件を提供する。
我々は、効率的に解決できる最適化タスクとして再構築問題を再構築する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:51:15 GMT)
Adaptive Exploration for Multi-Reward Multi-Policy Evaluation [26.0] オンラインマルチリワードマルチ政治ディスカウント設定における政策評価問題
我々は、$epsilon$-accurate 推定の観点を採用して、有限あるいは凸な報酬の集合に対して$epsilon$accurate 推定を達成する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:35:51 GMT)
Adaptive Resource Allocation Optimization Using Large Language Models in Dynamic Wireless Environments [25.9] 現在のソリューションはドメイン固有のアーキテクチャや技術に依存しており、制約付き最適化のための一般的なDLアプローチは未開発のままである。
本稿では,制約を順守しながら複雑な資源配分問題に対処するために,資源割当(LLM-RAO)のための大規模言語モデルを提案する。
LLM-RAO は従来の DL 法と比較して最大40% の性能向上を実現し,分析手法よりも80$% 向上した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:56:59 GMT)
Action-based image editing guided by human instructions [25.7] 本稿では,アクションテキストの指示に敏感な新しいモデルを提案する。
アクションベースのテキスト命令と高い推論機能を用いた画像編集の大幅な改善を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:44:13 GMT)
Extracting Problem Structure with LLMs for Optimized SAT Local Search [25.4] ローカル検索前処理は、Conflict-Driven Clause Learning (CDCL)を高速化する。
本稿では,Large Language Models (LLM) を用いてPythonの符号化コードを解析する手法を提案する。
本手法は,隠れ構造パターンを見つけるための局所探索アルゴリズムを自動生成する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:55:19 GMT)
Faster Vision Mamba is Rebuilt in Minutes via Merged Token Re-training [25.2] Vision Mambaで情報トークンを発行すると、重要な知識が失われ、パフォーマンスが低下する。
特にVim-Tiでの3回のトレーニングで35.9%の精度が急上昇した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:39:49 GMT)
Efficient Dynamic Scene Editing via 4D Gaussian-based Static-Dynamic Separation [25.0] 最近の4D動的シーン編集手法では、動的シーン合成に使用される数千の2D画像を編集する必要がある。
これらの手法は動的シーンの時間次元に関して拡張性がない。
本研究では,時間次元の面でよりスケーラブルな動的シーン編集手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:18:49 GMT)
Decision Theoretic Foundations for Conformal Prediction: Optimal Uncertainty Quantification for Risk-Averse Agents [24.9] リスク・逆の意思決定を伴う予測セットを用いて不確実性と接続する意思決定理論の基礎を開発する。
医療診断やレコメンデーションシステムなどの応用におけるリスク・アバース(RAC)の意義を実験的に実証した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:37:10 GMT)
A Black-Box Evaluation Framework for Semantic Robustness in Bird's Eye View Detection [24.7] 我々は,BEVモデルを騙すために3つの一般的な意味摂動を逆向きに最適化するロバストネス評価フレームワークを開発する。
セマンティック摂動を最適化することで生じる課題に対処するため、mAPメトリックを置き換えるスムーズな距離に基づく代理関数を設計する。
最近の10種類のBEVモデルのセマンティックロバスト性に関するベンチマークを提供する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:45:18 GMT)
SAMPro3D: Locating SAM Prompts in 3D for Zero-Shot Instance Segmentation [24.7] 3DシーンのゼロショットインスタンスセグメンテーションにSAMPro3Dを導入する。
提案手法は,2次元フレームに事前訓練されたセグメンション任意のモデル(SAM)を適用することで,3次元インスタンスをセグメント化する。
提案手法は,従来のゼロショットや完全教師付きアプローチと比較して,同等あるいは優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:40:44 GMT)
Contextual Self-paced Learning for Weakly Supervised Spatio-Temporal Video Grounding [24.7] Weakly Supervised S-Temporal Video Grounding (WSTVG) に注目した。
まず、WSTVGの最先端オブジェクト検出モデルの可能性について検討する。
頑丈なゼロショット機能にもかかわらず、我々の適応には大きな制限がある。
本稿では,これらの制約を克服するための新しいアプローチであるCoSPaLを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:30:08 GMT)
Can LLMs Replace Manual Annotation of Software Engineering Artifacts? [24.6] 大規模言語モデル(LLM)は、最近、いくつかの領域で人間レベルのパフォーマンスを実証し始めた。
本稿では、コードやコード関連アーティファクトの評価において、より安価なLCMクエリーでコストのかかる被験者を代用する可能性について検討する。
以上の結果から,LLMを人体アノテーションに置き換えることで,人体・人体・人体間の合意に等しいあるいは近い契約が成立する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:37:06 GMT)
Boosting Multimodal Reasoning with MCTS-Automated Structured Thinking [24.4] MLLM(Multimodal large language model)は印象的な能力を示すが、複雑な視覚的推論の課題に直面している。
我々はモンテカルロ木探索(MCTS)によるマルチモーダル推論のための自動構造化思考パラダイムであるAStarを提案する。
AStarはMCTSを使った階層構造を用いて、限られたデータから高レベルの認知的推論パターンを自動的に導き出す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:18:29 GMT)
Decentralized Federated Learning with Model Caching on Mobile Agents [24.3] フェデレートラーニング(FL)は、中央サーバーで調整された分散エージェントにデータと計算能力を使って共有モデルを訓練する。
分散FL(DFL)は、エージェント間のローカルモデル交換とアグリゲーションを利用して、中央サーバ上の通信オーバーヘッドを低減する。
本稿では,モバイルエージェント上でのモデルキャッシングによって実現される遅延耐性モデルの普及とアグリゲーションを検討するために,キャッシュ型分散フェデレートラーニング(Cached-DFL)を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:14:22 GMT)
scBIT: Integrating Single-cell Transcriptomic Data into fMRI-based Prediction for Alzheimer's Disease Diagnosis [24.3] scBITは、fMRIと単一核RNA(snRNA)を組み合わせてアルツハイマー病(AD)の予測を強化する新しい方法である
snRNAデータを細胞型特異的な遺伝子ネットワークに分割するサンプリング戦略を採用し、自己説明可能なグラフニューラルネットワークを使用してクリティカルなサブグラフを抽出する。
広範囲にわたる実験により、cBITが複雑な脳領域-遺伝子関連を明らかにする効果が検証された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:37:46 GMT)
InfantCryNet: A Data-driven Framework for Intelligent Analysis of Infant Cries [24.1] 本稿では,これらのタスクを実現するための新しいデータ駆動フレームワーク"InfantCryNet"を提案する。
事前学習された音声モデルを用いて、事前知識をモデルに組み込む。
実生活データセットの実験は、提案フレームワークの優れた性能を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:23:05 GMT)
Hybrid LLM-DDQN based Joint Optimization of V2I Communication and Autonomous Driving [23.7] 大規模言語モデル(LLM)は、その卓越した推論と理解能力により、最近かなりの関心を集めている。
本研究は、車両間通信(V2I)と自律運転(AD)ポリシーを共同で最適化することを目的として、車載ネットワークにLLMを適用することを検討する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:38:26 GMT)
Twilight: Adaptive Attention Sparsity with Hierarchical Top-$p$ Pruning [23.6] Twilightは、既存のスパースアテンションアルゴリズムに適応性をもたらすフレームワークである。
Twilightは、冗長トークンの少なくとも98%で適応的にプルーし、自己アテンション操作で15.4タイム=アクセラレーション、トークン毎のエンドツーエンドでのアクセラレーションで3.9タイム=アクセラレーションを実現している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:26:10 GMT)
Efficient Extensions for Asynchronous Byzantine Agreement via Weak Agreement [23.3] 我々は、$n$パーティの非同期ネットワークを、最大$t$で、そのうちの最大$t$はビザンチンであり、$t fracn3$失敗は、$ell$-bit入力のビザンチン合意(BA)を、$ell$-bit入力の1つのインスタンス、$ell$-bit入力の1つのインスタンス、バイナリBAと$Theta(ell n + n2)$追加通信のビットに還元する。
我々のWAプロトコルはどちらも、バイナリBAから多値BAへの最先端の情報理論拡張につながります。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:44:41 GMT)
Efficient Attention-Sharing Information Distillation Transformer for Lightweight Single Image Super-Resolution [23.3] Transformer-based Super-Resolution (SR) 法は畳み込みニューラルネットワーク (CNN) 法に比べて優れた性能を示した。
本稿では,トランスフォーマーを用いたSR方式に特化して設計された,アテンション共有と情報蒸留構造を統合した軽量SRネットワークを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:24:45 GMT)
Combinatorial Optimization Perspective based Framework for Multi-behavior Recommendation [23.3] 本稿では,COPF という最適化視点に基づく新しいマルチビヘイビア・レコメンデーション・フレームワークを提案する。
予測ステップでは,複数の専門家の生成と集約において,前向きと後向きの両方の伝搬を改善する。
3つの実世界のデータセットの実験は、COPFの優位性を示している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:19:47 GMT)
LoRA-TTT: Low-Rank Test-Time Training for Vision-Language Models [23.2] 視覚言語モデル(VLM)のための新しいテスト時間訓練(TTT)法であるLoRA-TTTを提案する。
テスト期間中にLoRAを導入し,パラメータのみを更新することにより,本手法は単純かつ効果的なTTTアプローチを提供する。
本手法は,メモリ消費や実行量を増やすことなく,これらの2つの損失を組み合わせ,多様な領域に適応することができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:40:26 GMT)
CVaR-Based Variational Quantum Optimization for User Association in Handoff-Aware Vehicular Networks [23.1] 本稿では、車両ネットワーク(VNet)における一般化代入問題(GAP)に対処するための、CVaRに基づく変動量子固有解法(VQE)フレームワークを提案する。
提案手法は, 目的と制約固有のペナルティのバランスを保ち, 解の質と安定性を向上させるために, 調整されたコスト関数を統合するハイブリッド量子古典構造を利用する。
本稿では,この枠組みを,ディープニューラルネットワーク(DNN)アプローチと比較して23.5%改善したVNetのユーザ連想問題に適用する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:51:53 GMT)
Can LLMs Assist Annotators in Identifying Morality Frames? -- Case Study on Vaccination Debate on Social Media [23.0] 大規模言語モデル(LLM)は、数ショットの学習を通じて新しいタスクを適応できる。
本研究は,ソーシャルメディア上での予防接種討論において,人間アノテータによる道徳的枠組みの同定を支援するLLMの可能性を探るものである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:10:23 GMT)
SHIELD: APT Detection and Intelligent Explanation Using LLM [22.9] 高度な永続的脅威(APT)は、長期にわたって検出されない高度なサイバー攻撃である。
既存のプロファイランスに基づく攻撃検出手法は、しばしば解釈可能性に欠け、高い偽陽性率に悩まされる。
統計的異常検出とグラフに基づく解析と,大規模言語モデルの文脈解析機能を組み合わせた新しい手法である ShiELD を導入する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:20:51 GMT)
Rule-ATT&CK Mapper (RAM): Mapping SIEM Rules to TTPs Using LLMs [22.8] Rule-ATT&CK Mapper (RAM)は構造化SIEMルールをMITRE ATT&CK技術にマッピングするフレームワークである。
RAMのマルチステージパイプラインは、プロンプトチェーン技術にインスパイアされたもので、LLM事前トレーニングや微調整を必要とせずにマッピング精度を向上させる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:16:02 GMT)
HetGPT: Harnessing the Power of Prompt Tuning in Pre-Trained Heterogeneous Graph Neural Networks [22.8] HetGPTは、グラフニューラルネットワークのトレーニング後プロンプトフレームワークである。
半教師付きノード分類における最先端HGNNの性能を向上させる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:15:39 GMT)
VaiBot: Shuttle Between the Instructions and Parameters [22.7] 本稿では、推論タスクと帰納タスクの両方を均一にモデル化し、学習し、推論するように設計された、VAEとVIBを統合したニューラルネットワークフレームワークであるVaiBotを提案する。
VaiBotが既存のベースラインメソッドと同等に動作し、インダクティブ能力でそれらをはるかに上回っていることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:36:54 GMT)
Images that Sound: Composing Images and Sounds on a Single Canvas [22.7] 自然画像と自然音声とを併用した分光図の合成が可能であることを示す。
我々のアプローチは単純でゼロショットであり、事前訓練されたテキスト・ツー・イメージとテキスト・トゥ・スペクトログラム拡散モデルを利用する。
提案手法は,所望の音声プロンプトと一致したスペクトログラムを生成すると同時に,所望の映像プロンプトの視覚的外観を抽出する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:00:25 GMT)
Interaction Matters: An Evaluation Framework for Interactive Dialogue Assessment on English Second Language Conversations [22.6] 第二言語話者としての英語の文脈における対話的対話評価のための評価フレームワークを提案する。
本フレームワークは,対話レベルの対話性ラベルとマイクロレベルのスパン特徴を収集する。
各種機械学習モデルの構築により,マイクロレベルの特徴がESL対話の(高レベルな)相互作用品質に与える影響について検討した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:58:11 GMT)
Sparse Data Generation Using Diffusion Models [22.6] 本稿では,スパースデータを生成する新しい手法であるスパースデータ拡散(SDD)を紹介する。
SDDは、生成されたデータの品質を保ちながら、データ空間の表現において高い忠実性を達成する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:14:28 GMT)
LLMER: Crafting Interactive Extended Reality Worlds with JSON Data Generated by Large Language Models [22.5] 大規模言語モデル(LLM)と拡張現実性(XR)技術の統合は、真の没入型XR環境を構築する可能性を提供します。
XR環境の複雑さにより、XRアーティファクトの圧倒的な量から関連するコンテキストデータやシーン/オブジェクトパラメータを正確に抽出することが困難になる。
これらの課題を克服するために,LLMERを用いたインタラクティブな世界を創出する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:08:48 GMT)
Mitigating Object Hallucinations in Large Vision-Language Models via Attention Calibration [22.4] LVLM(Large Vision-Language Models)は、視覚的コンテンツと実際に一致しない応答を生成する。
我々は、単一の意味のない入力画像からバイアスを推定する、トレーニング不要なソリューションUniform Attention (UAC)を導入する。
また、画像中のオブジェクトがどこにあっても一貫した出力を強制する、微調整ソリューションであるDynamic Attention (DAC)を導入します。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:27:38 GMT)
EALD-MLLM: Emotion Analysis in Long-sequential and De-identity videos with Multi-modal Large Language Model [22.3] EALDと呼ばれる長周期・非同一性ビデオにおける感情分析のためのデータセットを構築した。
また,NFBL(Non-Facial Body Language)アノテーションを各プレイヤーに提供します。
NFBLは内向きの感情表現であり、感情状態を理解するためのアイデンティティフリーな手がかりとして機能する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:57:52 GMT)
JailbreakEval: An Integrated Toolkit for Evaluating Jailbreak Attempts Against Large Language Models [21.9] ジェイルブレイク攻撃は、有害な応答を生成するために大規模言語モデル(LLM)を誘導する。
ジェイルブレイクの評価には合意がない。
JailbreakEvalは、jailbreakの試みを評価するツールキットである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:04:22 GMT)
Foundation Models for CPS-IoT: Opportunities and Challenges [21.8] 機械学習(ML)の手法は,CPS(Cyber-Physical Systems)とIoT(Internet of Things)における知覚認知コミュニケーションループの実装を変革した。
タスクに依存しない基礎モデル(FM)の成功は、CPS-IoT分析パイプラインの柔軟なビルディングブロックとしてFMを探求するための熱意を生み出した。
CPS-IoTドメインにおけるFMと大規模言語モデル(LLM)の現在の機能と、CPS-IoTアプリケーションで実行可能な要件との間には、大きなギャップが持続する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 21:21:49 GMT)
Improving Generalization Ability for 3D Object Detection by Learning Sparsity-invariant Features [21.8] 単一領域における3次元物体検出の一般化能力を向上させる手法を提案する。
1つのソースドメインから空間不変の特徴を学習するために、ソースデータを特定のビームに選択的にサブサンプリングする。
我々はまた、異なる点の雲の密度にBird’s Eye View機能を調整するために、教師学生のフレームワークも使用しています。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:47:02 GMT)
Cryogenic Thermal Modeling of Microwave High Density Signaling [21.7] 超伝導量子コンピュータは、室温から希釈冷凍機の混合室まで走る制御線を必要とする。
SC-086/50-SCN-CN半剛性同軸ケーブルの熱負荷について検討した。
記述されたアーキテクチャの理論的上限はおよそ200キュービットである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:38:24 GMT)
MATCNN: Infrared and Visible Image Fusion Method Based on Multi-scale CNN with Attention Transformer [21.6] 本稿では,アテンショントランスフォーマを用いたマルチスケール畳み込みニューラルネットワーク(MATCNN)に基づく,新しいクロスモーダル画像融合手法を提案する。
MATCNNは、MSFM(Multi-scale fusion Module)を用いて異なるスケールで局所的特徴を抽出し、グローバル特徴抽出モジュール(GFEM)を用いてグローバル特徴を抽出する。
情報マスクを用いて画像内の関連する詳細をラベル付けし、融合画像中の可視画像における赤外線画像および背景テクスチャにおける重要な情報保存の比率を高める。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:09:54 GMT)
Optimal Spectral Transitions in High-Dimensional Multi-Index Models [21.6] 本稿では,この問題に適したメッセージパッシング方式の線形化に基づくスペクトルアルゴリズムを提案する。
本研究では,提案手法が最適復元しきい値を達成することを示す。
数値実験と厳密な理論的枠組みによって支援され、我々はマルチインデックスモデルにおける弱い学習可能性の計算限界における臨界ギャップを橋渡しする。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:15:51 GMT)
Denoising with a Joint-Embedding Predictive Architecture [21.4] 私たちはD-JEPA(Joint-Embedding Predictive Architecture)でDenoisingを紹介します。
本稿では,JEPAをマスク画像モデリングの一形態として認識することにより,一般化した次世代予測戦略として再解釈する。
また,拡散損失を利用して確率分布をモデル化し,連続空間におけるデータ生成を可能にする。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:53:18 GMT)
Coherence Awareness in Diffractive Neural Networks [21.3] 拡散ネットワークでは空間コヒーレンス(空間コヒーレンス)の程度が劇的な効果を持つことを示す。
特に、物体の空間的コヒーレンス長が光学系で保存される最小の特徴量に匹敵する場合、非コヒーレントおよびコヒーレント極端は許容できる近似として機能しないことを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:35:58 GMT)
IDProtector: An Adversarial Noise Encoder to Protect Against ID-Preserving Image Generation [21.1] 本稿では,1つのフォワードパスのポートレート写真に対して,非知覚的な逆方向ノイズを印加する逆方向ノイズエンコーダであるIDProtectorを紹介する。
我々のアプローチは、InstantID、IP-Adapter、PhotoMakerなど、最先端のエンコーダベースの複数のメソッドに対して、ポートレートを普遍的に保護する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:08:27 GMT)
An Information-Theoretic Analysis of Thompson Sampling with Infinite Action Spaces [21.0] 本稿では,バンディット問題に対するトンプソンサンプリングアルゴリズムのベイズ的後悔について考察する。
これはRussoとVan Royが導入した情報理論フレームワークに基づいている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:12:27 GMT)
BadRobot: Jailbreaking Embodied LLMs in the Physical World [21.0] Embodied AIは、AIが物理的エンティティに統合されるシステムを表す。
大きな言語モデル(LLM)は強力な言語理解能力を示す。
我々は,従来の音声ベースのユーザシステムインタラクションを通じて,LLMを安全性や倫理的制約に違反させることを目的とした,新たな攻撃パラダイムであるBadRobotを紹介した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:24:35 GMT)
A Periodic Bayesian Flow for Material Generation [20.6] 周期的ベイズ流の提案による新しい結晶生成法であるCrysBFNを紹介する。
周期的ベイズ流の概念を実現するために、CrysBFNは新しいエントロピー条件機構を統合する。
CrysBFNの結晶生成と結晶構造予測の両方に関する実験は、CrysBFNの優位性を実証している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:07:13 GMT)
On Behalf of the Stakeholders: Trends in NLP Model Interpretability in the Era of LLMs [20.6] この記事では、なぜ解釈可能性が必要なのか、どのように解釈されているのか、という3つの根本的な疑問に対処する。
これらの質問を探索することにより、既存の解釈可能性パラダイム、それらの特性、および異なる利害関係者との関係について検討する。
分析の結果,NLP開発者と非開発者ユーザ,および研究分野の相違が明らかとなり,利害関係者の多様なニーズを浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:01:59 GMT)
Plan*RAG: Efficient Test-Time Planning for Retrieval Augmented Generation [20.5] Plan*RAGは、検索強化世代(RAG)における構造化マルチホップ推論を可能にするフレームワーク
Plan*RAGは、RQ-RAGやSelf-RAGといった最近提案された手法よりも一貫して改善されている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:30:36 GMT)
DiffBreak: Breaking Diffusion-Based Purification with Adaptive Attacks [20.2] 拡散型浄化(DBP)は、敵例(AEs)に対する防御基盤として登場した。
適応的勾配に基づく攻撃がこの基礎的主張を無効にすることを示す。
本稿では,近年のディープフェイク透かしに対する最適化手法の新たな適用法を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:04:20 GMT)
Data Overvaluation Attack and Truthful Data Valuation [20.0] 本稿では、戦略的クライアントがデータを著しく過大評価できる最初のデータ過大評価攻撃について紹介する。
我々は、Trath-Shapleyという真のデータ評価指標を提案する。
実験では,データ過大評価攻撃に対する既存のデータ評価指標の脆弱性を実証し,Trth-Shapleyの堅牢性と有効性を検証する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:36:53 GMT)
Covariances for Free: Exploiting Mean Distributions for Federated Learning with Pre-Trained Models [19.7] 最近の研究は、サーバにおけるローカルクライアントデータの分布を集約するために、一階統計と二階統計の利用を調査している。
クラス共分散行列の非バイアス推定器に基づく学習自由度推定法を提案する。
クラス形式で一階統計のみを使用する手法は,クライアントがサーバに通信する手段であり,二階統計を通信する手法によって要求される通信コストのごく一部しか発生しない。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:11:28 GMT)
UFID: A Unified Framework for Input-level Backdoor Detection on Diffusion Models [19.5] 拡散モデルはバックドア攻撃に弱い。
UFIDと呼ばれる拡散モデルに基づくブラックボックス入力レベルのバックドア検出フレームワークを提案する。
本手法は,検出効率と実行時間効率において高い性能を実現する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:18:40 GMT)
Better Understandings and Configurations in MaxSAT Local Search Solvers via Anytime Performance Analysis [19.4] 本稿では,MaxSATの局所探索性能を常に比較するために,経験的累積分布関数を用いることを実証する。
この研究は、任意の時間パフォーマンスの量的および高いばらつきが、マシンにより良いパラメータ設定を求めるためのガイドとなることも示している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:41:51 GMT)
LAST SToP For Modeling Asynchronous Time Series [19.4] Asynchronous Time Series に合わせたLarge Language Models (LLM) のための新しいプロンプト設計を提案する。
我々のアプローチはイベント記述のリッチな自然言語を効果的に活用し、LLMはさまざまなドメインやタスクをまたがる推論において、広範囲にわたる知識の恩恵を受けることができる。
さらに、モデル性能を大幅に向上させる新しいプロンプトチューニング機構であるSoft Promptingを導入し、QLoRAのような既存の微調整方法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:42:45 GMT)
Intelligent Sensing-to-Action for Robust Autonomy at the Edge: Opportunities and Challenges [19.4] ロボット、スマートシティ、自動運転車における自律エッジコンピューティングは、センサー、処理、アクチュエーターのシームレスな統合に依存している。
中心となるのは、センサー入力と計算モデルとを反復的に整列させて適応制御戦略を駆動するセンサー・ツー・アクション・ループである。
本稿では、能動的、文脈対応型センシング・ツー・アクションとアクション・トゥ・センシングの適応によって効率が向上する方法について論じる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:13:58 GMT)
ShapeShifter: 3D Variations Using Multiscale and Sparse Point-Voxel Diffusion [19.3] 本稿では,単一参照モデルに基づいて形状変化を合成する新しい3次元生成モデルであるShapeShifterを提案する。
その結果, 従来のSDF法よりも, 入力の細部をより正確に把握し, より汎用的な表面形状を処理できることが示唆された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:02:40 GMT)
Toward a Low-Cost Perception System in Autonomous Vehicles: A Spectrum Learning Approach [19.2] 本稿では,Bartlettの空間スペクトル推定手法に着想を得た新しい画素位置符号化アルゴリズムを提案する。
提案手法は,高分解能カメラ画像を利用してレーダ深度マップ生成モデルを訓練する。
提案手法は,一方向チャンファー距離(UCD)において,最先端技術(SOTA)を27.95%向上させることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:20:52 GMT)
VLA-Cache: Towards Efficient Vision-Language-Action Model via Adaptive Token Caching in Robotic Manipulation [18.8] VLA(Vision-Language-Action)モデルでは、命令と視覚知覚を処理して、出力としてアクションを直接生成することができる。
これにより、ロボットタスクにVLAモデルを適用する上での課題が提起される。
自然な考え方は、変化のない視覚トークンの計算結果を最終段階から再利用することである。
VLA-Cacheにはトークン選択機構が組み込まれており、各ステップにおける視覚的入力と前ステップからの入力を比較し、最小限の変更で視覚的トークンを適応的に識別する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:48:14 GMT)
ReGNet: Reciprocal Space-Aware Long-Range Modeling and Multi-Property Prediction for Crystals [18.7] 本稿では、幾何学的GNNと相互ブロックを統合して、短距離および長距離の相互作用をモデル化する新しいアーキテクチャReGNetを紹介する。
また,マルチタスク拡張であるReGNet-MTを導入する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:31:39 GMT)
Towards Consistent and Controllable Image Synthesis for Face Editing [18.6] 現在の顔編集法は主にGANに基づく手法に依存しているが、近年では画像再構成の成功により拡散モデルに焦点が移っている。
本研究では,静止拡散モデルと粗い3次元顔モデルのパワーを利用して,肖像画の照明,表情,頭部ポーズを制御する新しいアプローチを提案する。
我々のモデルは、既存の顔編集モデルと比較して、アイデンティティ保存とフォトリアリズムの両方において同等またはそれ以上の性能を達成している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:36:07 GMT)
Multiple Instance Learning with Coarse-to-Fine Self-Distillation [18.4] 計算病理学における全スライド画像(WSI)解析のための多重インスタンス学習(MIL)は、しばしばインスタンスレベルの学習を無視する。
本稿では,(1)インスタンスレベルの監視と(2)バッグレベルのインスタンス間コンテキスト情報学習という2つの観点からMILを改善するためのフレームワークであるPathMILを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:41:02 GMT)
DERMARK: A Dynamic, Efficient and Robust Multi-bit Watermark for Large Language Models [18.0] 動的,効率的,堅牢なマルチビット透かし方式であるDERMARKを提案する。
DERMARKはテキストを各ビットの埋め込みごとに異なる長さのセグメントに分割し、テキストの容量に適応的に適合する。
これは、透かし抽出損失を最小限に抑えて、テキスト編集に対して無視できるオーバーヘッドと堅牢な性能で実現される。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:23:49 GMT)
P4GCN: Vertical Federated Social Recommendation with Privacy-Preserving Two-Party Graph Convolution Network [17.9] プライバシ保護二要素グラフ畳み込みネットワーク(P4GCN)を利用した新しい縦型ソーシャルレコメンデーション手法を提案する。
P4GCNは推奨精度で最先端の手法より優れている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:46:27 GMT)
Pseudo-Physics-Informed Neural Operators: Enhancing Operator Learning from Limited Data [17.8] PPI-NO(Pseudo Physics-Informed Neural Operator)フレームワークを提案する。
PPI-NOは、基本微分作用素から導かれる偏微分方程式(PDE)を用いて、対象系に対する代理物理系を構築する。
このフレームワークは,データ共有シナリオにおける標準演算子学習モデルの精度を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:50:06 GMT)
Policy-Guided Causal State Representation for Offline Reinforcement Learning Recommendation [17.8] Policy-Guided Causal Representation (PGCR)は、オフラインRLRSにおける因果的特徴選択と状態表現学習のための新しい2段階フレームワークである。
PGCRはリコメンデーション性能を大幅に改善し,オフラインRLベースのレコメンデーションシステムの有効性を確認した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:58:20 GMT)
Neural Collapse Beyond the Unconstrained Features Model: Landscape, Dynamics, and Generalization in the Mean-Field Regime [17.7] ニューラル崩壊(Neural Collapse)は、よく訓練されたニューラルネットワークの最終層表現が高度に構造化された幾何学に収束する現象である。
本稿では、NC1として知られる最初の(そして最も基本的な)特性に焦点を当てる。
我々はNC1を3層ニューラルネットワークで解析し、最初の2層は平均場状態で動作し、次に線形層で処理する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:16:07 GMT)
Exploring Spatial Language Grounding Through Referring Expressions [17.5] 視覚言語モデル(VLM)による空間推論評価のためのプラットフォームとして参照表現タスクを提案する。
このプラットフォームは,1)対象検出の曖昧さ,2)より長い文構造と複数の空間関係を持つ複雑な空間表現,3)否定を伴う表現("not")について,空間的理解と接地能力のより深い分析を行う機会を提供する。
本研究は,これらの課題と行動に注目し,研究のギャップと今後の方向性について考察する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:58:15 GMT)
Fairness through Difference Awareness: Measuring Desired Group Discrimination in LLMs [17.4] 我々は、様々な重要な設定において、グループ差の認識が重要であると論じている。
16kの質問に対して8つのシナリオからなるベンチマークスイートを提案する。
差分認識は公平性の異なる次元であることを示す10のモデルにまたがって結果を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:56:28 GMT)
A Unified Understanding and Evaluation of Steering Methods [17.4] ステアリング法は、中間活性化にステアリングベクトルを適用することにより、大きな言語モデルを制御するための実践的なアプローチを提供する。
その重要性は増しているが、この分野には、タスクやデータセット間で統一された理解と一貫した評価が欠けている。
本稿では, ステアリング手法を解析・評価し, 基本原理を定式化し, 有効性に関する理論的知見を提供する統一的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:55:24 GMT)
When Dimensionality Hurts: The Role of LLM Embedding Compression for Noisy Regression Tasks [17.1] テキストの圧縮表現は、回帰タスクにおいてより良いパフォーマンスが得られることを示す。
この結果から,感情などの解釈可能な圧縮表現の成功は,正規化効果によるものと考えられる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:23:11 GMT)
CROWN: A Novel Approach to Comprehending Users' Preferences for Accurate Personalized News Recommendation [17.1] カテゴリー誘導意図のゆがみを利用した新しいパーソナライズされたニュースレコメンデーションフレームワーク(CROWN)を提案する。
CROWNは10の最先端のニュースレコメンデーションメソッドに対して一貫したパフォーマンス改善を提供する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:25:08 GMT)
SelfFed: Self-Supervised Federated Learning for Data Heterogeneity and Label Scarcity in Medical Images [17.1] 自己監督型フェデレーション学習戦略はラベルの不足と多様なデータ分布による性能劣化に悩まされる。
本稿では,医療画像のためのSelfFedフレームワークを提案する。
非IIDデータセット上のRetinaおよびCOVID-FLデータセットの最大8.8%と4.1%の改善を実現する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:07:25 GMT)
Exploring Empty Spaces: Human-in-the-Loop Data Augmentation [17.0] Amplioは、専門家が構造化されていないテキストデータセットで"未知の未知"をナビゲートするのを支援するインタラクティブツールである。
我々は,高品質で多様性があり,関連するモデル安全性プロンプトを生成するための拡張手法の有用性を実証する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:27:51 GMT)
Adaptive Voxel-Weighted Loss Using L1 Norms in Deep Neural Networks for Detection and Segmentation of Prostate Cancer Lesions in PET/CT Images [16.9] 本研究では, PET/CTスキャンにおける転移性前立腺癌病変の自動検出と分節化に向けた, ディープニューラルネットワークの新たな損失関数L1-weighted Dice Loss (L1DFL)を提案する。
我々は,Attention U-NetとSegResNetの2つの3D畳み込みニューラルネットワークを訓練し,PETとCTのボリュームを入力として生成した。
L1DFLはテストセットで比較損失関数を少なくとも13%上回った。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:45:16 GMT)
Constant Rate Schedule: Constant-Rate Distributional Change for Efficient Training and Sampling in Diffusion Models [16.9] ノイズスケジュールは、拡散したデータの確率分布の変化率を一定に保証する。
ノイズスケジュールは自動的に決定され、各データセットと種類の拡散モデルに合わせて調整される。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 06:56:07 GMT)
A Comprehensive Study of Bug-Fix Patterns in Autonomous Driving Systems [16.7] 自律運転システム(ADSe)におけるバグフィックスパターンの実証的研究について述べる。
我々は、ApolloとAutowareという2つの主要な自動運転プロジェクトのコミット履歴とバグレポートを、1,331のバグ修正から分析した。
本研究は,経路計画やデータフロー,構成管理など,いくつかの主要なバグフィックスパターンを明らかにする。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:13:05 GMT)
Dual-Flow: Transferable Multi-Target, Instance-Agnostic Attacks via In-the-wild Cascading Flow Optimization [16.7] 本稿では,マルチターゲットのインスタンス非依存型対向攻撃のための新しいDual-Flowフレームワークを提案する。
敵に訓練されたモデルのような攻撃手法は、防御機構に対する強い強靭性を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:25:58 GMT)
Distribution Transformers: Fast Approximate Bayesian Inference With On-The-Fly Prior Adaptation [16.6] 本稿では,任意の分布-分布マッピングを学習可能な新しいアーキテクチャである分散トランスフォーマーを紹介する。
提案手法は,あるデータセットに条件付きで,対応する後部への事前のマッピングを訓練することができる。
我々は、配電変換器が事前の変動に柔軟性を保ち、時間帯を数分からミリ秒に短縮できることを実証した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:33:12 GMT)
Anticipate & Act : Integrating LLMs and Classical Planning for Efficient Task Execution in Household Environments [16.5] 我々は,これらの課題を共同で達成する行動列を計算し,家庭内課題を予測するための枠組みを開発する。
今後の課題を考慮しないシステムと比較して,実行時間の31%削減を実証する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:31:55 GMT)
Neurons Speak in Ranges: Breaking Free from Discrete Neuronal Attribution [16.5] 本稿では,新しいレンジベースの解釈・操作フレームワークであるNeuronLensを紹介する。
これは、ニューロン内の概念帰属を局在させるために、ニューロンの活性化分布のより詳細なビューを提供する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:33:55 GMT)
Why human-AI relationships need socioaffective alignment [16.3] 人間は、私たちの目標と整合し、私たちのコントロール下にある安全なAIシステムを設計しようと努力します。
AI能力が進歩するにつれて、私たちは新たな課題に直面します。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:50:08 GMT)
From Uncertain to Safe: Conformal Fine-Tuning of Diffusion Models for Safe PDE Control [16.2] 我々は,安全制約下での最適制御を実現するために,PDE制御のためのセーフ拡散モデル(SafeDiffCon)を提案する。
提案手法は,安全制約を満たす制御シーケンスを生成するために,事前学習した拡散モデルをポストトレーニングする。
我々は,1次元バーガー方程式,2次元非圧縮流体,制御核融合問題という3つの制御課題についてSafeDiffConを評価した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:42:30 GMT)
No Metric to Rule Them All: Toward Principled Evaluations of Graph-Learning Datasets [16.0] グラフ学習データセットの品質を評価するためのフレキシブルでモード摂動フレームワークであるRINGSを紹介した。
本フレームワークでは,評価ツールとして性能分離性とモード補完性という2つの尺度を提案する。
グラフ学習手法の評価を改善するための実用的な勧告を導出する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:59:03 GMT)
Process Supervision-Guided Policy Optimization for Code Generation [15.9] 単体テストフィードバックによる強化学習(RL)は、大規模言語モデルのLLM(LLM)コード生成を強化したが、完全なコード評価後にのみ提供されるスパース報酬に依存している。
本稿では,人間のコード修正を模倣したプロセス・リワード・モデル(PRM)を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:24:30 GMT)
Growing the Efficient Frontier on Panel Trees [15.7] 我々は、個々の資産返却を解析するための新しいツリーベースモデルであるP-Treesを導入する。
P-Treesは、一般的なテストアセットと比較して効率のよいフロンティアを著しく向上させるテストアセットを構築し、アルファはベンチマーク価格モデルでは説明されていない。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:00:31 GMT)
CASIM: Composite Aware Semantic Injection for Text to Motion Generation [15.5] テキストとモーショントークンの動的対応を学習する複合認識型セマンティックインジェクション機構を提案する。
HumanML3DとKITベンチマークの実験では、CASIMは動きの質、テキスト・モーションアライメント、検索スコアを一貫して改善している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:22:07 GMT)
RFMedSAM 2: Automatic Prompt Refinement for Enhanced Volumetric Medical Image Segmentation with SAM 2 [15.5] Segment Anything Model 2 (SAM2)は、SAMを画像ドメインとビデオドメインの両方に拡張するプロンプト駆動基盤モデルである。
しかしSAMと同様、SAM 2はバイナリマスクの出力、セマンティックラベルの推論ができないこと、ターゲットのオブジェクト領域の正確なプロンプトへの依存によって制限されている。
我々は、カスタムの微調整アダプタを用いてSAM 2の上限値について検討し、BTCVデータセット上で92.30%のDice similarity Coefficient(DSC)を達成する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:03:23 GMT)
When are Diffusion Priors Helpful in Sparse Reconstruction? A Study with Sparse-view CT [15.5] 画像再構成の先行として拡散モデルの有用性について検討する。
我々は、ピクセルベースの、構造的、下流のメトリクスを用いて、それらのパフォーマンスを古典的な先行(スパースとティホノフの正規化)と比較する。
拡散先行は、非常に少ない観測で大量の詳細を捉えることができ、古典的先行よりも著しく優れていた。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:28:21 GMT)
Distributionally Robust Direct Preference Optimization [15.3] 大規模言語モデルを人間の好みに合わせる上での大きな課題は、分散シフトの問題である。
WDPO(Wasserstein DPO)とKLDPO(Kullback-Leibler DPO)という,分散的に堅牢な直接選好最適化アルゴリズムを新たに開発した。
本実験は,WDPOとKLDPOが優先分布シフトの際のアライメントを大幅に改善する上で,優れた性能を示すものである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:03:19 GMT)
Rankify: A Comprehensive Python Toolkit for Retrieval, Re-Ranking, and Retrieval-Augmented Generation [15.3] Rankifyは、検索、再ランク付け、RAGを統合するために設計された、強力でモジュール化されたオープンソースツールキットである。
厳密でスパースなリトリーバーを含む幅広い検索技術をサポートし、最先端のリグレードモデルも備えている。
Rankifyには、Huggingfaceで利用可能なベンチマークを容易にするために、検索済みのデータセットのコレクションが含まれている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:33:25 GMT)
From Challenges and Pitfalls to Recommendations and Opportunities: Implementing Federated Learning in Healthcare [15.2] フェデレートラーニングは、複数のセンターで大規模なヘルスケア研究とコラボレーションを可能にする大きな可能性を秘めている。
近年の多くの研究は、医療におけるフェデレートラーニングに基づく手法を提案または活用しているが、どちらの方法が潜在的な臨床的有用性を持っているかは定かではない。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:56:42 GMT)
Efficient 3D Recognition with Event-driven Spike Sparse Convolution [15.2] スパイキングニューラルネットワーク(SNN)は3次元時間的特徴を抽出するエネルギー効率の良い方法を提供する。
本稿では3次元点雲をスパーススパイクトレイン空間に符号化するスパイクVoxel Coding(SVC)方式を提案する。
本稿では,3次元スパース・クラウドの特徴を効率的に抽出するスパイクスパース・コンボリューション(SSC)モデルを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:52:37 GMT)
Robust and Secure Code Watermarking for Large Language Models via ML/Crypto Codesign [15.2] 本稿では,ML/Crypto符号の電子透かしフレームワークであるRoSeを紹介する。
検出性-忠実性-ロマンス性三目的物に付着する高品質な透かしは、符号の低エントロピーの性質のために制限される。
RoSeは、コード機能を保持しながら高い検出精度を達成する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:35:28 GMT)
Controllable Video Generation with Provable Disentanglement [15.1] 本稿では,ビデオ概念を乱すための制御可能なビデオ生成支援ネットワーク(VoGAN)を提案する。
最小限の変化原理と十分な変化特性を強制するために、潜在動的変数の次元性を最小化する。
提案手法は,多種多様な現実シナリオにおける生成品質と制御性を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:10:20 GMT)
CAMP: Collaborative Attention Model with Profiles for Vehicle Routing Problems [15.1] プロファイル車両ルーティング問題(PVRP)は、異種静電容量車両ルーティング問題(HCVRP)の一般化である。
マルチエージェント強化学習を用いてPVRPの効率的な解法を学習する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:21:37 GMT)
BRIDLE: Generalized Self-supervised Learning with Quantization [15.1] 自己教師付き学習は、さまざまな領域にわたるラベルなしデータから意味のある表現を学ぶための強力なアプローチである。
BERTが自然言語処理において双方向の深いコンテキストを捉えることに触発されて、同様のフレームワークがオーディオなどの他のモダリティに適応している。
本稿では、残留量子化を双方向学習プロセスに組み込んだ自己教師型事前学習フレームワークBRIDLEを紹介する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:54:06 GMT)
Open Materials Generation with Stochastic Interpolants [14.9] 結晶材料の生成と発見のための統一フレームワークであるオープンマテリアルジェネレーション(OMG)を紹介する。
OMGは、任意の塩基分布を結晶のターゲット分布にブリッジするために無機補間剤(SI)を用いる。
我々は,OMGの特定の構成に対する結晶構造予測(CSP)と,安定で新規でユニークな構造を発見することを目的とした'de novo'生成(DNG)の2つのタスクについて,OMGのパフォーマンスをベンチマークした。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:56:47 GMT)
Enforcing Demographic Coherence: A Harms Aware Framework for Reasoning about Private Data Release [14.9] データプライバシに必要であると主張するプライバシ攻撃にインスパイアされた、人口統計コヒーレンスを導入します。
我々のフレームワークは信頼性評価予測に重点を置いており、ほぼすべてのデータインフォームドプロセスから蒸留することができる。
差分的にプライベートなデータリリースはすべて、人口統計学的にコヒーレントであること、および、差分的にプライベートではない人口統計学的にコヒーレントなアルゴリズムがあることを実証する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:42:30 GMT)
Wavelet-based Positional Representation for Long Context [14.9] 長い文脈における従来の位置符号化手法を解析する。
ウェーブレット変換を利用して複数のスケール(ウィンドウサイズ)をキャプチャする新しい位置表現法を提案する。
実験結果から,本手法は短所と長所の両方でモデルの性能を向上させることが示された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:44:53 GMT)
Hypo3D: Exploring Hypothetical Reasoning in 3D [14.8] 既存の3D推論ベンチマークでは、頻繁なシーン更新のコストが高いため、リアルタイムのシーンアクセシビリティを前提としています。
実時間シーンデータにアクセスせずにモデルが推論できる能力を評価するためのベンチマークである仮説3D推論を導入する。
hypo3D は 3D Visual Question Answering (VQA) ベンチマークとして定式化されており、700の屋内シーンで7,727のコンテキスト変化があり、14,885の質問と回答のペアとなる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:48:42 GMT)
Exploiting Ensemble Learning for Cross-View Isolated Sign Language Recognition [14.5] We present our solution to the Cross-View Isolated Sign Language Recognition (CV-I SLR) Challenge held at WWW 2025。
CV-I SLRは、従来の分離手話認識(I SLR)において重要な問題に対処する。
提案手法は,RGBベースI SLRとRGBベースI SLRの両トラックで3位にランクされ,クロスビュー認識の課題に対処する上での有効性が示された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:21:28 GMT)
LightGNN: Simple Graph Neural Network for Recommendation [14.5] グラフニューラルネットワーク(GNN)は、協調的なレコメンデーションにおいて優れたパフォーマンスを示している。
既存のGNNパラダイムは、大規模でノイズの多い実世界のデータセットを扱う場合、スケーラビリティと堅牢性の課題に直面している。
軽量・蒸留方式のGNNプルーニングフレームワークであるLightGNNについて述べる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:34:08 GMT)
Density Ratio Estimation with Conditional Probability Paths [14.3] 条件変数に基づく時間スコア推定のための新しいフレームワークを提案する。
従来の手法と比較して,本手法は時間スコアの学習を高速化し,密度比の推定精度が向上することを示した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:13:35 GMT)
Progressive Correspondence Regenerator for Robust 3D Registration [14.2] レギュアはプログレッシブ対応再生器であり、多くの異常値に対して高品質なマッチを生成する。
我々は、グローバルな観点から正確な対応を得るために、グローバルな対応強化を採用している。
提案手法は,外乱除去法よりも10倍の精度で対応できる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:38:45 GMT)
Self-reflecting Large Language Models: A Hegelian Dialectical Approach [13.9] 哲学的なレンズによるNLPの探索は、計算手法と古典的な哲学の学派を結びつけることで、研究者の目を引くようになった。
本稿では, LLMの自己回帰に対するヘーゲル弁証法に触発された哲学的アプローチを紹介し, 自己弁証的アプローチを用いて内的批判をエミュレートし, 矛盾点を解消して新たなアイデアを合成する。
我々の実験は、新しいアイデアを生み出すことを約束し、将来の研究の足場を提供する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:12:05 GMT)
Unlocking Efficient Large Inference Models: One-Bit Unrolling Tips the Scales [13.8] 我々は1ビットのアルゴリズムを解き放つ新しいアプローチを導入し、物理世界からの情報をモデルアーキテクチャに効果的に統合する。
提案手法は,前処理で報告した1.58ビットよりもリンクレートが大幅に低くなる。
提案した1ビットアルゴリズムのアンローリング方式は,学習結果とテスト結果の両方を改善することができることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 00:53:10 GMT)
Concept-Aware Latent and Explicit Knowledge Integration for Enhanced Cognitive Diagnosis [13.8] 認知診断のための概念認識型遅延・明示的知識統合モデル(CLEKI-CD)を提案する。
具体的には、学生の熟達度に応じて多次元ベクトルを構築し、複数の視点から各知識概念のエクササイズ困難を解消する。
我々は認知診断層を併用して、潜在的知識と明示的知識を統合し、さらに認知診断性能を向上させる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:37:16 GMT)
Rapidly Adapting Policies to the Real World via Simulation-Guided Fine-Tuning [13.8] 物理シミュレーターは、状態、行動、環境を広範囲にカバーした膨大なデータセットを生成することができる。
これらのポリシーを小さな現実世界のデータセットで微調整することは、ロボット学習をスケールするための魅力的な方法だ。
本稿では,シミュレーション誘導ファインチューニング(SGFT)フレームワークについて紹介する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:40:44 GMT)
Parameter Tracking in Federated Learning with Adaptive Optimization [13.6] フェデレートラーニング(FL)では、モデルトレーニングのパフォーマンスはクライアント間のデータ不均一性に強く影響されます。
GT(Gradient Tracking)は、最近、局所モデル更新に修正項を導入することでこの問題を軽減するソリューションとして登場した。
現在まで、GTはグラディエント(SGD)ベースのDescentトレーニングしか考慮されていないが、現代のFLフレームワークは収束を改善するために適応性を採用する傾向にある。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 21:21:30 GMT)
PatchPilot: A Stable and Cost-Efficient Agentic Patching Framework [13.6] パッチの有効性,安定性,コスト効率のバランスをとるエージェントパッチであるPatchPilotを提案する。
PatchPilotは、コスト(インスタンスあたり1ドル未満)を維持し、より高い安定性を確保しながら、既存のオープンソースメソッドよりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:30:02 GMT)
A Training-Free Length Extrapolation Approach for LLMs: Greedy Attention Logit Interpolation (GALI) [13.6] Greedy Attention Logit Interpolation (GALI) は、トレーニング不要な長さ外挿法であり、事前訓練された位置間隔の利用を最大化する。
GalIは、最先端のトレーニングフリーメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:01:24 GMT)
A Probabilistic Inference Approach to Inference-Time Scaling of LLMs using Particle-Based Monte Carlo Methods [13.6] 大規模言語モデル(LLM)は、モデルのサイズやデータのスケールアップを通じて、大幅なパフォーマンス向上を実現している。
既存の推論時間スケーリング手法は、このタスクを検索問題として捉えており、ハックに報いるには弱い傾向にある。
本稿では,粒子ベースのモンテカルロ法を応用した新しい推論時間スケーリング手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:39:36 GMT)
Generative Psycho-Lexical Approach for Constructing Value Systems in Large Language Models [13.5] 大規模言語モデル(LLM)は、その本質的な価値に関する懸念を提起している。
本研究は、生成心理学的アプローチ(GPLA)の導入によるギャップに対処する。
LLMに適した心理学的基礎を持つ5要素値システムを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:10:55 GMT)
Potential Applications of Artificial Intelligence for Cross-language Intelligibility Assessment of Dysarthric Speech [13.5] 本稿では,言語ユニバーサル音声障害を捉える普遍的モデルと,言語固有の知性モデルからなる概念的枠組みを提案する。
我々は、データ不足、アノテーションの複雑さ、限られた言語的洞察を含む、言語間インテリジェンス評価の鍵となる障壁を識別する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:58:25 GMT)
Multilingual Machine Translation with Open Large Language Models at Practical Scale: An Empirical Study [13.4] GemmaX2-28は、28言語で最上位の多言語翻訳性能を達成する9Bモデルである。
GemmaX2-28 は TowerInstruct や XALMA などの最先端 (SOTA) モデルより一貫して優れている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:57:03 GMT)
A Universal Identity Backdoor Attack against Speaker Verification based on Siamese Network [13.3] 本稿では,話者認証システムに対するバックドア攻撃を提案する。
我々は、任意の登録話者をシミュレートし、検証に合格できるユニバーサルアイデンティティーをモデルに埋め込む。
本研究は,話者認証システムの脆弱性を明らかにし,システムの堅牢性をさらに向上するための新たな視点を提供する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:06:50 GMT)
Fuzzing the PHP Interpreter via Dataflow Fusion [13.3] 本稿では,PHPインタプリタにおけるメモリエラーを検出する最初の自動ファジリングフレームワークであるFlowFusionを紹介する。
評価では、FlowFusionがPHPインタプリタに158の未知のバグを発見し、125が修正され11が確認された。
FlowFusionは最先端のファズーであるAFL++やPolyglotよりも優れており、24時間のファズー処理の後に24%のコードをカバーしている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:02:58 GMT)
An interpretable generative multimodal neuroimaging-genomics framework for decoding Alzheimer's disease [13.2] アルツハイマー病(英語: Alzheimer's disease, AD)は、認知機能障害(Mild Cognitive Impairment, MCI)として知られる前ドロマステージを含む認知症である。
この研究の目的は、マルチモーダルMRIデータと単一核化物多型に依存する脳構造と機能の構造的・機能的調節を捉えることである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:36:37 GMT)
Avoiding spurious sharpness minimization broadens applicability of SAM [13.2] シャープネス・アウェア・最小化(SAM)のような曲率正規化技術は、視覚タスクの一般化を改善する上で非常に有望である。
SAMは自然言語処理(NLP)のようなドメインではパフォーマンスが悪く、計算予算の2倍であっても、パフォーマンスが劣化することがよくあります。
そこで我々は,関数の統計量を変更することでのみ曲率を正規化する関数SAMというアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:25:47 GMT)
A Theoretical Analysis of Recommendation Loss Functions under Negative Sampling [13.2] CCE(Categorical Cross Entropy)、BCE(Binary Cross Entropy)、BPR(Bayesian Personalized Ranking)といった損失関数は、レコメンダシステム(Recommender Systems、RS)において、ユーザによって対話されるポジティブな項目とネガティブな項目を区別するために一般的に使用されている。
我々は、CCEが正規化カウント累積ゲイン(NDCG)や平均相反ランク(MRR)のようなランキングの指標に最も厳しい下限を提供することを示す。
負のサンプリングでは、BPRとCCEは1つの負のサンプルが引かれるときに等価であり、3つの損失はすべて同じ大域最小値に収束する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 21:30:16 GMT)
Information-Theoretic Proofs for Diffusion Sampling [13.1] 本稿では, 拡散法に基づくジェネレーティブ・モデリング手法の基本的, 自己完結型分析法を提案する。
拡散ステップサイズが十分に小さい場合、サンプリング分布はターゲット分布に確実に近いことを示す。
また,各ステップに追加のランダム性を導入して,比較過程における高次モーメントに一致させることにより,収束を促進させる方法についての透過的なビューを提供する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:19:21 GMT)
Fault-tolerant quantum algorithms for quantum molecular systems: A survey [13.0] フォールトトレラント量子コンピューティングの最新動向を概観する。
これらのアルゴリズムによって達成できる潜在的な量子的優位性に特に注意が払われる。
レビューは今後の方向性に関する議論で締めくくられている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:12:00 GMT)
Vulnerability Mitigation for Safety-Aligned Language Models via Debiasing [13.0] 安全性アライメントは、現実世界のAIアプリケーションにとって重要な研究トピックである。
本研究はまず,モデルの有用性を犠牲にすることなく,このような脆弱性を除去することの難しさを明らかにした。
本手法は,安全性を維持しつつモデルの有用性を高め,トレードオフを改善できる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:31:54 GMT)
IncepFormerNet: A multi-scale multi-head attention network for SSVEP classification [12.9] 本研究では,Inception と Transformer アーキテクチャのハイブリッドモデルである IncepFormerNet を提案する。
IncepFormerNetは、異なる大きさの並列畳み込みカーネルを用いて、時系列データから、マルチスケールの時間情報を積極的に抽出する。
SSVEPデータのスペクトル特性に基づいて特徴を抽出するために,フィルタバンク手法を利用する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:04:03 GMT)
EdgeGFL: Rethinking Edge Information in Graph Feature Preference Learning [12.8] グラフニューラルネットワーク(GNN)は、非ユークリッドデータを扱う上で大きな利点がある。
多次元エッジ情報を含めることで、GNNモデルの機能性と柔軟性が向上する。
4つの実世界の異種グラフの実験は、提案されたモデルの有効性を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:16:54 GMT)
Towards Fast Graph Generation via Autoregressive Noisy Filtration Modeling [12.7] グラフ生成モデルはしばしば、複雑な分布の学習と高速な生成速度の達成の間に重要なトレードオフに直面します。
本稿では,両課題に対処する新しい手法である自動回帰ノイズフィルタモデリング(ANFM)を紹介する。
ANFMは極めて短いシーケンスを生成し、拡散モデルと比較して100倍の高速化を実現している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:35:25 GMT)
Real-Time Operator Takeover for Visuomotor Diffusion Policy Training [12.7] Real-Time Operator Takeover (RTOT) パラダイムにより、オペレータはライブビジュモータ拡散ポリシーをシームレスに制御できる。
本稿では,マハロノビス距離を用いて望ましくない状態を自動同定する新たな知見を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:24:28 GMT)
Hier-EgoPack: Hierarchical Egocentric Video Understanding with Diverse Task Perspectives [12.7] 多様な時間的粒度の推論を可能にすることで,EgoPackを進化させるHier-EgoPackを紹介した。
クリップレベルの推論とフレームレベルの推論の両方を含む複数のEgo4dベンチマークに対するアプローチを評価した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:03:49 GMT)
SoK: Understanding zk-SNARKs: The Gap Between Research and Practice [12.7] 我々は,zk-SNARKを理論から実践まで包括的に研究し,ギャップと限界を指摘する。
まず、プログラムをzk-SNARKに変換する際の主要なステップを統一するマスターレシピを示す。
2013年以降、40以上のzk-SNARKを調査し、それらのカテゴリとプロパティをリストアップした参照テーブルを提供する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:06:58 GMT)
Textoon: Generating Vivid 2D Cartoon Characters from Text Descriptions [12.7] テキスト記述に基づくLive2Dフォーマットで多種多様な2D漫画のキャラクターを生成する革新的な方法であるTextoonを紹介する。
Textoonは最先端の言語とビジョンモデルを活用して、テキストの意図を理解し、2Dの外観を生成する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:28:14 GMT)
UniGaze: Towards Universal Gaze Estimation via Large-scale Pre-Training [12.7] 我々は,視線推定のための自己教師付き事前学習を通じて,大規模な画像データセットを活用するUniGazeを提案する。
視覚変換器 (ViT) のバックボーンを用いて, 正規化顔画像にMasked Autoencoder (MAE) を事前トレーニングすることにより, 下流の視線推定モデルで求められる特定の入力空間内での適切な特徴表現を学習する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:24:23 GMT)
Can You Move These Over There? An LLM-based VR Mover for Supporting Object Manipulation [12.6] LLMを利用したVR Moverを提案する。これは、オブジェクト操作をサポートするユーザの声道指示を理解し、解釈できるソリューションである。
ユーザ調査の結果,VR Moverはユーザビリティ,ユーザエクスペリエンス,マルチオブジェクト操作におけるパフォーマンスの向上を実現している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:27:40 GMT)
SSAMBA: Self-Supervised Audio Representation Learning with Mamba State Space Model [12.4] Self-Supervised Audio Mamba (SSAMBA) は、音声表現学習のための最初の自己監督型、注意なし、およびSSMベースのモデルである。
以上の結果から,SSAMBAはSSAST(Self-Supervised Audio Spectrogram Transformer)よりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:29:08 GMT)
DREAM: Improving Video-Text Retrieval Through Relevance-Based Augmentation Using Large Foundation Models [12.4] 本稿では、Relevance-based AugMentation(DREAM)を用いたViDeoText Retrieval Paradigmを提案する。
我々はまず,単語やフレームをランダムに複製あるいはドロップすることで,自己相似データを生成する単純な拡張手法を採用する。
ビデオやテキスト情報をさらに強化するために,LLMとVGMが関連情報を生成・統合する関連性に基づく拡張手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:06:48 GMT)
CASE-Bench: Context-Aware SafEty Benchmark for Large Language Models [12.4] 大規模言語モデル(LLM)の安全性評価にコンテキストを組み込んだコンテキスト認識型SafEtyベンチマークであるCASE-Benchを紹介する。
Case-Benchは、コンテキスト整合性理論に基づく分類されたクエリに、明確に記述されたコンテキストを割り当てる。
本分析は, 安全性評価における文脈の必要性を強調し, 文脈が人間の判断に大きく, 重大な影響があることを明らかにする。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:40:32 GMT)
ENTP: Encoder-only Next Token Prediction [12.4] 典型的には、因果的注意を伴うデコーダのみの変換器を用いて次トーケン予測を行う。
もし計算制限がなかったら、デコーダのみのトランスフォーマーを使うべきだろうか?
演算子のみのNext Token Prediction (ENTP)を紹介する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:07:04 GMT)
VerteNet -- A Multi-Context Hybrid CNN Transformer for Accurate Vertebral Landmark Localization in Lateral Spine DXA Images [12.2] VerteNetはCNN-Transformerのハイブリッドモデルである。
我々は、様々なマシンから620DXA LSI上でVerteNetを訓練し、既存の手法と比較して優れた結果を得る。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:27:51 GMT)
Mask-informed Deep Contrastive Incomplete Multi-view Clustering [12.2] マルチビュークラスタリング(MvC)は、複数のビューからの情報を利用して、基礎となるデータ構造を明らかにする。
本稿では,新しいMask-informed Deep Contrastive Incomplete Multi-view Clustering (Mask-IMvC)法を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:23:48 GMT)
CodeSteer: Symbolic-Augmented Language Models via Code/Text Guidance [12.0] 既存のメソッドは、テキスト推論とコード生成の間に大きな言語モデル(LLM)を操ることができない。
我々は、LLMコード/テキスト生成を導く効果的な方法であるCodeSteerを紹介する。
GPT-4oをCodeSteerで強化すると、平均的なパフォーマンススコアが53.3から86.4に上昇する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:53:59 GMT)
A Method for Evaluating Hyperparameter Sensitivity in Reinforcement Learning [11.9] 本研究は,ハイパーパラメータチューニングに対するアルゴリズム性能の感度を研究,比較,定量化するための新しい経験的手法を提案する。
その結果、アルゴリズムの性能改善は、実際にはハイパーパラメータチューニングへの依存度が増大した結果である可能性が示唆された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:17:26 GMT)
MASTER: A Multi-Agent System with LLM Specialized MCTS [11.8] 大規模言語モデル(LLM)は、問題解決のためにますます研究されている。
MCTSは、真の報酬分布を近似するために、広範囲なサンプリングシミュレーションに依存している。
LLM専門MCTSによるエージェント採用とコミュニケーションを協調する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 06:26:08 GMT)
Video Latent Flow Matching: Optimal Polynomial Projections for Video Interpolation and Extrapolation [11.8] 本稿では、VLFM(Video Latent Flow Matching)と呼ばれる効率的なビデオモデリングプロセスについて考察する。
提案手法は,時間依存の映像フレームにデコード可能な潜在パッチのキャプション誘導流れをモデル化し,既存の強い事前学習画像生成モデルに依存する。
提案手法の有効性を示すために,複数のテキスト・ビデオ・データセットの実験を行った。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:19:12 GMT)
Nonparametric Sparse Online Learning of the Koopman Operator [11.7] クープマン作用素は、一般的な非線形力学系の力学を表現する強力なフレームワークを提供する。
クープマン作用素を学ぶためのデータ駆動手法は、選択された関数空間がシステム力学の下で閉じていると仮定するのが一般的である。
演算子近似アルゴリズムを用いて、演算子を反復的に学習し、表現の複雑さの制御を行う。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:14:46 GMT)
Nonparametric Sparse Online Learning of the Koopman Operator [11.7] クープマン作用素は、一般的な非線形力学系の力学を表現する強力なフレームワークを提供する。
クープマン作用素を学ぶためのデータ駆動手法は、選択された関数空間がシステム力学の下で閉じていると仮定するのが一般的である。
演算子近似アルゴリズムを用いて、演算子を反復的に学習し、表現の複雑さの制御を行う。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:17:37 GMT)
AdaptBot: Combining LLM with Knowledge Graphs and Human Input for Generic-to-Specific Task Decomposition and Knowledge Refinement [11.7] 人間を助ける身体エージェントは、しばしば新しいシナリオで新しいタスクを完了するよう要求される。
我々のフレームワークは、Large Language Models(LLMs)が提供する一般的な予測を活用することで、これらの課題に対処する。
ロボットはまた、既存の知識を洗練するために人間の入力を要請し、使用する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:32:39 GMT)
The Cost Perspective of Liquid Democracy: Feasibility and Control [11.7] 本稿では,投票・委任費用に対する予算制約を伴う液状民主主義の承認に基づくモデルについて検討する。
我々は、全体的なコストの最小化、短い委任パスの維持、投票力の過剰な集中を防ぐことに注力する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:59:56 GMT)
Product Manifold Representations for Learning on Biological Pathways [11.6] 非ユークリッド混合曲率空間における埋め込み経路グラフの効果について検討する。
学習ノード埋め込みを用いて教師付きモデルを訓練し、経路グラフにおけるタンパク質とタンパク質の相互作用の欠如を予測する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:14:32 GMT)
Prompt-based Depth Pruning of Large Language Models [11.5] 我々はPuDDing(Prompt-routed Dynamic Depth Pruning)と呼ばれる動的深度解析アルゴリズムを開発し、入力プロンプトに基づいてモデルからどのブロックを省略するかを決定する。
コモンセンス推論ベンチマークの実証的な結果から、PuDDingは推論言語モデルを効果的に加速し、静的深さプルーニングベースラインよりもタスク上での性能が向上することが示された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:16:17 GMT)
Cross-lingual Text Classification Transfer: The Case of Ukrainian [11.5] ウクライナ語は、言語間の方法論の継続的な洗練の恩恵を受けることができる言語である。
我々の知る限り、典型的なテキスト分類タスクにはウクライナのコーパスが欠如している。
本研究では,NLPの最先端技術を活用し,言語間知識伝達手法を探索する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:08:08 GMT)
Achieving Hiding and Smart Anti-Jamming Communication: A Parallel DRL Approach against Moving Reactive Jammer [11.4] 反応性ジャマは、送信活動を検出すると、高出力トラッキングジャミングを開始する。
これは、妨害者の検出を避けるために隠蔽を維持し、同時に無差別な妨害を避けるという二重命令である。
現在の方法論は、これらの2つの要件を同時に最適化する複雑さに苦慮している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:03:11 GMT)
EasySpec: Layer-Parallel Speculative Decoding for Efficient Multi-GPU Utilization [11.3] EasySpecは、マルチGPU利用効率を最適化する層並列投機戦略である。
バニラ復号と比較してピーク速度は4.17倍に達する。
ドラフトステージは最大1.62倍まで加速でき、最大精度は7%しか低下しない。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:09:21 GMT)
Ilargi: a GPU Compatible Factorized ML Model Training Framework [11.3] Ilargiは、CPUとGPU環境間の自動因数分解を容易にする、コストのかかるリレーショナル結合を必要としない、新しい因数分解学習フレームワークである。
IlargiはMLベースのコスト推定器を組み込んで、データ特性、アルゴリズムの複雑さ、ハードウェア環境、およびそれらのインタラクションに基づいて、因子化と物質化をインテリジェントに選択する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:59:17 GMT)
Causally-informed Deep Learning towards Explainable and Generalizable Outcomes Prediction in Critical Care [11.3] 本稿では,因果関係の同定に因果発見を利用した因果予測モデルを提案する。
これらの特徴から, 本手法は6つの臨界劣化に対して優れた精度を達成し, 患者群間での汎用性を向上する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:43:39 GMT)
Personalization Toolkit: Training Free Personalization of Large Vision Language Models [11.0] 大規模視覚言語モデル(LVLM)は、個々のユーザのニーズや好みに合わせてパーソナライズされた支援を提供する可能性がある。
既存のアプローチは、各ユーザとオブジェクトに対する時間を要するテスト時間トレーニングに依存しており、それらを実用的でないものにしている。
本稿では,事前学習型視覚基盤モデルを利用して,LVLMパーソナライズのための新しい学習不要アプローチを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:19:20 GMT)
Lossless Privacy-Preserving Aggregation for Decentralized Federated Learning [11.0] 我々は,勾配保護を強化するために,LPPAという新しいプライバシー保護アグリゲーションルールを提案する。
LPPAは、送信されたノイズと受信したノイズのノイズ差を、勾配保護のために送信された勾配に微妙に注入する。
LPPAは雑音付加よりも精度が14%向上したことを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:00:55 GMT)
Improved Replicable Boosting with Majority-of-Majorities [11.0] 本稿では,従来のアルゴリズムと比較して,サンプルの複雑さを大幅に改善するレプリカブルブースティングアルゴリズムを提案する。
このアルゴリズムは、Impagliazzoらによって導入されたレプリカブルブースティングアルゴリズムの改良版([2022])を下層層に導入して、2つの過半数投票を行う。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:57:53 GMT)
PANDAS: Improving Many-shot Jailbreaking via Positive Affirmation, Negative Demonstration, and Adaptive Sampling [10.9] 多数ショットのジェイルブレイクは、長い入力シーケンスを処理する能力を活用することで、大きな言語モデルの安全アライメントを回避する。
PANDAS: 正の肯定を伴うこれらの合成対話を変更することで、多発ジェイルブレイクを改善するハイブリッド技術を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:51:31 GMT)
A Hybrid Swarm Intelligence Approach for Optimizing Multimodal Large Language Models Deployment in Edge-Cloud-based Federated Learning Environments [10.7] Federated Learning (FL)、Multimodal Large Language Models (MLLM)、エッジ・クラウド・コンピューティングは分散およびリアルタイムのデータ処理を可能にする。
そこで本研究では,MLLMを十分なリソースとバッテリ寿命を備えたエッジデバイスにデプロイするハイブリッドフレームワークを提案する。
実験の結果,提案手法はシステム性能を大幅に向上し,92%の精度を実現し,通信コストを30%削減し,クライアントの参加性を高めた。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:03:24 GMT)
Causal Interpretations in Observational Studies: The Role of Sociocultural Backgrounds and Team Dynamics [10.7] 計算言語学的および回帰的手法を用いて,80,000以上の観察的研究を解析した。
その結果,未経験者や研究チーム,男性最後の著者,不確実性回避指標の高い国出身の著者が,因果語の使用頻度が高いことがわかった。
これらのことから, 因果語の使用は, 著者の社会文化的背景や研究協力のダイナミクスといった外部要因に影響されている可能性が示唆された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:00:10 GMT)
GP-GS: Gaussian Processes for Enhanced Gaussian Splatting [10.5] 本稿では,スパースSfM点雲の適応的および不確実性誘導密度化を実現する新しい3次元再構成フレームワークを提案する。
このパイプラインは不確実性推定を利用して、高分散予測のプルーニングを導く。
合成および実世界のデータセットで行った実験は、提案フレームワークの有効性と実用性を検証する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:50:16 GMT)
QMOS: Enhancing LLMs for Telecommunication with Question Masked loss and Option Shuffling [10.4] GPT-3.5は、最近の研究で、Retrieval Augmented Generationフレームワークにおいて、通信関連質問に対する注目すべき精度を得るために使われている。
本稿では、QMOSについて述べる。QMOSは、電信分野における複数の質問に答える際のLLMの性能を高めるために、Q-Masked LosとOption Shufflingのトリックを利用する革新的な手法である。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:46:23 GMT)
Decision Transformer for Enhancing Neural Local Search on the Job Shop Scheduling Problem [10.3] ジョブショップスケジューリング問題(JSSP)とその解法アルゴリズムは、何十年もの間、アカデミックと産業の両方に永続的な関心を集めてきた。
近年、機械学習(ML)は、JSSPのための既存のソリューションと新しいソリューションの構築において、より短い時間でより良いソリューションを見つけることを目的として、ますます重要な役割を担っている。
我々は、JSSP上の大規模局所探索を効率よく効果的に制御できる、Neural Local Search(NLS)と呼ばれる最先端の深層強化学習(DRL)エージェントの上に構築する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:47:30 GMT)
Deep Weight Factorization: Sparse Learning Through the Lens of Artificial Symmetries [10.2] スパース正規化技術は機械学習において十分に確立されているが、ニューラルネットワークへの応用は依然として難しい。
期待できる代替手段として、浅い重み分解があり、そこでは重みが2つの要因に分断され、$L$penalized Neural Networkの最適化が可能になる。
本研究では,2つ以上の既存手法に微分因子を付加し,重み分解を導入する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:12:56 GMT)
Classroom Simulacra: Building Contextual Student Generative Agents in Online Education for Learning Behavioral Simulation [10.2] N = 60の学生から6週間の教育ワークショップを開催し、カスタマイズされたオンライン教育システムを用いて詳細なデータを収集する。
本稿では,転送可能な反復リフレクション(TIR)モジュールを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:42:52 GMT)
Poisson Hierarchical Indian Buffet Processes for Within and Across Group Sharing of Latent Features-With Indications for Microbiome Species Sampling Models [10.2] 本稿では,Poisson Hierarchical Indian Buffet Processsのベイズ的後部解析について述べる。
この分析は、潜在的に無限の種数と未知のパラメータをカバーしている。
我々は,微生物学および生態学の専門家と共生する言語で,この知見を表現することを目指している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:27:16 GMT)
Transfer Risk Map: Mitigating Pixel-level Negative Transfer in Medical Segmentation [10.2] 本稿では,医学的セグメンテーションにおいて重要な伝達リスクのある領域に対して,モデルの注意を向ける重み付き微調整手法を提案する。
具体的には、転送可能性誘導転送リスクマップを計算し、各画素の転送硬度と負転送の潜在的なリスクを定量化する。
脳のセグメンテーションの実験では、ターゲットタスクのパフォーマンスが大幅に向上し、FeTS 2021では4.37%、iSeg 2019では1.81%向上した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:19:05 GMT)
BiLO: Bilevel Local Operator Learning for PDE inverse problems [10.1] 偏微分方程式(PDE)の逆問題に対する新しいニューラルネットワークに基づく解法を提案する。
上層部ではPDEパラメータに関してデータ損失を最小限に抑える。
低レベルでは、ニューラルネットワークをトレーニングし、与えられたPDEパラメータの集合の近傍でPDEソリューション演算子を局所的に近似する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:14:11 GMT)
Activation-Informed Merging of Large Language Models [10.0] 本稿では,大規模言語モデルのアクティベーション空間から情報を統合する手法である Activation-Informed Merging (AIM) について述べる。
我々は、AIMが複数のベンチマークでマージされたモデルの性能を大幅に向上させることを実証的に実証した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:42:03 GMT)
Visual Theory of Mind Enables the Invention of Writing Systems [10.0] エビデンスによれば、一部の書記システムの初期の形態は、元々は象徴的なピクトグラフで構成されていた。
私たちのモデルは、初期書記システムの開発に繋がった認知的・文化的プロセスに光を当てています。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:36:30 GMT)
Neuron-based Multifractal Analysis of Neuron Interaction Dynamics in Large Models [10.0] 我々はニューロMFA(NeuroMFA)と呼ばれる構造解析のための新しい解析フレームワークを提案する。
構造的特徴を大規模モデルの能力にリンクすることにより、NeuroMFAは大規模モデルの創発現象を分析するための定量的フレームワークを提供する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:46:33 GMT)
Learning to Double Guess: An Active Perception Approach for Estimating the Center of Mass of Arbitrary Objects [9.8] U-GRAPH: Uncertainty-Guided Rotational Active Perception with Hapticsを紹介する。
従来の手法は単一相互作用に依存しており、F/Tセンサーの固有の不正確さによって制限される。
本手法の顕著な一般化性および伝達性について,限定的な変動を伴う小さなデータセット上でのトレーニングを行いながら,未確認の複雑な実世界のオブジェクト上でも良好に動作することを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:03:21 GMT)
Mass-Editing Memory with Attention in Transformers: A cross-lingual exploration of knowledge [9.5] 本研究では,言語間の知識編集手法の有効性について検討した。
変圧器の注意を伴うマス編集メモリ(MEMAT)を提案する。
MEMATは、目覚ましい10%のスケールのメトリクスを提供する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:47:55 GMT)
HeRCULES: Heterogeneous Radar Dataset in Complex Urban Environment for Multi-session Radar SLAM [9.5] HeRCULESデータセットは、ヘテロジニアスレーダー、FMCW LiDAR、IMU、GPS、カメラを備えた包括的なマルチモーダルデータセットである。
これは、FMCW LiDARと並行して4Dレーダと回転レーダを統合する最初のデータセットであり、非並列なローカライゼーション、マッピング、位置認識機能を提供する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:41:00 GMT)
RAPID: Robust and Agile Planner Using Inverse Reinforcement Learning for Vision-Based Drone Navigation [9.3] 本稿では,乱雑な環境下でのアジャイルドローン飛行のための学習型ビジュアルプランナを紹介する。
提案したプランナーは、ミリ秒で衝突のないウェイポイントを生成し、ドローンは、異なる知覚、マッピング、計画モジュールを構築することなく、複雑な環境でアジャイルな操作を実行できる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 06:42:08 GMT)
DOC-Depth: A novel approach for dense depth ground truth generation [9.2] 我々は,任意のLiDARセンサから高密度深度を発生させる新しい,効率的かつ容易に展開できるアプローチであるDOC-Depthを紹介する。
DOC-Depthは高速でスケーラブルで、サイズと時間の観点からデータセットを作成することができる。
我々は、KITTIデータセットに対するアプローチの有効性を示し、その密度を16.1%から71.2%に改善した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:18:04 GMT)
Mental-Perceiver: Audio-Textual Multi-Modal Learning for Estimating Mental Disorders [9.2] 不安や抑うつといった精神障害は、あらゆる年齢の人々に影響を及ぼす世界的な懸念となっている。
AIベースの検出手法は将来性を示しているが、大規模なデータセットが公開されていないため、進歩は妨げられている。
音声およびテキストデータから精神障害を推定する深層学習モデルであるメンタル・パーシーバーを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:32:07 GMT)
On the Benefits of Attribute-Driven Graph Domain Adaptation [9.2] Graph Domain Adaptation (GDA)は、特に実世界のグラフデータセットにラベル付きデータが存在しないため、クロスネットワーク学習における押し付けの課題に対処する。
最近の研究では、グラフ間の構造的シフトを排除して、領域不変表現を学習しようと試みている。
既存の手法はグラフ領域のアライメントに重要な要素であるグラフノード属性の重要性を見落としていることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:04:04 GMT)
Multi-Domain Graph Foundation Models: Robust Knowledge Transfer via Topology Alignment [9.2] 実世界のグラフはスパースが多く、ノイズの多い接続や敵の攻撃を受けやすい。
本稿では,ドメイン間のトポロジ情報を整合化し活用する統合フレームワークであるMDGFMを提案する。
トポロジを整列させることで、MDGFMはマルチドメイン事前学習を改善するだけでなく、目に見えないドメインへの堅牢な知識伝達を可能にする。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:09:23 GMT)
Federated Low-Rank Tensor Estimation for Multimodal Image Reconstruction [9.1] 本研究では,大規模マルチモーダルデータを管理するために,タッカー分解を適用し,共同分解とランダムなスケッチ処理を取り入れたフェデレーション画像再構成手法を提案する。
提案手法は,既存手法と比較して,再現性や通信圧縮に優れることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:02:46 GMT)
AsserT5: Test Assertion Generation Using a Fine-Tuned Code Language Model [9.0] トレーニング済みのCodeT5モデルに基づく新しいモデルであるAsserT5を提案する。
焦点推定手法の抽象化と包含は、微調整された事前学習モデルにも有用であることがわかった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:42:22 GMT)
3D Foundation AI Model for Generalizable Disease Detection in Head Computed Tomography [8.9] 本稿では,頭部CTの基礎モデルであるFM-CTについて紹介する。
提案手法では,手動アノテーションを必要とせずに,361,663個の非コントラスト3次元頭部CTスキャンの大規模データセット上で,ディープラーニングモデルを事前学習する。
以上の結果から, 自己監督基盤モデルにより下流診断における性能が著しく向上することが示唆された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:42:18 GMT)
M2R2: Mixture of Multi-Rate Residuals for Efficient Transformer Inference [8.8] M2R2(Mixture of Multi-rate Residuals)は,残差速度を動的に変調して早期アライメントを改善するフレームワークである。
M2R2は最先端の距離ベースの戦略を超え、生成品質とスピードアップのバランスをとる。
自己投機的復号化では、M2R2はMT-Benchで最大2.8倍のスピードアップを達成する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 06:13:52 GMT)
Adaptive Self-improvement LLM Agentic System for ML Library Development [8.8] 大規模言語モデル(LLM)は一般的なコーディング能力を示している。
LLMはこのタスクを完了するには、限られたデータによる複雑な推論が必要である。
オープンおよびクローズドソースのLLMを用いてASPLコードを生成する適応型自己改善エージェントシステムを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:57:17 GMT)
Local minima of the empirical risk in high dimension: General theorems and convex examples [8.7] 我々は、データベクトル$mathbfxi$が$d-最小化であるような高次元経験的リスクの一般的なモデルを考える。
我々は推定誤差と予測誤差に基づいてシャープを導出する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:02:24 GMT)
Position: Scaling LLM Agents Requires Asymptotic Analysis with LLM Primitives [8.7] 難しい問題をサブプロブレムに分解することで、解き易く、より効率的に解決できる。
本稿は,LLMプリミティブを用いた解析が,そのようなシステムの効率性について考慮する必要があることを論じる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:47:43 GMT)
Discovering Quality-Diversity Algorithms via Meta-Black-Box Optimization [8.5] 品質多様性(Quality-Diversity)は、高性能なソリューションの多様な集団を生成する進化アルゴリズムのファミリーである。
メタラーニングを用いて,新しい品質多様性アルゴリズムの自動発見を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:13:13 GMT)
The Battling Influencers Game: Nash Equilibria Structure of a Potential Game and Implications to Value Alignment [8.4] 本稿では,マルチプレイヤー同時移動汎用ゲームであるBattling Influencers Game (BIG)を紹介する。
BIG はポテンシャルゲームであり、1 つまたは無限個の純同値 Nashlibria (NE) を持ち、これらの純同値NE は凸最適化によって見つけることができることを証明している。
本稿では,BIGが価値アライメントに与える影響について論じる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:40:58 GMT)
Degree Distribution based Spiking Graph Networks for Domain Adaptation [8.3] Spiking Graph Networks (SGNs) は、グラフ分類におけるエネルギー消費問題に対処する能力のために、研究者や業界から大きな注目を集めている。
まず、SGNにおけるドメイン適応問題を提案し、Degree-aware Spiking Graph Domain Adaptation for Classification (DeSGDA)と呼ばれる新しいフレームワークを提案する。
The proposed DeSGDA address the spiking graph domain adapt problem in three aspects: node degree-aware Personal spiking representation, adversarial feature distribution alignment, pseudo-label distillation。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:23:55 GMT)
SMTFL: Secure Model Training to Untrusted Participants in Federated Learning [8.2] フェデレートラーニング(Federated Learning)は、分散モデルトレーニングのテクニックである。
勾配反転攻撃と中毒攻撃は、トレーニングデータのプライバシーとモデルの正しさに重大なリスクをもたらす。
我々は,信頼された参加者に頼らずに,フェデレート学習における安全なモデルトレーニングを実現するための,SMTFLと呼ばれる新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 06:12:43 GMT)
Achievable distributional robustness when the robust risk is only partially identified [8.2] 安全クリティカルなアプリケーションでは、機械学習モデルは最悪の分散シフトの下でうまく一般化すべきである。
我々は、識別可能性に関係なく常に明確に定義された、ロバスト性の新しい尺度として、最悪のロバストリスクを導入します。
まず, 既存のロバストネス法が部分的に同定可能な場合において, 確実に準最適であることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:42:47 GMT)
Premise-Augmented Reasoning Chains Improve Error Identification in Math reasoning with LLMs [8.2] 大型言語モデル(LLM)の数学的推論を促進させるチェーン・オブ・ソート(CoT)
本稿では,各ステップの前提を識別し,推論の評価を改善するためのフレームワークを提案する。
本研究は,複雑な問題解決課題に対処する前提中心表現の有用性を強調した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:44:58 GMT)
VolleyBots: A Testbed for Multi-Drone Volleyball Game Combining Motion Control and Strategic Play [8.1] VolleyBotsは新しいMARLテストベッドで、複数のドローンが協力し、物理的なダイナミクスの下でバレーボールを競う。
単流体ドリルから多流体協調・競争タスクまで,幅広いタスクスイートを提供する。
シミュレーションの結果、既存のアルゴリズムは単純なタスクを効果的に処理するが、低レベルの制御と高レベルの戦略の両方を必要とする複雑なタスクでは困難に直面することがわかった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:07:23 GMT)
DeepForest: Sensing Into Self-Occluding Volumes of Vegetation With Aerial Imaging [8.1] リモートセンシングの長期的限界は、深い天蓋層に深く浸透する。
現在、LiDARとレーダーは3D植生構造を測定するための主要な選択肢と考えられている。
我々のアプローチは、森林のような自己排他的な植生の量を感知することを可能にする。
我々は、ドローンによる合成開口イメージングにより焦点スタックをスキャンし、事前訓練された3D畳み込みニューラルネットワークを用いて、焦点外信号のコントリビューションを低減する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:45:49 GMT)
Beyond English: Evaluating Automated Measurement of Moral Foundations in Non-English Discourse with a Chinese Case Study [8.1] 本研究では、非英語コーパスにおける道徳的基礎(MF)を測定するための計算手法について検討する。
本研究は,中国語を事例として,機械翻訳テキスト,局所言語語彙,多言語言語モデル,および多言語モデル(LLM)に英語リソースを適用し,非英語テキストのMFを測定することの有効性を評価する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:17:01 GMT)
Fairness in Survival Analysis: A Novel Conditional Mutual Information Augmentation Approach [8.0] 生存分析における等化奇数 (EO) という新たなフェアネスの概念を導入し, 予め定義された時点における予測公平性を強調する。
我々の条件付き相互情報拡張(CMIA)アプローチは,予測精度と公平性を効果的にバランスさせることができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:40:38 GMT)
Boundary-Driven Table-Filling with Cross-Granularity Contrastive Learning for Aspect Sentiment Triplet Extraction [8.0] Aspect Sentiment Triplet extract taskは、きめ細かい感情分析において最も顕著なサブタスクの1つである。
既存のほとんどのアプローチでは、エンドツーエンドで2次元テーブルフィリングプロセスとしてフレームトリプレット抽出を行っている。
文レベル表現と単語レベル表現のセマンティック一貫性を高めるために,BTF-CCLを用いた境界駆動型テーブル充填を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:23:45 GMT)
De-VertiFL: A Solution for Decentralized Vertical Federated Learning [7.9] この研究は、分散VFL設定でモデルをトレーニングするための新しいソリューションであるDe-VertiFLを紹介している。
De-VertiFLは、新しいネットワークアーキテクチャディストリビューション、革新的な知識交換スキーム、分散フェデレーショントレーニングプロセスを導入することで貢献する。
その結果、De-VertiFLは一般的にF1スコアのパフォーマンスにおいて最先端のメソッドを上回り、分散化とプライバシ保護のフレームワークを維持していることがわかった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:30:41 GMT)
Test Time Training for 4D Medical Image Interpolation [7.9] 本稿では,ラベルを必要とせず,自己監督を用いて新たな分布にモデルを適応させる新しいテストタイムトレーニングフレームワークを提案する。
利用可能な2つの4D医療画像データセット、Cardiacと4D-Lungについて実験を行った。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:19:16 GMT)
Verifying Fault-Tolerance of Quantum Error Correction Codes [7.8] 大規模フォールトトレラント量子コンピューティングは、ノイズを抑制するために量子エラー訂正符号(QECC)に依存している。
本稿では,量子プログラム言語におけるQECC実装のフォールトトレランスを定式化する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 00:11:21 GMT)
MILU: A Multi-task Indic Language Understanding Benchmark [7.7] 我々は,インデクス言語における大規模言語モデルを評価するための総合評価ベンチマークMILUを紹介する。
インド中心のデザインにより、MILUは地域や州レベルの試験の資料を取り入れ、地域の歴史、芸術、祭典、法律などのトピックを科学や数学のような標準的な主題と共にカバーしている。
オープンな多言語モデルは言語固有の微調整モデルよりも優れており、ランダムなベースラインよりもわずかに優れている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:41:27 GMT)
SLiM: One-shot Quantization and Sparsity with Low-rank Approximation for LLM Weight Compression [7.6] SLIMは新しいワンショット圧縮フレームワークで、ハードウェアフレンドリーな量子化、スパーシティ、低ランク近似を統合する。
SLIMはモデル精度を最大5.66%(LLaMA-2-7B)に改善し、4ビットの重み量子化で2:4の間隔で計算し、従来の手法より優れている。
また,小調整なしでSLIMと比較して,最大1.66%(LLaMA-2-13B)の精度向上を図ったPEFTレシピを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:30:52 GMT)
Vision-Language Model Dialog Games for Self-Improvement [7.6] VLM Dialog Gamesは、視覚言語モデル(VLM)のための、新しくスケーラブルな自己改善フレームワークである。
ゲームインタラクションの成功をフィルタすることにより、私たちは、インターリーブされた画像とテキストの高品質なデータセットを自動的にキュレートする。
この合成データの微調整は、下流タスクのパフォーマンス向上とデータセット間の一般化につながることを実証する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 21:58:07 GMT)
LLM+AL: Bridging Large Language Models and Action Languages for Complex Reasoning about Actions [7.6] LLM+ALは,LLMの自然言語理解能力を,行動言語の記号的推論強度で橋渡しする手法である。
LLM+AL"はChatGPT-4, Claude 3 Opus, Gemini Ultra 1.0, o1-previewなど,最先端のLLMと比較する。
以上の結果から,LLM+ALは比較的最小限の修正しか行わないが,常に正しい解が得られることが示唆された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:37:29 GMT)
Investigating the Robustness of Deductive Reasoning with Large Language Models [7.5] 大規模言語モデル(LLM)は多くの推論に基づく自然言語処理(NLP)タスクにおいて印象的な結果が得られることが示されている。
LLMが、非公式および自己形式化の両方の手法で、どの程度論理的推論タスクに頑健であるかは、まだ不明である。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:16:51 GMT)
Accelerating evolutionary exploration through language model-based transfer learning [7.4] 本稿では,伝達学習と遺伝子発現プログラミングを統合する手法を提案する。
このフレームワークは自然言語処理技術を統合し、過去の最適化で探索された方程式から相関や繰り返しパターンを識別する。
本結果は,移動学習機構によって導出された初期解が,改良された解に対するアルゴリズムの収束率を高めることを裏付けるものである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:49:14 GMT)
INSIGHT: Enhancing Autonomous Driving Safety through Vision-Language Models on Context-Aware Hazard Detection and Edge Case Evaluation [7.4] INSIGHTは、危険検出とエッジケース評価を強化するために設計された階層型視覚言語モデル(VLM)フレームワークである。
本手法は,マルチモーダルデータ融合を用いて意味表現と視覚表現を統合し,運転シナリオの正確な解釈を可能にする。
BDD100Kデータセットの実験結果は、既存のモデルよりもハザード予測の正確性と正確性を大幅に改善したことを示している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:28:23 GMT)
PALQA: A Novel Parameterized Position-Aware Lossy Quantum Autoencoder using LSB Control Qubit for Efficient Image Compression [7.3] 本研究では、画像圧縮に最小のビット制御量子ビットを利用するPALQA(Parized position-aware Losy quantum autoencoder)回路を導入する。
PALQA回路は、必要なゲート数とPSNRメトリクスの点で優れた性能を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:08:02 GMT)
T-SCEND: Test-time Scalable MCTS-enhanced Diffusion Model [7.3] T-SCENDは、エネルギーベースのトレーニングの改善とテスト時間計算のスケールアップにより、拡散モデルの推論能力を改善するフレームワークである。
推論中、T-SCENDはデノナイジングプロセスと新しいハイブリッドモンテカルロ木探索を統合する。
特に、Mazeのサイズを最大6ドル(約6,600円)までトレーニングしたT-SCENDでは、Mazeの問題の88%を15ドル(約1,300円)で解決していますが、標準拡散は完全に失敗します。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:07:48 GMT)
Text2PDE: Latent Diffusion Models for Accessible Physics Simulation [7.2] 物理シミュレーションに潜時拡散モデルを適用する方法をいくつか紹介する。
提案手法は、現在のニューラルPDEソルバと、精度と効率の両面で競合することを示す。
スケーラブルで正確で使用可能な物理シミュレータを導入することで、ニューラルPDEソルバを実用化に近づけたいと思っています。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:52:04 GMT)
Recovering Imbalanced Clusters via Gradient-Based Projection Pursuit [7.1] 本研究では,不均衡クラスタかベルヌーイ・ラデマッハ分布を含む射影を復元する手法を提案する。
我々は、不均衡クラスタがバランスの取れたクラスタよりも容易に回収できることを観察できる、プラントベクター設定におけるアルゴリズムのサンプルの複雑さを分析します。
我々は,FashionMNISTとHuman Activity Recognitionデータセットを用いて,実世界のデータへの適用性を実験的に評価した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:18:17 GMT)
Discovery of Spatter Constitutive Models in Additive Manufacturing Using Machine Learning [7.1] AMの重要な課題の1つは、一貫した印刷品質を達成することである。
メルトプール力学はプロセスの安定性と部分品質を高めるために重要である。
我々はAMプロセス運用に向けた意思決定を支援するフレームワークを開発した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:56:24 GMT)
Risk-Aware Driving Scenario Analysis with Large Language Models [7.1] 大規模言語モデル(LLM)は、微妙な文脈関係、推論、複雑な問題解決を捉えることができる。
本稿では, LLM を利用して生成した運転シナリオのリスク認識分析を行う新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:19:13 GMT)
Reviving The Classics: Active Reward Modeling in Large Language Model Alignment [7.0] 人間の好みからニューラル報酬モデルを構築することは、強化学習において重要な要素である。
人間のアノテーションの不足と高いコストを考えると、アノテートする最も情報に富んだペアをどうやって選ぶかは、不可欠だが挑戦的なオープンな問題である。
我々は、フィッシャー情報に基づく選択戦略を提案し、古典的な実験設計文献から理論を適応させ、それらをディープニューラルネットワークに基づく報酬モデリングタスクの最終線形層に適用する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:47:11 GMT)
Active learning of neural population dynamics using two-photon holographic optogenetics [7.0] 神経集団動態を同定するための最も効果的な光刺激パターンを決定する方法を開発した。
我々は、実データと合成データの両方にアプローチを示し、いくつかのケースでは、所定の予測力に到達するために必要なデータの量を2倍に減らすことができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:28:05 GMT)
Robust and Conjugate Spatio-Temporal Gaussian Processes [7.0] 我々はAltamirano al et alの堅牢RCGPフレームワークを適応し、特殊化する。
我々は、古典的時間的GPに匹敵する計算コストで、アンロバスト時間的GPを得る。
本手法は,金融・気象分野において広く研究されている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:16:01 GMT)
Automated Vehicles at Unsignalized Intersections: Safety and Efficiency Implications of Mixed-Human-Automated Traffic [6.9] 自動車両(AV)の交通システムへの統合は、道路の安全性と効率を高める前例のない機会である。
本研究では,無人交差点におけるAVと人間駆動車(HV)の行動差と適応性を調べることにより,ギャップを埋めることを目的とする。
AVはより大きな安全マージンを維持しているが、その保守的な行動は、人間のドライバーにとって予期せぬ状況を引き起こす可能性がある。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:23:31 GMT)
MotionLab: Unified Human Motion Generation and Editing via the Motion-Condition-Motion Paradigm [6.9] 人間の動きの生成と編集はコンピュータグラフィックスと視覚の重要な要素である。
この分野での現在のアプローチは、特定のタスクに合わせた分離されたソリューションを提供する傾向がある。
本稿では,新しいパラダイムであるMotion-Condition-Motionを紹介する。
我々は、ソースモーションからターゲットモーションへのマッピングを学習するために、修正フローを組み込んだ統合フレームワーク、MotionLabを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:43:26 GMT)
A physics-encoded Fourier neural operator approach for surrogate modeling of divergence-free stress fields in solids [6.9] 固体中の準静的平衡応力場のシュロゲートモデリングのための物理符号化フーリエニューラル演算子(PeFNO)を開発した。
準静的機械平衡に対する対応する境界値問題の数値解からトレーニング用応力場データを得る。
トレーニングされたPgFNOの出力は、トレーニングされたPgFNOまたはトレーニングされたPiFNOの出力よりも、機械的平衡を満たすのにかなり正確である。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:33:01 GMT)
EditIQ: Automated Cinematic Editing of Static Wide-Angle Videos via Dialogue Interpretation and Saliency Cues [6.8] 我々は、静止画、大視野、高解像度カメラで撮影されたシーンを撮影的に編集する、完全に自動化されたフレームワークEditIQを提案する。
静的カメラフィードから、EditIQは最初、複数の仮想フィードを生成し、カメラマンのチームをエミュレートする。
これらの仮想カメラショットは後に自動編集アルゴリズムを用いて組み立てられ、その目的は視聴者に最も鮮明なシーンコンテンツを提示することである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:45:52 GMT)
Stability and Generalization of Quantum Neural Networks [6.8] 量子ニューラルネットワーク(QNN)は、急速に成長する量子機械学習分野において、新興技術として重要な役割を果たす。
我々は,古典的学習理論,すなわちアルゴリズム的安定性の先進的なツールを用いて,QNNの一般化を研究する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:05:31 GMT)
TexHOI: Reconstructing Textures of 3D Unknown Objects in Monocular Hand-Object Interaction Scenes [6.8] 本研究では,物体の表面アルベドに対する環境可視性と間接照明に対する手の影響を予測する新しいアプローチを提案する。
本手法はテクスチャ再構築における最先端手法を超越した手法であり,我々の知る限り,オブジェクトテクスチャ再構築における手動インタラクションを初めて考慮した手法である。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:47:23 GMT)
Analytical Lyapunov Function Discovery: An RL-based Generative Approach [6.8] 解析的リアプノフ関数(ローカル)を構築するために変換器を用いたエンドツーエンドフレームワークを提案する。
本フレームワークは,候補リアプノフ関数を生成するトランスフォーマーベーストレーナーと,候補表現を検証するファルシファイアから構成される。
本稿では,制御文献に未同定なリアプノフ関数が発見可能であることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:04:15 GMT)
How Deep is your Guess? A Fresh Perspective on Deep Learning for Medical Time-Series Imputation [6.5] アーキテクチャとフレームワークのバイアスがモデルのパフォーマンスにどのように影響するかを示します。
実験では、プリプロセッシングと実装の選択に基づいて、最大20%の性能変化を示す。
我々は,現在の深層計算法と医療要件の相違点を同定する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 00:12:27 GMT)
Uncertainty Quantification for Collaborative Object Detection Under Adversarial Attacks [6.5] 協調オブジェクト検出(COD)と協調認識は、様々なエンティティからのデータや特徴を統合することができる。
敵対的攻撃は、ディープラーニングCODモデルに潜在的な脅威をもたらす。
我々は、協調知覚フレームワーク(TUQCP)における信頼された不確実性定量化を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:03:32 GMT)
A User Guide to Sampling Strategies for Sliced Optimal Transport [6.5] 本稿では,スライスされた最適輸送戦略をサンプリングするためのユーザガイドとして機能する。
本稿では, 建設方法, 生成時間の複雑さ, 理論的保証, および各戦略の条件について詳述する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:35:40 GMT)
Graph Structure Learning for Tumor Microenvironment with Cell Type Annotation from non-spatial scRNA-seq data [6.4] 本稿では,細胞型予測と細胞間相互作用解析を強化する新しいグラフニューラルネットワーク(GNN)モデルを提案する。
提案したScGSLモデルは堅牢な性能を示し、平均精度84.83%、精度86.23%、リコール81.51%、F1スコア80.92%を全データセットで達成した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:28:25 GMT)
AI Reliance and Decision Quality: Fundamentals, Interdependence, and the Effects of Interventions [6.4] 私たちは、AIによる意思決定に関する現在の文献で、信頼と意思決定品質が不適切に混ざり合っていると論じています。
我々の研究は、AIによる意思決定における信頼行動と意思決定品質の区別の重要性を強調している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:21:13 GMT)
On the Inherent Robustness of One-Stage Object Detection against Out-of-Distribution Data [6.3] 画像データ中の未知物体を検出する新しい検出アルゴリズムを提案する。
モデルによって抽出された特徴に対する次元の呪いの影響を軽減するために、教師付き次元削減技術を利用する。
これは高解像度の特徴マップを用いて、教師なしの方法で潜在的に未知の物体を識別する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:20:36 GMT)
Reliable Pseudo-labeling via Optimal Transport with Attention for Short Text Clustering [6.2] 本稿では,textbfOptimal textbfTransportを経由したReliable textbfPseudo-labelingという,新しいテキストクラスタリングフレームワークを提案する。
textbfPOTAはクラスタリングのための識別表現学習を支援するために、信頼できる擬似ラベルを生成する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 06:44:31 GMT)
Towards Evaluation Guidelines for Empirical Studies involving LLMs [6.2] 大規模言語モデル(LLM)は、ソフトウェア工学の研究環境を変えました。
本稿では,このような研究の総括的ガイドラインを初めて提示する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:29:07 GMT)
Rethinking stance detection: A theoretically-informed research agenda for user-level inference using language models [6.1] スタンス検出は自然言語処理研究において一般的な課題となっている。
我々は,(i)スタンスの理論的概念化の欠如,(ii)個人レベルでのスタンス処理に関する重要なギャップを強調した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:52:20 GMT)
An Attack-Driven Incident Response and Defense System (ADIRDS) [6.1] ADIRDSは実システムで動作するオンラインモニタリングシステムである。
実際のシステムをグラフとしてモデル化することにより、システムのクリティカルノード/アセットを密に監視する。
私たちはこのシステムを実例に適用することに成功しました。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:12:05 GMT)
e-SimFT: Alignment of Generative Models with Simulation Feedback for Pareto-Front Design Exploration [6.1] シミュレーション微調整生成モデルを用いた設計探索のための新しいフレームワークを提案する。
まず、Large Language Models (LLMs) 向けに開発された好みアライメント手法を採用し、エンジニアリング設計のための生成モデルを微調整する最初の応用例を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:17:22 GMT)
Towards Stable Machine Learning Model Retraining via Slowly Varying Sequences [6.1] そこで本研究では,リトレーニングを繰り返して安定なモデル列を見つけるためのモデルに依存しないフレームワークを提案する。
最適モデルの復元が保証される混合整数最適化の定式化を開発する。
平均的に、予測力の2%の低下は、安定性の30%の改善につながることが判明した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:25:48 GMT)
CUQDS: Conformal Uncertainty Quantification under Distribution Shift for Trajectory Prediction [6.0] 軌道予測モデルは、有限未来の軌道とその関連する不確実性の両方をオンライン環境で推測することができる。
本研究では、予測された軌道の不確かさを定量化するために、分散シフトフレームワークCUQDSのコンフォーマル不確実性定量化を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:08:55 GMT)
Survey of Quantization Techniques for On-Device Vision-based Crack Detection [6.0] 構造的健康モニタリング(SHM)は、インフラの安全性と長寿を保証する。
UAVと組み合わせた視覚ベースの亀裂検出は、従来のセンサーベースのSHM手法の限界に対処する。
本研究では、MobileNetV1x0.25とMobileNetV2x0.5の2つの軽量畳み込みニューラルネットワークモデルを評価する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:29:29 GMT)
Towards graph neural networks for provably solving convex optimization problems [6.0] 提案するMPNNフレームワークは,検証可能な実現可能性保証を用いて凸最適化問題を解決する。
実験の結果,提案手法は既存の神経ベースラインよりも解の質や実現可能性に優れていた。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:11:41 GMT)
More Experts Than Galaxies: Conditionally-overlapping Experts With Biologically-Inspired Fixed Routing [5.8] Conditionally Overlapping Mixture of ExperTs (COMET) は、モジュラーでスパースなアーキテクチャを、指数関数的に重複する専門家数で誘導する一般的なディープラーニング手法である。
画像分類,言語モデリング,回帰といったタスクにおけるCOMETの有効性を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:22:04 GMT)
Causal bandits with backdoor adjustment on unknown Gaussian DAGs [5.8] グラフ構造が不明な場合の因果帯域問題について検討する。
連続的に生成された実験データと観測データを用いて各アームのバックドア調整セットを同定する。
最適介入を逐次決定するために,修正された上位信頼境界に基づく新しい帯域幅アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:18:35 GMT)
A Preliminary Study of Fixed Flaky Tests in Rust Projects on GitHub [5.8] GitHub上のRustプロジェクトでは、不安定なテストの研究が進行中です。
修正は根本原因、マニフェストの特徴、修正戦略に関する貴重な情報を提供することができるので、報告されただけでなく、修正される不安定なテストに重点を置いています。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:55:54 GMT)
Single-shot detection limits of quantum illumination with multipartite qubits [5.8] 量子照明は、信号とアイドラーモードからなる2モードの絡み合った状態を用いて、低反射目標を検出するためのプロトコルである。
2モードキュービット状態から3モードキュービット状態に拡張し, (i) 3つの信号, (ii) 2つの信号と1つのアイドラー, (iii) 1つの信号と2つのアイドラーの構成を探索する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:02:30 GMT)
Anytime Incremental $ρ$POMDP Planning in Continuous Spaces [5.8] 我々は、時間とともに改善の正式な保証とともに、信念表現を動的に洗練する時限解法を提案する。
一般的なエントロピー推定器の有効性を示し、計算コストを桁違いに削減する。
実験の結果,$rho$POMCPOW は効率と解品質の両方において最先端の解法よりも優れていた。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:19:40 GMT)
Theoretical Guarantees for Low-Rank Compression of Deep Neural Networks [5.6] ディープニューラルネットワークは多くのアプリケーションで最先端のパフォーマンスを実現している。
低ランク近似技術は、これらのネットワークのサイズと複雑さを減らし、有望な解決策を提供する。
我々は、データ駆動の低ランク圧縮のための分析フレームワークを開発した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:10:13 GMT)
EFKAN: A KAN-Integrated Neural Operator For Efficient Magnetotelluric Forward Modeling [5.6] 我々はコルモゴロフ・アルノルドネットワーク(EFKAN)を用いた新しいニューラル演算子(FNO)を提案する。
EFKANフレームワーク内では、FNOは周波数領域の比抵抗モデルから見かけの比抵抗と位相を計算する分岐ネットワークとして機能する。
提案手法は, 所望の周波数と位置でインバージョンを施したNOと比較して, 比抵抗と位相を求める際の精度が高い。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:21:14 GMT)
Flatten Graphs as Sequences: Transformers are Scalable Graph Generators [5.6] 我々は,デコーダのみの変換器を用いて,大きな属性グラフを生成する新しいフレームワークであるAutoGraphを紹介する。
私たちのアプローチの核となるのは、グラフをランダムなシーケンスに変換する可逆的な「フラット化」プロセスです。
これらのシーケンスからサンプリングと学習を行うことで、AutoGraphは変換器をモデル化し、複雑なグラフ構造を生成することができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:52:14 GMT)
Understanding User Mental Models in AI-Driven Code Completion Tools: Insights from an Elicitation Study [5.5] AIによるコード補完ツールと対話する際に、フォーカスグループを使用してメンタルモデルを抽出する56人の開発者を対象に、ライセンス研究を実施します。
この研究結果は、ユーザの期待に応え、満足度と生産性を高め、AIによる開発ツールへの信頼を高める、人間中心のCCTを設計するための実用的な洞察を提供する。
我々はまた、開発者のコーディングの好みや環境に動的に適応し、多様な環境へのシームレスな統合を保証する概念実証CCTであるAtheNAを開発した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:20:49 GMT)
On the Guidance of Flow Matching [5.5] フローマッチングは、様々な生成タスクにおける最先端のパフォーマンスを示している。
フローマッチングのための一般的なガイダンスの最初のフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:27:57 GMT)
Pruning-aware Loss Functions for STOI-Optimized Pruned Recurrent Autoencoders for the Compression of the Stimulation Patterns of Cochlear Implants at Zero Delay [5.5] 人工内耳(CI)は外科的にインプラントされた補聴器であり、難聴者の聴覚を回復させる。
本研究は、ディープ・リカレント・オートエンコーダの符号化された刺激パターンの目的音声の明瞭度を最大化する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:44:15 GMT)
Adviser-Actor-Critic: Eliminating Steady-State Error in Reinforcement Learning Control [5.5] 精度制御ジレンマに対処するために設計されたアドバイザ・アクター・クライブ(AAC)を導入する。
AACは、俳優にコントロールアクションを洗練させ、それによってゴール達成の精度を高めるアドバイザーを特徴とする。
AACは精度クリティカルでゴール条件付きタスクにおいて標準のRLアルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:26:47 GMT)
Lower Bounds for Chain-of-Thought Reasoning in Hard-Attention Transformers [5.5] 整合推論とスクラッチパッドは、変換器の計算能力を高める重要なツールとして登場した。
本研究では,異なるアルゴリズム問題にまたがるCoTステップ数に対する体系的下界の研究を開始する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:14:01 GMT)
LAYOUTDREAMER: Physics-guided Layout for Text-to-3D Compositional Scene Generation [5.4] テキストによる高品質で物理的に一貫した構成シーン生成を容易にするために,3Dガウススプラッティング(3DGS)を利用するフレームワークを提案する。
具体的には、テキストプロンプトが与えられた場合、シーングラフに変換し、初期構成型3Dガウスの密度とレイアウトを適応的に調整する。
シーングラフから指示された依存関係を抽出することにより、現実性と柔軟性の両方を確保するために、物理的およびレイアウトエネルギーを調整します。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:51:37 GMT)
How Inclusively do LMs Perceive Social and Moral Norms? [5.3] 言語モデル(LM)は意思決定システムや対話型アシスタントとして使用される。
人口集団間でLMがノルムを包括的に知覚する方法について検討する。
LM応答に顕著な相違がみられ, 若年層群, 高所得層群が近縁であった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:24:17 GMT)
Query-Based and Unnoticeable Graph Injection Attack from Neighborhood Perspective [5.3] QUGIAはクエリベースの無意味グラフインジェクションアタックである。
被害者ノード接続に基づいてエッジを選択し、ベイズフレームワークを使用してノード機能を生成することで、ノードを注入する。
これにより、インジェクションされたノードが元のグラフノードと似ており、暗黙的にホモフィリを保ち、攻撃をより目立たないものにすることができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:11:57 GMT)
Muharaf: Manuscripts of Handwritten Arabic Dataset for Cursive Text Recognition [5.3] Manuscripts of Hand written Arabic(Muharaf)データセットは、1,600以上の歴史的な手書きページイメージからなる機械学習データセットである。
このデータセットは、手書きのテキスト認識において、最先端の技術を前進させるためにコンパイルされた。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 21:35:24 GMT)
Synthesis of Model Predictive Control and Reinforcement Learning: Survey and Classification [5.3] この研究は、異なる組み合わせアルゴリズムを可能にする相違点、類似点、基本点を照らす。
本稿では,MPCのオンライン最適化手法を用いて,ポリシーのクローズドループ性能を向上する方法について検討する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:06:07 GMT)
Generative Modeling on Lie Groups via Euclidean Generalized Score Matching [5.3] ユークリッドの楽譜に基づく拡散過程をリー群上の生成的モデリングに拡張する。
我々のアプローチはリー代数表現の直和として分解されるランゲヴィン力学をもたらす。
軌道空間の有効次元を小さくすることで,リー群の適切な選択が学習効率を向上させることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:32:17 GMT)
Beemo: Benchmark of Expert-edited Machine-generated Outputs [5.2] エキスパートによる機械生成出力(Beemo)のベンチマーク
本稿では,エキスパート編集機械生成出力(Beemo)のベンチマークを紹介する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:05:26 GMT)
Physics-Informed Echo State Networks for Modeling Controllable Dynamical Systems [5.2] 物理インフォームドESN (PI-ESN) は、外部入力のないカオス力学系をモデル化するために最初に提案された。
PI-ESNは、いくつかのデータポイントで以前にトレーニングされた外部入力でESNモデルを正規化することができ、過度な適合を低減し、一般化エラーを改善することができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:26:35 GMT)
Identifying Large-Scale Linear Parameter Varying Systems with Dynamic Mode Decomposition Methods [5.2] 本研究は,大規模LPVシステムの局所的およびグローバルな同定手法を開発する。
この方法は動的モード分解(DMD)にインスパイアされたDMD-LPVと呼ばれる。
実験により,提案手法は,全次元の同定を行うことなく,与えられた大規模システムの低次モデルを容易に同定できることが示唆された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:15:16 GMT)
Extending SEEDS to a Supervoxel Algorithm for Medical Image Analysis [5.2] 3D SEEDSは、医療画像解析のための高速で、より良く、そしてオープンソースのスーパーボクセルアルゴリズムである。
10個の臓器にまたがる13個のセグメンテーションタスクにおいて,3D SEEDSと広く使用されているスーパーボクセルアルゴリズムSLICを比較した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:26:57 GMT)
SCALM: Detecting Bad Practices in Smart Contracts Through LLMs [5.2] 本稿では,35以上の特定の課題を掘り下げ,スマートコントラクトにおける悪い実践に関する最初の体系的な研究を紹介する。
具体的には,大規模言語モデル (LLM) ベースのフレームワーク SCALM を提案する。
Step-Back PromptingとRetrieval-Augmented Generation (RAG)を組み合わせて、さまざまな悪いプラクティスを効果的に識別し、対処する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:15:13 GMT)
Reasoning Bias of Next Token Prediction Training [5.2] 次世代トークン予測(NTP)は,大規模言語モデル(LLM)の主要なトレーニングパラダイムである
トレーニング中にNTPが騒音に曝露しても,推論能力は上回っていることが明らかとなった。
この逆直感的な結果は、トレーニング力学における雑音の正規化の影響に起因している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:46:41 GMT)
Connections between Schedule-Free Optimizers, AdEMAMix, and Accelerated SGD Variants [5.1] 本稿では,AdEMAMixが勾配降下の加速バージョンに最もよく似ていることを示す。
我々は、大小のバッチサイズ設定で同じ性能を維持する、Simplified-AdEMAMixと呼ばれるAdEMAMixの修正を導入する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:55:35 GMT)
Point-Level Topological Representation Learning on Point Clouds [5.1] 複素点雲からノードレベルの位相的特徴を抽出する新しい手法を提案する。
我々は,これらのトポロジ的特徴が合成データと実世界のデータの両方に与える影響を検証する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:59:47 GMT)
Improved Quantum Computation using Operator Backpropagation [5.1] 本稿では,古典シミュレーションと量子ハードウェアを統合して観測可能な期待値の計算を改善するフレームワークを提案する。
この枠組みでは、量子回路を2つのサブ回路に分割する: 古典的なコンピュータ上で実行される観測可能なハイゼンベルクのバックプロパゲートな進化を記述するもので、もう1つは量子プロセッサ上で実行される「シュル」オーディンガー進化である。
本手法の有効性をハミルトニアンシミュレーション問題に適用し,量子ハードウェアのみを用いた場合と比較して,より正確な予測値推定を実現する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 00:03:07 GMT)
Privacy Attacks on Image AutoRegressive Models [4.9] 画像自己回帰(IAR)モデルは、画像品質(FID: 1.48 vs. 1.58)と生成速度の両方で拡散モデル(DM)を上回っている。
IARとDMを比較した包括的プライバシー分析を行う。
我々は,トレーニング画像の検出において,極めて高い成功率を達成する新しいメンバーシップ推論攻撃(MIA)を開発した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:33:08 GMT)
Developing multilingual speech synthesis system for Ojibwe, Mi'kmaq, and Maliseet [4.9] 我々は,Ojibwe,Mi'kmaq,Maliseetの多言語テキスト音声(TTS)システムについて述べる。
この結果から,3言語に類する多言語TSモデルをトレーニングすることで,単言語モデルよりも性能が向上できることが示唆された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:36:55 GMT)
CoDocBench: A Dataset for Code-Documentation Alignment in Software Maintenance [4.4] ソフトウェアメンテナンスにおける中心的なタスクの1つは、コードの変更を理解して開発できることです。
このことに動機づけられた私たちは、実際の高品質のGitHubプロジェクトから抽出されたコードとドキュメントの変更を結合した、新たな“自然な”大規模なデータセットを提供しています。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:09:56 GMT)
Bayesian Parameter Shift Rule in Variational Quantum Eigensolvers [4.4] 本稿では、適切なカーネルを持つガウス過程を用いてVQE目標の勾配を推定するベイズ変法を提案する。
勾配降下(SGD)では、ベイズPSRの柔軟性により、前のステップでの観測の再利用が可能となり、最適化プロセスが加速される。
数値実験の結果,ベイジアンPSRとGradCoReによるVQE最適化はSGDを著しく高速化し,最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:44:31 GMT)
Unveiling Privacy and Security Gaps in Female Health Apps [4.4] 調査の結果、有害な許可、機密性の高い個人・医療データの収集、および数多くのサードパーティ追跡ライブラリの存在が明らかになった。
発見は、特に女性の生殖の権利が政治的課題の増大に直面しているため、FemTechアプリのプライバシーとセキュリティ対策の重大な欠如を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:34:03 GMT)
Extension of the Alberti-Uhlmann criterion beyond qubit dichotomies [4.4] 我々はアルベルト・ウルマンの基準を、任意の数のクォービット状態やクォート状態の場合に一般化する。
半デバイス独立方式で評価基準を適用する可能性を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:47:58 GMT)
Layer Separation: Adjustable Joint Space Width Images Synthesis in Conventional Radiography [4.3] 慢性関節リウマチ(RA)は関節炎と進行性構造障害を特徴とする慢性自己免疫疾患である。
ジョイントスペース幅 (JSW) は, 従来の放射線診断において, 疾患進行を評価する重要な指標である。
深層学習に基づくJSW解析のための放射線CADシステムは、データ品質において重大な課題に直面している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:33:52 GMT)
LLM-USO: Large Language Model-based Universal Sizing Optimizer [4.2] 本稿では,構造化テキスト形式で回路設計知識を符号化する知識表現手法を提案する。
この表現は、類似のサブ構造を持つ回路の最適化インサイトを体系的に再利用することを可能にする。
i)ドメイン固有の知識をBOプロセスに注入し、(ii)回路間の知識伝達を促進し、専門家デザイナーの認知戦略を反映する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:08:03 GMT)
MIDI-GPT: A Controllable Generative Model for Computer-Assisted Multitrack Music Composition [4.2] MIDI-GPTはコンピュータ支援音楽合成のための生成システムである。
楽器の種類、音楽スタイル、音の密度、ポリフォニーレベル、音の持続時間などの属性を条件付けできる。
本研究では,MIDI-GPTがトレーニング対象の音楽素材の複製を一貫して回避し,トレーニングデータセットとスタイリスティックに類似した音楽を生成し,属性制御が生成した素材に様々な制約を課すことを実証する実験結果を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:14:38 GMT)
Generalizable and Fast Surrogates: Model Predictive Control of Articulated Soft Robots using Physics-Informed Neural Networks [4.1] 本研究では,データ効率を重視した音声ソフトロボット(ASR)のための物理インフォームドニューラルネットワーク(PINN)を提案する。
高価な実世界のトレーニングデータの量は、ひとつのシステムドメインに1つのデータセットとして最小限に削減されます。
PINNでは、精度の低いFPモデルの予測速度を最大466倍に向上させる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:16:33 GMT)
Deep Ensemble approach for Enhancing Brain Tumor Segmentation in Resource-Limited Settings [4.0] 本研究では, グリオーマのセマンティックセグメンテーションのために, UNet3D, V-Net, MSA-VNetモデルを統合した深層学習アンサンブルを開発する。
DICEスコアは腫瘍コア0.8358、全腫瘍0.8521、腫瘍エンハンス0.8167である。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:53:09 GMT)
From Accidents to Insights: Leveraging Multimodal Data for Scenario-Driven ADS Testing [4.0] 本稿では,シナリオベースADSテストケース生成フレームワークであるTRACEを紹介する。
マルチモーダルデータを活用して、現実世界の事故報告から困難なシナリオを抽出することで、TRACEは少ないデータで多数の重要なテストケースを構築します。
ユーザからのフィードバックによると、TRACEはシナリオ再構築の精度が優れており、シナリオの77.5%が"ほぼ"あるいは"完全に"一貫性がある"と評価されている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:21:29 GMT)
Efficient Bilinear Attention-based Fusion for Medical Visual Question Answering [4.0] MedVQA (MedVQA) はコンピュータビジョンと自然言語処理の交わりに注目が集まっている。
我々は,オリゴニティ損失,マルチヘッドアテンション,双線形アテンションネットワークを統合した新しい融合モデルOMniBANを導入し,高い計算効率とソリッドパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:19:35 GMT)
Regret-Optimized Portfolio Enhancement through Deep Reinforcement Learning and Future Looking Rewards [4.0] 本稿では、PPO(Proximal Policy Optimization)を用いた既存のポートフォリオ戦略を強化するためのエージェントベースの新しいアプローチを提案する。
従来のポートフォリオ構築にのみ焦点をあてるのではなく、当社のアプローチは、PPOとOracleエージェントによって駆動される動的リバランスを通じて、すでに高性能な戦略を改善することを目的としています。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:45:59 GMT)
Open Foundation Models in Healthcare: Challenges, Paradoxes, and Opportunities with GenAI Driven Personalized Prescription [3.9] OpenAIのGPT-4のようなプロプライエタリなLarge Language Model(LLM)の成功を受けて、オープンで非プロプライエタリなAI基盤モデル(AIFM)の開発への関心が高まっている。
独自の機能に適合できないにもかかわらず、オープンモデルは医療アプリケーションに革命をもたらす大きな可能性を秘めている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:16:56 GMT)
Unlocking the power of global quantum gates with machine learning [3.9] 有限個のグローバルゲートと単一量子ユニタリ層からなる回路アンサーゼを提案する。
構成上、これらのアンサーゼは線形深部局所ゲート量子回路と等価であり、非常に表現性が高い。
ハイゼンベルクモデルとトーリック符号ハミルトニアンの基底状態準備問題に適用することで、このアプローチの能力を実証する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:24:12 GMT)
Less is More: Simplifying Network Traffic Classification Leveraging RFCs [3.9] 我々は,雑音特性を排除し,有意義な特徴に焦点を当てたネットワークトラフィックの最小限の表現であるNetMatrixを提案する。
選択された基準線と比較して,LiMは資源消費を桁違いに改善することを示した。
本研究は、トラフィック表現と機械学習モデル選択における単純さの有効性を強調し、資源効率の高いネットワークトラフィック分類への道を開く。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:08:37 GMT)
DART: An AIGT Detector using AMR of Rephrased Text [3.8] DARTは、リフレクション、セマンティックパーシング、スコアリング、マルチクラス分類の4つのステップから構成される。
実験の結果,DARTは確率的特徴やAIGTの起源を伴わずに複数のブラックボックスLDMを識別できることがわかった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:52:02 GMT)
Variance-Adjusted Cosine Distance as Similarity Metric [3.8] 本研究はコサイン類似性の限界を示す。
伝統的なコサイン類似度計量はユークリッド空間でのみ有効である。
データにばらつきと相関がある場合、コサイン距離は類似性の完全な正確な尺度ではない。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:20:57 GMT)
From Human Hands to Robotic Limbs: A Study in Motor Skill Embodiment for Telemanipulation [3.7] 本稿では,GRUに基づく変分オートエンコーダを提案し,マニピュレータの構成空間の潜在表現を学習する。
完全に接続されたニューラルネットワークは、人間の腕の配置をこの潜伏空間にマッピングし、システムは対応するマニピュレータの軌道をリアルタイムで模倣して生成することができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:52:57 GMT)
AlphaSharpe: LLM-Driven Discovery of Robust Risk-Adjusted Metrics [3.7] シャープ比率のような財務指標は、リスクとリターンのバランスをとることで投資実績を評価する上で重要である。
伝統的なメトリクスは、特に動的で不安定な市場の状況において、堅牢性と一般化に苦しむことが多い。
本稿では,大規模言語モデル(LLM)を活用する新たなフレームワークであるAlphaSharpeを紹介する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:15:35 GMT)
A comparison of translation performance between DeepL and Supertext [3.7] 本研究では、DeepLとSupertextという2つの商用機械翻訳システムを比較した。
我々は4つの言語方向の翻訳品質を、文書レベルのコンテキストでセグメントを評価するプロの翻訳者を用いて評価する。
セグメントレベルの評価では、ほとんどの場合、システム間での強い嗜好は示されていないが、文書レベルの分析では、4つの言語方向のうち3つにスーパーテキストの嗜好が示される。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:53:42 GMT)
Rethinking Vision Transformer for Object Centric Foundation Models [3.5] 本稿では,Fovea-like Input Patching (FLIP) アプローチを提案する。
FLIPはよりデータ効率が高く、高解像度の視覚シーンで比較的小さなオブジェクトをマスキングする際にセグメンテーション性能が向上する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:07:34 GMT)
A Semantic Search Engine for Mathlib4 [3.5] 本稿では,非公式な問合せを受け付け,関連する定理を求めるMathlib4のセマンティック検索エンジンを提案する。
また,各種検索エンジンの性能評価のためのベンチマークを構築した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:10:52 GMT)
MedRAX: Medical Reasoning Agent for Chest X-ray [3.5] 胸部X線(CXR)は、疾患管理や患者のケアにおいて重要な決定を下す上で重要な役割を果たしている。
我々は、最先端のCXR分析ツールとマルチモーダルな大規模言語モデルをシームレスに統合した、初めての汎用AIエージェントであるMedRAXを紹介する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:31:00 GMT)
Deep Neural Cellular Potts Models [3.4] 本稿では,観測データに基づいて直接学習可能な,より表現力のあるPottsモデルを提案する。
NeuralCPMのコアにはNeural Hamiltonianがあり、これは集合的な細胞力学における普遍対称性を尊重するニューラルネットワークアーキテクチャである。
人工および実世界の多細胞システムを用いた評価により,ニューラルCPMは従来の解析的ハミルトニアンによって説明できない細胞動態をモデル化できることが示されている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:03:21 GMT)
RayGauss: Volumetric Gaussian-Based Ray Casting for Photorealistic Novel View Synthesis [3.4] 微分レンダリング法は、新しいビュー合成に大きな進歩をもたらした。
不規則分布ガウスの異なる光線鋳造のための放射放射率cと密度シグマを一貫した定式化を行う。
適切なトレーニング時間を維持しつつ、Blenderデータセット上で25FPSの推論速度を達成しながら、最先端のレンダリングよりも優れた品質を実現する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:56:58 GMT)
RL-MILP Solver: A Reinforcement Learning Approach for Solving Mixed-Integer Linear Programs with Graph Neural Networks [3.4] 混合整数線形プログラミング (MILP) は様々な分野にまたがる最適化手法である。
本稿では,最初の実現可能な解を見つけるだけでなく,より有効な解を段階的に発見する新しい強化学習(RL)に基づく解法を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:43:05 GMT)
On the Impact of Performative Risk Minimization for Binary Random Variables [3.4] 連立確率変数と線形能動シフトを用いた逐次能動リスク最小化問題に対する性能評価について検討した。
完全な情報の場合、PRMソリューションと影響測定の明確な公式を導出する。
我々の分析は、データシフトをモデル化しない代替品とPRMを対比し、PRMが増幅された副作用を持つことを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:06:27 GMT)
Evalita-LLM: Benchmarking Large Language Models on Italian [3.3] Evalita-LLM(エヴァリタ-LLM)は、イタリア語のタスクでLarge Language Models(LLM)を評価するために設計されたベンチマークである。
すべてのタスクはネイティブなイタリア語であり、イタリア語からの翻訳の問題や潜在的な文化的偏見を避ける。
ベンチマークには生成タスクが含まれており、LLMとのより自然なインタラクションを可能にする。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:58:19 GMT)
Large Language Model for Qualitative Research -- A Systematic Mapping Study [3.3] 先進的な生成AIを駆使した大規模言語モデル(LLM)がトランスフォーメーションツールとして登場した。
本研究は, LLMを用いた定性的研究に関する文献を体系的にマッピングする。
LLMは様々な分野にまたがって利用されており、プロセスの自動化の可能性を示している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:10:40 GMT)
An Efficient Local Search Approach for Polarized Community Discovery in Signed Networks [3.3] 我々は,友好的あるいは敵対的な相互作用を示すために,エッジを正あるいは負のラベルでラベル付けしたサイン付きネットワークについて検討する。
我々はFrank-Wolfe最適化に基づく手法を開発し、証明可能な収束保証付き局所探索手法を提案する。
提案手法は,計算効率の面で競争力を維持しつつ,スケーラブルかつ効率よく,ソリューション品質における最先端のベースラインを達成できる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:22:01 GMT)
Standard Neural Computation Alone Is Insufficient for Logical Intelligence [3.2] 論理的推論を統合するためには、標準的なニューラルネットワーク層を根本的に再考する必要がある、と我々は主張する。
論理演算の微分可能な近似を組み込んだ論理ニューラルネットワーク(LNU)モジュラーコンポーネントを提唱する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:07:45 GMT)
Quasi-Conformal Convolution : A Learnable Convolution for Deep Learning on Riemann Surfaces [3.1] 非ユークリッド領域の深層学習は、複雑な幾何学的データを分析する上で重要である。
非ユークリッド領域の畳み込みを定義するために準コンフォーマル畳み込み(QCC)を導入する。
我々は、幾何データに関連する様々なタスクに対処する準コンフォーマル畳み込みニューラルネットワーク(QCCNN)を開発した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:01:04 GMT)
Policy Guided Tree Search for Enhanced LLM Reasoning [3.1] Policy-Guided Tree Search (PGTS)は、強化学習と構造化木探索を組み合わせて推論経路を効率的にナビゲートするフレームワークである。
私たちの重要なイノベーションは、手作業や徹底的な検索の必要性をなくし、拡大、分岐、追跡、探索の終了を動的に決定する、学習されたポリシーです。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:08:20 GMT)
Scalable Higher Resolution Polar Sea Ice Classification and Freeboard Calculation from ICESat-2 ATL03 Data [3.1] ICESat-2は高解像度の地表高度を測定する地球観測衛星である。
10m-200mセグメントの海氷上昇とフリーボード生成物は、生のATL03データから150個の信号光子を集約した。
深層学習法を用いて,これら2mセグメントを海氷,薄氷,開水に分類した。
ATL07 (地域海水準) とATL10 (フリーボード) のデータ製品と比較して, 高い解像度と精度 (96.56%) を示した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:34:16 GMT)
A Minimax Approach to Ad Hoc Teamwork [3.1] 本稿では,AHT(Ad Hoc Teamwork)に対するミニマックスベイズアプローチを提案する。
パートナーよりも特定の分布を仮定する既存の方法とは異なり、我々のアプローチは最悪のパフォーマンス保証を改善する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:57:54 GMT)
Optimal sensing of photon addition and subtraction on nonclassical light [3.0] ワッサーシュタイン距離$W_1$は、古典的でない状態への光子付加または減算によって生じる変化を忠実に捉えていることを示す。
圧縮真空やコヒーレント状態の場合にはこれを説明し、トモグラム内の特定の領域の強度の変化に光子付加(または減算)が反映されていることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:55:40 GMT)
Too Noisy To Learn: Enhancing Data Quality for Code Review C [3.0] オープンソースのデータセットは、自動コードレビュータスクのためのニューラルネットワークのトレーニングに使用される。
これらのデータセットには、クリーニングメソッドにもかかわらず持続する大量のノイズの多いコメントが含まれている。
大規模言語モデル(LLM)を用いて,これらのデータセットをさらにクリーン化する手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:48:58 GMT)
AudioGenX: Explainability on Text-to-Audio Generative Models [3.0] 我々は、入力トークンの重要性を強調することで、テキストからオーディオ生成モデルの説明を提供する、説明可能なAI(XAI)であるAudioGenXを紹介する。
本手法は,テキスト入力と音声出力の関係を詳細に,包括的に理解する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:00:01 GMT)
Muographic Image Upsampling with Machine Learning for Built Infrastructure Applications [3.0] 非侵襲イメージング技術であるミューグラフィーは、宇宙線ミューオンの相互作用を検出することによって三次元密度マップを構築する。
宇宙線ミューオンは、その高いモーメントと天然資源のために、深く浸透し、固有の安全を提供する。
しかし、この技術はムーンフラックスに制約を課し、長期の取得に繋がる。
これらの制約に対処する2モデル深層学習手法を開発した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:37:37 GMT)
Blind Visible Watermark Removal with Morphological Dilation [2.9] 自動透かし除去のための新しい手法であるMorphoModを提案する。
MorphoModはセマンティックコンテンツを保持しながら不透明な透かしを削除する。
最先端の方法と比較して、透かし除去の有効性は最大で50.8%向上する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:36:35 GMT)
ViolinDiff: Enhancing Expressive Violin Synthesis with Pitch Bend Conditioning [2.9] 本稿では,2段階拡散に基づく合成フレームワークであるViolinDiffを紹介する。
提案モデルでは, 明示的なピッチ曲げモデリングを伴わないモデルよりも, より現実的なヴァイオリン音を生成する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:43:34 GMT)
SD++: Enhancing Standard Definition Maps by Incorporating Road Knowledge using LLMs [2.9] 高精細地図(HD map)は、車線中心線と道路要素を捉える詳細な情報地図である。
SD++は、道路マニュアルから得られる位置依存の道路情報でSDマップを強化するエンドツーエンドパイプラインである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:35:51 GMT)
Statistical Mechanics of Dynamical System Identification [2.9] 我々はスパース方程式探索アルゴリズムを解析するための統計力学手法を開発した。
与えられたモデルの雑音を推定する閉ループ推定法を提案する。
このスパース方程式発見の観点は万能であり、他の様々な方程式発見アルゴリズムに適応することができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:35:14 GMT)
TransformDAS: Mapping Φ-OTDR Signals to Riemannian Manifold for Robust Classification [2.8] 位相感度光時間領域反射法(Phi-OTDR)は、工学において広く使われている光ファイバーセンシングシステムである。
Phi-OTDRイベント分類のための機械学習アルゴリズムは、データセットのボリュームと品質を必要とする。
この問題に対処するための有望なアプローチの1つは、生成モデルと少数の実世界のデータを組み合わせて既存のデータを拡張することである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:53:30 GMT)
When Anti-Fraud Laws Become a Barrier to Computer Science Research [2.8] 我々は、コンピュータサイエンス研究のいくつかの領域で発生した反詐欺と偽装の問題を分析・分類する。
我々は、AIシステムの攻撃や監査、法的識別を含む研究の2つの重要な政策分野において、反詐欺法の重要性を強調した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:14:09 GMT)
ContinuouSP: Generative Model for Crystal Structure Prediction with Invariance and Continuity [2.8] 結晶構造予測のための生成機械学習における不変性と連続性について検討する。
結晶の対称性と周期性を効果的に扱う新しいモデルであるContinuouSPを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:22:26 GMT)
From Fog to Failure: How Dehazing Can Harm Clear Image Object Detection [2.8] 本研究は,人間の視覚的手がかりに基づく脱ハジングを物体検出に組み込むことの課題について考察する。
本稿では,光検出装置が関心領域を検知し,空間的注意に基づくデハジングによって拡張する多段階フレームワークを提案する。
霧の環境では有効であるが、この手法は鮮明な画像の性能を予期せず劣化させる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:24:44 GMT)
Review of Demographic Bias in Face Recognition [2.8] 本稿では、FRにおける多面的偏見の側面を包括的に概観した研究成果をまとめる。
FRにおける人口格差に関連する主な原因,データセット,評価指標,緩和手法について検討した。
本稿は、研究者に対して、同等で信頼性の高いFRシステムに対する重要なニーズを強調しつつ、最先端技術に対する統一的な視点を提供することを目的とする。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:28:49 GMT)
Sample Complexity of Bias Detection with Subsampled Point-to-Subspace Distances [2.8] バイアス推定のサンプル複雑性は、任意のバイアス検出手法のランタイム上の低い境界である。
我々は、測度空間上の点-部分空間問題としてバイアス検出を再構成し、超ノルムの場合、効率的にサブサンプリングできることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:03:49 GMT)
Scaling Large Language Model Training on Frontier with Low-Bandwidth Partitioning [2.7] 通信コストを削減し,メモリ使用量を改善するため,ZeRO++の通信と最適化戦略の集合を提案する。
20B GPTモデルでは、ZeRO++の最大384 GCDと比較して1.71倍のTFLOPS増加、最大384 GCDのスケーリング効率は0.94である。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:32:42 GMT)
Prostate-Specific Foundation Models for Enhanced Detection of Clinically Significant Cancer [2.5] MRIを用いても、放射線医は、特異性が低く、サーバ間変異が顕著である。
ここでは前立腺視覚コントラストネットワーク(ProViCNet)を紹介する。
ProViCNetは6つの機関で4,401人の患者を訓練し、検証した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:00:43 GMT)
The TechDebt Game -- Enabling Discussions about Technical Debt [2.5] TD(Technical Debt)は、ソフトウェア開発の実践においてよく使われる用語である。
これまでの研究では、TDに関するコミュニケーションは、特に非技術ステークホルダーにとって難しいことが強調されている。
私たちは、TDの概念をエミュレートして、技術以外のものを含むすべての利害関係者に適応できるようにボードゲームを設計しました。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:48:02 GMT)
What constitutes a Deep Fake? The blurry line between legitimate processing and manipulation under the EU AI Act [2.5] 私たちは、EUのAI法におけるディープフェイクの定義は、ディープフェイクによって引き起こされる課題に対処するために十分に特定されていないと論じています。
この定義は、ディープフェイク(deep fake)のスコープが多すぎる。
Googleのベストテイク機能のような編集機能が、透明性義務の例外であると考えることができるかは不明だ。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:15:56 GMT)
MAGNNET: Multi-Agent Graph Neural Network-based Efficient Task Allocation for Autonomous Vehicles with Deep Reinforcement Learning [2.5] 本稿では,グラフニューラルネットワーク(GNN)を一元的トレーニングと分散実行(CTDE)パラダイムに統合する新しいフレームワークを提案する。
本手法により,無人航空機 (UAV) と無人地上車両 (UGV) は, 中央調整を必要とせず, 効率よくタスクを割り当てることができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:29:56 GMT)
Watermarking across Modalities for Content Tracing and Generative AI [2.5] この論文には、画像、オーディオ、テキストのための新しい透かし技術の開発が含まれている。
まず,ソーシャルプラットフォーム上で画像の能動的モデレーションを行う手法を紹介する。
そして、AI生成コンテンツのための特定の技術を開発する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:49:50 GMT)
Learning Partial Graph Matching via Optimal Partial Transport [2.4] 最適部分移動にインスパイアされた部分グラフマッチングのための新しいフレームワークを提案する。
提案手法は, 偏りを取り入れつつ部分的代入を可能にする目的を定式化したものである。
我々の手法は,3次最悪のケースタイムの複雑さの中で,効率的かつ正確な解が得られる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:34:13 GMT)
Error Distribution Smoothing:Advancing Low-Dimensional Imbalanced Regression [2.4] 実世界の回帰タスクでは、データセットは頻繁に不均衡な分布を示し、その特徴は、高複雑さ領域におけるデータの不足と低複雑さ領域における量の不足である。
データ密度のみに焦点をあてる従来の定義を超えて、問題の複雑さとデータポイントの密度の両方を考慮に入れた「不均衡回帰」という新しい概念を導入する。
本研究では,不均衡な回帰に対処するための解として誤り分布平滑化(EDS)を提案し,バランスと代表性を保ちながら,データセットから代表サブセットを効果的に選択し冗長性を低減する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:40:07 GMT)
CoRPA: Adversarial Image Generation for Chest X-rays Using Concept Vector Perturbations and Generative Models [2.4] 医用画像分類タスクのためのディープラーニングモデルは、AI支援診断ツールで広く実装されている。
敵の攻撃に対する脆弱性は、患者の安全に重大なリスクをもたらす。
臨床に焦点を当てたブラックボックス攻撃フレームワークであるConcept-based Report Perturbation Attack (CoRPA)を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:14:31 GMT)
TinyThinker: Distilling Reasoning through Coarse-to-Fine Knowledge Internalization with Self-Reflection [2.4] 大規模言語モデルは、様々なタスクにまたがる印象的な推論能力を示す。
これらの機能を、生成された推論データを通じてより小さなモデルに蒸留する試みは、推論プロセスの表面的な模倣につながる可能性がある。
2つの新しいアプローチを紹介するフレームワークであるTinyThinkerを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:57:04 GMT)
Aligning Human and Machine Attention for Enhanced Supervised Learning [2.3] 人間は特定の学習タスクにおいて機械よりも優れています。
マシン・アテンションと人間のアテンション・メカニズムを合わせることで、マシン・パフォーマンスが豊かになる可能性が考えられる。
本稿では,HuMAL(Human-Machine Attention Learning)と呼ばれる新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:44:38 GMT)
Rationale Behind Essay Scores: Enhancing S-LLM's Multi-Trait Essay Scoring with Rationale Generated by LLMs [2.3] 本稿では,Rationale-based Multiple Trait Scoring (RMTS)について紹介する。
RMTSは、プロンプトエンジニアリングに基づく大規模言語モデル(LLM)と、より小さな大規模言語モデル(S-LLM)を用いた微調整ベースのエッセイスコアモデルを統合する。
ASAP、ASAP++、Feedback Prizeなどのベンチマークデータセットの実験では、RMTSが特性特異的スコアリングにおいて最先端のモデルとバニラS-LLMを著しく上回っていることが示されている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:31:21 GMT)
Event-Triggered Islanding in Inverter-Based Grids [2.3] この研究は、グリッドを自律島に分割できる適応的な隔離手法を提案する。
適応的な分離ロジックは、偽陽性を防止し、検出精度を高め、計算オーバーヘッドを低減するためにイベントトリガーされる。
シミュレーションの結果,提案手法は,22m秒以内で100%精度で異常な動作を検出する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:20:42 GMT)
A Revisit of Total Correlation in Disentangled Variational Auto-Encoder with Partial Disentanglement [2.3] 完全に非絡み合った変分自動エンコーダ(VAE)は、観測から非絡み合った潜伏成分を識別することを目的としている。
完全不整合VAEを部分的相関(PC)項に一般化するPDisVAE(Partially Disentangled VAE)を開発した。
このフレームワークはグループ単位の独立性を扱うことができ、標準のVAEまたは完全に切り離されたVAEに自然に還元することができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:46:21 GMT)
Symbolic State Partitioning for Reinforcement Learning [2.2] 優れたパーティショニングは、学習中の一般化と、事前経験のより効率的な活用を可能にする。
パーティショニングは、状態成分間の非線形関係の存在において特に有害な近似を導入する。
シンボル分割は, 環境行動に関して, 状態空間のカバレッジを向上し, 余分な報酬に対して強化学習がより優れていることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:22:06 GMT)
Bias Detection via Maximum Subgroup Discrepancy [2.2] 距離の概念である最大部分群離散性(MSD)を提案する。
この計量において、2つの分布が概して、すべての特徴部分群に対して相違が低ければ近い。
混合整数最適化(MIO)に基づく距離評価のための実用的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:01:03 GMT)
Rethinking Timesteps Samplers and Prediction Types [2.2] 拡散モデルは、トレーニングする時間とリソースの膨大な消費に悩まされる。
小さなバッチサイズにのみ適合するリソースが限られているため、拡散モデルのトレーニングは常に失敗する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:08:48 GMT)
SDE Matching: Scalable and Simulation-Free Training of Latent Stochastic Differential Equations [2.2] SDEマッチング(SDE Matching)を提案する。
以上の結果から,SDEマッチングは随伴感度法に匹敵する性能を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:47:49 GMT)
DHP: Discrete Hierarchical Planning for Hierarchical Reinforcement Learning Agents [2.1] 我々の重要な貢献は、従来の距離に基づくアプローチに代わる離散階層的計画法(DHP)である。
提案手法の理論的基礎を提供し,その効果を広範な経験的評価を通じて実証する。
提案手法は,25室環境における長期視覚計画タスクにおいて,成功率と平均エピソード長において,従来のベンチマークよりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:05:55 GMT)
Cross-Modality Embedding of Force and Language for Natural Human-Robot Communication [2.1] 本稿では,単語や力のプロファイルを統一的に埋め込むための枠組みを提案する。
言語と物理的力プロファイルは全く異なると考えられるが、これら2つは統一された潜在空間に埋め込むことができる。
この潜伏空間では、力プロファイルと単語が互いに補足し、b)個々の効果を統合し、c)交換可能な方法で置換することができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:32:45 GMT)
FRAUD-RLA: A new reinforcement learning adversarial attack against credit card fraud detection [2.1] 敵対的攻撃はデータ駆動システムに重大な脅威をもたらす。
既存の攻撃の限界を示す新しい脅威モデルを提案する。
次に、クレジットカード不正検出のための新たな敵攻撃を設計する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:59:35 GMT)
Broadcasting in random recursive dags [2.0] 均一な$k$-scダグは、既存のノードからランダムに$k$親を選択することでランダムランダムツリーを一般化する。
すべてのノードがビットを受信すると、$k$-sc dagがルートを特定せずに表示される。
以下の関数として$p$のしきい値は、すべてのノードの多数ルールが$c1/2$のエラーを$c+o(1)$とします。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:55:39 GMT)
Enhanced high-dimensional teleportation in correlated amplitude damping noise by weak measurement and environment-assisted measurement [1.9] 弱い測定(WM)と環境支援測定(EAM)によるCADノイズのクォートテレポーテーション向上のための2つの方策
その結果,CADノイズの相関効果は成功の確率を増大させることがわかった。
我々の研究は、量子技術としてのWMとEAMの能力を拡張し、クォート通信におけるCADノイズに対処する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 06:57:08 GMT)
The TIP of the Iceberg: Revealing a Hidden Class of Task-in-Prompt Adversarial Attacks on LLMs [1.9] LLMに対する新たなジェイルブレイク攻撃のクラスを提示する。
提案手法では,シーケンス・ツー・シーケンス・タスクをモデルが間接的に禁止された入力を生成するプロンプトに組み込む。
我々は,6つの最先端言語モデルにおいて,安全対策を回避できることを実証した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:09:13 GMT)
An Analysis of LLM Fine-Tuning and Few-Shot Learning for Flaky Test Detection and Classification [1.9] 燃えるようなテストは実行中に非決定的な振る舞いを示す。
テストの振る舞いの多様性のため、燃えるようなテストの検出と分類は難しい。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:54:51 GMT)
Energy-Consumption Advantage of Quantum Computation [1.9] 本稿では,量子計算と古典計算のエネルギー消費に関する一般的な枠組みを紹介する。
量子計算が古典計算よりも指数エネルギー消費の優位性を実現することを厳密に証明する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:19:14 GMT)
FinBloom: Knowledge Grounding Large Language Model with Real-time Financial Data [1.8] 我々は、金融クエリを扱うための大規模言語モデルのための知識基盤アプローチであるFinancial Agentを紹介する。
我々はFinBloom 7B(カスタム70億のパラメータLDM)を1400万の金融ニュース記事で訓練する。
このエージェントは、適切な財務状況を生成し、効率的なリアルタイムデータ検索を可能にする。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 06:51:34 GMT)
DLBacktrace: A Model Agnostic Explainability for any Deep Learning Models [1.7] 深層学習モデル決定に対する明確な洞察を提供するために設計された,モデルに依存しない手法であるDLBacktraceを紹介する。
本稿では,DLBacktraceの概要を概説し,その性能を既存の解釈可能性手法と比較する。
その結果,DLBacktraceは多種多様なタスクにおけるモデル行動の理解を効果的に促進することを示した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 06:55:49 GMT)
Evaluating the Effectiveness of LLMs in Fixing Maintainability Issues in Real-World Projects [1.7] 大規模言語モデル(LLM)はコーディング問題に対処するために注目を集めているが、コードの保守性を修正する上での有効性は依然として不明である。
この研究は10のGitHubリポジトリから127の保守性問題を解決するためのLLM機能を評価する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:50:23 GMT)
Compelling ReLU Networks to Exhibit Exponentially Many Linear Regions at Initialization and During Training [1.7] ReLULUアクティベーションを持つニューラルネットワークでは、出力中の断片的線形領域の数は、深さとともに指数関数的に増加する。
トレーニングを通じて,ネットワークの重みをその領域に制限する,ネットワークの新たなパラメータ化を導入する。
このアプローチにより、無作為な凸凸関数よりも数桁精度が高い凸凸関数の近似を学習することができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 21:55:41 GMT)
Quantum Metrology via Floquet-Engineered Two-axis Twisting and Turn Dynamics [1.6] Floquet-engineered two-axis twisting (TAT) とターンダイナミクスを用いて、量子気象学のためのGHZライクな状態を生成する。
解析的半古典的および量子的アプローチの両方を用いて、所望の$N$粒子GHZライクな状態が驚くほど短時間で生成できることが分かる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:34:02 GMT)
Impact of Stricter Content Moderation on Parler's Users' Discourse [1.6] 本研究では, パラーが行ったモデレーション変化と, その含有量に対する毒性について検討した。
準実験時系列分析により, パーラーのモデレーションが変化した後, 毒性は急速に減少し, 持続したことが明らかとなった。
共有されているニュースサイトの事実性の増加に加えて、共有されている陰謀や疑似科学ソースの数も減少していることがわかった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:56:12 GMT)
Learning to generate physical ocean states: Towards hybrid climate modeling [1.6] オーシャン・ジェネラル・サーキュレーション・モデル (Ocean General Circulation Models) は、平衡状態に達するためには広範な計算資源を必要とする。
ディープラーニングエミュレータは、高速な予測を提供するが、気候科学者に必要な物理的解釈可能性や長期的な安定性は欠如している。
我々は、深部生成モデルを利用して物理的に一貫した海洋状態を生成することにより、両方の世界から最善を尽くすことを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:14:41 GMT)
Embedding Safety into RL: A New Take on Trust Region Methods [1.6] 我々は,信頼領域が安全な政策のみを含むことを保証するために,政策空間を再設定する制約付きトラスト地域政策最適化(C-TRPO)を導入する。
実験により、C-TRPOは競合リターンを維持しながら制約違反を低減することが示された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:16:42 GMT)
Formalising Anti-Discrimination Law in Automated Decision Systems [1.6] 英国における差別防止法に基づく新たな意思決定理論の枠組みを導入する。
本稿では,推定誤差と基礎となるデータ生成過程を考慮に入れた「条件推定パリティ」指標を提案する。
弊社のアプローチは、機械学習の公正度測定値と差別防止法の分離を橋渡しし、非差別的自動意思決定システムを開発するための法的基盤となるフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 21:17:19 GMT)
Expanding on the BRIAR Dataset: A Comprehensive Whole Body Biometric Recognition Resource at Extreme Distances and Real-World Scenarios (Collections 1-4) [1.5] 近年,バイオメトリック認識アルゴリズムとオペレーティングシステムの現状が急速に進展している。
この技術は、極端な距離で識別を行う場合や、ビルの高架カメラやUAVに装着する場合など、従来とは異なる設定に応用される場合、依然として大きな被害を被る。
本稿では、これらの運用上の課題に対処する上で、現在注目されている最大のデータセットの拡張について要約する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:48:06 GMT)
LLM-ProS: Analyzing Large Language Models' Performance in Competitive Problem Solving [1.5] 本稿では,最新のLLMの性能を評価するための新しい評価手法であるLLM-ProSを提案する。
2011年から2024年までの166のワールドファイナル問題のデータセットを使用して、モデルの推論、正確性、効率をベンチマークします。
この結果から,新しい問題を一般化し,適応し,解決するモデルの能力に有意な差異が認められた。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:55:14 GMT)
AAD-DCE: An Aggregated Multimodal Attention Mechanism for Early and Late Dynamic Contrast Enhanced Prostate MRI Synthesis [1.5] DCE-MRIはガドリニウム系コントラスト剤(Gad)を投与する。
DCE-MR画像を合成する従来のディープラーニングアプローチでは、解剖学における局所的な灌流情報に焦点をあてていない非造影または低用量造影MRI画像が採用されている。
本稿では,グローバルおよびローカルな識別器からなるアグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリゲーション・アグリケーション・アグリゲーション・アグリケーション・アグリケーション・アグリケーション・アグリケーション・アグリケーション・アグリケーション・ア・アグリゲーション・ア・ア・ア・ア・ア・
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:28:25 GMT)
Large language models in climate and sustainability policy: limits and opportunities [1.5] 気候・持続可能性文書に異なるNLP技術、ツール、アプローチを適用し、政策関連および行動可能な措置を導出する。
LLMの使用は、異種テキストベースのデータの処理、分類、要約に成功している。
我々の研究は、複雑な政策問題に対するLLMの批判的かつ実証的な基礎的な応用を示し、人工知能を利用した計算社会科学をさらに拡大するための道筋を示唆している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:13:14 GMT)
Privacy by Design for Self-Sovereign Identity Systems: An in-depth Component Analysis completed by a Design Assistance Dashboard [1.5] ブータンのような国々は、市民のアイデンティティを管理するためのSSIインフラを既に実装している。
EUは、eIDAS規制の改正により、SSIベンダーが計画されているEUデジタルIDウォレット用のSSIシステムを開発するための扉を開く。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:42:29 GMT)
Quantum Bayesian Inference with Renormalization for Gravitational Waves [1.5] 重力波干渉計で検出された小型のバイナリコレッセンスからパラメータの量子推論を行うために,ハイブリッド量子アルゴリズムを提案する。
LIGO観測所から二元ブラックホール(BBH)の融合をアルゴリズムをテストする最初のケースとして選択するが、その応用はより一般的なインスタンスに拡張できる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:18:16 GMT)
Minimax-Optimal Covariance Projected Spectral Clustering for High-Dimensional Nonspherical Mixtures [1.5] 各クラスタ内の非球面(異方性)ノイズは、実世界のデータに広く存在している。
本研究では,高次元非球面混合モデルに基づくクラスタリングにおける最小値と最適統計手法について検討した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:55:49 GMT)
Doing More with Less -- Implementing Routing Strategies in Large Language Model-Based Systems: An Extended Survey [1.4] LLM(Large Language Models)ベースのシステムは、すべてのユーザクエリに対して単一のLLMに依存している。
彼らはしばしば、異なる事前処理戦略、推論のレベル、あるいは知識を必要とします。
本稿では,LLMシステムにルーティングを統合する上で重要な課題について考察する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:12:03 GMT)
LV-XAttn: Distributed Cross-Attention for Long Visual Inputs in Multimodal Large Language Models [1.4] LV-XAttnは,通信オーバーヘッドを最小限に抑えた,分散的かつ正確なクロスアテンション機構である。
LV-XAttnは、既存のアプローチと比較して最大5.58$times$ end-to-endのスピードアップを実現していることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:24:16 GMT)
Hierarchical Sparse Bayesian Multitask Model with Scalable Inference for Microbiome Analysis [1.4] 本稿では,一般的なマルチタスク二元分類学習問題に適用可能な階層型ベイズ的マルチタスク学習モデルを提案する。
後方分布を近似するために,変分推定に基づく計算効率の良い推論アルゴリズムを導出する。
各種合成データセットに対する新しいアプローチの可能性を示し, マイクロバイオームプロファイルに基づくヒトの健康状態の予測を行う。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:23:22 GMT)
Hierarchical Consensus Network for Multiview Feature Learning [1.3] 本稿では,CCAの理論とコントラスト学習に動機付けられ,階層型コンセンサスネットワーク(HCN)を提案する。
提案手法は,いくつかの最先端手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:19:28 GMT)
Coreset-Based Task Selection for Sample-Efficient Meta-Reinforcement Learning [1.3] モデル非依存型メタ強化学習(MAML-RL)におけるサンプル効率向上のためのタスク選択の検討
勾配空間におけるタスクの多様性に基づいて,タスクの重み付きサブセットを選択する,コアセットベースのタスク選択手法を提案する。
複数のRLベンチマーク問題にまたがるこの傾向を数値的に検証し,LQRベースラインを越えたタスク選択の利点について考察した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:09:00 GMT)
Anomaly Detection via Autoencoder Composite Features and NCE [1.3] オートエンコーダ(AE)または生成モデルは、通常入力のデータ分布をモデル化するためにしばしば使用される。
ノイズコントラスト推定(NCE)を訓練したAEと確率モデルの両方が異常検出を行うための非結合型トレーニング手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:29:22 GMT)
deCIFer: Crystal Structure Prediction from Powder Diffraction Data using Autoregressive Language Models [1.2] 粉末回折データから結晶構造予測(CSP)を行う自己回帰言語モデルを提案する。
提示されたモデルであるdeCIFerは、広く使われているCrystallographic Information File (CIF)フォーマットで結晶構造を生成する。
我々は、DeCIFerを2.3M近いユニークな結晶構造で訓練し、挑戦的な無機結晶系を特徴づけるために様々なPXRDパターンの集合を検証した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:09:47 GMT)
Enhancing the hyperpolarizability of crystals with quantum geometry [1.2] 結晶の高次電気感受性は、非自明な位相不変量や量子幾何学によって拡張・理解できることを示す。
種々の1次元結晶における非線形量子幾何学駆動光応答のチューニング性を明らかにするため, 数値シミュレーションを用いた。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:01:56 GMT)
A Differential Equation Approach for Wasserstein GANs and Beyond [1.2] 本稿では、WGAN(Warsserstein Generative Adversarial Network)を視認するための新しい理論レンズを提案する。
真のデータ分布と推定値の間のワッサーシュタイン-1距離を最小化するために、分布依存常微分方程式(ODE)を導出する。
これにより、永続的なトレーニング(W1-FEと呼ぶ)を自然に統合する新しい生成モデルが生まれました。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:37:43 GMT)
Calibration of Ordinal Regression Networks [1.2] ディープニューラルネットワークは十分に校正されておらず、しばしば自信過剰な予測を生成する。
オーディナル・アウェア・キャリブレーションを導入した新しい損失関数を提案する。
ソフト・オーディナル・エンコーディングとオーディナル・アウェア・正規化を取り入れ、キャリブレーションと一様性の両方を強制する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:53:19 GMT)
Circular Microalgae-Based Carbon Control for Net Zero [1.1] 気候変動の主な原因は、大気中の二酸化炭素の蓄積による温室効果である。
この研究は、古典的で学習ベースのネットワーク制御問題としてネットゼロにアプローチする最初のステップである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:01:44 GMT)
Heteroscedastic Double Bayesian Elastic Net [1.1] 平均分散と対数分散を共同でモデル化する新しいフレームワークであるヘテロセダスティックダブルベイズ弾性ネット(HDBEN)を提案する。
本手法は, 回帰係数と分散パラメータの分散とグループ化を同時に引き起こし, データの複雑な分散構造を捉える。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:44:19 GMT)
Improving Software Engineering Team Communication Through Stronger Social Networks [1.1] ソフトウェアエンジニアリンググループプロジェクトのチームで働く学生は、しばしば非効率にコミュニケーションします。
我々は,2学期ソフトウェアエンジニアリンググループプロジェクトから収集したデータに対して,トライアド調査と社会技術連携という2つの異なるコミュニケーション分析手法を適用した。
この結果から,各チームの各スプリントにおけるトリアード調査は,通過するストーリーポイントの割合の予測因子として有望であり,プロジェクトの成功と密接に関連していることが示唆された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:46:26 GMT)
From Natural Language to SQL: Review of LLM-based Text-to-SQL Systems [1.1] 本調査は,LLMに基づくテキスト・ツー・システムの進化に関する総合的研究である。
ベンチマーク、評価方法、評価指標について議論する。
LLMベースのテキスト・ツー・システムの改善に向けた,計算効率,モデルロバスト性,データプライバシといった重要な課題を強調した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:46:27 GMT)
A Tidal Current Speed Forecasting Model based on Multi-Periodicity Learning [1.1] 電力網内の潮流エネルギーの浸透は潮流速予測の精度に依存する。
マルチ周期性学習のためのWCN(Wavelet-Enhanced Convolutional Network)を提案する。
ベンチマークと比較すると、提案フレームワークは10ステップ予測における平均絶対誤差と平均平方誤差を、それぞれ90.36%と97.56%で削減する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:44:14 GMT)
Risk-Aware Sensitive Property-Driven Resource Management in Cloud Datacenters [1.1] そこで本研究では,クラウドデータセンタに対して,リスクに敏感なプロパティ駆動型仮想リソース割り当て機構を提案する。
我々は、データセットの感度特性を表現するために、KL分割と相互情報という2つの情報理論測度を用いた。
クラウドアーキテクチャの脆弱性と機密性プロファイルに基づいて、我々はこの問題をコスト駆動最適化問題として定式化した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 21:10:34 GMT)
Large Linguistic Models: Investigating LLMs' metalinguistic abilities [1.1] 我々は,OpenAIのo1が,構文木の作成や音韻的一般化に関わるタスクにおいて,他のモデルよりも大幅に優れていることを示す。
OpenAI o1の他のモデルに対する独特な優位性は、モデルのチェーン・オブ・シント機構によってもたらされる可能性があると推測する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:46:10 GMT)
CognArtive: Large Language Models for Automating Art Analysis and Decoding Aesthetic Elements [1.1] 芸術は普遍言語であり、様々な方法で解釈できる。
大規模言語モデル (LLM) とマルチモーダル大規模言語モデル (MLLM) の可用性は,これらのモデルがアートワークの評価と解釈にどのように使用できるのかという疑問を提起する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:08:23 GMT)
GAN-Based Architecture for Low-dose Computed Tomography Imaging Denoising [1.0] GAN(Generative Adversarial Networks)は低線量CT(LDCT)領域における革命的要素として浮上している。
本総説では,GANに基づくLDCT復調技術の急速な進歩を概観する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:29:16 GMT)
Networks with Finite VC Dimension: Pro and Contra [1.0] 有限VC次元は経験的誤差の一様収束には望ましいが、確率分布から引き出された関数の近似は、それらが与えられた種類のアプリケーションで起こる可能性のモデル化には向いていないことが示されている。
データからの学習における近似の精度と一貫性のトレードオフ、ReLUユニットによるネットワークの深さが精度と一貫性に与える影響について論じる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:44:14 GMT)
Embracing Dialectic Intersubjectivity: Coordination of Different Perspectives in Content Analysis with LLM Persona Simulation [1.0] 本研究は,コンセンサス指向からコーディネート指向へ,コンテンツ分析手法を進化させる試みである。
われわれは6つのGPT-4o構成を評価し、Fox NewsとMSNBCが2020年の大統領選挙でバイデンとトランプについて書き起こした感情を分析した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:15:45 GMT)
Theoretical and Practical Analysis of Fréchet Regression via Comparison Geometry [1.0] Fr'echet回帰は古典回帰法を非ユークリッド計量空間に拡張する。
この研究は、比較幾何学のレンズを通してFr'echet回帰の厳密な理論的解析を確立する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:16:00 GMT)
A weak convergence approach to large deviations for stochastic approximations [0.9] 我々は、状態依存マルコフ雑音とステップサイズを減少させる一般近似に対する大きな偏差原理を証明した。
学習アルゴリズムの例としては、勾配降下、コントラスト分岐、ワン・ランダウアルゴリズムがある。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:50:30 GMT)
A Generalized Numerical Framework for Improved Finite-Sized Key Rates with Renyi Entropy [0.9] 我々は、Renyi の発散の観点から、Renyi のエントロピーに厳密な解析的境界を示し、Renyi の発散の解析的勾配を導出する。
我々は、特に長距離衛星ベースのプロトコルに関係のある、高損失と低ブロックサイズのレギュレーションの改善を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:44:20 GMT)
Is My Data in Your Retrieval Database? Membership Inference Attacks Against Retrieval Augmented Generation [0.9] 本稿では,RAGシステムに対して,メンバーシップ推論攻撃(MIA)を行うための効率的かつ使いやすい手法を提案する。
2つのベンチマークデータセットと複数の生成モデルを用いて攻撃の有効性を示す。
本研究は,RAGシステムにおけるセキュリティ対策の実施の重要性を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:35:38 GMT)
Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG [0.8] 大規模言語モデル(LLM)は、人間のようなテキスト生成や自然言語理解を可能にすることによって、人工知能(AI)に革命をもたらした。
Retrieval Augmented Generation (RAG) がソリューションとして登場し、リアルタイムデータ検索を統合して文脈に関連のある応答を提供することでLLMを強化している。
Agentic Retrieval-Augmented Generation (RAG)は、自律的なAIエージェントをRAGパイプラインに埋め込むことによって、これらの制限を超越する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:48:00 GMT)
CoAT: Chain-of-Associated-Thoughts Framework for Enhancing Large Language Models Reasoning [0.8] Chain-of-Associated-Thoughts (CoAT)フレームワークは、モンテカルロ木探索(MCTS)アルゴリズムと「連想記憶」と呼ばれる新しいキー情報を統合する動的メカニズムの革新的な相乗効果を導入している。
MCTSの構造的探索能力と連想記憶の適応学習能力を組み合わせることで、CoATはLLM検索空間を大幅に拡張し、多様な推論経路を探索し、その知識ベースをリアルタイムで動的に更新することを可能にする。
これらの実験により、我々のフレームワークは、精度、コヒーレンス、多様性に関する従来の推論プロセスより優れていることが示された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:10:33 GMT)
Multi-illuminant Color Constancy via Multi-scale Illuminant Estimation and Fusion [0.8] 既存の手法は主に深層学習を用いて画像とその照明マップ間の直接マッピングを確立する。
我々は,マルチスケール画像から推定される成分の線形結合としてイルミナントマップを表現している。
マルチスケール画像から多粒性発光分布マップを推定する三分岐畳み込みネットワークを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:19:30 GMT)
LLMSecConfig: An LLM-Based Approach for Fixing Software Container Misconfigurations [0.7] コンテナオーケストレーションにおけるセキュリティの誤設定は、ソフトウェアシステムに深刻な脅威をもたらす。
現在、業界はこれらの設定を修正できる自動化ソリューションを欠いている。
本研究では,SAT と LLM を組み合わせることで,このギャップを埋める革新的なフレームワーク LLMSecConfig を紹介する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:56:34 GMT)
Fine-tuning Language Models for Recipe Generation: A Comparative Analysis and Benchmark Study [0.7] 本研究は, 様々な非常に小さな言語モデルを微調整し, レシピ生成タスクの探索と研究を行う。
我々は、ロバストな評価指標を開発し、レシピ生成のオープンなタスクを異なる言語モデルで比較する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:25:01 GMT)
Graph Neural Networks for O-RAN Mobility Management: A Link Prediction Approach [0.7] 5Gまでのセルラーネットワークにおいて、モビリティのパフォーマンスが重要視されている。
本稿では,O-RANにおけるモビリティ管理のためのアクティブなHOフレームワークを提案する。
リンク予測のためのグラフニューラルネットワーク(GNN)の様々なカテゴリについて検討し、それらをモビリティ管理領域に適用する際の複雑さを分析する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:44:41 GMT)
Accurate Modeling of Directional Couplers with Oxide Cladding: Bridging Simulation and Experiment [0.6] シミュレーションと測定の相違が頻繁に観測される。
本研究は,酸化クラッドの密度変化が主な原因であることを示す。
特徴ギャップが小さくなるにつれて,クラッド密度の変動が性能に与える影響が判明した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:33:30 GMT)
The Skin Game: Revolutionizing Standards for AI Dermatology Model Comparison [0.6] 皮膚画像分類における深層学習アプローチは有望な結果を示しているが、適切な評価を妨げる重要な方法論的課題に直面している。
本稿では、皮膚疾患分類研究における現在の方法論の体系的分析を行い、データ準備、強化戦略、パフォーマンス報告におけるかなりの不整合を明らかにした。
本稿では、厳密なデータ準備、系統的誤り解析、異なる画像タイプのための特別なプロトコルを強調し、モデル開発、評価、臨床展開のための包括的な方法論的勧告を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:15:36 GMT)
ReMiDi: Reconstruction of Microstructure Using a Differentiable Diffusion MRI Simulator [0.6] ReMiDiは、微分拡散磁気共鳴イメージング(dMRI)シミュレーターを用いて神経細胞の微細構造を任意の3次元メッシュとして推定する新しい手法である。
本稿では、参照信号にマッチするように調整可能な信号をシミュレートする、エンドツーエンドの微分可能なパイプラインを提案する。
有限要素メッシュで表される任意の形状の微細構造を再構築する能力を示し,脳白質中の軸索ジオメトリーに着目した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:03:08 GMT)
Topic Modeling in Marathi [0.6] リソースの限られた可用性、多様な言語構造、そしてIndic言語によって引き起こされる固有の課題は、この領域における研究や応用の不足に寄与する。
マルチリンガルおよびモノリンガルのBERTモデルを含むBERTと非BERTの様々なアプローチを比較し、トピックコヒーレンスとトピックの多様性を評価指標として用いた。
この論文の重要な発見は、BERTopicがIndic言語で訓練されたBERTモデルと組み合わせることで、トピックモデリングのパフォーマンスにおいてLDAを上回っていることである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:32:08 GMT)
Position: Stop Acting Like Language Model Agents Are Normal Agents [0.6] 言語モデルエージェント(LMA)は、人間やツールとの対話を自律的に行う能力として扱われる。
しかし、LMAは通常のエージェントではない。LMAは、構築される大きな言語モデル(LLM)の構造上の問題を継承する。
LMAは通常のエージェントとして扱われるべきではない、と我々は主張する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:14:18 GMT)
More resourceful states improve quantum channel discrimination [0.5] 凸でない状態の任意の資源理論において、最大平均成功確率が向上する程度は、ロバストネス測度によって正確に定量化できることを示す。
また, 補助システムを用いたチャネル識別問題の改善を, 頑健性測定によって定量化できることを実証した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 02:29:01 GMT)
Deep Learning-Based Facial Expression Recognition for the Elderly: A Systematic Review [0.5] 世界人口の急速な高齢化は、高齢者を支援する技術の必要性を浮き彫りにした。
表情認識(FER)システムは、感情状態を監視する非侵襲的な手段を提供する。
本研究は,高齢者を対象とした深層学習に基づくFERシステムの体系的レビューである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:05:24 GMT)
Exploring the Feasibility of AI-Assisted Spine MRI Protocol Optimization Using DICOM Image Metadata [0.5] 本研究は,臨床実習における動的データを用いたMRIプロトコルの最適化におけるAIの適用性を検証することを目的とする。
5つのAIモデルは、MRI理論に基づく画像品質に影響を与える取得パラメータのトレンドを特定するために訓練された。
モデルは、292以上のインスタンスを含むデータセットに対して、F1のパフォーマンスを77%から93%に向上させた。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:35:29 GMT)
INTACT: Inducing Noise Tolerance through Adversarial Curriculum Training for LiDAR-based Safety-Critical Perception and Autonomy [0.4] 本稿では、雑音の多いLiDARデータに対するディープニューラルネットワーク(DNN)の堅牢性を高めるために設計された新しいフレームワークを提案する。
IntACTは、メタラーニングと、敵対的なカリキュラムトレーニング(ACT)を組み合わせることで、3Dポイントクラウドにおけるデータの破損とスパーシリティによる課題に対処する。
IntACTの有効性は、オブジェクトの検出、追跡、分類ベンチマークに関する包括的な評価を通じて実証される。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 00:02:16 GMT)
Classical Algorithms for Constant Approximation of the Ground State Energy of Local Hamiltonians [0.4] 我々は、任意の$k$局所ハミルトニアンが$n$ qubitsで作用する基底状態エネルギーの近似を計算する古典的アルゴリズムを構築する。
定数近似が古典的に$mathrmpolyleft (1/chi,nright)$ time と $mathrmpoly(n)$ space で計算可能であることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:21:09 GMT)
Position Paper: Building Trust in Synthetic Data for Clinical AI [0.4] 本稿では, 臨床応用において, 総合医療データの信頼性向上が重要であることを論じる。
我々は,脳腫瘍のセグメント化による経験的証拠を提示し,合成データの質,多様性,比率が臨床AIモデルの信頼に直接影響を与えることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:53:23 GMT)
Model Human Learners: Computational Models to Guide Instructional Design [0.4] 本稿では,2つのA/B実験の結果を正確に予測できる計算モデルについて述べる。
また、そのようなモデルが人間のデータを必要とせずに学習曲線を生成できることも示している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:24:42 GMT)
Dementia Classification Using Acoustic Speech and Feature Selection [0.4] この研究は、モデル出力に基づいて特徴重要度スコアを計算するために、リッジ線形回帰、極小学習機械、線形支援ベクトル機械学習モデルを用いている。
本研究の結果は, 認知症診断において, 同じデータセットと音響的特徴抽出を用いた他の研究と比較して上位にランクされた。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:50:19 GMT)
Cross-Lingual Transfer for Low-Resource Natural Language Processing [0.3] 言語間移動学習は、NLPの性能を向上させるために、高ソース言語からのデータとモデルを活用する研究分野である。
この論文は、最先端のアノテーション投影法であるT-プロジェクションを用いて、データベースの転送を改善する新しい方法を提案する。
モデルベース転送では,ゼロショット設定で言語間連続ラベルを拡張可能な制約付き復号アルゴリズムを導入する。
最後に,最初の多言語テキスト・テキスト・メディカルモデルであるMedical mT5を開発した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 21:17:46 GMT)
A Self-Supervised Framework for Improved Generalisability in Ultrasound B-mode Image Segmentation [0.3] 我々は、BモードUS画像に適した対照的なSSLアプローチを導入し、RCL(Relation Contrastive Loss)を取り入れた。
提案手法は, 3つの乳房データセットにおいて, 従来の教師付きセグメンテーション法より有意に優れていた。
我々の研究は、特にデータ制限条件下で、ドメインにインスパイアされたSSLが米国のセグメンテーションを改善することを強調している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:06:41 GMT)
Empirical Bayes Estimation for Lasso-Type Regularizers: Analysis of Automatic Relevance Determination [0.2] 本稿では、ラッソやグループラッソのような非共役空間誘導正則化器を用いた線形回帰モデルに焦点をあてる。
パラメータ数に制限のある群ラッソ正規化線形回帰モデルに対する経験的ベイズ推定器を導出する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:01:43 GMT)
Learning Compact and Robust Representations for Anomaly Detection [0.2] 本稿では,3つの重要な特性を強制する異常検出のための対照的な前文タスクを提案する。
これらの特性は協調して、異常検出のためのより堅牢で差別的な特徴空間を確保する。
提案手法は,NT-Xentの約12倍,Rot-SupConの約7倍のコンバージェンスを実現し,性能が向上した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:50:50 GMT)
Mind the Gap: Evaluating Patch Embeddings from General-Purpose and Histopathology Foundation Models for Cell Segmentation and Classification [0.2] 一貫性のあるデコーダと各種エンコーダを備えたエンコーダデコーダアーキテクチャを実装した。
インスタンスレベルの検出,セグメンテーションの精度,および細胞型分類を評価した。
本研究は、一般目的と病理組織学の基礎モデルの比較強度と限界に関する知見を提供する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:47:00 GMT)
Automated tuning and characterization of a single-electron transistor charge sensor [0.2] 本稿では、単一電子トランジスタ(SET)または単一ホールトランジスタ(SHT)を高精度な電荷センサとして動作させる自動プロトコルを提案する。
最小限のデバイス固有情報を用いて、このプロトコルは高感度な操作点の選択とランキングを可能にする測定を行う。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:45:00 GMT)
Enhancing Scalability of Quantum Eigenvalue Transformation of Unitary Matrices for Ground State Preparation through Adaptive Finer Filtering [0.1] ハミルトニアンシミュレーション(英: Hamiltonian Simulation)は、量子コンピュータが古典的計算を上回る可能性を持つ領域である。
このような量子アルゴリズムの主な課題の1つは、システムサイズを増大させることである。
本稿では, 固有空間フィルタリングのスケーラビリティを, 与えられたハミルトニアンの基底状態の準備のために向上させるアプローチを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:14:01 GMT)
A New Rejection Sampling Approach to $k$-$\mathtt{means}$++ With Improved Trade-Offs [0.1] 単純かつ効果的なリジェクションサンプリングに基づくアプローチで,$k$-$mathttmeans$++ を高速化する。
最初のメソッドは $tildeO(mathttnnz (mathcalX) + beta k2d)$ で実行されます。
第2の手法は,計算コストと解品質の新たなトレードオフを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:05:34 GMT)
Superpositions of thermalisations in relativistic quantum field theory [0.1] 量子状態において、同じ単一熱化チャネルの量子制御された応用を受けると、系は熱分解に失敗することがある。
本研究では,空間翻訳の重ね合わせで加速するプローブが,フィールドモードの不規則な集合とどのように相互作用するかを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:33:19 GMT)
PaRCE: Probabilistic and Reconstruction-based Competency Estimation for CNN-based Image Classification [0.1] 確率的・再構成型能力推定法(PaRCE)を開発した。
本手法は, 異常領域を有するOODサンプルを正しく分類し, 誤分類し, 識別するのが最適であることがわかった。
本手法は,認識モデル信頼度という全体論的概念を最も確実に捉えた解釈可能なスコアを生成する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:21:33 GMT)
Efficient Domain Adaptation of Multimodal Embeddings using Constrastive Learning [0.1] 現在のアプローチでは、タスク固有の適応なしに事前訓練されたモデルを使用する際にサブパー結果を得るか、あるいは微調整のためにかなりの計算資源を必要とする。
本稿では,高コストな微調整処理を必要とせず,基礎的なマルチモーダルな埋め込みを下流タスクに適用するための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 06:30:12 GMT)
Effects of rotation on the thermodynamic properties of a quantum dot [0.1] 本研究では,回転が放射電位によって記述された量子ドットの物理特性に及ぼす影響について検討する。
回転と閉じ込めの間の相互作用は、系のシュリンガー方程式を解くことによって解析される。
外部磁場が存在しない状態で、状態密度、磁化、エントロピー、熱容量などの重要な熱力学特性を計算する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:36:21 GMT)
Quasiparticle cooling algorithms for quantum many-body state preparation [0.1] 本研究では, 準粒子冷却力学を記述するための動力学理論フレームワークを開発し, 異なる冷却アルゴリズムの効率を比較する。
定常状態準粒子群がノイズ率にどのように依存しているかを示し、高忠実度基底状態を達成するための最大雑音値を確立する。
この研究は、準粒子冷却アルゴリズムを、短期量子プロセッサ上での多体状態準備のための実用的で堅牢な方法として確立する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:17:54 GMT)
NER4all or Context is All You Need: Using LLMs for low-effort, high-performance NER on historical texts. A humanities informed approach [0.0] 我々は,NERの2つの主要なNLPフレームワークにおいて,手軽に利用できる,最先端のLCMが顕著に優れていることを示す。
提案手法は,NLPツールの確立に必要なスクリプティング言語や計算能力の障壁を取り除くことで,すべての歴史学者がNERにアクセスできるようにする。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:54:23 GMT)
MORPH-LER: Log-Euclidean Regularization for Population-Aware Image Registration [0.0] MORPH-LERは,人口適応型教師なし画像登録のためのログユークリッド正規化フレームワークである。
MORPH-LERは、人口形態計測を空間変換から学習し、登録ネットワークのガイドおよび正規化を行う。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:39:13 GMT)
mPOLICE: Provable Enforcement of Multi-Region Affine Constraints in Deep Neural Networks [0.0] 深層ニューラルネットワークは、気候モデリング、ロボット工学、産業制御など、厳しい出力制約を守らなければならない分野にますます採用されている。
本稿では,各領域に異なるパターンを割り当てるmPOLICEについて述べる。
重みと偏りの両方が各領域に固有のアクティベーションパターンを割り当て、矛盾なく制約が満たされることを保証するレイヤワイズ問題を定式化する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:58:12 GMT)
What is the absolutely continuous spectrum? [0.0] このプログラムは、自己随伴作用素 H の絶対連続スペクトルを、H に正則に関連付けられた適切な開量子系の輸送特性の観点から特徴づけるものである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:05:21 GMT)
Weak local measurements reproduce the measurement time of strong measurements on entangled systems [0.0] 純粋に弱い測定によって重要な結果を再現できることが示される。
この結果は、自然に弱い測定が全ての物理測度の基礎にあるという仮説の自己整合性を裏付けるものである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 00:38:48 GMT)
Wake-Informed 3D Path Planning for Autonomous Underwater Vehicles Using A* and Neural Network Approximations [0.0] 従来の経路計画手法では、詳細なウェイク構造を組み込むことができず、結果としてエネルギー消費が増加し、制御安定性が低下し、安全性のリスクが高まる。
本稿では,局所的な覚醒効果と大域的な電流を計画アルゴリズムに統合した新しい3次元経路計画手法を提案する。
その結果、ウェイクインフォームされたA*プランナーは、常に最低エネルギー消費を達成し、高速度領域との遭遇を最小限に抑えることを示した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:23:23 GMT)
Variational Scarring in Open Two-Dimensional Quantum Dots [0.0] 2次元量子ドットにおける変分スカーリングは、開系においても頑健であることを示す。
制御された摂動は、傷ついた状態による電子伝達の変調を可能にする。
これらの知見は、量子デバイスにおける実験的実現のためのメソスコピック輸送およびオープンパスにおけるスカーリングの役割に関する洞察を与える。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 22:37:55 GMT)
Using ChatGPT to refine draft conceptual schemata in supply-driven design of multidimensional cubes [0.0] 精製は多次元立方体の供給駆動設計における重要なステップである。
この作業の目標は、LDMが改良作業のファシリテータとして機能し、エンドユーザーによって完全に(あるいは主に)実行できるようにするかどうかを確認することである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:27:31 GMT)
Universal robust quantum gates by geometric correspondence of noisy quantum dynamics [0.0] 我々は、様々なノイズによる量子力学をグラフィカルに捉える理論を開発し、量子誤り進化図(QEED)を得る。
次に、一般的な誤りを訂正する単一ビットと2ビットのロバストゲートの共通セットを設計するプロトコルを開発する。
我々のアプローチは、ノイズ量子力学の幾何学的側面に対する新たな洞察と、既存の方法に対するいくつかの利点を提供する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:23:43 GMT)
Universal correlations in chaotic many-body quantum states: Fock-space formulation of Berrys random wave model [0.0] 相互作用量子系におけるカオス固有状態のランダム性は、粒子あたりの有限エネルギーによって課される微妙な相関を隠蔽することを示す。
これらの相関関係は、単粒子系におけるカオス固有関数に対するベリーズアプローチが多体空間に持ち上げられるときに明らかとなる。
次に、相互相関の普遍性と拡張係数のガウス分布をカオス固有状態の符号として同定する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:31:34 GMT)
Unitary description of the Jaynes-Cummings model under fractional-time dynamics [0.0] 我々は、トレースレス2レベルハミルトニアンに対してユニタリ進化が達成可能であることを示す。
分数次パラメータ $alpha$ とユニタリ量子力学におけるその効果を考慮する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:24:43 GMT)
Towards a group structure for superluminal velocity boosts [0.0] 超曲面の2つの族の間の写像を構築し、対応する作用素を超光速加速として解釈する。
ドラガンとエケルトによって提唱された「相対性理論の量子原理」の研究におけるこの構成の意味について論じる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:36:54 GMT)
Topological Tenfold Classification and the Entanglement of Two Qubits [0.0] カルタン分解を用いてトポロジカルな性質と量子絡み合いとの関係を特徴づける。
トポロジ的特徴は量子グラフへの写像によって体系的に得られる。
凝縮物質系に対するこの新しいアプローチの拡張について、さらなる視点が提供される。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:47:19 GMT)
The Relationship Between the Number of Nodes in Wave Functions and Heisenberg's Uncertainty Principle [0.0] 共役変数(位置や運動量など)の不確実性は一般にノード数の関数であると主張する。
本稿では,ハイゼンベルクの不確かさ原理が波動関数のノルダル構造の影響と,この依存の性質がシステムに依存していることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:32:15 GMT)
The Causal-Effect Score in Data Management [0.0] 因果効果(英: Causal Effect, CE)は、観測結果に対する変数の因果影響の数値的な尺度である。
古典的および確率的データベースの文脈において、いわゆるCausal-Effect Scoreを導入し、検討する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:12:23 GMT)
The (1+3)-dimensional 'quantum principle of relativity' is Einstein's principle of relativity [0.0] 初期の研究で提案された「相対性理論」の拡張は、単に1905年に提案されたアインシュタインの相対性理論であることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:13:18 GMT)
Target Attack Backdoor Malware Analysis and Attribution [0.0] カスタマイズされたバックドアは、無許可のシステム、データベース、およびアプリケーションコマンドを実行するために武装されている。
バックドアマルウェアは、典型的なMalwareが好むライブラリの上に、さまざまなAPI、コマンド、文字列、クエリ言語で設計することができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:14:14 GMT)
Sustainable Data Management: Indefinite Static Data at Rest with Machine-Readable Printed Optical Data Sheets (MRPODS) [0.0] 本研究は,デジタルデータに永続的安定性を提供する光学符号化手法のユニークな特性について考察する。
実験により,従来のデジタルストレージ方式に比べて,機械可読光符号化の効率が著しく向上していることが判明した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:52:11 GMT)
SurvHive: a package to consistently access multiple survival-analysis packages [0.0] SurvHiveはPythonベースのフレームワークで、Scikit-learnをモデルとしたコヒーレントかつインターフェース内でサバイバル分析メソッドを統合するように設計されている。
SurvHiveは古典的な統計モデルと最先端のディープラーニングアプローチを統合しており、トランスフォーマーベースのアーキテクチャやパラメトリックサバイバルモデルを含んでいる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:02:40 GMT)
Style transfer as data augmentation: evaluating unpaired image-to-image translation models in mammography [0.0] 深層学習モデルは乳がんをマンモグラムから検出することができる。
しかし, 過度に適合し, 一般性に欠ける課題は, 診療所での日常的な使用を妨げている。
データ拡張技術は、一般化性を改善するために使用することができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:52:45 GMT)
SpinGlassPEPS.jl: Tensor-network package for Ising-like optimization on quasi-two-dimensional graphs [0.0] 本研究では、Juliaで実装されたソフトウェアパッケージであるSpinGlassPEPS.jlを導入し、一般化ポッツモデルの低エネルギー構成を見つける。
SpinGlassPEPS.jlのモジュラーアーキテクチャは、様々な収縮スキームとハードウェアアクセラレーションをサポートする。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:40:00 GMT)
Spectral form factor and energy correlations in banded random matrices [0.0] 重核のスペクトル統計を記述するために、完全なランダム行列のより現実的な代替としてバンド化されたランダム行列が導入された。
短距離エネルギー相関が存在しないにもかかわらず、弱長距離エネルギー相関は帯状ランダム行列の非エルゴード相に持続することを示す。
また、エネルギー変動のパワースペクトルの高周波挙動は、帯状ランダム行列の非エルゴード位相とエルゴード位相を区別できることを示した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:00:06 GMT)
Spatio-temporal transformer to support automatic sign language translation [0.0] 本稿では,時間的動きのジェスチャーを符号化し,局所的・長距離的空間情報を保存するトランスフォーマーアーキテクチャを提案する。
提案手法はコロンビア手話翻訳データセットで検証された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:59:19 GMT)
Simulating quantum circuits using the multi-scale entanglement renormalization ansatz [0.0] 本稿では,中間サイズ量子回路の近似シミュレーションのためのスケーラブルな手法を提案する。
提案手法は,最大243キュービットのブロックウォール量子回路に対して,最大20層まで深さの異なる提案手法をベンチマークする。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:42:34 GMT)
SiLVR: Scalable Lidar-Visual Radiance Field Reconstruction with Uncertainty Quantification [0.0] 本稿では,ライダーと視覚データを融合したNeRFを用いた大規模再構成システムを提案する。
我々のシステムは、ライダーを付加的に組み込むために最先端のNeRF表現を採用する。
ロボット搭載型とハンドヘルド型の両方のスキャニング実験において,マルチカメラ・ライダーセンサ・スイートを用いた再構築システムを実証した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:00:49 GMT)
Sequence models for continuous cell cycle stage prediction from brightfield images [0.0] 非蛍光光場イメージングを用いた連続的なFucci信号の予測のためのディープラーニング手法の評価を行った。
因果モデルと変圧器モデルの両方が単一フレームと固定フレームのアプローチよりも有意に優れていることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:57:17 GMT)
Scalable noise characterisation of syndrome extraction circuits with averaged circuit eigenvalue sampling [0.0] 本稿では,量子誤り訂正符号のシンドローム抽出回路を特徴付けるために,スケーラブルなノイズ特徴化プロトコルを開発した。
以上の結果から,ノイズの詳細な特徴付け手法は短期量子デバイスに拡張可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:25:08 GMT)
SPFFNet: Strip Perception and Feature Fusion Spatial Pyramid Pooling for Fabric Defect Detection [0.0] YOLOv11に基づくファブリック欠陥検出モデルを提案する。
SPM(Strip Perception Module)を導入し,マルチスケールのコンボリューションにより機能キャプチャを改善する。
また,適応重み付き共振器(FECIoU)の新たな拡張完全交叉法を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:25:51 GMT)
Revisiting Expected Possession Value in Football: Introducing a Benchmark, U-Net Architecture, and Reward and Risk for Passes [0.0] 本稿では,最初のEPVベンチマークと,新たに改良されたサッカー用EVVモデルを紹介する。
本研究では,与えられた相対的なEVVと対のゲーム状態を用いて,EVVモデルの品質を定量的に評価する手法を提案する。
また,U-net型畳み込みニューラルネットワークに基づく新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:40:32 GMT)
Reproduction Research of FSA-Benchmark [0.0] フェールスローディスクは、最終的にフェールする前に徐々にパフォーマンスが低下する。
アウトライトディスクの障害とは異なり、フェールスロー条件は長期にわたって検出されず、システムパフォーマンスとユーザエクスペリエンスに大きな影響を与えます。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:42:40 GMT)
Reinforcement Learning for a Discrete-Time Linear-Quadratic Control Problem with an Application [0.0] 強化学習(RL)を用いた離散時間線形四分法(LQ)制御モデルについて検討する。
探索コストを測定するためにエントロピーを用いることで、問題の最適フィードバックポリシーはガウス型でなければならないことを示す。
次に、離散時間LQモデルの結果を適用し、離散時間平均分散資産-信頼性管理問題を解き、RLアルゴリズムのポリシー改善と収束性を証明する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:22:04 GMT)
Qubit-efficient quantum local search for combinatorial optimization [0.0] 本稿では,lceil log l rceil$ qubitsのみを用いた局所探索の量子バージョンを実装した量子ビット効率変動量子アルゴリズムを提案する。
この成果は、短期量子デバイスにおける大規模最適化問題を解決するアルゴリズムの可能性を強調している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:44:34 GMT)
Quantum-enabled framework for the Advanced Encryption Standard in the post-quantum era [0.0] 本稿では、量子技術を用いて保護を強化したAdvanced Encryption Standard(AES)の改良版を提案する。
このシステムは、予測可能なコンピュータアルゴリズムの代わりに、量子ランダム性を使って暗号鍵を生成する。
組織は、古いシステムの運用を維持しながら、機密データに対するハイブリッドモードで開始する、このソリューションを段階的に実装することができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:11:37 GMT)
Quantum model reduction for continuous-time quantum filters [0.0] 多くのアプリケーションでは、ターゲットの観測可能な量を再構築するために、フィルタの状態に含まれる情報の一部しか必要としない。
本稿では,関心の期待値の進化を正確に再現することのできる,量子フィルタの低次化を実現するための体系的手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:46:12 GMT)
Quantum coherence and the invisible Universe: Subradiance as a dark matter mechanism [0.0] 熱平衡における気体中の絡み合った状態は、サブラジオアンス、暗黒量子状態におけるエネルギーのトラップ、放射強度の低減につながることを示した。
これを暗黒物質ハロスの21cm線に適用すると、量子コヒーレンスによってガスが効果的に暗くなることが分かる。
また、入射放射の吸収は、コヒーレンスがない場合にのみ保持されるビールの法則によって予測されるレベルを超える可能性があることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:24:57 GMT)
Quantum Wave Simulation with Sources and Loss Functions [0.0] 不均一媒質中の線形反エルミート波動方程式をシミュレーションするための量子アルゴリズムフレームワークを提案する。
我々のフレームワークは標準的な数値離散化方式と互換性がある。
サブスペースエネルギーを抽出し、損失関数を$l$で比較する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:08:41 GMT)
Quantum Computing Education in Latin America: Experiences and Strategies [0.0] 量子コンピューティングは、資格を持つ専門家の不足に直面している急速に進歩している分野である。
ラテンアメリカでは、量子教育が初期段階にあり、地域の才能格差が悪化している。
本研究は、コロンビア国立大学量子コンピューティング研究グループ(Quantum Computing Research Group)による、量子コンピューティングを高等教育に組み込む取り組みを示すものである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:37:28 GMT)
Prospects of phase-adaptive cooling of levitated magnetic particles in a hollow-core photonic-crystal fibre [0.0] 本研究では, 中空コアフォトニック結晶ファイバ内に浮遊するマイクロ-ナノ磁性粒子の古典運動の冷却可能性について解析した。
我々の研究結果は、捕捉されたマイクロマグネットを検知、基礎物理学のテスト、磁化の量子状態の準備に利用するための重要なステップをもたらす。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:41:03 GMT)
Prompt-oriented Output of Culture-Specific Items in Translated African Poetry by Large Language Model: An Initial Multi-layered Tabular Review [0.0] 本稿では,3つのアフリカ詩のアンソロジーを翻訳するための3つの構造化されたプロンプトに対して,Chat Generative PreTrained Transformer Proが生成した文化的項目の出力について検討する。
第1の表は、3つのプロンプトの後に生み出された文化的項目の結果である。
2つ目は、プロパー名詞と共通表現のAixelaフレームワークに基づいて、これらのアウトプットを分類する。
第3の表は、人間の翻訳者、カスタム翻訳エンジン、および大規模言語モデルによって生成された文化的項目をまとめたものである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:12:06 GMT)
Practically Effective Adjustment Variable Selection in Causal Inference [0.0] 本稿では,適応変数のリストから変数を選択するための基準をアルゴリズムとともに提案し,因果効果推定における劣化精度を抑える。
既存のデータと人工データの両方を用いて,本手法の実用性を実証する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:35:19 GMT)
Potential of photon-subtracted CV states towards gain sensitivity of the Mach-Zehnder interferometer [0.0] Mach-Zehnder (MZ) 干渉計は、コヒーレント状態と結合した単一モード圧縮真空(SMSV)光で動作する。
位相依存型MZ干渉計の利得感度を10dB以上で報告した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:24:26 GMT)
Planning with affordances: Integrating learned affordance models and symbolic planning [0.0] 既存のタスク・アンド・モーション・プランニング・フレームワークを世界のオブジェクトの学習能力モデルで拡張する。
それぞれのタスクは、世界の現在の状態を所定の目標状態に変更したものと見なすことができます。
シンボリックプランニングアルゴリズムは、この情報と開始および目標状態を用いて、望ましい目標状態に到達するための実行可能なプランを作成する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:15:38 GMT)
PixelShuffler: A Simple Image Translation Through Pixel Rearrangement [0.0] スタイル転送は画像から画像への変換の応用として広く研究されており、ある画像の内容を他の画像のスタイルと組み合わせた画像の合成が目的である。
既存の最先端の手法は、しばしば高品質なスタイル転送を実現するために拡散モデルや言語モデルを含む複雑なニューラルネットワークに依存している。
本稿では,画像から画像への変換問題に対処する新たなピクセルシャッフル手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 21:33:12 GMT)
Pauli Spectrum and Non-stabilizerness of Typical Quantum Many-Body States [0.0] パウリスペクトルがハールランダム状態の1つに近づき、指数関数的に抑制された尾部を示す。
その結果, 量子情報の観点からは, 典型的状態と非典型的状態の相違が明らかとなった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:21:11 GMT)
Particle Trajectory Representation Learning with Masked Point Modeling [0.0] 時間射影チャンバー(TPC)における3次元粒子軌道解析のための自己監督型マスクモデリングフレームワーク
本研究は、疎イオン化点を分解能に依存しないパッチにグループ化するためのボリュームトークン化を提案する。
PoLAr-MAEは99.4%のトラックと97.7%のシャワー分類Fスコアを達成した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:31:56 GMT)
PATCH: a deep learning method to assess heterogeneity of artistic practice in historical paintings [0.0] ルネサンス期と近世の絵画は、主に見習いの工房を監督する師匠によって制作された。
異なるワークショップがどのように管理され、どのようにアートワークが作られたかは明らかになっていない。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:05:12 GMT)
Orientation-aware interaction-based deep material network in polycrystalline materials modeling [0.0] ディープマテリアルネットワーク(DMN)は効率的なサロゲートモデルとして提案されているが、テクスチャの進化を捉えるには不十分である。
ヒルマンデル原理に基づく指向性認識機構と相互作用機構を組み込んだ指向性認識インタラクションベースディープマテリアルネットワーク(ODMN)を提案する。
以上の結果から, ODMNは複雑な塑性変形下での機械的応答とテクスチャ進化を正確に予測し, 多結晶材料へのDMNの適用性を高めることが示唆された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:25:15 GMT)
Optimizing lossy state preparation for quantum sensing using Hamiltonian engineering [0.0] ホウ素-アインシュタイン凝縮体における原子損失にも拘わらず、スケーラブルな量子優位性が得られることを示す。
リンドブラッドジャンプ作用素は非エルミート的で非可逆であるが、ムーア・ペンローズ逆数を用いてフィッシャー情報のスケーリングによるいくつかの状態を構成するための枠組みを開発する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:35:00 GMT)
Optimizing Spot Instance Reliability and Security Using Cloud-Native Data and Tools [0.0] Cloudlabは、ネットワークセキュリティの研究とトレーニングをサポートするために設計された、包括的なクラウドネイティブな実験室である。
適応的でスケーラブルな環境を提供することで、Cloudlabはロールベースのアクセス制御、ポリシ・アズ・コード、コンテナセキュリティといった高度なセキュリティ概念をサポートする。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:25:01 GMT)
Optimal Subspace Inference for the Laplace Approximation of Bayesian Neural Networks [0.0] 数学的に最適部分空間モデルをラプラス近似に基づくベイズ推定シナリオに導出する。
実験により、最適の場合、1%未満のパラメータのごく一部は、完全なラプラス近似の信頼できる推定値を得るのに十分であることが示された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:27:21 GMT)
Optimal Security Response to Network Intrusions in IT Systems [0.0] この論文は、ITインフラにおける最適なセキュリティ対応のための実践的な方法論を開発することで、課題に取り組む。
まず、ターゲットインフラストラクチャの主要コンポーネントを複製するエミュレーションシステムを含む。
第2に、近似モデルを用いてゲーム理論応答戦略を最適化するシミュレーションシステムを含む。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:10:10 GMT)
Optical manifestations and bounds of topological Euler class [0.0] 非自明なオイラー類を包含するバンドのペアを用いて位相相における光学的重みの量子幾何学的境界を解析する。
境界は、異なるドーピングにおけるオイラーバンドの結合した光学的重みをいかに制限するかを示す。
我々は$veck cdot vecp$モデル内でオイラー位相の光学的表現を導出する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:34:07 GMT)
On the Emergent "Quantum" Theory in Complex Adaptive Systems [0.0] 複素適応系における創発的量子様理論の概念を探求する。
ロトカ・ボルテラ系におけるそのような創発的(あるいは「モック」)量子論の具体例について検討する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:24:00 GMT)
On Chord Dynamics and Complexity Growth in Double-Scaled SYK [0.0] 両面の弦ハミルトニアンが支配する時間進化について, ダブルスケールSYKモデルを用いて検討した。
半古典的極限における特定のエネルギー領域に局在させることによって、区別された半古典的挙動がどのように現れるかを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 00:49:06 GMT)
Nonlinear skin modes and fixed points [0.0] 非対称結合と様々な非線形性を持つ一次元強結合格子について検討し,非線形非エルミート皮膚効果について検討した。
非線形相互作用は半無限系のスペクトル領域に影響を与えないことが示されている。
非線形皮膚モードの特徴として, 退化, パワーエネルギ不連続などの特徴を同定した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:10:48 GMT)
Nonclassical Nullifiers for Quantum Hypergraph States [0.0] 量子ハイパーグラフ状態はグラフ状態形式主義の一般化を形成する。
このような状態のネットワークは、連続変数測定に基づく量子計算の普遍性を達成することができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:06:19 GMT)
Noise-Aware Mixed-State Quantum Computation via Parameterized Quantum Channels [0.0] 本稿では,量子チャネル制御の一般化戦略とその実践的実現について論じる。
本稿では,ノイズ発生時に量子チャネルの制御パラメータを最適化する,誤差緩和の文脈における単純な応用例について述べる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:50:21 GMT)
No-Signaling in Steepest Entropy Ascent: A Nonlinear Non-local Non-equilibrium Quantum Dynamics of Composite Systems [0.0] リンドブレディアン形式主義は「ボトムアップ」アプローチを用いて開量子系をモデル化し、システム-環境相互作用から線形力学を導出する。
本稿では,システム構造,サブシステム間の相互作用,環境影響に着目した「トップダウン」アプローチを提案する。
第二法則の要件 – ギブス状態が唯一の安定均衡である – を組み込むことは、非線形力学を必要とすることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:50:32 GMT)
Multi-Lingual Cyber Threat Detection in Tweets/X Using ML, DL, and LLM: A Comparative Analysis [0.0] サイバー脅威検出は、今日のデジタル時代において重要な領域となっている。
本研究は,様々な高度なモデルを用いた多言語ツイートによるサイバー脅威検出に焦点を当てた。
ツイートデータセットを英語、中国語、ロシア語、アラビア語の4言語で収集し、ラベル付けしました。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:46:24 GMT)
Model Input-Output Configuration Search with Embedded Feature Selection for Sensor Time-series and Image Classification [0.0] MICS-EFSは、組込み特徴選択を伴うモデル入力出力構成探索である。
ベースラインモデルよりも平均精度が1.5%向上している。
特徴次元を元のデータの2-5%に減らし、計算効率を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:30:55 GMT)
Microscopic Theory of Polariton Group Velocity Renormalization [0.0] キャビティ・エクシトン・ポラリトンは弾道輸送を示し、1ピコ秒で100$mu $mの距離を達成できる。
実験やシミュレーションで強く再現されているにもかかわらず、偏光子輸送の群速度に対処する包括的顕微鏡理論は存在しない。
有限温度グリーン関数を用いた群速度再正規化を記述するための顕微鏡理論を開発した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 21:29:55 GMT)
MSEG-VCUQ: Multimodal SEGmentation with Enhanced Vision Foundation Models, Convolutional Neural Networks, and Uncertainty Quantification for High-Speed Video Phase Detection Data [0.0] 高速ビデオ(HSV)位相検出(PD)セグメンテーションは, 産業プロセスにおける気相, 液相, マイクロ層相のモニタリングに重要である。
U-NetのようなCNNベースのモデルは、単純化されたシャドウグラフィーベースの2相流(TPF)解析に成功している。
MSEG-VCUQは、U-Net CNNとトランスフォーマーベースのSegment Anything Model(SAM)を統合し、セグメンテーション精度とクロスモーダリティの一般化を実現する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:30:51 GMT)
Localizing quantum fields with time-dependent potentials [0.0] フィールドの局所化モードにおいて、非無視混合性を導入することなく、これを実現できることを示す。
我々は、QFTにおける正規状態の高次絡み合いが相対論的量子情報プロトコルを阻害する可能性があるという、以前の文献で提起された懸念にどのように対処するかについて議論する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:00:02 GMT)
Linear-time classical approximate optimization of cubic-lattice classical spin glasses [0.0] 短距離古典スピングラスが線形時間と空間で概ね最適化されていることを示す。
我々のアルゴリズムは大規模並列化に適しており、フォトニック行列乗算ハードウェアによる低消費電力で高速化された実装も可能である。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:58:21 GMT)
Lieb-Robinson bounds with exponential-in-volume tails [0.0] リーブ・ロビンソン境界は、多体量子系における局所性の出現を示す。
摂動理論とクラスタ展開法は、短時間で体積充填作用素が抑制されることを示唆している。
我々は、障害作用素が自発的対称性の破れを持つ量子相の「可解(イシング)点」付近で体積法的な抑制を有することを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:00:12 GMT)
Licensing Open Government Data [0.0] この研究は、現在のオープンデータライセンスと比較し、ライセンス条項はポリシーの考慮を反映していると主張している。
本稿では、オープンな政府データの新たな波とともに、データのあいまいな法的地位について検討する。
最終的には、オープンな政府データライセンスの設計や選択が、情報ポリシーの重要な要素であると論じる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:17:20 GMT)
LLMs for Generation of Architectural Components: An Exploratory Empirical Study in the Serverless World [0.0] 本稿では,関数・アズ・ア・サービス(F)のためのアーキテクチャコンポーネントを生成するための大規模言語モデルの有用性について検討する。
アーキテクチャコンポーネントの小さなサイズは、このアーキテクチャスタイルを現在のLLMを使って生成可能にする。
我々は、リポジトリに存在する既存のテストを通じて正確性を評価し、ソフトウェア工学(SE)と自然言語処理(NLP)ドメインのメトリクスを使用する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:06:04 GMT)
JingFang: A Traditional Chinese Medicine Large Language Model of Expert-Level Medical Diagnosis and Syndrome Differentiation-Based Treatment [0.0] 既存のTCM大言語モデル(LLM)は、理解不能な医療相談と診断の限界を示す。
本研究はJingFang (JF): 医学的診断と診断に基づく治療の専門レベル能力を示す新しいTCM大言語モデルである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:45:42 GMT)
Invisible Traces: Using Hybrid Fingerprinting to identify underlying LLMs in GenAI Apps [0.0] 大規模言語モデル(LLM)のフィンガープリントは、AI統合アプリケーションのセキュリティと透明性を保証するために欠かせないものとなっている。
静的および動的フィンガープリント技術を統合することにより,これらの課題に対処する新しいフィンガープリントフレームワークを提案する。
提案手法は, 動的環境下でのLDMの高精度かつ堅牢なフィンガープリントを可能にするため, 建築特性と挙動特性を同定する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:56:50 GMT)
Instrumental distortions in quantum optimal control [0.0] RAW-GRAPEは応答対応勾配上昇パルス工学フレームワークである。
これは、GRAPEループ内で直接微分可能な歪みのカスケードを説明できる。
ユーザが指定した歪みカスケードに耐性のある制御シーケンスを生成する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:22:57 GMT)
Innovating the software engineering class through multi-team development [0.0] 本稿では,大学院ソフトウェア工学を教えるための新しいアプローチを提案する。
学生たちは複数のソフトウェアチームにグループ化され、それぞれがアプリの異なる側面に焦点を当てている。
アジャイル開発アプローチを使用することで、チームはコードベースに漸進的に追加し、アプリケーションが進化するにつれて機能を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:54:43 GMT)
Improving Power Plant CO2 Emission Estimation with Deep Learning and Satellite/Simulated Data [0.0] 発電所からのCO2排出は、重要なスーパーエミッターとして、地球温暖化に大きく貢献する。
本研究では、Sentinel-5PからのNO2データの統合、連続したXCO2マップの生成、OCO-2/3からの実際の衛星観測をデータスカース領域における71以上の発電所に組み込むことにより、利用可能なデータセットを拡張することによる課題に対処する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:05:15 GMT)
How to Diversify any Personalized Recommender? [0.0] 精度を維持しつつTop-Nレコメンデーションの多様性を向上させるための新しいアプローチを提案する。
当社のアプローチでは,ユーザを幅広いコンテンツカテゴリやトピックに公開するための,ユーザ中心の事前処理戦略を採用しています。
トレーニングに事前処理されたデータを使用すると、元の未修正データでトレーニングされたデータと同等のパフォーマンスレベルを達成するためのレコメンデーションシステムになる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:49:20 GMT)
How Memory in Optimization Algorithms Implicitly Modifies the Loss [0.0] 本稿では,最適化アルゴリズムをメモリと近似するメモリレスアルゴリズムを同定する手法を提案する。
我々は、LionがAdamWのようなメモリによって引き起こされる暗黙の反正則化を持っていないことを発見した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:04:50 GMT)
Honegumi: An Interface for Accelerating the Adoption of Bayesian Optimization in the Experimental Sciences [0.0] 先進的なベイズ最適化スクリプトの作成プロセスを簡単にするための,ユーザフレンドリでインタラクティブなツールであるHonegumiを紹介した。
Honegumiは動的選択グリッドを提供しており、ユーザーは最適化タスクのキーパラメータを設定でき、使える単体テストのPythonスクリプトを生成する。
インターフェースの添付は、概念的および実践的なガイダンスを提供するチュートリアルの包括的スイートである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 23:53:59 GMT)
High-Fidelity Human Avatars from Laptop Webcams using Edge Compute [0.0] 我々は,モバイルチップのニューラルコンピューティング機能を用いて,高忠実なアニマタブルアバターを生成する自動システムを構築した。
本研究では,3次元形態素モデル,ランドマーク検出,フォトリアリスティックテクスチャGAN,差別化レンダリングに基づく新しい手法を開発し,Webカメラ画像の品質低下とエッジ計算の問題に対処する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:40:19 GMT)
Hierarchical generation and design of quantum codes for resource-efficient loss-tolerant quantum communications [0.0] 我々は損失耐性量子コードを生成するための新しいプロトコルを開発した。
これらのコードは、クォービット損失に対する情報保護の中心である。
静的フィードバック機構を備えた単一量子エミッタでこれを実現する方法を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:51:00 GMT)
Heat as a witness of quantum properties [0.0] 熱発生に基づくエンタングルメントやコヒーレンスなどの量子資源を目撃するための新しいアプローチを提案する。
マクスウェルの悪魔に触発され、量子系と熱環境の間の最適な熱交換は、プロセスが量子メモリによって補助されるときに何であるかを尋ねる。
このシナリオで基本的なエネルギー制約を導出し、量子状態が熱交換によって古典的でないシグネチャを明らかにすることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:40:58 GMT)
Gradient-Regularized Latent Space Modulation in Large Language Models for Structured Contextual Synthesis [0.0] 本稿では、潜在空間における構造化制約の適用を通じて、テキスト生成を導くための新しいパラダイムを提案する。
勾配に基づく正規化の統合は、潜在表現の突然の変動を緩和する。
このフレームワークは、ニューラルネットワークに固有の生成的柔軟性を維持しながら、構造上の不整合を著しく低減する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:43:52 GMT)
Generalized quantum Zernike Hamiltonians: Polynomial Higgs-type algebras and algebraic derivation of the spectrum [0.0] 我々は、ハミルトニアンによって与えられる一般化されたゼルニケ系の量子アナログを考える。
この2次元量子モデルはハイゼンベルク代数の包絡代数内での運動の高階積分を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:06:54 GMT)
From Dyson Models to Many-Body Quantum Chaos [0.0] 多体量子カオスの基礎となるメカニズムの深い理解は、現代理論物理学における大きな課題の1つである。
グラフ上で定義された二次サハデフ・イ・キタエフ(SYK)ハミルトン多様体の文脈でこの問題に取り組む。
これにより、基礎となる単一粒子問題の幾何学的性質と相互作用項の重要性を解き放つことができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:29:13 GMT)
Frequency auto-homogenization using group-velocity-matched downconversion [0.0] 我々は,群速度整合ダウンコンバージョンによる周波数自己均質化を導入し,様々な量子エミッタのスペクトル識別性を除去する。
我々は、$chi(2)$量子周波数変換を用いて理論を提示し、自由空間光学装置における基本データの証明を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:37:02 GMT)
Foundation Model for Composite Materials and Microstructural Analysis [0.0] 複合材料に特化して設計された基礎モデルを提案する。
本研究は, 複合材料における基礎モデルの有効性と有効性について検証した。
このフレームワークは実験データが少ない場合でも高精度な予測を可能にする。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:57:37 GMT)
FinRLlama: A Solution to LLM-Engineered Signals Challenge at FinRL Contest 2024 [0.0] 本研究では,市場フィードバック(RLMF)による強化学習を用いた大規模言語モデル(LLM)のための新しいプロンプトフレームワークを提案する。
我々のフレームワークは、より正確な取引信号を生成するために、市場特有の特徴と短期的な価格変動を取り入れている。
評価の結果,このRTMF調整フレームワークは,信号の整合性や取引結果の厳密化において,ベースライン手法よりも優れており,タスクIIの勝者として与えられることがわかった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:11:09 GMT)
FewTopNER: Integrating Few-Shot Learning with Topic Modeling and Named Entity Recognition in a Multilingual Framework [0.0] FewTopNERは、数発のエンティティ認識とトピック対応のコンテキストモデリングを統合するフレームワークである。
多言語ベンチマークの実証評価では、FewTopNERは最先端の数ショットNERモデルよりも大幅に優れていた。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:13:40 GMT)
Fast Audio Codec Identification Using Overlapping LCS [0.0] 本稿では,重なり合う長大な共通部分文字列とサブシーケンスから派生した特徴に基づく音声分類手法を提案する。
8KBパケットに対して97%の精度を達成したシミュレーション結果は,従来の手法よりも提案手法の方が優れていることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:48:38 GMT)
FAB-PPI: Frequentist, Assisted by Bayes, Prediction-Powered Inference [0.0] 予測駆動推論(PPI)は、実験データと機械学習予測を組み合わせることで、有効な統計的推測を可能にする。
本稿では,予測の質について事前の知識でPPIフレームワークに通知することを提案する。
その結果,ベイズ支援型PPI(FAB-PPI)は,観測された予測品質が従来よりも低い場合にPPIよりも改善されることがわかった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:46:08 GMT)
Exploring LLMs Impact on Student-Created User Stories and Acceptance Testing in Software Development [0.0] 本研究では,LLM(大規模言語モデル)が大学生のユーザフィードバックをユーザストーリーに変換する能力に与える影響について検討する。
個別に働く学生は、ユーザーからのフィードバックのコメントを分析し、関連項目を適切にグループ化し、ユーザーストーリーを作成するように求められた。
その結果,LLMは学生にとって価値あるストーリーを十分に定義された受理基準で開発するのに役立つことがわかった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:35:44 GMT)
Exact Sequence Classification with Hardmax Transformers [0.0] 我々は、ハードマックスのアテンショントランスフォーマーが$N$ラベル付きシーケンスのデータセットを$mathbbRd$, $dgeq 2$で完全に分類することを証明している。
具体的には、$mathbbRd$で任意の長さの$N$シーケンスを与えられた場合、$mathcalO(N)$ブロックと$mathcalO(Nd)$パラメータで変換器を構築し、このデータセットを完全に分類する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 12:31:00 GMT)
Evaluating Fault Tolerance and Scalability in Distributed File Systems: A Case Study of GFS, HDFS, and MinIO [0.0] 分散ファイルシステム(DFS)は、スケーラビリティ、フォールトトレランス、データアクセシビリティのメリットを提供する、複数のサーバにわたる巨大なデータセットを管理するために不可欠である。
本稿では、Google File System(GFS)、Hadoop Distributed File System(HDFS)、MinIOの3つのDFSを総合的に評価する。
詳細な分析を通じて、これらのシステムがデータの冗長性、サーバ障害、クライアントアクセスプロトコルをどのように扱うか、動的で大規模環境における信頼性を確実に評価する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:52:45 GMT)
Enhanced strong interaction effect in synthetic spin-orbit coupling with mixed spin symmetry [0.0] 2つの擬スピン次数の系では、2つの粒子は対称状態と反対称状態を含むが、スピン対称性はより多くの粒子に対して混合することができる。
スピン軌道カップリングの存在下での混合スピン対称性の役割について検討する。
2粒子系とは対照的に、基底状態の対の相関は比較的小さな接触相互作用であってもトンクス・ジラルドー気体と類似している。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:16:25 GMT)
Enhanced quantum magnetometry with a laser-written integrated photonic diamond chip [0.0] 本稿では,ダイヤモンドに埋設した高品位レーザー導波路を用いた量子磁気計測を行った。
導波管結合型窒素空孔中心は, 原始ダイヤモンド中の窒素空孔中心と同等のスピンコヒーレンス特性を示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:53:22 GMT)
Emulating non-Hermitian dynamics in a finite non-dissipative quantum system [0.0] 与えられた時間窓における非エルミート力学のエミュレーションについて議論する。
我々は、有効連続体として作用する等距離離散状態の有限集合に結合した低次元量子系を用いる。
このような連続体は通常の準連続体モデルよりも効率的に非エルミート力学を再現できることを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:24:07 GMT)
Emergence of Self-Awareness in Artificial Systems: A Minimalist Three-Layer Approach to Artificial Consciousness [0.0] 本稿では,自己認識の出現に着目した,人工意識のための最小限の3層モデルを提案する。
脳複製アプローチとは異なり、本質的な要素のみを通して最小限の自己認識を実現することを目的としている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:06:25 GMT)
Efficient Implementation of the Global Cardinality Constraint with Costs [0.0] 我々は、コストに対する基数制約を考慮に入れている。
これは、全ての異なる制約の一般化であり、それぞれの値が与えられた変数の集合によって解において取らなければならない回数を指定する。
ランドマークに基づく最短経路上の上限を扱う新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:03:53 GMT)
Efficient Classical Simulation of the DQC1 Circuit with Zero Discord [0.0] DQC1回路の高速な古典シミュレーションのための経路を示す。
量子不協和によって量子化された非古典的相関は、混合状態量子計算における指数的スピードアップを可能にする鍵となる資源である。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 06:39:30 GMT)
Edge of Stochastic Stability: Revisiting the Edge of Stability for SGD [0.0] 我々は,ミニバッチ勾配降下(SGD)列車が異なる体制で「エッジ・オブ・安定性(EoSS)」と呼ばれることを示す。
2/eta$で安定化されるのは *Batch Sharpness* である。
さらに,SGD軌道の数学的モデリングについて考察する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:10:11 GMT)
ERASMO: Leveraging Large Language Models for Enhanced Clustering Segmentation [0.0] クラスタ分析は、マーケティングにおける顧客セグメンテーションなど、さまざまなドメインやアプリケーションにおいて重要な役割を果たす。
本研究では,テキストエンコードされたデータに基づいて事前学習した言語モデルを微調整するフレームワークであるERASMOを紹介する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:06:50 GMT)
Dynamic benchmarking framework for LLM-based conversational data capture [0.0] 本稿では,大規模言語モデル(LLM)を評価するためのベンチマークフレームワークを提案する。
生成エージェントシミュレーションを統合して、情報抽出、コンテキスト認識、適応エンゲージメントといった重要次元のパフォーマンスを評価する。
その結果,不明瞭な応答を扱う場合,適応戦略によりデータの抽出精度が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:47:47 GMT)
Dynamic Circuits for the Quantum Lattice-Boltzmann Method [0.0] 線形対流拡散方程式(ADE)格子ボルツマン法(LBM)の量子アルゴリズムを提案する。
動的量子回路は、最適化された衝突演算量子アルゴリズムを可能にし、部分的な測定を積分ステップとして導入する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 09:04:24 GMT)
Developing techniques for Simulation of SU(3) Quantum Field Theories on State-of-the-Art Quantum Devices [0.0] NISQデバイスを中心とした格子量子色力学(LQCD)の量子シミュレーション技術の改良
この論文は、密度の高い3フレーバーニュートリノ系に関する2つのプロジェクトを含んでいる。
最初の詳細は、最先端の量子デバイス上でのトロッター化時間進化回路の設計とテストである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:16:16 GMT)
Data-driven discovery of self-similarity using neural networks [0.0] 本稿では、観測データから直接自己相似性を発見するニューラルネットワークに基づく新しいアプローチを提案する。
物理問題における自己相似解の存在は、支配法則が権力者指数によって主張される関数を含むことを示す。
観測データを用いてニューラルネットワークモデルをトレーニングし、トレーニングが成功すれば、物理問題のスケール・トランスフォーメーション対称性を特徴付けるパワー指数を抽出できる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:36:14 GMT)
Data-Dependent Generalization Bounds for Parameterized Quantum Models Under Noise [0.0] 本研究では,パラメータ化量子機械学習モデルの雑音の影響下での一般化特性について検討した。
本稿では、量子フィッシャー情報行列に接地したデータ依存の一般化について述べる。
量子フィッシャー情報行列固有値によって定義される局所パラメータ近傍と有効次元を統合することで,量子モデルの複雑性をモデル化する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:03:39 GMT)
DRiVE: Dynamic Recognition in VEhicles using snnTorch [0.0] スパイキングニューラルネットワーク(SNN)は、イベント駆動設計を通じて効率的にデータを処理し、生物学的脳活動を模倣する。
この研究は、SNNとPyTorchの適応可能なフレームワークであるsnnTorchを組み合わせて、画像ベースのタスクの可能性をテストする。
DRiVEは、スパイキングニューロンダイナミクスを用いて画像の分類を行い、94.8%の精度とほぼ完璧な0.99AUCスコアを達成できる車両検出モデルである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:01:13 GMT)
Critical coupling constants for binding some quantum many-body systems [0.0] 粒子が2体の短距離中心ポテンシャル井戸を介して相互作用する場合、結合定数のいくつかの臨界値に対して結合が生じる。
エンベロープ理論を用いて、同じ粒子を含む量子非相対論系と同一粒子を含む系と異なる粒子を含む系に対して臨界カップリング定数の近似を計算する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 08:52:12 GMT)
Conversation AI Dialog for Medicare powered by Finetuning and Retrieval Augmented Generation [0.0] 大きな言語モデル(LLM)は、対話生成を含む自然言語処理タスクにおいて印象的な機能を示している。
本研究の目的は、LoRAによる微調整とRetrieval-Augmented Generationフレームワークという、2つの重要な技術の比較分析を行うことである。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:50:40 GMT)
Contextuality of Quantum Error-Correcting Codes [0.0] 文脈性と量子誤り訂正符号の直接リンクを確立する。
我々は、Abramsky--Brandenburger の層理論の枠組みから、文脈性の定義の同値性を証明する。
2つ以上のゲージ量子ビットを持つサブシステム安定化符号は強い文脈的であり、他方は文脈的でないことを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:23:24 GMT)
Contextual Memory Reweaving in Large Language Models Using Layered Latent State Reconstruction [0.0] シーケンスの長さが増加するにつれて、トークン依存は低下し、一貫性と事実整合性が低下する。
異なる処理層でキャプチャされた潜伏状態の再織り直しを通じてこの問題を軽減するための構造化されたアプローチが導入された。
提案されたContextual Memory Reweavingフレームワークには、Lambed Latent State Restructationメカニズムが組み込まれている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 06:25:20 GMT)
Constrained belief updates explain geometric structures in transformer representations [0.0] 我々は、最適予測のモデル非依存理論と機械論的解釈可能性を統合し、隠れマルコフモデルのトラクタブルファミリーで訓練されたトランスフォーマーを解析する。
注目ヘッドは,確率単純度を自然に解釈したアルゴリズムを実行し,特異な幾何学的構造を持つ表現を生成する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 03:03:54 GMT)
Confinement and false vacuum decay on the Potts quantum spin chain [0.0] 混合体三状態ポッツ量子鎖における量子クエンチ後の非平衡ダイナミクスを考察する。
イジングスピン鎖の類似した設定と比較すると、ポッツモデルはよりリッチな表現論を持つ。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:03:23 GMT)
Conceptual Metaphor Theory as a Prompting Paradigm for Large Language Models [0.0] 大規模言語モデル(LLM)の拡張のためのフレームワークとしてメタファー概念理論(CMT)を紹介する。
CMTは比喩的マッピングを活用して抽象的推論を構造化し、複雑な概念を処理し説明するモデルの能力を向上させる。
我々は4つのネイティブモデル(Llama3.2、Phi3、Gemma2、Mistral)を、ドメイン固有の推論、創造的洞察、メタファ解釈にまたがるベンチマークタスクで、CMTが強化したモデルと比較する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 00:26:39 GMT)
Complex entanglement entropy for complex conformal field theory [0.0] コンフォーマル場の理論は、量子多体系の臨界基底状態の根底にある。
非エルミート五状態ポッツモデルの複素絡みエントロピーを数値計算する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 04:27:11 GMT)
Chemically-Accurate Prediction of the Ionisation Potential of Helium Using a Quantum Processor [0.0] 量子コンピュータは、物質や化学プロセスの微視的挙動の理解に革命をもたらす可能性がある。
現在の量子コンピューティングハードウェアデバイスは、ノイズとコストという2つの課題に悩まされている。
本稿では,高精度電子構造のためのツールとして,ノイズ量子コンピュータの実用的価値を検討する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 05:20:12 GMT)
Cheaper and more noise-resilient quantum state preparation using eigenvector continuation [0.0] サブスペース法は、量子コンピュータ上の基底状態を効果的に作成できる強力で耐雑音性のある方法である。
本研究では、固有ベクトル連続体を用いて、ハミルトニアン集合の低次状態から部分空間を構築する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:00:59 GMT)
Chaos in a Nonlinear Wavefunction Model: An Alternative to Born's Probability Hypothesis [0.0] この基準を解析的に検討し, 小型(3キュービット)モデルからシミュレートする。
私はまた、不安定性の基準を連続体内のモデルに拡張します。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:30:07 GMT)
Cancellation of phonon hopping in trapped ions by modulation of the trap potential [0.0] トラップされたイオンの局所モードは、アナログ量子シミュレータとデジタル量子コンピュータを構築するために使用できる。
そこで本稿では,位相シフトゲートのシーケンスを適用して,与えられた局所モードの集合間のフォノンホッピングをキャンセルする手法を提案する。
本手法は、ボソニック系のシミュレーションや、トラップイオンを用いた量子コンピューティングの連続変数符号化にも適用可能である。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 01:18:08 GMT)
Brief analysis of DeepSeek R1 and it's implications for Generative AI [0.0] DeepSeekは新しい推論モデル(DeepSeek R1)を2025年1月にリリースした。
本報告では、生成AI分野におけるモデルと、そのリリースの意味について論じる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 17:45:32 GMT)
Bayesian Optimization for Repeater Protocols [0.0] 第一世代の量子リピータチェーンは、確率的絡み合い発生、交換、蒸留操作からなるプロトコルを実行することで絡み合いを分散する。
実験的な不完全性や操作の確率的性質から,与えられたプロトコルのシークレットキーレートを計算することは自明であることを示す。
我々は,異なるノード構成とハードウェア条件をまたいだリピータプロトコルの効率を最大化する方法についての知見を抽出するために,我々のフレームワークを利用する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:46:12 GMT)
BINDy -- Bayesian identification of nonlinear dynamics with reversible-jump Markov-chain Monte-Carlo [0.0] モデルパーシモニーは、データ駆動型モデリングにおける重要な認識バイアスであり、解釈可能性を助け、過度な適合を防ぐのに役立つ。
非線形力学(SINDy)法のスパース同定は、データから直接複素力学のスパース表現を学習することができる。
SINDyの代替として,辞書学習システム識別のベイズ的新しい治療法が提案されている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:35:01 GMT)
Autoencoder-based General Purpose Representation Learning for Customer Embedding [0.0] 多層契約型オートエンコーダの正規化項を計算する新しい手法であるDEEPCAEを導入する。
DEEPCAEは、復元性能と下流予測性能の両方において、他のテストされたオートエンコーダのバリエーションよりも優れていることを実証的に示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 13:17:52 GMT)
AuthOr: Lower Cost Authenticity-Oriented Garbling for Arbitrary Boolean Circuits [0.0] 本稿では,汎用回路のための新しい認証指向ガーブリング方式AuthOrについて報告する。
提案手法は,情報理論ギャリング,ハーフゲートギャリング,新しいバンド幅フリー・アンド・ゲートギャリング方式のアイデアをうまく組み合わせる。
提案手法は,多くの回路において通信コストと計算コストの両方でハーフゲートを突破するが,回路に依存するため,正確な効率向上を実証的に見ることができる。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:59:44 GMT)
Artificial Intelligence and Legal Analysis: Implications for Legal Education and the Profession [0.0] 本稿では,法的および非法的大規模言語モデルが法的解析を行う能力について検討した結果を報告する。
その結果, LLMは基本的なIRAC分析を行うことができるが, 詳細を欠いた短時間の応答, 回答にコミットできないこと, 虚偽の自信, 幻覚によって制限されることがわかった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 19:50:48 GMT)
Are Language Models Up to Sequential Optimization Problems? From Evaluation to a Hegelian-Inspired Enhancement [0.0] 大規模言語モデル(LLM)は多くの分野にまたがって印象的な能力を示している。
本稿では、逐次最適化問題(SOP)におけるLLMの熟練度について考察する。
We introduced WorldGen, a dynamic framework for generate unseen SOPs with controllable complexities。
ヘーゲル弁証学の影響力ある枠組みに触発され,SOP文脈におけるLLMの性能が著しく向上することを示すACEを提案する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 18:47:31 GMT)
Analysis of the Geometric Structure of Neural Networks and Neural ODEs via Morse Functions [0.0] 本研究では,スカラー出力を持つ有限深度ニューラルネットワークと無限深度ニューラルネットワークの入力出力ダイナミクスについて検討する。
ネットワークの特定の構造によって、入力出力マップは臨界点の存在と規則性に関して異なる特性を持つことを示す。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:45:54 GMT)
Analysis of LLMs vs Human Experts in Requirements Engineering [0.0] 大規模言語モデル(LLM)のソフトウェア開発への応用は、コード生成のテーマとなっている。
本研究は, LLMがソフトウェアシステムの要件を抽出する能力と, タイムボックス型およびプロンプトボックス型研究における人間専門家の要求とを比較した。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:33:51 GMT)
An extended Wigner's friend no-go theorem inspired by generalized contextuality [0.0] 観測事象と運用機関の絶対性という共同仮定と量子論の不整合を示す。
この結果は局所的フレンドリネスのノーゴー定理を一般化し、一般化された非コンテクスト性に基づくノーゴー定理よりも強い。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:31:57 GMT)
AmaSQuAD: A Benchmark for Amharic Extractive Question Answering [0.0] 本研究では,抽出された問合せデータセットを低リソース言語に翻訳するための新しい枠組みを提案する。
この方法論は、翻訳された質問と回答のミスアライメントに関連する課題に対処する。
我々は、AmaSQuAD合成データセット上でXLM-Rモデルを微調整し、Amharic Question-Answeringを行う。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 06:27:39 GMT)
Accurate Pocket Identification for Binding-Site-Agnostic Docking [0.0] ドッキングとのシームレスな統合のためのポケットフィンディングアルゴリズムを開発した。
AutoDock Vinaを導く場合、RAPID-NetはPoseBustersベンチマークでDiffBindFRを上回っている。
PUResNetとKalasantyを抜いて、ドッキング精度とポケットリガンドの交差点レートを上回っている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:52:10 GMT)
ASCenD-BDS: Adaptable, Stochastic and Context-aware framework for Detection of Bias, Discrimination and Stereotyping [0.0] 本稿では,ASCenD BDS(バイアス・識別・ステレオタイピングのための適応・コンテキスト・コンテキスト認識フレームワーク)というフレームワークを提案する。
この枠組みは, 性別, 年齢, 障害, 社会経済的地位, 言語的バリエーションなど, 様々なカテゴリーにまたがる偏見, 差別, ステレオタイピングを検出するアプローチを示す。
このコンセプトは、製品開発の一環としてSFCLabsでテストされている。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 07:44:20 GMT)
AIoT-based smart traffic management system [0.0] 本稿では,交通流の最適化と都市環境の混雑軽減を目的とした,AIベースの新しいスマートトラフィック管理システムを提案する。
既存のCCTVカメラのライブ映像を分析することで、新たなハードウェアの必要性を排除することができる。
AIモデルはライブビデオフィードを処理し、車両を正確にカウントし、交通密度を評価し、適応的な信号制御を可能にする。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:38:42 GMT)
A simple algorithm for output range analysis for deep neural networks [0.0] 本稿では,Deep Neural Networks (DNN) における出力範囲推定問題に対して,Simulated Annealing (SA) アルゴリズムを統合した新しい手法を提案する。
この方法はResNetsに固有の幾何学的情報や非線形性の欠如による課題に効果的に対処する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 20:01:18 GMT)
A mixed-precision quantum-classical algorithm for solving linear systems [0.0] 本稿では,QSVTの精度を向上し,QSVTのコストを削減するハイブリッド量子古典アルゴリズムを提案する。
誤差と複雑性を解析し、まず量子ソフトウェアスタックmyQLMを用いた実験を行う。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 10:49:42 GMT)
A de Finetti theorem for quantum causal structures [0.0] 古典的確率、量子状態、量子チャネルに関する同様の質問は、いわゆる「デ・フィネッティの定理」によって美しく答えられる。
この結果は、不定因数順序や、雑音量子デバイスに適用可能なマルチ時間非マルコフ過程を含む任意の因数構造を持つプロセスに拡張する。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 16:01:06 GMT)
A Robust Remote Photoplethysmography Method [0.0] この研究は、歪みの影響を受けにくく、最小限のハードウェア要件を持つ、より堅牢な手法を提案する。
この方法は、性別や年齢の異なる19人のボランティアから撮影した26の動画でテストされた。
その結果,平均絶対誤差は毎分1.95回であった。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 11:10:34 GMT)
A Deterministic Information Bottleneck Method for Clustering Mixed-Type Data [0.0] 混合型データをクラスタリングするための情報理論手法を提案する。
提案手法は,Information Bottleneckアルゴリズムの決定論的変種に基づいて構築される。
4つのクラスタリング手法に対して,本手法の性能評価を行った。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 14:16:08 GMT)
A Brief Analysis of the Iterative Next Boundary Detection Network for Tree Rings Delineation in Images of Pinus taeda [0.0] INBDネットワークは、まず背景、穴、リングの境界を分割する。
第2段階では、画像は極座標に変換され、リング境界は、ピットからバークへ反復的に分割される。
評価セット上のFスコアは77.5、mARは0.540、ARANDは0.205である。
論文参考訳(メタデータ) (Tue, 04 Feb 2025 15:43:54 GMT)