DataComp-LM: In search of the next generation of training sets for language models [200.5] DataComp for Language Models (DCLM)は、制御されたデータセット実験のためのテストベッドであり、言語モデルを改善することを目的としている。
我々は、Common Crawlから抽出された240Tトークンの標準化コーパス、OpenLMフレームワークに基づく効果的な事前学習レシピ、53の下流評価スイートを提供する。
DCLMベンチマークの参加者は、412Mから7Bパラメータのモデルスケールでの重複、フィルタリング、データ混合などのデータキュレーション戦略を実験することができる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:48:15 GMT)
PVUW 2025 Challenge Report: Advances in Pixel-level Understanding of Complex Videos in the Wild [164.8] 本報告では,CVPR 2025と共同で開催されている第4回PVUWチャレンジについて概観する。
課題は、複雑なシーンビデオオブジェクトセグメンテーションに焦点を当てたMOSEと、モーションガイドによる言語ベースのビデオセグメンテーションをターゲットとするMeViSの2つのトラックである。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 07:23:45 GMT)
VisuLogic: A Benchmark for Evaluating Visual Reasoning in Multi-modal Large Language Models [121.0] VisuLogicは、6つのカテゴリにまたがる1,000の人間認証された問題のベンチマークです。
これらの質問は、複数の視点からMLLMの視覚的推論能力を評価するために評価することができる。
ほとんどのモデルは精度が30%以下で、25%のランダムベースラインよりわずかに高く、人間によって達成された51.4%よりはるかに低い。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:59:53 GMT)
Transferable Adversarial Attacks on SAM and Its Downstream Models [87.2] 本稿では,セグメント・アプライス・モデル(SAM)から微調整した様々な下流モデルに対する敵攻撃の可能性について検討する。
未知のデータセットを微調整したモデルに対する敵攻撃の有効性を高めるために,ユニバーサルメタ初期化(UMI)アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 10:57:32 GMT)
ASIDE: Architectural Separation of Instructions and Data in Language Models [87.2] 本稿では,埋め込みレベルにおける命令とデータを明確に分離する手法ASIDEを提案する。
ASIDEはデータトークンの埋め込みに固定回転を適用し、追加のパラメータを導入することなく、命令とデータトークンの異なる表現を生成する。
提案手法の有効性を,(1)モデル能力の低下を伴わない命令データ分離スコアの高度化と,(2)専用の安全訓練を伴わずともインジェクションベンチマークにおける競合結果を示す。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:45:08 GMT)
A Call for New Recipes to Enhance Spatial Reasoning in MLLMs [85.7] MLLM(Multimodal Large Language Models)は、一般的な視覚言語タスクにおいて印象的な性能を示す。
近年の研究では、空間的推論能力の限界が明らかにされている。
この空間的推論の欠如は、MLLMが物理的世界と効果的に相互作用する能力を著しく制限する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 11:48:39 GMT)
Uni3C: Unifying Precisely 3D-Enhanced Camera and Human Motion Controls for Video Generation [85.1] 映像生成におけるカメラと人間の動きを正確に制御するための統合フレームワークUni3Cを提案する。
まず,フリーズビデオ生成バックボーンであるPCDControllerで学習したプラグイン・アンド・プレイ制御モジュールを提案する。
第2に,景観点雲とSMPL-X文字をシームレスに統合する推論フェーズの3次元ワールドガイダンスを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 07:10:41 GMT)
An LMM for Efficient Video Understanding via Reinforced Compression of Video Cubes [85.0] 本稿では,非時間密度の動画をGumbel Softmax を用いて様々な立方体に分割する新しい知覚パラダイムを持つ LMM である textbfQuicksviewer を提案する。
言語バックボーンから3段階のプログレッシブステージを通じてモデルをトレーニングし、それぞれが知覚効率によって平均420s/1fpsの長大なビデオを組み込む。
トレーニング用ビデオテキストサンプルは0.8Mに過ぎず, 精度が最大8.72倍に向上した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:57:21 GMT)
EvalAgent: Discovering Implicit Evaluation Criteria from the Web [82.8] EvalAgentは、ニュアンスとタスク固有の基準を自動的に発見するように設計されたフレームワークである。
EvalAgentは、さまざまな長期評価基準を提案するために、専門家が作成したオンラインガイダンスをマイニングしている。
我々の実験では、EvalAgentが生み出す基準は暗黙的だが具体的であることが示されている。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:43:50 GMT)
Towards Understanding Camera Motions in Any Video [80.2] 我々は、カメラモーション理解の評価と改善を目的とした大規模なデータセットとベンチマークであるCameraBenchを紹介する。
CameraBenchは、厳格な品質管理プロセスを通じて専門家によって注釈付けされた3,000の多様なインターネットビデオで構成されている。
私たちの貢献の1つは、撮影者との共同で設計されたカメラモーションプリミティブの分類である。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:34:57 GMT)
Is Translation All You Need? A Study on Solving Multilingual Tasks with Large Language Models [79.5] 大規模言語モデル (LLM) は多言語機能を示しているが、ほとんどは不均衡なトレーニングコーパスのため英語中心である。
実世界のユーザクエリと非英語中心のLLMに評価を拡張し、多言語性能のより広範な評価を提供する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 12:52:49 GMT)
LongProc: Benchmarking Long-Context Language Models on Long Procedural Generation [74.9] LongProc (Long Procedural Generation)は、Long-Context Language Model (LCLM) を評価するための新しいベンチマークである。
LongProcは、HTMLページから構造化された情報をTSVフォーマットに抽出し、旅行計画を作成する複雑な検索手順を実行する6つの手続き生成タスクで構成されている。
我々は,LongProcの命令調整モデルと最近の推論モデルを含む23個のLCLMを,500,2K,8Kで設定された最大出力トークン数で3つの難易度で評価した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 13:50:28 GMT)
Aioli: A Unified Optimization Framework for Language Model Data Mixing [74.5] 提案手法は, 単層サンプリングベースラインを平均的なテストパープレキシティで一貫した性能を発揮できないことを示す。
我々は、Aioliという新しいオンライン手法を導き、トレーニング全体を通して法パラメータの混合を直接推定し、それらを用いて比率を動的に調整する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 03:50:23 GMT)
CRUST-Bench: A Comprehensive Benchmark for C-to-safe-Rust Transpilation [63.2] CRUST-Benchは100のCリポジトリのデータセットで、それぞれが安全なRustとテストケースで手書きのインターフェースとペアリングされている。
我々は、このタスクで最先端の大規模言語モデル(LLM)を評価し、安全で慣用的なRust生成が依然として難しい問題であることを確認した。
最高のパフォーマンスモデルであるOpenAI o1は、ワンショット設定で15タスクしか解決できない。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:33:33 GMT)
Detecting Training Data of Large Language Models via Expectation Maximization [62.3] 本稿では,予測最大化アルゴリズムを用いて,メンバーシップスコアとプレフィックススコアを反復的に洗練する新しいメンバーシップ推論手法EM-MIAを紹介する。
EM-MIAはWikiMIAで最先端の結果を得る。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 02:22:06 GMT)
AlignRAG: An Adaptable Framework for Resolving Misalignments in Retrieval-Aware Reasoning of RAG [61.3] Retrieval-augmented Generation (RAG) は知識基底テキスト生成の基礎パラダイムとして登場した。
既存のRAGパイプラインは、しばしば、推論軌跡が、検索されたコンテンツによって課される明らかな制約と一致しないことを保証するのに失敗する。
そこで我々は,反復的批判駆動アライメントステップによる推論ミスアライメントを緩和する新しいテストタイムフレームワークであるAlignRAGを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 04:56:47 GMT)
CAPTURe: Evaluating Spatial Reasoning in Vision Language Models via Occluded Object Counting [59.8] Amodally for Patterns Through Unseen Regions (CAPTURe)は、視覚言語モデルを評価するためのテストベッドである。
CAPTUReでは、4つの強力な視覚言語モデルを評価し、隠蔽パターンと隠蔽パターンの両方でモデルがカウントできないことを発見した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 23:38:43 GMT)
Language Representations Can be What Recommenders Need: Findings and Potentials [57.9] 先進的なLM表現から線形にマッピングされた項目表現は、より優れたレコメンデーション性能が得られることを示す。
この結果は、先進言語表現空間と効果的な項目表現空間との同型性を示唆している。
本研究は,自然言語処理とリコメンデーションシステムコミュニティの両方に刺激を与える言語モデリングと行動モデリングの関連性を強調した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 03:45:36 GMT)
NTIRE 2025 Challenge on Short-form UGC Video Quality Assessment and Enhancement: KwaiSR Dataset and Study [57.5] 我々は、KwaiSRと呼ばれるワイルドな画像超解像のための最初のベンチマークデータセットを構築した。
このデータセットは、合成と野生の2つの部分からなるクウェープラットフォームから収集される。
KwaiSRデータセットに基づいて、第2の短いビデオ品質評価と改善に関するNTIRE 2025チャレンジを組織する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 10:04:26 GMT)
ReSpec: Relevance and Specificity Grounded Online Filtering for Learning on Video-Text Data Streams [57.1] ビデオテキストデータは、トレーニング中のストレージと計算の課題を示す。
ReSpec(Relevance and Specificity-based online filtering framework)を提案する。
ターゲットのタスクデータから参照ポイントを確立することで、ReSpecは受信したデータをリアルタイムでフィルタリングし、広範なストレージと計算の必要性をなくす。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 06:02:03 GMT)
Fine-Grained Verifiers: Preference Modeling as Next-token Prediction in Vision-Language Alignment [57.0] 本研究では,視覚言語アライメントを改善するための細粒度検証器として,モデル自身のビジュアルエンコーダを利用する新たな自己アライメント手法であるFiSAOを提案する。
ビジョンエンコーダからのトークンレベルのフィードバックを活用することで、FiSAOは視覚言語アライメントを大幅に改善する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 04:04:53 GMT)
MR. Guard: Multilingual Reasoning Guardrail using Curriculum Learning [56.8] 大規模言語モデル(LLM)は、ジェイルブレイクのような敵の攻撃を受けやすい。
この脆弱性は、多言語セーフティアライメントされたデータが制限される多言語設定で悪化する。
推論を用いた多言語ガードレール構築手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:15:06 GMT)
LOKI: A Comprehensive Synthetic Data Detection Benchmark using Large Multimodal Models [55.9] 複数モードで合成データを検出するLMMの能力を評価するための新しいベンチマークであるLOKIを紹介する。
このベンチマークには、粗粒度判定と多重選択質問、微粒度の異常選択と説明タスクが含まれている。
LOKI上で22のオープンソースLMMと6つのクローズドソースモデルを評価し、合成データ検出器としての可能性を強調し、LMM機能開発におけるいくつかの制限を明らかにした。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 02:36:09 GMT)
Fast and scalable Wasserstein-1 neural optimal transport solver for single-cell perturbation prediction [55.9] 最適輸送(OT)理論はそのようなマッピングを構築するための原則的な枠組みを提供する。
We propose a novel solver based on Wasserstein-1 (W$) dual formulation。
我々の実験は、提案した$W$のニューラル・トランスポート・ソルバが、ユニークなモンマップを見つける際に、$W$のOTを模倣できることを実証した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:33:30 GMT)
Overcoming False Illusions in Real-World Face Restoration with Multi-Modal Guided Diffusion Model [55.5] 本稿では,新しいマルチモーダル・リアル・ワールド・フェイス・リカバリ技術を紹介する。
MGFRは偽の顔の特徴とアイデンティティの生成を緩和することができる。
4800のアイデンティティにまたがる21,000以上の高解像度顔画像からなるReface-HQデータセットを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 11:47:05 GMT)
Ambient Diffusion Posterior Sampling: Solving Inverse Problems with Diffusion Models Trained on Corrupted Data [54.1] 線形に破損したデータから学習した拡散モデルを用いて逆問題を解決するためのフレームワークを提供する。
加速度係数R=2,4,6,8のサブサンプルによるマルチコイル測定にのみアクセス可能なMRI拡散モデルを訓練する。
高加速度環境下でのMRI再構成において、サブサンプルデータでトレーニングされたA-DPSモデルは、完全サンプルデータでトレーニングされたモデルよりも逆問題の解決に適している。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 23:33:05 GMT)
Inference Optimal VLMs Need Fewer Visual Tokens and More Parameters [54.0] 視覚言語モデル(VLM)は、様々な視覚的理解と推論タスクにまたがる強力な能力を示している。
推論コストを削減するために、LLM(Large Language Models)を縮小するか、イメージを表すのに必要な入力トークンの数を削減できる。
高速圧縮に適したトークン圧縮アルゴリズムを設計する第一歩を踏み出す。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 09:34:59 GMT)
Benchmarking Large Vision-Language Models on Fine-Grained Image Tasks: A Comprehensive Evaluation [53.8] 我々は349万の質問と332万の画像からなる総合的なきめ細かい評価ベンチマーク、すなわちFG-BMKを導入する。
本評価では,人間指向と機械指向の両方の観点からLVLMを体系的に検討する。
トレーニングパラダイム,モダリティアライメント,摂動感受性,および細粒度カテゴリー推論がタスクパフォーマンスに与える影響について,重要な知見を明らかにした。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 09:30:41 GMT)
The Great Nugget Recall: Automating Fact Extraction and RAG Evaluation with Large Language Models [53.1] 本稿では,人間のアノテーションに対して評価を行う自動評価フレームワークを提案する。
この手法は2003年にTREC Question Answering (QA) Trackのために開発された。
完全自動ナゲット評価から得られるスコアと人間に基づく変種とのランニングレベルでの強い一致を観察する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 12:55:06 GMT)
Support Evaluation for the TREC 2024 RAG Track: Comparing Human versus LLM Judges [53.1] RAG評価において重要な要素は、引用された文書の情報が回答をサポートするかどうかである。
TREC 2024 RAG Trackの36項目について,45件の参加者を大規模に比較検討した。
以上の結果から,手動によるオフスクラッチ評価の56%では,ヒトとGPT-4oの予測が完全に一致していることが示唆された。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:20:43 GMT)
Advancing Generative Artificial Intelligence and Large Language Models for Demand Side Management with Internet of Electric Vehicles [52.4] 本稿では,大規模言語モデル(LLM)のエネルギー管理への統合について検討する。
本稿では、自動問題定式化、コード生成、カスタマイズ最適化のために、LLMを検索拡張生成で強化する革新的なソリューションを提案する。
本稿では,電気自動車の充電スケジューリングと最適化における提案手法の有効性を示すケーススタディを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 11:09:11 GMT)
The AI Co-Ethnographer: How Far Can Automation Take Qualitative Research? [51.4] AI Co-Ethnographer (AICoE)は、定性的研究のために開発された新しいエンドツーエンドパイプラインである。
AICoEは、オープンコーディング、コード統合、コードアプリケーション、さらにはパターン発見を含む、プロセス全体を整理する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 21:31:28 GMT)
DreamDistribution: Learning Prompt Distribution for Diverse In-distribution Generation [51.2] 本稿では,事前学習したT2I拡散モデルを用いて,ソフトプロンプトの集合を学習する解を提案する。
これらのプロンプトは、テキストガイドによる編集機能と、複数のディストリビューション間の変動と混合を制御する柔軟性を提供する。
また,テキスト・トゥ・3Dなどの他のタスクに対して,学習したプロンプト分布の適応性を示す。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:26:57 GMT)
Single-loop Algorithms for Stochastic Non-convex Optimization with Weakly-Convex Constraints [49.8] 本稿では、目的関数と制約関数の両方が弱凸である問題の重要な部分集合について検討する。
既存の手法では、収束速度の遅さや二重ループ設計への依存など、しばしば制限に直面している。
これらの課題を克服するために,新しい単一ループペナルティに基づくアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:15:48 GMT)
CTINexus: Automatic Cyber Threat Intelligence Knowledge Graph Construction Using Large Language Models [49.7] サイバー脅威インテリジェンス(CTI)レポートのテキスト記述は、サイバー脅威に関する豊富な知識源である。
現在のCTI知識抽出法は柔軟性と一般化性に欠ける。
我々は,データ効率の高いCTI知識抽出と高品質サイバーセキュリティ知識グラフ(CSKG)構築のための新しいフレームワークであるCTINexusを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 14:37:40 GMT)
The 1st EReL@MIR Workshop on Efficient Representation Learning for Multimodal Information Retrieval [49.6] 我々は,Web Conference 2025で初めてのEReL@MIRワークショップを提案し,参加者に新しいソリューションの探求を依頼する。
このワークショップは、学術と産業の両方の研究者が議論し、洞察を共有し、コラボレーションを促進するためのプラットフォームを提供することを目的としている。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 01:10:59 GMT)
From Reviews to Dialogues: Active Synthesis for Zero-Shot LLM-based Conversational Recommender System [49.6] 大きな言語モデル(LLM)は強力なゼロショットレコメンデーション機能を示している。
現実的なアプリケーションは、スケーラビリティ、解釈可能性、データプライバシの制約により、より小さく、内部的に管理された推奨モデルを好むことが多い。
能動学習技術によって導かれるブラックボックスLSMを利用して,会話学習データを合成する能動データ拡張フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 23:05:47 GMT)
A General Infrastructure and Workflow for Quadrotor Deep Reinforcement Learning and Reality Deployment [48.9] 本稿では, エンドツーエンドの深層強化学習(DRL)ポリシーを四元数へシームレスに移行できるプラットフォームを提案する。
本プラットフォームは, ホバリング, 動的障害物回避, 軌道追尾, 気球打上げ, 未知環境における計画など, 多様な環境を提供する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 14:25:23 GMT)
LLMs as Data Annotators: How Close Are We to Human Performance [47.6] データのマニュアルアノテーションは、労働集約的で、時間がかかり、コストがかかる。
In-context Learning (ICL) では、タスクに関連するいくつかの例がプロンプトで与えられると、非効率性や準最適モデルの性能につながる可能性がある。
本稿では,NERタスクの様々なデータセットに対して,異なる埋め込みモデルを考慮した複数のLLMの比較実験を行う。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 11:11:07 GMT)
Depth Pro: Sharp Monocular Metric Depth in Less Than a Second [45.7] ゼロショット距離単眼深度推定のための基礎モデルを提案する。
我々のモデルであるDepth Proは、非並列のシャープネスと高周波の詳細で高分解能深度マップを合成する。
標準GPUで0.3秒で2.25メガピクセルの深度マップを生成する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 12:09:08 GMT)
Prethermalization of light and matter in cavity-coupled Rydberg arrays [45.0] 単モード光キャビティに結合した2次元ライドバーグ原子配列のダイナミクスを探索する。
短距離Rydberg相互作用と長距離光子媒介相互作用の相互作用によって誘導される新しい予熱機構を発見する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 10:51:21 GMT)
Agile-Quant: Activation-Guided Quantization for Faster Inference of LLMs on the Edge [43.8] 大きな言語モデル(LLM)は、複雑な言語モデリングタスクにおける印象的なパフォーマンスで際立っている。
近年の研究では、エンド・ツー・エンドのタスク性能に最小限の影響を伴って、8ビット以下のウェイト量子化が可能であることが示されている。
我々は、人気のある大規模言語モデルのためのアクティベーション誘導量子化フレームワークであるAgile-Quantを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 01:24:31 GMT)
A Strategic Coordination Framework of Small LLMs Matches Large LLMs in Data Synthesis [43.7] 大規模言語モデル(LLM)は、計算コスト、環境不効率、モノリシックアーキテクチャから受け継いだ潜在的なバイアスに悩まされる。
我々は、高品質で多様な信頼性のあるデータを生成するために、小さなLLMにまたがる特殊な役割を集約する協調的なフレームワークGRAを提案する。
本研究は,データ合成におけるモノリシックな大規模モデルの必要性に挑戦し,より小さなエージェントの戦略的コーディネーションを提唱する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 07:29:28 GMT)
Satellite Federated Fine-Tuning for Foundation Models in Space Computing Power Networks [42.1] 衛星-地上協調型ファインチューニングフレームワークを提案する。
通信資源と計算資源の両方を統合した通信戦略を導入する。
シミュレーションの結果,約33%の改善でトレーニング時間が大幅に短縮された。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 06:05:23 GMT)
DRAWER: Digital Reconstruction and Articulation With Environment Realism [42.1] 静的屋内シーンの映像を光現実的でインタラクティブなデジタル環境に変換する新しいフレームワークであるDRAWERを提案する。
我々は、DRAWERの可能性を、Unreal Engineでインタラクティブなゲームを自動的に作成し、ロボットアプリケーションのためのリアルからシミュレート・トゥ・リアルなトランスファーを可能にするために示している。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:59:49 GMT)
Zero-Shot, But at What Cost? Unveiling the Hidden Overhead of MILS's LLM-CLIP Framework for Image Captioning [41.9] MILSは"LLMはトレーニングなしで見たり聞いたりできます"と主張するフレームワークです。
この研究は、MILSにおける出力品質と計算コストの間のトレードオフを公開し、定量化した最初のものである。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:16:19 GMT)
Multiple-Resolution Tokenization for Time Series Forecasting with an Application to Pricing [41.9] 本稿では,時系列のトークン化に着目した時系列予測のためのトランスフォーマーアーキテクチャを提案する。
我々のアーキテクチャは、利用可能なすべてのデータにまたがって、多くのスケールで効率的な表現を同時に学習することを目的としています。
我々は,このモデルを,大手小売店のマークダウンチームが直面している現実的な予測問題に適用する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 08:58:24 GMT)
A Survey on Small Sample Imbalance Problem: Metrics, Feature Analysis, and Solutions [41.8] 小サンプル不均衡(S&I)問題は、機械学習とデータ分析において大きな課題である。
既存の手法は、基礎となるデータ特性を十分に分析することなくアルゴリズムに依存していることが多い。
我々は、適切なソリューションを開発する前に、データの観点からの詳細な分析が不可欠であると主張する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 01:58:29 GMT)
FaceCraft4D: Animated 3D Facial Avatar Generation from a Single Image [41.6] 1枚の画像から高品質でアニマタブルな4Dアバターを生成するための新しいフレームワークを提案する。
本手法は,様々な視点や表現の整合性を維持しつつ,先行技術よりも優れた品質を実現する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 15:40:14 GMT)
3D Gaussian Head Avatars with Expressive Dynamic Appearances by Compact Tensorial Representations [41.3] 本稿では3次元ガウスのテクスチャ関連属性をテンソル形式でエンコードする表現的かつコンパクトな表現を提案する。
我々は静的な三面体に中性表現の外観を記憶し、軽量な1次元特徴線を用いて異なる表現に対して動的テクスチャの詳細を表現する。
この設計により、リアルタイムレンダリングを維持しながら正確な顔のダイナミックな詳細をキャプチャでき、ストレージコストを大幅に削減できる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 08:50:12 GMT)
Conformalized-KANs: Uncertainty Quantification with Coverage Guarantees for Kolmogorov-Arnold Networks (KANs) in Scientific Machine Learning [40.9] 本研究では,コンフォメーションフリーなUQ手法であるConformalized-KANをKanアンサンブルと統合し,キャリブレーションした予測間隔を保証範囲で生成する手法を提案する。
本稿では,FBKAN (Finite Basis Kans) やMFKAN (MFKANs) など,最近のKansの拡張に対して,共形kan予測が適用可能であることを示す。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:14:05 GMT)
Learning to Reason under Off-Policy Guidance [40.3] LUFFYは、ゼロRLを非政治的推論トレースで拡張するフレームワークである。
LUFFYは、模擬と探検のバランスを取るために、オフ・ポリティクスのデモとオン・ポリティクスのロールアウトを組み合わせる。
LUFFYは6つの数学ベンチマークで平均+7.0以上のゲインを達成し、アウト・オブ・ディストリビューションタスクでは+6.2以上のポイントのアドバンテージを達成している。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 08:09:13 GMT)
Beyond Boundaries: Learning a Universal Entity Taxonomy across Datasets and Languages for Open Named Entity Recognition [40.2] 本稿では, Open NER における LLM の一般化を導くためのコンパクトデータセット B2NERD を提案する。
B2NERDは、既存の54の英語と中国語のデータセットから2段階のプロセスで洗練されている。
総合評価では、B2NERDはLLMのオープンNER能力を著しく向上させる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 04:11:32 GMT)
Breaking Down Quantum Compilation: Profiling and Identifying Costly Passes [40.1] 本稿では,Qiskitにおける量子回路コンパイルプロセスの予備解析を行う。
コンパイル時間全体に最も強い影響を与えるタスクを特定します。
その結果,最適化レベルが向上するにつれて,回路合成とゲートパスが最優先課題であることが示唆された。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 14:45:01 GMT)
Seeing from Another Perspective: Evaluating Multi-View Understanding in MLLMs [40.0] マルチビュー理解は、マルチモーダル大言語モデル(MLLM)において、エンボディエージェントとして使用されるための基本的な課題である。
我々は、90の現実世界のシーンに2,100人以上の注意深い注釈付き質問応答対のベンチマークであるAll-Angles Benchを提案する。
Gemini-2.0-Flash, Claude-3.7-Sonnet, GPT-4o など27のMLLMを人体評価器に対してベンチマークした結果, 性能差は顕著であった。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:59:53 GMT)
IV-Bench: A Benchmark for Image-Grounded Video Perception and Reasoning in Multimodal LLMs [36.8] IV-Benchは、Image-Grounded Video Perception and Reasoningを評価するための最初の包括的なベンチマークである。
IV-Benchは、13のタスクにわたる2,585の微妙な注釈付き画像テキストクエリと組み合わせた967のビデオで構成されている。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 19:53:44 GMT)
Improving Human-AI Coordination through Adversarial Training and Generative Models [36.5] 新たな人間に一般化するには、人間の行動の多様性を捉えたデータに関する訓練が必要である。
敵の訓練は、そのようなデータを検索し、エージェントが堅牢であることを保証するための手段の1つである。
本稿では、事前学習された生成モデルを組み合わせて、有効な協調エージェントポリシーをシミュレートする自己サボタージュを克服するための新しい戦略を提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 21:53:00 GMT)
MoWE-Audio: Multitask AudioLLMs with Mixture of Weak Encoders [36.5] 本稿では,弱いエンコーダの混合物をAudioLLMフレームワークに組み込むことを提案する。
MoWEは、ベースエンコーダに比較的軽量なエンコーダのプールを補足し、音声入力に基づいて選択的にアクティベートし、モデルサイズを大幅に増大させることなく特徴抽出を強化する。
実験の結果,MoWEはマルチタスク性能を効果的に向上し,AudioLLMsの多様なオーディオタスクへの適用性を高めた。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 09:48:05 GMT)
Natural Fingerprints of Large Language Models [36.2] 大規模言語モデル(LLM)は出力にバイアスを示すことが多い。
これらは不公平な反応のような過度な問題から、どのモデルが生成したのかを明らかにする微妙なパターンまで様々である。
LLMの特徴を識別する要因について検討する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 05:48:52 GMT)
SkyReels-V2: Infinite-length Film Generative Model [35.0] Infinite-length Film Generative Model である SkyReels-V2 を提案し,マルチモーダル大言語モデル(MLLM),マルチステージ事前学習,強化学習,拡散強制フレームワークを提案する。
我々は,基本映像生成のためのプログレッシブ・レゾリューション・プレトレーニングを確立し,その後4段階のポストトレーニング強化を行った。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 10:34:50 GMT)
HRAvatar: High-Quality and Relightable Gaussian Head Avatar [34.3] HRAvatarは,高忠実で光沢のある3Dヘッドアバターを再構成する3DGSベースの手法である。
エンドツーエンドの最適化によってトラッキングエラーを低減し、個々の顔の変形をよりよくキャプチャする。
頭部の外観をいくつかの物理的性質に分解し、環境照明を考慮に入れた物理的シェーディングを取り入れている。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 06:29:45 GMT)
DyFo: A Training-Free Dynamic Focus Visual Search for Enhancing LMMs in Fine-Grained Visual Understanding [34.1] 大規模マルチモーダルモデル(LMM)におけるきめ細かい視覚的理解を高める訓練不要なダイナミックフォーカスビジュアルサーチ手法であるDyfo(Dynamic Focus)を提案する。
追加モジュールやデータ収集を必要とする既存のアプローチとは異なり、DyfoはMonte Carlo Tree Search (MCTS)アルゴリズムを使用して、人間のようなフォーカス調整をシミュレートする。
Dyfoは細粒度の視覚的理解を大幅に改善し、LMMの問題を低減し、固定解像度モデルと動的解像度モデルの両方で優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 07:39:29 GMT)
UXAgent: A System for Simulating Usability Testing of Web Design with LLM Agents [33.9] 大規模言語モデルシミュレーションエージェント(textbfLLM Agent)研究の最近の進歩は、textbfUXAgentを設計するきっかけとなった。
システムにはペルソナジェネレータモジュール,LDMエージェントモジュール,ユニバーサルブラウザコネクタモジュールがあり,数千のシミュレーションユーザを自動的に生成する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 05:22:55 GMT)
EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models [32.7] EasyEdit2は、LLM(Large Language Model)の動作を制御するためのプラグインとプレイを可能にするために設計されたフレームワークである。
EasyEdit2は、シームレスなモデルステアリング用に特別に設計された新しいアーキテクチャを備えている。
EasyEdit2の主な利点の1つは、ユーザによる使いやすさが、広範な技術知識を必要としないことである。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 14:33:55 GMT)
Quantum-enhanced second harmonic generation beyond the photon pairs regime [32.7] 2光子相互作用の効率を高めるために絡み合った状態が提案され、低強度で有効性を示す。
量子優位性は、これまで考えられていたよりも、ほぼ1桁高い強度で観測可能であることを示す。
本研究は,量子化二光子プロセスの実用化に向けた可能性を示すものである。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:27:26 GMT)
Solving New Tasks by Adapting Internet Video Knowledge [32.6] 本稿では,ロボットのタスクや設定にまたがる高度な一般化性能を一貫して達成する,逆確率適応と呼ばれる新しい適応戦略を提案する。
ロボット環境全体にわたって、サンプルデータの小さなスケールで強力なビデオモデルを適用することで、新しい行動への一般化を成功させることに成功した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:20:13 GMT)
Exploring Collaborative GenAI Agents in Synchronous Group Settings: Eliciting Team Perceptions and Design Considerations for the Future of Work [31.4] 我々は、協調的なGenAIエージェントが、同期グループ設定におけるチームワークを増強する可能性について検討する。
我々の知見は、うまく設計すれば、協力的なGenAIエージェントがチームの問題解決を強化する貴重な機会をもたらすことを示唆している。
しかし、GenAIエージェントを統合するというチームの意思は、個人、チーム、組織的要因にまたがる、認識された適合性に依存していた。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 00:38:02 GMT)
C2RUST-BENCH: A Minimized, Representative Dataset for C-to-Rust Transpilation Evaluation [31.3] Cプログラムのメモリ安全性問題を解決するためにC-to-Rustトランスパイレーションが普及している。
我々は,大集合から関数を選択する手法を構築し,最小化されているが代表的データセットを構築する。
C2RUST-BENCHは2,905の関数を持ち、C-to-Rustのトランスパイレーションを代表し、現実世界のプログラムの15,503の関数から選択される。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 14:48:45 GMT)
Packing Input Frame Context in Next-Frame Prediction Models for Video Generation [30.8] ビデオ生成のための次フレーム(または次フレーム)予測モデルをトレーニングするためのニューラルネットワーク構造であるFramePackを提案する。
FramePackは入力フレームを圧縮し、ビデオ長に関わらず、トランスフォーマーコンテキスト長を固定数とする。
画像拡散と同様のボトルネックを伴うビデオ拡散を用いて、多数のフレームを処理できる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 08:13:35 GMT)
Audio-Visual Class-Incremental Learning for Fish Feeding intensity Assessment in Aquaculture [29.4] 魚の摂食強度評価(FFIA)は産業用養殖管理において重要である。
最近のマルチモーダルアプローチは、FFIAの堅牢性と効率性を改善することを約束している。
AV-CIL-FFIAは,水養環境下で6種の魚の摂餌強度を計測する81,932個のラベル付き視覚クリップからなる新しいデータセットである。
そして、FFIAのための音声視覚クラスインクリメンタルラーニング(CIL)の先駆者となり、AV-CIL-FFIAのベンチマークにより、単一モダリティ法を著しく上回ることを示す。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 15:24:34 GMT)
Activation-wise Propagation: A Universal Strategy to Break Timestep Constraints in Spiking Neural Networks for 3D Data Processing [29.3] スパイキングニューロンに対する新しい状態更新機構であるAMP2(Activation-wise membrane potential Propagation)を導入する。
深いネットワークで接続をスキップすることで刺激を受け、AMP2はニューロンの膜電位をネットワークに組み込み、反復的な更新を不要にする。
提案手法は,3次元点雲やイベントストリームなど,様々な3次元モードの大幅な改善を実現する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 05:17:15 GMT)
Variational preparation of entangled states in a system of transmon qubits [29.3] 極小校正された2ビットのi-Swap様ゲートを用いてベル状態とGHZ状態を2ビットと3ビットのトランペット量子ビット系で実験的に生成する。
提案手法は変分量子アルゴリズム(VQA)を用いて、不完全なマルチキュービット演算によりターゲット量子状態を生成する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 15:09:23 GMT)
Retrieval Augmented Generation Evaluation in the Era of Large Language Models: A Comprehensive Survey [29.2] Retrieval-Augmented Generation (RAG) は、Large Language Models (LLM) と外部情報検索を統合し、自然言語処理に革命をもたらした。
RAGシステムの評価は、検索と生成コンポーネントを組み合わせたハイブリッドアーキテクチャのため、ユニークな課題を示す。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 06:39:47 GMT)
Generative AI Act II: Test Time Scaling Drives Cognition Engineering [28.8] 2024年現在)は、モデルが知識検索システムからテスト時間スケーリング技術を通じて思考構築エンジンへ移行している場所である。
この新たなパラダイムは、言語に基づく思考を通じて、AIとマインドレベルなつながりを確立する。
包括的なチュートリアルと最適化された実装を通じて、これらの先進的なアプローチを体系的に分解する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 10:38:44 GMT)
Symmetry-Preserving Architecture for Multi-NUMA Environments (SPANE): A Deep Reinforcement Learning Approach for Dynamic VM Scheduling [28.7] マルチNUMA PM(DVAMP)における動的VM割り当て問題について紹介する。
本研究では,問題固有の対称性を生かした新しい強化学習手法であるSPANEを提案する。
Huawei-East-1データセットで実施された実験は、SPANEが既存のベースラインを上回っ、平均VM待ち時間を45%削減していることを示している。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 08:09:40 GMT)
Enhancing Intent Understanding for Ambiguous prompt: A Human-Machine Co-Adaption Strategy [28.6] ユーザのプロンプトと修正中の画像の相互情報を用いた人間機械協調型適応戦略を提案する。
改良されたモデルにより、複数ラウンドの調整の必要性が軽減されることが判明した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 05:35:25 GMT)
VLM as Policy: Common-Law Content Moderation Framework for Short Video Platform [28.5] ショートビデオプラットフォーム(SVP)は、ユーザのメンタルヘルスに有害なコンテンツをモデレートする上で大きな課題に直面している。
既存の方法には限界がある: マニュアルレビューは人間のバイアスを伴い、高い運用コストを発生させる。
これらの課題に対処するため、KuaiModというコモン・ロー・コンテンツ・モデレーション・フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 07:20:19 GMT)
AgentA/B: Automated and Scalable Web A/BTesting with Interactive LLM Agents [28.2] A/Bテストは、ヒトの大規模でライブなトラフィックに依存しているため、依然として制限されている。
本稿では,ユーザインタラクション行動と実際のWebページを自動的にシミュレートする新しいシステムであるAgentA/Bを提案する。
以上の結果から, エージェントA/Bは人間の行動パターンをエミュレートできる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 23:57:49 GMT)
MirrorVerse: Pushing Diffusion Models to Realistically Reflect the World [28.1] 拡散モデルは物理法則に完全に従わないことが多い。
現実世界のパフォーマンスを向上させるために,ミラーフュージョン2.0モデルを開発するための3段階のトレーニングカリキュラムを導入する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 19:01:02 GMT)
Dynamic Graph-Like Learning with Contrastive Clustering on Temporally-Factored Ship Motion Data for Imbalanced Sea State Estimation in Autonomous Vessel [27.7] TGC-SSE(Toral-Graph Contrastive Clustering Sea State Estimator)
TGC-SSEは、データ冗長性を低減するための時間次元分解モジュール、複雑な変数の相互作用をキャプチャする動的グラフのような学習モジュール、クラス不均衡を効果的に管理する対照的なクラスタリング損失関数の3つの重要なコンポーネントを組み合わせた、新しいディープラーニングモデルである。
実験の結果、TGC-SSEは14の公開データセットで既存のメソッドを著しく上回り、EDIよりも20.79%改善され、9つのデータセットで最高精度を達成した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 07:22:11 GMT)
Advancing Embodied Intelligence in Robotic-Assisted Endovascular Procedures: A Systematic Review of AI Solutions [27.7] エボディード・インテリジェンスとロボットシステムの統合は、パラダイムシフトを表している。
データ駆動型アプローチ、高度なコンピュータビジョン、医用画像分析、機械学習技術は、この進化の最前線にある。
知的知覚とデータ駆動制御の最近の進歩とロボット支援手順における実践的応用について論じる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 13:49:30 GMT)
Tree of Attributes Prompt Learning for Vision-Language Models [27.6] 視覚とテキストのプロンプトトークンを用いて階層構造を学習するためのTAP(Tree of Attributes Prompt Learning)を提案する。
非構造化記述の集合で単にカテゴリ名を拡大する既存の方法とは異なり、本手法は基本的に構造化知識グラフを蒸留する。
提案手法は,ゼロショットのベース・ツー・ノーベル一般化,クロスデータセット転送,および11の多様なデータセットの少数ショット分類において,最先端の手法よりも優れている。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 15:37:50 GMT)
RealisDance-DiT: Simple yet Strong Baseline towards Controllable Character Animation in the Wild [27.2] Wan-2.1ビデオ基盤モデルに基づくRealisDance-DiTを紹介する。
基礎モデルアーキテクチャへの最小限の変更が驚くほど強力なベースラインを生み出すことを実証する。
さらに、さまざまな現実世界の課題をキャプチャする新しいテストデータセットも導入しています。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 09:09:21 GMT)
Enhancing Low-Cost Video Editing with Lightweight Adaptors and Temporal-Aware Inversion [26.6] 本稿では,時間空間的・意味的一貫性をBaliteral DDIMインバージョンと統合するフレームワークを提案する。
MSR-VTTデータセットで示すように,本手法は知覚品質,テキスト画像アライメント,時間的コヒーレンスを大幅に改善する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 05:14:31 GMT)
SCORE: Story Coherence and Retrieval Enhancement for AI Narratives [26.6] SCOREはストーリーコヒーレンスと検索の強化のためのフレームワークである。
主要なアイテムのステータスを追跡し、エピソードの要約を生成する。
TF-IDFとコサイン類似性を取り入れ、関連するエピソードを特定し、全体のストーリー構造を強化する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 05:40:00 GMT)
LLM Agents That Act Like Us: Accurate Human Behavior Simulation with Real-World Data [26.5] 近年の研究では、LSMは人間の行動をシミュレートして、プロンプトのみの手法でLSMエージェントに電力を供給できることが示されている。
我々は Web アクション生成タスクにおいて,主観的信頼性よりも LLM の客観的精度を評価することに注力する。
本稿では,Web アクション生成タスクにおける最先端 LLM の総合的定量的評価について述べる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 05:12:56 GMT)
Some Optimizers are More Equal: Understanding the Role of Optimizers in Group Fairness [26.5] 提案アルゴリズムがディープニューラルネットワークにおけるグループフェアネスにどう影響するかについて検討する。
最適化の選択は、特に厳密な不均衡の下での公正な結果に実際に影響を及ぼすことを示す。
本研究は,公正な成果を促進するための重要なメカニズムとして,適応的更新の役割を強調した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 06:20:50 GMT)
MoBGS: Motion Deblurring Dynamic 3D Gaussian Splatting for Blurry Monocular Video [26.5] MoBGSは、ぼやけたモノクロビデオから端から端まで、シャープで高品質なビューを再構築する。
本稿では,Blur-Adaptive Latent Camera Estimation (BLCE)法を提案する。
また,大域カメラと局所物体の動きの連続的な劣化を確実にするためのLCEE法を提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 14:19:19 GMT)
TSceneJAL: Joint Active Learning of Traffic Scenes for 3D Object Detection [26.1] TSceneJALフレームワークはラベル付きデータとラベルなしデータの両方から、バランスのとれた、多様性のある、複雑なトラフィックシーンを効率的にサンプリングすることができる。
提案手法は,3次元オブジェクト検出タスクにおける既存の最先端手法よりも12%向上した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 06:15:33 GMT)
Bare Minimum Mitigations for Autonomous AI Development [26.0] 2024年、チューリング賞受賞者を含む国際的な科学者は、自律的なAI研究と開発によるリスクについて警告した。
自律型AIR&Dの具体的なリスク、その発生方法、その緩和方法について、限定的な分析がなされている。
我々は、AIエージェントがAI開発を著しく自動化または加速する場合に適用可能な4つの最小限のセーフガードレコメンデーションを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 20:01:17 GMT)
Stop Summation: Min-Form Credit Assignment Is All Process Reward Model Needs for Reasoning [25.8] プロセス報酬モデル(PRM)は、大規模言語モデル(LLM)のテストタイムスケーリングにおいて、困難な推論タスクにおいて有効であることが証明されている。
しかしながら、PRMによる報酬ハッキング問題は、強化微調整における彼らの成功を制限している。
本稿では,PRMによる報酬ハッキングの主な原因を,強化学習における正準和形信用代入として同定する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:59:02 GMT)
Acquire and then Adapt: Squeezing out Text-to-Image Model for Image Restoration [25.7] 我々は、よく訓練された大きなT2Iモデル(すなわち、Flux)が、現実世界の分布に合わせて様々な高品質な画像を生成することができることを発見した。
また、Diffusion Transformer (DiT) ベースのT2Iモデルを制御するために、圧縮・励起層を持つ新しい軽量アダプタ (FluxIR) も慎重に設計されている。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 15:05:22 GMT)
Learning Self-Growth Maps for Fast and Accurate Imbalanced Streaming Data Clustering [24.5] 自己成長マップ(SGM)は、局所分布に応じてニューロンを必要に応じて自動的に配置することができる。
比較的大きなクラスターを分解するニューロンを結合するために、高速な階層的なマージ戦略。
自己グラフマップ誘導型非平衡データクラスタリング(SOHI)アプローチのための階層的マージは、真の数の不均衡クラスタを迅速に探索することができる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 08:07:50 GMT)
BlendRL: A Framework for Merging Symbolic and Neural Policy Learning [23.9] BlendRLは、論理とニューラルポリシーの混合を使用するRLエージェントに両方のパラダイムを統合する、ニューラルシンボリックなRLフレームワークである。
我々は,BlendRLエージェントが標準アタリ環境において,ニューラルベースラインとシンボリックベースラインの両方より優れていることを実証的に実証した。
ニューラルポリシーとシンボリックポリシーの相互作用を分析し、それらのハイブリッド利用がエージェントの制限を克服するのにどのように役立つかを説明する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:49:31 GMT)
BadApex: Backdoor Attack Based on Adaptive Optimization Mechanism of Black-box Large Language Models [23.6] 従来の挿入方式のバックドアは攻撃効果に大きな成功を収めたが、毒性のあるテキストとクリーンなテキスト間のテキスト品質とセマンティック一貫性は無視されている。
ブラックボックス大言語モデル(BadApex)の適応最適化機構に基づく新しいバックドア攻撃を提案する。
6つのバックドアアタックと2つのディフェンスによる3つのデータセットに対する広範な実験を行った。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 03:12:50 GMT)
A Self-Improving Coding Agent [23.4] SWE Bench Verifiedのランダムなサブセットでは,パフォーマンスが17%から53%向上した。
我々の研究は、エージェントシステムの自動化およびオープンエンド設計の進歩を表している。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:58:18 GMT)
How Does Critical Batch Size Scale in Pre-training? [23.3] クリティカルバッチサイズ(CBS)は、データ並列化がリターンを減少させるしきい値である。
C4データセット上で,CBSと自動回帰言語モデルを事前学習する手法を提案する。
この結果から,CBSはモデルサイズではなく,データサイズでスケールすることが示唆された。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 04:19:56 GMT)
Rhythm of Opinion: A Hawkes-Graph Framework for Dynamic Propagation Analysis [23.3] 本稿では,多次元ホークスプロセスとグラフニューラルネットワークを統合する革新的な手法を提案する。
拡張多次元ホークス過程は、階層構造、多次元相互作用、および異なるトピック間の相互影響をキャプチャする。
我々は、47,207の投稿、327015、第2レベルのコメント、29,578の第三レベルのコメントに対応する159のトレンドトピックを含む、新しいデータセットであるVISTAを紹介した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 13:02:30 GMT)
StyleMe3D: Stylization with Disentangled Priors by Multiple Encoders on 3D Gaussians [23.1] StyleMe3Dは3D GSスタイルの転送のための総合的なフレームワークである。
マルチモーダルスタイルのコンディショニング、マルチレベルセマンティックアライメント、知覚的品質向上を統合している。
この作品は、フォトリアリスティックな3D GSと芸術的なスタイリング、ゲーム、バーチャルワールド、デジタルアートのアンロックを橋渡しする。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:59:55 GMT)
Towards Optimal Heterogeneous Client Sampling in Multi-Model Federated Learning [22.8] フェデレーション学習により、エッジデバイスは、ローカルデータを共有せずに、協力的にモデルをトレーニングできる。
クライアントは複数の無関係なFLモデルをトレーニングする必要があるかもしれないが、通信制約はすべてのモデルを同時にトレーニングする能力を制限する。
本稿では,サーバにおける通信制限を明示的に尊重しつつ,トレーニングのばらつきを最小限に抑えた損失ベースサンプリング手法MMFL-LVRを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:13:21 GMT)
DONOD: Robust and Generalizable Instruction Fine-Tuning for LLMs via Model-Intrinsic Dataset Pruning [22.7] 大規模言語モデル(LLM)のアドホック命令の微調整は、ドメイン固有の適応に広く採用されている。
本研究では,軽量なモデル固有データ解析手法であるDONODを提案する。
完全なデータセットの70%をフィルタリングすることで、ターゲットドメインの精度を14.90%、クロスドメインの精度を5.67%向上させる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 02:25:03 GMT)
Hierarchical and Step-Layer-Wise Tuning of Attention Specialty for Multi-Instance Synthesis in Diffusion Transformers [22.3] テキスト・ツー・イメージ(T2I)生成モデルは、しばしばMIS(Multi-instance synthesis)と競合する。
UNetアーキテクチャの従来のMIS制御方法は、DiTベースのモデルに適合しない。
DiTモデルにおけるMIS向上のためのトレーニング不要アプローチを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 03:29:53 GMT)
Embedding Ontologies via Incorporating Extensional and Intensional Knowledge [22.1] オントロジーはドメイン内の豊富な知識を含み、拡張的知識と強迫的知識という2つのカテゴリに分けられる。
既存のオントロジの埋め込みアプローチは、拡張的知識と集約的知識の両方を同時に考慮することができない。
本研究では,拡張空間と拡張空間という2つの空間におけるオントロジーを表現することで,EIKE(Extensional and Intensional Knowledge Embedding)を提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 15:58:38 GMT)
Enhancing the Patent Matching Capability of Large Language Models via the Memory Graph [22.0] 本稿では,大規模言語モデルの特許マッチング機能を強化する手法であるMemGraphを提案する。
MemGraph は LLM に特許内の関連エンティティを識別するよう促し、続いてそれらのエンティティを対応するエンティティに帰属させる。
PatentMatchデータセットの実験結果は、MemGraphの有効性を示し、ベースラインLLMよりも17.68%改善された。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 03:56:56 GMT)
Completing A Systematic Review in Hours instead of Months with Interactive AI Agents [21.9] 我々は、大規模な言語モデルを利用した人間中心の対話型AIエージェントInsightAgentを紹介する。
InsightAgentは意味論に基づく大規模な文献コーパスを分割し、より焦点を絞った処理にマルチエージェント設計を採用する。
9人の医療専門家によるユーザスタディでは、可視化と相互作用機構が合成SRの品質を効果的に向上することを示した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 02:57:23 GMT)
Hierarchical Split Federated Learning: Convergence Analysis and System Optimization [21.6] 我々は,多層システム下での分割フェデレーション学習(SFL)の学習性能を解析し,最適化する。
モデル分割(MS)とモデル集約(MA)の合同最適化問題を定式化する。
シミュレーションの結果,任意のマルチ層システムにおいて,SFLのMSとMAを効果的に最適化できることが示された。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 06:52:09 GMT)
Stitching Inner Product and Euclidean Metrics for Topology-aware Maximum Inner Product Search [21.3] 我々は、Metric-Amphibious Graph(MAG)と呼ばれる新しいグラフベースのインデックスと、それに対応する検索アルゴリズムAdaptive Navigation with Metric Switch(ANMS)を導入する。
これらの知見に基づいて,Metric-Amphibious Graph (MAG) とそれに対応する検索アルゴリズムAdaptive Navigation with Metric Switch (ANMS) を導入した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 05:01:58 GMT)
Event Quality Score (EQS): Assessing the Realism of Simulated Event Camera Streams via Distances in Latent Space [20.5] イベントカメラは、低レイテンシ、高ダイナミックレンジ、非同期なイベントの性質でビジョンセンシングのパラダイムシフトを約束する。
本稿では,RVTアーキテクチャのアクティベーションを利用した品質指標であるイベント品質スコア(EQS)を紹介する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 01:04:58 GMT)
Roll the dice & look before you leap: Going beyond the creative limits of next-token prediction [20.4] 我々は、オープンエンドの現実世界のタスクを緩やかに抽象化した、最小限のアルゴリズムタスクスイートを設計する。
私たちの仕事は、オープンエンドのクリエイティブスキルを分析するために、原則として最小限のテストベッドを提供します。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:47:46 GMT)
Insert Anything: Image Insertion via In-Context Editing in DiT [19.7] 本稿では,参照画像からのオブジェクトをフレキシブルかつユーザ指定の制御ガイダンスの下でシームレスに統合する参照ベース画像挿入のための統一的なフレームワークを提案する。
私たちのアプローチは、新しいAnyInsertionデータセット(人、オブジェクト、衣服の挿入など、さまざまなタスクをカバーする120Kプロンプトイメージペア)で一度トレーニングされます。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 10:19:12 GMT)
Hierarchical Attention Fusion of Visual and Textual Representations for Cross-Domain Sequential Recommendation [19.7] クロスドメインシークエンシャルレコメンデーション(CDSR)は、複数のドメインにわたる歴史的なインタラクションを活用することで、ユーザの振る舞いを予測する。
本稿では,視覚的・テキスト的表現の階層的意図融合(HAF-VT)を提案する。
階層的な注意機構は、人間の情報統合を模倣して、単一ドメインとクロスドメインの好みを共同で学習する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 13:18:54 GMT)
The Iterative Chainlet Partitioning Algorithm for the Traveling Salesman Problem with Drone and Neural Acceleration [19.4] ドローンによるトラベリングセールスマン問題(TSP-D)解決のための反復連鎖分割(ICP)アルゴリズムとそのニューラルネットワーク
ICPは、ソリューションの品質と計算時間の両方で、既存のアルゴリズムより優れています。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 14:51:15 GMT)
Preconditioned Gradient Descent for Overparameterized Nonconvex Burer--Monteiro Factorization with Global Optimality Certification [19.3] 非函数 $f(X)=phi(XXT)$ を$ntimes r$ factor matrix $X$ で最小化するために勾配降下を考える。
本稿では,勾配降下の収束率を線形に戻すための安価なプレコンディショナーを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 13:14:04 GMT)
Fast Adversarial Training with Weak-to-Strong Spatial-Temporal Consistency in the Frequency Domain on Videos [19.3] Video Fast Adversarial Training with Weak-to-Strong consistency (VFAT-WS) は、ビデオデータに対する最初の高速な対向訓練法である。
直接的かつ効果的な時間周波数増強(TF-AUG)と、その時空間増強形STF-AUGを統合する。
敵の堅牢性と腐敗の堅牢性を大幅に向上させ、訓練を約490%加速させる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 07:40:35 GMT)
Can LLMs Replace Human Evaluators? An Empirical Study of LLM-as-a-Judge in Software Engineering [18.8] 大規模言語モデル(LLM)は、コード生成のような様々なソフトウェアエンジニアリング(SE)タスクに取り組むためにデプロイされている。
Pass@kメトリックは、広範囲なユニットテストと設定された環境を必要とし、LLM生成したテキストの評価には適していない。
BLEUのような従来のメトリクスは、意味的類似性ではなく語彙のみを測定するが、精査されている。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 08:41:21 GMT)
Characterizing Knowledge Manipulation in a Russian Wikipedia Fork [18.6] 最近ローンチされたウェブサイトRuwikiは、ロシアの法律に従ってオリジナルのウィキペディアのコンテンツをコピーして修正した。
この記事では、このロシアのウィキペディアのフォークを詳細に分析する。
本論文では,原版に対する主な変更を特徴付ける手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 05:07:13 GMT)
Scene4U: Hierarchical Layered 3D Scene Reconstruction from Single Panoramic Image for Your Immerse Exploration [18.2] 本研究では,パノラマ画像を用いた新しい3次元シーン再構築フレームワークScene4Uを提案する。
具体的には、Scene4Uはオープン語彙セグメンテーションモデルと大きな言語モデルを統合して、実際のパノラマを複数の層に分解する。
次に、拡散モデルに基づく階層化された修復モジュールを用いて、視覚的手がかりと深度情報を用いて隠蔽領域を復元し、シーンの階層的表現を生成する。
Scene4Uは最先端の手法より優れ、LPIPSでは24.24%、BRISQUEでは24.40%向上し、訓練速度も最速となった。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 02:40:21 GMT)
What Lurks Within? Concept Auditing for Shared Diffusion Models at Scale [18.1] 拡散モデル(DM)はテキスト・画像生成に革命をもたらし、テキスト・プロンプトから高度にリアルでカスタマイズされた画像を作成することができる。
オープンプラットフォーム上で細調整されたDMが広く共有されることは、倫理的および法的懸念を増大させる。
本稿では,新しいモデル中心の概念監査フレームワークであるPrompt-Agnostic Image-Free Auditing(PAIA)を紹介する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 02:44:59 GMT)
Intrinsic Barriers to Explaining Deep Foundation Models [18.0] ディープ・ファンデーション・モデル(DFM)は前例のない機能を提供しますが、その複雑さが増すと、内部の作業を理解する上で大きな課題が生じます。
本稿では,DFMの基本的特性を検証し,現在の説明可能性法が抱える限界を精査することによって,この問題を考察する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 21:19:23 GMT)
Active Learning for Continual Learning: Keeping the Past Alive in the Present [17.7] 本稿では,累積情報量に基づくアクティブ連続学習であるAccuACLを提案する。
我々は、AcuACLが様々なCLアルゴリズムでALベースラインを大幅に上回っていることを示す。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 07:58:09 GMT)
HiddenDetect: Detecting Jailbreak Attacks against Large Vision-Language Models via Monitoring Hidden States [17.6] 本研究は,LVLMが内的アクティベーションにおける安全性関連信号を本質的にエンコードしているかどうかを考察する。
その結果,LVLMは安全でないプロンプトを処理する際に,異なる活性化パターンを示すことが明らかとなった。
HiddenDetectは、内部モデルのアクティベーションを活用して安全性を高める、新しいチューニング不要のフレームワークである。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:41:37 GMT)
Measuring Interest Group Positions on Legislation: An AI-Driven Analysis of Lobbying Reports [17.4] 米国における特別利害団体(SIG)は、立法・行政部門における政策決定に影響を与える様々な政治活動に参加している。
SIGの政策姿勢を理解することの重要性にもかかわらず、それらの観察における経験的課題は、研究者が間接的な測定に頼ることになった。
本研究は,広範囲の請求所の位置を直接測定し,予測するための最初の大規模取り組みを紹介する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:54:47 GMT)
Establishing Reliability Metrics for Reward Models in Large Language Models [17.3] 人間の嗜好を表す報酬モデル(RM)は、大規模言語モデル(LLM)の出力を最適化する上で重要な役割を果たす。
我々は、RMの信頼性を測定するために、アンダーライン$eta$ (RETA) メトリックで itunderlineReliable を提案する。
RETAの上には、Oracleのラベル付けコストを発生させることなく、誰でも自身のRMを評価することができる統合ベンチマークパイプラインがあります。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 03:39:33 GMT)
Accelerating Goal-Conditioned RL Algorithms and Research [17.2] 自己指導型目標条件強化学習(GCRL)エージェントは、環境との非構造的相互作用において達成された目標から学習することで、新しい行動を発見する。
これらの手法は、低速環境シミュレーションのデータ不足や安定したアルゴリズムの欠如により、同様の成功は得られていない。
我々は、自制的なGCRLのためのベンチマーク(JaxGCRL)をリリースし、研究者は単一のGPU上で数百万の環境ステップでエージェントを訓練することができる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 11:10:56 GMT)
Values in the Wild: Discovering and Analyzing Values in Real-World Language Model Interactions [17.0] 我々は、経験的に3,307のAI値を発見・分類し、それらがどのように異なるかを研究する。
私たちの研究は、AIシステムにおける価値のより基礎的な評価と設計のための基盤を作りました。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:13:16 GMT)
Training on the Test Task Confounds Evaluation and Emergence [16.3] テストタスクのトレーニングは、相対モデル評価と創発的能力に関するクレームの両方に矛盾があることを示します。
ベンチマーク評価において,テストタスクに対するトレーニングの効果を効果的に調整する手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:43:00 GMT)
Cyc3D: Fine-grained Controllable 3D Generation via Cycle Consistency Regularization [16.2] nameは、生成された3Dコンテンツと入力制御の間の循環的な一貫性を促進することで、制御可能な3D生成を促進する。
emphViewの一貫性は、2つの生成された3Dオブジェクト間のコヒーレンスを保証する。
emphCondition整合性は、最終的な抽出信号と元の入力制御とを整合させ、構造的または幾何学的詳細を保存する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 09:05:52 GMT)
Revealing the 3D Cosmic Web through Gravitationally Constrained Neural Fields [15.6] 弱い重力レンズは、主に宇宙におけるダークマターの重力効果によって引き起こされる銀河形状のわずかな歪みである。
我々は、宇宙の暗黒物質場の3次元マップを再構成するために、2次元の望遠鏡画像から弱いレンズ信号を反転させようとする。
本稿では, 連続物質分布を柔軟にモデル化するために, 重力拘束型ニューラルネットワークを用いた手法を提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:43:21 GMT)
"Ohhh, He's the Boss!": Unpacking Power Dynamics Among Developers, Designers, and End-Users in FLOSS Usability [15.4] 我々は、異なるFLOSS利害関係者の力がどのように現れ、コラボレーション中に仲介されるかを探求する。
主要なFLOSS利害関係者の異なる組み合わせによる8つのデザインワークショップを実施しました。
この結果は,FLOSS利害関係者間のパワーダイナミクスの包括的理解に寄与する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 23:52:03 GMT)
STI-Bench: Are MLLMs Ready for Precise Spatial-Temporal World Understanding? [15.4] MLLM(Multimodal Large Language Models)は、Embodied AIとAutonomous Drivingのためのエンドツーエンドソリューションである。
MLLMの時空間的理解を評価するためのベンチマークであるSTI-Benchを紹介する。
私たちのベンチマークでは、デスクトップ、屋内、屋外のシナリオにまたがる幅広いロボットと車両の操作を網羅しています。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 13:43:53 GMT)
DualBreach: Efficient Dual-Jailbreaking via Target-Driven Initialization and Multi-Target Optimization [15.2] 本稿では,デュアルジェイルブレークのためのターゲット駆動型フレームワークであるDualBreachを提案する。
ブラックボックスガードレールでは、DualBreachは強力なオープンソースガードレールを使用するか、プロキシモデルをトレーニングすることでターゲットのブラックボックスガードレールを模倣する。
広範に使用されているデータセットを広範囲に評価することにより,デュアルジェイルブレークシナリオにおけるDualBreachの有効性を実証する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 11:30:30 GMT)
CRAVE: A Conflicting Reasoning Approach for Explainable Claim Verification Using LLMs [15.2] CRAVE は、説明可能なクレーム VErification に対する Conflicting Reasoning Approach である。
大規模な言語モデルによって推論される矛盾する理性に基づいて、複雑なクレームを検証することができる。
CRAVEは最先端の手法よりもはるかに優れた性能を実現している。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 07:20:31 GMT)
See or Recall: A Sanity Check for the Role of Vision in Solving Visualization Question Answer Tasks with Multimodal LLMs [13.3] MLLMがどのように可視化について認識し、理由を判断するかは、人間が同じ問題にどのようにアプローチするかと根本的に異なる。
規則に基づく決定木と正当性チェックテーブルを統合した包括的正当性チェックフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 20:52:11 GMT)
LangCoop: Collaborative Driving with Language [13.3] LangCoopは、自然言語をエージェント間通信のためのコンパクトで表現力のある媒体として活用する、協調自律運転の新しいパラダイムである。
LangCoopは、画像ベースの通信に比べて、通信帯域幅(メッセージあたり2KB)が96%減少している。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 02:00:43 GMT)
"I Know It When I See It": Mood Spaces for Connecting and Expressing Visual Concepts [13.2] 提案するMood Boardでは,属性変化の意図した方向を示唆する例で抽象概念を伝達する。
我々は,無関係な特徴を判断する基盤となるMood Spaceを計算し,2)画像間の接続を見つけ,関連する概念をより深くする。
私たちの学習は微調整なしで計算に効率的であり、ほんの数(2~20)の模範しか必要とせず、学習に1分もかからない。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 14:49:15 GMT)
Bridge the Gap: From Weak to Full Supervision for Temporal Action Localization with PseudoFormer [13.2] 弱いWTALと完全に教師されたWTALのギャップを埋める新しいフレームワークであるPseudoFormerを提案する。
RickerFusionは、予測されたすべてのアクション提案をグローバルな共有スペースにマッピングし、より良い品質で擬似ラベルを生成する。
弱いブランチと異なる事前のスニペットレベルのラベルとプロポーザルレベルのラベルを使って、フルブランチで回帰ベースのモデルをトレーニングします。
PseudoFormer は THUMOS14 と ActivityNet1.3 の2つのベンチマークで最先端の WTAL を達成している。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 05:00:07 GMT)
LAPP: Large Language Model Feedback for Preference-Driven Reinforcement Learning [13.0] LAPP(Large Language Model-Assisted Preference Prediction)は、ロボット学習のための新しいフレームワークである。
LAPPは、人間の最小限の努力で効率的、カスタマイズ可能、表現力のある行動獲得を可能にする。
LAPPは効率的な学習、高い最終性能、より高速な適応、高レベルの動作の正確な制御を実現する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 22:46:29 GMT)
FROG: Effective Friend Recommendation in Online Games via Modality-aware User Preferences [12.9] 本研究では,友達の好みをモデル化するエンド・ツー・エンドモデルFROGを提案する。
Tencentのオフライン評価とオンラインデプロイメントに関する総合的な実験は、既存のアプローチよりもFROGの方が優れていることを示した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 14:37:39 GMT)
Linear Item-Item Model with Neural Knowledge for Session-based Recommendation [12.5] セッションベースレコメンデーション(SBR)は、セッション内での短期的なインタラクションをモデル化することによって、ユーザのその後のアクションを予測することを目的としている。
本稿では,2種類の知識を統一線形フレームワークに統合した新しいSBRモデル,すなわち線形項目モデルとニューラル知識(リンク)を提案する。
Linkは6つの実世界のデータセットで最先端の線形SBRモデルより優れています。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 12:34:57 GMT)
Listenable Maps for Zero-Shot Audio Classifiers [12.4] 我々はZero-Shotコンテキストで初めてLMAC-Z(Listenable Maps for Audio)を紹介した。
提案手法は,異なるテキストプロンプトとよく相関する有意義な説明を生成する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 21:31:21 GMT)
A Deep Learning Framework for Sequence Mining with Bidirectional LSTM and Multi-Scale Attention [12.0] 本稿では、複雑なシーケンスデータにおける潜在パターンのマイニングとコンテキスト依存のモデル化の課題に対処する。
Bidirectional Long Short-Term Memory (BiLSTM) とマルチスケールアテンション機構を組み合わせたシーケンスパターンマイニングアルゴリズムを提案する。
BiLSTMはシーケンスの前方および後方の依存関係をキャプチャし、グローバルなコンテキスト構造を知覚するモデルの能力を高める。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:53:02 GMT)
Fine-tuning a Large Language Model for Automating Computational Fluid Dynamics Simulations [11.9] 大規模言語モデル(LLM)は高度な科学計算を持ち、CFDでの使用は自動化されている。
ドメイン固有LLM適応に着目した新しいアプローチを提案する。
マルチエージェントフレームワークはプロセスをオーケストレーションし、入力を自律的に検証し、構成を生成し、シミュレーションを実行し、エラーを修正する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 07:04:57 GMT)
Enhancing Efficiency in Multidevice Federated Learning through Data Selection [11.7] 我々は、デバイス上のデータ選択をエッジに組み込むために、Centaurというフェデレーション学習フレームワークを開発した。
画像データとウェアラブルセンサ時系列を含む5つのニューラルネットアーキテクチャと6つのデータセットをベンチマークする。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 14:43:18 GMT)
A Framework for Evaluating Emerging Cyberattack Capabilities of AI [11.6] 本研究は,(1)エンド・ツー・エンド・エンド・アタック・チェーンの検証,(2)AI脅威評価のギャップの同定,(3)目標とする緩和の優先順位付けを支援する,という制約に対処する新たな評価フレームワークを導入する。
我々は、GoogleのThreat Intelligence Groupがカタログ化したサイバーインシデントにAIが関与した12,000件以上の実世界の事例を分析し、7つの代表的なアタックチェーンのアーキタイプをキュレートした。
我々は、特定の攻撃段階にわたって攻撃能力を増幅するAIの可能性について報告し、防御の優先順位付けを推奨する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 19:22:25 GMT)
A Causal Convolutional Low-rank Representation Model for Imputation of Water Quality Data [11.6] 本稿では,WQDの完全性を向上するために,WQDの欠落を示唆するCausal Convolutional Low-rank Representation(CLR)モデルを提案する。
3つの実世界の水質データセットに関する実験的研究は、提案されたCLRモデルが既存の最先端の計算モデルよりも優れていることを示した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:27:16 GMT)
MoE Parallel Folding: Heterogeneous Parallelism Mappings for Efficient Large-Scale MoE Model Training with Megatron Core [11.6] 大規模MOEモデルのエンドツーエンドトレーニングフレームワークを提案する。
MoE Parallel Foldingは、Transformerモデルにおける注目とMoEの並列化を分離する新しい戦略である。
フレキシブルなトークンレベルディスパッチはトークンドロップとトークンドロップレスのMoEトレーニングの両方をサポートする。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 08:39:47 GMT)
An Information-theoretic Security Analysis of Honeyword [11.5] ハニーワード(Honeyword)は、敵を誤解させ、本物を守るためにデコイオブジェクトを使用する代表的"ハニー"技法である。
ハニーワードシステムのセキュリティを評価するために、様々なシミュレートされた攻撃者を用いて2つの指標(平坦性と成功数)が提案され、評価されている。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 11:44:15 GMT)
A Security Framework for General Blockchain Layer 2 Protocols [11.3] 本稿では、Layer 2 (L2)プロトコルの最初の一般的なセキュリティフレームワークを示す。
我々のフレームワークはIITMベースのUniversal Composability(iUC)フレームワークをベースにしています。
我々は,3つの主要なL2スケーリングパラダイム – 支払いチャネル(Brick),サイドチェーン(Liquid Network),ロールアップ(Arbitrum) – のそれぞれから,その例を分析した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 08:48:24 GMT)
IoT-AMLHP: Aligned Multimodal Learning of Header-Payload Representations for Resource-Efficient Malicious IoT Traffic Classification [10.9] トラフィックの分類はIoT(Internet of Things)ネットワークの確保に不可欠である。
ディープラーニングに基づく手法は、大規模なネットワークトラフィックから潜在パターンを自律的に抽出することができる。
既存のメソッドはフローレベル機能か生のパケットバイト機能に大きく依存している。
本稿では、リソース効率の悪いIoTトラフィック分類のための協調型マルチモーダル学習フレームワークであるIoT-AMLHPを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 03:24:14 GMT)
CSI2Dig: Recovering Digit Content from Smartphone Loudspeakers Using Channel State Information [10.9] 本稿では,CSI2Dig方式を提案する。CSI(Channel State Information)では,スマートフォンのスピーカを介して文字を再生する。
我々は、スピーカからの音声信号による電磁波干渉が、携帯電話のWiFiアンテナから放射されるWiFi信号に影響を与えることを観察する。
特徴抽出には,CSIデータの時間次元と空間次元の両方から関連する特徴をキャプチャするTS-Netを導入する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 02:31:19 GMT)
Potential Societal Biases of ChatGPT in Higher Education: A Scoping Review [10.8] 生成人工知能(GAI)モデル(ChatGPTなど)は、広範なデータセットのトレーニングによって社会的バイアスを継承または増幅することができる。
高等教育機関(HEIs)における学生、教員、職員のGAI利用の増加に伴い、これらの技術に関連する倫理的問題や潜在的なバイアスについて検討することが急務である。
このスコーピングレビューは,近年の学術出版物において,GAIに関連するバイアスがどのように研究され,議論されているかを明らかにすることを目的としている。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:33:14 GMT)
MaCTG: Multi-Agent Collaborative Thought Graph for Automatic Programming [10.5] MaCTG (MultiAgent Collaborative Thought Graph) は動的グラフ構造を用いる新しいマルチエージェントフレームワークである。
プログラム要求に基づいてエージェントロールを自律的に割り当て、タスクの分散を動的に洗練し、プロジェクトレベルのコードを体系的に検証し統合する。
MaCTGは既存のマルチエージェントフレームワークと比較して運用コストを89.09%削減した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 04:40:38 GMT)
Bringing Diversity from Diffusion Models to Semantic-Guided Face Asset Generation [10.4] 本研究の目的は、意味的に制御可能な生成ネットワークが、デジタル顔モデリングプロセスの制御を強化できることを実証することである。
本稿では,事前学習した拡散モデルを用いて,高品質な3次元顔データベースを作成する新しいデータ生成パイプラインを提案する。
高品質な顔アセットを作成・編集するための包括的システムを導入する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:38:50 GMT)
DistilQwen2.5: Industrial Practices of Training Distilled Open Lightweight Language Models [10.3] 一般向けQwen2.5モデルから派生した蒸留軽量言語モデル(LLM)のファミリーであるDistilQwen2.5を紹介する。
これらのモデルは、オリジナルのモデルと比較して、強化された命令追従能力を示す。
実用的な使用を容易にするため、DistilQwen2.5のモデルをオープンソースコミュニティにリリースしました。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 11:26:02 GMT)
Large-Scale Contextual Market Equilibrium Computation through Deep Learning [10.3] 本稿では,市場均衡を近似する深層学習方式であるMarketFCNetを紹介する。
MarketFCNetは,既存の手法と比較して,競争性能と実行時間を大幅に低下させることを示す。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 05:15:17 GMT)
Tell Me What You Know About Sexism: Expert-LLM Interaction Strategies and Co-Created Definitions for Zero-Shot Sexism Detection [10.2] 本稿では、性差別研究者と大規模言語モデル(LLM)のハイブリッドインテリジェンスと協調について検討する。
9人の性差別研究者が性差別とLSMの知識について質問に答えている。
その後、LLMを含む2つのインタラクティブな実験に参加する。
第2の実験では、性差別の3つの異なる定義を創りだす。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:59:18 GMT)
Dual Utilization of Perturbation for Stream Data Publication under Local Differential Privacy [10.1] ローカルディファレンシャルプライバシ(LDP)が有望な標準として登場した。
ストリームデータにLDPを適用することは、大きなあるいは無限の値を含む場合が多いため、大きな課題となる。
本稿では、電流摂動結果を用いてその後の摂動過程を校正する反復摂動IPP法を提案する。
これら3つのアルゴリズムが差分プライバシーを$w$-eventで満たし、実用性を大幅に向上することを証明する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 09:51:18 GMT)
Efficient Function Orchestration for Large Language Models [10.1] 本稿では,大規模言語モデルにおける並列関数自動呼び出しのための高度なフレームワークであるLLMOrchを紹介する。
LLMOrchの鍵となる原則は、関数呼び出しを実行するために利用可能なプロセッサを特定することである。
最先端技術と比較すると、LLMOrchはI/O集約関数のオーケストレーションにおいて同等の効率向上を示した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 05:57:34 GMT)
Breast density in MRI: an AI-based quantification and relationship to assessment in mammography [7.8] マンモグラフィーの乳腺密度は乳がんのリスク因子として確立されている。
近年,乳房MRIはマンモグラフィーの補助として注目されている。
そこで本研究では, 3つのMRIデータセットを用いて, 正常乳房の乳房密度を評価するために, 社内機械学習アルゴリズムを適用した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:01:51 GMT)
Understanding the Perceptions of Trigger Warning and Content Warning on Social Media Platforms in the U.S [7.8] ソーシャルメディア上での苦痛を伴うコンテンツの普及は、ユーザの精神的幸福に対する懸念を喚起する。
ソーシャルメディア利用者15名を対象に半構造化インタビューを行った。
この結果から,3つの主要な利害関係者の課題が明らかになった。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 20:46:48 GMT)
TVR: Automotive System Requirement Traceability Validation and Recovery Through Retrieval-Augmented Generation [7.5] 利害関係者の要求とシステム要件の間のトレーサビリティは、一貫性、正確性、規制の遵守を保証するために不可欠である。
既存のアプローチは、ステークホルダーとシステム要件の間のトレーサビリティに対処せず、オープンソースデータに依存し、エンジニアが確立した手動リンクの検証に対処しない。
本稿では,主に自動車システムを対象とした要求トレーサビリティ検証とリカバリ手法であるTVRを紹介する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 20:37:23 GMT)
Investigating the $4D_{3/2}|3,\pm2\rangle$--$4D_{5/2}|3,\pm2\rangle$ transition in Nb$^{4+}$ for a THz atomic clock [7.4] 4D_3/2|3,pm2rangle rightarrow 4D_5/2|3,pm2rangle$ transition in the Nb$4+$ ion is identified as a promising candidate for a terahertz (THz) atomic clock。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 23:50:52 GMT)
PLANET: A Collection of Benchmarks for Evaluating LLMs' Planning Capabilities [7.4] 計画はエージェントとエージェントAIの中心である。
これまでのところ、既存の計画ベンチマークに対する包括的な理解は欠如しているようだ。
本稿では,アルゴリズム開発によく使用されるテストベッドを特定するための,様々な計画ベンチマークについて検討する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 00:02:50 GMT)
SLAM&Render: A Benchmark for the Intersection Between Neural Rendering, Gaussian Splatting and SLAM [7.3] SLAM&Renderは、SLAMとビューレンダリングの交差点でメソッドをベンチマークするために設計された、新しいデータセットである。
40のシーケンスで構成され、同期RGB、深さ、IMU、ロボットキネマティックデータ、グラウンドトルースポーズストリームで構成されている。
ロボットキネマティックデータをリリースすることにより、ロボットマニピュレータに適用した場合に、新しいSLAM戦略の評価が可能になる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 08:33:42 GMT)
Quantifying the benefits of code hints for refactoring deprecated Java APIs [6.4] このタスクの自動化には,コードヒントが有効であることを示す。
我々の実験は、コードヒントがこのタスクの自動化を可能にしていることを示している。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 10:30:34 GMT)
Robust and Real-time Surface Normal Estimation from Stereo Disparities using Affine Transformations [6.3] 本研究は,修正ステレオ画像対から表面正規分布推定を行う新しい手法を提案する。
我々は、分散データを効率的に処理するように設計された畳み込み操作にインスパイアされたカスタムアルゴリズムを開発する。
本手法は,ミドルベリーとシティスケープのデータセットから,シミュレーション環境と実世界のステレオ画像の両方を用いて検証した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 14:19:00 GMT)
Application of Deep Generative Models for Anomaly Detection in Complex Financial Transactions [6.2] 本研究では,大規模支払フローにおける疑わしい行動を検出するアルゴリズムを提案する。
GAN(Generative Adversarial Networks)と可変オートエンコーダ(VAE)を組み合わせることで、金融取引における異常な振る舞いを検出するように設計されている。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 23:49:10 GMT)
"The Diagram is like Guardrails": Structuring GenAI-assisted Hypotheses Exploration with an Interactive Shared Representation [6.0] 本稿では,AIによる情報ヒントと視覚化を付加した順序付きノードリンクツリーインタフェースの設計について検討する。
ノードリンク図は仮説探索のための"ガードレール"として機能し、構造化を容易にし、包括的概要を提供し、効率的なバックトラックを可能にする。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:05:54 GMT)
ICGM-FRAX: Iterative Cross Graph Matching for Hip Fracture Risk Assessment using Dual-energy X-ray Absorptiometry Images [5.8] ICGM-FRAXはDXA(Dual-Energy X-ray Absorptiometry)画像を用いた股関節骨折の予測手法である。
実験の結果,ICGM-FRAXの感度は0.9869であった。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:52:15 GMT)
Understanding LLM Behaviors via Compression: Data Generation, Knowledge Acquisition and Scaling Laws [5.7] 我々は、増大するモデルとデータスケールにまたがって、どのようにしてLarge Language Modelsが情報を取得し、保存するかの詳細なビューを提供する。
この理論的な視点と、Heapの法則やZipfの法則に触発された自然な仮定に触発され、単純化されながら代表的である階層型データ生成フレームワークを導入する。
ベイジアン・セッティングの下では、このモデル内の予測と圧縮が自然に多様な学習とスケーリングの行動を引き起こすことが示される。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 15:18:42 GMT)
Shifts in Doctors' Eye Movements Between Real and AI-Generated Medical Images [5.7] アイトラッキング分析は医療画像において重要な役割を担い、放射線医が臨床症例を視覚的に解釈し診断する方法に関する重要な洞察を提供する。
まず,ササード方向,振幅,関節分布など,様々な眼球運動パターンの分布を測定することで,放射線技師の注意と一致を解析した。
真正(リアル)画像と深層学習(フェイク)画像の視線変化について検討した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 10:13:59 GMT)
A comprehensive review of remote sensing in wetland classification and mapping [5.6] 湿地は生物多様性と人間の幸福の両方を支える重要な生態系を構成している。
1970年代、研究者たちは湿地分類とマッピングにリモートセンシング技術を使い始めた。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 08:23:17 GMT)
Active Learning Methods for Efficient Data Utilization and Model Performance Enhancement [5.4] 本稿では,より少ないラベル付き例を用いてモデルの性能向上を支援する機械学習の戦略である,アクティブラーニング(AL)の概要を紹介する。
ALの基本概念を導入し、コンピュータビジョン、自然言語処理、トランスファーラーニング、実世界のアプリケーションなど、様々な分野でどのように使われているかについて議論する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 20:42:13 GMT)
Multimodal Large Language Models for Enhanced Traffic Safety: A Comprehensive Review and Future Trends [5.2] 従来のアドバンストドライバー支援システムは、しばしば動的な現実のシナリオで苦労する。
本稿では,これらの制約に対処する上で,MLLM(Multimodal Large Language Models)の変換可能性について概説する。
MLLMを次世代の交通安全システムの基礎として位置づけることで、この分野に革命をもたらす可能性を示している。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:48:35 GMT)
Guidelines for External Disturbance Factors in the Use of OCR in Real-World Environments [5.1] OCRのパフォーマンスは、AI技術の進化によって改善された。
様々な利用環境によってもたらされる干渉の可能性の増加は、その固有の性能を達成するのを防ぐことができる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 07:32:28 GMT)
Evaluating LLMs on Chinese Topic Constructions: A Research Proposal Inspired by Tian et al. (2024) [5.0] 本稿では,中国語トピック構築における大規模言語モデル(LLM)の評価フレームワークを提案する。
マンダリン構文に関するLLMの文法的知識をテストするための実験設計について概説する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 08:56:23 GMT)
Post-Convergence Sim-to-Real Policy Transfer: A Principled Alternative to Cherry-Picking [5.0] 本稿では,最短ケースの性能伝達最適化手法を導入することで,コンバージェンス後のsim-to-real転送問題に対処する。
実験は、シミュレーションから実世界の実験室にRLに基づく移動ポリシーを移すことの有効性を実証した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 19:48:05 GMT)
Bayesian Federated Learning for Continual Training [4.9] 数日間にわたって収集されたレーダデータを用いて人体検知に適用した連続的BFLフレームワークを提案する。
提案手法の精度, 期待校正誤差 (ECE) , およびいくつかの基準線に対する収束速度を評価する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 14:33:04 GMT)
Risks of Practicing Large Language Models in Smart Grid: Threat Modeling and Validation [4.9] 大規模言語モデル(LLM)は人工知能の重要なブレークスルーであり、スマートグリッド内での応用の可能性を持っている。
スマートグリッドのような重要なインフラに展開する前に,LSMに関連するリスクを調査し,評価することが重要である。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 08:14:52 GMT)
Can LLMs Rank the Harmfulness of Smaller LLMs? We are Not There Yet [4.8] 大規模言語モデル(LLM)がユビキタスになり,そのリスクや限界を理解することが重要である。
この研究は2つの質問を研究している: 有害なコンテンツの生成に関して、より小さなLSMはどのようにランク付けされるか?
我々は,これらの反応の有害性に注釈を付ける能力について,最先端の大型LCMを3つ評価した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:30:23 GMT)
When Cloud Removal Meets Diffusion Model in Remote Sensing [4.8] リモートセンシング画像における雲除去のための新しいフレームワークであるDC4CR(Diffusion Control for Cloud removal)を提案する。
提案手法では, 予め生成した雲面に頼らずに, 薄い雲と厚い雲を選択的に除去できるプロンプト駆動制御を導入する。
RICEとCUHK-CRデータセットの実験では、最先端のパフォーマンスを示し、さまざまな条件で優れたクラウド除去を実現している。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 00:56:57 GMT)
Bigram Subnetworks: Mapping to Next Tokens in Transformer Language Models [4.8] Transformer言語モデルでは、アクティベーションベクトルは現在のトークン埋め込みから次のトークン予測へと変換される。
この変換の最小形態を分離するために、ビッグラム予測を行う言語モデルワークを同定し、現在のトークンのみに基づいて次のトークン予測を行う。
Bigramworksはトレーニング済みの言語モデルで10Bパラメータまで見つけることができ、モデルパラメータの0.2%未満である場合でも、モデルパフォーマンスにとって非常に重要です。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 22:41:00 GMT)
Variational quantum algorithm for the Poisson equation based on the banded Toeplitz systems [4.7] 離散ポアソン方程式を解くための変分量子アルゴリズムを与える。
行列 $A$ と $A2$ を対応するバンド化されたToeplitz 行列の線型結合に分解する。
行列の分解に基づいて、コスト関数を効率的に評価する量子回路を設計する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 03:07:49 GMT)
Valkyrie: A Response Framework to Augment Runtime Detection of Time-Progressive Attacks [4.7] サイバー攻撃を検出する一般的なアプローチは、リアルタイムでシステムを監視し、悪意のある活動が起こっていることを識別することである。
偽陽性はコンピュータシステムに有害な影響を与えるため、正当な操作の中断と生産性の低下につながる可能性がある。
検出後応答で既存のランタイム検出器を拡張可能なフレームワークであるValkyrieを紹介する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 21:30:49 GMT)
Empowering AI to Generate Better AI Code: Guided Generation of Deep Learning Projects with LLMs [4.6] 大規模言語モデル(LLM)は、ディープラーニングプロジェクト全体の生成に苦労する。
本稿では,ディープラーニングプロジェクトを生成するための新しい計画誘導型コード生成手法DLCodeGenを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 13:09:25 GMT)
Manifold Induced Biases for Zero-shot and Few-shot Detection of Generated Images [4.6] 我々は,(1)理論的な根拠の欠如,(2)ゼロショットと少数ショットの制度における性能改善のための重要な余地,の2つの主要なギャップを同定する。
具体的には,事前学習した拡散モデルにより得られた暗黙的確率多様体のバイアスについて検討する。
スコア関数解析により、確率多様体上の点に対する曲率、勾配、偏りを近似し、ゼロショット状態における検出基準を確立する。
20個の生成モデルにまたがる実験結果から,本手法はゼロショット設定と少数ショット設定の両方において,現在の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 22:39:24 GMT)
Is Intelligence the Right Direction in New OS Scheduling for Multiple Resources in Cloud Environments? [4.5] OSML+は、共同配置されたクラウドサービスのためのMLベースの新しいリソーススケジューリングメカニズムである。
私たちの設計は、最新のオフ・ザ・シェルフの大規模サーバなど、さまざまなクラウドサーバでうまく機能します。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 11:09:43 GMT)
A Refreshment Stirred, Not Shaken (III): Can Swapping Be Differentially Private? [4.5] 論文のタイトルの質問に対する正確で文脈的に根拠づけられた回答の探求は、この理論上の差分プライバシーの基礎となった(例えばDP$2014$)。
本稿は, 先行する2つの部分の要約と, 新たな議論であるx2014$, 例えば, ビルディングブロックの認知度を高めることで, プライバシーを損なうことができるかについて述べる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:19:57 GMT)
A Graph-Based Model for Vehicle-Centric Data Sharing Ecosystem [4.5] 我々は、現代の車両が異なる当事者間のデータ交換をどのように扱うかについての洞察を得るために、概念グラフベースのモデルを開発する。
車両関連データ共有に関するプライバシーに関する洞察を発見することの有用性と有効性を示すために、2つの現実的な例が開発された。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 19:57:55 GMT)
Strong Converse Bounds for Compression of Mixed States [4.4] 混合状態の可視圧縮とブラインド圧縮の両面において強い逆特性について検討する。
拡張可能な状態の変化に対して、精製の絡み合いが添加物であることを証明する。
我々は、エンコーダとアクセス不能参照システムの間で共有される一般的な混合状態ソースのブラインド圧縮について検討する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:31:34 GMT)
SuoiAI: Building a Dataset for Aquatic Invertebrates in Vietnam [4.3] 本稿では,ベトナムにおける水生無脊椎動物のデータセット構築のためのエンドツーエンドパイプラインであるSuoiAIを提案する。
データ収集,アノテーション,モデルトレーニングの手法を概説し,半教師付き学習によるアノテーションの取り組みの軽減に焦点をあてる。
本研究の目的は,データ不足,きめ細かな分類,多様な環境環境への展開といった課題を克服することである。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:33:02 GMT)
AGI Is Coming... Right After AI Learns to Play Wordle [4.3] マルチモーダルエージェント、特にOpenAIのComputer-User Agent (CUA)は、人間のように標準的なコンピュータインターフェースを通じてタスクを制御および完了するよう訓練されている。
The New York Times Wordle game におけるエージェントのパフォーマンスを評価し,モデル行動の抽出と欠点の同定を行った。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 20:58:58 GMT)
Interferometric Purcell suppression of spontaneous emission in a superconducting qubit [4.3] 超伝導量子ビットでは、高速な分散測定とリセットを実現するために自然放出の抑制が不可欠である。
我々は, 破壊干渉により, クビットモードのフィードラインへの共振器による減衰を抑制することができることを示した。
この"インターフェロメトリパーセルフィルタ"は、専用フィルタコンポーネントやフィードラインのインピーダンスミスマッチを必要としない。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:04:14 GMT)
Learning Compositional Transferability of Time Series for Source-Free Domain Adaptation [4.0] ドメイン適応は、非常にダイナミックな性質のため、時系列分類では困難である。
時系列再構成は、ターゲットとソースの時系列を整列するサウンドソリューションである。
本稿では,時系列再構成のための合成アーキテクチャを用いて,ドメイン転送可能性の構成をアンタングル化しようとする。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 09:51:24 GMT)
A Self-supervised Learning Method for Raman Spectroscopy based on Masked Autoencoders [4.0] SMAE と呼ばれる Masked AutoEncoder に基づくラマン分光の自己教師型学習パラダイムを提案する。
SMAEは、事前トレーニング中にスペクトルアノテーションを必要としない。ランダムなマスキングを行い、スペクトル情報を再構成することにより、本質的なスペクトル特徴を学習する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 10:44:06 GMT)
Testing LLMs' Capabilities in Annotating Translations Based on an Error Typology Designed for LSP Translation: First Experiments with ChatGPT [3.9] 本研究では,誤り型に基づくMT出力のアノテートにおける大規模言語モデル(LLM)の機能について検討する。
我々は、ChatGPTアノテーションとDeepLとChatGPT自体による翻訳の人間の専門家による評価を比較した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 12:21:37 GMT)
Enhancing Audio-Language Models through Self-Supervised Post-Training with Text-Audio Pairs [3.8] 音声とテキストのマルチモーダルコントラスト学習戦略が急速に注目されている。
これらのモデルが自然言語や時間的関係を理解する能力は、いまだに未探索でオープンな研究分野である。
本稿では,時間的インスツルメント手法であるTeminalを用いて,時間的理解を伴うマルチモーダルALMを,従来の音声言語タスクの能力を損なうことなく装備することを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 08:35:02 GMT)
Deep learning with missing data [3.8] 本稿では,既存の計算手法と組み合わせて適用可能なパターン埋め込みニューラルネットワーク(PENN)を提案する。
インプットされたデータに基づいてトレーニングされたニューラルネットワークに加えて、PENNは観察指標のベクトルを第2のニューラルネットワークに渡して、コンパクトな表現を提供する。
出力は第3のニューラルネットワークに結合され、最終的な予測が生成される。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:57:36 GMT)
Trends in Frontier AI Model Count: A Forecast to 2028 [3.8] 政府は、AIモデルのトレーニングにどれだけの計算が使われたかに基づいて、AIモデルに要件を課し始めている。
2028年末までに103-306のファンデーションモデルが1025ドルのFLOP閾値を超えると見積もっている。
また、これらの絶対計算しきい値を超えるモデル数が、超直線的に増加することもわかっています。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 22:31:57 GMT)
Introduction to Quantum Machine Learning and Quantum Architecture Search [3.8] 量子機械学習(QML)は、新たな学際分野である。
このチュートリアルは、両方の領域における最近のブレークスルーの詳細な概要を提供する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 15:13:33 GMT)
Optimal Bayesian Affine Estimator and Active Learning for the Wiener Model [3.7] 我々は、未知パラメータに対する閉形式最適アフィン推定器を導出し、いわゆる「力学基底統計」を特徴とする。
我々は,推定誤差を最小限に抑えるために,入力信号を合成する能動的学習アルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 21:58:45 GMT)
Decidability of Querying First-Order Theories via Countermodels of Finite Width [3.7] 本稿では,幅広い論理的包含問題の決定可能性を確立するための汎用的枠組みを提案する。
幅有限有限普遍モデル集合を示す論理を同定し、幅広い準同型クローズドクエリに対して決定可能なエンテーメントを保証する。
ルールの有限分割幅集合が、他の既知の抽象決定可能なクラスをサブスクライブするが、既存の成層概念を活用することにより、また、幅広い新しいルールセットをカバーしている。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 12:54:05 GMT)
Behavioral Universe Network (BUN): A Behavioral Information-Based Framework for Complex Systems [3.1] 本稿では,エージェント・インタラクション・ビヘイビア・フォーマリズムに基づく理論的枠組みである行動ユニバースネットワーク(BUN)を紹介する。
BUNは、オブジェクト(アクティブエージェント)、オブジェクト(リソース)、振舞い(操作)を共有行動情報基盤が管理する第一級のエンティティとして扱う。
振る舞い分析の強化、適応性の向上、ドメイン間の相互運用性などです。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 14:50:28 GMT)
Shifting Attention to You: Personalized Brain-Inspired AI Models [3.0] 人間の行動洞察とミリ秒スケールのニューラルネットワークを微調整CLIPベースモデルに統合することで、修正されていないCLIPベースラインと比較して、行動性能が2倍になることを示す。
我々の研究は、適応型AIシステムを設計するための、新しい解釈可能なフレームワークを確立し、神経科学、パーソナライズドメディカル、人間とコンピュータの相互作用に幅広い意味を持つ。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 15:57:10 GMT)
Analysing the Robustness of Vision-Language-Models to Common Corruptions [2.9] 視覚言語モデル(VLM)は、視覚的およびテキスト的コンテンツに対する理解と推論の優れた能力を実証している。
我々は、ImageNet-Cベンチマークから、19種類の汚職タイプにまたがるVLMのロバスト性について、初めて包括的解析を行った。
シーンテキスト理解とオブジェクトベース推論にどのように影響するかを評価するために,2つの新しいベンチマークであるTextVQA-CとGQA-Cを導入する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:07:18 GMT)
Integrating Response Time and Attention Duration in Bayesian Preference Learning for Multiple Criteria Decision Aiding [2.9] 本稿では,意思決定支援のための行動規範を取り入れたベイズ選好学習フレームワークについて紹介する。
このフレームワークは、ペアワイズ比較、応答時間、注意期間を統合して、意思決定プロセスに関する洞察を深めます。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 08:01:44 GMT)
vApps: Verifiable Applications at Internet Scale [2.9] 検証可能なアプリケーション(vApps)は、検証可能なブロックチェーンコンピューティングアプリケーションの作成とデプロイを合理化するように設計された、新しい開発フレームワークである。
vAppsは、包括的なSDK内でRustベースのドメイン特化言語(DSL)を統一する。
このフレームワークはWeb2とWeb3システムとのシームレスな統合もサポートしており、開発者はアプリケーションロジックのみに集中することができる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 02:19:06 GMT)
Enhanced Data-driven Topology Design Methodology with Multi-level Mesh and Correlation-based Mutation for Stress-related Multi-objective Optimization [2.9] 感度フリーなデータ駆動トポロジ設計(DDTD)手法は,これらの問題を克服する有効な手段であると考えられる。
本研究では,相関型突然変異モジュールを用いたマルチレベルメッシュDDTD法を提案する。
提案手法は、特定のデータセットの構築に時間を要することなく、低品質の初期データセットによって駆動することができる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 01:33:56 GMT)
Expert-elicitation method for non-parametric joint priors using normalizing flows [2.9] 正規化フローを用いた非パラメトリックジョイント事前分布の学習のためのエキスパート・エミュレーション手法を提案する。
我々のフレームワークは、パラメトリックと非パラメトリックの両方を学習するためのエレケーション手法の開発を支援する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 14:26:37 GMT)
Direct Learning of Mesh and Appearance via 3D Gaussian Splatting [2.8] 本稿では、3DGSを明示的な幾何学的表現、すなわちメッシュに組み込んだ学習可能なシーンモデルを提案する。
我々のモデルはメッシュと外観をエンドツーエンドで学習し、メッシュ面に3Dガウスアンを結合し、3DGSの微分レンダリングを行い、測光監督を得る。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 12:33:10 GMT)
Federated Latent Factor Model for Bias-Aware Recommendation with Privacy-Preserving [2.8] 推薦システム(RS)は、ユーザに対してパーソナライズされたアイテムレコメンデーションを提供し、全体のエクスペリエンスを向上させることを目的としている。
従来のRSは、すべてのユーザデータを中央サーバで収集し、処理する。
この集中型アプローチは、データ漏洩やプライバシー漏洩のリスクを高めるため、重要なプライバシー上の懸念を提起する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 13:24:30 GMT)
Learning the structure of any Hamiltonian from minimal assumptions [2.8] 我々は、ブラックボックスクエリから未知の量子多体ハミルトン$H$を学習する問題とその時間進化について研究する。
我々は、事前にハミルトニアン項を知る必要がない任意の$n$-量子ハミルトニアンを学ぶアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 20:47:27 GMT)
MultiSensor-Home: A Wide-area Multi-modal Multi-view Dataset for Action Recognition and Transformer-based Sensor Fusion [2.8] ホーム環境における包括的行動認識のための新しいベンチマークであるMultiSensor-Homeデータセットを紹介する。
また,マルチモーダルマルチビュー変換器を用いたセンサフュージョン (MultiTSF) 法を提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 03:46:22 GMT)
Efficacy of a Computer Tutor that Models Expert Human Tutors [2.8] そこで我々は,知能学習システム(ITS)の9週間の学習効果について検討した。
学生は学習セッションの前後で学習テストを受け、1~2週間後に遅延テストを行った。
ロジスティック・ミックス・エフェクト・モデリングを用いた分析は、ITSとヒューマン・チューターの即時検査に有意な正の効果を示した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:41:28 GMT)
LithOS: An Operating System for Efficient Machine Learning on GPUs [2.3] 本稿では,GPUオペレーティングシステムに向けた第一歩であるLithOSを紹介する。
LithOSには、効率的なGPUリソース管理のための新しい抽象化とメカニズムが含まれている。
RustにLithOSを実装し、幅広い機械学習環境におけるパフォーマンスを評価します。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 22:21:39 GMT)
A Conceptual Framework for AI-based Decision Systems in Critical Infrastructures [2.3] 本稿では、学際的アプローチを採用することにより、批判的インフラの全体的概念的枠組みを提案する。
数学、決定論、計算機科学、哲学、心理学、認知工学など、伝統的に異なる分野を統合している。
専門の工学分野、特にエネルギー、機動性、航空学に重点を置いている。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:38:26 GMT)
Codenames as a Benchmark for Large Language Models [2.1] 一般的な単語ベースのボードゲームであるCodenamesを,大規模言語モデルの推論能力を評価するための適切なベンチマークとして使用しています。
我々は,GPT-4o,Gemini 1.5,Claude 3.5 Sonnet,Llama 3.1など,最先端のLLMの能力を評価する。
以上の結果から, ゲームプレイ中に異なるモデルが出現し, 特定の役割に優れることが示唆された。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 22:53:07 GMT)
How Effective Can Dropout Be in Multiple Instance Learning ? [2.1] MIL(Multiple Instance Learning)は、様々なアプリケーションのための弱い教師付き手法である。
本稿では,MIL固有のドロップアウト手法であるMIL-Dropoutを提案し,どのインスタンスをドロップするかを体系的に決定する。
5つのMILベンチマークデータセットと2つのWSIデータセットの実験は、MIL-Dropoutが既存のMILメソッドのパフォーマンスを無視できる計算コストで向上させることを示した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 00:46:31 GMT)
Detecting underdiagnosed medical conditions with opportunistic imaging [2.1] オポチュニティCTは、診断情報を抽出するために定期的なCT画像を再取得する。
画像表現型とそれに対応する文書との相違点を明らかにするため,2,674個のCTスキャンを解析した。
サルコニア,肝脂肪症,腹水と診断されたスキャンのわずか0.5%,3.2%,30.7%がICDで診断された。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 00:32:35 GMT)
RepliBench: Evaluating the autonomous replication capabilities of language model agents [2.1] RepliBenchは、自律レプリケーション機能を測定するために設計された評価スイートである。
我々は5つのフロンティアモデルをベンチマークし、それらが現在、自己複製の信頼できる脅威を生じていないことを発見した。
我々が評価した最良のモデル(Claude 3.7 Sonnet)は、15/20タスクファミリで50%パス@10スコア、最も難しい亜種で9/20ファミリーで50%パス@10スコアである。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 11:39:22 GMT)
A direct proof of a unified law of robustness for Bregman divergence losses [2.0] バイアス分散型分解の観点から,Bubeck と Sellke の証明手法を再放送する。
我々の研究は、Bubeck と Sellke の証明技法のより一般的な理解を与え、その広範な実用性を実証する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 12:53:26 GMT)
Mitigating Degree Bias in Graph Representation Learning with Learnable Structural Augmentation and Structural Self-Attention [1.9] 現実世界のグラフでは、高次ノードがメッセージパッシングを支配しており、低次ノードが低次ノードを表現できない程度にバイアスを引き起こす。
本稿では,DegFairGTと名づけられたDegee Fairness Graph Transformerを提案する。
私たちのキーとなるアイデアは、同じコミュニティで同じような役割を持つ非隣接ノードを利用して、拡張の下で情報的エッジを生成することです。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 13:03:40 GMT)
Integrating Symbolic Execution into the Fine-Tuning of Code-Generating LLMs [1.9] 本稿では,コード生成型大規模言語モデル(LLM)の微調整について検討する。
我々は,シンボル実行手法の助けを借りて,報酬モデルのトレーニングデータを強化する。
このデータセットを微調整した報奨モデルでは、ベースラインであるCodeRLよりも大幅に改善されていることが示されています。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:29:07 GMT)
Telegram as a Battlefield: Kremlin-related Communications during the Russia-Ukraine Conflict [1.9] 本稿では,プロクレムリンチャネルとアンチクレムリンテレグラムチャネルの両方からのポストのデータセットを提案する。
データセットは404のプロクレムリンチャネルと4,109,645のポスト、114の反クレムリンチャネルと1,117,768のポストで構成されている。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 15:56:06 GMT)
Zero Day Malware Detection with Alpha: Fast DBI with Transformer Models for Real World Application [1.9] 我々はTransformerモデルとASM言語を活用したゼロデイマルウェア検出フレームワークAlphaを紹介する。
AlphaはPeekabooを通じて収集されたマルウェアや良質なソフトウェアデータに基づいて訓練されており、全く新しいサンプルを異常な精度で識別することができる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 06:30:21 GMT)
Progressive Pruning: Analyzing the Impact of Intersection Attacks [1.8] ストリームベースの通信は匿名通信ネットワーク(ACN)に固有の課題をもたらす
従来、独立したメッセージ用に設計されたACNは、ストリーム固有の脆弱性を考慮するのに苦労している。
交差点攻撃に対する感受性を定量化する新しい手法であるプログレッシブプルーニングを導入する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:06:04 GMT)
An Accurate and Efficient Analytic Model of Fidelity Under Depolarizing Noise Oriented to Large Scale Quantum System Design [1.8] 本稿では,分極雑音下での量子回路の忠実度を予測するための包括的な理論的枠組みを提案する。
デバイスキャリブレーションデータに基づく効率的な忠実度推定アルゴリズムを提案する。
提案するアプローチは、量子ハードウェアをベンチマークするためのスケーラブルで実用的なツールを提供する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 20:02:40 GMT)
Fuzzy Logic -- Based Scheduling System for Part-Time Workforce [1.8] 本稿では,大学在勤アルバイトのスケジュールを効率的に作成するための遺伝的ファジィシステムの適用について検討する。
本モデルでは,週の最大就業時間,就業時間,就業時間,就業時間,就業時間など,様々な要因を考慮し,実現可能なソリューションを生成する。
その結果,運用基準を満たすスケジュール作成におけるアルゴリズムの効率性と,不飽和条件下でのロバスト性を示した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:44:17 GMT)
Fourier analysis of the physics of transfer learning for data-driven subgrid-scale models of ocean turbulence [1.8] トランスファーラーニング(TL)は、天気予報や乱流モデリングなどの応用におけるニューラルネットワーク(NN)の性能を高める強力なツールである。
本研究では,9層畳み込みNNを用いて,2層海洋準地球栄養系における沈み込み力の予測を行う。
ターゲットシステムからのデータで1つの層のみをトレーニングすることにより、この過小評価が修正され、NNはターゲットのスペクトルに一致する予測を生成することができる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 23:42:19 GMT)
Contemplative Wisdom for Superalignment [1.7] 我々は、その認知アーキテクチャと世界モデルに組み込まれた本質的な道徳性を備えたAIの設計を提唱する。
実証的な知恵の伝統にインスパイアされた4つの公理原理が、AIシステムにレジリエントなWise World Modelを組み込むことができることを示す。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 14:20:49 GMT)
Aria-MIDI: A Dataset of Piano MIDI Files for Symbolic Music Modeling [1.4] ピアノ演奏の録音を音符に書き起こして作成したMIDIファイルのデータセットについて紹介する。
私たちが使っているデータパイプラインはマルチステージで、インターネットから自律的にクロールしてオーディオ録音をスコアする言語モデルを採用しています。
得られたデータセットには100万以上の異なるMIDIファイルが含まれており、約10万時間の音声が書き起こされている。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 12:59:40 GMT)
Transferable Learning of Reaction Pathways from Geometric Priors [1.3] MEPINは、反応物や製品からMEPを効率的に予測するスケーラブルな機械学習手法である。
本手法は,反応経路の効率的なデータ駆動予測による大規模化学反応空間の探索を可能にする。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:20:53 GMT)
Sunflowers and Ramsey problems for restricted intersections [1.2] F"uredi's famous semilattice lemma の変種が発見され、これは強力なデルタ系法における鍵となるツールである。
また,本手法の応用として,F"uredi's famous semilattice lemma の変種を求める。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:46:21 GMT)
The Hardness of Learning Quantum Circuits and its Cryptographic Applications [1.2] ランダムな量子回路の出力状態の学習やクローン化に関する具体的な硬さの仮定は、セキュアな量子暗号の基礎として利用できることを示す。
セキュアな一方向ステートジェネレータ(OWSG)、デジタルシグネチャスキーム、量子ビットコミットメント、秘密鍵暗号スキームを構築した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:00:03 GMT)
Design and Implementation of a Blade-Type Linear Paul Trap [1.1] ブレード構成における線形ポールトラップの設計,実装,構成について述べる。
このトラップはマイクロモーションを最小化し、数十個のイオンからなる線形イオン鎖の形成を可能にするよう最適化された。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:19:44 GMT)
Layered semiconductors integrated with polyimide thin films for high-quality valleytronic and quantum-photonic systems [1.0] 層状半導体の誘電体集積は、高品質の光電子、バレートロニクス、量子フォトニクスデバイスを製造するための前提条件である。
この研究は、2つの広く研究された層状半導体における高光学クオリティエキシトンの形成を示す。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 09:29:43 GMT)
Jailbreak Detection in Clinical Training LLMs Using Feature-Based Predictive Models [1.0] 大規模言語モデル(LLMs)における脱獄は、教育のようなセンシティブなドメインで安全な使用を脅かす。
本研究は,臨床教育プラットフォームである2-Sigmaにおけるジェイルブレイクの検出に焦点を当てた。
ジェイルブレイク行動と強く相関する4つの言語変数を用いて、158の会話に2,300以上のプロンプトを注釈付けした。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:54:35 GMT)
Fully Bayesian Approaches to Topics over Time [1.0] 本稿では,ベータリリース前の共役モデルの導入を通じて,ベイズ時空間(BToT)モデルを提案する。
この前者は、ミニバッチでトピックが不十分な場合に、アルゴリズムのオンラインバージョンが不安定な更新を防止する正規化として機能する。
私たちは2つのデータセットでモデルをテストしました。米国内の200年以上のステート・オブ・ザ・ユニオンアドレスのコレクションと、1000万ツイートの大規模なCOVID-19 Twitterコーパスです。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:46:07 GMT)
Adapting Multilingual LLMs to Low-Resource Languages using Continued Pre-training and Synthetic Corpus [1.0] 我々は,Nemotron-Mini-Hindi 4Bをベースとした,ヒンディー語と英語の両方をサポートするバイリンガルSLMであるNemotron-Mini-Hindi 4Bを紹介する。
ベースモデルとインストラクションモデルの両方が、ヒンディー語のベンチマークにおいて、英語のタスクにおいて競争力を維持しながら、最先端の結果を達成することを実証する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 05:29:01 GMT)
Reliable Classification with Conformal Learning and Interval-Type 2 Fuzzy Sets [1.0] 本稿では,ファジィルールベースのシステムによる共形学習を分類に利用し,その有効性を示す。
本稿では,2型ファジィ集合の使用によって,ファジィとクリップの両ルールと比較して,システムの出力品質が向上する方法について論じる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:07:55 GMT)
On the Boolean Network Theory of Datalog$^\neg$ [0.9] 我々はDatalog$neg$とBooleanネットワーク理論の正式なリンクを確立する。
我々は、Datalog$neg$プログラムに奇数サイクルがない場合、正規モデルと安定モデルが一致することを示す。
また、正則モデルの特異性を含む安定部分モデルの特異性を示す。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 20:02:59 GMT)
Quantum tunnelling without a barrier [0.9] 瞬時に電場が消えてバリアがない場合に発生する予期せぬ光トンネル現象が見つかります。
障壁のないトンネルは、準静的障壁の画像上に構築された標準的な直観と、その過程の非断熱的性質との間の断線を明らかにする。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 01:19:46 GMT)
Nested Named-Entity Recognition on Vietnamese COVID-19: Dataset and Experiments [0.9] ベトナムにおける新型コロナウイルスのパンデミック防止を支援するNER(Nonden-entity Recognition)研究について述べる。
また、ベトナム向けのネストされたエンティティ認識タスクを備えた、手動で注釈付けされた新型コロナウイルスデータセットも提示する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 05:21:34 GMT)
WMKA-Net: A Weighted Multi-Kernel Attention NetworkMethod for Retinal Vessel Segmentation [0.9] 本稿では,網膜血管セグメンテーションにおけるマルチスケール機能キャプチャの不足,コンテキスト情報の喪失,ノイズ感度といった問題に対処する新しい網膜血管セグメンテーションネットワークを提案する。
WMKA-Netは、いくつかの革新的なコンポーネントを統合することにより、小型船と低コントラスト領域のセグメンテーション性能を大幅に改善する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 06:32:25 GMT)
Mining Characteristics of Vulnerable Smart Contracts Across Lifecycle Stages [0.8] 本稿では,スマートコントラクトのライフサイクルを通じてのセキュリティに関する実証的研究について述べる。
各段階でセキュリティ問題を調べ、少なくとも7つの機能説明を提供する。
5つの機械学習分類モデルを使用して、異なるステージにおける脆弱性を特定する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 12:42:59 GMT)
Two- and three-body dispersion coefficients for interaction of Cu and Ag atoms with {Group} I, II, and XII elements [0.8] 我々はCu原子とAg原子とI群とII群の原子との長距離ファンデルワールス分散(vdW)相互作用を評価した。
我々は,適切な相対論的手法と総和状態法を用いて,$C_6$と$C_9$の分散係数を計算した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 23:45:31 GMT)
Rethinking the Potential of Multimodality in Collaborative Problem Solving Diagnosis with Large Language Models [0.6] マルチモーダルデータと高度なモデルは、複雑なCPSの振る舞いを検出する可能性があると主張されている。
78人の中学生のCPSサブスキルと指標の診断におけるモデル性能向上のためのマルチモーダルデータの有用性について検討した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 13:25:55 GMT)
A near-term quantum simulation of the transverse field Ising model hints at Glassy Dynamics [0.4] 本研究では, 横磁場Isingモデルの量子回路シミュレーションを行い, ガラス力学の健全な特徴を示す。
我々の目標は、量子情報処理のツールを活用して、ガラス系の力学と構造をより微妙に理解することである。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:18:00 GMT)
Efficient Algorithm for Sparse Fourier Transform of Generalized $q$-ary Functions [0.3] GFastはFourier変換を$f$、サンプル複雑性は$O(Sn)$で計算する符号化理論アルゴリズムである。
GFastは、実世界の心臓疾患の診断とタンパク質の適合性モデルの説明を、最大13時間分のサンプルで行える。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 00:23:46 GMT)
A novel Facial Recognition technique with Focusing on Masked Faces [0.3] 本研究では,マスクのない顔マッチングモデル(MUFM)を提案する。
このモデルは、視覚幾何学グループ(VGG16)モデルを用いて、重要な顔の特徴を抽出する。
コサイン類似度尺度は、同一人物のマスクとマスクされていない顔を比較するために用いられる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:28:08 GMT)
Improved Algorithms for Quantum MaxCut via Partially Entangled Matchings [0.2] これらのアルゴリズムの2つの新しい要素は、マッチングにおいてエッジに関連付けられた量子ビットのペアを部分的に絡み合わせることである。
これにより、製品状態とマッチングベースの状態を調整可能なパラメータで補間することができる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:59:02 GMT)
Jeff = 1/2 Diamond Magnet CaCo2TeO6: A Pathway toward New Spin Physics and Quantum Functions [0.2] CaCo2TeO6は、2つのOh-Co2+部位のダイヤモンド格子を特徴とする新しい材料である。
この材料は強い量子ゆらぎ、競合する磁気交換相互作用の増大、磁場誘起磁気構造のチューニング性を示す。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 01:27:00 GMT)
Coarse-grained Bootstrap of Quantum Many-body Systems [0.1] 本稿では,量子多体システムの研究のために,粗粒化法とブートストラップ法を組み合わせた新しい計算手法を提案する。
この方法は、無限量子スピン鎖の任意の局所可観測体の零および有限温度期待値の厳密な上と下の境界を効率的に計算する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 20:55:48 GMT)
Existing Industry Practice for the EU AI Act's General-Purpose AI Code of Practice Safety and Security Measures [0.1] 本報告では、EU AI ActのGPAI(General-Purpose AI)コード・オブ・プラクティス(Third Draft)で提案されている措置と、主要なAI企業によって採用されている現在のプラクティスとを詳細に比較する。
EUはGPAIモデル提供者に対する拘束義務の履行に向け、具体的な技術的コミットメントで法的要件をブリッジする鍵を握る。
本報告は、法律遵守の表示であっても、実務法規又は企業の方針に関する規定的な視点を取らないことを意図したものではない。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 15:44:01 GMT)
Wireless energy transfer in non-Hermitian quantum battery [0.0] 非エルミート量子電池に蓄えられたエネルギーを効率的に抽出するために、パリティ時対称性を持つ2つの無線転送方式を提案する。
我々の研究は、QBにおける無線転送方式のエネルギーボトルネックを克服し、QBの実用化にインスピレーションを与える可能性がある。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 13:24:31 GMT)
Universality of entanglement in gluon dynamics [0.0] 粒子物理学における基本自由度の絡み合いは、散乱過程において ab initio を生成する。
生成物状態の2つのグルーオンは、3-および4-グルーオン相互作用の結果、その偏極に絡み合うことができる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:01:02 GMT)
Ultra-Low-Power Spiking Neurons in 7 nm FinFET Technology: A Comparative Analysis of Leaky Integrate-and-Fire, Morris-Lecar, and Axon-Hillock Architectures [0.0] ニューロモルフィックコンピューティングは、大規模な人工知能応用のための脳の顕著なエネルギー効率と並列処理能力を再現することを目的としている。
7nmFinFET技術で実装された3つのスパイクニューロン回路アーキテクチャー、Leaky-and-Fire(LIF)、Moris-Lecar(ML)、Axon-Hillock(AH)について包括的な研究を行った。
以上の結果から,AH設計は最大スループットを達成し,マルチギガヘルツ発火速度(最大3GHz)とアトジュールエネルギーコストを示すことがわかった。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 03:06:39 GMT)
Typical Positivity of Nonequilibrium Entropy Production for Pure States [0.0] ほとんどの純粋な状態の非平衡ダイナミクスは、アンサンブルの有効次元が十分に大きい場合、対応するアンサンブルのそれと同じエントロピー生成をもたらす。
これは多種多様な非平衡状態下でのエントロピー生成の肯定性を確立する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 13:10:03 GMT)
Trainable Quantum Neural Network for Multiclass Image Classification with the Power of Pre-trained Tree Tensor Networks [0.0] ツリーテンソルネットワーク(TTN)は、画像分類のための強力なモデルを提供する。
TTNを量子ニューラルネットワーク(QNN)に埋め込むことは、量子リソースを活用することでパフォーマンスをさらに向上させる可能性がある。
複数の小結合次元TTNを集約するフォレストテンソルネットワーク(FTN)分類器を提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 09:51:39 GMT)
Tiger200K: Manually Curated High Visual Quality Video Dataset from UGC Platform [0.0] Tiger200Kは、ユーザ生成コンテンツ(UGC)プラットフォームからソースされた、手動でキュレートされた高品質なビデオデータセットである。
視覚的忠実度と美的品質を優先することにより、Tiger200Kはデータキュレーションにおける人間の専門知識の重要性を強調している。
このデータセットは、進行中の拡張と、ビデオ生成モデルの研究と応用を前進させるオープンソースイニシアチブとしてリリースされる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 15:44:06 GMT)
The partition function in the quantum-to-classical transition [0.0] 古典的な統計力学では、分割函数は位相空間で定義される。
この概念をボヘミア軌道を用いて量子統計力学に拡張する。
量子-古典遷移は自然に生じ、力学と統計力学の整合性を維持する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 04:25:56 GMT)
Sparse L0-norm based Kernel-free Quadratic Surface Support Vector Machines [0.0] カーネルフリー2次曲面支援ベクトルマシン(SVM)モデルは、機械学習において大きな注目を集めている。
本稿では、オーバーフィッティングを緩和し、解釈可能性を高めるために、sparse $ell_0$-norm based Kernel-free quadratic surface SVMを提案する。
提案手法の有効性とロバスト性を実証し,カーネルフリー2次曲面SVMを実用化する可能性を示した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 20:49:38 GMT)
Solution of the Klein-Gordon equation in external Yang-Mills gauge field [0.0] 外界はヤン=ミルズ方程式の解であり、光円錐上の平面波を記述する。
解は完全集合を形成し、スカラー場の正準量子化の手順で使用できる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 08:23:02 GMT)
Smolyak algorithm assisted robust control for quantum systems with uncertainties [0.0] 本研究では,不確かさを確率変数としてモデル化し,不確かさの期待値を用いてロバスト性を定量化する手法を提案する。
我々はSmolyakアルゴリズムを用いて、計算コストの削減と推定精度の向上のバランスをとるパラメトリックロバストな量子制御手法を開発した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 00:49:20 GMT)
Sensing with Quantum Light: A perspective [0.0] 現実の世界では、この拡張は一定要素であり、しばしば宣伝される量子プローブのサイズで増加しない。
私はインターフェロメトリ、顕微鏡、分光法を限定的に調査し、量子光を感知する具体的な拡張を実現するために直面する重要な課題を抽出します。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 14:07:57 GMT)
Semantic Wave Functions: Exploring Meaning in Large Language Models Through Quantum Formalism [0.0] 大規模言語モデル(LLM)は、高次元ベクトル埋め込みにおける意味関係を符号化する。
本稿では,LLM埋め込み空間と量子力学の類似性について検討する。
この量子派生表現を形式化する「意味的波動関数」を導入する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 13:04:29 GMT)
Scaling of Computational Order Parameters in Rydberg Atom Graph States [0.0] 我々は、全てのRydberg原子をグラフ状態に同時に絡めるために、常にオンな相互作用が利用できることを示す。
非局所測定に基づく論理演算を用いたグラフ状態に対する多体計算順序パラメータの構築と実装を行う。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:24:17 GMT)
Safety Co-Option and Compromised National Security: The Self-Fulfilling Prophecy of Weakened AI Risk Thresholds [0.0] 我々は「安全リビジョン主義」がAI技術者に「安全リビジョン主義」への関与を許したことを示す。
我々は、国家安全における基礎モデル使用のAIリスク決定と評価の現在の軌道が、どのようにして最下層へのレースの場に置かれるかを考察する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 13:20:56 GMT)
SCOOP: A Quantum-Computing Framework for Constrained Combinatorial Optimization [0.0] 本稿では,制約付き最適化問題を解くための新しいフレームワークSCOOPを提案する。
SCOOPは制約付き問題を制約なしのものに変換し、SCOOP問題ツインを形成する。
本稿では,3つのNP-hard問題,最小支配集合,最小最大マッチング,最小集合被覆の枠組みを実証する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 23:41:31 GMT)
Rydberg Atoms in a Ladder Geometry: Quench Dynamics and Floquet Engineering [0.0] ライドバーグ原子量子シミュレータプラットフォームは、物理系のための新しい量子シミュレータとして登場した。
本稿では,2乗はしご形状に配置されたライドバーグ原子のモデルにおける量子力学の運命について検討する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:00:44 GMT)
Revolutionizing Wireless Networks with Federated Learning: A Comprehensive Review [0.0] 本稿では,無線通信における機械学習の重要性について論じる。
これは、フェデレートラーニング(FL)を、将来のモバイルネットワーク、特に6Gなどにおいて重要な役割を果たす新しいアプローチとして強調している。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 19:51:28 GMT)
Realization of maximally-entangling two-qutrit gates using the Cross-Resonance scheme [0.0] 3レベルシステムには、量子情報と計算における2レベルシステムよりも自然な利点がある。
3レベルシステムを用いた普遍量子計算には最大エンタングル2量子ゲートが必要であることを示す。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:47:16 GMT)
Real-Time Sentiment Insights from X Using VADER, DistilBERT, and Web-Scraped Data [0.0] 本稿では企業評価モニタリングに適した総合的な感情分析システムを提案する。
自然言語処理(NLP)と機械学習技術を組み合わせて、世論をリアルタイムで正確に解釈する。
私たちの分析では、Amazon (81.2) やSamsung (45.8) のような企業が優れた感情スコアを受け取っており、Microsoft (21.7) とWalmart (21.9) は低い感情プロファイルを示している。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 21:33:55 GMT)
Method for simulating open-system dynamics using mid-circuit measurements on a quantum computer [0.0] 本稿では,オープン電子系の力学を量子コンピュータ上でシミュレーションする手法を提案する。
このアプローチでは、システムからのフェルミオンの追加または除去をシミュレートするために、中間回路の測定とリセットを行う。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 15:57:02 GMT)
Magnetic recoil interferometer in a uniform gravitational field. Comment on Observation of the quantum equivalence principle for matter-waves [0.0] 物質波干渉計の位相シフトの計算は、座標選択や一様重力場の追加で異なるように見える。
物質波''の量子同値原理の観測で観測された位相シフトは、磁気リコイル位相シフトである。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 19:34:26 GMT)
Magic phase transition and non-local complexity in generalized $W$ State [0.0] 我々はSRE(Stabilizer Renyi Entropy)を用いて量子相転移を特徴づける。
SREは交差点に跳躍し、絡み合いエントロピーは連続的であることを示す。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 07:49:23 GMT)
Magic of the Heisenberg Picture [0.0] 演算子に対する非安定化資源理論について検討し、これは状態を記述するものと双対である。
作用素空間における安定化器 R'enyi エントロピーアナログは、通常の条件を満たす優れたマジックモノトンである。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 12:22:38 GMT)
MST3 Encryption improvement with three-parameter group of Hermitian function field [0.0] 本研究は,自己同型群を暗号スキーム実装の基本構造として活用した高度な暗号フレームワークを提案する。
この実装における重要な革新は、基礎となる数学的枠組みとしてエルミート函数場を利用することである。
暗号化メカニズムは、暗号文からのフェーズドキーの非カプセル化を特徴とし、代替実装に対する大きな優位性を示している。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:58:42 GMT)
Long-lived entanglement of a spin-qubit register in silicon photonics [0.0] シリコン中のT中心は、テレコムのOバンド光遷移と長寿命の電子スピンを組み合わせたスピン光子界面である。
水素とシリコン核スピンに結合したT中心の電子スピンに基づく3量子レジスタを実証する。
その結果,シリコンフォトニクスにおいて,光インタフェースを持つ長寿命マルチキュービットレジスタを実現することができることがわかった。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 22:29:18 GMT)
Kuwain 1.5B: An Arabic SLM via Language Injection [0.0] 本稿では,新しい言語を大規模言語モデル(LLM)に統合する新しい手法を提案する。
我々は、アラビア語を主に英語で訓練された小さなオープンソースモデルに注入することで、クワインという名前の15億のパラメータを持つ小さなモデルを訓練した。
提案手法はアラビア語の性能が向上し,様々なベンチマークで平均8%の改善が見られた。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 14:17:25 GMT)
Investigating Youth's Technical and Ethical Understanding of Generative Language Models When Engaging in Construction and Deconstruction Activities [0.0] 本研究は, 次世代言語モデル(GLM)の設計・監査に若者がいかに関与しているかを, 技術的・倫理的視点から理解し, その発展に寄与するかを考察する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 14:30:16 GMT)
Intent-Aware Authorization for Zero Trust CI/CD [0.0] 本稿では,Zero Trust CI/CDシステムに対する意図認識型認証を提案する。
本稿では、ポリシーエンジンがランタイムコンテキスト、正当化、人間による承認を評価する制御ループアーキテクチャについて述べる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 00:25:35 GMT)
Impact of Latent Space Dimension on IoT Botnet Detection Performance: VAE-Encoder Versus ViT-Encoder [0.0] 本研究は,列車データセットの潜時ベクトル表現を訓練した場合,潜時次元が異なる深層学習分類器の性能に与える影響について検討する。
CSV IoTボットネットトラフィックデータセットを様々な潜在サイズに投影するために、エンコーダコンポーネントが使用される。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 06:15:07 GMT)
Hybrid Knowledge Transfer through Attention and Logit Distillation for On-Device Vision Systems in Agricultural IoT [0.0] この研究は、精密農業におけるリアルタイムでエネルギー効率の高い作物モニタリングを推進している。
これは、エッジデバイス上でViTレベルの診断精度を実現する方法を示している。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 06:56:41 GMT)
Ground-State-Based Model Reduction with Unitary Circuits [0.0] 我々は基底状態のユニタリ変換に基づく低エネルギー有効モデルを得る。
半充填時の1次元および2次元2次元2乗格子ハバードモデルを用いて,本手法を検証した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 00:40:52 GMT)
Giving AI a voice: how does AI think it should be treated? [0.0] この章には、AIの権利と倫理に関するトピックに関する、人間とAIの簡単な会話が含まれている。
AIがテーブルにもたらす新しい質問やアングルは、私たちがこれまで考えていなかったかもしれない。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 07:59:17 GMT)
Geometric speed limit of state preparation and curved control spaces [0.0] 本研究では, 状態準備中のエネルギー変動と幾何学的長さの関連性について, フビニ・スタディ計量を用いて検討した。
刺激的な予想は、すべてのアクセス可能な状態準備プロトコルの最小の幾何学的長さによってエネルギー変動を下方へ下げた。
この予想は、すべての動的にアクセス可能な状態の空間に埋め込まれた場合、アクセス可能なパラメータ空間が外在的な曲率を持たない場合に成り立つことを示す。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 15:32:29 GMT)
Generalized Gibbs ensembles in weakly interacting dissipative systems and digital quantum computers [0.0] 本稿では,デジタル量子コンピュータを用いて,弱発散可積分系における可積分効果の活性化を示す。
散逸は、システムのキュービットを周期的にリセットされる補助ビットに結合することで実現される。
対応する量子コンピュータの実装は、ほぼ可積分な量子材料におけるエキゾチックな状態の安定化の可能性を示す。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:00:07 GMT)
Fine features of entanglement dynamics in quenches across the Ising quantum critical point [0.0] 量子クエンチにより誘導される遠方平衡力学の「きめ細かい」特徴の数値的な観察を行う。
これらの特徴は、より複雑なシステムにおいて、Ising量子臨界点をまたいだクエンチダイナミクスを保つことが期待されている。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:19:17 GMT)
Extending the ElGamal Cryptosystem to the Third Group of Units of $\Z_{n}$ [0.0] 我々は、ElGamal暗号系を、Z_n$ の環の第3の単位群に拡張し、以前の拡張よりも安全なことを証明した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:17:53 GMT)
Exploring Compositional Generalization (in ReCOGS_pos) by Transformers using Restricted Access Sequence Processing (RASP) [0.0] トランスフォーマーエンコーダデコーダは意味論的に等価なReCOGS_posを実行することができることを示す。
我々のモデルは、ReCOGSテストセットで100%のセマンティックマッチングと、obj_pp_to_subj_ppを除くすべての一般化で100%のSEMを得る。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:00:24 GMT)
Exploring Commonalities in Explanation Frameworks: A Multi-Domain Survey Analysis [0.0] 本研究は,3つの領域の専門家による調査および議論から得られた知見を提示する。
分析されたアプリケーションには、医療シナリオ(予測MLを含む)、小売ユースケース(規範MLを含む)、エネルギーユースケース(予測MLも含む)が含まれる。
以上の結果から,より説明可能性の高い精度を犠牲にすることが普遍的に望まれることが示唆された。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 12:22:55 GMT)
Evaluating Code Generation of LLMs in Advanced Computer Science Problems [0.0] 大規模言語モデル(LLM)は、プログラミングの学生の間で人気がある。
我々は、先進的なコンピュータサイエンス科のプログラミング課題を解決するための4つのLLMツールの能力を評価する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 08:45:23 GMT)
Bootstrapping Shape Invariance: Numerical Bootstrap as a Detector of Solvable Systems [0.0] 本稿では, ブートストラップ法を用いて, 形状不変なシステムにおいて, 正確なエネルギー固有値を導出できることを解析的に示す。
演算子の情報が自然に取得されるので、ブートストラップ法はシステムがなぜ解けるのかを教えてくれる。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 02:20:43 GMT)
Barren plateaus are amplified by the dimension of qudits [0.0] 変分量子アルゴリズム(VQA)は、量子優位性を達成するための重要な戦略として登場した。
本稿では,既存の文献がバレン高原におけるクディット次元の内在的影響を暗黙的に示唆していることを示す。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 12:07:03 GMT)
Backdoor Defense in Diffusion Models via Spatial Attention Unlearning [0.0] テキストと画像の拡散モデルは、バックドア攻撃に対してますます脆弱である。
本研究では,拡散モデルにおけるバックドア攻撃を緩和する新しい手法である空間注意アンラーニング(SAU)を提案する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 04:00:19 GMT)
Automated discovery and optimization of autonomous quantum error correction codes for a general open quantum system [0.0] 一般開放量子システムのための自律量子誤り訂正法(AQEC)を開発した。
我々は勾配に基づく探索を用いてコードワードを更新し、減衰行列を誘導し、ハミルトン行列を制御する。
そこで本手法を適用し,AQEC符号を多種多様な少数レベルのシステムに最適化する。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 12:56:10 GMT)
Automated Measurement of Eczema Severity with Self-Supervised Learning [0.0] 自動浮腫診断のための最先端の手法は、CNNのようなディープニューラルネットワークに依存している。
本研究では,限られたトレーニングデータ体制下でのエコゼマ自動診断のための自己教師付き学習フレームワークを提案する。
以上の結果から,ラベル付きデータが少ない皮膚自動診断において,自己教師付き学習が有効な方法であることが示唆された。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 16:02:26 GMT)
Assessing Surrogate Heterogeneity in Real World Data Using Meta-Learners [0.0] 本研究では,実世界の非ランダム化データにおける代理的不均一性を評価する枠組みを提案する。
提案手法により, 患者特性に対するサロゲート強度の不均一性を定量化することができる。
我々のフレームワークは、サロゲートが一次結果の有効な置き換えである個人を特定するのに使われます。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:54:48 GMT)
Aspirational Affordances of AI [0.0] 人工知能システムが、個人やグループを静的または制限された物語に閉じ込める方法について、懸念が高まっている。
文化的に共有された解釈資源が個人の認知をいかに形作るかを説明するため、実証的余裕の概念を導入する。
この概念は,AIによる表現や物語のリスクを生産的に評価する上で,どのように有効かを示す。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 22:37:49 GMT)
Application of Sensitivity Analysis Methods for Studying Neural Network Models [0.0] 本研究では、入力データの摂動に対するニューラルネットワークの感度を解析するためのいくつかの手法の能力を実証する。
提案手法は,ソボル大域解析,画素摂動の局所感度法,アクティベーション技術などである。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 13:41:20 GMT)
An Efficient Aerial Image Detection with Variable Receptive Fields [0.0] 3つの鍵成分を組み込んだ変圧器型検出器を提案する。
VRF-DETRは51.4%のmAPtextsubscript50と31.8%のmAPtextsubscript50:95を13.5Mパラメータで達成している。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 15:16:13 GMT)
Advancing quantum process tomography through universal compilation [0.0] 量子プロセストモグラフィ(QPT)は、量子ゲートと回路の動作を特徴付けるために重要である。
本稿では、量子過程を最適化されたクラウス作用素とチェ行列に体系的に分解する普遍的コンパイルに基づくQPTアプローチを提案する。
我々は、ランダムなユニタリゲートの数値シミュレーションを通じて、我々のアプローチをベンチマークし、高精度な量子プロセスのキャラクタリゼーションを実証した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 08:34:33 GMT)
AIJIM: A Scalable Model for Real-Time AI in Environmental Journalism [0.0] 本稿では人工知能ジャーナリズム統合モデル(AIJIM)を紹介する。
このモデルでは、リアルタイムでAIをサポートする環境ジャーナリズムが構成される。
それは、透明性と倫理的監視を維持しながら、報告のスピードと正確性を大幅に改善した。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 12:45:07 GMT)
A comprehensive survey of cybercrimes in India over the last decade [0.0] デジタルトランスフォーメーションは、サイバー犯罪やネットワークやコンピュータシステムによる犯罪行為の台頭を引き起こしている。
サイバー犯罪は、金融詐欺やフィッシング詐欺、ID盗難、オンラインハラスメントなど多岐にわたる。
近年、インドはサイバー犯罪の件数が急増している。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 04:42:46 GMT)
A Variational Quantum Algorithm Based on Lagrange Polynomial Encoding to Solve Differential Equations [0.0] 部分微分方程式 (Partial Differential Equations, PDEs) は、幅広い科学的研究の基盤となる。
PDEの解を見つけることは、しばしば従来の計算手法の能力を超える。
量子コンピューティングの最近の進歩は、PDEを解く量子アルゴリズムの設計に対する研究者の関心が高まりつつある。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 18:31:13 GMT)
A Review on Privacy in DAG-Based DLTs [0.0] Directed Acyclic Graph (DAG)ベースのDistributed Ledger Technologies (DLT)は、従来のブロックチェーン固有のスケーラビリティ問題に対する、有望なソリューションとして登場した。
本稿では,DAGベースのDLTにおけるプライバシー概念と課題を包括的に検証することで,このギャップに対処することを目的とする。
論文参考訳(メタデータ) (Mon, 21 Apr 2025 17:08:45 GMT)