NTIRE 2025 Challenge on Short-form UGC Video Quality Assessment and Enhancement: Methods and Results [179.1] NTIRE 2025 Challenge on Short-form Video Quality Assessment and Enhancement
課題は, (i) 映像品質評価(KVQ) と (ii) 拡散に基づく画像超解像(KwaiSR) の2つのトラックからなる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:45:34 GMT)
NTIRE 2025 Challenge on Day and Night Raindrop Removal for Dual-Focused Images: Methods and Results [173.6] NTIRE 2025 Challenge on Day and Night Raindrop removal for Dual-Focused Images。
この課題は、我々の収集した実世界のレインドロップ・クラリティーデータセットを使用して開発され、評価された、幅広い印象的なソリューションを受け取った。
この課題の主な目的は、様々な照明と焦点条件の下で雨滴を除去するタスクのための、新しく強力なベンチマークを確立することである。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:35:35 GMT)
PerceptionLM: Open-Access Data and Models for Detailed Visual Understanding [126.2] 我々は、画像とビデオの理解において透過的な研究を行うために、完全にオープンで再現可能なフレームワークでパーセプションモデル言語(PLM)を構築した。
モデルからの蒸留なしで標準的な訓練パイプラインを分析し、大規模合成データを調べ、重要なデータギャップを識別する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:59:56 GMT)
St4RTrack: Simultaneous 4D Reconstruction and Tracking in the World [106.9] St4RTrackは、RGB入力から世界座標フレーム内の動的ビデオコンテンツを同時に再構成し、追跡するフレームワークである。
静的および動的シーン幾何学の両方をキャプチャして、同じ世界において、同時に両方のポイントマップを予測する。
統合されたデータ駆動フレームワークの有効性と効率を実証し、世界フレームの再構築と追跡のための新しい広範囲なベンチマークを構築します。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:55:58 GMT)
DC-SAM: In-Context Segment Anything in Images and Videos via Dual Consistency [91.3] In-context segmentation に SAM と SAM2 を適応させるプロンプトチューニングに基づく Dual Consistency SAM (DCSAM) 法を提案する。
我々の重要な洞察は、高品質な視覚的プロンプトを提供することにより、SAMのセグメンテーションにおけるプロンプトエンコーダの機能を強化することである。
提案したDC-SAMは主に画像用に設計されているが、SAM2のサポートによりビデオ領域にシームレスに拡張できる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:34:30 GMT)
CAP-Net: A Unified Network for 6D Pose and Size Estimation of Categorical Articulated Parts from a Single RGB-D Image [86.8] 本稿では,ロボット操作作業における調音物体のカテゴリーレベルのポーズ推定に取り組む。
そこで本研究では,Categorical Articulated Partsの6次元ポーズとサイズを推定するためのシングルステージネットワークCAP-Netを提案する。
我々は,RGB画像と実センサからシミュレーションした深度雑音を特徴とするRGB-D調音データセットであるRGBD-Artデータセットを紹介した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:13:37 GMT)
NNTile: a machine learning framework capable of training extremely large GPT language models on a single node [83.9] NNTileはタスクベースの並列処理を実装したStarPUライブラリをベースとしている。
これは、大きなニューラルネットワークをトレーニングするために必要な特定の操作が、CPUコアまたはGPUデバイスのいずれかで実行されることを意味する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:22:32 GMT)
Why and How LLMs Hallucinate: Connecting the Dots with Subsequence Associations [82.4] 本稿では,幻覚を体系的に追跡・理解するサブシーケンス・アソシエーション・フレームワークを提案する。
主要な洞察は、支配的な幻覚協会が忠実なものを上回るときに生じる幻覚である。
ランダムな入力コンテキストにおける幻覚の確率を解析することにより因果列を同定するトレースアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 06:34:45 GMT)
Harmony: A Unified Framework for Modality Incremental Learning [81.1] 本稿では,連続的に進化するモーダルシーケンスを横断するインクリメンタル学習が可能な統一モデルの実現可能性について検討する。
本研究では,適応的アライメントと知識保持を実現するために,Harmonyという新しいフレームワークを提案する。
提案手法は適応性のある特徴変調と累積的モーダルブリッジングを導入する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 06:35:01 GMT)
VistaDPO: Video Hierarchical Spatial-Temporal Direct Preference Optimization for Large Video Models [80.9] ビデオ階層型空間-時間的直接参照最適化のためのフレームワークであるVistaDPOを紹介する。
VistaDPOは3つの階層レベルにまたがってテキストとビデオの好みのアライメントを強化する。
Video Hallucination、Video QA、Captioningパフォーマンスタスクなどのベンチマークの実験では、VistaDPOが既存のLVMのパフォーマンスを大幅に改善していることが示されている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:39:41 GMT)
EchoWorld: Learning Motion-Aware World Models for Echocardiography Probe Guidance [79.7] 本稿では,プローブ誘導のためのモーションアウェアな世界モデリングフレームワークであるEchoWorldを紹介する。
解剖学的な知識と運動によって引き起こされる視覚力学を符号化する。
200以上の定期的なスキャンから100万枚以上の超音波画像で訓練されている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:19:05 GMT)
Look Before You Decide: Prompting Active Deduction of MLLMs for Assumptive Reasoning [77.7] 本研究は,MLLMの最も普及している手法が,その問題に先入観を導入することで,容易に騙せることを示す。
また,モデルが積極的に複合推論を行うように促す新しい強化学習パラダイムを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:05:10 GMT)
3DResT: A Strong Baseline for Semi-Supervised 3D Referring Expression Segmentation [73.9] 3D参照式(3D-RES)は通常、広範囲のインスタンスレベルのアノテーションを必要とします。
半教師付き学習(SSL)は、制限付きラベル付きデータと豊富なラベル付きデータを使用することでこれを緩和し、アノテーションのコストを削減しながらパフォーマンスを向上する。
本稿では,3D-RESのための半教師付き学習フレームワークについて紹介し,3DResTという頑健なベースライン手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 02:50:52 GMT)
Perception Encoder: The best visual embeddings are not at the output of the network [70.9] 本稿では、単純な視覚言語学習によって訓練された画像と映像の理解のための最先端エンコーダであるPerception (PE)を紹介する。
対照的な視覚言語学習だけでは、これらの下流タスクに強力な汎用的な埋め込みを実現できることが分かっています。
さらなる研究を促進するために、私たちはモデル、コード、および合成および人手による注釈付きビデオの新しいデータセットをリリースしています。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:59:57 GMT)
A conversion theorem and minimax optimality for continuum contextual bandits [70.7] 本研究では,学習者が側情報ベクトルを逐次受信し,凸集合内の行動を選択する,文脈連続帯域幅問題について検討する。
目標は、受信したコンテキストのすべての基盤関数を最小化することです。
サブ線形の静的な後悔を達成するアルゴリズムを拡張して、サブ線形の文脈的後悔を実現することができることを示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 12:18:41 GMT)
TongUI: Building Generalized GUI Agents by Learning from Multimodal Web Tutorials [70.1] リッチなマルチモーダルWebチュートリアルから学習し,汎用GUIエージェントを構築するTongUIフレームワークを提案する。
我々は、5つのオペレーティングシステムと200以上のアプリケーションにまたがる143Kトラジェクトリデータを含むGUI-Netデータセットを作成する。
我々はGUI-Net上でQwen2.5-VL-3B/7Bモデルを微調整してTongUIエージェントを開発する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 06:15:56 GMT)
Hadamard product in deep learning: Introduction, Advances and Challenges [68.3] この調査では、基本的な未検討のプリミティブ、すなわちアダマール積を調べている。
様々なアプリケーションに広く実装されているにもかかわらず、アダマール製品は、コアアーキテクチャのプリミティブとして体系的に分析されていない。
本稿では,高次相関,マルチモーダルデータ融合,動的表現変調,効率的なペアワイズ演算の4つの主要領域を同定し,その応用の包括的分類について述べる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:26:29 GMT)
In-situ mid-circuit qubit measurement and reset in a single-species trapped-ion quantum computing system [67.4] 我々は,トラップイオン量子コンピューティングシステム上でのMCMR(In-situ Mid-circuit Measurement and Reset)演算を実装した。
測定されたキュービットからデータキュービットを分離する2つの方法を紹介し比較する。
2つの171textrmYb+$イオンの結晶上で、両手法を実験的に実証した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 00:10:35 GMT)
Generate, but Verify: Reducing Hallucination in Vision-Language Models with Retrospective Resampling [67.1] VLM(Vision-Language Models)は視覚的理解に優れ、視覚幻覚に悩まされることが多い。
本研究では,幻覚を意識したトレーニングとオンザフライの自己検証を統合した統合フレームワークREVERSEを紹介する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:59:22 GMT)
In Which Areas of Technical AI Safety Could Geopolitical Rivals Cooperate? [66.9] 我々は、AI安全研究における国際協力のリスクに影響を与える技術的要因を考察する。
我々は,このような協力が危険な能力を向上し,機密情報の共有や害の機会を提供する程度に焦点をあてる。
我々は、技術的AI安全研究の協力に特有の主要なリスクを考慮して、関連するリスクを管理する既存のフレームワークを補うことができると論じる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:03:56 GMT)
THOUGHTTERMINATOR: Benchmarking, Calibrating, and Mitigating Overthinking in Reasoning Models [65.4] 本稿では,問題レベルの難易度を近似的に測定し,問題の難易度と最適なトークン使用量との間に明確な関係があることを実証する。
一般に、推論モデルは、特に簡単な問題に対して、キャリブレーションが不十分である。
トレーニング不要なブラックボックス復号法であるTHOUGHTTERMINATORを導入する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 22:16:30 GMT)
LLM-Select: Feature Selection with Large Language Models [64.5] 大規模言語モデル(LLM)は、データサイエンスの標準ツールに匹敵するパフォーマンスで、最も予測可能な機能を選択することができる。
以上の結果から,LSMはトレーニングに最適な機能を選択するだけでなく,そもそもどの機能を収集すべきかを判断する上でも有用である可能性が示唆された。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 21:50:37 GMT)
CLIMB: CLustering-based Iterative Data Mixture Bootstrapping for Language Model Pre-training [63.1] 本稿では,事前学習環境でデータ混合物を発見し,評価し,精製する自動フレームワークを提案する。
ClimbLabは、20のクラスタを研究用グラウンドとして、フィルタされた1.2トリリオントーケンコーパスであり、ClimbMixはコンパクトだが強力な400ビリオントーケンデータセットである。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:58:13 GMT)
DeepSeek-Inspired Exploration of RL-based LLMs and Synergy with Wireless Networks: A Survey [62.7] 強化学習(RL)に基づく大規模言語モデル(LLM)が注目されている。
無線ネットワークは、RLベースのLLMの強化を必要とする。
無線ネットワークは、RLベースのLLMの効率的なトレーニング、デプロイメント、分散推論のための重要な基盤を提供する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 01:30:17 GMT)
Rethinking Temporal Fusion with a Unified Gradient Descent View for 3D Semantic Occupancy Prediction [62.7] 視覚に基づく3次元意味的占有予測(VisionOcc)のための時間融合法であるGAFusionを提案する。
これは、VisionOccフレームワーク内の時間融合の未調査の側面を開き、時間的手がかりと融合戦略の両方に焦点を当てる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:05:33 GMT)
Syntactic and Semantic Control of Large Language Models via Sequential Monte Carlo [62.0] 広い範囲のLMアプリケーションは、構文的制約や意味論的制約に適合するテキストを生成する必要がある。
我々は、連続モンテカルロ(SMC)に基づく制御LM生成のためのアーキテクチャを開発する。
我々のシステムはLew et al. (2023) のフレームワーク上に構築されており、言語モデル確率型プログラミング言語と統合されている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:49:40 GMT)
ArtistAuditor: Auditing Artist Style Pirate in Text-to-Image Generation Models [61.6] 本稿では,テキスト・画像生成モデルにおける新しいデータ利用監査手法を提案する。
ArtistAuditorは、多彩なスタイルの表現を得るためにスタイル抽出器を使用し、アートワークをアーティストのスタイルのサンプリングとして扱う。
6つのモデルとデータセットの組み合わせによる実験結果は、ArtistAuditorが高いAUC値を達成可能であることを示している。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:15:38 GMT)
CompGS++: Compressed Gaussian Splatting for Static and Dynamic Scene Representation [60.7] CompGS++はコンパクトガウスプリミティブを活用して正確な3Dモデリングを実現する新しいフレームワークである。
私たちの設計は、プリミティブ間の冗長性をなくすという原則に基づいている。
私たちの実装は、さらなる研究を促進するためにGitHubで公開されます。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:33:01 GMT)
Human-Activity AGV Quality Assessment: A Benchmark Dataset and an Objective Evaluation Metric [56.7] 我々は人間活動型AI生成ビデオ(AGV)の先駆的な研究を行っている。
視覚的品質評価と意味歪みの同定に焦点をあてる。
我々は,人間活動AGVの質を自動解析するために,AI生成人活動ビデオ品質指標(GHVQ)という客観的評価指標を開発した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:28:43 GMT)
Chemist-X: Large Language Model-empowered Agent for Reaction Condition Recommendation in Chemical Synthesis [55.3] Chemist-Xは、化学合成における反応条件最適化(RCO)タスクを自動化する包括的なAIエージェントである。
このエージェントは、検索強化世代(RAG)技術とAI制御のウェットラブ実験を実行する。
我々の自動ウェットラブ実験の結果は、LLMが制御するエンドツーエンドの操作を、ロボットに人間がいない状態で行うことで達成され、Chemist-Xの自動運転実験における能力が証明された。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 22:42:04 GMT)
Global becomes local: Efficient many-body dynamics for global master equations [55.2] この研究は、グローバル・マスター方程式とローカル・マスター方程式の問題を前進させる。
我々は、相反(エネルギー)空間における短波相関時間展開について議論し、ジャンプ作用素の連続展開を導いた。
さらに、局所レッドフィールドマスター方程式を新しい局所リンドブラッド形式にマッピングし、従来の局所リンドブラッドアプローチと同じ概念上の利点を持つ方程式を与える。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 09:21:43 GMT)
Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective [50.3] 本稿では,SemVarEffectとSemVarBenchというベンチマークを用いて,テキスト・画像合成における入力のセマンティックな変化と出力の因果性を評価する。
本研究は,T2I合成コミュニティによるヒューマンインストラクション理解の探索を促進する効果的な評価枠組みを確立する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:31:14 GMT)
HiScene: Creating Hierarchical 3D Scenes with Isometric View Generation [50.2] HiSceneは、2D画像生成と3Dオブジェクト生成のギャップを埋める新しい階層的なフレームワークである。
構成構造を維持しながら2次元表現に整合した3次元コンテンツを生成する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:33:39 GMT)
ChemVLM: Exploring the Power of Multimodal Large Language Models in Chemistry Area [50.2] textbfChemVLMは、化学応用のためのオープンソースの化学マルチモーダル大規模言語モデルである。
ChemVLMは、テキストと視覚の化学情報の両方を理解する能力を高めるために、慎重にキュレートされたバイリンガルデータセットで訓練されている。
我々はChemVLMを、様々なタスクにおいて、オープンソースおよびプロプライエタリな多モーダルな大規模言語モデルに対してベンチマークする。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 03:01:41 GMT)
MemLLM: Finetuning LLMs to Use An Explicit Read-Write Memory [50.0] 本稿では,構造化および明示的な読み書きメモリモジュールを統合することで,大規模言語モデル(LLM)の拡張手法であるMemLLMを紹介する。
実験の結果, 言語モデリング, 特に知識集約型タスクにおいて, MemLLMはLLMの性能と解釈可能性を向上させることが示唆された。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:10:52 GMT)
Benchmarking the Spatial Robustness of DNNs via Natural and Adversarial Localized Corruptions [49.5] 本稿では,セグメンテーションモデルの空間的ロバスト性を評価するための特別な指標を紹介する。
本稿では,モデルロバスト性をより深く理解する手法として,地域対応型マルチアタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック分析を提案する。
その結果、モデルがこれらの2種類の脅威に異なる反応を示すことが明らかとなった。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:43:20 GMT)
Chain-of-Modality: Learning Manipulation Programs from Multimodal Human Videos with Vision-Language-Models [49.5] カオス・オブ・モダリティ(CoM)は、ビジョン言語モデルがマルチモーダルな人間の実演データを推論することを可能にする。
CoMはタスクプランを洗練し、詳細な制御パラメータを生成し、ロボットは単一のマルチモーダルなヒューマンビデオプロンプトに基づいて操作タスクを実行できる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 21:31:23 GMT)
An All-Atom Generative Model for Designing Protein Complexes [49.1] APM(All-Atom Protein Generative Model)は、マルチチェーンタンパク質をモデル化するためのモデルである。
原子レベルの情報を統合し、多鎖タンパク質のデータを活用することで、APMは鎖間相互作用を正確にモデル化し、結合能力を持つタンパク質複合体をゼロから設計することができる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:37:41 GMT)
EmoVoice: LLM-based Emotional Text-To-Speech Model with Freestyle Text Prompting [48.6] EmoVoiceは感情制御可能なTSモデルで、大きな言語モデル(LLM)を利用して、きめ細かい自然言語の感情制御を可能にする。
EmoVoice-DBは、表現力のある音声と自然言語記述によるきめ細かい感情ラベルを特徴とする、高品質な40時間感情データセットである。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 11:50:04 GMT)
United in Diversity? Contextual Biases in LLM-Based Predictions of the 2024 European Parliament Elections [42.7] 大規模言語モデル(LLM)に基づく「合成サンプル」は、人間の調査の効率的な代替手段として有効であると議論されている。
合成サンプル」は、訓練データや微調整プロセスが多様な文脈を表わさないため偏見を呈する可能性がある。
本研究は, LLM生成合成試料を公衆の意見予測に利用できるか, どのような条件で利用できるかを検討する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 21:21:10 GMT)
TUMLS: Trustful Fully Unsupervised Multi-Level Segmentation for Whole Slide Images of Histology [41.9] We present a Trustful fully unsupervised multi-level segmentation method (TUMLS) for whole slide image (WSIs)。
TUMLSは、低解像度のトレーニングデータの中で異なる組織タイプを特定するために、オートエンコーダ(AE)を特徴抽出器として採用している。
このソリューションは、臨床医にシームレスに統合され、WSI全体の検査を簡潔で解釈可能なクロスレベル洞察のレビューに変換する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:48:05 GMT)
DIDS: Domain Impact-aware Data Sampling for Large Language Model Training [41.9] ドメインレベルのサンプリング戦略を最適化するために、ドメインインパクト対応データサンプリング(DIDS)を提案する。
DIDSは、同等のトレーニング効率を維持しながら平均パフォーマンスを3.4%向上させる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:09:38 GMT)
SAR Object Detection with Self-Supervised Pretraining and Curriculum-Aware Sampling [41.2] 衛星搭載合成開口レーダ画像における物体検出は、都市モニタリングや災害対応といったタスクにおいて大きな可能性を秘めている。
衛星搭載SAR画像における小さな物体の検出は、比較的低い空間分解能と固有のノイズのため、特に複雑な問題を引き起こす。
本稿では,SARオブジェクト検出モデルであるTransARを紹介する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 19:44:05 GMT)
Understanding Attention Mechanism in Video Diffusion Models [41.1] 我々は,T2Vモデルの空間的および時間的注意ブロックの深い摂動解析を行う。
その結果,時間的・空間的な注意マップはビデオのタイミングやレイアウトだけでなく,合成ビデオの美的品質にも影響を及ぼすことがわかった。
本稿では,映像品質の向上とテキスト誘導映像編集を可能にする2つの方法を提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 01:49:31 GMT)
Information Gain-Guided Causal Intervention for Autonomous Debiasing Large Language Models [40.9] 現在の大規模言語モデル(LLM)は、まだデータセットのバイアスをキャプチャして、推論時に利用することができる。
本稿では,情報ゲイン誘導型因果介入脱バイアスフレームワークを提案する。
IGCIDBはLLMを効果的にデバイアスし、様々なタスクにおける一般化性を改善する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 12:39:25 GMT)
Natural Language Outlines for Code: Literate Programming in the LLM Era [35.5] 我々は、開発者がAI支援を提供するための新しいモダリティとインタラクションサーフェスとして、自然言語のアウトラインを使うことを提案する。
コード関数のNLアウトラインは、簡潔な散文で書かれた複数のステートメントを含み、コードを分割し、その主要なアイデアをリテラトプログラミングのスタイルで要約する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 22:02:36 GMT)
Why We Feel: Breaking Boundaries in Emotional Reasoning with Multimodal Large Language Models [35.2] 感情の反応を駆動する因果的要因に着目した感情解釈(EI)を提案する。
従来の感情認識とは異なり、EIタスクは単なるラベル付けではなくトリガーについての推論を必要とする。
EIBenchは1,615の基本的なEIサンプルと50の複雑なEIサンプルを含む大規模なベンチマークである。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 09:34:26 GMT)
NoisyRollout: Reinforcing Visual Reasoning with Data Augmentation [34.8] NoisyRolloutは、きれいな画像と適度に歪んだ画像の両方の軌跡を混合する強化学習アプローチである。
視覚知覚における標的の多様性と結果の推論パターンを導入している。
NoisyRolloutは5つのベンチマークで、オープンソースのRLチューニングモデルの最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:10:13 GMT)
SkyReels-V2: Infinite-length Film Generative Model [33.0] Infinite-length Film Generative Model である SkyReels-V2 を提案し,マルチモーダル大言語モデル(MLLM),マルチステージ事前学習,強化学習,拡散強制フレームワークを提案する。
我々は,基本映像生成のためのプログレッシブ・レゾリューション・プレトレーニングを確立し,その後4段階のポストトレーニング強化を行った。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:37:27 GMT)
FANeRV: Frequency Separation and Augmentation based Neural Representation for Video [32.4] ビデオのための周波数分離と拡張に基づくニューラル表現(FANeRV)を提案する。
FANeRVは離散ウェーブレット変換を用いて入力フレームを高周波数成分と低周波数成分に明示的に分離する。
特別に設計されたゲートネットワークは、これらの周波数成分を効果的に融合して最適な再構成を行う。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 09:49:23 GMT)
Local Data Quantity-Aware Weighted Averaging for Federated Learning with Dishonest Clients [32.1] フェデレートラーニング(FL)は、データをローカルクライアントを離れることなく、ディープラーニングモデルの協調トレーニングを可能にする。
最も一般的に使用される集約手法は、各クライアントからのデータの量に基づいて、各クライアントのコントリビューションを反映した重み付けアグリゲーションである。
We propose a novel secure underlineFederated underlineData qunderlineuantity-underlineaware weighted averaging method (FedDua)。
これにより、FLサーバはアップロードされたローカルモデル勾配に基づいて、各クライアントからのトレーニングデータの量を正確に予測できる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 01:50:24 GMT)
SEAL: Semantic Attention Learning for Long Video Representation [32.0] 本稿では,長編ビデオの新たな統一表現であるセマンティック・アテンション・ラーニング(SEAL)を紹介する。
計算複雑性を低減するために、長いビデオは3つの異なるタイプのセマンティックエンティティに分解される。
我々の表現は多用途であり、様々な長いビデオ理解タスクに応用できる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 02:23:52 GMT)
Structured 3D Latents for Scalable and Versatile 3D Generation [28.7] 汎用的で高品質な3Dアセット作成のための新しい3D生成手法を提案する。
基本となるのは、異なる出力フォーマットへのデコードを可能にする、構造化されたLATent表現である。
これは、疎人口の少ない3Dグリッドと、強力な視覚基盤モデルから抽出された濃密な多視点視覚特徴を統合することで実現される。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 03:14:38 GMT)
Do Vision-Language Models Represent Space and How? Evaluating Spatial Frame of Reference Under Ambiguities [27.9] 視覚言語モデル(VLM)の空間的推論能力を評価するための評価プロトコルを提案する。
あいまいさを解消する英語の慣行と幾らかの整合性があるにもかかわらず、本実験はVLMの重大な欠点を明らかにした。
視覚言語モデルと人間の認知的直感の整合化を図りつつ、我々は空間的推論のあいまいさと文化的な多様性により多くの注意を払っている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:59:27 GMT)
Does Refusal Training in LLMs Generalize to the Past Tense? [27.5] 我々は過去に有害な要求を改定することは、しばしば多くの最先端のLCMを脱獄するのに十分であることを示した。
また, 将来の時制の改革は効果が低いことが示唆され, 過去の歴史的問題については, 仮説的な未来の問題よりも良質であると考える傾向が示唆された。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 18:36:08 GMT)
LAD-Reasoner: Tiny Multimodal Models are Good Reasoners for Logical Anomaly Detection [27.5] 本稿では,論理的推論を組み込んで従来の異常検出を拡張したReasoning Logical Anomaly Detection (RLAD)を提案する。
本稿では,Qwen2.5-VL 3B上に構築された小型マルチモーダル言語モデルであるLAD-Reasonerを提案する。
MVTec LOCO ADデータセットの実験では、LAD-Reasonerははるかに小さく、精度はQwen2.5-VL-72BとF1のスコアと一致している。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:41:23 GMT)
Accelerating Non-Conjugate Gaussian Processes By Trading Off Computation For Uncertainty [27.3] 非共役ガウス過程(NCGP)は、分類的、順序的、連続的なデータをモデル化するための柔軟な確率的枠組みを定義する。
近似誤差はモデルの信頼性に悪影響を及ぼし、予測の不確実性を考慮しない。
このエラーを明示的にモデル化する反復的手法のファミリーを紹介します。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:47:26 GMT)
Abstract Meaning Representation-Based Logic-Driven Data Augmentation for Logical Reasoning [27.2] 本稿では,論理駆動型データ拡張手法AMR-LDAを提案する。
AMR-LDAは元のテキストを抽象的意味表現(AMR)グラフに変換する。
修正されたAMRグラフは、拡張データを生成するためにテキストに変換される。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 11:14:20 GMT)
ReTool: Reinforcement Learning for Strategic Tool Use in LLMs [27.1] ReToolは、ツール統合学習によるロングフォーム推論を強化する。
モデルは400のトレーニングステップで67%の精度を達成する。
注目すべきは、ReTool-32Bが72.5%の精度で設定できることだ。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:46:07 GMT)
Think-to-Talk or Talk-to-Think? When LLMs Come Up with an Answer in Multi-Step Arithmetic Reasoning [26.8] 本研究では,算術的多段階推論における言語モデルの内部推論過程について検討する。
ケーススタディでは、モデル間の系統的な内部推論パターンが見つかる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 06:57:50 GMT)
Tree-NeRV: A Tree-Structured Neural Representation for Efficient Non-Uniform Video Encoding [26.6] Inlicit Neural Representations for Videos (NeRV)がビデオ表現の強力なパラダイムとして登場した。
既存のNERVベースの手法は、時間軸に沿った一様サンプリングに依存しており、最適速度歪み(RD)性能に繋がる。
本稿では,木構造を持つ新しい特徴表現であるTree-NeRVを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 12:40:33 GMT)
ACoRN: Noise-Robust Abstractive Compression in Retrieval-Augmented Language Models [26.6] 抽象圧縮は、より小さなランガウジュモデルを用いてクエリ関連コンテキストを凝縮する。
検索された文書には、質問に答えることに関係のない情報や、事実の誤りによって誤解を招く情報が含まれていることが多い。
この挙動は、抽象圧縮機は正しい解答に必要な重要な情報を省略する傾向にあることを示している。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 06:05:35 GMT)
Let Me Grok for You: Accelerating Grokking via Embedding Transfer from a Weaker Model [26.5] 「グロキング」とは、ニューラルネットワークがトレーニングデータを最初に記憶し、一般化が不十分な現象であるが、訓練が長引いた後に突然、ほぼ完全な一般化へと移行する現象である。
本稿では、ニューラルネットワークのトレーニングにおいて、グラッキングを高速化する簡易かつ原理的な方法であるGrokTransferを提案する。
我々は、通常訓練において遅延一般化が常に発生する合成XORタスクにおいて、GrokTransferがターゲットモデルを遅延なく直接一般化できるようにすることを厳密に証明する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 19:08:40 GMT)
It's All Connected: A Journey Through Test-Time Memorization, Attentional Bias, Retention, and Online Optimization [26.4] 我々は、ニューラルネットワークを連想記憶モジュールとして再認識し、注意バイアスと呼ばれる内部的目的を用いてキーと値のマッピングを学習する。
高速並列化可能なトレーニングプロセスを維持しつつ、既存の線形RNNのパワーを超える3つの新しいシーケンスモデル(Moneta、Yaad、Memora)を提示する。
例えば、Mirasの特定のインスタンスは、言語モデリング、コモンセンス推論、リコール集約タスクのような特別なタスクで例外的なパフォーマンスを達成し、トランスフォーマーや他の現代的な線形リカレントモデルよりも優れています。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:59:33 GMT)
GRAIL: Gradient-Based Adaptive Unlearning for Privacy and Copyright in LLMs [26.1] 広範囲なデータセットでトレーニングされた大規模言語モデル(LLM)は、しばしばセンシティブな情報を学ぶ。
望ましくない情報を除去するために、スクラッチからモデル全体をリトレーニングすることは、費用がかかることと実用的でないことの両方である。
本稿では,GRAIL(AdaptIve unLearning)を提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 06:16:32 GMT)
ShadowKV: KV Cache in Shadows for High-Throughput Long-Context LLM Inference [25.6] ShadowKVは、LLM(Long-Context Large Language Model)推論システムである。
低ランクのキーキャッシュを格納し、バリューキャッシュをオフロードすることで、より大きなバッチサイズと長いシーケンスのためにメモリフットプリントを削減する。
最大6$times$大きなバッチサイズをサポートし、A100 GPUで最大3.04$times$までスループットを向上できる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 21:19:19 GMT)
Collaborative Learning of On-Device Small Model and Cloud-Based Large Model: Advances and Future Directions [25.6] 従来のクラウドベースの大規模モデル学習フレームワークは、レイテンシ、コスト、パーソナライゼーション、プライバシの懸念によって、ますます制約を受けています。
本調査では,デバイス上の小型モデルとクラウドベースの大規模モデルとの協調学習という,新たなパラダイムを探求する。
ハードウェア、システム、アルゴリズム、アプリケーション層を包括的にレビューします。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 06:41:30 GMT)
ArtCrafter: Text-Image Aligning Style Transfer via Embedding Reframing [25.6] ArtCrafterは、テキストから画像へのスタイル転送のための新しいフレームワークである。
注意に基づくスタイル抽出モジュールを導入する。
また,新たなテキスト画像アライメント拡張コンポーネントを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 12:49:56 GMT)
An Empirically Grounded Identifiability Theory Will Accelerate Self-Supervised Learning Research [25.6] 自己監視学習(SSL)は多くの現在のAIシステムを動かしている。
SSLのプラトン的見解は、異なる方法や工学的アプローチにもかかわらず、すべての表現は同じプラトン的イデアルに収束することを示唆している。
我々は Identifiability Theory (IT) を Singular Identifiability Theory (SITh) と呼ぶものに拡張することを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:10:33 GMT)
A Coding-Theoretic Analysis of Hyperspherical Prototypical Learning Geometry [25.5] HPL(Hyperspherical Prototypeal Learning)は、単位超球面上のクラスプロトタイプを設計する表現学習における教師ありアプローチである。
これまでのHPLのアプローチには、以下の欠点がある: (i) 予想外の最適化手順に従う; (ii) 理論上は健全であるが、1つの潜在次元にのみ制約される。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:04:48 GMT)
Judging the Judges: A Systematic Study of Position Bias in LLM-as-a-Judge [24.2] 本研究では,LLM審査員の位置バイアスをペアワイドおよびリストワイド比較設定で評価する。
偏見に寄与する判断レベル、候補レベル、タスクレベルを識別する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 02:43:35 GMT)
All-in-One Transferring Image Compression from Human Perception to Multi-Machine Perception [23.9] 単一モデル内でマルチタスク適応をサポートする非対称アダプタフレームワークを提案する。
本手法は圧縮効率を維持しつつ,複数のタスクに対して高い性能を実現する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:06:52 GMT)
Prototypes are Balanced Units for Efficient and Effective Partially Relevant Video Retrieval [23.8] 本稿では,ビデオ内のさまざまなコンテキストを一定数のプロトタイプにエンコードするプロトタイプPRVRフレームワークを提案する。
ビデオコンテキストを正確に符号化しながら、テキストクエリを介してプロトタイプを検索できるように、クロスモーダルおよびユニモーダル再構成タスクを実装した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:43:29 GMT)
The Limits of Tractable Marginalization [23.7] マージナライゼーション(Marginalization) -- すべての代入をその入力のサブセットにまとめること -- は、基本的な計算問題である。
関数に対して仮想的なエビデンスを余分に実行する効率的な実RAMが存在する場合、その関数のマルチ線形表現のための小さな回路が存在することを示す。
その結果、関数に対して仮想的なエビデンスを余分に実行する効率的な実RAMが存在する場合、その関数のマルチ線形表現のための小さな回路が存在することを示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:54:56 GMT)
Representation Learning for Tabular Data: A Comprehensive Survey [23.6] 行と列として構造化されたタブラルデータは、機械学習の分類と回帰アプリケーションにおいて最も一般的なデータタイプの一つである。
ディープニューラルネットワーク(DNN)は、最近、表現学習の能力を通じて有望な結果を実証した。
既存の手法を一般化能力に応じて3つの主要なカテゴリに分類する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:58:23 GMT)
MAIN: Mutual Alignment Is Necessary for instruction tuning [23.4] 高品質な命令応答対は各コンポーネントの個々の品質によって定義されるのではなく、相互にアライメントする程度によって定義される。
本稿では,相互制約による命令と応答のコヒーレンスを保証する相互アライメントフレームワーク(MAIN)を提案する。
実験により、LLaMAやMistralのようなモデルは、このフレームワーク内で微調整され、複数のベンチマークで従来のメソッドよりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:02:44 GMT)
Low-hallucination Synthetic Captions for Large-Scale Vision-Language Model Pre-training [23.4] 本稿では,高品質,低ハロゲン化,知識に富んだ合成キャプションを生成するための新しいパイプラインを提案する。
我々の連続DPO法は幻覚の減少に顕著な結果をもたらす。
35の視覚言語タスクに対して、我々のデータでトレーニングされたモデルは、少なくとも6.2%の大幅なパフォーマンス向上を達成する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:40:06 GMT)
Benchmarking Multi-National Value Alignment for Large Language Models [23.4] 大規模言語モデルと5つの主要国の値の整合性を評価するためのベンチマークであるNaVABを紹介する。
NaVABは、価値評価データセットを効率的に構築するための国家価値抽出パイプラインを実装している。
各国の様々なLCMについて広範な実験を行い、その結果、不整合シナリオの識別支援に関する知見を提供する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:01:38 GMT)
Can LLMs reason over extended multilingual contexts? Towards long-context evaluation beyond retrieval and haystacks [22.9] MLRBenchは多言語長文推論のための合成ベンチマークである。
並列性があり、リークに耐性があり、任意のコンテキスト長に対してスケーラブルであるように設計されている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 11:02:35 GMT)
Online Video Understanding: OVBench and VideoChat-Online [22.8] マルチモーダル大言語モデル(MLLM)はオフラインビデオ理解において著しく進歩している。
これらのモデルを自律運転や人間とコンピュータのインタラクションといった現実のシナリオに適用することは、ユニークな課題を提示します。
本稿では,評価ベンチマーク,モデルアーキテクチャ,トレーニング戦略の3つの観点から,体系的な取り組みについて述べる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 10:10:16 GMT)
Uncertainty Calibration for Counterfactual Propensity Estimation in Recommendation [22.7] クリック後変換率(CVR)は、オンライン顧客の嗜好の信頼できる指標である。
本稿では,CVR予測の妥当性に基づくデバイアス化のためのモデルに依存しないキャリブレーションフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 05:48:09 GMT)
ProteinGPT: Multimodal LLM for Protein Property Prediction and Structure Understanding [22.6] 本稿では,タンパク質の多モード多言語モデルであるProteinGPTを紹介する。
タンパク質GPTは、タンパク質配列と構造エンコーダを線形射影層に統合し、正確な表現適応を保証する。
我々は,20~30個のプロパティタグと5〜10個のQAペアを付加した132,092個のタンパク質の大規模データセットを構築し,GPT-4oを用いた命令調整プロセスを最適化した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 21:55:37 GMT)
Towards Characterizing Subjectivity of Individuals through Modeling Value Conflicts and Trade-offs [22.6] 我々は,ソーシャルメディア上での個人の主観性を特徴付け,その道徳的判断を大規模言語モデルを用いて推測する。
本研究では,個人の主観的根拠をよりよく表現するために,ユーザ生成テキストにおける価値相反やトレードオフを観察するフレームワークであるSOLARを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 04:20:05 GMT)
Robo-SGG: Exploiting Layout-Oriented Normalization and Restitution for Robust Scene Graph Generation [22.6] 本稿では,ロバストシーングラフ生成のための新しい手法Robo-SGG(Layout-Oriented Normalization and Restitution for Robust Scene Graph Generation)を提案する。
提案するRobo-SGGモジュールは,任意のベースラインSGGモデルに容易に統合可能なプラグイン・アンド・プレイコンポーネントとして設計されている。
我々は,PredCls,SGCls,SGDetタスクに対するmR@50の5.6%,8.0%,6.5%の相対的な改善を実現し,汚職シーングラフ生成ベンチマーク(VG-C,GQA)における新しい最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 03:09:22 GMT)
Universal Approximation with XL MIMO Systems: OTA Classification via Trainable Analog Combining [22.3] 適切なアナログ合成成分を持つeXtremely Large (XL) Multi-Input Multiple-Output (MIMO) 無線システムは,フィードフォワードニューラルネットワークと同様に,ユニバーサル関数近似器の特性を示す。
本稿では,従来のデジタル処理やプリプロセッシングを必要とせず,OTA(Over-The-Air)エッジ推論の新たな定式化について述べる。
深層学習手法や従来のEMMと比較して,提案手法は複雑度を桁違いに低減したパー性能を実現し,超低消費電力無線機器に非常に魅力がある。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:53:30 GMT)
Securing the Skies: A Comprehensive Survey on Anti-UAV Methods, Benchmarking, and Future Directions [22.2] 無人航空機(UAV)は、インフラ検査、監視および関連するタスクには不可欠であるが、重要なセキュリティ課題も導入している。
本調査は,3つの目的(分類,検出,追跡)を中心に,抗UAVドメインを広範囲に調査する。
単一モダリティとマルチセンサパイプラインをまたいだ最先端のソリューションを体系的に評価する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 09:25:04 GMT)
Crossing the Human-Robot Embodiment Gap with Sim-to-Real RL using One Human Demonstration [21.9] ロボットに巧妙な操作スキルを教えるには、何百ものデモをウェアラブルや遠隔操作で集める必要がある。
我々は,デクスタラスな操作ポリシーをトレーニングするための,新しい実-実-実-実-実-実-実-のフレームワークであるHuman2Sim2Robotを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 03:15:20 GMT)
Towards Training-Free Open-World Classification with 3D Generative Models [21.8] 我々は3次元オープンワールド分類のための3次元生成モデルの先駆的な探索を行っている。
また、回転不変の特徴抽出器を製作する。
この革新的なシナジーは、トレーニングなし、オープンカテゴリ、ポーズ不変の利点を、私たちのパイプラインに与えます。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:39:35 GMT)
Persona-judge: Personalized Alignment of Large Language Models via Token-level Self-judgment [21.7] ペルソナ・ジャッジ(Persona-judge)は、トレーニング不要なパーソナライズされたアライメントと、目に見えない好みのアライメントを可能にする、新しい差別的パラダイムである。
Persona-judgeは、パーソナライズされたアライメントに対して、スケーラブルで、計算的に効率的なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 05:50:13 GMT)
Unifying Feature-Based Explanations with Functional ANOVA and Cooperative Game Theory [21.4] 局所的およびグローバルな特徴に基づく説明のための統一的なフレームワークを導入する。
特徴分布の影響を決定する3つのfANOVA分解を導入する。
次に、合成および実世界のデータセットにおけるフレームワークの有用性を実証的に示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:06:21 GMT)
GaSLight: Gaussian Splats for Spatially-Varying Lighting in HDR [21.4] GaSLightは、通常の画像から空間的に変化する光を生成する方法である。
ガウススプレートを用いて3次元照明をモデル化し,空間変動照明を実現する。
我々の手法はHDR推定の最先端結果をもたらす。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 23:38:32 GMT)
DeepResearcher: Scaling Deep Research via Reinforcement Learning in Real-world Environments [20.5] 我々は、LLMベースのディープリサーチエージェントのエンドツーエンドトレーニングのための、初の総合的なフレームワークであるDeepResearcherを紹介する。
固定コーパス内にすべての必要な情報が存在すると仮定するRAGベースのアプローチとは異なり、我々の手法はオープンウェブのノイズ、非構造化、動的性質をナビゲートするエージェントを訓練する。
オープンドメインの研究タスクに関する大規模な実験は、DeepResearcherがエンジニアリングベースの素早いベースラインよりも最大28.9ポイントの大幅な改善を達成していることを示している。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 04:46:08 GMT)
GeoSense: Evaluating Identification and Application of Geometric Principles in Multimodal Reasoning [20.4] 幾何学的問題解決(GPS)は視覚的理解と記号的推論の両方を必要とする課題である。
既存のベンチマークでは、大きな言語モデルにおいて、人間のような幾何学的推論機構の両次元を共同で評価することができない。
MLLMの幾何学的推論能力を評価するために設計された最初の総合的バイリンガルベンチマークであるGeoSenseを紹介する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 02:46:27 GMT)
SymmCD: Symmetry-Preserving Crystal Generation with Diffusion Models [20.4] 結晶対称性を生成過程に明示的に組み込む新しい拡散型生成モデルであるSymphCDを提案する。
The Materials Projectのサブセット上でSymCDの競争性能を示し、現実的な対称性と予測特性を持つ多種多様で有効な結晶を得る。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 02:41:44 GMT)
Response to recent comments on Phys. Rev. B 107, 245423 (2023) and Subsection S4.3 of the Supp. Info. for Nature 638, 651-655 (2025) [20.0] トポロジカルギャッププロトコル(トポロジカルギャッププロトコル、英: Topological gap protocol、TGP)は、トポロジカルフェーズを高い信頼性と人間のバイアスなしで識別する統計検査である。
プロトコルの鍵となる測度は、自明な領域を位相的に誤って特定する確率である。
偽発見率 (FDR) の推定では, 欠陥は確認されていない。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:14:32 GMT)
Distribution Backtracking Builds A Faster Convergence Trajectory for Diffusion Distillation [19.9] 本研究では,拡散モデルのサンプリング速度を高速化する分散バックトラック蒸留(DisBack)を提案する。
DisBackは既存の蒸留法よりも高速で収束性が高く、ImageNet 64x64データセットのFIDスコアは1.38である。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 03:58:19 GMT)
Should We Tailor the Talk? Understanding the Impact of Conversational Styles on Preference Elicitation in Conversational Recommender Systems [19.8] 本研究では,会話スタイルの違いが会話推薦システム(CRS)の嗜好評価,タスクパフォーマンス,ユーザ満足度に及ぼす影響について検討した。
以上の結果から,ユーザの専門知識に基づく会話戦略の適応と,スタイル間の柔軟性の実現により,CRSにおけるユーザの満足度とレコメンデーションの有効性が向上することが示唆された。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:01:17 GMT)
A Quantum of Learning: Using Quaternion Algebra to Model Learning on Quantum Devices [19.7] 本稿では,量子学習機械の学習における適応と最適化の課題について考察する。
四元数の除算代数は、量子ビット上の計算と測定の操作を表現する効果的なモデルを導出するために用いられる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:51:21 GMT)
ChatEXAONEPath: An Expert-level Multimodal Large Language Model for Histopathology Using Whole Slide Images [19.7] 本稿では,WSIを用いた病理組織学のエキスパートレベルのMLLMについて紹介する。
62.9%の受け入れ率でChatEXAONEPathを用いて病理像を診断できることを実証した。
提案モデルでは, 膵臓WSIsと臨床経過を種々のがんタイプから理解することができる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:33:17 GMT)
Decentralized Federated Domain Generalization with Style Sharing: A Formal Modeling and Convergence Analysis [19.6] 本論文は,領域一般化目標と学習過程の形式的数学的解析の欠如を動機としたものである。
我々は、ピアツーピアネットワーク内のデバイスが、データセットから推論されたスタイル情報を共有することによって、DGを実現するための、完全に分散化されたDGアルゴリズムを開発した。
我々は、$textttStyleDDG$が、最小限の通信オーバーヘッドでターゲットドメイン間の精度を大幅に改善できることを示した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:52:03 GMT)
Multimodal LLMs Can Reason about Aesthetics in Zero-Shot [19.6] 本稿では,マルチモーダルLCMの推論能力を審美判断に効果的に活用する方法を検討する。
MLLMは美的推論において幻覚の傾向を示しており、主観的な意見と根拠のない芸術的解釈が特徴である。
我々の研究は、人間の美的基準を真に理解し、評価し、生成できるAIシステムへの道を開いた。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:14:09 GMT)
Context Switching for Secure Multi-programming of Near-Term Quantum Computers [19.4] 同時に2ビットのCNOTゲートからのクロストークはセキュリティ上のリスクを引き起こす。
ハードウェアエラープロファイルを知らずにクロストークを利用するゼロナレッジ・タンパリング・アタック(ZKTA)を設計する。
本稿では,複数のコンテキストにまたがるプログラムを実行することで,ZKTAを防御するコンテキストスイッチング手法であるQONTEXTSを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 04:34:36 GMT)
Arithmetic Transformers Can Length-Generalize in Both Operand Length and Count [19.1] トランスフォーマーはしばしば長さの一般化に苦しむため、トレーニング中に遭遇したものよりも長いシーケンスに一般化できない。
本研究は,算術変換器で最初に達成された2~3倍の長さのタスクを一般化する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:18:02 GMT)
Pandora: A Code-Driven Large Language Model Agent for Unified Reasoning Across Diverse Structured Knowledge [18.6] Unified Structured Knowledge Reasoning (USKR)は、テーブル、データベース、知識グラフなどの構造化されたソースを統一的に利用することで、自然言語の質問(NLQ)に答えることを目的としている。
既存のUSKRメソッドは、タスク固有の戦略を採用するか、SKRタスク間の知識伝達を活用するのに苦労するカスタム定義の表現に依存している。
本稿では、textscPythonのtextscPandas APIを利用して、統一知識表現を構築する、textscPandoraという新しいUSKRフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:18:09 GMT)
GPG: A Simple and Strong Reinforcement Learning Baseline for Model Reasoning [17.5] グループポリシーグラディエント(GPG)と呼ばれる最小主義的RLアプローチを提案する。
従来の手法とは異なり、GAGは元のRL目標を直接最適化するので、損失関数のサロゲートが不要になる。
本手法は補助的な技術や調整に頼ることなく優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:53:07 GMT)
How Do Social Bots Participate in Misinformation Spread? A Comprehensive Dataset and Analysis [17.5] 本論文は,Sina Weiboプラットフォーム上でのソーシャルボットと誤情報との相互作用を初めて探求するものである。
誤情報の観点からは、このデータセットは11,393個の誤情報と16,416個の実情報を含むマルチモーダルである。
ソーシャルボットの観点から見ると、このデータセットには65,749のソーシャルボットと345,886の真のアカウントが含まれている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 09:37:38 GMT)
SAM-Based Building Change Detection with Distribution-Aware Fourier Adaptation and Edge-Constrained Warping [17.5] 建築変化検出は、都市開発、災害評価、軍事偵察において困難である。
既存のアダプタベースファインチューニングアプローチは、不均衡な建物分布の課題に直面している。
分布を考慮したフーリエ適応とエッジ拘束型ワープを備えたSAMベースの新しいネットワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 03:47:43 GMT)
The Hitchhiker's Guide to Program Analysis, Part II: Deep Thoughts by LLMs [17.5] BugLensは、静的解析の精度を大幅に改善する、ポストリファインメントフレームワークである。
0.10 (raw) と 0.50 (半自動精製) から 0.72 に精度を上げ、偽陽性を著しく減少させる。
この結果から,構造化LCMベースのワークフローは静的解析ツールの有効性を有意に向上させることができることが示唆された。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 02:28:35 GMT)
Déjà Vu: Multilingual LLM Evaluation through the Lens of Machine Translation Evaluation [17.2] 多言語大言語モデル(mLLM)の生成能力と言語カバレッジは急速に進歩している。
しかし、mLLMの評価方法には、包括性、科学的厳密性、研究機関間の一貫した採用の欠如がある。
同様の課題に直面し、何十年もの間、透過的なレポーティング標準を開発してきた分野である、機械翻訳(MT)評価と平行関係を描いています。
我々はこれらの知見を,mLLM研究・開発のための実行可能なレコメンデーションのチェックリストに抽出する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 21:12:10 GMT)
Towards Cardiac MRI Foundation Models: Comprehensive Visual-Tabular Representations for Whole-Heart Assessment and Beyond [17.1] ViTaは、短軸長軸ビューから3D+Tスタックを統合することで、心臓循環を完全に捉えることができる。
このマルチモーダルパラダイムは、心臓表現型や生理的特徴予測など、幅広い下流タスクをサポートする。
リッチな画像特徴と患者コンテキストを橋渡しする共有潜在表現を学習することで、ViTaは従来のタスク固有のモデルを超えることができる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:46:19 GMT)
An Analysis of Malicious Packages in Open-Source Software in the Wild [17.0] オープンソースのソフトウェア(OSS)エコシステムは、マルウェアによるセキュリティ上の脅威に悩まされている。
OSSマルウェアの研究には、高品質なデータセットの欠如、マルウェアの多様性の欠如、攻撃キャンペーンコンテキストの欠如の3つの制限がある。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 00:45:56 GMT)
Accurate Tracking of Arabidopsis Root Cortex Cell Nuclei in 3D Time-Lapse Microscopy Images Based on Genetic Algorithm [16.7] 本研究では,シロイヌナズナの根の細胞パターンと体積間の空間的関係の知識を用いた遺伝的アルゴリズム(GA)に基づく正確な追跡手法を提案する。
本手法は,シロイヌナズナ根先端の長期ライブ画像データセットを用いて評価され,手作業による微調整により核を正確に追跡する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 06:07:17 GMT)
UniEdit-Flow: Unleashing Inversion and Editing in the Era of Flow Models [16.5] 拡散モデルの強力な代替手段としてフローマッチングモデルが登場した。
拡散のために設計された既存の反転と編集法は、しばしばそれらに効果がないか、適用できない。
本稿では,フローモデルにおけるインバージョンと編集のための予測器ベースのフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:24:23 GMT)
Mirror, Mirror of the Flow: How Does Regularization Shape Implicit Bias? [16.4] 入射バイアスは、モデルをいかに一般化するかを説明する上で重要な役割を果たす。
重量減少のような明示的な規則化は、過度な適合を防ぐためにしばしば用いられる。
トレーニング力学の幾何学における持続的影響を解析する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 12:17:51 GMT)
Training-Free Hierarchical Scene Understanding for Gaussian Splatting with Superpoint Graphs [16.2] ガウス原始体から直接スーパーポイントグラフを構築する訓練自由フレームワークを導入する。
スーパーポイントグラフはシーンを空間的にコンパクトでセマンティックなコヒーレントな領域に分割し、ビュー一貫性の3Dエンティティを形成する。
提案手法は,30時間以上のセグメンテーションを高速化し,最先端のオープン語彙セグメンテーション性能を実現する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:56:07 GMT)
Bayesian Density-Density Regression with Application to Cell-Cell Communications [16.1] 多変量分布を多変量分布に回帰するスケーラブルなフレームワークを提案する。
このフレームワークは、集団規模のシングルセルデータから通信を推測する応用によって動機付けられている。
鍵となる課題は、これらの分布が異なる次元の異なる空間に存在することである。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 03:46:03 GMT)
Sign-In to the Lottery: Reparameterizing Sparse Training From Scratch [16.1] スクラッチ(PaI)からのスパースニューラルネットワークのトレーニングと密度とスパーストレーニングの間のパフォーマンスギャップは、効率的なディープラーニングのための主要な障害となる。
本稿では,符号フリップを確実に誘導する動的reパラメタライゼーションを用いたSign-Inを提案する。
このようなサインフリップは、厳密でスパースなトレーニングが達成できるものと相補的なものです。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 10:01:59 GMT)
ES-FUZZ: Improving the Coverage of Firmware Fuzzing with Stateful and Adaptable MMIO Models [16.0] 組込みシステム(ES)のテストにはグレーボックスファジリングが広く使われている
ファームウェアの周辺機器のメモリマップされたI/O(MMIO)挙動をファームウェアのバイナリから推測するファズーもある。
本研究では,ステートフルMMIOモデルを用いて,各ファジィのコードカバレッジを改善するためのES-Fuzzを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 23:26:26 GMT)
Unexpected but informative: What fixation-related potentials tell us about the processing of confusing program code [15.5] 我々はプログラマに不明瞭なプログラムコードパターンのオンライン処理を解析するが、コンピュータではない。
プログラムコードにおける曖昧なものと対照的に、混乱の原子は400msから700msの時間で前頭葉の後期陽性を引き起こす。
これらのデータは、プログラムコードや自然言語における予期せぬ情報入力に応答して、脳が同様の神経認知機構を担っていることを示唆するものである。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:08:05 GMT)
Aligning Constraint Generation with Design Intent in Parametric CAD [15.2] エンジニアリングスケッチは、制約によって連結された幾何学的プリミティブで構成されている。
設計が容易に編集できるように、制約は設計意図を効果的に捉えなければならない。
生成CADモデルの整列に向けた重要な第一歩は、すべての幾何学的プリミティブを完全に制約する制約を生成することである。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:59:54 GMT)
High-Fidelity Image Inpainting with Multimodal Guided GAN Inversion [15.2] 本稿では,画像インペイントのための新しいGANインバージョン手法MMInvertFillを提案する。
MMInvertFillは、主に事前変調のマルチモーダル誘導エンコーダと、F&W+遅延空間のGANジェネレータを含む。
MMInvertFillは他の最先端技術よりも質的に定量的に優れていることを示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 10:58:45 GMT)
Learning from Similar Linear Representations: Adaptivity, Minimaxity, and Robustness [15.1] 我々は,不整形なタスクを扱いながら,テキストに類似するタスクから学習する方法を研究している。
両手法が大局的に最適であることを示すために,情報理論の下限を提供する。
また,未知の固有次元に適応するしきい値アルゴリズムを導入する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:40:48 GMT)
GraphOmni: A Comprehensive and Extendable Benchmark Framework for Large Language Models on Graph-theoretic Tasks [15.1] LLMのグラフ推論能力を評価するためのベンチマークフレームワークであるGraph Omniを提案する。
以上の結果から, 単連化やプロンプト戦略が他より一貫して優れていないことが示唆された。
これらの知見に感化され、我々は、最高のシリアライズとプロンプトのペアリングを動的に選択する強化学習に基づくアプローチを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 09:01:16 GMT)
Control the GNN: Utilizing Neural Controller with Lyapunov Stability for Test-Time Feature Reconstruction [15.1] グラフニューラルネットワーク(GNN)の性能は、トレーニングとサンプル分布のテストの相違の影響を受けやすい。
リアプノフ安定理論に基づく新しいノード特徴再構成法を提案する。
提案手法の有効性は,複数のデータセットにわたる広範な実験を通じて検証し,大幅な性能向上を示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 09:27:02 GMT)
Enhancing Explainability and Reliable Decision-Making in Particle Swarm Optimization through Communication Topologies [14.9] 本研究では,コミュニケーショントポロジの違いが収束行動や探索行動にどのように影響するかに着目した。
適応型IOHxプレナーを用いて,これらのトポロジが情報流,多様性,収束速度にどのように影響するかを検討する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 10:05:10 GMT)
ZeroSumEval: An Extensible Framework For Scaling LLM Evaluation with Inter-Model Competition [14.8] ZeroSumEvalは,大規模言語モデル(LLM)のための動的かつ競争的かつ進化的な評価フレームワークである。
ZeroSumEvalには、セキュリティ上の課題(Capture the Flag)、古典的なボードゲーム(chs)、知識テスト(MathQuiz)など、さまざまな種類のゲームが含まれている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 02:14:21 GMT)
Two Tasks, One Goal: Uniting Motion and Planning for Excellent End To End Autonomous Driving Performance [14.7] かつてのエンドツーエンドの自動運転アプローチは、しばしば計画と動きのタスクを分離し、それらを別々のモジュールとして扱う。
本稿では,新しい2段階軌道生成フレームワークであるTTOGを提案する。
第1段階では、多種多様な軌道候補が生成され、第2段階では、車両の状態情報を通じてこれらの候補を精製することに焦点を当てる。
周囲の車両状態の問題を緩和するため、TTOGは自車用データ訓練状態推定器を採用し、その後他の車両に拡張した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 05:52:35 GMT)
Quantum algorithm for solving nonlinear differential equations based on physics-informed effective Hamiltonians [14.4] 本稿では,量子コンピュータ上での微分方程式の解法を,実効ハミルトニアン作用素の基底状態にエンコードすることで解く方法を提案する。
我々のアルゴリズムはチェビシェフ空間におけるそのような作用素の構成に依存し、実効ハミルトニアンは大域微分とデータ制約の和である。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:59:33 GMT)
From Regulation to Support: Centering Humans in Technology-Mediated Emotion Intervention in Care Contexts [14.4] 情動支援」は「情動規制」に代わるアプローチであり、感情的幸福に対する人間中心のアプローチを強調している。
この研究は、個人的および認知的視点を超えて、多様な人間の感情的な要求を理解することを促進する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 03:35:01 GMT)
Error bounds for composite quantum hypothesis testing and a new characterization of the weighted Kubo-Ando geometric means [14.4] 可換の場合、状態の重み付けされた幾何学的手段を考えると、仮説当たりの2つの状態がこのアプローチに最適であることを示す。
また、2つの量子チャネルの重み付けされたKubo-Ando幾何学的手段の類似した最適性を示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:32:39 GMT)
Contour Field based Elliptical Shape Prior for the Segment Anything Model [14.3] 楕円形の先行情報は、医学や自然画像における特定のタスクに対する画像分割の精度を向上させる上で重要な役割を担っている。
SAM(Segment Anything Model)など、既存のディープラーニングベースのセグメンテーション手法では、楕円形状のセグメンテーション結果の効率向上に苦慮することが多い。
本稿では,従来の楕円形状を,変分法を用いて深層学習に基づくSAM画像分割手法に統合する手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 01:08:24 GMT)
Scaling Laws for Data-Efficient Visual Transfer Learning [14.1] 本稿では,視覚伝達学習におけるデータ効率のスケーリング法則に関する最初の実践的枠組みを確立する。
本稿では,蒸留効率の重要な転換点を明らかにする蒸留境界理論を提案する。
この研究は、データ制限されたレシエーションのスケーリング法則を再定義し、大規模事前学習と実践的な下流適応の知識ギャップを埋める。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:01:01 GMT)
Protecting Confidentiality, Privacy and Integrity in Collaborative Learning [14.0] 効果的な機械学習(ML)トレーニングを促進するためには、データセット所有者とモデル所有者のコラボレーションが必要である。
Citadel++は、データセット、モデル、トレーニングコードの機密性と、個々のユーザのプライバシを同時に保護するために設計された、協調的なMLトレーニングシステムである。
我々の実験によると、Citadel++は、データセット所有者とモデル所有者の機密性とプライバシ要件に準拠しながら、モデルユーティリティとパフォーマンスを提供する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 11:38:29 GMT)
Multi-Step Deductive Reasoning Over Natural Language: An Empirical Study on Out-of-Distribution Generalisation [13.9] 自然言語で表現された多段階推論のための反復型ニューラルネットワークであるIMA-GloVe-GAを紹介する。
本モデルでは,RNNに基づく反復型メモリニューラルネットワークを用いて推論を行う。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 11:11:51 GMT)
PR-Attack: Coordinated Prompt-RAG Attacks on Retrieval-Augmented Generation in Large Language Models via Bilevel Optimization [13.8] 大規模言語モデル(LLM)は、幅広いアプリケーションで顕著な性能を示している。
それらはまた、時代遅れの知識や幻覚への感受性のような固有の制限も示している。
近年の取り組みはRAGベースのLLMのセキュリティに重点を置いているが、既存の攻撃方法は3つの重大な課題に直面している。
本稿では,少数の有毒テキストを知識データベースに導入する新しい最適化型攻撃であるPrompt-RAGアタック(PR-アタック)を提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 02:01:42 GMT)
Towards Translating Real-World Code with LLMs: A Study of Translating to Rust [13.7] 大規模言語モデル(LLM)は、ほとんどのプログラミング言語でコードを記述する能力のため、コード翻訳において有望であることを示す。
実世界のオープンソースプロジェクトから抽出したコードについて検討する。
FLOURINEは、差分ファジィを使用して、Rust翻訳が元のソースプログラムと同等のI/Oかどうかをチェックする、エンドツーエンドのコード変換ツールである。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:18:24 GMT)
TimeCapsule: Solving the Jigsaw Puzzle of Long-Term Time Series Forecasting with Compressed Predictive Representations [13.7] 我々は高次元情報圧縮の原理に基づいたモデルであるTimeCapsuleを紹介する。
本稿では,圧縮表現領域の内部予測について提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:54:26 GMT)
Stochastic Gradient Descent in Non-Convex Problems: Asymptotic Convergence with Relaxed Step-Size via Stopping Time Methods [13.7] Gradient Descent (SGD) は機械学習の研究で広く使われている。
本稿では,より緩やかなステップサイズ条件下でのSGDの収束解析法を提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 02:56:20 GMT)
Comprehending Knowledge Graphs with Large Language Models for Recommender Systems [13.3] 知識グラフを改善するために,CoLaKGと呼ばれる新しい手法を提案する。
項目中心のサブグラフ抽出とプロンプトエンジニアリングを用いることで、ローカル情報を正確に理解することができる。
さらに、意味に基づく検索モジュールを通じて、各項目は知識グラフ全体の関連項目によって濃縮される。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 11:50:59 GMT)
Transfer Learning via Auxiliary Labels with Application to Cold-Hardiness Prediction [13.1] 寒冷な気候は、そのレジリエンスや、季節を通じて変化する寒冷な硬さによって、果実の収穫物に大きな凍害を引き起こすことがある。
これにより、農夫が高価な凍害対策をいつ導入するかを決めるのに役立つ予測的冷暖化モデルの開発につながった。
残念なことに、モデルトレーニングのためのコールドハードネスデータは、特別な機器や専門知識を必要とするため、一部の果実品種でのみ利用可能である。
本研究では,農家が表現学データを活用してより正確な寒冷環境予測を実現するための移動学習フレームワークであるTransfer via Auxiliary Labels(TAL)を導入する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:51:38 GMT)
Minute-long quantum coherence enabled by electrical depletion of magnetic noise [13.0] 固体スピン欠陥を古典的な電子デバイスに統合することで、量子情報処理の新しい機会を実現できる。
等方的に精製した炭化ケイ素 (SiC) p-i-n ダイオードのバイアス制御により, ノイズ源だけでなく磁気ノイズ源も劣化することを示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:58:52 GMT)
Tackling Social Bias against the Poor: A Dataset and Taxonomy on Aporophobia [12.9] アポロフォビア(Aporophobia)は、貧困に生きる人々に対する社会的偏見であり、貧困緩和政策を設計、承認、実施する上で大きな障害となっている。
この研究は、アポロフォビアの概念を運用し、有害な信念を特定し、追跡し、ソーシャルメディア上で貧しい人々に対する差別的行動を行うための最初のステップを示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:53:14 GMT)
Relevance for Human Robot Collaboration [12.9] 本稿では,人間ロボットコラボレーション(HRC)のための新しい次元削減プロセスであるrelevanceを紹介する。
提案手法は,連続的に動作する知覚モジュールを組み込み,シーン内のキュー十分性を評価し,フレキシブルな定式化と計算の枠組みを適用する。
シミュレーションの結果,一般のHRCセットアップの妥当性を正確に予測する枠組みと方法論が示された。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:19:17 GMT)
GraphQLer: Enhancing GraphQL Security with Context-Aware API Testing [12.9] APIは、Webアプリケーションのためのオープンソースのクエリおよび操作言語であり、APIの柔軟な代替手段を提供する。
不正なデータアクセス、DoS(DoS)攻撃、インジェクションなどの脆弱性に公開する。
既存のテストツールは、依存関係と実行コンテキストから生じるセキュリティリスクを見渡すことで、機能の正しさに重点を置いている。
本論文は,APIのコンテキスト対応型セキュリティエスカレーションテストフレームワークである。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 21:58:15 GMT)
SHA256 at SemEval-2025 Task 4: Selective Amnesia -- Constrained Unlearning for Large Language Models via Knowledge Isolation [12.8] 大規模言語モデル(LLM)は、トレーニング中に頻繁にセンシティブな情報を記憶し、公開可能なモデルをデプロイする際にリスクを生じさせる。
本稿では, 因果媒介分析と層固有の最適化を組み合わせた, 対象未学習におけるSemEval-2025タスク4の解を提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:05:40 GMT)
In-context KV-Cache Eviction for LLMs via Attention-Gate [12.7] KVキャッシュ技術は、大規模言語モデル(LLM)の推論の標準となっている。
本稿では,Attention-Gateと呼ばれる軽量モジュールをモデルに注入することで,KVキャッシュの動的な消去ポリシーを実現する。
提案手法は複数のシナリオにまたがって実験的に評価され,冗長トークンの有効排除は効率を向上するだけでなく,性能も向上することを示した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 03:51:06 GMT)
Convergence and Implicit Bias of Gradient Descent on Continual Linear Classification [12.7] 逐次的勾配降下(GD)による複数線形分類タスクの連続学習について検討する。
タスクが連分可能であれば、トレーニングされた線形分類器の(オフラインの)最大マルジン解への方向性収束を示す。
また、タスクがもはや関節分離不能な場合を分析し、循環順序で訓練されたモデルが関節損失関数の唯一の最小値に収束することを示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:35:48 GMT)
Are You Doubtful? Oh, It Might Be Difficult Then! Exploring the Use of Model Uncertainty for Question Difficulty Estimation [12.6] 本研究では,不確実性の特徴が難易度予測に大きく寄与することを示し,難易度は質問に正しく答えられる学生数に逆比例することを示した。
このアプローチの価値を示すことに加えて,USMLEとCMCQRDの公開データセット上で,我々のモデルが最先端の結果を達成することも観察した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 20:03:13 GMT)
Performance guarantees of light-cone variational quantum algorithms for the maximum cut problem [12.1] 変分量子アルゴリズム(VQA)は、古典的計算よりも短期的な量子コンピューティングの利点を実証することを約束している。
本稿では,標準VQAの最適ゲート列を選択することで,光円錐VQAを提案する。
1ラウンドの光円錐VQAがMaxCut問題に対して0.7926の近似比を達成することを証明した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 12:38:16 GMT)
Post-pre-training for Modality Alignment in Vision-Language Foundation Models [12.1] 本稿では,CLIPモデルの事前学習と微調整の段階における事前学習手法であるCLIP-Refineを提案する。
ゼロショットのパフォーマンス劣化を伴わずに、小さな画像テキストデータセットに対する1エポックトレーニングとフィーチャースペースの整合性を目指す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:46:19 GMT)
FashionDPO:Fine-tune Fashion Outfit Generation Model using Direct Preference Optimization [12.1] そこで本研究では,ファッション服のファッション生成モデルであるファッションDPO(FashionDPO)を,直接選好最適化を用いて微調整する手法を提案する。
このフレームワークは、タスク固有の報酬関数を設計することなく、ファッション生成モデルに対する汎用的な微調整アプローチを提供することを目的としている。
iFashionとPolyvore-Uの2つのデータセットの実験では、モデルのパーソナライズされた好みに合わせる能力を高める上で、我々のフレームワークの有効性が示されている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 12:41:41 GMT)
A Virtual Machine for Arbitrary Low-Precision GPGPU Computation in LLM Serving [12.1] Serving Large Language Models (LLMs) はAIを利用したアプリケーションには必須だが、かなりの計算資源を必要とする。
低精度の計算が資源消費を減らしながら効率を向上する鍵となる技術として登場した。
低精度カーネルを生成するための既存のアプローチは、2つのパワーを持つウェイトビット幅に限られている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:45:03 GMT)
Set You Straight: Auto-Steering Denoising Trajectories to Sidestep Unwanted Concepts [12.0] 我々は、望ましくない概念を避けるためにdeNoising TrajectoriesをガイドするANTと呼ばれる微調整フレームワークを導入する。
ANTは重要な洞察に基づいて構築されている。
単一概念の消去のために,より徹底的かつ効率的な消去を可能にする拡張型重み対応マップを提案する。
マルチコンセプト消去のために,目的関数は汎用的なプラグアンドプレイソリューションを提供し,性能を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 09:29:30 GMT)
Learning to Help in Multi-Class Settings [12.0] ローカルモデルをサーバサイドモデルで拡張することにより、ハイブリッドシステムを確立することができる。
提案されたLearning to Help(L2H)モデルは、固定ローカル(クライアント)モデルが与えられたサーバモデルをトレーニングする。
L2DとL2Hの両方のトレーニングでは、クライアントでリジェクタを学習して、サーバに問い合わせるタイミングを決定する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 03:05:03 GMT)
Exploring the Trade-Offs: Quantization Methods, Task Difficulty, and Model Size in Large Language Models From Edge to Giant [11.8] 量子化は、大規模および小規模言語モデルのコスト効率のよいデプロイのための有望なソリューションとして注目を集めている。
1Bから405Bパラメータにまたがる命令調整モデルの総合評価を行い、13のデータセットに対して4つの量子化手法を適用した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 01:37:50 GMT)
Towards Scientific Intelligence: A Survey of LLM-based Scientific Agents [11.7] 大規模言語モデル(LLM)は、重要なタスクを自動化する科学的エージェントへと進化している。
汎用LLMとは異なり、特殊エージェントはドメイン固有の知識、高度なツールセット、堅牢な検証メカニズムを統合する。
一般的なエージェントと異なる理由と、さまざまな科学分野の研究を進める方法を強調します。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:26:34 GMT)
A Survey and Evaluation of Adversarial Attacks for Object Detection [11.5] 深層学習モデルは、信頼できるが誤った予測をすることを欺くような敵対的な例に対して脆弱である。
この脆弱性は、自動運転車、セキュリティ監視、安全クリティカルな検査システムなどの高リスクなアプリケーションに重大なリスクをもたらす。
本稿では,対象検出アーキテクチャに特有の敵攻撃を分類するための新しい分類枠組みを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:52:09 GMT)
ELAB: Extensive LLM Alignment Benchmark in Persian Language [11.2] 本稿では,ペルシア語大言語モデルを批判的倫理的次元に整合させるための包括的評価枠組みを提案する。
ペルシャ語と文化の文脈に適応することで、既存のLLM評価フレームワークのギャップに対処する。
このベンチマークは、 (i) 翻訳データ、 (ii) 合成によって生成された新しいデータ、 (iii) 自然収集された新しいデータという3つのタイプのペルシア語ベンチマークを生成する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 00:50:41 GMT)
UniPhys: Unified Planner and Controller with Diffusion for Flexible Physics-Based Character Control [11.1] 拡散に基づく行動クローニングフレームワークであるUniPhysを導入し,動作計画と制御をひとつのモデルに統一する。
UniPhysは、テキスト、軌跡、ゴールなどのマルチモーダル入力に条件付けされた柔軟で表現力のあるキャラクターの動きを可能にする。
また,UniPhysは,様々な制御タスクにおいて,動作自然性,一般化,ロバスト性において,従来の手法よりも優れていたことを示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 00:04:31 GMT)
Accommodate Knowledge Conflicts in Retrieval-augmented LLMs: Towards Reliable Response Generation in the Wild [11.1] 大規模言語モデル (LLM) には高度な情報検索システムがある。
LLMは、しばしば内部記憶と検索された外部情報の間の知識の衝突に直面している。
スウィンVIBは,変分情報ボトルネックモデルのパイプラインを,検索した情報の適応的拡張に統合する新しいフレームワークである。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:40:31 GMT)
Towards Lossless Token Pruning in Late-Interaction Retrieval Models [11.0] ColBERTのような後期の相互作用型ニューラルIRモデルは、多くのベンチマークで競合効率と効率のトレードオフを提供する。
すべてのドキュメントトークンのコンテキスト表現を保持するには、巨大なメモリスペースが必要です。
本稿では,文書とクエリのスコアに影響を与えることなくトークンをエミュレートする方法を定義するための原則的アプローチを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 09:18:58 GMT)
PriorDiffusion: Leverage Language Prior in Diffusion Models for Monocular Depth Estimation [10.9] 拡散モデルのテキスト・ツー・イメージ事前学習において得られた帰納的バイアスを活用することにより,先行言語は単眼深度推定を向上させることができると論じる。
本稿では,アフィン不変深度を推定するために,画像と対応するテキスト記述を併用した事前学習型テキスト・画像拡散モデルを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 18:32:36 GMT)
Embodied Neuromorphic Control Applied on a 7-DOF Robotic Manipulator [10.6] 逆ダイナミクスは、ロボットシステムの関節空間からトルク空間にマップする基本的なロボット工学の問題である。
スパイキングニューラルネットワークを用いて、動作データの連続性を利用して制御精度を改善し、チューニングパラメータを除去する。
この研究は、概念実証から複雑な実世界のタスクへの応用への一歩前進によって、具体化されたニューロモルフィック制御を推し進める。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:13:37 GMT)
From Sands to Mansions: Towards Automated Cyberattack Emulation with Classical Planning and Large Language Models [10.6] 脅威情報による防衛をサポートするために、包括的で最新のサイバー攻撃データセットが必要である。
我々はAuroraを提案する。Auroraは、サードパーティの攻撃ツールと脅威情報レポートを使って、自律的にサイバー攻撃をエミュレートするシステムである。
Auroraを使って1000以上のアタックチェーンを含むデータセットを作成します。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:54:48 GMT)
The Role of Empathy in Software Engineering -- A Socio-Technical Grounded Theory [10.3] その重要性にも拘わらず、ソフトウェア工学(SE)ではいまだに共感があまり研究されていない。
本研究は、SEにおける共感の役割と、SE活動とプロセスが共感を考慮してどのように改善できるかを考察した。
我々の理論は、共感が起こる状況、それを形成する条件、その存在と欠如の原因と結果について詳述している。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:13:18 GMT)
Large-Scale Contextual Market Equilibrium Computation through Deep Learning [10.3] 本稿では,市場均衡を近似する深層学習方式であるMarketFCNetを紹介する。
MarketFCNetは,既存の手法と比較して,競争性能と実行時間を大幅に低下させることを示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:05:19 GMT)
Fleet of Agents: Coordinated Problem Solving with Large Language Models [10.2] Fleet of Agents(FoA)は、動的ツリー検索をナビゲートするエージェントとして大きな言語モデルを利用する、原則化されたフレームワークである。
FoAは多数のエージェントを発生させ、それぞれが自律的に検索空間を探索し、次に選択フェーズを行う。
FoAはすべてのベンチマーク手法の中で最高のコスト品質のトレードオフを実現し、FoA + LMA3.2-11BはLlama3.2-90Bモデルを上回る。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 02:02:57 GMT)
Collaborative Perception Datasets for Autonomous Driving: A Review [9.5] 共同認識は、自律運転における認識精度、安全性、堅牢性を高める可能性から、学術や産業からの関心が高まりつつある。
多くの協調認識データセットが登場し、協調パラダイム、センサー構成、データソース、アプリケーションシナリオが変化している。
協調認識データセットに焦点を当てた最初の包括的なレビューとして、この作業は、多次元的な観点から既存のリソースをレビューし、比較する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 06:49:21 GMT)
ImPart: Importance-Aware Delta-Sparsification for Improved Model Compression and Merging in LLMs [9.4] ImPartは、新しく重要なデルタスペーサー化アプローチである。
異なる特異ベクトルの空間比をその重要性に基づいて調整する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:39:36 GMT)
Tinker Tales: Interactive Storytelling Framework for Early Childhood Narrative Development and AI Literacy [9.4] このフレームワークは、NFCチップ対応のポーンとトークンを通じて、AIとの有形および音声ベースのインタラクションを統合する。
子どもたちは、ポーンとトークンを使用する文字、場所、アイテム、感情など、重要なストーリー要素を選択して定義する。
評価のために、いくつかのゲームセッションを児童AIエージェントでシミュレーションし、生成されたストーリーの品質と安全性を評価した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:47:55 GMT)
ViClaim: A Multilingual Multilabel Dataset for Automatic Claim Detection in Videos [9.1] ViClaimは、3つの言語(英語、ドイツ語、スペイン語)と6つのトピックにわたる1,798の注釈付きビデオテキストのデータセットである。
転写文の各文には、クレーム関連カテゴリ: fact-check-worthy, fact-non-check-worthy, opinionの3つがラベル付けされている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 12:14:38 GMT)
Identifying and Mitigating the Influence of the Prior Distribution in Large Language Models [9.1] 大規模言語モデル(LLM)が決定論的タスクに適切に対応できない場合があります。
我々は、機械的解釈可能性技術を用いて、LLM内の前者をローカライズし、その前者が応答に影響を与える範囲を操作します。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 02:00:53 GMT)
Test-time Alignment of Diffusion Models without Reward Over-optimization [9.0] 拡散モデルは生成的タスクにおいて優れているが、特定の目的とそれらを整合させることは依然として困難である。
そこで本研究では,SMC(Sequential Monte Carlo)をベースとした学習自由なテスト時間手法を提案する。
単一逆最適化、多目的シナリオ、オンラインブラックボックス最適化において、その効果を実証する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 12:23:46 GMT)
A resource theory of asynchronous quantum information processing [8.8] ポートベースのテレポーテーションでは、古典的なメッセージが受信される前に、局所的な量子前処理を開始することができる。
バイパーティイト状態が一方通行の古典的テレポーテーション閾値を破ることができるのは、それを破棄するサブシステムの自明なデコードマップを使って行うことができる場合に限りである。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:46:02 GMT)
The Chronicles of Foundation AI for Forensics of Multi-Agent Provenance [8.1] 時空は物事の年表であり、起源を解明し、つながりを辿り、空間と時間の流れの中で存在を定めようとする追求に共鳴する。
本稿では、内部記憶状態や外部メタ情報に依存することなく、コンテンツのみから生成履歴を投稿する時系列システムを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 03:23:17 GMT)
Training a neural netwok for data reduction and better generalization [7.5] スパース学習者は、優れた一般化に必要なものだけを選択することで入力(特徴)を圧縮する。
人間の科学者は、選択された数少ない特徴にインテリジェントな解釈を与えることができる。
我々の手法は柔軟で、浅い人工ニューラルネットワークから深い人工ニューラルネットワークまで、複雑なモデルに適用できる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:02:56 GMT)
Codes over Finite Ring $\mathbb{Z}_k$, MacWilliams Identity and Theta Function [7.5] 我々は格子とテータ関数に基づいて$mathbbZ_k$以上の線形符号を研究する。
我々は、全ウェイト列挙子MacWilliams恒等子と対称性付ウェイト列挙子MacWilliams恒等子を得る。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 03:07:48 GMT)
Reducing the Scope of Language Models [7.5] 言語モデルのスコープ化が可能であることを示す。
我々は無関係なクエリの多様性、レイヤの異なるテクニック、敵対的な評価を行う。
我々は,言語モデルをスコーピングする実践者のガイドとして,本研究を行おうとしている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 19:17:21 GMT)
SMPL-GPTexture: Dual-View 3D Human Texture Estimation using Text-to-Image Generation Models [7.4] SMPL-GPTextureは、自然言語プロンプトを入力として取り、最先端のテキスト画像生成モデルを活用する、新しいパイプラインである。
パイプラインはユーザのプロンプトに合わせて高解像度なテクスチャを生成することができることを示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 23:28:38 GMT)
Demoting Security via Exploitation of Cache Demote Operation in Intel's Latest ISA Extension [7.4] 我々は、Intelが最近導入した、効率的なデータ共有を促進するcldemote拡張について検討する。
性能上の利点があるにもかかわらず、我々は、重要な特性のないアクセス、キャッシュ間状態遷移、障害抑制を解明し、マイクロアーキテクチャーアタックに利用できるようにする。
分析に基づいて,Flush+DemoteとDemote+Timeという2つの新しい攻撃プリミティブを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 00:38:24 GMT)
Modelling Mean-Field Games with Neural Ordinary Differential Equations [7.3] 平均場ゲーム理論は、そうでなければモデル化が難しかったであろう近似ゲームに依存している。
平均場理論と深層学習をニューラル常微分方程式の形で組み合わせる。
モデルが柔軟で軽量であり、データの基礎となる分布を学習するためにはほとんど観察を必要としていないことを示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:38:42 GMT)
Exploring the Role of Knowledge Graph-Based RAG in Japanese Medical Question Answering with Small-Scale LLMs [7.2] 大規模言語モデル(LLM)は,医学的QAにおいて良好に機能するが,プライバシの制約により,日本語の文脈における有効性は制限される。
近年の取り組みは, オープンソース LLM に重点を置いているが, 検索強化世代 (RAG) と組み合わせる可能性はまだ未定である。
我々は,日本の医療用QA小規模オープンソースLLMのための知識グラフベースRAGフレームワークを初めて検討した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 03:27:55 GMT)
Predicting Driver's Perceived Risk: a Model Based on Semi-Supervised Learning Strategy [7.2] ドライバーの主観的リスク(DSPR)モデルは、異方性と減衰を動的に引き起こすメカニズムとして認識されるリスクについて提案される。
20人の参加者がドライバー・イン・ザ・ループ実験のために採用され、様々な自動走行シナリオを経験する際に、リアルタイムの主観的リスクレーティング(SRR)を報告します。
DSPRは3つの最先端リスクモデルと比較して、SRRの予測において87.91%の予測精度を達成している。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 05:50:33 GMT)
CAGE-GS: High-fidelity Cage Based 3D Gaussian Splatting Deformation [7.2] CAGE-GSは、ソース3DGSシーンとユーザが定義したターゲット形状をシームレスに整列するケージベースの3DGS変形法である。
提案手法では,ターゲットから変形ケージを学習し,ソースシーンの幾何学的変換を導出する。
本手法は,テキスト,画像,点雲,メッシュ,3DGSモデルなど,さまざまな形状表現を格納し,柔軟である。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 10:00:15 GMT)
RoPETR: Improving Temporal Camera-Only 3D Detection by Integrating Enhanced Rotary Position Embedding [7.1] 本稿では,速度推定の高速化を目的としたStreamPETRフレームワークの改良について紹介する。
改良されたアプローチでは、VT-Lバックボーンを用いて70.86%の最先端NDSを実現し、カメラのみの3Dオブジェクト検出のための新しいベンチマークを設定した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 05:05:31 GMT)
Evaluating the Bias in LLMs for Surveying Opinion and Decision Making in Healthcare [7.1] 大きな言語モデル(LLM)によって駆動されるシリコの人間の振る舞いをシミュレートするために、生成剤がますます使われてきた
本研究は、医療意思決定に関する理解アメリカ研究(UAS)の調査データと、生成エージェントからのシミュレーション応答を比較した。
人口統計に基づくプロンプトエンジニアリングを用いて、調査回答者のデジタルツインを作成し、異なるLLMが現実世界の振る舞いをいかにうまく再現するかを分析する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 01:36:57 GMT)
XYScanNet: A State Space Model for Single Image Deblurring [7.0] ディープステートスペースモデル(SSM)は、CNNやTransformerネットワークに代わる有望な選択肢として浮上している。
本研究では,スライスとスライスを交互に走査するスライス・アンド・スキャン方式を提案する。
我々はXYScanNetを開発した。XYScanNetは軽量な機能融合モジュールと統合されたSSMアーキテクチャで、画像の劣化を改善できる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 23:12:47 GMT)
Macroscopic states and operations: a generalized resource theory of coherence [6.9] 我々は、マクロな状態の概念、すなわち、マクロな詳細の粗い表現に焦点を合わせ、マクロな測定結果からのみ推測できる状態として定義する。
我々は、コヒーレンス、熱水性、純度、非対称性の既存の資源理論を統一し、一般化する微視的資源理論を開発する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:28:09 GMT)
Out of Sight Out of Mind, Out of Sight Out of Mind: Measuring Bias in Language Models Against Overlooked Marginalized Groups in Regional Contexts [6.8] 我々は、言語モデル(LM)がマイノリティのバイアスやステレオタイプを形成し、これらのグループのメンバーの不公平な扱いにつながることを知っています。
エジプト、残りの21か国、ドイツ、イギリス、米国からの270の疎外化グループを対象に、23のLMにおける攻撃的ステレオタイピングバイアスを調査した。
また,非バイナリ,LGBTQIA+,黒人女性に対して高い交叉バイアスが認められた。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 09:05:50 GMT)
Enabling Fast and Accurate Crowdsourced Annotation for Elevation-Aware Flood Extent Mapping [6.6] FloodTraceは,浸水領域アノテーションを効果的にクラウドソーシングし,機械学習アプリケーションに活用するWebアプリケーションである。
私たちの研究は、トポロジカルセグメンテーションツールをWebに持ち込み、最先端技術と比較して、アノテーションの効率を大幅に改善します。
ノースカロライナのハリケーン・マシューの高分解能空中画像に266人の大学院生が注視した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 18:53:23 GMT)
WildFireCan-MMD: A Multimodal dataset for Classification of User-generated Content During Wildfires in Canada [6.5] 急激な情報アクセスは山火事の間は不可欠だが、従来のデータソースは遅くてコストがかかる。
カナダで最近発生した山火事のXポストのマルチモーダルデータセットであるWildFireCan-MMDを13のテーマにアノテートした。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:43:56 GMT)
A Multi-task Learning Balanced Attention Convolutional Neural Network Model for Few-shot Underwater Acoustic Target Recognition [6.5] マルチタスク平衡チャネルアテンション畳み込みニューラルネットワーク(MT-BCA-CNN)を提案する。
実験の結果、MT-BCA-CNNは97%の分類精度と95%のF1$-scoreを27クラスのショットシナリオで達成している。
本研究は, 海洋生物音響学とソナー信号処理の研究を推進し, 水中音場認識のための効率的なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:11:32 GMT)
KFinEval-Pilot: A Comprehensive Benchmark Suite for Korean Financial Language Understanding [6.4] KFinEval-Pilotは、韓国の金融ドメインで大規模言語モデル(LLM)を評価するために設計されたベンチマークスイートである。
金融知識、法的推論、金融毒性の3つの重要な領域に1,000以上のキュレートされた質問が含まれている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 00:12:58 GMT)
Evaluation of Active Feature Acquisition Methods for Time-varying Feature Settings [6.1] 機械学習の手法は、入力機能が無償で利用できると仮定することが多い。
機能性の獲得が有害な分野である医療のような領域では、機能の獲得と予測的肯定性とのバランスをとる必要がある。
能動的特徴獲得性能評価(AFAPE)の問題点について述べる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 11:31:49 GMT)
Confidence on the Focal: Conformal Prediction with Selection-Conditional Coverage [6.0] コンフォーマル予測は、ランダムに描画されたテストポイントの未知の結果をカバーする、わずかに有効な予測間隔を構築する。
実際には、データ駆動手法は興味のある特定のテストユニットを特定するためにしばしば使用される。
本稿では,有限サンプルの正確なカバレッジを持つ予測セットを構築するための一般的な枠組みを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 19:05:51 GMT)
CPG-EVAL: A Multi-Tiered Benchmark for Evaluating the Chinese Pedagogical Grammar Competence of Large Language Models [6.0] 本稿では、外国語教育の文脈において、LLMの教育文法に関する知識を評価するために設計された最初のベンチマークを紹介する。
このベンチマークは、文法認識、微粒な文法的区別、分類的識別、言語的干渉に対する抵抗性を評価するために設計された5つのタスクからなる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 18:01:50 GMT)
Knowledge Acquisition on Mass-shooting Events via LLMs for AI-Driven Justice [5.9] 本稿では,NER技術を用いて,マスシューティングイベントの知識獲得を目的とした最初のデータセットを提案する。
犯罪人、被害者、場所、犯罪機器など、法的および調査目的に不可欠な重要な実体を特定することに焦点を当てている。
実世界のマスシューティングコーパスの実験では、GPT-4oが大量シューティングNERの最も効果的なモデルであり、マイクロ精度、マイクロリコール、マイクロF1スコアを達成している。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 00:13:04 GMT)
Feature selection based on cluster assumption in PU learning [5.8] 特定の実世界の学習タスクでは、適切な特徴選択の対象となるデータは、しばしば正のラベルが集中したクラスタを形成する。
本稿では,FSCPU と呼ばれる PU 学習におけるクラスタ仮定に基づく特徴選択手法を提案する。
合成データセットの実験は、様々なデータ条件におけるFSCPUの有効性を示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 05:22:17 GMT)
Dressed Interference in Giant Superatoms: Entanglement Generation and Transfer [5.5] 2つ以上の相互作用する原子が1つを介して導波路に非局所的に結合する巨大超原子(GSAs)の概念を導入し、その非伝統的な量子力学を探求する。
編まれたGSAでは、このセットアップは非コヒーレンスな転送と内部の絡み合った状態の交換を可能にする。
別々のGSAに対して、工学的結合相は、選択的な指向性量子情報伝達を可能にする状態依存的なキラル放出をもたらす。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:42:47 GMT)
Impact of Data Duplication on Deep Neural Network-Based Image Classifiers: Robust vs. Standard Models [5.5] トレーニングセット、特に言語モデルにおける重複したデータは、かなりの注目を集めています。
本分析は, モデルトレーニングの効率に悪影響を及ぼす要因として, 重複画像の存在が示唆された。
重複サンプルが均一に選択されたとしても、重複量の増加は精度を著しく向上させるには至らない。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:01:23 GMT)
Interpersonal Theory of Suicide as a Lens to Examine Suicidal Ideation in Online Spaces [5.5] 我々は、Redditのr/SuicideWatchからの59,607の投稿を分析するために、Interpersonal Theory of Suicide (IPTS) を分析レンズとして使用した。
リスクの高いSIポストは、計画、試み、方法、ツール、弱点と痛みを表しています。
AIは構造的コヒーレンスを改善したが、専門家による評価は、動的でパーソナライズされ、深く共感的なサポートを提供する上で、永続的な欠点を強調している。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 18:40:55 GMT)
Weak Cube R-CNN: Weakly Supervised 3D Detection using only 2D Bounding Boxes [5.5] 3Dオブジェクト検出器は通常、完全に教師された方法で訓練され、3Dラベル付きデータに大きく依存する。
この研究は、モノクラー法によるデータ要求を減らすために、弱教師付き3D検出に焦点を当てている。
本稿では,3次元の物体を推定時に予測できる一般モデルWeak Cube R-CNNを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 19:13:42 GMT)
Memorization: A Close Look at Books [5.4] Llama 370Bのモデルを使って、最初の500個のトークンから1冊の本を自動で再構築しました。
本書の抽出率は本の人気と相関し,学習データに重複する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 00:20:18 GMT)
Multi-output Classification Framework and Frequency Layer Normalization for Compound Fault Diagnosis in Motor [5.2] 本研究は,故障診断における領域適応のための多出力分類(MOC)フレームワークを提案する。
従来のマルチクラス分類 (MCC) 法とは異なり, 提案手法は個別に各断層の重大度を推定する。
PLデータを用いた6つの領域適応事例を対象とした評価の結果,MOCはマクロF1スコアにおいてベースラインモデルよりも優れていた。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 12:49:13 GMT)
Chain-of-Thought Prompting for Out-of-Distribution Samples: A Latent-Variable Study [5.2] CoT(Chain-of-Thought)プロンプトは、大規模言語モデルにおけるコンテキスト内学習を改善するための強力なテクニックとして登場した。
我々は、CoTの潜在変数フレームワークを拡張し、その振る舞いを2つのオフ・オブ・ディストリビューション(OOD)シナリオで研究する。
実験により, 潜伏変数がトレーニング中に見られるものとよく似ているOODサンプルに対して, CoT推論が効果的に一般化することを示したが, この類似性が低下すると性能が低下する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:59:29 GMT)
Query Complexity of Classical and Quantum Channel Discrimination [5.2] 量子チャネル識別のクエリ複雑性について検討する。
目標は、所望のエラー確率に到達するために必要なチャネルの最小数を決定することである。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:54:00 GMT)
Wearable-Derived Behavioral and Physiological Biomarkers for Classifying Unipolar and Bipolar Depression Severity [5.1] うつ病は複雑な精神障害であり、伝統的な主観的評価を超える様々な観察可能な指標と測定可能な指標によって特徴づけられる。
近年の研究では、うつ病の生理的、行動的側面をより正確に把握するために、ウェアラブルデバイスを用いた客観的、受動的、継続的な監視に焦点を当てている。
本研究では、ウェアラブルデバイスを利用して、うつ病のサブタイプ(特異的に単極性、双極性)を予測し、診断精度を高め、パーソナライズされた治療戦略をサポートすることのできる特徴的なバイオマーカーを同定する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 20:41:28 GMT)
Hierarchical Feature Learning for Medical Point Clouds via State Space Model [5.1] 本稿では,医学点クラウド理解のためのSSMに基づく階層的特徴学習フレームワークを提案する。
点雲処理におけるSSMの補助として,座標次数と内外走査方式を導入する。
提案手法を評価するため,MedPointSという大規模医療点クラウドデータセットを構築した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:22:31 GMT)
Predicting and Publishing Accurate Imbalance Prices Using Monte Carlo Tree Search [5.0] 本稿では,モンテカルロ木探索手法を提案する。
本稿では,ニューラルネットワーク予測器と強化学習エージェントによって制御される仮想電池群を用いて,システムダイナミクスをモデル化する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 10:30:26 GMT)
Algorithms for the Shortest Vector Problem in $2$-dimensional Lattices, Revisited [4.8] 2次元格子における最短ベクトル問題(SVP)の効率的な解法は、暗号や計算幾何学において実際的な重要性を持つ。
我々は、ユークリッドアルゴリズムを次元にわたって戦略的に適用する効率的な適応格子削減アルゴリズム textbfCrossEuc を開発した。
textbfHVecを反復的に呼び出すことによって、最適化されたアルゴリズム textbfHVecSBP は、ビット長$n$の任意の入力ベースに対して$O(log n M(n) )$ time の還元基底を得る。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:50:51 GMT)
Prompt-Driven and Training-Free Forgetting Approach and Dataset for Large Language Models [4.8] 本稿では,プロンプトベースの階層編集と学習不要な局所的特徴除去に基づく自動データセット作成フレームワークを提案する。
ForgetMeデータセットには、CUB-200-2011 (Birds)、Stanford-Dogs、ImageNet、合成猫データセットなど、さまざまな現実シナリオと合成シナリオが含まれている。
このデータセット上で選択的なアンラーニングを実現し,ForgetMeデータセットとEntangledメトリックの両方の有効性を検証する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 01:44:57 GMT)
LLMs Meet Finance: Fine-Tuning Foundation Models for the Open FinLLM Leaderboard [4.6] 我々はOpen FinLLM Leaderboardをベンチマークとして基礎モデルを微調整した。
我々は、金融能力を高めるために、教師付き微調整(SFT)、直接選好最適化(DPO)、強化学習(RL)などの手法を採用した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:42:02 GMT)
Excitation transfer and many-body dark states in WQED [4.6] 1次元導波管量子力学系では、量子エミッタは無限範囲、分散、散逸性双極子-双極子相互作用を介して相互作用する。
これらの相互作用は長距離周期的挙動を引き起こし、リッチ多体物理学は自由空間に存在しない。
シンメトリズドM励起暗黒状態の集合を構築し、その時間進化射影に対する解析式を導出する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 06:07:22 GMT)
Physics Informed Constrained Learning of Dynamics from Static Data [4.6] 物理インフォームドニューラルネットワーク(PINN)は、制御物理法則をニューラルネットワークのアーキテクチャに統合することにより、システムのダイナミクスをモデル化する。
既存のPINNフレームワークは、完全に観測された時間軸データに依存しており、多くのシステムでは取得が禁止される可能性がある。
本研究では,非時間コースや部分的に観測されたデータを用いて一階微分や動きを近似できる新しいPINN学習パラダイムであるConstrained Learningを開発した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 06:06:53 GMT)
Understanding the Difficulty of Low-Precision Post-Training Quantization for LLMs [4.6] 高いパラメータ数を持つ大規模言語モデルは計算コストが高いが、その重みを非常に低い数値精度に圧縮することで、はるかに効率的にすることができる。
同じデータ制約下では、前者のアプローチは後者よりもほぼ常に悪化しており、数値精度が非常に低い場合に特に顕著な現象である。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 23:26:11 GMT)
Design Topological Materials by Reinforcement Fine-Tuned Generative Model [4.5] トポロジカル絶縁体(TI)とトポロジカル結晶絶縁体(TCI)は、非伝統的な電子的性質を持つ材料である。
生成モデルによる新しいトポロジカル材料の生成に焦点を当てる。
事前学習した生成モデルに強化微調整を適用し, モデル目標と材料設計目標を一致させる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:05:24 GMT)
Unlocking LLM Repair Capabilities in Low-Resource Programming Languages Through Cross-Language Translation and Multi-Agent Refinement [4.5] 本稿では,新しい言語間プログラム修復手法 LANTERN を提案する。
提案手法は,LLMが弱い補修能力を示す言語から,より強力な性能を示す言語へ,欠陥コードを戦略的に翻訳する。
我々は,11言語にまたがる5,068のバグを含む総合的な多言語ベンチマークであるxCodeEvalについて評価を行った。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:00:56 GMT)
QLLM: Do We Really Need a Mixing Network for Credit Assignment in Multi-Agent Reinforcement Learning? [4.4] マルチエージェント強化学習(MARL)におけるクレジットの割り当ては依然として根本的な課題である。
大規模言語モデル(LLM)を用いた信用代入関数の自動構築を容易にする新しいアルゴリズムである textbfQLLM を提案する。
いくつかの標準MARLベンチマークで実施された大規模な実験は、提案手法が既存の最先端のベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:07:11 GMT)
VariFace: Fair and Diverse Synthetic Dataset Generation for Face Recognition [4.4] VariFaceは2段階の拡散に基づくパイプラインで、公正で多様な合成顔データセットを作成し、顔認識モデルをトレーニングする。
同じデータセットサイズに制約された場合、VariFaceは、以前の合成データセットよりも大幅にパフォーマンスが向上する。
VariFaceは6つの評価データセットで実際のデータセット(CASIA-WebFace)を上回った。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 12:12:38 GMT)
A Numerical Gradient Inversion Attack in Variational Quantum Neural-Networks [4.1] 変分量子ニューラルネットワーク(VQNN)のロスランドスケープは、量子ビットの増加とともに指数関数的に増大する局所的ミニマによって特徴づけられる。
本稿では,学習可能なVQNNの勾配から入力学習,実世界,実践的データを再構築する数値計算手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 10:12:38 GMT)
A general language model for peptide identification [4.0] PDeepPPは、事前訓練されたタンパク質言語モデルと並列トランスフォーマー-CNNアーキテクチャを統合するディープラーニングフレームワークである。
このモデルのハイブリッドアーキテクチャは、局所的なシーケンスモチーフとグローバルな構造特徴の両方をキャプチャするユニークな機能を示している。
決定的なグリコシル化部位の検出において99.5%の特異性を保ちながら、配列アライメント法よりも218*の加速を達成した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:52:57 GMT)
A Collaborative Platform for Soil Organic Carbon Inference Based on Spatiotemporal Remote Sensing Data [4.0] WALGREENは、現在のアプリケーションの制限を克服することで、SOC推論を強化するプラットフォームである。
WALGREENは、過去の公開データとプライベートデータを使って予測モデルを生成する。
研究者、政策立案者、土地管理者が炭素データにアクセスし、トレンドを分析し、エビデンスベースの意思決定をサポートするために、ユーザーフレンドリーなインターフェースを提供する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 04:50:18 GMT)
De Novo Generation of Hit-like Molecules from Gene Expression Profiles via Deep Learning [4.0] 生体活性と薬物様特性を有する新しい分子を生成するために,ハイブリッドニューラルネットワーク HNN2Mol を提案する。
実験およびケーススタディにより、提案されたHNN2Molモデルが、潜在的な生物活性と薬物様の性質を持つ新しい分子を生成できることが示されている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:28:21 GMT)
Curriculum-based Sample Efficient Reinforcement Learning for Robust Stabilization of a Quadrotor [3.9] 本稿では,Quadrotor用の頑健な安定化コントローラを開発するためのカリキュラム学習手法を紹介する。
学習の目的は、ランダムな初期条件から望ましい位置を達成することである。
過渡的かつ定常的な性能仕様を取り入れた新たな付加的報酬関数を提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 11:14:21 GMT)
EditSplat: Multi-View Fusion and Attention-Guided Optimization for View-Consistent 3D Scene Editing with 3D Gaussian Splatting [3.9] MFG(Multi-view Fusion Guidance)とAGT(Attention-Guided Trimming)を統合したテキスト駆動3Dシーン編集フレームワークEditSplatを提案する。
我々のMFGは、拡散過程に不可欠な多視点情報を組み込むことにより、多視点整合性を確保する。
我々のAGTは、3DGSの明示的な表現を利用して、3Dガウスを選択的にプーンし、最適化し、最適化効率を向上し、正確で意味的にリッチな局所的な編集を可能にする。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 20:10:32 GMT)
Applications of Statistical Field Theory in Deep Learning [3.8] 実験駆動の分野であるため、物理学のパラダイムの中でディープラーニングの理論を求めることは自然である。
深層学習は主に関数の学習と関数上の分布に関するものであるので、統計場理論は形式主義の明らかな選択である。
研究は、一般化、暗黙の偏見、特徴学習効果に関する有用な洞察を提供するための場の理論の能力を実証してきた。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:48:20 GMT)
What Are the Odds? Improving the foundations of Statistical Model Checking [3.8] マルコフ決定プロセス(MDP)は不確実性の下での意思決定の基本的なモデルである。
従来の検証アルゴリズムは、MDPの振る舞いを管理する確率の正確な知識を前提としている。
我々はMDPの知識を活用する専門的なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:33:17 GMT)
Attractor-merging Crises and Intermittency in Reservoir Computing [3.7] 貯留層コンピューティングは、ランダムニューラルネットワーク(RNN)にアトラクタを埋め込むことができる
我々は,グローバルパラメータを調整するだけで,間欠性を伴うアトラクタ統合の危機が生じることを報告した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 06:48:51 GMT)
The Athenian Academy: A Seven-Layer Architecture Model for Multi-Agent Systems [3.7] 本稿では,「アテネ学術」の多層7層構造を提案する。
人工知能(AI)アート創造におけるマルチエージェントシステム(MAS)の課題に対処する。
このフレームワークは、AIアート作成におけるマルチエージェントコラボレーションのための構造化された方法論を提供し、アート分野における革新的な応用を促進する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:21:28 GMT)
Why Ask One When You Can Ask $k$? Two-Stage Learning-to-Defer to a Set of Experts [3.7] L2D(Learning-to-Defer)は、不確実な予測をより有能なエージェントに選択的に延期することで、意思決定システムによる信頼性の向上を可能にする。
本稿では,従来の2段階L2Dフレームワークを一般化したTop-k$ Learning-to-Deferを提案する。
柔軟性とコスト効率をさらに向上するため,各クエリに対して最適なエージェント数を求める適応型拡張であるTop-$k(x)$ Learning-to-Deferを導入する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:50:40 GMT)
TTRD3: Texture Transfer Residual Denoising Dual Diffusion Model for Remote Sensing Image Super-Resolution [3.6] リモートセンシング画像超解像(RSISR)は、高分解能(HR)リモートセンシング画像を低分解能入力から再構成し、きめ細かい地上物体の解釈をサポートする。
既存の手法では,(1)空間的不均質なRSシーンからのマルチスケール特徴抽出の困難さ,(2)再構成における意味的不整合の原因となる事前情報の限定,(3)幾何学的精度と視覚的品質のトレードオフの不均衡,の3つの課題に直面している。
テクスチュアトランスファー残響二元拡散モデル (TTRD3) を3つの革新とともに提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:37:13 GMT)
Chinese-Vicuna: A Chinese Instruction-following Llama-based Model [3.6] Chinese-Vicunaは、中国語の命令追従能力のギャップを埋めるために設計された、オープンソースのリソース効率の高い言語モデルである。
医療や法律などの分野におけるドメイン固有の適応をサポートする。
そのモジュラーデザイン、オープンソースエコシステム、およびコミュニティ主導の強化は、中国のLLMアプリケーションのための汎用的な基盤として位置づけている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:27:02 GMT)
A novel quantum machine learning classifier to search for new physics [3.5] NPを探索する量子探索近傍(QSN)と変分QSN(VQSN)アルゴリズムを提案する。
VQSNは古典的なデータを処理するためにQSNにバリエーションを導入している。
その結果、VQSNは古典的なk-アネレスト近傍アルゴリズムよりも優れた効率を示した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 01:01:10 GMT)
Unbiased Quantum Error Mitigation Without Reliance on an Accurate Error Model [3.5] 我々は,1つの正確に測定された誤差パラメータとパウリ誤差のサンプリング器で,偏りのない量子誤差軽減を実現することができることを示した。
提案手法は, 誤差パラメータの揺らぎに頑健であり, 実際には非バイアス量子誤差緩和の限界がある。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 11:42:34 GMT)
The Impact of Environment Configurations on the Stability of AI-Enabled Systems [3.3] 運用環境の変化は、AI対応ソフトウェアシステムの安定性に悪影響を及ぼすことが知られている。
3つの主要な環境変数(オペレーティングシステム、Pythonバージョン、CPUアーキテクチャ)を、30ドルのオープンソースAI対応システム上で8つの異なる組み合わせで実験を行った。
以上の結果から,環境構成の変化が3つの指標の不安定性につながることが示唆された。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:52:17 GMT)
Empirically Evaluating the Use of Bytecode for Diversity-Based Test Case Prioritisation [3.2] 回帰テストは、変更後のソフトウェアの正しさを保証するが、リソース集約である。テストケース優先順位付け(TCP)は、早期故障検出を最大化するテストの順序付けによってこれを緩和する。
本稿では,TCPの多様性の基盤としてバイトコードを初めて研究し,そのコンパクトさを活用して効率と精度を向上させる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 09:40:49 GMT)
Leveraging Functional Encryption and Deep Learning for Privacy-Preserving Traffic Forecasting [3.2] 本稿では,セキュアでプライバシ保護された位置情報と交通予報システムを提案する。
我々の新しいk匿名方式は,ドライバが送信した暗号化された位置情報を集約するために機能暗号化を利用する。
本研究では,60分間の予測地平線に対する平均絶対誤差を10%以下に抑えた提案手法の有効性を示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 18:21:55 GMT)
Cooperation Is All You Need [3.0] コラボレーターは、新皮質の文脈に敏感な錐体ニューロンにインスパイアされている。
トランスフォーマーは、インテグレート・アンド・ファイアの「ポイント」ニューロンの長期的概念に基づいている。
Cooperatorに基づくアルゴリズムは、同じ数のパラメータを持つ場合でも、Transformerに基づくアルゴリズムよりもはるかに高速に学習する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 22:04:39 GMT)
dsld: A Socially Relevant Tool for Teaching Statistics [3.0] データ・サイエンス・ルックス・アット・差別(Data Science Looks At Discrimination)とは、人種、性別、年齢などの保護されたグループに関する差別の可能性を評価するための統計的およびグラフィカルな手法の包括的なツールキットをユーザに提供するために設計されたRとPythonパッケージである。
このパッケージは、共同創設者を特定して緩和し、予測アルゴリズムで保護されたグループに対するバイアスを減らすことで、重要な問題に対処する。
80ページのQuartoの本は、統計教育者から法律専門家まで、これらの分析ツールを現実世界のシナリオに効果的に適用するユーザをさらにサポートする。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:23:08 GMT)
How Large Language Models Are Changing MOOC Essay Answers: A Comparison of Pre- and Post-LLM Responses [2.7] 我々は,AI倫理に関する自由大学レベルのMOOCからのエッセイ応答を分析した。
また,ChatGPTのローンチは,学生エッセイの長さとスタイルに大きな変化が見られた。
また、AIやLLMに関連する重要なコンテンツワードの頻度の変化(関連する公開談話に基づいて予想されるように)も観察します。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:51:59 GMT)
Governance Challenges in Reinforcement Learning from Human Feedback: Evaluator Rationality and Reinforcement Stability [2.4] Reinforcement Learning from Human Feedback (RLHF)は、大きな言語モデルと人間の価値と期待を一致させることの中心である。
本研究では,評価者の認知能力,特に合理性レベルが強化信号の安定性に与える影響について検討した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 19:10:00 GMT)
Are Retrials All You Need? Enhancing Large Language Model Reasoning Without Verbalized Feedback [2.2] フィードバックなしで再審理の概念を導入する」
従来の反復改良法とは異なり,本手法では明示的な自己回帰や言語フィードバックは必要としない。
以上の結果から, より単純な再審ベースのアプローチの方が, より高度な推論フレームワークより優れていることが示唆された。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:52:48 GMT)
Accuracy is Not Agreement: Expert-Aligned Evaluation of Crash Narrative Classification Models [2.2] 本研究では,Deep Learning(DL)モデルの精度と,クラッシュ物語の分類における専門家合意との関係について検討する。
我々は、専門家ラベル付きデータや物語テキストに対して、BERTの変種やUSE(Universal Sentence)を含む5つのDLモデルを評価する。
専門家対応モデルは、位置特化キーワードよりも、文脈的および時間的言語的手がかりに依存する傾向にある。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:29:08 GMT)
Putting the Segment Anything Model to the Test with 3D Knee MRI -- A Comparison with State-of-the-Art Performance [2.2] メニスキは膝の軟骨組織であり、関節の潤滑や重量分散に寄与する。
メニスシの正確な自動セグメンテーションは、半月状異常の早期発見と治療を可能にする。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 21:18:58 GMT)
Registration, Detection, and Deregistration: Analyzing DNS Abuse for Phishing Attacks [2.2] フィッシングは引き続き重要なサイバーセキュリティの脅威となる。
根本において、特にフィッシング領域において、この根本的な課題に取り組むことが不可欠である。
ドメイン登録は、ユーザーとウェブサイトの間の主要なゲートウェイとして機能するため、重要な介入ポイントとなる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 11:42:00 GMT)
Causality-enhanced Decision-Making for Autonomous Mobile Robots in Dynamic Environments [2.0] 本稿では,電池使用量や人体障害を予測するための因果判定フレームワークを提案する。
また,文脈に敏感な人間とロボットの空間的相互作用をモデル化するために,ガゼボをベースとした新しいシミュレータを開発した。
我々の研究は、自律ロボットが人間と共有する動的環境において、因果推論によってより効率的かつ安全に操作できることを強調した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:41:44 GMT)
Which Optimizer Works Best for Physics-Informed Neural Networks and Kolmogorov-Arnold Networks? [1.8] 我々は,バーガーズ,アレン・カシンスキー,ギンズバーグ・ランダウ方程式を含む,重要な挑戦的線形・剛性・多スケール非線形PDEについてPINNとPIKANを比較した。
PINN や PIKAN で一般的に用いられている他の機能拡張を使わずに改善点を明らかにした。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:26:56 GMT)
From Questions to Insights: Exploring XAI Challenges Reported on Stack Overflow Questions [1.8] 解釈可能性の欠如は、AIモデルの実用的使用を制限する主要な障壁である。
XAI技術(例えばSHAP、LIME)はこれらのモデルの性能を解釈するために使われてきた。
我々は,これらの課題,その重症度,XAI技術をより使いやすくするための特徴を明らかにするために,探索的研究を行った。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 23:05:40 GMT)
Pose and Facial Expression Transfer by using StyleGAN [1.8] 顔画像間でポーズと表情を伝達する手法を提案する。
モデルは、ソース顔画像のポーズと表現がターゲットIDに転送される出力画像を生成する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:29:41 GMT)
The Dissipation Theory of Aging: A Quantitative Analysis Using a Cellular Aging Map [1.8] 我々はエルゴード理論を用いて、老化中の変化のダイナミクスを分解し、老化が生物学的システムにおける散逸過程であることを示す。
本研究では, トランスフォーマーを用いた機械学習アルゴリズムを用いて遺伝子発現データの解析を行い, 年齢をトークンとして組み込んで, 組込み空間における年齢関連散逸の反映度を評価する。
本研究は, 老化を散逸過程とする新しい視点を提供し, 分子分解能による加齢変化の計測を可能にする計算フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:59:15 GMT)
Exact Learning Dynamics of In-Context Learning in Linear Transformers and Its Application to Non-Linear Transformers [1.7] トランスフォーマーモデルは、顕著なインコンテキスト学習(ICL)を示す
我々の研究は、ICLの正確な動的モデルを提供し、複雑なトランスフォーマートレーニングを解析するための理論的基盤ツールを提供する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:05:33 GMT)
Multi-Stakeholder Disaster Insights from Social Media Using Large Language Models [1.7] ソーシャルメディアは、災害や緊急時にユーザーがフィードバックや問題を迅速に共有するための主要なチャンネルとして現れてきた。
本稿では, LLMの能力を活用して災害対応と管理を強化する手法を提案する。
提案手法は,生のユーザフィードバックと利害関係者固有のレポートのギャップを埋めるために,分類手法と生成AIを組み合わせる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 11:29:06 GMT)
WebLists: Extracting Structured Information From Complex Interactive Websites Using Executable LLM Agents [1.7] 我々は、一般的な4つのビジネスおよびエンタープライズユースケースにわたる200のデータ抽出タスクのベンチマークであるWebListsを紹介します。
検索能力を有するLLMとSOTA Webエージェントの両方が、それぞれ3%と31%のリコールで、これらのタスクに苦労していることを示す。
提案するBardeenAgentは,Webエージェントが実行をリピータブルなプログラムに変換し,類似した構造を持つページ間で大規模に再生することを可能にする新しいフレームワークである。
WebListsベンチマークでは、BardeenAgentが総リコール総数の66%を達成し、SOTA Webエージェントのパフォーマンスを倍増し、出力行あたりのコストを3倍に削減した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 06:16:40 GMT)
3D-PNAS: 3D Industrial Surface Anomaly Synthesis with Perlin Noise [1.7] パーリンノイズと表面パラメータ化に基づく3D-PNASを提案する。
提案手法は,2次元平面上に点雲を投影し,パーリンノイズ場からマルチスケールノイズ値をサンプリングし,その通常の方向に沿って点雲を摂動させることにより,現実的な3次元表面異常を生成する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 11:23:17 GMT)
Questions: A Taxonomy for Critical Reflection in Machine-Supported Decision-Making [1.7] 意思決定者は、マシンレコメンデーションに過剰に依存するリスクを負う。
提案する「潜在的リフレクションマシン」は, 係留中の決定に対する批判的リフレクションを支援する。
ソクラテス的な質問と人間中心の説明可能なAIから着想を得た質問分類を提示する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 10:44:08 GMT)
Attack-Defense Trees with Offensive and Defensive Attributes (with Appendix) [1.4] アタック・ディフェンス・ツリー(ADT)は、この相互作用を表現するのによく使われる方法論である。
この領域におけるこれまでの作業は、コスト、ダメージ、時間といったメトリクスを攻撃者の観点から分析することだけに重点を置いていた。
本稿では,防衛メトリクスをADTに組み込む新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:41:07 GMT)
Variational quantum and neural quantum states algorithms for the linear complementarity problem [1.3] 変分量子アルゴリズム(VQA)は、有望なハイブリッド量子古典法である。
本稿では、変分量子線形解法(VQLS)とその古典的量子状態に基づく古典的ニューラルネットワーク線形解法(VNLS)の新たな応用について述べる。
我々は,VNLSを用いて衝突時の剛球体の力学を正確にシミュレートすることを示した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 10:44:22 GMT)
Sparks of Science: Hypothesis Generation Using Structured Paper Data [1.3] 我々は,最上位のコンピュータサイエンスカンファレンスから抽出された約5500の構造化問題と仮説のペアの最初のデータセットであるHypoGenを紹介する。
我々は,Bit-Flip-SparkとChain-of-Reasoningをモデルとして,フレーミング仮説の生成を条件付き言語モデリングとして示す。
得られた仮説の新規性、実現可能性、および全体的な品質を改善するために、私たちのHypoGenデータセットを微調整することで、その妥当性が向上することを示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:29:18 GMT)
SimUSER: Simulating User Behavior with Large Language Models for Recommender System Evaluation [1.2] 信頼性と費用対効果を両立させるエージェントフレームワークであるSimを紹介した。
Simは、歴史的データから自己一貫性のあるペルソナを識別し、ユニークな背景と個性を持つユーザープロフィールを豊かにする。
我々は,サムネイルがクリック率,露出効果,レビューがユーザエンゲージメントに与える影響を調べる実験を行った。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:57:23 GMT)
SMARTe: Slot-based Method for Accountable Relational Triple extraction [1.2] 三重抽出(RTE)は自然言語処理(NLP)の基本課題である
SMARTe: a Slot-based Method for Accountable Triple extract。
解釈可能性の追加は性能を損なうものではないことを実証する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 10:21:15 GMT)
Koney: A Cyber Deception Orchestration Framework for Kubernetes [1.1] 我々は、偽装技術について「コードとして」記述するために、偽装ポリシー文書を記述する。
サービスメッシュやeBPFといったクラウドネイティブテクノロジを活用して、コンテナ化されたソフトウェアアプリケーションに自動的にトラップを追加しています。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 11:12:49 GMT)
Effective Dual-Region Augmentation for Reduced Reliance on Large Amounts of Labeled Data [1.1] 本稿では,大規模ラベル付きデータセットへの依存を減らすために,新しい二重領域拡張手法を提案する。
提案手法は,前景オブジェクトにランダムノイズ摂動を適用することで,対象データ変換を行う。
SFDAのためのPACSデータセットの評価は、当社の増補戦略が既存の手法を一貫して上回っていることを示している。
Market-1501とDukeMTMC-reIDデータセットの実験は、我々のアプローチの有効性を検証する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:42:33 GMT)
Featuremetric benchmarking: Quantum computer benchmarks based on circuit features [1.1] 多くの量子コンピュータの性能を簡潔に要約するベンチマークは、有用な量子計算の目標に向けた進歩を測定するために不可欠である。
本稿では,これらの回路の特徴の関数として量子コンピュータの性能がどのように変化するかを定量化するベンチマークフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 01:49:02 GMT)
$\mathcal{PT}$-symmetric mapping of three states and its implementation on a cloud quantum processor [1.0] 我々は、$N = 3$純量子状態のマッピングのための新しい$mathcalPT$-symmetricアプローチを開発する。
提案アルゴリズムは,従来の最小誤差,最大信頼度,最大相互情報戦略と同一の3状態QKDプロトコルに対する攻撃率を有する。
我々の研究は、量子通信、コンピューティング、暗号に$mathcalPT$対称性を適用するための新しい経路を開く。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 00:35:42 GMT)
Assesing LLMs in Art Contexts: Critique Generation and Theory of Mind Evaluation [0.9] 本研究では,大きな言語モデル (LLM) が芸術に関連する2つの領域でどのように機能するかを考察する。
批判生成部分には,ノエル・キャロルの評価枠組みと幅広い美術批評理論を組み合わせるシステムを構築した。
これらの批判は、チューリングテストスタイルの評価において、人間の専門家によって書かれたものと比較された。
第2部では、解釈、感情、道徳的緊張を含む状況に基づいた、新しいシンプルなToMタスクを導入した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 10:10:25 GMT)
Replication Packages in Software Engineering Secondary Studies: A Systematic Mapping [0.9] システムレビュー(SR)は、ソフトウェア工学(SE)を含む科学における最先端の証拠をまとめたものである。
2013年から2023年の間に発行された528件の二次研究では、複製パッケージの可用性と報告を分析した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 05:11:39 GMT)
A Shapley Value Estimation Speedup for Efficient Explainable Quantum AI [0.9] 古典的な文脈では、シャプリー値の協調ゲーム理論の概念はポストホックな説明に自然に適応する。
そこで我々は,ある信頼区間内でShapley値を抽出できる量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:00:56 GMT)
Trajectory Adaptation using Large Language Models [0.9] 新しい状況に応じた人間の指示に基づくロボット軌道の適応は、より直感的でスケーラブルな人間とロボットの相互作用を実現するために不可欠である。
本研究は,市販の移動プランナが生成する汎用ロボット軌道に適応する柔軟な言語ベースのフレームワークを提案する。
我々は、事前学習されたLLMを用いて、高密度ロボット操作のポリシーとしてコードを生成することにより、軌道方向の経路を適応させる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:48:23 GMT)
RF-DETR Object Detection vs YOLOv12 : A Study of Transformer-based and CNN-based Architectures for Single-Class and Multi-Class Greenfruit Detection in Complex Orchard Environments Under Label Ambiguity [0.8] 本研究では,RF-DETRオブジェクト検出ベースモデルとYOLOv12オブジェクト検出モデル構成の詳細な比較を行う。
単一クラス (greenfruit) とマルチクラス (occluded and non-ococuded greenfruits) アノテーションを備えたカスタムデータセットが開発された。
DINOv2のバックボーンと変形可能なアテンションを利用するRF-DETRモデルは、グローバルなコンテキストモデリングにおいて優れている。
YOLOv12はCNNベースの注意をローカル特徴抽出の強化に利用し、計算効率とエッジデプロイメントに最適化した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:08:11 GMT)
Malicious Code Detection in Smart Contracts via Opcode Vectorization [0.8] スマートコントラクトのセキュリティ問題はますます顕著になっている。
悪意のあるコードの存在は、ユーザ資産の喪失とシステムのクラッシュにつながる可能性がある。
本稿では,機械学習に基づく知的契約の悪意のあるコード検出について,簡単な研究を行った。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:51:48 GMT)
GPMFS: Global Foundation and Personalized Optimization for Multi-Label Feature Selection [0.8] 次元性の呪いは、高次元多ラベル学習における主要なボトルネックの1つである。
GPMFS (Global Foundation and Personalized Optimization for Multi-Label Feature Selection) という新しい手法を提案する。
複数の実世界のデータセットの実験により、GPMFSは高い解釈性と堅牢性を維持しながら、優れたパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:29:14 GMT)
Approaching Current Challenges in Developing a Software Stack for Fully Autonomous Driving [0.7] 一般的なアプローチは、モジュール化を通じて、駆動タスクを個々のサブタスクに分解することです。
これらの個別に開発されたアルゴリズムが組み合わさってフルスタックの自動運転ソフトウェアを作る必要がある場合、これは特別な課題を引き起こす。
この論文の貢献は、将来のフルスタック自動運転プロジェクトを簡単にする。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 10:17:24 GMT)
Automated Generation of Commit Messages in Software Repositories [0.7] コミットメッセージはソフトウェア変更の文書化に不可欠であり、プログラムの理解とメンテナンスを支援する。
機械学習(ML)と自然言語処理(NLP)を用いたコミットメッセージの自動生成手法を提案する。
コード変更とそれに対応するコミットメッセージのデータセットをLiuらによって使用しました。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:08:05 GMT)
ConExion: Concept Extraction with Large Language Models [0.6] 本稿では,事前学習型大言語モデル(LLM)を用いた文書からの概念抽出手法を提案する。
私たちのアプローチは、重要なドメインだけでなく、特定のドメインに関連するすべての概念を抽出する、より困難なタスクに取り組みます。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:05:14 GMT)
Quantum correlations and metrological advantage among Unruh-DeWitt detectors in de Sitter spacetime [0.6] ギボンズ・ホーキング・デコヒーレンス(GH)の存在下での量子フィッシャー情報(QFI)と局所量子不確実性(LQU)の堅牢性について検討する。
我々の結果は、相対論的量子距離論(RQM)の進歩に価値ある洞察を提供するため、QFIとLQUの管理におけるGH熱性の重要性を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 21:22:09 GMT)
Entanglement between accelerated probes in de Sitter [0.6] 曲線時空における加速量子プローブによる真空エンタングルメントの特性について検討する。
量子場との相互作用は、初期の非相関プローブ間の非局所的な相関を異なる方向に加速させる。
この結果から, エンタングルメントは, 加速度や曲率の変化によって独立に変化することが示唆された。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 12:22:49 GMT)
Pricing AI Model Accuracy [0.6] 我々は,競争が企業のインセンティブにどのように影響し,モデル精度を向上させるかを分析するために,消費者確認デュポリーモデルを開発する。
競争市場においては、全体的な正確性を改善する企業は必ずしも利益を上げるとは限らない。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 23:09:04 GMT)
Arabizi vs LLMs: Can the Genie Understand the Language of Aladdin? [0.5] アラビジはラテン文字と数字を含むアラビア語のハイブリッド形である。
機械翻訳には形式的な構造が欠如しているため、大きな課題がある。
本研究は、アラビジ語を現代標準アラビア語と英語の両方に翻訳する際のモデルの性能について検討する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:07:44 GMT)
Fine Flood Forecasts: Incorporating local data into global models through fine-tuning [0.5] 洪水は自然災害の最も一般的な形態であり、早期警戒システムには正確な洪水予報が不可欠である。
これまでの研究によると、機械学習(ML)モデルは、大規模で地理的に異なるデータセットでトレーニングされた場合の洪水予測を改善するための有望な方法である。
このグローバルトレーニングの要件は、地域のパフォーマンスを改善するためにモデルを容易に適応できない国家の予測者にとって、所有権の喪失につながる可能性がある。
我々は、MLベースの水文予測システムの運用上の障壁を低くすることを目的として、独自のデータを用いてグローバルモデルのオーナシップを欲しがる国家予測者のロードマップを提供する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 01:14:21 GMT)
Addressing the Minor-Embedding Problem in Quantum Annealing and Evaluating State-of-the-Art Algorithm Performance [0.4] D-Wave Systems 量子アニールの性能に及ぼす埋め込み品質の影響を解析する。
また,D-Wave のアルゴリズムである Minorminer が生成した埋め込みの質を評価する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 23:13:14 GMT)
Learning Diverse Robot Striking Motions with Diffusion Models and Kinematically Constrained Gradient Guidance [0.4] 私たちは、オフラインで制約付きで、多様なアジャイルの振る舞いを表現する、新しい拡散モデリングアプローチを開発しています。
エアホッケーとリアル卓球の2つの課題領域において, KCGG を評価することで, 時間クリティカルなロボット作業に対するアプローチの有効性を実証する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:22:17 GMT)
Employing Continuous Integration inspired workflows for benchmarking of scientific software -- a use case on numerical cut cell quadrature [0.3] 本稿では、確立された継続的インテグレーションツールとプラクティスを利用して、ベンチマークの実行とレポートの自動化を実現する、実証済みのアプローチを提案する。
我々のユースケースは、任意の領域上の数値積分(四分法)であり、2Dまたは3Dで暗黙的にあるいはパラメトリックに定義された曲線や曲面によって境界づけられる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:44:50 GMT)
Rethinking industrial artificial intelligence: a unified foundation framework [0.3] 産業人工知能(AI)の最近の進歩は、よりスマートな製造、予測保守、インテリジェントな意思決定を推進し、産業を変革している。
既存のアプローチは、ドメイン知識、データ、モデルを体系的に統合することの重要性を見越しながら、主にアルゴリズムとモデルに焦点を当てることが多い。
本稿では,従来の研究をレビューし,産業AIの役割を再考し,統一産業AI基盤フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 02:54:57 GMT)
QI-MPC: A Hybrid Quantum-Inspired Model Predictive Control for Learning Optimal Policies [0.3] 本稿では、変分量子回路を用いてMPC問題における制御警察を学習するQIMPC(Quantum-Inspired Model Predictive Control)を提案する。
アプローチの生存性は、目標追跡制御戦略、エネルギー効率の高い建築気候制御、自律車体力学、単純な振り子、複合振り子という5つの実験で検証される。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:55:37 GMT)
Contextual Agent Security: A Policy for Every Purpose [0.3] 本稿では,エージェント領域におけるコンテキストセキュリティについて考察する。
それは、ジャスト・イン・タイム、コンテキスト、人間検証可能なセキュリティポリシーを生成するフレームワークであるConsecaを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:48:53 GMT)
Engineering Artificial Intelligence: Framework, Challenges, and Future Direction [0.3] 本稿では,「ABCDE」をエンジニアリングAIの重要な要素として紹介する。
統一的で体系的なAIエコシステムフレームワークを提案する。
本稿では,包括的視点を提供することで,AIの戦略的実装を進めることを目的とする。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 03:14:31 GMT)
Sentiment Analysis on the young people's perception about the mobile Internet costs in Senegal [0.1] 我々は、セネガルにおけるモバイルインターネットの価格に対する若者の感想を、サービスの品質の認識に関連して検討する。
対象に関するTwitterとFacebookのコメントの集合をスキャンし、感情分析モデルを適用して一般的な感情を収集した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 18:53:41 GMT)
Deep literature reviews: an application of fine-tuned language models to migration research [0.1] 本稿では,大規模言語モデル(LLM)を用いた従来の書誌的手法を拡張した文献レビューのためのハイブリッドフレームワークを提案する。
オープンソースのLCMを微調整することで,大量の研究コンテンツから質的洞察をスケーラブルに抽出することができる。
この枠組みを20000以上の人的移動に関する科学的論文に適用することにより、ドメイン適応型LLMが「スペシャリスト」モデルとして機能できることを実証する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:55:46 GMT)
Unipa-GPT: Large Language Models for university-oriented QA in Italian [0.0] 本稿では,Unipa-GPTのアーキテクチャとトレーニングについて述べる。
Unipa-GPTは、パレルモ大学で学士課程と修士課程を選択する学生を支援するために開発された。
実験では,RAG(Retrieval Augmented Generation)アプローチと微調整を併用してシステムを開発した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:57:34 GMT)
Uncertainty-Aware Trajectory Prediction via Rule-Regularized Heteroscedastic Deep Classification [0.0] ShiFT (Spectral Heteroscedastic Informed Forecasting for Trajectories) は、よく校正された不確実性モデリングと情報前処理を組み合わせた新しいフレームワークである。
我々のモデルは、本質的に不確実性が高い交差点のような複雑なシナリオで優れている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:24:50 GMT)
Uncertainty Quantification in Graph Neural Networks with Shallow Ensembles [0.0] 機械学習電位(MLP)は、分子特性と材料特性の正確かつ効率的な予測を提供することによって、材料発見に革命をもたらした。
グラフニューラルネットワーク(GNN)は、複雑な原子間相互作用をキャプチャする能力のため、最先端のアプローチとして登場した。
この研究は、GNNベースの材料モデリングの堅牢性を改善するための軽量不確実性定量化(UQ)手法の可能性を強調している。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 04:02:53 GMT)
Tunable Entangling and Steering of Ferrimagnetic Magnons via an OptoMagnoMechanical Ring [0.0] マイクロ波をオプティマグニックリングキャビティに注入することにより,空間的に分離した2つの磁性YIG結晶を接合する手法を提案する。
提案したオポマグノメカニカル構成は、磁歪誘起の機械的変位と放射圧による光学的キャビティとの結合を利用する。
解析の結果,マグノンの絡み合いは同一のマグノメカニカルカップリングに対して消滅するが,熱ゆらぎに対して頑健であることが判明した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:36:37 GMT)
Trusted Identities for AI Agents: Leveraging Telco-Hosted eSIM Infrastructure [0.0] テレコムグレードのeSIMインフラを利用する概念アーキテクチャを提案する。
SIM認証情報をハードウェアデバイスに埋め込むのではなく、通信会社がセキュアで認証されたハードウェアモジュールをホストするモデルを想定する。
本論文は,標準化,セキュリティアーキテクチャ,およびエージェント経済の進展における通信インフラの役割について,オープンな議論を行うための概念的枠組みとして意図されている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:36:26 GMT)
Transferable Foundation Models for Geometric Tasks on Point Cloud Representations: Geometric Neural Operators [0.0] 我々は、事前訓練された幾何学的ニューラル演算子(GNP)を得る方法を提案する。
GNPは幾何学的特徴を得るための基礎モデルとして機能する。
我々のGNPは、点-雲の微分幾何学の頑健な潜在表現を学習するためにどのように訓練されるかを示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 03:47:25 GMT)
Transfer matrix approach to quantum systems subject to certain Lindblad evolution [0.0] ラプラス領域において、グリーン関数の簡単な表現が見つかる。
熱力学の限界における解析的な結果を得るために用いられる。
また、密度の進化を決定するための高速な数値法も提供する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:05:52 GMT)
Three-dimensional canonical quantum plasmonics for finite media: exact solution in terms of the classical Green tensor [0.0] 我々は、電界に結合した散逸・散逸媒体に顕微鏡モデルを用いる。
対角量子ハミルトニアンは対応原理によって量子化される。
電場作用素は、係数を持つ生成消滅作用素の線形結合として書けることを示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:39:29 GMT)
Theory of quantum optics and optical coherence in high harmonic generation [0.0] 量子光学と強いレーザー駆動プロセスの交点における光コヒーレンスの概念を導入する。
調和場の2時間強度相関関数の理論を考案する。
本研究では,原子HHGにおける単一,少数,多個のエミッタの相関関数について検討した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 18:58:07 GMT)
The measurement problem and the completeness of quantum states [0.0] 量子還元状態とアンサンブルの統計混合状態の等価性は、深い物理的基盤を持つことを示す。
量子測定問題に対して可能な解を与える。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:40:19 GMT)
The Impact of AI on the Cyber Offense-Defense Balance and the Character of Cyber Conflict [0.0] サイバードメインは本質的にデジタルであり、AIトレーニングとサイバーアプリケーションの間に強いフィードバックループがある。
AIが進歩を続けるにつれて、サイバードメインがどのように変化するのかを理解することが重要です。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 22:40:14 GMT)
The Future of Internet of Things and Multimodal Language Models in 6G Networks: Opportunities and Challenges [0.0] 本稿では,IoT(Internet of Things)とMLLM(Multimodal Language Models)の統合の可能性について述べる。
医療、農業、スマートシティなど、さまざまな分野におけるこの統合の応用に焦点を当てている。
本稿は、IoTおよびMLLM技術とアプリケーションに関する包括的な説明を提供し、各柱におけるマルチモーダルの役割に対処し、今後の研究における最も重要な課題と方向性の概要をまとめて結論付けている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 18:57:06 GMT)
Temporal Bell inequalities in non-relativistic many-body physics [0.0] 2つのスピンの時間的クレーター-ホルン不等式は、2つの測定されたパーティがスピンチェーンで接続されている場合、測定間の非ゼロ時間間隔で違反することを示す。
私たちが分析したダイナミクスは、非相対論的な設定で期待されているように、情報の拡散はリーブ・ロビンソン境界によって根本的に制限されていることを示している。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 10:21:14 GMT)
Superfluorescent upconversion nanoparticles as an emerging second generation quantum technology material [0.0] ランタニドドープアップコンバージョンナノ粒子(UCNP)の超蛍光は2022年に初めて発見された室温量子現象である。
SFプロセスでは、1つのUCNP内の多くの放射性ランタニドイオンが、超短パルス(nsまたはfs)高出力励起レーザーパルスによってコヒーレントに結合される。
本稿では, SF-UCNPを第2世代の量子技術とみなす方法について, SF-UCNPの発展に向けたいくつかの課題, 機会, オープンな疑問について述べる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:20:17 GMT)
Subfunction Structure Matters: A New Perspective on Local Optima Networks [0.0] ローカルオプティマネットワーク(LON)は、フィットネス情報ランドスケープをキャプチャする。
サブファンクションに基づく情報を組み込むことで、LON分析をどのように改善できるかを検討する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:31:11 GMT)
Sub-femtosecond optical control of entangled states [0.0] XUVとIRレーザーパルスを組み合わせた単一水素分子(H2)の光解離のために、光電子の放出方向の光制御を、放出中性フラグメント(H原子)に関して実証する。
フェムト秒以下の時間分解能で調整可能な2つのレーザー場の相対遅延に依存すると、光電子はH原子と反対の半球に放出される。
この放出非対称性は、空間的に分離された有界電子と放出電子を含む2電子の最終状態の絡み合いの結果である。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 19:09:53 GMT)
SSTAF: Spatial-Spectral-Temporal Attention Fusion Transformer for Motor Imagery Classification [0.0] 脳電図に基づく運動画像分類における脳-コンピュータインタフェース(BCI)は、神経リハビリテーションと補助技術において有望な解決策を提供する。
脳波信号の非定常特性と重要な物体間変動は、頑健な物体間分類モデルを開発する上で大きな課題を引き起こす。
本稿では,上肢運動画像分類に特化して設計されたSSTAF変換器を提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 07:45:14 GMT)
Route to hyperchaos in quadratic optomechanics [0.0] 2次結合を持つオプトメカニカルシステムにハイパーカオスが生じる可能性があることを示す。
また,ハイパーカオスの出現のメカニズムも明らかにした。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 11:58:51 GMT)
Reducing Deep Network Complexity via Sparse Hierarchical Fourier Interaction Networks [0.0] 局所的な詳細とグローバルな文脈に同時アクセス可能な階層的パッチワイドフーリエ変換; 最も情報性の高いスペクトル係数のみを保持する学習可能で微分可能なトップKマスキング機構により、視覚信号と言語信号の自然な圧縮性を利用する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 19:06:38 GMT)
RL-PINNs: Reinforcement Learning-Driven Adaptive Sampling for Efficient Training of PINNs [0.0] 物理インフォームドニューラルネットワーク(PINN)は偏微分方程式(PDE)を解くための強力なフレームワークとして登場した。
彼らのパフォーマンスは、トレーニングポイントの選択に使われる戦略に大きく依存しています。
RL-PINN(RL-PINN)は,1ラウンドのサンプリングだけで効率的なトレーニングを可能にする強化学習駆動型適応サンプリングフレームワークである。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:50:55 GMT)
Quantum-gas microscopy of the Bose-glass phase [0.0] 障害ポテンシャルは、量子系の輸送特性とコヒーレンスを根本的に変える。
相互作用するボゾン系では、ボースガラスは、長距離位相コヒーレンスを伴わない絶縁性で圧縮可能な状態として低エネルギーで現れることが期待されている。
量子ガス顕微鏡における超低温ボソニック原子を用いて2次元正方格子におけるボースガラス相の出現を探索する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:52:58 GMT)
Quantum theory from classical mechanics near equilibrium [0.0] 我々は、一般化されたモータ=p$と一般化された座標が消える時点において、非退化最小値を持つハミルトニアヌス$H(p,q)$によって記述された古典理論を考える。
一般化モータの平方と一般化座標の和は運動の積分であると仮定する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 19:52:45 GMT)
Quantum precursors to Kolmogorov-Arnold-Moser theorem in Floquet spin-$J$ systems [0.0] Kolmogorov-Arnold-Moser (KAM) の定理は、古典的可積分ハミルトニアンの共鳴トーラスが非可積分摂動を導入したときに破れることを証明している。
我々はKAM定理の量子前駆体を1自由度スピンハミルトニアンは瞬時キックによって摂動する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 18:00:13 GMT)
Quantum dynamics of a bosonic mode and a two-level system interacting with several reservoirs [0.0] 本研究では,時間依存結合関数の異なる2つの貯水池と相互作用する振動系の量子力学について検討した。
還元密度行列、量子光学特性関数、フシミ、グラウバー・スダルシャン、ウィグナー関数のような(準)分布関数を得る。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 19:26:14 GMT)
Quantum Natural Gradient with Geodesic Corrections for Small Shallow Quantum Circuits [0.0] 我々は、高次および測地補正を導入することにより、量子自然勾配(QNG)法を拡張した。
我々のアプローチは、幾何学的手法の利点を生かして、より効率的な量子アルゴリズムの道を開く。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 10:30:56 GMT)
Quantum Geometry of Finite XY Chains: A Comparison of Neveu-Schwarz and Ramond Sectors [0.0] 本稿では,有限長XY量子鎖の幾何学的解析について述べる。
まず、モデルの基底状態と最初の励起状態を調べ、有限サイズ効果の影響を強調する。
フービニ・スタディ・メトリックから導かれた量子(ベリー)曲率を解析することにより,システムの幾何学的特徴を探求する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 21:27:23 GMT)
Provable Secure Steganography Based on Adaptive Dynamic Sampling [0.0] 安全ステガノグラフィー(Secure Steganography)は、ステゴキャリアーを通常のキャリアと区別しにくい技術である。
現在のPSS方式では、送信側と受信側の両方で生成モデルの分布に明示的にアクセスする必要があることが多い。
本稿では,送信側と受信側の両方に対して,明示的なモデル分布へのアクセスを必要としない,確実に安全なステガノグラフィ手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 01:52:09 GMT)
Properties of Krylov state complexity in qubit dynamics [0.0] 量子ビット力学におけるKrylov状態の複雑性の性質を,1つの量子ビットと1つの量子ビット対を考慮して解析する。
リードベルク二層原子と相互作用する特定の場合を考えると、実効ハミルトニアンを用いて得られるクリロフ基底は時間平均拡散複雑性を最小化する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:50:57 GMT)
Privacy-Preserving CNN Training with Transfer Learning: Two Hidden Layers [0.0] 完全同相暗号(FHE)を用いた4層ニューラルネットワークの学習例を示す。
我々の研究の重要な貢献は、textitSoftmax を textitSigmoid に置き換えることと、BCE(Binary Cross-Entropy)損失関数と組み合わせることで、同型分類のための効果的でスケーラブルなソリューションが提供されることである。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 03:58:23 GMT)
Predicting Forced Responses of Probability Distributions via the Fluctuation-Dissipation Theorem and Generative Modeling [0.0] 非線形系の高次モーメントの小さな外乱に対する応答を推定するための新しいデータ駆動フレームワークを提案する。
標準実装はガウス近似に依存しており、平均応答を正確に予測できるが、高次モーメントに顕著なバイアスをもたらすことが多い。
我々はGFDTと最近のスコアベース生成モデリングの進歩を組み合わせることで、完全な密度再構成を必要とせず、スコア関数の直接推定を可能にする。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 20:54:33 GMT)
Predicting BVD Re-emergence in Irish Cattle From Highly Imbalanced Herd-Level Data Using Machine Learning Algorithms [0.0] Bovine Viral Diarrhoea (BVD) はアイルランドにおける根絶プログラムの成功の焦点となっている。
国家がBVDの自由に向かって進むにつれ、標的監視のための予測モデルの開発がますます重要になっている。
我々は,高度に不均衡な群集データを用いて,BVD陽性群を予測するための機械学習アルゴリズムの性能を評価する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:33:15 GMT)
Physical origins and limitations of canonical quantum measurement behavior [0.0] 正準量子計測行動の物理的起源と限界に関する私の研究をレビューし、強化します。
私の分析は、実験によって支持される創発的で近似的なボルン則につながり、非常に小さな確率密度で分解する可能性がある。
同様の図は、ガイガーカウンタ、スターン・ゲルラッハの実験、超伝導量子ビットなど、他の測定シナリオにも当てはまると私は主張する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:46:05 GMT)
On the minimax optimality of Flow Matching through the connection to kernel density estimation [0.0] フローマッチングは拡散モデルの単純で柔軟な代替手段である。
フローマッチングはワッサーシュタイン距離の対数係数までの最適収束率と一致することを証明した。
また,高次元設定におけるフローマッチングの有効性を初めて正当化する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 21:06:41 GMT)
On the asymptotic behaviour of stochastic processes, with applications to supermartingale convergence, Dvoretzky's approximation theorem, and stochastic quasi-Fejér monotonicity [0.0] 我々は, ある緩和されたスーパーマーチンゲール条件に適合するプロセスの挙動について, 新規かつ一般的な結果を示す。
我々は近似からよく知られた概念と定理の新しい定量的バージョンを導き出す。
我々は、高速で、特に線形な速度で構築できる結果の特別な事例について論じる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:11:26 GMT)
On the Definition of Robustness and Resilience of AI Agents for Real-time Congestion Management [0.0] 欧州連合の人工知能(AI)法は、リスクの高いセクターに対する堅牢性、レジリエンス、およびセキュリティ要件を定義している。
本稿では,混雑管理における強化学習エージェントの堅牢性とレジリエンスを定量的に評価するための新しい枠組みを提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 20:01:48 GMT)
Observation of quantum entanglement between free electrons and photons [0.0] 自由電子と光子の間の量子絡み合いを実証する。
2つのビームの重ね合わせで作製された電子がナノ構造を通過すると、絡み合いが生じる。
我々は、標準量子限界を超える電子イメージングと分光法の発展を期待する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:03:05 GMT)
Nonlinear wave dynamics on a chip [0.0] チップスケールで量子可能なウェーブフルームを実演する。
ウェーブ・フラムは、ナノメートルの厚さの超流動ヘリウム膜と光学的相互作用を利用して、極端に地上に流れているものを上回る非線形性を達成する。
測定の結果、波の急激化、衝撃フロント、ソリトン核分裂が明らかになった。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:11:21 GMT)
Multi-Parameter Molecular MRI Quantification using Physics-Informed Self-Supervised Learning [0.0] 常微分方程式(ODE)モデルを用いてパラメータ抽出逆問題の解法を提案する。
これは、数値ODEソルバをステップワイズ解析として機能させ、自動微分に基づく最適化と互換性を持たせることで実現される。
The neural-network-based train-by-fit pipeline was used to Quantify semisolid magnetization transfer (MT) and chemical exchange saturation transfer (CEST) amide proton exchange parameters in the human brain。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 05:54:02 GMT)
Mesh-Informed Reduced Order Models for Aneurysm Rupture Risk Prediction [0.0] 計算流体力学(CFD)を用いて大動脈瘤の発症リスクを予測する。
有限体積(FV)の離散化によって得られるメッシュの自然なグラフ構造を利用する。
本手法は,次元の呪いを克服する有効な方法であることを確認した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 12:45:16 GMT)
Many-body cages: disorder-free glassiness from flat bands in Fock space, and many-body Rabi oscillations [0.0] 多体ケージは非平衡現象の一般的なメカニズムである。
フォック空間の基底状態は、焼成障害がないときにエドワーズ・アンダーソン型のパラメータを示す。
単粒子平らなバンドの多様性は、類似のタイプを示唆している。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:54:38 GMT)
Magnetic noise in macroscopic quantum spatial superposition [0.0] 磁場のランダムなゆらぎが、物質波干渉計の経路をランダムに揺らぎ、量子重ね合わせをデコヒートすることを示す。
このような物質波干渉計は、物理学における多くの新しい基礎的な進歩の基盤となっている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 18:00:02 GMT)
MCP Guardian: A Security-First Layer for Safeguarding MCP-Based AI System [0.0] MCPガーディアンは、認証、レート制限、ロギング、トレース、Web Application Firewall(WAF)スキャンによるMPPベースの通信を強化するフレームワークである。
弊社のアプローチは、AIアシスタントのためのセキュアでスケーラブルなデータアクセスを促進する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:49:10 GMT)
Lower Bounds for Unitary Property Testing with Proofs and Advice [0.0] ユニタリプロパティのテストでは、テスタとしても知られる量子アルゴリズムは、ブラックボックスのユニタリへのクエリアクセスが与えられる。
本稿では,一元性検定の量子クエリの下位境界を証明するための新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:42:20 GMT)
Long-wavelength optical lattices from optical beatnotes: theory and applications [0.0] Beat-Note Superlattices (BNSL) は、超低温原子雲の周期的トラップ電位を生成する手法である。
本研究では, この近似が有効である格子深さと波長の範囲を調査し, その摂動に対する頑健さについて検討する。
本結果は,量子シミュレーション,原子干渉法,その他の量子技術への応用におけるBNSLの可能性を明らかにするものである。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 10:46:16 GMT)
Large Language Models as Attribution Regularizers for Efficient Model Training [0.0] 大規模言語モデル(LLM)は、様々な領域で顕著なパフォーマンスを示している。
我々は,LLM生成したグローバルタスク特徴属性を,より小さなネットワークのトレーニングプロセスに組み込む方法を提案する。
我々のアプローチは、数ショットの学習シナリオにおいて優れたパフォーマンスをもたらす。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 11:32:53 GMT)
LSEAttention is All You Need for Time Series Forecasting [0.0] トランスフォーマーベースのアーキテクチャは自然言語処理とコンピュータビジョンにおいて顕著な成功を収めた。
これまでの研究では、伝統的な注意機構が、この領域におけるそれらの有効性を制限する重要な要素として特定されてきた。
本稿では,トランスフォーマーを用いた時系列予測において,エントロピー崩壊を緩和し,不安定性をトレーニングするための新しいアプローチであるLATSTを紹介する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 09:49:31 GMT)
Kernel Ridge Regression for Efficient Learning of High-Capacity Hopfield Networks [0.0] 反復学習の代替としてカーネルリッジ回帰(KRR)を提案する。
KRRは、クローズドフォームのソリューションを通じて非定性的に双対変数を学習し、学習速度の大幅な利点を提供する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 01:17:28 GMT)
Is Productivity in Quantum Programming Equivalent to Expressiveness? [0.0] 我々は、Qiskit、Cirq、Qrisp、quAPLなどのホスト型量子プログラミング言語と、Q#やQmodなどのスタンドアロン言語を比較した。
我々の研究結果は、異なる量子プログラミングパラダイムが表現性と生産性の間に明確なトレードオフをもたらすことを示唆している。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:17:26 GMT)
In between myth and reality: AI for math -- a case study in category theory [0.0] 我々は、数学研究の方向で行った実験について、現代のAIシステムで最も有名な2つの実験について論じる。
この実験の目的は、AIシステムが数学的研究をどのように支援できるかを理解することである。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 21:58:30 GMT)
ICAS: IP Adapter and ControlNet-based Attention Structure for Multi-Subject Style Transfer Optimization [0.0] ICASは効率的かつ制御可能なマルチオブジェクトスタイル転送のための新しいフレームワークである。
我々のフレームワークは、正確な局所的なスタイル合成とともに、忠実なグローバルなレイアウト維持を保証します。
ICASは、構造保存、スタイル整合性、推論効率において優れた性能を発揮する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 10:48:11 GMT)
Hybrid Dense-UNet201 Optimization for Pap Smear Image Segmentation Using Spider Monkey Optimization [0.0] 本研究では,事前学習したDenseNet201をU-Netアーキテクチャのエンコーダとして統合したハイブリッドDense-UNet201最適化手法を提案する。
Dense-UNet201は96.16%のセグメンテーション精度、91.63%のIoU、95.63%のDice係数スコアを達成した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 10:14:05 GMT)
Hopf Exceptional Points [0.0] ホップ不変量によって保護されるホップ例外点のクラスを導入する。
球面の高次ホモトピー群に基づいて、非エルミート位相を持つ多重折りたたみ HEP と対称性保護 HEP の存在を予測する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:19:05 GMT)
High-Precision Phase Control of an Optical Lattice with up to 50 dB Noise Suppression [0.0] 光格子は、レーザービームの定常波干渉パターンから構築された周期的な光結晶である。
2本の逆伝搬格子ビームを重畳し、それぞれが独立なアコホースト光変調器で位相と強度を制御する有効解を示す。
0.1Hz - 1Hz帯における格子相雑音の最大50dB抑制効果と,40年以上にわたる顕著な抑制効果を報告した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 18:09:25 GMT)
Gas Station of the Future: A Perspective on AI/ML and IoT in Retail Downstream [0.0] 未来のガソリンスタンドは、単純な燃料供給センターからインテリジェントな小売ハブへと転換する可能性がある。
本稿では、小売業のダウンストリーム部門における技術革新について考察する。
AI/MLを予測分析、動的価格設定、パーソナライズされた顧客のエンゲージメント、IoTに活用することにより、将来のガソリンスタンドは、燃料小売のエクスペリエンスを再定義する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 22:27:38 GMT)
Fragile Systems: A hidden variable theory for quantum mechanics [0.0] 量子力学(Quantum Mechanics)は、ベイズ確率論(Bayesian probability theory)の "fragile" システムへの応用に由来する。
複素ヒルベルト空間、非可換作用素および期待に対するトレース規則は、すべて線型代数の使用から自然に生じる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 19:17:49 GMT)
Focus3D: A Practical Method to Adaptively Focus ISAR Data and Provide 3-D Information for Automatic Target Recognition [0.0] 本稿では,集中アルゴリズムとレーダに対する船舶の角度をモデル化する手法を組み合わせることで,メレンデスとベネットの作業を拡張した。
本論文は, 水平面の回転を表すアスペクト角と, 傾斜角の2つの角度で船の回転をモデル化し, 船舶の効果的な放牧角度の変化を示す。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 20:19:30 GMT)
Fieldoscopy at the Quantum Limit [0.0] 光の古典的な性質から量子的な性質への明確な遷移を観察する。
我々は前例のないヨークトジュールレベルの感度と90デシベルを超えるダイナミックレンジに到達した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:38:46 GMT)
Feedforward suppression of readout-induced faults in quantum error correction [0.0] 方法は、前回のサイクルから各チェックキュービットの読み出し結果に条件付けされた適応的な読み出しシーケンスで構成される。
特定の量子ビット状態が強い読み出しエラーや測定によるリークに対して、このフィードフォワードプロトコルは物理量子ビットエラーを抑制することができる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:50:26 GMT)
Fault-tolerant structures for measurement-based quantum computation on a network [0.0] 本稿では,故障耐性測定に基づく量子計算(MBQC)アーキテクチャを構築する手法を提案する。
考えられる応用は分散量子計算であり、別の計算ノードが絡み合うことでフォールトトレラントな計算を行う。
我々は、モノリシックな(非分散的な)実装と分散的な実装の両方において、ダイヤモンド格子に基づくアーキテクチャが従来の立方体格子よりも優れていることを示した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:31:06 GMT)
Enhancing Stroke Diagnosis in the Brain Using a Weighted Deep Learning Approach [0.0] 脳卒中は、脳の一部への血流が破壊され、細胞死に至るときに起こる。
CTスキャンやMRIなどの従来の脳卒中診断法は費用と時間を要する。
本研究では,ランダムフォレスト,ディープラーニング,ヒストグラムに基づく勾配上昇などの分類器からの予測を組み合わせて,より効果的にストロークを予測する,重み付き投票アンサンブル(WVE)機械学習モデルを提案する。
このモデルはプライベートデータセットで94.91%の精度を達成し、早期のリスク評価と予防を可能にした。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 21:54:36 GMT)
Enhancing Cocoa Pod Disease Classification via Transfer Learning and Ensemble Methods: Toward Robust Predictive Modeling [0.0] 本研究では,移動学習を3つのアンサンブル学習戦略(bagging, Boosting, Stacking)と統合することにより,ココアポッド病分類のためのアンサンブルに基づくアプローチを提案する。
VGG16、VGG19、ResNet50、ResNet101、InceptionV3、Xceptionを含む事前訓練された畳み込みニューラルネットワークは、ブラックポッドロット、ポッドボラー、ヘルスの3つの疾患カテゴリを検出するためのベースラーナーとして微調整された。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 15:02:27 GMT)
Energy Landscape Plummeting in Variational Quantum Eigensolver: Subspace Optimization, Non-iterative Corrections and Generator-informed Initialization for Improved Quantum Efficiency [0.0] 変分量子固有解法(VQE)は、ハードウェアノイズとバレンプラトーと局所トラップの存在により、重大な課題に直面している。
本稿では,VQE最適化を低次元部分空間に投影することにより,ハードウェアリソースの利用率と精度を最適化する汎用形式を提案する。
数値シミュレーションにより, 化学にインスパイアされたアンザッツと組み合わせることで, 最小値の1~2桁の精度で推定できることがわかった。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 17:07:09 GMT)
Effect of electric vehicles, heat pumps, and solar panels on low-voltage feeders: Evidence from smart meter profiles [0.0] 低炭素技術(LCT)は高速で低電圧グリッド(LVG)に接続されている。
LVGへの影響を理解するための大きなハードルの1つは、最近の大規模な電力消費データセットの欠如である。
住宅LVG顧客を対象とした42,089個のスマートメータの大規模データセットを用いて,LV供給者のピークの大きさとタイミングに対するLCTの寄与について検討した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 06:40:24 GMT)
Dynamic Difficulty Adjustment With Brain Waves as a Tool for Optimizing Engagement [0.0] 本研究では,脳波を用いた脳波モニタリングを用いて,バーチャルリアリティ(VR)ゲーム環境における動的難易度調整(DDA)を実現する。
前頭脳波電極から導出されるタスクエンゲージメント指数(TEI)を用いて,最適なプレイヤーエンゲージメントを維持するために,ゲームチャレンジレベルをリアルタイムで調整する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:15:54 GMT)
Denoising and Reconstruction of Nonlinear Dynamics using Truncated Reservoir Computing [0.0] 本稿では,ノイズフィルタリングと非線形ダイナミクス再構築のための新しいReservoir Computing(RC)手法を提案する。
動的パラメータにおける雑音強度, 雑音周波数, および劇的なシフトの観点から, RCの性能について検討した。
演算器の冗長ノードとエッジをトラッピングすることで,デノナイジング性能が向上することが示されている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 21:47:13 GMT)
Constrained dynamics and confinement in the two-dimensional quantum Ising model [0.0] 量子イジングモデルの2次元2乗格子上のダイナミクスを最大16倍16$スピンで調べる。
秩序相では、モデルが動的に制約されたダイナミックスを示すと予測され、励起の制限と遅い熱化が生じる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:58:46 GMT)
Computer-Aided Design of Personalized Occlusal Positioning Splints Using Multimodal 3D Data [0.0] 本稿では,コンピュータ支援による咬合スプリントの位置推定と精度評価について述べる。
3Dスプリントは、下顎位置の処置的変化を表す形質転換マトリックスに基づいて生成される。
本稿では,治療位置における咬合条件を正確に再現するスプリント生成法を提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 11:53:49 GMT)
Comment on 'Product states and Schmidt rank of mutually unbiased bases in dimension six' [0.0] レムマは、$mathbbC6$の4つの互いに偏りのない基底の集合における任意の複素アダマール行列の構造に必要条件を与える。
補題の証明は誤りを含むことが示され、最終的には後続の論文で導かれた3つの定理を無効化する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 16:25:55 GMT)
Combining the Maximum Overlap Method with Multiwavelets for Core-Ionisation Energy Calculations [0.0] 分子のコアイオン化エネルギーを計算するためのプロトコルを提案する。
基底状態と中核イオン状態の両方の電子構造は、マルチウェーブレットと密度ファンクション理論を用いて計算される。
擬似ポテンシャルを用いた従来のマルチウェーブレット計算と一致していることを示す。
このプロトコルが比較的大きなターゲット分子にどのように適用できるかを実証する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:08:19 GMT)
Cluster-based classification with neural ODEs via control [0.0] パラメータを時間的一貫した関数として固定した単一ニューロンアーキテクチャを考える。
以前の研究では、$O(N)$スイッチを必要とするポイントバイポイント戦略を用いて分類が可能であることが示されている。
本稿では,任意のデータセットを$d$ポイントのクラスタを逐次ステアリングすることで,任意のデータセットを分類する新しい制御手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:28:16 GMT)
Cluster weighted models with multivariate skewed distributions for functional data [0.0] 本稿では,関数線形回帰モデルと3つのスキュート多変量分布の混合に基づくクラスタリング手法 funWeightClustSkew を提案する。
本手法は関数型高次元データクラスタリング(funHDDC)手法の枠組みに従う。
funWeightlustClustSkewのシミュレーションデータとAir Qualityデータセットの性能について説明する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 06:17:06 GMT)
ChemKANs for Combustion Chemistry Modeling and Acceleration [0.0] 化学動力学モデル推論を効率化するために機械学習技術が提案されている。
ケムカンは水素燃焼化学を正確に表現することができ、解法において詳細な化学よりも2倍の加速を与える。
これらのデモンストレーションは、燃焼物理学や化学反応学におけるケムカンの可能性を示している。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 01:53:28 GMT)
Can spacetime fluctuations generate entanglement between co-moving accelerated detectors? [0.0] リンドラー・ウェッジのネスト配列では、元のリンドラー・フレームの真空は、シフトしたリンドラー・フレームのオブザーバに熱的に占有しているように見える。
検出器の加速度に対する絡み合いの依存性について検討する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 06:05:41 GMT)
Building Russian Benchmark for Evaluation of Information Retrieval Models [0.0] RusBEIRは、ロシア語における情報検索モデルの評価のためのベンチマークである。
適応、翻訳、新しく作成されたデータセットを統合し、語彙モデルとニューラルモデルの比較を可能にする。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 12:11:14 GMT)
Bayesian dynamic borrowing considering semantic similarity between outcomes for disproportionality analysis in FAERS [0.0] 本稿では,自然報告システム(SRS)における有害事象(AE)の定量的同定を強化するため,ベイズ動的借入(BDB)アプローチを提案する。
この方法はベイズ階層モデルに先立って頑健なメタ分析予測(MAP)を組み込み、意味的類似度尺度(SSM)を組み込む。
FDA Adverse Event Reporting System(FAERS)の2015年から2019年にかけてのデータを用いて,MedDRAハイレベルグループ用語(HLGT)レベルでの借入による標準情報成分分析(IC)とICに対するアプローチを評価する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:49:27 GMT)
Atomic-scale imaging and charge state manipulation of NV centers by scanning tunneling microscopy [0.0] ダイヤモンド中の窒素空孔(NV)中心は、最も有望な固体量子ビット候補の一つである。
この分野では大きな進歩があったが、個々のNV中心の原子スケールの特徴と制御はいまだ解明されていない。
導電性グラフェンキャッピング層を用いたNV-$欠陥の直接イメージングと操作を可能にする新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 18:43:56 GMT)
Are AI agents the new machine translation frontier? Challenges and opportunities of single- and multi-agent systems for multilingual digital communication [0.0] 本稿では,機械翻訳システム(MT)におけるシングルエージェントとマルチエージェントシステムの可能性について述べる。
MTにおけるマルチエージェントの実現可能性を示すため,法的なMTのパイロット研究を行っている。
以上の結果から,マルチエージェントシステムはドメイン適応性とコンテキスト認識を大幅に改善する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 12:32:18 GMT)
Alternatives of entanglement depth and metrological entanglement criteria [0.0] 部分的絡み合い特性の1-パラメータ族と結果として生じる絡み合いの量に関する一般理論を考察する。
特に、パーティショナビリティの深さ、プロデューサビリティの深さ(あるいは単に絡み合う深さ)、ストレッチビリティの深さがある。
より物理的に意味のある性質、例えば、二乗性、強靭性、自由度、およびエントロピー的動機付けのいくつかのものを構築します。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:31:39 GMT)
Adversary-Augmented Simulation for Fairness Evaluation and Defense in Hyperledger Fabric [0.0] 本稿では,複数のプロトコルからなる分散システムに対する攻撃の分析に適した,逆モデルとシミュレーションフレームワークを提案する。
本モデルでは,対象プロトコルの仮定に基づいて,対戦行動の分類と制約を行う。
このフレームワークを適用して、Hyperledger Fabric(HF)ブロックチェーンネットワークの公平性特性を分析する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:17:27 GMT)
Adversarial Resilience against Clean-Label Attacks in Realizable and Noisy Settings [0.0] i.d.データのストリームから逐次学習する際、非依存的な保証を確立するという課題について検討する。
我々は学習者が不確実な場合に予測をしないことを許す。
我々は、ノイズのあるクリーンラベルの反対者の下で、不一致に基づくしきい値に対する学習者の理論的分析を初めて行った。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 13:20:12 GMT)
AdaptoVision: A Multi-Resolution Image Recognition Model for Robust and Scalable Classification [0.0] AdaptoVisionは、計算複雑性と分類精度を効率的にバランスさせるように設計された、新しい畳み込みニューラルネットワーク(CNN)アーキテクチャである。
強化された残余単位、深さ的に分離可能な畳み込み、階層的なスキップ接続を利用することで、AdaptoVisionはパラメータ数と計算要求を大幅に削減する。
CIFAR-10では95.3%、CIFAR-100では85.77%であり、事前訓練された重量に依存しない。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 05:23:07 GMT)
Acoustic to Articulatory Inversion of Speech; Data Driven Approaches, Challenges, Applications, and Future Scope [0.0] 本稿では,音声のAAI(Auance-to-Articulatory Inversion)の異なる応用に適用したデータ駆動型アプローチについて述べる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 19:38:50 GMT)
ALT: A Python Package for Lightweight Feature Representation in Time Series Classification [0.0] ALTは、効率的かつ正確な時系列分類(TSC)のために開発されたオープンソースのPythonパッケージである。
このパッケージは適応法則変換(ALT)アルゴリズムを実装し、可変長シフト時間窓を用いて生の時系列データを線形に分離可能な特徴空間に変換する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 10:57:29 GMT)
AI-Assisted Transport of Radioactive Ion Beams [0.0] 我々は,放射光の輸送過程を支援するために人工知能(AI)を用いたシステムを導入する。
このAI支援アプローチは、世界中の他の放射性ビーム施設に拡張して、運用効率を改善し、科学的な出力を高めることができる。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 00:25:50 GMT)
A biologically Inspired Trust Model for Open Multi-Agent Systems that is Resilient to Rapid Performance Fluctuations [0.0] 既存の信頼モデルは、エージェントモビリティ、振る舞いの変化、コールドスタート問題に関連する課題に直面します。
我々は,信頼者が自身の能力を評価し,信頼データをローカルに保存する,生物学的にインスパイアされた信頼モデルを導入する。
この設計はモビリティサポートを改善し、通信オーバーヘッドを減らし、偽情報に抵抗し、プライバシーを保護する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 08:21:54 GMT)
A Two-Phase Perspective on Deep Learning Dynamics [0.0] 深層ニューラルネットワークの学習は、高速な曲線フィッティングフェーズと、低速な圧縮または粗粒化フェーズの2段階に進むことを提案する。
私たちは、関連する時間スケールが2つのかなり異なる設定で一致していることを実証的に示します。
第2フェーズは、標準的なトレーニングアルゴリズムによって積極的に最適化されておらず、不要に長期化される可能性がある、と我々は主張する。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 06:57:37 GMT)
A Systematic Review on Sleep Stage Classification and Sleep Disorder Detection Using Artificial Intelligence [0.0] 本研究は,近年の文献を包括的かつ体系的にレビューし,睡眠研究における様々なアプローチとその成果を分析することを目的としている。
このレビューでは、最初183の論文が異なる雑誌から選ばれ、そのうち80の論文が2016年から2023年まで、明示的なレビューのために登録された。
脳波は、睡眠ステージングや障害研究に最もよく用いられる身体パラメータである。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 06:54:25 GMT)
A Stochastic Nonlinear Dynamical System for Smoothing Noisy Eye Gaze Data [0.0] 眼球追跡実験において収集した視線データを円滑にするための拡張カルマンフィルタ(EKF)を提案する。
その結果,EKFはノイズを著しく低減し,追跡精度が著しく向上した。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 18:42:03 GMT)
A Phenomenological Approach to Analyzing User Queries in IT Systems Using Heidegger's Fundamental Ontology [0.0] 本稿では,Martin Heidegger氏の基本オントロジーに基づく新しい分析ITシステムを提案する。
このシステムでは、ユーザー入力を処理するための存在の分類言語と、内部分析のための存在の実在言語という、2つの異なる記述的完備な言語が採用されている。
論文参考訳(メタデータ) (Thu, 17 Apr 2025 14:29:25 GMT)