Scaling Data-Constrained Language Models [133.2] データ制約付きシステムにおける言語モデルのスケーリングについて検討する。
固定された計算予算に対する制約付きデータでは、反復するデータの最大4つのエポックなトレーニングは、ユニークなデータに比べて損失に対する無視可能な変化をもたらす。
本稿では,繰り返しトークンと過剰パラメータの値の減少を考慮に入れた計算最適性のスケーリング法則を提案し,実証的に検証する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 00:00:06 GMT)
Generalized Linear Mode Connectivity for Transformers [87.3] 驚くべき現象はリニアモード接続(LMC)であり、独立に訓練されたモデルを低損失またはゼロ損失の経路で接続することができる。
以前の研究は主に置換によるニューロンの並べ替えに焦点を合わせてきたが、そのようなアプローチは範囲に限られている。
我々は、4つの対称性クラス(置換、半置換、変換、一般可逆写像)をキャプチャする統一的なフレームワークを導入する。
この一般化により、独立に訓練された視覚変換器とGPT-2モデルの間の低障壁とゼロバリア線形経路の発見が可能となった。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 01:46:36 GMT)
RoboPearls: Editable Video Simulation for Robot Manipulation [81.2] RoboPearlsは、ロボット操作のための編集可能なビデオシミュレーションフレームワークである。
3D Gaussian Splatting (3DGS)に基づいて構築されたRoboPearlsは、フォトリアリスティックでビュー一貫性のあるシミュレーションの構築を可能にする。
我々は、RLBench、COLOSSEUM、Ego4D、Open X-Embodiment、現実世界のロボットなど、複数のデータセットやシーンで広範な実験を行う。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 05:03:31 GMT)
ScienceMeter: Tracking Scientific Knowledge Updates in Language Models [79.3] 大規模言語モデル(LLM)は、科学研究を支援するためにますます使われているが、科学的進歩に関する彼らの知識は急速に時代遅れになる。
我々は,過去,現在,未来にまたがる科学的知識の更新手法を評価するための新しいフレームワークであるScienceMeterを紹介する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 05:08:03 GMT)
MLAN: Language-Based Instruction Tuning Preserves and Transfers Knowledge in Multimodal Language Models [79.1] マルチモーダルな大言語モデルのゼロショットタスクの一般化を改善するために,新しい視覚的インストラクションチューニング手法を提案する。
十分な多彩なテキストのみのデータの増加は、視覚言語アプローチよりも効率的でありながら、モダリティ全体にわたって命令追従能力とドメイン知識の伝達を可能にする。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 18:24:35 GMT)
Probabilistic Prototype Calibration of Vision-Language Models for Generalized Few-shot Semantic Segmentation [75.2] 一般化されたFew-Shot Semanticnative(GFSS)は、いくつかの注釈付き例だけでセグメンテーションモデルを新しいクラスに拡張することを目的としている。
プリトレーニング済みCLIPのマルチモーダルプロトタイプ上での確率的プロトタイプ校正フレームワークであるFewCLIPを提案する。
FewCLIPはGFSSとクラスインクリメンタルセッティングの両方で最先端のアプローチを著しく上回っている。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 18:36:22 GMT)
Seedance 1.0: Exploring the Boundaries of Video Generation Models [71.3] Seedance 1.0は高性能で推論効率の良いビデオ基盤生成モデルである。
精度と意味のあるビデオキャプションを付加したマルチソースキュレーションデータを統合する。
Seedance 1.0は1080p解像度で5秒のビデオを生成することができる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 11:58:23 GMT)
High-Precision Dichotomous Image Segmentation via Probing Diffusion Capacity [69.3] 拡散モデルは、例外的な品質、詳細な解像度、強い文脈認識を提供することによって、テキストと画像の合成に革命をもたらした。
本稿では,拡散モデルにおける事前学習されたU-Netのポテンシャルを利用する拡散駆動セグメンテーションモデルDiffDISを提案する。
DIS5Kデータセットの実験は、DiffDISの優位性を示し、合理化された推論プロセスを通じて最先端の結果を達成する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 02:27:51 GMT)
ICME 2025 Generalizable HDR and SDR Video Quality Measurement Grand Challenge [66.9] この課題は、HDRとSDRコンテンツを共同で扱うことのできるVQAアプローチをベンチマークし、促進することにある。
トップパフォーマンスモデルは最先端のパフォーマンスを達成し、一般化可能なビデオ品質評価のための新しいベンチマークを設定した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 07:14:23 GMT)
Finding the Sweet Spot: Preference Data Construction for Scaling Preference Optimization [66.7] 本研究の目的は、繰り返しランダムサンプリングにより、オンラインサンプルの数を増大させ、アライメント性能を向上させることである。
実験の結果,サンプルサイズが大きくなるにつれて,この戦略がエフェデクリンの性能向上につながることが明らかとなった。
サンプルの規模が大きくなるにつれてモデル性能を継続的に向上するスケーラブルな嗜好データ構築戦略を導入する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 07:31:40 GMT)
Neural Cellular Automata: From Cells to Pixels [66.3] バイオインスパイアされたニューラルセルラーオートマタ(NCAs)は、同じ細胞が自己組織され、単純な局所規則を適用することで複雑でコヒーレントなパターンを形成する生体インスパイアされたシステムである。
NCAは、自己再生、一般化、見えない状況に対する堅牢性、自発的な動きなど、突発的な行動を示す。
暗黙のデコーダを備えたNAAは,自己組織的,創発的特性を保ちながら,リアルタイムにフルHD出力を生成可能であることを示す。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 14:30:21 GMT)
ThinkVideo: High-Quality Reasoning Video Segmentation with Chain of Thoughts [64.9] ビデオオブジェクトの推論は難しいタスクであり、入力ビデオと暗黙の複雑なテキストクエリからマスクシーケンスを生成する。
既存の作業は、セグメント化に基づく出力のためにMLLM(Multimodal Large Language Model)を微調整することでこの問題を調査するが、時間に敏感なクエリが与えられたビデオでは難しいケースでは依然として不足している。
MLLMのゼロショット・チェーン・オブ・ソート(CoT)機能を利用してこれらの課題に対処する新しいフレームワークであるThinkVideoを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 21:35:45 GMT)
Think Before You Segment: High-Quality Reasoning Segmentation with GPT Chain of Thoughts [64.9] ThinkFirstはトレーニング不要の推論セグメンテーションフレームワークである。
我々のアプローチでは、GPT-4oや他の強力なMLLMが画像の詳細なチェーン記述を生成することができる。
この要約された記述は、セグメンテーションプロセスを支援するために言語で指示されたセグメンテーションアシスタントに渡される。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 21:31:26 GMT)
Margin Matching Preference Optimization: Enhanced Model Alignment with Granular Feedback [64.7] 人間のフィードバックからの強化学習など、アライメント技術で微調整された大規模言語モデル(LLM)は、これまでで最も有能なAIシステムの開発に役立っている。
マージンマッチング選好最適化(MMPO)と呼ばれる手法を導入し、相対的な品質マージンを最適化し、LLMポリシーと報酬モデルを改善する。
人間とAIの両方のフィードバックデータによる実験によると、MMPOはMT-benchやRewardBenchといった一般的なベンチマークにおいて、ベースラインメソッドよりも一貫してパフォーマンスが向上している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 08:52:35 GMT)
Decide less, communicate more: On the construct validity of end-to-end fact-checking in medicine [59.6] 我々は、専門家が医療証拠を合成することによって、ソーシャルメディアからの真の主張を検証する方法を示す。
臨床試験の形で、野生の主張と科学的証拠を結びつける困難さ。
我々は,ファクトチェックは対話型コミュニケーション問題としてアプローチし,評価すべきであると主張している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 06:11:10 GMT)
SConU: Selective Conformal Uncertainty in Large Language Models [59.3] SconU(Selective Conformal Uncertainity)と呼ばれる新しいアプローチを提案する。
我々は,特定の管理可能なリスクレベルで設定されたキャリブレーションの不確実性分布から,与えられたサンプルが逸脱するかどうかを決定するのに役立つ2つの共形p値を開発する。
我々のアプローチは、単一ドメインと学際的コンテキストの両方にわたる誤発見率の厳密な管理を促進するだけでなく、予測の効率を高める。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 15:29:40 GMT)
Time-MQA: Time Series Multi-Task Question Answering with Context Enhancement [55.2] Time Series Multi-Task Question Answering (Time-MQA)は、複数の時系列タスクにわたる自然言語クエリを可能にする統合フレームワークである。
Time-MQAの中心はTSQAデータセットである。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 18:42:47 GMT)
RGE-GS: Reward-Guided Expansive Driving Scene Reconstruction via Diffusion Priors [54.8] RGE-GSは、拡散に基づく生成と報酬誘導ガウス積分を相乗化する新しい拡張的再構築フレームワークである。
本稿では,復元フェーズに先立って一貫したパターンを識別・優先順位付けする報奨ネットワークを提案する。
復元過程において,シーン収束度に応じてガウス最適化の進捗を自動的に調整する学習戦略を考案した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 08:02:54 GMT)
Seg-Zero: Reasoning-Chain Guided Segmentation via Cognitive Reinforcement [52.7] Seg-Zeroは、顕著な一般化可能性を示し、認知的強化を通じて明確な連鎖推論を導出する新しいフレームワークである。
Seg-ZeroはGRPOによる強化学習と明確な推論データなしでのみ訓練される。
実験の結果、Seg-Zero-7BはReasonSegベンチマークで57.5のゼロショット性能を達成し、以前のLISA-7Bを18%上回った。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 11:01:08 GMT)
ThinkSound: Chain-of-Thought Reasoning in Multimodal Large Language Models for Audio Generation and Editing [52.3] ThinkSoundは、Chain-of-Thought(CoT)推論を利用して、ビデオの段階的にインタラクティブなオーディオ生成と編集を可能にする新しいフレームワークである。
提案手法は,3つの相補的な段階に分解する: セマンティック・コヒーレント, 正確なユーザインタラクションによる対話型オブジェクト中心の洗練, 自然言語命令でガイドされたターゲット編集。
実験により、ThinkSoundはオーディオメトリクスとCoTメトリクスの両方で、ビデオからオーディオ生成における最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 04:59:30 GMT)
Learning Time-Aware Causal Representation for Model Generalization in Evolving Domains [50.7] 動的因果要因と因果機構のドリフトを組み込んだ時間認識型構造因果モデル(SCM)を開発した。
本研究では,時間領域毎に最適な因果予測値が得られることを示す。
合成と実世界の両方のデータセットの結果から,SynCは時間的一般化性能に優れることが示された。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 07:42:53 GMT)
VisionScores -- A system-segmented image score dataset for deep learning tasks [49.2] VisionScoresは、最初のシステム別画像スコアデータセットである。
機械学習とディープラーニングのタスクのために、構造に富んだ高情報密度の画像を提供することを目指している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 22:29:23 GMT)
Deep Learning based Joint Geometry and Attribute Up-sampling for Large-Scale Colored Point Clouds [46.8] 本研究では,大規模点群を生成するための深層学習に基づくJGAU(Joint Geometry and Attribute Up-Sampling)手法を提案する。
我々は、SYSU-PCUDと呼ばれるカラーポイントクラウドアップサンプリングのための大規模データセットをリリースする。
実験により、JGAU法により達成されたピーク信号-雑音比(PSNR)は33.90デシベルであることが示されている。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 04:08:44 GMT)
MusiXQA: Advancing Visual Music Understanding in Multimodal Large Language Models [46.8] MusiXQAは、音楽シート理解におけるMLLMの評価と進歩のための、最初の包括的なデータセットである。
我々は、データセットに微調整されたMLLMであるPhi-3-MusiXを開発し、GPT法よりも大きな性能向上を実現した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 20:46:47 GMT)
Test-Time Reasoning Through Visual Human Preferences with VLMs and Soft Rewards [45.8] ImageReward や Human Preference Score v2 (HPSv2) のようなデータセットを用いて、われわれのモデルは ImageReward のテストセットで 64.9%、HPSv2で65.4% の精度を達成した。
われわれの発見は、テキスト・ツー・ビジョン・モデルをさらに強化する強力なマイルストーンになり得る。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 09:19:28 GMT)
BraTS-PEDs: Results of the Multi-Consortium International Pediatric Brain Tumor Segmentation Challenge 2023 [44.6] 小児脳腫瘍に焦点を当てた第1回BraTS-PEDs 2023チャレンジの結果を報告する。
BraTS-PEDs 2023は、磁気共鳴画像による小児脳グリオーマの体積分割アルゴリズムの評価を目的とした。
小児腫瘍分析におけるトップパフォーマンスのAIアプローチには、nnU-NetとSwin UNETR、Auto3DSeg、あるいはnnU-Netの自己組織化フレームワークによるアンサンブルが含まれていた。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 14:31:12 GMT)
AirSketch: Generative Motion to Sketch [44.5] 本研究では,手の動きから直接忠実で視覚的に整合したスケッチを生成することを目的としたAirSketchの概念を紹介する。
制御可能な画像拡散モデルにより、ノイズの多い手追跡画像から、きれいで美的なスケッチへの翻訳を学習することができる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 17:16:06 GMT)
Training Flexible Models of Genetic Variant Effects from Functional Annotations using Accelerated Linear Algebra [44.3] 提案手法は,大規模ニューラルネットワーク予測モデルを用いてオプティマイザを最適化するDeepWASを開発するための手法である。
より多くの機能でトレーニングされたより大きなモデルは、より良い予測をし、病気の予測を改善し、治療対象の識別を改善する可能性がある。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 13:26:08 GMT)
Compositional Generative Model of Unbounded 4D Cities [44.2] 本研究では,4次元都市を創出するのに適した構成生成モデルを提案する。
CityDreamer4Dは、インスタンス編集、都市スタイル化、都市シミュレーションなど、さまざまなダウンストリームアプリケーションをサポートしている。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 03:02:48 GMT)
A Reinforcement Learning Approach for Optimal Control in Microgrids [43.1] マイクログリッドは、エネルギー発生、貯蔵、分散に対する局所的な制御を可能にすることで、有望なソリューションを提供する。
本稿では,マイクログリッドエネルギー管理を最適化するための新しい強化学習手法を提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 20:10:00 GMT)
The Limited Impact of Medical Adaptation of Large Language and Vision-Language Models [42.1] 医療用大規模言語モデル(LLM)と視覚言語モデル(VLM)を対応するベースモデルと比較する。
以上の結果から,最先端の汎用ドメインモデルはすでに強力な医学的知識と推論能力を持っている可能性が示唆された。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 21:17:10 GMT)
SPEAR: Structured Pruning for Spiking Neural Networks via Synaptic Operation Estimation and Reinforcement Learning [41.9] ディープスパイクニューラルネットワーク(SNN)は優れたパフォーマンスを示し、リソースに制約のあるニューロモルフィックハードウェアへの展開は依然として困難である。
ネットワークプルーニングは、SNNのエッジデプロイメントを容易にするために、パラメータとシナプス操作(SynOps)の両方を削減することで、実行可能なソリューションを提供する。
既存の検索ベースのメソッドは、検索プロセスで動的に変更されるため、制約としてSynOpsを直接使用することができない。
本稿では,SynOpsを探索制約として直接使用するために強化学習(RL)技術を利用するSPEARという新しいSNN刈取フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 15:21:05 GMT)
APVR: Hour-Level Long Video Understanding with Adaptive Pivot Visual Information Retrieval [41.8] 現在の大規模言語モデル(LM)は時間レベルのビデオ理解に苦慮している。
bftextAdaptive textbfPivot MLbfVisual information textbfRetrieval (textbfAPVR)は、十分に重要な視覚情報を階層的に検索し保持する、トレーニング不要のフレームワークである。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 07:30:15 GMT)
FOCUS: Fine-grained Optimization with Semantic Guided Understanding for Pedestrian Attributes Recognition [40.9] 歩行者属性認識は、インテリジェント輸送とセキュリティにおける基本的な認識課題である。
このきめ細かいタスクに対処するため、既存のほとんどの手法は属性情報を豊かにするための地域特徴の抽出に重点を置いている。
PARに対するsemantitextbfC gtextbfUided undertextbfStanding(FOCUS)アプローチを用いたtextbfFine-fine textbfOptimizationを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 10:38:54 GMT)
Adaptive Rank Allocation for Federated Parameter-Efficient Fine-Tuning of Language Models [40.7] 本稿では,パラメータ効率の高い言語モデルの微調整のための新しい適応ランクアロケーションフレームワークであるFedARAを提案する。
FedARAは、ヘテロジニアスなデータの下で、さまざまなデータセットやモデルに対して平均6.95%から8.49%のベースラインを一貫して上回っている。
各種エッジデバイスの実験では、それぞれ48.90%、46.95%のトレーニング時間とエネルギー消費が大幅に減少している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 10:20:31 GMT)
Early Stopping Tabular In-Context Learning [40.6] テキスト内学習を早期に行うことを提案する。
トランスフォーマーエンコーダの各レイヤの後にコンテキスト内学習を停止させるかどうかを動的に評価することでこれを実現する。
一旦停止すると、プレトレーニングされたレイヤワイズデコーダを使って埋め込みをデコードします。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 19:36:55 GMT)
Scalable Structure Learning of Bayesian Networks by Learning Algorithm Ensembles [40.2] 本稿では,構造学習アンサンブル(SLE)を用いて,一貫した学習精度を実現する方法を提案する。
また,高品質なSLEを手作業で設計する上での課題に対処するため,準最適SLEを学習するためのAuto-SLEという自動手法を提案する。
本手法は,SLE学習用トレーニングデータよりも多くの変数を持つデータセットによく一般化する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 11:05:08 GMT)
Listener-Rewarded Thinking in VLMs for Image Preferences [38.1] 視覚報酬モデルをトレーニングするためのリスナー強化GRPOフレームワークを提案する。
我々のリスナー型報酬方式は,ImageRewardベンチマークにおいて最も精度が高い。
これらの結果から、聞き手による報酬は、視覚言語モデルと微妙な人間の嗜好を整合させる、スケーラブルでデータ効率のよい経路を提供することが示された。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 09:53:17 GMT)
A Systematic Study of Compositional Syntactic Transformer Language Models [37.4] 本稿では,構成表現のボトムアップ構成を含む構成構文解析木に基づく合成SLMについて述べる。
既存の構成SLMにおける設計選択のキーとなる側面を特定し,既存モデルと新規モデルの両方を包含する統一フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 18:32:23 GMT)
LatentMove: Towards Complex Human Movement Video Generation [35.8] 我々は、高ダイナミックな人間のアニメーションに特化して設計されたDiTベースのフレームワークであるLatentMoveを提示する。
アーキテクチャには条件制御ブランチと学習可能なフェイス/ボディトークンが組み込まれており、フレーム間のきめ細かい詳細や一貫性を保っている。
I2Vシステムのロバスト性を評価するために設計された多種多様で挑戦的な人間の動きを特徴付けるデータセットである複合Human-Videos(CHV)を紹介する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 01:34:06 GMT)
STR-Match: Matching SpatioTemporal Relevance Score for Training-Free Video Editing [35.5] STR-Matchは、視覚的に魅力的なコヒーレントなビデオを生成するトレーニングフリーのビデオ編集システムである。
STR-Matchは、視覚的品質と時間的一貫性の両方において、既存の手法よりも一貫して優れている。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 12:36:19 GMT)
Enhancing the Capability and Robustness of Large Language Models through Reinforcement Learning-Driven Query Refinement [35.5] 大きな言語モデル(LLM)の、正直で無害で有用な応答を生成する能力は、ユーザープロンプトの品質に大きく依存している。
本研究では,LSMに入力される前にユーザプロンプトを洗練する,転送可能でプラグイン可能なフレームワークを提案する。
この戦略はクエリの品質を改善し、LCMにより誠実で良質で有用なレスポンスを生成する権限を与えます。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 07:39:54 GMT)
Multi Layered Autonomy and AI Ecologies in Robotic Art Installations [34.5] 本稿では,Baoyang Chen氏の大規模インスタレーションであるSymbiosis of Agentsについて述べる。
AI駆動のロボットを没入型ミラーラインのアリーナに埋め込んで、マシンエージェンシーと芸術的作者との緊張関係を探る。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 02:37:31 GMT)
Predicting and Explaining Customer Data Sharing in the Open Banking [34.3] 本研究は,オープンバンキングによるデータ共有の妥当性を予測し,説明モデル解析(EMA)を通じてその振る舞いを解釈する枠組みを提案する。
約320万人の顧客がいるブラジルの大手金融機関からのデータを使用して、データ共有の頻度に対処するためにハイブリッドなデータバランス戦略が採用された。
これらのモデルは顧客のデータ共有を正確に予測し、インフローの精度は91.39%、アウトフローの精度は91.53%に達した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 01:24:59 GMT)
How to Retrieve Examples in In-context Learning to Improve Conversational Emotion Recognition using Large Language Models? [34.2] 本研究では,大規模言語モデル(LLM)による会話感情認識(CER)の改善手法について検討する。
ランダムかつ拡張されたサンプル検索に基づく様々な戦略を提案し、CERの精度に対する会話コンテキストの影響を解析する。
その結果、拡張サンプル検索は、すべてのデータセットを対象とした調査において、他の手法よりも一貫して優れていることがわかった。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 03:04:05 GMT)
ContextCache: Context-Aware Semantic Cache for Multi-Turn Queries in Large Language Models [33.7] このデモでは、マルチターン対話のためのコンテキスト対応セマンティックキャッシュシステムであるContextCacheを紹介した。
ContextCacheは、2段階の検索アーキテクチャを使用し、まず現在のクエリ上でベクトルベースの検索を実行し、潜在的なマッチングを識別し、その後、正確なコンテキストマッチングのための自己認識機構を通じて、現在の対話表現と過去の対話表現を統合する。
キャッシュされた応答は、直接LLM呼び出しの約10倍のレイテンシを示し、会話アプリケーションに対する計算コストの大幅な削減を可能にする。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 07:25:12 GMT)
XTransfer: Cross-Modality Model Transfer for Human Sensing with Few Data at the Edge [32.7] 事前訓練されたモデルの転送に依存する現在の方法は、モダリティシフトのような問題に遭遇することが多い。
資源効率, モダリティに依存しないモデル転送のための第一種手法であるXTransferを提案する。
XTransferは、センサデータ収集、モデルトレーニング、エッジデプロイメントのコストを大幅に削減しつつ、人間のセンシングタスクにおける最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 02:14:43 GMT)
LightBSR: Towards Lightweight Blind Super-Resolution via Discriminative Implicit Degradation Representation Learning [31.0] LR画像の暗黙的劣化表現(IDR)を抽出する際の暗黙的劣化推定に基づく盲点超解像(IDE-BSR)ヒンジ。
既存の方法は、BSRにおけるIDR識別性の重要性を無視している。
光BSRと呼ばれる新しい強力で軽量なBSRモデルを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 01:24:10 GMT)
Are Convex Optimization Curves Convex? [30.1] 最初の高原に急激な減少が続き、最適化がいつ停止するかを決めるのが困難になる。
意外なことに、答えはステップサイズの選択に依存している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 20:25:33 GMT)
How Semantically Informative is an Image?: Measuring the Covariance-Weighted Norm of Contrastive Learning Embeddings [29.8] コントラスト学習モデルを用いてテキストサンプルから算出した画像に対する意味情報度指標を提案する。
画像上の条件付けが関連するテキストの分布を歪めているかを測定する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 13:36:44 GMT)
General Compression Framework for Efficient Transformer Object Tracking [29.8] そこで我々は,CompressTrackerという,効率的なトランスフォーマーオブジェクト追跡のための汎用モデル圧縮フレームワークを提案する。
本手法は,教師モデルのトランスフォーマー層を異なる段階に分割する新たな段階分割戦略を特徴とする。
また、学生モデルの特定の段階を教師モデルとランダムに置き換える独自の代替訓練手法を設計する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 08:38:59 GMT)
GM-MoE: Low-Light Enhancement with Gated-Mechanism Mixture-of-Experts [29.5] 低照度化は、自動運転、3D再構成、リモートセンシング、監視など、幅広い用途に応用されている。
低照度画像強調のための混合実験ネットワークを導入した最初のフレームワークであるGated-Mechanism Mixture-of-Experts (GM-MoE)を提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 10:49:59 GMT)
PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models [28.7] PRMベンチ(PRM Bench)は, PRMの微細な誤差検出機能を評価するための, プロセスレベルのベンチマークである。
PRMBenchは、6,216の慎重に設計された問題と83,456のステップレベルラベルで構成され、複数の次元にわたるモデルを評価する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 12:31:45 GMT)
PoI: A Filter to Extract Pixel of Interest from Novel View Synthesis for Scene Coordinate Regression [28.4] 新しいビュー合成(NVS)技術は、トレーニングデータを拡張・多様化することで、カメラのポーズ推定を強化することができる。
これらの手法によって生成された画像は、しばしばぼやけや幽霊のような空間的な人工物に悩まされる。
本稿では,トレーニング中に最適な画素を動的に識別・破棄する二基準フィルタリング機構を提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 10:06:29 GMT)
Which Programming Language and What Features at Pre-training Stage Affect Downstream Logical Inference Performance? [26.9] 大規模言語モデル(LLM)は、数学や論理的推論タスクにおいて顕著な一般化能力を示している。
本研究の目的は,事前学習中の言語と特徴が論理推論性能にどのような影響を及ぼすかを検証することである。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 13:44:16 GMT)
BEST-Route: Adaptive LLM Routing with Test-Time Optimal Compute [25.7] BEST-Routeは、クエリの難しさと品質閾値に基づいて、モデルとサンプルに対する応答数を選択する新しいルーティングフレームワークである。
実世界のデータセットを用いた実験により,提案手法はコストを最大60%削減し,性能低下は1%以下であった。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 01:52:50 GMT)
Part Segmentation and Motion Estimation for Articulated Objects with Dynamic 3D Gaussians [25.7] パートセグメンテーションとモーション推定は、明瞭な物体の動き解析の基本的な問題である。
単音節物体の観測点雲列からこれらの問題を共同で解く方法を提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 01:56:35 GMT)
Kill Two Birds with One Stone! Trajectory enabled Unified Online Detection of Adversarial Examples and Backdoor Attacks [25.7] 提案されたUniGuardは、敵の例とバックドア攻撃に同時に対処できる、最初の統合されたオンライン検出フレームワークである。
第一に、AEとバックドア攻撃の両方が推論フェーズを妥協し、オンライン検出を通じて実行中に同時に対処できるようにする必要がある。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 02:06:23 GMT)
Improving Rationality in the Reasoning Process of Language Models through Self-playing Game [25.2] 証明者が最初に与えられた問題に対する解を提供し、その後、その解に対する批判によって挑戦される、批判認識ゲーム(CDG)を設計する。
証明者の目的は、誤解を招くコメントに直面しながら、建設的なフィードバックに対する誤りを修正しながら正しい回答を維持することである。
数学的推論,ステップワイドな誤り検出,自己補正,長鎖推論を含む課題に関する実験により,CDGトレーニングは,その推論過程を理解するための整合性 LLM の能力を大幅に向上させることができることを示した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 15:11:23 GMT)
The Translation Barrier Hypothesis: Multilingual Generation with Large Language Models Suffers from Implicit Translation Failure [25.0] 生成のための暗黙的なタスク解決-->翻訳パイプラインの存在を実証する。
108言語対にわたる単語翻訳タスクに対して,この仮説を検証した。
全体的な失敗のかなりの部分は、翻訳失敗に起因していることが分かりました。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 02:09:21 GMT)
Better Aligned with Survey Respondents or Training Data? Unveiling Political Leanings of LLMs on U.S. Supreme Court Cases [24.6] 本研究では,大規模言語モデルの政治的傾きが事前学習コーパスから記憶されたパターンを反映する程度について検討する。
ケーススタディとして、我々は、中絶や投票権などの論争的な話題に対処するため、米国最高裁判所32件のLLMの政治的傾向を調査することに焦点をあてる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 10:09:37 GMT)
Efficiently Serving Large Multimodal Models Using EPD Disaggregation [24.1] Encode-Prefill-Decode Disaggregation(エンコード・プリフィル・デコード・デコード・デアグリゲーション)という,エンコード・プリフィル・デコード・デコード・デアグリゲーション(Encode-Prefill-Decode Disaggregation)というフレームワークを紹介した。
エンコーディングとプリフィルをバンドルする現在のシステムとは異なり、私たちのアプローチはこれらのステップを分離し、新たな機会と最適化を解放します。
一般的なLMMを用いた実験では、メモリ効率(ピークメモリ使用率の最大15倍)、バッチサイズ(最大22倍)、リクエストあたり10倍のイメージ、および2.2倍のKVキャッシュが大幅に向上した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 03:53:17 GMT)
Tracking by Detection and Query: An Efficient End-to-End Framework for Multi-Object Tracking [23.8] マルチオブジェクトトラッキング(MOT)は、トラッキング・バイ・検出(TBD)とトラッキング・バイ・クエリ(TBQ)の2つのパラダイムによって支配されている。
本稿では,両パラダイムの長所を効果的に組み合わせたTBDQ-Netを提案する。
提案手法は,MOT調整アソシエータと事前学習した高性能検出器を効率よく統合する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 02:52:56 GMT)
S^3cMath: Spontaneous Step-level Self-correction Makes Large Language Models Better Mathematical Reasoners [23.7] 自己補正は,大規模言語モデル(LLM)の潜在的な推論能力を刺激する手法である
本稿では,S$3$c-Mathを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 04:34:18 GMT)
From Outcomes to Processes: Guiding PRM Learning from ORM for Inference-Time Alignment [23.5] 報酬誘導探索(RGS)にプロセス報酬モデル(PRM)を導入する。
本研究では,SP-PRMを提案する。SP-PRM,SP-PRM,SP-PRM,SP-PRM,SP-PRM,SP-PRM,SP-PRM,SP-PRM,SP-PRM。
対話、要約、推論タスクの実験は、SP-PRMが既存のRGSメソッドを大幅に強化し、全タスクでGPT-4の評価スコアが3.6%-10.3%向上したことを示している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 14:16:58 GMT)
BFA: Best-Feature-Aware Fusion for Multi-View Fine-grained Manipulation [23.3] マルチビュー操作タスクのためのBFA融合戦略を提案する。
ポリシーネットワークの視覚的バックボーンに基づいて、各ビューの重要度を予測する軽量ネットワークを設計する。
予測された重要度に基づいて、再重み付けされたマルチビュー機能はその後融合され、エンドツーエンドのポリシーネットワークに入力される。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 17:23:09 GMT)
What can large language models do for sustainable food? [22.7] 食品システムは、人為的な温室効果ガス排出量の3分の1を担っている。
本研究では,Large Language Models (LLMs) が食品生産の環境への影響を減らしうるかを検討した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 18:05:20 GMT)
OpenPath: Open-Set Active Learning for Pathology Image Classification via Pre-trained Vision-Language Models [22.5] 病理画像分類のためのオープンセット能動的学習手法OpenPathを提案する。
OpenPathは、選択されたサンプルの純度が高いため、モデルの性能を大幅に向上させる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 10:26:44 GMT)
Point Cloud Compression and Objective Quality Assessment: A Survey [22.3] 3Dポイントのクラウドデータは、自動運転、ロボティクス、没入型環境のアプリケーションによって駆動される。
従来の2Dメディアとは異なり、ポイントクラウドは不規則な構造、高いデータボリューム、複雑な属性のためにユニークな課題を呈している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 14:34:24 GMT)
Super Co-alignment of Human and AI for Sustainable Symbiotic Society [22.0] 持続可能な共生社会の価値観は、人間と生きたAIによって共に形成されるべきである。
本稿では,外部監視と本質的プロアクティブアライメントを統合したフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 12:44:53 GMT)
Residual Matrix Transformers: Scaling the Size of the Residual Stream [21.6] 残ストリームはメモリバスとして機能し、トランスフォーマー層は格納とアクセスの両方の機能を格納する。
残差ストリームにおける情報検索・保存機構の変更を検討し, 変圧器の残差ストリームを外部積記憶行列に置き換える。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 00:29:42 GMT)
CP-Guard: A Unified, Probability-Agnostic, and Adaptive Framework for Malicious Agent Detection and Defense in Multi-Agent Embodied Perception Systems [21.5] コラボレーティブ・パーセプション(CP)は、マルチエージェント自律運転とマルチエージェントロボットシステムにとって有望な技術であることが示されている。
CPでは、egoエージェントは、その協力者からメッセージを受け取る必要があるため、悪意のあるエージェントからの攻撃に対して脆弱である。
我々は、CP-Guardという統合された、確率に依存しない、適応的なフレームワークを提案し、その協調ネットワークにおける悪意あるエージェントを正確に検出し、排除する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 14:02:14 GMT)
Quantum implicit representation of vortex filaments in turbulence [21.4] 絡み合った渦フィラメントは乱流に必須であり、非線形流体力学を管理するコヒーレント構造として機能する。
本研究では、レベルセット法を用いて、乱流中の渦フィラメントの量子暗黙表現を導入する。
提案する量子フレームワークは,精度,堅牢性,汎用性のバランスを維持しつつ,ほぼ直線的な時間複雑性と指数的ストレージ削減を実現する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 12:02:33 GMT)
Sculpting Memory: Multi-Concept Forgetting in Diffusion Models via Dynamic Mask and Concept-Aware Optimization [20.8] テキスト・ツー・イメージ(T2I)拡散モデルは,テキスト・プロンプトから高品質な画像を生成することに成功している。
しかし、膨大な量の知識を蓄積する能力は、選択的に忘れることが必要なシナリオに懸念を生じさせる。
マルチコンセプトを忘れるように設計された新しいアンラーニングフレームワークであるコンセプト・アウェア・ロスを併用したtextbfDynamic Maskを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 04:37:01 GMT)
Evaluating Agents using Social Choice Theory [20.6] 我々は、投票理論のレンズを通して、多くの一般的な評価問題を見ることができると論じる。
各タスクは別個の投票者として解釈され、全体的な評価を得るためには、通常のランク付けやエージェントのペア比較しか必要としない。
これらの評価は解釈可能で柔軟性があり、現在クロスタスク評価に直面している多くの問題を回避している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 20:24:20 GMT)
UniFuse: A Unified All-in-One Framework for Multi-Modal Medical Image Fusion Under Diverse Degradations and Misalignments [20.3] 現在のマルチモーダル医療画像融合は、典型的には、ソース画像は高品質で、ピクセルレベルで完全に整列していると仮定する。
劣化認識学習モジュールを組み込むことで、UniFuseは入力画像から多方向情報をシームレスに統合する。
本稿では,LoRA の原理に基づく適応型 LoRA Synergistic Network (ALSN) を取り入れた,ユニバーサル・フィーチャー・リカバリ・アンド・フュージョン・モジュールを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 02:44:22 GMT)
Explanations are a means to an end [19.9] 説明は特定の目的を念頭において設計・評価されるべきである、と我々は主張する。
さまざまなユースケースにまたがって,このような機能的なアプローチが適用可能であることを示す。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 03:04:21 GMT)
MPC in the Quantum Head (or: Superposition-Secure (Quantum) Zero-Knowledge) [19.7] 本稿では,MPC-in-the-headパラダイムの量子設定への一般化について述べる。
本稿では,書面の重ね合わせが可能である検証者に対して,セキュリティが保たれるゼロ知識プロトコルを構築するための新しいアプローチを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 17:43:32 GMT)
MedEthicsQA: A Comprehensive Question Answering Benchmark for Medical Ethics Evaluation of LLMs [18.9] 本稿では, LLM における医療倫理評価のために, $textbf5,623$ 複数選択質問と $textbf5,351$ オープンエンド質問からなる総合的なベンチマークである $textbfMedEthicsQA$を紹介する。
我々は、グローバルな医療倫理基準を統合した階層的な分類を体系的に確立し、このベンチマークは広く使われている医療データセット、権威ある質問銀行、文献から派生したシナリオを包含する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 08:21:35 GMT)
Knowledge Augmented Finetuning Matters in both RAG and Agent Based Dialog Systems [18.8] 大規模言語モデル (LLM) はダイアログシステムに適用されている。
LLMは知識集約的なシナリオでエラーを起こしやすい。
検索拡張生成(RAG)とエージェントに基づくアプローチが現われ,実際の精度が向上した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 11:26:31 GMT)
SemFaceEdit: Semantic Face Editing on Generative Radiance Manifolds [18.6] この研究は、外観と幾何学的編集プロセスを合理化する新しい方法であるSemFaceEditを導入している。
提案手法は,生成画像内の異なる顔のセマンティクスに関連する幾何学的特徴と外観を効果的に分離する。
本実験では,セマンティックフィールドベースの編集におけるSemFaceEditの優れた性能を強調した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 10:29:23 GMT)
Interpretable Time Series Autoregression for Periodicity Quantification [18.6] 本稿では,解釈可能な機械学習の観点から,スパース自動回帰フレームワークを提案する。
本研究では,部分空間追従に基づく決定変数探索(DVP)戦略を開発し,探索空間を削減する。
特に、提案手法は、何百万もの決定変数であっても、大規模な問題に対してモデルをスケーラブルにする。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 14:17:11 GMT)
Evaluating and Improving Large Language Models for Competitive Program Generation [18.6] 本研究では,大規模言語モデル(LLM)を現実の競合プログラミング問題の解法として評価・改善することを目的とする。
2024年に開催された9つの地域ICPC/CCPCコンテストから117の問題を収集し、4つのフィルタリング基準を設計し、80の問題をキュレートしたベンチマークを構築した。
我々は,オンライン審査員(OJ)プラットフォームを通じて,その競争プログラム生成能力を評価し,慎重に設計された基本的なプロンプトで指導する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 17:18:23 GMT)
Prompt Mechanisms in Medical Imaging: A Comprehensive Survey [18.1] 深層学習は医療画像に変革をもたらす。
しかし、その臨床導入は、データの不足、分散シフト、堅牢なタスクの一般化の必要性といった課題によって、しばしば妨げられている。
深層学習モデルを導くための重要な戦略として,プロンプトベースの方法論が登場している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 03:06:25 GMT)
Vision Technologies with Applications in Traffic Surveillance Systems: A Holistic Survey [18.1] 交通監視システム(TSS)は、現代のインテリジェント交通システムにおいてますます重要になっている。
本稿では,TSSにおける視覚技術の体系的レビューを行う。
低レベルと高レベルの両方の知覚タスクについて検討する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 06:36:13 GMT)
Iterative Zoom-In: Temporal Interval Exploration for Long Video Understanding [18.0] 時間探索(Temporal Search)は、MLLMが時間領域を探索し、長いビデオの理解を反復的に改善する訓練不要のフレームワークである。
モデルの生成信頼度は、時間間隔によって異なるため、予測精度と高い相関関係がある。
よりきめ細かな時間間隔に注意を移し、長いビデオの理解を深めることで、モデルの焦点を洗練させる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 15:24:05 GMT)
Imitation Learning of Correlated Policies in Stackelberg Games [17.0] Stackelbergゲームは、リーダーの戦略がフォロワーの反応を駆動する非対称な相互作用を含む。
多エージェントシステムではエージェントの動作は相互依存的であり、従来のマルチエージェント・イミテーション・ラーニング(MAIL)手法は複雑な相互作用を捉えるのに失敗することが多い。
そこで本稿では,Stackelbergゲーム用に特別に設計されたポリシ占有率の相関式を提案し,それに対応するためにLatent Stackelberg Differential Network (LSDN)を提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 07:26:06 GMT)
Open World Object Detection: A Survey [16.8] オープンワールドオブジェクト検出(OWOD)は、この原則を適用して新しい知識を探求する、新たな研究分野である。
本稿では、OWODドメインの徹底的なレビューを行い、問題定義、ベンチマークデータセット、ソースコード、評価指標、既存手法の比較研究など、基本的な側面について述べる。
本稿では,現在のOWODアルゴリズムが直面する限界と課題に対処し,今後の研究の方向性を提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 12:17:40 GMT)
DMD-Net: Deep Mesh Denoising Network [16.6] DMD-Netはエンドツーエンドのディープラーニングフレームワークであり,メッシュデノケーション問題を解決するためのフレームワークである。
DMD-Netは、原始グラフと双対グラフの両方で集約を行うグラフ畳み込みニューラルネットワークで構成されている。
提案手法は,最先端メッシュデノケーションアルゴリズムと比較して,競争力や優れた結果が得られることを示す。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 11:13:45 GMT)
Self-supervised Learning of Hybrid Part-aware 3D Representation of 2D Gaussians and Superquadrics [16.4] PartGSは、オブジェクトやシーンを解釈可能な分解に解析するために、2Dガウスとスーパークワッドリックを統合する、自己管理された部分認識再構築フレームワークである。
提案手法は,DTU,ShapeNet,および実世界のデータセットに関する広範な実験において,最先端の手法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 07:40:39 GMT)
Guiding AI to Fix Its Own Flaws: An Empirical Study on LLM-Driven Secure Code Generation [16.3] 大規模言語モデル(LLM)は、コードの自動生成のための強力なツールになっている。
LLMは、しばしば重要なセキュリティプラクティスを見落とし、安全でないコードを生成する。
本稿では、安全性の低いコードを生成するための固有の傾向、自己生成する脆弱性ヒントによってガイドされた場合にセキュアなコードを生成する能力、フィードバックレベルが異なる場合に脆弱性を修復する効果について検討する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 23:24:33 GMT)
Unleashing the Multi-View Fusion Potential: Noise Correction in VLM for Open-Vocabulary 3D Scene Understanding [15.9] MVOV3Dはオープンな3Dシーン理解のための2次元多視点融合の可能性の解放を目的とした新しいアプローチである。
具体的には、MVOV3Dは、CLIPエンコーダでエンコードされた正確な領域レベルの画像特徴とテキスト特徴を活用することで、マルチビュー2D機能を改善する。
ScanNet200では14.7% mIoU,Matterport160では16.2% mIoU,オープン語彙セマンティックセマンティックセグメンテーションでは14.7% mIoUを達成した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 08:40:42 GMT)
VOCABTRIM: Vocabulary Pruning for Efficient Speculative Decoding in LLMs [15.5] 本研究では,プロダクタに基づく投機的復号法(SpD)の性能向上のためのトレーニングフリー手法を提案する。
ドラフトラダーベースの投機的復号法は、複数のトークンからなるドラフトシーケンスまたはツリーをサンプリングするために、ドラフトラダーまたはドラフトモデルと呼ばれる1つ以上のより小さな言語モデルを利用する。
提案手法は,Spec-Bench上でのLlama-3モデルのメモリバウンド速度を,特にLlama-3.2-3B-Instructの16%向上できることを示す。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 00:26:40 GMT)
AI-Generated Song Detection via Lyrics Transcripts [15.2] AIベースの音楽生成ツールの近年の能力向上は、音楽産業の隆盛を生み出している。
本稿では、一般的な自動音声認識(ASR)モデルを用いて曲を翻訳することで、このギャップを解決することを提案する。
我々の手法は、音声が様々な方法で摂動されるとき、最先端のオーディオベースよりも頑丈である。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 05:44:41 GMT)
On the Convergence of Min-Max Langevin Dynamics and Algorithm [15.1] エントロピー正則化を伴うユークリッド空間 $mathbbRd$ 上の確率分布空間におけるゼロサムゲームについて検討する。
平均場 min-max Langevin ダイナミクスに対する指数収束保証を証明し、平衡分布を計算する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 00:02:09 GMT)
Robust Tensor Completion via Gradient Tensor Nulclear L1-L2 Norm for Traffic Data Recovery [15.0] 本稿では,L1-L2ノルム(RTC-NL)モデルによるロバスト・コンプリートを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 02:38:01 GMT)
Privacy-Preserving Video Anomaly Detection: A Survey [14.9] Video Anomaly Detection (VAD)は、オープンスペースから収集された監視ビデオのパターンを自動的に分析し、異常な事象を検知することを目的としている。
近年、研究者は様々な観点から体系的な研究を行うことにより、VADのプライバシーに関する懸念に焦点を当てている。
本稿は、P2VADの進捗状況を体系的にレビューし、その範囲を定義し、直感的な分類法を提供する最初の論文である。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 09:36:36 GMT)
Curve-Aware Gaussian Splatting for 3D Parametric Curve Reconstruction [14.6] 本稿では,多視点エッジマップから直接3次元パラメトリック曲線を再構成するためのエンドツーエンドフレームワークを提案する。
パラメトリック曲線とエッジ指向ガウス成分の双方向結合機構を提案する。
提案手法は,既存の手法に比べて高い効率と優れた性能を達成し,トレーニング中のパラメータ数を著しく削減する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 07:11:28 GMT)
Suboptimality analysis of receding horizon quadratic control with unknown linear systems and its applications in learning-based control [14.3] 多くの場合、予測の地平線は制御性能を改善するために1つまたは無限のどちらかであることを示す。
時間対数関数として増加する適応予測地平線は、後悔の最小化に有用であることを示す。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 00:39:35 GMT)
Mixing Time of the Proximal Sampler in Relative Fisher Information via Strong Data Processing Inequality [14.0] 近距離サンプリングアルゴリズムを用いて,相対的なフィッシャー情報のサンプリングに要する混合時間保証について検討する。
ターゲットの確率分布が強く対数となると、相対的なフィッシャー情報は近距離サープラーに沿って指数関数的に高速に収束する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 00:24:10 GMT)
DriveMRP: Enhancing Vision-Language Models with Synthetic Motion Data for Motion Risk Prediction [14.0] 本研究では,エゴ車,他の車両,環境の3つの側面からリスクをモデル化するために,バードアイビュー(BEV)に基づくモーションシミュレーション手法を提案する。
これにより、ビジョン・ランゲージ・モデルに適したプラグイン・アンド・プレイ高リスクモーションデータを合成できる。
我々は、HDMRP-Agentという、VLMに依存しないモーションリスク推定フレームワークを設計する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 21:28:01 GMT)
MagShield: Towards Better Robustness in Sparse Inertial Motion Capture Under Magnetic Disturbances [13.9] MagShieldは、スパース慣性モーションキャプチャ(MoCap)システムにおける磁気干渉の問題に対処するために設計された。
マルチIMU関節分析により磁気障害を初めて検出し、人間の動き先を用いて方向誤差を補正する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 14:42:59 GMT)
Agentic Enterprise: AI-Centric User to User-Centric AI [13.8] AI for Enterprisesは、意思決定が機能、タスク、オペレーションにまたがって決定的かつ繰り返される役割を担います。
AI-Centric Userパラダイムが欠落していることに注意を向けることで、企業におけるエージェント的成功のための6つのテッテを強調します。
ユーザ中心AIへの移行を裏付ける上で、私たちは6つのテテットを提供し、プラットフォームの市場メカニズムを促進しています。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 14:05:59 GMT)
Deterministic Object Pose Confidence Region Estimation [13.5] 6次元ポーズ信頼領域推定は不確実性定量化の重要な方向として現れた。
現在のサンプリングベースのアプローチは、実践的なデプロイメントを著しく阻害する限界に悩まされている。
ポーズ信頼領域を推定する決定論的かつ効率的な手法を提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 02:03:34 GMT)
Spectra 1.1: Scaling Laws and Efficient Inference for Ternary Language Models [13.0] 大規模言語モデル(LLM)は、研究や産業アプリケーションでますます使われているが、推論効率は依然として大きな課題である。
本稿では,メモリ要求を大幅に低減するために,量子化学習を用いた3次言語モデル(TriLM)について検討する。
最大1.2兆のトークンでトレーニングされたTriLMのオープンスイートであるSpectra-1.1を導入する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 22:13:43 GMT)
Reasoner Outperforms: Generative Stance Detection with Rationalization for Social Media [12.5] 本研究は、明確な解釈可能な有理性を含む姿勢予測を含む生成的アプローチを採用する。
姿勢検出に推論を組み込むことで、より小さなモデル(FlanT5)がGPT-3.5のゼロショット性能を上回ることが判明した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 00:26:57 GMT)
Supporting renewable energy planning and operation with data-driven high-resolution ensemble weather forecast [12.4] 再生可能エネルギー、特に風力発電の計画と運用は、正確でタイムリーで高解像度の気象情報に依存している。
我々は,高分解能数値気象シミュレーションを用いて,目標風力発電場の気候分布を学習することにより,これらの課題に対処する。
この学習された高分解能気候予報と粗いグリッドの大規模予測との最適な組み合わせは、高度に正確で、きめ細かな、完全な変動可能な、大規模な気象パターン予測のアンサンブルをもたらす。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 01:44:54 GMT)
Agent-to-Agent Theory of Mind: Testing Interlocutor Awareness among Large Language Models [12.2] 大規模言語モデル(LLM)は、マルチエージェントやヒューマンAIシステムに統合されつつある。
本稿では,対話相手の同一性と特徴を識別し,適応する能力について定式化する。
GPT や Claude など,LLM が同一家族の同族や著名なモデルファミリを確実に識別できることを示す。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 17:22:59 GMT)
You Think, You ACT: The New Task of Arbitrary Text to Motion Generation [11.3] 本稿では,制限されたアクションテキストを任意のテキストに拡張する。
明示的なアクションラベルのないシーンテキストは、複雑で多様な産業におけるモデルの実用性を高めることができる。
任意のテキストからアクション命令を抽出し,その後に動作を生成する,シンプルで効果的なフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 11:36:30 GMT)
Double Entendre: Robust Audio-Based AI-Generated Lyrics Detection via Multi-View Fusion [11.1] 本稿では,音声中の歌詞関連情報を自動書き起こした歌詞と音声特徴を組み合わせ,マルチモーダルでモジュール形式のレイトフュージョンパイプラインを提案する。
我々のD-detect法は、既存の歌詞ベースの検出器より優れ、音声の摂動にも頑健である。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 05:47:16 GMT)
Riemannian-Geometric Fingerprints of Generative Models [10.7] 生成モデル(GM)のアーティファクトと指紋の新しい定義を提案する。
我々はこの理論を、実際に指紋を計算するための新しい勾配に基づくアルゴリズムに適用する。
結果は,2つの異なる解像度で4つの異なるデータセットにまたがって,GMの大規模な配列を識別する方が効果的であることを示している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 08:08:16 GMT)
MARBLE: A Hard Benchmark for Multimodal Spatial Reasoning and Planning [10.6] 複数のモダリティから情報を処理し、それを段階的に分析する能力は、人工知能を進化させる上で重要な課題である。
本稿では,マルチモーダル言語モデルの精査を目的としたマルチモーダル推論ベンチマークであるMARBLEを提案する。
現在のMLLMはMARBLEでは性能が悪く、M-Portalではほぼランダムな性能、M-Cubeでは0%の精度が得られる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 19:44:32 GMT)
GlobalMood: A cross-cultural benchmark for music emotion recognition [10.5] 「GlobalMood」は59か国から1180曲をサンプリングした異文化間ベンチマークデータセットである。
文化的に特定の音楽関連感情用語を抽出するためのボトムアップ・参加者主導のアプローチを実装した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 15:18:03 GMT)
Positioning AI Tools to Support Online Harm Reduction Practice: Applications and Design Directions [10.0] 大規模言語モデル(LLM)は情報提供を強化する新しい機会を提供する。
本稿では、薬物使用者(PWUD)の情報ニーズに対応するために、LCMをレスポンシブに設計する方法について検討する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 16:15:47 GMT)
Infinite Sampling: Efficient and Stable Grouped RL Training for Large Language Models [9.8] グループベース強化学習アルゴリズムは,人間のフィードバックによる大規模言語モデル(LLM)の微調整に有効であることが証明されている。
プロンプト毎に複数のレスポンスを生成し、保存すると、かなりのメモリオーバーヘッドが発生する。
Infinite Samplingは、GPUメモリ使用量からグループサイズを分離することで、効率よく安定したGRPOトレーニングを可能にするフレームワークである。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 16:52:29 GMT)
Intervening in Black Box: Concept Bottleneck Model for Enhancing Human Neural Network Mutual Understanding [9.5] 人-神経ネットワーク相互理解(CBM-HNMU)の実現のための概念ボトルネックモデルを提案する。
CBM-HNMUはブラックボックス推論を近似し、概念的理解を伝えるための解釈可能なフレームワークである。
CBM-HNMU は Flower-102, CIFAR-10, CIFAR-100, FGVC-Aircraft, CUB-200 にまたがる様々な CNN およびトランスフォーマーベースモデルで評価される。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 08:11:29 GMT)
InSight-R: A Framework for Risk-informed Human Failure Event Identification and Interface-Induced Risk Assessment Driven by AutoGraph [9.5] 原子力などの安全上重要な領域では、人間の信頼性が重要な問題となっている。
現在の手法は、人間の失敗事象(HFE)を特定し、パフォーマンスに影響する要因(PIF)を割り当てる専門家の判断に大きく依存している。
本研究では,オートグラフ(InSight-R)によるリスク情報に基づくヒューマン障害事象識別とインターフェースリスク評価のためのフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 02:04:06 GMT)
Convergent Privacy Framework with Contractive GNN Layers for Multi-hop Aggregations [9.4] 微分プライバシー(DP)は、機密構造情報を保護するためにグラフニューラルネットワーク(GNN)に統合されている。
理論的保証に必要な契約性を保証するための,シンプルで効果的な契約グラフ層(CGL)を提案する。
当社のフレームワークであるCARIBOUは,トレーニングと推論の両方をサポートし,契約集約モジュール,プライバシ割り当てモジュール,プライバシ監査モジュールを備えている。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 02:17:53 GMT)
Know Your Mistakes: Towards Preventing Overreliance on Task-Oriented Conversational AI Through Accountability Modeling [9.3] 本稿では,ユーザ過度に対処するタスク指向対話エージェントのための説明責任モデルを提案する。
実験結果から,提案手法はAIエージェントエラーの信頼性の高い推定を可能にするだけでなく,デコーダがより正確な動作を生成することを示唆している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 03:44:49 GMT)
FuzzCoh: Robust Canonical Coherence-Based Fuzzy Clustering of Multivariate Time Series [9.3] 我々はスペクトル領域における堅牢なファジィクラスタリングフレームワークを開発した。
本手法は,周波数依存構造と脳機能接続を探索することにより,スペクトル特性と空間特性の両方を捉える。
神経科学、ウェアラブルセンシング、環境モニタリング、ファイナンスといった分野に広く応用されている。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 12:02:01 GMT)
Confident Splatting: Confidence-Based Compression of 3D Gaussian Splatting via Learnable Beta Distributions [9.1] 3D Gaussian Splattingは高品質なリアルタイムレンダリングを実現するが、数百万のスプレートを生成することが多い。
本研究では,ベータ分布をモデル化した学習可能な信頼度スコアに基づく新しい損失圧縮手法を提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 18:11:30 GMT)
Graph Contrastive Learning with Low-Rank Regularization and Low-Rank Attention for Noisy Node Classification [8.9] 本稿では,GCL-LRR (Graph Contrastive Learning with Low-Rank Regularization) という,頑健で革新的なノード表現学習手法を提案する。
GCL-LRRはノード分類のための2段階のトランスダクティブ学習フレームワークである。
本稿では,新しいLR-Attention層をGCL-LRRに組み込んだ改良モデルGCL-LR-Attentionを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 05:31:17 GMT)
Doubly robust estimation of causal effects for random object outcomes with continuous treatments [8.9] 因果推論は統計学と科学的発見の中心である。
現代のアプリケーションは複雑で非ユークリッド的なデータ構造をますます含んでいる。
本稿では,非ユークリッドデータに適用した継続的治療による因果推論のための新しい枠組みを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 04:55:12 GMT)
Inpainting is All You Need: A Diffusion-based Augmentation Method for Semi-supervised Medical Image Segmentation [8.8] AugPaintは、限られたラベル付きデータからイメージラベルペアを生成するフレームワークである。
4つの公開医用画像セグメンテーションデータセットを用いたデータ拡張手法の評価を行った。
すべてのデータセットにおける結果は、AugPaintが最先端のラベル効率の方法論より優れていることを示している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 23:44:18 GMT)
Teaching Models to Verbalize Reward Hacking in Chain-of-Thought Reasoning [8.7] RLでトレーニングされた言語モデルは、彼らのチェーン・オブ・シークレットの推論でこのような振る舞いを明らかにすることなく、報酬のハッキングを行うことができる。
本稿では,アクシデント・キューの影響を受けやすいモデルを明確に認識するための事前RL介入である動詞化微調整(VFT)を提案する。
以上の結果から,RL前における報酬ハッキング行動を明確に表現する学習モデルは,その検出を著しく改善することが示された。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 06:37:10 GMT)
A Narrative Review on Large AI Models in Lung Cancer Screening, Diagnosis, and Treatment Planning [8.4] 肺がんは世界中で最も流行し、致命的な疾患の1つである。
大規模AIモデルの最近の進歩は、医療画像理解と臨床的意思決定を大幅に強化した。
本稿では, 肺がん検診, 診断, 予後, 治療における大規模AIモデルの適用状況について, 系統的に検討する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 01:57:26 GMT)
Kalahi: A handcrafted, grassroots cultural LLM evaluation suite for Filipino [8.3] フィリピン生まれの話者が共同で作成した,文化的LLM評価スイートであるKalahiを紹介する。
カラヒにおける強力なLLMパフォーマンスは、ある状況下で平均的なフィリピン人が言うのと同じような反応をモデルが生成する能力を示している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 07:25:45 GMT)
Chiral superfluorescence from perovskite superlattices [7.6] 大規模ペロブスカイト超格子のエッジ状態から生じる室温キラルCP-SFを報告する。
キラリティーによって誘導される光子輸送は、当初不整合で弱偏光の自然放出から高偏光のCP-SFへの遷移を駆動する。
本研究は,キラル超格子内での大規模量子コヒーレンス確立におけるキラル性の重要性を強調した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 07:00:11 GMT)
Single-Frame Point-Pixel Registration via Supervised Cross-Modal Feature Matching [7.5] 本稿では,LiDARとカメラビュー間の直接点画像マッチングのための検出不要フレームワークを提案する。
具体的には、LiDARインテンシティマップをLiDARの観点から2次元ビューに投影し、注意に基づくマッチングネットワークに入力する。
マッチングの信頼性をさらに高めるために,事前にソフトな可視性として機能する再現性スコアリング機構を導入する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 06:57:13 GMT)
Prompting without Panic: Attribute-aware, Zero-shot, Test-Time Calibration [7.5] テスト時間プロンプトチューニング(TPT)によるキャリブレーションを効果的に改善できることを示す。
本法では,バニラTPTが11.7例,C-TPTが6.12例,DiffTPTが6.78例,CVPR'23例,PromptAlignが8.43例であった。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 08:57:57 GMT)
FF-INT8: Efficient Forward-Forward DNN Training on Edge Devices with INT8 Precision [7.5] 本稿では、FFの層間戦略を利用して勾配量子化を安定化するINT8量子化学習手法を提案する。
NVIDIA Jetson Orin Nanoボードで行われた実験では、トレーニングが4.6%速く、省エネが8.3%、メモリ使用量が27.0%減少した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 06:16:26 GMT)
BWLer: Barycentric Weight Layer Elucidates a Precision-Conditioning Tradeoff for PINNs [7.3] この精度はPDEの不調や典型的な多層パーセプトロンアーキテクチャによるものであるかを検討する。
BWLer-hatを通じて既存のソリューションの上にBWLerを追加することができる。
BWLerを追加することで,5つのベンチマークPDEの精度が向上することがわかった。
発見は、PINNの柔軟性と古典的なスペクトルソルバの精度を組み合わせるための実践的な道を指す。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 22:11:00 GMT)
Recommender Systems for Good (RS4Good): Survey of Use Cases and a Call to Action for Research that Matters [7.3] 我々は、推薦システムは社会的善(RS4Good)に寄与すべきだと主張する。
本稿ではまず,社会問題問題に対するレコメンデータシステムの利用が,文献で成功を収めた事例について論じる。
次に、RS4Goodの研究を成功させるために必要となるパラダイムシフトを概説する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 19:54:34 GMT)
Smaller = Weaker? Benchmarking Robustness of Quantized LLMs in Code Generation [7.3] 大規模言語モデル(LLM)を圧縮する主流手法として量子化が登場した
コード生成タスクにおいて,量子化がLLMのロバスト性に与える影響について,最初の系統的研究を行った。
本研究は,LLMの量子化が実精度よりも優れた強靭性を示すことを示すことによって,従来の知恵に挑戦する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 06:32:25 GMT)
Mathematical Computation on High-dimensional Data via Array Programming and Parallel Acceleration [6.9] 本研究では,空間完全性に基づく並列計算アーキテクチャを提案し,高次元データを分散処理のための次元非依存構造に分解する。
このフレームワークは、データマイニングと並列最適化機械学習メソッドのシームレスな統合を可能にし、統一システム内の医療や自然画像などのさまざまなデータタイプにわたる科学的計算をサポートする。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 15:42:23 GMT)
Extended Non-Markovian Stochastic Schrödinger Equation with Complex Frequency Modes for General Basis Functions [6.8] 複素周波数モード(拡張cNMSSE)を持つ非マルコフシュラーディンガー方程式の拡張定式化を提案する。
この拡張は、浴場相関関数に対して完全な非指数基底展開を用いる。
拡張されたcNMSSEは、非マルコフ量子力学をシミュレートするための効率的で柔軟なアプローチを提供する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 02:47:14 GMT)
Dynamical structure factor and a new method to measure the pairing gap in two-dimensional attractive Fermi-Hubbard model [6.7] ペアリングギャップの測定は超伝導体や超流体の物性を研究する上で重要な役割を担っている。
動的励起によりペアリングギャップを測定するための戦略を開発する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 14:55:57 GMT)
What's Privacy Good for? Measuring Privacy as a Shield from Harms due to Personal Data Use [6.7] 我々は、400人の大学生と大学生によるオンライン研究において、この概念化を運用する。
研究参加者は、人工知能ベースのアルゴリズムが個人データを推測する際に生じる様々な害に対する認識を示した。
研究データの総合的統計分析により、14の害は内部的に一貫したものであり、全体としてプライバシー害の一般的な概念を表していることが示された。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 07:00:37 GMT)
DICE-BENCH: Evaluating the Tool-Use Capabilities of Large Language Models in Multi-Round, Multi-Party Dialogues [6.7] 既存の関数呼び出しベンチマークはシングルターンインタラクションに重点を置いている。
本稿では,対話を通してツール関連情報の分散を評価する指標であるDICE-SCOREを紹介する。
DICE-BENCHは、ツールグラフを通じてデータセットを合成することで、実用的な関数呼び出しを構築するフレームワークである。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 11:28:04 GMT)
A Quantum Annealing Approach for Solving Optimal Feature Selection and Next Release Problems [6.6] サブルーチンとして量子アニーリングを導入し,多目的検索に基づくソフトウェア工学の問題に取り組む。
小規模な問題に対して、量子処理のためのペナルティベースのマッピングを用いて、多目的最適化(MOO)を単目的最適化(SOO)として再構成する。
大規模問題に対しては,局所探索効率を高めるために,最大エネルギー衝突(MEI)を最急降下法で導いた分解戦略を用いる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 09:28:37 GMT)
Libra: Synergizing CUDA and Tensor Cores for High-Performance Sparse Matrix Multiplication [6.6] 現代の加速器は一般にスパース演算子を加速するコアとコアを備えている。
資源を1つだけ利用すれば,それぞれの制限のため,スパース行列乗算の性能が劣ることを示す。
本稿では,2.9コアの高性能とコアの低冗長性を両立させて,タスクマッピング演算子のスイートポイントを求める2D対応のワークロード計算戦略を提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 01:50:13 GMT)
Learning Truthful Mechanisms without Discretization [6.5] 本稿では、真理とユーティリティの最大化メカニズムを学習するための離散化フリーアルゴリズムであるTEDIを紹介する。
我々は、結果と価格をマッピングする関数として定義される価格規則の概念を定式化する。
本概念に基づき, 具体的条件下での真正な直接的機構に匹敵する新しいメニュー機構を提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 14:50:29 GMT)
Peccavi: Visual Paraphrase Attack Safe and Distortion Free Image Watermarking Technique for AI-Generated Images [6.4] 本稿では,最初のビジュアルパラフレーズアタックセーフで歪みのない画像透かし技術であるPECCAVIを紹介する。
視覚的パラフレーズ攻撃では、画像は、Non-Melting Points (NMPs)と呼ばれるコアセマンティック領域を保持しながら変更される。
PECCAVIは戦略的にこれらのNMP内に透かしを埋め込み、マルチチャネル周波数領域透かしを用いる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 17:34:08 GMT)
Towards Time Series Generation Conditioned on Unstructured Natural Language [6.1] 本研究では,非構造化自然言語記述に基づく時系列生成手法を提案する。
提案手法は,カスタム予測,時系列操作,データ拡張,転送学習など,さまざまなアプリケーションを提供できる。
我々は63,010の時系列記述ペアからなる時系列生成のための新しい公開データセットを構築し,提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 15:28:01 GMT)
Performance Measurements in the AI-Centric Computing Continuum Systems [5.8] 我々は分散コンピューティング継続(DCC)とモノのインターネット環境でよく使われるメトリクスについてレビューする。
本稿では,持続可能性,エネルギー効率,システムの可観測性といった,進化するコンピューティングニーズに対処する新たなパフォーマンス次元について論じる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 13:46:07 GMT)
Simple-RF: Regularizing Sparse Input Radiance Fields with Simpler Solutions [5.7] ニューラル・ラジアンス・フィールド(NeRF)は、シーンのフォトリアリスティックなフリービューレンダリングにおいて印象的なパフォーマンスを示す。
TensoRFやZipNeRFといったNeRFの最近の改良は、最適化とレンダリングの高速化のために明示的なモデルを採用している。
放射場によって推定される深度を監督することは、より少ない視点で効果的に学習することに役立つことを示す。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 03:13:33 GMT)
A Study on Semi-Supervised Detection of DDoS Attacks under Class Imbalance [5.6] 本研究では、データの不均衡や部分的にラベル付けされた場合のDDoS攻撃検出を改善するために、セミスーパーバイザードラーニング(SSL)技術を用いて検討する。
いくつかのシナリオでDDoS攻撃を検出するために,13の最先端SSLアルゴリズムを評価した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 16:47:39 GMT)
Decoupled Seg Tokens Make Stronger Reasoning Video Segmenter and Grounder [5.6] Sa2VAで実証されたビデオセグメンタとグライダーアプローチは、セグメンテーションモデル内で機能を直接フューズする。
これはしばしば、動的視覚情報と静的意味論の好ましくない絡み合いが生じ、セグメント化の精度が低下する。
SAM-2に固有の情報処理制限に対処するため,テキスト事前学習と線形デカップリングモジュールを統合したデカップリング強化プロンプト方式であるDeSa2VAを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 13:30:36 GMT)
PhonemeFake: Redefining Deepfake Realism with Language-Driven Segmental Manipulation and Adaptive Bilevel Detection [5.5] PhonemeFake (PF) は、言語推論を用いて重要な音声セグメントを操作するDF攻撃である。
PFは人間の知覚を最大42%減少させ、ベンチマーク精度を最大94%低下させる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 06:56:41 GMT)
Characterizing GPU Resilience and Impact on AI/HPC Systems [5.5] 本研究では,大規模AIシステムデルタHPCにおけるGPUレジリエンスを特徴付ける。
2.5年間の運用データ(1170万GPU時間)をGPUエラーに使用しました。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 06:07:45 GMT)
Selecting and Merging: Towards Adaptable and Scalable Named Entity Recognition with Large Language Models [5.5] Supervised Fine-tuning (SFT) は、大きな言語モデル(LLM)と、名前付きエンティティ認識(NER)のような情報抽出(IE)タスクの整合に広く用いられている。
推論時に専門家モデルを動的に選択・マージするSaMフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 08:28:52 GMT)
Mind the Gap: Entity-Preserved Context-Aware ASR Structured Transcriptions [5.4] 本稿では,ASRモデルの意味的文脈を拡張する新しいトレーニング手法を提案する。
30秒のチャンクの両側で5秒のオーバーラップをスライスすることで、40秒の"効果的なセマンティックウィンドウ"を作成します。
提案手法をスポンクウィキペディアデータセット上で評価する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 11:41:36 GMT)
Boosting CTC-Based ASR Using LLM-Based Intermediate Loss Regularization [5.4] 本稿では,CTCに基づく音声認識システムを強化するために,Language-Aware Intermediate Loss (LAIL) と呼ばれる新たな補助的損失フレームワークを提案する。
LAILは出力を大規模言語モデル(LLM)の埋め込み空間にマッピングし、トレーニング中に因果言語モデリング損失を計算する。
計算オーバーヘッドが最小限に抑えられたCTCベースのASRにおいて, ワード誤り率(WER)をLibriSpeech, TEDLium2, WSJコーパスで大幅に改善し, 最先端性能を実現した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 10:59:42 GMT)
MedSegNet10: A Publicly Accessible Network Repository for Split Federated Medical Image Segmentation [5.4] MedSegNet10は、スプリットフェデレーション学習を用いた医用画像セグメンテーション用に設計されたレポジトリである。
SplitFedの利点を活用することで、MedSegNet10はプライベートに格納された水平に分割されたデータの協調トレーニングを可能にし、プライバシと整合性を保証する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 19:55:32 GMT)
WavShape: Information-Theoretic Speech Representation Learning for Fair and Privacy-Aware Audio Processing [5.2] WavShapeは情報理論による音声表現学習フレームワークである。
タスク関連情報を保存しながら、公平さとプライバシーのために埋め込みを最適化するWavShapeを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 07:03:55 GMT)
On Universality of Non-Separable Approximate Message Passing Algorithms [5.2] 非分離性アルゴリズム力学の平均場特性は、主にi.i.d.に制限されている。
我々はLipschitz AMPアルゴリズムの条件BCP近似性を定式化し、同様の普遍的な保証を享受する。
非分離非線型性の多くの共通類が BCP-近似可能であることを示す。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 20:48:56 GMT)
Cybersecurity-Focused Anomaly Detection in Connected Autonomous Vehicles Using Machine Learning [4.8] 連結自動運転車(CAV)の異常検出は、安全で信頼性の高い輸送ネットワークを維持するために不可欠である。
本研究では、車両の挙動をシミュレートし、典型的および非典型的な車両間の相互作用を表すデータセットを生成する異常検出手法について検討する。
機械学習モデルを用いて、異常運転パターンを効果的に同定する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 19:11:19 GMT)
Persistence Paradox in Dynamic Science [4.6] 私たちは2012年にAlexNetが触媒としたディープラーニング革命に注目しています。
5000人以上の科学者による20年間のキャリアの軌跡を分析し、彼らの研究の焦点と成果がどのように進化したかを調べた。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 02:21:19 GMT)
Detecting Sockpuppetry on Wikipedia Using Meta-Learning [4.6] ウィキペディアにおける悪意あるソックパペットの検出は、インターネット上の信頼できる情報へのアクセスを維持するために重要である。
従来の機械学習アプローチはスタイリスティックな特徴とメタデータに頼っているが、著者固有の振る舞いへの適応性を優先しない。
本稿では,データスカース設定の性能向上を目的とした機械学習技術であるメタラーニングの応用を提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 05:51:43 GMT)
Deep Learning in Mild Cognitive Impairment Diagnosis using Eye Movements and Image Content in Visual Memory Tasks [4.5] 本研究は、視線追跡データを用いたデジタル認知タスクを用いて、健康管理(HC)とマイルド認知障害(MCI)を区別する。
44名の被験者の視線追跡データを用いて,VTNetに基づくディープラーニングモデルを訓練した。
モデルの性能は、同様の方法を用いたアルツハイマーの研究に匹敵する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 21:20:33 GMT)
VoteSplat: Hough Voting Gaussian Splatting for 3D Scene Understanding [4.3] VoteSplatは、Houghの投票と3DGSを統合する新しい3Dシーン理解フレームワークである。
オープン語彙オブジェクトのローカライゼーションのために、VoteSplatは投票ポイントを介して2Dイメージセマンティクスを3Dポイントクラウドにマップする。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 08:02:43 GMT)
Missing-Modality-Aware Graph Neural Network for Cancer Classification [4.3] マルチモーダルな生物学的データから学ぶ上で重要な課題は、いくつかのモダリティから得られるすべてのデータが欠落しているモダリティの欠如である。
部分変調を用いた直接予測のためのMAGNET(Missing-modality-Aware Graph Neural Networkwork)を提案する。
人工的な欠損ではなく現実のがん分類のための3つの公共マルチオミクスデータセットの実験は、MAGNETが最先端の融合法より優れていることを示している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 14:31:00 GMT)
FedDTG:Federated Data-Free Knowledge Distillation via Three-Player Generative Adversarial Networks [4.2] データフリー相互蒸留を実現するために,分散3プレーヤ生成適応ネットワーク(GAN)を導入する。
ベンチマークデータセットの可視化実験により,本手法は一般化の観点から,他のフェデレーション蒸留アルゴリズムよりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 15:44:26 GMT)
A Pre-trained Sequential Recommendation Framework: Popularity Dynamics for Zero-shot Transfer [4.0] オンラインアプリケーションの成功には、シーケンシャルなレコメンデーターが不可欠だ。
本稿では,事前学習型シーケンシャルレコメンデーションフレームワークPrepRecを提案する。
PrepRecは、最先端のシーケンシャルレコメンデータモデルと比較して、競争性能が向上することを示す。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 08:55:48 GMT)
Can Robots "Taste" Grapes? Estimating SSC with Simple RGB Sensors [4.0] テーブルブドウ栽培では、収穫は果実の品質を正確に評価することに依存する。
Soluble Solid Content (SSC)は、熟度と相関する重要な品質要因であるが、色との直接的な因果関係は欠いている。
本研究では,無制御照明下での簡易RGBセンサの可能性について検討し,SSCと色を推定し,費用対効果の高いロボットによる収穫を可能にした。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 10:44:14 GMT)
A Novel Frame Identification and Synchronization Technique for Smartphone Visible Light Communication Systems Based on Convolutional Neural Networks [3.9] 本稿では,フレーム識別と同期のための新しい,堅牢かつ軽量な制御型畳み込みニューラルネットワーク(CNN)を提案する。
提案したCNNモデルは、Jupyter Notebookで実施された3つのリアルタイム実験によって訓練された。
実験では、スクラッチから作成したデータセットを組み込んで、モビリティシナリオにおけるぼやけた、トリミング、回転したイメージなど、S2C通信におけるさまざまなリアルタイム課題に対処した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 20:29:37 GMT)
Offline Reinforcement Learning for Mobility Robustness Optimization [3.7] 我々は、モビリティロバストネス最適化アルゴリズムを再検討し、オフライン強化学習を用いて最適なセル個別オフセットチューニングを学習する可能性について検討する。
このような手法では、収集されたオフラインデータセットを使用して最適なポリシーを学習するが、さらなる探索は行わない。
我々は,決定変換器(Decision Transformer)と呼ばれるシーケンスベースの手法と,保守的Qラーニング(Reserve Q-Learning)と呼ばれる価値ベースの手法を適用し,バニラ規則に基づくMROと同じ目標報酬に対する最適ポリシーを学習する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 07:31:01 GMT)
General Autonomous Cybersecurity Defense: Learning Robust Policies for Dynamic Topologies and Diverse Attackers [3.7] 自律型サイバーセキュリティ防衛(ACD)システムは、人間の介入によってリアルタイムの脅威の検出と対応に欠かせないものとなっている。
既存のACDシステムは仮定の制限、特に基礎となるネットワーク力学の定常性に依存している。
本研究では,動的ネットワーク環境にまたがる汎用ポリシーを学習するエージェントの開発手法を検討する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 01:12:13 GMT)
Turning Up the Heat: Min-p Sampling for Creative and Coherent LLM Outputs [3.6] 大規模言語モデル(LLM)は、各復号ステップにおける語彙上の確率分布から次のトークンをサンプリングしてテキストを生成する。
本稿では,トップトークンの確率をスケーリング係数として利用して,モデルの信頼度に基づいてサンプリングしきい値を調整する動的トランケーション手法であるmin-pサンプリングを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 02:22:47 GMT)
Deep neural networks can provably solve Bellman equations for Markov decision processes without the curse of dimensionality [3.6] 離散時間最適制御問題と漏洩決定プロセス(MDP)は、不確実性の下でのシーケンシャルな意思決定の基本的なモデルである。
本稿では、無限時間地平線と有限制御セット$A$を持つMDPに関連する$Q$関数に対するディープニューラルネットワーク(DNN)近似を構築する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 11:25:44 GMT)
Truth Neurons [3.5] 言語モデルには真理ニューロンが含まれており、真理を主題に依存しない方法で符号化していることを示す。
様々なスケールのモデルで行われた実験は、真理ニューロンの存在を検証する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 18:14:07 GMT)
VFEFL: Privacy-Preserving Federated Learning against Malicious Clients via Verifiable Functional Encryption [3.3] フェデレートラーニング(Federated Learning)は、ローカルクライアントデータを公開せずに協調的なモデルトレーニングを可能にする、有望な分散学習パラダイムである。
フェデレーション学習の分散した性質は、悪意のあるクライアントによる攻撃に対して特に脆弱である。
本稿では,検証可能な機能暗号化に基づくプライバシ保護型フェデレーション学習フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 09:23:38 GMT)
Fragile, Robust, and Antifragile: A Perspective from Parameter Responses in Reinforcement Learning Under Stress [3.3] 本稿では、内部および外部ストレス下でのネットワークパラメータを体系的に解析することにより、強化学習(RL)ポリシーの堅牢性について検討する。
神経科学においてシナプスの可塑性に触発され、シナプスのフィルタリングはパラメータを選択的に摂動することで内部のストレスをもたらす。
その結果、ストレス下での政策性能を高める反フレジブルパラメータの存在が強調され、RL政策適応性を向上させるためのターゲットフィルタリング技術の可能性が示された。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 23:28:47 GMT)
Enabling Precise Topic Alignment in Large Language Models Via Sparse Autoencoders [3.2] 大規模言語モデル層に適用されるスパースオートエンコーダ(SAE)は、解釈可能な概念に対応するニューロンを持つ。
提案手法は,SAEの観測および修正特性を利用して,任意のトピックのアライメントを可能にする。
このアプローチのアライメント能力は、Amazonのレビュー、メディカル、Sycophancyなど、さまざまなパブリックトピックデータセットに基づいて評価する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 17:47:49 GMT)
Region-Aware CAM: High-Resolution Weakly-Supervised Defect Segmentation via Salient Region Perception [3.0] 本稿では,弱教師付きセマンティックセマンティックセグメンテーションフレームワークを提案する。
リージョン対応のクラスアクティベーションマップ(CAM)と擬似ラベルトレーニングで構成されている。
提案手法は,弱教師付き学習と高精度欠陥分割のギャップを効果的に埋めるものである。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 12:24:45 GMT)
Loop2Net: Data-Driven Generation and Optimization of Airfoil CFD Meshes from Sparse Boundary Coordinates [2.9] 本研究では、深層畳み込みニューラルネットワークアーキテクチャに基づく、メッシュ品質の革新的なインテリジェント最適化システムを提案する。
この研究の中心はLoop2Netジェネレータと損失関数であり、与えられた翼座標に基づいてメッシュを予測する。
モデルの性能は、トレーニング中に2つの重要な損失関数によって継続的に最適化される。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 13:27:07 GMT)
Can We Reliably Predict the Fed's Next Move? A Multi-Modal Approach to U.S. Monetary Policy Forecasting [2.6] 本研究では、構造化データと連邦準備制度の通信からの非構造化テキスト信号を統合することにより、予測精度を向上させることができるかどうかを検討する。
以上の結果から,ハイブリッドモデルは単調なベースラインを一貫して上回ることがわかった。
金融政策予測では、より単純なハイブリッドモデルは正確性と解釈可能性の両方を提供し、研究者と意思決定者に実用的な洞察を提供する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 05:54:58 GMT)
Not All Water Consumption Is Equal: A Water Stress Weighted Metric for Sustainable Computing [2.6] 本研究では,水ストレスの空間的および時間的変動を要因として,計算における水の影響を評価する最初のフレームワークであるSCARFを提案する。
ScarFは、時間とともに消費量と局所的な水ストレスの両方を考慮する調整水衝撃(AWI)測定値を計算する。
位置選択と時間選択を最適化し、節水型コンピューティングの道を開くことにより、水の衝撃を抑えるための隠れた機会を示す。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 06:26:06 GMT)
TRiSM for Agentic AI: A Review of Trust, Risk, and Security Management in LLM-based Agentic Multi-Agent Systems [2.5] 本総説では, LLMに基づくエージェントマルチエージェントシステム (AMAS) の文脈における, textbfTrust, Risk, and Security Management (TRiSM) の構造解析について述べる。
まず、エージェントAIの概念的基礎を調べ、従来のAIエージェントとアーキテクチャ的区別を強調します。
次に、ガバナンス、説明可能性、モデルOps、プライバシ/セキュリティの4つの主要な柱を中心に構成された、エージェントAIのためのAI TRiSMフレームワークを適応して拡張します。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 20:26:07 GMT)
Lower bounds for trace estimation via Block Krylov and other methods [2.4] 我々は,Hutchinson法とBlock Krylov法を併用した手法について検討した。
関数に対してクリロフステップがいくつ必要かという理論上界を導出する。
また、トレース推定に必要なクエリ数の制限も低くする。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 00:41:39 GMT)
A Data Science Approach to Calcutta High Court Judgments: An Efficient LLM and RAG-powered Framework for Summarization and Similar Cases Retrieval [2.4] 本研究は,Calcutta High Courtの判決を解析するための枠組みを提案する。
ペガサスモデルを微調整することにより、判例の要約において大幅な改善が達成される。
RAGベースのフレームワークは、ユーザクエリに応答して、同様のケースを効率的に検索し、徹底的な概要と要約を提供する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 20:24:34 GMT)
P$^2$U: Progressive Precision Update For Efficient Model Distribution [2.3] この問題に対処するために,プログレッシブ精度更新(P$2$U)を提案する。
元の高精度モデルを送信する代わりに、P$2$Uは低ビット精度モデルを送信する。
P$2$Uは、精度、帯域幅使用量、レイテンシのトレードオフを一貫して達成する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 12:47:04 GMT)
HalluSegBench: Counterfactual Visual Reasoning for Segmentation Hallucination Evaluation [2.2] HalluSegBenchは、対物的視覚推論のレンズを通して視覚的接地における幻覚を評価するために特別に設計された最初のベンチマークである。
我々のベンチマークは、281のユニークなオブジェクトクラスにまたがる1340の対実例ペアからなる新しいデータセットで構成されています。
HalluSegBenchの最先端の視覚言語セグメンテーションモデルによる実験では、視覚駆動幻覚はラベル駆動のものよりもはるかに多いことが示されている。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 15:32:51 GMT)
QTurbo: A Robust and Efficient Compiler for Analog Quantum Simulation [2.1] 本稿では,強力なアナログ量子シミュレーションコンパイラQTurboを紹介する。
高精度で耐雑音性のあるパルススケジュールを生成することにより,精度と信頼性が向上する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 17:24:38 GMT)
Foundation Models for Wearable Movement Data in Mental Health Research [2.0] 本稿では,時系列ウェアラブル運動データを対象とした最初のオープンソース基盤モデルであるPretrained Actigraphy Transformer (PAT)を紹介する。
PATは、いくつかのメンタルヘルス予測タスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 20:08:42 GMT)
Multimodal Contrastive Representation Learning in Augmented Biomedical Knowledge Graphs [2.0] PrimeKG++はマルチモーダルデータを組み込んだ豊富な知識グラフである。
提案手法は強い一般化可能性を示し,未知のノードに対しても正確なリンク予測を可能にする。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 22:15:00 GMT)
FreqDGT: Frequency-Adaptive Dynamic Graph Networks with Transformer for Cross-subject EEG Emotion Recognition [1.9] クロスオブジェクトの一般化は、個人の多様性、認知的特徴、感情的な反応による課題である。
本稿では,周波数適応型動的グラフ変換器FreqDGTを提案する。
FreqDGTは、周波数適応性、空間力学、時間階層モデリングの統合の有効性を確認することにより、物体間感情認識の精度を大幅に向上させる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 08:18:05 GMT)
Non-Bloch Band Theory for 2D Geometry-Dependent Non-Hermitian Skin Effect [1.9] 2次元格子系における非エルミート皮膚効果(NHSE)のためのストリップ一般化ブリルアンゾーン(SGBZ)フレームワークを導入する。
我々は,GDSEにおいて,SGBZ固有状態の非Bloch動的縮退分割という重要な条件を初めて導いた。
提案したSGBZフレームワークは、2次元格子系における非エルミート効果を探索するための普遍的なロードマップを提供する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 03:37:05 GMT)
VSRM: A Robust Mamba-Based Framework for Video Super-Resolution [1.9] ビデオの超高解像度化は、低レベルの視覚タスクにおいて依然として大きな課題である。
本研究では,ビデオ中の長いシーケンスを処理するための新しいフレームワークであるVSRMを提案する。
VSRMは様々なベンチマークで最先端の結果を達成し、将来の研究の基盤として確立している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 05:51:42 GMT)
CN-SBM: Categorical Block Modelling For Primary and Residual Copy Number Variation [1.8] 離散コピー数状態に基づいてサンプルとゲノム領域を共同でクラスタリングする確率的フレームワークであるコピー数ブロックモデル(CN-SBM)を導入する。
CN-SBMはCNV呼び出しの離散的な性質を尊重し、ブロックワイド構造を通してサブポピュレーション固有のパターンをキャプチャする。
大規模コホートおよび高解像度データに適用するためのスケーラブルな変分推論アルゴリズムを導出する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 17:45:45 GMT)
FairMarket-RL: LLM-Guided Fairness Shaping for Multi-Agent Reinforcement Learning in Peer-to-Peer Markets [1.7] 本稿では,Large Language Models (LLMs) とReinforcement Learning (RL) を組み合わせた新しいフレームワークであるFairMarket-RLについて述べる。
複数の売り手や買い手によるシミュレーションされたP2Pマイクログリッドでは、LLMはリアルタイムフェアネス評論家として、Fairness-To-Buyer(FTB)とFairness-Between-Sellers(FBS)の2つの指標を使用して、各トレーディングエピソードを評価する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 01:17:55 GMT)
Interpretable Interaction Modeling for Trajectory Prediction via Agent Selection and Physical Coefficient [1.7] 本稿では、手動で対話エージェントを選択し、Transformerの注目スコアを新たに計算された物理相関係数に置き換えるASPILinを提案する。
驚くべきことに、これらの単純な修正は予測性能を大幅に改善し、計算コストを大幅に削減することができる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 15:40:13 GMT)
Evaluation of LLMs for mathematical problem solving [1.7] 大規模言語モデル(LLM)は、様々な教育課題において優れた性能を示してきたが、数学的な問題を解く可能性についてはまだ検討されていない。
我々は,GPT-4o,DeepSeek-V3,Gemini-2.0の3つの数学データセットを比較した。
GPT-4oはすべてのデータセットで最も安定しており、パフォーマンスに一貫性があるが、特にMIT Open Coursewareデータセットのハイレベルな質問では際立っている。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 05:54:45 GMT)
Super-resolution of two Closely-spaced Electromagnetic Fields via Walsh-Modulated Dynamical Decoupling Spectroscopy [1.7] 線形幅は2つの密接な空間周波数の解消において決定的な役割を果たさないことを示す。
超解像分光のための最初の一般的なブロードバンドプロトコルを提案し,実験的に実証する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 06:11:41 GMT)
Improved Supervised Fine-Tuning for Large Language Models to Mitigate Catastrophic Forgetting [1.6] Supervised Fine-Tuning (SFT) は、Large Language Models (LLM) の命令追従能力を高めるための重要なステップである。
SFTはしばしば、破滅的忘れという現象として、モデルの一般的な能力の低下につながる。
本稿では,従来のSFTデータへのアクセスを必要とせずに,破滅的な忘れを効果的に軽減する,新しい費用対効果のSFT手法を提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 02:26:03 GMT)
Denoising Multi-Color QR Codes and Stiefel-Valued Data by Relaxed Regularizations [1.5] マルチバイナリやスティフェル値データといった新しいデータタイプに対しては,TVおよびTikhonov型復調モデルが提案されている。
本研究の目的は、この手法をマルチバイナリやスティフェル値などの新しい種類のデータに適用することである。
両新たなデータタイプに対して,テレビとティクホノフをベースとしたデノジングモデルを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 09:33:29 GMT)
Application-level Benchmarking of Quantum Computers using Nonlocal Game Strategies [1.5] 非ローカルゲームでは、2人のプレーヤーが、ゲームのルールに違反しない戦略を持っていることを審判に納得させるために協力する。
非局所ゲームの規則をハミルトニアンに符号化することにより、非局所ゲームに対する量子戦略を計算する変分量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 07:42:43 GMT)
Scaling Laws of Quantum Information Lifetime in Monitored Quantum Dynamics [1.5] 量子情報は、測定と環境結合において脆弱である。
その寿命は、中循環測定によって環境が継続的に監視されている場合、システムサイズと指数関数的にスケールできることが判明した。
浴室の監視がないと、寿命は著しく異なる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 05:01:21 GMT)
Enhancing Android Malware Detection with Retrieval-Augmented Generation [1.4] 本研究では,静的な特徴を利用した機械学習に基づく手法に着目した。
LLMの脆弱性として知られる幻覚を緩和するため、我々は検索・拡張生成を統合した。
慎重に設計したプロンプトを用いてLLMを誘導し,コヒーレント関数の要約を生成し,変換器モデルを用いて解析する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 04:36:31 GMT)
Evaluating Pavement Deterioration Rates Due to Flooding Events Using Explainable AI [1.3] 本研究は,国際粗度指数(IRI)による舗装粗さ測定を中心に,洪水が舗装劣化に与える影響について検討する。
これらの効果を定量化するために,TxDOTのPMISデータベースから20年間の舗装条件データを利用した。
その結果, 浸水の影響を受けない舗装は, 非流動部に比べて急激な粗さの増加が見られた。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 04:13:53 GMT)
Generating Privacy Stories From Software Documentation [1.2] CoT, in-context-learning (ICL), Large Language Models (LLMs) に基づく新しいアプローチを開発する。
GPT-4o や Llama 3 などの LLM は,プライバシの振る舞いを識別し,F1 スコア 0.8 を超えるプライバシユーザストーリーを生成する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 20:55:21 GMT)
Cybersecurity Challenge Analysis of Work-from-Anywhere (WFA) and Recommendations guided by a User Study [1.2] 多くの組織は、新型コロナウイルスのパンデミックに伴う規制にもかかわらず、業務を継続し、営業を続ける必要性から、すぐにWFAモデルに移行せざるを得なかった。
本稿では,WFAモデルのサイバーセキュリティに関する課題と意義を明らかにする。
遠隔勤務に移行した雇用主とその従業員の即応性とサイバーセキュリティ意識を調査するために,オンラインユーザスタディを実施した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 15:10:16 GMT)
Improving Student-AI Interaction Through Pedagogical Prompting: An Example in Computer Science Education [1.2] 大規模言語モデル(LLM)アプリケーションは、興奮と懸念の両方を引き起こした。
最近の研究は、LLMの誤用が学習の妨げとなることを一貫して強調している。
本研究の目的は,LLMの学習改善を効果的に促進する方法を学生に教えることである。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 18:15:32 GMT)
Fine-Tuning Next-Scale Visual Autoregressive Models with Group Relative Policy Optimization [1.2] 強化学習(Reinforcement Learning, RL)を用いた微調整事前学習生成モデルは, 出力と人間の嗜好を整合させる効果的なアプローチとして登場した。
RLに基づくファインチューニングは、VARモデルに対して効率的かつ効果的であり、特に高速な推論速度の恩恵を受けていることを示す。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 18:55:07 GMT)
Transformer Encoder and Multi-features Time2Vec for Financial Prediction [1.1] 我々は、Time2VecとTransformerモデルを統合することで、新しいニューラルネットワークアーキテクチャを開発する。
異なる市場の研究に基づいて,新たな相関特徴選択法を提案する。
提案手法は、位置符号化など、他の最先端の符号化手法よりも優れていると結論付けている。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 16:16:55 GMT)
ReasonBridge: Efficient Reasoning Transfer from Closed to Open-Source Language Models [1.1] 本稿では、強力なクローズドソースからオープンソースモデルへの推論能力を効率的に伝達する手法であるReasonBridgeを紹介する。
我々は、難易度、多様性、品質を重視した、1,000の慎重にキュレートされた推論トレースしか持たない、カスタマイズされたデータセットReason1Kを開発した。
総合的な評価によると、ReasonBridgeはベンチマークタスクにおいて、オープンソースモデルの推論能力を最大23%改善する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 12:22:55 GMT)
ActAlign: Zero-Shot Fine-Grained Video Classification via Language-Guided Sequence Alignment [1.1] 本稿では,ビデオ分類をシーケンスアライメントとして定式化するフレームワークであるActAlignを紹介する。
ActAlignは、非常に難しいActionAtlasベンチマークで30.5%の精度を達成している。
これらの結果は、構造化言語先行と古典的アライメント技術が組み合わさって、視覚言語モデルのオープンセット認識能力を開放し、きめ細かいビデオ理解を実現するためのスケーラブルで汎用的なアプローチを提供することを示した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 17:57:58 GMT)
YM-WML: A new Yolo-based segmentation Model with Weighted Multi-class Loss for medical imaging [1.0] 本研究は,心臓画像分割の新しいモデルであるYM-WMLを提案する。
このモデルは、効果的な特徴抽出のための堅牢なバックボーン、マルチスケール特徴集約のためのYOLOv11ネック、アテンションベースのセグメンテーションヘッドを統合している。
ACDCデータセットでは、YM-WMLは91.02のDice similarity Coefficientを達成し、最先端の手法より優れている。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 17:21:25 GMT)
MOTOR: Multimodal Optimal Transport via Grounded Retrieval in Medical Visual Question Answering [0.9] 医用視覚質問応答(MedVQA)は、画像に基づく質問に対する文脈的に豊かな回答を提供することによって、臨床的意思決定において重要な役割を担っている。
検索の強化された生成リスクは、無関係なコンテキストを検索し、視覚言語モデルの推論能力を低下させる。
そこで本稿では, 接地キャプションと最適輸送を利用した新しいマルチモーダル検索手法を提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 14:30:37 GMT)
On the Generalizability of "Competition of Mechanisms: Tracing How Language Models Handle Facts and Counterfactuals" [0.9] 我々は,「メカニズムの競争:言語モデルがファクトとカウンターファクトをどう扱うかの追跡」の研究を再現する。
事実的リコールと対実的インコンテキスト反復の間の言語モデルにおけるメカニズムについて検討する。
We found that the attention head ablation proposed in Ortu et al. (2024) is not effective for the domain are underrepresented in their dataset。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 18:29:19 GMT)
xLSTMAD: A Powerful xLSTM-based Method for Anomaly Detection [0.8] フルエンコーダ・デコーダxLSTMアーキテクチャを統合した最初の異常検出手法であるxLSTMADを提案する。
実世界の17のデータセットにまたがる包括的TSB-AD-Mベンチマークを用いて,本手法の評価を行った。
以上の結果から、xLSTMは最先端の精度を示し、23の異常検出基準を上回りました。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 10:39:09 GMT)
G$^{2}$D: Boosting Multimodal Learning with Gradient-Guided Distillation [0.8] 本稿では, カスタマイズされた損失関数を持つマルチモーダルモデルを最適化する知識蒸留フレームワークであるGradient-Guided Distillation (G$2$D)を紹介する。
G$2$Dは、訓練中に弱いモダリティの重要度を増幅し、分類および回帰タスクにおける最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 01:56:41 GMT)
Aircraft Trajectory Dataset Augmentation in Latent Space [0.8] 本稿では,航空機軌道データセット拡張のための新しいフレームワークであるATRADAを提案する。
Transformer Encoderは、元のトラジェクトリデータセットの下位パターンを学習する。
新しいサンプルは、実装されたGMMから引き出され、サンプルの寸法は元の次元に戻され、それらをマルチ層パーセプトロンで復号する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 07:44:53 GMT)
Disaster Informatics after the COVID-19 Pandemic: Bibliometric and Topic Analysis based on Large-scale Academic Literature [0.7] 本研究では,2020年1月から2022年9月までに刊行された災害情報学文献の総合的文献・話題分析について述べる。
我々は、最も活発な国、機関、著者、協力ネットワーク、創発的なトピック、最も重要なトピックのパターン、そして新型コロナウイルスのパンデミックによって引き起こされる研究の優先順位の変化を特定します。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 20:30:36 GMT)
Efficient Multi-Crop Saliency Partitioning for Automatic Image Cropping [0.7] 固定アスペクト比クロッピングアルゴリズムを拡張し、線形時間で複数の非重複作物を効率的に抽出する。
本手法は,サリエンシマップ全体を再計算することなく,注意閾値を動的に調整し,選択した作物を考慮から除去する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 08:32:53 GMT)
A Large Language Model-Enabled Control Architecture for Dynamic Resource Capability Exploration in Multi-Agent Manufacturing Systems [0.6] 本稿では,多エージェント製造システムのための大規模言語モデル対応制御アーキテクチャを提案する。
シミュレーションに基づくケーススタディでは、提案されたアーキテクチャがシステムのレジリエンスと柔軟性を向上させることが示されている。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 20:02:25 GMT)
Orthogonal Frequency Division Multiplexing Continuous Variable Terahertz Quantum Key Distribution [0.3] 本稿では,テラヘルツ(THz)帯域内の複数のサブキャリアにまたがる量子情報を符号化する量子鍵分布プロトコルを提案する。
複数のサブキャリアにまたがる量子情報を符号化することにより、スペクトル効率を高め、チャネル分散と大気減衰を緩和する。
大気中最大3m, 低温, 真空環境中最大26kmの距離で, 安全な通信が可能である。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 19:16:29 GMT)
Scenario-Based Hierarchical Reinforcement Learning for Automated Driving Decision Making [0.3] 強化 学習アプローチは、経験から直接包括的な意思決定ポリシーを学ぶことができる。
現在のアプローチでは、より複雑な運転タスクの一般化が達成できず、学習効率が欠如している。
シナリオベース環境における階層的政策の強化学習(RL)を統合する最初のフレームワークである,シナリオベースの自動運転強化学習(SAD-RL)を提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 21:55:59 GMT)
Against 'softmaxing' culture [0.2] 私はこの現象を「ソフトマックス文化」と呼び、今日のAI評価に直面する根本的な課題の1つです。
私は2つの重要なシフトを提案します。まず最初に、システム評価の開始時に「文化とは何か?」と尋ねる代わりに、「文化とは何か?」という問いから始めます。
私は、文化的普遍性が存在するという哲学的主張を認めていますが、その課題は単にそれらを記述することではなく、それらの特質に関してそれらを満たすことです。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 17:59:17 GMT)
Terahertz source-on-a-chip with decade-long stability using layered superconductor elliptical microcavities [0.2] コヒーレント、連続波、電気的に調整可能なチップスケールテラヘルツ(THz)源は、センシング、イメージング、分光、通信、空間、量子技術における新たな応用に不可欠である。
ここでは, 高温超伝導体を積層した高温超伝導体をベースとした高強度ソースオンチップTHzエミッタを試作し, 11年を超える前例のない運転寿命でコヒーレント発光を持続できることを示した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 08:26:13 GMT)
Decoding Federated Learning: The FedNAM+ Conformal Revolution [0.2] FedNAM+は、ニューラルネットワーク付加モデル(NAM)と新しい共形予測手法を統合する、連合学習フレームワークである。
本手法では,勾配に基づく感度マップを用いた動的レベル調整手法を導入し,重要な入力特徴が予測に与える影響を同定する。
我々は、CTスキャン、MNIST、CIFARデータセットの実験を通して、我々のアプローチを検証し、損失を最小限に抑えながら高い予測精度を示す。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 04:14:41 GMT)
Understanding the Challenges and Promises of Developing Generative AI Apps: An Empirical Study [0.1] 2022年のChatGPTは、生成人工知能モバイルアプリ(つまり、Gen-AIアプリ)の急激な急増を引き起こした。
Google Play Storeの173のGen-AIアプリから、676,066のレビューをユーザ中心で分析します。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 04:39:35 GMT)
Multibiometrics Using a Single Face Image [0.1] 本研究では, 顔, 虹彩, 眼周囲, 鼻, まぶたの5つの生体特性を組み合わせて, 単一顔画像から抽出できる新しい多生体計測法を提案する。
提案手法は,単面画像のみを入力として使用するため,バイオメトリックスの利便性を犠牲にしない。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 03:29:58 GMT)
ATTENTION2D: Communication Efficient Distributed Self-Attention Mechanism [0.1] ATTENTION2Dは,クエリとキー/値という2次元の並列性を利用する手法である。
この方法は、複数のデバイスにまたがる計算の効率的かつ並列化を可能にする。
Ring Attentionと比較すると,GPT-3-likeモデルでは5倍の性能向上がみられた。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 22:35:32 GMT)
Variational Scarring in Open Two-Dimensional Quantum Dots [0.0] 2次元量子ドットにおける変分スカーリングは、開系においても頑健であることを示す。
制御された摂動は、傷ついた状態による電子伝達の変調を可能にする。
これらの知見は、量子デバイスにおける実験的実現のためのメソスコピック輸送およびオープンパスにおけるスカーリングの役割に関する洞察を与える。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 14:21:14 GMT)
Utilizing a Novel Deep Learning Method for Scene Categorization in Remote Sensing Data [0.0] このファイルは、リモートセンシングデータにおけるシーンのタイプのためのCuttlefish Optimized Bidirectional Recurrent Neural Network(CO-BRNN)と呼ばれる革新的な技術を紹介する。
調査では,CO-BRNNを,多層パーセプトロン・畳み込みニューラルネットワーク(MLP-CNN),畳み込みニューラルネットワーク・ロング短期記憶(CNN-LSTM),長短期記憶・畳み込みランダムフィールド(LSTM-CRF),グラフベース(GB),マルチラベル画像検索モデル(MIRM-CF),畳み込みなど,現在の技術と比較した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 16:12:28 GMT)
Uncertainty Relations Relative to Phase-Space Quantum Reference Frames [0.0] 量子参照フレーム(QRF)に対するハイゼンベルクの不確かさの関係について検討する。
我々は、位置と運動量で観測可能な関節を構成することによって、新しいフレーム関係の不確実性関係を導出する。
我々は、標準量子論は外部の古典的枠組みに対して理解されなければならないと主張する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 15:09:45 GMT)
TriADA: Massively Parallel Trilinear Matrix-by-Tensor Multiply-Add Algorithm and Device Architecture for the Acceleration of 3D Discrete Transformations [0.0] マルチ線形変換は、ハイパフォーマンスコンピューティング(HPC)と人工知能(AI)ワークロードにおいて重要である。
並列処理ユニットの数を増やすことで スケール計算は エネルギー消費を大幅に増加させます。
TriADAは、ハイパーキュービックな算術複雑性を持つ様々なトリ線形変換を、線形の時間ステップで実行することができる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 08:42:01 GMT)
The Application of Large Language Models on Major Depressive Disorder Support Based on African Natural Products [0.0] うつ病の主な障害は21世紀における世界的健康上の課題の1つである。
アフリカの伝統医学は、新しい抗うつ薬の開発に貴重な資源を提供する。
本稿では,抑うつ支援のための大規模言語モデルとアフリカの天然物の統合について検討する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 21:05:57 GMT)
Text Production and Comprehension by Human and Artificial Intelligence: Interdisciplinary Workshop Report [0.0] 本報告は、認知心理学、言語学習、人工知能(AI)に基づく自然言語処理(NLP)の専門家を集めた最近の学際ワークショップの結果を合成する。
このワークショップは、テキスト理解と構成におけるAI言語モデルと人間の認知プロセスとの関係を理解する上で、重要な知識ギャップに対処することを目的としていた。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 00:31:14 GMT)
Revisiting CroPA: A Reproducibility Study and Enhancements for Cross-Prompt Adversarial Transferability in Vision-Language Models [0.0] VLM(Large Vision-Language Models)はコンピュータビジョンに革命をもたらし、画像分類、キャプション、視覚質問応答などのタスクを可能にする。
特に視覚とテキストの両方のモダリティを操作できるシナリオでは、敵攻撃に対して非常に脆弱なままである。
我々は,「イメージは1000の嘘である:視覚・言語モデルにおける逆転可能性」の総合的研究を行う。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 19:01:41 GMT)
Reconstruction of full-space quantum Hamiltonian from its effective, energy-dependent model-space projection [0.0] フェシュバッハのモデル空間アバターからフルスペース量子ハミルトニアンを再構成することは実現可能である。
最も単純なケースでは、それらの解決策が与えられ、議論される。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 11:37:46 GMT)
RAILS: Retrieval-Augmented Intelligence for Learning Software Development [0.0] GPT-3.5-Turboのような大規模言語モデル(LLM)は、外部またはプロジェクト固有のドキュメントにアクセスできない場合、不完全なコードや不正なインポートを生成する。
我々は、LLMプロンプトを拡張するフレームワークであるRAILSを紹介し、キュレートされたリソースから意味的に検索されたコンテキストを付加する。
RAILSを、標準ライブラリ、GUI API、外部ツール、カスタムユーティリティにまたがる78の現実世界のJavaインポートエラーケースで評価した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 03:30:04 GMT)
Quantum Neural Networks for Wind Energy Forecasting: A Comparative Study of Performance and Scalability with Classical Models [0.0] 古典的な機械学習手法の強力な代替手段として量子ニューラルネットワーク(QNN)が登場している。
本研究は,風力タービンの出力予測のためのQNNの詳細な検討を行う。
実験により,QNNが従来のベンチマーク手法と競合する予測性能を達成できることを実証した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 10:51:27 GMT)
Privacy-Preserving Methods for Bug Severity Prediction [0.0] ソースコードメトリクスと大規模言語モデルを用いたメソッドレベルのバグ重大度予測について検討する。
集中学習,フェデレート学習,合成データ生成を用いて学習したモデルの性能を比較した。
我々の発見は、産業環境で効果的なバグの深刻度予測を可能にするために、プライバシー保護アプローチの可能性を強調している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 04:40:51 GMT)
Phase error rate estimation in QKD with imperfect detectors [0.0] 我々は,コヒーレント攻撃に対するデコイ状態BB84QKDプロトコルの有限サイズセキュリティ証明を提案する。
本結果は,不完全特徴の基底効率ミスマッチ検出装置に適用する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 01:21:47 GMT)
P4OMP: Retrieval-Augmented Prompting for OpenMP Parallelism in Serial Code [0.0] 我々は,大規模言語モデル(LLM)を用いて,シリアルC/C++コードをOpenMPアノテーション付き並列コードに変換するフレームワークであるP4OMPを提案する。
我々の知る限り、モデル微調整やコンパイラのインスツルメンテーションを使わずに、OpenMPのプラグマ補正に検索ベースのプロンプトを適用する最初のシステムである。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 01:06:34 GMT)
Optimization by VarQITE on Adaptive Variational Quantum Kolmogorov-Arnold Network [0.0] 量子想像時間進化(Quantum imaginary Time Evolution, QITE)は、システムの基底状態を導出する強力な方法である。
本稿では,量子機械学習にQITE法を適用し,複数の入力値に対する理想値を予測する手法を提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 08:05:34 GMT)
On the polemic assessment of what Bell did [0.0] ベルの不平等の解釈は、ノーベル賞を受賞した経験的ファルシフィケーションにも拘わらず、論争の対象となっている。
この記事では、John S. Bell と A. Einstein が量子絡み合いは非局所的な相関を突くことを意味すると主張した理由を論じ、明らかにしようと試みる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 14:59:16 GMT)
Multivariate de Bruijn Graphs: A Symbolic Graph Framework for Time Series Forecasting [0.0] 本稿では,記号表現とニューラルモデリングのギャップを埋める新しいエンコーダであるDRAGONを提案する。
DRAGONは連続的な入力シーケンスを離散化し、それらを固定されたグラフ構造にマッピングすることで、グラフベースの注意による動的コンテキスト回復を可能にする。
DRAGONはデュアルブランチアーキテクチャ内の補助モジュールとして統合され、従来のCNNベースのエンコーダを象徴的で構造を意識した表現で拡張する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 04:29:45 GMT)
Multimodal Atmospheric Super-Resolution With Deep Generative Models [0.0] スコアベース拡散モデリング(Score-based diffusion modeling)は、複雑な分布からサンプリングできる生成機械学習アルゴリズムである。
本稿では,高次元力学系の超解像にそのような概念を適用し,低分解能および実験的に観察されたスパースセンサ測定のリアルタイム利用性を考える。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 06:47:09 GMT)
Modular versus Hierarchical: A Structural Signature of Topic Popularity in Mathematical Research [0.0] 本研究では,研究トピックの人気が,そのトピックのコラボレーションネットワークの構造とどのように関連しているかを検討する。
その結果,トピックの選択は,基本的に異なる2つの協調環境間の暗黙の選択であることが示唆された。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 16:39:57 GMT)
Machine learning in wastewater treatment: insights from modelling a pilot denitrification reactor [0.0] ノルウェーのヴェアス処理施設にあるパイロット・リアクターのデータを用いて、生物学的硝酸塩の最適化に機械学習をどのように利用できるかを探る。
予測精度にのみ焦点をあてるのではなく、本手法は効果的なデータ駆動モデリングのための基礎的要件を理解することを優先する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 11:41:43 GMT)
Machine Assistant with Reliable Knowledge: Enhancing Student Learning via RAG-based Retrieval [0.0] MARK(Machine Assistant with Reliable Knowledge)は、学生の学習を支援するために開発された質問応答システムである。
システムは検索強化世代(RAG)フレームワーク上に構築されており、このフレームワークは、実際の一貫性を確保するために、キュレートされた知識ベースを統合する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 22:17:27 GMT)
MANTA: Cross-Modal Semantic Alignment and Information-Theoretic Optimization for Long-form Multimodal Understanding [0.0] MANTAは、視覚と聴覚の入力を構造化されたテキスト空間に統合し、大きな言語モデルでシームレスに処理するフレームワークである。
MANTAは,(1)情報理論最適化によるモダリティ間のセマンティックアライメント,(2)情報密度の適応時間同期,(3)マルチスケール理解のための階層的コンテンツ表現の4つの課題に対処する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 12:12:06 GMT)
LegiGPT: Party Politics and Transport Policy with Large Language Model [0.0] 本研究では,大規模言語モデル (LLM) と説明可能な人工知能 (XAI) を統合し,交通機関に関する立法提案を分析する新しい枠組みを提案する。
交通政策形成の鍵となる要因を特定するために、政治的提携とスポンサー特性が用いられた。
その結果、保守的かつ進歩的なスポンサーの数と比率が、選挙区規模や選挙人人口と共に、立法成果を形作る重要な決定要因であることが判明した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 03:42:00 GMT)
Implementation of a quantum sequence alignment algorithm for quantum bioinformatics [0.0] この論文は2000年に提案された元のQSAアルゴリズムを、NISQ時代の量子コンピュータの現在の能力と限界に適応させたものである。
この実装は、シミュレーションされた量子コンピュータ環境でテストされ、アプローチを検証し、GASPデータローディング回路設計を洗練する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 06:31:24 GMT)
Hierarchical Decentralized Stochastic Control for Cyber-Physical Systems [0.0] 本稿では,サイバー物理システム制御のための2時間規模の階層型分散アーキテクチャを提案する。
アーキテクチャは、$N$独立サブプロセス、グローバルコントローラ、および$N$ローカルコントローラで構成される。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 18:03:35 GMT)
Hierarchical Characterization of Brain Dynamics via State Space-based Vector Quantization [0.0] 本研究では、状態空間モデルに基づく階層構造における脳の状態と遷移を定量化する階層的状態空間に基づくトークン化ネットワークHSTを提案する。
我々はHSTを2つの公開fMRIデータセットで検証し、脳の階層的ダイナミクスを定量化する効果を実証した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 17:12:18 GMT)
Hecto: Modular Sparse Experts for Adaptive and Interpretable Reasoning [0.0] Hectoは軽量なMoEアーキテクチャで、時間的推論のためのGRUエキスパートと、スパースなTop-1ゲーティングメカニズムの下で静的抽象化のためのFFNNエキスパートを組み合わせる。
ヘクトは、独立した入力表現を受け取っているにもかかわらず、パフォーマンスにおいて均質なベースラインにマッチまたは密接に追従する。
Hectoは条件計算の新しいベンチマークとして自らを確立している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 15:03:43 GMT)
Heavy-tailed open quantum systems reveal long-lived and ultrasensitive coherence [0.0] 中心極限定理を超えるランダム開量子系について検討する。
長寿命かつ超高感度な量子コヒーレンスは、中心極限定理に基づく予測と比較して2桁の高次性を示すことを示す。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 01:56:10 GMT)
Gauge freedoms in unravelled quantum dynamics: When do different continuous measurements yield identical quantum trajectories? [0.0] マルコフの開量子系の量子軌跡は、システムが相互作用する環境で行われる測定のバックアクションから生じる。
我々は、異なる測定結果が同じ量子軌道をもたらす必要十分条件を導出する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 09:25:16 GMT)
Feature-Wise Mixing for Mitigating Contextual Bias in Predictive Supervised Learning [0.0] 本稿では,コンテキストバイアスを緩和する機能ワイド混合フレームワークを提案する。
これは複数のコンテキストデータセットにまたがって機能表現を再配布することで実現された。
平均偏差は43.35%、統計的に有意な2乗誤差の減少を達成した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 23:12:59 GMT)
Exploring new variational quantum circuit ansatzes for solving $SU(2)$ matrix models [0.0] TwoLocal と EvolvedOperatorAnsatz という2種類の量子回路が、一般的な EfficientSU2 回路より優れていることを示す。
特に、ボソニックモデルの強い結合状態において、TwoLocal と EvolvedOperatorAnsatz の両回路は、正確な基底状態により良い近似を与える。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 07:06:54 GMT)
Exact Quantum Capacity of Decohering Channels in Arbitrary Dimensions [0.0] 我々は、広い種類のデコヒーレンスな量子チャネルの量子キャパシティの正確な解析式を、$Lambda(rho)= (1-x)rho + x D(rho)$, ここで$D(rho)$は構造化されたデコヒーレンス過程を表す。
これらのチャネルは、すべてのノイズパラメータと任意の次元に対して分解可能であることが示され、クローズド形式のシングルレター容量公式が得られる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 08:22:08 GMT)
Evaluating AI Counseling in Japanese: Counselor, Client, and Evaluator Roles Assessed by Motivational Interviewing Criteria [0.0] 本研究は,日本語治療における3つのカウンセリングの役割において,大規模言語モデル(LLM)の性能を総合的に評価した最初の事例である。
我々は同時に、カウンセラー人工知能(AI)システム(GPT-4-turbo with zeroshot prompting or Structured Multi-step Dialogue Prompts (SMDP), Claude-3-Opus-SMDP)、クライアントAIシミュレーション、評価AIシステム(o3, Claude-3.7-Sonnet, Gemini-2.5-pro)を評価した。
Geminiはパワーシェアリングを強調し、o3は技術的熟練に焦点を当て、Sonnetは感情表現を優先した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 21:50:29 GMT)
Efficient Shallow Ritz Method For 1D Diffusion-Reaction Problems [0.0] 本稿では,一次元拡散-反応問題の解法として浅部リッツ法について検討する。
近似のほぼ最適順序を達成するために、減衰ブロックニュートン法(dBN)を提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 16:22:47 GMT)
Efficient Cybersecurity Assessment Using SVM and Fuzzy Evidential Reasoning for Resilient Infrastructure [0.0] 本稿では,ファジィ明示的推論 (ER) を用いたセキュリティ問題評価モデルを提案する。
このような問題を克服するために,ファジィ明示的推論 (ER) を用いたセキュリティ問題評価モデルを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 16:08:34 GMT)
Effectiveness of the DEJAMPS purification protocol in noisy entangled photon systems, a Monte Carlo simulation [0.0] 絡み合いの浄化は量子通信にとって重要な技術である。
偏光結合光子対に適用されたDEJMPS浄化プロトコルに関するモンテカルロの総合的研究について述べる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 09:45:25 GMT)
Deep learning 40 years of human migration [0.0] 本研究は,230か国と地域間の原産地別年次移動フローと在庫に関する,新規かつ詳細なデータセットを提示する。
我々の流速は出生国によってさらに減少しており、過去43年間にわたる移住の全体像を提供する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 09:05:34 GMT)
Certifying nonlocal properties of noisy quantum operations [0.0] それらが引き起こす確率分布から量子的性質を証明することは、いくつかの目的において重要なタスクである。
特に、チャンネルの認証方法がどの程度ノイズによって損なわれるかは、ほとんど分かっていない。
本稿では,準備・測定プロトコルで得られた相関関係から,量子チャネルの非局所的性質を証明するための統一手法を提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 15:44:10 GMT)
Bridging Ethical Principles and Algorithmic Methods: An Alternative Approach for Assessing Trustworthiness in AI Systems [0.0] 本稿では,Trustworthy AIの倫理的要素とPageRankとTrustRankのアルゴリズム的プロセスを組み合わせた評価手法を提案する。
目標は、フィールドで広く普及する自己評価技術に固有の主観性を最小化するアセスメントフレームワークを確立することである。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 06:27:30 GMT)
Boosting Domain Generalized and Adaptive Detection with Diffusion Models: Fitness, Generalization, and Transferability [0.0] ディテクタは、トレーニングとテストデータのドメインギャップによって、しばしばパフォーマンス低下に悩まされる。
近年,領域一般化(DG)や適応(DA)タスクに応用された拡散モデルが研究されている。
単一段階拡散過程から中間的特徴を抽出することにより,これらの問題に対処することを提案する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 03:56:38 GMT)
Beyond Code: The Multidimensional Impacts of Large Language Models in Software Development [0.0] 大規模言語モデル(LLM)は、特にオープンソースソフトウェア(OSS)分野において、ソフトウェア開発に大きな影響を与える可能性がある。
まず、コード開発、協調的な知識伝達、スキル開発を通じてLSMがOSSに影響を与えるメカニズムを概説する。
次に、これらの3つの重要な領域において、LSMがOSS開発者の作業にどのように影響するかを実証的に検証する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 01:10:24 GMT)
BayesLoRA: Task-Specific Uncertainty in Low-Rank Adapters [0.0] BayesLoRAは下流に調整されたガードレールを提供しており、不確実性の下での動作のイントロスペクションと調整を可能にする。
数学的および実験的に、LoRAアダプタは微調整分布の外部に増幅された分散を示し、エージェントによる意思決定の信頼性を推定できることを示した。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 08:22:02 GMT)
Band-edge superfluid of Bose-Einstein condensates in the spin-orbit-coupled Zeeman lattice [0.0] 基底状態相図のバンドエッジ位相はエキゾチックであり、非常に広いパラメータ状態に存在する。
バンドエッジ状態の超流動性は、基本励起と超流動分数によって同定される。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 09:03:04 GMT)
Arabic Dialect Classification using RNNs, Transformers, and Large Language Models: A Comparative Analysis [0.0] アラビア語は世界でも最も人気のある言語の一つであり、22か国で話される方言が多種多様である。
本研究では、アラビア語のツイートのQADIデータセットの18のアラビア方言を分類する問題に対処する。
このうち、MARBERTv2は65%の精度、64%のF1スコアで最高の成績を収めた。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 12:32:10 GMT)
An efficient plant disease detection using transfer learning approach [0.0] 植物病は農業と農業に重大な課題をもたらす。
本研究では,移動学習手法を用いて植物病の同定とモニタリングを行うシステムを提案する。
このシステムは、Powdery Mildew、Angular Leaf Spot、Early blight、トマトモザイクウイルスなどの細菌、真菌、ウイルス病の存在を正確に検出することができる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 13:47:27 GMT)
A parametric activation function based on Wendland RBF [0.0] ウェンドランド放射基底関数(RBF)は、ReLU、シグモイド、タンなどの従来の活性化関数の制限に対応するために適応される。
提案された拡張ウェンドランド活性化は、標準ウェンドランド成分と線形および指数項を組み合わせることで、調整可能な局所性、勾配伝播の改善、訓練中の安定性の向上を提供する。
その結果、ウェンドランドをベースとしたアクティベーションは、特に回帰タスクにおいて、計算効率を保ちながら、特定のシナリオにおいてより優れた精度を達成することが示された。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 11:35:10 GMT)
A novel approach to multi-image quantum encryption/decryption using qudits [0.0] 我々は、量子コンピューティングのリソーシングがクォーディットで機能することを前提として、画像暗号化において画期的な手法を導入する。
カラーマルチイメージの量子表現は、空間充填曲線に基づいており、記憶空間を小さくすることができる。
量子ベーカー写像を一般化し、2つのn-クォーディットをスクランブルすることができる。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 23:58:30 GMT)
A Generalized Approach to Root-based Attacks against PLWE [0.0] ポリアルラーニング・ウィズ・エラー(Polyal Learning With Errors)問題は、2024年8月に国立標準技術研究所(National Institute of Standards and Technology)が標準化した3つの暗号システムの背景となっている。
PLWEは量子抵抗性が高いと考えられているが、この事実はまだ確立されていない。
いくつかの特定のインスタンスに対して、いくつかの脆弱性が発生している。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 10:56:27 GMT)
A Fundamental Accuracy--Robustness Trade-off in Regression and Classification [0.0] 我々は、比較的一般的な状況において、標準と敵のリスクの根本的なトレードオフを導出します。
具体例として、軽度規則性条件下での導出尾根関数による量的トレードオフを評価する。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 20:29:04 GMT)
(World) Building Transformation: Students and Teachers as CoCreators in OpenXR Learning Environments [0.0] この指導的デザイン実践論文は、我々の教員チーム、学習経験設計者、およびユーザ体験研究者が、どのように人間中心のデザイン思考を実践したかを反映している。
実践者エクスペリエンスと学習者のペルソナ,さらには学習者からの調査,インタビュー,グループ応答をペアにすることで,人間中心の反射レンズを通じてデザインをナレーションします。
論文参考訳(メタデータ) (Sat, 28 Jun 2025 19:36:49 GMT)