An Empirical Study of Evaluating Long-form Question Answering [77.8] 我々は,5,236個のファクトイドおよび非ファクトイドの長文回答を,異なる大言語モデルから収集する。
我々は,2,079件の人的評価を行い,正確性と情報性に着目した。
回答のスタイルや長さ,質問のカテゴリが,自動評価指標に偏りがあることが分かりました。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:14:25 GMT)
LaRI: Layered Ray Intersections for Single-view 3D Geometric Reasoning [76.0] 層状光線交差(LaRI)は、1つの画像から未知の幾何学的推論を行う新しい方法である。
コンパクトで階層的な表現から恩恵を受けることで、LaRIは完全で効率的でビュー整合な幾何学的推論を可能にする。
3Dオブジェクトやシーンを含む、合成および実世界のデータのための完全なトレーニングデータ生成パイプラインを構築します。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:31:29 GMT)
Opportunistic Collaborative Planning with Large Vision Model Guided Control and Joint Query-Service Optimization [74.9] オープンなシナリオで自動運転車をナビゲートすることは、目に見えない物体を扱うのが難しいため、課題である。
既存のソリューションは、一般化に苦しむ小さなモデルか、リソース集約的な大きなモデルに依存している。
本稿では,効率的なローカルモデルと強力なクラウドモデルをシームレスに統合するオポチュニティ協調計画(OCP)を提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 04:07:21 GMT)
From System 1 to System 2: A Survey of Reasoning Large Language Models [73.0] 基礎的な大規模言語モデルは、迅速な意思決定では優れているが、複雑な推論には深みがない。
OpenAIのo1/o3とDeepSeekのR1は、数学やコーディングといった分野のエキスパートレベルのパフォーマンスを実証している。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:15:51 GMT)
EPO: Explicit Policy Optimization for Strategic Reasoning in LLMs via Reinforcement Learning [69.6] 戦略的推論のための明示的なポリシー最適化(EPO)を提案する。
EPOはオープンなアクション空間で戦略を提供し、任意のLLMエージェントにプラグインすることで、ゴール指向の振る舞いを動機付けることができる。
社会的および物理的領域にわたる実験は、EPOの長期的なゴールアライメント能力を示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 13:03:37 GMT)
FaceInsight: A Multimodal Large Language Model for Face Perception [69.1] 本研究では,顔の詳細な情報を提供する多目的顔認識大言語モデル (MLLM) を提案する。
本手法では, 顔情報間の不確かさと決定論的関係の両方をモデル化するために, 顔知識の視覚的・テキスト的アライメントを導入する。
3つの顔認識タスクに対する総合的な実験と分析により、FaceInsightはMLLMと比較した9つの性能を一貫して上回っていることが示された。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 18:58:49 GMT)
Exploring a Large Language Model for Transforming Taxonomic Data into OWL: Lessons Learned and Implications for Ontology Development [63.7] 本稿では,種分類におけるChatGPT-4を用いた農業製品型オントロジー(APTO)におけるオルガニズムモジュールの開発について検討する。
本手法では,ChatGPT-4を用いてGBIF Backbone APIからデータを抽出し,APTOのさらなる統合のためのファイルを生成する。
1つは、BrowserOPプラグインを介してタスクを実行するためのChatGPT-4の一連のプロンプトを発行すること、2つは、タスクを実行するためのPythonアルゴリズムを設計するためにChatGPT-4を指示することである。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 19:05:52 GMT)
Exploring Local Memorization in Diffusion Models via Bright Ending Attention [63.0] テキスト・画像拡散モデルにおける「右端」(BE)異常は、トレーニング画像の記憶に起因する。
本稿では,BEを既存のフレームワークに統合する簡易かつ効果的な手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 03:20:52 GMT)
POET: Prompt Offset Tuning for Continual Human Action Adaptation [61.6] ユーザと開発者に対して,デバイスモデルに新たなアクションクラスを継続的に追加することで,エクスペリエンスをパーソナライズする機能の提供を目標としています。
我々はこれをプライバシーに配慮した数発の連続的な行動認識として定式化する。
本稿では,新しい時間的学習可能なプロンプトチューニング手法を提案し,グラフニューラルネットワークにこのようなプロンプトチューニングを適用した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 04:11:24 GMT)
Predictive Churn with the Set of Good Models [61.0] 本稿では,予測的不整合という2つの無関係な概念の関連性について考察する。
予測多重性(英: predictive multiplicity)は、個々のサンプルに対して矛盾する予測を生成するモデルである。
2つ目の概念である予測チャーン(英: predictive churn)は、モデル更新前後の個々の予測の違いを調べるものである。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 19:40:51 GMT)
Quantum Lifting for Invertible Permutations and Ideal Ciphers [47.3] 量子乱数置換と理想的な暗号モデルにおけるセキュリティを確立するための最初の持ち上げ定理を導出する。
これらの定理は、任意の量子逆数の成功確率と、少数の古典的クエリのみを作る古典的アルゴリズムの成功確率を関連付ける。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:07:55 GMT)
Depth-Constrained ASV Navigation with Deep RL and Limited Sensing [45.8] 本研究では,深度制約下でのASVナビゲーションのための強化学習フレームワークを提案する。
環境意識を高めるため,GPレグレッションをRLフレームワークに統合する。
我々は,実世界の水環境に対して,訓練された政策が適切に一般化されることを保証する効果的なシミュレート・トゥ・リアル・トランスファーを実証する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 10:56:56 GMT)
DualRAG: A Dual-Process Approach to Integrate Reasoning and Retrieval for Multi-Hop Question Answering [45.2] MHQA(Multi-Hop Question Answering)タスクは、多様な知識領域にまたがる多段階推論のオーケストレーションにおいて課題となる。
推論と検索をシームレスに統合する相乗的デュアルプロセスフレームワークであるDualRAGを提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 10:43:53 GMT)
Co-Training with Active Contrastive Learning and Meta-Pseudo-Labeling on 2D Projections for Deep Semi-Supervised Learning [42.6] SSLはこの課題に対処し、ラベル付きで豊富なラベル付けされていないデータを活用する。
教師によるメタ擬似ラベリングとALを効果的に組み合わせた能動型DeepFAを提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 19:41:45 GMT)
RAG LLMs are Not Safer: A Safety Analysis of Retrieval-Augmented Generation for Large Language Models [42.3] RAGはモデルの安全性を低くし、安全性のプロファイルを変更します。
安全なモデルと安全なドキュメントの組み合わせでさえ、安全でない世代を引き起こす可能性がある。
我々の研究は、RAG LLMに特化して、安全研究とリピート手法の必要性を強調している。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 03:25:18 GMT)
CoCoGesture: Toward Coherent Co-speech 3D Gesture Generation in the Wild [42.1] CoCoGestureは、目に見えない人間の音声プロンプトから鮮明で多様なジェスチャー合成を可能にする新しいフレームワークである。
私たちの重要な洞察は、カスタム設計のトレーニングパラダイムに基づいています。
提案するCoCoGesture は,ゼロショット音声・ジェスチャー生成における最先端手法よりも優れる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:26:36 GMT)
Neuroplasticity in Artificial Intelligence -- An Overview and Inspirations on Drop In & Out Learning [42.1] 我々は、神経新生、神経アポトーシス、神経可塑性が将来のAI進歩にどのように影響するかを探求する。
神経新生と再考のためのドロップイン'の概念を導入し,神経アポトーシスのための構造解析を行った。
我々は、この学際領域におけるより大きな研究努力を提唱することで締めくくる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:54:59 GMT)
Improving LLM Personas via Rationalization with Psychological Scaffolds [42.0] ユーザ記述やペルソナによって引き起こされる言語モデルは、ユーザの好みや意見を予測することができる。
既存のペルソナ構築アプローチでは、そのユーザ判断の背後にある根底にある理由を捉えられません。
PB&Jは,ユーザが特定の判断を下す理由の理論的根拠を取り入れ,LLMのペルソナを改善するフレームワークである。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 00:36:39 GMT)
Efficient GNN Training Through Structure-Aware Randomized Mini-Batching [41.8] グラフニューラルネットワーク(GNN)は、現実世界のグラフでの学習を可能にし、GNNのトレーニングのデファクトスタンダードとしてミニバッチトレーニングが登場した。
既存のミニバッチ技術では、精度と収束性を改善するためにランダム化方式を採用している。
本稿では,コミュニティ構造を考慮したランダム化ミニバッチ(COMM-RAND)を提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:16:53 GMT)
Multi-view Hand Reconstruction with a Point-Embedded Transformer [41.4] この研究は、POEMという名前の新規で一般化可能なマルチビューハンドメッシュ再構成モデルを導入している。
POEMは実世界のハンドモーションキャプチャのシナリオで実用化するために設計されている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 06:49:59 GMT)
EDU-NER-2025: Named Entity Recognition in Urdu Educational Texts using XLM-RoBERTa with X (formerly Twitter) [41.3] EDU-NER-2025という名前の、教育ドメインに関連する13の最もユニークなエンティティを含む、手動で注釈付きデータセットを作成します。
フォーマルなウルドゥー語文でよく見られる形態的複雑性や曖昧さといった重要な言語的課題に対処し、分析する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:50:58 GMT)
A Multimodal Deep Learning Approach for White Matter Shape Prediction in Diffusion MRI Tractography [40.9] そこで我々は,10個の白質トラクトグラフィー形状を予測できる新しいディープラーニングフレームワークであるTract2Shapeを提案する。
モデル効率を向上させるために,モデルの次元削減アルゴリズムを用いて5つの一次形状成分を予測した。
本研究では,HCP-YAデータセットと未確認PPMIデータセットを用いて,Tract2Shapeの性能評価を行った。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:54:47 GMT)
RGS-DR: Reflective Gaussian Surfels with Deferred Rendering for Shiny Objects [40.8] RGS-DRは光沢・反射性オブジェクトを再構成・描画するための新しい逆レンダリング手法である。
フレキシブルなリライトとシーン編集をサポートする。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:23:50 GMT)
TurboSVM-FL: Boosting Federated Learning through SVM Aggregation for Lazy Clients [40.7] TurboSVM-FLは、クライアント側で追加の計算負荷を発生させることのない、新しい統合集約戦略である。
我々は、FEMNIST、CelebA、シェークスピアを含む複数のデータセット上でTurboSVM-FLを評価する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:16:13 GMT)
An Open-Source and Reproducible Implementation of LSTM and GRU Networks for Time Series Forecasting [39.7] 本稿では,時系列予測のためのLong Short-Term Memory(LSTM)とGated Recurrent Unit(GRU)ネットワークのオープンソースかつ再現可能な実装について紹介する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:00:54 GMT)
RankFlow: A Multi-Role Collaborative Reranking Workflow Utilizing Large Language Models [39.7] RankFlowは、複数ロールの再ランクワークフローである。
RankFlowは、クエリRewriter、擬似Answerer、Summarizer、Rerankerの4つの異なる役割を達成するためにLLMを登録する。
実験結果から、RangeFlowは、広く認識されているIRベンチマークにおいて、既存の主要なアプローチよりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 01:33:35 GMT)
Generative Evaluation of Complex Reasoning in Large Language Models [39.2] 大規模言語モデル(LLM)における推論評価に特化して設計された生成的評価フレームワークであるKUMOを紹介する。
自動パイプラインを通じて、KUMOは、超人記憶よりも真の一般化を示すために、オープンエンドドメインにまたがる新しいタスクを連続的に生成する。
我々は、KUMOが作成した100のドメインにまたがる5000のタスクに対して、23の最先端LCMを評価し、大学生に対する推論能力をベンチマークした。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 12:02:19 GMT)
A Picture is Worth A Thousand Numbers: Enabling LLMs Reason about Time Series via Visualization [38.8] 我々は,大規模言語モデルの時系列推論(TsR)性能を評価するための,最初の総合的なテストベッドであるTimerBedを提案する。
そこで本稿では,可視化モデルデータと言語誘導推論を用いたプロンプトベースのVL-Timeを提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:39:41 GMT)
ElChat: Adapting Chat Language Models Using Only Target Unlabeled Language Data [38.3] チャットLLMのための新しい言語適応手法であるElChatを提案する。
ベースモデルなしで、ターゲットの未ラベルデータに直接チャットモデルを適用する。
ソースチャットモデルから情報をインジェクトすることで、チャット能力を付与する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:08:57 GMT)
Gradient Descent as a Shrinkage Operator for Spectral Bias [38.2] 勾配降下(GD)は、ニューラルネットワークのヤコビアンの特異値を隠す収縮演算子として解釈することができる。
本稿では、GDが保持する周波数成分の数を暗黙的に選択し、スペクトルバイアスを制御する方法を示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:36:17 GMT)
Partition Map-Based Fast Block Partitioning for VVC Inter Coding [37.6] インターコーディングにおいて高速なブロック分割を追求する分割マップに基づくアルゴリズムを提案する。
分割マップを用いたイントラコーディング手法に関するこれまでの研究に基づいて,VVCインターコーディングの特性を解析した。
本稿では、複雑性の低減とRD性能損失の微妙なトレードオフを実現するための二重閾値決定方式を提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:53:03 GMT)
TextTIGER: Text-based Intelligent Generation with Entity Prompt Refinement for Text-to-Image Generation [37.2] 我々は,エンティティ・プロンプト・リファインメント(TextTIGER)を用いたテキストベースのインテリジェント・ジェネレーションを提案する。
TextTIGERは、プロンプトに含まれるエンティティに関する知識を増強し、Large Language Models (LLMs)を使用して拡張記述を要約する。
実験によると、TextTIGERはキャプションのみのプロンプトと比較して、標準メトリクス(IS、FID、CLIPScore)における画像生成性能を改善する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:27:44 GMT)
DREAM: Disentangling Risks to Enhance Safety Alignment in Multimodal Large Language Models [37.1] MLLM(Multimodal Large Language Models)は、視覚データとテキストデータの統合により、ユニークな安全性上の課題を提起する。
textbfDREAM(textittextbfDisentangling textbfRisks to textbfEnhance Safety textbfAlignment in textbfMLLMs)を導入する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 03:54:24 GMT)
Deep Cut-informed Graph Embedding and Clustering [36.2] 我々は,革新的で非GNNベースのDeep Cut-informed Graph Embedding and Clusteringフレームワーク,すなわちDCGCを提案する。
符号化モジュールに対しては,その結合正規化カットを最小化することにより,グラフ構造と属性を融合させる,カットインフォームドグラフ埋め込みの目的を導出する。
クラスタリングモジュールでは,クラスタリングの割り当てを得るために最適な輸送理論を利用する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 00:15:04 GMT)
HRScene: How Far Are VLMs from Effective High-Resolution Image Understanding? [35.4] 高分解能画像(HRI)の理解は、病理画像や農業用空中画像など、多数のピクセルで画像を処理することを目的としている。
HRI理解を評価するためのVision Large Language Modelsの包括的なベンチマークが欠如している。
HRSceneは、リッチなシーンでのHRI理解のための新しい統一ベンチマークである。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:01:41 GMT)
ShapeSpeak: Body Shape-Aware Textual Alignment for Visible-Infrared Person Re-Identification [34.8] Visible-Infrared Person Re-identification (VIReID)は、視線と赤外線の歩行者画像とをマッチングすることを目的としている。
既存の方法はアイデンティティラベルの監視のみに依存している。
視覚言語で事前訓練されたモデルがVIReIDに導入され、意味情報モデリングが強化された。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 02:37:47 GMT)
MIND: Math Informed syNthetic Dialogues for Pretraining LLMs [34.5] 本稿では,新しい大規模かつ多様なMath Informed syNthetic Dialogue(MIND)生成法を提案する。
MIND は OpenWebMath (OWM) に基づいて合成会話を生成し,新しい数学コーパス MIND-OWM を生成する。
会話設定の異なる実験により,対話参加者間の知識ギャップを組み込むことが,高品質な数学データの生成に不可欠であることが判明した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 03:14:33 GMT)
UniGraph2: Learning a Unified Embedding Space to Bind Multimodal Graphs [34.5] マルチモーダルグラフ上での汎用的な表現学習を可能にする新しいクロスドメイングラフ基盤モデルを提案する。
UniGraph2は、グラフニューラルネットワーク(GNN)と共にモダリティ固有のエンコーダを使用して、統一された低次元埋め込み空間を学習する。
我々は,UniGraph2が表現学習,伝達学習,マルチモーダル生成タスクなどのタスクにおいて,最先端モデルよりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:12:51 GMT)
StoryGPT-V: Large Language Models as Consistent Story Visualizers [33.7] 生成モデルは、テキストのプロンプトに基づいて、現実的で視覚的に喜ばしい画像を生成する素晴らしい能力を示しています。
しかし、新興のLarge Language Model(LLM)はあいまいな参照をナビゲートする堅牢な推論能力を示している。
本稿では,LDMとLDMの利点を生かしたemphStoryGPT-Vを提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 12:47:21 GMT)
ReStyle3D: Scene-Level Appearance Transfer with Semantic Correspondences [33.1] ReStyle3Dは、シーンレベルの外観を1つのスタイルのイメージから、複数のビューで表現された現実世界のシーンに転送するためのフレームワークである。
明示的な意味対応と多視点整合性を組み合わせることで、正確で一貫性のあるスタイリングを実現する。
私たちのコード、事前訓練されたモデル、データセットは、インテリアデザイン、仮想ステージング、そして3D一貫性のあるスタイリングにおける新しいアプリケーションをサポートするために、公開されます。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 21:19:20 GMT)
Memory Reviving, Continuing Learning and Beyond: Evaluation of Pre-trained Encoders and Decoders for Multimodal Machine Translation [32.5] マルチモーダル機械翻訳は、画像などの補助的なモダリティをテキスト入力と併用することで、翻訳品質を向上させることを目的としている。
大規模事前学習型言語と視覚モデルにおける最近の進歩は、一助の自然言語処理タスクに大きな恩恵をもたらしている。
我々は,マルチモーダル翻訳モデルにおける事前学習エンコーダとデコーダの影響について,系統的研究を行った。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 01:44:04 GMT)
COCO-Inpaint: A Benchmark for Image Inpainting Detection and Manipulation Localization [32.3] COCOInpaint(ココインペント)は、検出の塗装に特化して設計されたベンチマークである。
6つの最先端塗膜モデルにより生成された高品質な塗膜試料。
258,266枚のインペイント画像による大規模カバレッジと多彩なセマンティック多様性。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:04:36 GMT)
ActionArt: Advancing Multimodal Large Models for Fine-Grained Human-Centric Video Understanding [31.5] ActionArtは、人間中心のマルチモーダル理解の研究を促進するために設計された、きめ細かいビデオキャプチャデータセットである。
私たちのデータセットは、幅広い人間の行動、人間とオブジェクトの相互作用、さまざまなシナリオをキャプチャする何千ものビデオで構成されています。
本研究では,異なる次元にまたがる既存大規模マルチモーダルモデルの細粒度理解能力を評価するために,8つのサブタスクを開発した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:05:32 GMT)
Superradiant phase transitions in the quantum Rabi model: Overcoming the no-go theorem through anisotropy [30.3] 超ラジアント相転移(SRPT)は、パラダイム的量子ラビモデルでは禁止されている。
異方性量子Rabiモデルにおいて、通常の位相から生じる2種類のSRPTを示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:23:16 GMT)
From Mapping to Composing: A Two-Stage Framework for Zero-shot Composed Image Retrieval [30.3] Composed Image Retrieval (CIR) は、参照画像と付随する修正テキストに基づいてターゲット画像を取得する、困難なマルチモーダルタスクである。
本稿では,マッピングから構成に至るまでのトレーニングを行うための2段階のフレームワークを提案する。
最初の段階では、視覚的意味注入モジュールを導入して、画像から擬似単語へのトークン学習を強化する。
第2段階では、少量の合成三重項データを用いてテキストエンコーダを最適化し、合成意味論を効果的に抽出する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 00:18:23 GMT)
Rate-Distortion-Perception Tradeoff Based on the Conditional-Distribution Perception Measure [30.3] 本稿では,大きなブロック長の制限下でのメモリレスソースモデルの速度歪み知覚トレードオフについて検討する。
離散メモリレスソースの場合の関数の単一文字特性を導出し、デコーダがノイズ付加機構に制限可能であることを示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 21:28:11 GMT)
Bridge the Domains: Large Language Models Enhanced Cross-domain Sequential Recommendation [30.1] クロスドメインシークエンシャルレコメンデーション (CDSR) は、様々なドメインにわたるユーザの歴史的なインタラクションから好みを抽出することを目的としている。
既存のCDSRメソッドは、クロスドメインアイテムの関係を学習するために、すべてのドメインでインタラクションを所有するユーザに依存している。
強力な表現力と推論能力により、LLM(Large Language Models)はこれらの2つの問題に対処することを約束している。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:30:25 GMT)
Optimizing Multi-Round Enhanced Training in Diffusion Models for Improved Preference Understanding [29.2] 本稿では,ユーザの好みに合わせた報酬モデルを活用し,フィードバックをループに組み込んだフレームワークを提案する。
このアプローチは、特にマルチターン対話シナリオにおいて、ユーザの満足度において競合するモデルを一貫して上回ります。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:35:02 GMT)
TRACE Back from the Future: A Probabilistic Reasoning Approach to Controllable Language Generation [28.9] TRACEは期待属性確率を効率的に計算する新しいフレームワークである。
トラクタブルな確率的推論と軽量な制御によって、新しい属性に適応する。
TRACEは、10%のデコードオーバーヘッドで、最先端の結果をデトキシ化する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 17:59:13 GMT)
Ultra-fast feature learning for the training of two-layer neural networks in the two-timescale regime [26.5] 平均場単一隠蔽層ニューラルネットワークの学習における勾配法の収束性について検討した。
教師-学生設定において,教師の特徴分布に対する訓練された特徴分布の収束を保証する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:40:10 GMT)
Pre-train, Align, and Disentangle: Empowering Sequential Recommendation with Large Language Models [26.3] Sequential Recommendation (SR) は、ユーザの過去のインタラクションにおけるシーケンシャルなパターンを活用して、ユーザの好みを正確に追跡することを目的としている。
大規模言語モデル(LLM)の有効性が証明されているにもかかわらず、商用レコメンデータシステムへの統合は妨げられている。
我々は,LLMを用いたSRモデルを強化するために,新しいPri-train,Align,Disentangle(PAD)フレームワークを導入する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 18:32:35 GMT)
ShadowKV: KV Cache in Shadows for High-Throughput Long-Context LLM Inference [25.6] ShadowKVは、LLM(Long-Context Large Language Model)推論システムである。
低ランクのキーキャッシュを格納し、バリューキャッシュをオフロードすることで、より大きなバッチサイズと長いシーケンスのためにメモリフットプリントを削減する。
最大6$times$大きなバッチサイズをサポートし、A100 GPUで最大3.04$times$までスループットを向上できる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 19:40:54 GMT)
Highly Accurate and Diverse Traffic Data: The DeepScenario Open 3D Dataset [25.2] 我々は,新しいモノクラーカメラドローン追跡パイプラインによって得られた6自由度境界ボックス軌道のDeepScenario Open 3Dデータセット(DSC3D)を紹介した。
当社のデータセットには、14種類のトラフィック参加者の175,000以上のトラジェクトリが含まれており、多様性とスケールの点で既存のデータセットを大きく上回っている。
動作予測,動作計画,シナリオマイニング,生成反応性トラフィックエージェントなど,複数のアプリケーションにまたがる実用性を実証する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 12:59:17 GMT)
NoiseController: Towards Consistent Multi-view Video Generation via Noise Decomposition and Collaboration [25.1] 本稿では,映像生成のコンピテンシーを高めるために,マルチレベルノイズデコントローラ,マルチフレームノイズデコントローラ,ジョイントデノイングを提案する。
我々は,映像生成タスクと下流タスクの公開データセットに対するノイズコントローラの評価を行い,その最先端性能を実証した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:01:48 GMT)
Pseudo-Asynchronous Local SGD: Robust and Efficient Data-Parallel Training [25.0] PseudosynchronousA Local SGD (PALSGD) と呼ばれる手法を提案する。
PALSGDは標準のローカルSGDよりも長い同期間隔を使用することができる。
その結果,PALSGDは従来の手法に比べて少ない時間で性能が向上することがわかった。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:06:08 GMT)
Investigating Co-Constructive Behavior of Large Language Models in Explanation Dialogues [24.0] 共構築的説明対話において,大規模言語モデルが説明者として関与する能力について検討する。
以上の結果から,質問の検証,質問者の関与の促進,話題の理解の向上など,共同構築的な行動が示唆された。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:47:44 GMT)
PreGSU-A Generalized Traffic Scene Understanding Model for Autonomous Driving based on Pre-trained Graph Attention Network [23.4] 交通要素間の相互作用の学習、抽出、表現として定義されたシーン理解は、ハイレベル自律運転(AD)における重要な課題の1つである。
現在のシーン理解手法は主に、軌道予測やリスクレベル評価などの1つの具体的な単一タスクに焦点を当てている。
グラフアテンションネットワークに基づく一般化された事前学習シーン理解モデルであるPreGSUを提案し、様々な下流タスクをサポートするために、交通シーンの普遍的相互作用と推論を学習する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:37:11 GMT)
A Survey on Web Application Testing: A Decade of Evolution [22.8] Webアプリケーションテスト(WAT)は、Webアプリケーションの機能、セキュリティ、信頼性を保証する上で重要な役割を果たす。
過去10年間に様々なWATアプローチが開発されてきた。
本稿では,テストケースの生成と実行,評価,評価など,WATに関わる主なステップについて検討する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 10:43:24 GMT)
Understanding and Mitigating Risks of Generative AI in Financial Services [22.7] 我々は、金融サービスドメインに特有のAIコンテンツ安全性の考察を強調し、関連するAIコンテンツリスク分類を概説することを目指している。
我々は,既存のオープンソース技術ガードレールソリューションがこの分類をレッドチーム活動を通じて収集されたデータに基づいて評価することによってどのようにカバーするかを評価する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:55:51 GMT)
Benchmarking large language models for biomedical natural language processing applications and recommendations [22.7] 大規模言語モデル(LLM)は、一般的なドメインにおいて有望であることを示している。
我々は、そのゼロショット、少数ショット、微調整性能を従来のBERTモデルやBARTモデルと比較する。
LLM出力の不足情報や幻覚といった問題を見つけます。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 22:22:45 GMT)
Fast-Slow Thinking for Large Vision-Language Model Reasoning [22.1] 質問特徴に基づく推論深度を適応するフレームワークである textbfFAST を提案する。
FASTは、ベースモデルと比較して10%以上改善され、最先端の精度が達成される。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:11:23 GMT)
Redefining Superalignment: From Weak-to-Strong Alignment to Human-AI Co-Alignment to Sustainable Symbiotic Society [22.0] スーパーアライメントは、AIシステムが人間よりもはるかに賢く、人間の(互換性のある)意図と価値観に一致し続けることを保証します。
既存の拡張性のある監視法と弱強一般化法は、AISに面した場合、実質的に不可能で不十分であることを示す可能性がある。
外部監視と本質的なプロアクティブアライメントを統合するフレームワークを強調します。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:32:41 GMT)
Outlier-aware Tensor Robust Principal Component Analysis with Self-guided Data Augmentation [22.0] 適応重み付けを用いた自己誘導型データ拡張手法を提案する。
本研究では,最先端手法と比較して精度と計算効率の両面での改善を示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 13:03:35 GMT)
Federated Client-tailored Adapter for Medical Image Segmentation [22.0] 医用画像セグメンテーションのための新しいFCAフレームワークを提案する。
FCAは、機密なローカルデータを共有せずに、安定かつクライアントに適したセグメンテーションを実現する。
我々は、アダプタを共通コンポーネントと個別コンポーネントに適応的に分解する2つのクライアント調整されたフェデレーション更新戦略を開発する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 02:20:25 GMT)
Review-driven Personalized Preference Reasoning with Large Language Models for Recommendation [21.8] EXP3RTは、ユーザとアイテムレビューに含まれるリッチな好み情報を活用するために設計された、LLMベースの新しいレコメンデータである。
詳細なステップバイステップの推論と予測された評価を生成する。
実験の結果、EXP3RTは評価予測と候補項目の双方において、トップkレコメンデーションにおいて既存の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:10:43 GMT)
Distillation and Refinement of Reasoning in Small Language Models for Document Re-ranking [21.2] 本稿では、推論集約型文書ランキングのための小言語モデルをトレーニングするための新しいアプローチを提案する。
我々は Web データと教師 LLM を用いて,関連性の説明付き高品質な学習例を自動生成する。
私たちのモデルは、他のアプローチよりもはるかに少ないパラメータを使用しながら、リーダーボードで3位です。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 20:39:42 GMT)
Understanding Depth and Height Perception in Large Visual-Language Models [21.2] 視覚言語モデル(VLM)の幾何学的理解を評価することに注力する。
形状や大きさといった基本的な幾何学的性質の知覚には優れていますが、深さや高さの知覚には一貫して苦労しています。
本研究の目的は, 幾何学的理解を深めた VLM の開発方法を明らかにすることである。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:56:39 GMT)
Pre-DPO: Improving Data Utilization in Direct Preference Optimization Using a Guiding Reference Model [20.6] 提案するPre-DPO(Pre-DPO)は,指導基準モデルを活用することにより,嗜好最適化性能を向上させる,シンプルで効果的なDPOベースのトレーニングパラダイムである。
AlpacaEval 2.0とArena-Hard v0.1ベンチマークの大規模な実験は、Pre-DPOがDPOとSimPOの両方のパフォーマンスを一貫して改善していることを示している。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:47:16 GMT)
FungiTastic: A multi-modal dataset and benchmark for image categorization [20.1] 我々は,20年間にわたって連続的に収集された菌類記録に基づいて,新しいベンチマークとデータセットFungiTasticを導入する。
データセットは専門家によってラベル付けされ、キュレーションされ、6kの細粒度カテゴリー(種)の約350kのマルチモーダル観測から構成される。
FungiTasticは、前例のないラベルの信頼性に関するDNA配列の真実をテストセットを含む数少ないベンチマークの1つである。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:11:09 GMT)
HyperDAS: Towards Automating Mechanistic Interpretability with Hypernetworks [20.1] 本稿では, コンバータをベースとしたハイパーネットワークアーキテクチャHyperDASを提案する。
Llama3-8Bでの実験では、HyperDASはRAVELベンチマークで最先端のパフォーマンスを達成し、隠蔽状態における概念の密接化を実現している。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:03:38 GMT)
ThreMoLIA: Threat Modeling of Large Language Model-Integrated Applications [20.0] 大規模言語モデル(LLM)は現在、産業用ソフトウェアアプリケーションに統合されている。
脅威モデリングは、これらの脅威を特定し、緩和を提案するために一般的に使用される。
本研究の目的は,1) ライフサイクルの早い段階での脅威モデリングを行う方法,(2) 既存の脅威モデルを統合する脅威モデリングツールを開発すること,(3) 高品質な脅威モデリングを実現することにある。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:11:42 GMT)
Your Weak LLM is Secretly a Strong Teacher for Alignment [19.3] 既存のアライメントフレームワークは、高価な人的労力または高い計算コストの形で制約を提示します。
本稿では,上位層モデルよりも資源集約度が低い弱いLLMを用いた,有望な中間層を探索する。
弱いLLMは、完全に注釈付けされたデータに匹敵する、あるいは超えるフィードバックを提供することができる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:34:47 GMT)
Can We Detect Failures Without Failure Data? Uncertainty-Aware Runtime Failure Detection for Imitation Learning Policies [19.3] FAIL-Detectは、模倣学習に基づくロボット操作における障害検出のための2段階のアプローチである。
まず、政策失敗と相関し、不確実性を捉えるスカラー信号にポリシー入力と出力を蒸留する。
我々の実験は、新しいフローベース密度推定器を使用する場合、学習信号がほぼ一貫した効果を示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:12:28 GMT)
Offline Learning of Controllable Diverse Behaviors [19.1] イミテーションラーニング(IL)技術は、特定のタスクで人間の行動を再現することを目的としている。
時間的一貫性と制御性に基づく新しい手法を提案する。
我々は,タスクや環境の多様さに対して,最先端の手法との比較を行った。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:16:56 GMT)
Diffusion-Driven Universal Model Inversion Attack for Face Recognition [17.7] 顔認識システムは、伝統的にプライバシー保護と見なされる生の画像を埋め込みに変換する。
モデル反転攻撃は、プライベートな顔画像の再構築によって重大なプライバシー上の脅威となる。
顔認識システムのためのトレーニングフリー拡散駆動型ユニバーサルモデルインバージョンアタックであるDiffUMIを提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 01:53:27 GMT)
Machine-generated text detection prevents language model collapse [17.3] 復号化戦略がモデル崩壊に与える影響について検討する。
我々は,機械生成テキスト検出器を訓練し,モデル崩壊を緩和するための重要なサンプリング手法を提案する。
モデル崩壊を防止できるだけでなく、十分な人為的なサンプルが存在する場合に性能を向上させることができることを示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:53:47 GMT)
Spark: A System for Scientifically Creative Idea Generation [17.3] 大規模言語モデル(LLM)は、科学における新しい研究のアイデアを生み出す有望な能力を示している。
我々は、LLMを用いた検索強化アイデア生成と、OpenReviewから600Kの科学的レビューに基づいて訓練された審査員モデルとを結合したSparkというアイデア生成システムを提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 20:33:57 GMT)
MultiMind: Enhancing Werewolf Agents with Multimodal Reasoning and Theory of Mind [17.3] MultiMindは、マルチモーダル情報をソーシャル推論エージェントに統合する最初のフレームワークである。
言語内容とともに表情と声調を処理し、心の理論(ToM)モデルを用いる。
このToMモデルとMCTS(Monte Carlo Tree Search)を組み合わせることで、エージェントは自身に対する疑念を最小限に抑えるコミュニケーション戦略を特定する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 03:12:43 GMT)
BackSlash: Rate Constrained Optimized Training of Large Language Models [16.7] 本稿では,RDOに基づく新しい訓練時間圧縮手法BackSlashを紹介する。
BackSlashは、正確さを損なわずに、メモリ使用量を60%から90%削減できる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:26:21 GMT)
Task-Oriented Communications for Visual Navigation with Edge-Aerial Collaboration in Low Altitude Economy [16.6] ビジョンベースの手法は、軽量UAV上での帯域幅、メモリ、処理の制約に直面する。
マルチカメラシステムを備えたUAVがコンパクトなマルチビュー特徴を抽出し,エッジサーバへのオフロードローカライゼーションタスクをオフロードするタスク指向通信フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 12:49:14 GMT)
NoEsis: Differentially Private Knowledge Transfer in Modular LLM Adaptation [16.5] NoEsisはモジュール性、プライバシ、知識伝達の望ましい特性の上に構築されている。
NoEsisは、差分プライバシーとハイブリッドな2段階パラメータ効率の微調整を統合する。
CodeXGLUEによる評価の結果、NoEsisは証明可能なプライバシー保証を達成できることが示された。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:56:24 GMT)
DeepDistill: Enhancing LLM Reasoning Capabilities via Large-Scale Difficulty-Graded Data Training [16.4] 大規模言語モデル(LLM)は、最近、様々な複雑な推論ベンチマークで顕著なパフォーマンスを達成した。
難易度が変化する約334万のユニークなクエリを含む大規模で難易度の高い推論データセットを構築した。
AIME2024の数学的推論ベンチマークで79.2%のパス率を達成することで、ベースモデルの推論能力を大幅に改善する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:10:20 GMT)
Music Tempo Estimation on Solo Instrumental Performance [16.4] 本研究では,最先端のテンポ推定手法について検討し,その演奏性を評価する。
声帯と器楽の混在を前提とした時間畳み込みニューラルネットワーク(TCN)とリカレントニューラルネットワーク(RNN)モデルを用いた。
新たにトレーニングしたTCNモデルでは,Acc1が61.1%の事前訓練したTCNモデルと比較して,ギターテンポ推定においてAcc1の基準値が38.6%向上した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 17:14:52 GMT)
Treating Motion as Option with Output Selection for Unsupervised Video Object Segmentation [16.4] 本稿では,移動キューを必要ではなくオプションコンポーネントとして扱う,新たなモーション・アズ・オプション・ネットワークを提案する。
トレーニング中、光学フローマップの代わりにRGB画像をランダムにモーションエンコーダに入力し、ネットワークのモーションキューへの依存を暗黙的に低減する。
この設計により、モーションエンコーダはRGB画像と光フローマップの両方を処理可能であることを保証する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 01:03:39 GMT)
A Unified MDL-based Binning and Tensor Factorization Framework for PDF Estimation [16.1] 多変量確率密度関数推定のための新しい非パラメトリックアプローチを提案する(PDF)。
提案手法は, 共役確率テンソルの正準多進分解(CPD)を利用するテンソル分解法に基づく。
我々は,本手法が合成データおよび実生豆分類データセットに与える影響を実証した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 20:27:04 GMT)
Decoding complexity: how machine learning is redefining scientific discovery [16.1] 機械学習(ML)は、複雑なデータセットの編成、分析、解釈に欠かせないツールとなっている。
本稿では,さまざまな科学分野のブレークスルーを加速する上で,MLが果たす変革的役割について考察する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:35:04 GMT)
Auto-SLURP: A Benchmark Dataset for Evaluating Multi-Agent Frameworks in Smart Personal Assistant [16.0] Auto-SLURPは、インテリジェントパーソナルアシスタントのコンテキストにおけるLLMベースのマルチエージェントフレームワークの評価を目的としたベンチマークデータセットである。
Auto-SLURPは、データを緩和し、シミュレートされたサーバと外部サービスを統合することで、元のSLURPデータセットを拡張している。
我々の実験は、Auto-SLURPが現在の最先端フレームワークに重大な課題をもたらすことを示した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:17:47 GMT)
HierSum: A Global and Local Attention Mechanism for Video Summarization [14.9] 本稿では,指導ビデオの要約に焦点をあて,映像を意味のあるセグメントに分割する方法を提案する。
HierSumは、サブタイトルからのきめ細かいローカルキューと、ビデオレベルの命令によって提供されるグローバルなコンテキスト情報を統合する。
我々は,HierSumがF1スコアやランク相関などの重要な指標において,既存の手法を一貫して上回ることを示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 20:30:30 GMT)
Human-In-The-Loop Software Development Agents: Challenges and Future Directions [14.8] Atlassianでは、Jiraの作業項目を解決するためにHuman-in-the-Loop Software Development Agentsをデプロイしました。
本稿では,LLMに基づく評価において,単体テストの計算コストが高いことと,変動性という2つの大きな課題を取り上げる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 01:52:59 GMT)
Neural Combinatorial Optimization Algorithms for Solving Vehicle Routing Problems: A Comprehensive Survey with Perspectives [14.5] 我々は、NCOソルバの最新の分類を確立させるために、関連する出版物やプレプリントをレビューする。
我々は,SOTAソルバの欠点として,一般化の低さ,大規模VRPの解決能力の低下,NCOソルバと従来のOperations Researchアルゴリズムとの比較が困難である点を挙げる。
提案した分類法に従って,NCOソルバのライブレポジトリとして付随するWebページを提供する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 06:52:44 GMT)
Generalization Guarantees for Multi-View Representation Learning and Application to Regularization via Gaussian Product Mixture Prior [14.5] 分散多視点表現学習の課題について検討する。
この問題において、$K$エージェントは、それぞれ異なる、おそらく統計的に相関した、ビューとそれから独立した抽出を適切な表現として観察する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:07:39 GMT)
Fairness Is More Than Algorithms: Racial Disparities in Time-to-Recidivism [14.4] この研究は、反事実的人種格差の概念を導入し、アルゴリズム的偏見、文脈的要因、またはそれらの相互作用からリシディズムの違いが生じるかどうかを評価するために、観察データを用いた公式なテストを提供する。
この枠組みをCompASデータセットに適用した実証的研究により、リスクスコアの制御において、短期的な再分配パターンが人種的格差を示さないことが明らかになった。
これは、アルゴリズム的なスコアを超えた要因、おそらく住宅、雇用、社会的支援における構造的な格差は、時間とともに再分配のリスクを蓄積し、悪化させる可能性があることを示唆している。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 18:13:37 GMT)
Early Prediction of Alzheimers Disease Leveraging Symptom Occurrences from Longitudinal Electronic Health Records of US Military Veterans [14.3] アルツハイマー病(AD)の早期予測は、時間的介入と治療に不可欠である。
本研究の目的は,AD患者の経時的電子健康記録(EHR)解析に機械学習アプローチを使用することである。
我々は,AD関連キーワードのパネルと,患者の縦 EHR における時間的変化を,4つの機械学習モデルを用いたAD予測の予測因子として使用した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 18:07:58 GMT)
Knowledge-Augmented Multimodal Clinical Rationale Generation for Disease Diagnosis with Small Language Models [14.1] 小型言語モデル(SLM)は効率的であるが、マルチモーダル医療データを統合するための高度な推論が欠けている。
我々は,LLM由来の推論能力を合理的蒸留とドメイン知識注入によって活用し,SLMの強化を図るClinRaGenを提案する。
実世界の医療データセットの実験により、ClinRaGenは疾患の診断と合理性生成において最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 03:53:34 GMT)
TimeSoccer: An End-to-End Multimodal Large Language Model for Soccer Commentary Generation [13.8] TimeSoccerは、フルマッチサッカービデオにおけるSDVCのためのエンドツーエンドのサッカーMLLMである。
TimeSoccerはタイムスタンプを共同で予測し、ひとつのパスでキャプションを生成し、グローバルなコンテキストモデリングを可能にする。
MoFA-Selectは、トレーニングなし、モーション対応のフレーム圧縮モジュールで、代表フレームを適応的に選択する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:58:48 GMT)
Efficient Single-Pass Training for Multi-Turn Reasoning [13.8] マルチターン推論データセット上での微調整大型言語モデルには,ユニークな課題がある。
本稿では、応答トークン複製とカスタムアテンションマスクにより、この制限を克服する新しいアプローチを提案する。
提案手法はトレーニング時間を著しく短縮し,マルチターン推論データセットの高精度な微調整を可能にする。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 10:46:56 GMT)
Anti-adversarial Learning: Desensitizing Prompts for Large Language Models [13.7] 本稿では,LLMプロンプトを脱感作する方法であるPromptObfusを提案する。
PromptObfusの基本的な考え方は"反逆的"な学習であり、プライバシーの言葉を不明瞭な機密情報へと誘惑する。
PromptObfus はタスク性能を保ちながらリモート LLM からのプライバシ推論を効果的に防止できることを示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 06:19:02 GMT)
Reason Like a Radiologist: Chain-of-Thought and Reinforcement Learning for Verifiable Report Generation [13.6] BoxMed-RLは、空間的に検証可能な説明可能な放射線学レポートを生成するための、画期的な統合トレーニングフレームワークである。
大きなビジョン言語モデルに基づいて構築されたBoxMed-RLは、2つの統合フェーズを通じてレポート生成に革命をもたらす。
BoxMed-RLは、最先端の手法と比較して、METEORとROUGE-Lの両方で平均7%改善されている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:05:06 GMT)
Pets: General Pattern Assisted Architecture For Time Series Analysis [13.6] 時系列分析は、天気予報、異常検出、医療などの分野で広く応用されている。
伝統的な分解技術は、季節成分から複数の変動パターンを効果的に切り離すのに苦労する。
本稿では,時間スペクトル空間内のエネルギー分布に基づく新しい視点を提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 04:23:48 GMT)
A Model Zoo on Phase Transitions in Neural Networks [12.5] 重量空間学習法は、訓練されたモデルの集団を、開発と評価のためのデータセットとして要求する。
モデル動物園と呼ばれる既存のモデルのコレクションは、構造化されていないか、多様性の初歩的な定義に従っている。
我々は、モデル動物園のアイデアとフェーズ情報を組み合わせることで、人口の多様性の制御された概念を創出する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:01:52 GMT)
Decomposing and Fusing Intra- and Inter-Sensor Spatio-Temporal Signal for Multi-Sensor Wearable Human Activity Recognition [12.4] 本稿では,モダリティ変数間の関係をよりよくモデル化するDecomposeWHARモデルを提案する。
この分解は、改良されたDepth Separable Convolutionを通じて、各センサ内変数の高次元表現を生成する。
我々のモデルは、広く使われている3つのWHARデータセットにおいて優れた性能を示し、最先端のモデルよりも大幅に優れている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 04:02:01 GMT)
Tilus: A Virtual Machine for Arbitrary Low-Precision GPGPU Computation in LLM Serving [12.1] Serving Large Language Models (LLMs) はAIを利用したアプリケーションには必須だが、かなりの計算資源を必要とする。
低精度の計算が資源消費を減らしながら効率を向上する鍵となる技術として登場した。
低精度カーネルを生成するための既存のアプローチは、2つのパワーを持つウェイトビット幅に限られている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 18:40:48 GMT)
Comparing Uncertainty Measurement and Mitigation Methods for Large Language Models: A Systematic Review [11.9] 大規模言語モデル(LLM)は多くの領域にまたがって変換されている。
不確実性定量化(英: Uncertainty Quantification, UQ)とは、不確実性の測定と、不確実性と正確性の間の不一致に対処するための校正技術である。
この調査は、LCMの校正方法と関連するメトリクスをレビューする最初の専用研究である。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 13:34:40 GMT)
Class-Conditional Distribution Balancing for Group Robust Classification [11.5] 間違った理由からモデルが正しい予測に導かれるような豪華な相関関係は、堅牢な現実世界の一般化にとって重要な課題である。
クラス-条件分布における不均衡やミスマッチとして、突発的な相関を緩和することで、新しい視点を提供する。
本稿では,バイアスアノテーションと予測の両方を必要としない,シンプルで効果的な頑健な学習手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 02:50:56 GMT)
Building a stable classifier with the inflated argmax [11.5] マルチクラス分類の文脈におけるアルゴリズム安定性のための新しい枠組みを提案する。
この種のアプローチの欠点は、本質的に不安定であることであり、トレーニングデータのわずかな摂動に非常に敏感であることである。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 21:58:03 GMT)
Hierarchical and Multimodal Data for Daily Activity Understanding [11.2] Daily Activity Recordings for Artificial Intelligence (DARai)は、現実の環境での人間の活動を理解するために構築されたマルチモーダルデータセットである。
DARaiは、10の異なる環境における50人の参加者による連続的なスクリプトと未記述の録音で構成され、合計200時間以上のデータである。
さまざまな機械学習モデルによる実験では、人間中心のアプリケーションにおける重要な課題を明らかにする上で、DARaiの価値が示されている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:07:50 GMT)
Leveraging Label Semantics and Meta-Label Refinement for Multi-Label Question Classification [11.2] 本稿では,ラベルのセマンティクスとメタラベルの精巧化を活用して,複数ラベルの質問分類を検索する新手法RR2QCを紹介する。
実験の結果,RR2QCはPrecision@KとF1スコアの既存の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:36:19 GMT)
Teleportation-based Speed Meter for Precision Measurement [11.1] 干渉型変位検出のための量子テレポーテーションを用いた速度計を提案する。
2つの等価な実装が提示され、量子放射圧ノイズを低減し、測定変位の標準量子限界を超える。
このアプローチは、量子絡み合いによって可能となるバックアクション回避への新たな経路を提供する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 06:29:24 GMT)
Why Does My Transaction Fail? A First Look at Failed Transactions on the Solana Blockchain [10.3] Solanaは、高いスループットと低いトランザクションコストで認識される、新興ブロックチェーンプラットフォームである。
このアドバンテージによってSolanaは、金銭的搾取のためのボットスパムに晒され、トランザクションが失敗する。
我々は、15億以上の失敗したトランザクションのキュレートされたデータセットを使用して、Solara上で失敗したトランザクションの大規模な実証的研究を行った。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 04:05:28 GMT)
Building UD Cairo for Old English in the Classroom [10.2] UDカイロ文に基づく古英語用木バンクのサンプルを提示する。
LLMのプロンプトと検索の組み合わせを古英語の真正データに適用する。
以上の結果から,現代英語のLLM出力は文法を反映していないが,後編集により緩和できる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 22:08:06 GMT)
Can Kernel Methods Explain How the Data Affects Neural Collapse? [10.0] ニューラルネットワーク(NN)分類器がゼロトレーニングエラー点を超えると、"Neural Collapse"(NC)現象が発生する。
本稿では,浅いNNに関連付けられたカーネルを用いてNC1を解析する可能性について検討する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 06:43:34 GMT)
The Evolution of Information Seeking in Software Development: Understanding the Role and Impact of AI Assistants [9.9] 実践者の行動を求めるAI支援情報とその認知的生産性とスキル開発への影響を理解するために,混合手法による研究を行った。
開発者の情報検索にAIツールの利用が増えていることが,効率の向上を重要なメリットとして挙げている。
当社の取り組みは,情報検索システムと学習支援として,AIツールの開発者への効果的な統合に影響を及ぼす。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 03:05:11 GMT)
LEAM: A Prompt-only Large Language Model-enabled Antenna Modeling Method [9.8] LEAM(Large Language Model, LLM)と呼ばれるアンテナモデリング手法について述べる。
LEAMは言語記述に基づくアンテナモデルの自動生成を可能にする。
すべての例において、正しいアンテナモデルは数分で生成される。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:29:30 GMT)
A Parametric Approach to Adversarial Augmentation for Cross-Domain Iris Presentation Attack Detection [9.7] アイリスベースの生体認証システムは、敵がシステムを破壊するために物理的な人工物を提示するプレゼンテーションアタック(PA)に対して脆弱である。
本研究では,PAD分類器のクロスドメイン性能を向上させるために,ボナフィドイリドとPAの双方の対向トレーニングサンプルを用いる。
4つのデータセットとLivDet-Iris 2020データセットからなるLivDet-Iris 2017データベース上で実施された実験は、提案手法の有効性を実証する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:34:19 GMT)
Temporal Entailment Pretraining for Clinical Language Models over EHR Data [9.6] 臨床領域における言語モデルのための新しい時間的包含事前学習目標を提案する。
本手法は, EHRセグメントを時間的に順序付けられた文対として定式化し, 後の状態が先行状態に関係しているか, 矛盾しているか, 中立であるかを決定するようモデルを訓練する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:30:38 GMT)
Application and Optimization of Large Models Based on Prompt Tuning for Fact-Check-Worthiness Estimation [9.6] 我々は,プロンプトチューニングを用いて,方法論レベルでのファクトチェック・信頼性推定モデルを構築した。
我々は,インコンテキスト学習を確立し,インプロンプトチューニング技術を活用し,クレームに事実チェックの信頼性があるかどうかを判断する精度を向上させる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 06:16:41 GMT)
SORT3D: Spatial Object-centric Reasoning Toolbox for Zero-Shot 3D Grounding Using Large Language Models [9.6] SORT3Dは2Dデータからリッチなオブジェクト属性を利用し、大規模言語モデルの能力とAsベースの空間推論ツールボックスをマージするアプローチである。
2つのベンチマークにおいて、複雑なビュー依存のグラウンド化タスクにおいて、SORT3Dが最先端のパフォーマンスを達成することを示す。
私たちはまた、パイプラインを実装して、自動運転車でリアルタイムに実行し、我々のアプローチが、これまで見えなかった現実世界の環境において、オブジェクトゴールナビゲーションに使用できることを実証しています。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 20:24:11 GMT)
Deep Optimal Transport for Domain Adaptation on SPD Manifolds [9.6] 最適輸送理論とSPD多様体の幾何学を組み合わせた新しい幾何学的深層学習フレームワークを提案する。
提案手法は, 多様体構造を尊重しながらデータ分布を整列させ, 限界差と条件差を効果的に低減する。
提案手法は,KU,BNCI2014001,BNCI2015001の3つのクロスセッション脳コンピュータインタフェースデータセットに対して検証を行った。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:58:22 GMT)
On the workflow, opportunities and challenges of developing foundation model in geophysics [9.4] 本稿では,地球物理データと連動して基礎モデルを開発する過程を体系的に検討する。
物理データの多様性,複雑性,物理的整合性の制約を考慮すると,対象とする解について論じる。
本稿では,基礎モデルの伝達学習能力を活用してラベル付きデータへの依存を減らし,計算効率を向上し,物理的制約をモデルトレーニングに組み込む方法について論じる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:35:21 GMT)
EMT: A Visual Multi-Task Benchmark Dataset for Autonomous Driving in the Arab Gulf Region [9.4] Emirates Multi-Taskデータセットは、統一されたフレームワーク内でマルチタスクのベンチマークをサポートするように設計されている。
ダッシュカメラの視界から3万枚以上のフレームと570,000点の注釈付きバウンディングボックスで構成され、約150kmの走行経路をカバーしている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 12:00:46 GMT)
AMR-RE: Abstract Meaning Representations for Retrieval-Based In-Context Learning in Relation Extraction [9.1] 関係抽出のためのAMR強化検索に基づくICL法を提案する。
本モデルでは,タスク入力とトレーニングサンプル間の意味的構造的類似性に基づいて,文脈内サンプルを検索する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 02:23:21 GMT)
From Prompts to Propositions: A Logic-Based Lens on Student-LLM Interactions [9.0] Prompt2Constraintsは,学生のプロンプトを論理的制約に翻訳する新しい手法である。
この手法を用いて,203人の生徒による1,872件のプロンプトのデータセットを解析する。
成功し、失敗した試みは、全体として同じ数の制約を使う傾向にあるが、学生が失敗すると、そのプロンプトはより大幅に修正されることが多い。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 20:58:16 GMT)
A UD Treebank for Bohairic Coptic [8.9] ボヘリック・コプト語(Bohairic Coptic)は、マムルーク前、ビザンティン・エジプト後期、コプト教会の現代語の主要なコプト語方言である。
本稿では,聖書のテキスト,聖人の生活,キリスト教のアセティック・ライティングなど,さまざまな作品から収集した,ボヘラクティック・コプトの最初の構文的注釈付きコーパスを提示し,評価する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:33:03 GMT)
Cabbage: A Differential Growth Framework for Open Surfaces [8.9] キャベジ(Cabbage)は、花弁のカールのような自然界に見られる3次元開口面における座屈挙動をモデル化するための差動成長フレームワークである。
キャベジは自己切断のない高品質な三角形メッシュを生成する。
コンピュータ・モデリング、デジタル・ファブリケーション、教育だけでなく、幾何学処理や形状解析のための高品質な注釈付きデータも提供している。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 03:25:13 GMT)
Data Science: a Natural Ecosystem [8.9] この原稿は、私たちが本質的なデータ科学と呼ぶものの全体像(データ中心)を提供する。
データサイエンティストは、ミッションに従って定義された課題に直面します。
我々は本質的なデータ科学を計算と基礎に意味的に分割した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:43:27 GMT)
Sky-Drive: A Distributed Multi-Agent Simulation Platform for Socially-Aware and Human-AI Collaborative Future Transportation [8.8] 本稿では,新しい分散マルチエージェントシミュレーションプラットフォームであるSky-Driveを紹介する。
自律走行車(AV)-vulnerable road user(VRU)インタラクションモデリング、ヒューマン・イン・ザ・ループトレーニング、社会的に認識された強化学習、パーソナライズされた運転ポリシー、カスタマイズされたシナリオ生成など、さまざまなアプリケーションをサポートする。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 01:33:26 GMT)
The Rise of Small Language Models in Healthcare: A Comprehensive Survey [8.6] 小型言語モデル(SLM)は、次世代医療情報学にスケーラブルで臨床的に実行可能なソリューションを提供する。
包括的調査では、医療従事者に対して分類・分類するための分類学的枠組みを提示する。
本研究は,医療におけるSLMの変容可能性を明らかにするために,広く研究されているNLPタスクを対象とした実験結果のまとめである。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 13:42:19 GMT)
Back to Fundamentals: Low-Level Visual Features Guided Progressive Token Pruning [8.3] LVTPは、マルチスケールのTsallisエントロピーと2倍のクラスタリングを備えた低レベル視覚特徴によってガイドされるプログレッシブトークンプルーニングフレームワークである。
高レベルのセマンティクスと、正確なセグメンテーションのための基本的な視覚属性を統合している。
プラグアンドプレイモジュールとして、アーキテクチャの変更や追加のトレーニングは必要ありません。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 00:43:20 GMT)
DreamID: High-Fidelity and Fast diffusion-based Face Swapping via Triplet ID Group Learning [8.2] DreamIDは、高レベルのID類似性、属性保存、画像の忠実性、高速推論速度を実現する拡散ベースの顔交換モデルである。
本稿では,SwapNet,FaceNet,IDAdapterを組み合わせた拡散モデルアーキテクチャを提案する。
DreamIDは、アイデンティティの類似性、ポーズと表現の保存、イメージの忠実性の観点から、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 03:48:24 GMT)
Leave-One-Out Analysis for Nonconvex Robust Matrix Completion with General Thresholding Functions [7.7] 我々は、ロバスト完備行列(RMC)の問題をランク付けする。
解析には単純だが効率的なアルゴリズムを考える。
最高のサンプリング結果を得るためには、これが最初のランクアウト分析法である。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:28:32 GMT)
VisTabNet: Adapting Vision Transformers for Tabular Data [7.6] 本稿では,事前学習した重み付きビジョントランスフォーマーを用いて表データ処理を行うクロスモーダルトランスファー学習法を提案する。
VisTabNetの優位性を示し、従来のアンサンブル手法と最近のディープラーニングモデルの両方より優れています。
サンプル実装をGitHubリポジトリとして公開しています。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 12:19:39 GMT)
Adversarial Attacks to Latent Representations of Distributed Neural Networks in Split Computing [7.6] 分散ディープニューラルネットワーク(DNN)は、モバイルデバイスの計算負担を低減し、エッジコンピューティングシナリオにおけるエンドツーエンドの推論レイテンシを低減することが示されている。
本稿では,分散DNNの対戦行動に対するロバスト性を厳格に分析することにより,既存の研究ギャップを埋める。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 00:32:41 GMT)
Three Types of Calibration with Properties and their Semantic and Formal Relationships [7.6] キャリブレーションを動機づける2つの説明として,予測特性の自己実現と帰属損失の正確な推定を行う。
二項帰結集合では、両方の原型的定義は参照特性の適切な選択の下で一致する。
校正と校正の両面において,複数校正によく用いられるグループ分けの役割について論じる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:46:10 GMT)
A Cognitive-Mechanistic Human Reliability Analysis Framework: A Nuclear Power Plant Case Study [7.6] 本研究では,IDHEAS-ECA方法論を強化する認知機械的枠組み(COGMIF)を提案する。
ACT-Rベースのヒューマンデジタルツイン(HDT)とTimeGAN強化シミュレーションを統合している。
TimeGANはACT-R生成時系列データに基づいてトレーニングされ、高忠実な合成演算子挙動データセットを生成する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 00:46:00 GMT)
OnePerc: A Randomness-aware Compiler for Photonic Quantum Computing [7.6] 本稿では,スケーラビリティと効率性を同時に実現するために,ランダム性を考慮したコンパイルフレームワークを提案する。
我々は、このフレームワークが、スケーラブルな方法で最も効率的なベースラインコンパイラを著しく上回っていることを実証した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 22:36:59 GMT)
Disambiguating Numeral Sequences to Decipher Ancient Accounting Corpora [7.5] 古代・部分的に解読された原エラマイト(PE)文字について検討する。
書かれた数字は、それらを読むのに使われるシステムによって最大4つの異なる読みを持つことができる。
本稿では,このコーパスに記録された数値の値を決定するために,これらの読みのあいまいさを解消する作業について考察する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 22:07:02 GMT)
Efficient Learning on Large Graphs using a Densifying Regularity Lemma [7.2] 交差する二部体成分の組み合わせに基づいて、大きな有向グラフの低ランク分解を導入する。
グラフ,スパース,あるいは密度を高密度IBGで効率的に近似する方法を示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:34:44 GMT)
Learning and Generating Diverse Residential Load Patterns Using GAN with Weakly-Supervised Training and Weight Selection [7.2] 本稿では,RLP-GAN(Generative Adversarial Network based Synthetic Residential Load Pattern)の生成モデルを提案する。
417世帯の実世界データを用いて, RLP-GANの有効性を検証するための総合評価手法を開発した。
我々は,RLP-GAN生成した合成データセットを公開し,100万の合成住宅負荷パターンプロファイルを合成した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:01:08 GMT)
An Adaptive Grasping Force Tracking Strategy for Nonlinear and Time-Varying Object Behaviors [7.1] 本稿では、一般化剛性の概念を導入し、剛性の定義を非線形時間変動グリップシステムモデルに拡張する。
提案手法は,非理想的対象への適応性を向上しつつ,高精度かつ短い探索時間を実現する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:01:05 GMT)
Revisiting DRAM Read Disturbance: Identifying Inconsistencies Between Experimental Characterization and Device-Level Studies [7.0] 本研究では,RowHammerとRowPressのキービットフリップ特性をデバイスレベルのエラー機構から同定し,抽出する。
我々はRowHammerとRowPressのビットフリップ方向の基本的な矛盾と、実験結果とデバイスレベルのエラー機構のアクセスパターン依存性を見出した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 13:42:17 GMT)
Structure Learning in Gaussian Graphical Models from Glauber Dynamics [7.0] グラウバー力学に基づいてデータをサンプリングする場合, ガウスモデル選択のための最初のアルゴリズムを提案する。
本稿では,提案アルゴリズムの構造学習性能の計算的および統計的複雑さを保証する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:45:29 GMT)
All for One, and One for All: UrbanSyn Dataset, the third Musketeer of Synthetic Driving Scenes [7.0] UrbanSynは、半プロデューラルに生成された合成都市運転シナリオを通じて取得されるデータセットである。
深度、セマンティックセグメンテーション、インスタンスセグメンテーションを含むピクセルレベルの地上真実を提供する。
UrbanSynをオープンかつ自由に利用できるようにする(www.urbansyn.org)
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:35:12 GMT)
A Method for the Architecture of a Medical Vertical Large Language Model Based on Deepseek R1 [6.6] 本稿では,効率的な医療用垂直大モデルアーキテクチャを提案する。
知識獲得レベルでは、DeepSeek-R1-Distill-70B教師モデルからDeepSeek-R1-Distill-7B学生モデルへ知識伝達パイプラインを設計する。
モデル圧縮レベルでは、4ビットの重み量子化を含む圧縮技術が実装され、医用推論のコア表現が保存される。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:28:29 GMT)
DCFormer: Efficient 3D Vision-Language Modeling with Decomposed Convolutions [6.5] 我々は,3次元畳み込みを深さ,高さ,幅の3つの平行1次元畳み込みに分解する,効率的な3次元画像エンコーダDCFormerを紹介する。
ゼロショットと微調整による18の病理診断では、DCFormerは最先端の3Dビジョンエンコーダよりも一貫して優れている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:36:21 GMT)
Robust Kernel Hypothesis Testing under Data Corruption [6.4] 本稿では,データ破損下でのロバストな置換テストを構築するための一般的な手法を提案する。
最小限の条件下での力の一貫性を証明する。
これは、潜在的な敵攻撃を伴う現実世界のアプリケーションに対する仮説テストの実践的な展開に寄与する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:16:54 GMT)
Forensics and security issues in the Internet of Things [6.4] 本稿では、異なる分野におけるIoTに関する法医学的およびセキュリティ上の問題についてレビューする。
ほとんどのIoTデバイスは、標準的なセキュリティ対策が欠如しているため、攻撃に対して脆弱である。
消費者のセキュリティを意識したニーズを満たすために、IoTはスマートホームシステムの開発に使用できる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:10:53 GMT)
Technical Challenges in Maintaining Tax Prep Software with Large Language Models [6.4] 我々は、LLM(Large Language Models)を活用した技術的課題を特定し、理解し、対処することに注力する。
我々の研究は、ChatGPTとLlamaを利用してIRS出版物からコード差分を忠実に抽出する技術的課題を特定し、理解し、対処することに焦点を当てています。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 21:00:20 GMT)
A Multimodal Hybrid Late-Cascade Fusion Network for Enhanced 3D Object Detection [6.4] マルチモーダル入力から3Dオブジェクトを検出するための新しい手法を提案する。
画像上にLiDAR境界ボックスを投影することにより,LiDAR検出とRGB検出とを一致させる。
我々は、KITTIオブジェクト検出ベンチマークで結果を評価し、大幅な性能改善を示した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:28:53 GMT)
Spatial Audio Processing with Large Language Model on Wearable Devices [6.3] 空間的音声理解を大規模言語モデル(LLM)に組み込んだ新しいシステムアーキテクチャを提案する。
SINGは空間認識自動音声認識(ASR)をサポートし、単語誤り率(WER)5.3の既存の作業における88.52円の中央値エラーと比較して平均誤差が25.72円$-で大幅に改善されている。
例えば、最大5人まで、DoAエラーの中央値は16ドル(約1万2000円)と見積もっている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:21:54 GMT)
Bitcoin: A Non-Continuous Time System [6.3] 私たちは、Bitcoinの時間的不連続に寄与する3つの中核的な側面に焦点を当てています。
これらの要素が組み合わさってBitcoinの時間構造を作り、従来の計算や物理学で見られる連続的な時間システムとは根本的に異なる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:06:20 GMT)
Even Small Reasoners Should Quote Their Sources: Introducing the Pleias-RAG Model Family [6.2] Pleias-RAG-350m と Pleias-RAG-1B は,大規模合成データセット上で中間学習を行う。
引用と接地をリテラルでサポートし、RAGに関連する複数の機能を再統合する。
ヨーロッパの主要言語間で一貫したRAG性能を維持している唯一のSLMである。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 10:17:04 GMT)
Med-R1: Reinforcement Learning for Generalizable Medical Reasoning in Vision-Language Models [6.2] 視覚言語モデル(VLM)は、自然画像の推論において顕著な進歩を遂げているが、医療画像におけるその可能性はまだ探索されていない。
医用推論における一般化と信頼性の向上を目的とした強化学習(RL)による視覚言語モデルであるMed-R1を提案する。
我々はMed-R1を8つの異なる医用画像モダリティで評価した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:11:19 GMT)
ECG Identity Authentication in Open-set with Multi-model Pretraining and Self-constraint Center & Irrelevant Sample Repulsion Learning [6.1] オープンセット設定でも高い性能を維持する頑健なECG認証システムを提案する。
本手法は,99.83%の認証精度を達成し,False Accept Rateを5.39%まで低く維持する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 12:18:51 GMT)
CR-LSO: Convex Neural Architecture Optimization in the Latent Space of Graph Variational Autoencoder with Input Convex Neural Networks [6.0] 潜時空間最適化(LSO)に基づくニューラルアーキテクチャ探索(NAS)法では、離散的ニューラルアーキテクチャを連続潜時空間に埋め込むために深層生成モデルを訓練する。
本稿では,空間の学習過程を正規化することを目的とした凸性アーキテクチャ正規化空間(CRLSO)法について述べる。
3つのNASベンチマークによる実験結果から,CR-LSOは計算複雑性と性能の両面で競合評価結果が得られることが示された。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:04:12 GMT)
EvidenceBench: A Benchmark for Extracting Evidence from Biomedical Papers [6.0] バイオメディカルペーパーにおける仮説に関連する証拠を自動的に発見する作業について検討する。
このタスクでモデルのパフォーマンスを測定するために、EvidenceBenchを導入します。
複数の人間-専門家のアノテーションを用いて,パイプラインの妥当性と精度を示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 23:23:17 GMT)
AutoFL: A Tool for Automatic Multi-granular Labelling of Software Repositories [6.0] AutoFLは、ソースコードからソフトウェアリポジトリを自動的にラベル付けするツールである。
textitfile、textitpackage、textitproject-levelを含む、複数の粒度のアノテーションを可能にする。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:08:51 GMT)
Depth3DLane: Monocular 3D Lane Detection via Depth Prior Distillation [5.9] 限界に対処し、3次元車線検出精度を向上させるためのBEVベースのフレームワークを提案する。
教師モデルから意味深度知識を伝達するために,Depth Prior Distillationを活用する。
本手法は,z軸誤差による最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 13:08:41 GMT)
Research on Personalized Medical Intervention Strategy Generation System based on Group Relative Policy Optimization and Time-Series Data Fusion [5.9] 我々は,グループ相対的政策最適化と時系列データ融合に基づく個人化された医療介入戦略を生成するシステムを開発した。
意思決定の堅牢性と解釈性を向上させるために,多層ニューラルネットワーク構造を用いて患者特性をグループコードする。
実験の結果,既存の方法と比較して精度,カバレッジ,意思決定の利点が著しく向上した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 18:15:59 GMT)
Learning Actionable World Models for Industrial Process Control [5.9] 効果的なAIシステムは、非常に限られたトレーニングデータから複雑なシステムの振る舞いについて学ぶ必要がある。
本稿では,学習した潜在表現においてプロセスパラメータをアンタングル化する新しい手法を提案する。
これにより、入力の変化から表現の変化を予測することができ、その逆も可能となり、プロセスのバリエーションに責任を負う重要な要因の解釈が容易になる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:11:20 GMT)
TGDT: A Temporal Graph-based Digital Twin for Urban Traffic Corridors [5.8] 既存のディープラーニングモデルは、しばしば空間的な一般化性に欠け、複雑なアーキテクチャに依存し、リアルタイムのデプロイメントに苦労する。
本稿では,時間的畳み込みニューラルネットワークと注意グラフニューラルネットワークを統合したスケーラブルなフレームワークであるTGDTを提案する。
TGDTは、数秒で1000以上のシナリオをシミュレートすることができ、コスト効率が高く、解釈可能で、リアルタイムな信号最適化ソリューションを提供する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 01:28:32 GMT)
Closing the Gap: A User Study on the Real-world Usefulness of AI-powered Vulnerability Detection & Repair in the IDE [5.8] プロのソフトウェア開発者が所有する実際のプロジェクトで、脆弱性検出と修正ツールを実装しています。
DeepVulGuardは脆弱性のコードをスキャンし、修正を提案し、警告と修正の自然言語説明を提供し、チャットインターフェースを活用する。
最先端のAIによる検出と修正ツールは、将来性を示しているが、偽陽性や適用不可能な修正の頻度が高いため、現実世界での使用には実用的ではない。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 22:40:15 GMT)
Neuro-Symbolic Evaluation of Text-to-Video Models using Formal Verification [5.5] 我々は,新しい合成ビデオ評価指標であるNeuS-Vを紹介する。
NeuS-Vは、ニューロシンボリック形式検証技術を用いて、テキストとビデオのアライメントを厳格に評価する。
既存の指標と比較すると,NeuS-Vは5倍以上の相関性を示すことがわかった。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 02:50:58 GMT)
Equi-Euler GraphNet: An Equivariant, Temporal-Dynamics Informed Graph Neural Network for Dual Force and Trajectory Prediction in Multi-Body Systems [5.4] 物理インフォームドグラフニューラルネットワーク(GNN)であるEqui-Euler GraphNetを提案する。
Equi-Euler GraphNetはトレーニングディストリビューションを超えて一般化され、目に見えない速度、負荷、設定の下でロードとトラジェクトリを正確に予測する。
トラジェクトリ予測に重点を置く最先端のGNNよりも優れており、エラーの蓄積を最小限に抑えながら、数千のタイムステップで安定したロールアウトを実現する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:07:14 GMT)
RandALO: Out-of-sample risk estimation in no time flat [5.2] クロスバリデーション(CV)は、リスク推定のデファクトスタンダードとして機能するが、計算コスト(リーブ・ワン・アウト・CV)に対して高いバイアス(K$fold CV)の取引が不十分である。
本稿では,高次元におけるリスクの一貫した推定器であるとともに,計算コストも$K$-fold CVよりも低いランダム化された約1回のリスク推定器を提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:33:57 GMT)
Finding 709 Defects in 258 Projects: An Experience Report on Applying CodeQL to Open-Source Embedded Software (Experience Paper) -- Extended Report [5.1] SASTツールは滅多に使われません。プロジェクトのわずか3%は、自明なコンパイラ分析を越えています。
開発者は、非効率性と偽陽性という認識を、採用制限の理由として挙げた。
258プロジェクト全体で、CodeQLは709の真の欠陥を報告し、偽陽性率は34%だった。
セキュリティ上の脆弱性は535件(75%)あり、その中にはMicrosoft、Amazon、Apache Foundationが管理する主要なプロジェクトも含まれる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:18:45 GMT)
Foundations of Safe Online Reinforcement Learning in the Linear Quadratic Regulator: $\sqrt{T}$-Regret [5.1] 我々は,安全制約付き強化学習における厳格な後悔の限界を証明した。
我々は$tildeO_T(sqrtT)$を後悔する最初の安全なアルゴリズムを提供する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 19:22:57 GMT)
Optimizing GPT for Video Understanding: Zero-Shot Performance and Prompt Engineering [5.1] 我々は、ゼロショット分類のためのGPTベースのモデルを探索し、最適化することで、ビデオコンテンツ分類における業界の課題に取り組む。
我々は,迅速な最適化と政策改善を通じて,GPTの性能向上に新たなアプローチを貢献する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 22:35:16 GMT)
Deep Learning for Individual Heterogeneity [5.1] 本稿では,深層ニューラルネットワーク(DNN)を構造経済モデルに統合する。
経済構造と機械学習は、代替品ではなく経験的モデリングの補完である。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 00:16:37 GMT)
SSD-Poser: Avatar Pose Estimation with State Space Duality from Sparse Observations [5.0] 軽量で効率的なSSD-Poserは、スパース観測から頑健なフルボディ動作推定のために設計されている。
SSD-Poserは、よく設計されたハイブリッドエンコーダであるState Space Attentionsを組み込んで、状態空間を複雑なモーションポーズに適応させる。
AMASSデータセットの実験では、SSD-Poserは例外的な精度と計算効率を達成する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 13:18:06 GMT)
A BERT-Style Self-Supervised Learning CNN for Disease Identification from Retinal Images [5.0] 医用画像研究において、高品質なラベルの取得は高価かつ困難である。
本研究では,BERTスタイルの自己教師型学習手法を実装するために,軽量CNNフレームワークであるnn-MobileNetを用いる。
アルツハイマー病 (AD) , パーキンソン病 (PD) , および各種網膜疾患の鑑別について, 事前訓練を行った。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 03:38:55 GMT)
Fast Orthogonal Matching Pursuit through Successive Regression [4.9] 本稿では,OMPの進歩と一般化OMPと呼ばれる拡張について述べる。
提案手法は,OMPとgOMPの計算複雑性を直接的に低減する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 03:26:13 GMT)
Extending Cox Proportional Hazards Model with Symbolic Non-Linear Log-Risk Functions for Survival Analysis [4.9] 我々は、生存分析の新しい手法であるGeneralized Cox Proportional Hazards (GCPH)モデルを導入する。
GCPHは従来のCPHモデルの解釈可能性を維持しつつ、非線形ログリスク関数の推定を可能にする。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 00:53:08 GMT)
Neural operators struggle to learn complex PDEs in pedestrian mobility: Hughes model case study [4.9] ヒューズモデル(Hughes model)は、群衆力学の1次双曲保存法体系である。
ニューラル作用素は、初期状態における不連続性の少ない簡単なシナリオでよく機能する。
彼らは複数の初期不連続性と動的境界条件を持つ複雑なシナリオで苦労する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:26:41 GMT)
Bigram Subnetworks: Mapping to Next Tokens in Transformer Language Models [4.8] Transformer言語モデルでは、アクティベーションベクトルは現在のトークン埋め込みから次のトークン予測へと変換される。
この変換の最小形態を分離するために、ビッグラム予測を行う言語モデルワークを同定し、現在のトークンのみに基づいて次のトークン予測を行う。
Bigramworksはトレーニング済みの言語モデルで10Bパラメータまで見つけることができ、モデルパラメータの0.2%未満である場合でも、モデルパフォーマンスにとって非常に重要です。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 23:34:11 GMT)
Explainable AI for UAV Mobility Management: A Deep Q-Network Approach for Handover Minimization [4.7] 本稿では、さまざまな状態パラメータがハンドオーバ決定にどのように影響するかについて、より深い洞察を提供するための、説明可能なAI(XAI)フレームワークを紹介する。
参照信号受信電力(RSRP)などの重要な特徴の影響を定量化することにより、RLベースのハンドオーバソリューションの解釈可能性と信頼性を向上させる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:11:51 GMT)
Unify3D: An Augmented Holistic End-to-end Monocular 3D Human Reconstruction via Anatomy Shaping and Twins Negotiating [4.7] 本稿では,人間の再建を全体的プロセスとして扱う新しいパラダイムを紹介する。
本稿では、解剖学的形状抽出モジュールとツインズネゴシエイト再構成U-Netの2つのコアコンポーネントからなる新しい再構成フレームワークを提案する。
また,Comic Data Augmentation 戦略を提案し,より複雑なケースインプットでモデル性能を高めるために15k以上の人体スキャンを構築した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:49:23 GMT)
Revisiting Locally Differentially Private Protocols: Towards Better Trade-offs in Privacy, Utility, and Attack Resistance [4.5] ローカル微分プライバシー(LDP)は、特にデータを収集するサーバが信頼できない設定で、強力なプライバシ保護を提供する。
本稿では, LDPプロトコルを改良するための汎用多目的最適化フレームワークを提案する。
我々のフレームワークは、調整可能なプライバシ・ユーティリティ・トレードオフによるLPP機構のモジュール化とコンテキスト対応のデプロイを可能にする。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:40:09 GMT)
Optimising ChatGPT for creativity in literary translation: A case study from English into Dutch, Chinese, Catalan and Spanish [4.5] テキストレベルでのGPT翻訳の評価,温度設定,クリエイティビティスコア式によるプロンプト戦略について検討した。
最小限の命令でChatGPTをプロンプトすると、最高の創造的翻訳が得られることがわかった。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 10:11:15 GMT)
Appa: Bending Weather Dynamics with Latent Diffusion Models for Global Data Assimilation [4.4] Appaはスコアベースのデータ同化モデルで、地球規模の大気軌道を0.25度と1時間間隔で生成する。
この結果から,将来的な大気モデルシステムの基礎として,潜在スコアに基づくデータ同化が確立される。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 22:14:29 GMT)
A Bias-Variance Decomposition for Ensembles over Multiple Synthetic Datasets [4.4] 最近の研究は、教師あり学習のための複数の合成データセットを生成する利点を強調している。
これらの利点は明らかな実証的な支持を持っているが、理論的な理解は今のところ非常に軽い。
複数の合成データセットを使用するいくつかの設定に対して、バイアス分散分解を導出することで理論的理解を高めることを目指す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 10:38:41 GMT)
Random-Set Large Language Models [4.3] 大規模言語モデル(LLM)は、クエリに対する非常に高品質なテストとレスポンスを生成することで知られています。
しかし、この生成されたテキストはいくら信用できますか?
本稿では,トークン空間上の有限ランダム集合(関数)を予測するランダムセット大言語モデル(RSLLM)を提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:25:27 GMT)
E-VLC: A Real-World Dataset for Event-based Visible Light Communication And Localization [4.3] イベントカメラはLED信号のデコードやLEDマーカーの位置に対するカメラへのデコードに使用することができる。
さまざまな現実世界の設定でデコードとローカライゼーションをベンチマークする公開データセットは存在しない。
ハードウェアトリガと正確に同期した、イベントカメラ、フレームカメラ、グラウンドトルースポーズからなる、最初のパブリックデータセットを提示する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 17:43:20 GMT)
Non-Asymptotic Guarantees for Average-Reward Q-Learning with Adaptive Stepsizes [4.2] 本研究は,非同期実装を用いたQ-Learningの平均逆Q-Learningの最終項目収束に対する最初の有限時間解析である。
私たちが研究しているアルゴリズムの重要な特徴は、各状態-作用ペアの局所クロックとして機能する適応的なステップサイズの使用である。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 23:41:14 GMT)
Multilingual Large Language Models and Curse of Multilinguality [4.1] 大規模言語モデル(LLM)は自然言語処理(NLP)の研究者や実践者の間で広く普及している。
本稿では,多言語LLMの展望を概観し,その技術的側面について概観する。
基礎となるアーキテクチャ、客観的関数、事前トレーニングされたデータソース、トークン化メソッドを説明します。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 10:53:27 GMT)
A Spatially-Aware Multiple Instance Learning Framework for Digital Pathology [4.0] マルチプル・インスタンス・ラーニング (MIL) は、スライド画像全体を用いた病理学における弱い教師付き分類のための有望なアプローチである。
トランスフォーマーベースMIL(Transformer Based MIL)のような最近の進歩は、空間的コンテキストとパッチ間関係を取り入れている。
本研究では,この問題に対処するための対話対応表現を統合することで,ABMILフレームワークを強化する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:23:36 GMT)
Deniable Encryption in a Quantum World [4.0] 暗号処理が量子アルゴリズムであるような環境では、(sender-)deniablecryptを学習するが、暗号文は古典的である。
我々は、量子計算が本質的に強力な復号化暗号を解き放つことを示しており、これを完全説明不能( perfect unexplainability)と呼ぶ。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:37:14 GMT)
An Improved ResNet50 Model for Predicting Pavement Condition Index (PCI) Directly from Pavement Images [4.0] 本研究では,Residual Network (ResNet50) アーキテクチャの拡張版を提案し,CBAM (Convolutional Block Attention Module) と統合した。
CBAMを組み込むことで、モデルは画像内の重要な特徴を自律的に優先順位付けし、予測精度を向上させる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 17:00:50 GMT)
Continuum limit of $p$-biharmonic equations on graphs [3.8] ランダムな幾何グラフが考慮され、データポイントの数が無限大になるとき、解の挙動を調査する。
連続極限は、均一なノイマン境界条件を持つ適切な重み付き$p$-ビハーモニック方程式であることを示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:20:37 GMT)
A Large Vision-Language Model based Environment Perception System for Visually Impaired People [3.8] 本稿では,LVLMに基づく環境認識システムを提案する。
このシステムは視覚障害者が周囲の環境を効果的に知覚するのに役立つ。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 02:46:22 GMT)
SSL4Eco: A Global Seasonal Dataset for Geospatial Foundation Models in Ecology [3.7] 自己教師付き学習は、ラベルのないデータからの学習表現を可能にした。
これらのモデルは、高い人間の活動領域に偏ったデータセットに基づいて訓練されることが多い。
植生の季節性を世界規模でより正確に把握するために, 簡易な表現インフォームドサンプリング戦略を提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 10:58:44 GMT)
Paradigm shift on Coding Productivity Using GenAI [3.7] ジェネレーティブAI(GenAI)アプリケーションは、自動コード作成を可能にすることで、ソフトウェアエンジニアリングを変革している。
本稿では、通信とドメインにおけるGenAI符号化アシスタント(例えば、Codeium、Amazon Q)の採用について検討する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:00:06 GMT)
Factual Knowledge in Language Models: Robustness and Anomalies under Simple Temporal Context Variations [3.7] 本稿では,言語モデル(LM)の事実知識における時間的文脈の変化に対するロバスト性について考察する。
LMが時間的文脈と特定の期間に有効な過去の事実を正しく関連付けることができるかどうかを検討する。
LMの精度は、有効期間から不正確なコンテキストの距離と、コンテキストの粒度という2つの次元に沿って分析される。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:31:02 GMT)
Revisiting Algorithmic Audits of TikTok: Poor Reproducibility and Short-term Validity of Findings [3.7] 本稿では,TikTokレコメンデータシステムの既存のソックパペット監査の欠点と一般化可能性について検討する。
また,これらの単発検査は短期的にのみ実施されることが多かった。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:50:06 GMT)
Toward Foundation Models for Online Complex Event Detection in CPS-IoT: A Case Study [3.7] 複雑なイベント(CE)は、CPS-IoTアプリケーションにおいて重要な役割を担い、高いレベルの意思決定を可能にする。
既存のモデルでは、CE検出に必要な長期的な推論が欠如している。
本研究は,長期的推論が可能なCPS-IoT基盤モデルのケーススタディとしてCE検出について検討する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 19:51:34 GMT)
Chien-Shiung Wu as the experimental pioneer in quantum entanglement: a 2022 note [3.6] 我々は,電子-陽電子消滅により生成した絡み合った光子について,智円・清王の初期の先駆的な研究を概説する。
本稿は,2022年5月31日,チエン・ションヴの110周年記念国際シンポジウムにおいて,著者の講演の基礎となり,中国語でいくつかの記事が紹介された。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:10:59 GMT)
S3MOT: Monocular 3D Object Tracking with Selective State Space Model [3.5] 3次元空間における多物体追跡は、ロボット工学とコンピュータ応用の進歩に不可欠である。
2Dビデオストリームからの3Dアソシエーションのマイニングが難しいため、モノラルなセットアップでは依然として大きな課題である。
モノクローナル3次元MOTのための不均一なキューの融合を促進するための3つの革新的な技術を提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 04:45:35 GMT)
Preparing the Gutzwiller wave function for attractive SU(3) fermions on a quantum computer [3.3] 量子コンピュータ上での魅力的なSU(3)フェルミオン系に対するGutzwiller波動関数を実装した。
補助フィールド上で和を実行するための2つの相補的手法を開発し、修正する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:02:34 GMT)
LiDAR-Guided Monocular 3D Object Detection for Long-Range Railway Monitoring [3.1] 本稿では,自律列車に適した長距離3次元物体検出のためのディープラーニング手法を提案する。
この方法は、Faraway-Frustumアプローチにインスパイアされた単眼画像のみに依存し、トレーニング中にLiDARデータを組み込んで深度推定を改善する。
OSDaR23データセットの評価は、最大250mの物体検出におけるアプローチの有効性を示している。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:33:52 GMT)
The Road to Hybrid Quantum Programs: Characterizing the Evolution from Classical to Hybrid Quantum Software [3.1] 量子マシン上で有意義に実行できる量子候補コードフラグメントを識別する努力は、主に静的コード解析に依存している。
本稿では,古典的プログラムにおける量子候補とその適切な符号化過程を体系的に定式化することを目的とする。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 10:21:43 GMT)
Co-Change Graph Entropy: A New Process Metric for Defect Prediction [3.1] 共変化グラフエントロピー(Co-Change Graph Entropy)は、共変化をグラフとしてモデル化し、共変化散乱を定量化する新しい計量である。
ファイルレベルの欠陥分類では、変更エントロピーを共変化エントロピーに置き換えることで、AUROCは72.5%、MCCは62.5%改善する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 17:27:18 GMT)
What Happened in This Pipeline? Diffing Build Logs with CiDiff [3.1] 我々は、CiDiffと呼ばれるログ構築に適した新しいdiffアルゴリズムを導入する。
我々はCiDiffを17,906CIレグレッションの新しいデータセットに基づいていくつかのベースラインに対して評価した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:56:21 GMT)
Seeing Soundscapes: Audio-Visual Generation and Separation from Soundscapes Using Audio-Visual Separator [3.1] 音環境から画像を生成するためのAV-GAS(Audio-Visual Generation and separation model)を提案する。
まず、マルチクラスの音声入力を与えられた画像を生成することを目的として、音声視覚生成タスクに新たな課題を提案する。
第2に、混合音声入力に存在する各クラス毎に別々の画像を生成する新しい音声-視覚分離タスクを導入する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:51:04 GMT)
Enhancing Strawberry Yield Forecasting with Backcasted IoT Sensor Data and Machine Learning [3.1] 環境データ収集のため,イチゴ生産用ポリタンネルにIoTセンサを2年間展開した。
センサ観測と手動で4シーズンにわたる収量記録を組み合わせた。
実測と合成観測を組み合わせたAIを用いた収量予測モデルを構築した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:02:50 GMT)
Machine Learning and Statistical Insights into Hospital Stay Durations: The Italian EHR Case [3.0] 入院期間(LoS)は,医療の質を評価し,病院の資源管理を最適化するための重要な指標である。
本研究は、2020年から2023年までのピエモンテ地域の60以上の医療施設の入院記録のデータセットを用いて、イタリアの医療状況におけるLoSに影響を与える要因を特定することを目的としている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:44:31 GMT)
Self-Balancing, Memory Efficient, Dynamic Metric Space Data Maintenance, for Rapid Multi-Kernel Estimation [2.7] 本稿では,進化する距離空間における効率的な近傍維持を可能にする,動的自己分散オクツリーデータ構造を提案する。
我々の手法は、特に高次元空間において、精度を維持しながら指数的なスピードアップをもたらす。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 01:15:53 GMT)
Are We on the Same Page? Examining Developer Perception Alignment in Open Source Code Reviews [2.7] コードレビューは、オープンソースソフトウェア(OSS)開発において重要な側面であり、品質を確保し、コラボレーションを促進する。
本研究では,OSSコードレビュープロセスにおける認識,課題,バイアスについて考察し,コントリビュータとメンテナの視点に着目した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:03:39 GMT)
A Novel Taxonomy and Classification Scheme for Code Smell Interactions [2.7] 本研究では,新しい分類法とコード臭の相互作用の分類法を提案する。
いくつかの一般的な機械学習(ML)モデルを用いて実験が実施されている。
結果は、主にドメイン内のインタースメル検出というコード臭いの相互作用の存在を示しています。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:24:11 GMT)
Rethinking Reuse in Dependency Supply Chains: Initial Analysis of NPM packages at the End of the Chain [2.5] 本稿では,サードパーティパッケージへの依存を最小限に抑えるためのソフトウェア開発プラクティスの転換を提唱する。
これらのエンドツーエンドパッケージは、エコシステムにおいて重要な役割を担っているため、ユニークな洞察を提供する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:23:35 GMT)
Model Evaluation in the Dark: Robust Classifier Metrics with Missing Labels [2.4] 本稿では,精度,リコール,ROC-AUCなどの指標を用いて分類器の評価を行うための多重計算手法を提案する。
予測分布の位置と形状が一般的に正しいことを実証的に示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:31:42 GMT)
An Interactive Debugger for Rust Trait Errors [2.3] 本稿では,型推論をインタラクティブに視覚化するシステムArgusについて述べる。
Argusの中核となる洞察は、コンパイラ診断の従来のモデルがすべてワンサイズであると避けることである。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 21:33:43 GMT)
Assessing the Impact of External and Internal Factors on Emergency Department Overcrowding [2.3] 本研究は、ED追跡データと病院国勢調査データと、天気、フットボールイベント、連邦政府のホリデーシーズンなどの外部情報源のデータを統合する。
7つの回帰モデルが開発され、気象条件、病院の国勢調査、連邦政府の休日、異なるタイムスタンプでのフットボールの試合など、様々な予測要因の効果を評価する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 22:56:12 GMT)
Eval-PPO: Building an Efficient Threat Evaluator Using Proximal Policy Optimization [2.2] 本研究では,脅威評価問題を強化学習課題として再定義する。
Eval-PPOは、多次元敵の特徴と友好的なユニットの状態情報を体系的な訓練を通じて統合する。
ルールベースの手法と比較して、Eval-PPOは平均成功率を大幅に改善し、17.84%の上昇を示した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:47:54 GMT)
Cross-modality Force and Language Embeddings for Natural Human-Robot Communication [2.1] 本稿では,単語や力のプロファイルを統一的に埋め込むための枠組みを提案する。
言語と物理的力プロファイルは全く異なると考えられるが、これら2つは統一された潜在空間に埋め込むことができる。
この潜伏空間では、力プロファイルと単語が互いに補足し、b)個々の効果を統合し、c)交換可能な方法で置換することができる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 21:31:38 GMT)
Using Causal Inference to Test Systems with Hidden and Interacting Variables: An Evaluative Case Study [2.1] 大規模なパラメータ空間、非決定性、高い計算コストを持つソフトウェアシステムは、テストが困難である。
因果推論に基づく最近のソフトウェアテスト技術は、そのような特性を示すシステムにうまく適用されている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 13:32:24 GMT)
Boosting-Enabled Robust System Identification of Partially Observed LTI Systems Under Heavy-Tailed Noise [2.1] 部分的に観測された線形時間不変(LTI)システムのシステム同定の問題点を考察する。
一般的な重み付きノイズプロセスの下でシステムパラメータを識別するための漸近的でない保証を提供する。
提案アルゴリズムは,ガウス以下の雑音下で導出されたものとほぼ一致するような,サンプルの複雑性境界を実現する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:57:13 GMT)
Interpretable Affordance Detection on 3D Point Clouds with Probabilistic Prototypes [2.1] 本研究では,3次元点雲の空き度検出モデルにプロトタイプ学習を適用した。
3D-AffordanceNetベンチマークデータセットの実験は、プロトタイプモデルが競合性能を達成することを示す。
これにより、プロトタイプモデルが人間とロボットの相互作用シナリオの候補となる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 13:52:39 GMT)
"Two Means to an End Goal": Connecting Explainability and Contestability in the Regulation of Public Sector AI [2.0] 我々は,14の学際的AI規制専門家による半構造化インタビュー研究の結果を報告する。
我々は,説明的・規範的説明可能性,裁判的・非司法的争議チャンネル,個人的・集団的争議行動の区別を提供する。
私たちの貢献には、説明可能性と競争可能性の交差を実証的に基礎づけた概念化が含まれます。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 10:34:00 GMT)
Robustness of WDM technique for the co-propagation of quantum with classical signals in an optical fiber [1.7] We study the evolution of co-proagating quantum and classical signals which are launched using WDM。
計算によると 古典的なチャンネルから 一番近いチャンネルは 2つしかない
これは、WDM技法が古典的なデータトラフィックへの弱い量子リンクの統合において原則として堅牢であることを反映している。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:35:26 GMT)
Quantum Speed Limit and Quantum Thermodynamic Uncertainty Relation under Feedback Control [1.7] 量子力学におけるトレードオフ関係を記述する基本的な不等式は2つある。
連続行列積状態法に基づいてこれらの不等式を導出する。
我々はフィードバック制御の下で量子力学の正確な形を解析的に導出する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:44:40 GMT)
Algorithmic Fairness and Color-blind Racism: Navigating the Intersection [1.6] アルゴリズム的公正に関する多くの研究の流れがこの交差点で関心から生まれた。
人種的偏見の事例に動機づけられたものの、アルゴリズム的公正性の研究はほとんど人種差別に関する学問から切り離されている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 19:22:18 GMT)
Aligning Language Models for Icelandic Legal Text Summarization [1.5] 本研究では,アイスランドの法的な要約を生成する上で,嗜好に基づくトレーニング技術がモデルの性能を向上させるか否かを検討する。
その結果、選好訓練は、標準的な微調整よりも生成した要約の法的な精度を向上させるが、アイスランド語使用の全体的な品質を著しく向上させるものではないことが示唆された。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:55:15 GMT)
Multimodal graph representation learning for website generation based on visual sketch [1.5] Design2Codeの問題は、デジタルデザインを機能的なソースコードに変換することである。
伝統的なアプローチは、Webページの設計に固有の複雑な視覚的詳細と構造的関係を正確に解釈するのにしばしば苦労する。
本稿では,これらの課題に対処するために,マルチモーダルグラフ表現学習を活用する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 22:48:10 GMT)
NRevisit: A Cognitive Behavioral Metric for Code Understandability Assessment [1.5] 本稿では,動的コード理解可能性評価手法を提案する。
コードを扱う特定のプログラマの観点から、パーソナライズされたコード理解可能性スコアを推定する。
シンプルで低コストで非侵入型のデスクトップアイトラッカーや、標準のコンピュータカメラで簡単に実装できる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 13:34:24 GMT)
An Integrated Framework for Contextual Personalized LLM-Based Food Recommendation [1.5] この論文は、効果的な食品レクリエーションに必要な成分を特定し、分析する。
私たちは、リッチなコンテキストデータ取得のためのマルチメディアフードロギングプラットフォームと、World Food Atlasという2つの重要なイノベーションを紹介します。
Food Recommendation as Language Processingフレームワーク - フードドメイン用に特別に設計された、新しく統合されたアプローチ。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 22:20:33 GMT)
Exploring the Potential of Latent Embeddings for Sea Ice Characterization using ICESat-2 Data [1.4] 氷、雲、標高衛星-2 (ICESat-2) は海氷の高さを高精度に測定する。
近年、ICESat-2データに対する機械学習手法が開発され、主に表面型分類に焦点が当てられている。
We developed autoencoder model based on Long Short-Term Memory (LSTM) and Convolutional Neural Networks (CNN) to reconstruction topographic sequences from ICESat-2 and derive embeddeds。
その結果,オートエンコーダの埋め込みは全体の構造を保ちながら,元のICESat-2データと比較して比較的コンパクトなクラスタを生成することがわかった。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 19:42:09 GMT)
Statistical Guarantees in Synthetic Data through Conformal Adversarial Generation [1.4] 既存の生成モデルは魅力的な合成サンプルを生成するが、基礎となるデータ分布との関係に関する厳密な統計的保証は欠如している。
本稿では,共形予測手法をGAN(Generative Adrial Networks)に組み込んだ新しいフレームワークを提案する。
このアプローチは、CGAN(Conformalized GAN)と呼ばれ、従来のGANの生成能力を維持しながら、キャリブレーション特性の強化を示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 19:52:22 GMT)
A Scalable Synthesis Algorithm for Reversible Functions [1.4] 本稿では,変換に基づく可逆回路の正確な合成法を提案する。
実験により, 最先端の精密合成法に比べ, T-ゲートの量で最大99%の改善が得られた。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:53:16 GMT)
Unveiling 3D Ocean Biogeochemical Provinces: A Machine Learning Approach for Systematic Clustering and Validation [1.3] 目的は北大西洋の地域を客観的に定義することであった。
塩分濃度, 温度, 酸素, 硝酸塩, リン酸塩, ケイ酸塩の濃度を入力として測定した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:55:40 GMT)
Reimagining Assistive Walkers: An Exploration of Challenges and Preferences in Older Adults [1.3] 本研究は, 高齢者, 介護者, 医療従事者が歩行者を用いて直面している課題について考察する。
主観的アプローチとして,高齢者,介護者,医療従事者を対象にした主観的質問紙を用いた。
50%以上は、転倒検知、エルゴノミクスデザイン、騒音低減、およびユーザーニーズや嗜好を満たすための歩行ランプを取り入れることの重要性を強調した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:32:44 GMT)
A model and package for German ColBERT [1.2] 遅延対話型マルチセンスベクトル探索手法であるColBERTのドイツ語版を紹介し,RAGアプリケーションに焦点をあてる。
検索と微調整の両方をサポートするColBERTのパッケージの主機能についても紹介する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:17:53 GMT)
What is the Added Value of UDA in the VFM Era? [1.2] 教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、認識モデルの未ラベル対象領域への一般化を改善する。
UDAは、VFM(Vision Foundation Models)と合成ソースデータを用いて、実際のターゲットデータを用いた完全教師付き学習に匹敵する一般化性能を実現する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:10:10 GMT)
Toward Automated Test Generation for Dockerfiles Based on Analysis of Docker Image Layers [1.2] Dockerイメージを構築するプロセスは、Dockerfileと呼ばれるテキストファイルで定義されている。
Dockerfileは、Dockerイメージのビルド方法の指示を含む、一種のソースコードと見なすことができる。
本稿では,Dockerfileの自動テスト生成手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:02:46 GMT)
Unlocking Neural Transparency: Jacobian Maps for Explainable AI in Alzheimer's Detection [1.2] 本稿では,アルツハイマー病の診断における説明可能性と信頼性を高めるために,ヤコビアンマップ(JM)を多モードフレームワークで活用する新しいプレモデルアプローチを提案する。
我々は、JMsで訓練された3D CNNと従来の前処理データとの比較実験により、JMsを検証する。
また、3D Grad-CAM分析を用いて、視覚的および定量的な洞察を提供し、さらに解釈可能性と診断信頼性の向上を示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 18:54:01 GMT)
A Case Study Exploring the Current Landscape of Synthetic Medical Record Generation with Commercial LLMs [1.2] 合成データを生成する商用大規模言語モデルの現状を評価する。
我々の主な発見は、LLMが小さな特徴のサブセットに対して確実に合成された健康記録を生成できる一方で、データの次元が増加するにつれて、現実的な分布と相関を維持するのに苦労していることである。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 06:34:43 GMT)
Proof-of-TBI -- Fine-Tuned Vision Language Model Consortium and OpenAI-o3 Reasoning LLM-Based Medical Diagnosis Support System for Mild Traumatic Brain Injury (TBI) Prediction [1.1] 視覚言語モデルとOpenAI-o3推論大言語モデル(LLM)を統合する医療診断支援システムProof-of-TBIを提案する。
TBI MRIスキャンのラベル付きデータセットを用いて、複数の視覚言語モデルに微調整を行い、TBIの症状を効果的に診断する訓練を行った。
このシステムは,優れた推論性能を示すモデルであるOpenAI-o3推論LPMを用いて,すべての微調整された視覚言語モデルからの予測を評価する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 19:49:30 GMT)
Estimation of the second-order coherence function using quantum reservoir and ensemble methods [0.9] ゼロ時間二階相関関数 g2(0) を推定する機械学習に基づく手法を提案する。
我々は、このハイブリッド量子古典的アプローチを、様々な量子光学系にわたって評価する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:35:08 GMT)
Local Control Networks (LCNs): Optimizing Flexibility in Neural Network Data Pattern Capture [0.9] 各ノードで同じアクティベーション関数を利用するのは最適以下であり、各ノードで異なるアクティベーション関数を活用して柔軟性と適応性を向上させることを提案する。
そこで我々は,各ノードのアクティベーション曲線を識別するために,B-スプライン関数を利用するローカル制御ネットワーク(LCN)を導入する。
その結果,ノードレベルでの多様なアクティベーションにより,性能と効率が向上することが示唆された。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:19:40 GMT)
Efficiency, Expressivity, and Extensibility in a Close-to-Metal NPU Programming Interface [0.9] この作業は、NPUパフォーマンスエンジニアのためのツールキットであるIRONを使用して、デザイナの効率を向上させることを目的としている。
我々はIRONに新しい洗練されたプログラミング構造を含むプログラマインタフェースを更新する。
分析によると、コードの行数の平均が26%減少し、さまざまな設計のためのHalsteadメトリクスが減少している。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:43:50 GMT)
PerfCam: Digital Twinning for Production Lines Using 3D Gaussian Splatting and Vision Models [0.8] PerfCamは、デジタルツインニング、オブジェクトトラッキング、産業生産ラインにおけるキーパフォーマンス指標(KPI)抽出のためのフレームワークである。
PerfCamは、オブジェクト追跡と空間マッピングに対する半自動アプローチを提供する。
製薬業界における現実的なテスト生産ラインへの実践的展開を通じて,PerfCamの有効性を検証する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:29:00 GMT)
AMAD: AutoMasked Attention for Unsupervised Multivariate Time Series Anomaly Detection [0.7] AMADはUMTStextbfADシナリオに対するtextbfAutotextbfMasked Attentionを統合している。
AMADはUMTSADの課題に対して堅牢で適応可能なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:30:42 GMT)
Qubit-efficient quantum chemistry with the ADAPT variational quantum eigensolver and double unitary downfolding [0.7] 活性空間外における動的相関エネルギーの回復には, DUCC有効ハミルトニアンが有効であることを示す。
基底状態の収束は、素の活性空間ハミルトニアンと類似しており、DUCCハミルトニアンが量子プロセッサの負荷を増大させることなく精度を高めることを実証している。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 20:24:07 GMT)
Transforming Hyperspectral Images Into Chemical Maps: An End-to-End Deep Learning Approach [0.7] 本研究では、U-Netの修正版とカスタムロス関数を用いて、ハイパースペクトル画像から化学マップを直接取得するエンド・ツー・エンドのディープラーニング手法を提案する。
U-Netと従来のPSS回帰を豚腹サンプルの実際のデータセットと関連する平均脂肪基準値と比較した。
同時にU-Netは、分散の99.91%が空間的に相関している詳細な化学地図を生成する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 13:19:53 GMT)
TDAvec: Computing Vector Summaries of Persistence Diagrams for Topological Data Analysis in R and Python [0.6] 我々は永続化ダイアグラム(PD)のベクトル化を効率化する新しいソフトウェアパッケージを導入する。
PDの空間の非ヒルベルト的な性質は、機械学習アプリケーションで直接使用する上での課題を提起する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 13:07:56 GMT)
Convergence of the Stochastic Heavy Ball Method With Approximate Gradients and/or Block Updating [0.6] 我々は,より一般的な条件下でのヘビーボール (SHB) アルゴリズムの収束を確立する。
我々の解析は凸関数だけでなく、PL(Polyak-Lojasiewicz)およびKL(Kurdyka-Lojasiewicz)条件を満たすより一般的な関数も受け入れている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:03:12 GMT)
MODP: Multi Objective Directional Prompting [0.6] MODP -- Multi Objective Directional Prompting -- は、2つの主要な概念に基づいたフレームワークである。
合成データセットを用いて要約作業における提案手法の有効性を実証する。
我々は,DellのNext Best Action支援ツールのプロンプト開発にMODPを適用した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 22:20:04 GMT)
Predicting and Understanding Turn-Taking Behavior in Open-Ended Group Activities in Virtual Reality [0.5] ネットワーク型バーチャルリアリティ(VR)では、ユーザー行動、個人差、グループダイナミクスが将来の音声行動の重要なシグナルとなる。
本研究では,社会的ダイナミクスの文献から抽出した特徴を用いたターンテイク行動の予測を行う。
77セッションと1660分間の少人数のソーシャルインタラクションからなる大規模なVR教室データセットの結果について論じる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 20:57:25 GMT)
Studying Small Language Models with Susceptibilities [0.5] 本研究では,ニューラルネットワークをベイズ統計力学系として扱う解釈可能性の枠組みを開発する。
データ分散の小さな制御された摂動は、ネットワークの選択されたコンポーネントに局所化される観測可能の後方期待の1次変化を誘導する。
結果として生じる感受性は、局所的なSGLDサンプルで効率的に推定され、署名された個々のコントリビューションに分解される。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:39:32 GMT)
Magnetic field orientation dependence of continuous-wave optically detected magnetic resonance with nitrogen-vacancy ensembles [0.5] ダイヤモンド中の窒素空孔(NV)スピンによる連続波光検出磁気共鳴(CW-ODMR)測定は、近傍のターゲットから直流磁場を検出するために用いられる。
この技術は、異なるNV配向クラスによる共鳴が互いに重なり合うとき、磁場成分の抽出の曖昧さに悩まされる。
ここでは、低バイアス磁場を呈するNVアンサンブルに対するそのような効果に関する詳細な実験および理論的研究を行う。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:36:27 GMT)
Optimizing Resource Allocation in a Distributed Quantum Computing Cloud: A Game-Theoretic Approach [0.5] 本稿では,量子クラウド環境における資源利用を最大化しつつ,クライアントのコストを最小化する量子回路分割リソース割り当てゲームモデルを提案する。
我々のソリューションは、量子ノード当たりのコスト、トータルコスト、最大コスト、パーティション数、リモートゲート数の観点から、従来のものよりも優れている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 12:14:14 GMT)
Determining Molecular Ground State with Quantum Imaginary Time Evolution using Broken-Symmetry Wave Function [0.4] 本稿では,ハートリー・フォック波動関数をスピンおよび空間対称性の破壊波動関数に置き換えることを提案する。
我々は, この手法が低エネルギー固有状態に対して良好な収束挙動をもたらすことを示す。
この方法はオープンシェルシステムにおけるエネルギーシミュレーションを改善するための経路を提供する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:12:34 GMT)
Addressing the Minor-Embedding Problem in Quantum Annealing and Evaluating State-of-the-Art Algorithm Performance [0.4] D-Wave Systems 量子アニールの性能に及ぼす埋め込み品質の影響を解析する。
また,D-Wave のアルゴリズムである Minorminer が生成した埋め込みの質を評価する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 20:16:01 GMT)
Towards Adaptive Software Agents for Debugging [0.4] 本稿では,エージェントの数とその役割を動的に決定する適応型エージェント設計を提案する。
最初の評価では、適応設計では、生成されるエージェントの数はバグのあるコードの複雑さに依存することが示されている。
治療効果は, ワンショットプロンプトよりも平均11%改善した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 12:48:08 GMT)
Using customized GPT to develop prompting proficiency in architectural AI-generated images [0.4] 本研究は,AI駆動画像生成におけるアーキテクチャ学生の習熟度を高めるため,カスタマイズされたGPTモデルの利用について検討する。
ANOVAの結果は単語数,類似性,具体性において統計的に有意な改善を示し,特にAIペルソナと構造化プロンプトガイドが支持した群で有意な改善を示した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 06:54:32 GMT)
Evaluation of Distimation's Real-world Performance on a Superconducting Quantum Computer [0.4] Distimationは、ベル対角線状態の効率的な推定のために設計された新しい蒸留ベースのプロトコルである。
本研究は,実用的な量子ネットワークにおいて,スケーラブルでリアルタイムなエンタングルメントモニタリングを実現するための有効な方法として,ディモーテーションを確立した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:50:17 GMT)
Generating ensembles of spatially-coherent in-situ forecasts using flow matching [0.4] 天気予報後処理のための機械学習に基づく手法を提案する。
我々のフロー・マッチング・ポストプロセッシング(FMAP)は、観測分布の相関構造をより良く表現する。
FMAPはEUPPBenchデータセットの実験で有望なパフォーマンスを示している。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:00:15 GMT)
TSCL:Multi-party loss Balancing scheme for deep learning Image steganography based on Curriculum learning [0.4] 深層学習画像ステガノグラフィーアルゴリズムにおける多項損失のバランスをとるための2段階学習損失スケジューラ(TSCL)を提案する。
ALASKA2、VOC2012、ImageNetの3つの大規模な公開データセットの実験結果から、提案したTSCL戦略は、ステガノグラフィーの品質、デコード精度、セキュリティを改善することが示された。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 13:36:50 GMT)
A Review of 3D Object Detection with Vision-Language Models [0.3] 視覚言語モデルを用いた3次元物体検出のための最初の体系的解析を行う。
ポイントクラウドとボクセルグリッドを使った従来のアプローチは、CLIPや3D LLMのようなモダンなビジョン言語フレームワークと比較される。
私たちは、限られた3D言語データセットや計算要求など、現在の課題を強調します。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 23:27:26 GMT)
AI Ethics and Social Norms: Exploring ChatGPT's Capabilities From What to How [0.3] 本研究は、実証的な文脈におけるChatGPTが倫理や社会規範に従って機能するかどうかを評価することを目的とする。
この研究の結果は、バイアス、信頼性、セキュリティ、毒性学、社会規範、倫理データなど、AI倫理の6つの重要な側面に関する最初の洞察を提供する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 03:26:30 GMT)
A Machine Learning Approach For Bitcoin Forecasting [0.1] 我々は、どの時系列と機械学習アルゴリズムが最良の結果をもたらすかを研究する。
価格に関係のない他のBitcoin関連の機能との関連性は無視できない。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:35:44 GMT)
TLoRA: Tri-Matrix Low-Rank Adaptation of Large Language Models [0.1] TLoRAはトリマトリクスの低ランク適応法である。
我々は,TLoRAが既存の低ランク手法に匹敵する性能を発揮することを示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 23:11:10 GMT)
NUDF: Neural Unsigned Distance Fields for high resolution 3D medical image segmentation [0.1] 画像から直接NUDF(Neural Unsigned Distance Field)を学習することを提案する。
CT画像から左心房補助 (LAA) セグメンテーションの課題について検討した。
LAAの詳細を捉える3次元メッシュモデルを予測でき、CT画像のボクセル間隔の順に精度を達成できる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 13:32:16 GMT)
Tree Boosting Methods for Balanced andImbalanced Classification and their Robustness Over Time in Risk Assessment [0.1] XGBoostのようなツリーベースのメソッドは、検出性能と速度のために、いくつかのベンチマークで際立っている。
開発した手法は、トレーニングのためにより多くのデータが与えられることにより、認識性能を向上させる。
正値と負値で割った正値の比率によって決定される精度-リコールの基準線よりも、依然としてかなり優れている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:35:38 GMT)
PHEATPRUNER: Interpretable Data-centric Feature Selection for Multivariate Time Series Classification through Persistent Homology [0.1] PHeatPrunerは時系列分類における性能と解釈可能性のバランスをとる方法である。
永続ホモロジーは、適用変数の最大45%のプルーニングを促進する。
シーフ理論は、データの構造的ニュアンスに関する深い洞察を提供する説明ベクトルに寄与する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 13:14:11 GMT)
Three-Factor Learning in Spiking Neural Networks: An Overview of Methods and Trends from a Machine Learning Perspective [0.1] Spiking Neural Networks(SNN)の3要素学習ルールは、従来のヘビーン学習の重要な拡張として現れている。
これらのメカニズムは生物学的な可視性を高め、人工神経系の信用割り当てを改善する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:36:00 GMT)
Stabilizing Reasoning in Medical LLMs with Continued Pretraining and Reasoning Preference Optimization [0.1] 本稿では,日本の医療領域に最適化された72BパラメータモデルであるPreferred-MedLLM-Qwen-72Bを紹介する。
我々は、Qwen2.5-72Bベースモデルに2段階の微調整プロセスを適用し、高い精度と安定した推論を実現する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:15:31 GMT)
SafEDMD: A Koopman-based data-driven controller design framework for nonlinear dynamical systems [0.0] SafEDMDは証明書指向のEDMDベースのコントローラ設計フレームワークである。
基礎となる非線形システムの安定化を保証した半定値プログラミングに基づくコントローラ設計を確立する。
主成分として、原点で消失し、制御タスクに適した比例誤差境界を導出する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:51:40 GMT)
Validation and Calibration of Semi-Analytical Models for the Event Horizon Telescope Observations of Sagittarius A* [0.0] 生成機械学習モデルであるAlinetを用いて、放射能的に非効率な降着流画像を生成する。
我々は、恒星間散乱を含む多くの未モデル化物理効果によってもたらされる不確実性を推定する。
次に、これを物理パラメータ推定のキャリブレーションに利用し、RIAFモデルと関連する不確実性は、EHTデータをモックするのに適合する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 18:00:04 GMT)
Unraveling quantum phase estimation: exploring the impact of multi-photon interference on the quantum Fisher information [0.0] 量子干渉は情報の区別によって絶滅することが知られている。
本研究は、多光子干渉が精度測定に与える影響を定量化するために必要なすべてのツールを提供する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:37:22 GMT)
Universal quantum control over Rydberg atoms [0.0] 本稿では,複数のリドバーグ原子のグリーンベルガー・ホルン・ザイリンガー状態(GHZ)の生成に対して,誤り訂正を伴う普遍量子制御を適用した。
一般のGHZ状態の$N$Rydberg qubitsは、N-1$のステップで作成でき、環境ノイズと系統的エラーの両方に対して堅牢である。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:06:01 GMT)
Tracking Articulatory Dynamics in Speech with a Fixed-Weight BiLSTM-CNN Architecture [0.0] 本稿では,ある音声音響に係わる舌と唇の調音特徴を予測するための新しい手法を提案する。
提案するネットワークは,同時記録音声とEMA(Electromagnetic Articulography)データセットの2つのデータセットで訓練されている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:57:22 GMT)
Towards a deep learning approach for classifying treatment response in glioblastomas [0.0] グリオーマは最も攻撃的なタイプのグリオーマであり、5年生存率は6.9%である。
放射線医は、RANO(Re Response Assessment in Neuro-Oncology)基準を用いて、画像と臨床の特徴に基づいて腫瘍を4つのラベルの1つに分類する。
ディープラーニングは、分類問題に対処するために広く用いられているため、RANO基準の分類のための最初のDLパイプラインの実装を目的としている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:27:05 GMT)
Towards Optimal Differentially Private Regret Bounds in Linear MDPs [0.0] 我々は、LSVI-UCB++を民営化し、オフラインRLから分散認識解析に適応させることにより、新しい微分プライベートアルゴリズムを設計する。
我々のアルゴリズムは、$widetildeO(d sqrtH3 K + H15/4 d7/6 K1/2 / epsilon)$の後悔の限界を達成し、従来のプライベートメソッドよりも改善した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 18:40:53 GMT)
Topological defect formation in a phase transition with tunable order [0.0] キブル・ズレック機構(KZM)は、二階相転移中の系の非平衡ダイナミクスと位相欠陥の形成を記述している。
超伝導体や荷電超流動体の遷移は, ゆらぎの影響を考慮した場合, 典型的には2次に分類されるが, 弱い1次特性を示す。
このような位相遷移におけるクエンチによるトポロジ的欠陥の形成について検討し、KZMと核生成理論を組み合わせることでその密度を予測できることを示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:33:35 GMT)
Time and Frequency Domain-based Anomaly Detection in Smart Meter Data for Distribution Network Studies [0.0] 本稿では,異常がパワーデータセットに与える影響を検知・緩和する手法に焦点をあてる。
分離フォレスト機械学習アルゴリズムと高速フーリエ変換フィルタに基づく異常検出フレームワークを提案する。
異常検出手法を統合することの重要性は, スマートメータを多用した分散ネットワークにおいて重要である。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 10:26:30 GMT)
The Moral Mind(s) of Large Language Models [0.0] 大規模言語モデル (LLM) は、その決定を導く道徳的嗜好の一貫性のある構造を示す。
確率論的合理性テストを用いて、各主要プロバイダの少なくとも1つのモデルが、ほぼ安定した道徳的嗜好と整合した振る舞いを示した。
そして、これらのユーティリティ関数を推定し、ほとんどのモデルが中立的な道徳的スタンスの周りに集まっていることを発見した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:47:33 GMT)
Tensor Networks for Explainable Machine Learning in Cybersecurity [0.0] マトリックス製品状態(MPS)に基づく教師なしクラスタリングアルゴリズムを開発した。
我々の調査は、MPSがオートエンコーダやGANといった従来のディープラーニングモデルと性能的に競合していることを証明している。
提案手法は,機能的確率,フォン・ノイマン・エントロピー,相互情報の抽出を自然に促進する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:56:42 GMT)
Tensor Cross Interpolation of Purities in Quantum Many-Body Systems [0.0] 量子多体系において、自由度数のヒルベルト空間の指数的スケーリングは完全な状態特徴づけを与える。
近年, 量子波動関数の振幅をエンタングルメント関数として符号化することで, サブリージョンの純度をコンパクトに保存する方法が提案されている。
本研究では, 絡み合い特性が, 自由度数において, サンプル量だけを用いて効率的に定義できることを実証する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:53:21 GMT)
Temperature Estimation in Induction Motors using Machine Learning [0.0] モーターの内部温度をモニターし、しきい値以下に保つことは、重要な第一歩だ。
現代の電気駆動装置がシステム動作中に収集するすべてのデータから、熱的挙動を推定するためにデータ駆動型アプローチを適用することが可能である。
本稿では,誘導電動機におけるステータ巻線と軸受の温度を近似する複数の機械学習手法について検討した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 06:22:31 GMT)
Subject-independent Classification of Meditative State from the Resting State using EEG [0.0] 本研究の目的は,脳波データを用いて,ラージョガ覚醒時の意識変化状態と脳の静止状態とを対象非依存的に識別することである。
CSP-LDA-LSTMアーキテクチャは、オブジェクト内分類において98.2%の精度で最高の性能を提供する。
SVD-NNアーキテクチャは96.4%の精度でオブジェクト間の分類を行う。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:44:51 GMT)
Speeding up Quantum Annealing with Engineered Dephasing [0.0] 提案手法により, 制御量子力学の断熱性を高めることができることを示す。
本稿では,プロトコルの実験的実現可能性について論じ,忠実性と実装性の間のトレードオフについて考察する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:01:31 GMT)
Spatial Reasoner: A 3D Inference Pipeline for XR Applications [0.0] 本稿では,記号的述語と関係性で幾何学的事実をブリッジする空間的推論フレームワークを提案する。
その基礎は、空間的述語集合によって強化された、向き付けられた3D境界ボックス表現に依存している。
導出した述語は空間知識グラフを形成し、パイプラインベースの推論モデルと組み合わせることで、空間クエリと動的ルール評価を可能にする。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:27:27 GMT)
SoK: Timeline based event reconstruction for digital forensics: Terminology, methodology, and current challenges [0.0] イベント再構成は、デジタルアーティファクトを分析して過去の活動を推測するために、検査者が利用できるテクニックである。
その重要性にもかかわらず、この分野は断片的な研究に悩まされており、しばしばタイムラインの作成や改ざん検出といった側面に焦点を絞っている。
本稿では,従来の法科学モデルに適応した時系列に基づくイベント再構成のための包括的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:33:35 GMT)
Self-Healing Software Systems: Lessons from Nature, Powered by AI [0.0] 本稿では,生物の癒しからインスピレーションを得て,人工知能による自己修復ソフトウェアの概念を探求する。
ログ分析、静的コード検査、AIによるパッチやテストアップデートの生成を組み合わせることで、ダウンタイムを削減し、ソフトウェアのレジリエンスを高めることを目指している。
この研究は、生物に似た継続的治癒が可能なインテリジェントで適応的で自己回復的なソフトウェアシステムへの道を開いた。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 22:54:57 GMT)
Local Statistical Parity for the Estimation of Fair Decision Trees [0.0] 本研究では,公平性を促進するために,ツリーノードに局所的なフェアネス基準を提案する。
本稿では,アルゴリズムフェアネス文学で人気のある統計的パリティ基準との関連性を示す。
制約付きロジスティック回帰木(C-LRT)と呼ばれる木の推定アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:15:55 GMT)
LightDSA: A Python-Based Hybrid Digital Signature Library and Performance Analysis of RSA, DSA, ECDSA and EdDSA in Variable Configurations, Elliptic Curve Forms and Curves [0.0] RSA, DSA, ECDSA, EdDSAをサポートするハイブリッドデジタル署名ライブラリLightDSAを紹介する。
我々は、これらのアルゴリズムの計算効率を様々な構成で分析し、鍵生成、署名、検証時間を比較する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:07:47 GMT)
Lecture Notes on Normalizing Flows for Lattice Quantum Field Theories [0.0] 注記は格子場の理論、フローの正規化、および後者が前者の研究にどのように適用できるかを簡潔に説明することを目的としている。
このノートは、近年の様々な研究校で最初の著者が行った講義に基づいている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:22:11 GMT)
Learning to fuse: dynamic integration of multi-source data for accurate battery lifespan prediction [0.0] 本研究では,バッテリ寿命予測のためのハイブリッド学習フレームワークを提案する。
動的マルチソースデータ融合と積み重ねアンサンブル(SE)モデリングアプローチを統合する。
平均絶対誤差(MAE)は0.0058、根平均二乗誤差(RMSE)は0.0092、決定係数(R2)は0.9839である。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 10:24:45 GMT)
Learning by gaming, coding and making with EDUMING: A new approach to utilising atypical digital games for learning [0.0] 本稿では、EDUMINGの概念を用いて、デジタル学習ゲームの開発を簡単にするための新しい方法を提案する。
ゲームベースの学習のような概念と確立された概念の主な違いは、ゲームが閉じられず、受動的に消費されることである。
この研究は、コンセプトの実践的なテストに対する最初の経験的アプローチとして意図されている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:11:06 GMT)
LLMpatronous: Harnessing the Power of LLMs For Vulnerability Detection [0.0] 脆弱性検出のための大規模言語モデル(LLM)には、ユニークな課題がある。
脆弱性検出に機械学習モデルを使用した以前の試みは、効果がないことが証明されている。
我々は、これらの制限を緩和することに焦点を当てた、堅牢なAI駆動アプローチを提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:30:40 GMT)
Incoherent population trapping in quantum emitters [0.0] 中心的な仮定は、放射放出確率が内部量子効率に比例するということである。
我々は、この仮定を反証する量子エミッタにおける崩壊ダイナミクスのモデルを導入する。
基礎となる物理は、準安定状態における人口の非コヒーレントなトラップによって支配されていることを示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:04:25 GMT)
Incentivized Symbiosis: A Paradigm for Human-Agent Coevolution [0.0] 進化ゲーム理論は、協力を成功させるための構造とインセンティブを理解するためのレンズを提供する。
ヒューマンエージェントチーム、契約理論、Web3のような分散フレームワークの収束は、協力を促進する基盤を提供する。
私たちは、Incentivized Symbiosisを、Web3の原則にインスパイアされ、ブロックチェーン技術にエンコードされた、人間とAIの間のソーシャルコントラクトとして概念化しています。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 18:38:37 GMT)
Impossibility of Quantum Private Queries [0.0] シンメトリ・プライベート情報検索(Symmetric private information retrieve)は、ユーザがデータベースに問い合わせて、アクセスしたデータベースの所有者に知らせることなく、正確に1つのエントリを取得できるようにする暗号化タスクである。
我々は,ユーザに対して安全であるプロトコルが,データベースの所有者に対して非自明なセキュリティ保証を持つことができないことを示すため,不正に敏感な対称なプライベート情報検索プロトコルに対して明示的な攻撃を行う。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:52:59 GMT)
Fast approximative estimation of conditional Shapley values when using a linear regression model or a polynomial regression model [0.0] 線形回帰モデルを用いて得られた条件付きシェープ値に対する新しい近似推定法を開発した。
シャープパッケージのシーケンシャルメソッドと比較して,本手法は数分で動作し,数時間で動作しない。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:29:18 GMT)
Exploring Quantum Contextuality with the Quantum Moebius-Escher-Penrose hypergraph [0.0] 本稿では、モエビウス・エッシャー・ペンローズハイパーグラフを、モエビウス・ストリップやペンローズの不可能な物体のようなパラドックス構造からインスピレーションを得たものである。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:03:44 GMT)
Explicit neural network classifiers for non-separable data [0.0] 我々は、トランケーションマップの観点から、フィードフォワードニューラルネットワークの大規模なクラスを特徴づける。
アプリケーションとして、ReLUニューラルネットワークが同心データを分離する特徴マップをどのように実装できるかを示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 21:46:54 GMT)
Entanglement Harvesting from Quantum Field: Insights via the Partner Formula [0.0] 二つのガウス状態に対するシモンの絡み合いの基準は、通勤者の観点から再構成可能であることを示す。
検出モードのプロファイル表現を用いて,特定の条件下での収穫が禁止されていることを確認した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:32:41 GMT)
Enhancing Visual Interpretability and Explainability in Functional Survival Trees and Forests [0.0] 本研究では,FST(Functional Survival Tree)とFRSF(Functional Random Survival Forest)の2つの主要な生存モデルについて検討する。
FSTモデルの解釈可能性を高め、FRSFアンサンブルの説明可能性を向上させるための新しい手法とツールを導入している。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 17:11:10 GMT)
Efficient witnessing and testing of magic in mixed quantum states [0.0] 非安定化性(nonstabilizerness)またはマジック(Magic)は、量子コンピュータにとって重要なリソースである。
我々は、安定化器R'enyiエントロピーに基づくマジックの効率的な目撃者を提供する。
雑音の多いランダム量子回路の魔法を実験的に検証する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 05:56:09 GMT)
Efficient fine-tuning of 37-level GraphCast with the Canadian global deterministic analysis [0.0] この研究は、グラフCastデータ駆動予測モデルを効率的に微調整し、別の分析システムをシミュレートするプロセスを記述する。
結果として得られたモデルは、未修正のGraphCastと運用予測の両方を著しく上回る。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 13:46:36 GMT)
Efficient Truncations of SU($N_c$) Lattice Gauge Theory for Quantum Simulation [0.0] 格子ゲージ理論は、量子色力学の非摂動力学を研究する可能性を与える。
ナイーブ分析は 膨大な計算資源を必要とすることを示唆している
これらのハミルトニアンによって生成される時間進化の量子シミュレーションに必要な計算資源は、以前のアプローチよりも17-19桁小さいことが示されている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 16:51:25 GMT)
Edge-Based Learning for Improved Classification Under Adversarial Noise [0.0] アドリアルノイズは画像に小さな摂動をもたらし、深層学習モデルを誤分類に導く。
本研究では,画像特徴のトレーニングが頑健性を向上させるかどうかを検討した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 04:04:59 GMT)
Do Large Language Models know who did what to whom? [0.0] 大きな言語モデル(LLM)は、言語を理解していないとして一般的に批判されている。
ここでは、言語に強く結びついているある種の理解について研究する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 20:06:45 GMT)
Deep Reinforcement Learning Based Navigation with Macro Actions and Topological Maps [0.0] 本稿では,広角で視覚的に複雑な環境でのナビゲーションの課題に対処する。
本稿では,トポロジカルマップ上に構築されたオブジェクト指向マクロアクションを用いて,簡単なQ-Networkで効果的なナビゲーションポリシーを学習する手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 12:19:35 GMT)
Deep Learning vs. Black-Scholes: Option Pricing Performance on Brazilian Petrobras Stocks [0.0] 本稿では,ペトロブラス上での欧州オプションの価格設定におけるディープ残差ネットワークの利用について検討する。
性能はBlack-Scholes(BS)モデルと比較する。
長期間にわたって精度を低下させる傾向にあるブラック・スコールズ解とは異なり、深層学習モデルは、長期間にわたって正確に実行された。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 18:33:29 GMT)
Data-Driven Calibration of Prediction Sets in Large Vision-Language Models Based on Inductive Conformal Prediction [0.0] 動的しきい値キャリブレーションとクロスモーダル整合性検証を統合したモデル非依存不確実性定量化法を提案する。
このフレームワークは、様々なキャリブレーションとテストの分割比で安定したパフォーマンスを実現し、医療、自律システム、その他の安全に敏感な領域における現実的な展開の堅牢性を強調している。
この研究は、マルチモーダルAIシステムにおける理論的信頼性と実用性の間のギャップを埋め、幻覚検出と不確実性を考慮した意思決定のためのスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:34:59 GMT)
Comparative Study on the Discourse Meaning of Chinese and English Media in the Paris Olympics Based on LDA Topic Modeling Technology and LLM Prompt Engineering [0.0] 一般的なトピックとしては、オープニング・セレモニー、アスリートのパフォーマンス、スポンサーシップブランドなどがある。
中国のメディアは、特定のスポーツ、スポーツ精神、ドーピング論争、そして新しい技術に焦点を当てている。
イギリスのメディアは女性アスリート、メダル獲得、および資格問題に焦点を当てている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 06:23:55 GMT)
Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition [0.0] 本稿では,自動音声認識(ASR)のための2段階アクティブラーニング(AL)パイプラインを提案する。
第1段階では、ラベルなし音声データから多様なサンプル選択を行うために、xベクトルクラスタリングを用いて教師なしALを利用する。
第2段階には、ASR用に特別に開発されたバッチALメソッドを備えた、教師付きAL戦略が組み込まれている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 06:24:10 GMT)
Can We Govern the Agent-to-Agent Economy? [0.0] AIガバナンスに対する現在のアプローチは、AIエージェントが重要なタスクを管理する未来を予測できないことが多い。
我々は、将来の分散化エージェント経済を期待して、研究開発活動に情報を提供するために、業界における新たな概念を強調します。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 17:21:28 GMT)
Boosting KNNClassifier Performance with Opposition-Based Data Transformation [0.0] 従来の分類アルゴリズムの性能を高めるために,OBL(Opposition-Based Learning)に基づく新しいデータ変換フレームワークを提案する。
ここでは、OBLを利用して、トレーニングデータを強化し、決定境界形成を改善する合成反対サンプルを生成する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:27:58 GMT)
Bipartite Fluctuations and Charge Fractionalization in Quantum Wires [0.0] 弾道的量子ワイヤにおける分数電荷を測定するための量子情報手法を提案する。
このことは、系の同じ電子に付随する2つの反伝播分数電荷の絡み合いの性質を明らかにしている。
両分極電流のゆらぎが量子相転移の発見にどのように役立つかを示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 06:29:30 GMT)
Bandit on the Hunt: Dynamic Crawling for Cyber Threat Intelligence [0.0] 公開情報には、将来の攻撃を防ぐために使用される貴重なサイバー脅威情報(CTI)が含まれている。
現在の研究は、既知の情報源から妥協の指標を抽出することに焦点を当てている。
本稿では,マルチアームバンディット(MAB)と各種クローリング戦略を用いたCTI型クローラを提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:19:56 GMT)
Backaction suppression in levitated optomechanics using reflective boundaries [0.0] 定常波トラップで浮遊する微小ナノ球に作用するレーザ誘起逆作用によるノイズは、適切な反射境界を利用することで著しく低減できることを示す。
球面ミラーの中心に閉じ込められた双極子粒子に作用する光力ゆらぎを解析し,レーザー再コイルの効果を直接検討した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:25:04 GMT)
Average Spread Complexity and the Higher-Order Level Spacing [0.0] 大規模システムの汎用2レベルサブシステムの拡散複雑性について検討する。
我々はカオスと積分可能なシステムを比較し、量子カオスの普遍的な診断として複雑性を使用する際の制限を強調した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 07:46:28 GMT)
Automatic Design of Semantic Similarity Ensembles Using Grammatical Evolution [0.0] 本稿では,意味的類似性アンサンブルを構築するための文法的進化に基づく自動戦略を提案する。
標準ベンチマークデータセットの実験では、提案手法が既存のアンサンブル手法よりも精度が高いことが示されている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 10:11:25 GMT)
Automated Work Records for Precision Agriculture Management: A Low-Cost GNSS IoT Solution for Paddy Fields in Central Japan [0.0] 従来の農業機械を低コストのIoT(Internet of Things)デバイスで再現し,データ収集の自動化を実証するため,中部日本のフィールドスタディを行った。
このデータを得るために、業界標準のLTE-GNSSBluetoothゲートウェイをWR実装に装着し、低コストのBLEビーコンをWR Low Energyに装着した。
設置後, SPVは421, MVPは1,120を含む7ヶ月のフィールド準備および植林期間1,623WRが自動的に得られた。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 10:12:52 GMT)
Atoms in hollow-core fibers: A QED approach [0.0] 中空コア光ファイバにおける光-物質相互作用の機械的効果について概説する。
量子化された電磁放射から始めると、分散、モード関数、損失がどのように開量子系を定義するかを示す。
空間依存型真空力の予測にLangevin方程式を用いる方法を示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 17:27:27 GMT)
Artificial Intelligence health advice accuracy varies across languages and contexts [0.0] 21言語から6つの主要な大規模言語モデルをベンチマークします。
英語中心の教科書の主張に高い精度があるにもかかわらず、性能はヨーロッパ以外の複数の言語で低下している。
我々は、グローバルヘルスコミュニケーションにAIをデプロイする前に、包括的な多言語、ドメイン認識検証の緊急性を強調します。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 12:37:15 GMT)
Application of linear regression and quasi-Newton methods to the deep reinforcement learning in continuous action cases [0.0] LeineらによりLast Squares Deep Q Network (LS-DQN)法が提案された。
本稿では,この制限に対応するために,Double Least Squares Deep Deterministic Policy Gradient (DLS-DDPG)法を提案する。
MuJoCo 環境で行った数値実験により,提案手法は少なくともいくつかのタスクにおいて性能を向上した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 14:36:54 GMT)
Adversarial Attacks on LLM-as-a-Judge Systems: Insights from Prompt Injections [0.0] 本稿では,コンテンツ作者攻撃とシステムプロンプト攻撃を分離するフレームワークを提案する。
Gemma 3.27B Gemma 3.4B Llama 3.2 3B GPT 4 と Claude 3 Opus の4つのモデルについて,条件毎の50プロンプトを用いて,様々な防御を施した5つのモデルを評価した。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 13:18:42 GMT)
Advancing Superconducting Qubits: CMOS-Compatible Processing and Room Temperature Characterization for Scalable Quantum Computing beyond 2D Architectures [0.0] CMOSパイロットラインを用いた業界グレードのCMOS互換量子ビット製造手法について報告する。
我々の研究結果は、スケーラブルな量子コンピューティングのための超伝導量子ビットのCMOS互換産業スタイルの創出の大きな可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:38:56 GMT)
Adapting Probabilistic Risk Assessment for AI [0.0] 汎用人工知能(AI)システムは、緊急リスク管理の課題を示す。
現在の手法は、しばしば選択的なテストとリスク優先順位に関する未文書の仮定に依存します。
本稿では,AIフレームワークの確率的リスクアセスメント(PRA)を紹介する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 17:59:14 GMT)
Acoustic phonons, spin-phonon coupling and spin relaxation via the lattice reorientation mechanism in hexagonal germanium nanowires [0.0] 我々はヘキサゴナル(2H)ゲルマニウムのスピン緩和について研究した。
この結果は、長い量子ビット緩和時間を持つナノワイヤ量子ドット実験の設計を促進する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:29:28 GMT)
A geometrical description of non-Hermitian dynamics: speed limits in finite rank density operators [0.0] 量子系の非エルミート力学は状態密度作用素のランクを保存する。
我々は相互に一貫性のある方向と不整合な方向を識別し、それらの物理的解釈を提供する。
この理解により、所定の軌道に沿った非エルミート運転の成功率を最適化することができる。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 10:04:38 GMT)
A comprehensive review of classifier probability calibration metrics [0.0] AIとMLモデルが生成する確率や信頼度は、その真の正確さを反映しないことが多い。
確率キャリブレーション測度は、信頼性と精度の差を測定する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 11:44:44 GMT)
A Trade-Off Between Path Entanglement and Quantum Sensitivity [0.0] 絡み合いはしばしば量子測定スキームの感度を高める。
単一モード位相シフトの測定におけるエンタングルメントエントロピーと感度の逆関係を証明した。
経路間の絡み合いを最小化することは、ゼロ平均ガウス状態入力を持つN$モード系の位相感度を最大化することを示す。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 02:23:30 GMT)
A Gradient-Optimized TSK Fuzzy Framework for Explainable Phishing Detection [0.0] 既存のフィッシング検出手法は高い精度と説明可能性の両立に苦慮している。
勾配に基づく手法により最適化された1次高木・スゲノ・カンファジィ推論モデルに基づく新しいフィッシングURL検出システムを提案する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 18:31:05 GMT)
A Generative Graph Contrastive Learning Model with Global Signal [0.0] 高精度グラフ学習のためのコントラスト信号生成フレームワーク(CSG2L)
本研究では,CSG2L (Contrastive Signal Generative Framework for Accurate Graph Learning) を提案する。
ベンチマークデータセットの実験では、提案されたCSG2Lが最先端のベースラインを上回っていることが示された。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 08:00:38 GMT)
A Dual Perspective of Reinforcement Learning for Imposing Policy Constraints [0.0] 我々は、価値ベースおよびアクター批判的強化学習法において、汎用的な原始双対フレームワークを使用する。
得られた二重定式化は、学習されたポリシーにさらなる制約を与えるのに特に有用であることが判明した。
トレーニングを通じて自動的に処理されるポリシー制約の様々な組み合わせをサポートする実用的なアルゴリズムが導出される。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 15:20:59 GMT)
A Data-Centric Approach to 3D Semantic Segmentation of Railway Scenes [0.0] 本稿では,鉄道固有のOSDaR23データセットのセグメンテーション性能を改善するために,2つのターゲットデータ拡張手法を提案する。
パーソン・インスタンス・ペースト法は、データセットに現実的なバリエーションを注入することにより、遠距離の歩行者のセグメンテーションを強化する。
トラックスペーシフィケーション法は、LiDARスキャンの点密度を再分配し、距離の近距離精度に最小限の影響を与えることなく、遠距離でのトラックセグメンテーションを改善する。
論文参考訳(メタデータ) (Fri, 25 Apr 2025 09:46:31 GMT)