NTIRE 2025 Challenge on Real-World Face Restoration: Methods and Results [132.7] 本論では,NTIRE 2025による顔修復の課題について概説する。
この課題は、アイデンティティの一貫性を維持しながら、自然な、現実的なアウトプットを生成することに焦点を当てている。
課題の軌跡は、加重画像品質評価(IQA)スコアを用いて性能を評価し、AdaFaceモデルをアイデンティティチェッカーとして利用する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 13:00:24 GMT)
ParaPO: Aligning Language Models to Reduce Verbatim Reproduction of Pre-training Data [95.7] 言語モデル(LM)は、非敵対的な設定であっても、単語のセグメントを記憶し、再生することができる。
ParaPO(Paraphrase Preference Optimization)は、意図しない逆流を減らすためにLMを微調整するポストトレーニング手法である。
そこで我々は,システムプロンプトを用いて再生行動を制御するParaPOの変種を開発した。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 01:59:46 GMT)
Towards Model Resistant to Transferable Adversarial Examples via Trigger Activation [95.4] 知覚不能な摂動によって特徴づけられる敵対的な例は、彼らの予測を誤解させることで、ディープニューラルネットワークに重大な脅威をもたらす。
本稿では,移動可能な敵例(TAE)に対して,より効率的かつ効果的に堅牢性を高めることを目的とした,新たなトレーニングパラダイムを提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 09:07:10 GMT)
FedEGG: Federated Learning with Explicit Global Guidance [90.0] フェデレートラーニング(FL)は、そのプライバシー保護の性質から、多様なアプリケーションにとって大きな可能性を秘めている。
既存の手法は、最適化ベースのクライアント制約、適応的なクライアント選択、事前訓練されたモデルや合成データの使用によってこれらの課題に対処するのに役立つ。
我々はbftextFedEGGを提案する。bftextFedEGGは、よく定義された、容易に収束できる学習タスクを用いて、グローバルガイドタスクを構築する新しいFLアルゴリズムである。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 06:29:48 GMT)
Back on Track: Bundle Adjustment for Dynamic Scene Reconstruction [78.3] 従来のSLAMシステムは、カジュアルなビデオでよく見られる非常にダイナミックなシーンと格闘する。
この研究は3Dポイントトラッカーを利用して、カメラによる動的物体の動きからカメラによる動きを分離する。
私たちのフレームワークは、従来のSLAM -- バンドル調整 -- の中核を、堅牢な学習ベースの3Dトラッカーフロントエンドと組み合わせています。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 07:29:42 GMT)
How to Enable Effective Cooperation Between Humans and NLP Models: A Survey of Principles, Formalizations, and Beyond [73.6] 我々は、その原則、形式化、オープンな課題を探求し、人間-モデル協力の徹底的なレビューを行う。
既存のアプローチを要約する統一的な視点を提供する新しい分類法を導入する。
また、潜在的なフロンティア領域とその対応課題についても論じる。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 02:18:50 GMT)
An Efficient and Mixed Heterogeneous Model for Image Restoration [71.9] 現在の主流のアプローチは、CNN、Transformers、Mambasの3つのアーキテクチャパラダイムに基づいている。
混合構造融合に基づく効率的で汎用的なIRモデルであるRestorMixerを提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 03:38:56 GMT)
Grounding-MD: Grounded Video-language Pre-training for Open-World Moment Detection [67.7] Grounding-MDは、オープンワールドのモーメント検出に適した、革新的なビデオ言語事前学習フレームワークである。
我々のフレームワークは、構造化されたプロンプト機構を通じて、任意の数のオープンな自然言語クエリを組み込む。
Grounding-MDは特異なセマンティック表現学習能力を示し、多種多様な複雑なクエリ条件を効果的に処理する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 09:54:25 GMT)
Data Selection for ERMs [67.6] 我々は、$mathcalA$が、少なくとも$nll N$のデータポイントで訓練された時に、いかにうまく機能するかを研究する。
結果は,平均推定,線形分類,線形回帰に対する最適データ選択境界を含む。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 11:26:01 GMT)
Seurat: From Moving Points to Depth [66.7] 本研究では,2次元軌跡の空間的関係と時間的変化を調べ,相対的な深度を推定する手法を提案する。
提案手法は,様々な領域にわたる時間的スムーズかつ高精度な深度予測を実現する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 17:37:02 GMT)
Generative Multimodal Pretraining with Discrete Diffusion Timestep Tokens [66.0] MLLM(Multimodal Large Language Models)は、視覚的理解と生成を統一することを目的としている。
既存のアプローチは空間的トークンに依存しており、画像パッチは空間的順序に応じてエンコードされ配置される。
本稿では,個別の視覚トークンを学習するために拡散時間ステップを再構成し,適切な視覚言語を構築する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 16:14:28 GMT)
Trans-Zero: Self-Play Incentivizes Large Language Models for Multilingual Translation Without Parallel Data [64.4] 言語モデル(LLM)の単言語データと本質的な多言語知識のみを活用するセルフプレイフレームワークを提案する。
実験により、このアプローチは大規模並列データに基づいて訓練されたモデルの性能と一致するだけでなく、非英語翻訳の方向でも優れていることが示された。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 16:20:30 GMT)
NoWag: A Unified Framework for Shape Preserving Compression of Large Language Models [63.3] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な性能を示す。
LLMは膨大な計算量とメモリ需要に悩まされており、リソース制約のある環境への展開を制限している。
Normalized Weight and Activation Guided Compression (Normalized Weight and Activation Guided Compression) をゼロショット形状保存圧縮アルゴリズムの統一フレームワークとして提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 11:00:29 GMT)
HYDRA: Hypergradient Data Relevance Analysis for Interpreting Deep Neural Networks [63.0] 本稿では、深層ニューラルネットワーク(DNN)による予測をトレーニングデータの効果として解釈する高次データ関連分析(HYDRA)を提案する。
HYDRAは、トレーニング軌跡全体を通して、テストデータポイントに対するトレーニングデータの貢献を評価する。
さらに,HyDRAは,データのコントリビューションを正確に推定し,ノイズのあるデータラベルを検出することで,影響関数よりも優れていることを定量的に示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 13:29:13 GMT)
TrustLoRA: Low-Rank Adaptation for Failure Detection under Out-of-distribution Data [62.2] 本稿では,共変量および意味的シフトの両条件下での拒絶による分類を統一し,促進する,単純な故障検出フレームワークを提案する。
キーとなる洞察は、障害固有の信頼性知識を低ランクアダプタで分離し、統合することにより、障害検出能力を効果的かつ柔軟に向上できるということです。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 09:20:55 GMT)
Reasoning-Enhanced Healthcare Predictions with Knowledge Graph Community Retrieval [61.7] KAREは、知識グラフ(KG)コミュニティレベルの検索と大規模言語モデル(LLM)推論を統合する新しいフレームワークである。
MIMIC-IIIでは最大10.8~15.0%、MIMIC-IVでは12.6~12.7%である。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 05:49:38 GMT)
BookWorld: From Novels to Interactive Agent Societies for Creative Story Generation [60.5] BookWorldは、書籍ベースのマルチエージェント社会の構築とシミュレーションを行うシステムである。
BookWorldはストーリー生成、インタラクティブゲーム、ソーシャルシミュレーションを含む多様なアプリケーションを可能にする。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 08:56:27 GMT)
StreetCrafter: Street View Synthesis with Controllable Video Diffusion Models [59.6] 我々は,LDARポイントクラウドレンダリングをピクセルレベルの条件として利用する,制御可能なビデオ拡散モデルであるStreetCrafterを紹介する。
さらに、画素レベルのLiDAR条件を利用することで、ターゲットシーンに対して正確なピクセルレベルの編集を行うことができる。
我々のモデルは視点変化を柔軟に制御し、レンダリング領域を満たすためのビューを拡大する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 13:47:21 GMT)
Semi-parametric Memory Consolidation: Towards Brain-like Deep Continual Learning [59.4] 本稿では,半パラメトリックメモリと覚醒・睡眠統合機構を統合したバイオミメティック連続学習フレームワークを提案する。
提案手法は,実世界の挑戦的連続学習シナリオにおいて,先行知識を維持しつつ,新しいタスクにおけるディープニューラルネットワークの高性能維持を可能にする。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 19:53:13 GMT)
Exploring Temporally-Aware Features for Point Tracking [58.6] Chronoは、時間的認識を組み込んだポイントトラッキング用に特別に設計された機能バックボーンである。
Chronoは、TAP-Vid-DAVISとTAP-Vid-Kineticsデータセットの洗練されたフリー設定で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 14:33:55 GMT)
Pairwise or Pointwise? Evaluating Feedback Protocols for Bias in LLM-Based Evaluation [57.4] フィードバックプロトコルの選択が評価信頼性に大きく影響し,系統的バイアスを生じさせることを示す。
特に、ペアワイズ評価プロトコルは、不注意な評価に対してより脆弱であることを示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 19:05:59 GMT)
VACT: A Video Automatic Causal Testing System and a Benchmark [55.5] VACTは、現実世界のシナリオにおけるVGMの因果的理解をモデル化、評価、測定するための**自動**フレームワークである。
マルチレベル因果評価指標を導入し、VGMの因果性能を詳細に分析する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 02:24:18 GMT)
How Do Large Language Models Understand Graph Patterns? A Benchmark for Graph Pattern Comprehension [53.6] この研究は、グラフパターンタスクにおける大規模言語モデルの能力を評価するためのベンチマークを導入する。
我々は,LLMが用語的記述と位相的記述の両方に基づいて,グラフパターンを理解できるかどうかを評価するベンチマークを開発した。
私たちのベンチマークでは、合成データセットと実際のデータセットの両方と、11のタスクと7のモデルで構成されています。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 21:31:45 GMT)
On Tractable $Φ$-Equilibria in Non-Concave Games [53.2] 非コンケーブゲームにおいて、抽出可能な$Phi$-equilibriaについて検討する。
Phi$が有限であるとき、対応する$Phi$-equilibriaに収束する効率的な非結合学習アルゴリズムが存在することを示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 01:01:36 GMT)
CHARMS: A Cognitive Hierarchical Agent for Reasoning and Motion Stylization in Autonomous Driving [45.0] 本稿では,共振・運動スティル化のための認知階層的エージェント(CHARMS)を提案する。
我々は、強化学習による人間ドライバーの意思決定をモデル化し、微調整を指導する。
得られたモデルは様々な振る舞いを示し、シミュレーションにおいて周囲の車両の知性とリアリズムを改善する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 13:17:56 GMT)
MAR-3D: Progressive Masked Auto-regressor for High-Resolution 3D Generation [44.9] ピラミッド変分オートエンコーダとカスケードマスク自動回帰変換器を統合したMAR-3Dを提案する。
我々のアーキテクチャは、トレーニング中にランダムマスキングを採用し、推論中にランダムな順序で自動回帰化を行い、自然に3D潜在トークンの無秩序な性質を調節する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 08:36:32 GMT)
BenchMAX: A Comprehensive Multilingual Evaluation Suite for Large Language Models [44.8] マルチウェイ多言語評価ベンチマークであるBenchMAXを紹介する。
高品質を維持するために、3つの異なるネイティブなアノテータがそれぞれのサンプルに独立してアノテートする。
BenchMAXの大規模な実験は、言語間のコア機能のさまざまな効果を明らかにしている。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 12:19:46 GMT)
Frequency-domain Learning with Kernel Prior for Blind Image Deblurring [43.9] 我々は、カーネルが画像コンテキストに依存しないため、カーネルを深層学習手法に導入する。
カーネルの事前情報を効果的に融合するために,従来のデブロアリングアルゴリズムにインスパイアされた合理的な実装手法を採用する。
実験の結果,本手法は複数のブラインド画像の劣化タスクにおいて,最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 16:00:38 GMT)
ZJUKLAB at SemEval-2025 Task 4: Unlearning via Model Merging [43.5] 本稿では,ZJUKLABチームによるSemEval-2025 Task 4: Unlearning Sensitive Content from Large Language Modelsを提案する。
本課題は,大規模言語モデルからセンシティブな知識を選択的に消去することを目的としている。
本稿では,2つの専門モデルとよりバランスのとれた未学習モデルを組み合わせることによって,モデルマージを活用するアンラーニングシステムを提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 00:37:24 GMT)
Neural Encoding and Decoding at Scale [42.3] NEDS(Neural and Decoding at Scale)を実現するマルチモーダルマルチタスクモデルを提案する。
私たちのアプローチの中心は、神経、行動、内部モダリティ、および相互モダリティマスキングを交互に交互に行う、新しいマルチタスクマスキング戦略です。
NEDSは、複数動物データに基づいて事前訓練された後、新しい動物に微調整された際に、符号化と復号の両方の最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 20:44:18 GMT)
Causal Disentanglement for Robust Long-tail Medical Image Generation [40.6] そこで本研究では,病的特徴と構造的特徴を独立に生成する新しい医用画像生成フレームワークを提案する。
本稿では,病理所見から導かれる拡散モデルを用いて病理像をモデル化し,種々の対物画像の生成を可能にする。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 01:54:18 GMT)
Deliberate Planning of 3D Bin Packing on Packing Configuration Trees [40.5] オンライン3D Bin Packing Problem (3D-BPP) は産業自動化に広く応用されている。
我々は,新しい階層表現,パッキング構成木(PCT)の学習を通じて,オンライン3D-BPPの実用性を高めることを提案する。
PCTは、ディープ強化学習(DRL)に基づくパッキングポリシー学習を支援するビンパッキングの状況と行動空間について、本格的な記述である。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 15:29:49 GMT)
DARE the Extreme: Revisiting Delta-Parameter Pruning For Fine-Tuned Models [39.4] DAREx-qは,高い刈取速度で性能を著しく向上させる再スケーリング係数の修正である。
我々は、DAREx-qが、LoRAのようなバニラパラメータ効率の良い微調整技術とシームレスに結合できることを実証した。
我々はDPPにおける重要度に基づくプルーニング手法の適用を再検討し、デルタパラメータが大きい場合のランダムな手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 20:53:39 GMT)
AI-Slop to AI-Polish? Aligning Language Models through Edit-Based Writing Rewards and Test-time Computation [39.0] 品質評価を書くことは、基本的に主観的で専門知識を必要とすることもあって、コミュニティから注目されるものが少なくなっている。
まず、5つの書評データセットを4,729の書評判断に集約することで、書評品質ベンチマーク(WQ)を導入する。
実験の結果、WQのランダムなベースラインよりも、推論タスクに優れる最先端のLLMを含む、競争力のあるベースラインの大半が、WQのランダムなベースラインよりも優れていることがわかった。
そして、4つのアウト・オブ・ディストリビューション・テストセットと74%の精度で強力な一般化を示す書字品質評価のための様々なサイズの書字品質リワード・モデル(WQRM)を訓練する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 02:42:05 GMT)
MP-Mat: A 3D-and-Instance-Aware Human Matting and Editing Framework with Multiplane Representation [38.7] MP-Matは、多面体表現を備えた新しい3D・インスタント・アウェア・マッティングフレームワークである。
既存のマット方式で探索された領域である画像編集作業において,その優位性を示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 13:15:07 GMT)
SLMRec: Distilling Large Language Models into Small for Sequential Recommendation [38.5] シーケンシャルレコメンデーションタスクでは、過去のインタラクションを考慮して、ユーザが対話する可能性のある次の項目を予測する。
最近の研究は、LCMがシーケンシャルレコメンデーションシステムに与える影響を実証している。
LLM の巨大なサイズのため、現実のプラットフォームに LLM ベースのモデルを適用するのは非効率で実用的ではない。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 18:07:13 GMT)
Comparative clinical evaluation of "memory-efficient" synthetic 3d generative adversarial networks (gan) head-to-head to state of art: results on computed tomography of the chest [35.9] 本研究では,新しいメモリ効率GANアーキテクチャであるCRF-GANを紹介する。
このモデルの性能は、最先端階層型(HA)-GANモデルに対して評価される。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 21:31:01 GMT)
Knowledge Distillation and Dataset Distillation of Large Language Models: Emerging Trends, Challenges, and Future Directions [35.8] LLM(Large Language Models)の指数関数的成長は、絶え間なく拡大する計算およびデータ要求を満たすための効率的な戦略の必要性を強調し続けている。
本調査は、知識蒸留(KD)とデータセット蒸留(DD)の2つの相補的パラダイムを包括的に分析する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 23:50:23 GMT)
OmniV-Med: Scaling Medical Vision-Language Model for Universal Visual Understanding [35.4] 我々はマルチモーダル医療理解のための統合フレームワークであるOmniV-Medを紹介する。
我々は,多解像度2D/3D画像と映像を統一アーキテクチャで処理する回転位置適応エンコーダを考案した。
本稿では,ボリュームデータと医用ビデオの空間的冗長性を生かした,医療対応型トークンプルーニング機構を提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 17:53:56 GMT)
Controlling Space and Time with Diffusion Models [34.7] 4次元新規ビュー合成(NVS)のためのケースド拡散モデルである4DiMを提案する。
我々は3D(カメラポーズ付き)、4D(目的+時間)、ビデオ(時間だがポーズなし)のデータを混合してトレーニングすることができる。
4DiMは、直感的なメートルスケールカメラポーズ制御を備えた最初のNVS方式である。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 04:48:38 GMT)
CHATTER: A Character Attribution Dataset for Narrative Understanding [31.5] 我々はCHATTERのサブセットであるCHATTEREVALを検証する。CHATTEREVALは人間のアノテーションを用いて映画スクリプトの文字属性タスクを評価するためのベンチマークとして機能する。
evaldatasetはまた、言語モデルの物語理解と長文モデリング能力を評価する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 05:40:15 GMT)
Can We Ignore Labels In Out of Distribution Detection? [30.0] アウト・オブ・ディストリビューション(OOD)検出法は近年,安全クリティカルな自律システムの中核となる要素として注目されている。
ラベル付きデータのコストのため、近年の研究では、自己教師付き学習(SSL)OOD検出の可能性について検討されている。
我々は、情報理論の観点から、未ラベルのOOD検出アルゴリズムにおける失敗の理論的保証のための一連の条件を同定する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 18:37:51 GMT)
SeaMo: A Season-Aware Multimodal Foundation Model for Remote Sensing [26.8] リモートセンシング(RS)データは、地球観測に必要な豊富な多次元情報をカプセル化する。
既存のVisual Foundation Models (VFM) は強力な特徴抽出器として機能し、事前トレーニングとその後の微調整にRSデータを活用する。
マルチモーダルおよびマルチシーズンRS情報を効果的に統合する新しいVFMであるSeaMoを紹介する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 00:08:58 GMT)
A DeNoising FPN With Transformer R-CNN for Tiny Object Detection [25.9] そこで本稿では,Trans R-CNN (DNTR) を用いたFPNのデノベーション手法を提案する。
DNTRは、簡単なプラグイン設計、DeNoising FPN (DN-FPN)、効果的なTransformerベースの検出器であるTrans R-CNNで構成されている。
我々は、古いR-CNN検出器を新しいTrans R-CNN検出器に置き換え、自己注意を持つ小さな物体の表現に集中する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 09:18:30 GMT)
VGNC: Reducing the Overfitting of Sparse-view 3DGS via Validation-guided Gaussian Number Control [25.8] 生成的新規ビュー合成(NVS)モデルに基づくバリデーション誘導ガウス数制御(VGNC)手法を提案する。
これは、スパースビュー3DGSの過剰適合問題を生成検証画像で緩和する最初の試みである。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 09:38:02 GMT)
Slice+Slice Baby: Generating Last-Level Cache Eviction Sets in the Blink of an Eye [25.7] 我々はIntelプロセッサ上のエビクションセットを見つける技術に3つの主要な貢献をしている。
まず、メモリアクセス時間を比較し、アドレスマップのキャッシュスライスを特定する。
次に、既知のハッシュ関数を用いて、スライス識別法におけるエラー率を減らし、テストされていないメモリアドレスへのスライスマッピングを外挿することで作業を削減する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 07:53:09 GMT)
Modality Selection and Skill Segmentation via Cross-Modality Attention [25.6] 本稿では,各段階における行動生成に最も有用なモダリティを識別し,選択的に活用するための,クロスモーダルアテンション(CMA)機構を提案する。
我々は、CMAの応用を拡張し、専門家によるデモンストレーションからプリミティブスキルを抽出し、このセグメンテーションを活用して、長い水平・コンタクトリッチな操作タスクを解くことができる階層的なポリシーを訓練する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 11:32:43 GMT)
EmoSEM: Segment and Explain Emotion Stimuli in Visual Art [25.5] 本稿では,視覚芸術理解における重要な課題に焦点をあてる。芸術的イメージを与えられたモデルは,特定の人間の感情を誘発するピクセル領域をピンポイントする。
近年の芸術理解の進歩にもかかわらず、ピクセルレベルの感情理解は依然として二重の課題に直面している。
本稿では,感情理解能力を持つセグメンテーションモデルSAMを実現するために,感情刺激・説明モデル(EmoSEM)を提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 15:40:00 GMT)
TAPIP3D: Tracking Any Point in Persistent 3D Geometry [25.4] 本稿では,モノクロおよびRGB-Dビデオにおける長期3次元点追跡の新しい手法であるTAPIP3Dを紹介する。
TAPIP3Dは、ビデオをカメラ安定化機能クラウドとして表現し、深度とカメラモーション情報を活用する。
以上の結果から,カメラモーションの補正によりトラッキング性能が向上することが示唆された。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 19:09:43 GMT)
Detecting AI-Generated Video via Frame Consistency [25.3] 生成したビデオのオープンソースデータセットと検出手法を初めて提案する。
まず,964のプロンプトからなるスケーラブルなデータセットを提案する。
第二に、空間的アーティファクトに基づく検出器が一般化性に欠けていることの探索実験により明らかになった。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 11:47:02 GMT)
From Imitation to Exploration: End-to-end Autonomous Driving based on World Model [24.6] RAMBLEは、意思決定を駆動するエンド・ツー・エンドの世界モデルベースのRL方式である。
複雑な動的トラフィックシナリオを処理できる。
CARLA Leaderboard 1.0では、ルート完了率の最先端のパフォーマンスを達成し、CARLA Leaderboard 2.0では38のシナリオをすべて完了している。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 06:05:58 GMT)
HOPE: A Reinforcement Learning-based Hybrid Policy Path Planner for Diverse Parking Scenarios [24.3] 多様な複雑な駐車シナリオを扱うために,Hybrid pOlicy Path PlannEr(HOPE)を導入する。
HOPEは強化学習エージェントをReeds-Shepp曲線に統合し、多様なシナリオにまたがる効果的な計画を可能にする。
本稿では,空間および障害物分布に基づく駐車シナリオの難易度を分類するための基準を提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 05:53:50 GMT)
SG-Reg: Generalizable and Efficient Scene Graph Registration [23.4] セマンティックノードの複数モードを符号化するシーングラフネットワークを設計する。
バックエンドでは、対応に応じて変換を決定するために頑健なポーズ推定器を用いる。
提案手法は,クエリフレーム毎に52KBの通信帯域しか必要とせず,わずかに高い登録リコールを実現する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 01:22:40 GMT)
Connecting Parameter Magnitudes and Hessian Eigenspaces at Scale using Sketched Methods [22.8] 任意のパラメータマスクとヘッセン固有空間の類似性を測定する手法をグラスマン計量を用いて開発する。
我々の実験では、等級パラメータマスクとトップヘッセン固有空間の間の*オーバーラップ*が、確率レベルよりも一貫して高いことを明らかにした。
我々の研究は、ディープラーニングヘッセンを大規模に近似し、分析するための方法論を提供し、また、その固有空間の構造に関する新しい洞察を提供する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 18:29:39 GMT)
Adaptive Mix for Semi-Supervised Medical Image Segmentation [22.7] Mix-upは、整合正則化に基づく半教師あり学習手法の鍵となる技術である。
本稿では,画像混合のための適応混合アルゴリズム(AdaMix)を提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 01:12:09 GMT)
SlimPipe: Memory-Thrifty and Efficient Pipeline Parallelism for Long-Context LLM Training [21.9] SlimPipeは、きめ細かいパイプライン並列化に対する新しいアプローチである。
蓄積した活性化をいくつかのマイクロバッチから1つに減らし、いくつかのスライスに分割する。
ほぼゼロのメモリオーバーヘッドを達成し、(2)パイプラインバブルを同時に最小化する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 07:33:33 GMT)
Federated Transfer Learning with Differential Privacy [21.5] フェデレートラーニングは分散データを分析するための強力なフレームワークとして登場した。
本稿では,複数の異種ソースデータセットからの情報を活用することで,対象データセットの学習を向上させることを目的とする。
私たちは、データセットごとにプライバシーを保証するフェデレーションされた差分プライバシーの概念を厳格に定式化します。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 15:05:22 GMT)
Learning Structured Representations by Embedding Class Hierarchy with Fast Optimal Transport [20.9] 我々は、Earth Moverefficient's Distance (EMD) を用いて、特徴空間内のクラス間のペア距離を測定する。
4種類の近似式を探索することにより、最適なトランスポートCPCCファミリーを導入する。
我々の最も効率的なOT-CPCC変種であるFast FlowTreeアルゴリズムは、データセットのサイズで線形に実行される。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 01:00:27 GMT)
A Language Anchor-Guided Method for Robust Noisy Domain Generalization [20.8] アンカーアライメントとアダプティブウェイトリング(A3W)について紹介する。
A3Wは、自然言語処理(NLP)アンカーでガイドされたサンプル再重み付けを使用して、より代表的な特徴を抽出する。
最先端の領域一般化法より一貫して優れている。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 19:49:45 GMT)
GLoRE: Evaluating Logical Reasoning of Large Language Models [20.8] GLoREは、多様なデータセットを統合し、それらを大きな言語モデルを評価するための統一フォーマットに標準化するプラットフォームである。
実験結果から,OpenAIのo1 miniやDeepSeek R1,QwQ-32Bといった大規模推論モデルの論理的推論能力は,人体の性能と教師付き微調整モデルと比較して著しく向上したことがわかった。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 04:31:16 GMT)
AltGDmin: Alternating GD and Minimization for Partly-Decoupled (Federated) Optimization [20.4] 本稿では、勾配交互降下(GD)と最小化(AltGDmin)と呼ばれる新しい最適化ソリューションフレームワークについて述べる。
AltGDmin はしばしば、(i) 1 つの変数の集合 Zb 上の最小化が他の集合 Za よりもはるかに速く、(ii) コスト関数は w.r.t Za で微分可能であるような問題に対して、AltMin よりも高速な解である。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 21:07:59 GMT)
Less is More: Adaptive Coverage for Synthetic Training Data [20.1] 本研究では,最大カバレッジ問題に基づく新しいサンプリングアルゴリズムを導入し,合成されたデータセットから代表サブセットを選択する。
この結果から,この文脈的にサンプリングされたサブセット上での分類器のトレーニングは,データセット全体のトレーニングよりも優れた性能が得られることが示された。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 06:45:16 GMT)
Functional Abstraction of Knowledge Recall in Large Language Models [20.1] 本稿では,大規模言語モデル(LLM)の知識リコール機構について,機能構造に抽象化することで検討する。
そこで本研究では,知識リコールの間,モデル内の隠れアクティベーション空間が暗黙的に関数実行プロセスを必要とすることを提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 05:17:57 GMT)
Paint Outside the Box: Synthesizing and Selecting Training Data for Visual Grounding [20.0] データ不足に対処するための新しいフレームワークPOBF(Paint Outside the Box and Filter)を提案する。
POBFは、ラベルのミスアライメント問題に対処して、ボックスの外側にペンキを塗ることで画像を合成する。
POBFはパフォーマンスを継続的に改善し、実際のデータのみの手法よりも平均5.83%向上した。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 10:32:37 GMT)
HealthGenie: Empowering Users with Healthy Dietary Guidance through Knowledge Graph and Large Language Models [19.7] HealthGenieは、LLM(Large Language Models)とKG(Knowledge Graphs)の長所を組み合わせたインタラクティブシステムである。
このシステムは、定義されたカテゴリによって構成された関連する情報を視覚化し、ハイライトし、詳細な説明可能な推奨論理を提供する。
対象内比較実験とオープンエンドの議論から,HealthGenieは個人化された食事指導を得る上で,効果的にユーザを支援することを実証した。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 12:51:16 GMT)
Digital Twin Buildings: 3D Modeling, GIS Integration, and Visual Descriptions Using Gaussian Splatting, ChatGPT/Deepseek, and Google Maps Platform [19.6] 都市デジタルツイン(Urban Digital twins)は、マルチソースデータとデータ分析を使用して都市計画、インフラ管理、意思決定を最適化する都市の仮想レプリカである。
当社のフレームワークは,ビルの3次元モデルと視覚的記述を検索し,大規模言語モデルに基づくデータ分析とクラウドベースのマッピング統合を実現する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 19:36:15 GMT)
CoLoTa: A Dataset for Entity-based Commonsense Reasoning over Long-Tail Knowledge [19.3] 我々は、Long-Tailエンティティ(CoLoTa)上でのCommonsense推論のための新しいデータセットを提案する。
CoLoTaは質問応答とクレーム検証タスクから3,300のクエリで構成されている。
我々は,LLMコモンセンス推論能力と,長い尾を持つ物体に対する幻覚に対する頑健性の両方を評価するための新しいベンチマークとしてCoLoTaを提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 02:47:18 GMT)
SUDO: Enhancing Text-to-Image Diffusion Models with Self-Supervised Direct Preference Optimization [19.1] 従来のテキスト・画像拡散モデルでは、教師付き微調整を用いて事前訓練されたベースモデルを強化するのが一般的である。
我々は,画素レベルの細かな詳細とグローバルな画質の両方を最適化する新しいパラダイムであるSelf-SUpervised Direct preference Optimization (SUDO)を紹介する。
教師付き微調整の効果的な代替として、SUDOはどんなテキスト・画像拡散モデルにもシームレスに適用できる。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 08:18:27 GMT)
Nudging: Inference-time Alignment of LLMs via Guided Decoding [18.5] 我々は,任意のベースモデルを小さなアライメントモデルを用いて推論時に整列するプラグアンドプレイアルゴリズムであるnudgingを提案する。
看護は、アライメントがスタイリスティックトークンの小さなサブセット上でのモデルの振る舞いを主に変えるという最近の発見によって動機付けられている。
多様なオープンインストラクションタスクにおいて,3つのモデルファミリーにまたがるヌードの評価を行った。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 00:16:18 GMT)
MedM-VL: What Makes a Good Medical LVLM? [17.9] 大規模視覚言語モデル(LVLM)は、複雑な医療課題を解決するための新しいソリューションを提供する。
2次元および3次元の医療用LVLMのモデルアーキテクチャとトレーニング戦略を探求するために、人気のあるLLaVAフレームワークを構築した。
MedM-VL-2D, MedM-VL-CT-Chest, MedM-VL-CT-Chestの2つの事前訓練モデルをリリースする。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 15:56:56 GMT)
Causality for Natural Language Processing [17.7] 因果推論は人間の知性の基礎であり、人工システムにとって重要な能力である。
この論文は、大きな言語モデルにおける因果推論と理解の様々な次元に展開する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 08:11:11 GMT)
Learning Critically: Selective Self Distillation in Federated Learning on Non-IID Data [17.6] フェデレートラーニングのための選択的自己蒸留法(FedSSD)を提案する。
FedSSDは、グローバルモデルの知識を自己蒸留することで、ローカル更新に適応的な制約を課している。
他の最先端のFL法と比較して、より少ない通信ラウンドでの一般化と堅牢性を実現する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 18:06:55 GMT)
Star Attention: Efficient LLM Inference over Long Sequences [17.4] 本稿では,複数のホストに注意を向けることで,計算効率を向上させる2相ブロックスパース近似であるStar Attentionを紹介する。
Star Attentionは、グローバルに注意を払ってトレーニングされたほとんどのTransformerベースのLarge Language Modelとシームレスに統合され、メモリ要件と推論時間を最大11倍に短縮する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 21:50:03 GMT)
DialogueAgents: A Hybrid Agent-Based Speech Synthesis Framework for Multi-Party Dialogue [17.4] 本稿では,新しいハイブリッドエージェントベース音声合成フレームワークであるDialogueAgentsを提案する。
バイリンガル・マルチパーティ・マルチターン音声対話データセットであるMultiTalkにコントリビュートする。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 04:14:30 GMT)
Reconstruction of Differentially Private Text Sanitization via Large Language Models [15.4] 大規模言語モデル(LLM)は、DP対応のプロンプトから変更/削除されたプライバシを再構築することができる。
LLMのアクセシビリティに基づいた2つの攻撃(ブラックボックスとホワイトボックス)を提案する。
本研究は、これらの有名なLCMが、既存のDPテキストサニタイズアプローチの新たなセキュリティリスクとして出現したことを示唆している。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 03:22:57 GMT)
K2MUSE: A human lower limb multimodal dataset under diverse conditions for facilitating rehabilitation robotics [15.2] K2MUSEデータセットには、運動、運動、振幅モード超音波(AUS)、表面筋電図(sEMG)の測定を含む、総合的なマルチモーダルデータの収集が含まれている。
このデータセットは、リハビリテーションロボットの制御フレームワークを設計し、下肢運動の生体力学的解析を行うための新しいリソースを提供する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 13:03:56 GMT)
WikiHint: A Human-Annotated Dataset for Hint Ranking and Generation [15.1] 最初に手動で構築したヒントデータセットWikiHintを紹介した。
我々は,ヒントの助けを借りずに質問に答える人間の被験者に対して,ヒントの有効性を評価する。
その結果, (a) データセットは, より効果的なヒントを生成するのに役立ち, (b) 回答情報を含む質問は, 一般的に生成したヒントの質を向上し, (c) エンコーダベースモデルは, ヒントランキングにおけるデコーダベースモデルよりも優れていることがわかった。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 19:43:24 GMT)
Talk is Not Always Cheap: Promoting Wireless Sensing Models with Text Prompts [14.8] 本稿では,3つの迅速な戦略記述,簡潔な説明,詳細なアクション記述を通じて意味的知識をシームレスに統合する,革新的なテキスト強調型無線センシングフレームワークWiTalkを提案する。
我々は、このフレームワークを、人行動認識のためのXRF55、WiFiTAL、WiFi時行動ローカライゼーションのためのXRFV2の3つの公開ベンチマークデータセットで厳格に検証した。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 13:58:35 GMT)
A Survey on Music Generation from Single-Modal, Cross-Modal, and Multi-Modal Perspectives [14.7] マルチモーダル・ミュージック・ジェネレーションは広範に応用された新たな研究分野である。
本稿では、モーダル性の観点から音楽生成システムを分類し、この分野を概観する。
この領域の主な課題は、効果的なマルチモーダル統合、大規模包括的なデータセット、体系的な評価方法である。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 12:55:44 GMT)
Efficient Federated Split Learning for Large Language Models over Communication Networks [14.5] 分散方式で訓練済みの大規模言語モデル(LLM)を微調整することは、リソース制約のあるエッジデバイスに重大な課題をもたらす。
我々は,分割フェデレーション学習とパラメータ効率のよい微調整技術を統合する新しいフレームワークであるFedsLLMを提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 16:16:54 GMT)
Persona Dynamics: Unveiling the Impact of Personality Traits on Agents in Text-Based Games [14.4] PANDA: Personality Adapted Neural Decision Agentsは,人格特性をエージェントに投影する新しい手法である。
我々は、25のテキストベースのゲームに16の異なるパーソナリティタイプを配置し、それらのトラジェクトリを分析する。
これらの知見は、対話型環境におけるより整合性があり、効果的で、人間中心の意思決定を促進するためのパーソナリティ適応エージェントの約束を裏付けるものである。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 11:19:21 GMT)
From Regulation to Support: Centering Humans in Technology-Mediated Emotion Intervention in Care Contexts [14.4] 情動支援」は「情動規制」に代わるアプローチであり、感情的幸福に対する人間中心のアプローチを強調している。
この研究は、個人的および認知的視点を超えて、多様な人間の感情的な要求を理解することを促進する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 04:15:14 GMT)
NVSMask3D: Hard Visual Prompting with Camera Pose Interpolation for 3D Open Vocabulary Instance Segmentation [14.0] 本稿では,3次元ガウシアン・スプレイティングに基づくハードビジュアル・プロンプト手法を導入し,対象物に関する多様な視点を創出する。
提案手法は現実的な3次元視点をシミュレートし,既存のハード・ビジュアル・プロンプトを効果的に増強する。
このトレーニングフリー戦略は、事前のハード・ビジュアル・プロンプトとシームレスに統合され、オブジェクト記述的特徴が強化される。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 14:39:27 GMT)
MedUnifier: Unifying Vision-and-Language Pre-training on Medical Data with Vision Generation Task using Discrete Visual Representations [14.0] 医療データに適した統合型ビジョンランゲージ事前学習フレームワークであるMedUnifierを提案する。
MedUnifierはテキスト基底画像生成機能とマルチモーダル学習戦略をシームレスに統合する。
本手法では, 視覚ベクトル量子化を用いて, クロスモーダル理解のためのより密着的な学習戦略を実現するとともに, マルチモーダル生成品質を向上させる。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 21:18:03 GMT)
Fast Adaptive Anti-Jamming Channel Access via Deep Q Learning and Coarse-Grained Spectrum Prediction [13.4] 本稿では,複雑で未知のジャミング環境におけるアンチジャミングチャネルアクセス問題について検討する。
固定パターンを用いた従来のチャネルホッピングアンチジャミングアプローチは、動的ジャミング攻撃に対して効果がない。
ジャマーよりも学習の直感に導かれる高速適応型アンチ・ジャミング・チャンネル・アクセス・アプローチを提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 03:58:00 GMT)
Robust Quantum Control using Reinforcement Learning from Demonstration [13.3] システムモデルで生成された制御シーケンスを活用するために,Reinforcement Learning from Demonstration (RLfD) を用いる。
このアプローチはサンプル数を減らしてサンプル効率を高めることができ、トレーニング時間を著しく短縮することができる。
我々はRLfD法を用いて複数の高忠実度非古典状態の生成をシミュレートした。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 03:39:39 GMT)
A Framework for Benchmarking and Aligning Task-Planning Safety in LLM-Based Embodied Agents [13.2] 大規模言語モデル(LLM)は、エンボディエージェント内のタスク計画能力を向上する上で大きな可能性を秘めている。
我々は, LLMをベースとしたエンボディエージェントの挙動を, セーフプランベンチとアライメントのための統合フレームワークであるSafe-BeAlを提案する。
我々の経験的分析によると、敵対的な入力や悪意がなくても、LSMベースのエージェントは安全でない行動を示すことができる。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 15:12:14 GMT)
VM-BHINet:Vision Mamba Bimanual Hand Interaction Network for 3D Interacting Hand Mesh Recovery From a Single RGB Image [13.0] Vision Mamba Bimanual Hand Interaction Network (VM-BHINet)は、状態空間モデル(SSM)を手再構成に導入し、インタラクションモデリングを強化する。
コアコンポーネントであるVision Mamba Interaction Feature extract Block (VM-IFEBlock)は、SSMとローカルおよびグローバルな機能操作を組み合わせたものだ。
InterHand2.6Mデータセットの実験では、VM-BHINetは、結合位置の平均値(MPJPE)と頂点位置の平均値(MPVPE)を2-3%削減している。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 13:54:22 GMT)
FairSteer: Inference Time Debiasing for LLMs with Dynamic Activation Steering [12.7] 大規模言語モデル(LLM)は、トレーニングコーパスからバイアスを捉える傾向があり、潜在的にネガティブな社会的影響をもたらす。
提案するFairSteerは,カスタマイズしたプロンプト設計やモデル再訓練を必要とせずに,新しい推論時脱バイアスフレームワークである。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 04:57:00 GMT)
Breaking the Prompt Wall (I): A Real-World Case Study of Attacking ChatGPT via Lightweight Prompt Injection [12.6] 本報告では,ChatGPTのような大規模言語モデルプラットフォームに対して,インジェクションのプロンプトがどう作用するかを示す実例を示す。
本稿では,ユーザ入力や Web ベース検索,システムレベルのエージェント命令を通じて,敵対的プロンプトをインジェクションする方法を示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 05:59:00 GMT)
LeetCodeDataset: A Temporal Dataset for Robust Evaluation and Efficient Training of Code LLMs [12.4] LeetCodeDatasetは、コード生成モデルの評価とトレーニングのための高品質なベンチマークである。
データセットと評価フレームワークはHugging FaceとGithubで公開されている。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 15:28:16 GMT)
Efficient Knowledge Transfer in Multi-Task Learning through Task-Adaptive Low-Rank Representation [12.0] 事前訓練された言語モデルは、現実世界のアプリケーションでトレーニング中に見つからない新しいタスクに苦しむ。
本稿では,タスク適応型低ランク表現(TA-LoRA)を提案する。
16のタスクの実験では、TA-LoRAがフルデータおよび少数ショット設定で最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 06:33:19 GMT)
Understanding and Optimizing Multi-Stage AI Inference Pipelines [11.3] HERMESは不均一な多段LPM推論実行シミュレータである。
HERMESは、以前のフレームワークとは異なり、複数のモデルを同時に実行する異種クライアントをサポートする。
我々は、推論ステージがエンドツーエンドのレイテンシ、ハイブリッドパイプラインの最適戦略、リモートKVキャッシュ検索のアーキテクチャ的影響について検討する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 19:57:16 GMT)
Large Language Models as Robust Data Generators in Software Analytics: Are We There Yet? [11.2] 敵攻撃は、ソフトウェアシステムの信頼性とセキュリティを損なう可能性がある。
LLM(Large Language Model)が生成したデータと人書きデータとがどのように比較されるかは明らかでない。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 16:35:44 GMT)
Generalized Derangetropy Functionals for Modeling Cyclical Information Flow [11.1] 本稿では,デレンジトロピー関数と呼ばれるエントロピー変調変換の一般化されたファミリを介し,循環型およびフィードバック型情報フローをモデル化する枠組みを提案する。
シャノンエントロピーのようなスカラーや静的エントロピーの測度とは異なり、これらの関数は確率密度に直接作用し、分布の支持を越えて情報構造の地形的表現を提供する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 13:09:21 GMT)
TVPR: Text-to-Video Person Retrieval and a New Benchmark [11.0] 本稿では,新しいテキスト・ツー・ビデオ・パーソナリティ検索(TVPR)タスクを提案する。
自然言語で人ビデオを記述するデータセットやベンチマークは存在しないため、大規模なクロスモーダル人ビデオデータセットを構築する。
MFGF(Multielement Feature Guided Fragments Learning)戦略を導入する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 08:48:04 GMT)
Can Large Language Models Become Policy Refinement Partners? Evidence from China's Social Security Studies [10.8] 本研究では,中国の社会保障問題に対する政策レコメンデーション作成における大規模言語モデル(LLM)の機能境界と性能特性について検討した。
LLMは、複雑な社会的ダイナミクスへの対処、利害のバランス、社会保障領域内の財政リスクの制御において、重大な制限に直面している。
DeepSeek-R1は、ポリシーレコメンデーション生成におけるすべての評価次元において、GPT-4oよりも優れた性能を示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 10:05:59 GMT)
SWE-Synth: Synthesizing Verifiable Bug-Fix Data to Enable Large Language Models in Resolving Real-World Bugs [10.7] 本稿では,現実的な検証可能な,プロセス対応のバグフィックスデータセットをリポジトリレベルで合成するフレームワークであるSWE- Synthを紹介する。
手作業で収集したデータセットと比較して、文脈的豊かさと正確さを保ちながら、最小限の人的労力でスケールする。
この結果から,APRとソフトウェア工学の自動化の最先端を推し進めるために,人工エージェント生成データの可能性を強調した。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 22:37:43 GMT)
Are Vision LLMs Road-Ready? A Comprehensive Benchmark for Safety-Critical Driving Video Understanding [10.2] 視覚大言語モデル(VLLM)は、画像キャプションや視覚的質問応答といった一般的な視覚的タスクにおいて、印象的な機能を示している。
しかし、自律運転のような専門的で安全に重要な分野におけるその効果は、まだ明らかにされていない。
DVBenchは、安全クリティカルな運転映像の理解において、VLLMの性能を評価するために設計された先駆的なベンチマークである。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 07:50:44 GMT)
A Hierarchical Framework for Measuring Scientific Paper Innovation via Large Language Models [10.2] 大規模言語モデル(LLM)に基づく階層的かつトレーニング不要なフレームワークであるHSPIMを提案する。
セクションタイトルでテキストをセグメンテーションし、ゼロショットLCMを使用して、セクション分類、質問回答(QA)拡張、および重み付きノベルティスコアを実装する。
そこで本研究では,共通質問とセクション固有の質問からなる2層質問構造を提案し,遺伝的アルゴリズムを用いて質問と提案の組合せを最適化する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 13:58:20 GMT)
Efficient Implicit Neural Compression of Point Clouds via Learnable Activation in Latent Space [10.1] Inlicit Neural Representations (INR) はディープラーニングの強力なパラダイムとして登場した。
静的クラウド圧縮のためのINRベースのフレームワークである textbfPICO を提案する。
当社のアプローチは競争力が高く、PCQMの平均利得は2.7倍10-3$である。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 03:37:32 GMT)
Machine Learning Fleet Efficiency: Analyzing and Optimizing Large-Scale Google TPU Systems with ML Productivity Goodput [10.0] 本稿では,GoogleのTPUに基づくMLフリートを大規模に解析する。
MLプロダクティビティグッドプット(ML Productivity Goodput)"のメトリクスを使って、MLフリート効率を計測する方法を示します。
また,MPGを用いて性能ボトルネックを特定し,最適化する手法を提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 08:02:36 GMT)
Enhancing DR Classification with Swin Transformer and Shifted Window Attention [10.0] 糖尿病網膜症 (DR) は, 早期発見の重要性を浮き彫りにしている。
画像トリミング、コントラスト制限適応ヒストグラム等化(CLAHE)、およびモデル一般化とレジリエンスを改善するためのターゲットデータ拡張を組み込んだ頑健な前処理パイプラインを提案する。
我々は,多クラスDR分類のためのAptosデータセットとIDRiDデータセットを用いて,精度89.65%,精度97.40%を実現した。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 13:23:20 GMT)
Emotion Alignment: Discovering the Gap Between Social Media and Real-World Sentiments in Persian Tweets and Images [9.9] 現実世界とオンラインプラットフォームの間の感情表現の相違が 現れます
革新的なパイプラインは、ソーシャルメディアと比較して現実世界の感情の類似度を測定するために設計された。
結果は、画像と現実世界の感情の間に28.67%の類似性を示し、ツイートは現実世界の感情と75.88%の一致を示した。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 08:45:04 GMT)
DreamActor-M1: Holistic, Expressive and Robust Human Image Animation with Hybrid Guidance [9.9] 本稿では,DreamActor-M1 を用いた拡散トランスフォーマ (DiT) ベースのフレームワークを提案する。
動作誘導のために、暗黙の表情、3次元頭部球体、および3次元体骨格を統合したハイブリッド制御信号は、表情と身体運動の堅牢な制御を実現する。
実験により,本手法は,肖像画,上半身,全体生成の表現的結果を提示し,最先端の成果よりも優れることが示された。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 11:52:01 GMT)
Metamon-GS: Enhancing Representability with Variance-Guided Densification and Light Encoding [9.7] 3D Gaussian Splatting(3DGS)は、ガウスのシーンを表現できる。
大幅な進歩があったが、レンダリング性能を向上させることは依然として困難である。
分散誘導型デンシフィケーション戦略とマルチレベルハッシュグリッドの革新的視点からメタモンGSを提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 02:44:39 GMT)
PolicyEvol-Agent: Evolving Policy via Environment Perception and Self-Awareness with Theory of Mind [9.6] PolicyEvol-Agentは、他者の意図を体系的に獲得するのが特徴の包括的なフレームワークである。
PolicyEvol-Agentは、さまざまな認知操作を、内的および外的視点とともに、心の理論と統合する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 06:43:23 GMT)
FlowLoss: Dynamic Flow-Conditioned Loss Strategy for Video Diffusion Models [9.5] ビデオ拡散モデル(VDM)は高品質なビデオを生成することができるが、時間的に一貫した動きを生み出すのにしばしば苦労する。
本研究では,生成した映像から抽出した流れ場を直接比較するFlowLossを提案する。
本研究は,騒音条件付き生成モデルにモーションベース制御を組み込むための実用的な知見を提供する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 08:22:29 GMT)
Quantum cellular automata for word statistics facilitated by quantum correlations [8.5] ランダムな量子セルオートマトンにおける状態空間内で符号化された情報に支配される協調進化を研究するための反復的アルゴリズムを提案する。
統計言語学において2-gramモデルにインスパイアされた量子状態の更新は、与えられたコーパスによって決定され、量子相関を誘導する相互作用として機能する。
この結果は,量子探索アルゴリズムとランダム多体ダイナミクスの適応パラダイムを提供する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 02:07:20 GMT)
sEEG-based Encoding for Sentence Retrieval: A Contrastive Learning Approach to Brain-Language Alignment [8.5] 本稿では,凍結したCLIPモデルの文埋め込み空間に単射ステレオ脳波信号(sEEG)を投影するコントラスト学習フレームワークであるSSENSEを提案する。
本手法は,自然主義映画視聴データセットから,時系列のsEEGと音声の書き起こしについて評価する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 03:01:42 GMT)
Evaluating Temporal Plasticity in Foundation Time Series Models for Incremental Fine-tuning [8.2] 時系列基礎モデルは、様々な時系列予測タスクで優れているが、漸進的な学習による継続的改善の能力は、まだ解明されていない。
本研究は,これらのモデルの時間的可塑性(連続学習による性能向上能力)を調査する最初の包括的研究である。
その結果,従来のモデルでは微調整の微調整で性能劣化に悩まされていたが,Time-MoEやChronosのような基礎モデルでは予測精度が持続的に向上していることがわかった。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 16:43:01 GMT)
DreamID: High-Fidelity and Fast diffusion-based Face Swapping via Triplet ID Group Learning [8.2] DreamIDは、高レベルのID類似性、属性保存、画像の忠実性、高速推論速度を実現する拡散ベースの顔交換モデルである。
本稿では,SwapNet,FaceNet,IDAdapterを組み合わせた拡散モデルアーキテクチャを提案する。
DreamIDは、アイデンティティの類似性、ポーズと表現の保存、イメージの忠実性の観点から、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 06:53:00 GMT)
Steganography in Game Actions [8.1] 本研究は, 実効性のあるステガノグラフィー媒体であると考えられるものの境界を拡大することを目的としている。
本研究では,環境と対話する複数のエージェントのエピソードを通して,隠れた情報を伝達するステガノグラフィーのパラダイムを探求する。
概念実証として,目的に向かって操る行為において,サブリミナル通信を隠蔽するナビゲーションタスクであるラビリンスゲームを通じて,アクションステガノグラフィーを例示する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 02:17:12 GMT)
Steganography Beyond Space-Time with Chain of Multimodal AI [8.1] ステガノグラフィー(英: Steganography)は、隠蔽文学の芸術と科学である。
人工知能が進化を続けるにつれて、現実的なコンテンツを合成する能力は、サイバー犯罪の脅威として現れます。
本研究は,空間的・時間的領域を超えてメッセージが隠蔽される聴覚メディアのためのステガノグラフィーのパラダイムを提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 02:50:48 GMT)
Automated Test Transfer Across Android Apps Using Large Language Models [7.9] 本稿では、LLM(Large Language Models)を活用して、モバイルアプリ間で使用量ベースのUIテストを効率的に転送する革新的な手法であるLLMigrateを紹介する。
LLMigrateは自動テスト転送で97.5%の成功率を達成でき、スクラッチからテストを書くのに必要な手作業が91.1%削減された。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 09:29:20 GMT)
Language-Guided Reinforcement Learning for Hard Attention in Few-Shot Learning [7.0] 本稿では,データセット全体ではなく,本質的なデータセグメントに注目することで,学習モデルの精度と信頼性を向上させることを提案する。
本稿では,言語指導による深層強化学習を活用して情報的データ領域を特定し活用する新しいフレームワークであるLaHAを紹介する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 17:24:04 GMT)
Decoding Secret Memorization in Code LLMs Through Token-Level Characterization [6.9] コード大言語モデル(LLM)は、プログラムコードの生成、理解、操作において顕著な能力を示した。
LLMは必然的に機密情報の記憶につながり、深刻なプライバシーリスクを生じさせる。
トークン確率に基づいて,コードLLMが生成した実・偽の秘密を特徴付ける新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 05:41:14 GMT)
Forecasting from Clinical Textual Time Series: Adaptations of the Encoder and Decoder Language Model Families [6.9] 本稿では, タイムスタンプによる臨床所見が予測の主入力となるテキスト時系列からの予測問題について紹介する。
我々は、細調整されたデコーダベースの大規模言語モデルやエンコーダベースのトランスフォーマーなど、多様なモデル群を評価する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 19:03:57 GMT)
Improving Clinical Decision Support through Interpretable Machine Learning and Error Handling in Electronic Health Records [6.6] Trust-MAPSは、臨床領域の知識を高次元の混合整数プログラミングモデルに変換する。
信頼スコアは、臨床決定支援タスクの予測性能を高めるだけでなく、MLモデルに解釈可能性を与える臨床的に有意義な特徴として出現する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 15:54:32 GMT)
Neglected Risks: The Disturbing Reality of Children's Images in Datasets and the Urgent Call for Accountability [6.4] データセットに子供のイメージを含めると、倫理的な懸念が浮かび上がっている。
これらのデータセットは、搾取、プロファイリング、追跡などのリスクに子供たちをさらけ出すことができる。
本稿では,そのような画像の検出と削除を行うパイプラインを提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 01:36:07 GMT)
Diffusion-Driven Inertial Generated Data for Smartphone Location Classification [6.2] スマートフォンの位置認識のための拡散駆動型特定力生成データを提案する。
以上の結果から, 拡散に基づく生成モデルは, 特定の力信号の特徴を捉えることに成功していることがわかった。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 10:14:36 GMT)
Closing the Evaluation Gap: Developing a Behavior-Oriented Framework for Assessing Virtual Teamwork Competency [6.2] 本研究では,工学系学生の仮想チームワーク能力を評価するための行動指向フレームワークを開発する。
批判的インシデントテクニックと組み合わせたフォーカスグループインタビューを用いて,3つの重要な側面を同定した。
結果として得られるフレームワークは、より効果的な評価プラクティスの基礎を提供する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 08:12:27 GMT)
Mitigating Parameter Interference in Model Merging via Sharpness-Aware Fine-Tuning [6.1] 事前学習のパラダイムを持つ大規模ディープラーニングモデルは、一般的な事前学習モデルから微調整された多数のタスク固有モデルの急増につながっている。
これらの大きなモデルを単一のマルチタスクモデル、特にパラメータの単純な算術モデルにマージする研究が進められている。
このようなマージ手法は、異なるタスクで微調整されたモデルパラメータ間の干渉という、中心的な課題に直面します。
我々は、シャープネスを意識した最小化による事前学習モデルの微調整を提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 15:57:12 GMT)
Convergence Analysis of Probability Flow ODE for Score-based Generative Models [5.9] 確率フローODEに基づく決定論的サンプリング器の収束特性を理論的・数値的両面から検討する。
連続時間レベルでは、ターゲットと生成されたデータ分布の総変動を$mathcalO(d3/4delta1/2)$で表すことができる。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 16:45:48 GMT)
Learning from Reasoning Failures via Synthetic Data Generation [5.9] 本稿では,既存のLMMの推論失敗の分析に基づく合成データ生成手法を提案する。
553k以上のサンプルを含む大規模なマルチモーダル命令チューニングデータセットを生成する。
以上の結果から,我々の合成データに基づいてトレーニングしたモデルが,等価量の実データに基づいてトレーニングしたLMMの性能を上回ることが示唆された。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 07:45:53 GMT)
Matrix Factorization with Dynamic Multi-view Clustering for Recommender System [5.8] マトリックス分解(MF)はレコメンデーションシステムの基盤である。
MFDMCは、Webスケールデータの包括的な利用と効率的なエンドツーエンドトレーニングのバランスをとる統合フレームワークである。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 10:47:21 GMT)
Trading off Consistency and Dimensionality of Convex Surrogates for the Mode [5.6] 結果が$n$以上の多重クラス分類では、結果は少なくとも次元が$n-1$の実数に埋め込まれなければならない。
本稿では,サロゲート損失次元のトレードオフ,問題インスタンス数,単純度における一貫性領域の制限について検討する。
整合性を持つ各点の質量分布の周りには、単純体の実次元部分集合が存在するが、$n-1$次元に満たない場合、幻覚と呼ばれる現象が起こる分布が存在することを示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 15:12:16 GMT)
Conditional Brownian Bridge Diffusion Model for VHR SAR to Optical Image Translation [5.6] 本文は,Brownian Bridge Diffusion Model(BBDM)に基づく条件付き画像から画像への変換手法を提案する。
我々は、MSAWデータセット、ペアSAR、0.5m Very-High-Resolution (VHR) の光学画像収集に関する総合的な実験を行った。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 09:03:15 GMT)
WT-BCP: Wavelet Transform based Bidirectional Copy-Paste for Semi-Supervised Medical Image Segmentation [5.4] 半監督型医用画像分割(SSMIS)は、ラベル付き医療データへの依存を減らすことを約束している。
しかし、SSMISフィールドはラベル付きデータとラベルなしデータの分散ミスマッチ、トレーニングバイアスの原因となる人工摂動、生画像情報の不十分な利用といった課題に直面している。
本稿では,Wavelet 変換に基づく双方向コピー・ペースト SSMIS フレームワーク WT-BCP を提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 01:34:55 GMT)
Metamizer: a versatile neural optimizer for fast and accurate physics simulations [4.7] 本稿では,広範囲の物理システムを高精度で反復的に解く,新しいニューラルネットワークであるMetamizerを紹介する。
我々は,メタマイザがディープラーニングに基づくアプローチにおいて,前例のない精度で達成できることを実証した。
以上の結果から,メタミザーは将来の数値解法に大きな影響を与える可能性が示唆された。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 19:42:42 GMT)
Deep Learning-Based Approach for Identification of Potato Leaf Diseases Using Wrapper Feature Selection and Feature Concatenation [4.6] ジャガイモの葉に影響を及ぼす遅発病を検出するために,画像処理と機械学習に基づく自律的手法を提案する。
本手法は,SVMを用いて550個の特徴を選別することにより,99%の精度を実現する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 13:07:54 GMT)
HLSTester: Efficient Testing of Behavioral Discrepancies with LLMs for High-Level Synthesis [4.5] 高レベル合成(HLS)における行動の相違をテストする既存の方法はまだ未熟である。
本研究では,大規模言語モデル(LLM)を用いたテストフレームワークHLSTesterを提案する。
LLMの幻覚を緩和するために、オリジナルのC/C++プログラムのテストベンチを利用して、LS互換のテストベンチを生成する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 14:45:01 GMT)
AlphaZero-Edu: Making AlphaZero Accessible to Everyone [4.5] このAlphaZero-Eduは、AlphaZeroの数学的枠組みに基づく軽量で教育に焦点を当てた実装である。
主要なコンポーネントをアンタングルするモジュラーアーキテクチャを備えており、アルゴリズムプロセスの透過的な可視化を可能にしている。
五目マッチでは、人間の対戦相手に対する勝利率を一貫して達成し、例外的なパフォーマンスを見せている。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 14:29:39 GMT)
HyperFusion: A Hypernetwork Approach to Multimodal Integration of Tabular and Medical Imaging Data for Predictive Modeling [4.4] EHRの値と測定値に画像処理を条件付け,臨床画像と表層データを融合させるハイパーネットワークに基づく新しいフレームワークを提案する。
このアプローチは、これらのモダリティに存在する相補的な情報を活用し、様々な医療応用の精度を高めることを目的としている。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 16:17:38 GMT)
AI for the Open-World: the Learning Principles [4.4] この論文は、オープンワールドのためのAIを構築するために必要な学習原則を探求する。
学習原則を使用するためのテクニックを提案し、学習原則を検証するために大規模な実験を行う。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 22:22:00 GMT)
Risk Assessment Framework for Code LLMs via Leveraging Internal States [4.2] PtTrustは、内部状態事前学習に基づくコードLLMのための2段階のリスクアセスメントフレームワークである。
PtTrustは、LLM状態の一般的な表現を学習するために、大規模な未ラベルのソースコードで教師なしの事前訓練を行う。
コードラインレベルの細粒度リスク評価によるPtTrustの有効性を示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 14:44:18 GMT)
Safety Implications of Explainable Artificial Intelligence in End-to-End Autonomous Driving [4.2] 本稿では,エンド・ツー・エンドの自動運転における説明の安全性への影響について述べる。
我々はまず、エンド・ツー・エンドの運転における安全性と説明可能性の概念を再考し、運転安全性の向上における説明の重要性を示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 23:39:27 GMT)
Exploring the Frontiers of LLMs in Psychological Applications: A Comprehensive Review [4.1] 大規模言語モデル(LLM)は、人間の認知と行動の側面をシミュレートする可能性がある。
LLMは、文献レビュー、仮説生成、実験的なデザイン、実験的な主題、データ分析、学術的な執筆、心理学におけるピアレビューのための革新的なツールを提供する。
データプライバシ、心理的研究にLLMを使うことの倫理的意味、モデルの制限をより深く理解する必要がある、といった問題があります。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 08:45:26 GMT)
Deep Learning in Early Alzheimer's disease's Detection: A Comprehensive Survey of Classification, Segmentation, and Feature Extraction Methods [4.1] 2015年の世界アルツハイマー病報告書によると、世界中で4680万人が認知症に苦しんでいる。
ディープラーニングは、高次元データの複雑な構造を特定することによって、従来の機械学習技術より優れている。
本研究では、オープンアクセスデータセットを用いて、早期アルツハイマー病検出のためのディープラーニングアルゴリズムの評価を行った。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 12:23:19 GMT)
Time Frequency Analysis of EMG Signal for Gesture Recognition using Fine grained Features [3.9] 本稿では,細粒度分類を用いた手動作認識のための新しい手法を提案する。
XMANetは、浅層から深層CNNの専門家の間での相互注意を通じて、低レベルの局所的および高レベルのセマンティックキューを統一する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 18:51:10 GMT)
Quantum tomography of the superfluid-insulator transition for a mesoscopic atomtronic ring [3.8] 有限サイズBose-Hubbard回路における超流体絶縁体遷移の解析のための位相空間的視点を提供する。
粒子間相互作用が変化するにつれて固有状態がどのようにパラメトリックに進化するかを考察する。
最後に、最低のゴールドストーンバンドとヒッグスバンドの形成に焦点を当てる。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 06:17:10 GMT)
Revealing Treatment Non-Adherence Bias in Clinical Machine Learning Using Large Language Models [3.5] 本研究では,非遺伝治療が因果推論と予測モデルの両方を歪ませる暗黙バイアスをいかに導入するかを検討する。
以上の結果から, この暗黙バイアスは, 治療効果を逆転させるだけでなく, モデル性能を最大5%低下させることが示唆された。
このことは、責任と公平な臨床機械学習システムの開発において、治療の非整合性に対する説明の重要性を強調している。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 20:25:08 GMT)
M-TabNet: A Multi-Encoder Transformer Model for Predicting Neonatal Birth Weight from Multimodal Data [3.5] 出生体重(BW)は新生児の健康にとって重要な指標であり、低出生体重(LBW)は死亡率と死亡率の増加と関連している。
既存のモデルでは栄養学や遺伝学の影響を無視することが多く、主に生理学やライフスタイルに重点を置いている。
本研究は,12週間の妊娠後早期のBW予測のためのマルチエンコーダアーキテクチャを用いたアテンションベーストランスフォーマーモデルを提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 00:03:47 GMT)
The Developer Experience of LGBTQIA+ People in Agile Teams: a Multivocal Literature Review [3.3] この研究は、アジャイルチームにおけるLGBTQIA+プロフェッショナルの開発者エクスペリエンスに焦点を当てた、Multivocal Literature Reviewを通じて、伝統的およびグレーの文献データを調べることを目的としている。
調査の結果, 視認性, 偏見, 差別などの問題は, 現場における異性愛者の優位性に左右され, 経験に悪影響を及ぼすことが明らかとなった。
チームや組織、特にニーズに合わせたプロセスで歓迎されていると感じているプロフェッショナルは、よりポジティブなチームのダイナミクスとエンゲージメントを報告します。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 16:00:37 GMT)
Persistent Homology for Structural Characterization in Disordered Systems [3.3] 障害のあるシステムにおける局所的構造と大域的構造の両方を特徴付けるために,永続的ホモロジー(PH)に基づく統一的なフレームワークを提案する。
同じアルゴリズムとデータ構造を使って、ローカルとグローバルのディスクリプタを同時に生成できる。
粒子の再配置を予測し、大域的な位相を分類するのに非常に効果的で解釈可能であることが示されている。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 20:55:16 GMT)
AI-Copilot for Business Optimisation: A Framework and A Case Study in Production Scheduling [3.2] ビジネス最適化問題定式化のためのAI-Copilotを提案する。
トークンの制限については、モジュール化を導入し、エンジニアリング技術を推進します。
問題定式化の精度と品質を評価するのに適した性能評価指標を設計する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 23:22:26 GMT)
Information Gain Is Not All You Need [3.1] 本稿では,情報ゲインが品質制約探索における最適化目標として機能すべきでないことを論じる。
本稿では,ロボットの近距離と他のフロンティアからの遠距離とのトレードオフに基づいてフロンティアを選択する,新しい距離優位性を提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 13:01:02 GMT)
Training neural networks without backpropagation using particles [2.1] ニューラルネットワークは、人間の脳内の生物学的ニューロンを模倣するために、複数の層にまとめられたニューロンのグループである。
勾配降下戦略は、ニューラルネットワークのバックプロパゲーションアルゴリズムを改善するために使用されている。
粒子群最適化 (PSO) は損失関数の探索空間の中で最適な局所最小値を選択するために提案された。
提案手法では、個々のニューロンを個別に訓練することで、勾配降下とPSOアルゴリズムの限界を克服する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 15:41:36 GMT)
ChronoRoot 2.0: An Open AI-Powered Platform for 2D Temporal Plant Phenotyping [2.0] 私たちは、安価なハードウェアと高度な人工知能を組み合わせたオープンソースの統合プラットフォームであるChronoRoot 2.0を紹介します。
このシステムはいくつかの大きな進歩を導入し、苗作開発に関する統合的な視点を提供する。
シロイヌナズナの3つのユースケースを通じてシステム機能を示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 20:56:25 GMT)
A Holistic Evaluation of Piano Sound Quality [2.0] 本研究では,異なるピアノの音質について検討した。
畳み込みニューラルネットワーク(CNN)の様々な事前学習モデルの微調整結果を比較して最適なピアノ分類モデルを選択する。
その結果、音楽的に訓練された個人は、異なるピアノの音質の違いを区別できることがわかった。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 03:54:59 GMT)
Reinforcement Learning from Multi-level and Episodic Human Feedback [2.0] 報酬関数と最適ポリシーの両方を多段階のフィードバックから効率的に学習するアルゴリズムを提案する。
提案アルゴリズムは, 広範囲なシミュレーションにより, サブ線形後悔を実現し, その経験的有効性を示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 20:09:19 GMT)
On Dimension-Free Transformer: An Application of STP to AI [2.0] 次元自由変換器(DFT)の枠組みを提案する。
すべてのエントリに関するバランスの取れた情報を使用することで、DFTは信号を扱う上でより効率的でなければならない。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 07:19:54 GMT)
Achieving Tight $O(4^k)$ Runtime Bounds on Jump$_k$ by Proving that Genetic Algorithms Evolve Near-Maximal Population Diversity [1.8] 我々は、$(mu+1)$-$lambda_c$-GAの集団の多様性が、ほぼ完全な多様性の均衡に収束することを示した。
また、この分析は、JUMP$_k、delta$、HURDLEなどの他のユニタリ化関数にも拡張可能であることを示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 14:12:19 GMT)
DNSSEC+: An Enhanced DNS Scheme Motivated by Benefits and Pitfalls of DNSSEC [1.8] DNSSEC+は、リゾルバとネームサーバ間のDNS解決プロセスのセキュリティとプライバシの脆弱性を軽減するために設計された新しいDNSスキームである。
サーバ側処理のレイテンシ、解像度時間、CPU使用率において、DNSSEC+は安全性の低いスキームに匹敵するが、DNS-over-TLSよりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 20:15:52 GMT)
Explainability for Embedding AI: Aspirations and Actuality [1.8] 説明可能なAI(XAI)は、開発者が構築するシステムをよりよく理解することを可能にする。
既存のXAIシステムは、まだこの願望には達していない。
私たちは、この複雑さに対処するための適切なサポートメカニズムを開発者に提供する必要があると考えています。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 14:20:01 GMT)
Change Logging and Mining of Change Logs of Business Processes -- A Literature Review [1.8] 変革マイニングは、組織がビジネスプロセスで発生した変化を理解することを可能にする。
本稿では,プロセス対応情報システムにおける変更ロギングとマイニングの文献について検討する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 14:08:38 GMT)
Airlift Challenge: A Competition for Optimizing Cargo Delivery [1.7] エアリフトチャレンジコンペティションは、エアリフト問題を単純化した抽象化を提供するシミュレーターを通じて可能な解決策を模索している。
このシミュレーターはOpenAIのジムインターフェースを使用し、参加者はエージェントアクションを計画するアルゴリズムを作成できる。
本稿では,コンペティション,シミュレーション環境,結果について述べる。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 00:24:36 GMT)
Efficient Frame Extraction: A Novel Approach Through Frame Similarity and Surgical Tool Tracking for Video Segmentation [1.6] 本稿では,余剰フレームを効率的に除去し,データセットのサイズや計算時間を短縮する手法を提案する。
具体的には,手術器具の移動を追跡することで,連続するフレーム間の類似性を計算する。
症例の振り返りレビューから得られたデータセットを解析し,提案手法の有効性を評価する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 07:28:55 GMT)
MSAD-Net: Multiscale and Spatial Attention-based Dense Network for Lung Cancer Classification [1.6] 肺がんは、世界中でがん関連死亡率の高い原因の一つである。
我々は,新しいCNNアーキテクチャであるMulti-Scale Dense Network (MSD-Net)'を提案した。
提案モデルでは,最新のCNNモデルであるConvNext-Tiny,最近のViT(Vision Transformer),Pooling-based ViT(PiT),その他の既存モデルよりも大幅に性能が向上した。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 14:07:21 GMT)
From Idea to Implementation: Evaluating the Influence of Large Language Models in Software Development -- An Opinion Paper [1.4] トランスアーキテクチャの導入は自然言語処理(NLP)の転換点となった。
ChatGPT や Bard などの大規模言語モデル (LLM) が一般向けに公開されており、これらのモデルの膨大な可能性を示している。
専門家の全体的な意見は肯定的であり、生産性の向上やコーディング時間の短縮といったメリットを専門家が特定している。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 22:50:35 GMT)
IXGS-Intraoperative 3D Reconstruction from Sparse, Arbitrarily Posed Real X-rays [1.3] R2$-Gaussian splatting frameworkを拡張して、一貫した3Dボリュームを困難な条件下で再構築する。
形態伝達を用いた解剖学的誘導ラジオグラフィ標準化のステップを導入し、ビュー間の視覚的整合性を改善する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 18:28:13 GMT)
A computational framework for longitudinal medication adherence prediction in breast cancer survivors: A social cognitive theory based approach [1.2] 慢性疾患の患者の半数近くは、処方薬の処方に従わないため、薬物への非順守は重要な問題である。
本研究は, 薬物付着のマルチスケールモデルを構築し, 異なる時間枠における付着に影響を与える因子の意義を明らかにすることを目的とする。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 03:26:29 GMT)
Automatic Text Summarization (ATS) for Research Documents in Sorani Kurdish [1.2] 本研究では,Sorani Kurdishの231の科学的論文を基に,データセットと言語モデルを構築した。
結果は手動で評価され、ROUGE-1、ROUGE-2、ROUGE-Lを使用して自動的に評価され、最高精度は19.58%に達した。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 14:17:17 GMT)
A Case Study Exploring the Current Landscape of Synthetic Medical Record Generation with Commercial LLMs [1.2] 合成データを生成する商用大規模言語モデルの現状を評価する。
我々の主な発見は、LLMが小さな特徴のサブセットに対して確実に合成された健康記録を生成できる一方で、データの次元が増加するにつれて、現実的な分布と相関を維持するのに苦労していることである。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 15:37:05 GMT)
Uncovering Issues in the Radio Access Network by Looking at the Neighbors [1.1] RAN Mobile ネットワーク用のコンテキストアノマリー dEectiontitor である c-ANEMON について述べる。
本手法は, 個々の細胞の挙動を局所的に解析することにより, 変動を捉える。
提案手法におけるGNNモデルは,これまで見つからなかった領域の細胞に効果的に一般化することを示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 17:36:52 GMT)
PROMPTEVALS: A Dataset of Assertions and Guardrails for Custom Production Large Language Model Pipelines [0.8] 大規模言語モデル(LLM)は、さまざまなドメインにまたがる特殊な実運用データ処理パイプラインに、ますます多くデプロイされている。
これらのアプリケーションの信頼性を向上させるためには、パイプラインと一緒に動作するLCM出力のアサーションやガードレールを作成することが不可欠である。
本稿では,2087のパイプラインプロンプトのデータセットであるPrompTEVALSについて,12623のアサーション基準で紹介する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 21:04:23 GMT)
Consensus in Motion: A Case of Dynamic Rationality of Sequential Learning in Probability Aggregation [0.6] 本稿では,命題確率論理に基づく確率集約の枠組みを提案する。
コンセンサス互換かつ独立的なアジェンダ上のアジェンダのルールは必ず線形であることを示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 14:04:39 GMT)
A Survey on Multi-Resident Activity Recognition in Smart Environments [0.5] HAR(Human Activity Recognition)は、スマートデバイス、センサー、アルゴリズムを利用して個人の行動を自動的に分類し識別する、急速に成長する分野である。
これらのシステムには、ケアタスクの支援、セキュリティの向上、エネルギー効率の向上など、幅広い応用がある。
重要な課題の1つは、センサーの観察と関係者の身元を正確に関連付けることである。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 17:58:04 GMT)
FarsEval-PKBETS: A new diverse benchmark for evaluating Persian large language models [0.5] 本稿では,ペルシア語における大規模言語モデルを評価するためのFarsEvalプロジェクトのサブセットであるFarsEval-PKBETSベンチマークを紹介する。
このベンチマークは4000の質問と、複数の選択、短い回答、記述的な応答を含む様々な形式の回答で構成されている。
医学、法律、宗教、ペルシア語、百科事典知識、人間の嗜好、社会知識、倫理と偏見、テキスト生成、他者の権利の尊重など幅広い分野やタスクをカバーしている。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 17:43:47 GMT)
Optimizing SIA Development: A Case Study in User-Centered Design for Estuary, a Multimodal Socially Interactive Agent Framework [0.5] 本稿では,ソーシャル・インテリジェント・エージェント(SIA)開発フレームワークのユーザ中心設計モデルについて述べる。
我々は、ラピッドアセスメント・プロセス(RAP)を利用して、SIAの分野における主要な研究者の考えを収集する。
我々の研究の成果は、エスチュアリーの継続的な開発を支援するだけでなく、SIAのための他の将来のフレームワークや技術の開発を導くことを願っている。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 00:02:56 GMT)
ResNetVLLM -- Multi-modal Vision LLM for the Video Understanding Task [0.4] ResNetVLLM (ResNet Vision LLM) はゼロショットビデオ理解のためのクロスモーダルフレームワークである。
ResNetベースのビジュアルエンコーダとLarge Language Model (LLM)を統合している。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 00:20:18 GMT)
Random pure Gaussian states and Hawking radiation [0.4] ブラックホールはホーキング放射によって蒸発する。その放射のそれぞれのモードは熱的だ。それでも、全体の状態が純粋なものであるなら、モードは絡み合わなければならない。
制約付きランダムシンプレクティック変換の新しい理論は、全状態が純粋かつガウス的かつ与えられた限界を持つという理論に基づいて展開する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 14:45:28 GMT)
Wasserstein Distributionally Robust Regret Optimization [0.0] We provide a systematic analysis of Wasserstein DRRO, paralleling known results for Wasserstein DRO。
滑らかさと規則性条件下では、ワッサーシュタインDRROは経験的リスク最小化(Empirical Risk Minimization:ERM)と1次項に一致することを示す。
2つの1次元凹関数を最大化することにより、後悔を計算できることが示される。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 04:51:38 GMT)
Using street view imagery and deep generative modeling for estimating the health of urban forests [0.0] 健康な都市林は気候変動の緩和に重要な役割を果たしている。
都会の森林の健康をモニタリングする伝統的なアプローチは、計器検査技術を必要とする。
簡易入力を用いた都市林のモニタリング手法を提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 12:09:15 GMT)
Urban Metaverse: The Smart City in the Industrial Metaverse. Opportunities of the metaverse for real-time, interactive, and inclusive infrastructure applications in urban areas [0.0] 都市メタバース(Urban Metaverse)は、都市と市民の物理的世界とデジタルデータとシステムを結ぶ没入型3D環境を記述している。
この傾向研究は、都市とコミュニティのリーダー、都市計画家、IT専門家、そして都市空間の将来に関心のある人のためのインスピレーションとガイダンスの源泉となっている。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 10:23:04 GMT)
Translation Analytics for Freelancers: I. Introduction, Data Preparation, Baseline Evaluations [0.0] これは、最近の言語技術の進歩に起因する、急速に拡大する新しい機会を探求する一連の論文の最初のものである。
我々は、これらの進歩を活用するための実用的な手法で翻訳者を強化することを目指している。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 13:54:28 GMT)
Toward the Axiomatization of Intelligence: Structure, Time, and Existence [0.0] 本研究では,メタフレームワーク内での知能の公理的定義を構築することを目的とする。
我々は、宇宙の集合論的な表現を知性が存在する領域として定式化する。
我々は、その知性、構造的特性、生物学的妥当性の3つの例を比較し、解釈する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 12:55:37 GMT)
The last Dance : Robust backdoor attack via diffusion models and bayesian approach [0.0] 拡散モデルは、前方と後方の学習原理に基づいて訓練された最先端のディープラーニング生成モデルである。
人工知能研究の世界で人気のあるフレームワークであるHugging Faceから派生したオーディオトランスフォーマーに対するバックドア攻撃の可能性を示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 19:42:23 GMT)
The complexity of entanglement embezzlement [0.0] プロセスの任意の精度を実現する状態列を用いて,エンベゾルメントの回路複雑性について検討する。
回路の複雑さは、完全なエンベゾルメントの物理的障害として働くことを示唆する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 11:16:55 GMT)
Simple Cracking of (Noise-Based) Dynamic Watermarking in Smart Grids [0.0] 動的透かしとその関連プロトコルのスペクトル特性を解析する。
デジタル双対法に触発された簡単な攻撃を提示する。
安全で認証された通信がないため、動的透かしは条件付きでも条件付きでもない。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 20:44:52 GMT)
Seeing Through Risk: A Symbolic Approximation of Prospect Theory [0.0] リスク下での意思決定のための新しいシンボリックモデリングフレームワークを提案する。
提案手法は,不透明な実用曲線と確率重み付け関数を,透明でエフェクトサイズの誘導された特徴に置き換える。
数学的に定式化し、よく知られたフレーミング現象と損失回避現象を再現する能力を示し、合成データセットに対するエンドツーエンドの実証検証を提供する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 01:44:54 GMT)
Relaxing the Markov Requirements on Reinforcement Learning Under Weak Relative Ignorability [0.0] 我々は「相対的不確実性」の概念を導入し、適応強化学習のための新しい収束定理を確立する。
この理論的結果は、従来の$Q$-ラーニングの過程におけるマルコフの仮定を緩和し、最適性を確立するためにロビンズ・モンロ近似定理の一般化形式を展開させる。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 16:06:48 GMT)
Quantum-Enhanced Weight Optimization for Neural Networks Using Grover's Algorithm [0.0] 本稿では,古典的NNの重み付けを最適化するために量子コンピューティングを提案する。
我々は、NNの最適パラメータの探索を高速化するために、Groverの量子探索アルゴリズムのインスタンスを設計する。
提案手法は,他のQNN手法と比較して,より少ない量子ビットを必要とする。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 10:59:04 GMT)
Quantum analysis of the effects of coordinate noncommutativity on bi-dimensional harmonic motion under parametric variations [0.0] 高エネルギー物理学において、座標非可換性(英語版)は空間自体を量子化できるという中心的な考えを表している。
まず、時間に依存しないパラメータで記述されたシステムの量子解を導出する。
我々は,非可換位相空間形式に枠を組んだ研究を拡張し,時間依存パラメータを用いたシステムの関連する解を求める。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 05:29:52 GMT)
Quantum Simulation of the Unruh Temperature the Thermal Properties of Virtually Evolving Bose-Einstein Condensates [0.0] 本稿では,複数のボース・アインシュタイン熱浴の臨界温度と関連づけることで,ウンルー温度をシミュレートする新しい理論モデルを提案する。
これらの熱浴は、進化するボース・アインシュタイン凝縮物(BEC)に由来するボース・ファイアワークのスナップショットとして概念化される
論文参考訳(メタデータ) (Sun, 20 Apr 2025 17:20:21 GMT)
On the Tunability of Random Survival Forests Model for Predictive Maintenance [0.0] 本稿では,ランダムサバイバルフォレスト(RSF)モデルの予測維持性について検討する。
チューナビリティを定量化する3段階のフレームワークを導入する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 21:27:23 GMT)
No Imputation of Missing Values In Tabular Data Classification Using Incremental Learning [0.0] 本稿では,グラフデータのインクリメンタル・ラーニング (NIIL) は行わないことを提案する。
提案手法は,アテンションマスクを用いて重なり合う特徴集合の分割を段階的に学習し,アテンションスコアから欠落値を取り除いた。
実験は、欠落値の計算を含む方法と比較して、様々な欠落値タイプやレートに対して、NIILの頑健さを裏付けるものである。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 13:31:49 GMT)
Nearly Optimal Circuit Size for Sparse Quantum State Preparation [0.0] 量子状態が$d$スパースであるとは、非ゼロ振幅が$d$である場合に言う。
我々は,アシラリー量子ビット数と回路サイズとのトレードオフを初めて証明した。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 16:28:09 GMT)
Med-2D SegNet: A Light Weight Deep Neural Network for Medical 2D Image Segmentation [0.0] 我々は,新しい高効率セグメンテーションアーキテクチャであるMed-2D SegNetを紹介する。
Med-2D SegNetは、複数のベンチマークデータセットで最先端のパフォーマンスを実現する。
その成功の中心は、特殊なエンコーダ設計であるコンパクトなメドブロックである。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 19:04:43 GMT)
Finite temperature fermionic charge and current densities in conical space with a circular edge [0.0] 磁気フラックスでスレッディングされた2次元円錐空間上に局在した巨大なスピノル場の電荷と電流密度に対する有限温度およびエッジ誘起効果について検討した。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 18:48:49 GMT)
Exact Duality at Low Energy in a Josephson Tunnel Junction Coupled to a Transmission Line [0.0] 有限長帯電伝送線路に結合したジョセフソントンネル接合部の低エネルギー挙動について検討する。
長さが大きくなる伝送線路では、電荷バイアス構成の低エネルギー電荷依存エネルギーバンドがフラックスバイアス系に正確にマッピング可能であることを示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 15:13:10 GMT)
Evaluating BERTopic on Open-Ended Data: A Case Study with Belgian Dutch Daily Narratives [0.0] 本研究は,オランダのオープンエンドな日刊物語をモデル化するBERTopicの可能性を,ラテント・ディリクレ・アロケーション(LDA)やKMeansと対比した。
本研究は,NLPモデルにおけるロバストな一般化の必要性を強調した。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 18:51:08 GMT)
Estimating detector error models from syndrome data [0.0] 本稿では,個別のDEMイベントの確率,およびDEMイベントの集合クラスを,複数のシンドローム抽出サイクルのデータを用いて推定する方法を示す。
本稿では,個別のDEMイベントの確率,およびDEMイベントの集合クラスを,複数のシンドローム抽出サイクルのデータを用いて推定する方法を示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 14:56:56 GMT)
Establishing Workload Identity for Zero Trust CI/CD: From Secrets to SPIFFE-Based Authentication [0.0] CI/CDシステムは、現代のインフラストラクチャでは特権的な自動化エージェントになっていますが、そのアイデンティティは依然として、システム間で渡されるシークレットや一時的な認証に基づいています。
本稿では、静的認証からOpenID Connect(OIDC)フェデレーションへの移行について述べ、非人間アクターのプラットフォーム中立性モデルとしてSPIFFEを紹介した。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 23:06:03 GMT)
Entangled states are not always useful for single shot distinguishability of unitaries [0.0] 2つのユニタリは、最大エンタングル状態とは区別できるが、最大エンタングル状態とは区別できない。
このタスクにおける最適な探索状態の1つの顕著な特徴は、2つ以上のユニタリ数を増やせばわかる。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 05:40:43 GMT)
Emotional Strain and Frustration in LLM Interactions in Software Engineering [0.0] 大規模言語モデル(LLM)は、ソフトウェア工学における日々のタスクにますます統合されています。
フラストレーションは、ストレスとバーンアウトにエスカレートした場合、エンジニアの生産性と幸福に悪影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 10:41:35 GMT)
Emergent quantum phase transition of a Josephson junction coupled to a high-impedance multimode resonator [0.0] モード数が増加すると、多重モード共振器に結合した接合の創発的臨界度について検討する。
この遷移は、基底状態ではなく、最初の励起状態を含むレベルの反交差に由来することが判明した。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 15:21:07 GMT)
Don't Retrieve, Generate: Prompting LLMs for Synthetic Training Data in Dense Retrieval [0.0] 効果的な高密度検索モデルの訓練は、しばしば文書コーパスから抽出された強陰性(HN)の例に依存する。
本稿では,Large Language Model (LLM) が最初にパスからクエリを生成し,その後,そのクエリテキストをエンフォニーに使用して,難解なサンプルを生成する,エンド・ツー・エンドのパイプラインについて紹介する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 08:34:10 GMT)
Disentangling Linguistic Features with Dimension-Wise Analysis of Vector Embeddings [0.0] 本稿では,異なる言語特性(LP)を符号化したベクトル埋め込みの特定の次元を明らかにするための枠組みを提案する。
本稿では,同義語,否定語,時制,量などの10つの重要な言語的特徴を分離するLinguistically Distinct Sentence Pairsデータセットを紹介する。
このデータセットを用いて,様々な手法を用いてBERT埋め込みを分析し,各LPの最も影響力のある次元を同定する。
我々の研究結果は、否定や極性といった特定の性質が特定の次元で強固に符号化されている一方で、同義語のような他の性質はより複雑なパターンを示すことを示している。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 23:38:16 GMT)
Deep Learning with Pretrained 'Internal World' Layers: A Gemma 3-Based Modular Architecture for Wildfire Prediction [0.0] この作業は、Gemma 3上に構築されたモジュラーアーキテクチャを導入することで、内部世界を山火事発生予測に活用する。
これらのGemma 3サブレイヤは、トレーニング済みの表現力を保ちながら、より小さな入出力ネットワークのみをトレーニングします。
モロッコの山火事データセットの評価では、標準フィードフォワードや畳み込みベースラインと比較して予測精度と堅牢性が改善された。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 18:02:22 GMT)
Decoupling Identity from Access: Credential Broker Patterns for Secure CI/CD [0.0] 認証ブローカは、CI/CDシステムへのアクセスからIDを分離する方法を提供する。
本稿では,SPEなどの実行時に発行される検証可能なIDをブローカと組み合わせて,パイプラインやワークロードの短時間かつポリシ駆動的な認証を可能にする方法を示す。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 23:08:17 GMT)
Critical quantum metrology using non-Hermitian spin model with RT-symmetry [0.0] 我々は、$mathcalRT$-対称性を持つKaplan-Shekhtman-Entin-Wohlman-Aharony相互作用を持つ非エルミート的逆の$XY$モデルについて研究する。
系の磁場を正確に推定するために、iKSEA$モデルの基底状態の量子フィッシャー情報(QFI)が、システムサイズである$N2$までスケールできることを証明した。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 11:25:50 GMT)
Conditioning through indifference in quantum mechanics [0.0] このような測定を行う上で、量子システムの状態条件に関する不確実性を記述する方法について検討する。
条件付けに関する一般的なルールを導出することで, 望ましさ, コヒーレンス, 無関心の相互作用を生かして, 条件付けの一般的なルールを導出できることが示される。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 12:38:24 GMT)
Conditioning and AGM-like belief change in the Desirability-Indifference framework [0.0] 本稿では, AGM の信念変化フレームワークをどのように拡張して,いわゆる Desirability-Indifference フレームワークの条件付けに対処するかを示す。
このレベルの抽象化により、古典的および量子的確率論を同時に扱うことができる。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 12:51:59 GMT)
Checkification: A Practical Approach for Testing Static Analysis Truths [0.0] 本稿では,抽象解釈に基づく静的アナライザの試験法を提案する。
このアプローチの主な利点は、Ciaoアサーションベースのバリデーションフレームワーク内で直接フレーミングすることによる、シンプルさにあります。
我々は、CiaoPP静的解析器にアプローチを適用し、合理的なオーバーヘッドを伴う多くのバグを特定した。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 18:42:18 GMT)
Building babyGPTs: Youth Engaging in Data Practices and Ethical Considerations through the Construction of Generative Language Models [0.0] 若者は、日々の生活でジェネレーティブ言語モデル(GLM)をますます利用している。
ほとんどの研究は、GLMシステムを利用する若者を支援することに重点を置いている。
本稿では,GLM構築における若年者参加の可能性を示すケーススタディを提案する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 23:40:29 GMT)
Application of Deep Reinforcement Learning for Intrusion Detection in Internet of Things: A Systematic Review [0.0] IoT(Internet of Things)は、前例のない一連のデバイスを相互接続することで、デジタルランドスケープを大幅に拡大した。
従来の侵入検知システム(IDS)は、IoTネットワークの動的で進化する性質と脅威パターンに対応するのに苦労している。
この体系的なレビューでは、IoT設定におけるIDSを強化するために、Deep Reinforcement Learning(DRL)の適用について検討する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 00:55:58 GMT)
Algorithmic contiguity from low-degree conjecture and applications in correlated random graphs [0.0] 2つの問題に対して計算硬度を示す。
我々の証明の主な要素の1つは、2つの確率測度の間の近位関係を導出することである。
このフレームワークは、異なるタスク間のリダクションを実行するための便利なツールを提供する。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 00:32:19 GMT)
AI with Emotions: Exploring Emotional Expressions in Large Language Models [0.0] 大言語モデル(LLM)は、特定の感情状態の質問に答えるエージェントとしての役割を持つ。
ラッセルの「サイクムプレックス」モデルは、眠気(覚醒)と快楽(静寂)の軸に沿った感情を特徴づける。
評価の結果, 生成した回答の感情状態は, 仕様と一致していた。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 18:49:25 GMT)
A Combinatorial Theory of Dropout: Subnetworks, Graph Geometry, and Generalization [0.0] 本稿では,2進法の高次元グラフ上のランダムウォークをモデル化し,ドロップアウトの一般化とグラフ理論的理論を提案する。
一般化作業が大規模で接続された低抵抗クラスタを形成し,ネットワーク幅で指数関数的に増加することを証明した。
これによって、堅牢で構造化された、冗長性を備えた汎用的なワークの集合体からサンプリングするメカニズムとして、ドロップアウトが明らかになる。
論文参考訳(メタデータ) (Sun, 20 Apr 2025 23:09:20 GMT)