VideoWorld: Exploring Knowledge Learning from Unlabeled Videos [119.4] この研究は、深層生成モデルが視覚入力のみから複雑な知識を学習できるかどうかを考察する。
我々は、未ラベルのビデオデータに基づいて訓練された自動回帰ビデオ生成モデルであるVideoWorldを開発し、ビデオベースのGoとロボット制御タスクにおける知識獲得能力をテストする。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:59:10 GMT)
VITA-1.5: Towards GPT-4o Level Real-Time Vision and Speech Interaction [105.4] 視覚情報と音声情報の両方を段階的に学習する多段階学習手法を提案する。
提案手法は, 視覚言語能力の強化だけでなく, 音声音声対話の効率向上にも寄与する。
画像, ビデオ, 音声タスクのベンチマークにおいて, 我々の手法を最先端の手法と比較することにより, モデルが強い視覚と音声の両機能を備えていることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:00:16 GMT)
FAST: Efficient Action Tokenization for Vision-Language-Action Models [98.2] 離散コサイン変換に基づくロボット動作のための圧縮に基づく新しいトークン化手法を提案する。
FASTをベースとしたFAST+は,100万個のリアルロボットアクショントラジェクトリに基づいて訓練されたユニバーサルロボットアクショントークンである。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:57:04 GMT)
Tapping the Potential of Large Language Models as Recommender Systems: A Comprehensive Framework and Empirical Analysis [91.6] ChatGPTのような大規模言語モデルは、一般的なタスクを解く際、顕著な能力を示した。
本稿では,レコメンデーションタスクにおけるLLMの活用のための汎用フレームワークを提案し,レコメンデーションタスクとしてのLLMの機能に着目した。
提案手法は,提案手法が推薦結果に与える影響を解析し,提案手法とモデルアーキテクチャ,パラメータスケール,コンテキスト長について検討する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:58:54 GMT)
Towards Robust and Realistic Human Pose Estimation via WiFi Signals [85.6] WiFiベースの人間のポーズ推定は、離散的で微妙なWiFi信号を人間の骨格にブリッジする難しいタスクである。
本論文は,本問題を再検討し,(1)ドメイン間ギャップ,(2)ソース・ターゲット領域のポーズ分布の顕著な変化,(2)骨格のポーズが歪んだトポロジーを示す構造的フィデリティギャップ,の2つの重要な問題を明らかにする。
本稿では,タスクをDT-Poseと呼ばれる新しい2段階のフレームワークに書き換えることで,これらのギャップを埋める:ドメイン一貫性表現学習とトポロジ制約ポスデコーディング。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:38:22 GMT)
SMPLest-X: Ultimate Scaling for Expressive Human Pose and Shape Estimation [81.4] 表現的人間のポーズと形状推定(EHPS)は、身体、手、顔の動きを多数の応用で統合する。
現在の最先端の手法は、限定されたデータセット上で革新的なアーキテクチャ設計を訓練することに焦点を当てている。
本稿では,EHPSのスケールアップが一般基盤モデルのファミリに与える影響について検討する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:59:46 GMT)
Empowering Large Language Models in Wireless Communication: A Novel Dataset and Fine-Tuning Framework [81.3] 我々は,無線通信アプリケーションのための大規模言語モデル(LLM)の評価と微調整を目的とした,特殊なデータセットを開発した。
データセットには、真/偽と複数選択型を含む、さまざまなマルチホップ質問が含まれている。
本稿では,PVI(Pointwise V-Information)に基づく微調整手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:19:53 GMT)
Cold-Start Recommendation towards the Era of Large Language Models (LLMs): A Comprehensive Survey and Roadmap [78.3] コールドスタート問題は、リコメンデータシステムにおける長年の課題のひとつだ。
インターネットプラットフォームの普及とユーザやアイテムの指数的な成長により、コールドスタートレコメンデーション(CSR)の重要性が増している。
本稿では、CSRのロードマップ、関連文献、今後の方向性について、包括的なレビューと議論を行う。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:53:23 GMT)
LLM360 K2: Building a 65B 360-Open-Source Large Language Model from Scratch [77.0] 我々は、LLM360 K2-65Bモデルのトレーニングについて詳述し、私たちの360度OPEN SOURCEアプローチを、プロジェクトLLM360の下で最大かつ最も強力なモデルにスケールアップした。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:49:10 GMT)
Merging Models on the Fly Without Retraining: A Sequential Approach to Scalable Continual Model Merging [75.9] ディープモデルマージ(Deep Modelmerging)は、複数の微調整モデルを組み合わせて、さまざまなタスクやドメインにまたがる能力を活用する、新たな研究方向を示すものだ。
現在のモデルマージ技術は、全ての利用可能なモデルを同時にマージすることに集中しており、重量行列に基づく手法が主要なアプローチである。
本稿では,モデルを逐次処理するトレーニングフリーなプロジェクションベース連続マージ手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:17:24 GMT)
Diffusion Models in Vision: A Survey [73.1] 拡散モデルは、前方拡散段階と逆拡散段階の2つの段階に基づく深層生成モデルである。
拡散モデルは、既知の計算負荷にもかかわらず、生成したサンプルの品質と多様性に対して広く評価されている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 11:17:04 GMT)
UVRM: A Scalable 3D Reconstruction Model from Unposed Videos [69.9] 従来の2次元視覚データを用いた3D再構成モデルのトレーニングには、トレーニングサンプルのカメラポーズに関する事前知識が必要である。
UVRMは、ポーズに関する情報を必要とせず、単眼ビデオでトレーニングし、評価できる新しい3D再構成モデルである。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:00:17 GMT)
Provably Efficient Reinforcement Learning with Multinomial Logit Function Approximation [67.8] 本稿では,MNL関数近似を用いたMDPの新たなクラスについて検討し,状態空間上の確率分布の正当性を保証する。
その大きな利点にもかかわらず、非線形関数を組み込むことは、統計的および計算効率の両方において重大な課題を提起する。
我々は,$widetildemathcalO(dH2sqrtK + kappa-1d2H2)$を後悔するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:45:52 GMT)
Learning to Assist Humans without Inferring Rewards [65.3] 我々は、エンパワーメントのレンズを通して支援を研究する先行研究に基づいて構築する。
補助剤は、人間の行動の影響を最大化することを目的としている。
これらの表現は、先行研究と類似したエンパワーメントの概念を推定する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:18:01 GMT)
Distilling Multi-modal Large Language Models for Autonomous Driving [64.6] 近年のエンド・ツー・エンドの自動運転システムは,大規模言語モデル(LLM)をプランナーとして活用し,レアイベントに対する一般化性を向上させる。
我々は,LLMの世界の知識を活用しつつ,LLMフリー(あるいはビジョンベース)プランナの効率を維持するエンド・ツー・エンドの自動運転システムであるDiMAを提案する。
DiMAを用いたトレーニングでは、L2軌道誤差が37%減少し、ビジョンベースプランナーの衝突速度が80%低下し、ロングテールシナリオでは44%軌道誤差が減少する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:59:53 GMT)
Practical Continual Forgetting for Pre-trained Vision Models [61.4] 現実のシナリオでは、選択的な情報は事前訓練されたモデルから継続的に取り除かれることが期待される。
この問題を3つの重要な課題を連続的に忘れ、識別するものとして定義する。
本稿ではまず,各忘れるタスクに対してTransformerブロック内のFFN層を微調整するグループスパースLoRA(GS-LoRA)を提案する。
顔認識,物体検出,画像分類に関する広範な実験を行い,他のクラスへの影響を最小限に抑えながら,特定のクラスを忘れることが実証された。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:57:53 GMT)
Reward-Guided Controlled Generation for Inference-Time Alignment in Diffusion Models: Tutorial and Review [59.9] このチュートリアルは、拡散モデルにおける下流の報酬関数を最適化するための推論時ガイダンスとアライメント方法に関する詳細なガイドを提供する。
生物学のような分野における実践的な応用は、しばしば特定の指標を最大化するサンプル生成を必要とする。
本稿では,(1)推論時と組み合わせた微調整手法,(2)モンテカルロ木探索などの探索アルゴリズムに基づく推論時アルゴリズム,(3)言語モデルと拡散モデルにおける推論時アルゴリズムの接続について論じる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:37:35 GMT)
Finding the Trigger: Causal Abductive Reasoning on Video Events [59.2] Causal Abductive Reasoning on Video Events (CARVE)は、ビデオ内のイベント間の因果関係を特定する。
本稿では、時間空間と意味空間における映像イベントの関係を調査する因果イベント関係ネットワーク(CERN)を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 05:39:28 GMT)
DriveLM: Driving with Graph Visual Question Answering [57.5] 本研究では,Webスケールデータに基づいて学習した視覚言語モデル(VLM)を,エンド・ツー・エンドの運転システムに統合する方法について検討する。
グラフVQAとエンドツーエンド駆動を併用するVLMベースラインアプローチ(DriveLM-Agent)を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:57:44 GMT)
OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking [57.1] 我々は,人間のような反復的展開と反射の過程をエミュレートする機械記述フレームワークであるOmniThinkを提案する。
実験結果から,OmniThinkはコヒーレンスや深度といった指標を伴わずに,生成した記事の知識密度を向上することが示された。
人間の評価と専門家のフィードバックは、OmniThinkが長文記事の生成における現実的な課題に対処する可能性をさらに強調している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:58:06 GMT)
AutoCBT: An Autonomous Multi-agent Framework for Cognitive Behavioral Therapy in Psychological Counseling [57.1] 伝統的な個人の心理カウンセリングは主にニッチであり、心理学的な問題を持つ個人によって選択されることが多い。
オンラインの自動カウンセリングは、恥の感情によって助けを求めることをためらう人たちに潜在的な解決策を提供する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:57:12 GMT)
Cost-aware Bayesian Optimization via the Pandora's Box Gittins Index [57.0] 我々は,コストを意識したベイズ最適化と,経済学の意思決定問題であるPandoraのBox問題との間に,従来未解決の接続関係を構築した。
我々の研究は、Gittinsインデックス理論からベイズ最適化への技術統合に向けた第一歩となる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 05:21:05 GMT)
Lost in Translation, Found in Context: Sign Language Translation with Contextual Cues [56.0] 我々の目的は、連続手話から音声言語テキストへの翻訳である。
署名ビデオと追加のコンテキストキューを組み込む。
文脈的アプローチが翻訳の質を著しく向上させることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:59:03 GMT)
Scenario-Wise Rec: A Multi-Scenario Recommendation Benchmark [54.9] 6つの公開データセットと12のベンチマークモデルと、トレーニングと評価パイプラインで構成されるベンチマークである textbfScenario-Wise Rec を紹介します。
このベンチマークは、研究者に先行研究から貴重な洞察を提供することを目的としており、新しいモデルの開発を可能にしている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 04:40:18 GMT)
Indefinite causal order strategy nor adaptive strategy does not improve the estimation of group action [53.6] 可能ユニタリ演算の集合がコンパクト群の射影ユニタリ表現によって与えられるとき、未知ユニタリ演算の推定を考える。
誤差関数が群共分散を満たす場合,不確定因果順序戦略や適応戦略は,この推定性能を向上しないことを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 06:00:57 GMT)
General detectability measure [53.6] 資源のない状態から資源状態を排除することは、量子情報の基本課題である。
我々は、与えられた$n$-tensorの積状態を検出するために、故障確率の最適指数減衰率を導出した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 05:39:22 GMT)
VanGogh: A Unified Multimodal Diffusion-based Framework for Video Colorization [53.4] ビデオのカラー化は、時間的一貫性と構造的整合性を維持しながら、グレースケールのビデオを鮮やかな色表現に変換することを目的としている。
既存のビデオカラー化法は、しばしば色出血に悩まされ、包括的な制御が欠如している。
我々はVanGoghを紹介した。VanGoghはビデオカラー化のためのマルチモーダル拡散に基づく統合フレームワークである。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:20:40 GMT)
Augmenting a Large Language Model with a Combination of Text and Visual Data for Conversational Visualization of Global Geospatial Data [51.6] 本稿では,Large Language Model (LLM) をテキストと視覚データの組み合わせで拡張する手法を提案する。
可視化とデータセットのテキスト記述と視覚化のスナップショットを組み合わせることでこの問題に対処する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:16:37 GMT)
Collaborative Gym: A Framework for Enabling and Evaluating Human-Agent Collaboration [51.5] Collaborative Gymは、エージェント、人間、タスク環境間の非同期で三分割的なインタラクションを可能にするフレームワークである。
シミュレーション条件と実環境条件の両方において,Co-Gymを3つの代表的なタスクでインスタンス化する。
その結果、協調作業員はタスクパフォーマンスにおいて、完全に自律的なエージェントよりも一貫して優れていたことが判明した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 07:01:37 GMT)
iFADIT: Invertible Face Anonymization via Disentangled Identity Transform [51.1] 顔の匿名化は、個人のプライバシーを保護するために顔の視覚的アイデンティティを隠すことを目的としている。
Invertible Face Anonymization の頭字語 iFADIT を Disentangled Identity Transform を用いて提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 07:58:06 GMT)
Instruction-Guided Fusion of Multi-Layer Visual Features in Large Vision-Language Models [51.0] 18のベンチマークと6つのタスクカテゴリにわたる異なるエンコーダ層からの視覚的特徴の寄与について検討する。
テキスト命令に基づいて動的に多層機能を統合する命令誘導型視覚アグリゲータを提案する。
この研究は、大規模視覚言語モデルにおける階層的視覚的特徴の適応的利用に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:06:35 GMT)
MAMo: Leveraging Memory and Attention for Monocular Video Depth Estimation [50.9] モノクロ映像深度推定のための新しいメモリとアテンションフレームであるMAMOを提案する。
また,MAMoでは,映像を流すときの深度予測を支援するメモリによるモデル拡張を行う。
我々はMAMoが一貫した単分子深度推定ネットワークを改善し,SOTA(State-of-the-art)の精度を新たに設定することを示した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:55:36 GMT)
Vision-Language Models Do Not Understand Negation [50.3] NegBenchは、イメージ、ビデオ、医療データセットにまたがる18のタスクのバリエーションと79kのサンプルに対する否定的理解を評価するために設計されたベンチマークである。
提案手法は, 否定的クエリに対するリコールが10%増加し, 否定的キャプションによる複数質問に対する精度が40%向上することを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:55:42 GMT)
Foundations of Large Language Models [50.0] 本書は4つの主要な章で構成されており、それぞれが事前学習、生成モデル、プロンプト技術、アライメント方法という重要な領域を探求している。
自然言語処理や関連分野の大学生、専門家、実践者を対象としている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 01:03:56 GMT)
AugRefer: Advancing 3D Visual Grounding via Cross-Modal Augmentation and Spatial Relation-based Referring [49.8] 3Dビジュアルグラウンドティングは、自然言語記述と対象物とを3Dシーン内で関連付けることを目的としている。
既存のアプローチでは、トレーニング用に利用可能なテキスト3Dペアが不足しているのが一般的である。
AugReferは3次元視覚的接地を前進させる新しい手法である。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:57:40 GMT)
Monte Carlo Tree Search with Velocity Obstacles for safe and efficient motion planning in dynamic environments [49.3] 本稿では,動的障害物に関する情報を最小限に抑えた最適オンライン動作計画手法を提案する。
提案手法は,モデルシミュレーションによるオンライン最適計画のためのモンテカルロ木探索 (MCTS) と障害物回避のためのVelocity Obstacles (VO) を組み合わせた。
我々は,非線形モデル予測制御(NMPC)を含む最先端のプランナーに対して,衝突速度,計算,タスク性能の向上の観点から,我々の方法論の優位性を示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:45:08 GMT)
CrisisSense-LLM: Instruction Fine-Tuned Large Language Model for Multi-label Social Media Text Classification in Disaster Informatics [49.3] 本研究では,事前学習型大規模言語モデル(LLM)の強化による災害テキスト分類への新たなアプローチを提案する。
本手法では,災害関連ツイートから包括的インストラクションデータセットを作成し,それをオープンソース LLM の微調整に用いる。
この微調整モデルでは,災害関連情報の種類,情報化,人的援助の関与など,複数の側面を同時に分類することができる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:26:36 GMT)
Quantum One-Wayness of the Single-Round Sponge with Invertible Permutations [49.2] スポンジハッシュは、広く使われている暗号ハッシュアルゴリズムのクラスである。
これまでのところ、不規則な置換は根本的なオープンな問題のままである。
ランダムな2n$-bit置換でゼロペアを見つけるには、少なくとも$Omega(2n/2)$多くのクエリが必要である。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 00:28:43 GMT)
Chiral Dissociation of Bound Photon Pairs for a Non-Hermitian Skin Effect [49.2] 原子配列に冷間結合した導波路内を伝播する相互作用光子の束縛状態について検討した。
我々は、束縛された光子対が配列の端に集中し、非エルミート皮膚効果とリンクできることを実証する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:44:00 GMT)
Focus On This, Not That! Steering LLMs With Adaptive Feature Specification [48.3] Focus Instruction Tuning (FIT)は、大きな言語モデルを訓練し、他を無視しながら特定の特徴に注目して応答を条件付けする。
焦点調整されたモデルは、推論時に異なる特徴に焦点を合わせることで適応的に操縦できることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 11:26:02 GMT)
Bridging conformal field theory and parton approaches to SU(n)_k chiral spin liquids [48.2] 共形場理論では SU(n)_k Wess-Zumino-Witten (WZW) モデルを用いて1次元と2次元の格子波関数を構成する。
一次元では、これらの波動関数は、普遍性クラスが構築に使用されるWZWモデルと1対1で対応している臨界スピン鎖を記述する。
2次元において、我々の構造はキラルスピン液体のモデル波動関数を生成し、そのすべての位相セクターを体系的に見つける方法を示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:42:00 GMT)
Text-driven Adaptation of Foundation Models for Few-shot Surgical Workflow Analysis [47.7] Surg-FTDA (Few-shot Text-driven Adaptation) は、最小のペア画像ラベルデータを用いて様々な外科的ワークフロー解析タスクを処理するように設計されている。
まず、Few-shot選択に基づくモダリティアライメントは、画像の小さなサブセットを選択し、その埋め込みを下流タスクからのテキスト埋め込みと整合させる。
第二に、テキスト駆動型適応はテキストデータのみを活用してデコーダをトレーニングし、ペアのイメージテキストデータを必要としない。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:18:06 GMT)
Simplified and Generalized Masked Diffusion for Discrete Data [47.7] 離散データの生成モデリングのための自己回帰モデルの代替として、マスケッド拡散(または吸収拡散)が積極的に研究されている。
本研究の目的は,マスク拡散モデルの潜在能力を最大限に活用する,シンプルで汎用的なフレームワークを提供することである。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:46:16 GMT)
Creating Virtual Environments with 3D Gaussian Splatting: A Comparative Study [47.1] 3D Gaussian Splatting (3DGS)は革新的で効率的な3D表現技術として登場した。
仮想環境(VE)生成のための3つの異なる3DGSベースのアプローチについて検討し,その特徴を有効かつ視覚的に魅力的なシーン表現に活用する。
我々は,没入型VEの作成における3DGSの実現可能性を評価し,XRアプリケーションにおけるその限界を特定し,今後の研究開発の機会について論じる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 05:37:29 GMT)
Flexible task abstractions emerge in linear networks with fast and bounded units [47.1] 重みとゲートが勾配降下によって協調的に最適化される線形ゲートネットワークを解析する。
その結果,タスクの抽象化はタスクとサブタスクの合成による一般化を支援することがわかった。
我々の研究は、シナプス的および神経的ゲーティングにおける関節勾配降下から生じる動物の認知的柔軟性の理論を提供する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:12:29 GMT)
Making Your Dreams A Reality: Decoding the Dreams into a Coherent Video Story from fMRI Signals [46.9] 本稿では,マルチメディアコミュニティにおける勇敢な新しいアイデアについて考察し,夢をコヒーレントなビデオ物語に変換するための新しい枠組みを提案する。
脳イメージングの最近の進歩、特に機能的磁気共鳴イメージング(fMRI)は、夢の神経基盤を探索する新しい方法を提供してきた。
主観的な夢体験と客観的な神経生理学的データを組み合わせることで、夢の視覚的側面を理解し、完全なビデオ物語を作成することを目指す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:03:49 GMT)
The Learning Stabilizers with Noise problem [46.6] 雑音のある学習パリティ(Learning Parity with Noise, LPN)問題は、雑音の存在下でランダムな線形コードを復号するタスクとみなすことができる。
LSNは特殊なケースとして含まれており、これは古典的なケースと同程度に難しいことを示唆している。
我々は、量子ビットスキームの構築から量子データからの学習の計算限界まで、LSN仮定のいくつかの応用を同定する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 00:11:15 GMT)
FutureDepth: Learning to Predict the Future Improves Video Depth Estimation [46.4] FutureDepthは、マルチフレームとモーションキューを暗黙的に活用して深度推定を改善するビデオ深度推定手法である。
本論文では,FutureDepthがベースラインモデルを大幅に改善し,既存のビデオ深度推定法より優れ,新しい最先端(SOTA)の精度が設定できることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:58:31 GMT)
Universal quantum computation via scalable measurement-free error correction [45.3] 本研究では,中間回路計測を行なわずに誤り訂正を行うシナリオにおいて,普遍的な量子計算をフォールトトレラントにすることができることを示す。
論理的な$mathitCCZ$ゲートを実現するため,Bacon-Shor符号の無測定変形プロトコルを導入する。
特に,回路レベルのエラーレートが10~3ドル以下であれば,破れない論理性能が達成可能であることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:22:51 GMT)
A General Framework for Inference-time Scaling and Steering of Diffusion Models [45.3] Feynman Kac (FK) ステアリングは、報酬関数を持つ拡散モデルをステアリングするための推論時フレームワークである。
FKステアリングは、粒子と呼ばれる複数の相互作用する拡散過程の系をサンプリングし、中間ステップで粒子を再サンプリングすることで機能する。
テキスト・ツー・イメージとテキスト拡散モデルを用いたFKステアリングの評価を行った。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:18:14 GMT)
SD-Eval: A Benchmark Dataset for Spoken Dialogue Understanding Beyond Words [45.3] 音声対話理解と生成の多次元評価を目的としたベンチマークデータセットであるSD-Evalを提案する。
3つの異なるモデルを実装し、SD-Evalと同様のプロセスに従ってトレーニングセットを構築する。
パラ言語的・環境的な情報を条件付けしたモデルは、客観的・主観的尺度の両方において、相手よりも優れている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:34:36 GMT)
ComplexVAD: Detecting Interaction Anomalies in Video [45.1] 本稿では,新しい大規模異常検出データセットである ComplexVAD を紹介する。
さらに,映像属性付きシーングラフを用いてオブジェクト間の相互作用をモデル化することにより,複雑な異常を検出する手法を提案する。
提案手法と他の2つの最先端ビデオ異常検出手法を用いて,コンプレックスVADのベースラインスコアを取得し,本手法が既存手法より優れていることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:35:45 GMT)
Efficient Few-Shot Medical Image Analysis via Hierarchical Contrastive Vision-Language Learning [45.0] 医用画像解析のための階層的コントラストアライメント(HiCA)を用いた適応型視覚言語ファインタニングを提案する。
HiCAは、ドメイン固有の事前学習と階層的コントラスト学習を組み合わせて、視覚的およびテキスト的表現を複数のレベルで整列させる。
我々はChest X-rayとBreast Ultrasoundという2つのベンチマークデータセットに対するアプローチを評価した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 05:01:30 GMT)
MoE$^2$: Optimizing Collaborative Inference for Edge Large Language Models [43.8] 大規模言語モデル (LLM) は、幅広い自然言語処理タスクにおいて顕著な機能を示した。
エッジLLMのための新しい協調推論フレームワークである textitMixture-of-Edge-Experts (MoE$2$) を紹介する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:36:32 GMT)
Contrastive Policy Gradient: Aligning LLMs on sequence-level scores in a supervised-friendly fashion [43.8] コントラストポリシーグラディエント(Contrastive Policy Gradient, COPG)は、単純かつ数学的に原理化された新しいRLアルゴリズムである。
本稿では,直接アライメント手法のIPO(アイデンティティ優先最適化)と古典的政策勾配を一般化する手法を提案する。
提案したCOPGをおもちゃのバンディット問題で実験し,その特性を説明するとともに,要約タスクでLLMを微調整する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:54:59 GMT)
PAL: Prompting Analytic Learning with Missing Modality for Multi-Modal Class-Incremental Learning [42.0] マルチモーダルクラスインクリメンタルラーニング(MMCIL)は、音声と視覚、画像とテキストのペアのようなマルチモーダルデータを活用する。
重要な課題は、漸進的な学習フェーズにおけるモダリティの欠如である。
PALは, MMCILに適合した, モダリティの欠如を前提とした, 斬新なフレームワークである。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:04:04 GMT)
Balancing Act: Prioritization Strategies for LLM-Designed Restless Bandit Rewards [41.1] 本稿では,人選好に基づく報酬関数のトレードオフを扱うための社会選択言語モデルを提案する。
実験により、我々のモデルはより効果的で、整合性があり、バランスの取れた報酬関数を確実に選択できることを示した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:44:22 GMT)
Fabrication of Mode-Matched, Low-Loss Optical Resonators by Combination of FIB-Milling and CO$_2$ Laser Ablation [40.3] 集束イオンビームミリングとCO$レーザーアブレーションを用いたファブリペロキャビティの新製法を提案する。
この技術は、幅広い光学基板上の低損失光学のカスタマイズと繰り返し可能な製造を可能にする。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:53:05 GMT)
CMRxRecon2024: A Multi-Modality, Multi-View K-Space Dataset Boosting Universal Machine Learning for Accelerated Cardiac MRI [40.1] CMRxRecon2024データセットは、最も大きく、最もプロトカルなディバースで公開されている心臓k空間データセットである。
健常者330名から取得され、一般的に使用されるモダリティ、解剖学的視点、臨床心臓MRIにおける獲得軌跡をカバーしている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 06:46:18 GMT)
Point-PRC: A Prompt Learning Based Regulation Framework for Generalizable Point Cloud Analysis [39.9] 近年の研究では、パラメータ効率のよいプロンプトチューニングにより、3次元点雲認識の性能が著しく向上できることが示されている。
本稿では,学習可能なプロンプトが大規模3次元モデルにおいて,よく学習された一般知識と積極的に対話することを可能にする包括的規制フレームワークを提案する。
意外なことに,本手法は,一貫した一般化能力の向上だけでなく,様々な3DDGベンチマークにおけるタスク固有の3D認識性能を明確なマージンで向上させる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 07:26:52 GMT)
IFRA: a machine learning-based Instrumented Fall Risk Assessment Scale derived from Instrumented Timed Up and Go test in stroke patients [39.8] IFRA は Instrumented Fall Risk Assessment の略。
IFRAスケールで考慮される特徴は、歩行速度、座-歩行遷移中の垂直加速度、角速度の旋回である。
IFRAは、転倒者の半分以上を高リスク層に正しく割り当てる唯一の尺度である。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:20:22 GMT)
BLEnD: A Benchmark for LLMs on Everyday Knowledge in Diverse Cultures and Languages [39.2] 大型言語モデル(LLM)は、特に多種多様な地域や非英語言語において、日常生活に関する文化特有の知識を欠いていることが多い。
BLEnDはLLMの日常的な知識を様々な文化や言語で評価するために設計された手作りのベンチマークである。
提案手法は,短問合せと複数問合せの2つの形式を含むベンチマークを構築した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 01:41:48 GMT)
Neural Honeytrace: A Robust Plug-and-Play Watermarking Framework against Model Extraction Attacks [39.1] モデル抽出攻撃に対する堅牢なプラグアンドプレイ透かしフレームワークであるNeural Honeytraceを提案する。
Neural Honeytraceは、最悪のケースであるt-Testベースの著作権主張に必要なサンプルを、トレーニングコストゼロで12,000ドルから200ドルに削減する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 06:59:20 GMT)
Evaluating Conversational Recommender Systems with Large Language Models: A User-Centric Evaluation Framework [38.9] 本研究では,LCMを用いたCRS自動評価フレームワークを提案する。
これは、人間とコンピュータの相互作用と心理学に関する既存の研究に基づいている。
このフレームワークを用いて、4つの異なる対話レコメンデーションシステムを評価する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:06:56 GMT)
Bayesian Low-Rank LeArning (Bella): A Practical Approach to Bayesian Neural Networks [38.8] ベイズニューラルネットワーク(BNN)の計算負担を軽減するための革新的な枠組みを導入する。
提案手法は,ディープアンサンブルに基づくベイズ的手法の原理に従っているが,事前学習されたニューラルネットワークから生じるパラメータの低ランク摂動により,コストを大幅に削減する。
バニラ版のアンサンブルと、Stein Variational Gradient Descent (SVGD)を用いたベイズ学習のようなより洗練されたスキームは、提案フレームワーク内でシームレスに実装できる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:45:36 GMT)
MERaLiON-AudioLLM: Bridging Audio and Language with Large Language Models [37.9] シンガポールの多文化景観に合わせた最初の音声テキストモデルであるMERaLiON-AudioLLMを紹介する。
MERaLiON-AudioLLMは、局所的なアクセントや方言の多様な言語的ニュアンスに対処するために、高度な音声処理とテキスト処理を統合している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:29:23 GMT)
ReFactor GNNs: Revisiting Factorisation-based Models from a Message-Passing Perspective [36.7] 本稿では、ReFactor GNNを提案することにより、因子モデル(FM)とグラフニューラルネットワーク(GNN)のギャップを埋める。
我々は、勾配降下手順をメッセージパッシング操作として再構成することにより、FMをGNNとしてキャストする方法を示す。
我々のGNNは、FMに匹敵するトランスダクティブ性能と最先端のインダクティブ性能を実現し、パラメータの桁数を桁違いに減らした。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:56:56 GMT)
A Near-optimal Algorithm for Learning Margin Halfspaces with Massart Noise [36.3] 我々は、マスアートノイズの存在下で、PACが$gamma$-marginハーフスペースを学習する際の問題について検討する。
我々のアルゴリズムは単純で実用的であり、慎重に選択された凸損失の列にオンラインSGDを頼っている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:44:18 GMT)
On the uncertainty principle of neural networks [36.1] ニューラルネットワークは、敵攻撃に対して高い精度と堅牢性を同時に達成する能力において、基本的な限界として現れる不確実性関係の対象であることが示される。
量子物理学の基盤である相補性原理がニューラルネットワークに適用され、共役特徴の同時学習におけるそれらの能力に根本的な制限が課されることが明らかとなった。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 11:16:40 GMT)
StructSR: Refuse Spurious Details in Real-World Image Super-Resolution [35.2] StructSRは、構造的忠実性を高め、拡散に基づくReal-ISRの急激な詳細を抑制する、シンプルで効果的で、プラグアンドプレイの手法である。
中心となるのがStructure-Aware Screeningメカニズムで、初期の推論段階での低解像度(LR)入力と最も構造的に類似したイメージを識別する。
実験の結果,StructSRは構造とテクスチャの忠実度を著しく改善し,PSNRおよびSSIMの指標を合成データセット(DIV2K-Val)で平均5.27%,9.36%,2で4.13%,8.64%改善した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:20:11 GMT)
Style4Rec: Enhancing Transformer-based E-commerce Recommendation Systems with Style and Shopping Cart Information [34.3] Style4Recはトランスフォーマーベースのeコマースレコメンデーションシステムである。
スタイルとショッピングカート情報を利用して、既存のシーケンシャルな製品レコメンデーションシステムを強化する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:05:39 GMT)
Intra-day Solar and Power Forecast for Optimization of Intraday Market Participation [34.3] 太陽光照射の予測により、太陽光発電(PV)発電とグリッド統合の信頼性が向上する。
本研究は, 長短期記憶(LSTM)モデルとBi-LSTMモデルを用いて, 6時間の地平線と10分間の分解能で太陽光照射を予測する。
LSTM予測は平均して時間分解能モデルを作成し、平均絶対誤差、ルート平均二乗誤差、正規化ルート平均二乗誤差、平均絶対二乗誤差を用いて評価した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:12:03 GMT)
WMamba: Wavelet-based Mamba for Face Forgery Detection [34.2] ウェーブレット解析は、空間領域で認識できない微妙な偽造品を発見できる。
We introduced WMamba, a novel wavelet-based feature extractor built on the Mamba architecture。
We show that WMamba achieves state-of-the-art (SOTA) performance, highlighting its effectiveness and superiority in face forgery detection。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:44:24 GMT)
A Simple Aerial Detection Baseline of Multimodal Language Models [33.9] LMMRotateという,マルチモーダル空中検出を初めて適用するための簡単なベースラインを提案する。
オープンソースの汎用性を微調整してベースラインを構築し,従来の検出器に匹敵する優れた検出性能を実現する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:09:22 GMT)
VIS-MAE: An Efficient Self-supervised Learning Approach on Medical Image Segmentation and Classification [33.7] 医用画像に特化して設計された新しいモデルウェイトであるVisualization and Masked AutoEncoder(VIS-MAE)について述べる。
VIS-MAEは、様々なモダリティから250万枚の未ラベル画像のデータセットで訓練されている。
その後、明示的なラベルを使って分類とセグメンテーションのタスクに適応する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:45:29 GMT)
Monte Carlo Tree Search for Comprehensive Exploration in LLM-Based Automatic Heuristic Design [33.6] 大規模言語モデル(LLM)に基づく自動設計(AHD)手法は,手作業による介入なしに高品質な言語を生成することを約束している。
木構造中のLLM生成物を保存しながら, LLMに基づく進化にMCTS(Monte Carlo Tree Search)を適用することを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:57:03 GMT)
Towards Large Reasoning Models: A Survey of Reinforced Reasoning with Large Language Models [33.1] 大規模言語モデル(LLM)は、複雑な推論タスクに対処するためにそれらを活用することに大きな研究の関心を呼んだ。
最近の研究は、LLMがテスト時間推論中により多くのトークンで"考える"ことを奨励することは、推論の精度を著しく向上させることを示した。
OpenAIのo1シリーズの導入は、この研究の方向性において重要なマイルストーンである。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:37:58 GMT)
A New Teacher-Reviewer-Student Framework for Semi-supervised 2D Human Pose Estimation [33.0] 新しく設計された教師-視聴者-学生の枠組みを利用して,新しい半教師付き2次元ポーズ推定手法を提案する。
具体的には、まず、人類がフレームワークを設計するための統合のための以前の知識を常にレビューする現象を模倣する。
第2に、バックボーンの異なるステージからの出力を利用して、ヒートマップを推定し、ネットワークトレーニングをガイドするマルチレベル特徴学習戦略を導入する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:40:02 GMT)
An Overview of CV-MDI-QKD [32.7] 量子鍵分布(QKD)は、量子コンピュータの脅威に対する堅牢な防御として現れる。
本稿では,CV-MDI-QKDプロトコルにおけるこれらの方法論の統合について述べる。
それは、その進化、主要な特徴、そして理論と実験の両方における最新の進歩を詳細に探求する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 20:09:23 GMT)
Convex Markov Games: A Framework for Creativity, Imitation, Fairness, and Safety in Multiagent Learning [32.0] コンベックス・マルコフゲーム(英語版)のクラスを導入し、占有度よりも一般的なコンベックス・プレイスを可能にする。
無限の時間的地平線とマルコフゲームよりも厳密な一般性にもかかわらず、純粋な戦略ナッシュ平衡が存在する。
実験により,従来の常連型ゲームに対する新しい解法,不斉協調ゲームにおける公正な解法,ロボット倉庫環境における安全な長期行動の優先順位が明らかにされた。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:42:59 GMT)
A Survey on Responsible LLMs: Inherent Risk, Malicious Use, and Mitigation Strategy [31.8] 大規模言語モデル(LLM)は、多くの現実世界のアプリケーションをサポートする大きな可能性を秘めている。
プライバシー漏洩のリスク、幻覚的なアウトプット、そして価値のミスアライメントといった点で、彼らは依然として重大な課題に直面している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:59:45 GMT)
The Dark Side of Rich Rewards: Understanding and Mitigating Noise in VLM Rewards [31.8] VLM(Vision-Language Models)は、エンボディエージェントを訓練するための報酬信号を生成するために使われるようになっている。
我々の研究によると、VLM報酬によって誘導されるエージェントは、本質的な報酬のみを使用するエージェントに比べて、しばしばパフォーマンスが劣っている。
ノイズを緩和する新しい報奨関数であるBiMIを導入する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 23:59:18 GMT)
DynST: Dynamic Sparse Training for Resource-Constrained Spatio-Temporal Forecasting [31.4] 地球科学システムは、センサーの広範な展開に大きく依存している。
従来のセンサー配置アプローチでは、特定のアルゴリズムを使用してセンサーを設計および展開する。
本稿では,スパース時間データダイナミックスパーストレーニングの概念を初めて紹介し,適応的かつ動的に重要な分布センサをフィルタリングすることにコミットする。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 02:10:39 GMT)
Learnings from Scaling Visual Tokenizers for Reconstruction and Generation [30.9] 自動エンコーディングによるビジュアルトークン化は、ピクセルを潜在空間に圧縮することで、最先端の画像およびビデオ生成モデルを促進する。
私たちの研究は、この空白を埋めるために自動エンコーダのスケーリングを調査することを目的としています。
我々は、ImageNet-1Kを超える大規模な画像およびビデオデータセット上でViTokをトレーニングし、トークンのスケーリングに関するデータ制約を取り除く。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:59:04 GMT)
Double Visual Defense: Adversarial Pre-training and Instruction Tuning for Improving Vision-Language Model Robustness [30.9] 本稿では,対角的視覚摂動に対する視覚言語モデルの堅牢性について検討する。
我々は、Webスケールデータを用いて、スクラッチから大規模な対角視言語事前学習を行う。
次に、対角的視覚的指導のチューニングを取り入れて防御を強化する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:20:48 GMT)
Beyond Reward Hacking: Causal Rewards for Large Language Model Alignment [30.6] 本稿では,因果推論を統合し,素因果関係を緩和する因果報酬モデリング手法を提案する。
提案手法は様々な種類のスプリアス相関を効果的に緩和し,LLMと人間の嗜好との整合性を高めた。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:00:37 GMT)
Joint Transmission and Deblurring: A Semantic Communication Approach Using Events [30.6] 効率的な画像伝送のための有望な技術として,ディープラーニングに基づくジョイントソースチャネル符号化(JSCC)が登場している。
既存のアプローチでは、カメラの揺れや動きの速い物体によって引き起こされる動きのぼやけなど、現実世界の課題を見越して、鮮明なイメージの伝達に重点を置いている。
本稿では,限られた帯域幅で高品質な再構成を実現することを目的とした,ぼやけた画像やイベントを共同送信するための新しいJ SCCフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:07:01 GMT)
Leveraging Scale-aware Representations for improved Concept-Representation Alignment in ViTs [29.9] 概念表現アライメントモジュール(CRAM)は、多スケールの特徴ピラミッドとパッチ表現から、スケールと位置認識の両方の表現を学習する。
CRAMはさらに、これらの表現をアテンションマトリックスを通じて概念アノテーションと整合させる。
提案したCRAMモジュールは、ViTアーキテクチャの予測性能を改善し、正確で堅牢な概念説明を提供する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 00:45:05 GMT)
Direct Unlearning Optimization for Robust and Safe Text-to-Image Models [29.9] モデルが潜在的に有害なコンテンツを生成する能力を取り除くために、未学習の技術が開発されている。
これらの手法は敵の攻撃によって容易に回避され、生成した画像の安全性を確保するには信頼性が低い。
T2IモデルからNot Safe For Work(NSFW)コンテンツを除去するための新しいフレームワークであるDirect Unlearning Optimization (DUO)を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:08:57 GMT)
Prompt-CAM: A Simpler Interpretable Transformer for Fine-Grained Analysis [29.8] 事前訓練された視覚変換器(ViT)は、局所的かつ情報的特徴を抽出する顕著な能力を示した。
本稿では,救助活動のための新しいアプローチであるPrompt Class Attention Map(Prompt-CAM)を提案する。
Prompt-CAMは、事前訓練されたViTへのクラス固有のプロンプトを学習し、対応する出力を分類に使用する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 07:07:41 GMT)
Crafting Customisable Characters with LLMs: Introducing SimsChat, a Persona-Driven Role-Playing Agent Framework [29.2] 大きな言語モデル(LLM)は、命令を理解し、人間に似たテキストを生成する素晴らしい能力を示す。
実世界のキャラクターをシミュレートするためにLLMを利用するCustomisable Conversation Agent Frameworkを導入する。
我々は,様々な現実的な設定を取り入れた自由にカスタマイズ可能なロールプレイングエージェントであるSimsChatを紹介する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:47:58 GMT)
Boosting Latent Diffusion with Perceptual Objectives [29.1] 遅延拡散モデル (LDMs) パワー・オブ・ザ・アート高分解能画像モデル。
我々は,遅延知覚損失(LPL)を定義するためにデコーダの内部的特徴を活用することを提案する。
この損失により、モデルはよりシャープでリアルなイメージを作成することができる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:59:35 GMT)
Tessellated Linear Model for Age Prediction from Voice [29.0] Tessellated Linear Model (TLM) は、線形モデルの単純さと非線形関数のキャパシティを組み合わせた一括線形アプローチである。
TIMITデータセットを用いた音声から年齢予測を行い,その精度は最先端のディープラーニングモデルよりも優れていた。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 01:28:45 GMT)
Surveying Attitudinal Alignment Between Large Language Models Vs. Humans Towards 17 Sustainable Development Goals [29.0] 大規模言語モデル(LLM)は、国連の持続可能な開発目標を推進するための強力なツールとして登場した。
本研究は, LLM の17 SDG に対する態度に関する文献の総合的なレビューと分析を行う。
本研究は,理解と感情,文化的・地域的差異,課題目的の変化,意思決定プロセスにおいて考慮される要因など,潜在的な相違について検討する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 02:45:07 GMT)
TPIA: Towards Target-specific Prompt Injection Attack against Code-oriented Large Language Models [28.8] 本稿では,標的特異的プロンプトインジェクション攻撃(TPIA)という,コードLLMに対する新たな攻撃パラダイムを提案する。
TPIAは悪意のある命令の情報を含む非機能的摂動を生成し、被害者のコードコンテキストに挿入する。
我々のTPIAは、3つの代表的なオープンソースコードLLMと、2つの主要な商用コードLLM統合アプリケーションにうまく対応できることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 07:50:07 GMT)
Smoothness Really Matters: A Simple Yet Effective Approach for Unsupervised Graph Domain Adaptation [28.2] Unsupervised Graph Domain Adaptation (UGDA)は、ラベル付きソースグラフからの知識をラベル付きターゲットグラフに転送することで、ドメイン間の分散シフトをブリッジする。
TDSS(Target-Domain Structure Smoothing)と呼ばれるUGDAのための新しいアプローチを提案する。
TDSSは、ターゲットグラフ上で直接構造的滑らか化を行うための、シンプルで効果的な方法である。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:04:10 GMT)
CLAP-S: Support Set Based Adaptation for Downstream Fiber-optic Acoustic Recognition [28.0] CLAP(Contrastive Language-Audio Pretraining)モデルは、音響信号認識タスクにおいて前例のない性能を示した。
本稿では,CLAP 適応器と CLAP 適応器を線形に補間するサポートベース適応手法 CLAP-S を提案する。
実験結果から,実験室で記録した光ファイバーESC-50データセットと実世界の光ファイバーショットファイアワークデータセットの両方で競合性能が得られた。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 23:22:17 GMT)
Text-guided Synthetic Geometric Augmentation for Zero-shot 3D Understanding [27.8] Textguided Geometric Augmentation (TeGA)は、ゼロショット3D分類においてSoTAを実現する言語イメージ3D事前訓練用に調整されている。
我々は,TeGAが3Dデータギャップを効果的に橋渡しし,実際の訓練データに限りなく頑健なゼロショット3D分類を可能にすることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:54:06 GMT)
aiXcoder-7B: A Lightweight and Effective Large Language Model for Code Processing [26.9] 本稿では,aiXcoder-7Bというコード補完のための軽量で効果的なLarge Language Model (LLM)を提案する。
既存のLLMと比較して、aiXcoder-7Bはより小さなスケール(70億のパラメータ)で高いコード補完精度を達成する。
我々は,aiXcoder-7Bの優位性を,(1)多目的学習,(2)多種多様なデータサンプリング戦略,(3)広範囲な高品質データという3つの重要な要因とみなす。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:46:53 GMT)
Towards an End-to-End (E2E) Adversarial Learning and Application in the Physical World [26.8] 本稿では,デジタルドメインからの逆学習をプロジェクタを用いて物理ドメインに変換する,新しいエンドツーエンド(E2E)フレームワークであるPAPLAフレームワークを提案する。
実験室の環境や現実的な屋外環境など,様々なシナリオでPAPLAを評価した。
以上の結果から,物理領域におけるE2E対角学習は伝達可能性の問題を取り除き,物体検出装置による回避を確実にすることがわかった。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:55:41 GMT)
Geometric Distortion Guided Transformer for Omnidirectional Image Super-Resolution [26.8] GDGT-OSR (Geometric Distortion Guided Transformer for Omdirectional Image Super-Resolution) について紹介する。
具体的には、変形可能な自己アテンションと統合された歪変調矩形ウィンドウ自己アテンション機構を提案し、歪みをよりよく知覚する。
新たなGDGT-OSRは既存の文献の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:06:16 GMT)
Towards Balanced Continual Multi-Modal Learning in Human Pose Estimation [26.5] 人間の3次元ポーズ推定(3D HPE)は、特にRGBベースの手法の領域において顕著な研究トピックとして現れている。
RGB, LiDAR, mmWave, WiFiの電力を利用する3次元HPEのための, バランスの取れた連続マルチモーダル学習手法を提案する。
広義のマルチモーダルデータセットMM-Fiについて広範囲に実験を行い、3次元ポーズ推定の高速化におけるアプローチの優位性を実証した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 02:39:20 GMT)
Diatomic and Polyatomic Heteronuclear Ultralong-Range Rydberg Molecules [25.4] 超長距離リドバーグ分子(ULRM)は、そのユニークな電子的性質と量子技術への応用により、大きな関心を集めている。
我々は、Rb-Cs系に着目したヘテロ核ULRMの形成と特性を理論的に検討した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 04:07:25 GMT)
Multi-hop Upstream Anticipatory Traffic Signal Control with Deep Reinforcement Learning [24.7] 交通信号制御のコーディネーションは,都市ネットワークにおける混雑管理に不可欠である。
我々の研究はマルコフ連鎖理論に基づく新しい概念、すなわちテクティットマルチホップ上流圧力を導入している。
この遠視的かつコンパクトなメトリクスは、深層強化学習エージェントにマルチホップアップストリームキューをプリエンプティブにクリアするように通知する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 21:09:57 GMT)
Large Language Model is Secretly a Protein Sequence Optimizer [24.6] 本研究では,与えられた野生型配列から,高い適合度を持つタンパク質配列を見つけることを目的としたタンパク質配列工学的問題を考える。
大規模言語モデル(LLM)は、大量のテキストで訓練されているにもかかわらず、秘密裏にタンパク質配列であることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:44:16 GMT)
Mitigating Hallucinations in Large Vision-Language Models via DPO: On-Policy Data Hold the Key [24.2] 幻覚は、LVLM(Large Vision-Language Models)にとって大きな課題である。
本稿では,専門家のフィードバックを一意に活用して幻覚応答を補正するOn-Policy Alignment (OPA)-DPOフレームワークを提案する。
OPA-DPOは、AMBERベンチマークで13.26%、Object-Halベンチマークで5.39%のLLaVA-1.5-7Bの幻覚率をさらに低下させる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:48:03 GMT)
FASP: Fast and Accurate Structured Pruning of Large Language Models [24.2] FASP(Fast and Accurate Structured Pruning)は,大規模言語モデル(LLM)のための新しい構造化プルーニングフレームワークである。
FASPはシーケンシャルなレイヤを相互にリンクする独自のプルーニング構造を採用しており、同時に前のレイヤで対応する行を削除しながら、追加のパフォーマンス損失を発生させることなく、ひとつのレイヤで列を削除できる。
我々は,OPTおよびLLaMAモデルファミリー上でのFASPを評価し,最先端の手法と比較して,下流タスクの難易度と精度において優れた性能を示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:38:39 GMT)
Fine-Grained Image-Text Correspondence with Cost Aggregation for Open-Vocabulary Part Segmentation [24.1] Open-Vocabulary Part (OVPS) は、未確認のカテゴリにおいて、きめ細かい部分を認識するための新興分野である。
OVPSの主な課題は,部分レベルの画像テキスト対応の整合性の難しさと,分割対象部分の構造的理解の欠如である。
本稿では,DINOから,オブジェクト認識型部分的コストアグリゲーション,構成的損失,構造的ガイダンスを統合した新しいフレームワークであるPartCATSegを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:40:19 GMT)
Statistical Efficiency of Distributional Temporal Difference Learning and Freedman's Inequality in Hilbert Spaces [24.0] 本稿では,分布時間差学習における非漸近的統計率に着目した。
生成モデルを用いたNTDの場合、$tildeO(varepsilon-2 mu_pi,min-1 (1-gamma)-3+t_mixmu_pi,min-1 (1-gamma)-1)$サンプル複雑性境界はワッサーシュタイン距離が1ドルである場合に必要である。
我々は新しいフリードマンの不平等を樹立する
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:31:46 GMT)
SPRec: Leveraging Self-Play to Debias Preference Alignment for Large Language Model-based Recommendations [23.9] 大規模言語モデル(LLM)はレコメンデーションシステムにおいて大きな注目を集めている。
直接選好最適化(DPO)は、オフライン選好ランキングデータを用いて、ユーザの選好に合わせてレコメンデーションを調整する。
その利点にもかかわらず、DPOは本質的にモデルをいくつかの項目に偏り、フィルタバブル問題を悪化させ、究極的にはユーザエクスペリエンスを低下させます。
SPRecは、過剰勧告を緩和し、追加のデータや手動による介入を必要とせずに公平性を向上させるために設計された、新しいセルフプレイレコメンデーションフレームワークである。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:38:42 GMT)
A Simple Graph Contrastive Learning Framework for Short Text Classification [23.4] 短文分類のための簡易グラフコントラスト学習フレームワーク(SimSTC)を提案する。
本手法は,マルチビュー・コントラッシブ・ラーニングの利点を生かしながら,コントラスト・ビューを生成するためのデータ拡張操作を不要とする。
その単純さにもかかわらず、我々のモデルは優れた性能を達成し、様々なデータセット上の大きな言語モデルを上回っている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 00:35:56 GMT)
A Study of In-Context-Learning-Based Text-to-SQL Errors [23.3] 本研究は,テキスト・トゥ・コレクト・エラーの総合的研究である。
テキストの正当性エラーは広範囲に及んでおり、29種類の7カテゴリのエラータイプが要約されている。
本稿では,新しいテキスト間エラー検出・修復フレームワークMapleRepairを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 05:54:59 GMT)
HydraMix: Multi-Image Feature Mixing for Small Data Image Classification [22.6] そこで,HydraMixを提案する。HydraMixは,同じクラスから複数の異なるイメージを混合することによって,新しい画像合成を生成する新しいアーキテクチャである。
以上の結果から,HydraMixは既存の画像分類手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:33:48 GMT)
Practical Spoofing Attacks on Galileo Open Service Navigation Message Authentication [22.5] 本稿では,Galileo Open Service Navigation Message Authentication (OSNMA)について検討する。
人工的に操作された時間同期(ATS)と割り込み可能なメッセージ認証(IMA)という2つの重大な脆弱性を発見した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 02:16:53 GMT)
Estimating shared subspace with AJIVE: the power and limitation of multiple data matrices [22.3] 本稿では,マルチマトリックス設定における共有部分空間推定の体系的解析を行う。
2段階のスペクトルアプローチであるAJIVE法に焦点をあてた。
本研究では,高信号-雑音比(SNR)法では,行列数に応じてAJIVEの推定誤差が減少することを示す。
低SNR設定では、AJIVEは非縮小エラーを示し、基本的な制限を強調している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 07:23:26 GMT)
Robin: a Suite of Multi-Scale Vision-Language Models and the CHIRP Evaluation Benchmark [22.1] 近年のVLM(Vision-Language Models)の普及は、厳密で包括的な評価手法とベンチマークを求めている。
この研究は、自動化されたメトリクス、AIベースの評価、さまざまなタスクにわたる人的評価を含む、既存のVLM評価技術を分析する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:08:12 GMT)
Cooperative Decentralized Backdoor Attacks on Vertical Federated Learning [22.1] 本稿では,垂直フェデレートラーニング(VFL)に対する新たなバックドアアタックを提案する。
ラベル推論モデルでは,距離学習による変分オートエンコーダが強化され,相手がローカルに学習できる。
コンバージェンス解析により,トレーニングモデルの定常差によって示されるVFLに対するバックドアの摂動の影響が明らかになった。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 06:22:35 GMT)
Analyzing Continuous Semantic Shifts with Diachronic Word Similarity Matrices [21.9] 本稿では,複数の期間にわたって意味的変化が発生するための,シンプルかつ直感的なフレームワークを提案する。
任意の時間にまたがる高速かつ軽量な単語埋め込みを用いて、ダイアクロニックな単語類似度行列を計算する。
意味変化の類似した振る舞いを示す単語を教師なしの方法で分類することができる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:42:09 GMT)
The Devil is in the Details: Simple Remedies for Image-to-LiDAR Representation Learning [21.1] 我々は、空間的および時間的軸に沿って見過ごされた設計選択に焦点を当てる。
基本設計要素、例えばLiDAR座標系、既存の入力インタフェースによる量子化は、損失関数の開発よりも重要である。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 11:44:29 GMT)
Enhanced SPS Velocity-adaptive Scheme: Access Fairness in 5G NR V2I Networks [21.0] V2I技術は、車両と道路インフラ間の情報交換を可能にする。
本稿では、車両ネットワークの最適化問題を定式化する。
5G NR V2Iモード2のSPS機構における選択ウィンドウを調整し,多目的最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 06:44:29 GMT)
Sparsity-Aware Distributed Learning for Gaussian Processes with Linear Multiple Kernel [21.0] 本稿では,新しいGP線形多重カーネル (LMK) と,ハイパーパラメータを最適化する汎用空間認識分散学習フレームワークを提案する。
新たに提案されたグリッドスペクトル混合製品(GSMP)カーネルは,多次元データ用に調整されている。
そこで本研究では,Sparse LInear Multiple Kernel Learning (SLIM-KL) フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:33:37 GMT)
The Streaming Batch Model for Efficient and Fault-Tolerant Heterogeneous Execution [20.9] 本稿では, 効率的かつフォールトトレラントなヘテロジニアス実行を可能にする2つのモデルのハイブリッドであるストリーミングバッチモデルを紹介する。
我々は、従来のバッチ処理やストリーム処理システムと比較して、異種バッチ推論パイプラインのスループットを3~8$timesで改善するストリーミングバッチモデルの実装であるRay Dataを紹介する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 19:54:01 GMT)
DiffMesh: A Motion-aware Diffusion Framework for Human Mesh Recovery from Videos [20.9] ヒューマンメッシュリカバリ(Human Mesh recovery, HMR)は、さまざまな現実世界のアプリケーションに対して、リッチな人体情報を提供する。
ビデオベースのアプローチはこの問題を緩和するために時間的情報を活用する。
DiffMeshはビデオベースのHMRのための革新的な動き認識型拡散型フレームワークである。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 02:48:38 GMT)
Clone-Robust AI Alignment [20.4] Reinforcement Learning with Human Feedback (RLHF)は、人間アノテータのペア比較を用いて報酬関数を訓練する。
我々はRLHFアルゴリズムの望ましい特性である近似クローンにロバスト性を導入する。
我々は、標準正規化最大推定値を変更する新しいRLHFアルゴリズムである重み付きMLEを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 02:43:44 GMT)
EraseBench: Understanding The Ripple Effects of Concept Erasure Techniques [20.3] 概念消去技術は、テキスト・ツー・イメージ・モデルから不要な概念を取り除くことができる。
我々は,現在の概念消去技術の障害モードを体系的に検討する。
本稿では,概念消去手法をより深く評価するためのベンチマークであるEraseBENCHを紹介する。
以上の結果から,最先端技術でさえ品質維持に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 20:42:17 GMT)
KU AIGEN ICL EDI@BC8 Track 3: Advancing Phenotype Named Entity Recognition and Normalization for Dysmorphology Physical Examination Reports [20.2] BioCreative8 Track 3の目的は、EHRテキスト内に埋め込まれた表現型重要な医学的発見を抽出し、それらの発見をヒトフェノタイプオントロジー用語に標準化することである。
表現型発見における多彩な表面形態の存在は、それらを正しいHPO項に正確に正規化することを困難にしている。
その結果,F1の正確な抽出値と正規化値の2.6%が,課題に対する回答の平均値よりも高い値となった。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:53:32 GMT)
Mesh2SLAM in VR: A Fast Geometry-Based SLAM Framework for Rapid Prototyping in Virtual Reality Applications [20.1] SLAMは、ロボット工学とAR/VRに広く応用された基礎技術である。
本研究では,メッシュ幾何投影を特徴として用いたスパースフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:22:06 GMT)
Enhancing Lexicon-Based Text Embeddings with Large Language Models [19.9] 近年の大規模言語モデル (LLM) は汎用テキスト埋め込みタスクにおいて例外的な性能を示した。
LENSはトークン埋め込みクラスタリングを通じて語彙空間を集約し、双方向の注意と様々なプール戦略を研究する。
LENS は MTEB (Massive Text Embedding Benchmark) 上での高密度埋め込みよりも優れている
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:57:20 GMT)
Skinned Motion Retargeting with Dense Geometric Interaction Perception [19.8] 既存のアプローチはしばしば骨格運動後の身体矯正段階を見落としている。
この結果、幾何学的相互作用と幾何補正の対立が生じ、ジッタリー運動が生じる。
動きの密接な相互作用を直接モデル化するMeshRetrationを導入する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:58:44 GMT)
Go-with-the-Flow: Motion-Controllable Video Diffusion Models Using Real-Time Warped Noise [19.4] 本研究では,構造付き潜時雑音サンプリングによる動画拡散モデルの構築を行う。
本稿では,ランダムな時空間のガウス性と相関した雑音を置き換え,リアルタイムに動作可能な新しいノイズワープアルゴリズムを提案する。
提案アルゴリズムの効率性により,ワープノイズを最小限のオーバーヘッドで使用することで,最新の映像拡散ベースモデルを微調整することができる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 07:43:19 GMT)
Enhancing User Interest based on Stream Clustering and Memory Networks in Large-Scale Recommender Systems [19.3] ユーザ興味強化(UIE)は、ユーザプロファイルやユーザ履歴の動作シーケンスを含む、ユーザの関心を高める。
UIEは、関心の少ないユーザにおけるモデルパフォーマンスを著しく改善するだけでなく、他のユーザに対するモデルパフォーマンスを大幅に向上させる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:49:06 GMT)
On Learning Informative Trajectory Embeddings for Imitation, Classification and Regression [19.0] 実世界のシーケンシャルな意思決定タスクでは、観察された状態-行動軌跡から学ぶことは、模倣、分類、クラスタリングのようなタスクには不可欠である。
本稿では,動的意思決定プロセスにおけるスキルと能力の獲得を目的とした,状態行動軌跡を潜在空間に埋め込む新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 06:52:58 GMT)
Autonomous Algorithm for Training Autonomous Vehicles with Minimal Human Intervention [19.0] 強化学習(RL)アルゴリズムはシミュレーション運転環境において顕著な結果を示した。
RLアルゴリズムは、現実の自動運転車を直接訓練することで、忠実さギャップ問題を回避できる。
本稿では,人間による介入を最小限に抑えた自動運転車の訓練を可能にするアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 02:37:08 GMT)
SSD4Rec: A Structured State Space Duality Model for Efficient Sequential Recommendation [18.5] 本稿では,新しい汎用的かつ効率的なレコメンデーションバックボーンSSD4Recを提案する。
SSD4Recは、可変長のアイテムシーケンスをシーケンスレジスタでマークし、アイテム表現を双方向のStructured State Space Duality (SSD)ブロックで処理する。
本モデルは,ユーザシーケンス長のほぼ直線的スケーラビリティを維持しながら,最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:04:43 GMT)
PhysMamba: State Space Duality Model for Remote Physiological Measurement [18.4] リモート光胸腺撮影(remote Photoplethysmography, RBFC)は、顔画像から非接触的な生理的信号の抽出を可能にする。
この研究は、リアルタイム遠隔医療を含む非接触型健康モニタリングの実践的応用の基盤となる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 02:08:47 GMT)
Atleus: Accelerating Transformers on the Edge Enabled by 3D Heterogeneous Manycore Architectures [18.4] Atleusと呼ばれる3次元ヘテロジニアスアーキテクチャの設計を提案する。
Atleusには、トランスフォーマーモデルを加速するために特別に最適化された異種コンピューティングリソースが組み込まれている。
Atleusは, 性能およびエネルギー効率の点で, 既存の最先端技術よりも56倍, 64.5倍高い性能を示した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:11:33 GMT)
Perspective Transition of Large Language Models for Solving Subjective Tasks [18.3] パースペクティブ・トランジション(RPT)による推論(Reasoning through Perspective transition)は、LLMが直接、役割、第三者の視点を動的に選択できる、コンテキスト内学習に基づく手法である。
提案手法は,チェーン・オブ・シークレット・プロンプトやエキスパート・プロンプトといった,単一の固定視点に基づく手法よりも優れている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:30:47 GMT)
SVIA: A Street View Image Anonymization Framework for Self-Driving Applications [18.3] 自動運転アプリケーションのためのストリートビュー画像匿名化フレームワークを提案する。
SVIAフレームワークは、セマンティックセグメンタ、プライバシに敏感な領域の代替を生成するインペイント、修正された領域をシームレスに縫合するハーモナイザの3つの統合コンポーネントで構成されている。
既存の方法と比較して、SVIAは画像生成の品質とプライバシ保護のトレードオフをはるかに改善している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:05:46 GMT)
Revisiting Rogers' Paradox in the Context of Human-AI Interaction [18.0] 我々は、人間とAIの相互作用の文脈でロジャースのパラドックスを再考し、人間とAIシステムが一緒に学習する単純化されたネットワークを探索する。
我々は、単一の人間とAIのインタラクションに関わる様々な利害関係者が行うことができる戦略を考えます。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:09:57 GMT)
Task Vectors in In-Context Learning: Emergence, Formation, and Benefit [17.7] 合成データセットをスクラッチから学習したモデルを用いて, 制御された環境下でのタスクベクトルの生成について検討した。
その結果,特定の条件下ではタスクベクトルが自然に現れることが確認できたが,タスクは比較的弱く,あるいは非局所的にモデル内にコード化されている可能性がある。
モデル内の所定位置に符号化された強いタスクベクトルを促進するために,損失を促すタスクベクトルに基づく補助的なトレーニング機構を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 01:54:23 GMT)
MuFF: Stable and Sensitive Post-training MutationTesting for Deep Learning [17.6] 変異体の安定性を確保するために, MuFF と命名された新しい効率的なDL変異法を提案する。
MuFFはDeepMutation++とDeepCrimeと比較して60%、25%高い感度の変異体を生成する。
MuFFはポストトレーニング突然変異法の利点を保ち、DeepCrimeの61倍の速度で突然変異を生成する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 21:29:34 GMT)
Learning Noisy Halfspaces with a Margin: Massart is No Harder than Random [17.6] 我々は、マスアートノイズを伴う$gamma$-marginハーフスペースのPAC学習問題について検討する。
本稿では,サンプル複雑性を$widetildeO((epsilongamma)-2)$とする単純な固有学習アルゴリズムPerspectronを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 21:46:53 GMT)
Fast Searching of Extreme Operating Conditions for Relay Protection Setting Calculation Based on Graph Neural Network and Reinforcement Learning [17.5] 本稿では,グラフニューラルネットワークと深部強化学習を組み合わせたEOC高速探索手法であるGraph Dueling Double Deep Q Network (Graph D3QN)を提案する。
提案手法は,IEEE 39-bus と 118-bus のリレー保護設定計算のための探索故障電流のケーススタディにより検証された。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:11:48 GMT)
Delayed Fusion: Integrating Large Language Models into First-Pass Decoding in End-to-end Speech Recognition [17.4] 本稿では,大規模言語モデル(LLM)を用いたエンドツーエンド自動音声認識(E2E-ASR)の効率的な復号化手法を提案する。
復号時に遅延を伴うASR仮説にLLMスコアを適用する「遅延融合」を提案する。
遅延核融合により、浅い核融合やN-best再コーディングに比べてデコード速度と精度が向上することを示した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:01:50 GMT)
MERaLiON-TextLLM: Cross-Lingual Understanding of Large Language Models in Chinese, Indonesian, Malay, and Singlish [17.4] 本報告では,中国語,インドネシア語,マレー語,シングリッシュ語の理解と生成を改善するためのオープンソース言語モデルであるMERaLiON-TextLLMについて述べる。
提案手法は,これらの言語のベンチマークにおいて,公式のLlama-3モデルを上回る性能向上を実現する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 06:16:43 GMT)
DehazeGS: Seeing Through Fog with 3D Gaussian Splatting [17.1] DehazeGSは,霧のない背景をメディアから分解・レンダリングできる手法である。
合成と実世界の霧のデータセットの実験は、DehazeGSが最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:20:15 GMT)
Free-Knots Kolmogorov-Arnold Network: On the Analysis of Spline Knots and Advancing Stability [17.0] Kolmogorov-Arnold Neural Networks (KAN)は、機械学習コミュニティにおいて大きな注目を集めている。
しかしながら、それらの実装はトレーニングの安定性が悪く、重いトレーニング可能なパラメータに悩まされることが多い。
本研究では, スプラインノットのレンズによるカンの挙動を解析し, B-スプライン系カンの結び目数に対する上下境界を導出する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 04:12:05 GMT)
SynthLight: Portrait Relighting with Diffusion Model by Learning to Re-render Synthetic Faces [16.7] ポートレートライティングのための拡散モデルであるSynthLightを紹介する。
本手法では,環境照明条件の変化に応じて画素を変換する再レンダリング問題として,画像のリライティングを行う。
我々は、この照明条件の変換を、様々な照明の下で3Dヘッドアセットでシミュレートするデータセットを合成する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:59:48 GMT)
YETI (YET to Intervene) Proactive Interventions by Multimodal AI Agents in Augmented Reality Tasks [16.4] Augmented Reality (AR)ヘッドウェアは、日々の手続き的なタスクを解く際のユーザエクスペリエンスを一意に改善することができる。
このようなAR機能は、AIエージェントがユーザーのマルチモーダル機能に関連するアクションを見て耳を傾けるのに役立つ。
一方、AIエージェントのプロアクティビティは、人間が観察されたタスクのミスを検出し、修正するのに役立つ。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:06:02 GMT)
MECD+: Unlocking Event-Level Causal Graph Discovery for Video Reasoning [16.2] 新しいタスクとデータセットであるMulti-Event Causal Discovery (MECD)を導入する。
時系列的に長いビデオに分散したイベント間の因果関係を明らかにすることを目的としている。
我々は,効率的なマスクベースの事象予測モデルを用いて,Granger Causality法にインスパイアされた新しいフレームワークを考案した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:30:54 GMT)
VLG-CBM: Training Concept Bottleneck Models with Vision-Language Guidance [16.2] Concept Bottleneck Models (CBM) は解釈可能な予測を提供する。
CBMは人間の理解可能な概念を符号化し、モデルの判断を説明する。
本稿では,VLG-CBM(Vision-Language-Guided Concept Bottleneck Model)を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 05:42:28 GMT)
PeFLL: Personalized Federated Learning by Learning to Learn [16.2] PeFLLは,3つの側面で最先端の学習を改善する,個人化された新しいフェデレーション学習アルゴリズムである。
PeFLLの中核には、埋め込みネットワークとハイパーネットワークを共同でトレーニングする学習から学習へのアプローチがある。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:53:23 GMT)
LAVCap: LLM-based Audio-Visual Captioning using Optimal Transport [16.1] LAVCapは大型言語モデル(LLM)ベースの音声視覚キャプションフレームワークである。
視覚情報とオーディオを統合し、音声キャプション性能を向上させる。
既存のAudioCapsデータセットの最先端メソッドよりも優れています。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 04:53:29 GMT)
Fusion Self-supervised Learning for Recommendation [16.0] 本稿では,Fusion Self-supervised Learningフレームワークを提案する。
具体的には、GCNプロセスからの高次情報を用いてコントラストビューを作成します。
各種CL目標からの自己教師付き信号を統合するために,先進CL目標を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 02:17:21 GMT)
Holographic deep thermalization: theory and experimentation [16.0] 我々は,セキュアでハードウェア効率のよい量子乱数状態発生器であるホログラフィック深熱化を導入する。
スクランブル測度リセットプロセスのシーケンシャルな適用を採用することで、時間とともに空間を交換し、必要なアンシラサイズを大幅に削減する。
リソースの削減により、我々の回路ベースのIBM Quantumデバイスの実装は、合計8ドルキュービットしか利用せずに、真に5ドルキュービットのランダムな状態生成を実現した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 19:40:12 GMT)
ASTRA: A Scene-aware TRAnsformer-based model for trajectory prediction [15.6] ASTRA (A Scene-aware TRAnsformer based model for trajectory prediction) は軽量な歩行者軌道予測モデルである。
我々は、U-Netベースの特徴抽出器を用いて、その潜在ベクトル表現を用いて、シーン表現をキャプチャし、グラフ対応トランスフォーマーエンコーダを用いて、ソーシャルインタラクションをキャプチャする。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 23:28:30 GMT)
PIER: A Novel Metric for Evaluating What Matters in Code-Switching [15.4] コードスイッチングは音声認識において重要な課題である。
Word-Error-Rate (WER)のような一般的なメトリクスは、一般的にパフォーマンスを測定するために使われる。
We propose Point-of-interest Error Rate (PIER) is proposed WER is variant of WER which only focus on specific words of interest。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:57:33 GMT)
AnyStory: Towards Unified Single and Multiple Subject Personalization in Text-to-Image Generation [14.7] 我々は、パーソナライズされた主題生成のための統一的なアプローチであるAnyStoryを提案する。
AnyStoryは、単一の被写体だけでなく、複数の被写体に対する高忠実度パーソナライゼーションを実現し、被写体への忠実度を犠牲にしない。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:28:39 GMT)
Vulnerability-Aware Spatio-Temporal Learning for Generalizable and Interpretable Deepfake Video Detection [14.6] ディープフェイクビデオは、鍛造シーケンスの複雑な時間的および空間的なアーティファクトのため、検出が極めて困難である。
最近のアプローチは、実データと偽データの両方で訓練されたバイナリ分類器に依存している。
モデルが微妙なアーティファクトに集中できるように,空間的および時間的分岐を付加したマルチタスク学習フレームワークを導入する。
第2に,疑似フェイク映像を微妙なアーティファクトで生成するビデオレベルデータアルゴリズムを提案し,そのモデルに高品質なサンプルと地上真実データを提供する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:11:06 GMT)
SEAL: Entangled White-box Watermarks on Low-Rank Adaptation [14.5] SEALはトレーニング可能なLoRA重みの間に秘密の非トレーニング可能なマトリックスを埋め込み、所有権を主張するためのパスポートとして機能する。
SEALを適用する際には,コモンセンス推論,テキスト・ビジュアル・インストラクション・チューニング,テキスト・ツー・イメージ・シンセサイザー・タスクによるパフォーマンス劣化は見られなかった。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 04:17:56 GMT)
Federated Deep Subspace Clustering [14.3] 本稿では,フェデレートラーニング(FC)スキーマを用いたプライベートプロテクトサブスペースクラスタリング(SC)アプローチであるFDSCを紹介する。
各クライアントには、エンコードネットワーク、自己表現層、デコードネットワークからなる孤立したデータをグループ化するためのディープサブスペースクラスタリングネットワークが存在する。
実験は、公開データセット上でFDSCをテストし、他のクラスタリング手法と比較し、FDSCの有効性を実証する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 02:28:47 GMT)
mGeNTE: A Multilingual Resource for Gender-Neutral Language and Translation [14.2] mGeNTEは、英語/イタリア語/ドイツ語/スペイン語のペアのデータセットである。
ジェンダー・ニュートラル翻訳(GNT)と3つの文法性言語のための言語モデリングの両方の研究を可能にする。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:35:15 GMT)
Entailed Between the Lines: Incorporating Implication into NLI [13.8] 我々は、多くの言語タスクのコアツールである自然言語推論(NLI)に焦点を当てている。
最先端のNLIモデルとデータセットは、テキストから明示的ではなく、包含が示唆される範囲のケースを認識するのに苦労していることに気付きました。
インプリードNLIデータセット(INLI)を導入し、現在のLLMが幅広いインプリッドエンタテインメントを認識し、暗黙的エンタテインメントと明示的エンタテインメントを区別できるようにする。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 21:00:53 GMT)
Geometry-Preserving Encoder/Decoder in Latent Generative Models [13.7] 本稿では,VAEと異なる理論的特性を持つ新しいエンコーダ/デコーダフレームワークを提案する。
エンコーダとデコーダの両方のトレーニングプロセスにおいて,この幾何保存エンコーダの重要な利点を示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 23:14:34 GMT)
Improving Zero-Shot Object-Level Change Detection by Incorporating Visual Correspondence [13.5] 既存の変更検出アプローチには3つの大きな制限がある。
本稿では,変化検出精度を向上させるために,学習中の変化対応を利用した新しい手法を提案する。
また、推定ホモグラフィーとハンガリーのアルゴリズムを用いて検出された変化のペア間の対応を予測した最初の人物である。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:00:37 GMT)
Can ChatGPT Overcome Behavioral Biases in the Financial Sector? Classify-and-Rethink: Multi-Step Zero-Shot Reasoning in the Gold Investment [13.3] 大規模言語モデル(LLM)は、理解可能で組織化されたテキストを作成する際、例外的な能力を示すことで、近年大きな成功を収めています。
最近、最も強力なLCMの1つであるChatGPTを使用し、この目標を達成するためにエンジニアリングを推進します。
我々の研究では、ChatGPTとCoTのプロンプトがより説明可能な予測を提供し、行動バイアスを克服できることが判明した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:17:25 GMT)
EVaDE : Event-Based Variational Thompson Sampling for Model-Based Reinforcement Learning [13.3] Posterior Sampling for Reinforcement Learning (PSRL) は、モデルに基づく強化学習アルゴリズムをトンプソンサンプリングで強化するアルゴリズムである。
最近の研究は、ニューラルネットワークと組み合わせて使用されるドロップアウトが、これらの後部を近似できる変動分布を誘導していることを示している。
MBRLに有用な変動分布であるEVaDE(Event-based Variational Distributions for Exploration)を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:35:48 GMT)
Jodes: Efficient Oblivious Join in the Distributed Setting [13.3] 本稿では,分散環境での効率的な結合アルゴリズムであるJodesを紹介する。
Jodesは最先端の結合アルゴリズムよりも最大6倍のパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 07:12:14 GMT)
Generalized Single-Image-Based Morphing Attack Detection Using Deep Representations from Vision Transformer [13.2] 顔改ざん攻撃は、国境管理やパスポート発行のユースケースで運用される顔認識システム(FRS)に深刻な脅威をもたらしている。
視覚変換器 (ViT) アーキテクチャから符号化を学習し, 一般化された単一画像ベースMAD (S-MAD) アルゴリズムを提案する。
一般公開されたFRGC顔データセットを用いて顔変形データセットを用いて実験を行った。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 20:09:19 GMT)
Reducing the Sensitivity of Neural Physics Simulators to Mesh Topology via Pretraining [13.2] メッシュトポロジの変動は,ニューラルネットワークシミュレータの性能を著しく低下させることを示した。
グラフ埋め込みモデルを用いた確立されたオートエンコーダ事前トレーニング技術を用いることで、ニューラルネットワークシミュレータの感度をメッシュトポロジのバリエーションに低下させる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:21:18 GMT)
MatrixNet: Learning over symmetry groups using learned group representations [13.2] 本稿では,事前定義された表現の代わりにグループ要素入力の行列表現を学習するニューラルネットワークアーキテクチャであるMatrixNetを提案する。
MatrixNetは、トレーニングセットよりも単語長の大きいグループ要素の一般化を可能にするグループ関係を尊重していることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:45:12 GMT)
Adaptive Random Testing with Qgrams: The Illusion Comes True [13.2] 我々は、ペアワイズ距離計算を過去の実行のコンパクトアグリゲーションに置き換える、適応的ランダムテストのための新しいフレームワークを提案する。
Qgrams を用いた ART では,平均でランダムテストの 4 倍,従来の距離ベース手法による ART の 3.5 倍の目標がカバーされている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:10:24 GMT)
The Heap: A Contamination-Free Multilingual Code Dataset for Evaluating Large Language Models [13.1] 57のプログラミング言語をカバーする大規模な多言語データセットであるThe Heapをリリースする。
このデータセットにより、研究者は大きな言語モデルの公正な評価を、大きなデータのクリーニングオーバーヘッドなしに行うことができる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:48:41 GMT)
Teaching Wav2Vec2 the Language of the Brain [13.1] 我々は、Wav2Vec2が学習したパターンが脳データに転送可能であることを示す。
We run full-tuning with pre-trained weights for Wav2Vec2, training 'from scratch' without pre-trained weights, and the pre-trained Wav2Vec2 and training the BFE for 45 different BFE architectures。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:37:07 GMT)
Graph Analysis Using a GPU-based Parallel Algorithm: Quantum Clustering [12.6] 本稿では、グラフ構造に量子クラスタリングを適用する新しい方法を紹介する。
量子クラスタリング(Quantum Clustering, QC)は、ポテンシャル関数を構築してクラスター中心を決定する、新しい密度に基づく教師なし学習手法である。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 05:07:46 GMT)
Predictions as Surrogates: Revisiting Surrogate Outcomes in the Age of AI [12.6] 我々は、生物統計学における数十年前の代理結果モデルと予測駆動推論(PPI)の新たな分野との正式な関係を確立する。
我々は、既存のPPI提案よりも効率的な統計的推論手法である、補正予測を用いた推論を開発する。
我々は,最先端の機械学習/AIモデルを活用した3つのアプリケーションを通じて,既存のPPI提案よりも有効サンプルサイズが大幅に向上したことを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:30:33 GMT)
Deterministic Uncertainty Propagation for Improved Model-Based Offline Reinforcement Learning [12.5] 本稿では,ベルマン目標計算によって得られたモンテカルロ試料数に対する準最適性の強い依存性を示す理論的結果を示す。
我々の主な貢献は、進行モーメントマッチングを利用するベルマン目標に対する決定論的近似である。
我々は,既存のモンテカルロサンプリング手法よりもMOMBOの準最適性について,より厳密な保証を提供することが可能であることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:07:51 GMT)
SimHawNet: A Modified Hawkes Process for Temporal Network Simulation [12.4] 本稿では、連続時間時間ネットワークの生成モデルのための新しいフレームワークを提案する。
SimHawNetは、時系列ネットワークの連続的な進化のシミュレーションを可能にする。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:40:01 GMT)
Boosting Short Text Classification with Multi-Source Information Exploration and Dual-Level Contrastive Learning [12.4] 短文分類のためのMI-DELIGHTという新しいモデルを提案する。
まず、スパーシリティの問題を軽減するために、マルチソース情報探索を行う。
次に,短いテキストの表現を学習するために,グラフ学習アプローチを採用する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 00:26:15 GMT)
TextureCrop: Enhancing Synthetic Image Detection through Texture-based Cropping [12.3] 合成画像検出(SID)法は、オンラインのAI生成コンテンツを識別するために不可欠である。
我々は,事前学習した任意のSIDモデルにプラグインして,その性能を向上させるイメージ前処理コンポーネントであるTextureCropを提案する。
実験結果は、中央の収穫に比べてAUCが6.1%改善し、リサイズに比べて15%改善したことを示している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:20:32 GMT)
An LLM-Guided Tutoring System for Social Skills Training [12.3] 本稿では,インストラクターが大規模言語モデルと協調して,学生がコミュニケーションできる現実的なシナリオを動的に設計するフレームワークを提案する。
我々のフレームワークはこれらのシナリオを用いて学生のリハーサルを可能にし、即時フィードバックを提供し、学生とインストラクターの両方のパフォーマンスを可視化する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 22:54:12 GMT)
DEFOM-Stereo: Depth Foundation Model Based Stereo Matching [12.2] DEFOM-Stereoはモノクローナルディープキューとの堅牢なステレオマッチングを容易にするために構築されている。
DEFOM-Stereoは、ステート・オブ・ザ・アート(SOTA)メソッドでScene Flowデータセットに匹敵するパフォーマンスを持つことが検証されている。
我々のモデルは、個々のベンチマークにおいて、以前のモデルより同時に優れています。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:59:29 GMT)
EILID: Execution Integrity for Low-end IoT Devices [12.2] EILIDは、ローエンドデバイス上でのソフトウェア実行の整合性を保証するハイブリッドアーキテクチャである。
それは、ソフトウェア不変性を保証する、予防ベースの(アクティブな)ハイブリッドRoot-of-Trust (RoT)の上に構築されている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 00:31:39 GMT)
FineMedLM-o1: Enhancing the Medical Reasoning Ability of LLM from Supervised Fine-Tuning to Test-Time Training [12.1] FineMedLM-o1は医学的推論のための大きな言語モデルである。
Supervised Fine-Tuning (SFT) と Direct Preference Optimization (DPO) のための高品質な合成医療データと長文推論データを用いる。
また,臨床領域でテストタイムトレーニング(TTT)を初めて導入し,ドメイン適応の促進と信頼性,正確な推論の確保を図った。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 00:19:19 GMT)
Fine-grained Testing for Autonomous Driving Software: a Study on Autoware with LLM-driven Unit Testing [12.1] 本稿では、自律運転システム(ADS)ソースコードに対するテスト、特に単体テストに関する最初の研究について述べる。
大型言語モデル(LLM)による人書きテストケースと生成事例の両方を解析する。
AwTest-LLMは,テストカバレッジを向上し,テストケースパス率をAutowareパッケージ間で改善するための新しいアプローチである。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 22:36:00 GMT)
CleanVul: Automatic Function-Level Vulnerability Detection in Code Commits Using LLM Heuristics [12.1] 本稿では,Large Language Model (LLM) を用いて,VFCからの脆弱性修正変更を自動的に識別する手法を提案する。
VulSifterは大規模な調査に適用され、GitHubで127,063のリポジトリをクロールし、5,352,105のコミットを取得しました。
LLM拡張手法を用いて11,632個の関数からなる高品質なデータセットであるCleanVulを開発した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 04:08:15 GMT)
Lossless Compression of Vector IDs for Approximate Nearest Neighbor Search [11.9] インデックスのサイズを減らすために、ロスシー圧縮が広く適用されている。
逆ファイルとグラフベースのインデックスでは、ベクトルIDやリンクなどの補助データはほとんどのストレージコストを表すことができる。
いくつかのデータセットに対して、これらの手法は量子化されたベクトルコードも無害に圧縮できることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 20:45:11 GMT)
BRIGHT-VO: Brightness-Guided Hybrid Transformer for Visual Odometry with Multi-modality Refinement Module [11.9] 視覚計測(VO)は、自律運転、ロボットナビゲーション、その他の関連するタスクにおいて重要な役割を果たす。
本稿では,トランスフォーマーアーキテクチャに基づく新しいVOモデルであるBrightVOを紹介し,フロントエンドの視覚的特徴抽出を行う。
ポーズグラフ最適化を用いて、このモジュールは、エラーを減らし、精度とロバスト性の両方を改善するために、ポーズ推定を反復的に洗練する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:51:49 GMT)
Building Bridges across Papua New Guinea's Digital Divide in Growing the ICT Industry [11.9] パプアニューギニアは、地理的および社会的境界を克服する機会を持つ新興テクノロジー社会である。
現在のテクノロジーの世界は、シリコンバレーのBig Techや、Global Northのそのほかの多国籍企業が支配しており、PNGのような新興経済の要求を無視する傾向にある。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 11:35:57 GMT)
Finding Safety Violations of AI-Enabled Control Systems through the Lens of Synthesized Proxy Programs [11.9] ファルシフィケーションは、制御システムが正式な安全仕様に違反する原因となる入力信号を見つけることを目的としている。
AI対応制御システムにファルシフィケーションを適用することは、2つの大きな課題をもたらす。
本稿では,AI対応制御システムに適したファルシフィケーションフレームワークであるSynthifyを紹介する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 06:55:59 GMT)
Measuring Diversity of Game Scenarios [11.9] 我々は,現在の文学と実践のギャップを埋めることを目指しており,ゲームシナリオにおける多様性の測定と統合のための効果的な戦略に関する洞察を提供する。
この調査は、様々なゲームシナリオにおける将来の研究の道筋を示すだけでなく、多様性をゲームデザインと開発の重要な要素として活用しようとする業界の実践者のためのハンドブックとしても機能する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 05:35:43 GMT)
Normal-NeRF: Ambiguity-Robust Normal Estimation for Highly Reflective Scenes [11.5] 本稿では,不明瞭な形状でも頑健な透過率勾配に基づく正規推定手法を提案する。
提案手法は,高スペクトル反射と複雑な幾何学的構造を持つシーンの頑健な再構成と高忠実なレンダリングを実現する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:42:29 GMT)
AudioBERT: Audio Knowledge Augmented Language Model [11.1] 近年の研究では、テキストのみのデータセットで事前訓練された言語モデルには、基本的な視覚的知識が欠けていることが確認されている。
聴覚知識を評価するための2つの新しいタスクからなるAuditoryBenchというデータセットを構築した。
このベンチマークを用いて分析した結果,言語モデルにも聴覚的知識が不足していることが判明した。
本稿では,BERTの聴覚知識を検索ベースで拡張する新しい手法であるAudioBERTを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:17:18 GMT)
Synthesizing Forestry Images Conditioned on Plant Phenotype Using a Generative Adversarial Network [10.9] 本研究は, 特定の表現特性, viz. canopy greennessを満たす合成林業画像の生成に焦点を当てた。
我々はGAN(Generative Adversarial Network)を用いて、生物学的に可塑性で表現型的に安定した森林画像の合成を行う。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 04:13:10 GMT)
NS-Gym: Open-Source Simulation Environments and Benchmarks for Non-Stationary Markov Decision Processes [10.8] 非定常マルコフ決定過程(NS-MDP)は、変化条件下での意思決定問題をモデル化し解決するための枠組みを提供する。
NS-MDP向けに設計された最初のシミュレーションツールキットであるNS-Gymについて述べる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:38:33 GMT)
Algorithmic Collective Action in Recommender Systems: Promoting Songs by Reordering Playlists [10.7] 変圧器を用いた推薦システムにおけるアルゴリズム的集団行動について検討する。
我々のユースケースは音楽ストリーミングプラットフォームであり、ファンの集まりは、表現不足のアーティストの可視性を促進することを目的としています。
曲を挿入する位置を選択するための2つの簡単な実装可能な戦略を導入し、テスト時にレコメンデーションを強化することを目標にしている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:59:53 GMT)
PIXELS: Progressive Image Xemplar-based Editing with Latent Surgery [10.6] PIXELSと呼ばれる,市販拡散モデルを用いたプログレッシブな例駆動編集のための新しいフレームワークを提案する。
PIXELSは編集のきめ細かい制御を提供し、ピクセルや領域レベルでの調整を可能にする。
我々は,PIXELSが高品質な編集を効率よく行うことを実証し,定量化と人的評価に顕著な改善をもたらすことを示した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 20:26:30 GMT)
Incorporating Quantum Advantage in Quantum Circuit Generation through Genetic Programming [10.6] 遺伝的アルゴリズムの適合度関数に量子優位性指標を組み込むための2つの新しい手法を提案する。
本稿では,Bernstein-Vazirani問題とUnstructured Database Search問題に基づくアプローチを事例として評価する。
量子優位性の尺度を組み込んだ遺伝的アルゴリズムを用いた自動量子回路設計は、量子アルゴリズムの開発を加速するための有望なアプローチであることが示唆された。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:34:34 GMT)
PISCO: Self-Supervised k-Space Regularization for Improved Neural Implicit k-Space Representations of Dynamic MRI [10.4] 我々は$mathL_mathrmPISCOで新しい自己教師付きk空間損失関数を導入する。
提案した損失関数は、並列イメージングにインスパイアされた自己整合性の概念に基づいている。
最先端の手法に比べて優れた安定性を実現する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:18:59 GMT)
Lindblad estimation with fast and precise quantum control [10.4] 弱い波形を推定することは基礎物理学実験の中核的な課題である。
我々は、波形推定、量子ビットを用いた分光法、リンドブラッド推定を含む幅広い応用のためのプロトコルを開発する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:07:19 GMT)
A Consolidated Volatility Prediction with Back Propagation Neural Network and Genetic Algorithm [10.2] 本稿では,バックプロパゲーションニューラルネットワークと遺伝的アルゴリズムを併用した統合モデルを構築し,新興市場の将来的ボラティリティを予測する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:53:47 GMT)
CarMem: Enhancing Long-Term Memory in LLM Voice Assistants through Category-Bounding [10.2] 本稿では,予め定義されたカテゴリを中心に構成された音声アシスタントのための長期記憶システムを提案する。
このアプローチでは、Large Language Modelsを活用して、好みを効率的に抽出、保存、検索する。
また、実業界データに基づく合成マルチターン・マルチセッション会話データセット(CarMem)も導入する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:37:33 GMT)
Pseudo-Hermitian extensions of the harmonic and isotonic oscillators [9.9] 調和振動子と等速振動子の擬エルミート拡大について述べる。
位置表現における波動関数を明示的に解き、それらの相互関係を探索する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 21:08:52 GMT)
Preference-based Pure Exploration [9.9] ベクトル値の報酬を持つ包帯の選好に基づく純粋探索問題について検討する。
我々は、最も好まれるポリシーを特定するために、サンプルの複雑さに基づいた新しい境界を導出する。
次に、下界の凸緩和を行い、それを利用して、Preferenceベースのトラック・アンド・ストップアルゴリズムを設計する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 22:16:11 GMT)
Guided Debugging of Auto-Translated Code Using Differential Testing [9.9] tHinterは自動翻訳コードで翻訳エラーを見つけるツールである。
ファジィを使用して、翻訳されたコードを徹底的に探索する多様なテストケースを生成する。
次に、カバレッジ情報と差分テストの実行結果から翻訳エラーをピンポイントするアルゴリズムに依存する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 11:27:25 GMT)
Event-based quantum contextuality theory [9.8] 本稿では、事象に基づく文脈性理論を確立することによって、いくつかの既知の文脈性理論が直面する課題を克服する。
我々の理論は、一般的なプロジェクタからなるシナリオを扱うことができる量子文脈性に関する正確な数学的枠組みを提供する。
有限次元量子系におけるコチェン・スペクターの文脈性は状態独立な強い文脈性と同値である。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 07:42:08 GMT)
Fuzzy Integration of Data Lake Tables [9.8] 本稿では,Flull Disjunction内での近似やファジィマッチングの接合を可能にする新しいデータ駆動方式を提案する。
ファジィフル・ディジャンクションは、最先端のフル・ディジャンクション実装にかなりの時間的オーバーヘッドを与えないことを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 00:06:33 GMT)
Class Incremental Fault Diagnosis under Limited Fault Data via Supervised Contrastive Knowledge Distillation [9.6] クラスインクリメンタルな障害診断は、以前の知識を維持しながら新しい障害クラスに適応するモデルを必要とする。
本稿では,クラスインクリメンタル・フォールト・診断のためのスーパーバイザード・コントラスト・ナレッジ・ディチリレーションを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:20:29 GMT)
A Comparative Study on Multi-task Uncertainty Quantification in Semantic Segmentation and Monocular Depth Estimation [9.5] 我々はモンテカルロ・ドロップアウト,ディープ・サブ・アンサンブル,ディープ・アンサンブルを共同セグメンテーションと単眼深度推定のために評価した。
ディープアンサンブル(Deep Ensembles)は、特にドメイン外のシナリオにおいて、好まれる選択肢として際立っている。
我々は、画素を確実または不確実と分類するために、異なる不確実性しきい値を採用することの影響を強調した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:27:33 GMT)
VBIM-Net: Variational Born Iterative Network for Inverse Scattering Problems [9.4] フルウェーブ逆散乱問題の解法として,新しい変分ボルン反復ネットワーク,すなわちV BIM-Netを提案する。
提案したV BIM-Netは変動ボルン反復法における全電界とコントラストの交互更新をエミュレートする。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 02:26:40 GMT)
reBEN: Refined BigEarthNet Dataset for Remote Sensing Image Analysis [9.3] BigEarthNetは、リモートセンシング画像解析のためのディープラーニング(DL)研究を支援するために構築された、大規模でマルチモーダルなリモートセンシングデータセットである。
reBENデータセットは、Sentinel-1とSentinel-2の画像パッチの549,488対で構成されている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:55:49 GMT)
Fokker-Planck to Callan-Symanzik: evolution of weight matrices under training [9.3] 本稿では,Fokker-Planckを用いて,単純な2-bottleneck層自動エンコーダのボトルネック層における個々の重み行列の確率密度進化をシミュレートする。
また、カルン=シマンツィクやカルダル=パリ=チャン方程式のような物理的に関係のある偏微分方程式は、我々が持つ力学方程式から導出する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:54:40 GMT)
SOP-Agent: Empower General Purpose AI Agent with Domain-Specific SOPs [9.1] 汎用AIエージェントは、ドメイン固有の知識と人間の専門知識を効率的に活用するのに苦労する。
ドメイン固有のエージェントを構築するための新しいフレームワークであるSOP-agent(Standard Operational Procedure-Guided Agent)を紹介する。
SOPエージェントは優れた汎用性を示し、汎用エージェントフレームワークよりも優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 06:14:58 GMT)
Information Sifting Funnel: Privacy-preserving Collaborative Inference Against Model Inversion Attacks [9.1] ニューラルネットワークと推論タスクの複雑さは、リソース制約されたエッジデバイスに重大な課題をもたらす。
コラボレーション推論は、エッジデバイスに浅い特徴抽出を割り当て、さらなる推論のために機能をクラウドにオフロードすることで、これを緩和する。
協調推論のためのプライバシー保護フレームワークSiftFunnelを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 02:38:55 GMT)
Bias for Action: Video Implicit Neural Representations with Bias Modulation [8.9] 本稿では,ActINRと呼ばれる暗黙的ニューラル表現(INR)に基づく新しい連続ビデオモデリングフレームワークを提案する。
ビデオINRとこのバイアスINRを合わせてトレーニングすることで、ビデオスローモーションの10ドル、空間スーパー解像度の4ドル、スローモーションの2ドル、デノイングの2ドル、ビデオインペインティングなどのユニークな機能をデモします。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:47:25 GMT)
A Comprehensive Survey of Foundation Models in Medicine [8.9] ファンデーションモデル(FM)は、大規模なデータセットに基づいてトレーニングされた大規模ディープラーニングモデルである。
我々は医学におけるFMのレビューを行い、その進化、学習戦略、旗艦モデル、アプリケーション、関連する課題に焦点を当てる。
本稿では,臨床自然言語処理,医用コンピュータビジョン,グラフ学習,その他のバイオ・オミクス関連タスクにまたがるFM対応医療応用の詳細な分類法を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:04:07 GMT)
Enhancing Graph Self-Supervised Learning with Graph Interplay [8.8] Graph Interplay(GIP)は、様々な既存のGSSLメソッドを備えたパフォーマンスを大幅に向上させる革新的で汎用的なアプローチである。
GIPは、標準バッチ内でランダムなグラフ間エッジによる直接グラフレベルの通信を導入することを提唱している。
我々の実証研究は、GIPが広く普及しているGSSL法の性能を大幅に上回っていることを示している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 01:18:40 GMT)
ChartInsighter: An Approach for Mitigating Hallucination in Time-series Chart Summary Generation with A Benchmark Dataset [8.8] 時系列チャートの要約生成における要約要素と一般的な幻覚型を同定する。
時系列データのチャート要約を自動的に生成するChartInsighterを導入する。
文ごとに注釈付き幻覚型を付与し,高品質なチャートと要約のベンチマークを作成する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:03:32 GMT)
Optimization is Better than Generation: Optimizing Commit Message Leveraging Human-written Commit Message [8.7] コミットメッセージ最適化 (Commit Message Optimization, CMO) は、大規模言語モデルと検索に基づく最適化を活用して、人書きメッセージを強化する。
CMOは、より合理的、包括的、表現的なコミットメッセージを生成し、最先端のCMGメソッドと人間のメッセージの88.2%-95.4%を上回っている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 22:20:04 GMT)
Reinforcement learning with non-ergodic reward increments: robustness via ergodicity transformations [8.4] 強化学習の応用分野は、自律運転、精密農業、金融などである。
特に、RL の焦点は典型的には戻り値の期待値である。
我々は,RLエージェントが個々の軌道の長期的性能を最適化するアルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 19:43:21 GMT)
Weight for Robustness: A Comprehensive Approach towards Optimal Fault-Tolerant Asynchronous ML [8.4] 非同期システムは、ビザンツの失敗に対する完全性を維持するのに苦労する。
これらの問題に対処するために、新しい重み付けされたロバストアグリゲーションフレームワークを導入します。
非同期なビザンチン環境において, 最適収束率を初めて達成する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:00:52 GMT)
Positive-Unlabeled Constraint Learning for Inferring Nonlinear Continuous Constraints Functions from Expert Demonstrations [8.4] 多様な現実世界のロボットタスクの計画には、すべての制約を知って記述する必要がある。
本稿では,実証から連続的な制約関数を推論する2段階の正非ラベル制約学習(PUCL)アルゴリズムを提案する。
連続的な非線形制約を推論し、制約精度と政策安全性の点で他のベースライン法より優れている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:30:40 GMT)
Learning Constraint Network from Demonstrations via Positive-Unlabeled Learning with Memory Replay [8.4] 本稿では,実証から連続的,任意の,あるいは非線形な制約を推測する,正の未ラベル(PU)学習手法を提案する。
提案手法の有効性を2つのMujoco環境で検証した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 11:59:02 GMT)
Meaning-Typed Programming: Language-level Abstractions and Runtime for GenAI Applications [8.3] ソフトウェアは、論理コードから、生成的AIとアプリケーション機能に大規模言語モデル(LLM)を活用する神経統合アプリケーションへと、急速に進化している。
本稿では,神経統合型アプリケーションの作成を簡略化する新しい手法として,意味型プログラミング(MTP)を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:56:27 GMT)
Local Anti-Concentration Class: Logarithmic Regret for Greedy Linear Contextual Bandit [8.1] 本研究では,線形文脈帯域問題に対する探索自由グリードアルゴリズムの性能保証について検討する。
提案手法では,テキストローカルアンチ集中(LAC)条件という新しい条件を導入し,グリーディバンディットアルゴリズムを有効活用する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:46:14 GMT)
PeFoMed: Parameter Efficient Fine-tuning of Multimodal Large Language Models for Medical Imaging [8.0] MLLM(Multimodal large language model)は、従来の大規模言語モデルの能力の進化的拡張を表す。
近年,MLLMを医療用マルチモーダル問題に対する普遍的解決法として応用する研究が進められている。
本稿では,Med-VQA (Med-VQA) タスクとMRG (Med-VQA) タスクに基づいて,MLLMを微調整するためのパラメータ効率のよいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 02:31:20 GMT)
AdaFV: Accelerating VLMs with Self-Adaptive Cross-Modality Attention Mixture [7.9] 偏りのあるVLMの自己アテンションに応じて視覚トークンを減らすいくつかのアプローチは、不正確な応答をもたらす。
本稿では,視覚的満足度とテキスト・ツー・イメージの類似性の有効性を動的に活用する,自己適応型クロスモーダリティ・アテンション・ミックス機構を提案する。
提案手法は,特に縮小速度が十分に大きい場合,最先端のトレーニング不要なVLM加速性能を実現する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:34:33 GMT)
Converse bounds for quantum hypothesis exclusion: A divergence-radius approach [7.8] 任意のダミーの仮説と関連する候補のそれぞれを区別するために、非対称二項仮説検定に強い逆結果を適用する。
これにより、幾何学的に着想を得た議論を通じて、分岐の観点から所望の上界が導かれる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:01:19 GMT)
Estimating Task-based Performance Bounds for Accelerated MRI Image Reconstruction Methods by Use of Learned-Ideal Observers [7.8] 画像計測に作用する理想的なオブザーバ(IO)の性能は、画像システムの最適化の指針として長年議論されてきた。
IOパフォーマンスの推定は、アンダーサンプリングされたデータ取得テクニックを設計する際の貴重なガイダンスを提供することができる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 01:09:30 GMT)
Scaling up self-supervised learning for improved surgical foundation models [7.2] 本研究は外科的コンピュータビジョンの新しいベンチマークを設定できる新しい手術基礎モデルであるSurgeNetXLを紹介する。
SurgeNetXLは、4つの手術手順と3つのタスクにまたがる6つのデータセットで一貫したトップレベルパフォーマンスを実現する。
これらの知見は、データスカースシナリオにおける一般化性と堅牢性を改善するための道を開いた。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:07:44 GMT)
Identifying Information from Observations with Uncertainty and Novelty [7.1] 本稿では、異なる仮説間の関係を表現するために用いられる言語から生じる「識別可能な情報」の概念を定式化する。
計算可能なPAC-Bayes学習者のサンプル複雑性分布は、固定有限仮説集合上の事前確率分布の観点から、そのモーメントによって決定されることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 07:02:05 GMT)
BN-Pool: a Bayesian Nonparametric Approach to Graph Pooling [7.0] グラフニューラルネットワーク(GNN)のための最初のクラスタリングに基づくプール手法BN-Poolを紹介する。
BN-Pool は粗いグラフ内のスーパーノードの数を適応的に決定する。
BN-Poolは多種多様なベンチマークにおいて優れた性能を示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 20:15:12 GMT)
Interpretable Droplet Digital PCR Assay for Trustworthy Molecular Diagnostics [6.9] I2ddPCRは、GPT-4o Multimodal Large Language Model (MLLM)とフロントエンド予測モデル(ドロップレットのセグメンテーションと分類のための)を統合する包括的なフレームワークである。
このアプローチは最先端モデルを超え、信号-雑音比(SNR)の異なる複雑なddPCR画像を99.05%の精度で処理できる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 00:33:17 GMT)
OpticFusion: Multi-Modal Neural Implicit 3D Reconstruction of Microstructures by Fusing White Light Interferometry and Optical Microscopy [6.9] 白色光干渉計(White Light Interferometry, WLI)は、微細構造の3次元トポグラフィーを測定するための精密光学ツールである。
従来の手法では、WLIハードウェアと解析ソフトウェアを変更することで、この制限を克服しようと試みてきた。
我々は,光学顕微鏡を付加して自然色テクスチャを用いた3次元再構成を実現する新しいアプローチである OpticFusion を紹介する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:02:08 GMT)
Safe Control and Learning Using the Generalized Action Governor [6.9] 本稿では、GA(Generalized Action Governor)に基づく安全制御と学習のための一般的なフレームワークを紹介する。
AGは、所定の安全制約を厳格に扱う能力を備えた、名目上のクローズドループシステムを強化するための監督スキームである。
我々は,汎用AGと統合されたデータ駆動型クープマン演算子制御と,強化学習とデータ駆動型クープマン演算子制御の2つの安全な学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:40:30 GMT)
Testing Refactoring Engine via Historical Bug Report driven LLM [6.9] リファクタリングは、外部の振る舞いを変えることなく、既存のコードを再構築するプロセスである。
自動エンジンテストのためのフレームワークであるRETESTERを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 23:31:49 GMT)
Robustness of quantum many-body scars in the presence of Markovian bath [6.7] 量子多体傷(QMBS)の弱エルゴディディティ破壊のための量子多体システムについて検討する。
系はQMBSが支配する定常状態に緩和され、散逸ダイナミクスは初期状態の適切な準備によって動的回復を示す。
これにより、発散動力学上のエルゴディディティの破れのサインが見え、安定なQMBSを実験的に準備する可能性がある。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:01:57 GMT)
FLOL: Fast Baselines for Real-World Low-Light Enhancement [6.6] 低光画像強調(LLIE)は、計算写真や画像撮影において重要な課題である。
本稿では,周波数領域と空間領域における画像処理を組み合わせた軽量ニューラルネットワークを提案する。
我々の手法であるFLOL+は,このタスクにおいて最も高速なモデルの一つであり,一般的な実シーンデータセットの最先端結果を実現する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:06:09 GMT)
Domain Adaptation of Foundation LLMs for e-Commerce [6.6] E-Llamaモデル:E-コマース領域に適応した80億と70億のパラメーター大言語モデルを示す。
e-Llamaモデルは、Llama 3.1ベースモデルをドメイン固有データの1兆個のトークンで継続的に事前訓練することで得られる。
トレーニング設定を慎重に選択すると、Llama 3.1モデルは、一般的なドメインタスクにおいて大きなパフォーマンスを犠牲にすることなく、新しいドメインに適応できることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:58:32 GMT)
Strong and Noise-Tolerant Entanglement in Dissipative Optomechanics [6.5] 我々はミッチェルソン・サニャック干渉計における量子絡み合いについて研究し、分散と散逸結合を任意にオン/オフすることができる。
純散逸結合によって生じる量子絡み合いは、純粋散逸結合によって生じるものよりも著しく強く、耐雑音性が高いことが判明した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:45:02 GMT)
Personalized Parsons Puzzles as Scaffolding Enhance Practice Engagement Over Just Showing LLM-Powered Solutions [6.4] パーソンズパズルを足場としてパーソンズパズルを受け取った学生は、苦労するときに完全な解決策を得た学生よりもはるかに長い練習に従事した。
その結果,パーソンズパズルを足場としてパーソンズパズルを受講した学生は,苦労時に解答を受けた学生よりも有意に長い練習を行った。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 00:05:20 GMT)
Exact Parent Hamiltonians for All Landau Level States in a Half-flux Lattice [6.4] Kapit-Muellerモデルは、最低ランダウ準位状態の格子アナログを安定化させる。
これらの対称性がランダムランダウ級数に対するギャップレス性と特異点をどのように強制するかについて議論する。
我々のモデルは、適切なエネルギー的および量子的ジオメトリを持つ強結合モデルの大規模なクラスを指し示している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:52:19 GMT)
Omni-Emotion: Extending Video MLLM with Detailed Face and Audio Modeling for Multimodal Emotion Analysis [6.4] 自己レビューデータセットと人間レビューデータセットを導入し,24,137個の粗粒度サンプルと3,500個の手作業で詳細な感情アノテーションを付加したアノテートサンプルを作成した。
音声モデリングに加えて,既存の高度なビデオMLLMに顔符号化モデルを明示的に統合することを提案する。
我々のOmni-Emotionは、感情認識と推論の両方において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:27:05 GMT)
Enhanced Masked Image Modeling to Avoid Model Collapse on Multi-modal MRI Datasets [6.3] マスク付き画像モデリング(MIM)は、ラベルなしデータの利用において有望であることを示す。
モデル崩壊を, 完全崩壊と次元崩壊の2つのタイプで解析し, 対処する。
HMPとPBTモジュールを併用した拡張MIM(E-MIM)を構築し,マルチモーダルMRIのモデル崩壊を回避する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 01:30:35 GMT)
CyberMentor: AI Powered Learning Tool Platform to Address Diverse Student Needs in Cybersecurity Education [6.3] サイバーセキュリティプログラムの多くの非伝統的な学生は、しばしば仲間や家族、教授からのアドバイスへのアクセスを欠いている。
本稿では,知識,スキル,キャリア準備に関するアドバイスに答えることによって,包括的支援を提供するアプリケーションを提案する。
我々はサイバーセキュリティの学生の多様なニーズと問題点に対処する学習ツールプラットフォームであるCyberMentorを開発した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:00:06 GMT)
Efficient PAC Learning of Halfspaces with Constant Malicious Noise Rate [6.2] 本研究では,悪質な雑音の存在下でのハーフスペースの計算効率の高いPAC学習の問題について検討する。
再重み付きヒンジ損失を最小化することにより、一定の耐雑音性を実現することができることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 05:50:54 GMT)
Ruling the Unruly: Designing Effective, Low-Noise Network Intrusion Detection Rules for Security Operations Centers [6.1] セキュリティオペレーションセンター(SOC)は、Suricataのような署名ベースのネットワーク侵入検知システム(NIDS)に大きく依存している。
ルールの品質に影響を与える要因をよりよく理解することは、現在のSOC問題に対処するのに役立ちます。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 19:35:10 GMT)
Empirical Evaluation of Embedding Models in the Context of Text Classification in Document Review in Construction Delay Disputes [6.1] テキスト埋め込みはテキストデータの数値表現であり、単語、フレーズ、文書全体を実数のベクトルに変換する。
本稿では,4つの異なるモデルの包括的比較分析を通じて,異なる埋め込みを評価する作業について述べる。
K-Nearest Neighbors (KNN) と Logistic Regression (LR) の両方を用いてバイナリ分類タスクを行い、特にラベル付きデータセット内でテキストスニペットが 'delay' あるいは 'not delay' に関連付けられているかどうかを判断する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 22:12:11 GMT)
Optimizing Circuit Reusing and its Application in Randomized Benchmarking [5.8] 量子学習タスクは、ランダムにサンプリングされた量子回路を利用して未知のシステムを特徴づける。
回路再利用 (circuit reusing) と呼ばれる効率的な手法では、各回路を複数回実行することで、新しい回路を実装するよりもコストを削減できる。
本研究では,所定の実験コストに対する測定結果の分散を最小化する最適再利用パラメータについて検討する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:46:39 GMT)
Anatomy of a Digital Bubble: Lessons Learned from the NFT and Metaverse Frenzy [5.7] ランドパーセルをNTTコレクションとして販売する仮想世界プラットフォームであるDecentralandについて検討する。
当初、土地価格は伝統的な不動産価格モデルに従っていた。
NFTの市場価値が大幅に上昇した後、複数のパーセルの短期保有者が主要な販売ポジションを占め始めた。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:22:26 GMT)
Evaluating alignment between humans and neural network representations in image-based learning tasks [5.7] トレーニング済みの860ドルのニューラルネットワークモデルの表現が、人間の学習軌跡にどのようにマッピングされているかテストしました。
トレーニングデータセットのサイズは人間の選択に沿った中核的な決定要因であるのに対し、マルチモーダルデータ(テキストと画像)による対照的なトレーニングは、人間の一般化を予測するために現在公開されているモデルの一般的な特徴であることがわかった。
結論として、事前訓練されたニューラルネットワークは、タスク間で伝達可能な認知の基本的な側面を捉えているように見えるため、認知モデルのための表現を抽出するのに役立つ。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:12:24 GMT)
Confidence Estimation for Error Detection in Text-to-SQL Systems [5.6] 本研究では,選択型分類器のテキスト・ツー・ラーニングシステムへの統合について検討する。
エンコーダ-デコーダ T5 は,テキスト内 GPT 4 やデコーダのみの Llama 3 よりもキャリブレーションが優れていることを示す。
誤り検出の観点では、高い確率の選択的分類器は、不正なクエリ生成ではなく、無関係な質問に関連する誤りを検出する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:23:07 GMT)
ADAGE: A generic two-layer framework for adaptive agent based modelling [5.6] エージェントベースモデル(ABM)は、複雑な、潜在的に平衡外のシナリオをモデル化するのに有用である。
マルチエージェント強化学習をABMに組み込んだ最近の進歩は適応剤の挙動を導入している。
我々はAdaptive AGEnt based modelling (ADAGE)のための汎用的な2層フレームワークを開発する。
このフレームワークは、条件付き行動ポリシーを持つスタックルバーグゲームとしてバイレベル問題を定式化する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:58:24 GMT)
Hybrid additive modeling with partial dependence for supervised regression and dynamical systems forecasting [5.6] 部分依存に基づく新たなハイブリッドトレーニング手法を導入し,複雑な正規化の必要性を排除した。
合成問題と実回帰問題の両方において、そのようなハイブリッドモデルを訓練するためのいくつかのアプローチを比較する。
ツリーベースモデルや人工ニューラルネットワークなど、さまざまなタイプの機械学習モデルで実験が実施されている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:00:38 GMT)
Model-Based Transfer Learning for Contextual Reinforcement Learning [5.6] 文脈RL問題の解法としてモデルベーストランスファー学習を導入する。
理論的には,本手法は訓練作業数のサブリニアな後悔を示す。
都市交通と標準連続制御ベンチマークを用いて,提案手法を実験的に検証した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:35:07 GMT)
Pruning for Sparse Diffusion Models based on Gradient Flow [5.5] 拡散モデル(DM)は、世代モデル間で印象的な能力を持つが、推論速度が遅いことと計算コストが高いことに制限されている。
従来の作業では、単発構造プルーニングを使用して、事前訓練されたものから軽量DMを導出するが、このアプローチは世代品質を著しく低下させることが多い。
本稿では,勾配流プルーニングプロセスと勾配流プルーニング基準を含む勾配流に基づく反復的プルーニング法を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:55:05 GMT)
A Survey of Research in Large Language Models for Electronic Design Automation [5.4] 大規模言語モデル (LLM) は変換技術として登場している。
この調査は、モデルアーキテクチャの進歩、さまざまなモデルサイズの影響、そして革新的なカスタマイズ技術に焦点を当てている。
EDA業界やAI研究者、高度なAI技術や電子設計の収束に関心のある人には、貴重な洞察を提供することを目指している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:51:59 GMT)
AI in Support of Diversity and Inclusion [5.4] 大規模言語モデル(LLM)をより透明化し、包括的で、社会的偏見を認識していく上での課題と進歩を考察する。
メディア内の偏見のあるコンテンツを識別する上で、AIが果たす役割を強調します。
AIシステムには多様な包括的トレーニングデータが必要だ、と私たちは強調する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:36:24 GMT)
Aligning Brain Activity with Advanced Transformer Models: Exploring the Role of Punctuation in Semantic Processing [5.4] 神経活動データに対して,RoBERTa,DistiliBERT,ALBERT,ELECTRAの4種類の先進トランスモデルを評価した。
以上の結果より,RoBERTaは神経活動と最もよく一致し,正確性はBERTを上回った。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:19:24 GMT)
Automatically Detecting Heterogeneous Bugs in High-Performance Computing Scientific Software [5.4] 異なるプラットフォーム間でのデータ移動を管理する際に、不均一なバグが発生する。
HeteroBugDetectは、HPC科学応用におけるプラットフォーム依存の異種バグを検出するための自動アプローチである。
分子動力学シミュレータLAMMPSでHeteroBugDetectを評価し,複数の異種バグを検出した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 22:58:50 GMT)
Enhancing Generalization in Chain of Thought Reasoning for Smaller Models [5.3] より小さな言語モデルにおけるChain-of-Thought (CoT)推論は、自然言語処理の問題である。
既存のCOT知識蒸留法は、小規模のLLMにおいて過度に保守的な適応性に悩まされることが多い。
多様なCoTドメインを統合した原理的な微調整フレームワークであるPRADAを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 19:23:11 GMT)
Exploring the Inquiry-Diagnosis Relationship with Advanced Patient Simulators [5.2] コンサルテーションプロセスにおける「問い合わせ」と「診断」の関係について検討する。
調査プロセスは,(1)主訴調査,(2)既知症状の特定,(3)随伴症状の調査,(4)家族や医療史の収集の4種類に分類される。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 11:41:14 GMT)
Graph Neural Networks for Travel Distance Estimation and Route Recommendation Under Probabilistic Hazards [5.2] 本稿では,グラフニューラルネットワーク(GNN)に基づく新しいフレームワークを提案する。
実世界のケーススタディでは,ハリケーン時の避難遅延を計算するために,洪水リスク解析手法を適用した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 19:22:50 GMT)
Domain-conditioned and Temporal-guided Diffusion Modeling for Accelerated Dynamic MRI Reconstruction [5.1] dDiMoフレームワークは、時間分解次元から時間情報を統合する。
提案手法は, 心的マルチコイルMRIとGolden-Radial-Angle-acquired multicoil free-acquired MRIの2種類のMRIデータを用いて検討した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 05:39:50 GMT)
From Complexification to Self-Similarity: New Aspects of Quantum Criticality [5.0] 量子相転移は凝縮物質物理学の魅力的な領域である。
複雑化による拡張は、臨界性とその統計的意味を理解するための新しい枠組みを提供する。
このミニレビューは、最近の複雑化の展開を簡潔に概観する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 11:29:53 GMT)
Artificial Intelligence-Driven Clinical Decision Support Systems [5.0] この章は、医療で信頼できるAIシステムを作るには、公平さ、説明可能性、プライバシーを慎重に考慮する必要があることを強調している。
AIによる公平な医療提供を保証するという課題は強調され、臨床予測モデルのバイアスを特定し緩和する方法が議論されている。
この議論は、ディープラーニングモデルのデータ漏洩からモデル説明に対する高度な攻撃に至るまで、医療AIシステムのプライバシ脆弱性の分析に進展している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:17:39 GMT)
Knowledge Retrieval Based on Generative AI [4.9] 本研究は,中国語ウィキペディアとLawbankを検索源として用いたRAG(Retrieval-Augmented Generation)に基づく質問応答システムを開発した。
このシステムは,BGE-M3を用いて高関係な検索結果を検索し,BGE-rerankerを用いてクエリの関連性に基づいてそれらの検索結果を並べ替える。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:30:38 GMT)
SE-BSFV: Online Subspace Learning based Shadow Enhancement and Background Suppression for ViSAR under Complex Background [4.8] ビデオ合成開口レーダ(ViSAR)は移動目標検出(MTD)分野で大きな注目を集めている。
ViSARでは、移動対象の影がオフセットしたりデフォーカスしたりすることはなく、MTDの機能として広く使われている。
影と背景の区別を強化する方法を検討する価値がある。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 07:50:56 GMT)
Intelligent OLSR Routing Protocol Optimization for VANETs [4.7] 本稿では、最適化リンク状態ルーティング(OLSR)の最適パラメータ設定を扱う。
実験では、調整されたOLSR構成により、標準的なコメント要求(RFC 3626)よりも品質の高いサービス品質(QoS)が得られる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:05:28 GMT)
Authenticated Delegation and Authorized AI Agents [4.7] 我々は、AIエージェントに対する権限の認証、認証、監査可能な委任のための新しい枠組みを導入する。
フレキシブルな自然言語パーミッションを監査可能なアクセス制御構成に変換するためのフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:11:21 GMT)
Lossy Compression with Pretrained Diffusion Models [4.7] 事前訓練した拡散モデルを用いた損失圧縮の原理的アルゴリズムは,少なくとも Ho 等から理解されている。
DiffCの最初の完全な実装につながる簡単な回避策を紹介します。
追加の訓練は必要としないが,本手法は,超低速で他の最先端の生成圧縮法と競合する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 20:02:13 GMT)
Optimizing hypergraph product codes with random walks, simulated annealing and reinforcement learning [4.6] ハイパーグラフ製品は、2つの古典的なLDPCコードから構築された量子低密度パリティチェック(LDPC)コードである。
本研究では,量子消去チャネルに対する性能の最適化に焦点をあてる。
このチャネルの重要な利点は、効率的な最大形デコーダの存在である。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:01:02 GMT)
PsyDI: Towards a Personalized and Progressively In-depth Chatbot for Psychological Measurements [4.2] PsyDIは、心理測定のための個人化された、そして、徐々に深いチャットボットである。
PsyDIは、ユーザ関連のマルチモーダル情報を使用し、カスタマイズされたマルチターンインタラクションを使用して、パーソナライズされ、容易にアクセス可能な計測を提供する。
心理学的特徴に関連するプロキシ変数のランク付けを学習する新しいトレーニングパラダイムを導入する。
スコアモデルにより、PsyDIはマルチターンインタラクションを通じて包括的で正確な測定を行うことができる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 07:40:27 GMT)
MVGT: A Multi-view Graph Transformer Based on Spatial Relations for EEG Emotion Recognition [4.2] 3つの領域にまたがる情報を統合する空間関係に基づく多視点グラフ変換器(MVGT)を提案する。
公開データセットの評価では、MVGTがパフォーマンスにおいて最先端の手法を上回ることが示されている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 02:54:35 GMT)
A symmetry-protected topological optical lattice clock [4.1] 合成超格子における対称性保護位相の調整可能な実装を提案する。
本稿では,Rabi分光法に類似したプロトコルについて述べる。
提案した実装は、最先端量子センサにおける対称性保護トポロジカル位相によって提供されるユニークな機会を利用するための道を開く。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:53:03 GMT)
Exact Fisher zeros and thermofield dynamics across a quantum critical point [4.1] 開量子系の量子相転移や非単位力学をよりよく理解するために、フィッシャーゼロがどのように用いられるかを示す。
我々は、Z$を量子回路で実現し、探索することができることを指摘している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 11:42:26 GMT)
Detecting Many-Body Scars from Fisher Zeros [4.1] 我々はフィッシャーゼロに基づくQMBSの検出と診断のための代替ルートを提案する。
傷跡のある系では、フィッシャー零点の連続直線が虚数$beta$軸から現れ、上向きに伸びる。
個々の量子状態を徹底的に調べることなく、傷跡の出現を容易に発見できるという利点がある。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 11:30:21 GMT)
Unified Face Matching and Physical-Digital Spoofing Attack Detection [3.9] 顔認識システムは、物理的およびデジタル偽造攻撃による脅威の増加に直面している。
本稿では,身体的およびデジタル的攻撃の顔認識と検出を目的とした,革新的な統一モデルを提案する。
畳み込みニューラルネットワークフレームワークにおいて、高度なSwin TransformerのバックボーンとHiLoの注意を活用することにより、統合された顔認識とスプーフ攻撃検出をより効果的に処理する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:24:21 GMT)
Computing Optimization-Based Prompt Injections Against Closed-Weights Models By Misusing a Fine-Tuning API [3.9] 本稿では,攻撃者が遠隔操作インタフェースから返却した損失情報を利用して,敵のプロンプトを探索する方法について述べる。
LLMのGoogle Geminiファミリでは65%から82%の攻撃成功率を示しています。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 19:01:25 GMT)
Coded Deep Learning: Framework and Algorithm [3.9] 本稿では,CDL(Coded Deep Learning')と呼ばれる新しいフレームワークを紹介する。
CDLは情報理論のコーディング概念を深層学習の内部動作に統合する。
モデルの重みとアクティベーションを著しく圧縮し、トレーニングとトレーニング後の推論段階の計算複雑性を低減します。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 21:33:47 GMT)
Hybrid Approaches for Moral Value Alignment in AI Agents: a Manifesto [3.7] 次世代人工知能(AI)システムの安全性確保への関心が高まっているため、自律エージェントに道徳を埋め込む新しいアプローチが求められている。
連続体としてモデル化された機械に道徳を導入する問題に対する既存のアプローチの体系化を提供する。
我々は、適応可能で堅牢だが制御可能で解釈可能なエージェントシステムを構築するために、よりハイブリッドなソリューションが必要であると論じている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:58:24 GMT)
Dynamics of Moral Behavior in Heterogeneous Populations of Learning Agents [3.7] 本研究では、道徳的に異質な集団が社会的ジレンマ環境で相互作用する学習力学について研究する。
我々は、親社会と反社会的エージェント間のいくつかの非自明な相互作用を観察する。
ある種の道徳的エージェントは、より協調的な行動に向けて利己的なエージェントを操ることができる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:28:26 GMT)
To Retrieve or Not to Retrieve? Uncertainty Detection for Dynamic Retrieval Augmented Generation [3.7] 不確実性検出メトリクスは、質問応答精度をわずかに低下させるだけで、検索呼び出し数をほぼ半分に減らすことができる。
以上の結果から,Degree Matrix Jaccard や Eccentricity などの不確実性検出指標は,質問応答精度をわずかに低下させることなく,検索回数をほぼ半分に抑えることが示唆された。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 04:56:33 GMT)
Mitigating Overfitting in Graph Neural Networks via Feature and Hyperplane Perturbation [3.4] グラフニューラルネットワーク(GNN)のための新しいデータ拡張戦略を提案する。
初期特徴と超平面の両方を反転させることで、学習可能なパラメータをより正確に更新する訓練スペースを新たに作成する。
実世界のデータセットを用いた実験により,提案手法はノード分類精度を46.5%向上させることができた。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 07:34:31 GMT)
CryoBench: Diverse and challenging datasets for the heterogeneity problem in cryo-EM [3.4] 核電子顕微鏡(cryo-EM)は、画像データから高分解能の3次元生体分子構造を決定するための強力な技術である。
ここでは、CryoBenchを紹介します。CryoBenchは、Cleo-EMにおける異種再構成のためのデータセット、メトリクス、ベンチマークのスイートです。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 00:54:04 GMT)
Treatment Effect Estimation with Observational Network Data using Machine Learning [3.4] 治療効果推定のための因果推論法は、通常独立した単位を仮定する。
本研究では,1つの(社会的)ネットワークからの観測データによる期待平均処理効果(EATE)の推定と推定のための拡張逆確率重み付け(AIPW)を開発した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 20:18:46 GMT)
AALF: Almost Always Linear Forecasting [3.3] 我々は、単純なモデルはたいていの場合十分良いものであり、少数の重要な予測に対してのみDeep Learningメソッドを選択することで、予測性能を改善することができると論じる。
実世界の様々なデータセットに関する実証的研究により、我々の選択手法は、ほとんどの場合、最先端のオンラインモデル選択手法に匹敵する性能を示した。
ほぼ常に単純な自己回帰線形モデルを選択して、結果の競合性能を予測できることが分かる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:29:28 GMT)
RE-POSE: Synergizing Reinforcement Learning-Based Partitioning and Offloading for Edge Object Detection [3.3] エッジデバイス上でのリアルタイムオブジェクト検出は、その限られた計算リソースと、ディープニューラルネットワーク(DNN)ベースの検出モデルの高要求により、大きな課題を呈している。
本稿では,リソース制約のあるエッジ環境における精度-遅延トレードオフを最適化するフレームワークであるRE-POSEを紹介する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:56:45 GMT)
Suggesting Code Edits in Interactive Machine Learning Notebooks Using Large Language Models [3.2] GitHub上の792の機械学習リポジトリの20,095のリビジョンから得られた48,398のJupyterノートブック編集の最初のデータセットを提示する。
我々のデータセットは、セルレベルとラインレベルの修正の詳細な詳細をキャプチャし、機械学習における現実のメンテナンスパターンを理解する基盤を提供する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:55:38 GMT)
Exploring the Capabilities of Vision-Language Models to Detect Visual Bugs in HTML5 <canvas> Applications [3.1] HTML5 canvas> アプリケーションは、ドキュメントオブジェクトモデル(DOM)でそれらを表現することなく、オブジェクトをcanvas> bitmapにレンダリングする。
canvas>ビットマップの期待値と実際の視覚出力のミスマッチを視覚的バグと呼ぶ。
VisionLanguage Models (VLM)は、アプリケーション毎に最大100%の精度で視覚的バグを自動的に検出する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 01:42:33 GMT)
Scaling Graph-Based Dependency Parsing with Arc Vectorization and Attention-Based Refinement [3.1] 本稿では,ベクトルを明示的に構成するグラフベースの依存性解析のための新しいアーキテクチャを提案する。
本手法は,アークスコアリングとラベル付けを単一ネットワークに統一することで,標準的な2ピペリン方式の鍵となる制約に対処する。
我々のアーキテクチャは、高次の依存関係を効率的にシミュレートするために、トランスフォーマー層との限られたアーク相互作用を克服する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:26:17 GMT)
AgRegNet: A Deep Regression Network for Flower and Fruit Density Estimation, Localization, and Counting in Orchards [3.1] 本稿では,樹木果樹冠内の花と果実の密度,数,位置を推定する,深い回帰に基づくネットワークAgRegNetを提案する。
一般的なU-NetアーキテクチャにインスパイアされたAgRegNetは、エンコーダからデコーダへのスキップ接続と、エンコーダ機能抽出器としてConvNeXt-Tを改良したU字型ネットワークである。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 20:25:21 GMT)
Are Open-Vocabulary Models Ready for Detection of MEP Elements on Construction Sites [3.1] 高度な視覚システムを備えた地上ロボットは、機械、電気、配管(MEP)システムの監視などのタスクを自動化することができる。
本研究は, 細調整, 軽量, クローズドセットオブジェクト検出器と比較して, オープン語彙型視覚言語モデルの適用性を評価する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:34:36 GMT)
Swin transformers are robust to distribution and concept drift in endoscopy-based longitudinal rectal cancer assessment [3.0] 直腸癌治療の様々な段階において内視鏡画像を用いて治療の反応と毒性を評価する。
主観評価は非常に変動しており、一部の患者では反応の程度を過小評価することができる。
深層学習の進歩は、内視鏡画像に対して一貫した客観的応答アセスメントを生成する能力を示している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 00:22:53 GMT)
Physics-informed deep learning for infectious disease forecasting [2.9] 物理インフォームドニューラルネットワーク(PINN)に基づく新しい感染症予測モデルを提案する。
提案するPINNモデルでは,障害伝達の動的システム表現を損失関数に組み込む。
ケース数、死亡数、入院数に関するPINNモデルの予測は、既存のベンチマークと一致している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 05:07:05 GMT)
The Power of Types: Exploring the Impact of Type Checking on Neural Bug Detection in Dynamically Typed Languages [2.8] 種々の誤用バグに対する各種神経バグ検出装置に対する型チェックの影響について検討した。
以上の結果から,既存のバグ検出データセットには,タイプ関連バグのかなりの割合が含まれていることが示唆された。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 05:40:08 GMT)
Multiple Choice Questions: Reasoning Makes Large Language Models (LLMs) More Self-Confident Even When They Are Wrong [2.8] 回答に対する自信は、モデルが直接答えるか、答える前に推論を提供するよう求められたかどうかにどのように依存するかを調査する。
我々の仮説は、この行動は、選択された答えの確率を変更する推論によるものであるというものである。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:27:51 GMT)
MOGNET: A Mux-residual quantized Network leveraging Online-Generated weights [2.7] MOGNETは、リソース限定のハードウェアと互換性のあるコンパクトなモデルアーキテクチャである。
類似またはより低いモデルサイズで1%まで明確なギャップを保ち、より高い精度を達成することができる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:30:20 GMT)
Metric Learning with Progressive Self-Distillation for Audio-Visual Embedding Learning [2.7] メトリクス学習は、類似点と相違点が定量化される組込み空間にサンプルを投影する。
本稿では, クロスモーダル三重項損失とプログレッシブ自己蒸留を統合した新しいアーキテクチャを提案する。
各バッチのサブセットにアノテートされたラベルからオーディオ視覚分布に基づく知識を抽出する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:32:41 GMT)
Rethinking Pre-Trained Feature Extractor Selection in Multiple Instance Learning for Whole Slide Image Classification [2.7] 複数インスタンス学習(MIL)は、パッチレベルのアノテーションを必要とせずに、ギガピクセル全体のスライド画像(WSI)分類に好まれる方法となっている。
本研究では,3次元のMIL特徴抽出器(事前学習データセット,バックボーンモデル,事前学習手法)を体系的に評価する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 02:09:15 GMT)
Cueless EEG imagined speech for subject identification: dataset and benchmarks [2.6] 脳波をベースとした疑似音声パラダイムを導入し,外的手がかりを伴わない意味論的意味のある単語の発音を被験者が想像する。
分類精度は97.93%であった。
これらの知見は、現実世界のアプリケーションにおいて、セキュアで信頼性の高い被検体識別のためのキューレス脳波パラダイムの可能性を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:54:56 GMT)
Parallel multi-objective metaheuristics for smart communications in vehicular networks [2.6] 本稿では,車載ネットワーク用のAdhoc On Demand Vectorルーティングプロトコルの高品質設定を自動的に検索する2つの並列多目的ソフトコンピューティングアルゴリズムについて分析する。
実験により、最適化アルゴリズムによって計算された構成が、他の最先端の最適化構成よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:16:34 GMT)
Comprehensive Survey of QML: From Data Analysis to Algorithmic Advancements [2.6] 量子機械学習(Quantum Machine Learning)は、量子コンピューティングと機械学習の交差点におけるパラダイムシフトである。
この分野は、ハードウェアの制約、ノイズ、量子ビットコヒーレンス(英語版)の制限など、重大な課題に直面している。
この調査は、実用的な実世界のアプリケーションに向けて量子機械学習を進めるための基盤となるリソースを提供することを目的としている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:25:49 GMT)
Generating particle physics Lagrangians with transformers [2.5] 物理学において、ラグランジアンは物理システムを管理する法則を記述する体系的な方法を提供する。
ラグランジアンを言語表現に類似した複雑な規則構造として扱うことにより、与えられた粒子のリストに対応するラグランジアンを予測するためにトランスフォーマーモデルを訓練した。
入力埋め込みの解析を通して、モデルがラグランジアンを生成するために学んだ群表現や共役演算といった内部概念を持つことを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:25:50 GMT)
Connectivity for AI enabled cities -- A field survey based study of emerging economies [2.5] この論文は、新興国でAIを成功させるために緩和する必要がある課題に焦点を当てている。
これは、安価で高品質なインターネットベースのサービスに対する市民の願望を強調している。
この調査結果は、多様なユーザ要求を満たすための高度な通信ネットワークの必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 11:31:39 GMT)
CaPa: Carve-n-Paint Synthesis for Efficient 4K Textured Mesh Generation [2.5] CaPaは、高忠実度3Dアセットを効率的に生成するカーブ・アンド・ペイントのフレームワークである。
テクスチャの忠実さと幾何学的安定性に優れ、実用的でスケーラブルな3Dアセット生成のための新しい標準を確立する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:03:15 GMT)
A Dynamic and High-Precision Method for Scenario-Based HRA Synthetic Data Collection in Multi-Agent Collaborative Environments Driven by LLMs [2.5] 本研究では,細調整された大規模言語モデル(LLM)を活用した,新たなシナリオ駆動型ワークロード推定手法を提案する。
この方法はオペレータのワークロードの変化に動的に適応し、より正確でフレキシブルでスケーラブルなワークロード推定を提供する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:23:48 GMT)
Sequential PatchCore: Anomaly Detection for Surface Inspection using Synthetic Impurities [2.4] 本研究は, 合成データ生成における不純物の検討の重要性を強調した。
合成データに水染色を含む手続き的手法を提案する。
合成データセットは実際のデータセットに対応するように生成され、さらに異常検出モデルのトレーニングに使用される。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:56:41 GMT)
Latent Space Characterization of Autoencoder Variants [2.3] 我々は、畳み込みオートエンコーダ(CAE)、復調オートエンコーダ(DAE)、変分オートエンコーダ(VAE)など、様々なオートエンコーダによって学習される潜伏空間の構造を特徴付ける。
また、距離保存変換を用いて行列多様体の点をヒルベルト空間に写像し、ヒルベルト空間で生成される部分空間を入力の歪みの関数として別のビューとする。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:44:39 GMT)
On the convergence of noisy Bayesian Optimization with Expected Improvement [2.3] 期待されている改善(EI)はベイズ最適化において最も広く使われている獲得機能の一つである。
我々は3つの新しい領域における収束理論EIに貢献する。
ノイズのないケースとノイズの多いケースの両方でエラー境界が改善したことを証明した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:11:50 GMT)
The Goofus & Gallant Story Corpus for Practical Value Alignment [2.1] 価値や原則は、人々の行動と機能に影響を与える人間の社会の重要な要素である。
人間の社会ではAIシステムがユビキタスになりつつあるため、これらの規範や価値観に違反し、潜在的に害をもたらす可能性があるという大きな懸念がある。
本研究では,実生活における規範的・非規範的行動を示すマルチモーダルデータセットを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:58:58 GMT)
From Explainability to Interpretability: Interpretable Policies in Reinforcement Learning Via Model Explanation [2.1] 本稿では,複雑な深いRLポリシーを透過的な表現に変換するためのモデルに依存しない新しいアプローチを提案する。
提案手法を既存の3つの深部RLアルゴリズムを用いて評価し,その性能を2つの古典的制御環境で検証した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 22:11:03 GMT)
A Runtime Analysis of the Multi-Valued Compact Genetic Algorithm on Generalized LeadingOnes [2.1] 我々は,r値のLeadingOnes関数上での複数値cGAのランタイム解析を行った。
r-LeadingOnes上のr-cGAのランタイムは、高い確率でO(n2r2 log3 n log2 r)であることが示される。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:59:07 GMT)
Evaluating LLM Abilities to Understand Tabular Electronic Health Records: A Comprehensive Study of Patient Data Extraction and Retrieval [2.0] 我々はMIMICデータセットを用いて実験を行い、素早い構造、命令、文脈、実演の影響を探索する。
その結果,最適特徴選択とシリアライズ手法はタスク性能を最大26.79%向上させることができた。
実例選択によるインコンテキスト学習では,データ抽出性能が5.95%向上した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:52:50 GMT)
Analytical Performance Estimations for Quantum Repeater Network Scenarios [2.0] 量子リピータチェーンは将来の量子ネットワークのバックボーンを形成し、ネットワークノード間の絡み合いを分散する。
量子リピータチェーンのダイナミクスをモデル化するためにマルコフ連鎖を用いることで、長期スループットとオンデマンドレイテンシの解析的推定を提供する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 20:31:20 GMT)
Sentiment Analysis in Twitter Social Network Centered on Cryptocurrencies Using Machine Learning [1.9] 本稿では,Twitter上での暗号通貨に関するイラン人の意見を考察する。
感情に基づいてツイートを分類する最良のモデルを提供する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:15:52 GMT)
pFedWN: A Personalized Federated Learning Framework for D2D Wireless Networks with Heterogeneous Data [1.9] 従来のフェデレートラーニングアプローチは、クライアント間のデータの異質性に悩まされることが多い。
PFLは、非独立で同一の分散(非IID)とクライアント間のアンバランスなデータによって引き起こされる課題に対する解決策として現れます。
デバイス間通信(D2D)の無線チャネル条件をサーバフリーなPFLアプローチに組み込む共同最適化問題を定式化する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 20:16:49 GMT)
The Spread of Virtual Gifting in Live Streaming: The Case of Twitch [1.9] 本稿では,世界最大級のライブストリーミングプラットフォームであるTwitchの視聴者に対して,ギフトの広がりについて検討する。
我々は、ギフト受信のランダムな性質を自然実験環境として認識する。
贈与者に対して、贈与の広がりを促進または抑える可能性のある様々な贈与タイプを考慮し、賞与者が前払いするかどうかを検討する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 01:40:55 GMT)
Managed-Retention Memory: A New Class of Memory for the AI Era [1.8] Managed-Retention Memory(MRM)は、AI推論ワークロードのキーデータ構造を格納するように最適化されている。
MRMはさまざまなトレードオフを行い、ワークロードのIOパターンを理解することによって、長期的なデータ保持と書き込みパフォーマンスを予見し、これらのワークロードの重要なメトリクスのパフォーマンスを向上させる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:25:44 GMT)
Multimodal Marvels of Deep Learning in Medical Diagnosis: A Comprehensive Review of COVID-19 Detection [1.8] 本研究は、新型コロナウイルスを例として、診断における多モード深層学習(DL)の可能性について概説する。
新型コロナウイルス(COVID-19)パンデミックの間、人工知能の応用が成功し、病気のスクリーニング、予測、分類におけるDLの能力を明らかにすることを目的としている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:38:49 GMT)
The Qudit Cirq Library: An Extension of Google's Cirq Library for Qudits [1.8] Qudit CirqライブラリはGoogleのqudits用Cirqライブラリの拡張である。
我々の拡張は、キューディットの作成、一般的なキューディットゲートの適用、回路の構築、これらの回路上の量子計算のシミュレーションのためのビルトインメソッドを備えている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 02:36:49 GMT)
NL2KQL: From Natural Language to Kusto Query [1.8] NL2KQLは、大規模言語モデル(LLM)を使用して自然言語クエリ(NLQ)をKusto Query Language(KQL)クエリに変換する革新的なフレームワークである。
NL2KQLのパフォーマンスを検証するために、オンライン(クエリ実行に基づく)とオフライン(クエリ解析に基づく)メトリクスの配列を使用します。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:08:22 GMT)
Poxel: Voxel Reconstruction for 3D Printing [1.7] は、フォトポリマージェット3Dプリントに最適化されたボクセルベースの3D再構成フレームワークであるPrinable-Voxelの略である。
我々のフレームワークは、ビュー依存性を除去することで、印刷可能なボクセルグリッドを直接出力する。
提案システムは,物理3Dオブジェクトの要件に整合して,印刷モデルの忠実度と品質を向上する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:01:31 GMT)
WindsorML: High-Fidelity Computational Fluid Dynamics Dataset For Automotive Aerodynamics [1.7] 本稿では,Windsorボディの355の幾何学的変種を含む機械学習(ML)のための,オープンソースの新しい高忠実度データセットを提案する。
著者らにとってこれは、許容オープンソースライセンス(CC-BY-SA)を持つWindsorボディのための、最初の大規模高忠実CFDデータセットである。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 11:11:30 GMT)
Electronic Health Records: Towards Digital Twins in Healthcare [1.7] 本章では、医療情報システムの進化と重要性について論じる。
英国と米国における EHR の実施に関する調査から始まる。
国際疾病分類(ICD)システムの概要を概観し、ICD-9からICD-10までの発展を辿る。
この議論の中心はMIMIC-IIIデータベースであり、これは医療データ共有における目覚ましい業績であり、世界中の研究者が自由に利用できる最も包括的なクリティカルケアデータベースである。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:30:02 GMT)
Metrics for Inter-Dataset Similarity with Example Applications in Synthetic Data and Feature Selection Evaluation -- Extended Version [1.7] 既存のデータセット間の類似度を測定する方法は計算コストが高く、制限され、異なるエンティティに敏感である。
データセット間の類似度を測定するための2つの新しい指標を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:17:27 GMT)
TakuNet: an Energy-Efficient CNN for Real-Time Inference on Embedded UAV systems in Emergency Response Scenarios [1.7] TakuNetは、Deep-wise convolutionsや早期のダウンサンプリングステムといったテクニックを採用した、新しい軽量アーキテクチャである。
パラメータの最小値にもかかわらず、緊急時の航空画像の分類において、最先端の精度を達成する。
リソース制約のあるプラットフォーム上でのリアルタイムAI処理や、緊急シナリオにおけるドローンの適用性向上に適している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 20:35:28 GMT)
Discriminative Representation learning via Attention-Enhanced Contrastive Learning for Short Text Clustering [1.7] 我々は,textbfAttention-textbfEnhanced textbfContrastive textbfLによる識別表現学習という,新しいテキストクラスタリング手法を提案する。
実験の結果,提案したtextbfAECL は最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 07:56:42 GMT)
Strategic Base Representation Learning via Feature Augmentations for Few-Shot Class Incremental Learning [1.5] クラスインクリメンタルな学習は、学習済みのクラスの知識を少数のトレーニングインスタンスで保持しながら、新しいクラスを学習するモデルを意味する。
既存のフレームワークは通常、新しいクラスを組み込む際に、以前に学んだクラスのパラメータを凍結する。
本稿では,新しいクラスに対応するために,事前学習したクラスの分離を強化するために,機能拡張駆動型コントラスト学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:17:32 GMT)
Overshoot: Taking advantage of future gradients in momentum-based stochastic optimization [1.4] オーバーシュート(Overshoot)は、標準およびネステロフの運動量を超えて性能を高めるために設計された運動量に基づく降下最適化手法である。
オーバーシュートは、様々なタスクで標準とネステロフの勢いを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:18:10 GMT)
Quantum particle in the wrong box (or: the perils of finite-dimensional approximations) [1.4] トランケートされたハミルトニアンによって生成されるシュル・オーディンガー方程式の解は、実際のハミルトニアンに対応するシュル・オーディンガー方程式の解に収束しないことを示す。
重要なことに、数値シミュレーションは必然的にその限界における間違った力学を再現するが、この失敗を明らかにする数値的なテストは存在しない。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:16:39 GMT)
Threshold Quantum Secret Sharing [1.4] 量子秘密共有プロトコルとして$(t,n)$しきい値アプローチとmodulo dが最近Songらによって議論された。
他の参加者の情報がなければ、Song em et al.のsprotocolの秘密は再構築できない。
本稿では,この問題を解決するプロトコルについて述べる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:21:24 GMT)
Quantum-Enhanced Transformers for Robust Acoustic Scene Classification in IoT Environments [1.3] この研究は、IoTネットワークにインテリジェントな音響センサーを配置する方法を開拓し、スマートホーム、産業監視、環境監視に応用する可能性がある。
QASCの精度は68.3%から88.5%で、最先端の手法よりも5%以上高い。
この研究は、IoTネットワークにインテリジェントな音響センサーを配置する方法を開拓し、スマートホーム、産業監視、環境監視に応用する可能性がある。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:06:10 GMT)
Variational method for $\mathbb{Z}_K$ wavefunctions in spin-$J$ PXP model [1.3] 時間依存変動原理(TDVP)の1次元スピン-J$PXPモデルに対するデチューニングによるアプローチについて検討する。
本研究では, 変分力学と変分誤差を熱力学極限における高速収束級数として表現できることを実証した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 05:32:30 GMT)
Wasserstein Gradient Flows for Moreau Envelopes of f-Divergences in Reproducing Kernel Hilbert Spaces [1.2] 特性カーネル$K$に付随する2乗最大平均誤差により$f$-divergenceを正規化する。
ヒルベルト空間におけるモローエンベロープのよく知られた結果を利用して、MDD規則化された$f$-divergencesを解析する。
本稿では,経験的指標から始まる流れの概念実証数値例を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:05:26 GMT)
Transformer Models for Quantum Gate Set Tomography [1.2] 量子計算は、高性能コンピューティングの領域における有望なフロンティアである。
本研究では,高忠実かつスケーラブルな量子プロセッサを製造する上での課題について検討する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:17:43 GMT)
An Adaptive Collocation Point Strategy For Physics Informed Neural Networks via the QR Discrete Empirical Interpolation Method [1.2] QR離散経験補間法(QR-DEIM)を用いた適応的コロケーション点選択法を提案する。
我々のQR-DEIMに基づく手法は既存の手法と比較してPINNの精度を向上することを示した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:02:59 GMT)
Bridging Language Barriers in Healthcare: A Study on Arabic LLMs [1.2] 本稿では,多言語理解と医学知識の両方に熟練した大規模言語モデルを開発する上での課題について考察する。
言語比率を慎重に調整した大規模モデルは、母国語の臨床課題において優れた性能を発揮することが判明した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 20:24:56 GMT)
Enhancing Few-Shot Image Classification through Learnable Multi-Scale Embedding and Attention Mechanisms [1.2] 少数の分類の文脈において、ゴールは、限られた数のサンプルを使用して分類器を訓練することである。
伝統的なメートル法は、この目的を達成するための一定の限界を示す。
提案手法では,サンプルを異なる特徴空間にマッピングするマルチ出力埋め込みネットワークを利用する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:01:58 GMT)
Using Machine Learning to Discover Parsimonious and Physically-Interpretable Representations of Catchment-Scale Rainfall-Runoff Dynamics [1.2] 本稿では,汎用ネットワークアーキテクチャの基本計算単位としてMass Conserving Perceptron (MCP) を用いる方法を示す。
物理的解釈可能性と優れた予測性能は,比較的相似な分散状態マルチフローパスネットワークを用いて達成可能であることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:48:36 GMT)
Local US officials' views on the impacts and governance of AI: Evidence from 2022 and 2023 survey waves [1.1] 本稿では、米国の政策立案者のAIの将来的影響と規制に関する見解について調査する。
地域社会や国家に対するAIの影響に関する政策立案者の期待に対する洞察を提供する。
ChatGPTのリリースとその後のAIに対する大衆の認識の高まりを受けて、態度の変化を捉えている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:25:58 GMT)
Democratizing AI Governance: Balancing Expertise and Public Participation [1.1] 人工知能(AI)システムの開発と展開は、その大きな社会的影響とともに、ガバナンスにとって重要な課題を提起している。
本稿では、専門家主導による監視と民主的参加の緊張関係を考察し、参加型と熟考型民主主義のモデルを分析する。
これらのアプローチを欧州連合に合わせたバランスの取れたガバナンスモデルに統合するための勧告が提供されている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:47:33 GMT)
Modeling Language for Scenario Development of Autonomous Driving Systems [1.1] 本研究は,自動車位置図 (CPD) という表記を導入した。
CPDは多数のシナリオの簡潔な表現を可能にし、シナリオ分析と設計に特に適している。
シナリオ列挙のためのツールが実装され、典型的な車の挙動と国際標準の両方で実験が行われる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 06:19:55 GMT)
Fröhlich versus Bose-Einstein Condensation in Pumped Bosonic Systems [0.9] 室温で汲み上げられたボソニック系で発生するマグノン凝縮は、大きな関心を集め続けている。
伝統的にボース=アインシュタイン凝縮の言葉で定式化されているが、Fr"ohlich-condensationによって説明することもできる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:18:56 GMT)
PixelBrax: Learning Continuous Control from Pixels End-to-End on the GPU [0.9] 画素観察を伴う連続制御タスクの集合であるPixelBraxについて述べる。
私たちはBrax物理エンジンと純粋なJAXを組み合わせて、強化学習実験をGPU上でエンドツーエンドで実行できるようにします。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:00:10 GMT)
Rational Tuning of LLM Cascades via Probabilistic Modeling [0.9] 大規模言語モデル(LLM)の連立性能分布の確率的モデルを提案する。
グリッドサーチを用いた信頼性閾値の選択と比較して,提案手法はカスケードの長さとコストエラー曲線の所望の解像度に関して,実行時のスケーリングを大幅に改善する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 07:58:33 GMT)
On the Energy Consumption of Test Generation [0.9] 本研究では,EvoSuiteが生成したテストの実行時に消費するエネルギーと,生成したテストケースの実行時に消費するエネルギーを計測する。
その結果、異なるテスト生成アルゴリズムは、特に高サイクロマティックな複雑性を持つクラスにおいて、異なる量のエネルギーを消費したことが明らかとなった。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:52:55 GMT)
MagnetDB: A Longitudinal Torrent Discovery Dataset with IMDb-Matched Movies and TV Shows [0.8] magnetDBは2018年から2024年にかけてBitTorrent DHTを通じて発見されたトレントの時系列データセットである。
データセットには2860万以上のトレントと9億5000万以上のファイルのメタデータが含まれている。
映画やテレビ番組のトレントにIMDbマッチングとアノテーションを適用することで、MrnetDBはBitTorrentネットワークにおける海賊コンテンツ進化の詳細な分析を容易にする。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:44:28 GMT)
SoccerSynth-Detection: A Synthetic Dataset for Soccer Player Detection [0.7] Soccer Synth-Detectionは、合成サッカー選手を検出するために設計された最初の合成データセットである。
広い範囲のランダムな照明やテクスチャ、シミュレートされたカメラモーションのぼかしなどが含まれる。
本研究は,サッカービデオ解析の分野でのアルゴリズム学習において,実際のデータセットを置き換える合成データセットの可能性を示すものである。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 04:06:59 GMT)
Text Semantics to Flexible Design: A Residential Layout Generation Method Based on Stable Diffusion Model [0.7] フレキシブルな住宅レイアウトを生成するための安定拡散モデルに基づくクロスモーダル設計手法を提案する。
この方法は、学習目的のための複数の入力型を提供し、ユーザーは境界とレイアウトの両方を指定できる。
また,知識グラフ内に設計の専門知識をカプセル化し,それを自然言語に変換するスキームを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:57:38 GMT)
ARMAX identification of low rank graphical models [0.7] 大規模システムでは複雑な内部関係がしばしば存在し、このような相互接続システムは低階のプロセスによって効果的に記述できる。
既存の下級識別アプローチは、ノイズを明示的に考慮しないことが多く、弱い雑音の下でも無視できない不正確さにつながった。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:43:32 GMT)
An efficient likelihood-free Bayesian inference method based on sequential neural posterior estimation [0.7] SNPE技術はニューラルネットワークに基づく条件密度推定器を用いて逐次シミュレーションから後部を学習する。
SNPE法は、キャリブレーションカーネルを用いて観測データの周囲のサンプル重量を増大させ、集中的な損失関数をもたらす。
本稿では,適応キャリブレーションカーネルと分散低減技術を用いてSNPEの安定性を向上させることを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 00:53:15 GMT)
A Multi-Modal Approach for Face Anti-Spoofing in Non-Calibrated Systems using Disparity Maps [0.6] 顔認識技術は、顔の偽造攻撃に対して脆弱である。
ステレオ深度カメラはこのような攻撃を効果的に検出できるが、その高いコストで採用が制限される。
本稿では,顔の特徴を利用して異質情報を導き出すことにより,この課題を克服する手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:20:56 GMT)
A Multi-tiered Solution for Personalized Baggage Item Recommendations using FastText and Association Rule Mining [0.6] 本稿では,旅行者を対象としたパッケージングを最適化するインテリジェントバッグアイテムレコメンデーションシステムを提案する。
このシステムは、効率的な荷物スペースの利用、重量制限の遵守、旅行体験の向上を保証する。
パフォーマンスは、カバレッジ、サポート、信頼、リフト、レバレッジ、信念といったメトリクスを使って評価されます。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:15:21 GMT)
From Scarcity to Capability: Empowering Fake News Detection in Low-Resource Languages with LLMs [0.6] BanFakeNews-2.0は、Bangla偽ニュース検出を強化する堅牢なデータセットである。
このバージョンには、信頼できる情報源から検証された、慎重にキュレートされた偽のニュース記事が11700件追加されている。
さらに、460件の偽ニュースと540件の真正ニュースを手作業で収集した独立したテストセットを作成しました。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:24:41 GMT)
Exploring AI-based System Design for Pixel-level Protected Health Information Detection in Medical Images [0.6] 本稿では,テキスト検出,テキスト抽出,医用画像中のPHI内容の分析という,PHI検出のためのAIベースのパイプラインを提案する。
パイプライン内の視覚モデルと言語モデルの役割を交換して実験することにより、性能を評価し、PHI検出タスクに最適な設定を推奨する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:12:33 GMT)
Solving the unsolvable: Translating case law in Hong Kong [0.6] この論文は、政府や司法機関が事件法を翻訳するための散発的かつ非協調的な努力を批判している。
提案手法では,機械翻訳技術を活用した対話型翻訳プラットフォームを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:17:58 GMT)
Unifying quantum stochastic methods using Wick's theorem on the Keldysh contour [0.5] 我々はケルディシュ輪郭に自然に定式化された系の力学の伝搬子に対するコンパクトな表現を開発する。
本手法の主な利点は,初期システムバス相関を考慮に入れやすいため,その柔軟性である。
TheEの解法は、情報を失うことなく単一の物理的雑音で書けることを証明している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:52:48 GMT)
W3ID: A Quantum Computing-Secure Digital Identity System Redefining Standards for Web3 and Digital Twins [0.5] 本稿では,Web3 標準規格の略である W3ID を紹介する。
W3IDは、量子コンピューティングによって引き起こされる脆弱性に対処しながら、Web3標準を満たすように設計されている。
W3IDは、セキュアな認証のためにデュアルキーシステムを採用し、公開とプライベートの認証機構を強化している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 19:16:08 GMT)
Silent Abandonment in Text-Based Contact Centers: Identifying, Quantifying, and Mitigating its Operational Impacts [0.5] 17社にまたがる顧客の3%から70%が黙秘している。
ある研究では、放棄された顧客の71.3%が黙って、エージェント効率を3.2%、システム容量を15.3%削減した。
我々は,無声放棄行動の疑いやサービス設計の変更を予測し,無声放棄の影響を運用的に緩和する戦略を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:30:23 GMT)
CrossModalityDiffusion: Multi-Modal Novel View Synthesis with Unified Intermediate Representation [0.5] CrossModalityDiffusion(クロスモダリティ・ディフュージョン)は、シーン幾何学の知識を必要とせず、様々なモダリティにまたがる画像を生成するために設計されたモジュラーフレームワークである。
異なるモジュールを共同でトレーニングすることで、フレームワーク内のすべてのモダリティに対して一貫した幾何学的理解が保証されることを示す。
合成ShapeNet車のデータセット上でのCrossModalityDiffusionの機能を検証する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 20:56:32 GMT)
ELM-DeepONets: Backpropagation-Free Training of Deep Operator Networks via Extreme Learning Machines [0.5] Deep Operator Networks (DeepONets)は、オペレータ学習のための最も著名なフレームワークである。
我々は,ELMのバックプロパゲーションフリーな性質を活用する,DeepONetsのためのエクストリーム学習マシン(ELM)フレームワークであるELM-DeepONetsを提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:06:43 GMT)
Adaptive-depth randomized measurement for fermionic observables [0.4] 推定精度を維持しつつ回路深さを低減することを目的とした適応深度フェルミオン型古典影(ADFCS)プロトコルを提案する。
ADFCSはより効率的な量子シミュレーションを可能にし、量子状態推定の忠実さを保ちながら回路深度を低減できる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:47:10 GMT)
Optimal limits of continuously monitored thermometers and their Hamiltonian structure [0.2] ボソニックおよびフェルミオン環境における温度測定の基本的および実用的精度の限界について,N$レベルのプローブを結合して連続的にモニタリングすることにより検討した。
以上の結果から,Fisher情報によって定量化される最終的な精度限界は,平衡温度測定よりも指数関数的に向上したN$と線形にスケールすることが示唆された。
固定されたハミルトン構造では、観測された観測された観測された観測された軌道を最小限の誤差で温度推定にマッピングする最大推定戦略を開発する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:45:27 GMT)
Unitary Expressions: A Necessary Abstraction for Extensible Quantum Programming Languages and Systems [0.2] シンボルユニタリ表現として記述されたゲートからなるプログラムを記述・解析・最適化・分析・活用するためのOpenQuditシステムを提案する。
QGLはユニタリ固有の式言語で、OpenQuditでジャスト・イン・タイムのコンパイラを差別化する。
我々のQVMは、現在の主要な数値量子コンパイルフレームワークの約10倍高速に計算できる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:05:41 GMT)
Conversational Text Extraction with Large Language Models Using Retrieval-Augmented Systems [0.2] 本研究では,Large Language Models (LLMs) を利用した対話インタフェースを用いてPDF文書からテキストを抽出するシステムを提案する。
このシステムは、PDF内の関連するパスをハイライトしながら、ユーザからの問い合わせに対して情報的応答を提供する。
提案システムは,既存のテキスト抽出・要約技術と比較して,競争力のあるROUGE値を提供する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 19:12:25 GMT)
High-accuracy multi-ion spectroscopy with mixed-species Coulomb crystals [0.2] 4つのクロックイオンによる動作は不安定性を1.6times10-15/sqrtt/(1;mathrms)$から9.2times10-16/sqrtt/(1;mathrms)$に下げる。
状態準備中の崩壊関連死亡時間のモデルを作成し, 観測された不安定性のスケーリングとクロックイオン数$N$とを一致させる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:40:45 GMT)
$^{115}$In$^+$-$^{172}$Yb$^+$ Coulomb crystal clock with $2.5\times10^{-18}$ systematic uncertainty [0.2] 我々は15$In$+$の遷移に基づいて、スケーラブルな混合種Coulombクリスタルクロックを提示する。
これは不安定性を9.2times10-16/sqrttau/1;mathrms$.2times10-16/sqrttau/1;mathrms$に減少させる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:20:55 GMT)
Shape-Based Single Object Classification Using Ensemble Method Classifiers [0.1] セマンティックギャップを効果的にブリッジするための階層的分類フレームワークが提案されている。
この手法は、AmazonとGoogleのデータセットから単一のオブジェクトイメージを分類するために適用された。
分類精度は20%から99%と推定された。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 05:58:32 GMT)
Towards a Framework for Enterprise Architecture in Mobile Government: A Case Study [0.1] m- Governmentモデルは、情報技術(IT)基盤、セキュリティ、アプリケーション管理および実装の観点から、e- Governmentから逸脱する。
企業アーキテクチャ(EA)は、e政府を通じて公共セクターにおける効率性と情報通信技術(ICT)の活用を高めるために、グローバルに開発・活用されている。
本研究は, m- Government に適した EA の開発を目指す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:13:09 GMT)
Relativity and decoherence of spacetime superpositions [0.1] 量子重力の理論では、時空幾何学の半古典状態の量子重ね合わせが存在する。
本稿では,このような「時空状態の量子重ね合わせ」を記述するための枠組みを紹介する。
重畳振幅が座標変換によって異なる状態の場合、一つの固定された背景上で動的にシナリオを再表現することは常に可能であることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 21:20:10 GMT)
Village-Net Clustering: A Rapid approach to Non-linear Unsupervised Clustering of High-Dimensional Data [0.0] 教師なしクラスタリングアルゴリズム「Village-Net」を開発した。
まず、K-Meansクラスタリングを利用して、データセットを別個のサブセットに分割する。
我々は,既存の実世界のデータセットに対して,その競合性能を示すために,既知の地下構造ラベルを用いた広範なベンチマークを行う。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 06:56:43 GMT)
Utilizing AI Language Models to Identify Prognostic Factors for Coronary Artery Disease: A Study in Mashhad Residents [0.0] 本研究の目的は,Naive Bayes,REP Tree,J48,CART,CHAIDアルゴリズムを用いて,マシュハドの冠動脈疾患の予後マーカーを評価することである。
CARTおよびCHAIDモデルにおける冠動脈疾患の主な予後因子は、年齢、心筋梗塞歴、高血圧、うつ病スコア、身体活動、BMIである。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 11:32:03 GMT)
Unpolarized prethermal discrete time crystal [0.0] 非分極前熱離散時間結晶(UPDTCs)と呼ばれる新しい熱水前DTCのクラスを導入する。
常磁性初期状態に対するスタッガー磁化の自己相関関数において、頑健な周期倍のダイナミクスが持続可能であることを示す。
我々は,PDTCはFloquet予熱法と整合して,高周波駆動方式において指数的に長寿命であることを示した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:47:17 GMT)
Universal Behavior of Tunneling Time and Barrier Time-Delay Decoupling in Attoclock Measurements [0.0] 断熱トンネルの時間遅れと非断熱トンネルのイオン化との差から,バリアトンネルの時間遅れを合理的に定義し,決定できることを示す。
弱い測定限界では、バリアの時間遅延はラーモア時計時間とバリア内の相互作用時間に対応する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:09:27 GMT)
Understanding Mental Health Content on Social Media and Its Effect Towards Suicidal Ideation [0.0] この研究は、膨大な量のソーシャルメディアデータを分析して言語パターンを検出するために、これらの技術の応用について詳述している。
自殺予防にこれらの技術を用いる際の現実の有効性、限界、倫理的考察を評価する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 05:46:27 GMT)
Towards Spectral Convergence of Locally Linear Embedding on Manifolds with Boundary [0.0] 局所線形埋め込み(Locally Linear Embedding)と呼ばれる教師なし学習アルゴリズムの振る舞いを制御した微分演算子の固有値と固有関数について検討する。
固有関数上の自然な正則性条件は一貫した境界条件を課し、フロベニウス法を用いて点的挙動を推定する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:45:53 GMT)
Topological quantum compilation of metaplectic anyons based on the genetic optimized algorithms [0.0] グローバルな反干渉能力を持つ量子コンピューティングは、いくつかをブレイディングすることで実現される。
我々は、F-行列、R-シンボル、メタプレクティック・エノンの融合規則を利用した合計28のエノンモデルを得る。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:26:43 GMT)
Topological origin of non-Hermitian skin effect in higher dimensions and uniform spectra [0.0] 非エルミート皮膚効果は、非エルミート系における系の境界付近の固有状態の凝集によって特徴づけられる。
この研究は点ギャップの観点を採用し、すべての空間次元における非エルミート皮膚効果は点ギャップから生じることを明らかにしている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:51:49 GMT)
Threetangle in the XY-model class with a non-integrable field background [0.0] 3つの三角形の平方根は、積分性を破る平面内磁場成分を持つ横XYモデルに対して計算される。
このシステムは3つの絡み合った状態の準純度源として、あるいは絡み合いによって引き起こされるスイッチとして実験的に使用できる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:21:20 GMT)
ThreatCluster: Threat Clustering for Information Overload Reduction in Computer Emergency Response Teams [0.0] 本稿では,マルチアームバンディット(MAB)に基づくサイバー脅威インテリジェンス(CTI)ドメインに着目した集中型クローラを提案する。
本研究では,収穫率25%以上を達成し,使用済み種子を300%以上拡大できるThreatCrawlというシステムを提案する。
さらに、このクローラは、以前は知られていなかったが、非常に関連性の高い概要ページ、データセット、ドメインを特定した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:58:30 GMT)
Thermodynamics of coherent energy exchanges between lasers and two-level systems [0.0] 本研究では,コヒーレントマクロ電磁場(レーザー)と2レベル系(量子ビット)の共鳴近傍の量子熱力学について検討した。
レーザーが自律的な作業源として機能し、マクロ的な限界において、生成した作業がレーザーの位相に依存しないことが示される。
レーザーを外部磁場として扱うことで、強い駆動状態における量子熱力学予測と矛盾する仕事の表現が得られることが知られている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:15:03 GMT)
The surprising efficiency of temporal difference learning for rare event prediction [0.0] 我々は,強化学習における政策評価のための時間差(TD)学習,あるいはモンテカルロ(MC)推定器を用いて,時間差(TD)学習の効率を定量化する。
LSTD は MC よりも高い効率で相対精度が得られることを示す。
LSTDは、希少事象の時間スケールとMC推定器の相対精度の両方が、状態数で指数関数的に大きい場合でも、相対精度の一定レベルを維持する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 04:11:29 GMT)
The quantum relative entropy of the Schwarzschild black-hole and the area law [0.0] 任意のシュワルツシルト半径に対するシュヴァルツシルトブラックホールの量子相対エントロピーの領域法則を導出する。
シュワルツシルト計量はエントロピー量子重力の修正アインシュタイン方程式の正確な解ではないが、低カップリング極限で有効な近似解である。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:01:58 GMT)
Testing a cellular automata construction method to obtain 9-variable cryptographic Boolean functions [0.0] 5変数セルオートマトン規則の暗号特性を解析する。
各暗号特性について,48のアフィン同値クラス毎に保持する5変数のセルオートマトン規則の比率を分析する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:48:23 GMT)
Testing Born's rule via photoionization of helium [0.0] 最先端のアト秒光イオン化実験が、いわゆるソルキンテストを通じてボルンの規則をテストする方法が示されている。
ソルキン試験のシミュレーションは、現在までの最高のソルキン試験の範囲で達成可能な測定精度を推定する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:09:55 GMT)
Synthetic Data for Portfolios: A Throw of the Dice Will Never Abolish Chance [0.0] 本稿では、特にポートフォリオやリスクマネジメントにおいて、生成モデルの限界についてより深く理解することを目的としている。
私たちは、モデル開発の分離不能な性質と、パラドックスに触れることで望ましいユースケースを強調します。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:33:03 GMT)
Stylomech: Unveiling Authorship via Computational Stylometry in English and Romanized Sinhala [0.0] 英語とローマ字の両方における著者の帰属は、ここ数十年で主要な要件となった。
本研究は計算言語学の分野に大きく貢献する。
著者帰属の範囲を多種多様な言語文脈に広げることで、デジタルコミュニケーションにおける信頼と説明責任の育成に寄与する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:26:48 GMT)
Soft Knowledge Distillation with Multi-Dimensional Cross-Net Attention for Image Restoration Models Compression [0.0] トランスフォーマーベースのエンコーダデコーダモデルは、画像間転送タスクにおいて顕著な成功を収めた。
しかし、高い計算複雑性はFLOPの増大やパラメータの増大に悩まされ、現実のシナリオでの応用が制限される。
画像復元モデルを圧縮するための多次元クロスネットアテンション(MCA)機構を組み込んだソフトナレッジ蒸留(SKD)戦略を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 06:25:56 GMT)
Sines, Transient, Noise Neural Modeling of Piano Notes [0.0] 3つのサブモジュールはピアノ録音からコンポーネントを学び、ハーモニック、トランジェント、ノイズ信号を生成する。
特異点から、三弦の異なる鍵と畳み込みに基づくネットワークとの結合をエミュレートする。
その結果、モデルがターゲットの部分分布と一致し、スペクトルの上部のエネルギーがより多くの課題をもたらすことを予測した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:52:28 GMT)
Semi-Supervised Image-Based Narrative Extraction: A Case Study with Historical Photographic Records [0.0] 本稿では,歴史写真から物語を抽出するための半教師付きアプローチとして,物語地図アルゴリズムの適応を用いた手法を提案する。
この手法は、ロベルト・ゲルストマン(Robert Gerstmann)が捉えた1928年のサカンバヤ遠征の写真集であるROGERデータセットに適用される。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 23:54:54 GMT)
STROOBnet Optimization via GPU-Accelerated Proximal Recurrence Strategies [0.0] 本研究では,時空間レンジオブザーバ・オブザーバ・オブザーバ・バイパートイトネットワーク(STROOBnet)に着目した。
観測ノード(監視カメラなど)を定義された地理的領域内のイベントにリンクし、効率的な監視を可能にする。
ニューオーリンズのRTCC(Real-Time Crime Camera)システムとCFS(Calls for Service)のデータを用いて、ネットワークの初期観測不均衡に対処する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:02:26 GMT)
Random Subspace Cubic-Regularization Methods, with Applications to Low-Rank Functions [0.0] 本稿では,2階適応正規化のランダムな部分空間変種を提案し,解析する。
我々の手法は探索空間をパラメータのランダムな部分空間に反復的に制限し、この部分空間内でのみ局所モデルを構築し、最小化する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:37:59 GMT)
RAGBench: Explainable Benchmark for Retrieval-Augmented Generation Systems [0.0] Retrieval-Augmented Generation (RAG)は、ユーザ向けチャットアプリケーションにおけるドメイン固有の知識の標準的なアーキテクチャパターンとなっている。
RAGBenchは、100kのサンプルからなる、最初の包括的な大規模RAGベンチマークデータセットである。
TRACe評価フレームワークは、すべてのRAGドメインに適用可能な説明可能かつ実行可能なRAG評価指標のセットである。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:05:17 GMT)
Quantum dynamics of coupled excitons and phonons in chain-like systems: tensor train approaches and higher-order propagators [0.0] 連鎖型量子系における時間依存型シュル・オーディンガー方程式の解について検討する。
効率的な低ランクテンソルトレイン表現を用いて,メモリ消費と計算コストの削減を目指す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:14:13 GMT)
Quantum algorithm for the gradient of a logarithm-determinant [0.0] スパースランク入力演算子の逆を効率的に決定することができる。
入力演算子のすべての$N2$要素の代わりに、量子状態の期待値を測定することは、$O(ksigma)$ timeで実現できる。
このアルゴリズムは、完全に誤り訂正された量子コンピュータ向けに構想されているが、短期的なマシンで実装可能である。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:39:31 GMT)
Quantum Contextual Hypergraphs, Operators, Inequalities, and Applications in Higher Dimensions [0.0] 量子文脈性(quantum contextuality)は、量子計算と量子情報理論をサポートする上で重要な役割を果たしている。
本研究では,様々な手法を用いて任意の次元で文脈ハイパーグラフを生成する方法を示す。
我々は、次元 32 まで広がるハイパーグラフの革新的な例を紹介した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:27:45 GMT)
Pretty-good simulation of all quantum measurements by projective measurements [0.0] 量子論における一般測度は、いわゆる正の演算子値測度(POVM)によって記述される。
我々は、$d$次元量子システムにおいて、一定の($d$に依存しない)可視性パラメータを持つ偏極ノイズの応用により、任意のPOVMが射影測定のランダム化実装によりシミュレート可能であることを示す。
この結果は、様々な情報処理タスクにおいて、POVMが投影的な測定以上のことができるという利点を著しく制限します。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 07:47:24 GMT)
Predicting Air Temperature from Volumetric Urban Morphology with Machine Learning [0.0] 本稿では,都市などの大規模データセットに対して,効率的にかつ高速に動作するVoxelにCityGMLデータを変換する手法を提案する。
複数の都市の3D都市データとそれに対応する気温データを用いて、機械学習モデルを開発する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 11:10:38 GMT)
PolInterviews -- A Dataset of German Politician Public Broadcast Interviews [0.0] 本稿では,高官のドイツ人政治家を特集した公開インタビューのデータセットについて紹介する。
インタビューはYouTubeからソースされ、書き起こされ、話者識別のために処理され、タイディでオープンな形式で保存された。
このデータセットは、5つの主要なインタビューフォーマットで、33人の異なるドイツの政治家との99のインタビューで構成され、合計28,146の文が含まれている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:49:07 GMT)
Phase-Shifted Bell States [0.0] パラメトリックダウン変換により生成された光子を用いた広範囲なEPR-Bell実験に関する新しい結果を示す。
我々の実験は、この位相シフトの特定の角度に対する驚くべき結果を示している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 23:08:46 GMT)
Periodicity and absolute zeta functions of multi-state Grover walks on cycles [0.0] 量子ウォークは数学、量子物理学、量子情報科学の分野で広く研究されている。
本研究では,Grover ウォークの周期と絶対ゼータ関数をサイクルグラフ上で検討する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:50:01 GMT)
Performance Analysis for Crosstalk Errors between Parallel Entangling Gates in Trapped Ion Quantum Error Correction [0.0] 物理量子ビットの様々なクロストーク誤差、ゲート不完全性、コヒーレンス時間の下で論理誤差率とコヒーレンス時間を数値計算する。
現実的なパラメータの下では、ブレーク・エクイティ・ポイントに到達できることが示される。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:15:51 GMT)
Partonic distribution functions and amplitudes using tensor network methods [0.0] 粒子分布関数 (PDF) と分布振幅 (DA) はクォークおよびグルーオン場の光円錐相関器として定義される非摂動量である。
本研究では, テンソルネットワークシミュレーションに基づく一様量子戦略を提案し, ハドロン量を直接抽出する。
1+1次元のNambu-Jona-Lasinioモデルを用いた模擬数値計算を行い、利用可能な正確な対角化と量子回路シミュレーション結果と比較する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:44:45 GMT)
Optimization Strategies for Enhancing Resource Efficiency in Transformers & Large Language Models [0.0] 本研究では,量子化,知識蒸留,プルーニングなどの最適化手法について検討する。
4ビット量子化は、最小精度の損失でエネルギー使用量を大幅に削減する。
KDとStructured Pruningを組み合わせたNVIDIAのMinitronアプローチのようなハイブリッドアプローチは、サイズ縮小と精度保持の間の有望なトレードオフを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:54:44 GMT)
On the Relation between Optical Aperture and Automotive Object Detection [0.0] 交通信号認識や光状態検出などの深層学習タスクにおいて,開口サイズと形状が自動車カメラシステムに与える影響について検討する。
点拡散関数 (PSF) を用いて光学効果をシミュレートし, 現実性を高め, 合成画像と実画像の領域ギャップを低減する手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:31:51 GMT)
Observation of non-Markovian Radiative Phenomena in Structured Photonic Lattices [0.0] 本研究では,2次元構造貯水池に結合したエミッタの非マルコフ放射動力学について検討した。
我々のプラットフォームは、構造化貯水池における単一光子量子光学現象の実験的探索の道を開く。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:05:41 GMT)
Observation of Jones-Roberts solitons in a paraxial quantum fluid of light [0.0] 熱ルビジウム蒸気を伝播する同軸近共振レーザビームを用いて超流動光を生成する。
我々は超流動層に有界渦対渦双極子を励起し、希薄パルスと後方への遷移を観察する。
量子流体の非圧縮性から圧縮性へのコヒーレンス移動を観察し,超流動速度相関を解析および実験的に検討した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:52:24 GMT)
Non-reciprocical Scattering in a Microwave Frequency Comb [0.0] マイクロ波周波数コムのモード内における非相互散乱について検討する。
散乱過程に対する構成的干渉を制御しつつ、逆過程に対する破壊的干渉を同時に達成する。
非相互散乱はパラメトリック制御のためのツールセットを拡張し、新しい量子相関を設計する可能性がある。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:28:04 GMT)
Non-linear regime of atomic arrays at low drive intensity: controlled generation of multiple subradiant excitations via a multi-photon resonance [0.0] 原子配列は、強く制御可能な集合効果を示す興味深い光物質プラットフォームとして登場した。
本研究では, 非線形二粒子共鳴を弱駆動することにより, サブラジアントモードの個体群を制御した定常状態が得られることを示す。
これは相互作用するサブラジアント励起の非ゼロ密度を特徴とし、多体加熱効果に耐える多モードスクイーズ相関と長距離相関を示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 19:39:20 GMT)
NEBULA: A National Scale Dataset for Neighbourhood-Level Urban Building Energy Modelling for England and Wales [0.0] ビルは温室効果ガス排出量に重要な貢献者であり、2022年の世界のエネルギーセクター排出量の26%を占めている。
ネットゼロの目標を達成するには、建物から直接、あるいは間接的に建物で使われる電気と熱の生産から、ビルの排出を急速に削減する必要がある。
地理的に位置付けられたビルレベルのエネルギーデータはヨーロッパではほとんど利用できないが、分析は通常匿名化された、シミュレーションされた、または低解像度のデータに依存している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:26:17 GMT)
Multiplexed Quantum Communication with Surface and Hypergraph Product Codes [0.0] 量子相互接続技術によって複数のプロセッサを接続することは、単一プロセッサの量子コンピュータにおけるスケーラビリティの問題を克服するのに役立つ。
多重化は損失誤差を悪化させるが、インテリジェントな方法で光子に量子ビットを割り当てることで、これらの効果を最小化できることを示す。
この多重化技術は、量子通信や高次元のQuditシステムによるマルチモード量子メモリにも適用することができる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 07:51:38 GMT)
Multi-task deep-learning for sleep event detection and stage classification [0.0] 本研究では,睡眠事象の同時検出と1回のパスでのハイドノグラム構築のためのマルチタスク深層学習手法を提案する。
本研究では,脳波覚醒剤,呼吸イベント(呼吸時,呼吸時,呼吸時,睡眠時)の異なる組み合わせを同定する手法の性能について検討した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:09:37 GMT)
MonoSOWA: Scalable monocular 3D Object detector Without human Annotations [0.0] そこで本研究では,ドメイン固有のアノテーションを使わずに,単眼のRGBカメラに3Dオブジェクト検出器をトレーニングする手法を提案する。
新たに提案されたCanonical Object Spaceのおかげで、この手法は、さまざまなデータセットやカメラのセットアップにまたがるデータを利用して、単一の3D検出器を訓練するだけでなく、これまでは見えなかったカメラのセットアップでも使える。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 11:35:22 GMT)
Mono-Forward: Backpropagation-Free Algorithm for Efficient Neural Network Training Harnessing Local Errors [0.0] バックプロパゲーションは、ニューラルネットワークトレーニングにおける最先端の精度を達成するための標準的な方法である。
HintonのForward-Forwardフレームワークにインスパイアされた,純粋に局所的な階層学習手法であるMono-Forwardアルゴリズムを導入する。
テスト結果は、Mono-Forwardがすべてのタスクでバックプロパゲーションの正確さを一貫して一致または上回っていることを示している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 01:50:34 GMT)
Modeling Time-Variant Responses of Optical Compressors with Selective State Space Models [0.0] 本稿では,Selective State Spaceモデルを用いたディープニューラルネットワークを用いた光学ダイナミックレンジ圧縮機のモデル化手法を提案する。
ネットワークを動的に調整するために、機能ワイドリニア変調とゲート付きリニアユニットを統合した洗練された技術が特徴である。
提案アーキテクチャは、ライブオーディオ処理において重要な低レイテンシおよびリアルタイムアプリケーションに適している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:26:40 GMT)
Model Alignment Search [0.0] 本稿では,分散表現類似性を因果的に探索するモデルアライメント探索(MAS)を提案する。
まず,本手法を用いて,異なる学習種数を持つネットワーク間で,カウントタスクにおける項目数などの特定の因果変数を転送できることを示す。
そこで我々は,MASと既存の因果類似性法の違いを考察し,非現実的潜在補助損失関数を導入する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 21:07:04 GMT)
Machine Learning Nonadiabatic Dynamics: Eliminating Phase Freedom of Nonadiabatic Couplings with the State-Intraction State-Averaged Spin-Restricted Ensemble-Referenced Kohn-Sham Approach [0.0] ダイアバティック・ハミルトニアン(英語版)の対角要素の平方から派生した位相なし結合項$Delta2$を導入する。
その結果,$Delta2$をベースとしたML-ESMD法は,初期ESMDシミュレーションを再現できることがわかった。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:42:39 GMT)
Linear gate bounds against natural functions for position-verification [0.0] 量子位置検証スキームは、証明者の空間的位置を検証しようとする。
我々は、$f$-routing(英語版)と$f$-BB84(英語版)として知られる2つのよく研究された位置検証スキームを考える。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 21:50:59 GMT)
Large-Range Tuning and Stabilization of the Optical Transition of Diamond Tin-Vacancy Centers by In-Situ Strain Control [0.0] マイクロエレクトロメカニカル制御を用いたダイヤモンドSnV中心の広帯域光周波数チューニングについて報告する。
これらの結果は、ダイヤモンドSnVベースの量子ネットワークのオンチップスケーリングの経路を提供する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 19:00:01 GMT)
LLM-Based Routing in Mixture of Experts: A Novel Framework for Trading [0.0] 本稿では,Mix-of-experts(MoE)アーキテクチャのルータとして大規模言語モデル(LLM)を用いる新しいフレームワークを提案する。
具体的には、従来のニューラルネットワークベースのルータをLLMに置き換え、その広範な世界の知識と推論能力を活用する。
マルチモーダルな実世界のストックデータセットに関する我々の実験は、LLMoEが最先端のMoEモデルやその他のディープニューラルネットワークアプローチより優れていることを示した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:25:30 GMT)
Knowledge Distillation for Image Restoration : Simultaneous Learning from Degraded and Clean Images [0.0] 画像復元作業におけるモデル圧縮に適した同時学習知識蒸留(SLKD)フレームワークを提案する。
SLKDは2つの異なる学習戦略:分解除去学習(DRL)と画像再構成学習(IRL)を同時に採用している。
5つのデータセットと3つのタスクにわたる実験結果から、SLKDは強力な画像復元性能を維持しながら、FLOPとパラメータの大幅な削減を実現していることが示された。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 03:35:23 GMT)
Internal structure of gauge-invariant Projected Entangled Pair States [0.0] 投影された絡み合ったペア状態(PEPS)は、自然にグローバルまたはローカル(ゲージ)の対称性を符号化することができる。
局所対称性を持つPEPSは、格子ゲージ理論の非摂動的状態の研究にますます使われている。
射影対対状態の内部構造をゲージ対称性で研究する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:12:48 GMT)
Intermodal quantum key distribution field trial with active switching between fiber and free-space channels [0.0] インターモーダル量子鍵分布は、ファイバーネットワークと自由空間チャネルの完全な相互運用を可能にする。
本稿では、単純な3ノード不均一量子ネットワークにおけるモード間量子鍵分布系のフィールドトライアルについて述べる。
スイッチングシステムは、信頼できる量子鍵分配ネットワークに対する費用対効果のソリューションである。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:21:01 GMT)
Intelligent Icing Detection Model of Wind Turbine Blades Based on SCADA data [0.0] 本稿では,畳み込みニューラルネットワーク(CNN),GAN(Generative Adversarial Network),ドメイン適応学習(Domain Adaption Learning)を用いて,インテリジェントな診断フレームワークを構築する可能性について検討する。
本研究は, 正常およびアイシング試料の固有特徴を捉えるために, 並列GANを用いた2段階の訓練について検討する。
3つの風力タービンSCADAデータのモデル検証は、2段階の訓練がモデル性能を効果的に改善できることを示している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 21:18:48 GMT)
Information flow-enhanced precision in collisional quantum thermometry [0.0] 多層衝突モデルに基づいて量子温度計を記述・解析する。
提案アーキテクチャは, 温度計と探査対象システムとの間の短時間の相互作用時間においても, 高い感度を提供する。
層状温度計内およびシステムと温度計間の情報流の評価により,相互逆流の調整が温度計の精度に肯定的な影響を与えることが明らかとなった。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:00:55 GMT)
Improving the Finite Sample Estimation of Average Treatment Effects using Double/Debiased Machine Learning with Propensity Score Calibration [0.0] 本稿では,2次/脱バイアス機械学習フレームワークにおける確率校正手法の活用について検討する。
DML推定値の根平均2乗誤差を大幅に低減できる可能性が示唆された。
我々はこれを実証的な例で示し、キャリブレーションがDML推定器の特性を変化させない条件を提供する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 13:05:14 GMT)
Imperfect quantum networks with tailored resource states [0.0] 絡み合いに基づく量子ネットワークは、絡み合ったリソース状態の選択においてユニークな柔軟性を示す。
本研究では, 完全に非対称なネットワークシナリオにおける絡み合いの分布に, このアプローチの柔軟性をどのように利用できるかを検討する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:50:30 GMT)
Image Segmentation with transformers: An Overview, Challenges and Future [0.0] 本稿ではCNNベースのモデルの欠点とトランスフォーマーアーキテクチャへの移行について考察する。
本稿では,トランスフォーマーを用いたセグメンテーションにおける現在の課題について論じ,今後の展望を概説する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:34:39 GMT)
Identification of Traditional Medicinal Plant Leaves Using an effective Deep Learning model and Self-Curated Dataset [0.0] 提案したモデルは、カスタム畳み込みニューラルネットワーク(CNN)アーキテクチャで、6つの畳み込み層、最大プール層、および高密度層を備える。
このモデルは、Indian Medicinal Leaves Imageデータセット、MED117 Medicinal Plant Leafデータセット、著者による自己計算データセットという3つの異なるデータセットでテストされた。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:18:03 GMT)
High-Q cavity coupled to a high permittivity dielectric resonator for sensing applications [0.0] 超伝導キャビティを高誘電率で結合する結合キャビティ構成について報告する。
温度範囲の異なるボロメーターとして結合システムの具体的な応用について論じる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:56:43 GMT)
Geometric Floquet theory [0.0] 量子幾何学からフロケ理論を導出する。
フロッケ固有状態に対する遷移のない反断熱駆動をハミルトニアンが生成することを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 11:04:36 GMT)
Generation of entanglement and non-stationary states via competing coherent and incoherent bosonic hopping [0.0] ユニタリ力学に付加される非コヒーレントな過程は、重畳や絡み合いのような量子的特徴を減少させることが予想されるため、一般的に有害であるとみなされる。
ボゾンモード間の統計的結合をもたらす不整合ホッピングの単なる付加は、頑健な量子絡み合いを伴う定常状態をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 19:00:02 GMT)
Generalized Black Hole Entropy is von Neumann Entropy [0.0] 最近、シュワルツシルト-AdSブラックホールの質量にdressした可観測物のフォン・ノイマン代数やデ・シッターの観測者がタイプIIであることが示されている。
我々は、キリング地平線を持つ任意の時空上の線型体に対して、着飾った可観測体の代数を得るための一般的な枠組みを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 02:59:15 GMT)
General relativistic particle trajectories via quantum mechanical weak values and the Schwarzschild-Alcubierre spacetime [0.0] シュワルツシルト時空における相対論的量子粒子の平均軌跡は、曲線時空量子論における確率電流の予測フロー線と等価であることを示す。
これらの軌道は、シュワルツシルト=アルクビエールのハイブリッド時空における古典的零測地線と正確に一致することを示した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 21:07:27 GMT)
From tomography of conditional states to tomography of states that never existed [0.0] 微視的なシュリンガー・キャット状態と1の位数の光子数は静止量子関連磁場から生成される。
本稿では,量子相関状態の平均光子数が1よりかなり大きい量子相関状態の測定データを導出する手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:55:32 GMT)
Frechet Music Distance: A Metric For Generative Symbolic Music Evaluation [0.0] フレシェ・ミュージック・ディスタンス(Frechet Music Distance, FMD)は、シンボリック・ミュージック・モデルの評価指標である。
FMDはコンピュータビジョンにおけるFrechet Inception Distance(FID)と生成オーディオにおけるFrechet Audio Distance(FAD)にインスパイアされている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:56:53 GMT)
Finite-time Unruh effect: Waiting for the transient effects to fade off [0.0] 有限時間遷移確率は、純粋に熱的項と非熱的過渡項の和として記述できることを示す。
我々は、一様加速検出器の遷移確率率に対する非熱的過渡項の寄与を定量化する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:14:35 GMT)
Fermionic wave packet scattering: a quantum computing approach [0.0] フェルミオンハミルトニアンの相互作用する基底状態の上に運動量を持つガウス波パケットを作成する方法を提案する。
本稿では,デジタル量子コンピュータ上でのウェーブパケットの進化を通じて,観測対象の期待値を効率的に取得する方法を示す。
我々は、この現象を特徴づけ、デジタル量子コンピュータ上でより複雑な衝突過程を研究するための第一歩を提供する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:01:51 GMT)
Engineering a Josephson junction chain for the simulation of the clock model [0.0] ジョセフソン接合配列(JJA)の前例のないチューニングを可能にする製造技術と高品質半導体-超伝導界面
実験的にアクセス可能な制御パラメータはほとんどなく、関連する低エネルギー場理論の豊富な位相図を探索できることを示す。
JJAを用いたアナログ量子シミュレーションは, 量子ビットアーキテクチャでは効率的に捕捉できないモデルに向けて, 水平線を拡大する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:51:49 GMT)
Engineering One Axis Twisting via a Dissipative Berry Phase Using Strong Symmetries [0.0] 我々は、原子の集合集合集合に結合した駆動散逸性キャビティが、メロジカルに有用なスピンスクイーズ状態を生成する方法を示す。
本研究は, 原子空洞共振系において, 微小光学励起による絡み合いを生じさせることが可能であることを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 21:13:08 GMT)
Energy-filtered quantum states and the emergence of non-local correlations [0.0] エネルギーフィルタリングされた量子状態は、効率よく熱状態をシミュレートするための有望な候補である。
我々は、製品状態からスペクトルの中央に位置する固有状態への遷移を意図したプロトコルを探索する。
フィルタされた状態の特性は,時間平均密度行列と局所的に区別できないことを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:02:48 GMT)
Elucidating the Physical and Mathematical Properties of the Prouhet-Thue-Morse Sequence in Quantum Computing [0.0] 本研究では、量子コンピューティングにおけるPTM(Prouhet-Thue-Morse)シーケンスの応用について検討する。
我々は、量子誤り訂正、ノイズ耐性量子メモリ、および量子カオスに関する洞察の提供において、PTMシーケンスが果たす重要な役割を実証する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:34:52 GMT)
Efficient measure of information backflow with quasi-stochastic process [0.0] 開量子系における非マルコフ力学の特性と量子化はトピックの問題である。
情報バックフローの概念に基づく標準的なアプローチは、環境からシステムへの情報の流れを検出する。
本稿では,準確率表現の概念を活用することで,状態に依存しない情報バックフローの代替的証人および測度を提案する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 08:39:02 GMT)
Effective field theory of the quantum skyrmion Hall effect [0.0] 量子スミリオンホール効果(QSkHE)に対する有効場理論(EFT)を導入する。
私たちはこの目的のために単一の統一的な一般化を採用しています。
ファジィコセット空間上のゲージ場への依存を維持するために一般化された余剰ファジィ次元を持つゲージ理論を同定する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:21:53 GMT)
Dynamic Neural Style Transfer for Artistic Image Generation using VGG19 [0.0] 所望の画像に様々な芸術的スタイルを付加できるニューラルスタイル転送システムを提案する。
このシステムはVGG19モデルを用いて特徴抽出を行い、コンテンツの整合性を損なうことなく高品質で柔軟なスタイリングを実現する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:47:18 GMT)
Driving a Quantum Phase Transition at Arbitrary Rate: Exact solution of the Transverse-Field Ising model [0.0] 磁場後における横磁場イジングモデルにおける量子相転移の交叉を任意の速度で検討する。
線形化クエンチの完了時に, 欠陥密度, 完備kink数分布, 累積量を解析した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 19:03:37 GMT)
Do LLMs Really Think Step-by-step In Implicit Reasoning? [0.0] Chain-of-Thoughtは複雑なタスクにおけるLCMのパフォーマンスを向上させる。
多くの研究は、中間ステップを明示的に生成するLLMを必要としない暗黙のCoTの使用を試みた。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 06:07:12 GMT)
Detection of Vascular Leukoencephalopathy in CT Images [0.0] 本研究は,脳小血管疾患であるロイコ脳症の診断におけるAIの役割について検討した。
約1200名のX線CT患者のデータセットを用いて,2次疾患分類のための畳み込みニューラルネットワーク(CNN)を訓練した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 22:21:00 GMT)
Dataset-Free Weight-Initialization on Restricted Boltzmann Machine [0.0] フィードフォワードニューラルネットワークでは,データセットフリーの重み初期化手法が開発されている。
制限ボルツマンマシン(RBM)のためのデータセットフリーウェイト初期化法はまだ開発されていない
本研究では,Bernoulli--Bernoulli RBMの統計力学解析に基づくデータセットフリー重量初期化法を導出する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:46:57 GMT)
Creation and manipulation of Schrödinger cat states based on semiclassical predictions [0.0] 量子測定誘起論理ゲートを用いたシュリンガー猫状態の生成を考察する。
ゲート出力状態の正確な解と半古典理論から再構成された「完全」シュリンガー・キャットとの忠実度は0.99を超える高い値に達することを示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 06:19:41 GMT)
Cooperative Decay of N Atoms in a Ring Configuration [0.0] 単励起構成の環上に周期的に分布するN二層原子の協調崩壊速度のスペクトルを解析的に表現する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:10:01 GMT)
Controlling the spontaneous emission of trapped ions [0.0] 予想される新規性には、単一の光子検出イベントを通じて2つ以上のイオンが絡み合う可能性がある。
この設定は、量子技術で一般的に使用される既存のイオントラップのほとんどに適応することができる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:30:13 GMT)
Control of a Josephson Digital Phase Detector via an SFQ-based Flux Bias Driver [0.0] Josephson Digital Phase Detector (JDPD) による低温オンチップ量子ビット読み出し
フラックスバイアス特性がJDPD性能に及ぼす影響を数値的に検討した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 07:53:01 GMT)
Comparison of Various SLAM Systems for Mobile Robot in an Indoor Environment [0.0] 本稿では,様々なROSベースのSLAMシステムによって計算された移動ロボット軌跡の比較分析を行う。
我々は,2Dライダー,モノクラーカメラ,ZEDステレオカメラという,一般的なセンサを備えた移動ロボットのプロトタイプを開発した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:01:44 GMT)
Comparative Insights from 12 Machine Learning Models in Extracting Economic Ideology from Political Text [0.0] 本研究では、経済イデオロギーの検出において、12の機械学習モデルとモデルバリエーションの能力を体系的に評価する。
この分析は、粒度および集合レベルでのいくつかの生成、微調整、ゼロショットモデルの性能を評価する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:06:22 GMT)
Coming full circle -- A unified framework for Kochen-Specker contextuality [0.0] 文脈性は古典物理学と量子物理学を区別する重要な特徴である。
コンテクストコネクト'と呼ばれる概念的に新しいツールを導入し、新しい形式でKochen-Speckerコンテキストをキャストし分析する。
この枠組みが文脈性に対する限界的およびグラフ論的アプローチをどのように仮定するかを詳細に示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:57:53 GMT)
Collision Risk Analysis for LEO Satellites with Confidential Orbital Data [0.0] 衝突リスク分析は、衛星衝突リスクを軽減するために不可欠である。
この貢献は、完全同型暗号(FHE)に基づく解を提案する。
既存の手法とは対照的に、この手法は衝突リスク分析を他の当事者に開示することなく、感度の高い軌道データ上で行うことができる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 09:08:18 GMT)
Collaboration in Immersive Environments: Challenges and Solutions [0.0] 本稿では,没入型環境における協調研究の現状について概説する。
それはVRやARなど、没入型環境のさまざまなタイプと、これらの環境で起こりうるコラボレーションのさまざまな形態について論じている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 02:12:45 GMT)
Clinicians don't know what explanations they need: A case study on eliciting AI software explainability requirements [0.0] 本稿では、AIコンポーネントを用いたソフトウェアアプリケーション作成において、ソフトウェア開発者が説明可能性要件をどのように適用するかを分析する。
ノルウェーの病院で小さなソフトウェア開発チームに従って、我々はAIアプリケーションを同時に開発するプロセスを観察します。
臨床医はシステムと対話する前に説明可能性の必要性を明確にするために苦労したため、反復的アプローチが有効であることが判明した。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:17:33 GMT)
Can linguists better understand DNA? [0.0] 本研究では,自然言語と遺伝子配列/言語間の能力伝達の存在を論じる。
DNA-ペア分類(DNA配列類似性)とDNA-タンパク質-ペア分類(遺伝子コーディング決定)の2つの類似タスクを構築した。
これらのタスクは、自然言語から遺伝子配列への能力の伝達可能性を検証するために設計された。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 14:33:40 GMT)
Bounds and Bugs: The Limits of Symmetry Metrics to Detect Partisan Gerrymandering [0.0] 我々は、パルチザンジェリーマンダー解析によく用いられる2つの対称性指標、平均媒介差(MM)とパルチザンバイアス(PB)について考察する。
我々の主な結果は、選挙区選挙において達成可能な議席と票の組み合わせについて、各選挙区が獲得した選挙区の数を、理想的なメートル法値から逸脱する可能性の程度と比較することである。
これらの比較は、MMとPBが、ある政党が獲得した地区の数が極端に多いことを検出するために使われている例によって動機付けられている。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 19:36:55 GMT)
Bidirectional microwave-optical conversion using an integrated barium-titanate transducer [0.0] 光とマイクロ波の光子間の効率よく、低雑音、高帯域転送が量子通信の鍵となる。
光薄膜におけるブロードバンド直接電気光学(ポッケルス)効果を用いたマイクロ波光伝送の最近の実証は有望であることを示している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:22:48 GMT)
Benchmarking quantum machine learning kernel training for classification tasks [0.0] 本研究は、分類タスクの文脈における量子カーネル法に焦点を当てる。
量子カーネル推定(QKE)と量子カーネル訓練(QKT)の性能を2つの量子特徴写像と関連づけて検討する。
実験結果から、量子法は異なるデータセット間で様々な性能を示すことが明らかとなった。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 12:45:17 GMT)
Bayesian Event Categorization Matrix Approach for Explosion Monitoring [0.0] 本稿では,前回のイベント分類行列モデルに対するベイズ的更新について述べる。
また, 事象分類行列モデルをベイズ決定理論で拡張することにより, 事象分類の偽陰性あるいは偽陽性率を直感的に低減することができる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 21:09:38 GMT)
Attention based Bidirectional GRU hybrid model for inappropriate content detection in Urdu language [0.0] 本研究では,Urdu Unicodeテキスト言語における不適切なコンテンツを特定するために,注目に基づく双方向GRUハイブリッドモデルを提案する。
提案したモデルBiGRU-Aは,事前学習したワード2Vec層を使わずに84%の精度で他のベースラインモデルよりも優れていた。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 18:10:37 GMT)
Approaching optimal microwave-acoustic transduction on lithium niobate using SQUID arrays [0.0] 従来の圧電トランスデューサは、小さな効率か狭い帯域幅に制限されている。
ニオブ酸リチウムの最大効率帯域幅積に近い圧電マイクロ波音響変換を実現するための強靭な戦略を実証する。
我々のトランスデューサは他の超伝導量子デバイスと容易に接続でき、マイクロ波-光変換方式、量子制限フォノン検出、および4-8GHz帯の音響分光への応用がある。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:57:07 GMT)
An operational approach to classifying measurement incompatibility [0.0] 本稿では,2つの基本的古典的操作について,測定の不整合性の操作的分類について述べる。
我々は、粗粒化や凸混合に関して、射影測定の集合が完全に不整合であるかどうかを決定するための分析的基準を導出する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 06:31:09 GMT)
Algorithm for Semantic Network Generation from Texts of Low Resource Languages Such as Kiswahili [0.0] 本稿では,生の自然言語テキストを処理し,意味ネットワークにマッピングするアルゴリズムを提案する。
キシュワヒリのQAタスクで78.6%の正確なマッチでテストされた。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 06:51:32 GMT)
Agile System Development Lifecycle for AI Systems: Decision Architecture [0.0] 本稿では,AIシステム開発を支援するために,意思決定科学を用いてアジャイルSDLCを強化することを提案する。
提案手法の適用例を,保険請求処理の事例として示す。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 10:04:19 GMT)
Adversarial-Ensemble Kolmogorov Arnold Networks for Enhancing Indoor Wi-Fi Positioning: A Defensive Approach Against Spoofing and Signal Manipulation Attacks [0.0] 本研究は,Wi-Fiを用いた屋内位置決めシステムの敵攻撃に対する堅牢性向上に関する研究である。
目標は、Wi-Fi SpoofingとSignal Strength Manipulationという2つの攻撃シナリオの下で、これらのシステムの位置決め精度とレジリエンスを改善することである。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:34:00 GMT)
Adaptive Law-Based Transformation (ALT): A Lightweight Feature Representation for Time Series Classification [0.0] 時系列分類は、金融、医療、環境モニタリングなど、多くの分野において基本的なものである。
伝統的なTSC手法は、時系列データの本質的な複雑さと変動性に悩まされることが多い。
キーデータパターンに基づいて特徴空間を変換する適応法則変換(ALT)を導入する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 00:33:01 GMT)
A relativistic continuous matrix product state study of field theories with defects [0.0] 本稿では,ライン欠陥を伴う大規模量子場理論における期待値を計算する手法を提案する。
我々は、(想像上の)時間が欠陥に垂直に実行される量子化スキームを用いる。
局所バルクおよび欠陥演算子の相関関数を,磁束欠陥を持つ$phi4$理論で計算することで,この機械の有効性を実証する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 19:00:23 GMT)
A posteriori error estimates for the Lindblad master equation [0.0] 我々は、無限次元ヒルベルト空間におけるリンドブラッドマスター方程式によって支配される開量子系のシミュレーションに興味がある。
標準的なアプローチは、有限次元部分空間における微分方程式を導出する2つの逐次近似を含む。
本稿では,数値結果の精度を保証するために明示的に計算できる2つの近似のバウンダリを確立する。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 15:26:06 GMT)
A Systems Thinking Approach to Algorithmic Fairness [0.0] システム思考は、アルゴリズムの公平性問題をモデル化する方法を提供する。
そして、データ生成プロセスにバイアスが存在すると信じている場所で、事前の知識と仮定をコード化できます。
私たちは、さまざまな種類の公正政策から存在する複雑なトレードオフを理解するために、政治通路の両側の政策立案者を支援するシステム思考を利用することができます。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 16:29:31 GMT)
A Simplification Method for Inequality Constraints in Integer Binary Encoding HOBO Formulations [0.0] 提案手法は,擬似非拘束バイナリ最適化(QUBO)の定式化に伴う課題に対処する。
制約を効率的に統合することにより、量子および古典的解法の計算効率と精度を高めることができる。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 17:06:25 GMT)
A Mechanistic Explanatory Strategy for XAI [0.0] 本稿では,ディープラーニングシステムの機能的構造を説明するためのメカニズム的戦略を概説する。
メカニスティックアプローチによると、不透明なAIシステムの説明には、意思決定を促進するメカニズムの特定が含まれる。
この研究は、モデル組織を研究するための体系的なアプローチが、より単純な(あるいはより控えめな)説明可能性技術が欠落する可能性のある要素を明らかにすることを示唆している。
論文参考訳(メタデータ) (Thu, 16 Jan 2025 23:37:24 GMT)