The BrowserGym Ecosystem for Web Agent Research [151.9] BrowserGymエコシステムは、Webエージェントの効率的な評価とベンチマークの必要性の高まりに対処する。
大規模なマルチベンチマークWebエージェント実験を初めて実施する。
結果は、OpenAIとAnthropicの最新モデルの大きな相違点を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 23:43:59 GMT)
Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Scaling [121.1] InternVL 2.5は、InternVL 2.0上に構築された高度マルチモーダル大規模言語モデル(MLLM)シリーズである。
InternVL 2.5は、GPT-4oやClaude-3.5-Sonnetといった主要な商用モデルと競合する競争力を持つ。
このモデルが、マルチモーダルAIシステムの開発と適用のための新しい標準を設定することで、オープンソースコミュニティに貢献できることを願っています。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:57:08 GMT)
StyleDiffusion: Prompt-Embedding Inversion for Text-Based Editing [115.5] 画像の編集のために、事前訓練された拡散モデルの驚くべき能力を活用することに重点が置かれている。
彼らはモデルを微調整するか、事前訓練されたモデルの潜在空間で画像を反転させる。
選択された地域に対する不満足な結果と、非選択された地域における予期せぬ変化の2つの問題に悩まされている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:43:47 GMT)
DRS: Deep Question Reformulation With Structured Output [114.1] 大規模言語モデル(LLM)は、解決不可能な質問を検知できるが、これらの質問の修正をユーザーが支援するのに苦労する。
DRS:Deep Question Reformulation with Structured Output, a novel zero-shot method for enhance to LLMs ability to help users in reformulation Question。
DRS は GPT-3.5 の改定精度を 23.03% から 70.42% に改善するとともに,Gemma2-9B などのオープンソースモデルの性能を 26.35% から 56.75% に向上させた。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 04:08:34 GMT)
MegaSaM: Accurate, Fast, and Robust Structure and Motion from Casual Dynamic Videos [104.1] 本研究では,ダイナミックシーンのカジュアルモノクラー映像から,カメラパラメータと奥行きマップの精度,高速,堅牢な推定を可能にするシステムを提案する。
本システムは,先行作業や同時作業と比較して,カメラポーズや深度推定において有意に精度が高く,頑健である。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 19:15:46 GMT)
Automated Evaluation of Large Vision-Language Models on Self-driving Corner Cases [102.1] 自動運転コーナーケースにおけるLVLMの自動評価のための最初のベンチマークであるCODA-LMを提案する。
テキストのみの大規模言語モデルを判断として使用すると、LVLMの判断よりも人間の好みとの整合性が向上することを示す。
CODA-VLM は GPT-4V を+21.42% 上回っても GPT-4V と相容れない性能を示した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:54:59 GMT)
LIAR: Leveraging Alignment (Best-of-N) to Jailbreak LLMs in Seconds [98.2] LIAR(LeveragIng Alignment to jailbReak)と呼ばれる新しいジェイルブレイク手法を提案する。
安全に配慮したモデルをジェイルブレイクする可能性に関する理論的洞察を提供する。
ASRは10倍のパープレキシティ向上を実現し,10時間ではなく秒単位のタイム・トゥ・アタックを実現した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:02:59 GMT)
Scaling Inference-Time Search with Vision Value Model for Improved Visual Comprehension [95.6] 視覚価値モデル(VisVM)は、VLM推論時間探索をガイドして、より良い視覚的理解で応答を生成する。
本稿では、VLM推論時間探索をガイドし、視覚的理解を向上した応答を生成するVisVMを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:21:48 GMT)
Tulu 3: Pushing Frontiers in Open Language Model Post-Training [94.1] トゥル3(Tulu 3)は、最先端の訓練後モデルである。
Tulu 3はLlama 3.1ベースモデルをベースにしており、Llama 3.1、Qwen 2.5、Mistral、さらにGPT-4o-mini、Claude 3.5-Haikuといったクローズドモデルにも勝っている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:01:20 GMT)
Learning a Diffusion Model Policy from Rewards via Q-Score Matching [93.0] 本稿では,拡散モデルポリシの構造を学習されたQ-関数に関連付ける理論的枠組みを提案する。
本稿では,この理論からQスコアマッチングを示す新しいポリシー更新手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 22:58:41 GMT)
HunyuanVideo: A Systematic Framework For Large Video Generative Models [87.9] HunyuanVideoは、革新的なオープンソースのビデオファンデーションモデルだ。
データキュレーション、高度なアーキテクチャ設計、プログレッシブモデルスケーリング、トレーニングが組み込まれている。
その結果,13億以上のパラメータを持つビデオ生成モデルの訓練に成功した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:02:10 GMT)
Noise Self-Regression: A New Learning Paradigm to Enhance Low-Light Images Without Task-Related Data [86.7] タスク関連のデータにアクセスせずにノイズ自己回帰(NoiSER)を提案する。
NoiSERは品質向上に非常に競争力があるが、モデルのサイズははるかに小さく、トレーニングや推論のコストもはるかに低い。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:46:09 GMT)
Rethinking Machine Unlearning for Large Language Models [85.9] 大規模言語モデル(LLM)の領域における機械学習の研究
このイニシアチブは、望ましくないデータの影響(機密情報や違法情報など)と関連するモデル機能を排除することを目的としている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:39:49 GMT)
Learning State-Augmented Policies for Information Routing in Communication Networks [84.8] 我々は,グラフニューラルネットワーク(GNN)アーキテクチャを用いて,ソースノードの集約情報を最大化する,新たなステート拡張(SA)戦略を開発した。
教師なし学習手法を利用して、GNNアーキテクチャの出力を最適情報ルーティング戦略に変換する。
実験では,実時間ネットワークトポロジの評価を行い,アルゴリズムの有効性を検証した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 20:01:21 GMT)
Matching the Statistical Query Lower Bound for $k$-Sparse Parity Problems with Sign Stochastic Gradient Descent [83.9] 我々は、2層完全連結ニューラルネットワーク上での符号勾配降下(SGD)による$k$スパースパリティ問題を解く。
このアプローチは、$d$次元ハイパーキューブ上での$k$スパースパリティ問題を効率的に解くことができることを示す。
次に、符号SGDを持つトレーニングニューラルネットワークが、この優れたネットワークを効果的に近似し、小さな統計的誤差で$k$-parity問題を解く方法を示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:58:51 GMT)
A Practitioner's Guide to Continual Multimodal Pretraining [83.6] マルチモーダル・ファンデーション・モデルは視覚と言語を交わす多くのアプリケーションに役立っている。
モデルを更新し続けるために、継続事前トレーニングの研究は主に、大規模な新しいデータに対する頻度の低い、差別的な更新、あるいは頻繁に行われるサンプルレベルの更新のシナリオを探求する。
本稿では,FoMo-in-Flux(FoMo-in-Flux)について紹介する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:22:32 GMT)
Stag-1: Towards Realistic 4D Driving Simulation with Video Generation Model [83.3] 本稿では,現実世界のシーンを再現するために,DrivinG(Stag-1)モデルのための空間-テンポラル・シミュレートを提案する。
Stag-1は、自動運転車のサラウンドビューデータを使用して、連続した4Dポイントのクラウドシーンを構築する。
空間的時間的関係を分離し、コヒーレントな運転ビデオを生成する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:59:56 GMT)
Densing Law of LLMs [81.1] 大規模言語モデル(LLM)は人工知能のマイルストーンとして登場し、モデルのサイズが大きくなるにつれてその性能が向上する。
本稿では,異なるスケールでLLMの品質を評価するための新しい指標として,「テクトキャパシティ密度」の概念を紹介する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:39:27 GMT)
DreamColour: Controllable Video Colour Editing without Training [80.9] 直感的なインタフェースにより、正確な映像色編集を可能にする訓練不要のフレームワークを提案する。
色編集の空間的側面と時間的側面を分離することにより、ユーザの自然なワークフローをより良く整合させることができる。
当社のアプローチは、トレーニングや特別なハードウェアの必要性を排除しつつ、最先端の手法に適合または超越しています。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:57:54 GMT)
Slicing Vision Transformer for Flexible Inference [79.4] 一つのネットワークが複数の小さな ViT を表現できるように,Scala という名前の汎用フレームワークを提案する。
S Scalaは、パラメータが少ないImageNet-1Kで平均1.6%の改善を実現している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:31:42 GMT)
Findings of the Second BabyLM Challenge: Sample-Efficient Pretraining on Developmentally Plausible Corpora [79.0] BabyLM Challengeは、人間と計算言語学習者のデータ効率ギャップを埋めるためのコミュニティの取り組みである。
参加者は1億ワード以下の固定言語データ予算で、言語モデルトレーニングを最適化するために競争する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:06:08 GMT)
SleeperMark: Towards Robust Watermark against Fine-Tuning Text-to-image Diffusion Models [77.8] SleeperMarkは、回復力のある透かしをT2I拡散モデルに埋め込むように設計された新しいフレームワークである。
モデルは、学習したセマンティック概念から透かし情報を切り離し、埋め込み透かしを保持することができる。
各種拡散モデルにおけるSleeperMarkの有効性について実験を行った。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:44:18 GMT)
Video Decomposition Prior: A Methodology to Decompose Videos into Layers [74.4] 本稿では,プロのビデオ編集の実践からインスピレーションを得た,新しいビデオ分解以前のtextttVDPフレームワークを提案する。
textttVDPフレームワークは、ビデオシーケンスを複数のRGBレイヤと関連する不透明度レベルに分解する。
ビデオオブジェクトのセグメンテーション、デハジング、リライティングといったタスクに対処する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:35:45 GMT)
Enhancing Foundation Models for Time Series Forecasting via Wavelet-based Tokenization [74.3] 我々はウェーブレットベースのトークンーザを開発し、時間局所化周波数の空間でモデルが複雑な表現を直接学習できるようにする。
提案手法は,まず入力時系列をスケール・分解し,次に閾値を設定し,ウェーブレット係数を定量化し,最後に予測水平方向の係数を予測する自己回帰モデルを事前学習する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:22:59 GMT)
KaLM: Knowledge-aligned Autoregressive Language Modeling via Dual-view Knowledge Graph Contrastive Learning [74.2] 本稿では、textitKnowledge-aligned Language Modeling アプローチである textbfKaLM を提案する。
明示的な知識アライメントと暗黙的な知識アライメントという共同目的を通じて、KG知識と整合するように、自己回帰的な大規模言語モデルを微調整する。
特に,本手法は知識駆動型タスクの評価において顕著な性能向上を実現している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:08:24 GMT)
UniScene: Unified Occupancy-centric Driving Scene Generation [73.2] UniSceneは3つの重要なデータ形式(セマンティック占有率、ビデオ、LiDAR)を生成するための最初の統一フレームワークである。
UniSceneは、シーン生成の複雑なタスクを2つの階層的なステップに分解するプログレッシブな生成プロセスを採用している。
大規模な実験により、UniSceneは、占有率、ビデオ、LiDAR生成において、以前のSOTAよりも優れていたことが示されている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:41:52 GMT)
Maximizing Alignment with Minimal Feedback: Efficiently Learning Rewards for Visuomotor Robot Policy Alignment [73.1] 本研究では,人間の嗜好フィードバックをはるかに少なくして視覚的報酬を学習するための表現適応型選好学習(RAPL)を提案する。
RAPLは、エンドユーザの視覚表現に合わせて微調整された事前学習された視覚エンコーダに焦点を合わせ、特徴マッチングによって密集した視覚報酬を構築する。
RAPLは人間の嗜好に沿った報酬を学習し、より効率的に嗜好データを使用し、ロボットの具体化を一般化できることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:04:02 GMT)
DEMO: Reframing Dialogue Interaction with Fine-grained Element Modeling [73.1] 大規模言語モデル(LLM)は、対話を人間と機械の相互作用の中心的なモードの一つにした。
本稿では,包括的対話モデリングと評価のために設計された新しいベンチマークである$textbfDEMO$を提案する。
模倣学習にインスパイアされたエージェントは,DEMOベンチマークに基づいて対話要素をモデル化する能力を有する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:01:38 GMT)
Pushing Rendering Boundaries: Hard Gaussian Splatting [72.3] 3D Gaussian Splatting (3DGS) は,NVS(Noven View Synthesis) をリアルタイムなレンダリング方式で実現した。
我々はHGSと呼ばれるハードガウシアンスプラッティングを提案し、これは多視点的な位置勾配とレンダリング誤差を考慮し、ハードガウシアンを成長させる。
本手法は,リアルタイムの効率を保ちながら,最先端のレンダリング品質を実現する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 07:42:47 GMT)
Assouad, Fano, and Le Cam with Interaction: A Unifying Lower Bound Framework and Characterization for Bandit Learnability [71.8] 我々は,統計的推定と対話的意思決定において,情報理論の下限を統一する枠組みを開発する。
Emphinteractive Fano methodinteractive と呼ばれる新しい下界アプローチを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 19:53:59 GMT)
ExploraCoder: Advancing code generation for multiple unseen APIs via planning and chained exploration [70.3] ExploraCoderはトレーニング不要のフレームワークで、大規模な言語モデルにコードソリューションで見えないAPIを呼び出す権限を与える。
ExploraCoderは,事前のAPI知識を欠いたモデルのパフォーマンスを著しく向上させ,NAGアプローチの11.24%,pass@10の事前トレーニングメソッドの14.07%を絶対的に向上させることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 19:00:15 GMT)
BimArt: A Unified Approach for the Synthesis of 3D Bimanual Interaction with Articulated Objects [70.2] BimArtは3Dバイマニュアルハンドインタラクションを音声オブジェクトと合成するための新しい生成手法である。
まず, 物体軌道上に配置された距離ベースの接触マップを, 音声認識特徴表現を用いて生成する。
学習された接触は手の動き生成装置のガイドに使われ、物体の動きや調音のための多彩で現実的なバイマニュアルの動きが生成されます。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:23:56 GMT)
MAmmoTH-VL: Eliciting Multimodal Reasoning with Instruction Tuning at Scale [66.7] MLLM(Multimodal large language model)は、多モーダルタスクにおいて大きな可能性を秘めている。
既存の命令チューニングデータセットは、中間的合理性のないフレーズレベルの答えのみを提供する。
そこで本研究では,大規模マルチモーダル・インストラクション・チューニング・データセットを構築するためのスケーラブルで費用対効果の高い手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:14:24 GMT)
Scaling Efficient Masked Image Modeling on Large Remote Sensing Dataset [66.2] 本稿では、大規模RSデータセットの作成とMIMの効率的なアプローチを特徴とする、RSモデルのための新しい事前学習パイプラインを提案する。
我々は、利用可能なRSデータセットを収集し、排他的、スライシング、復号化を通じてそれらを処理することで、OptoRS-13Mという高品質なデータセットをキュレートした。
実験により,OCR-13Mは分類,検出,セグメンテーション性能を著しく向上し,SelectiveMAEは2回以上のトレーニング効率を向上させることが示された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:10:36 GMT)
EM Distillation for One-step Diffusion Models [65.6] 最小品質の損失を最小限に抑えた1ステップ生成モデルに拡散モデルを蒸留する最大可能性に基づく手法を提案する。
本研究では, 蒸留プロセスの安定化を図るため, 再パラメータ化サンプリング手法とノイズキャンセリング手法を開発した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 06:07:45 GMT)
Unlocking State-Tracking in Linear RNNs Through Negative Eigenvalues [65.4] リニアリカレントニューラルネットワーク(LRNN)は、大規模言語モデリングにおけるトランスフォーマーの効率的な代替手段として登場した。
LRNNは、コード評価やチェスゲーム追跡といったタスクのパフォーマンスを損なうような状態追跡を行うのに苦労している。
我々の研究は、現代のLRNNの表現性を高め、トレーニングや推論のコストを変えることなく適用性を高める。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:22:21 GMT)
Mind the Time: Temporally-Controlled Multi-Event Video Generation [65.1] 時間制御を備えたマルチイベントビデオジェネレータMinTを提案する。
私たちの重要な洞察は、各イベントを生成されたビデオの特定の期間にバインドすることで、モデルが一度にひとつのイベントに集中できるようにすることです。
文献の中ではじめて、我々のモデルは生成されたビデオのイベントのタイミングを制御できる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:52:20 GMT)
EmbodiedOcc: Embodied 3D Occupancy Prediction for Vision-based Online Scene Understanding [64.0] 3D占有予測は周囲のシーンを包括的に記述する。
既存のほとんどのメソッドは、1つか数つのビューからのオフラインの認識に焦点を当てている。
具体化された3次元占有予測タスクを定式化し,ガウスをベースとしたEmbodiedOccフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:43:38 GMT)
One-shot Federated Learning via Synthetic Distiller-Distillate Communication [63.9] One-shot Federated Learning (FL)は、単一のコミュニケーションで機械学習モデルの協調トレーニングを促進する強力な技術である。
我々はこれらの課題に対処するために,新しい,実用的なワンショットFLフレームワークであるFedSD2Cを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:05:34 GMT)
Diversity Over Quantity: A Lesson From Few Shot Relation Classification [62.7] 多様な関係の集合に対するトレーニングは、モデルが目に見えない関係を一般化する能力を大幅に向上させることを示す。
我々は、既存のデータセットよりも桁違いに多くの関係型を組み込んだ新しいFSRCベンチマークであるREBEL-FSを紹介する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:41:01 GMT)
Accelerated Gradient Tracking over Time-varying Graphs for Decentralized Optimization [59.7] 実用的な単一ループ加速勾配追跡には$O(fracgamma1-sigma_gamma)2sqrtfracLepsilon)$が必要であることを証明している。
我々の収束率は$O(frac1epsilon5/7)$と$O(fracLmu)5/7frac1(1-sigma)1.5logfrac1epsilon)$よりも大幅に改善した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:56:10 GMT)
EACO: Enhancing Alignment in Multimodal LLMs via Critical Observation [58.5] 臨界観測(EACO)によるMLLMのアライメント向上を提案する。
EACOは、経済的に5k画像のみを使用して、MLLMを自己生成の選好データで整列する。
EACOは幻覚全体の65.6%をHalusionBenchで減らし、MME-Cognitionで21.8%改善する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:59:47 GMT)
Benchmarking Open-ended Audio Dialogue Understanding for Large Audio-Language Models [58.4] LALM(Large Audio-Language Models)は、LALMと人間間の音声言語を直接交換する音声対話機能を持つ。
GPT-4oのような最近の進歩により、LALMは人との前後の音声対話を可能にしている。
オープンエンド音声対話理解におけるLALMの性能を評価するための音声対話理解ベンチマーク(ADU-Bench)を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:34:15 GMT)
NitroFusion: High-Fidelity Single-Step Diffusion through Dynamic Adversarial Training [57.2] 我々は,動的対向フレームワークを通じて高品質な生成を実現する単一ステップ拡散に対する基本的に異なるアプローチであるNitroFusionを紹介した。
本フレームワークは, (i) 動的識別器プールと, 生成品質向上のための特殊識別器グループ, (ii) 識別器過適合を防止する戦略的リフレッシュ機構, (iii) マルチスケール品質評価のためのグローバルな識別器ヘッドを組み合わせる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:22:17 GMT)
Natural Language Processing for Dialects of a Language: A Survey [56.9] 最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットにおけるNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 23:14:39 GMT)
GaussianFormer-2: Probabilistic Gaussian Superposition for Efficient 3D Occupancy Prediction [55.6] 3Dセマンティック占有予測は、堅牢な視覚中心の自律運転において重要な課題である。
既存のほとんどの手法は、密度の高いグリッドベースのシーン表現を利用しており、運転シーンの空間的空間性を見渡している。
本稿では,各ガウス分布をその周辺領域の確率分布として解釈する確率論的ガウス重ね合わせモデルを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:43:40 GMT)
Technology as uncharted territory: Contextual integrity and the notion of AI as new ethical ground [55.2] 私は、責任と倫理的AIを促進する努力が、確立された文脈規範に対するこの軽視に必然的に貢献し、正当化することができると論じます。
私は、道徳的保護よりも道徳的革新のAI倫理における現在の狭い優先順位付けに疑問を呈する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:36:13 GMT)
OpenGaussian: Towards Point-Level 3D Gaussian-based Open Vocabulary Understanding [55.0] 本稿では,3次元点レベルの開語彙理解が可能な3次元ガウススティング(3DGS)に基づくOpenGaussianを紹介する。
我々の主な動機は、既存の3DGSベースのオープン語彙法が主に2Dピクセルレベルの解析に焦点を当てていることに起因している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:49:23 GMT)
Sparse autoencoders reveal selective remapping of visual concepts during adaptation [54.8] 特定の目的のために基礎モデルを適用することは、機械学習システムを構築するための標準的なアプローチとなっている。
PatchSAEと呼ばれるCLIPビジョントランスのための新しいスパースオートエンコーダ(SAE)を開発し、解釈可能な概念を抽出する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:59:51 GMT)
ChartX & ChartVLM: A Versatile Benchmark and Foundation Model for Complicated Chart Reasoning [54.8] 我々は、チャート領域における既製のマルチモーダル言語モデル(MLLM)の能力をベンチマークする。
ChartXは18種類のチャートタイプ,7つのチャートタスク,22のディシプリナトピック,高品質なチャートデータを含むマルチモーダルな評価セットである。
我々は、解釈可能なパターンに強く依存するマルチモーダルタスクに対する新しい視点を提供するため、ChartVLMを開発した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:34:47 GMT)
Leveraging Skills from Unlabeled Prior Data for Efficient Online Exploration [54.8] 本研究では,未ラベルの事前軌跡データを用いて効率的な探索戦略を学習する方法について検討する。
我々の手法 SUPE (Skills from Unlabeled Prior Data for Exploration) は、これらのアイデアの慎重な組み合わせがそれらの利点を兼ね備えていることを示す。
実験により,SUPEが従来の戦略を確実に上回り,長い水平・スパース・リワードタスクの一組の解決に成功したことを実証的に示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:57:15 GMT)
Towards Flexible 3D Perception: Object-Centric Occupancy Completion Augments 3D Object Detection [54.8] 占領は3Dシーンの知覚に有望な代替手段として現れてきた。
オブジェクトbboxのサプリメントとして,オブジェクト中心の占有率を導入する。
これらの特徴は,最先端の3Dオブジェクト検出器の検出結果を著しく向上させることを示した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:12:38 GMT)
2-Rectifications are Enough for Straight Flows: A Theoretical Insight into Wasserstein Convergence [54.6] 本稿では, 凝固流のサンプリング分布とターゲット分布とのワッサーシュタイン距離に関する最初の理論的解析を行った。
ガウス流から有限の第一モーメントを持つ任意の一般目標分布への整流の場合、直流を達成するのに2つの整流が十分であることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:00:14 GMT)
On the Proper Treatment of Tokenization in Psycholinguistics [54.0] 論文は、トークンレベルの言語モデルは、精神言語学研究で使用される前に、文字レベルの言語モデルにマージ化されるべきであると主張している。
興味領域自体のサブプライムよりも心理学的予測が優れている様々な焦点領域を見いだす。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:27:09 GMT)
Differentially Private Random Feature Model [52.5] プライバシを保存するカーネルマシンに対して,差分的にプライベートな特徴モデルを作成する。
本手法は,プライバシを保護し,一般化誤差を導出する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:31:08 GMT)
$\textit{X}^2$-DFD: A framework for e${X}$plainable and e${X}$tendable Deepfake Detection [52.1] 3つのコアモジュールからなる新しいフレームワークX2$-DFDを提案する。
最初のモジュールであるモデル特徴評価(MFA)は、MLLMに固有の偽機能の検出能力を計測し、これらの機能の下位ランキングを提供する。
第2のモジュールであるStrong Feature Strengthening (SFS)は、上位機能に基づいて構築されたデータセット上でMLLMを微調整することで、検出と説明機能を強化する。
第3のモジュールであるWak Feature Supplementing (WFS)は、外部専用の機能を統合することで、低階機能における微調整MLLMの機能を改善する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 12:28:01 GMT)
Multimodal Instruction Tuning with Conditional Mixture of LoRA [51.6] 本稿では,Low-Rank Adaption (LoRA) とマルチモーダル命令チューニングを統合した新しい手法を提案する。
各入力インスタンスのユニークな要求に合わせた低ランク適応行列を動的に構築することで、LoRAを革新する。
様々なマルチモーダル評価データセットの実験結果から、MixLoRAは従来のLoRAを同等以上のランクで上回るだけでなく、性能も向上していることが示された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 00:41:15 GMT)
Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.6] 本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 23:30:10 GMT)
Verb Mirage: Unveiling and Assessing Verb Concept Hallucinations in Multimodal Large Language Models [51.5] その結果,ほとんどのMLLMは重度の動詞幻覚に悩まされていることがわかった。
本稿では,動詞の幻覚を軽減するために,動詞の知識に基づく新しいチューニング手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:53:47 GMT)
MultiTrust: A Comprehensive Benchmark Towards Trustworthy Multimodal Large Language Models [51.2] MultiTrustはMLLMの信頼性に関する最初の総合的で統一されたベンチマークである。
我々のベンチマークでは、マルチモーダルリスクとクロスモーダルインパクトの両方に対処する厳格な評価戦略を採用している。
21の近代MLLMによる大規模な実験は、これまで調査されなかった信頼性の問題とリスクを明らかにしている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:21:06 GMT)
NVComposer: Boosting Generative Novel View Synthesis with Multiple Sparse and Unposed Images [50.4] NVComposerは、明示的な外部アライメントの必要性を排除する新しいアプローチである。
NVComposerは、生成的マルチビューNVSタスクにおいて最先端のパフォーマンスを達成する。
提案手法は, 入力ビュー数の増加に伴い, 合成品質が大幅に向上したことを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:56:50 GMT)
Fast Sampling via Discrete Non-Markov Diffusion Models with Predetermined Transition Time [49.6] 離散非マルコフ拡散モデル(DNDM)を提案する。
これにより、トレーニング不要なサンプリングアルゴリズムにより、関数評価の数を大幅に削減できる。
有限ステップサンプリングから無限ステップサンプリングへの移行について検討し、離散プロセスと連続プロセスのギャップを埋めるための新たな洞察を提供する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 03:52:24 GMT)
Beyond Pixels: Text Enhances Generalization in Real-World Image Restoration [47.9] 拡散に基づく復元モデルの生成能力を再活性化するために,テキストを補助的不変表現として用いることを提案する。
Res-Captionerは、画像の内容や劣化レベルに合わせて拡張されたテキスト記述を生成するモジュールである。
様々な現実世界のシナリオを捉えるために設計された新しいベンチマークであるRealIRを提示する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:14:05 GMT)
A Simple Data Augmentation for Feature Distribution Skewed Federated Learning [47.3] フェデレートラーニング(FL)は、複数のクライアント間の協調学習を分散的に促進する。
FLのパフォーマンスは非独立およびIdentically Distributed(非IID)データで劣化する。
本稿では,フェデレーション全体からクライアントのデータに局所分布の統計情報をランダムに注入するFedRDNを提案する。
私たちのFedRDNはプラグイン・アンド・プレイコンポーネントで、数行のコードだけでデータ拡張フローにシームレスに統合できます。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:35:09 GMT)
Explingo: Explaining AI Predictions using Large Language Models [47.2] LLM(Large Language Models)は、説明を自然なコミュニケーションと整合する人間可読な物語形式に変換することができる。
ナレーターはMLの説明を取り入れ、それらを自然言語の説明に変換する。
グレーダーはこれらの物語を、正確性、完全性、流用性、簡潔さを含む一連の指標で評価する。
この研究の結果はオープンソースツールに統合され、さらなるアプリケーションで物語の説明が利用できるようになった。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:01:30 GMT)
Neuro-Symbolic Data Generation for Math Reasoning [47.0] 高品質な教師付き数学的データセットを自動生成する手法を開発した。
本手法は,既存の数学問題を慎重に変更し,新たに生成した問題の多様性と妥当性を両立させる。
実験により,提案手法により生成したデータの品質を実証し,LLaMA-2 と Mistral が最先端のデータを上回ることを示した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:49:49 GMT)
Fine-Tuning CLIP's Last Visual Projector: A Few-Shot Cornucopia [45.9] 本稿では、最適化に「外部」パラメータを追加することなく、CLIP適応のための代替手法を提案する。
視覚の最後のプロジェクション行列を微調整するだけで、全てのベースラインよりもパフォーマンスが向上することがわかった。
この単純なアプローチはProLIPと呼ばれ、11個の数ショットの分類ベンチマークで最先端のパフォーマンスが得られる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:07:47 GMT)
Neural Point Process for Learning Spatiotemporal Event Dynamics [45.4] 本稿では,時間的点過程を統合するディープ・ダイナミクス・モデルを提案する。
提案手法は柔軟で効率的で,不規則にサンプリングされた事象を時間と空間で正確に予測することができる。
我々のモデルは最先端のベースラインよりも優れた性能を示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 22:13:07 GMT)
From Defects to Demands: A Unified, Iterative, and Heuristically Guided LLM-Based Framework for Automated Software Repair and Requirement Realization [45.0] この写本は、人工知能とソフトウェア工学の統合の新しい時代を示唆している。
コード作成と改良のあらゆる面において、AIが人間のプログラマを完全に置き換えることができることを証明した、形式化された反復的な方法論を提示する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:54:21 GMT)
What's the Move? Hybrid Imitation Learning via Salient Points [44.9] 視覚的・空間的なバリエーションをまたいだ一般化を学習するフレキシブルな模倣学習ポリシーを導入する。
Sphinx: 健全なポイントベースのハイブリッドImitatioNとeXecutionは、ポイントクラウド内のタスク関連ポイントを推測することを学びます。
実世界の4つのタスクとシミュレーションされた2つのタスクで86.7%の成功を達成し、次の最高のILベースラインを平均41.1%上回った。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:17:14 GMT)
Generative Modelling of Structurally Constrained Graphs [44.3] ConStructは、グラフ拡散モデルが平面性や非巡回性といった特定の性質に厳しい制約を組み込むことを可能にする新しいフレームワークである。
我々のアプローチは、サンプルグラフが、前と逆の両方の過程において、軌跡全体を通して指定された性質を満たすグラフの領域内にあることを保証します。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:07:23 GMT)
Direct Multi-Turn Preference Optimization for Language Agents [44.0] エージェントタスクに対するLLM(Large Language Models)の適用は、言語エージェントの開発において重要である。
直接選好最適化(DPO)は、複合誤差の緩和によるこの適応のための有望な手法である。
DPOをマルチターンタスクに適用することは、パーティション関数をキャンセルできないため、課題を提起する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 22:20:54 GMT)
Hard Math -- Easy UVM: Pragmatic solutions for verifying hardware algorithms using UVM [44.0] 本稿では,ハードウェアに実装された複雑な数学的アルゴリズムを,効率的かつ効果的に検証するための実用的な解を提案する。
提示されたソリューションは、さまざまなアプリケーションのための単一のチップレーダセンサーによる実際のプロジェクト経験に基づいている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:18:26 GMT)
A Federated Approach to Few-Shot Hate Speech Detection for Marginalized Communities [43.4] ネット上でのヘイトスピーチは、辺境化コミュニティにとって未検討の課題だ。
本稿では,インターネット上のヘイトスピーチから身を守るためのプライバシ保護ツールを用いて,支配的言語が低リソースの社会に居住する疎外化コミュニティを提供することを目的とする。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:00:05 GMT)
Revolutionizing Database Q&A with Large Language Models: Comprehensive Benchmark and Evaluation [43.2] DQABenchは、Large Language Models (LLMs)の最初の包括的なデータベースQAベンチマークである。
DQABenchは、評価データセットの生成、クリーニング、書き直しを自動化する革新的なLCMベースの手法を備えており、英語と中国語で20万以上のQAペアが別々に作られている。
さらに,本テストベッドは,QCR,RAG,TIG,Promptテンプレートエンジニアリング(PTE)といった基本的かつ先進的なコンポーネントを備えた,高度にモジュール化され,スケーラブルなデータベースQAテストベッドを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:51:06 GMT)
SCMM: Calibrating Cross-modal Representations for Text-Based Person Search [43.2] テキストベースの人探索(TBPS)はIoT(Internet of Things)領域において重要なタスクである。
クロスモーダルTBPSタスクでは、共通空間においてよく分散された表現を得ることが重要である。
本稿では,Sew Embedding and Masked Modeling (SCMM)を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:13:10 GMT)
Continuous Video Process: Modeling Videos as Continuous Multi-Dimensional Processes for Video Prediction [43.2] 本稿では,映像を連続的な多次元プロセスとして扱う新しいモデルクラスを提案する。
我々は、KTH、BAIR、Human3.6M、UCF101などのベンチマークデータセットで検証された、ビデオ予測における最先端のパフォーマンスを確立する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:34:50 GMT)
Automatic Tissue Differentiation in Parotidectomy using Hyperspectral Imaging [43.2] この研究では、400-1000$ nmの範囲で超スペクトルデータを持つ3次元畳み込みニューラルネットワークを用いる。
取得システムはステレオHSIシステムを作成する2台のマルチスペクトルスナップショットカメラで構成された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:20:59 GMT)
SimC3D: A Simple Contrastive 3D Pretraining Framework Using RGB Images [42.7] SimC3Dは、純粋なRGB画像データからバックボーンを事前学習するための3Dコントラスト学習フレームワークである。
従来のマルチモーダルフレームワークは、追加の2Dバックボーンを利用することで、2Dプリトレーニングを容易にする。
SimC3Dは2Dの位置埋め込みを強い対照的な目的として直接利用し、2Dバックボーンの必要性を排除している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:59:04 GMT)
Privacy Risks in Reinforcement Learning for Household Robots [42.7] プライバシーは、ロボットが実質的な個人情報にアクセスすることによって、具体化されたAIの領域における重要な関心事として浮上する。
本稿では,値に基づくアルゴリズムと勾配に基づくアルゴリズムのトレーニングプロセスに対する攻撃を提案し,状態,行動,監督信号の再構成に勾配インバージョンを利用する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:14:26 GMT)
Evaluating and Aligning CodeLLMs on Human Preference [42.3] 実世界のコーディングタスクの複雑さと多様性をエミュレートするために,厳密な人為的なベンチマークであるCodeArenaを提案する。
また,大規模合成命令微調整の有効性を検証するために,多種多様な合成命令コーパスSynCode-Instructを提案する。
その結果、実行ベースのベンチマークとCodeArenaのパフォーマンスの違いが判明した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:40:38 GMT)
WAPITI: A Watermark for Finetuned Open-Source LLMs [42.1] WAPITIはパラメータ統合によってベースモデルから微調整モデルに透かしを転送する新しい手法である。
提案手法は,透かしの注入に成功し,微調整モデルとの互換性が高いことを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:50:13 GMT)
TeamCraft: A Benchmark for Multi-Modal Multi-Agent Systems in Minecraft [40.4] オープンソースのビデオゲームMinecraft上に構築されたマルチモーダルなマルチエージェントベンチマークであるTeamCraftを紹介します。
このベンチマークでは、マルチモーダルプロンプトによって指定された55,000のタスク変種、模倣学習のための手続き的に生成された専門家のデモンストレーション、モデル一般化機能を評価するための慎重に設計されたプロトコルが特徴である。
以上の結果から,既存のモデルでは,新たな目標,シーン,不明なエージェントの数を一般化する上で,大きな課題が続いていることが示唆された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:41:16 GMT)
Smoothie: Label Free Language Model Routing [39.9] 大規模言語モデル(LLM)は、LLM入力が多くの異なるタスクにまたがるアプリケーションでますます使われている。
Smoothieは、ラベル付きデータを必要としない、監督にインスパイアされた弱いルーティング手法である。
SmoothieのLLMの品質スコアは、地上モデルの品質と相関している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:06:37 GMT)
LUDVIG: Learning-free Uplifting of 2D Visual features to Gaussian Splatting scenes [39.7] 本研究では,3次元ガウス・スプラッティングシーンに2次元画像特徴をアップリフトする新しい手法を提案する。
本手法は,グラフ拡散機構により拡張された,よりシンプルで効率的な特徴集約手法を用いる。
CLIP機能に適用すると,オープン語彙オブジェクト検出タスクにおいて高い性能を示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:39:13 GMT)
SimMLP: Training MLPs on Graphs without Supervision [38.6] グラフ学習のための自己教師型フレームワークであるSimMLPを紹介する。
SimMLPは、最適の場合において、GNNと等価性を達成できる最初の学習方法である。
我々は、相互情報と帰納バイアスに基づいて、SimMLPとGNNの等価性を示す包括的な理論的分析を行う。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:46:38 GMT)
Learning to Translate Noise for Robust Image Denoising [38.6] ディープ・ラーニング・テクニックは、現実世界のノイズに分布しないような一般化性能に苦しむことが多い。
そこで,本研究では,元の雑音画像を直接デノナイズするのではなく,変換された雑音で画像をデノナイズする新しいノイズ翻訳フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:35:44 GMT)
C$^2$LEVA: Toward Comprehensive and Contamination-Free Language Model Evaluation [38.6] C$2$LEVAは、組織的な汚染防止を特徴とする包括的なベンチマークである。
15のオープンソースおよびプロプライエタリモデルの大規模評価は,C$2$LEVAの有効性を示している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:07:44 GMT)
Superpixel Tokenization for Vision Transformers: Preserving Semantic Integrity in Visual Tokens [38.3] 我々は、Vision Transformerのグリッドベースのトークン化をスーパーピクセルトークン化に置き換えることを提案する。
既存のフレームワークとの強い互換性を示すアプローチは、様々な下流タスクにおけるViTの精度と堅牢性を高める。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 00:38:36 GMT)
CompCap: Improving Multimodal Large Language Models with Composite Captions [38.3] 合成画像 (CI) は、カメラに直接キャプチャされるのではなく、チャート、ポスター、スクリーンショットなどの複数のビジュアル要素をマージすることによって生成される合成ビジュアルである。
現在のMLLM(Multimodal Large Language Models)は、CIを正確に理解する上で重要な課題に直面している。
LLM(Large Language Models)と自動化ツールを活用するフレキシブルなフレームワークであるComp Captions(CompCap)を導入し、CIを正確なキャプションと詳細なキャプションで合成する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:22:47 GMT)
MixedGaussianAvatar: Realistically and Geometrically Accurate Head Avatar via Mixed 2D-3D Gaussian Splatting [38.2] 高忠実度3Dヘッドアバターの再構築は、仮想現実などの様々な応用において重要である。
最近の3次元ガウススティング(3DGS)に基づく手法は、トレーニングとレンダリングの効率を著しく向上させる。
そこで我々は,MixedGaussian Avatarという新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:17:25 GMT)
Open-Canopy: A Country-Scale Benchmark for Canopy Height Estimation at Very High Resolution [38.0] オープンアクセス・カントリースケール・ベンチマークであるOpen-Canopyを導入し,高分解能(1.5m)キャノピー高さ推定を行った。
Open-Canopy-$Delta$は,樹齢の異なる画像間のキャノピー高さ変化検出のベンチマークである。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:32:41 GMT)
FairMedFM: Fairness Benchmarking for Medical Imaging Foundation Models [37.8] 医療画像における基礎モデル(FM)研究のためのフェアネスベンチマークであるFairMedFMを紹介する。
FairMedFMは17の一般的な医療画像データセットと統合されており、様々なモダリティ、次元、機密属性を含んでいる。
ゼロショット学習、線形探索、パラメータ効率のよい微調整、様々な下流タスク、分類とセグメンテーションなど、広く使われている20のFMを探索する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:16:02 GMT)
Spectrally-Pure Optical Serrodyne Modulation for Continuously-Tunable Laser Offset Locking [37.7] 連続波レーザー光の光周波数オフセット(OFO)を,光ファイバーEOMと光周波数(RF)トーンを用いてセルロジン変調により示す。
このツールの有用性は、キャビティロックレーザーのオフセットを50MHzから1600MHzに連続的にシフトさせることによって示される。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 20:40:18 GMT)
GenMix: Effective Data Augmentation with Generative Diffusion Model Image Editing [37.5] 本稿では、一般化可能なプロンプト誘導型生成データ拡張手法であるGenMixを紹介する。
本手法は、画像編集を利用して、カスタム条件付きプロンプトに基づく拡張画像を生成する。
提案手法は、非現実的な画像とラベルの曖昧さを緩和し、結果のモデルの性能と対角的堅牢性を向上する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 00:42:40 GMT)
Unifying Generative and Dense Retrieval for Sequential Recommendation [37.4] 逐次密度検索と生成検索の強みを組み合わせたハイブリッドモデルであるLIGERを提案する。
LIGERは、シーケンシャルな高密度検索を生成検索に統合し、性能差を緩和し、コールドスタートアイテムレコメンデーションを強化する。
このハイブリッドアプローチは、これらのアプローチ間のトレードオフに関する洞察を与え、小規模ベンチマークにおけるレコメンデーションシステムの効率と効率性の向上を示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 23:09:05 GMT)
EvaGaussians: Event Stream Assisted Gaussian Splatting from Blurry Images [36.9] 3次元ガウススプラッティング(3D-GS)は、3次元シーン再構成と新しいビュー合成において例外的な機能を示した。
本稿では,イベントストリーム支援型ガウシアンスプラッティング(EvaGaussians)について紹介する。これは,イベントカメラがキャプチャしたイベントストリームを統合して,ぼやけた画像から高品質な3D-GSを再構築する手法である。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:34:57 GMT)
Functional Bilevel Optimization for Machine Learning [36.1] 本稿では,関数空間上での内的目的を最小化する機械学習における二段階最適化問題に対する新たな機能的視点を提案する。
機能的二段階最適化問題に対して,スケーラブルで効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:37:50 GMT)
SPARKLE: A Unified Single-Loop Primal-Dual Framework for Decentralized Bilevel Optimization [35.9] 本稿では,複数のエージェントが協調して,近傍通信によるネスト最適化構造に関わる問題を解く分散二段階最適化について検討する。
SPARKLE(Single-loop Primal-dual AlgoRithm frameworK)を提案する。
本稿では,SPARKLEの統一収束解析を行い,既存の分散二段階アルゴリズムと比較して,最先端の収束率を持つ全変種に適用する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:45:50 GMT)
LongVALE: Vision-Audio-Language-Event Benchmark Towards Time-Aware Omni-Modal Perception of Long Videos [35.8] リアルワールドビデオは、密集したストーリーラインを形成する一連のイベントを含む、オムニ・モーダル情報(ビジョン、オーディオ、スピーチ)を含んでいる。
微粒なイベントアノテーションによるマルチモーダルビデオデータの欠如と、手動ラベリングの高コストは、全方位ビデオ知覚において大きな障害となる。
正確な時間境界を持つ105Kのオムニモーダルイベントからなる視覚・聴覚・言語イベント理解ベンチマークであるLongVALEを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 07:24:10 GMT)
DINO-X: A Unified Vision Model for Open-World Object Detection and Understanding [35.5] IDEA Researchが開発した統合オブジェクト中心ビジョンモデルであるDINO-Xを紹介する。
DINO-Xは、オープンワールドオブジェクト理解のためのオブジェクトレベルの表現を追求するために、Grounding DINO 1.5と同じTransformerベースのエンコーダデコーダアーキテクチャを使用している。
我々は,プロンプトのないオープンワールド検出をサポートする汎用オブジェクトプロンプトを開発し,ユーザがプロンプトを提供することなく,画像中のあらゆるものを検出できるようにする。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:45:46 GMT)
EXAONE 3.5: Series of Large Language Models for Real-world Use Cases [35.0] EXAONE 3.5言語モデルは32B、7.8B、2.4Bの3つの構成で提供されている。
商用利用については、LG AI Researchの公式コンタクトポイントを参照してください。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:53:46 GMT)
Who Sets the Agenda on Social Media? Ideology and Polarization in Online Debates [34.8] 今回の研究では、気候変動、新型コロナウイルス、ロシア・ウクライナ戦争という3つの世界的議論から、大規模なTwitterデータを分析します。
本研究は,メディアや活動家など特定のカテゴリーのアクターによる議論ではなく,イデオロギー的アライメントによる議論が主であることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:48:22 GMT)
Fast Tree-Field Integrators: From Low Displacement Rank to Topological Transformers [34.5] 重み付き木に定義されたテンソル場を統合するための高速多言語線形アルゴリズムのクラスを提案する。
結果の高速木野グラフ(FTFI)の応用として,グラフメトリクスと木メトリクスの近似,グラフ分類,メッシュ上のモデリングなどがある。
トポロジカルトランスフォーマーでは、トランスフォーマー層毎に3つの余分な学習可能なパラメータを持つ新しい相対位置符号化(RPE)マスキング機構を提案し、1.0-1.5%以上の精度向上を実現した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:41:56 GMT)
Variational quantum classifiers via a programmable photonic microprocessor [34.0] 変分量子アルゴリズム(VQA)は、量子優位性を達成するための実行可能な戦略を提供する。
この研究はシリコンベースの量子フォトニックマイクロプロセッサと古典コンピュータを用いてVQCを実装している。
3つのバイナリ分類タスクのアキュラティはそれぞれ87.5%、92.5%、85.0%であり、現実世界のアイリスデータセットでは98.8%である。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:34:12 GMT)
Monitoring Latent World States in Language Models with Propositional Probes [33.8] 言語モデルは、バイアス、梅毒、バックドア、その他入力コンテキストに対する不誠実な応答につながる傾向に影響を受けやすい。
我々は、語彙情報のためのトークンを合成的にプローブし、それらを論理的命題に結合する「命題プローブ」を用いる。
言語モデルが入力コンテキストに不誠実に応答する3つの設定において、デコードされた命題が忠実であることに気付きました。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:58:12 GMT)
High-contrast absorption magnetometry in the visible to near-infrared range with nitrogen-vacancy ensembles [33.7] 放射波長から1000nmまでのNV中心による広帯域光吸収現象を示す。
吸収遷移の低いレベルは、エネルギー的に低いNV一重項状態である可能性がある。
これにより、高感度NV磁気メトリーのためのコヒーレントレーザー信号検出による新しい検出波長状態が開かれる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:10:55 GMT)
Bed-Attached Vibration Sensor System: A Machine Learning Approach for Fall Detection in Nursing Homes [33.5] 本研究は,医療用ベッドに内蔵された自動転倒検知システムの開発であり,ウェアラブルやビデオ監視を通じて患者のプライバシーを損なうことなく,患者の安全性を高めることを目的としている。
ベッドフレームを介して伝達される機械的振動は、短時間のフーリエ変換を用いて処理され、畳み込みニューラルネットワークを用いて、異なる人間の落下パターンの堅牢な分類を可能にする。
利用可能なデータが限られているにもかかわらず、提案システムは、転倒に対する正確かつ迅速な対応の可能性を示し、健康への影響を軽減し、高齢化人口のニーズに対処する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:08:47 GMT)
An Evolved Universal Transformer Memory [33.3] 従来の手法では, コンテクストの特定の部分を手作業によるルールで取り除き, 現代的な基礎モデルのエスカレーションコストを相殺することを提案した。
ニューラルアテンション記憶モデル(NAMM)によるこのトレードオフを克服する。
私たちは、個々のレイヤとアテンションヘッドの最も関連性の高い情報に焦点を当てた、さまざまな潜伏したコンテキストを提供するように進化しています。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:22:11 GMT)
All-in-One: Heterogeneous Interaction Modeling for Cold-Start Rating Prediction [33.1] 異種相互作用評価ネットワーク(HIRE)と呼ばれるフレキシブルなフレームワークを提案する。
HIRE線量は、事前に定義された相互作用パターンや、手動で構築された異種情報ネットワークにのみ依存しない。
実験では,実世界の3つのデータセットに対して,3つのコールドスタート設定でモデルを評価する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:26:40 GMT)
Enhancing LLMs for Physics Problem-Solving using Reinforcement Learning with Human-AI Feedback [33.0] 大規模言語モデル(LLM)は、テキストベースのタスクにおいて強力な能力を示してきたが、物理学的な問題に必要な複雑な推論に苦慮している。
本稿では,人間・人工知能フィードバックを用いた強化学習(RLHAIF)を用いた物理問題におけるLLM性能向上のための新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:17:47 GMT)
Agreement-Based Cascading for Efficient Inference [32.9] Agreement-Based Cascading (ABC) は単純で効果的な適応推論手法である。
ABCは、サイズ/複雑さの増大したモデルのカスケードを構築し、データ依存ルーティングの基盤として、カスケードの各レベルにおけるモデルのアンサンブル間の合意を使用する。
ABCは既存のモデルの代替品として確実に機能し、効率と精度の両面で、最高のシングルモデルを上回ることを示しています。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 20:21:37 GMT)
PsycoLLM: Enhancing LLM for Psychological Understanding and Evaluation [32.4] PsycoLLMは、提案された高品質な心理的データセットに基づいて訓練されている。
このプロセスは、オンラインプラットフォームから抽出された現実世界の心理的背景によって強化される。
中国における信頼性心理学的カウンセリング試験に基づく総合心理学的ベンチマークを開発した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 06:51:46 GMT)
DNF: Unconditional 4D Generation with Dictionary-based Neural Fields [32.3] 非条件生成モデルのための新しい4次元表現であるDNFを提案する。
DDNFは、歪んだ形状と動きを持つ変形可能な形状を効率的にモデル化する。
提案手法は,有効かつ高忠実な4Dアニメーションを生成することができる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:25:57 GMT)
Transformers Struggle to Learn to Search [32.2] 基礎的なグラフ接続問題をテストベッドとして使用し、最小限の高被覆データを効果的に生成し、小型変圧器を訓練する。
適切なトレーニング分布が与えられると、トランスフォーマーは検索を学ぶことができる。
また、文脈内で検索を行うこと(すなわち、チェーン・オブ・シント)は、より大きなグラフで検索することを学ぶことができないことを解決しない。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:29:24 GMT)
Document Haystacks: Vision-Language Reasoning Over Piles of 1000+ Documents [32.0] 大規模マルチモーダルモデル (LMM) は視覚言語理解において顕著な進歩を遂げた。
それらは、多数の画像に対して複雑な推論を必要とする現実世界のアプリケーションにおいて制限に直面している。
我々はDocHaystackとInfoHaystackという2つの文書ハイスタックベンチマークを導入し、大規模ビジュアル文書検索と理解においてLMMの性能を評価する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:10:23 GMT)
Foundation Models for Low-Resource Language Education (Vision Paper) [31.8] 大規模言語モデル(LLM)は、自然言語を扱うための強力なツールである。
LLMは、限られたトレーニングデータと文化的なニュアンスを理解するのが難しいため、低リソース言語に適用する際の課題に直面している。
本稿では,LLMが低リソース言語への教育をいかに強化するかを論じ,実践的応用とメリットを強調した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 04:34:45 GMT)
ControlFace: Harnessing Facial Parametric Control for Face Rigging [31.8] フレキシブルで高忠実な制御を可能にする3DMMレンダリングに条件付けされた新しい顔リグ手法であるControlFaceを導入する。
ひとつはFaceNetと呼ばれ、アイデンティティと詳細をキャプチャし、もうひとつは生成に焦点を当てています。
顔ビデオデータセットをトレーニングすることで、FaceNetのリッチな表現を完全に活用し、コントロールの順守を確保します。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:48:04 GMT)
The Silent Prompt: Initial Noise as Implicit Guidance for Goal-Driven Image Generation [31.6] テキスト・ツー・イメージ合成(T2I)は大規模拡散モデルの出現とともに著しく進歩した。
本研究では、しばしば見過ごされるノイズ自体が固有の生成傾向を符号化し、暗黙的に出力を導く「サイレントプロンプト」として機能することを明らかにする。
本稿では,様々なユーザニーズを満たすために,あらかじめ構築したノイズライブラリから最適な初期ノイズを選択する新しい手法であるNossQueryを紹介する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:59:00 GMT)
Graph Canvas for Controllable 3D Scene Generation [31.1] GraphCanvas3Dは、制御可能な3Dシーン生成のためのプログラム可能、空間的、適応可能なフレームワークである。
本フレームワークでは,空間要素をグラフノードとして表現する階層的,グラフ駆動的なシーン記述を用いている。
GraphCanvas3Dは4Dシーン生成をサポートし、時間とともに変化する変化をモデル化するために時間的ダイナミクスを取り入れている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:26:29 GMT)
Customized Generation Reimagined: Fidelity and Editability Harmonized [30.9] カスタマイズされた生成は、新しい概念を事前訓練されたテキスト・ツー・イメージモデルに組み込むことを目的としている。
カスタマイズされた生成は、概念の忠実さと編集性の間の本質的にのトレードオフに悩まされる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 07:54:34 GMT)
DRL4AOI: A DRL Framework for Semantic-aware AOI Segmentation in Location-Based Services [30.6] 位置情報サービス(LBS)における関心領域(AOI)のセグメンテーションの基本的な課題
本稿ではDRL4AOIと呼ばれる新しいDRLベースのフレームワークを提案する。
また,ロジスティクスサービスにおけるAOIセグメンテーションのためのDRL4AOIの代表的な実装について述べる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:45:27 GMT)
Spatially-Adaptive Hash Encodings For Neural Surface Reconstruction [30.6] 本研究では,ネットワークが空間の関数として符号化ベースを選択することができる学習手法を提案する。
その結果、空間適応的なアプローチにより、ネットワークはノイズを発生させることなくより広い周波数域に適合できる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:54:55 GMT)
Diff4Steer: Steerable Diffusion Prior for Generative Music Retrieval with Semantic Guidance [30.2] Diff4Steerは、ユーザクエリから多様なシード埋め込みを合成する新しい生成検索フレームワークである。
Diff4Steerは、検索対象のモダリティ(オーディオ)に関する統計的事前情報を提供し、ユーザの嗜好の不確実性と多面的な性質を効果的に捉えている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 03:18:18 GMT)
Conformal Prediction for Class-wise Coverage via Augmented Label Rank Calibration [30.0] 本稿では,クラス条件カバレッジを実現するための予測セットサイズを削減するために,ランク校正型クラス条件CP(RC3P)アルゴリズムを提案する。
複数の実世界のデータセットの実験により、RC3Pは平均的な予測セットサイズを26.25%削減した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:56:05 GMT)
The Intelligible and Effective Graph Neural Additive Networks [29.7] Graph Neural Additive Network (GNAN) は、一般化加法モデルの解釈可能なクラスの拡張である。
GNANは完全に解釈可能で、機能とグラフレベルでのグローバルとローカルの両方の説明を提供する。
我々は、さまざまなタスクやデータセットの一連の例において、GNANの知性を示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:25:17 GMT)
LLMs May Perform MCQA by Selecting the Least Incorrect Option [29.2] 大規模言語モデル(LLM)は、様々なタスクにわたるパフォーマンスを著しく向上させた。
LLMを評価するためのベンチマークとして、MCQA(Multiple Choice Question Answering)が採用され、大きな注目を集めている。
しかし、この評価手法の堅牢性に関する懸念は続いている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:54:40 GMT)
Knowledge Graphs are all you need: Leveraging KGs in Physics Question Answering [28.3] 質問回答タスクに対するモデル応答品質の向上を目的としたパイプラインを導入する。
LLMを用いて質問の内部ロジックをキャプチャする知識グラフを構築することにより、これらのグラフはサブクエストの生成をガイドする。
その結果,知識グラフから派生したサブクエストは,元の質問の論理に対する忠実度を著しく向上させることがわかった。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 22:25:23 GMT)
TTT-Unet: Enhancing U-Net with Test-Time Training Layers for Biomedical Image Segmentation [28.2] TTT-Unetは、テストタイムトレーニング層をバイオメディカルイメージセグメンテーションのための従来のU-Netアーキテクチャに統合する新しいフレームワークである。
TTT-Unetは,CTおよびMR画像における3次元腹部臓器の分画,内視鏡画像における計器の分画,顕微鏡画像における細胞分画など,複数の医用画像データセット上で評価される。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:45:11 GMT)
LoRA.rar: Learning to Merge LoRAs via Hypernetworks for Subject-Style Conditioned Image Generation [28.1] 画像品質を向上し、マージ処理において4000ドルを超える驚くべきスピードアップを実現する方法であるLoRA.rarを紹介する。
LoRA.rarは、様々なコンテンツスタイルのLoRAペアのハイパーネットワークを事前トレーニングし、新しい、目に見えないコンテンツスタイルのペアに一般化する効率的なマージ戦略を学ぶ。
本手法は,MLLMの評価と人的評価によって評価され,内容とスタイルの忠実さの両面で技術の現状を著しく上回っている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:04:56 GMT)
Exponential Speedups by Rerooting Levin Tree Search [28.0] Levin Tree Search (LTS) は、ユーザが指定したポリシーを使って探索を誘導する決定論的環境の探索アルゴリズムである。
我々は、検索ツリーの各ノードにルートされたLTS検索を暗黙的に開始する、$sqrttextLTS$ (pronounce root-LTS)と呼ばれる新しいアルゴリズムを導入する。
我々は、$sqrttextLTS$が持つ探索ステップの数が、再ルートの不確実性に関連する因子の価格で、サブタスクへの最良の分解と競合していることを証明する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:20:50 GMT)
QuTiP 5: The Quantum Toolbox in Python [28.0] 我々はQuTiP v5の最新の開発について紹介し、QuTiPの将来に大きな影響を与えることを想定している。
コード設計と基本データレイヤの変更と効率の改善を要約します。
QuTiPのすべての"量子オブジェクト"を支えるデータレイヤのさらなる柔軟性により、最先端のデータフォーマットとJAX、CuPyなどのパッケージのパワーを利用することができます。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:36:04 GMT)
MSECG: Incorporating Mamba for Robust and Efficient ECG Super-Resolution [27.4] 本稿では,ECG SR 用に設計されたコンパクトニューラルネットワークモデル MSECG を提案する。
MSECGは、再帰するMambaモデルの強度と畳み込み層を組み合わせることで、ECG波形の局所的および大域的依存関係をキャプチャする。
実験結果から,MSECGは2つの現代ECG SRモデルよりもクリーンでノイズの多い条件下で優れていた。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:53:31 GMT)
Sense and Sensitivity: Evaluating the simulation of social dynamics via Large Language Models [27.3] 大規模言語モデルは、社会力学をシミュレートする古典的エージェントベースモデル(ABM)の強力な代替物として提案されている。
しかし、LLMのブラックボックスの性質から、LLMエージェントが実際に意図した意味論を実行するかどうかは不明である。
目的とする力学を近似するプロンプトを設計することは可能であるが、これらのシミュレーションの品質はプロンプトの特定の選択に非常に敏感である。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:50:01 GMT)
MaterialPicker: Multi-Modal Material Generation with Diffusion Transformers [27.0] 本稿では,Diffusion Transformer (DiT) アーキテクチャを利用したマルチモーダル・マテリアル・ジェネレータを提案する。
本手法では, 被捕獲面が歪んだ場合でも, 試料の画像量に基づいて材料を生成することができる。
従来よりも多種多様な材料生成と歪み補正が可能であることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:24:39 GMT)
Transition Rate Scheduling for Quantization-Aware Training [26.8] 量子化対応トレーニング(QAT)は、ウェイト/アクティベーションのビット精度を低下させるために、トレーニング中の量子化プロセスをシミュレートする。
勾配ベースを用いて遅延重みを更新することで、間接的に量子化された重みを学習する。
本稿では,量子化重みの遷移数を明示的に制御する遷移率(TR)スケジューリング手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 12:02:37 GMT)
xLSTM: Extended Long Short-Term Memory [26.6] 1990年代、Long Short-Term Memory (LSTM) の中心概念として、定数エラーカルーセルとゲーティングが導入された。
正規化と安定化を適切に行う指数ゲーティングを導入する。
i)スカラーメモリ,スカラー更新,新しいメモリ混合,(ii)行列メモリと共分散更新ルールと完全に並列化可能なmLSTM。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:42:07 GMT)
Steps are all you need: Rethinking STEM Education with Prompt Engineering [26.6] シュートとチェーン・オブ・ワートのプロンプトは、物理学的質問回答タスクに適用すると、有望であることが示されている。
物理質問回答タスクに適用された場合、ほとんどショットやチェーン・オブ・ソートのプロンプトは期待できない。
The Mixture of Experts (MoE) Model, as analogical prompting, we can be shown improve model performance。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:20:57 GMT)
A Water Efficiency Dataset for African Data Centers [26.3] 本稿では,5つの異なる気候領域にわたる41のアフリカ諸国のデータセンターにおける水利用効率を推定するための,第1種データセットを提案する。
また、我々のデータセットを用いて、2つの大きな言語モデルにおける推論の水消費量を評価し、推定する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 04:40:40 GMT)
A Practical Examination of AI-Generated Text Detectors for Large Language Models [25.9] 機械生成コンテンツ検出器は、任意の言語モデルからAI生成テキストを識別する。
本稿では,これらの主張を,いくつかの人気検出器を評価することによって批判的に評価する。
我々は、敵攻撃をシミュレートするために様々なプロンプト戦略を採用し、中程度の努力でも検出を著しく回避できることを示した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:56:11 GMT)
Privacy-Preserving Retrieval Augmented Generation with Differential Privacy [25.9] 検索拡張生成(RAG)は、外部知識ソースから直接関連する情報を提供することで、大規模言語モデル(LLM)を支援する。
RAGは、外部データソースから機密情報を漏洩するリスクを出力する。
本研究では、データプライバシの正式な保証である差分プライバシ(DP)の下でRAGを探索する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:20:16 GMT)
Supervised Radio Frequency Interference Detection with SNNs [25.1] 電波干渉(Radio Frequency Interference、RFI)は、電波望遠鏡によって観測される観測を妨害し、地球や天体から発生する電波天文学において重要な課題である。
電波天文学観測の動的・時間的性質を考えると、スパイキングニューラルネットワーク(SNN)は有望なアプローチとして出現する。
SNN推論のための電波可視データの符号化について,レート,レイテンシ,デルタ変調,ステップフォワードアルゴリズムの3つのバリエーションを考慮した6つの符号化方式について検討した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:24:55 GMT)
TPRF: A Transformer-based Pseudo-Relevance Feedback Model for Efficient and Effective Retrieval [25.0] 本稿では,資源制約環境下での高密度検索のための擬似関連フィードバック(PRF)手法について考察する。
本稿では,より少ないメモリフットプリントと高速な推論時間を有する変圧器を用いたPRF法を提案する。
TPRFは、高密度通路表現からの関連フィードバック信号を効果的に組み合わせる方法について学習する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:54:55 GMT)
Logic Agent: Enhancing Validity with Logic Rule Invocation [24.8] Chain-of-Thoughtプロンプトは、推論タスク中に言語モデルの推論能力を増強するための重要なテクニックとして現れている。
本稿では,大規模言語モデルにおける推論プロセスの有効性向上を目的としたエージェントベースのフレームワークであるLogic Agent(LA)を紹介する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:34:38 GMT)
DAug: Diffusion-based Channel Augmentation for Radiology Image Retrieval and Classification [24.7] 生成モデルの出力を用いて知覚モデルの性能を向上させる携帯型手法を提案する。
具体的には、放射線画像を複数のチャネルに拡張し、病気が進行する傾向のある地域のヒートマップとして追加する。
本手法は, 生成モデルが正常画像と異常画像の分布を学習するという事実に動機付けられ, その知識は画像理解タスクの補完となる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 07:43:28 GMT)
Quantum-Hybrid Stereo Matching With Nonlinear Regularization and Spatial Pyramids [24.5] 本稿では, 非線形正則化器とピラミッドとのステレオマッチングの新しい定式化について述べる。
我々のアプローチはハイブリッド(すなわち量子古典)であり、現代のD-Wave量子アニールと互換性がある。
我々は、異なる解法を用いる場合の量子ステレオマッチングの2%と22.5%において、従来の技術よりも改良されたルート平均2乗精度を実現する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:03:53 GMT)
Momentum Approximation in Asynchronous Private Federated Learning [24.3] 本稿では,すべての履歴モデル更新の最適重み付き平均を求めることにより,バイアスを最小限に抑えるモーメント近似を提案する。
我々は、ベンチマークFLデータセットにおいて、モーメント近似が収束のスピードアップで1.15のテクスム−-4タイムを達成できることを実証的に実証した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 23:10:57 GMT)
Understanding Multi-Granularity for Open-Vocabulary Part Segmentation [24.1] Open-vocabulary part segmentation (OVPS) は、多種多様な未確認語彙を用いたきめ細かいエンティティのセグメンテーションに焦点を当てた新興研究分野である。
本研究は,部分識別の知識に基づく性質を反映して,複雑な境界と多様な粒度による部分分割の複雑さを強調した。
一般化された部分とオブジェクトレベルのコンテキストを活用する新しいフレームワークであるPartCLIPSegを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:26:27 GMT)
ChromaDistill: Colorizing Monochrome Radiance Fields with Knowledge Distillation [24.0] 入力グレースケールのマルチビュー画像から新しいビューをカラー化する方法を提案する。
自然画像に基づいて訓練したこれらのネットワークからターゲット3D表現に色を伝達する蒸留方式を提案する。
提案手法は基礎となる3D表現に非依存であり,NeRF法や3DGS法に容易に一般化可能である。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 07:11:33 GMT)
Birth and Death of a Rose [23.9] 本研究では,事前学習した2次元基礎モデルから時間的対象固有値を生成する問題について検討する。
本稿では,事前学習した2次元拡散モデルから抽出した信号を用いて,そのような資産を生成する手法を提案する。
本手法は,いくつかの自然現象に対して高品質な時間的対象固有値を生成することができる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:59:52 GMT)
No Free Lunch From Random Feature Ensembles [23.7] モデル全体のサイズに関する予算が与えられた場合、単一の大きなニューラルネットワークをトレーニングするか、あるいは多数の小さなネットワークの予測を組み合わせるかを判断する必要がある。
トレーニング可能なパラメータの固定数が、独立に訓練されたモデルで$K$に分割された場合、$K=1$が最適な性能を達成することを証明した。
カーネルおよびタスク固有構造上の条件を特定し、アンサンブルがほぼ最適スケーリング法則を達成できることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 20:55:27 GMT)
Transformers Can Navigate Mazes With Multi-Step Prediction [23.6] トランスフォーマーは、長期計画に苦しむシーケンスで次のトークンを予測するように訓練された。
標準の次のシングルトークン予測目標は、複数のステップを先に予測する明確なメカニズムを提供しない。
本研究は,トランスフォーマーの迷路ナビゲーションを改善するために,複数のステップ(および後方)を明示的に予測できるかどうかを検討する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:19:10 GMT)
Towards Boosting LLMs-driven Relevance Modeling with Progressive Retrieved Behavior-augmented Prompting [23.6] 本研究では,検索ログに記録されたユーザインタラクションを活用して,ユーザの暗黙の検索意図に対する洞察を得ることを提案する。
ProRBPは,探索シナリオ指向の知識を大規模言語モデルと統合するための,プログレッシブ検索行動拡張型プロンプトフレームワークである。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 12:09:15 GMT)
Rethink Deep Learning with Invariance in Data Representation [23.5] 不変設計は、深層学習以前の様々な表現の基盤となっている。
本チュートリアルでは,データ表現の不変性に関する歴史的考察を紹介する。
これらの研究のジレンマ、有望な作業、今後の方向性、そしてWebアプリケーションを特定します。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:52:26 GMT)
A Survey on Privacy-Preserving Caching at Network Edge: Classification, Solutions, and Challenges [23.2] エッジネットワークでのコンテンツキャッシングは、ネットワークバックホールの負担を軽減するために広く展開されている人気で効果的な手法である。
エッジネットワークでコンテンツをキャッシュするプライバシー侵害に関して、いくつかの論争があった。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:43:55 GMT)
ConQRet: Benchmarking Fine-Grained Evaluation of Retrieval Augmented Argumentation with LLM Judges [23.2] 今日の分極環境では、計算的議論がますます重要になっている。
そこで本研究では,現実世界のWebサイトを基盤とした,議論されたトピックに関する,長く複雑な人間による議論を特徴とする新しいベンチマークを提案する。
提案した LLM Judges と ConQRet ベンチマークは,計算議論の急速な進展を可能にする。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:35:52 GMT)
Autoformalize Mathematical Statements by Symbolic Equivalence and Semantic Consistency [22.9] そこで我々は,記号的同値性と意味的整合性に基づいて,k個の自己形式化候補から最良の結果をスコアし,選択する新しいフレームワークを提案する。
MATHおよびminiF2Fデータセットに対する実験により,本手法は自己形式化精度を大幅に向上させることが示された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:06:20 GMT)
Tencent Hunyuan3D-1.0: A Unified Framework for Text-to-3D and Image-to-3D Generation [22.7] Hunyuan3D-1.0はテキストおよび画像条件生成をサポートする2段階のアプローチである。
最初の段階では、約4秒で効率よくマルチビューRGBを生成するマルチビュー拡散モデルを用いる。
第2段階では、3Dアセットを迅速かつ忠実に再構築するフィードフォワード再構築モデルを導入する。
我々のフレームワークは、Hunyuan-DiTというテキスト・ツー・イメージ・モデルで、テキスト・コンディショニングとイメージ・コンディショニングの両方をサポートする統一的なフレームワークである。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:22:41 GMT)
DenseMatcher: Learning 3D Semantic Correspondence for Category-Level Manipulation from a Single Demo [22.7] DenseMatcher(DenseMatcher)は、類似した構造を持つ線内オブジェクト間の3次元対応を計算できる手法である。
DenseMatcherは、以前の3Dマッチングベースラインを43.5%上回っている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:55:09 GMT)
LLM-Align: Utilizing Large Language Models for Entity Alignment in Knowledge Graphs [22.6] 埋め込みベースのエンティティアライメント(EA)が最近注目されている。
EAは、異なる知識グラフ(KG)で対応するエンティティを特定し、一致させようとしている
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:05:37 GMT)
MC-NeRF: Multi-Camera Neural Radiance Fields for Multi-Camera Image Acquisition Systems [22.5] ニューラル・ラジアンス・フィールド(NeRF)は3次元シーン表現にマルチビュー・イメージを使用し、顕著な性能を示す。
以前のNeRFベースの手法のほとんどは、ユニークなカメラを前提としており、マルチカメラのシナリオをめったに考慮していない。
提案するMC-NeRFは,内在パラメータと外在パラメータの両方を,NeRFと併用して共同最適化する手法である。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:53:06 GMT)
Remaining-data-free Machine Unlearning by Suppressing Sample Contribution [22.3] 非学習モデルは、トレーニングプロセスに忘れたデータが関与せず、したがって再学習されたモデルに寄与しない、再学習されたモデルにアプローチすべきである。
本稿では, MU-Mis (Machine Unlearning by Minimize input sensitivity) を提案する。
残余データのない手法が、残余データを利用する最先端の未学習手法より優れているのは、これが初めてである。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:06:19 GMT)
Bridging Text and Image for Artist Style Transfer via Contrastive Learning [22.0] 本稿では,任意のスタイル転送を制御するためのCLAST(Contrastive Learning for Artistic Style Transfer)を提案する。
画像テキストモデルからスタイル記述を効果的に抽出するための教師付きコントラスト訓練戦略を導入する。
また,AdaLNをベースとした新規かつ効率的な状態空間モデルを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:53:44 GMT)
NebulaFL: Effective Asynchronous Federated Learning for JointCloud Computing [21.9] 本稿では,複数クラウド間の協調モデルトレーニングのための非同期FL手法NebulaFLを提案する。
実験の結果、最先端のFL法と比較して、NebulaFLは最大5.71%の精度向上を達成できることがわかった。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:02:09 GMT)
Automated Federated Pipeline for Parameter-Efficient Fine-Tuning of Large Language Models [21.9] 多くの下流タスクでは、プライベートデータを使用して大きな言語モデル(LLM)を微調整する必要がある。
我々はFedPipeという自動フェデレーションパイプラインを提案し、最小のトレーニングコストでLLMを微調整する。
大規模な実験では、FedPipeがモデルのトレーニングを高速化し、最先端のベンチマークよりも高い精度を達成することが示されている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 07:10:30 GMT)
From Voice to Value: Leveraging AI to Enhance Spoken Online Reviews on the Go [21.8] 音声入力によるレビューを提供するモバイルアプリケーションであるVocalizerを開発した。
調査の結果,AIエージェントを頻繁に利用し,レビューに詳細な情報を加えることができた。
また、インタラクティブなAI機能によって、ユーザーの自己効力感やレビューをオンラインで共有する意欲が向上することを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:59:47 GMT)
Gla-AI4BioMed at RRG24: Visual Instruction-tuned Adaptation for Radiology Report Generation [21.8] 胸部X線から放射線学レポートを生成するために,放射線学に焦点を当てた視覚言語モデルを提案する。
我々のモデルは、画像エンコーダとVicuna-7Bアーキテクチャに基づく微調整LDMを組み合わせることで、顕著な精度で放射線学レポートの異なるセクションを生成することができる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:14:03 GMT)
TelOps: AI-driven Operations and Maintenance for Telecommunication Networks [21.6] 通信ネットワーク(TN)は、過去1世紀で最も重要なデータ通信基盤となっている。
運用と保守(O&M)は、TN通信の可用性、有効性、効率を確保するために極めて重要である。
この記事では、TNのためのAI駆動型O&MフレームワークであるTelOpsを紹介します。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:46:50 GMT)
UniMIC: Towards Universal Multi-modality Perceptual Image Compression [21.4] 汎用多モード画像圧縮フレームワークUniMICを提案する。
UniMICは、複数の画像コーデックに対するRDP最適化を統一することを目的としている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:08:55 GMT)
Navigating Shortcuts, Spurious Correlations, and Confounders: From Origins via Detection to Mitigation [21.2] Clever Hans氏の行動、刺激的な相関、あるいは共同設立者は、機械学習とAIにおいて重要な課題を提示している。
この領域の研究は、様々な用語で断片化され、分野全体の進歩を妨げている。
我々は,ショートカットを形式的に定義し,文献で用いられる多種多様な用語をブリッジすることによって,統一された分類を導入する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:10:13 GMT)
Defending Object Detectors against Patch Attacks with Out-of-Distribution Smoothing [21.2] 本稿では,敵対パッチの除去を目的としたアプローチの特性を特徴付けるOODSmootherを紹介する。
このフレームワークは、1)既存のオブジェクト検出器に対するパッチアタックを壊す新しいアダプティブアタック、2)セマンティックプリミティブを利用する新しいディフェンスアプローチであるSemPriorを設計するのに役立つ。
SemPriorだけでは40%増、既存の防衛と組み合わせれば60%増だ。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 03:25:10 GMT)
A dynamical measure of algorithmically infused visibility [21.0] この研究は、人間とアルゴリズムの振る舞いが互いに影響を及ぼす社会における可視性の性質に焦点を当てている。
本稿では、コミュニケーション研究、政治科学、マーケティング、技術デザイン、ソーシャルメディア分析など、様々な分野への含意と応用を含む視界の定量的尺度を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:51:39 GMT)
REGENT: A Retrieval-Augmented Generalist Agent That Can Act In-Context in New Environments [20.8] 新しい環境に迅速に適応できるジェネラリストエージェントを構築することは、デジタルおよび現実世界にAIをデプロイする上で重要な課題である。
そこで本研究では,比較的小規模なデータセットを事前訓練した上で,コンテキスト内学習による未知の環境に適応する手法を提案する。
私たちのキーとなるアイデアは、検索が高速適応に強力なバイアスを与える、ということです。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 03:54:55 GMT)
Robot Learning with Super-Linear Scaling [20.7] CASHERは、データ収集と学習をシミュレーションでスケールアップするためのパイプラインであり、パフォーマンスは人間の努力と超直線的にスケールする。
そこで我々は,CASHERにより,人的努力を伴わないビデオスキャンにより,事前学習したポリシーを目標シナリオに微調整できることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:23:30 GMT)
Aesthetic Post-Training Diffusion Models from Generic Preferences with Step-by-step Preference Optimization [20.7] 本稿では,経済的に美学を改善するために,ステップバイステップ優先最適化(SPO)を提案する。
SPOは伝播戦略を捨て、きめ細かい画像の詳細を評価できる。
SPOは、細かな視覚的詳細のステップバイステップアライメントのため、DPO法よりもはるかに高速に収束する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:59:18 GMT)
QueEn: A Large Language Model for Quechua-English Translation [20.4] 本稿では,Retrieval-Augmented Generation(RAG)とパラメータ効率のよい微調整技術を組み合わせた,ケチュア英訳の新しい手法であるQueEnを提案する。
BLEUスコアは標準GPTモデルの1.5に対して17.6である。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:04:21 GMT)
An Experimental Evaluation of Imputation Models for Spatial-Temporal Traffic Data [20.3] 本研究の目的は、交通データ計算研究の総合的な理解を提供することであり、実用的なガイドラインとして機能することである。
まず、現実の交通データ損失の可能な全ての形態を体系的に同定し、欠落パターンと計算モデルに対する実践指向を提案する。
さらに、様々な欠落パターンとレートで10の代表的なモデルを包括的に評価するために、統一的なベンチマークパイプラインを導入します。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:47:54 GMT)
Mix-Modality Person Re-Identification: A New and Practical Paradigm [20.0] より実用的な混合モダリティ検索パラダイムを提案する。
既存の可視赤外人物再識別法(VI-ReID)は,両モード相互検索のパラダイムにおいていくつかの成果を上げている。
本稿では,Mix-Modality person re-identification (MM-ReID)タスクを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:19:57 GMT)
Deep Learning in Single-Cell and Spatial Transcriptomics Data Analysis: Advances and Challenges from a Data Science Perspective [19.7] 単一細胞および空間転写学の発展は、細胞の性質、機能、相互作用を研究する能力に革命をもたらした。
しかし,単一セル・空間オミクスデータの解析は依然として困難である。
ディープラーニングは、高次元の複雑なデータを処理し、意味のあるパターンを自動的に識別できる強力なツールとして登場した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:53:50 GMT)
A Lightweight and Real-Time Binaural Speech Enhancement Model with Spatial Cues Preservation [19.4] バイノーラル音声強調は、聴覚装置から受信される雑音信号の音質と可聴性を改善することを目的としている。
既存の手法は、ノイズ低減(NR)と空間的手がかり(SCP)の精度と保存の妥協に悩まされることが多い。
本稿では、低周波帯域をフィルタし、残りを保ち、NRに優れた学習ベース軽量複合畳み込みネットワーク(LBCCN)を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:27:11 GMT)
Revitalizing Reconstruction Models for Multi-class Anomaly Detection via Class-Aware Contrastive Learning [19.1] クラス認識型コントラスト学習(CL)を取り入れたプラグアンドプレイ修正を提案する。
4つのデータセットにまたがる実験により、我々のアプローチの有効性が検証され、高度な手法と比較して大幅に改善され、性能が向上した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 04:31:09 GMT)
Addressing Attribute Leakages in Diffusion-based Image Editing without Training [18.9] 重要な課題は属性リークであり、非ターゲット領域や属性干渉によるターゲット領域内で意図しない修正が発生する。
既存のメソッドは、単純なテキストの埋め込みとEnd-of-Sequence(EOS)トークンの埋め込みの不十分な処理によって、リークに悩まされることが多い。
1)テキスト埋め込みにおけるオブジェクト固有の属性をローカライズするためのオブジェクト制限埋め込み(ORE)、(2)クロスアテンションマスキング(RGB-CAM)のためのリージョンガイドブレンド(RGB-CAM)、(3)非保存のためのバックグラウンドブレンド(BB)の3つのコンポーネントで属性リークに対処する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:10:07 GMT)
Megatron: Evasive Clean-Label Backdoor Attacks against Vision Transformer [18.8] 本稿では,視覚変換器に対するクリーンラベルバックドア攻撃であるMegatronを提案する。
効果的なトリガを生成するため、トランスフォーマーネットワークで使用される注意機構に基づいて2つの損失項をカスタマイズする。
CIFAR-10、GTSRB、CIFAR-100、Tiny ImageNetの実験はメガトロンの有効性を実証した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 04:39:41 GMT)
The Vizier Gaussian Process Bandit Algorithm [18.7] Google Vizierは、数百万の最適化を実行し、Googleの多くのリサーチとプロダクションシステムを加速した。
本稿では,Open Source Vizierが提供するデフォルトアルゴリズムの実装の詳細と設計選択について論じる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:31:39 GMT)
MANTA: A Large-Scale Multi-View and Visual-Text Anomaly Detection Dataset for Tiny Objects [18.7] 我々は、小さなオブジェクトに対する視覚的テキスト異常検出データセットであるMANTAを提案する。
ビジュアルコンポーネントは、典型的な5つのドメインにまたがる38のオブジェクトカテゴリにわたる137.3Kイメージを含む。
テキストコンポーネントは2つのサブセットで構成されており、共通の異常を記述した875の単語を含む宣言的知識と、様々な難易度で2Kの多重選択質問を提供する構成的学習である。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:01:10 GMT)
Dirac-Equation Signal Processing: Physics Boosts Topological Machine Learning [18.6] トポロジカル信号は、ネットワークのノードとエッジの両方に関連する変数または特徴である。
本稿では,ノードやエッジ上での真の信号を効率的に再構築するフレームワークであるDirac-equation Signal Processingを提案する。
実信号がディラック方程式の1つ以上の固有状態の非自明な線形結合である場合、ディラック方程式信号処理も効率的に利用できることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:38:58 GMT)
UniMLVG: Unified Framework for Multi-view Long Video Generation with Comprehensive Control Capabilities for Autonomous Driving [18.2] UniMLVGは、正確に制御された拡張ストリートマルチパースペクティブビデオを生成するために設計された統合フレームワークである。
トレーニングデータにシングルビューとマルチビューのドライビングビデオを統合することで、我々のアプローチは3段階にわたってクロスフレームとクロスビューのモジュールを更新する。
我々のフレームワークは、FIDが21.4%、FVDが36.5%の改善を実現している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:27:53 GMT)
PBDyG: Position Based Dynamic Gaussians for Motion-Aware Clothed Human Avatars [18.1] 本稿では,マルチビューRGBビデオから学習可能な,新しいヒューマンモデルを提案する。
本手法は, 物理シミュレーションにより, 動きに依存した布の変形を実現する。
実験により,本手法は外観を正確に再現するだけでなく,高度に変形可能な衣服を装着したアバターの復元も可能であることが示された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 22:51:43 GMT)
Deep Learning and Machine Learning: Advancing Big Data Analytics and Management with Design Patterns [18.0] この本は、ビッグデータ分析システムの開発、メンテナンス、スケーラビリティを最適化するための、古典的なソフトウェアエンジニアリングパターンの適用について説明している。
モデル管理、デプロイメント戦略、チームコラボレーションへの影響について、シングルトン、ファクトリ、オブザーバ、ストラテジーといった主要なデザインパターンを分析します。
このボリュームは、開発者、研究者、エンジニアにとって、マシンラーニングとソフトウェア設計の両方における技術的専門知識を強化するために不可欠なリソースである。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 06:59:09 GMT)
VASCAR: Content-Aware Layout Generation via Visual-Aware Self-Correction [17.5] 大規模言語モデル(LLM)は、構造記述言語を生成できるため、レイアウト生成に有効であることが証明されている。
近年,LLMプロバイダはこれらのモデルを大規模視覚言語モデル (LVLM) へと進化させ,多モーダル理解能力の顕著な向上を図っている。
LVLMに基づくレイアウト生成のためのビジュアル・アウェア・セルフコレクション・レイアウト・ジェネレーション(VASCAR)を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:16:57 GMT)
On the Generalization of Preference Learning with DPO [17.4] 大きな言語モデル(LLM)は目覚ましい能力を示してきたが、しばしば人間の好みに合わせるのに苦労している。
嗜好学習は、人間のフィードバックに基づいて、好ましくない反応と好ましくない反応を区別するモデルを訓練する。
本稿では、直接選好最適化(DPO)で訓練されたモデルの一般化保証を解析するための新しい理論的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:31:30 GMT)
Momentum-GS: Momentum Gaussian Self-Distillation for High-Quality Large Scene Reconstruction [17.1] 3D Gaussian Splattingは大規模なシーン再構築において顕著な成功を収めた。
しかし、高いトレーニングメモリ消費とストレージオーバーヘッドのため、課題は継続する。
本稿では,運動量に基づく自己蒸留を利用して,一貫性と精度を向上させる新しい手法であるMomentum-GSを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:31:12 GMT)
Consistent Spectral Clustering in Hyperbolic Spaces [16.8] 複雑なデータ構造を表現するために,ハイパーボリック空間上のスペクトルクラスタリングアルゴリズムを提案する。
このアルゴリズムはユークリッド空間におけるスペクトルクラスタリングと同程度の速度で収束することを示す。
この研究は、クラスタリングアルゴリズムで非ユークリッド空間を利用するための道を開く。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:00:26 GMT)
Decomposed Distribution Matching in Dataset Condensation [16.4] 最近の研究は、コストのかかる二段階最適化を回避した分布整合問題としてDCを定式化している。
本稿では,オリジナルデータとコンデンスデータのスタイル情報とを一致させる,シンプルで効果的な手法を提案する。
様々なサイズと解像度のデータセットを用いた実験により,本手法の有効性を実証する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 03:20:36 GMT)
Pretrained Optimization Model for Zero-Shot Black Box Optimization [16.4] 多様なタスクの最適化から得られた知識を活用する事前学習最適化モデル(POM)を提案する。
POMは、直接アプリケーションや数発のサンプルによる微調整を通じて、ゼロショット最適化の効率的なソリューションを提供する。
少数のサンプルと予算を持つ微調整POMは、大幅な性能改善をもたらす。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:55:26 GMT)
PADetBench: Towards Benchmarking Physical Attacks against Object Detection [16.3] 物体検出に対する物理的攻撃は、その重要な実践的意味から注目を集めている。
これらの課題に対処するため、現実的なシミュレーションを活用し、物理的攻撃を徹底的かつ厳密にベンチマークする。
私たちのベンチマークには、20の物理的攻撃方法、48のオブジェクト検出器、包括的な物理力学、評価指標が含まれています。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 06:41:47 GMT)
CALICO: Conversational Agent Localization via Synthetic Data Generation [15.6] 本稿では,対話エージェントの学習データをある言語から別の言語にローカライズするために,大規模言語モデル(LLM)を微調整する手法であるCALICOを提案する。
スロット(名前付きエンティティ)では、CALICOは動詞のコピー、リテラル翻訳、ローカライゼーションの3つの操作をサポートする。
本稿では,CALICOがより正確なスロット変換を生成するHTケースと,HLテストセットに近いローカライズされたスロットを生成するHLケースの両方で,最先端のlingUIST(文脈外リテラルスロット変換に依存している)を性能的に向上させることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 19:29:16 GMT)
Learning High-Degree Parities: The Crucial Role of the Initialization [15.5] 本稿では,通常のニューラルネットワーク上での勾配勾配降下に対して,学習性は初期重み分布に依存することを示す。
ほぼ完全なパリティの正の値は$sigma=O(d-1)$とされ、よりシャープなしきい値現象に関する疑問が指摘される。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:05:10 GMT)
Towards Effective GenAI Multi-Agent Collaboration: Design and Evaluation for Enterprise Applications [15.5] 本稿では,新しいマルチエージェント協調フレームワークにおける協調とルーティング機能に関する総合的な評価について述べる。
コーディネート機能として,エージェント間通信とペイロード参照機構の有効性を実証し,エンドツーエンドの目標達成率を90%とする。
マルチエージェントコラボレーションは,ベンチマークの単一エージェントアプローチと比較して,目標達成率を最大70%向上させる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 22:14:17 GMT)
Sensitive Content Classification in Social Media: A Holistic Resource and Evaluation [15.4] 6つのカテゴリにまたがるソーシャルメディアコンテンツモデレーションに適した統合データセットを提案しました。
これには、矛盾する言語、暴言、性的明示的な材料、薬物関連コンテンツ、自傷行為、スパムが含まれる。
この新たなデータセットを微調整した大規模言語モデルでは,市販のモデルに比べて検出性能が大幅に向上した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:41:53 GMT)
Espresso: High Compression For Rich Extraction From Videos for Your Vision-Language Model [15.3] エスプレッソ(Espresso)は、空間情報と時間情報を別々に抽出し、圧縮する手法である。
本研究では,エスプレッソにおける空間的・時間的圧縮が,長大な映像理解能力に肯定的な影響を与えることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:39:50 GMT)
What can we learn from quantum convolutional neural networks? [15.2] 量子データを利用したモデルが、隠れた特徴写像を通してどのように解釈できるかを示す。
量子位相認識の高性能は、臨界点における鋭い特徴を持つ非常に効果的な基底を生成することから生じる。
我々の分析は量子データを扱う際の一般化の改善を強調している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:29:27 GMT)
LiFT: Leveraging Human Feedback for Text-to-Video Model Alignment [15.1] 本稿では,T2Vモデルのアライメントにヒトのフィードバックを活用する新しい微調整手法LiFTを提案する。
我々は,報酬関数を効果的に学習するために,報酬モデルLiFT-Criticを訓練する。
最後に、学習した報酬関数を利用して、報酬重み付き確率を最大化し、T2Vモデルを整列する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 07:16:14 GMT)
KNN-MMD: Cross Domain Wi-Fi Sensing Based on Local Distribution Alignment [15.0] Wi-Fiセンシングは、家、オフィス、公共空間など様々な環境で広く応用されている。
チャネル状態情報(CSI)は環境の影響を強く受けており、小さな環境変化でさえCSIのパターンを大きく変えることができる。
我々は,K-Nearest Neearbors Maximum Mean Discrepancy (KNN-MMD)モデルを導入する。
ワンショットシナリオでは,4つのタスクでそれぞれ93.26%,81.84%,77.62%,75.30%の精度を実現している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:20:08 GMT)
Fair Diagnosis: Leveraging Causal Modeling to Mitigate Medical Bias [14.8] 医学画像解析では、モデル予測は人種や性別などのセンシティブな属性に影響される可能性がある。
本稿では,感度属性が診断予測に与える影響を低減することを目的とした因果モデリングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:59:36 GMT)
Flash Communication: Reducing Tensor Parallelization Bottleneck for Fast Large Language Model Inference [14.8] emphFlash Communicationは、推論時のテンソル並列通信ボトルネックを軽減するために設計された低ビット圧縮技術である。
提案手法は,ノード内通信速度を3倍以上に向上し,モデル精度を犠牲にすることなく2倍に向上する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:29:32 GMT)
A robust quantum nonlinear solver based on the asymptotic numerical method [14.7] 本稿では,新しい量子非線形解法である量子数値法を紹介する。
テイラー級数を用いて非線形問題を線形化することにより、量子アルゴリズムで解ける線形方程式の列に変換する。
クァフの超伝導量子プロセッサの実験を行い, 得られた非線形解路において最大98%の精度を達成できた。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:42:13 GMT)
An Efficient Loop and Clique Coarsening Algorithm for Graph Classification [14.6] 本稿では,GTアーキテクチャ上でのグラフ分類(LCC4GC)の線形複雑度を考慮した効率的なループおよび斜め粗大化アルゴリズムを提案する。
具体的には、完全な構造表現を学ぶために、オリジナル、粗い、変換の3つのユニークなビューを構築します。
8つの実世界のデータセットの実験では、さまざまなアーキテクチャから31のベースラインを越えるLCC4GCの改善が示されている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:37:55 GMT)
Pan-cancer Histopathology WSI Pre-training with Position-aware Masked Autoencoder [14.6] 設計した位置認識マスク付きオートエンコーダ(PAMA)を用いたパンカンサーWSIレベルの事前学習のための新しい自己教師型学習フレームワークを提案する。
その結果,差別性WSI表現学習とパン・カンサーWSI事前学習におけるPAMAの有効性と一般化が示された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 07:05:16 GMT)
Multi-Objective Alignment of Large Language Models Through Hypervolume Maximization [14.5] ハイパーボリュームを最大化する多様なLCMポリシーを学習するためのアルゴリズムHaMを提案する。
これはMOAHFへのa-posteriori MOOの最初の応用である。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 23:51:47 GMT)
Text to Blind Motion [14.4] 視覚障害者のための最初のマルチモーダル・モーション・ベンチマークであるBlindWaysを紹介した。
実際の都市環境では,11人の視覚障害者が8つの経路をナビゲートするウェアラブルセンサを用いて3Dモーションデータを収集する。
我々は、最先端の3D予測モデルをベンチマークし、既成および事前学習に基づく手法による性能の低下を見出した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:59:51 GMT)
Perturb-and-Revise: Flexible 3D Editing with Generative Trajectories [14.4] 既存の3D編集手法は、広範囲な幾何学的・外観的変化に苦しむ。
我々は、様々なNeRF編集を可能にするPerturb-and-Reviseを提案する。
Perturb-and-Reviseは3Dで色、外観、幾何学を柔軟、効果的、一貫した編集を容易にする。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:59:53 GMT)
Nonmyopic Global Optimisation via Approximate Dynamic Programming [14.4] 我々はIDWとRBFに基づくグローバルな最適化に適した新しい非筋力的獲得戦略を導入する。
具体的には、ロールアウトやマルチステップシナリオベースの最適化スキームを含む動的プログラミングベースのパラダイムを開発する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:25:00 GMT)
RNNs are not Transformers (Yet): The Key Bottleneck on In-context Retrieval [14.4] 長いシーケンスの処理においてメモリ効率が知られているRNNがトランスフォーマーの性能にマッチするかどうかを理解することに注力する。
重要なボトルネックは、Chain-of-Thought(CoT)であっても、RNNがコンテキストから情報を完全に取得できないことだ。
Retrieval-Augmented Generation (RAG) や単一トランスフォーマー層の追加など,RNNのコンテキスト内検索能力を向上する手法を採用することで,CoT によるリアルタイム解決可能な問題を解くことができることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 19:50:34 GMT)
LoFi: Vision-Aided Label Generator for Wi-Fi Localization and Tracking [14.3] 我々は、Wi-Fiのローカライゼーションとトラッキングのための視覚支援ラベル生成手法を提案する。
LoFiは2次元画像のみに基づいて地上の真理位置座標を生成することができる。
ESP32-S3とWebカメラを用いてWi-Fiトラッキングとローカライゼーションのデータセットも収集する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:32:25 GMT)
Enhancing low-temperature quantum thermometry via sequential measurements [14.1] 高精度な低温推定のためのシーケンシャルな測定プロトコルを提案する。
その結果, 相関出力は低温精度を著しく向上させた。
シーケンシャルプロトコル内の量子温度測定は、熱雑音の高分解能量子分光として機能する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:20:01 GMT)
Learning With Multi-Group Guarantees For Clusterable Subpopulations [14.0] 予測問題に対する標準的なデシプラタムは、パフォーマンス保証が人口よりも平均的に維持されるべきである。
しかし、意味のあるサブポピュレーションを構成するものは何だろうか?
個人の分布から自然に現れるクラスターに関して、関連するサブポピュレーションは定義されるべきである。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 19:31:44 GMT)
ByteScience: Bridging Unstructured Scientific Literature and Structured Data with Auto Fine-tuned Large Language Model in Token Granularity [14.0] ByteScienceは非営利のクラウドベースの自動車ファインチューニング大型言語モデル(LLM)プラットフォームである。
構造化された科学データを抽出し、巨大な科学コーパスから新しい科学知識を合成するように設計されている。
このプラットフォームは、少量の注釈付き記事で顕著な精度を達成している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:08:10 GMT)
On Borrowed Time -- Preventing Static Side-Channel Analysis [13.9] 敵は静的な状態で集積回路の漏れや応答の振る舞いを悪用する。
このクラスのメンバーには、静的パワーサイドチャネル解析(SCA)、レーザー論理状態イメージング(LLSI)、インピーダンス解析(IA)がある。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:56:52 GMT)
LLM-Enhanced Bayesian Optimization for Efficient Analog Layout Constraint Generation [13.9] 本稿では,アナログレイアウト合成のためのtexttLLANA フレームワークを提案する。
アナログ設計に依存したパラメータ制約をより効率的に生成するために、LLM(Large Language Models)の少数ショット学習能力を利用する。
その結果、textttLLANAは、最先端(SOTA)BO法に匹敵する性能を達成するだけでなく、アナログ回路設計空間をより効果的に探索できることを示した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 12:40:53 GMT)
From Principles to Practice: A Deep Dive into AI Ethics and Regulations [13.8] この記事では、欧州連合が提案する画期的なAI規制フレームワークについて、徹底的に分析する。
学術や産業がこれらの原則を守ろうとする技術的努力と戦略を考えると、我々は5つの倫理的原則の相乗効果と矛盾を探求する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 00:46:20 GMT)
Causal discovery with endogenous context variables [13.6] 本研究では,内因性文脈変数を持つシステムにおいて,制約に基づく文脈固有情報の因果発見の仮定について検討する。
マスクされたデータ上で異なるレギュレーショングラフを学習したり、すべてのデータをプールしたりといった、単純なアプローチは、非形式的な結果をもたらす可能性があることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 12:01:04 GMT)
Question Answering for Decisionmaking in Green Building Design: A Multimodal Data Reasoning Method Driven by Large Language Models [13.5] グリーンビルの設計における意思決定(DGBD)は、建築エネルギーコストの削減に不可欠である。
多くの研究がこの分野に人工知能(AI)の手法を適用している。
本研究は,大規模言語モデルをDGBDと革新的に統合し,マルチモーダルデータ推論のための問合せフレームワークであるGreenQAを作成する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 03:02:58 GMT)
Ltri-LLM: Streaming Long Context Inference for LLMs with Training-Free Dynamic Triangular Attention Pattern [13.3] 我々は,KVをスパンに分割し,それらをオフラインインデックスに格納し,関連するKVをメモリに格納するLtri-LLMフレームワークを提案する。
一般的な長文ベンチマークによる実験結果から,Ltri-LLMは効率のよいストリーミングベース推論を維持しつつ,FAに近い性能を達成できることがわかった。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 03:46:06 GMT)
How to Squeeze An Explanation Out of Your Model [13.2] 本稿では,モデルに依存しない解釈可能性のアプローチを提案する。
任意のモデルの分類レイヤーの前にSEブロックを含めることで、最も影響力のある特徴を検索することができる。
以上の結果から,新たなSEベースの解釈性は,画像およびビデオ/マルチモーダル設定の様々なモデルに適用可能であることがわかった。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:47:53 GMT)
BIAS: A Body-based Interpretable Active Speaker Approach [13.2] BIASは、音声、顔、身体情報を組み合わせて、様々な/混ざり合った状況で話者を正確に予測するモデルである。
その結果,BIASは身体的特徴が最重要となる困難な状況において最先端であることがわかった。
BIASの解釈可能性はまた、様々な設定でASD予測に関連性のある機能/アスペクトを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:08:09 GMT)
CigTime: Corrective Instruction Generation Through Inverse Motion Editing [12.9] ユーザの現在の動作(ソース)と所望の動作(ターゲット)が与えられた場合,ユーザを目標動作に導くためのテキスト命令を生成する。
我々は、大規模な言語モデルを利用して修正テキストを生成し、既存のモーション生成および編集フレームワークを利用する。
提案手法は,ユーザパフォーマンスを改善・改善するためのテキストベースのガイダンスを提供することにより,教育シナリオにおけるその効果を実証する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 22:57:36 GMT)
Incremental Sentence Processing Mechanisms in Autoregressive Transformer Language Models [12.9] LMにおける庭道文処理のメカニズムについて検討する。
多くの重要な特徴が構文構造に関連するが、いくつかは構文的に無関係なことを反映している。
ほとんどのアクティブな特徴は文の一読に対応しているが、ある特徴は他方に対応しており、LMが両方の可能性に重みを同時に割り当てていることを示唆している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:54:54 GMT)
eXpath: Explaining Knowledge Graph Link Prediction with Ontological Closed Path Rules [12.8] リンク予測(LP)は知識グラフ(KG)の完成には不可欠だが、一般的には解釈可能性の問題に悩まされる。
本稿では,KGにおけるLPモデルについて,経路に基づく説明を用いて説明する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:33:49 GMT)
Building a Family of Data Augmentation Models for Low-cost LLM Fine-tuning on the Cloud [12.7] モデル微調整の効率を大幅に向上するために,データ拡張モデル群を提案する。
これらのモデルは十分に小さなLLMに基づいて訓練され、推論コストの低い重要な機能をサポートする。
実験と応用研究は、我々のアプローチの有効性を証明した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:04:12 GMT)
Modality Decoupling is All You Need: A Simple Solution for Unsupervised Hyperspectral Image Fusion [12.6] ハイパースペクトル画像融合(HIF)は、低分解能ハイパースペクトル画像(LR-HSI)と高分解能マルチスペクトル画像(HR-MSI)を融合することを目的としている。
現在の方法は通常、2つのモダリティからの直接融合を有効な監督なしに適用する。
本研究では,HIF にモダリティデカップリングが不可欠であると仮定した,教師なし HIF に対する単純かつ効果的な解を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 06:22:43 GMT)
Adaptive Dropout for Pruning Conformers [12.6] 単位の保持確率は、バックプロパゲーションとGumbel-Softmax技術を用いて推定する。
提案手法は,LibriSpeechタスク上で音声認識実験を行うことで評価する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:05:02 GMT)
Stable Object Placement Planning From Contact Point Robustness [12.6] 我々のプランナーはまず接触点を選択し、次に選択した点をソリケートする配置ポーズを決定する。
本アルゴリズムは, 物体形状, 凸性, 質量密度の均一性に制約を加えることなく, 安定性を考慮した物体配置計画を容易にする。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 22:52:06 GMT)
ELBA: Learning by Asking for Embodied Visual Navigation and Task Completion [12.5] 本稿では,タスク完了のための追加情報を動的に取得するために,いつ,どの質問をするかを学習するELBA(Embodied Learning-By-Asking)モデルを提案する。
実験結果から,提案手法は質問応答能力のないベースラインモデルと比較して,タスク性能の向上を図っている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 00:13:04 GMT)
Translating C To Rust: Lessons from a User Study [12.5] Rustは、未使用のCプログラムが楽しむことのない保証として、プログラムの完全なメモリ安全性を提供することを目指している。
我々は,現実世界のCプログラムをRustに変換するよう人間に求めるユーザスタディについて報告する。
私たちの参加者は安全なRust翻訳を作成できますが、最先端の自動ツールではそうできません。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 04:14:08 GMT)
Beyond Boxes: Mask-Guided Spatio-Temporal Feature Aggregation for Video Object Detection [12.4] 本稿では、インスタンスマスク機能を活用することで、時間的特徴集約を強化する新しいVOD手法であるFAIMを提案する。
YOLOXをベース検出器として使用するFAIMは、イメージネットVIDデータセットの87.9%のmAPを、1つの2080Ti GPU上で33 FPSで達成している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:12:10 GMT)
On Interpreting the Effectiveness of Unsupervised Software Traceability with Information Theory [12.4] 教師なしトレーサビリティ手法は、しばしばテキストデータの中にトレーサビリティパターンが存在すると仮定する。
我々は、トレーサビリティリンクの情報性や信頼性を測定する指標として、自己情報、相互エントロピー、相互情報(MI)を導入している。
平均MIは4.81ビット、損失は1.75ビット、ノイズは0.28ビットであり、教師なしトレーサビリティ技術の有効性には情報理論上の限界があることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:29:29 GMT)
COBias and Debias: Minimizing Language Model Pairwise Accuracy Bias via Nonlinear Integer Programming [12.3] コンオッディティバイアス(COBias)として再認識することで、クラスごとの予測精度の不均衡に取り組む。
我々は,COBiasの低減と全体的な精度向上に向け,クラスごとのICLを補正するためのデバイアスプログラミング(DNIP)を提案する。
DNIPは従来のICLアプローチよりも大きなCOBias(27%)と精度改善(+12%)を同時に達成する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:04:55 GMT)
Stochastic Primal-Dual Three Operator Splitting Algorithm with Extension to Equivariant Regularization-by-Denoising [12.2] 本稿では,凸3成分最適化問題のクラスを解くために,TOS-SPDHG法を提案する。
エルゴディック$O (1/K)$収束率を示す理論的収束解析を行い,逆問題の画像化におけるアプローチの有効性を実証する。
また,事前学習したディープデノナイジングネットワークを先行として活用するために,レギュラー化・バイ・デノナイジングフレームワークを利用するTOS-SPDHG-REDとTOS-SPDHG-eREDを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:41:07 GMT)
A Differentially Private Kaplan-Meier Estimator for Privacy-Preserving Survival Analysis [12.1] 本稿では,遅延ノイズ,動的クリッピング,スムース化を施した新しいアルゴリズムを導入し,プライバシ保護型生存曲線を生成する。
NCCTG肺がんデータセットを用いて評価した結果,提案手法はルート平均二乗誤差(RMSE)を効果的に低減し,プライバシ予算全体にわたって精度を向上することが示された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:29:53 GMT)
Direct Quantized Training of Language Models with Stochastic Rounding [12.0] 本稿では,バックプロパゲーション中のストレートスルー推定器に頼ることなく,量子化低精度行列を直接更新する可能性について検討する。
LLaMA構造モデルによる実験結果から,3次値に制約された場合でも,低精度の重み付きトレーニングが実現可能であることが示唆された。
私たちのモデルは3次重みを使って推論も行えます。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:41:11 GMT)
Reconstructing Quantitative Cerebral Perfusion Images Directly From Measured Sinogram Data Acquired Using C-arm Cone-Beam CT [12.0] 現在の定量的灌流イメージングは、時間分解画像再構成と灌流パラメトリック推定という2つのカスケードステップを含む。
これらの2つの課題は、C-arm CBCTを用いて定量的に正確な灌流画像を得るのを防ぐことである。
現に開発された直接脳血流パラメトリック画像再構成技術であるTRAINERでは、定量的灌流画像は時間分解CTフォワードモデルの制約の下で訓練された主観的条件生成モデルとして表現されている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:42:50 GMT)
Unifying Dual-Space Embedding for Entity Alignment via Contrastive Learning [11.8] 知識グラフ(KGs)の内在的構造を維持するために二重空間埋め込みを統一するUniEAを提案する。
本手法は,構造型EAにおける最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:25:09 GMT)
Towards counterfactual fairness thorough auxiliary variables [11.8] 変数を動機とする新しい因果推論フレームワークEXOCを紹介する。
本フレームワークは, ファクトフェアネスに寄与する補助ノードと制御ノードを明示的に定義する。
合成および実世界のデータセットを用いて評価を行い,EXOCの優位性を検証した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 04:23:05 GMT)
ReF-LDM: A Latent Diffusion Model for Reference-based Face Image Restoration [11.7] 本稿では、1つのLQ画像と複数のHQ参照画像に条件付けされたHQ顔画像を生成するために設計されたLDMの適応であるReF-LDMを提案する。
我々のモデルは、生成プロセス中に参照画像を活用するために、効果的で効率的なメカニズムであるCacheKVを統合している。
最後に,20,405個の高品質な顔画像と対応する参照画像からなるデータセットであるFFHQ-Refを構築した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:49:10 GMT)
PropertyGPT: LLM-driven Formal Verification of Smart Contracts through Retrieval-Augmented Property Generation [11.4] PropertyGPTは包括的で高品質なプロパティを生成し、基礎的な真実と比べて80%のリコールを達成することができる。
PropertyGPTはテスト対象37件中26件のCVE/アタックインシデントを検出し、12件のゼロデイ脆弱性を発見した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:41:01 GMT)
Multi-Party Supervised Fine-tuning of Language Models for Multi-Party Dialogue Generation [11.3] 大規模言語モデル(LLM)は通常、ダイアディックや二者対話に参加するために微調整される。
本研究では,多人数対話データセットに基づくLLMのためのマルチパーティファインチューニングフレームワーク (MuPaS) を設計する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:33:47 GMT)
Iterative Methods for Vecchia-Laplace Approximations for Latent Gaussian Process Models [11.1] 本稿では,いくつかのプレコンディショナーを導入,解析し,新しい収束結果の導出を行い,予測分散を正確に近似する新しい手法を提案する。
特に、Coleskyベースの計算と比較すると、桁違いの高速化が得られる。
すべてのメソッドは、ハイレベルなPythonとRパッケージを備えたフリーのC++ソフトウェアライブラリで実装されている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:51:23 GMT)
Learning Partial Differential Equations with Deep Parallel Neural Operator [11.1] 新たな手法は、出力間のマッピングを近似する手段として演算子を学ぶことである。
物理科学の実践的な問題では、偏微分方程式の数値解は複雑である。
偏微分方程式の解法を効率よく正確に解くために,DPNO(Deep parallel operator model)を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:20:51 GMT)
SAMCL: Empowering SAM to Continually Learn from Dynamic Domains [11.0] Segment Anything Model (SAM)は、オープンな世界で、特に多種多様な動的ドメインにおいて、オブジェクトのセグメンテーションに苦労する。
本研究では,これらの課題に対処する新しいCS手法であるSAMCLを提案する。
SAMを動的ドメインにまたがるCS能力で強化する最初の研究である。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:05:50 GMT)
Exploring the Use of Drones for Taking Accessible Selfies with Elderly [10.7] 自撮りは人気のあるソーシャル・パステムであり、オンライン上でのソーシャル化の重要な部分である。
それにもかかわらず、セルフィーを撮る際にはアクセシビリティの問題がいくつかある。
我々は、ドローンの利用を提案し、ハンズフリー自撮りのための新しいコンセプトを提示した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:04:55 GMT)
ShadowHack: Hacking Shadows via Luminance-Color Divide and Conquer [10.6] シャドーは、画像の明るさの低減、テクスチャ劣化、色歪みなどの課題を導入する。
この研究はシャドウハック(ShadowHack)について述べる。シャドウハック(ShadowHack)は、これらの複雑さに対処し、元のタスクを輝度回復と色修復に分解する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 07:46:47 GMT)
Bayesian Parameter-Efficient Fine-Tuning for Overcoming Catastrophic Forgetting [10.6] 微調整性能を低下させることなく,我々の手法によって破滅的な忘れを克服できることを示す。
以上の結果から,Kronecker-factored approximation を用いることで,対角線よりも学習前の知識の保存性が向上することが示唆された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 23:18:31 GMT)
DHIL-GT: Scalable Graph Transformer with Decoupled Hierarchy Labeling [10.6] Graph Transformer(GT)は最近、グラフ構造化データ学習のための有望なニューラルネットワークアーキテクチャとして登場した。
DHIL-GTはスケーラブルなグラフ変換器で,グラフ計算を個別のステージに完全に分離することで,ネットワーク学習を簡略化する。
DHIL-GTは、大規模ベンチマーク上の既存のスケーラブルグラフ変換器の設計よりも、計算の高速化とミニバッチ能力の点で効率的である。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:59:01 GMT)
Enhancing LLMs for Impression Generation in Radiology Reports through a Multi-Agent System [10.5] RadCouncil(ラッドクンシル)は、発見部からの放射線学レポートにおける印象の生成を促進するために設計された多言語大言語モデル(LLM)フレームワークである。
RadCouncilは、(1)ベクターデータベースから類似のレポートを識別して検索するRetrievalエージェント、(2)所定のレポートの発見セクションに基づいて印象を生成するRadiologistエージェント、及び、検索エージェントが検索した先行レポートと、(3)生成されたインプレッションを評価し、フィードバックを提供するReviewerエージェントの3つの特殊エージェントから構成される。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:33:03 GMT)
Enhancing Zero-shot Chain of Thought Prompting via Uncertainty-Guided Strategy Selection [10.5] 本稿では,ゼロショット不確実性に基づく選択法(ZEUS)を提案する。
ZEUSは有用な質問と非効果的な質問の区別において高い感度を提供し、より正確で信頼性の高い選択を保証する。
我々の評価は、ZEUSが既存のCoT戦略を4つの挑戦的推論ベンチマークで一貫して上回っていることを示している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:24:47 GMT)
SLayR: Scene Layout Generation with Rectified Flow [10.4] SLayRはトークン空間上のレイアウト生成のための新しい変圧器ベースの整流モデルを提案する。
生成した画像の確立されたメトリクスが、その基盤となるシーンレイアウトを評価するために決定的でないことを示す。
従来より多種多様あるいは可算性に優れていた研究とは対照的に,本手法は両軸の両面において同時に良好に機能することを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 12:58:58 GMT)
LayerShuffle: Enhancing Robustness in Vision Transformers by Randomizing Layer Execution Order [10.4] 視覚変換器はテスト時に任意の層の実行順序に適応可能であることを示す。
また、ネットワークにおけるレイヤの位置に応じて、レイヤが異なるコントリビューションを学習することを示す。
分析の結果,ネットワークにおけるレイヤの位置に応じて,レイヤが異なるコントリビューションを学習できることが判明した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:20:26 GMT)
FAMES: Fast Approximate Multiplier Substitution for Mixed-Precision Quantized DNNs--Down to 2 Bits! [10.3] FAMESは混合精度DNNの高速近似乗算器置換法である。
我々の実験は、ビット幅が2ビット以下の最先端の混合精度量子化モデルに対して、平均28.67%のエネルギー削減を実証した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:18:13 GMT)
A*Net and NBFNet Learn Negative Patterns on Knowledge Graphs [10.2] ルールベースアプローチとNBFNetとA*Netアーキテクチャの知識グラフ補完に関する予測性能差について検討する。
最も一般的な2つのベンチマークでは、各データセット上の1つのユニークな負のパターンによって、パフォーマンス差のかなりの部分を説明することができる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:15:18 GMT)
QuickDrop: Efficient Federated Unlearning by Integrated Dataset Distillation [10.2] 学習を高速化するための効率的でオリジナルなFU手法であるQuickDropを紹介する。
QuickDropでは、各クライアントがDDを使用して、オリジナルのトレーニングデータセットを表すコンパクトなデータセットを生成する。
QuickDropは、既存のFUアプローチと比較して、スクラッチからのモデル再トレーニングと65.1倍の学習期間を463.8倍に短縮することを示した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:11:19 GMT)
LinVT: Empower Your Image-level Large Language Model to Understand Videos [10.2] 大規模言語モデル(LLM)は様々なタスクで広く使われている。
我々は、任意の訓練された画像ベースのLCMをビデオLLMに変換するモジュールを提案する。
我々はLinVTをAquila, Blip-3, InternVL2, Mipha, Molmo, Qwen2-VLの6つのビジュアルLLMでベンチマークした。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:04:42 GMT)
GameGen-X: Interactive Open-world Game Video Generation [10.0] 我々は,オープンワールドゲームビデオの生成とインタラクティブ制御に特化して設計された,最初の拡散トランスフォーマーモデルであるGameGen-Xを紹介する。
革新的なキャラクター、動的環境、複雑なアクション、多様なイベントなど、一連のゲームエンジン機能をシミュレートする。
インタラクティブな制御性を提供し、現在のクリップに基づいたコンテンツの予測と将来的な変更を可能にし、ゲームプレイシミュレーションを可能にする。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:09:43 GMT)
Parametric-ControlNet: Multimodal Control in Foundation Models for Precise Engineering Design Synthesis [9.9] 本稿では,テキストから画像への基礎的な生成AIモデルに対する,安定拡散のようなマルチモーダル制御のための生成モデルを提案する。
本モデルは,設計精度と多様性を高めるために,パラメトリック,イメージ,テキスト制御のモダリティを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:40:10 GMT)
BodyMetric: Evaluating the Realism of Human Bodies in Text-to-Image Generation [9.9] BodyMetricは、画像の身体リアリズムを予測する学習可能なメトリックである。
BodyMetricは、これまで大規模に利用できなかったアプリケーションを通じてデモします。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:00:39 GMT)
Does Deep Active Learning Work in the Wild? [9.7] 深層能動学習(DAL)法は, 単純なランダムサンプリングに比べて, サンプル効率が著しく向上した。
ここでは、現実世界の環境では、あるいは荒野では、良質なHPに関してかなりの不確実性があることを論じる。
8つのベンチマーク問題に対して,11種類のDAL手法の性能評価を行った。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 04:51:31 GMT)
Contrastive Sequential-Diffusion Learning: Non-linear and Multi-Scene Instructional Video Synthesis [9.7] 本稿では,最も適切なシーンを選択して,次のシーンの復調過程をガイドし,条件付けするコントラッシブ・シーケンシャルな映像拡散手法を提案する。
実世界の行動中心データを用いた実験は、過去の研究と比較して、我々のモデルの実用性と一貫性を実証し、改善した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 19:52:46 GMT)
Optimizing Quantum Communication for Quantum Data Centers with Reconfigurable Networks [9.3] 我々は、クロスラック通信の並列化と頻繁な再設定を避けるために、新しい最適化空間を導入する。
提案手法は,全体のレイテンシを8.02倍に削減し,キュービットのデコヒーレンスを緩和する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:07:26 GMT)
CUE-M: Contextual Understanding and Enhanced Search with Multimodal Large Language Model [9.2] 本稿では,新しいマルチモーダル検索フレームワークであるMLLM (CUE-M) について述べる。
マルチモーダルなQ&Aデータセットとパブリックセーフティベンチマークによる評価は、CUE-Mが精度、知識統合、安全性のベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:43:58 GMT)
SMIC: Semantic Multi-Item Compression based on CLIP dictionary [9.2] 最近のセマンティック圧縮スキームは基盤モデルCLIPに依存している。
このような手法を画像収集圧縮に拡張し、コーディングフェーズ中に中間冗長性を考慮する。
また,学習した辞書はセマンティックな性質を持ち,画像のセマンティックな内容のセマンティックなプロジェクタとして機能することを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:39:36 GMT)
SwiftDiffusion: Efficient Diffusion Model Serving with Add-on Modules [9.2] 拡散モデルを使用したテキスト・ツー・イメージ(T2I)生成は、今日のAIクラウドにおけるブロックバスターサービスとなっている。
プロダクションT2Iサービスは一般的に、さまざまな"アドオン"モジュールでベース拡散モデルを拡張したサービスワークフローを伴います。
我々は、総合的なアプローチでT2Iワークフローを効率的に提供するシステムであるSwiftDiffusionを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:47:06 GMT)
Searches for exotic spin-dependent interactions with spin sensors [9.1] 多くの理論は、粒子物理学の標準モデルを超えて、エキゾチックなスピン依存相互作用の存在を仮定している。
スピンベースの量子センサーは、測定精度を高めるためにスピンの量子特性を利用する。
スピンベースのセンサーは、超高感度、コンパクトなテーブルトップデザイン、費用対効果で際立っている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 04:07:53 GMT)
Hallucination Detection in LLMs: Fast and Memory-Efficient Fine-Tuned Models [9.1] 大規模言語モデル(LLM)は近年人気が高まっているが、幻覚の対象となっている。
LLMアンサンブルの高速かつメモリフレンドリーな学習を可能にする新しい手法を提案する。
結果として得られるアンサンブルは幻覚を検知でき、訓練や推論に1つのGPUしか必要としないため、現実的なアプローチであることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 12:39:00 GMT)
Graph Neural Networks for Job Shop Scheduling Problems: A Survey [9.1] ジョブショップスケジューリング問題(JSSP)は、重要な最適化問題である。
近年、JSSPの解決にグラフニューラルネットワーク(GNN)の適用が急速に増加しているのを目撃している。
本稿では,様々な種類のJSSPに対するGNN手法と,それに密接に関連するフローショップスケジューリング問題について,徹底的に検討することを目的とする。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:18:37 GMT)
URVFL: Undetectable Data Reconstruction Attack on Vertical Federated Learning [9.0] 既存の悪意のある攻撃は、基礎となるVFLトレーニングタスクを変化させ、受信した勾配と正直なトレーニングで受け取った勾配を比較することで容易に検出できる。
我々は,電流検出機構を回避する新しい攻撃戦略であるURVFLを開発する。
包括的実験により、URVFLは既存の攻撃を著しく上回り、悪意のある攻撃に対するSOTA検出方法を回避することに成功した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:14:15 GMT)
I Dream My Painting: Connecting MLLMs and Diffusion Models via Prompt Generation for Text-Guided Multi-Mask Inpainting [8.9] 塗装は、画像の欠落した領域や破損した領域を埋めて、周囲のコンテンツやスタイルとシームレスにブレンドすることに焦点を当てている。
本稿では,異なるプロンプトを用いて複数の領域を同時に塗布するマルチマスク塗装の新たな課題を紹介する。
私たちのパイプラインは、創造的で正確なインペイント結果を提供します。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:58:53 GMT)
Equivariant Denoisers for Image Restoration [8.9] 等変復号器と最適化に基づいて,等変正規化(ERED)と呼ばれる統一フレームワークを提案する。
本稿では,このアルゴリズムの収束性を分析し,その実用性について論じる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:22:00 GMT)
BESSTIE: A Benchmark for Sentiment and Sarcasm Classification for Varieties of English [8.8] BESSTIEは、オーストラリア(en-AU)、インド(en-IN)、イギリス(en-UK)の3種類の英語に対する感情と皮肉の分類のベンチマークである。
位置に基づくフィルタリングとトピックに基づくフィルタリングという2つの手法を用いて,これらの言語品種のデータセットを収集する。
言語変異のネイティブ話者は、感情ラベルと皮肉ラベルでデータセットを手動で注釈付けする。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:34:40 GMT)
WRF-GS: Wireless Radiation Field Reconstruction with 3D Gaussian Splatting [8.6] WRF-GSは3次元ガウススプラッティングを用いた無線放射場(WRF)再構成に基づくチャネルモデリングのための新しいフレームワークである。
少数の測定で、WRF-GSは与えられたシーンに対してミリ秒以内に新しい空間スペクトルを合成できる。
WRF-GSは、チャネル状態情報予測タスクにおいて、既存の手法を2.43dB以上のマージンで上回り、優れた性能を達成する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 07:56:14 GMT)
Is Your Paper Being Reviewed by an LLM? Investigating AI Text Detectability in Peer Review [8.6] 既存のAIテキスト検出アルゴリズムが人間の書いたピアレビューと最先端のLLMを区別する能力について検討する。
分析の結果,既存の手法では,多くの GPT-4o 書面レビューを偽陽性分類を発生させることなく識別できないことがわかった。
偽陽性分類の低レベルにおけるGPT-4o書評の同定において,既存の手法を超越した新たな検出手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:23:53 GMT)
An end-to-end attention-based approach for learning on graphs [8.6] グラフ上で学習するためのトランスフォーマーベースのアーキテクチャは、効果的な学習メカニズムとして注目によって動機付けられている。
本稿では,エンコーダとアテンションプーリング機構を組み合わせた,純粋に注意に基づくアプローチを提案する。
その単純さにもかかわらず、このアプローチは微調整されたメッセージパッシングベースラインよりも優れており、最近70以上のノードとグラフレベルのタスクでトランスフォーマーベースのメソッドが提案されている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:44:46 GMT)
Non-Hermitian Generalization of Rayleigh-Schrödinger Perturbation Theory [8.5] 我々は、レイリー=シュリンガー摂動理論を幾何学的形式主義を用いて非エルミート制に一般化する。
本論文で提案する摂動法は,エルミート系における標準レイリー・シュレーディンガー摂動理論に還元される。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:30:19 GMT)
Towards Understanding the Role of Sharpness-Aware Minimization Algorithms for Out-of-Distribution Generalization [8.2] シャープネス認識(SAM)は、シャープネスを最小化することによって一般化を改善するための有望な方法として登場した。
我々は SAM をout-of-distribution (OOD) 一般化のために研究する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:41:44 GMT)
Statistical Mechanics of Support Vector Regression [8.1] 我々は、$varepsilon$-insensitive Support Vector Regression(varepsilon$-SVR)の平均ケース学習曲線について検討する。
解析の結果, 臨界負荷時のトレーニング誤差の位相遷移が明らかとなり, 許容パラメータ$varepsilon$とニューラルバリアビリティの相互作用を捉えることができた。
理論予測は玩具モデルとディープニューラルネットワークの両方で検証される。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:48:00 GMT)
Code generation and runtime techniques for enabling data-efficient deep learning training on GPUs [8.0] この論文は、特にグラフニューラルネットワーク(GNN)と大規模言語モデル(LLM)において、代表的深層学習タスクにおけるデータ非効率を解析する。
これらの課題を軽減し、PyTorchスタック内でこれらの最適化をシームレスに実装するための、新しいランタイムとコード生成技術を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 03:20:03 GMT)
Who Speaks Next? Multi-party AI Discussion Leveraging the Systematics of Turn-taking in Murder Mystery Games [7.9] 本研究では,会話分析における隣接対やターンテイクといった会話規範に着目した。
本稿では,AIエージェントの対話制御にこれらの規範を適用した"Murder Mystery Agents"という新しいフレームワークを提案する。
提案フレームワークは、隣接ペアと自己選択機構に基づいて、次の話者選択を統合する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:45:54 GMT)
Quantum-hydrodynamic modal perspective on plasmonic gap structures [7.7] プラズモニックギャップ構造は、極端に光を閉じ込めることのできる数少ない構成の一つである。
プラズモニック反応は、ギャップサイズが0に近づくにつれて、劇的な量子効果駆動の遷移を行う。
ここでは、量子流体力学理論(QHT)に基づく準正規モード(QNM)解析を用いて、プラズモン応答の遷移について、新しいモーダル視点を提供する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 06:26:29 GMT)
PanoDreamer: 3D Panorama Synthesis from a Single Image [7.7] PanoDreamerは、単一の入力画像からコヒーレント360$circ3Dシーンを作成するための新しい方法である。
この問題を単一画像パノラマと深度推定とみなす。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 07:42:48 GMT)
Multi-Armed Bandit Approach for Optimizing Training on Synthetic Data [7.6] 動的ユーザビリティ指標と組み合わせた UCB ベースのトレーニング手法を提案する。
提案手法は,合成画像と対応する実・合成データセットからの低レベル・高レベル情報を統合する。
提案手法は, ユーザビリティに基づいて, 合成画像のランク付けに有効な方法であることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 23:36:36 GMT)
Enhancing Medical Image Segmentation with Deep Learning and Diffusion Models [7.5] 正確な臨床診断には医用画像分割が不可欠である。
病変と正常な組織とのコントラストの低さ、境界の曖昧さ、患者間の高いばらつきといった課題に直面している。
ディープラーニングはセグメンテーションの精度と効率を改善したが、それでも専門家のアノテーションに大きく依存している。
本稿では,医療画像のセグメンテーションの重要性,現在のディープラーニングアプローチの限界,これらの課題に対処するための拡散モデルの可能性について論じる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:27:43 GMT)
Ranking Narrative Query Graphs for Biomedical Document Retrieval (Technical Report) [7.5] 本稿では,生物医学領域における既存のグラフベースの発見システムを拡張する。
グラフベースの非教師付きランキング手法、新しいクエリ緩和パラダイム、存在論的書き換えに寄与する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 12:49:28 GMT)
Metamemory: Exploring the Resilience of Older Internal Migrants [7.5] メタデータ調査と半構造化面接を用いて,高齢者の社会適応に直面する課題について検討した。
以上の結果から,高齢移民の顕著なレジリエンス,特に思い出の顕著さが浮き彫りとなった。
これは、高齢者の内的移民の思いやりを高めること、メタバースの肯定的な可能性を活用すること、そして将来における高齢者の内的移民の懸念により効果的に対処するための戦略を考案することを促進することを目的としている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:21:52 GMT)
GS-Matching: Reconsidering Feature Matching task in Point Cloud Registration [7.3] 本稿では,Gale-ShapleyアルゴリズムにインスパイアされたGSマッチング方式を提案する。
提案手法は, 高い重なり合い条件下で効率よく動作し, より非反復的不整合を求めることができる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:47:14 GMT)
Estimating the treatment effect over time under general interference through deep learner integrated TMLE [7.3] DeepNetTMLE(DeepNetTMLE)は,ディープラーニングによる最大等量推定(TMLE)手法である。
DeepNetTMLEは、一般的な干渉の下で、時間によって変化する共同創設者のバイアスを軽減する。
我々は,DeepNetTMLEが,反実推定においてより低いバイアスとより正確な信頼区間を実現することを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 06:09:43 GMT)
Optimally Fast Qubit Reset [7.3] 任意のリセット速度に対する最小熱力学的コストと最適プロトコルを決定する。
以上の結果から,超音速ボソニック熱浴はクビットリセットに適した選択肢であることが示唆された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:25:13 GMT)
Long-Range Four-body Interactions in Structured Nonlinear Photonic Waveguides [7.1] 線形光学材料以外の多光子力学は、量子情報処理において重要である。
我々は,光子-光子相互作用の存在下での非線形導波路の構造を理論的に提案する。
本研究により, 構造化非線形導波路QEDを多体量子情報処理に適用する方法について検討した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 06:26:19 GMT)
'Debunk-It-Yourself': Health Professionals' Strategies for Responding to Misinformation on TikTok [7.0] ソーシャルメディアプラットフォームは、情報提供者として信頼を維持する責任を負っている。
解釈の問題として、プラットフォームはこの責任を十分に満たさず、危険な健康上の誤報が多くのユーザーに影響を与えることを許している。
我々はTikTokのビデオを通じて誤情報対策キャンペーンを行う14名の健康専門家を探索調査した。
ユーザ自身による誤情報の影響に対して,構造化された応答を推奨する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 12:52:18 GMT)
Exploring the Manifold of Neural Networks Using Diffusion Geometry [7.0] ニューラルネットワークの隠蔽層表現間の距離を導入することにより,データポイントがニューラルネットワークである多様体を学習する。
これらの距離は非線形次元減少アルゴリズムPHATEに供給され、ニューラルネットワークの多様体を生成する。
解析の結果,高い性能のネットワークが一貫した埋め込みパターンを表示できることがわかった。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 22:04:55 GMT)
Uncertainty-aware retinal layer segmentation in OCT through probabilistic signed distance functions [6.8] オプティカルコヒーレンス・トモグラフィー(OCT)スキャンにおける不確実性認識網膜層セグメンテーションの新しいアプローチを提案する。
本手法は、レベルセットを介して網膜層形状を効果的にパラメータ化する符号付き距離関数(SDF)を予測することにより、セグメンテーションを洗練する。
これにより、あいまいな入力、撮像ノイズ、信頼できないセグメンテーションが存在する場合でも、網膜層の堅牢な表現が保証される。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:44:11 GMT)
Grand Challenges in Immersive Technologies for Cultural Heritage [6.7] 没入型技術の統合は、文化遺産の提示方法を変えてきた。
これらのテクノロジの採用は、さまざまな課題や潜在的なリスクをもたらします。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:07:12 GMT)
Zephyr quantum-assisted hierarchical Calo4pQVAE for particle-calorimeter interactions [6.5] モンテカルロシミュレーションに大きく依存している既存のアプローチは、年間数百万のCPUを必要とすると予測されている。
このボトルネックは、深い生成モデルと量子シミュレーションを統合することにより、計算物理学の進歩にエキサイティングな機会を与える。
本稿では,変分オートエンコーダ(VAE)と,モデルの潜在空間に予め埋め込まれたエネルギー条件付きボルツマンマシン(RBM)を組み合わせた量子支援型階層型深部生成サロゲートを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 00:23:12 GMT)
PerfGen: Automated Performance Benchmark Generation for Big Data Analytics [6.5] 計算スキュー、データスキュー、メモリスキューなど、ビッグデータ分析における性能低下の多くの症状が入力に依存する。
PerfGenはパフォーマンステストのためにインプットを自動的に生成するように設計されている。
PerfGenは、パフォーマンスの症状を誘発するインプットを生成する場合、従来のファジングアプローチと比較して、少なくとも11倍のスピードアップを達成する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 00:58:20 GMT)
Local and Global Feature Attention Fusion Network for Face Recognition [6.5] 本稿では,特徴量に基づく地域的・グローバルな特徴注意融合(LGAF)ネットワークを提案する。
ネットワークは特徴品質に応じて局所特徴とグローバル特徴の注意を適応的に割り当て、より差別的で高品質な顔特徴を得る。
実験の結果、LGAFは4ドルの検証セットで最高の平均性能を達成していることがわかった。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:32:23 GMT)
EvTTC: An Event Camera Dataset for Time-to-Collision Estimation [6.5] EvTTCは、高速シナリオ下でのTTCタスクに焦点を当てた最初のマルチセンサーデータセットである。
実験検証とデータ拡張のための小型TTCテストベッドを提供する。
テストベッドのすべてのデータと設計はオープンソースであり、ビジョンベースのTTC技術の開発を促進するベンチマークとして機能する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:08:08 GMT)
Automated, Unsupervised, and Auto-parameterized Inference of Data Patterns and Anomaly Detection [6.5] RIOLUは完全に自動化され、自動的にパラメータ化され、ラベル付きサンプルを必要としない。
RIOLUはさまざまな領域のデータセットから正確なパターンを生成することができ、高いF1スコアは97.2%である。
RIOLUの派生版は、ユーザーガイダンスによってさらに精度を高め、F1では最大37.4%改善されている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:18:26 GMT)
DIFEM: Key-points Interaction based Feature Extraction Module for Violence Recognition in Videos [6.4] そこで本研究では,人間の骨格キーポイントを有効利用して暴力の性質を捉える手法を提案する。
我々の手法の核心は、速度や関節交叉といった特徴を捉える新しい動的相互作用特徴抽出モジュール(DIFEM)である。
DIFEMによって抽出された特徴により、ランダムフォレスト、決定木、AdaBoost、k-Nearest Neighborといった様々な分類アルゴリズムが使用されている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 19:25:47 GMT)
Automatic Tongue Delineation from MRI Images with a Convolutional Neural Network Approach [6.3] 本稿では,U-Net自己エンコーダ畳み込みニューラルネットワークを用いて,舌の自動デライン化を行った。
実時間磁気共鳴画像と手動で1ピクセル幅の輪郭を入力として使用した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:49:24 GMT)
Comparing ImageNet Pre-training with Digital Pathology Foundation Models for Whole Slide Image-Based Survival Analysis [6.2] このタスクのために提案された複数のマルチインスタンス学習フレームワークは、自然言語で事前トレーニングされたResNet50バックボーンを使用している。
私たちのコードは受理時に公開されます。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:20:05 GMT)
Electromagnetic Scattering Kernel Guided Reciprocal Point Learning for SAR Open-Set Recognition [6.2] Open Set Recognition (OSR)は、未知のクラスを「未知」と表現しながら、既知のクラスを分類することを目的とする。
オープンセットSAR分類を強化するために,相互学習ネットワークを用いた散乱カーネルと呼ばれる手法を提案する。
大規模属性散乱中心モデルに基づく畳み込みカーネルの設計を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:31:56 GMT)
Reinforcement Learning: An Overview [6.1] この写本は、(深い)強化学習とシーケンシャルな意思決定の分野を概観している。
価値ベースのRL、ポリシーのグラディエントなメソッド、モデルベースのメソッド、その他さまざまなトピックをカバーしています。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:53:49 GMT)
Streaming Deep Reinforcement Learning Finally Works [6.1] ストリーミング学習は、リソース制限、通信制限、プライバシに敏感なアプリケーションに理想的だ。
深いRLでは、学習者はたいてい、バッチ更新とバッファの再生を使い、計算コストが高く、ストリーミング学習と互換性がない。
本稿では,バッチRLの予測と制御の両面において,ストリームバリアを克服し,サンプル効率にマッチするストリーム-xアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 00:55:36 GMT)
Relevance for Human Robot Collaboration [6.0] 本稿では,新しい概念とシーン理解的アプローチ「関連性」を紹介する。
そこで我々は,関連性判定を選択的にトリガするイベントベースフレームワークを開発した。
実世界のデモでは、人間を日々のタスクでインテリジェントに支援する関連フレームワークの能力が紹介されている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:41:37 GMT)
NeuroNAS: A Framework for Energy-Efficient Neuromorphic Compute-in-Memory Systems using Hardware-Aware Spiking Neural Architecture Search [6.0] スパイキングニューラルネットワーク(SNN)は、超低電力/エネルギー消費で多様な機械学習タスクを解く能力を実証している。
SNN推論の性能と効率を最大化するために、Compute-in-Memory(CIM)ハードウェアアクセラレータが採用されている。
我々はエネルギー効率の良いニューロモルフィックCIMシステムを開発するための新しいフレームワークであるNeuroNASを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:35:27 GMT)
Reuse-Aware Compilation for Zoned Quantum Architectures Based on Neutral Atoms [6.0] ゾーンアーキテクチャのためのスケーラブルなコンパイラZACを提案する。
ZACは、クォービット再利用でゾーン間のデータの移動オーバーヘッドを最小限にする。
ZACはモノリシックアーキテクチャに比べて22倍の忠実性向上を実現している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 20:42:58 GMT)
DEYOLO: Dual-Feature-Enhancement YOLO for Cross-Modality Object Detection [5.9] 照明の悪い環境での物体検出は、通常RGB画像でははっきりと見えないため、難しい作業である。
本稿では,デュアルエンハンスメントに基づくオブジェクト検出ネットワークDEYOLOを提案する。
提案手法は,SOTAオブジェクト検出アルゴリズムよりも明確なマージンで優れている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:39:11 GMT)
Memory-efficient Continual Learning with Neural Collapse Contrastive [5.8] コントラスト学習は表現品質を大幅に改善し、連続学習(CL)におけるタスク間の知識伝達を高めた
しかし、対照的な手法は主にサンプル間の「ソフトな関係」や「ソフトな関係」に焦点を当てているため、破滅的な忘れは依然として重要な課題である。
本稿では,ソフトな関係とハードな関係を効果的にバランスさせる新しい表現学習損失であるFNC2を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:38:02 GMT)
Establishing Software Engineering Design Competence with Soft Skills [5.8] カナダのソフトウェア工学プログラムに入学した高校生のための工学デザインコースが開発されている。
コースの目的は、現実的なデザイン体験を提供すること、学生を業界文化に紹介すること、タイムマネジメントスキルの向上、技術的、知的に挑戦すること、コミュニケーションスキルの向上、学生レベルの専門性の向上、ソフトスキルの強化、ソフトウェアエンジニアリングにおけるヒューマンファクタの認識の向上である。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:17:51 GMT)
Knowledge-Based Deep Learning for Time-Efficient Inverse Dynamics [5.8] 時間効率逆動的解析のための知識に基づくディープラーニングフレームワークを提案する。
BiGRUニューラルネットワークは、時系列データの巧妙なハンドリングのため、我々のモデルのバックボーンとして選択される。
実験結果から、選択したBiGRUアーキテクチャは、特別に設計された損失関数を用いてトレーニングされた場合、他のニューラルネットワークモデルよりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 20:12:52 GMT)
COOOL: Challenge Of Out-Of-Label A Novel Benchmark for Autonomous Driving [5.8] リスク検出のための新しいデータセットを導入し、様々なタスクに適用可能な多目的評価指標を提供する。
COOOLは200以上のダッシュカム指向のビデオコレクションで構成されており、人間のラベル付け者が関心のあるオブジェクトを識別するために注釈を付けている。
データセットのサイズとデータの複雑さのため、COOOLは評価ベンチマークとしてのみ機能する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 23:01:33 GMT)
Unsupervised Segmentation by Diffusing, Walking and Cutting [5.7] 本稿では,事前学習したテキスト・画像拡散モデルの特徴を用いた教師なし画像分割手法を提案する。
重要な洞察は、自己アテンション確率分布は、画像を横断するランダムウォーキングの遷移行列として解釈できることである。
提案手法は,COCO-Stuff-27およびCityscapesにおける非教師なしセグメンテーションの既存手法を全て超越し,最先端の結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 00:23:18 GMT)
Integrating Semantic Communication and Human Decision-Making into an End-to-End Sensing-Decision Framework [5.6] 本稿では,意味コミュニケーションとヒューマン意思決定(HDM)を1つの確率的エンドツーエンドセンシング決定フレームワークに統合することを提案する。
本研究は,HDMモデルを用いた意味コミュニケーションの設計・相互作用に関する新たな知見を提供する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:01:19 GMT)
Constructing optimal treatment length strategies to maximize quality-adjusted lifetimes [5.5] 品質調整寿命を最大化するために最適な治療長戦略を構築する方法を提案する。
生存率に対する最適な治療戦略を推定する既存の方法は、情報検閲による品質調整の寿命には適用できない。
筋萎縮性側索硬化症に対する内視鏡的腹腔内挿術の至適時間について検討した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:09:17 GMT)
Granular Ball K-Class Twin Support Vector Classifier [5.5] グラニュラーボールKクラスツインサポートベクトル(GB-TWKSVC)
GB-TWKSVCは、Twin Support Vector Machinesとグラニュラーボールコンピューティングを組み合わせた、新しいマルチクラス分類フレームワークである。
その結果、GB-TWKSVCは、パターン認識、障害診断、大規模データ分析を含む領域で広く適用可能であることが示された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:47:49 GMT)
MTSpark: Enabling Multi-Task Learning with Spiking Neural Networks for Generalist Agents [5.3] 本稿では,スパイクネットワークを用いたマルチタスクRLを実現する新しい手法MTSparkを提案する。
具体的には、タスク固有のコンテキスト信号を活用することで、アクティブなデンドライトとデュエル構造を備えたディープスパイキングQ-ネットワーク(DSQN)を開発する。
実験の結果,MTSparkは最先端のタスクよりも高いパフォーマンスで複数のタスクを効果的に学習できることがわかった。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:35:33 GMT)
Bayesian quantum estimation of the separation of two incoherent point sources [5.3] 我々は、量子ベイズの観点から、任意に閉じた2つの不整合点源の分離に関する推定問題に対処する。
散逸した半ガウスのPDFでは、SPADEと直接撮像(DI)の性能とベイズ平均二乗誤差を比較した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:24:41 GMT)
Predictive Window Decoding for Fault-Tolerant Quantum Programs [5.3] リアルタイムデコーディングは、将来のフォールトトレラント量子システムにおいて重要な要素である。
ウィンドウ化されたデコード方式では、いくつかのデコードタスクは、他のタスクが完了するまで遅らせる必要がある。
本稿では,従来のコンピュータアーキテクチャにおける分岐予測から着想を得た投機的ウィンドウデコーディング手法を提案する。
従来の並列ウィンドウデコーダと比較すると,アプリケーションの実行時間を平均40%削減できるという憶測がある。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:17:18 GMT)
Acquired TASTE: Multimodal Stance Detection with Textual and Structural Embeddings [5.2] スタンス検出は、談話解析から偽ニュースの拡散の追跡、科学的事実の否定まで、幅広い下流の応用を可能にする上で重要な役割を担っている。
TASTEは、トランスフォーマーベースのコンテンツ埋め込みと教師なし構造埋め込みを調和して融合する、スタンス検出のためのマルチモーダルアーキテクチャである。
TASTEは、一般的なベンチマークで最先端の結果を達成し、強力なベースラインの配列を著しく上回っている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:43:00 GMT)
Memorization With Neural Nets: Going Beyond the Worst Case [5.0] 実際には、ディープニューラルネットワークはトレーニングデータを簡単に補間できることが多い。
本稿では、3層ニューラルネットワークを時間内に補間する単純なランダム化アルゴリズムを提案する。
サンプル数に依存しない保証を得るため、最悪の記憶能力限界を超えて移動します。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:48:43 GMT)
It's Quick to be Square: Fast Quadratisation for Quantum Toolchains [5.0] 我々は、高次表現の特定のクラス、すなわち制約のないバイナリ問題を考える。
我々は、新しい自動変換機構を広く使われている非制約バイナリ最適化問題に考案する。
また、トランスフォーメーションプロセスにおいて、低レベルの詳細がどのような影響要因を抽象化できるかを識別する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:56:33 GMT)
OSS License Identification at Scale: A Comprehensive Dataset Using World of Code [5.0] 本研究では,オープンソースソフトウェア(OSS)ライセンスの再利用と包括的データセットを提案する。
OSSプロジェクトで550万の異なるライセンスブロブを発見し、特定しました。
データセットはオープンで、OSSコミュニティの開発者、研究者、法律専門家に貴重なリソースを提供する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:04:07 GMT)
SJTU:Spatial judgments in multimodal models towards unified segmentation through coordinate detection [4.9] 本稿では,マルチモーダルモデルにおける空間的判断 -コーディネート検出による統一を目指して-
マルチモーダル空間における空間推論を通した視覚言語モデルとのセグメンテーション手法の統合手法を提案する。
ベンチマークデータセット間で優れたパフォーマンスを示し、COCO 2017では0.5958、Pascal VOCでは0.6758、IoUスコアを達成しました。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 07:08:56 GMT)
GRAND : Graph Reconstruction from potential partial Adjacency and Neighborhood Data [4.9] セキュアなマルチパーティ計算のような暗号手法は、各参加者のデータに集中することなく、分散グラフの機能のセキュアな計算に使用できる。
本稿では,グラフの隣接行列を再構成する手法を提案する。
共役行列のみを観測する2つの逆数モデルと、元のグラフの部分的知識を持つ知識のある2つのモデルを考える。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:20:15 GMT)
Euler's Elastica Based Cartoon-Smooth-Texture Image Decomposition [4.8] グレースケール画像を3つの異なる成分に分解する新しいモデルを提案する。
構造部は強い境界と強い光-暗黒遷移のある領域、滑らかな部分、柔らかい影と影、振動、テクスチャとノイズを表す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 04:24:02 GMT)
MobileFlow: A Multimodal LLM For Mobile GUI Agent [4.8] 本稿では,モバイルGUIエージェント用のマルチモーダルな大規模言語モデルであるMobileFlowを紹介する。
MobileFlowは約21億のパラメータを含み、新しいハイブリッドビジュアルエンコーダを備えている。
画像データを完全に解釈し、GUIインタラクションタスクのユーザ命令を理解する能力がある。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 07:43:34 GMT)
Computational Advantage in Hybrid Quantum Neural Networks: Myth or Reality? [4.6] ハイブリッド量子ニューラルネットワーク(HQNN)は、計算性能を向上させる可能性に注目されている。
量子層は純粋に古典的なモデルよりも計算上の優位性を提供しますか?
本稿では,従来のモデルとハイブリッドモデルがアーキテクチャの複雑さを増す問題にどのように適応するかを考察する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 12:31:04 GMT)
Archaeoscape: Bringing Aerial Laser Scanning Archaeology to the Deep Learning Era [4.6] Archaeoscapeはカンボジアで888 km$2$の大規模なALSデータセットであり、31,141の注釈付き考古学的特徴がある。
Archaeoscapeは、オープンアクセスデータ、アノテーション、モデルを備えた最初のALS考古学リソースである。
この問題に対する現代のビジョン技術の利点を示すために,近年のセグメンテーションモデルをいくつかベンチマークした。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:32:53 GMT)
Physics-informed reduced order model with conditional neural fields [4.5] 本研究では、パラメータ化偏微分方程式(PDE)の解を近似するために、低次モデリング(CNF-ROM)フレームワークのための条件付きニューラルネットワークを提案する。
このアプローチは、潜伏状態からPDEソリューションを再構成するデコーダと、時間とともに潜伏ダイナミクスをモデル化するためのパラメトリックニューラルネットワークODEを組み合わせる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:04:33 GMT)
Generative Humanization for Therapeutic Antibodies [4.5] 人間化(Humanization)は、免疫原性と呼ばれる1つの重大なリスクに対処するシーケンス最適化戦略である。
我々は,ヒト抗体データに基づいて訓練された言語モデルからヒト化変異をサンプリングする条件生成モデリングタスクとして,人間化を再編成する。
免疫原性リスクを低減し、治療特性を維持または改善した候補配列を得るために、抗原結合親和性などの治療特性のモデルを含むサンプリングプロセスについて述べる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:54:45 GMT)
A Machine Learning-Based Approach For Detecting Malicious PyPI Packages [4.3] 現代のソフトウェア開発では、外部ライブラリやパッケージの使用が増えている。
この再利用コードへの依存は、悪意のあるパッケージという形でデプロイされたソフトウェアに重大なリスクをもたらす。
本稿では、機械学習と静的解析を用いて、パッケージのメタデータ、コード、ファイル、テキストの特徴を調べるデータ駆動型アプローチを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:49:06 GMT)
Quantum Electronics on Quantum Liquids and Solids [4.3] 粒子質量が低く粒子間相互作用が弱い非極性原子や分子は、低温で量子液体や固体(QLS)を形成することができる。
過剰電子は真空中でQLSの表面に自然に結合し、2次元と低次元にユニークな量子電子の挙動を示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 03:32:49 GMT)
Privacy Drift: Evolving Privacy Concerns in Incremental Learning [4.3] 本研究の目的は,モデル性能の進化とデータプライバシの整合性との関係を明らかにすることである。
この結果から,モデル精度とプライバシ保護の複雑な相互作用が強調され,モデル性能の向上がプライバシリスクの増大につながることが明らかとなった。
この研究は、モデル精度と分散環境におけるデータのプライバシとの微妙なバランスを達成することを目的として、プライバシを意識した機械学習に関する将来の研究の基盤となる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:04:09 GMT)
Global Optimization with A Power-Transformed Objective and Gaussian Smoothing [4.3] 我々の手法は、$f$のグローバルな最大点の$delta$-neighborhoodの解に収束することを示す。
収束率は$O(d2sigma4varepsilon-2)$であり、標準および単一ループホモトピー法よりも高速である。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:33:43 GMT)
Cutting is All You Need: Execution of Large-Scale Quantum Neural Networks on Limited-Qubit Devices [4.2] 本研究では,HQNNの量子回路切断手法を提案する。
提案手法は、元の回路の精度を保ち、全てのサブ回路における量子パラメータのトレーニングを支援する。
その結果,量子回路切断は,現在の量子ハードウェア上で量子機械学習(QML)を前進させる上で有望な手法であることが示唆された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:29:46 GMT)
DAWN-SI: Data-Aware and Noise-Informed Stochastic Interpolation for Solving Inverse Problems [4.2] 不完全またはノイズの観測からパラメータを推定する逆問題は、医療画像、地球物理学、信号処理など様々な分野で発生する。
この作業では、単純な参照分布をマッピングするために決定論的とプロセスの両方を統合するフレームワークである$textitStochastic Interpolation$(SI)を使用します。
本手法は,各逆問題に対して特に訓練を行い,様々なノイズレベルに適応する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 04:18:49 GMT)
A Temporally Correlated Latent Exploration for Reinforcement Learning [4.1] 時間的関連潜伏探索(TeCLE)は、行動条件付き潜伏空間と時間的相関を用いた、本質的な報酬の定式化である。
その結果, エージェントの探索行動は時間的相関によって決定されることがわかった。
我々は,提案するTeCLEが,ベンチマーク環境でのノイズTVのアンドリティに対して堅牢であることを証明する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 04:38:43 GMT)
Generating Rectifiable Measures through Neural Networks [4.0] 我々は、(可算)$m$-rectifiable measuresのクラスに対する普遍近似結果を得る。
我々はこの結果を数えきれない$m$-rectible measureに拡張し、このレートがなおもretifiability parameter $m$と等しいことを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:10:04 GMT)
Predicting Organic-Inorganic Halide Perovskite Photovoltaic Performance from Optical Properties of Constituent Films through Machine Learning [3.9] 本研究では,3D/2D構造(FAMA)Pb(IBr)3/OABrハイブリッド有機無機ハロゲン化物ペロブスカイト(HOIP)太陽電池の電流電圧挙動をAM1.5照明下で正確に予測する機械学習手法を提案する。
我々のニューラルネットワークアルゴリズムは、数百のHOIP太陽電池からの応答の測定に基づいて訓練されている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:41:21 GMT)
Chimera: Accurate retrosynthesis prediction by ensembling models with diverse inductive biases [3.9] 化学合成の計画と実行は、機能的な小さな分子の発見において大きなボトルネックとなっている。
化学者が反応モデルを構築するためのフレームワークであるChimeraを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:55:19 GMT)
A Graph-Based Approach for Conversational AI-Driven Personal Memory Capture and Retrieval in a Real-world Application [3.9] TOBUは、AIを応用した会話型アプローチで、個人記憶(これらの瞬間の物語や状況とともに、写真やビデオ)をキャプチャし、取り出す、新しいモバイルアプリケーションである。
最初の試作品では、記憶関係の理解に制限があるため、検索強化生成(RAG)システムのような既存の検索手法が不足していることが示されている。
我々は新しいグラフベースの検索手法であるTOBUGraphを設計する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 22:05:39 GMT)
Interactive Occlusion Boundary Estimation through Exploitation of Synthetic Data [3.8] 閉塞境界(OBs)は、2次元画像における閉塞事象を幾何学的に局所化する。
そこで我々は,2次元画像の自動生成のためのMesh2OBというツールを開発した。
我々は,実世界のOB-LabNameを作成した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:16:51 GMT)
Automated Dynamic Image Analysis for Particle Size and Shape Classification in Three Dimensions [3.8] 動的画像解析のための最先端技術は、主に二次元イメージングに限られている。
既存の3次元イメージング技術(CT、レーザースキャン、写真撮影など)は静的物体に限られている。
OCcularは、光カメラの同期配列を用いて連続的な粒子の流れを撮像するコスト効率のよいソリューションを提供することで、これらの課題に対処する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:36:59 GMT)
Automatic Prediction of Stroke Treatment Outcomes: Latest Advances and Perspectives [3.8] ディープラーニング技術の導入と開発は、大規模で多様な医療データを分析するのに役立ちます。
医用画像分析領域における共通データ標準化の課題にもかかわらず、脳卒中結果予測におけるディープラーニングの未来は、マルチモーダル情報を使うことにある。
このレビューは、研究者、臨床医、政策立案者に対して、この急速に発展し、有望な分野に関する最新の理解を提供することを目的としている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 07:06:21 GMT)
'Being there together for health': A Systematic Review on the Feasibility, Effectiveness and Design Considerations of Immersive Collaborative Virtual Environments in Health Applications [3.7] MEDLINE、PsycINFO、Emcareデータベースをピアレビューされたオリジナルレポートのために体系的に検索した。
没入型拡張現実技術を用いたすべての研究は、1人以上の参加者が直接健康上の利益に介入しながら行われた。
調査では、リハビリテーションへの関与、距離を越えた有意義な相互作用、ポジティブな影響、変革的体験、メンタルヘルス療法、運動スキル学習など、様々なポジティブな結果が示された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 03:58:51 GMT)
Resolving Intent Ambiguities by Retrieving Discriminative Clarifying Questions [3.7] 本稿では,単純なルールベースシステムを用いて,識別的質問を生成する新しい手法を提案する。
提案手法は,2つの意図の識別を目的としているが,複数の意図の明確化に容易に拡張することができる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 03:51:24 GMT)
PyTerrier-GenRank: The PyTerrier Plugin for Reranking with Large Language Models [3.7] PyTerrier-GenRank は LLM によるシームレスな再品位実験を容易にする PyTerrier-GenRank プラグインである。
私たちはHuggingFaceとOpenAIがホストするエンドポイントを通じてプラグインを検証する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 04:30:00 GMT)
Adaptive Optimization for Enhanced Efficiency in Large-Scale Language Model Training [3.7] 大規模言語モデル (LLM) は様々なタスクにおいて顕著な成果を上げている。
本稿では適応最適化アルゴリズムに基づく改良手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:17:30 GMT)
Harnessing Shared Relations via Multimodal Mixup Contrastive Learning for Multimodal Classification [3.7] マルチモーダルデータに固有のニュアンス付き共有関係を抽出するマルチモーダル混合コントラスト学習手法であるM3CoLを提案する。
我々は,M3CoLが共有マルチモーダル関係を効果的に捉え,ドメイン間の一般化を実証する。
我々の研究は、堅牢なマルチモーダル学習のための共有関係の学習の重要性を強調し、将来の研究に有望な道を開く。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 06:58:30 GMT)
Endless Jailbreaks with Bijection Learning [3.6] ランダムに生成したエンコーディングを用いて,安全性上の脆弱性に対してLLMをファジリングする強力な攻撃アルゴリズムを提案する。
私たちの攻撃は、幅広いフロンティア言語モデルに対して非常に効果的です。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:31:43 GMT)
SurgBox: Agent-Driven Operating Room Sandbox with Surgery Copilot [3.5] SurgBoxはエージェント駆動のサンドボックスフレームワークで、没入型手術シミュレーションにおける外科医の認知能力を高める。
特に,外科情報の流れを積極的に調整し,臨床的意思決定を支援するAI駆動型アシスタントであるオペリアルコパイロットを考案した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:07:27 GMT)
Old Optimizer, New Norm: An Anthology [3.5] それぞれの手法は、凸性の仮定を伴わない正方形の一階法として理解することができると論じる。
この観察を一般化することにより、トレーニングアルゴリズムのための新しいデザインスペースをグラフ化する。
ニューラルネットワークを慎重に成熟させるというこのアイデアが、より安定し、スケーラブルで、実際に高速なトレーニングにつながることを期待しています。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:09:22 GMT)
Modular Duality in Deep Learning [3.5] 汎用ニューラルネットワークのための双対写像を構築する。
私たちの地図は、a)高速かつb)スケーラブルなアルゴリズムをトレーニングするための理論的基盤を形成します。
我々は、Embed、Linear、Conv2Dレイヤを二元化するためのGPUフレンドリーなアルゴリズムを導出した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:02:28 GMT)
Local Curvature Smoothing with Stein's Identity for Efficient Score Matching [3.4] 本稿では,Stein's Identity (LCSS) を用いた局所曲率スムースなスコアマッチング変種を提案する。
LCSSは、スタインのアイデンティティを適用してジャコビアントレースをバイパスし、正規化の有効性と効率的な計算を可能にした。
LCSSは,サンプル生成性能において既存の手法を上回り,スコアマッチングの性能と一致することを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 04:11:24 GMT)
Osteoporosis Prediction from Hand X-ray Images Using Segmentation-for-Classification and Self-Supervised Learning [3.3] Dual-Energy X-ray absorptiometry (DXA)のような骨密度試験に限定的にアクセスするため、診断も治療も行われていない慢性代謝性骨疾患である。
本稿では手・手首X線画像を用いた骨粗しょう症の予測手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:47:29 GMT)
Enhanced Quasiparticle Relaxation in a Superconductor via the Proximity Effect [3.3] 超伝導体の準粒子輸送に及ぼす近接層の影響について検討した。
超伝導体における準粒子の緩和速度を著しく向上させるために, 通常の金属層を用いることができる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:28:09 GMT)
MotionShop: Zero-Shot Motion Transfer in Video Diffusion Models with Mixture of Score Guidance [3.2] 拡散変圧器におけるScore Guidance(MSG)の混合による第1動作伝達手法を提案する。
MSGは拡散モデルにおける運動伝達の理論的基盤となるフレームワークである。
我々は、200のソースビデオと1000の転送モーションからなる最初のモーショントランスファーデータセットであるMotionBenchを紹介する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:59:17 GMT)
MotionFlow: Attention-Driven Motion Transfer in Video Diffusion Models [3.2] 動画拡散モデルにおける動き伝達のための新しいフレームワークであるMotionFlowを紹介する。
本手法は,空間的・時間的ダイナミクスを正確に把握し,操作するために,クロスアテンションマップを利用する。
実験の結果,MotionFlowは劇的なシーン変化であっても,忠実度と汎用性の両方で既存モデルよりも優れていた。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:59:12 GMT)
Optimization of deterministic photonic graph state generation via local operations [3.2] 本稿では,状態の局所的クリフォード等価度と生成コストパラメータのグラフ理論的相関に基づくプロトコルの最適化手法を提案する。
任意の大きなリピータグラフ状態を生成するために、2量子ゲートを使用する場合、50%の削減を実現し、ランダムな高密度グラフを生成するために、合計ゲート数も同様に大幅に削減する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 19:41:08 GMT)
Secret Breach Prevention in Software Issue Reports [2.9] 本稿では,ソフトウェア問題報告における秘密漏洩検出のための新しい手法を提案する。
ログファイル、URL、コミットID、スタックトレース、ダミーパスワードなど、ノイズによって引き起こされる課題を強調します。
本稿では,最先端技術の強みと言語モデルの文脈的理解を組み合わせたアプローチを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 00:35:38 GMT)
Generative Model-Based Fusion for Improved Few-Shot Semantic Segmentation of Infrared Images [2.8] 赤外線(IR)イメージングは、自律運転、火災安全、防衛用途など、様々なシナリオで一般的に用いられている。
Few-shot segmentation (FSS)は、いくつかのラベル付きサポートサンプルを使用してクエリイメージをセグメント化することで、これらの問題を解決するためのフレームワークを提供する。
本研究では、生成モデリングと融合技術を用いて、IR画像のFSSのための新しい戦略を開発する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:14:57 GMT)
BEExformer: A Fast Inferencing Transformer Architecture via Binarization with Multiple Early Exits [2.8] トランスフォーマーに基づく大規模言語モデル(LLM)は、様々なアプリケーションで最先端の結果を得る。
様々な効率の考慮事項の中で、モデルバイナライゼーションとEarly Exit(EE)は一般的な有効解である。
本稿では,最初の選択型学習変圧器アーキテクチャであるBinarized Early Exit Transformer (BEExformer)を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:58:14 GMT)
DiversityMedQA: Assessing Demographic Biases in Medical Diagnosis using Large Language Models [2.8] DiversityMedQAは,多彩な患者集団にわたる医療クエリに対する大規模言語モデル(LLM)応答を評価するために設計された,新しいベンチマークである。
以上の結果から,これらの変動に比較して,モデル性能に顕著な差が認められた。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:53:43 GMT)
ACT-Bench: Towards Action Controllable World Models for Autonomous Driving [2.7] 世界モデルは自律運転のための有望な神経シミュレータとして登場した。
動作の忠実度を定量化するためのオープンアクセス評価フレームワーク ACT-Bench を開発した。
現状のモデルが与えられた指示に完全に従わないことを示す一方で,Terraは改善された行動忠実性を実現する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:06:28 GMT)
ETLNet: An Efficient TCN-BiLSTM Network for Road Anomaly Detection Using Smartphone Sensors [2.6] 路面異常は、路面上または路面自体の異常として定義することができる。
スピードバンプは、安全のために意図的に配置されるが、その非標準形状、サイズ、適切なマーキングの欠如により危険である。
ポットホールは意図せず、深刻な損傷を引き起こすことがある。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 12:27:07 GMT)
DART-Eval: A Comprehensive DNA Language Model Evaluation Benchmark on Regulatory DNA [2.5] 大規模なゲノムDNA言語モデル(DNALM)は、多様なDNA要素の一般化可能な表現を学習することを目的としている。
本ベンチマークでは, 機能的配列の特徴探索, 細胞型特異的制御活性の予測, 遺伝的変異の影響の予測など, 生物学的に有意義な下流課題を対象としている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:23:35 GMT)
Quantum Security Analysis of the Key-Alternating Ciphers [2.5] 複数のラウンドにわたる偶数マンソル暗号の一般化であるキー交換暗号(KAC)のセキュリティについて検討する。
我々は,複数のラウンド KAC に対する最初の非自明な量子鍵回収攻撃を,相手がパブリックな置換の1つにしか量子アクセスできないようなモデルで導入する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:23:29 GMT)
Under the Hood of Tabular Data Generation Models: Benchmarks with Extensive Tuning [2.5] 16個のデータセットに対する広範囲なベンチマークにより,データセット固有のチューニングが表型データ生成のための最新の5つのモデルファミリに与える影響について検討した。
我々のベンチマークは、ほとんどのモデルにおいて、大規模データセット固有のチューニングが元の構成よりも大幅に性能を向上することを示した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:13:18 GMT)
Voronoi Candidates for Bayesian Optimization [2.5] 多くの実践的なBO法、特に高次元では、取得関数の形式的で連続的な最適化を導出する。
本稿では,現在の設計点のヴォロノイ・テッセルレーションの境界上にある候補を用いて,それらのうち2つ以上に等しくなるようにすることを提案する。
テッセルレーションを明示的に生成することなく,ヴォロノイ境界を直接サンプリングすることで,効率的な実装の戦略について議論する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:38:56 GMT)
Secure Integration of 5G in Industrial Networks: State of the Art, Challenges and Opportunities [2.5] 産業ネットワークへの5Gのセキュアな統合に関する,最先端かつ導出的な勧告について述べる。
セキュリティを強化するために5Gを利用する機会を特定し、残る課題を示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 19:13:59 GMT)
A cyber-physical digital twin approach to replicating realistic multi-stage cyberattacks on smart grids [2.5] 本稿では,セキュアな実験室環境における電力網の複製により,サイバー攻撃がスマートグリッドに与える影響について検討する。
スマートグリッドのセキュアな運用のための通信インフラの研究にシミュレーションが使用される。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:58:51 GMT)
Random Tree Model of Meaningful Memory [2.4] 本稿では,各ノードが木葉の圧縮された表現であるキーポイントの階層として物語を表現するために,ランダムツリーの統計的アンサンブルを導入する。
平均リコール長は物語長に比例して増加し,各リコール文では個人がより長いナラティブセグメントを要約するようになっている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:13:01 GMT)
Preprocessing is All You Need: Boosting the Performance of Log Parsers With a General Preprocessing Framework [2.3] 先行研究では、多くの統計ベースのログ(例えば、Drain)が提案されており、非常に効率的である。
本研究は,本研究の成果を反映した汎用前処理フレームワークを開発し,既存の構文解析への影響を評価した。
実験の結果,前処理フレームワークは4つの最先端統計モデルの性能を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:39:34 GMT)
Latent Space Characterization of Autoencoder Variants [2.3] 我々は、畳み込みオートエンコーダ(CAE)、復調オートエンコーダ(DAE)、変分オートエンコーダ(VAE)など、様々なオートエンコーダによって学習される潜伏空間の構造を特徴付ける。
また、距離保存変換を用いて行列多様体の点をヒルベルト空間に写像し、ヒルベルト空間で生成される部分空間を入力の歪みの関数として別のビューとする。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 03:40:21 GMT)
Connecting Large Language Models with Blockchain: Advancing the Evolution of Smart Contracts from Automation to Intelligence [2.3] 本稿では,Large Language Modelsをブロックチェーンデータ,sysnameと統合するための普遍的なフレームワークを提案し,実装する。
意味的関連性と真理発見の手法を組み合わせることで,革新的なデータ集約手法であるfuncnameを導入する。
実験結果は、40%の悪意のあるノードであっても、最適なベースラインと比較して平均17.74%の精度でデータ精度を向上させることを示した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:43:58 GMT)
U-MATH: A University-Level Benchmark for Evaluating Mathematical Skills in LLMs [2.2] 教材から得られた大学レベルの未発表問題1,100件の新規ベンチマークであるU-MATHを紹介する。
6つの中核領域でバランスが取れており、20%のマルチモーダル問題がある。
U-MATH問題のオープンな性質を考えると、生成した解の正しさを判断するために LLM を用いる。
その結果,LLMはテキストベースのタスクでは最大63%の精度しか得られず,視覚的問題では45%以下であった。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:29:43 GMT)
Experimental realization of universal quantum gates and six-qubit entangled state using photonic quantum walk [2.2] 室温での高忠実度量子ゲートの普遍的な実現を実験的に実証した。
単一光子を用いた3量子系では、第1の量子ビットは偏光情報を用いて符号化され、残りの2つの量子ビットは経路情報を用いて符号化される。
6キュービットのグリーンバーガー・ホーネ・ザイリンガー状態を生成するために、2つの3キュービット加群を絡めるために、絡み合った光子対を用いる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:40:12 GMT)
Backdooring Outlier Detection Methods: A Novel Attack Approach [2.2] 外乱検出は、重要な現実世界のアプリケーションに分類器を配置するのに不可欠である。
本稿では,アウトリア検出タスクをターゲットとした新しいバックドアアタックであるBATODを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:03:22 GMT)
Ultra precise determination of Cs($nS_{1/2}$) and Cs($nD_J$) quantum defects for sensing and computing: Evaluation of core contributions [2.2] 我々はCs Rydberg遷移の絶対周波数測定を行う。
測定されたリドベルグ級数に対する量子欠陥パラメータは、これまででもっとも正確なものである。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:22:08 GMT)
Enhancing FKG.in: automating Indian food composition analysis [2.2] 本稿では,インド料理の食品組成データを知識グラフを用いて計算する手法を提案する。
このワークフローは、FKG.inを補完し、検証済み知識ベースからの食品組成データを反復的に補完することを目的としている。
ユーザがワークフローと対話して、ダイエットベースのヘルスレコメンデーションを得る方法について、簡単に説明している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:27:15 GMT)
A unified framework for classical and quantum uncertainty relations using stochastic representations [2.1] これまでに発見されたすべての不確実性関係は、同じ力学の表現によってのみ導出可能であることを示す。
この手法をマルコフ開量子系に応用し、その力学を解明する。
このことは、古典系と量子系の両方の不確実性関係を、その性質の固有の性質として完全に確立する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 12:16:41 GMT)
Effective Rank and the Staircase Phenomenon: New Insights into Neural Network Training Dynamics [2.0] ディープラーニングは高次元問題、特に低次元の特徴構造を持つ問題の解決において広く成功している。
ニューラルネットワークがどのようにそのような特徴を抽出するかをトレーニング中に理解することは、ディープラーニング理論における根本的な問題である。
本稿では,ニューラルネットワークの最後の隠れ層にあるニューロンを,重要な特徴を表す基本関数として解釈することで,新たな視点を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:00:50 GMT)
Smart Parking with Pixel-Wise ROI Selection for Vehicle Detection Using YOLOv8, YOLOv9, YOLOv10, and YOLOv11 [2.0] この研究は、最新のYOLOモデルを使用して、モノのインターネット、エッジコンピューティング、ディープラーニングの概念を統合する新しいアプローチを導入している。
駐車場画像中の車両をカウントする関心領域を正確に識別するために,新しい画素単位のポストプロセッシングROI選択法を提案する。
提案システムは3,484枚の画像のカスタムデータセット上で99.68%の精度を達成し、費用対効果の高いスマートパーキングソリューションを提供した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 20:56:05 GMT)
Towards Predicting the Success of Transfer-based Attacks by Quantifying Shared Feature Representations [2.0] この研究は、ターゲットモデル内で脆弱な特徴の存在を特定することによって、攻撃成功の事前予測を行う最初の試みである。
Chen と Liu (2024) による最近の研究は、共通多様体空間に成功した TBA が存在することを示唆する統一フレームワークである多様体攻撃モデルを提案した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:33:15 GMT)
Transfer of Fisher Information in Quantum Postselection Metrology [2.0] 出力光子はフィッシャー情報伝達効果を利用して量子スケールに到達可能であることを示す。
本研究は,ポストセレクション戦略の量子力学的優位性を高め,適用範囲を広げるものである。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:12:09 GMT)
Short-term Streamflow and Flood Forecasting based on Graph Convolutional Recurrent Neural Network and Residual Error Learning [1.8] 機械学習ベースのストリームフロー予測は、評価曲線からの大規模なストリームフローデータセットに依存する。
評価曲線モデリングの不確かさは、ストリームフローデータにエラーをもたらす可能性がある。
本研究では,これらのデータエラーに対処するストリームフロー予測手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 04:16:35 GMT)
Rethinking Time Series Forecasting with LLMs via Nearest Neighbor Contrastive Learning [1.8] 本稿では, NNCL-TLLM: Nearest Neighbor Contrastive Learning for Time Series forecasting via Large Language Modelsを提案する。
まず、時系列互換テキストプロトタイプを作成し、各テキストプロトタイプは、その近傍に単語トークンを埋め込んだり、時系列の特徴を表現したりする。
次に、LLMの層正規化と位置埋め込みを微調整し、他の層をそのままに保ち、トレーニング可能なパラメータを減らし、計算コストを削減した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 06:32:47 GMT)
Gaining Explainability from a CNN for Stereotype Detection Based on Mice Stopping Behavior [1.8] 我々は、各個体の停止点の連続を通して、マウスの年齢/性別を明らかにする形質を特定することに重点を置いている。
メスのマウスは、より認識可能な行動パターンを示し、90%以上の分類精度に達する。
雄、特に幼体は、幼体と成体の間に振動する行動パターンを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:22:00 GMT)
Quantum Machine Learning Algorithms for Anomaly Detection: a Review [1.7] 量子コンピューティングに関わる重要な概念を要約し、量子スピードアップという形式的な概念を導入する。
このレビューは、量子機械学習に基づく異常検出の構造化マップを提供する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:56:31 GMT)
Towards the interoperability of low-code platforms [1.7] ローコードプラットフォーム (LCP) は様々な産業で普及している。
特にこれらのプラットフォーム間の相互運用性の欠如を考えると、ベンダのロックインは大きな懸念事項である。
本研究では、あるプラットフォームで指定されたモデルから別のプラットフォームへ(半)自律的に移行することで、LCPの相互運用性を改善するアプローチを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:33:34 GMT)
Enhancing Cross-Language Code Translation via Task-Specific Embedding Alignment in Retrieval-Augmented Generation [1.6] 本稿では,タスク固有の埋め込みアライメントを統合することで,FortranからC++へのクロス言語コード変換を強化する手法を提案する。
我々の戦略は、CodeBLEUメトリックによって定量化されているように、検索モデルを翻訳品質を最大化する目的と直接一致させる。
これらのCodeBLEU最適化埋め込みをRAGフレームワークに統合することにより、検索精度とコード生成品質の両方を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:22:32 GMT)
VTD: Visual and Tactile Database for Driver State and Behavior Perception [1.6] 本稿では,運転状態とインタラクション行動の主観的不確実性に対処する新しい視覚触覚認識手法を提案する。
疲労および散逸条件下でのマルチモーダルデータを包含する包括的データセットを開発した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:31:40 GMT)
Power Plant Detection for Energy Estimation using GIS with Remote Sensing, CNN & Vision Transformers [1.6] 本稿では,CNN(Convolutional Neural Networks)とViT(Vision Transformers)による遠隔センシング機能を備えたGISをパイプライン化することで,エネルギー推定アプリケーションを支援するハイブリッドモデルを提案する。
提案手法は,GISを介して共通マップ上の複数のデータ型をリアルタイムに解析し,CNNによる特徴抽出機能を実現する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 12:15:11 GMT)
AI-Driven Non-Invasive Detection and Staging of Steatosis in Fatty Liver Disease Using a Novel Cascade Model and Information Fusion Techniques [1.5] 非アルコール性脂肪肝疾患(非アルコール性脂肪肝疾患、NAFLD)は、世界規模で最も多い肝疾患の1つである。
本研究では,アンサンブル学習と特徴融合技術を用いた新しい人工知能カスケードモデルを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:26:22 GMT)
CIKAN: Constraint Informed Kolmogorov-Arnold Networks for Autonomous Spacecraft Rendezvous using Time Shift Governor [1.5] 我々は、時間シフトガウンタ(TSG)に対する制約付きインフォームドニューラルネットワーク(CINN)近似について検討する。
TSGに対する制約付きコルモゴロフ・アルノルドネットワーク(CIKAN)に基づく近似を提案する。
制約された宇宙船ランデブーミッションのシミュレーションにより,CIKANをベースとしたTSGの有効性を実証する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 19:09:56 GMT)
IterNorm: Fast Iterative Normalization [1.5] IterNorm マクロは$d$次元ベクトルを正規化し、100MHz/1.05Vで112-227サイクルのレイテンシで 64 leq d leq 1024$ となる。
IterNormは、FP32の9ケース中6ケース、BFloat16の9ケース中5ケースにおいて、OPTモデルで使用される埋め込み長で高速逆平方根アルゴリズムより優れている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:00:01 GMT)
Intelligent Spark Agents: A Modular LangGraph Framework for Scalable, Visualized, and Enhanced Big Data Machine Learning Workflows [1.5] LangGraphフレームワークは、スケーラビリティ、視覚化、インテリジェントなプロセス最適化を通じて機械学習を強化するように設計されている。
このフレームワークの中核となるのは、Sparkの分散コンピューティング機能を活用する重要なイノベーションであるAgent AIだ。
フレームワークにはLangChainエコシステムを通じて大きな言語モデルも組み込まれており、構造化されていないデータとのインタラクションが強化されている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:21:40 GMT)
Stably unactivated neurons in ReLU neural networks [1.4] ReLUニューラルネットワークでは、安定に活性化されないニューロンの存在は、ネットワークの表現力を低下させる。
本研究では、ニューラルネットワークの第2の隠蔽層におけるニューロンが安定に活性化されない確率について検討する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 22:15:22 GMT)
MC3: Memory Contention based Covert Channel Communication on Shared DRAM System-on-Chips [1.4] 我々は,新しいメモリ保持型秘密通信攻撃MC3を導入する。
システムへのLLCや高機能アクセスを必要とせずに、CPUとGPU上で動作するアプリケーション間の高いスループット通信を実現する。
NVIDIA Orin AGX, Orin NX, Orin Nano における MC3 の有用性を 1% 以下の6.4 kbps の伝送速度で実証した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:58:57 GMT)
Artificial intelligence and the internal processes of creativity [1.4] 本稿では,創造性の内部過程の基盤となる神経生物学的機構について考察する。
人工と人間の創造性の産物は似ているが、内部プロセスは異なると結論付けている。
この論文は、AIが人間の創造性の内部プロセス、例えばスキルの発展、知識の統合、アイデアの多様性にどのように悪影響を及ぼすかについても論じている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:31:22 GMT)
A Hamiltonian Approach to Barrier Option Pricing Under Vasicek Model [1.3] ハミルトンアプローチによるVasicek Modelのオプション価格について検討する。
成熟までの時間を無限ステップに分割し、各ステップの行列要素を量子力学法で計算した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:52:21 GMT)
Anomaly Detection and Classification in Knowledge Graphs [1.3] 知識グラフにおける異常な三重項や実体を検出するための教師なしアプローチであるSEKA(Seeking Knowledge Graph Anomalies)を提案する。
また, TAXOはKGに出現する可能性のある異常型の分類法である。
実世界の4つのKG, YAGO-1, KBpedia, Wikidata, DSKGを用いて, 両者のアプローチを評価する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:03:10 GMT)
ColonNet: A Hybrid Of DenseNet121 And U-NET Model For Detection And Segmentation Of GI Bleeding [1.2] 本研究では,Wireless Capsule Endoscopy (WCE) ビデオから抽出したフレーム内の消化管出血の自動検出と分類のための統合ディープラーニングモデルを提案する。
このデータセットは、MISAHUBチームがホストするAuto-WCBleedGen ChallengeバージョンV2の一部としてリリースされた。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:48:06 GMT)
KEDformer:Knowledge Extraction Seasonal Trend Decomposition for Long-term Sequence Prediction [1.2] 時系列予測はエネルギー、金融、気象学といった分野において重要な課題である。
季節差分解を統合する知識抽出駆動型フレームワークであるKEDformerを提案する。
この分解により、モデルが短期的変動と長期的パターンの両方を捉える能力が向上する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:07:11 GMT)
The Score-Difference Flow for Implicit Generative Modeling [1.2] Inlicit Generative Modelingは、対象データ分布と一致する合成データのサンプルを作成することを目的としている。
最近の研究は、合成音源データをターゲット分布へプッシュする観点から、IGG問題にアプローチしている。
任意のターゲット分布とソース分布のスコア差を,Kulback-Leibler分散を最適に低減するフローとして提示する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:02:25 GMT)
Enhancing Person Re-Identification via Uncertainty Feature Fusion and Auto-weighted Measure Combination [1.2] 人物再識別(Re-ID)は、監視システムにおいて、異なるカメラビューで同一人物を特定することを含む、困難なタスクである。
本稿では,不確定特徴融合法(UFFM)と自動重み付け器(AMC)によるReIDモデルの能力を向上する新しい手法を提案する。
本手法は,人物の再識別データセットで評価した場合のランク@1精度と平均精度(mAP)を大幅に改善する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 19:42:48 GMT)
Solid-state qubits in moire superlattices [1.2] 我々は、量子ビットの有望なプラットフォームとして、ツイストした二層膜のモワール超格子を導入する。
モワール超格子はモワール超格子の中で同じ局在量子井戸を育む。
提案した量子ビットは従来の固体量子ビットシステムよりも大きな利点を示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:00:24 GMT)
Using Machine Learning to Discover Parsimonious and Physically-Interpretable Representations of Catchment-Scale Rainfall-Runoff Dynamics [1.2] 本稿では,汎用ネットワークアーキテクチャの基本計算単位としてMass Conserving Perceptron (MCP) を用いる方法を示す。
物理的解釈可能性と優れた予測性能は,比較的相似な分散状態マルチフローパスネットワークを用いて達成可能であることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:30:01 GMT)
HyperGraphOS: A Meta Operating System for Science and Engineering [1.1] 本稿では,科学技術分野を対象とした革新的なオペレーティングシステムHyperGraphOSを提案する。
ウェブベースのアーキテクチャを使用すると、HyperGraphOSは知識、ドキュメント、コンテンツを相互接続されたモデルにまとめるために、ブラウザのみを必要とする。
その結果、柔軟性、データ管理、計算、ドキュメント処理が大幅に改善された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:21:41 GMT)
The Polynomial Stein Discrepancy for Assessing Moment Convergence [1.1] 本研究では,サンプルの集合とベイズ推定のための所望の後方分布との差を測定する新しい手法を提案する。
いくつかの例において、このテストは競合他社よりも高いパワーを持ち、計算コストが低いことを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:51:04 GMT)
Transferring disentangled representations: bridging the gap between synthetic and real images [1.1] 実データに適用可能な汎用的不整合表現を学習するために,合成データを活用する可能性を検討する。
本稿では,表現中の因子の質を測定するために,新しい解釈可能な介入基準を提案する。
以上の結果から, 合成データから実データへの表現の変換が可能であること, 有効であることが示唆された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:14:41 GMT)
Can Large Language Models Serve as Effective Classifiers for Hierarchical Multi-Label Classification of Scientific Documents at Industrial Scale? [1.1] 大規模言語モデル(LLM)は、多ラベル分類のような複雑なタスクにおいて大きな可能性を証明している。
これらの課題を克服するために,LLMの強みと高密度検索手法を組み合わせる手法を提案する。
複数の分野にまたがる大規模プリプリントリポジトリであるSSRNにおいて,本手法の有効性を評価する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:51:22 GMT)
GUIDE: A Global Unified Inference Engine for Deploying Large Language Models in Heterogeneous Environments [1.1] 現実世界のシナリオにおける大規模言語モデル(LLM)は依然として重要な課題である。
これらの課題は、しばしばメモリ使用率、レイテンシ、スループットの非効率につながる。
これらの問題に対処するフレームワークを開発し、バッチレイテンシ、TTFT、デコードスループットといった主要なメトリクスに対して、25%から55%の予測エラーを達成する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:46:43 GMT)
Comprehensive framework for evaluation of deep neural networks in detection and quantification of lymphoma from PET/CT images: clinical insights, pitfalls, and observer agreement analyses [1.0] 本研究はPET/CT画像からの自動リンパ腫分離における重要なギャップに対処する。
深層学習は悪性リンパ腫の病巣分類に応用されているが, アウト・オブ・ディストリビューション検査を取り入れた研究はほとんどない。
高い代謝活性を有する大強度病変に対して,ネットワークがより優れた性能を示すことを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 04:35:45 GMT)
Large Language Models for Ingredient Substitution in Food Recipes using Supervised Fine-tuning and Direct Preference Optimization [1.0] 本研究では, あるレシピのコンテキスト内で, 可塑性代替材料を予測するために, 材料置換システムを構築した。
この問題に対するLLMの使用はほとんど行われていないことから,我々は広範囲にわたる実験を行った。
この研究は、パーソナライズされた創造的な料理体験を実現するための重要なステップであると考えています。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:21:25 GMT)
Multimodal Fact-Checking with Vision Language Models: A Probing Classifier based Solution with Embedding Strategies [0.9] 本研究では,視覚言語モデル(VLM)のファクトチェックにおけるマルチモーダルコンテンツ表現および活用の有効性を評価する。
マルチモーダリティは性能を向上させることができるが,テキストと画像エンコーダの分離埋め込みはVLM埋め込みよりも優れた結果を示した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:13:19 GMT)
A Survey of Sustainability in Large Language Models: Applications, Economics, and Challenges [0.8] 大規模言語モデル(LLM)は、自然言語理解、生成、推論の高度な機能を提供することによって、多くのドメインを変換している。
研究、医療、クリエイティビティ・メディアといった業界にまたがる、画期的な応用にもかかわらず、彼らの急速な採用は持続可能性に関する重要な懸念を提起する。
本研究では, LLMの環境, 経済, 計算的課題について検討し, データセンターのエネルギー消費, 炭素排出量, 資源利用に着目した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:20:04 GMT)
A Survey of Large Language Model-Based Generative AI for Text-to-SQL: Benchmarks, Applications, Use Cases, and Challenges [0.8] 自然言語クエリを構造化クエリ言語(技術)に変換することで,データベースとのスムーズな対話を容易にする
この調査は、AI駆動のテキスト・ツー・ワンシステムの進化の概要を提供する。
医療、教育、金融といった分野におけるテキスト・ツー・ワンの適用について検討する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:36:28 GMT)
A Parametric, Second-Order Cone Representable Model of Fairness for Decision-Making Problems [0.7] この記事は「$varepsilon$-fairness」と呼ばれるフェアネスのパラメトリックモデルを開発する。
本研究では,本モデルが文献で広く用いられている公正度を測定するための既存の計量値と閉形式関係を持つことを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:59:48 GMT)
Evaluation of post-hoc interpretability methods in time-series classification [0.6] 本稿では,既存のポストホック解釈可能性法の性能を評価するために,定量的な指標を用いたフレームワークを提案する。
文献で確認されたいくつかの欠点、すなわち、人間の判断、再訓練、サンプルを除外する際のデータ分布の変化に対処できることが示される。
提案手法と定量的なメトリクスを用いて,実践的な応用で得られた解釈可能性手法の信頼性を理解することができる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:56:46 GMT)
Exact deconfined gauge structures in the higher-spin Yao-Lee model: a quantum spin-orbital liquid with spin fractionalization and non-Abelian anyons [0.6] 北エフハニカムモデルは正確な$mathbbZ$ゲージ構造を持ち、半整数スピン北エフモデルにおいて量子スピン液体(QSL)のみを識別する。
整数-スピンモデルにおけるスピン分数化の正確な表現は、以前の研究では比較的稀であり、北エフ・ハニカムモデルには欠落している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:16:19 GMT)
Mixup Barcodes: Quantifying Geometric-Topological Interactions between Point Clouds [0.6] 我々は、持続的ホモロジーと画像持続的ホモロジーを組み合わせることで、それらの間の形状と相互作用を特徴付ける新しい方法を定義する。
特に,(1)任意の次元の2つの点集合間の幾何学的トポロジカル相互作用(ミックスアップ)をキャプチャするミキシングバーコード,(2)単純な要約統計,総ミキシングアップ,および合計パーセンテージミキシングアップ,(3)これらの相互作用の複雑さを1つの数として定量化するソフトウェアツールを紹介する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 00:34:50 GMT)
From classical techniques to convolution-based models: A review of object detection algorithms [0.6] 物体検出はコンピュータビジョンと画像理解の基本的な課題である。
手作りの特徴と浅いモデルに頼っていた伝統的な手法は、複雑な視覚データに悩まされ、限られた性能を示した。
ディープラーニング、特に畳み込みニューラルネットワーク(CNN)は、データから直接リッチで階層的な機能を自動的に学習することで、これらの制限に対処した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:32:54 GMT)
A tweezer array with 6100 highly coherent atomic qubits [0.5] 我々は約12,000の場所で6,100個の中性原子をトラップする光学的ツイーザーを実験的に実現した。
また、光ツイーザアレイにおける超微細量子ビットの記録である12.6(1)秒のコヒーレンス時間を示す。
我々の結果は、他の最近の発展とともに、1万の原子量子ビットを持つ普遍量子コンピューティングが近い将来の展望であることを示している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:56:25 GMT)
Multi-class heart disease Detection, Classification, and Prediction using Machine Learning Models [0.5] 心臓病は、特に中高年および高齢者において、世界中の早死にの主な原因である。
心臓病を含む非感染性疾患は世界の死者の25%(179万人)を占め、バングラデシュでは43,204人以上が死亡している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:55:41 GMT)
ChatNVD: Advancing Cybersecurity Vulnerability Assessment with Large Language Models [0.5] 本稿では,Large Language Models (LLMs) のソフトウェア脆弱性評価への応用について検討する。
我々は,OpenAIによるGPT-4o mini,MetaによるLlama 3,GoogleによるGemini 1.5 Proの3つの著名なLCMを利用して,ChatNVDの3つの変種を開発した。
それらの有効性を評価するために,一般的なセキュリティ脆弱性質問を含む包括的アンケートを用いて,これらのモデルの比較分析を行った。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 03:45:49 GMT)
Squeezing and Entanglement Dynamics in Phase-Sensitive Non-Hermitian Systems [0.5] 本研究では,単モードAPT対称性を本質的に有する位相感受性非エルミタン波混合モデルを構築した。
ポンプ場の位相を調整することにより、このモデルは同時に2モードの二次PT対称性を示す。
本研究は, 2モード量子絡み合いとポンプ磁場の位相の関係をさらに探求し, 対応する非線形系における絡み合いの発生と進化について深い知見を提供する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:32:41 GMT)
Fault-Tolerant Implementation of the Deutsch-Jozsa Algorithm [0.5] Deutsch-Joszaアルゴリズムは、小さなフォールトトレランス実験の自然な候補である。
このアルゴリズムは,フォールトトレラントエンコーディングを伴わずに,トラップイオン量子コンピュータ上で実装する。
平均して全てのオラクルで、エラー率の削減は90 %近くであった。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:55:31 GMT)
Are Frontier Large Language Models Suitable for Q&A in Science Centres? [0.4] 本稿では,科学センターにおけるQ&Aインタラクションにおけるフロンティア大規模言語モデル(LLM)の適合性について検討する。
OpenAIのGPT-4, Claude 3.5 Sonnet, Google Gemini 1.5。
その結果、クリエイティビティと精度のトレードオフが明らかとなり、ClaudeはGPTとGeminiを、明快さと若年層へのエンゲージメントの両方で上回った。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:28:43 GMT)
Spinal ligaments detection on vertebrae meshes using registration and 3D edge detection [0.4] 本手法は, ステップワイズアプローチを用いて66個の脊柱靭帯付着点を検出することができる。
ランドマーク検出には椎骨1本あたり約3.0秒が必要で、既存の方法よりも大幅に改善されている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:39:06 GMT)
Reconstruction of 3D lumbar spine models from incomplete segmentations using landmark detection [0.4] 不完全な3次元椎体から完全3次元腰椎モデルを再構築する新しい方法を提案する。
本手法は, 腰椎全椎をわずか0.14秒でL1からL5に区分する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:23:42 GMT)
Feature Group Tabular Transformer: A Novel Approach to Traffic Crash Modeling and Causality Analysis [0.4] 本研究では,複数のソースから融合した包括的データセットを用いて,衝突のタイプを予測する新しい手法を提案する。
我々のアプローチの中心は、異なるデータを有意な特徴群に整理する特徴群タブラルトランスフォーマー(FGTT)モデルの開発である。
FGTTモデルは、ランダムフォレスト、XGBoost、CatBoostなど、広く使われているツリーアンサンブルモデルと比較され、優れた予測性能を示している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 20:47:13 GMT)
A text-to-tabular approach to generate synthetic patient data using LLMs [0.4] そこで本研究では,患者データへのアクセスを必要としない人工的な患者データを生成する手法を提案する。
我々は,大言語モデルの先行医療知識とコンテキスト内学習能力を活用して,現実的な患者データを生成する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:10:40 GMT)
Tabular data generation with tensor contraction layers and transformers [0.4] テンソル縮退層と変圧器を用いて,データ生成に埋め込み表現を用いることの可能性を検討する。
OpenML CC18スイートの複数のデータセットを対象に実施した実証的研究では,密度推定モデルと機械学習効率指標を比較した。
この結果から得られた主な特徴は、テンソル収縮層の助けを借りて埋め込み表現を利用することで密度推定の指標が向上するが、機械学習効率の観点からは競合性能は維持できるということである。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 19:34:13 GMT)
Machine learning algorithms to predict the risk of rupture of intracranial aneurysms: a systematic review [0.3] くも膜下出血は頭蓋内動脈瘤破裂の致命的な原因である。
機械学習は頭蓋内動脈瘤の破裂リスクを予測するために応用できる。
しかし、この証拠は既存の実践よりも総合的に優位性を示すものではない。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 03:25:01 GMT)
DevBench: A multimodal developmental benchmark for language learning [0.3] タスクと行動データに基づいて視覚言語モデルを評価するベンチマークであるDevBenchを紹介する。
DevBenchは、モデルを人間の言語開発と比較するためのベンチマークを提供する。
これらの比較は、モデルと人間の言語学習プロセスの分岐方法を強調する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 22:05:05 GMT)
Investigating Self-Supervised Image Denoising with Denaturation [0.3] 理論的解析と数値実験により,デ変性データを用いた自己教師付き復調アルゴリズムを解析する。
その結果, 劣化画像を用いたアルゴリズムトレーニングは有効であり, 経験的性能は理論的結果と一致していることがわかった。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 03:53:11 GMT)
Scalable and shallow quantum circuits encoding probability distributions informed by asymptotic entanglement analysis [0.3] マトリックス積状態(MPS)法は、浅い量子回路を構築する上で最も有望な手法として現れた。
入力関数の滑らかさに依存するMPS表現における結合間の絡み合いの崩壊に対する厳密な展開を導出する。
我々は、量子回路を浅く正確に符号化する改良されたMPSベースのアルゴリズムを構築した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:31:35 GMT)
LLM-ABBA: Understanding time series via symbolic approximation [0.3] 我々は,様々なダウンストリーム時系列タスクに対して,ABBAを大規模言語モデルに統合するLLM-ABBAという手法を提案する。
LLM-ABBAは、時系列を象徴することにより、最近のUCRにおける最先端(SOTA)と3つの医療時系列分類タスクとを良好に比較する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:35:45 GMT)
Entity-based Reinforcement Learning for Autonomous Cyber Defence [0.2] 自律的なサイバー防衛の鍵となる課題は、防御エージェントが様々なネットワークトポロジや構成をまたいで一般化する能力を確保することである。
深層強化学習への標準的アプローチは、一定の大きさの観測と行動空間を期待する。
自律型サイバー防衛では、訓練対象と異なるネットワークトポロジを持つ環境に一般化するエージェントを開発することが困難になる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:52:25 GMT)
Uncertainty Quantification for Transformer Models for Dark-Pattern Detection [0.2] 本研究は、ユーザ決定を操作し、自律性と同意を損なう、暗パターン検出、偽造設計の選択に焦点を当てる。
本稿では, 変圧器を用いた事前学習モデルを用いた不確実性定量化により, 最終分類ヘッドに実装した微分微調整手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:31:51 GMT)
Virtual entanglement purification via noisy entanglement [0.2] 分散量子計算(DQC)はスケーラブルな量子コンピューティングにおいて有望なアプローチである。
本稿では,期待値のレベルにおいてノイズの多い絡み合いを解消する仮想演算を利用したプロトコルを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 03:08:05 GMT)
YOLOv5-Based Object Detection for Emergency Response in Aerial Imagery [0.0] 本稿では, YOLOv5モデルを用いた空中画像における物体検出のためのロバストなアプローチを提案する。
我々は、救急車、自動車事故、警察車両、牽引車、消防車、転倒した車、火災時の車両などの重要物を特定することに重点を置いている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 19:40:00 GMT)
Visual Error Patterns in Multi-Modal AI: A Statistical Approach [0.0] MLLM(Multi-modal large language model)は、テキストと視覚データの統合に優れるが、曖昧さや不完全な視覚刺激を解釈する際に体系的な課題に直面する。
本研究では3D、回転、顔と面の欠如といった特徴を特徴とする幾何的刺激のデータセットを用いて、統計モデルを用いてこれらの誤差を駆動する要因を分析する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:01:54 GMT)
Variational Encoder-Decoders for Learning Latent Representations of Physical Systems [0.0] 本稿では,物理系のデータ駆動型低次元表現を学習するためのフレームワークを提案する。
地下水流動モデルの観測井における油圧応答のモデル化に成功した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:46:48 GMT)
Two-photon coupling via Josephson element I: Breaking the symmetry with magnetic fields [0.0] 対称超伝導量子干渉デバイス(SQUID)に基づく結合素子について考察する。
2光子相互作用を媒介することを示す。
これと他の誘導的相互作用はその場でオフにすることができる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:09:18 GMT)
Two stages domain invariant representation learners solve the large co-variate shift in unsupervised domain adaptation with two dimensional data domains [0.0] 教師なし領域適応(UDA)の最近の発展により、対象データに対する教師なし機械学習(ML)予測が可能になった。
本稿では,ソースとターゲットのギャップをセマンティック中間データで埋める手法を提案する。
また、トレーニングされたモデルと教師なしのターゲットラベリングルールのギャップを測定するための定理を導出する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 00:46:12 GMT)
Trust and distrust in electoral technologies: what can we learn from the failure of electronic voting in the Netherlands (2006/07) [0.0] 本稿では、オランダにおける機械投票の中止にアプローチして、デジタル政府技術における信頼と不信の複雑なダイナミクスに焦点を当てる(2006-07)。
それは、以前信頼されていたシステムが崩壊する可能性、信頼と不信の関係がいかにパラドックス的であるか、そしてそれが選挙技術の採用と管理とどのように相互作用するかを説明する。
本稿では,デジタル政府技術における信頼のダイナミクスの理解に寄与し,政策立案と技術導入戦略に影響を及ぼす。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:07:59 GMT)
The quantum magic of fermionic Gaussian states [0.0] フェルミオンガウス状態の非安定化性を定量化する効率的な方法を提案する。
対数的減算補正を施したハール乱数状態に匹敵する広範囲な先行挙動を明らかにする。
サンプリングアルゴリズムを2次元自由フェルミオントポロジカルモデルに適用し、トポロジカル位相境界におけるマジックの急激な遷移を明らかにする。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 19:00:16 GMT)
The Prompt Canvas: A Literature-Based Practitioner Guide for Creating Effective Prompts in Large Language Models [0.0] 本稿では,既存の方法論を包括的に構築し,実践者のための包括的概要を構築するためのフレームワークの構築について論じる。
本稿では,プロンプト・キャンバス(Prompt Canvas)について述べる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:35:18 GMT)
The Fock-space landscape of many-body localisation [0.0] 本稿では、量子多体系における多体局在(MBL)の物理の理解の最近の進歩を概観する。
我々は、多体系の力学を、高次元、相関、乱れのあるフォック空間グラフ上の架空の単一粒子の力学にマッピングする。
我々は,Fock空間上の固有状態相関の性質,静的および動的およびエルゴードおよび多体局在相およびMBL遷移近傍について詳細に論じる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:22:51 GMT)
Teleportation of a genuine single-rail vacuum-one-photon qubit generated via a quantum dot source [0.0] 単一空間モードで符号化された純真空1光子量子ビットのテレポーテーションを可能にする。
セットアップ内では、本物の単一レール真空1光子量子ビットをテレポートし、絡み合い交換を行うことができる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:25:09 GMT)
Technical Insights on Blockchain's Role in Financial Systems [0.0] この調査は、金融業界におけるブロックチェーンの実装方法に関する批判的な分析を提供する。
グリーンファイナンスの普及、規制の遵守の保証、サプライチェーンファイナンスの改善、分散ファイナンス(DeFi)の強化、モノのインターネット(IoT)の強化における重要な役割を強調している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:08:14 GMT)
Talking Like One of Us: Effects of Using Regional Language in a Humanoid Social Robot [0.0] 標準言語と比較して,非標準/地域言語における音声言語品種の効果について検討する。
本研究では,人間型社会ロボットのPepperと,高ドイツ語と低ドイツ語で答えるロボットを比較した。
その結果,会話の低ドイツ語版では暖かさが著しく高いことが示唆された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:21:57 GMT)
TFT-multi: simultaneous forecasting of vital sign trajectories in the ICU [0.0] 医療データにおける軌道予測は、計算手法の精度ケアと臨床統合において重要な研究領域である。
我々は、多次元時系列予測ツールであるフレームワーク時間融合変換器(TFT)を拡張し、TFT-multiを提案する。
集中治療室で記録された5つのバイタルサイン (血圧, 脈拍, SpO2, 温度, 呼吸速度) の予測にTFT-multiを適用した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:28:58 GMT)
Swap Path Network for Robust Person Search Pre-training [0.0] 我々は、エンドツーエンドの人物探索のための最初のフレームワークを提示する。
提案手法は,近年のバックボーンのみによる事前学習方法よりも,より効果的で,効率的で,かつ頑健であることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:35:26 GMT)
Supply Chain Insecurity: The Lack of Integrity Protection in SBOM Solutions [0.0] SBOM(Software Bill of Materials)は、ソフトウェアサプライチェーンのセキュリティを確保するための最重要事項である。
ビデン大統領が発した大統領令により、SBOMの採用は米国内で義務化されている。
本研究は,SBOMの完全性に関する詳細な,体系的な研究である。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:52:12 GMT)
Stronger speed limit for observables: Tight bound for the capacity of entanglement, the modular Hamiltonian and the charging of a quantum battery [0.0] 観測可能な速度限界のより強いバージョンを証明し、得られた境界が新しい境界の特別な場合であることを示す。
我々の発見は、量子熱力学、演算子成長の複雑さ、量子相関成長の時間速度の予測に重要な応用を持つことができる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:49:33 GMT)
States Violating Both Locality and Noncontextuality Inequalities in Quantum Theory [0.0] CHSHの不等式は、量子論における局所性をテストするために用いられる。
KCBSの不等式は、量子論における非文脈性をテストするために用いられる。
特定の量子状態は、これらの不等式を個々に違反することが知られている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:06:00 GMT)
Stark localization near Aubry-André criticality [0.0] Aubry-Andr'e (AA) 臨界点付近のスターク局在について検討した。
局所化のキー記述子によって保持されるスケーリング指数は、純粋なAAモデルとは全く異なることを示す。
そこで我々は, より優れた多体量子センサの設計において, 新たな制御パラメータを誘導する臨界性を呼び起こすことが, どのように役立つかについて議論する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:22:54 GMT)
Scaled and Inter-token Relation Enhanced Transformer for Sample-restricted Residential NILM [0.0] 本稿では,2つの革新点を持つトランスフォーマーアーキテクチャを提案する。
提案手法をREDDデータセット上で検証し, 各種アプライアンスに対してF1スコアを10~15%向上させる結果を得た。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 19:24:54 GMT)
Robust Computation with Intrinsic Heterogeneity [0.0] 内在型神経内不均一性は生物学的システムのユビキタスな特徴であり、よく文書化された計算上の利点がある。
機械学習における最近の研究は、シナプス接続と並んで神経パラメータを最適化することで、そのような多様性を取り入れている。
この性能向上は、より大きなパラメータ空間によって課される計算コストが著しく高いコストで実現される。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:34:58 GMT)
Retina-Inspired Object Motion Segmentation for Event-Cameras [0.0] イベントカメラは、標準的なアクティブなピクセルカメラをはるかに超える高時間解像度の革命的技術として登場した。
本研究は、視覚的特徴を抽出する追加の網膜機能の可能性を示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 12:37:08 GMT)
Resource theories with completely passive states and passive states as free states [0.0] 我々は、完全に受動的状態と受動的状態を自由状態とみなし、最大作業が単調であるような資源理論を定式化する。
特に、自由な操作が自由な状態にどのように作用するかを考察し、これらの資源理論において、ある種の温度がどのように重要な役割を果たすかを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:05:18 GMT)
Quantum-Enhanced Multi-Parameter Sensing in a Single Mode [0.0] 標準量子限界以下で不確実性が同時に減少する位置と運動量の小さな変化の測定を実証する。
実験では格子状態を用いて位置と運動量の小さな変化を計測し,同時に5.1(5)dBまで上昇した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:58:19 GMT)
Quantum instability and Ehrenfest time for an inverted harmonic oscillator [0.0] 初期状態がIHO系の任意の位置に位置する時間外相関器(OTOCs)は、サドル点で同じ指数的成長速度(EGRs)を有する。
IHO系における古典量子対応は、初期系光子数だけでなく、位相空間における初期状態の中央位置にも依存している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 07:39:49 GMT)
Quantum information capacity in a 1D topological system [0.0] 1次元Su-Schrieffer-Hegger(SSH)トポロジカル絶縁体の温度効果について検討した。
熱アンサンブルのための量子情報処理(QIP)能力に着目した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:01:18 GMT)
Quadratic Modelings of Syndrome Decoding [0.0] 本稿では,2次方程式系に対する有界重みと完全重み付きシンドローム復号問題(SDP)の高度化について述べる。
我々は,SDPインスタンスを$mathbbF_q$で方程式系に変換する新しい手法を導入し,それらの多様体の次元を徹底的に検討する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:36:02 GMT)
Putting the Iterative Training of Decision Trees to the Test on a Real-World Robotic Task [0.0] 過去の研究では、強化学習タスクのエージェントとして決定木(DT)を訓練する方法を開発した。
このアルゴリズムをロボットタスクの現実的な実装に初めて適用する。
本研究は,DRLエージェントの性能に適合するDTを生成することにより,実世界のタスクに適用可能であることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:48:49 GMT)
Promoting Cooperation in the Public Goods Game using Artificial Intelligent Agents [0.0] 計算進化モデルを用いて、AIエージェントがプレイヤーの動作を模倣した場合のみ、協調のための重要なシナジー閾値が低下することがわかった。
このことは、人間のプレイヤーを模倣するAIエージェントを設計することで、AIを活用して社会的ジレンマにおける集団的幸福を促進することができることを示唆している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 22:16:21 GMT)
Project Report: Requirements for a Social Robot as an Information Provider in the Public Sector [0.0] 我々はヒューマノイド社会ロボットを公的な環境に統合するための応用シナリオを考案した。
我々は,対応するロボットアプリケーションを開発し,キール市議会とともにプロジェクトの初期試験と評価を行った。
このプロジェクトで得られた最も重要な洞察の1つは、自然言語処理能力を持つヒューマノイドロボットが、ユーザーにとってずっと好まれていることであった。
本稿では、ACT-Rの認知アーキテクチャとロボットとの連携を提案し、ACT-Rモデルをロボットアプリケーションとのインタラクションに利用して、人間とロボットの対話を認知的に処理し、強化する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:07:06 GMT)
Probing the contents of semantic representations from text, behavior, and brain data using the psychNorms metabase [0.0] テキスト,行動,脳データから得られた意味表現の類似性と相違について検討した。
我々は、人間の表現や行動を把握するためのテキストの重要な補完として行動を確立する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:44:20 GMT)
Plentiful Jailbreaks with String Compositions [0.0] 大規模言語モデル(LLM)は、多くの敵攻撃やジェイルブレイクメソッドに対して脆弱なままである。
我々のチームは、これらのエンコーディングベースの攻撃を拡張し、それらを可逆的な文字列変換のフレームワークに統合した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:39:13 GMT)
Phonon-mediated quantum gates in trapped ions coupled to an ultracold atomic gas [0.0] 我々は,極低温の原子ガスの存在下での捕捉されたイオン間のフォノンを介するクビット-クビット相互作用のダイナミクスについて検討した。
原子-イオン散乱長を調整すれば、イオンの冷却速度を調整できる。
また、原子-イオン相互作用や原子浴の性質を量子的に測定するためにも用いられる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 12:56:54 GMT)
Path distributions for describing eigenstates of the harmonic oscillator and other 1-dimensional problems [0.0] 波動関数を記述する積分式が記述されている。
得られた式は定常位相解析の一般化を用いて解析することができる。
幾分広い分布が見出され、古典的なエネルギーに対応する運動量の値でピークに達する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:30:16 GMT)
Partial Wavefunction Collapse Under Repeated Weak Measurement of a non-Conserved Observable [0.0] 量子非分解(QND)測定の2つの目印は、測定可能な$A$の期待値のアンサンブルレベルの保存である。
非QND条件下では、QND様の振舞いは依然として生じうるが、二次可観測物の振舞いでは$B$と呼ばれる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 17:58:38 GMT)
PCTreeS: 3D Point Cloud Tree Species Classification Using Airborne LiDAR Images [0.0] 樹種の分布に関する現在の知識は、フィールドにおける手動データ収集に大きく依存している。
近年の研究では、光検出とランキング(LiDAR)画像を用いた最先端のディープラーニングモデルにより、様々な生態系における樹木種の正確かつスケーラブルな分類が可能であることが示されている。
本稿では,(1)熱帯サバンナの樹木分類にディープラーニングの枠組みを適用し,(2)地上のLiDAR画像よりも解像度が低いがスケーラビリティの高い空中LiDAR画像を用い,(3)視覚変換モデル(PCTree)に3D点雲画像を直接供給するアプローチを導入する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:09:52 GMT)
Opus: A Large Work Model for Complex Workflow Generation [0.0] Opusは、複雑なビジネスプロセスアウトソーシング(BPO)ユースケースに適したタスクの生成と最適化のためのフレームワークである。
このアプローチでは、クライアント入力、クライアント出力、プロセス指向コンテキストのアライメントとして定義されたインテンションから実行ファイルを生成します。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 06:05:59 GMT)
Optimization of the sensitivity of a temperature sensor based on germanium-vacancy color center (GeV) in diamond [0.0] ダイヤモンド中のGeV色中心に基づく温度センサは、科学と工業の分野で大きな注目を集めている。
元々のセンサー設計は、ゼロフォノン線のスペクトル特性の測定に頼っていた。
最近、二色鏡でGeV放射を分割し、2つの信号の比に基づいて温度を決定する改良されたアプローチが導入された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:24:51 GMT)
Optimization for the propagation of a multiparticle quantum walk in a one-dimensional lattice [0.0] 古典的ランダムウォークにおける線形時間スケーリングを上回り、位置分布のばらつきの2次時間スケーリングを持つ離散時間量子ウォークによって単一の粒子が伝播できることが知られている。
本研究では, 複数粒子の位置分布の長期的変化について検討し, 粒子間の位置分布の最大分散を導出するために, コイン状態の解析的最適化を行った。
興味深い結果として、最適化されたコイン状態は、2つの非連結な完全部分グラフからなるグラフによって特徴づけられる特定の交換対称性を持つ。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:37:27 GMT)
Optimal control of a Bose-Eintein Condensate in an optical lattice: The non-linear and the two-dimensional cases [0.0] 光学格子における原子ボース・アインシュタイン凝縮体の最適制御を数値的に研究する。
我々はポントリャーギンの最大原理からそのようなアルゴリズムを構築する方法を示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:42:18 GMT)
On estimates of the Bures distance between bosonic Gaussian states [0.0] これらの境界はバーズ距離に適応し、従ってバーズ距離よりもバーズ距離での状態推定と学習に適応する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:16:28 GMT)
On Process Awareness in Detecting Multi-stage Cyberattacks in Smart Grids [0.0] 本研究は,スマートグリッドにおける侵入検出の促進におけるプロセス認識の役割について考察する。
この研究は、IT、OT、ETレイヤをカプセル化した共シミュレーション環境を利用して、サイバー攻撃をモデル化し、機械学習ベースのIDS戦略を評価する。
この結果は、スマートグリッド環境における高度なIDSベンチマークとデジタルツインデータセットのさらなる開発の重要性を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:59:02 GMT)
Nonlocality-Assisted Enhancement of Error-Free Communication in Noisy Classical Channels [0.0] ゼロエラー容量ゼロのノイズのある古典的なチャネルは、2-2mの非局所相関によって補助されたときに1ビットの情報を送信することができる。
ゼロエラー容量ゼロのチャネルを識別するが、対応する極端非局所相関によって支援された場合、ログmビットの情報を完全送信できる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:01:47 GMT)
Non-rotational measures in the Bargmann space, and entanglement of bipartite squeezed coherent states [0.0] 2つの複素変数の正則エルミート関数によって生じる二部分断状態の絡み合いについて検討した。
2粒子量子力学系を開発した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:56:47 GMT)
NoLoR: An ASR-Based Framework for Expedited Endangered Language Documentation with Neo-Aramaic as a Case Study [0.0] この言語の死は、アラマ語話者の子孫にとって不名誉な損失となる。
本稿では,この絶滅危惧言語の文書化を高速化するASRモデルを開発し,我々はNoLoRと呼ぶ新しいフレームワークで戦略を一般化する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:15:53 GMT)
Natural Probability [0.0] 本稿では、純粋量子システム内の古典的情報をモデル化しようとする試みに基づいて、確率の新しい物理理論をスケッチする。
我々は、時空で局所化された射影演算子を用いて符号化された量子情報に重点を置いて、ズレックの量子ダーウィン理論のバージョンを用いて古典的な情報をモデル化する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:04:57 GMT)
Mutual information chain rules for security proofs robust against device imperfections [0.0] 我々は、敵に追加情報を漏らす不完全なデバイスを用いて量子暗号を解析する。
これらの結果は、デバイスに依存しない様々なプロトコルやデバイスに依存しないプロトコルにおいて、デバイス不完全性を扱うために使用できることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 20:01:34 GMT)
Modeling Task Immersion based on Goal Activation Mechanism [0.0] ひとつのタスクの過剰な刺激は、タスク外のイベントを見渡すなど、欠点がある。
本研究では,過度に増大した覚醒がタスク遷移を困難にする覚醒力学の計算モデルを構築した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:12:47 GMT)
Modeling High-Dimensional Dependent Data in the Presence of Many Explanatory Variables and Weak Signals [0.0] 本稿では,多数の説明変数が利用可能であり,信号対雑音比が低い場合に,高次元依存データをモデル化する手法について考察する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:54:31 GMT)
Minimalistic and Scalable Quantum Reservoir Computing Enhanced with Feedback [0.0] 量子Reservoir Computing (QRC) は、量子システムを利用して、例外的な効率とエネルギー消費の削減で複雑な計算タスクを実行する。
単一モード光キャビティ内の2レベル原子を数個だけ利用し,連続量子測定と組み合わせた最小主義QRCフレームワークを提案する。
このフレームワークは、ハードウェアサイズとエネルギー消費を最小限にするため、QRCの目的を満たす。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 23:44:46 GMT)
Maxwell's demon across the quantum-to-classical transition [0.0] マクスウェルの悪魔が作り出したシナリオでは、微視的な自由度に関する情報は熱力学の第2法則に反するように見える。
我々は、両方のドメインで操作できるマクスウェルのデーモンの実装について研究する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:49:45 GMT)
Light-induced magnetic trapping for cold alkali atoms using a combined optical tweezers and nanofibre platform [0.0] 光ナノファイバーからの光誘起磁場を用いた8,7$Rbの低温原子の磁気トラップ法を提案する。
光ツイーザーのガウスモードとラゲール・ガウスモードのトラップポテンシャルをプロットしプロットする。
両光場のパワーを制御することにより、数百ナノメートルのトラップ位置が変化することを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 06:55:13 GMT)
Leveraging Bi-Focal Perspectives and Granular Feature Integration for Accurate Reliable Early Alzheimer's Detection [0.0] アルツハイマー病(英: Alzheimer's disease、AD)は、何百万人もの患者で毎年診断される、最も一般的な神経変性疾患である。
従来のCNNは画像中の大量の低レベル情報を抽出できるが、高レベルの極小粒子を抽出することができない。
本稿では,異なるスケールでの情報抽出と効率的な情報フローを組み合わせた新しいグラニュラー特徴統合手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:51:41 GMT)
Learning Hidden Physics and System Parameters with Deep Operator Networks [0.0] 隠れた物理を発見し、スパース測定から未知のシステムパラメータを識別するのに適した2つの革新的なニューラル演算子フレームワークを紹介した。
最初のフレームワークは、人気のあるニューラルネットワークであるDeepONetと、物理インフォームドニューラルネットワークを統合して、スパースデータと基礎となる物理の関係を捉え、支配方程式のファミリーの正確な発見を可能にする。
第2のフレームワークはシステムパラメータの同定に重点を置いており、スパースセンサー測定で事前訓練されたDeepONetを活用して、物理制約された逆モデルの初期化を行う。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:44:59 GMT)
Krylov Complexity in Mixed Phase Space [0.0] 我々は、Krylov複雑性が量子カオスの信頼性マーカーとして一貫して現れることを示した。
その結果、クリロフ複雑性は量子カオスの強力な診断として確立される。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:27:54 GMT)
Improving analytical color and texture similarity estimation methods for dataset-agnostic person reidentification [0.0] ノイズ低減のためのヒストグラムスムーシングを用いて,CIE-Lab色空間の色を解析・比較する。
テクスチャ解析のために,新しい事前構成潜在空間 (LS) 教師付きオートエンコーダ (SAE) を提案する。
提案手法の有効性は,Market1501データセット上のランク1,ランク10,mAPリIDメトリクスを用いて検証する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:34:32 GMT)
Hybrid deep additive neural networks [0.0] 加算回帰という概念を取り入れた新しいディープニューラルネットワークを導入する。
我々のニューラルネットワークは、Kolmogorov-Arnoldネットワークとアーキテクチャ上の類似点を共有しているが、よりシンプルで柔軟なアクティベーションと基底関数に基づいている。
我々はそれらの普遍近似特性を導出し、シミュレーション研究と実データ応用を通してその効果を実証する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:41:19 GMT)
How many lives does Schrödinger's cat have? [0.0] マクロ性という分野は、死猫や生き猫のようなマクロ的な重ね合わせが存在するかという疑問に対する答えを提供することを目的としている。
我々は、可視化と直感的な説明とともに、学生が死と生きているという重畳状態にある段ボールの細胞から独自のマクロな量子猫を作成できるハンズオン活動を提供しています。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:01:52 GMT)
Hardware-Algorithm Re-engineering of Retinal Circuit for Intelligent Object Motion Segmentation [0.0] 我々は、哺乳類網膜の基本的な視覚的特徴であるOMS(Object Motion Sensitivity)に焦点をあてる。
イメージセンサの内部にOMS機能を実装する新しいCMOS回路を提案する。
提案するCMOS回路設計の機能と再構成性は,180nm 技術におけるCadence シミュレーションにより検証する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:31:55 GMT)
Get It Right: Improving Comprehensibility with Adaptable Speech Expression of a Humanoid Service Robot [0.0] 本研究では,人型社会ロボットPepperを用いた公共サービス環境における顧客支援のケーススタディについて検討する。
この情報を簡単な言語に翻訳したり、他の音声言語に翻訳したりすることで、受信した情報の知性を向上させるアプリケーションアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:14:25 GMT)
Gauge-Fixing Quantum Density Operators At Scale [0.0] 非平衡量子系の理論、アルゴリズム、シミュレーションを提供する。
量子密度演算子の表現に関連する仮想自由度を解析的および数値的に検討する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:32:46 GMT)
Follow the money: a startup-based measure of AI exposure across occupations, industries and regions [0.0] 既存のAIの職業曝露対策は、技術的実現可能性に基づいて人間の労働を代用または補うAIの理論的可能性に焦点を当てている。
我々は,O*NETとスタートアップが開発したAIアプリケーションからの職業的記述に基づく,新たな指標であるAISE(AI Startup Exposure)指標を紹介する。
我々の発見は、AIの採用は、AIアプリケーションの技術的実現可能性と同様に、社会的要因によって徐々に形成されていくことを示唆している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:25:05 GMT)
Fast Laplace transforms on quantum computers [0.0] 我々はQuantum Laplace Transform (QLT)を導入し、$lceil log_2(N)rceil$-qubitsで符号化された量子状態上の$Ntimes N$離散Laplace変換の実装を可能にする。
多くの場合、関連する量子回路は、$N$を$O(log(N))$としてスケールする深さを持ち、$O(log(N))$としてスケールする大きさを持ち、指数関数的に少ない演算と、古典的な演算よりも双指数的に少ない計算時間を必要とする。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:44:00 GMT)
Execution-time opacity control for timed automata [0.0] タイムドオートマトンにおけるタイミングリークは、攻撃者がタイムドビヘイビアを観察して秘密を推論できるときに起こりうる。
実行時の不透明さにおいて、攻撃者は実行時間だけを観察して、プライベートな場所が訪れたかどうかを推定することを目的としている。
TAが実行時に制御可能かどうかを判断して不透明性を確保することができることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 02:14:05 GMT)
Exact Model Reduction for Continuous-Time Open Quantum Dynamics [0.0] 有限次元多体量子系を時間非依存ハミルトニアン方程式とマルコフマスター方程式によって記述する。
本稿では,初期条件の集合や観測可能な関心事の時間発展を再現する,より小さな次元の縮小モデルを構築するための体系的手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:00:58 GMT)
Enlargement of symmetry groups in physics: a practitioner's guide [0.0] ウィグナーの分類は、射影ユニタリ表現が量子力学において顕著な役割を果たすという洞察を導いた。
本稿では、拡大群のユニタリ表現として射影ユニタリ表現を記述するためのステップバイステップガイドを提供する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:19:18 GMT)
Enhancing fidelity in teleportation of a two-qubit state via a quantum communication channel formed by spin-1/2 Ising-Heisenberg trimer chains due to a magnetic fieldxx [0.0] 2つの独立スピン-1/2イジング・ハイゼンベルク三量体鎖は、絡み合った2量子状態の量子テレポーテーションに有効なプラットフォームを提供する。
任意の2量子状態の量子テレポーテーションの効率は、中程度の磁場によって著しく向上することができる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:14:19 GMT)
Enhancing Dynamic CT Image Reconstruction with Neural Fields and Optical Flow [0.0] 偏微分方程式に基づく動的逆問題に対する明示的運動正規化器の導入の利点を示す。
また、ニューラルネットワークをグリッドベースの解法と比較し、前者はPSNRで後者より優れていることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 12:53:57 GMT)
Enhanced sensing of Stark weak field under the influence of Aubry-André-Harper criticality [0.0] 局在化-非局在化遷移は、パラメータ推定における量子増強感度を達成するためのリソースとして利用することができる。
局所化-非局在化遷移ポテンシャルの異なるクラスを利用することで、パラメータ推定の精度を大幅に向上できることを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:41:25 GMT)
Engineering qubit dynamics in open systems with photonic synthetic lattices [0.0] 我々は,大域的ユニタリ力学とシステムを含む量子演算の正確なマッピングを確立する。
位相誤差や脱分極といった一般的なノイズ過程をシミュレートすることで,この手法を実験的に検証する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:27:58 GMT)
Encryption-Aware Anomaly Detection in Power Grid Communication Networks [0.0] スマートグリッドへの移行により、電力システムは高度なサイバー脅威に対してより脆弱になった。
本研究は、統計と機械学習を用いて不規則なパターンを識別する暗号化電力グリッドシステムの低レベル通信層に焦点を当てている。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:58:56 GMT)
Employee Well-being in the Age of AI: Perceptions, Concerns, Behaviors, and Outcomes [0.0] この研究は、AIが従業員の知覚、仕事の満足度、メンタルヘルス、維持をいかに形作るかを調べる。
AIシステムの透明性は、信頼とポジティブな従業員の態度を促進する重要な要因として現れます。
この研究は、AI職の幸福なインタラクションフレームワークを紹介している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 06:07:44 GMT)
Elucidating microstructural influences on fatigue behavior for additively manufactured Hastelloy X using Bayesian-calibrated crystal plasticity model [0.0] 結晶塑性モデリング(CPモデリング)は材料の機械的挙動を予測する重要なツールである。
本稿では,疲労負荷条件下での最適CPモデルパラメータの同定に最適化(BO)を用いる頑健な手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:46:37 GMT)
DrIFT: Autonomous Drone Dataset with Integrated Real and Synthetic Data, Flexible Views, and Transformed Domains [0.0] 本稿では,ドメインシフト下での視覚的ドローン検出のためのDriIFTデータセットを提案する。
DrIFTには14の異なる領域があり、それぞれが視点の変化、合成から現実のデータ、季節、悪天候を特徴としている。
我々は不確実性を認識しないドメイン適応法においてMCDOマップを使用し、SOTA非教師付きドメイン適応法よりも優れた性能を示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:47:55 GMT)
Distributing quantum correlations through local operations and classical resources [0.0] この不協和によって特徴づけられるグローバル量子相関は、情報キャリアの混合状態を用いて量子メモリに分散することができる。
リソース状態が相関するデフォーカスノイズを発生させると,さらに不協和が生じることが示される。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 00:46:35 GMT)
Dimensionality reduction for closed-loop quantum gate calibration [0.0] ゲートキャリブレーションにおけるパラメータ空間の次元性を低減するための系統的手法を提案する。
我々はこの手法を用いて、振幅と変形誤差に対して頑健な$X_pi/2$ゲートの設計と校正を行う。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 18:00:07 GMT)
Designing a Secure, Scalable, and Cost-Effective Cloud Storage Solution: A Novel Approach to Data Management using NextCloud, TrueNAS, and QEMU/KVM [0.0] 本稿では,NextCloud,TrueNAS,QEMU/KVMを統合することにより,クラウドストレージの課題に対する新たなアプローチを提案する。
我々の研究は、この組み合わせが、様々なアプリケーションに適した堅牢で柔軟な、経済的クラウドストレージシステムをどのように生み出すかを実証している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:48:44 GMT)
Dephasing-Induced Distribution of Entanglement in Tripartite Quantum Systems [0.0] 貯水池メモリは、マルチパーティント絡みに影響を及ぼすデコヒーレンスダイナミクスを弱める手段を提供する。
量子系の非コヒーレンスに対する堅牢性は、絡み合いの分布に依存することを示す。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:22:50 GMT)
DPGIIL: Dirichlet Process-Deep Generative Model-Integrated Incremental Learning for Clustering in Transmissibility-based Online Structural Anomaly Detection [0.0] 本研究では、クラスタリングのためのディリクレプロセス深層生成モデル統合インクリメンタルラーニング(DPGIIL)を提案する。
DGMの潜在空間に先立ってDPMMを導入することで、DPGIILは抽出された潜在表現の相違を自動的に捕捉し、生成モデリングとクラスタリングの両方を可能にする。
2つのケーススタディにより、提案手法は、構造異常の検出とクラスタリングにおける最先端のアプローチより優れていることが示された。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 05:18:58 GMT)
Cross-modal semantic segmentation for indoor environmental perception using single-chip millimeter-wave radar raw data [0.0] 室内環境認識のための単一チップミリ波レーダ(mmWave)を用いたクロスモーダルセマンティックセマンティックセマンティクスモデルを提案する。
高品質なラベルを効率よく取得するために、LiDAR点雲と占有グリッドマップを用いた自動ラベル生成方法を導入する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 14:02:59 GMT)
Comprehensive Analysis and Improvements in Pansharpening Using Deep Learning [0.0] 本稿では,従来型および深層学習に基づくパンシャーピング手法を包括的に分析する。
我々は、ジェネレータ損失関数の新しい正規化手法を導入することで、PSGANフレームワークの強化を提案する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 09:55:37 GMT)
Comparison of Open-Source and Proprietary LLMs for Machine Reading Comprehension: A Practical Analysis for Industrial Applications [0.0] 大規模言語モデル(LLM)は、最近、様々な自然言語処理(NLP)アプリケーションで顕著な性能を示した。
本稿では,オープンソースLLMとプロプライエタリモデルの比較分析を行う。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 21:24:16 GMT)
Bayesian sequential design of computer experiments for quantile set inversion [0.0] 複素数値シミュレータのようなシステムを表現する未知の多変量関数を考える。
我々の目的は、確率が与えられた閾値未満の出力につながる決定論的入力のセットを推定することである。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:56:04 GMT)
BadGPT-4o: stripping safety finetuning from GPT models [0.0] モデルを劣化させることなくGPT-4oの安全ガードレールを切断するQiなど2023の簡易微調整法について述べる。
BadGPT攻撃はHarmBenchとStrongREJECTで最高のホワイトボックスのジェイルブレイクと一致している。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 13:56:36 GMT)
Another look at inference after prediction [0.0] 予測ベース(PB)推論は、関心の結果が得られにくいアプリケーションではますます使われている。
予測駆動推論(PPI)推定器の統計的効率について検討した。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 15:34:08 GMT)
Analysing the cultural dimensions of cybercriminal groups -- A case study on the Conti ransomware group [0.0] 本研究では,人間の行動や相互作用の文化的側面を分析することによって,脅威俳優グループをプロファイリングするための新たな要素を提案する。
本研究では,ハフステデ文化分類の6次元と,ランサムウェアグループContiの漏洩内部通信におけるMeyer分類の8次元をテーマ分析した。
このようなアプリケーションからの洞察は、第一に、サイバー犯罪と戦うのを補助し、第二に、ニュアンスによるサイバー攻撃の帰属プロセスに対する信頼のレベルを提供することができる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 12:46:49 GMT)
Americans' Support for AI Development -- Measured Daily with Open Data and Methods [0.0] 私はそれを行う最初のオープンソースシステムを提示します。
自動システムは、毎日、調査項目に対する新しい人間の反応を収集し、マイクロデータを匿名化し、公開し、公開可能なWebダッシュボードを通じて分析を提示する。
2024-11-17年時点で、システムは1日当たり214の支持率を自動生成していた。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:27:05 GMT)
Achieving Group Fairness through Independence in Predictive Process Monitoring [0.0] 予測プロセス監視は、特定のケースの結果を予測するなど、進行中のプロセス実行の将来の状態を予測することに焦点を当てる。
近年,この領域における機械学習モデルの適用は科学的な注目を集めている。
この研究は、独立性の調査による予測プロセス監視におけるグループフェアネス、すなわち、センシティブなグループメンバーシップによる予測が影響を受けないことを保証する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 10:10:47 GMT)
Accurate early detection of Parkinson's disease from SPECT imaging through Convolutional Neural Networks [0.0] パーキンソン病(PD)の早期かつ正確な診断は臨床的に重要な課題である。
本研究では、SPECT画像の特徴を用いて機械学習モデルを構築し、早期PDおよびSWEDD被検体を正常から検出する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 16:14:02 GMT)
A simple model for longitudinal electron transport during and after laser excitation: Emergence of electron resistive transport [0.0] レーザー駆動の電子輸送は、数十年にわたって大きな注目を集めてきた。
光伝搬方向に電子を操る磁場であることを示す。
我々は、電子がレーザー励起後に一定の抵抗で減速する抵抗輸送の概念を導入する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 01:06:10 GMT)
A Machine Learning Algorithm for Finite-Horizon Stochastic Control Problems in Economics [0.0] 深層ニューラルネットワークに基づく有限水平制御問題を解くための機械学習アルゴリズムを提案する。
アルゴリズムには3つの特徴がある:(1)高次元(例えば100次元以上)と有限水平時間不均一な制御問題、(2)各反復における性能改善の単調性、そして(3)ベルマン方程式に依存しない。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 08:49:54 GMT)
A Localized Reality Appears To Underpin Quantum Circuits [0.0] 量子回路の挙動を局所的に説明できる証拠を提示する。
状態が大規模に絡み合っているとしても、弱い値は局所回路素子を通過するときにのみ進化する。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 22:35:45 GMT)
A Key Encapsulation Mechanism from Low Density Lattice Codes [0.0] キーカプセル化メカニズム(キーカプセル化メカニズム、英: Key Encapsulation Mechanisms、KEM)は、非対称機構(公開鍵)を用いて対称暗号鍵を提供するように設計された暗号技術である。
本稿では,低密度格子符号(KEM-LDLC)から鍵カプセル化機構の設計と解析に着目し,セキュリティレベルを許容して鍵サイズを下げる。
論文参考訳(メタデータ) (Fri, 06 Dec 2024 11:56:25 GMT)