Fugu-MT: arxivの論文翻訳(概要)

AIM 2024 Challenge on Video Saliency Prediction: Methods and Results [105.1]
本稿では,AIM 2024におけるビデオ・サリエンシ予測の課題について概説する。参加者の目標は、提供されたビデオシーケンスのセットに対して正確な精度マップを予測する方法を開発することであった。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:59:22 GMT)
Multi-modal Auto-regressive Modeling via Visual Words [96.3]
本稿では,視覚的特徴を大規模多モードモデルの語彙上の確率分布にマッピングする視覚トークンの概念を提案する。さらに、LMM内の意味空間における視覚的特徴の分布と、視覚情報を表現するためにテキスト埋め込みを使用することの可能性について検討する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:51:01 GMT)
Editing Factual Knowledge and Explanatory Ability of Medical Large Language Models [89.1]
モデル編集は、大きな言語モデル(LLM)の振る舞いを、特定の知識に関連して正確に変更することを目的としている。このアプローチは、LLMにおける幻覚や時代遅れの情報の問題に対処する上で有効であることが証明されている。しかし、医療分野における知識の修正にモデル編集を用いることの可能性はほとんど解明されていない。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:09:00 GMT)
A Controlled Study on Long Context Extension and Generalization in LLMs [85.5]
広義のテキスト理解とテキスト内学習は、完全な文書コンテキストを利用する言語モデルを必要とする。長期コンテキストモデルを直接訓練する際の実装上の課題のため、長期コンテキストを扱うためにモデルを拡張する多くの方法が提案されている。我々は,一貫したベースモデルと拡張データを利用して,標準化された評価による拡張メソッドの制御プロトコルを実装した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:39:07 GMT)
Toward Efficient Visual Gyroscopes: Spherical Moments, Harmonics Filtering, and Masking Techniques for Spherical Camera Applications [83.9]
視覚ジャイロスコープは、画像を通してカメラの回転を推定する。従来のRGBカメラに比べて視野が広い全方位カメラの統合は、より正確で堅牢な結果をもたらすことが証明されている。本稿では,効率的なマルチマスク・フィルタ回転エステータと学習に基づく最適化を組み合わせた,新しい視覚ジャイロスコープを導入することで,これらの課題に対処する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:07:13 GMT)
A Realistic Simulation Framework for Analog/Digital Neuromorphic Architectures [73.7]
ARCANAは、混合信号ニューロモルフィック回路の特性を考慮に入れたスパイクニューラルネットワークシミュレータである。その結果,ソフトウェアでトレーニングしたスパイクニューラルネットワークの挙動を,信頼性の高い推定結果として提示した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:16:46 GMT)
Speechworthy Instruction-tuned Language Models [71.9]
提案手法は,学習の促進と嗜好の両面において,一般的な命令調整型LLMの音声適合性の向上を図っている。我々は,各手法が生成した応答の音声適合性向上にどのように貢献するかを示すために,語彙的,構文的,定性的な分析を共有する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 02:34:42 GMT)
Adapting Segment Anything Model for Unseen Object Instance Segmentation [70.6]
Unseen Object Instance(UOIS)は、非構造環境で動作する自律ロボットにとって不可欠である。 UOISタスクのためのデータ効率のよいソリューションであるUOIS-SAMを提案する。 UOIS-SAMは、(i)HeatmapベースのPrompt Generator(HPG)と(ii)SAMのマスクデコーダに適応する階層識別ネットワーク(HDNet)の2つの重要なコンポーネントを統合する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:05:50 GMT)
Towards Unified 3D Object Detection via Algorithm and Data Unification [70.3]
我々は、最初の統一型マルチモーダル3Dオブジェクト検出ベンチマークMM-Omni3Dを構築し、上記のモノクロ検出器をマルチモーダルバージョンに拡張する。設計した単分子・多モード検出器をそれぞれUniMODEとMM-UniMODEと命名した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:55:21 GMT)
The BRAVO Semantic Segmentation Challenge Results in UNCV2024 [68.2]
我々は,(1)モデルが様々な摂動にさらされたときの精度とキャリブレーションを反映したセマンティック信頼性,(2)トレーニング中に未知のオブジェクトクラスを検出する能力を測定するOOD信頼性の2つのカテゴリを定義した。その結果、大規模事前学習と最小限のアーキテクチャ設計が、堅牢で信頼性の高いセマンティックセグメンテーションモデルを開発する上で重要であるという興味深い洞察が浮かび上がっている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:17:30 GMT)
MaterialFusion: Enhancing Inverse Rendering with Material Diffusion Priors [67.7]
本稿では,テクスチャと材料特性に先立って2Dを組み込んだ,従来の3次元逆レンダリングパイプラインであるMaterialFusionを紹介する。本稿では,2次元拡散モデルであるStableMaterialについて述べる。種々の照明条件下で, 合成および実物体の4つのデータセット上でのMaterialFusionの照度特性を検証した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:59:06 GMT)
PixWizard: Versatile Image-to-Image Visual Assistant with Open-Language Instructions [66.9]
PixWizardは、画像生成、操作、翻訳を自由言語命令に基づいて行うために設計されたイメージ・ツー・イメージのビジュアルアシスタントである。我々は、様々な視覚タスクを統一された画像テキスト・画像生成フレームワークに取り組み、Omni Pixel-to-Pixel Instruction-Tuningデータセットをキュレートする。我々の実験は、PixWizardが様々な解像度の画像に対して印象的な生成能力と理解能力を示すだけでなく、目に見えないタスクや人間の指示で有望な一般化能力を示すことを示した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:59:46 GMT)
AIM 2024 Sparse Neural Rendering Challenge: Methods and Results [64.2]
本稿では,ECCV 2024と共同で開催されるAIM(Advanceds in Image Manipulation)ワークショップの一部であるスパースニューラルレンダリングの課題についてレビューする。この課題は、スパース画像から多様なシーンを合成する新しいカメラビューを作ることである。参加者は、Pak Signal-to-Noise Ratio (PSNR) 測定によって測定された地中真実像に対する客観的忠実度を最適化するよう依頼される。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:17:40 GMT)
Mixture of Efficient Diffusion Experts Through Automatic Interval and Sub-Network Selection [64.0]
本稿では, 事前学習した拡散モデルを用いて, 効率の良い専門家の混入を図り, サンプリングコストを削減することを提案する。提案手法であるDiffPruningの有効性を,複数のデータセットで示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:27:26 GMT)
CamLoPA: A Hidden Wireless Camera Localization Framework via Signal Propagation Path Analysis [59.9]
CamLoPAは、トレーニング不要の無線カメラ検出およびローカライゼーションフレームワークである。低コストの商用オフ・ザ・シェルフ(COTS)デバイスを使用して、最小限の活動空間制約で運用する。 95.37%のスヌーピングカメラ検出精度と17.23の平均位置誤差を達成する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:23:50 GMT)
UDA-Bench: Revisiting Common Assumptions in Unsupervised Domain Adaptation Using a Standardized Framework [59.4]
現代無監督領域適応法(UDA)の有効性に影響を及ぼす様々な要因について, より深く考察する。分析を容易にするため,ドメイン適応のためのトレーニングと評価を標準化する新しいPyTorchフレームワークであるUDA-Benchを開発した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:57:07 GMT)
AQA: Adaptive Question Answering in a Society of LLMs via Contextual Multi-Armed Bandit [59.1]
質問応答(QA)では、異なる質問を異なる回答戦略で効果的に扱うことができる。本稿では,各質問に対して最適なQA戦略を適応的に選択する動的手法を提案する。提案手法は,複数のモジュールを持つQAシステムの適応的オーケストレーションに有効であることを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:43:06 GMT)
Ternary-Type Opacity and Hybrid Odometry for RGB NeRF-SLAM [58.7]
表面を交差する光線上の点を3つの領域(前・前・後・後)に分類する3成分式不透明度モデルを導入する。これにより、より正確な深度のレンダリングが可能となり、画像ワープ技術の性能が向上する。 TTとHOの統合アプローチは,合成および実世界のデータセット上で最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:48:06 GMT)
Robust Federated Learning Over the Air: Combating Heavy-Tailed Noise with Median Anchored Clipping [57.4]
重み付き雑音による有害な影響に対処するため,メディアアンコールド・クリッピング (MAC) と呼ばれる新しい勾配クリッピング法を提案する。また、MAC下でのアナログオーバー・ザ・エア・フェデレーション学習によるモデルトレーニングの収束率の解析式も導出する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:11:40 GMT)
Style over Substance: Failure Modes of LLM Judges in Alignment Benchmarking [56.3]
ポストトレーニング法は、人間のペアワイズ選好とのより良い対応により、優れたアライメントを主張する。 LLM-judgeの好みは、アライメントのためのより具体的なメトリクスの進捗に変換されますか? 1) LLM判断は, 安全性, 世界知識, 指導の具体的な尺度と相関せず, 2) LLM判断者は, 事実性や安全性を優先して, 強い暗黙の偏見を持ち, 3) PO段階ではなく, 監督された訓練後の微調整段階がアライメントに最も影響を与える。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:58:07 GMT)
DreamSampler: Unifying Diffusion Sampling and Score Distillation for Image Manipulation [55.3]
DreamSampler は任意の LDM アーキテクチャに適用可能なモデルに依存しないアプローチである。蒸留と逆サンプリングの両方が可能で、画像編集と再構築のためのガイダンスが追加されている。既存のアプローチと比較して,DreamSamplerの競合性能を実証する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 06:47:08 GMT)
ReVLA: Reverting Visual Domain Limitation of Robotic Foundation Models [55.1]
既存の3つのロボット基礎モデルの視覚的一般化能力について検討する。本研究は,既存のモデルがドメイン外シナリオに対する堅牢性を示していないことを示す。モデルマージに基づく段階的なバックボーンリバーサルアプローチを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:47:59 GMT)
CUTE: Measuring LLMs' Understanding of Their Tokens [54.7]
大きな言語モデル(LLM)は、様々なタスクにおいて顕著なパフォーマンスを示す。 LLMはどの程度の間、正書法情報を学ぶことができるのか? LLMの正書法知識をテストするために設計されたタスクの集合を特徴とする新しいベンチマークを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:27:03 GMT)
Dumpling GNN: Hybrid GNN Enables Better ADC Payload Activity Prediction Based on Chemical Structure [53.8]
DumplingGNNは、化学構造に基づいてADCペイロードのアクティビティを予測するために特別に設計された、ハイブリッドなグラフニューラルネットワークアーキテクチャである。 DNAトポイソメラーゼIインヒビターに着目した包括的ADCペイロードデータセットで評価を行った。特別なADCペイロードデータセットに対して、例外的な精度(91.48%)、感度95.08%)、特異性(97.54%)を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:11:04 GMT)
V^3: Viewing Volumetric Videos on Mobiles via Streamable 2D Dynamic Gaussians [53.6]
V3 (Viewing Volumetric Videos) は,ダイナミックガウスのストリーミングによる高品質なモバイルレンダリングを実現する,新たなアプローチである。私たちの重要なイノベーションは、ダイナミックな3DGSを2Dビデオと見なすことで、ハードウェアビデオコーデックの使用を促進することです。モバイル端末でダイナミックなガウシアンをストリームする最初の手段として、私たちのコンパニオンプレーヤーは、前例のないボリュームビデオ体験をユーザに提供します。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:04:53 GMT)
Attack Atlas: A Practitioner's Perspective on Challenges and Pitfalls in Red Teaming GenAI [52.1]
生成AI、特に大規模言語モデル(LLM)は、製品アプリケーションにますます統合される。新たな攻撃面と脆弱性が出現し、自然言語やマルチモーダルシステムにおける敵の脅威に焦点を当てる。レッドチーム(英語版)はこれらのシステムの弱点を積極的に識別する上で重要となり、ブルーチーム(英語版)はそのような敵の攻撃から保護する。この研究は、生成AIシステムの保護のための学術的な洞察と実践的なセキュリティ対策のギャップを埋めることを目的としている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:18:10 GMT)
Uniting contrastive and generative learning for event sequences models [51.5]
本研究では,2つの自己指導型学習手法 – 例えば,コントラスト学習と,潜在空間におけるマスクイベントの復元に基づく生成的アプローチ – の統合について検討する。いくつかの公開データセットで行った実験は、シーケンス分類と次点型予測に焦点を合わせ、統合された手法が個々の手法と比較して優れた性能を達成することを示した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:46:00 GMT)
Pre-trained Language Model and Knowledge Distillation for Lightweight Sequential Recommendation [51.3]
本稿では,事前学習言語モデルと知識蒸留に基づく逐次推薦アルゴリズムを提案する。提案アルゴリズムは,推薦精度を高め,タイムリーな推薦サービスを提供する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:39:07 GMT)
Exploring Fine-grained Retail Product Discrimination with Zero-shot Object Classification Using Vision-Language Models [50.4]
スマートリテールアプリケーションでは、多数の製品とその頻繁なターンオーバーは信頼性の高いゼロショットオブジェクト分類方法を必要とする。我々は28の異なる製品カテゴリからなるMIMEXデータセットを紹介した。我々は、提案したMIMEXデータセット上で、最先端ビジョン言語モデル(VLM)のゼロショットオブジェクト分類性能をベンチマークする。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:28:40 GMT)
Methods for Convex $(L_0,L_1)$-Smooth Optimization: Clipping, Acceleration, and Adaptivity [50.3]
我々は、(強に)凸 $(L0)$-smooth 関数のクラスに焦点を当て、いくつかの既存のメソッドに対する新しい収束保証を導出する。特に,スムーズなグラディエント・クリッピングを有するグラディエント・ディフレッシュと,ポリアク・ステップサイズを有するグラディエント・ディフレッシュのコンバージェンス・レートの改善を導出した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:11:37 GMT)
Neural Control Variates with Automatic Integration [49.9]
本稿では,任意のニューラルネットワークアーキテクチャから学習可能なパラメトリック制御関数を構築するための新しい手法を提案する。我々はこのネットワークを用いて積分器の反微分を近似する。我々はウォーク・オン・スフィア・アルゴリズムを用いて偏微分方程式を解くために本手法を適用した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 06:04:28 GMT)
DanceCamAnimator: Keyframe-Based Controllable 3D Dance Camera Synthesis [49.6]
ダンスカメラの動きは、可変長の連続的なシーケンスと、複数のカメラの切り替えをシミュレートする突然の変化の両方を含む。本稿では,この課題をアニメーター検出,合成,ツイーン関数予測という3段階のプロセスとして定式化し,撮影知識を統合することを提案する。この定式化に続いて、人間のアニメーション手順を模倣し、可変長の強力な制御性を示す新しいエンドツーエンドのダンスカメラフレームワーク textbfDanceCamAnimator を設計する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:20:44 GMT)
HOTVCOM: Generating Buzzworthy Comments for Videos [49.4]
この研究は、中国最大のビデオコンテンツデータセットであるtextscHotVComを紹介し、94万の多様なビデオと1億1700万のコメントからなる。また、中国語のビデオデータセット上で、視覚的、聴覚的、テキスト的データを相乗的に統合し、影響力のあるホットコンテンツを生成するtexttComHeatフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:45:13 GMT)
Multi-Modal Generative AI: Multi-modal LLM, Diffusion and Beyond [48.4]
マルチモーダル生成AIは、学術と産業の両方で注目を集めている。理解と生成の両方に統一されたモデルを持つことは可能か?
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:16:09 GMT)
Past Meets Present: Creating Historical Analogy with Large Language Models [46.6]
本稿では,あるイベントに類推された過去の出来事を収集することを目的とした,歴史的類推獲得タスクに焦点を当てる。 LLMが歴史的類推を生成する際に,幻覚やステレオタイプを緩和する自己回帰法を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:52:09 GMT)
From Commands to Prompts: LLM-based Semantic File System for AIOS [46.3]
プロンプト駆動型ファイル管理のためのLSFS(LLM-based semantic file system)を提案する。従来のアプローチとは異なり、LSFSはLLMを組み込んで、ユーザやエージェントが自然言語のプロンプトを通じてファイルと対話できるようにする。実験の結果,LSFSはユーザ利便性,サポート対象関数の多様性,ファイル操作の正確性や効率性の観点から,従来のファイルシステムよりも大幅に改善されていることがわかった。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:39:16 GMT)
Preventing Rowhammer Exploits via Low-Cost Domain-Aware Memory Allocation [46.3]
Rowhammerは、最新のDRAMベースのメモリを持つすべてのシステムの中心にあるハードウェアセキュリティの脆弱性である。 C Citadelは、Rowhammerの初期セキュリティエクスプロイトを防ぐ新しいメモリアロケータ設計である。 C Citadelは数千のセキュリティドメインを、平均7.4%のメモリオーバーヘッドでサポートし、パフォーマンスを損なわない。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:41:14 GMT)
Agents in Software Engineering: Survey, Landscape, and Vision [46.0]
大規模言語モデル(LLM)は目覚ましい成功を収め、下流の様々なタスクで広く使われてきた。 LLMとソフトウェア工学(SE)を組み合わせた多くの研究では、明示的にも暗黙的にもエージェントの概念が採用されている。本稿では,知覚,記憶,行動の3つの重要なモジュールを含む,SE における LLM ベースのエージェントのフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:55:07 GMT)
Anomaly Detection from a Tensor Train Perspective [45.0]
本稿では,データセットの異常検出のためのテンソルネットワークに一連のアルゴリズムを提案する。これらのアルゴリズムは、圧縮中の通常のデータ構造を保存し、異常なデータ構造を削除している。我々は,これらの手法の有効性を数値で検証し,Olivettiはデータセットとサイバーセキュリティデータセットを用いてサイバー攻撃を判定する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:55:58 GMT)
Adaptive Multi-head Contrastive Learning [44.2]
対照的な学習では、異なる拡張によって生成された元のイメージの2つのビューが正のペアと見なされる。単射影ヘッドによって提供される単一の類似度測定は、正と負のサンプル対を評価する。適応型マルチヘッドコントラスト学習(AMCL)は,いくつかの一般的なコントラスト学習手法に適用し,実験的に拡張することができる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:33:17 GMT)
Transfer-based Adversarial Poisoning Attacks for Online (MIMO-)Deep Receviers [44.1]
本稿では,オンラインレシーバーに対するトランスファーベースの逆毒攻撃手法を提案する。攻撃対象の知識がなければ、摂動はパイロットに注入され、オンラインのディープレシーバーに毒を盛る。シミュレーションの結果,提案した毒殺攻撃はオンライン受信機の性能を著しく低下させることが示唆された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 06:07:32 GMT)
AIM 2024 Sparse Neural Rendering Challenge: Dataset and Benchmark [43.8]
異なるレンダリングは、シーンの密集した視点のカバレッジに依存します。ほんのわずかのインプットビューが利用できる場合、多くの課題が発生する。スパースレンダリング文学における繰り返し発生する問題は、均一で最新のデータセットと評価プロトコルがないことである。 DTU MVSデータセットのセットアップに従う新しいデータセットを導入する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:10:06 GMT)
Fair Enough? A map of the current limitations of the requirements to have fair algorithms [43.6]
我々は、社会が自動意思決定システムから要求しているものと、この要求が現実のシナリオで実際に意味しているものとの間には、因果関係があることを論じる。自動意思決定システムにおける公正性の増大に具体的な意味を与えるため、社会として対応しなければならない重要なオープンポイントの集合を概説する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:20:12 GMT)
Cross-Domain Latent Factors Sharing via Implicit Matrix Factorization [43.4]
CDIMFは、ALSによる標準的な暗黙の行列分解をクロスドメインシナリオに拡張するモデルである。産業データセットに関する実験は、コールドスタートとウォームスタートの両方においてCDIMFの競合性能を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:50:35 GMT)
Do Large Language Models have Problem-Solving Capability under Incomplete Information Scenarios? [43.0]
大規模言語モデル(LLM)の不完全情報シナリオ下での問題解決能力の評価はますます重要である。本論では,「潜入者」と「二十問」を基にしたブレインキングという新作ゲームを紹介する。 LLMは、限定されたイエスまたはノーの質問と潜在的な誤解を招く答えを持つターゲットエンティティを識別する必要がある。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:18:02 GMT)
Speech-Copilot: Leveraging Large Language Models for Speech Processing via Task Decomposition, Modularization, and Program Generation [42.6]
Speech-Copilotは、命令指向の音声処理タスクのためのモジュラーフレームワークである。事前にコンパイルされたタスク命令を分析することで、音声処理固有のツールセットを構築する。プログラム生成を通じてタスクを実行する大きな言語モデルに基づく柔軟なエージェントを備えている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:45:04 GMT)
Holding Secrets Accountable: Auditing Privacy-Preserving Machine Learning [42.2]
プライバシ保護機械学習を監査するためのMPCフレームワークであるArcを紹介した。我々のフレームワークの中核となるのは、大規模な簡潔なコミットメントに対してMPC入力を効率的に検証するための新しいプロトコルです。我々は、一貫性プロトコルをインスタンス化する際のフレームワークの性能を評価し、ハッシュベースおよびホモモーフィック・コミットベースのアプローチと比較する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:04:43 GMT)
Evaluating ML Robustness in GNSS Interference Classification, Characterization \& Localization [42.1]
ジャミング装置は、グローバルナビゲーション衛星システム(GNSS)からの信号を妨害することで重大な脅威をもたらす周波数スナップショット内の異常の検出は、これらの干渉を効果的に対処するために重要である。本稿では,制御されたマルチパス効果を含む大規模環境下での干渉をキャプチャする広範囲なデータセットを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:20:33 GMT)
Open-CRB: Towards Open World Active Learning for 3D Object Detection [40.8]
LiDARによる3次元物体検出は,最近,能動学習(AL)によって著しく進歩した。ストリーミングポイントクラウドが未知または新しいオブジェクトを含む実世界のデプロイメントでは、そのようなオブジェクトをキャプチャする現在のALメソッドが探索されていない。本稿では,3次元物体検出のためのオープンワールドアクティブラーニング(OWAL-3D)という,より実践的で困難な研究課題について検討する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 04:48:30 GMT)
Structure-based Drug Design with Equivariant Diffusion Models [40.7]
本稿では,タンパク質ポケットに新しい条件を付加したSE(3)-同変拡散モデルDiffSBDDを提案する。我々のサイリコ実験では、DiffSBDDが地上の真実データの統計を効果的に捉えていることが示されています。これらの結果は、拡散モデルが従来の方法よりも正確に構造データの複雑な分布を表すという仮定を支持する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:31:01 GMT)
S$^2$AG-Vid: Enhancing Multi-Motion Alignment in Video Diffusion Models via Spatial and Syntactic Attention-Based Guidance [40.5]
既存のテキスト・トゥ・ビデオ(T2V)モデルは、単一のモーションを実行する単一のオブジェクトを特徴とする単純なシーンに焦点を当てている。課題は、異なる動きを持つ複数の物体を含むシナリオで発生し、しばしば被写体とその対応する動きの間の誤ったビデオテキストアライメントを引き起こす。トレーニング不要な推論ステージ最適化手法である textbfS$2$AG-Vid を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:56:03 GMT)
Human Hair Reconstruction with Strand-Aligned 3D Gaussians [39.3]
従来のヘアストランドと3Dガウスの二重表現を用いた新しいヘアモデリング手法を提案する。ヒトのアバターをモデル化するための非構造ガウス的アプローチとは対照的に,本手法は3Dポリラインや鎖を用いて髪を再構築する。提案手法はGaussian Haircutと呼ばれ, 合成シーンと実シーンで評価し, ストランドベースヘア再構築作業における最先端性能を実証する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:49:46 GMT)
Phantom of Latent for Large Language and Vision Models [39.3]
モデルサイズ0.5B,1.8B,3.8B,7Bパラメータを持つ新しい効率的なLLVMファミリーPhantomを提案する。 LLVMは、物理的モデルのサイズを大幅に増加させることなく、潜在言語に関するよりビジョン的な知識を、より深く検討し、理解する準備を整えます。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 05:19:06 GMT)
Human4DiT: 360-degree Human Video Generation with 4D Diffusion Transformer [38.9]
1枚の画像から高品質でコヒーレントな人間ビデオを生成するための新しい手法を提案する。本フレームワークは,グローバル相関を捉える拡散変圧器の強度と,正確な条件注入を行うCNNの強度を組み合わせたものである。我々は,360度リアルでコヒーレントな人間のモーションビデオを合成する手法の能力を実証した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:52:01 GMT)
An Incremental Unified Framework for Small Defect Inspection [38.8]
Incremental Unified Framework(IUF)を提案し、パイプラインに新しいオブジェクトを継続的に統合する場合に、機能衝突の問題を軽減することができる。最先端のトランスフォーマーを用いて、異なるセマンティックバウンダリを規定するために、OASA(Object-Aware Self-Attention)を導入する。本手法は, 動的かつスケーラブルな産業検査に欠かせない, 最先端の性能を実現する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 04:08:05 GMT)
FusionRF: High-Fidelity Satellite Neural Radiance Fields from Multispectral and Panchromatic Acquisitions [38.6]
光学的未処理衛星画像からのニューラルレンダリング地形再構成手法であるFusionRFを導入する。我々は,WorldView-3衛星のマルチスペクトル・パンクロマティック衛星画像について,各地における評価を行った。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:38:03 GMT)
Gaps or Hallucinations? Gazing into Machine-Generated Legal Analysis for Fine-grained Text Evaluations [38.3]
LLM(Large Language Models)は、法律分析を行う専門家のための文書作成支援である。 LLMは、非専門職や既存のテキスト評価指標によって認識しにくい方法で、この設定で幻覚を起こすことが多い。厳密な誤った意味での幻覚とは対照的に、中性的なギャップの概念を導入し、人間による記述と機械による法的な分析の違いを言及する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:06:25 GMT)
MODEL&CO: Exoplanet detection in angular differential imaging by learning across multiple observations [37.8]
ほとんどの後処理法は、対象の観測自体から核分裂のモデルを構築している。本稿では,教師付き深層学習技術を利用して,複数観測のアーカイブからニュアンスモデルを構築することを提案する。本稿では,提案手法をVLT/SPHERE機器から得られた複数のデータセットに適用し,高精度なリコールトレードオフを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:22:45 GMT)
End-to-End Graph Flattening Method for Large Language Models [37.5]
グラフをLarge Language Models (LLM) の自然言語に変換する一般的な実践は、優れた一般化性と解釈可能性を示している。人間の認知的推論の習慣に触発されて,エンド・ツー・エンドDAG-Path prompting (EEDP) と呼ばれるLCMに適合するグラフ平坦化法を提案する。実世界のデータセットでの実験では、EEDPは長距離シナリオにおけるLLMの推論性能を高めつつ、短距離シナリオにおける優れたパフォーマンスを維持している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:28:47 GMT)
KISS-Matcher: Fast and Robust Point Cloud Registration Revisited [37.4]
我々はtextitKISS-Matcher という,ポイントクラウド登録のためのオープンソースライブラリを開発した。 KISS-Matcherは、古典的なファストポイント特徴ヒストグラム(FPFH)を改善する新しい特徴検出器、textitFaster-PFHを組み合わせた。さらに、$k$コアベースのグラフ理論プルーニングを採用して、外れ値対応を拒否する際の時間的複雑さを低減している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 23:39:03 GMT)
Stalactite: Toolbox for Fast Prototyping of Vertical Federated Learning Systems [37.1]
本稿では,VFL(Vertical Federated Learning)システムのためのオープンソースのフレームワークであるemphStalactiteを紹介する。 VFLはデータサンプルが複数のデータ所有者にまたがる機能によって分割されるFLの一種である。実世界のレコメンデーションデータセットでその使い方を実証する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:29:03 GMT)
Asynchronous Local-SGD Training for Language Modeling [37.0]
局所勾配降下(Local-SGD)は、各デバイスが通信毎に複数のSGD更新を行う分散最適化のアプローチである。この研究は、言語モデルをトレーニングするための非同期ローカル-SGDについて実証的研究を行い、SGDのステップが完了した直後に、各ワーカーがグローバルパラメータを更新する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:49:33 GMT)
Probing multi-mobility edges in quasiperiodic mosaic lattices [36.6]
モビリティエッジ(ME)は、ローカライゼーション物理学を理解する上で重要な概念である。本稿では,複数のMEを示す単一システムの可能性を示す実験的な証拠を提供する。単一サイトインジェクションと障害レベルの走査により,変調格子のMEを概ね調査することができた。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:44:26 GMT)
MoWE-Audio: Multitask AudioLLMs with Mixture of Weak Encoders [36.5]
本稿では,弱いエンコーダの混合物をAudioLLMフレームワークに組み込むことを提案する。 MoWEは、ベースエンコーダに比較的軽量なエンコーダのプールを補足し、音声入力に基づいて選択的にアクティベートし、モデルサイズを大幅に増大させることなく特徴抽出を強化する。実験の結果,MoWEはマルチタスク性能を効果的に向上し,AudioLLMsの多様なオーディオタスクへの適用性を高めた。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 03:04:27 GMT)
Energy-Aware Federated Learning in Satellite Constellations [36.4]
衛星コンステレーションにおけるフェデレーション学習は、グローバルに接続されたインテリジェンスを実現するための有望な技術である。この計算集約的なタスクに必要なエネルギーは、太陽パネルまたは衛星が地球の影にある場合の内部バッテリーによって提供される。コンバージェンス速度に影響を与えることなく、バッテリ使用量を最小限に抑えることを目的とした、衛星FLのための新しいエネルギー対応計算時間スケジューラを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:01:17 GMT)
Multi-Fidelity Bayesian Optimization With Across-Task Transferable Max-Value Entropy Search [36.1]
本稿では,現在のタスクに関する情報を取得する必要性と,将来的なタスクに伝達可能な情報を集めることのバランスをとる新しい情報理論獲得機能を提案する。提案手法は,十分なタスク数を処理すると,最適化効率を大幅に向上できることを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:10:44 GMT)
Ditto: Elastic Confidential VMs with Secure and Dynamic CPU Scaling [36.0]
Elastic CVM"とWorker vCPU設計は、より柔軟で費用対効果の高い機密計算環境を実現するための道を開いた。 Elastic CVM"とWorker vCPUの設計は、クラウドリソースの利用を最適化するだけでなく、より柔軟で費用対効果の高い機密計算環境の道を開く。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:52:10 GMT)
Robust Training Objectives Improve Embedding-based Retrieval in Industrial Recommendation Systems [35.4]
自己教師付きマルチタスク学習(SSMTL)は、埋め込み学習における学術ベンチマークにおいて強い性能を示している。我々は、テクノロジーセクターのソーシャルメディアプラットフォーム上で、大規模な友人推薦システムを通じて、堅牢なトレーニング目標、特にSSMTLを用いて評価する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 03:12:33 GMT)
NeurLZ: On Enhancing Lossy Compression Performance based on Error-Controlled Neural Learning for Scientific Data [35.4]
大規模科学シミュレーションは、ストレージとI/Oに挑戦する巨大なデータセットを生成する。我々は、科学データのための新しいクロスフィールド学習およびエラー制御圧縮フレームワークNeurLZを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:30:35 GMT)
TextToon: Real-Time Text Toonify Head Avatar from Single Video [34.1]
乾燥可能なトーン化アバターを生成するためのTextToonを提案する。短い単眼ビデオシーケンスとアバタースタイルに関する命令が与えられた場合,本モデルは高忠実度トーン化アバターを生成することができる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:04:45 GMT)
ReLoo: Reconstructing Humans Dressed in Loose Garments from Monocular Video in the Wild [33.8]
ReLooは、モノラルなインザワイルドビデオから、ゆるい服を着た人間の高品質な3Dモデルを再構築する。まず、布を被った人間を神経内装と外装に分解する層状神経人間表現を構築した。グローバルな最適化は、多層異なるボリュームレンダリングにより、人体と衣服の形状、外観、変形を共同で最適化する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:58:39 GMT)
Quantum sensing of acceleration and rotation by interfering magnetically-launched atoms [33.7]
磁気的に起動された原子干渉計をベースとした小型の冷間原子加速度計ジャイロスコープのアーキテクチャを提案する。 700ppmのジャイロスコープスケールファクターを1日で安定させ,加速速度と回転速度のバイアス安定性は7×10-7$m/s$2/s,4×10-7$rad/sは2日間の統合後に到達した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:37:44 GMT)
A Preliminary Study of o1 in Medicine: Are We Closer to an AI Doctor? [33.7]
OpenAIのo1は、強化学習戦略を使ったチェーン・オブ・ソート技術を使った最初のモデルとして際立っている。本報告では、様々な医療シナリオにおけるo1の総合的な探索を行い、理解、推論、多言語性という3つの重要な側面について検討する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:59:43 GMT)
SiT: Exploring Flow and Diffusion-based Generative Models with Scalable Interpolant Transformers [33.2]
Diffusion Transformers (DiT) のバックボーン上に構築された生成モデル補間フレームワークは、2つの分布を標準拡散モデルよりも柔軟な方法で接続することができる。 SiT は条件付き ImageNet 256x256 と 512x512 ベンチマークで DiT を均一に上回っている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:59:41 GMT)
Can CLIP Count Stars? An Empirical Study on Quantity Bias in CLIP [32.7]
われわれはCLIPの量バイアスを実験的に検討した。実験の結果,CLIP埋め込みの量バイアスが,下流タスクの信頼性に影響を与えることが明らかとなった。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:01:16 GMT)
DiLoCo: Distributed Low-Communication Training of Language Models [32.2]
大規模言語モデル(LLM)は、機械学習の多くのアプリケーションにおいて重要なコンポーネントである。 LLMのトレーニングのための標準的なアプローチは、多数の相互接続されたアクセラレータを必要とする。本研究では,低接続のデバイス上での言語モデルのトレーニングを可能にする分散最適化アルゴリズムDiLoCoを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:41:27 GMT)
Probabilistically Aligned View-unaligned Clustering with Adaptive Template Selection [32.1]
異なる視点から同一ターゲットのインスタンス間でのクロスビュー対応(CVC)は、一貫した表現を熱心に導き出すための重要な前提条件である。本稿では、ビューアンアライメントクラスタリングのための二部グラフパラダイムに置換導出手法を統合することを提案する。具体的には、両部グラフで一貫したアンカーとビュー固有グラフを学習し、不整合グラフに適用した置換を導出する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:30:09 GMT)
Stochastic interpolants with data-dependent couplings [31.9]
補間剤の枠組みを用いて、ベースとターゲット密度を補間する方法を定式化する。これらのトランスポートマップは、標準的な独立な設定に類似した単純な2乗損失回帰問題を解くことで学習可能であることを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:38:43 GMT)
Revise, Reason, and Recognize: LLM-Based Emotion Recognition via Emotion-Specific Prompts and ASR Error Correction [31.7]
本研究では、音響学、言語学、心理学から感情固有の知識を取り入れた新しいプロンプトを提案する。 LLMトレーニングスキームの有用性を検討するために,文脈認識学習,文脈内学習,指導訓練の実験を行った。本研究の目的は、感情認識および関連ドメインにおけるLLMの使用を改善することである。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:07:06 GMT)
Dynamic Integration of Task-Specific Adapters for Class Incremental Learning [31.7]
非典型的なクラスインクリメンタルラーニング (NECIL) では、モデルがスクラッチからリトレーニングしたり、古いタスクインクリメンタルを格納したりすることなく、新しいクラスを継続的に取得できる。本稿では,タスク特化アダプタ統合(TSAI)とパッチレベルモデルアライメントという,タスク特化アダプタの動的統合(DIA)という新しいフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:01:33 GMT)
RWKV-CLIP: A Robust Vision-Language Representation Learner [31.5]
コントラスト言語-画像事前学習(CLIP)は、様々な視覚言語タスクのパフォーマンスを大幅に改善した。本稿では,Large Language Models(LLM)を利用して,Webベースのテキスト,合成キャプション,検出タグからコンテンツを合成・洗練する多種多様な記述生成フレームワークを提案する。 RWKV-CLIPは,変換器の効果的な並列学習とRNNの効率的な推論を組み合わせた,最初のRWKV駆動型視覚言語表現学習モデルである。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 06:19:44 GMT)
MTP: A Dataset for Multi-Modal Turning Points in Casual Conversations [30.9]
感情的なアウトバーストや会話中の意思決定の変化といった重要な瞬間は、人間の行動とその結果の変化を理解するために不可欠である。我々の研究は、これらの瞬間をターンポイント(TP)として焦点をあてた、新しい問題設定を導入する。我々は,これらの転換点における感情,行動,視点,決定の光度の高い変化について,正確なタイムスタンプ,説明,および視覚的テキスト的証拠を提供する。また,現状の視覚言語モデルを用いて,映像や大規模言語モデルから物語を構築し,回転点の分類と検出を行うフレームワークTP Mavenを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:26:08 GMT)
Speaking in Wavelet Domain: A Simple and Efficient Approach to Speed up Speech Diffusion Model [30.8]
Denoising Diffusion Probabilistic Models (DDPM)は、様々な生成タスクにおいて主要なパフォーマンスを達成した。音声信号自体を変更することにより、DDPMのトレーニング/推論速度と性能を向上させることが可能か? 本稿では、生成対象をウェーブレット領域に単純にリダイレクトすることで、音声DDPMのトレーニング速度と推論速度を2倍にする。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 22:57:44 GMT)
MIMAFace: Face Animation via Motion-Identity Modulated Appearance Feature Learning [30.6]
動作レベルと同一性レベルの両方でCLIP特徴を変調する動き入出力学習モジュール(MIA)を導入する。また、クリップ間の時間関係をモデル化するICA(Inter-Clip Affinity Learning Module)を設計する。提案手法は, 表情と視線を正確に制御し, 忠実なアイデンティティを保存し, クリック内時間的整合性を維持するアニメーション映像を生成する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:33:53 GMT)
Semi-supervised Learning For Robust Speech Evaluation [30.6]
音声評価は、自動モデルを用いて学習者の口頭習熟度を測定する。本稿では,半教師付き事前学習と客観的正規化を活用することで,このような課題に対処することを提案する。アンカーモデルは、発音の正しさを予測するために擬似ラベルを用いて訓練される。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 02:11:24 GMT)
ToxiCraft: A Novel Framework for Synthetic Generation of Harmful Information [30.3]
Toxicraftは有害な情報のデータセットを合成するための新しいフレームワークである。少量のシードデータだけで、我々のフレームワークは多種多様な合成データを生成することができるが、驚くほど現実的であり、有毒な情報の例である。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 06:36:57 GMT)
Knowledge Planning in Large Language Models for Domain-Aligned Counseling Summarization [30.3]
大規模言語モデル(LLM)は、様々な生成タスクにおいて顕著な能力を示す。メンタルヘルスの専門家はまず、要約を書く際にドメイン知識を適用する計画だ。構造化知識のアライメントを編成する新しい計画エンジンを導入する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:01:31 GMT)
RMCBench: Benchmarking Large Language Models' Resistance to Malicious Code [30.2]
LLMが悪意のあるコード生成に抵抗する能力を評価する研究はない。我々は、悪意のあるコード生成に抵抗する能力を評価するために、11の代表的なLCMについて実証的研究を行った。以上の結果から,現在のLLMは,テキスト・ツー・コード・シナリオでは平均40.36%,コード・ツー・コード・シナリオでは11.52%の拒否率で,悪意のあるコード生成に抵抗する能力に限界があることが示唆された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:03:26 GMT)
FedGCA: Global Consistent Augmentation Based Single-Source Federated Domain Generalization [30.0]
Federated Domain Generalization (FedDG) は、多ドメイントレーニングサンプルでドメインを見落とせるように、グローバルモデルをトレーニングすることを目的としている。連合学習ネットワークのクライアントは、固有のサンプリングと時間制限のため、単一のIIDドメインに制限されることが多い。本稿では,FedGCA(Federated Global Consistent Augmentation)法について紹介する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 02:24:46 GMT)
Evaluating Theory of (an uncertain) Mind: Predicting the Uncertain Beliefs of Others in Conversation Forecasting [29.9]
対話における他者の不確実性をモデル化するために,新たなタスクスイート,挑戦言語モデル(LM)を提案する。我々は、インターロケータ自体を予測者とみなし、インターロケータの不確実性を予測するようLMに求めている。 LMは、他者の不確実性に最大7%のばらつきを説明できるが、タスクの難しさと将来の仕事の余地を強調している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:05:25 GMT)
Deep Cost Ray Fusion for Sparse Depth Video Completion [29.5]
スパース深度ビデオ補完のための学習ベースフレームワークを提案する。隣り合うコストボリュームの重なり合った1対の光線に対して、注意機構を効果的に活用するRayFusionを導入する。我々のフレームワークは、さまざまな屋内および屋外データセットに対する最先端のアプローチを一貫して上回るか、あるいはライバルする。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:42:16 GMT)
Speech2rtMRI: Speech-Guided Diffusion Model for Real-time MRI Video of the Vocal Tract during Speech [29.5]
音声中の人間の声道のMRIビデオにおいて,音声を視覚的に表現するデータ駆動方式を提案する。先行知識に埋め込まれた大規模な事前学習音声モデルを用いて、視覚領域を一般化し、見当たらないデータを生成する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:19:24 GMT)
FastGL: A GPU-Efficient Framework for Accelerating Sampling-Based GNN Training at Large Scale [29.3]
グラフニューラルネットワーク(GNN)は、非ユークリッドグラフデータに対して大きな優位性を示している。我々は,大規模なGNNのサンプリングベーストレーニングを高速化するGPU効率のフレームワークであるFastGLを提案する。 FastGLは、最先端フレームワークであるPyG、DGL、GNNLabに対して平均11.8x、2.2x、1.5xのスピードアップを達成することができる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:45:47 GMT)
Location is Key: Leveraging Large Language Model for Functional Bug Localization in Verilog [29.0]
本稿では,Verilogスニペット内の機能的エラーを検出するオープンソースLLMソリューションであるLocation-is-Keyを提案する。 Pass@1のローカライゼーション精度は、RTLLMに基づくテストデータセットで93.3%で、GPT-4の77.9%を超え、Claude-3.5の90.8%に匹敵する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:38:53 GMT)
Semantic Inference-Based Deep Learning and Modeling for Earth Observation: Cognitive Semantic Augmentation Satellite Networks [28.7]
本稿では,地球観測衛星ネットワークにおける意味コミュニケーションの枠組みについて述べる。認知的セマンティック処理と衛星間リンクを統合することにより、マルチスペクトル衛星画像の解析と伝送を強化する。このエンドツーエンドアーキテクチャは、6Gをサポートする次世代衛星ネットワーク向けに調整されている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:42:05 GMT)
Pathfinder for Low-altitude Aircraft with Binary Neural Network [28.3]
以前のグローバルトポロジマップ(例えば、OpenStreetMap, OSM)は、地上移動ロボットによる自律的マッピングの性能を高めることができる。本稿では,低高度航空機が搭載する空中センサを用いたOSMメーカを提案する。 OSMメーカーの中核は、LiDARとカメラデータに基づく、新しい効率的なパスファインダーアプローチである。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 01:29:58 GMT)
(De)-regularized Maximum Mean Discrepancy Gradient Flow [27.7]
本稿では,最大平均離散(DrMMD)とワッサーシュタイン勾配流の正則化を導入する。 DrMMDフローは、連続時間と離散時間の両方において、広範囲の目標に対して、同時にニア・グロバル収束を保証することができる。我々の数値スキームは、フロー全体を通して適応的な非正規化スケジュールを使用して、離散化誤差と$chi2$の規則からの逸脱を最適にトレードオフする。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:57:42 GMT)
EFUF: Efficient Fine-grained Unlearning Framework for Mitigating Hallucinations in Multimodal Large Language Models [27.7]
ペア化データなしで幻覚を除去する,効率的な粒度の未学習フレームワーク(EFUF)を提案する。本手法は, 高い計算オーバーヘッドで生成品質を保ちながら, 幻覚を常に低減する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 02:05:02 GMT)
Novel Gradient Sparsification Algorithm via Bayesian Inference [27.2]
本稿では,誤り蓄積の学習速度スケーリングを制御する,正規化Top-$k$(RegTop-$k$)と呼ばれる新しいスペーシフィケーションアルゴリズムを提案する。 CIFAR-10のResNet-18による数値実験では、RegTop-$k$は標準のTop-$k$よりも8%高い精度で達成されている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:42:34 GMT)
PSS-BA: LiDAR Bundle Adjustment with Progressive Spatial Smoothing [27.1]
本稿では, プログレッシブ空間平滑化によるLiDARバンドル調整について述べる。提案手法の有効性とロバスト性をシミュレーションと実世界のデータセットで検証した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:43:17 GMT)
Leveraging Discourse Structure for Extractive Meeting Summarization [26.8]
本稿では,談話構造を利用したミーティングのための抽出要約システムを提案する。我々は、GNNに基づくノード分類モデルを訓練し、最も重要な発話を選択する。 AMIおよびICSIの実験結果から,本手法が既存のテキストベースおよびグラフベース抽出要約システムを上回ることを示した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:19:13 GMT)
DeMPT: Decoding-enhanced Multi-phase Prompt Tuning for Making LLMs Be Better Context-aware Translators [26.7]
DeMPT(Decoding-enhanced Multi-phase Prompt Tuning)という適応手法を提案する。各フェーズで異なる連続プロンプトを導入し、LLMを様々な情報を識別的にモデル化する。実験の結果,本手法は結合法よりも有意に優れていた。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:30:01 GMT)
SHFL: Secure Hierarchical Federated Learning Framework for Edge Networks [26.5]
Federated Learning(FL)は、プライバシに敏感なアプリケーションのために設計された分散機械学習パラダイムで、リソースに制約のあるデバイス上で、非IdenticallyおよびIndependently Distributed (IID)データで実行される。従来のFLフレームワークでは,クライアントデバイスから受信したすべてのトレーニング済みローカルモデルを集約することで,サーバがグローバルモデルを構築するという,単一レベルの集約プロセスを備えたクライアントサーバモデルを採用しています。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:38:20 GMT)
Enabling Tensor Decomposition for Time-Series Classification via A Simple Pseudo-Laplacian Contrast [26.3]
本稿では, Pseudo Laplacian Contrast (PLC) テンソル分解フレームワークを提案する。データ拡張とラプラシアンのクロスビューを統合し、クラス認識表現の抽出を可能にする。様々なデータセットの実験は、我々のアプローチの有効性を実証している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:48:13 GMT)
Towards Efficient and Robust VQA-NLE Data Generation with Large Vision-Language Models [26.1]
自然言語解説(NLE)は、自然言語の詳細な人間フレンドリーな説明を提供することで、意思決定プロセスの解明を目的としている。自然言語説明データセットを用いた視覚質問応答作成のための既存の手法は、人間のアノテーションに依存している。本稿では,LVLMを用いて高品質な合成VQA-NLEデータセットを効率的に生成する手法を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:59:50 GMT)
Reflecting Reality: Enabling Diffusion Models to Produce Faithful Mirror Reflections [26.0]
拡散型生成モデルを用いて、高現実的で可視なミラー反射を生成する問題に取り組む。これを可能にするために、鏡の前にオブジェクトが置かれた多様な合成シーンの大規模なデータセットであるSynMirrorを作成します。本研究では,高品質な幾何整合性およびフォトリアリスティックミラー反射を生成するミラーフュージョン法を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 02:59:07 GMT)
SpikeGS: Learning 3D Gaussian Fields from Continuous Spike Stream [26.0]
スパイクカメラは、高時間分解能と高ダイナミックレンジなどの利点を提供する特殊な高速視覚センサである。スパイクストリームのみから3次元ガウス場を学習する最初の方法であるSpikeGSを紹介する。本手法は,移動型スパイクカメラで捉えた連続スパイクストリームから,微妙なテクスチャでビュー合成結果を再構成することができる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:28:41 GMT)
Target-Aware Language Modeling via Granular Data Sampling [26.0]
言語モデルの事前訓練は、一般的に幅広いユースケースをターゲットにし、多様なソースからのデータを取り込む。コスト効率が高く簡単なアプローチは、低次元のデータ特徴をサンプリングすることである。事前学習したモデルはRefinedWebの全データと同等に動作し、125Mから1.5Bまでのモデルサイズに対してランダムに選択されたサンプルより優れた性能を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 04:52:17 GMT)
Compositional Neural Textures [25.9]
この研究は、合成ニューラルモデルを用いてテクスチャを表現するための、完全に教師なしのアプローチを導入する。我々は,各テキストを,空間的支持がその形状を近似する2次元ガウス関数と,その詳細な外観を符号化する関連する特徴として表現する。このアプローチは、画像テクスチャから他のイメージへの外観の移動、テクスチャの多様化、テクスチャのバリエーションの明示/修正、編集の伝播、テクスチャアニメーション、ダイレクトテキスト操作など、幅広いアプリケーションを可能にする。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 03:01:59 GMT)
CFVNet: An End-to-End Cancelable Finger Vein Network for Recognition [25.8]
本稿では,セキュアな指静脈認識システムの設計に使用可能な,エンドツーエンドの指静脈ネットワーク(CFVNet)を提案する。局在モジュールは安定な指静脈ROIと一意な指静脈ROIの自動局在を実現する。圧縮モジュールは空間的およびチャネル的冗長性を取り除く。トランスフォーメーションモジュールは、提案したBWR法を用いて、システムに非リンク性、不可逆性、無効性を導入する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:43:44 GMT)
Context-Conditioned Spatio-Temporal Predictive Learning for Reliable V2V Channel Prediction [25.7]
下流タスクの最適化には,V2Vチャネル状態情報(CSI)予測が不可欠である。従来の予測手法は、時間、帯域幅、アンテナ(TX、RX)空間の予測を含む4次元(4D)CSIに重点を置いている。本研究では,4次元CSIデータ内の依存関係をキャプチャするコンテキスト条件付き時間予測学習手法を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 04:50:12 GMT)
MATCH POLICY: A Simple Pipeline from Point Cloud Registration to Manipulation Policies [25.5]
MATCH POLICYは、高精度なピックと配置タスクを解決するパイプラインである。アクション推論をポイントクラウド登録タスクに転送する。非常に高いサンプル効率と、目に見えない構成への一般化性を実現する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:09:43 GMT)
Identify As A Human Does: A Pathfinder of Next-Generation Anti-Cheat Framework for First-Person Shooter Games [25.0]
オンラインゲームでのティーティングは、ゲーム体験の完全性に重大な脅威をもたらす。本稿では,人気ゲームCS:GOのためのサーバサイドFPSアンチチートフレームワークHAWKを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:00:07 GMT)
PackageIntel: Leveraging Large Language Models for Automated Intelligence Extraction in Package Ecosystems [24.9]
PackageIntelは、悪意のあるパッケージインテリジェンスの収集、処理、検索に革命をもたらす新しいプラットフォームである。我々は,21の異なるインテリジェンスリポジトリから生成された20,692のNPMおよびPyPIパッケージを含む包括的データベースを開発した。 PackageIntelは、SnykやOSVのような主要なデータベースよりも平均70%早く脅威を検出し、1インテリジェンスあたり0.094ドルで費用対効果で運用する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:22:53 GMT)
Dual Graph Attention based Disentanglement Multiple Instance Learning for Brain Age Estimation [24.5]
本稿では,DGA-DMIL(Dual Graph Attention based Disentanglement Multi-instance Learning)フレームワークを提案する。次に,双対グラフ注意アグリゲータを提案し,instance内およびinter-instance間関係を利用してバックボーンの特徴を学習する。提案モデルでは,脳年齢推定における異常な精度を示し,英国バイオバンクで2.12年間の絶対誤差を達成した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:53:31 GMT)
ShadowBound: Efficient Heap Memory Protection Through Advanced Metadata Management and Customized Compiler Optimization [24.5]
ヒープの破損はシステムのセキュリティに深刻な脅威をもたらすユニークなヒープメモリ保護設計であるShadowBoundを紹介します。 LLVMフレームワーク上にShadowBoundを実装し、最先端の3つの無防備を統合しました。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:03:05 GMT)
Early alignment in two-layer networks training is a two-edged sword [24.4]
1次最適化手法によるニューラルネットワークのトレーニングは、ディープラーニングの実証的な成功の核心にある。小さな初期化は一般的に、単純な解に対して勾配降下が暗黙的に偏っている特徴学習体制に関連付けられている。この研究は、元来Maennelらによって導入された初期のアライメントフェーズの一般的かつ定量的な記述を提供する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:08:11 GMT)
Evaluating language models as risk scores [23.8]
質問応答 LLM を用いてリスクスコアを生成するソフトウェアパッケージである folktexts を紹介する。提案した5つのベンチマークタスクにまたがって17の最近のLCMを評価した。複数選択質問応答によるゼロショットリスクスコアは高い予測信号を持つが、広く誤校正されている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:46:48 GMT)
Scideator: Human-LLM Scientific Idea Generation Grounded in Research-Paper Facet Recombination [23.5]
我々は、科学的思考のための新しい混合開始ツールであるSideatorに貢献する。ユーザが提供する論文セットから、Sideatorはこれらおよび関連する論文からキーファセット(目的、メカニズム、評価)を抽出する。またSideatorは、ユーザーが文学を検索することで、アイデアの斬新さを判断するのに役立つ。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 00:09:34 GMT)
Method of Equal Shares with Bounded Overspending [23.2]
境界超過(BOS等分)による等分法の導入 BOS Equal Sharesは、厳密な比例保証に固有の非効率性に対処するが、元の等式共有方法と同様、優れた比例性を提供する。分析の過程では、プロジェクトの部分的な資金提供を可能にする方法の分数変種についても論じる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:30:25 GMT)
Learning the Target Network in Function Space [23.1]
Lookahead-Replicate (LR) は新しい値関数近似アルゴリズムである。 LRは値関数の学習において収束挙動をもたらすことを示す。また、LRベースのターゲットネットワーク更新により、Atariベンチマークの深いRLが大幅に改善されることを示す実験結果を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 02:43:55 GMT)
TeeRollup: Efficient Rollup Design Using Heterogeneous TEE [23.0]
本稿では,低ガスコストと短時間の退避遅延を有する効率的なロールアップ設計であるTeeRollupを紹介する。以上の結果から,TeeRollupはゼロ知識ロールアップ(zkロールアップ)に優れ,オンチェーン検証コストが約86%削減され,離脱遅延が数分に短縮された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 01:15:03 GMT)
MECURY: Practical Cross-Chain Exchange via Trusted Hardware [23.0]
MERCURY(MERCURY)は,オンライン・クライアントの要求なしに信頼性を最小化し,効率の良い暗号通貨取引所である。 MERCURYは、それぞれ67.87%、45.01%、47.70%のコスト削減を実現している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 00:52:13 GMT)
Reinforcement Feature Transformation for Polymer Property Performance Prediction [22.9]
既存の機械学習モデルは、低品質のポリマーデータセットによるポリマー表現を効果的に学習する際の課題に直面している。本研究は, 最適かつ説明可能な記述子表現空間を再構築することにより, 高分子特性性能予測タスクの改善に焦点をあてる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 23:42:18 GMT)
A comprehensive study of on-device NLP applications -- VQA, automated Form filling, Smart Replies for Linguistic Codeswitching [22.8]
2つのカテゴリに3つの新しい体験を提案する。まず、画面理解に活用できる体験について議論する。拡張可能な2つ目のカテゴリは、多言語話者をサポートするスマートリプライである。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:28:52 GMT)
Length Optimization in Conformal Prediction [22.7]
我々は,共形予測の原理的枠組みとして,CPL(Conformal Prediction with Length-Optimization)を開発した。 CPLは条件付き妥当性を確保しつつ(ほぼ)最適な長さで予測セットを構築する。実験による評価は, CPLの最先端手法と比較して, 予測セットサイズ性能が優れていることを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:29:35 GMT)
Federated Graph Learning with Adaptive Importance-based Sampling [22.6]
分散グラフデータセットを含むグラフ学習タスクのプライバシ保護には、フェデレーション学習(FL)ベースのGCN(FedGCN)トレーニングが必要である。既存のグラフサンプリング強化FedGCNトレーニングアプローチは、グラフ構造情報や最適化のダイナミクスを無視し、高いばらつきと不正確なノード埋め込みをもたらす。我々は、この制限に対処するために、FedAIS(Federated Adaptive Importance-based Smpling)を提案する。 FedAISはテスト精度を最大3.23%向上し、通信コストと計算コストを91.77%、85.59%削減した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 01:49:20 GMT)
Towards Efficient Neuro-Symbolic AI: From Workload Characterization to Hardware Architecture [22.3]
ニューロシンボリックAIは、解釈可能性、堅牢性、信頼性を高めるニューラルネットワークとシンボリックアプローチを融合して、有望なパラダイムとして出現する。最近のニューロシンボリックシステムは、推論と認知能力を備えた協調的な人間-AIシナリオにおいて大きな可能性を示している。まず, ニューロシンボリックAIアルゴリズムを体系的に分類し, 実行時, メモリ, 計算演算子, 疎結合性, システム特性を実験的に評価し, 解析する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 01:30:12 GMT)
A Survey of Resource-efficient LLM and Multimodal Foundation Models [22.2]
大規模言語モデル(LLM)、ビジョントランスフォーマー(ViT)、拡散、マルチモーダルモデルを含む大規模な基盤モデルは、機械学習ライフサイクル全体に革命をもたらしている。しかしながら、これらのモデルが提供する汎用性と性能の大幅な進歩は、ハードウェアリソースの面でかなりのコストがかかる。この調査は、アルゴリズム的側面とシステム的側面の両方を調べることで、そのような研究の重要さを掘り下げるものである。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:37:34 GMT)
CAMAL: Optimizing LSM-trees via Active Learning [21.9]
機械学習を用いてLSMツリー構造を最適化し、様々な読み取り/書き込み操作の処理コストを削減する。 Camalを完全なシステムRocksDBに統合することにより,最先端のRocksDB設計と比較して,システムパフォーマンスが平均28%,最大8倍向上する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:35:23 GMT)
MediConfusion: Can you trust your AI radiologist? Probing the reliability of multimodal medical foundation models [20.8]
医用ビジュアル質問回答(VQA)ベンチマークデータセットであるMedConfusionを紹介した。現状のモデルは、画像のペアによって容易に混同され、それ以外は視覚的に異なっており、医療専門家にとってはっきりと区別されている。また、医療における信頼性が高く信頼性の高いMLLMの新しい世代の設計に役立つモデル失敗の共通パターンを抽出する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:59:37 GMT)
Parse Trees Guided LLM Prompt Compression [20.6]
本稿では、PartPromptと呼ばれる新しい選択的圧縮手法を提案する。まず、言語規則に基づいて各文のパースツリーを取得し、パースツリーの各ノードのローカル情報エントロピーを算出する。実験によると、PartPromptはさまざまなデータセットで最先端のパフォーマンスを受信している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 06:21:40 GMT)
Electric imaging and dynamics of photo-charged graphene edge [20.5]
フローティンググラフェンフレークの実空間走査マップは、空間分解能が$sim$10 nmで取得された。電場のリアルタイム追跡は、光熱イオン放出過程と放出された電子の再結合過程を検出した。本研究は,グラフェンを用いた一次元ゲートとナノスケール実空間イメージングを用いた光エレクトロニクスの新しい視点を提供する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:53:08 GMT)
Revolutionizing Biomarker Discovery: Leveraging Generative AI for Bio-Knowledge-Embedded Continuous Space Exploration [20.4]
本稿では,2つの重要なモジュールを持つバイオマーカー識別フレームワークを提案する。第1モジュールはマルチエージェントシステムを使用して,バイオマーカーサブセットのペアと,それに対応する予測精度をトレーニングデータとして自動収集する。第2のモジュールは、収集したデータの知識を連続的な空間に圧縮するために、エンコーダ-評価器-デコーダ学習パラダイムを使用する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 23:36:30 GMT)
GNNAnatomy: Systematic Generation and Evaluation of Multi-Level Explanations for Graph Neural Networks [20.1]
本稿では,グラフ分類タスクの多段階説明の生成と評価を目的とした視覚解析システムであるGNNAnatomyを紹介する。 GNNAnatomyは、グラフレット、原始グラフサブ構造を用いて、GNN予測とグラフレット周波数の相関を分析することにより、グラフクラスで最も重要なサブ構造を識別する。社会学・生物学領域からの合成および実世界のグラフデータセットのケーススタディを通して,GNN解剖学の有効性を実証する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:38:54 GMT)
Flash STU: Fast Spectral Transform Units [19.9]
本稿では、スペクトル変換ユニットの効率的でオープンソースのPyTorch実装について述べる。本研究では,言語,ロボット工学,シミュレートされた力学系を含むいくつかのモードにおけるシーケンス予測タスクについて検討する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 00:26:07 GMT)
Cog-GA: A Large Language Models-based Generative Agent for Vision-Language Navigation in Continuous Environments [19.8]
VLN-CE(Vision Language Navigation in Continuous Environments)は、AIのフロンティアである。本稿では,VLN-CEタスクに適した大規模言語モデル(LLM)に基づく生成エージェントであるCog-GAを紹介する。 Cog-GAは、人間のような認知過程をエミュレートするための二重戦略を採用している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 03:18:27 GMT)
Steward: Natural Language Web Automation [19.3]
大規模言語モデル(LLM)は、AIアシスタントの基盤として機能する優れた能力を示している。我々は、低コストでスケーラブルでエンドツーエンドなWebインタラクション自動化ソリューションとして機能するように設計された、新しいLLMベースのWeb自動化ツールであるStewardを紹介します。本稿では,状態表現,アクションシーケンス選択,システム応答性,タスク完了の検出,キャッシュ実装など,さまざまな設計と実装の課題について論じる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:06:32 GMT)
VLM's Eye Examination: Instruct and Inspect Visual Competency of Vision Language Models [19.3]
ビジョン言語モデル(VLM)は、様々なベンチマークで有望な推論能力を示している。本研究では,VLMがどのようにイメージを知覚するかを調べるために,視線検査プロセスを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:15:29 GMT)
Multi-Label Guided Soft Contrastive Learning for Efficient Earth Observation Pretraining [19.1]
土地被覆土地利用製品は、自然界の強い知識を持つビジョン基盤モデルと同様に、自由なグローバルな意味情報を提供する。これらの自由な追加リソースは、一般的なコントラスト学習ボトルネックを解決するだけでなく、EO事前学習の効率と効果を大幅に向上させることを示す。我々は、既存のSOTAモデルよりも11の下流タスクのうち10のタスクにおいて、はるかに優れた結果が得られるマルチスペクトルおよびSAR基盤モデルを作成している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:36:33 GMT)
RACER: Rich Language-Guided Failure Recovery Policies for Imitation Learning [19.0]
本稿では,障害復旧トラジェクトリによる専門家によるデモンストレーションを強化する,スケーラブルなデータ生成パイプラインを提案する。次に、Rich languAge-guided failure reCovERy(RACER)を紹介します。実験の結果,RACERはRLbench上での最先端のロボットビュートランスよりも優れていた。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 02:50:33 GMT)
Do Large Language Models Possess Sensitive to Sentiment? [18.9]
大規模言語モデル(LLM)は、最近、言語理解における異常な能力を示した。本稿では,LLMがテキストモーダルの感情を検知し,反応する能力について検討する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 02:28:27 GMT)
FedSlate:A Federated Deep Reinforcement Learning Recommender System [18.6]
推薦システムにおける長期ユーザエンゲージメントの最適化に強化学習法が用いられている。潜在的な解決策の1つは、さまざまなプラットフォームから集中した場所にデータを集約し、集約されたデータをトレーニングに使用することである。このアプローチは、通信コストの増加やユーザプライバシに対する潜在的な脅威など、経済的および法的懸念を提起する。法的なレベルでの共有が禁止されている情報を効果的に活用する強化学習推薦アルゴリズムである textbfFedSlate を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:10:24 GMT)
VLMine: Long-Tail Data Mining with Vision Language Models [18.4]
この研究は、ラベルなしデータのコーパス内の稀な例を識別する問題に焦点を当てている。本稿では,大規模視覚言語モデル(VLM)に含まれる知識を活用する,シンプルでスケーラブルなデータマイニング手法を提案する。私たちの実験は、ベースライン技術よりも大きな改善(10%から50%)を示しています。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:13:51 GMT)
VLEU: a Method for Automatic Evaluation for Generalizability of Text-to-Image Models [18.3]
VLEU(Visual Language Evaluation Understudy)と呼ばれる新しい指標を導入する。 VLEUは、視覚テキストの限界分布とモデルが生成した画像の条件分布との間のクルバック・リーバーの偏差を計算することにより、モデルの一般化可能性を定量化する。本実験は,様々なT2Iモデルの一般化能力を評価する上で,VLEUの有効性を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 04:50:36 GMT)
Noise Stability Optimization for Finding Flat Minima: A Hessian-based Regularization Approach [18.0]
本稿では,ヘッセン損失行列を効果的に正規化できるアルゴリズムを提案する。提案手法は,CLIPとチェーン・オブ・ファインチューニングデータセットの事前学習における一般化の改善に有効である。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:52:43 GMT)
Handling Long-Term Safety and Uncertainty in Safe Reinforcement Learning [17.9]
安全性は、現実世界のロボットに強化学習技術が配備されるのを防ぐ重要な問題の1つだ。本稿では,安全な探索手法であるATACOMを学習可能な制約で拡張することにより,そのギャップを埋める。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:42:32 GMT)
CITI: Enhancing Tool Utilizing Ability in Large Language Models without Sacrificing General Performance [17.7]
コンポーネントベースツール活用能力注入法(CITI)を提案する。異なるコンポーネントの勾配に基づく重要度スコアによると、CITIは微調整プロセスによって生じる能力衝突を軽減する。実験結果から,本手法は様々な評価指標において優れた性能を発揮することが示された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 05:38:24 GMT)
Revisiting Video Quality Assessment from the Perspective of Generalization [17.7]
YouTube Shorts、TikTok、Kwaiなどの短いビデオプラットフォームは、ユーザー生成コンテンツ(UGC)の急増につながっている。これらの課題は、テストセットのパフォーマンスに影響を与えるだけでなく、異なるデータセットをまたいで一般化する能力にも影響を及ぼす。対向重み摂動は、この景観を効果的に滑らかにし、一般化性能を著しく向上させることができることを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:24:55 GMT)
GlitchProber: Advancing Effective Detection and Mitigation of Glitch Tokens in Large Language Models [17.6]
大規模言語モデル(LLM)は、自然言語処理の分野で前例のない成功を収めた。最近の研究では、モデルの語彙空間に異常トークンのクラスを発見し、それらを「グリッチトークン」と名付けた。本研究では,グリッチトークンの理解を深め,その検出と緩和のための手法を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 03:46:55 GMT)
General Flow as Foundation Affordance for Scalable Robot Learning [17.5]
大規模RGBDビデオデータセットから直接,言語条件付き3次元フロー予測モデルを開発する。提案手法は,ゼロショットの人間とロボットのスキル伝達において,81%の成功率を達成した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:22:04 GMT)
Enabling Resource-Efficient On-Device Fine-Tuning of LLMs Using Only Inference Engines [17.5]
大規模言語モデル(LLM)は、テキスト生成や要約といった様々なタスクの自動化において、例外的な性能を示してきた。現在、LLMは大規模なクラウドサーバ上でトレーニングと微調整が行われていますが、これらのモデルをリソース制約のあるエッジデバイス上で微調整することは、依然として大きな課題です。本稿では,制約環境下での微調整LDMの障壁を低減するため,資源効率の高いゼロ階最適化手法を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:14:09 GMT)
Advancing Video Quality Assessment for AIGC [17.2]
本稿では,平均絶対誤差とクロスエントロピー損失を組み合わせ,フレーム間品質の不整合を緩和する新たな損失関数を提案する。また,モデルの一般化能力を高めるために,敵対的トレーニングを活用しながら,重要なコンテンツを維持するために革新的なS2CNet技術を導入する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:36:22 GMT)
Enhancing Pedestrian Trajectory Prediction with Crowd Trip Information [17.1]
正確な歩行者軌道予測には、個々の行動、社会的相互作用、道路環境の深い理解が必要である。本稿では,歩行者軌道モデルに旅行情報を新たなモダリティとして取り入れた新しいアプローチを提案する。道路網内の群集行動を調べることで,正確な軌道予測による歩行者の安全向上が期待できる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:11:31 GMT)
Mitigating Perspective Distortion-induced Shape Ambiguity in Image Crops [17.1]
単一の画像から3Dを予測するためのモデルは、しばしば関心の対象の周りの作物と連動し、カメラの視野内の物体の位置を無視する。内在性を考慮した位置推定法を提案する。ベンチマーク(KPE)は、画像とカメラの形状における作物の位置に関する情報を組み込んだベンチマークである。 NYUの深度予測、KITTIとnuScenesの3Dオブジェクト検出、ARCTICの3Dオブジェクトの予測という3つの人気のある3D画像ベンチマークの実験は、KPEの利点を示している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:23:07 GMT)
When LLMs Meets Acoustic Landmarks: An Efficient Approach to Integrate Speech into Large Language Models for Depression Detection [17.0]
抑うつは世界的メンタルヘルスにおいて重要な関心事であり、AIに基づく検出方法の広範な研究を促している。大規模言語モデル(LLM)は、メンタルヘルスケアアプリケーションにおいて、その汎用性において際立っている。マルチモーダル抑うつ検出のためのLLMフレームワークに音声情報を統合するための革新的なアプローチを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 22:54:05 GMT)
On The Specialization of Neural Modules [16.8]
本稿では,データセットの有用な構造に特化し,系統的な一般化を実現するネットワークモジュールの能力について検討する。その結果、モジュールの特殊化の難しさ、モジュールの専門化を成功させるために必要なもの、モジュールアーキテクチャの体系化の必要性が明らかになった。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:58:11 GMT)
Mutation-Based Deep Learning Framework Testing Method in JavaScript Environment [16.7]
そこで本研究では,DLJSFuzzerという変異ベースのJavaScript DLフレームワークテスティング手法を提案する。 DLJSFuzzerは21のユニークなクラッシュと126のNaN & Inconsistencyバグを正常に検出する。 DLJSFuzzerはモデル生成効率が47%以上、バグ検出効率が91%以上改善されている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:37:56 GMT)
With Ears to See and Eyes to Hear: Sound Symbolism Experiments with Multimodal Large Language Models [16.6]
視覚言語モデル (VLM) は, 正書法や画像のみからの抽象的推論により, 暗黙的に音による現象を理解できることを示す。我々は,古典的キキ・ブーバやミル・マール形状の再現,等級記号課題などの実験を行った。以上の結果から, VLMは人体ラベルとの一致のレベルが異なることが示され, サイリコ実験ではVLMと人体ラベルとの対応がより重要となる可能性が示唆された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:13:25 GMT)
PROMPTFUZZ: Harnessing Fuzzing Techniques for Robust Testing of Prompt Injection in LLMs [16.3]
大規模言語モデル(LLM)は、人間のようなテキストを生成する強力な能力のため、様々なアプリケーションで広く利用されている。プロンプトインジェクション攻撃は、モデルの最初の命令を悪意のあるプロンプトで上書きし、生成されたテキストを操作する。本稿では,ファジィ技術を利用した新規な試験フレームワークであるProMPTFUZZを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 06:08:32 GMT)
M2OST: Many-to-one Regression for Predicting Spatial Transcriptomics from Digital Pathology Images [16.2]
病理画像の階層構造に対応する多対一回帰変換器M2OSTを提案する。 1対1のイメージラベルペアで訓練された従来のモデルとは異なり、M2OSTはデジタル病理画像の異なるレベルからの複数の画像を使用して、共通の対応する領域における遺伝子発現を共同で予測する。 M2OSTはパラメータが少なく、浮動小数点演算(FLOP)で最先端のパフォーマンスを実現することができる
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:06:37 GMT)
Learning When to Retrieve, What to Rewrite, and How to Respond in Conversational QA [16.1]
シングルターンSELF-RAGフレームワークを構築し,会話設定のためのSELF-multi-RAGを提案する。 SELF-multi-RAGは、関連するパスの検索に関して、シングルターン変種よりも改善された機能を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:05:12 GMT)
Joint State-Channel Decoupling and One-Shot Quantum Coding Theorem [16.1]
平滑化を伴わないワンショット誤差指数を求めるための連立状態チャネル分離手法を提案する。我々は、サンドイッチ化されたR'enyiコヒーレント情報によって与えられる量子チャネル符号化のためのワンショットエラー指数を確立する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:59:16 GMT)
Analyzing Privacy Implications of Data Collection in Android Automotive OS [16.0]
Android Automotive OS(AAOS)は1億台以上の車両に統合されている。この膨大なデータ収集によって、プライバシーはますます重要になっている。本稿では,AAOSのプライバシ含意に焦点をあて,データ収集の性質と範囲,および元の機器メーカー(OEM)のプライバシポリシについて検討する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:35:40 GMT)
FaceVid-1K: A Large-Scale High-Quality Multiracial Human Face Video Dataset [15.9]
我々はtextbfFaceVid-1K という高品質な多人種顔コレクションを作成している。我々は,テキスト・トゥ・ビデオ,画像・トゥ・ビデオ,無条件映像生成など,確立されたビデオ生成モデルを用いて実験を行った。対応するパフォーマンスベンチマークを取得し、公開データセットでトレーニングされたベンチマークと比較し、データセットの優位性を実証する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:27:02 GMT)
History, Development, and Principles of Large Language Models-An Introductory Survey [15.9]
自然言語処理(NLP)の基盤となる言語モデル数十年にわたる広範な研究を経て、言語モデリングは、初期統計言語モデル(SLM)から、大規模言語モデル(LLM)の現代的景観へと進歩してきた。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:12:40 GMT)
Tag Map: A Text-Based Map for Spatial Reasoning and Navigation with Large Language Models [15.5]
大言語モデル(LLM)は、ロボットが共通感覚推論を用いてタスクプランを生成するためのツールとして登場した。最近の研究は、固定された意味クラスを持つ明示的な写像から暗黙的なオープンな語彙マップへと移行している。 LLMと簡単に統合しながら、数千のセマンティッククラスを表現できる明示的なテキストベースのマップを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:26:19 GMT)
Are LLMs Good Annotators for Discourse-level Event Relation Extraction? [15.4]
大規模言語モデル (LLM) は、様々な自然言語処理タスクにおいて習熟度を示す。本研究は, 教師あり学習によって確立されたベースラインと比較して, LLMの顕著な性能低下を明らかにした。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:25:16 GMT)
SpaGBOL: Spatial-Graph-Based Orientated Localisation [15.3]
都市域内のクロスビューなジオローカライゼーションは、現在のデータセットや技術に空間的構造が欠如していることから、部分的には困難である。本稿では,局所的な観測のシーケンスをモデル化するためのグラフ表現の利用と,対象位置の接続性を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:04:29 GMT)
BEV-CV: Birds-Eye-View Transform for Cross-View Geo-Localisation [15.3]
地理的局所化のためのクロスビュー画像マッチングは、空中と地上の視点の視覚的違いが著しく異なるため、難しい問題である。 BEV-CVは2つの重要なノベルティを導入するアプローチであり、クロスビューなジオローカライゼーションの現実的実現性の向上に重点を置いている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:10:25 GMT)
Adaptive Learning on User Segmentation: Universal to Specific Representation via Bipartite Neural Interaction [15.3]
本稿では,情報ボトルネックを通じて汎用ユーザ表現を学習する新しい学習フレームワークを提案する。次に、ニューラルネットワークを通じてセグメンテーション特化あるいはタスク特化表現をマージし、学習する。提案手法は2つのオープンソースベンチマーク、2つのオフラインビジネスデータセットで評価され、ユーザのCVRを予測するために2つのオンラインマーケティングアプリケーションにデプロイされる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:02:23 GMT)
TS-TCD: Triplet-Level Cross-Modal Distillation for Time-Series Forecasting Using Large Language Models [15.3]
本稿では,3段階のクロスモーダルな知識蒸留機構を包括的に導入する新しいフレームワークTS-TCDを提案する。分離されたアライメント技術に焦点を当てた以前の作業とは異なり、私たちのフレームワークは体系的に統合されます。ベンチマークタイムシリーズの実験では、TS-TCDは最先端の結果を達成し、精度と堅牢性の両方で従来の手法より優れていることが示されている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:57:24 GMT)
How Privacy-Savvy Are Large Language Models? A Case Study on Compliance and Privacy Technical Review [15.2]
プライバシ情報抽出(PIE)、法および規制キーポイント検出(KPD)、質問応答(QA)などのプライバシー関連タスクにおいて、大規模言語モデルの性能を評価する。本稿では, BERT, GPT-3.5, GPT-4, カスタムモデルなど, プライバシコンプライアンスチェックや技術プライバシレビューの実行能力について検討する。 LLMは、プライバシーレビューの自動化と規制上の相違点の特定を約束する一方で、法律標準の進化に完全に準拠する能力において、大きなギャップが持続している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 02:30:21 GMT)
A Majorization-Minimization Gauss-Newton Method for 1-Bit Matrix Completion [15.1]
本稿では,Majorization-Minimization Gauss-Newton (MMGN) と呼ばれる新しい1ビット行列補完法を提案する。本手法は,元の最適化問題を標準的な低ランク行列補完問題に変換する偏極最小化原理に基づく。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 23:20:44 GMT)
Back-stepping Experience Replay with Application to Model-free Reinforcement Learning for a Soft Snake Robot [15.0]
Back-stepping Experience Replay (BER)は、任意の外部強化学習アルゴリズムと互換性がある。柔らかいヘビロボットの移動とナビゲーションのためのモデルレスRLアプローチにおけるBERの適用について述べる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 22:58:39 GMT)
Using Game Play to Investigate Multimodal and Conversational Grounding in Large Multimodal Models [14.9]
本稿では,テキストモデルからマルチモーダルモデルへの評価パラダイムを提案する。我々は、視覚情報から状況を表現するためのモデルの能力に挑戦するゲームを定義し、対話を通じてそのような表現を調整する。最大のクローズドモデルは、私たちが定義したゲームでかなりよく機能し、最高のオープンウェイトモデルでさえそれらと苦労している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:07:18 GMT)
Enhancing Aspect-based Sentiment Analysis in Tourism Using Large Language Models and Positional Information [14.9]
本稿では,Aspect-Category-Sentiment Quadruple extract (ACOSQE)のためのアスペクトベース感情分析モデルACOS_LLMを提案する。このモデルは補助知識生成とACOSQEという2つの重要な段階から構成される。その結果、F1は観光データセットの他のモデルと比較して7.49%改善した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:19:17 GMT)
Quantum Optimization: Potential, Challenges, and the Path Forward [14.8]
量子コンピュータの最近の進歩は、ブラトフォース古典シミュレーションを超えるスケールで問題を解決する能力を示している。計算機科学や物理学全般において、主要な最適化問題に対するアプローチは様々である。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:21:25 GMT)
Large Language Model-Enhanced Interactive Agent for Public Education on Newborn Auricular Deformities [14.4]
耳介変形は、心身障害や聴覚障害の長期的悪影響を持つ新生児によく見られる。 Baidu Inc.のErnieの大規模言語モデルの助けを借りて、対話型エージェントの実現を導き出した。アップロードされた画像に対応する耳介変形の種類を検出するのに十分な知能である。耳介変形の知識の普及に関して、このエージェントは両親に病気の専門的な提案をすることができる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 02:10:35 GMT)
FACET: Fast and Accurate Event-Based Eye Tracking Using Ellipse Modeling for Extended Reality [14.1]
イベントカメラは、高時間分解能と低消費電力のため、有望な代替手段を提供する。 FACET(Fast and Accurate Event-based Eye Tracking)は、イベントデータから瞳孔パラメータを直接出力するエンドツーエンドのニューラルネットワークである。改良されたEV-Eyeテストセットでは、FACETは平均瞳孔中心誤差0.20ピクセル、推論時間0.53msを達成する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 22:31:38 GMT)
Neural Differential Appearance Equations [14.1]
本研究では,動的外観テクスチャを時変時空間で再現する手法を提案する。我々は、ニューラルネットワークの常微分方程式を用いて、ターゲットの例から外見の根底となるダイナミクスを学習する。実験の結果,本手法は現実的かつ一貫性のある結果をもたらすことがわかった。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:29:19 GMT)
Towards Real-world Deployment of NILM Systems: Challenges and Practices [13.8]
我々は,エッジクラウドのコラボレーションを通じて,NILMシステムの現実的な適用性を高めるための3層フレームワークを提案する。エッジとクラウドの両方で利用可能な計算資源を考慮すると、エッジに軽量なNILMモデル、クラウドにディープラーニングベースのモデルを実装します。差分モデルの実装に加えて、GunicornとNGINXを統合したNILM固有のデプロイメントスキームも設計する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:54:05 GMT)
Observe Then Act: Asynchronous Active Vision-Action Model for Robotic Manipulation [13.7]
本モデルでは,カメラのNext-Best-View(NBV)ポリシーとグリップのNext-Best Pose(NBP)ポリシーを直列接続し,数発の強化学習を用いてセンサ・モーター協調フレームワークでトレーニングする。このアプローチにより、エージェントは3人称カメラを調整し、タスクゴールに基づいて環境を積極的に観察し、その後に適切な操作行動を推測することができる。その結果,操作タスクにおける視覚的制約処理の有効性を示すとともに,ベースラインアルゴリズムを一貫して上回る結果が得られた。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:38:20 GMT)
Mammo-Clustering:A Weakly Supervised Multi-view Global-Local Context Clustering Network for Detection and Classification in Mammography [13.6]
文脈クラスタリングに基づく乳がん早期検診モデルを提案する。本モデルは, 乳がん検診における医師の負担軽減と, 未発達地域の女性に対する乳がん検診の可能性を高める可能性を示唆する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:17:13 GMT)
Detect, Describe, Discriminate: Moving Beyond VQA for MLLM Evaluation [13.3]
2つの非常に類似した画像を一意に記述する能力により、MLLMが特定の視覚概念をいかによく理解するかを評価する。 D3ベンチマークの一部として247枚の非常に類似した画像ペアをキュレートする。各画像対について、(1)特定の視覚的差を検知し、(2)目的画像を独自に記述し、(3)対象画像を障害者から識別する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:31:25 GMT)
Takin: A Cohort of Superior Quality Zero-shot Speech Generation Models [13.1]
Takin AudioLLMは、主にTakin TTS、Takin VC、Takin Morphingを含む一連の技術とモデルである。これらのモデルはゼロショット音声生成が可能であり、実際の人間の音声とほとんど区別できない高品質な音声を生成する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:25:27 GMT)
3D Hand Pose Estimation in Everyday Egocentric Images [13.0]
我々は、視線歪みと野生における3Dアノテーションの欠如から生じる課題に焦点を当てる。日常の自我中心画像における3次元手ポーズ推定システムWildHandsを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:32:08 GMT)
Rethinking Conventional Wisdom in Machine Learning: From Generalization to Scaling [12.8]
大規模言語の事前学習とスケーリング法則の発見は、機械学習のパラダイムシフトを表している。本稿では,スケール中心の大規模言語モデル (LLM) 時代においてもはや成り立たないような,レギュラー化に基づくいくつかの重要な原則について検討する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:04:03 GMT)
3D Reconstruction of Objects in Hands without Real World 3D Supervision [12.7]
ハンドヘルドオブジェクトを再構築するためのモデル学習をスケールアップするために,3Dインスペクションを活用するモジュールを提案する。具体的には、ビデオから多視点2Dマスクの監視を抽出し、形状収集から3次元形状の前兆を抽出する。我々はこれらの間接的な3次元キューを用いて、単一のRGB画像から物体の3次元形状を予測する占有ネットワークを訓練する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:38:20 GMT)
In-Context Learning May Not Elicit Trustworthy Reasoning: A-Not-B Errors in Pretrained Language Models [12.7]
A-Not-Bエラー(A-Not-B error)は、乳幼児にみられる現象で、よく観察された状態が変化したにもかかわらず、前報の振る舞いを繰り返す現象である。このことは、抑止力の欠如、つまり習慣的または衝動的な反応を止める能力の欠如を浮き彫りにする。 Llama3-8bのような最先端のLLMは、コンテキスト内学習(ICL)と一貫してうまく動作するが、エラーを発生させ、コンテキストが自明に変化すると、タスクの推論において最大83.3%の大幅な低下を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:30:31 GMT)
Beyond Turn-Based Interfaces: Synchronous LLMs as Full-Duplex Dialogue Agents [12.6]
フル同期音声対話モデルのための同期LLMを提案する。実世界の音声対話データをわずか2k時間で有意義で自然な対話を生成するモデルを訓練する。異なるデータセット上で訓練された2つのエージェント間の相互作用をシミュレートすることにより、モデルがフル同期対話に参加する能力を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 23:01:31 GMT)
KARMA: Augmenting Embodied AI Agents with Long-and-short Term Memory Systems [12.5]
エンボディードAIエージェントは、しばしばコンテキスト内メモリの困難に直面し、タスク実行の非効率性とエラーを引き起こす。我々は,長期記憶モジュールと短期記憶モジュールを統合する革新的なメモリシステムであるKARMAを紹介する。この二重メモリ構造により、エージェントは関連する過去のシーン体験を検索し、タスク計画の精度と効率を向上させることができる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:02:46 GMT)
Interpretability-Guided Test-Time Adversarial Defense [12.3]
本稿では,解釈可能性に配慮したニューロン重要度ランキング法を考案し,新規で低コストなテストタイム敵防衛法を提案する。我々の手法は、ロバストネスと精度のトレードオフを大幅に改善できる訓練のないアプローチである。強い適応攻撃下であっても、最先端のテスト時間防御に対して改善(平均1.5%)を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:40:10 GMT)
CANDERE-COACH: Reinforcement Learning from Noisy Feedback [12.2]
CANDERE-COACHアルゴリズムは、非最適教師によるノイズフィードバックから学習することができる。本稿では,教師のフィードバックの最大40%が誤りであった場合,RLエージェントが学習を成功させるためのノイズフィルタリング機構を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:14:12 GMT)
Generalization vs. Specialization under Concept Shift [12.2]
機械学習モデルは、分散シフトの下では不安定であることが多い。二重降下が欠如している場合でも,テスト性能が非単調なデータ依存を示すことを示す。 MNISTとFashionMNISTの実験は、この興味深い挙動が分類問題にも存在することを示唆している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 22:30:28 GMT)
MemBench: Towards Real-world Evaluation of Memory-Augmented Dialogue Systems [12.1]
長期記憶はチャットボットや対話システム(DS)にとって非常に重要であり、研究者は多数のメモリ拡張DSを開発した。彼らはクエリが与えられた事実情報の正確さや生成したレスポンスの難解さだけを測定したが、それはそのパフォーマンスをほとんど反映しなかった。本研究では,認知科学と心理学理論に基づく,記憶のリコールパラダイムを網羅する新しいベンチマークを構築した。メモリベンチマーク(MemBench)は、認知科学における2句理論(メモリ検索、メモリ認識、注入)に基づく2つのタスクを含む。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:38:41 GMT)
Rethinking Emotion Bias in Music via Frechet Audio Distance [11.9]
我々は、音楽感情認識(MER)と感情音楽生成(EMG)の研究を行う。本稿では,Frechet Audio Distance(FAD)と並行して,多様なオーディオエンコーダを用いる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:59:15 GMT)
Research on Dynamic Data Flow Anomaly Detection based on Machine Learning [11.5]
本研究では,非教師なし学習法を用いて動的データフローの異常を同定する。類似したデータをクラスタリングすることで、ラベル付きデータを必要とせずに、通常のトラフィックから著しく逸脱するデータ挙動を検出することができる。特に、不均衡なデータのコンテキストにおいて、堅牢で適応可能なパフォーマンスを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:19:15 GMT)
A Framework for Human Evaluation of Large Language Models in Healthcare Derived from Literature Review [11.3]
我々は、標準化された一貫した人間評価アプローチに対する顕著なニーズを強調します。大規模言語モデル(LLM)の人間評価のための包括的で実践的な枠組みを提案する。このフレームワークは、異なる医療アプリケーションにおけるLCMの信頼性、一般化可能性、適用性を改善することを目的としている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:00:20 GMT)
CSPS: A Communication-Efficient Sequence-Parallelism based Serving System for Transformer based Models with Long Prompts [11.2]
LLM (Long-sequence Generative Large-Language Model) が普及している。提案手法は, 逐次チャンク処理により, TTFT (TimeToFirstToken) が高い結果が得られた。本稿では,テンソル並列性(TP)と非TPの2つのアーキテクチャを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:16:29 GMT)
TACO-RL: Task Aware Prompt Compression Optimization with Reinforcement Learning [11.2]
GPT-4のような大規模言語モデル(LLM)は、最適なパフォーマンスに必要なプロンプトのサイズが急増した。本稿では,RLに基づくタスク認識プロンプト圧縮手法を提案する。我々は,RL誘導圧縮法により,最先端圧縮技術よりもタスク性能が8%から260%向上することが実証された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:40:10 GMT)
Disentanglement with Factor Quantized Variational Autoencoders [11.1]
本稿では,生成因子に関する基礎的真理情報をモデルに提供しない離散変分オートエンコーダ(VAE)モデルを提案する。本研究では, 離散表現を学習する上で, 連続表現を学習することの利点を実証する。 FactorQVAEと呼ばれる手法は,最適化に基づく不整合アプローチと離散表現学習を組み合わせた最初の手法である。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:33:53 GMT)
Generative AI Is Not Ready for Clinical Use in Patient Education for Lower Back Pain Patients, Even With Retrieval-Augmented Generation [11.1]
腰痛 (LBP) は世界の障害の主要な原因である。患者教育戦略の進歩にもかかわらず、LCP患者にパーソナライズされたエビデンスベースの情報を提供することで、大きなギャップが持続する。大規模言語モデル(LLM)と生成人工知能(GenAI)の最近の進歩は、患者教育を強化する可能性を示している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:56:08 GMT)
StableKD: Breaking Inter-block Optimization Entanglement for Stable Knowledge Distillation [11.0]
IBOEを破り、より安定した最適化を実現する新しいKDフレームワークであるStableKDを提案する。他のKD手法と比較して、我々の単純で効果的なStableKDはモデルの精度を1%向上させ、収束を最大10倍に高速化し、トレーニングデータのわずか40%でそれらを上回ります。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:37:35 GMT)
Diffusion-based RGB-D Semantic Segmentation with Deformable Attention Transformer [11.0]
本稿では,RGB-Dセマンティックセグメンテーション問題に対処する拡散型フレームワークを提案する。本研究では,デフォルマブルアテンション変換器をエンコーダとして利用し,奥行き画像から特徴を抽出することにより,デフォルマブルアテンション変換器の特性を効果的に把握できることを実証する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:23:01 GMT)
Apparate: Rethinking Early Exits to Tame Latency-Throughput Tensions in ML Serving [10.9]
本稿では,機械学習モデルにおける早期退避を自動的に適用し,管理するシステムであるApparateを紹介する。 EEがもたらす時間的なオーバーヘッドと正確性に対処するために、Apparateは出口を再利用して継続的なフィードバックを提供する。 CVおよびNLP分類ワークロードの中央値応答レイテンシを40.5--91.5%と10.0--24.2%に下げる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:59:42 GMT)
Vision-Language Navigation with Continual Learning [10.9]
視覚言語ナビゲーション(VLN)は、組み込みインテリジェンスにおいて重要なドメインである。本稿では,この課題に対処するために,ビジョンランゲージナビゲーションと連続学習パラダイムを提案する。このパラダイムでは、エージェントは、以前獲得した知識を維持しながら、新たな環境を漸進的に学習する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 03:17:02 GMT)
Gaussian Déjà-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities [10.8]
本稿では,まず頭部アバターの一般化モデルを取得し,その結果をパーソナライズするガウス的D'eja-vuフレームワークを紹介する。最先端の3Dガウシアンヘッドアバターをフォトリアリスティックな品質で上回り、既存の方法の少なくとも4分の1のトレーニング時間を短縮する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 00:11:30 GMT)
RAM2C: A Liberal Arts Educational Chatbot based on Retrieval-augmented Multi-role Multi-expert Collaboration [10.7]
我々は,このような対話データを自動的に生成する検索型多言語多言語協調フレームワークを設計する。具体的には、まずHTS指導の知識基盤を確立し、スキル、心理学、安全倫理の3つの領域知識を包含する。次に、RAM2Cは、上記の異なる知識ベースによって強化されたLLMを、異なる役割を持つ複数の専門家グループに編成し、HTS準拠の教育対話データセットを生成する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:38:04 GMT)
MICSim: A Modular Simulator for Mixed-signal Compute-in-Memory based AI Accelerator [10.7]
この研究はMICSimを紹介した。MICSimは、チップレベルのソフトウェア性能とCIM(Mixed-signal Compute-in-Memory)アクセラレータのハードウェアオーバーヘッドを評価するために設計された、オープンソースの回路前シミュレータである。 MICSimはモジュラー設計を特徴とし、多層共同設計と設計空間の探索が容易である。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:12:46 GMT)
MGSA: Multi-Granularity Graph Structure Attention for Knowledge Graph-to-Text Generation [10.6]
本稿では,事前学習言語モデル(PLM)に基づくMGSA(Multi-granularity Graph Structure Attention)を提案する。モデルアーキテクチャのエンコーダは、エンティティレベルの構造符号化モジュールと、ワードレベルの構造符号化モジュールと、両方の構造から情報を合成する集約モジュールとを備える。 KG-to-Text GenerationベンチマークデータセットとWebNLG,EventNarrativeを用いて,MGSAモデルの広範な評価を行った。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 04:06:16 GMT)
MAR-DTN: Metal Artifact Reduction using Domain Transformation Network for Radiotherapy Planning [10.5]
頭頸部癌患者では、kVCT(kVoltage tube potentials)を用いた標準CTスキャンの品質は、ストリークアーティファクトによって著しく低下する。いくつかの放射線治療装置は、毎日の患者のセットアップ検証のためにMega-Voltage CT(MVCT)を取得する可能性がある。得られたkVCT画像からアーチファクトフリーのMVT画像を生成することができるディープラーニングベースのアプローチを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:04:00 GMT)
FineCops-Ref: A new Dataset and Task for Fine-Grained Compositional Referring Expression Comprehension [10.5]
Referring Expression (REC) は言語理解能力、画像理解能力、言語と画像の接地能力を客観的に評価する重要なクロスモーダルタスクである。我々は2つの重要な特徴を特徴とする新しいRECデータセットを構築した。これには、既存のデータに基づいて微細な編集と生成によって作成された否定的なテキストと画像が含まれる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 06:56:51 GMT)
Founding Quantum Cryptography on Quantum Advantage, or, Towards Cryptography from #P-Hardness [10.4]
近年の分離により、世襲構造が崩壊しても持続する硬さの源から量子暗号を構築する可能性が高まっている。量子暗号は、$mathsfP#P notsubseteq mathsf(io)BQP/qpoly$という非常に穏やかな仮定に基づいている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:45:33 GMT)
MCTrack: A Unified 3D Multi-Object Tracking Framework for Autonomous Driving [10.4]
本稿では,KITTI, nuScenes, データセット間でのSOTA(State-of-the-art)性能を実現する3Dマルチオブジェクトトラッキング手法であるMCTrackを紹介する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:26:01 GMT)
SocialCircle+: Learning the Angle-based Conditioned Interaction Representation for Pedestrian Trajectory Prediction [10.2]
本論文は,軌道予測ネットワークにおける説明可能性と条件条件性に焦点をあてる。本研究は, 海産動物が他の動物や水中環境をエコーロケーションで知覚し, アングルに基づく条件付き社会相互作用表現SocialCircle+を構築した。実験は、異なる軌道予測バックボーンを持つSocialCircle+の優位性を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:02:12 GMT)
Circuit Partitioning and Transmission Cost Optimization in Distributed Quantum Computing [10.2]
本稿では分散量子コンピューティングにおける過剰な通信複雑性の問題に焦点をあてる。 QUBOモデルに基づく回路分割法と送信コスト最適化のためのルックアヘッド法を併用して提案手法を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:56:10 GMT)
Peer-to-Peer Learning Dynamics of Wide Neural Networks [10.2]
我々は,一般的なDGDアルゴリズムを用いて学習した広範ニューラルネットワークの学習力学を,明示的で非漸近的に特徴づける。我々は,誤りや誤りを正確に予測し,分析結果を検証した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:57:58 GMT)
How Does Return Distribution in Distributional Reinforcement Learning Help Optimization? [10.1]
ニューラルネットワークZ-Iteration(Neural FZI)フレームワークにおける分布RLの最適化の利点について検討する。その結果, 分布RLは良好な滑らかさ特性を有し, 安定な勾配を享受できることが示唆された。本研究は,分布RLアルゴリズムの帰属分布が最適化にどう役立つかを明らかにする。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 00:19:05 GMT)
Attention Heads of Large Language Models: A Survey [10.1]
本研究では,Large Language Models (LLMs) の内部理化プロセスについて,その基盤となるアテンションヘッドのメカニズムに焦点を絞って光を当てることを目的としている。まず、人間の思考過程を4段階の枠組みに蒸留する。この枠組みを用いて,既存の研究を体系的に検証し,特定の注目者の機能を特定し,分類する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:36:23 GMT)
A-VL: Adaptive Attention for Large Vision-Language Models [10.0]
LVLM(Large Vision-Language Model)は、コンピュータビジョンと自然言語処理技術を統合し、アプリケーションの可能性を高める。現在の適応アダプティブアテンション手法はトランスフォーマーベースの言語モデルのメモリ要求を大幅に削減する。我々は、LVLMがリモート画像トークンとローカルテキストトークンの両方から応答を生成し、異なるモダリティが異なる注意パターンを持つのを観察した。 LVLM推論に適したプラグアンドプレイ適応型アダプティブアテンションであるA-VLを開発した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:22:59 GMT)
SPformer: A Transformer Based DRL Decision Making Method for Connected Automated Vehicles [9.8]
本稿ではトランスフォーマーと強化学習アルゴリズムに基づくCAV意思決定アーキテクチャを提案する。学習可能なポリシートークンは、多車連携ポリシーの学習媒体として使用される。我々のモデルは交通シナリオにおける車両の全ての状態情報をうまく活用することができる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:16:35 GMT)
Choose the Final Translation from NMT and LLM hypotheses Using MBR Decoding: HW-TSC's Submission to the WMT24 General MT Shared Task [9.8]
本稿では,Huawei Translate Services Center(HW-TSC)をWMT24汎用機械翻訳(MT)共有タスクに提出する。我々は、正規化ドロップアウト、双方向トレーニング、データ多様化、前方翻訳、後方翻訳、交互学習、カリキュラム学習、トランスダクティブアンサンブル学習などのトレーニング戦略を用いて、ニューラルマシン翻訳(NMT)モデルをトレーニングする。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:25:37 GMT)
Domino: Eliminating Communication in LLM Training via Generic Tensor Slicing and Overlapping [9.6]
大規模言語モデル(LLM)を大規模にトレーニングする場合、通信オーバーヘッドがより顕著になる。計算の背後にある通信を隠蔽する汎用的なスキームであるDominoを提案する。 DominoはNvidia DGX-H100 GPU上でのLLMトレーニングの最大1.3倍の高速化を実現している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:38:52 GMT)
EventDance++: Language-guided Unsupervised Source-free Cross-modal Adaptation for Event-based Object Recognition [9.6]
EventDance++は、教師なしソースフリーのクロスモーダル適応問題に対処する新しいフレームワークである。自己教師型でイベントから強度フレームを再構成するL-RMB (L-RMB) モジュールを提案する。本稿では,複数のイベント表現を利用したマルチ表現知識適応(MKA)モジュールを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 01:18:21 GMT)
From Zero to Hero: How local curvature at artless initial conditions leads away from bad minima [9.5]
複雑な損失景観のケーススタディとして,位相探索問題に焦点をあてる。スペクトルの遷移が起こり、方向が失われ、システムが悪いミニマに閉じ込められることを示す。我々の分析は、有限次元の勾配勾配勾配ダイナミクスを促進する新しいメカニズムに光を当てている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:00:09 GMT)
Efficient Tabular Data Preprocessing of ML Pipelines [9.2]
データ前処理パイプラインは機械学習(ML)トレーニングの重要なコンポーネントである。 Piperは、データ前処理のためのハードウェアアクセラレータで、FPGA上でプロトタイプし、商用レコメンデータシステムのパイプラインをトレーニングする可能性を実証している。 Piperは128コアのCPUサーバ上でのレイテンシの高速化を4.7$sim$ 71.3$times$達成し、バイナリ入力を使用する場合のデータセンタGPUの4.8$sim$ 20.3$times$を上回っている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:07:57 GMT)
Cross Branch Feature Fusion Decoder for Consistency Regularization-based Semi-Supervised Change Detection [9.1]
我々はCross Branch Feature Fusion CBFFと呼ばれる新しいデコーダを導入する。局所的畳み込み分岐と大域的変圧器分岐の長所を組み合わせたものである。 CBFFを用いて、強弱一貫性戦略に基づいて、SSCDモデルを構築します。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:47:59 GMT)
Not Only the Last-Layer Features for Spurious Correlations: All Layer Deep Feature Reweighting [9.1]
急激な相関と戦うための強力なアプローチは、バランスの取れたバリデーションデータセットで最後のレイヤを再トレーニングすることです。重要な属性は、ニューラルネットワークによって最後のレイヤに向けて破棄されることがある。本研究では,すべての層から派生した特徴の集合上で,分類器を再学習することを検討する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 00:31:39 GMT)
Improving Adversarial Robustness for 3D Point Cloud Recognition at Test-Time through Purified Self-Training [9.1]
3Dポイントのクラウドディープラーニングモデルは、敵の攻撃に対して脆弱である。敵の浄化は生成モデルを使って敵の攻撃の影響を緩和するそこで我々は,この目的を達成するために,テスト時間浄化型自己学習戦略を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:46:38 GMT)
TSCLIP: Robust CLIP Fine-Tuning for Worldwide Cross-Regional Traffic Sign Recognition [8.9]
交通標識認識の現在の手法は、従来のディープラーニングモデルに依存している。コントラスト型言語画像事前学習モデルを用いた頑健な微調整手法TSCLIPを提案する。著者の知る限り、TSCLIPは世界規模のクロスリージョン交通標識認識タスクに使用される最初のコントラスト言語画像モデルである。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:51:26 GMT)
Robust and Flexible Omnidirectional Depth Estimation with Multiple 360° Cameras [8.9]
我々は、複数の360度カメラの幾何的制約と冗長情報を用いて、頑健で柔軟な全方位深度推定を実現する。この2つのアルゴリズムは, 土壌パノラマ入力を施した場合でも, 精度よく深度マップを予測し, 最先端性能を実現する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:31:48 GMT)
Lessons Learned on Information Retrieval in Electronic Health Records: A Comparison of Embedding Models and Pooling Strategies [8.8]
大きな言語モデルを臨床領域に適用することは、医療記録を処理するという文脈重大な性質のために困難である。本稿では, 組込みモデルとプール法の違いが臨床領域の情報検索に与える影響について検討する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:16:08 GMT)
RoWSFormer: A Robust Watermarking Framework with Swin Transformer for Enhanced Geometric Attack Resilience [8.8]
本稿では,RoWSFormer という Swin Transformer をベースとしたロバストな透かしフレームワークを提案する。具体的には、エンコーダとデコーダの両方のコアとして、ローカルチャネル拡張スウィントランスブロックを設計する。多くの非幾何学的攻撃に対して、RoWSFormerは同じ抽出精度を維持しながらPSNRを3dB改善する。幾何攻撃の場合、RoWSFormerはPSNRの6dB以上の改善を実現し、抽出精度は97%を超えた。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:59:55 GMT)
Locality vs Quantum Codes [8.7]
量子符号は量子フォールトトレランスへの有望な道を提供するが、局所性の実践的な制約はそれらの品質を制限している。本稿では,量子誤り訂正符号の局所性とパラメータ間の最適トレードオフを証明した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:50:21 GMT)
Zero-Cost Whole-Body Teleoperation for Mobile Manipulation [8.7]
MoMa-Teleopは、ベースモーションを強化学習エージェントに委譲する新しい遠隔操作手法である。提案手法は,様々なロボットやタスクに対して,タスク完了時間が大幅に短縮されることを実証する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:09:45 GMT)
Efficient Large-Scale Quantum Optimization via Counterdiabatic Ansatz [8.7]
この2つのアルゴリズムの回路深さが等しく保たれた場合, ディジタイズされたQAOA(DC-QAOA)は, 全てのシステムサイズにおいてQAOAを上回っていると考えられる。 DC-QAOAは層ごとにより多くのCNOTゲートを導入しているので、回路の複雑さは層当たりのCNOTゲートの数と回路深さとのトレードオフである。その結果,DC-QAOA(NC)はQAOAに比べて回路の複雑さを小さくすることがわかった。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:31:56 GMT)
Fair Overlap Number of Balls (Fair-ONB): A Data-Morphology-based Undersampling Method for Bias Reduction [8.7]
信頼できる人工知能における分類問題に関する重要な問題の1つは、異なるクラスの予測において公平性を保証することである。トレーニングデータのバイアスが機械学習に反映され、人間の生活に影響を与え、現在の規制に従わないため、これらのケースではデータ品質が重要になります。本研究は,各データ群のデータ形態を利用したアンダーサンプリング手法であるフェアオーバーラップボール数(Fair-ONB)を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:52:05 GMT)
Human-Centered LLM-Agent User Interface: A Position Paper [8.7]
大規模言語モデル (LLM) - ループ内でのアプリケーションは、人間のコマンドを効果的に解釈できることが示されている。基盤となるツールやシステムにほとんど無知なユーザは、LAUIを使って創発的なワークフローを見つけることができるべきです。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:41:04 GMT)
CritiPrefill: A Segment-wise Criticality-based Approach for Prefilling Acceleration in LLMs [8.6]
本稿では,CritiPrefillを提案する。 CritiPrefillは、入力シーケンスのクエリとKVキャッシュをセグメントとブロックに分割する。複数の長コンテキストデータセットの大規模な評価では、Llama3-8Bで2.7倍、Yi-9Bで3.0倍、単一のA100 GPUで128Kのコンテキスト長を持つ。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 02:24:33 GMT)
PipeFill: Using GPUs During Bubbles in Pipeline-parallel LLM Training [8.6]
PipeFillは、他の保留中のジョブの実行でパイプラインバブルを埋める。大規模なLLMトレーニングで使用されるGPUでは,PipeFillが全体の利用率を最大63%向上させることができる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 22:39:05 GMT)
Adaptive and Robust Watermark for Generative Tabular Data [8.6]
生成表データに対するフレキシブルでロバストな透かし機構を提案する。ウォーターマークされたデータセットがデータ品質と下流のユーティリティに無視できる影響があることを理論的および実証的に示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 04:37:30 GMT)
Uncovering Coordinated Cross-Platform Information Operations Threatening the Integrity of the 2024 U.S. Presidential Election Online Discussion [8.6]
情報操作は民主的プロセスの完全性に重大な脅威をもたらす。 2024年のアメリカ合衆国大統領選挙を期待して、調整されたIOのデジタルトレースを$mathbbX$(元Twitter)で発見することを目的とした研究を発表した。オンラインコーディネーションを検出するための機械学習フレームワークを用いて,2024年5月からの選挙関連会話を含むデータセットをmathbbX$で分析した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:36:14 GMT)
Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make your LLMs use External Data More Wisely [8.5]
外部データで拡張された大規模言語モデル(LLM)は、現実世界のタスクを完了させる際、顕著な能力を示した。 Retrieval-Augmented Generation (RAG) とファインチューニングが注目され、広く応用されている。しかし、データ拡張LDMを様々な専門分野に効果的に展開することは、重大な課題である。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:20:20 GMT)
FisheyeDepth: A Real Scale Self-Supervised Depth Estimation Model for Fisheye Camera [8.5]
魚眼カメラに適した自己監督深度推定モデルである魚眼深度について述べる。魚眼カメラモデルを訓練中の投射と再投射の段階に組み込んで画像歪みの処理を行う。また、連続するフレーム間の幾何学的投影に実際のポーズ情報を組み込んで、従来のポーズネットワークで推定されたポーズを置き換える。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:31:42 GMT)
DSG-KD: Knowledge Distillation from Domain-Specific to General Language Models [8.3]
本研究は,韓国の小児救急部門(PED)から得られた電子カルテ(EMR)データに基づく緊急時・緊急時・緊急時分類タスクについて検討した。既存のドメイン固有の事前学習言語モデルは、N言語自由テキストデータ特性を扱う場合の一般的な言語モデルと比較して性能が劣る。本稿では,知識蒸留を利用したドメイン知識伝達手法を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:59:02 GMT)
Physics Enhanced Residual Policy Learning (PERPL) for safety cruising in mixed traffic platooning under actuator and communication delay [8.2]
線形制御モデルは、その単純さ、使いやすさ、安定性解析のサポートにより、車両制御に広範囲に応用されている。一方、強化学習(RL)モデルは適応性を提供するが、解釈可能性や一般化能力の欠如に悩まされる。本稿では,物理インフォームドポリシによって強化されたRL制御系の開発を目標とする。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 23:02:34 GMT)
UTrace: Poisoning Forensics for Private Collaborative Learning [8.2]
我々は、マシンラーニング(PPML)における中毒攻撃のユーザレベルトレースバックのためのフレームワークであるUTraceを紹介する。 UTraceは低毒性率で有効であり、複数のデータ所有者に分散した攻撃に対して耐性がある。 10件の中毒に対するUTraceの有効性を示した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:32:46 GMT)
Predicting Expert Evaluations in Software Code Reviews [8.0]
本稿では,その複雑さや主観性から回避されるコードレビューの側面を自動化するアルゴリズムモデルを提案する。手作業によるレビューを置き換える代わりに、私たちのモデルは、レビュアーがより影響力のあるタスクに集中するのに役立つ洞察を追加します。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:01:52 GMT)
SAMEdge: An Edge-cloud Video Analytics Architecture for the Segment Anything Model [8.0]
エッジユーザのためのSAM計算をサポートするために設計された,新しいエッジクラウドコンピューティングアーキテクチャであるPamedgeを提案する。 Madedgeはエッジとクラウドの新たなモジュールを統合して、視覚的なプロンプト下での分析精度を最大化し、遅延制約のある入力プロンプトをイメージする。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:59:09 GMT)
AdapFair: Ensuring Continuous Fairness for Machine Learning Operations [7.9]
本稿では、入力データの最適な公正な変換を見つけるために設計されたデバイアス化フレームワークを提案する。正規化フローを活用して、効率的な情報保存データ変換を可能にします。閉形式勾配計算を用いた効率的な最適化アルゴリズムを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:01:47 GMT)
GMP-TL: Gender-augmented Multi-scale Pseudo-label Enhanced Transfer Learning for Speech Emotion Recognition [7.8]
GMP-TLは、ジェンダー強化されたマルチスケール擬似ラベル(GMP)に基づくトランスファー学習を利用する新しいSERフレームワークである。 GMP-TLは80.0%のWARと82.0%のUARを達成でき、最先端のユニモーダルSER法よりも優れた性能が得られることを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:32:11 GMT)
From Text to Treatment Effects: A Meta-Learning Approach to Handling Text-Based Confounding [7.5]
本稿では,テキストに変数を埋め込んだ場合のメタラーナーの性能について検討する。共同創設者の事前学習したテキスト表現を用いた学習者は,CATE推定精度の向上を図っている。テキスト埋め込みの絡み合った性質のため、これらのモデルは、完全な共同創設者の知識を持つメタ学習者のパフォーマンスと完全には一致しない。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:46:19 GMT)
Learning from Contrastive Prompts: Automated Optimization and Adaptation [7.5]
本稿では,高速な最適化と適応を実現するためのLCP(Learning from Contrastive Prompts)フレームワークを提案する。 LCPは、良い例と悪い例のパターンを分析することによって効果的なプロンプトを生成するために、対照的な学習を採用している。我々のBig-Bench Hardデータセットに対する評価は、LCPが既存の最適化手法よりも76%以上勝っていることを示している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:47:23 GMT)
Unveiling the Potential of Graph Neural Networks in SME Credit Risk Assessment [7.3]
本稿では、グラフニューラルネットワークを技術的枠組みとして捉え、企業財務指標間の本質的な関係を統合し、企業信用リスク評価モデルを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 22:41:54 GMT)
High-quality Unknown Object Instance Segmentation via Quadruple Boundary Error Refinement [7.3]
高品質未知オブジェクトインスタンス(UOIS)のための新しいエラーインフォームド改善手法QuBERを提案する。 QuBERはまず、初期セグメンテーションのインスタンス境界における4倍境界誤差-真正、真負、偽正、偽負の画素-を推定する。その後、エラー誘導融合機構を使用してセグメンテーションを洗練し、細粒度とインスタンスレベルのセグメンテーションエラーを効果的に補正する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:05:01 GMT)
RepoGenReflex: Enhancing Repository-Level Code Completion with Verbal Reinforcement and Retrieval-Augmented Generation [7.2]
RepoGenReflexは、検索と生成プロセスを動的に最適化する汎用的で動的で効果的なフレームワークである。 Verbal Reinforcement Learning (VRL)で強化されたRetrieval-Augmented Generation (RAG)を活用することで、リポジトリレベルのコード補完に最適な結果が動的に選択できる。 RepoGenReflexは、標準のコード補完タスクよりも優れたパフォーマンスと有効性を示している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:53:37 GMT)
BehaVR: User Identification Based on VR Sensor Data [7.1]
これは、VRデバイス上で実行される複数のアプリによって収集されたすべてのセンサグループからのデータを収集し、分析するフレームワークである。私たちはBehaVRを使って、20の人気のある現実世界のアプリと対話する実際のユーザーからデータを収集しています。私たちは、利用可能なセンサデータから機能を抽出して、アプリ内およびアプリ間のユーザ識別のための機械学習モデルを構築します。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 05:13:55 GMT)
Inference-Friendly Models With MixAttention [7.1]
MixAttentionは、最近のトークンの小さなサブセットだけをKVキャッシュに格納するスライディングウィンドウアテンションと、レイヤ間のKVキャッシュ共有を組み合わせたものだ。実験により,MixAttentionはメモリ使用量を大幅に削減し,短文タスクと長文タスクの両方においてモデル性能を犠牲にすることなく推論速度を向上することを示した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:37:25 GMT)
A study of why we need to reassess full reference image quality assessment with medical images [7.0]
特に、FR-IQA測度PSNRとSSIMは、多くの自然画像処理に成功するために知られ、テストされている。本稿では、2つの最も一般的なフルレファレンス(FR)画像品質尺度が、新しいアルゴリズムの評価に不適であることを証明した、構造化された総合的な例のコレクションを提供する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:17:30 GMT)
Enhancing Visual Question Answering through Ranking-Based Hybrid Training and Multimodal Fusion [7.0]
Rank VQAモデルは、Faster R-CNNモデルと、事前訓練されたBERTモデルから得られたリッチセマンティックテキスト特徴を用いて抽出された高品質な視覚特徴を統合する。回答の相対ランク付けを最適化するためにランキング学習モジュールが組み込まれ、回答精度が向上する。我々のモデルは、標準VQAデータセットにおける既存の最先端モデルよりも大幅に優れています。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 04:46:26 GMT)
zsLLMCode: An Effective Approach for Functional Code Embedding via LLM with Zero-Shot Learning [7.0]
大型言語モデル(LLM)はゼロショット学習の能力を持ち、訓練や微調整を必要としない。 LLMを用いた関数型コード埋め込みを生成する新しいアプローチであるzsLLMCodeを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 01:03:15 GMT)
Reliability Function of Classical-Quantum Channels [7.0]
一般古典量子チャネルの信頼性関数について検討する。我々は、信頼性関数に対するペッツ形式における量子レニー情報の観点から、低い境界を証明した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:24:30 GMT)
Curb Your Attention: Causal Attention Gating for Robust Trajectory Prediction in Autonomous Driving [6.9]
自律走行における軌道予測モデルは、非因果エージェントの摂動に弱い。過去のステップのウィンドウ上で、エージェント間の因果関係を特定するために、$textitCausal tRajecTory predICtion$ $textbf(CRiTIC)$を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:01:20 GMT)
CauSkelNet: Causal Representation Learning for Human Behaviour Analysis [6.9]
本研究では,人間の関節動態や複雑な動作をよりよく理解するために,因果推論に基づく表現学習手法を提案する。我々のアプローチは、人間の動作分析を前進させ、より適応的なインテリジェントヘルスケアソリューションの道を開く。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:38:49 GMT)
Eagle: Efficient Training-Free Router for Multi-LLM Inference [6.8]
さまざまな能力とコストを持つ大規模言語モデル(LLM)は、AIシステムにおける効率的なモデル選択の必要性を生み出している。グローバルおよびローカルELOランキングモジュールを組み合わせた,新しいLLMルーティング手法であるEagleを提案する。イーグルは、AUC(Area Under Curve)スコアで最大23.2%の改善とともに、ベースライン法を一貫して上回っている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:10:10 GMT)
Neural refractive index field: Unlocking the Potential of Background-oriented Schlieren Tomography in Volumetric Flow Visualization [6.7]
本研究はニューラル屈折指数場(NeRIF)と呼ばれる革新的な再構成手法を提案する。 NeRIFはニューラルネットワークで流れの場を暗黙的に表現する。乱流文泉火炎における数値シミュレーションと実験実験の両方により, 再現精度と空間分解能を大幅に向上させることができることが示唆された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 05:40:50 GMT)
Analysis of Human Perception in Distinguishing Real and AI-Generated Faces: An Eye-Tracking Based Study [6.7]
本研究では,人間がどのように実像と偽像を知覚し,区別するかを検討する。 StyleGAN-3生成画像を解析したところ、参加者は76.80%の平均精度で偽の顔と現実を区別できることがわかった。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:34:30 GMT)
Large Language Models Are Involuntary Truth-Tellers: Exploiting Fallacy Failure for Jailbreak Attacks [6.6]
言語モデルでは、誤った推論や偽りの推論を発生させることが困難であることがわかった。本稿では、悪意のある出力に対して一致した言語モデルを引き出すジェイルブレイク攻撃法を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:48:20 GMT)
CURO: Curriculum Learning for Relative Overgeneralization [6.6]
相対的オーバージェネリゼーション(Relative Over generalization, RO)は、協調的なマルチエージェントタスクで発生する病理である。相対オーバージェネリゼーション(CURO)のためのカリキュラム学習という新しい手法を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:43:25 GMT)
On-device Training: A First Overview on Existing Systems [6.6]
リソース制約のあるデバイスにいくつかのモデルをデプロイする努力も行われている。この研究は、デバイス上でモデルトレーニングを可能にする最先端のシステム研究を要約し、分析することを目的としている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:59:38 GMT)
MapEx: Indoor Structure Exploration with Probabilistic Information Gain from Global Map Predictions [6.4]
我々は、しばしば予測可能で繰り返しパターンから構成される、構造化された屋内環境を探索するロボットに焦点を当てる。近年の研究では、深層学習技術を用いて地図の未知領域を予測し、これらの予測を情報ゲイン計算に利用している。本研究では,予測地図を用いて情報ゲイン推定のための確率的センサモデルを構築する新しい探索フレームワークであるMapExを紹介する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 22:48:04 GMT)
Generative LLM Powered Conversational AI Application for Personalized Risk Assessment: A Case Study in COVID-19 [6.4]
大規模言語モデル(LLM)は、様々な自然言語タスクにおいて顕著な能力を示している。本研究は,ヒトとAIの会話をストリーミングすることで,LSMを用いた新たな疾病リスク評価手法を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:55:13 GMT)
Can It Edit? Evaluating the Ability of Large Language Models to Follow Code Editing Instructions [6.4]
コード編集タスクのベンチマークを導入し、それをいくつかの最先端LCMの評価に利用する。我々の評価は、最先端のオープンモデルとクローズドモデルの間の大きなギャップを露呈する。我々は、自然言語命令と組み合わされたコード編集タスクの新しい、慎重にキュレートされ、パーミッシブにライセンスされたトレーニングデータセットを導入する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:57:18 GMT)
Accountable authentication with privacy protection: The Larch system for universal login [6.2]
larchは、強力なセキュリティとプライバシ特性を備えた、説明可能な認証フレームワークである。 FIDO2、TOTP、パスワードベースのログインのためのlarchを実装している。 4コアのクライアントと8コアのログサーバを持つと、larchによる認証はFIDO2で150ms、TOTPで91ms、パスワードで74msとなる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:11:02 GMT)
Temperature shift of magnetic-field-dependent photoluminescence features of nitrogen-vacancy ensembles in diamond [6.2]
幅広い磁場で観測できる様々な特徴の温度変動について検討した。幅広い特徴の熱的挙動に関する深い洞察は、様々な応用に重要な結果をもたらす可能性がある。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:27:28 GMT)
Reducing Energy Bloat in Large Model Training [6.1]
トレーニング中に消費されるすべてのエネルギーが、エンドツーエンドのスループットに直接寄与する訳ではない。本研究では,大規模モデルトレーニングにおける2つの独立したエネルギー肥大源を特定し,両者を緩和するトレーニングシステムであるPerseusを提案する。これを実現するために、Perseusは効率的なグラフカットベースのアルゴリズムを用いて、大規模なモデルトレーニングジョブの時間-エネルギートレードオフフロンティアを取得し、時間にわたってエネルギー消費をスケジュールし、両方のタイプのエネルギー肥大を減少させる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:02:41 GMT)
3D Gaussian Splatting for Large-scale Surface Reconstruction from Aerial Images [6.1]
AGS(Aerial Gaussian Splatting)という,空中多視点ステレオ(MVS)画像を用いた3DGSによる大規模表面再構成手法を提案する。まず,大規模空中画像に適したデータチャンキング手法を提案する。次に,レイ・ガウス断面積法を3DGSに統合し,深度情報と正規情報を得る。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 05:07:08 GMT)
Deep Reinforcement Learning-based Obstacle Avoidance for Robot Movement in Warehouse Environments [6.1]
本稿では,移動ロボット障害物回避アルゴリズムである倉庫環境に基づく深層強化学習を提案する。深部強化学習アルゴリズムにおける値関数ネットワークの学習能力不足に対して、歩行者間の相互作用情報を歩行者角度グリッドを介して抽出する。歩行者の空間行動に基づいて、強化学習の報酬関数を設計し、その角度が過度に変化する状態に対して、ロボットを罰する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:42:35 GMT)
Towards Accountable AI-Assisted Eye Disease Diagnosis: Workflow Design, External Validation, and Continual Learning [5.9]
AIは診断精度が保証されるが、臨床および多様な集団の検証が不十分なため、現実の応用問題に直面している。本研究は、年齢関連黄斑変性(AMD)診断と分類重症度に関するケーススタディを通じて、医療用AIの下流アカウンタビリティのギャップに対処する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:01:09 GMT)
Data governance: A Critical Foundation for Data Driven Decision-Making in Operations and Supply Chains [5.9]
本研究は、運用・サプライチェーン管理(OSCM)分野におけるデータガバナンス(DG)研究への注目を喚起することを目的とする。 3つのケーススタディに基づいて、業界における実生活データ問題を調べ分析した。 1)人的要因,2)ルールや規則の欠如,3)非効率な技術ハードウェアとソフトウェア,4)リソースの欠如,の4つの原因が判明した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:41:56 GMT)
Fully automatic extraction of morphological traits from the Web: utopia or reality? [5.9]
本研究では,植物形質に関する情報を非構造的テキスト記述形式で収集・処理する機構を提案する。その結果, F1スコアは75%以上であった。この結果から,LLMの情報抽出機能により,構造化された特徴データベースの大規模作成が可能であることが示唆された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:40:24 GMT)
Matérn Kernels for Tunable Implicit Surface Reconstruction [5.9]
マタン核はいくつかの魅力的な性質を持ち、表面再構成に特に適している。定常であることから、Mat'ernカーネルのスペクトルが特徴写像と同じ方法でチューニングできることが示される。我々は、SIRENネットワークに対するMat'ernの接続と、以前に採用されていたアークコサインカーネルとの関係を解析する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:45:42 GMT)
Distributed Differentiable Dynamic Game for Multi-robot Coordination [5.8]
我々は,ロボットの動作が,他者の行動にも依存する自身のダイナミクスと目的によって決定される動的ゲームとして,マルチロボット協調を定式化する。本稿では,マルチロボット協調における前方および逆問題の効率よく解決できる分散微分可能動的ゲーム(D3G)フレームワークを開発する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:07:38 GMT)
Don't Use LLMs to Make Relevance Judgments [5.7]
最近の大きな言語モデルの出現は、自然言語のプロンプトに反応して、驚くべきほど人間らしく流れるテキストを生成することで、IR研究者は、それらのモデルが関連判断の収集プロセスでどのように使われるのか疑問に思うようになった。 ACM SIGIR 2024 カンファレンスでは,ワークショップ LLM4Eval' が,この作業の場を提供し,TREC 深層学習トラックの判断を再現するデータチャレンジ活動を開催した。ボトムアップフロントのメッセージは、TRECスタイルの評価のための関連判断を作成するためにLLMを使用しないことです。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:38:12 GMT)
BoQ: A Place is Worth a Bag of Learnable Queries [5.5]
Bag-of-Queries (BoQ)は、普遍的な場所特化属性をキャプチャするために設計されたグローバルクエリセットを学習する。 BoQは異なる学習可能なグローバルクエリを採用し、クロスアテンションを通じて入力機能を探索する。 NetVLAD、MixVPR、EigenPlacesといった最先端技術よりも一貫して優れています。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:59:21 GMT)
Identifying Elasticities in Autocorrelated Time Series Using Causal Graphs [5.5]
機器変数を用いた観測データから需要の価格弾力性の推定(IV) 因果時間グラフはIV同定を単純化し、一貫した推定器を選択するのに役立つと論じる。この手法をドイツの電力市場に適用し、シミュレーションおよび実世界のデータに基づいて需要の価格弾力性を推定する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:28:08 GMT)
Combining Open-box Simulation and Importance Sampling for Tuning Large-Scale Recommenders [5.5]
我々は、キーパフォーマンス指標(KPI)に影響を与える複数の連続パラメータを持つ大規模広告プラットフォームをチューニングすることの課題に対処する。オープンボックスのモンテカルロシミュレータのような従来の手法は正確ではあるが、多数のパラメータ設定を評価するコストが高いため、計算コストが高い。オープンボックスシミュレーションと重要サンプリングを組み合わせたSGIS(Simulator-Guided Smpling)のハイブリッド手法を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:35:47 GMT)
Safe Guard: an LLM-agent for Real-time Voice-based Hate Speech Detection in Social Virtual Reality [5.4]
ソーシャルVR(VRChat)における音声によるヘイトスピーチ検出のためのLLMエージェントであるSafe Guardを提案する。本システムは,リアルタイム音声対話において,Open AI GPTと音声特徴抽出を利用する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 23:54:45 GMT)
Bilingual Rhetorical Structure Parsing with Large Parallel Annotations [5.4]
我々は,大規模で多様な英語GUM RSTコーパスに対して,パラレルなロシア語アノテーションを導入する。我々のエンドツーエンドRTTは、英語とロシア語のコーパスで最先端の結果を得る。我々の知る限り、この研究は、手動で注釈付けされた並列コーパス上での言語間エンドツーエンドのRTT解析の可能性を評価する最初のものである。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:40:33 GMT)
Kriformer: A Novel Spatiotemporal Kriging Approach Based on Graph Transformers [5.4]
本研究は, 環境問題として, スパースセンサの配置と信頼性の低いデータに対処する。グラフクリフォーマーモデルであるKriformerは、限られた資源であっても、空間的および時間的相関をマイニングすることで、センサのない場所でデータを推定する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:01:18 GMT)
Self-supervised Equality Embedded Deep Lagrange Dual for Approximate Constrained Optimization [5.4]
ニューラルネットワーク(NN)を用いた高速最適近似器としてDeepLDEを提案する。不等式制約を課すために,DeepLDEと初等・非双対学習法の収束を証明した。提案したDeepLDEソリューションは,最小のNNベースアプローチ間の最適ラグギャップを実現する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:28:24 GMT)
Necessary and Sufficient Condition for Randomness Certification from Incompatibility [5.4]
量子ランダム性はベル非局所性またはアインシュタイン-ポドルスキー-ローゼンステアリングを示す確率的挙動から証明することができる。不整合性の観点からは,不整合性不整合性に対する必要十分条件を提供する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:13:47 GMT)
A Survey on Large Language Models from General Purpose to Medical Applications: Datasets, Methodologies, and Evaluations [5.3]
本調査は,オープンソース汎用LSMをベースとした医療用LSMのトレーニング方法を体系的にまとめたものである。 a) トレーニングコーパスの取得方法、カスタマイズされた医療トレーニングセットの構築方法、(b) 適切なトレーニングパラダイムの選択方法、(d) 既存の課題と有望な研究方向性をカバーしている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 02:45:29 GMT)
Reducing the Footprint of Multi-Vector Retrieval with Minimal Performance Impact via Token Pooling [5.2]
ColBERTによって先導されたマルチベクター検索手法は、ニューラルIRに対するアプローチとしてますます人気が高まっている。しかし、大量のベクトルを格納するために必要なストレージとメモリの要求は、依然として重要な欠点である。簡単なクラスタリングベースのトークンプーリング手法を導入し、保存が必要なベクトルの数を積極的に削減する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 03:12:43 GMT)
Revealing an Unattractivity Bias in Mental Reconstruction of Occluded Faces using Generative Image Models [5.2]
以前の研究では、顔が部分的に隠されているとき、より魅力的なものとして評価されていることが示されている。 1つの説明は、難易度評価タスクで示されるように、より魅力的な知覚に偏った、隠蔽された顔部分の精神的再構成である。この仮説を,心的再建を直接必要とする遅延マッチングタスクを用いて検証した。我々の実験は、最初の仮説を支持しておらず、隠蔽された顔に対する魅力のないバイアスを明らかにします。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:10:19 GMT)
Precise Asymptotics of Bagging Regularized M-estimators [5.2]
我々は,アンサンブル推定器の正方形予測リスクを,正規化M値推定器のサブタグ化(サブサンプルブートストラップ集約)により特徴付ける。我々の分析の鍵は、重なり合うサブサンプル上の推定値と残差との相関関係の結合挙動に関する新しい結果である。サブサンプルサイズ,アンサンブルサイズ,正規化の併用最適化は,全データに対してのみ,正規化器の最適化を著しく上回る。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:48:28 GMT)
Robust Second-order LiDAR Bundle Adjustment Algorithm Using Mean Squared Group Metric [5.2]
我々は,LiDAR BAアルゴリズムの最適化目標を構築するために,新しい平均2乗群計量(MSGM)を提案する。堅牢なカーネル関数を統合することで、BAアルゴリズムに関わるメトリクスを再重み付けし、ソリューションプロセスの堅牢性を高める。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 02:38:55 GMT)
A Security Risk Taxonomy for Prompt-Based Interaction With Large Language Models [5.1]
本稿では,大規模言語モデル(LLM)によるセキュリティリスクに着目し,現在の研究のギャップに対処する。我々の研究は,ユーザモデル通信パイプラインに沿ったセキュリティリスクの分類を提案し,一般的に使用されている機密性,完全性,可用性(CIA)3つのトライアドと並行して,ターゲットタイプと攻撃タイプによる攻撃を分類する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:23:02 GMT)
Indoor Air Quality Dataset with Activities of Daily Living in Low to Middle-income Communities [5.0]
インドでは夏と冬の6ヶ月間に30箇所の屋内から空気の質を測定した。データセットにはさまざまな種類の屋内環境が含まれている。発展途上国のユニークな汚染パターンに対応することを目的としたデータ駆動学習モデル研究の基盤を提供することができる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 06:46:19 GMT)
Isometric Immersion Learning with Riemannian Geometry [5.0]
等尺性の理論的な保証を提供する多様体学習方法はまだ存在しない。ナッシュの等尺定理に触発され、等尺浸漬学習と呼ばれる新しい概念を導入する。計量学習と多様体学習を同時に行う教師なしニューラルネットワークモデルを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:17:06 GMT)
Mixing Data-driven and Geometric Models for Satellite Docking Port State Estimation using an RGB or Event Camera [5.0]
この研究は、最近リリースされたLockheed Martin Mission Augmentation Port (LM-MAP) をターゲットとして、衛星に依存しない運用に焦点を当てている。本稿では,標準RGBセンサやイベントカメラの単眼視データを用いて,衛星ドッキングポートの自動検出と状態推定を行うパイプラインを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 22:28:09 GMT)
Micrometer: Micromechanics Transformer for Predicting Mechanical Responses of Heterogeneous Materials [4.8]
異種材料の機械的応答を予測する人工知能フレームワークであるMicromechanics Transformer(em Micrometer)を紹介する。マイクロメーターは、幅広いミクロ組織にわたるマイクロスケールのひずみ場を予測する際に、最先端の性能を達成することができる。私たちの研究は、計算ソリッドメカニクスにおけるAI駆動のイノベーションへの大きな一歩を示しています。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:01:37 GMT)
Improved Routing of Multiparty Entanglement over Quantum Networks [4.8]
本稿では,GHZ状態を共有するための2つのグラフ状態ベースのルーティングプロトコルを提案する。任意のネットワークトポロジに対して、上記の木が最適な結果を得るための特別な構成を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 03:52:44 GMT)
When Context Leads but Parametric Memory Follows in Large Language Models [4.6]
大規模言語モデル (LLM) は多様な知識源の活用において顕著な進歩を見せている。本研究では,9つのLLMがオープンな質問に対して,局所的な文脈とグローバルなパラメータの知識を割り当てる方法について検討した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 00:42:36 GMT)
Optimizing News Text Classification with Bi-LSTM and Attention Mechanism for Efficient Data Processing [4.5]
本稿では,ディープラーニングに基づくニューステキストの自動分類手法を提案する。高度な機械学習アルゴリズムを導入することにより、ニューステキストの効率的な分類と管理を実現する。ニュース業界の情報処理能力を向上させるために重要な実践的重要性を持っている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 22:23:08 GMT)
HydroVision: LiDAR-Guided Hydrometric Prediction with Vision Transformers and Hybrid Graph Learning [4.5]
水位予測は、水資源の管理、洪水予測、環境保護に不可欠である。静的グラフ学習と動的グラフ学習を組み合わせたハイブリッドグラフ学習構造を提案する。提案手法は, 予測誤差を1日平均10%削減し, 予測地平線を延長する改良を行った。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:57:43 GMT)
Feeding the Crave: How People with Eating Disorders Get Trapped in the Perpetual Cycle of Digital Food Content [4.5]
摂食障害のある人を対象に,デジタル食品を消費する動機と実践を理解するために2つの研究を行った。本研究は、参加者が食品メディアの症状を克服するために陽性効果を期待していることを明らかにするが、実際には障害を悪化させることがしばしばある。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 05:50:41 GMT)
Classification of Breast Cancer Histopathology Images using a Modified Supervised Contrastive Learning Method [4.3]
モデルロバスト性を高めるために、画像レベルラベルとドメイン固有の拡張の両方を活用することで教師付きコントラスト学習法を改善する。乳癌の病理組織像から得られたBreakHisデータセットについて検討した。この改良は93.63%の絶対精度に対応し、データの特性を利用してより適切な表現空間を学習するアプローチの有効性を強調した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:08:53 GMT)
Coherent population trapping and spin relaxation of a silicon vacancy center in diamond at mK temperatures [4.3]
1K以下では、自然に豊富な13C原子のスピン浴によって引き起こされるものと比べ、フォノン誘起のスピン脱落は無視できる。スピン寿命の100倍近い増加は、温度が4Kから1K以下に下がったときに観測される。 2フォノンスピンフリップ遷移は、SiV基底状態のスピン緩和において重要な役割を果たす。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:49:09 GMT)
OMPar: Automatic Parallelization with AI-Driven Source-to-Source Compilation [4.3]
本稿では,OpenMP pragmasを用いたC/C++コードの並列化を自動化するAI駆動型ツールであるOMParを紹介する。 OMParは、ループ並列化ポテンシャルを評価するOMPifyと、正確なOpenMPパグマを生成する新しい微調整モデルであるMonoCoder-OMPの2つの主要なコンポーネントを通じて、LLM(Large Language Models)を統合している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:39:01 GMT)
EDSNet: Efficient-DSNet for Video Summarization [4.1]
従来の注意をフーリエ、ウェーブレット変換、Nystrオムフォーマなどの代替品に置き換えることで、効率と性能が向上することを示す。私たちの仕事は、ビデオ要約タスクに対して、よりスケーラブルなソリューションを提供します。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 05:43:37 GMT)
RAMBO: Enhancing RAG-based Repository-Level Method Body Completion [4.1]
RAMBOは、レポジトリレベルのMBCのための新しいRAGベースのアプローチである。クラス、メソッド、変数/フィールドなど、レポジトリ固有の要素とその関連する使用法を特定します。 RAMBOは、最先端のレポジトリレベルのMBCアプローチを大幅に上回った。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:51:43 GMT)
FLeNS: Federated Learning with Enhanced Nesterov-Newton Sketch [4.0]
FLeNS(Federated Learning with Enhanced Nesterov-Newton Sketch)を紹介する。 FLeNSは、正確なヘッセンに依存することなく、ニュートンの手法を近似する。我々は、加速度、スケッチサイズ、収束速度のトレードオフを厳格に保証し、特徴付ける。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:00:35 GMT)
Fast and Accurate Triangle Counting in Graph Streams Using Predictions [4.0]
本稿では, グラフストリーム中の三角形の数を予測した最初の効率的かつ実用的なアルゴリズムを提案する。提案アルゴリズムは,待機室サンプリングと貯水池サンプリングと,エッジの重み,すなわちエッジが関与する三角形の数の予測器を組み合わせる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:52:11 GMT)
Approximated Orthogonal Projection Unit: Stabilizing Regression Network Training Using Natural Gradient [4.0]
本稿では,AOPU (Approximated Orthogonal Projection Unit) と呼ばれるNNを提案する。 AOPU が NN において最小分散推定 (MVE) を達成することを証明する。 2つの化学プロセスデータセットの実験的結果は、AOPUが安定収束を達成するために他のモデルより優れていることを明らかに示している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 03:42:50 GMT)
ChatGPT as a Solver and Grader of Programming Exams written in Spanish [3.9]
我々はChatGPTの能力を評価し、実際のプログラミング試験を解き、評価する。我々の研究結果は、このAIモデルは単純なコーディングタスクを解くのにのみ有効であることを示唆している。複雑な問題に対処する能力や、他の人によって書かれたソリューションを評価する能力は、決して効果的ではない。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:20:07 GMT)
The Number of Trials Matters in Infinite-Horizon General-Utility Markov Decision Processes [3.9]
無限水平GUMDPにおいて試行回数が重要な役割を担い、ある政策の期待性能は一般に試行数に依存することを示す。まず, 割引GUMDPによる政策評価について検討し, GUMDPの有限と無限の試験式間のミスマッチについて, 下位と上位の境界を証明した。第2に、GUMDPの異なるクラスが、有限と無限の試行公式のミスマッチにどのように影響するかを研究することで、平均的なGUMDPに対処する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:34:45 GMT)
Exploring Public Attention in the Circular Economy through Topic Modelling with Twin Hyperparameter Optimisation [3.7]
本研究は, 一般の注意の進化, 循環生成物に関する大衆の認知経路, および主要な関心事を明らかにすることを目的としている。 Twitter、Reddit、The Guardianといったさまざまなプラットフォームからデータを収集し、3つのトピックモデルを使用してデータを分析しました。我々の最適化されたモデルは、持続可能性や円周的なプラクティスの経済的影響について、国民が懸念していることを明らかにする。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:21:51 GMT)
ControlEdit: A MultiModal Local Clothing Image Editing Method [3.7]
マルチモーダル・衣料品画像編集(マルチモーダル・衣料品画像編集、英: Multimodal clothing image editing)とは、テキスト記述や視覚画像を制御条件として用いた衣服画像の精密な調整と修正をいう。衣料品画像のマルチモーダルな局所的塗り絵に衣料品画像の編集を転送する新しい画像編集方法である制御編集を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 05:34:59 GMT)
Interval spectrum for electric quantum walk and related skew-shift CMV matrices [3.6]
電場を持つ量子ウォークモデルの族に対して、スペクトルは任意の不合理体に対する単位円であることを示す。この結果は、スキューシフトによって定義される関連するCMV行列についても成り立つ。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:49:58 GMT)
Membership Inference Attacks and Privacy in Topic Modeling [3.5]
トレーニングデータのメンバーを確実に識別できるトピックモデルに対する攻撃を提案する。本稿では,DP語彙選択を前処理ステップとして組み込んだプライベートトピックモデリングフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:57:56 GMT)
Generalizing monocular colonoscopy image depth estimation by uncertainty-based global and local fusion network [3.4]
本研究の目的は,大腸内視鏡画像によく応用できる堅牢なフレームワークを開発することである。本稿では,局所的な特徴を捉えるための畳み込みニューラルネットワーク(CNN)と,グローバルな情報を取得するためのトランスフォーマーを組み合わせたフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:30:59 GMT)
Multi-Sensor Diffusion-Driven Optical Image Translation for Large-Scale Applications [3.4]
本稿では,大規模な低空間分解能画像を,異なる光学センサから高分解能に高分解能に分解する手法を提案する。我々の貢献は、大規模な画像翻訳の課題に対処するために欠かせない新しい前方および逆拡散過程にある。その結果、一貫したパッチを持つ高解像度の大規模画像となり、異種変化検出などのアプリケーションに不可欠である。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:08:34 GMT)
Clinical-grade Multi-Organ Pathology Report Generation for Multi-scale Whole Slide Images via a Semantically Guided Medical Text Foundation Model [3.4]
患者に対する病理報告を生成するために, 患者レベル多臓器報告生成(PMPRG)モデルを提案する。我々のモデルはMETEORスコア0.68を達成し、我々のアプローチの有効性を実証した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 22:22:32 GMT)
A new baseline for edge detection: Make Encoder-Decoder great again [3.3]
提案されたNew Baseline for Edge Detection (NBED)は、複数のエッジ検出ベンチマークで一貫してパフォーマンスを向上する。 BSDS500におけるNBEDのODSは0.838であり、最先端のパフォーマンスを実現している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:54:38 GMT)
Circuit decompositions and scheduling for neutral atom devices with limited local addressability [3.3]
現在の中性原子アーキテクチャは、ブロッホ球のxy平面の軸の1量子ビット回転の局所的アドレス付けをサポートしない。本稿では,任意のゲートセットからグローバルゲートを含むリアルな中性原子ネイティブゲートセットに入力回路を変換する最適化コンパイラパイプラインを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:51:30 GMT)
GEM-RAG: Graphical Eigen Memories For Retrieval Augmented Generation [3.2]
検索拡張生成のためのグラフィカル固有メモリ(GEM-RAG)について紹介する。 GEM-RAG は LLM が生成したユーティリティの質問を与えられたテキストコーパスにタグ付けすることで機能する。我々は,UnifiedQA と GPT-3.5 Turbo を LLM として,SBERT を用いた GEM-RAG と OpenAI のテキストエンコーダを2つの標準QA タスクで評価した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:42:47 GMT)
Privacy Policy Analysis through Prompt Engineering for LLMs [3.1]
PAPEL (Privacy Policy Analysis through Prompt Engineering for LLMs) は、Large Language Models (LLMs) の力を利用してプライバシーポリシーの分析を自動化するフレームワークである。これらのポリシーからの情報の抽出、アノテーション、要約を合理化し、追加のモデルトレーニングを必要とせず、アクセシビリティと理解性を高めることを目的としている。 PAPELの有効性を, (i) アノテーションと (ii) 矛盾解析の2つの応用で実証した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:23:31 GMT)
Fine-Grained Representation Learning via Multi-Level Contrastive Learning without Class Priors [3.1]
Contrastive Disentangling(CD)は、クラス事前に依存することなく表現を学習するように設計されたフレームワークである。 CDはインスタンスレベルと特徴レベルのコントラスト損失を正規化エントロピー損失と統合し、意味的にリッチできめ細かな表現をキャプチャする。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:20:18 GMT)
A Comparative Quality Metric for Untargeted Fuzzing with Logic State Coverage [3.0]
本稿では,観測された興味深い振る舞いをカウントするために,論理状態のカバレッジをプロキシ指標として提案する。論理状態は、より細かい粒度の反復的(すなわちより興味深い)な振る舞いを区別し、観察された興味深い振る舞いの数に確実に比例するロジック状態のカバレッジを確実に得る。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:08:17 GMT)
GroCo: Ground Constraint for Metric Self-Supervised Monocular Depth [2.8]
本稿では,自己監督パラダイムに特化して設計された地盤領域に関する新しい制約を提案する。このメカニズムはスケールを正確に回復するだけでなく、深度予測と地上とのコヒーレンスを確保する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:30:27 GMT)
Using Similarity to Evaluate Factual Consistency in Summaries [2.8]
抽象要約器は流動的な要約を生成するが、生成したテキストの事実性は保証されない。本稿では,ゼロショット事実性評価尺度であるSBERTScoreを提案する。実験の結果,SBERTScoreでは,各手法の強度が異なることが示唆された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:02:38 GMT)
Bi-modality Images Transfer with a Discrete Process Matching Method [2.7]
両モード画像転送タスクを実現するために,新しいフローベースモデルである離散プロセスマッチング(DPM)を提案する。 MRI T1/T2とCT/MRIの3つのデータセットに対する実験により、DPMは両モード画像合成における他の最先端フローベース手法よりも優れていることが示された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:17:45 GMT)
DeepCloth-ROB$^2_{\text{QS}}$P&P: Towards a Robust Robot Deployment for Quasi-Static Pick-and-Place Cloth-Shaping Neural Controllers [2.7]
シミュレーショントレーニングされた視覚ベースのデータ駆動型ニューラルネットワークと実世界の操作の間の忠実度ギャップは、シミュレーションから物理実験へのメソッドの信頼性を損なう。 We propose DeepCloth-ROB$2_textQS$P&P with a Simulation-to-Reality transfer strategy Towel-Sim2Real and a cloth grasping protocol。私たちのアプローチでは、実環境で複数のニューラルコントローラを初めて比較することができ、布の操作コミュニティに貴重な洞察を与えます。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:08:16 GMT)
SPEED: Scalable Preprocessing of EEG Data for Self-Supervised Learning [2.7]
自己教師付き学習に最適化されたPythonベースのEEG前処理パイプラインを提案する。この最適化は、自己教師付きトレーニングを安定化し、下流タスクのパフォーマンスを向上させる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:30:15 GMT)
Solvent: liquidity verification of smart contracts [2.7]
スマートコントラクト検証ツールの現在の制限は、暗号資産の交換に関する流動性特性の表現と検証に効果がないことである。我々は,これらの特性の検証を目的とした溶剤について提案する。これは,Solidityの既存の検証ツールの範囲を超えている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:27:57 GMT)
Language-Agnostic Analysis of Speech Depression Detection [2.6]
本研究は、英語とマラヤラムの2言語間での自動抑うつ検出を解析する。 CNNモデルは、両言語に焦点をあてて、抑うつに関連する音響的特徴を特定するために訓練される。その結果,言語に依存しない抑うつ検出システムの開発に寄与する可能性が示唆された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:35:56 GMT)
Beyond Fine-tuning: Unleashing the Potential of Continuous Pretraining for Clinical LLMs [2.5]
大言語モデル (LLMs) は臨床応用の転換に有意な可能性を示唆している。臨床応用には, 連続事前訓練, 微調整, NEFTune, 即時工学の4つの手法を応用した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:09:57 GMT)
VaLID: Verification as Late Integration of Detections for LiDAR-Camera Fusion [2.5]
LiDARの使用法は一般的にカメラのみを使用する方法よりも優れている。本稿では,各予測境界ボックスが許容可能であるかどうかを検証したモデル独立遅延融合法VaLIDを提案する。提案手法はモデル非依存であり,汎用カメラ検出器を用いた場合においても,最先端の競争性能を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:27:10 GMT)
Unbiased third-party bots lead to a tradeoff between cooperation and social payoffs [2.5]
人工知能(AI)の台頭は、より適用性と制御性の高い協調力学に影響を与える新たな機会を提供する。我々は、不偏のボットは、よく混ざった集団の正常なプレイヤーの間で欠陥均衡をシフトできないことを示した。構造化された集団では、不偏な行動にもかかわらず、ボットは自発的に共同作業者や欠陥者に対して異なる影響を生じさせ、協力の強化につながった。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:50:12 GMT)
DepthART: Monocular Depth Estimation as Autoregressive Refinement Task [2.4]
本稿では,視覚的自己回帰変換器に基づく最初の自己回帰深度推定モデルを提案する。我々の主な貢献は、Depth Autoregressive Refinement Taskとして定式化された新しいトレーニング手法であるDepthARTである。実験により,提案手法は,奥行き推定タスクにおいて,次のスケールの予測によって視覚自己回帰モデルを大幅に上回ることを示した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:36:34 GMT)
Generalized conformal quantum mechanics as an ideal observer in two-dimensional gravity [2.4]
我々は、荷電粒子の運動の二重スケーリング限界から、ジャッキー・タイテルボイム重力に結合した一般化共形力学(GCM)に対する作用を得る。フル理論の半古典的ヒルベルト空間は、GCM に対するシュル「オーディンガー方程式」の一般時依存正規化解を明示的に解いて構成する。 JT重力に結合したGCMの完全な理論は量子化に寄与するので、量子重力に結合した検出器の可解モデルにつながる可能性がある。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:00:01 GMT)
Validity Learning on Failures: Mitigating the Distribution Shift in Autonomous Vehicle Planning [2.4]
計画問題は、自律運転フレームワークの基本的な側面を構成する。この問題に対処するための対策として,失敗に対する妥当性学習,VL(on failure)を提案する。 VL(on failure)は最先端の手法よりも大きなマージンで優れていることを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:47:50 GMT)
On demand single photon generation and coherent control of excitons from resonantly driven nanowire quantum dots [2.3]
ナノワイヤベースの量子ドット源は、オンチップハイブリッド統合の可能性から人気がある。共振励起InAsP/InPナノワイヤ量子ドットからのオンデマンド単光子生成を実証する。ハイブリッド量子フォトニクス統合の道を開き、スピン光子絡み合いと物質記憶をチップ上で実現している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:29:41 GMT)
ZeroSCD: Zero-Shot Street Scene Change Detection [2.3]
Scene Change Detectionは、コンピュータビジョンとロボティクスにおいて難しいタスクである。従来の変更検出方法は、これらのイメージペアを入力として、変更を見積もるトレーニングモデルに依存しています。我々は,ゼロショットシーン変化検出フレームワークであるZeroSCDを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:53:44 GMT)
Rapid Bayesian identification of sparse nonlinear dynamics from scarce and noisy data [2.3]
我々はベイジアンフレームワーク内でSINDy法をリキャストし、ガウス近似を用いて計算を高速化する。ベイジアン・シンディは推定したパラメータの不確かさを定量化するが、限られたノイズのあるデータから正しいモデルを学ぶ際にもより堅牢である。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:51:21 GMT)
UniBEVFusion: Unified Radar-Vision BEVFusion for 3D Object Detection [2.1]
多くのレーダービジョン融合モデルではレーダーを希薄なLiDARとして扱い、レーダー固有の情報を過小評価している。本稿では,レーダー固有データを深度予測プロセスに統合したRDLモジュールを提案する。また、異なるモードでBEV機能を抽出するUnified Feature Fusion (UFF)アプローチも導入する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 06:57:27 GMT)
FUSED-Net: Enhancing Few-Shot Traffic Sign Detection with Unfrozen Parameters, Pseudo-Support Sets, Embedding Normalization, and Domain Adaptation [2.1]
本稿では,交通信号検出のための高速RCNN「FUSED-Net」を提案する。従来のアプローチとは異なり、トレーニング中にすべてのパラメータを凍結しないようにし、限られたサンプルからFUSED-Netを学習できるようにします。 1ショット,3ショット,5ショット,10ショットのシナリオでそれぞれ2.4倍,2.2倍,1.5倍,1.3倍の改善を実現しています。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:34:42 GMT)
IGCN: Integrative Graph Convolution Networks for patient level insights and biomarker discovery in multi-omics integration [2.1]
本稿では,癌分子サブタイプとバイオメディカル分類のための新しい統合ニューラルネットワークアプローチを提案する。 IGCNは、特定のクラスを予測するために患者に対してどのタイプのオミクスがより強調されるかを特定することができる。 IGCNは、様々なオミクスデータタイプから重要なバイオマーカーを特定できる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:15:07 GMT)
An Effective Deployment of Diffusion LM for Data Augmentation in Low-Resource Sentiment Classification [2.1]
感性分類(SC)は、ドメイン固有のコンテキスト、不均衡なラベル分布、少数ショットシナリオなど、低リソースの課題に悩まされることが多い。我々はDiffusion LMを提案し、強力なラベル関連トークンを再構成することでドメイン内の知識を捕捉し、擬似サンプルを生成する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:39:34 GMT)
Skills Made to Order: Efficient Acquisition of Robot Cooking Skills Guided by Multiple Forms of Internet Data [2.1]
我々は,様々なインターネットデータソースを用いて,一連のテンプレートロボットの動作を選択して,スキルを発揮できる方法を探究する。その結果,LLMは視覚情報の欠如にもかかわらず驚くほど有能なテンプレートセレクタであることが判明した。これらのシナジーを活用することで、ツール使用を含む16種類の調理スキルのセットで79%の成功率を達成する、複数種類のインターネットデータを用いたテンプレートセレクタを作成する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:25:44 GMT)
ASTE Transformer Modelling Dependencies in Aspect-Sentiment Triplet Extraction [2.1]
Aspect-Sentiment Triplet extract (ASTE) は、ある文から三重項(アスペクトフレーズ、意見フレーズ、感情極性)を抽出するタスクである。最近の最先端手法は、まず与えられた文から可能な全てのスパンを抽出することで、このタスクにアプローチする。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:49:47 GMT)
From Image to Language: A Critical Analysis of Visual Question Answering (VQA) Approaches, Challenges, and Opportunities [2.1]
この研究は、VQAデータセットとフィールドの歴史に関するメソッドの複雑さを掘り下げる、VQA(Visual Question Answering)の領域における調査である。我々はさらにVQAをマルチモーダルな質問応答に一般化し、VQAに関連する課題を探求し、今後の調査に向けた一連のオープンな問題を提示する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 22:36:53 GMT)
Convergence Rates for Stochastic Approximation: Biased Noise with Unbounded Variance, and Applications [2.1]
目的関数 $J(cdot)$ の定常点を求めるグラディエント・Descent (SGD) 法の収束特性について検討した。この結果は、すべての定常点が大域最小値である性質を持つ invex' 関数のクラスに適用できる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:22:41 GMT)
Scaling Laws of Decoder-Only Models on the Multilingual Machine Translation Task [1.9]
マルチ言語およびマルチドメイン翻訳タスクにおけるデコーダのみのモデルのスケーリング法則について検討する。大規模言語モデルで発見されたようなスケーリング法則を用いて,デコーダのみのモデルの損失を推定できることを示す。また、モデルの深さと幅のスケーリングは、同様のテスト損失の改善をもたらすが、モデルの効率に異なる影響を与えることを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:26:01 GMT)
Embedding Knowledge Graphs in Degenerate Clifford Algebras [1.9]
知識グラフ埋め込みの文脈において、Cl_p,q$という形のクリフォード代数を研究する。パラメータの発見には$p$,$q$,$r$の2つの新しいモデルを設計する。 7つのベンチマークデータセットによる評価結果から, 零ベクトルが埋め込みの捕集に有効であることが示唆された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:57:13 GMT)
Built Different: Tactile Perception to Overcome Cross-Embodiment Capability Differences in Collaborative Manipulation [1.9]
触覚は、人間とロボットのアシスタントの間で暗黙のコミュニケーションを行う強力な手段である。本稿では,触覚がロボットシステム間での身体間差異をいかに超越させるかを検討する。本研究では,ロボットと人間が協調して宇宙空間で物体を操る,協調作業を可能にする方法を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:45:41 GMT)
Region Mixup [1.9]
本稿では,Mixupの簡易拡張について紹介する(Zhangら,視覚認識タスクにおける一般化データ拡張)。画像全体をブレンドするバニラ混合法とは異なり、本手法は複数の画像からの領域の組み合わせに焦点を当てる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:55:16 GMT)
Autonomous Exploration and Semantic Updating of Large-Scale Indoor Environments with Mobile Robots [1.9]
移動ロボットが未知の環境を自律的に探索できる新しいロボットシステムを提案する。ロボットは、93m×90mのフロアを意味的にマッピングし、オブジェクトが環境に移動されるとセマンティックマップを更新する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:25:03 GMT)
Experimental Simulation of Two Pulses and Three Pulses Coherent One Way Quantum Key Distribution Protocol in Noisy/Noiseless and Wired/Wireless Environment [1.9]
Coherent One Way(COW)プロトコルは、ハードウェア展開の容易さから、最も有名なプロトコルの1つである。我々は、ノイズのないシナリオとノイズのないシナリオの両方で、プロトコルの符号化と復号部分を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:02:52 GMT)
MACeIP: A Multimodal Ambient Context-enriched Intelligence Platform in Smart Cities [1.8]
本稿では,スマートシティのためのマルチモーダル環境情報プラットフォーム(MACeIP)を提案する。私たちのプラットフォームは、IoT(Internet of Things)センサー、エッジとクラウドコンピューティング、マルチモーダルAIなど、高度なテクノロジを統合して、応答性とインテリジェントな都市エコシステムを構築します。主なコンポーネントは、市民インタラクションのためのInteractive Hubs、広範なIoTセンサーネットワーク、インテリジェントな公開資産管理、歩行者監視システム、都市計画ポータル、クラウドコンピューティングシステムである。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:39:53 GMT)
Intelligent Routing Algorithm over SDN: Reusable Reinforcement Learning Approach [1.8]
本稿では,再利用可能なRLSRルーティングアルゴリズム RLSR-Routing をSDN上で開発する。我々のアルゴリズムは従来の手法よりもロードバランシングの点で優れた性能を示している。また、複数のトラフィック要求のパスを見つける際には、再利用不可能なRLアプローチよりも早く収束する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:15:24 GMT)
Spectral Gap Optimization for Enhanced Adiabatic State Preparation [1.8]
本稿では,テンソルネットワーク状態(TNS)を近似的に生成する効率的な手法を提案する。 1次元のランダムなTNS、AKLT、GHZ状態の例を通して、この効率的なTNS作成アルゴリズムを実証する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:00:32 GMT)
InsightPulse: An IoT-based System for User Experience Interview Analysis [1.8]
本稿では,IoT(Internet of Things)ベースのハードウェアおよびソフトウェアシステムであるInsightPulseを紹介する。 InsightPulseは、重要な議論ポイントを自動的に識別しハイライトし、フォローアップ質問を積極的に提案し、テーマの要約を生成することで、ユーザインタビュー中のリアルタイムサポートを提供する。システムは堅牢なバックエンド分析ダッシュボードを備えており、インタービュー後のレビュープロセスが簡単になり、実行可能な洞察の迅速な抽出が容易になり、全体的なUX研究効率が向上する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:39:34 GMT)
Behavioral Bias of Vision-Language Models: A Behavioral Finance View [1.7]
本稿では,LVLM(Large Vision-Language Models)の行動バイアスについて,行動金融の観点から検討する。評価の結果,LLaVA-NeXT,MobileVLM-V2,Mini-Gemini,Mini-Llama3-V 2.5,Phi-3-vision-128kといったオープンソースのLVLMは,これらの2つのバイアスに大きく影響していることがわかった。私たちの観察では、オープンソースモデルの改善の方向性を強調しています。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:54:47 GMT)
Learning characteristic parameters and dynamics of centrifugal pumps under multiphase flow using physics-informed neural networks [1.7]
本研究では,ESPシステムの流体特性,動的状態,重要なパラメータを間接的に推定する物理インフォームドニューラルネットワーク(PINN)モデルを提案する。 PINNモデルの有効性は,これらの圧力測定を入力データとして,未知の状態とパラメータを推定することによって検証した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:08:24 GMT)
Dual Stream Graph Transformer Fusion Networks for Enhanced Brain Decoding [1.6]
本稿では,タスクベース脳磁図(MEG)データの分類に特化して設計された新しいDual Stream Graph-Transformer Fusionアーキテクチャを提案する。空間ストリームでは、入力はまずグラフとして表現され、次にグラフアテンションネットワーク(GAT)を介して空間パターンを抽出する。実験の結果,他の試験モデルと比較して,分類性能の向上と標準偏差の低減が示された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:59:22 GMT)
Identification and Mitigating Bias in Quantum Machine Learning [1.5]
本研究は、量子機械学習におけるバイアスに対する識別、診断、応答に関する研究を含む。本稿では,3つの主要なトピックの概要を提供する。量子機械学習に特有のバイアスは,どのように見えるか? それについて何ができるのか、すべきなのか?
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:31:16 GMT)
Quantum-interference-induced pairing in antiferromagnetic bosonic $t$-$J$ model [1.5]
反強磁性ボソニック$t$-$J$モデルについて,大規模密度行列再正規化群計算を用いて検討した。密閉孔対の対密度波 (PDW) がAFM秩序と共存し, 小型ドーピング時に「超固体」を形成することがわかった。対の順序は大きなドーピングで崩壊し、スピン背景との超流動の単ボソン凝縮と強磁性(FM)秩序が同時に崩壊する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:00:04 GMT)
Parsimonious Optimal Dynamic Partial Order Reduction [1.5]
本稿では,Parsimonious-Optimal DPOR(POP)を提案する。 POPは、(i)同じ人種の複数の逆転を避ける擬似的な人種反転戦略を含む、いくつかの新しいアルゴリズム技術を組み合わせている。我々のNidhuggの実装は、これらの手法が並列プログラムの解析を著しく高速化し、メモリ消費を抑えられることを示している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:42:30 GMT)
CON: Continual Object Navigation via Data-Free Inter-Agent Knowledge Transfer in Unseen and Unfamiliar Places [1.5]
本研究は,ロボット物体目標ナビゲーション(ON)を強化するため,短時間のエージェント間知識伝達(KT)の可能性を探るものである。私たちはこのプロセスを,ブラックボックスモデル(教師)から新しいモデル(学生)への知識伝達を目的とした,データフリー連続学習(CL)チャレンジとして捉えています。このギャップに対処するために,オープンワールド環境における非協力的なブラックボックス教師を対象とした,軽量でプラグ&プレイ可能なKTモジュールを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:50:11 GMT)
Two-component repulsive atomic Fermi gases in a thin spherical shell [1.4]
薄い球状殻形状の反動相互作用を持つ2成分原子フェルミガスの基底状態構造を示す。このシステムは、相互作用強度が臨界値を超えたときに、均一混合物から2チャンク相分離への不可解な遷移を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:17:33 GMT)
Probing the limits of variational quantum algorithms for nonlinear ground states on real quantum hardware: The effects of noise [1.4]
非線形シュリンガー方程式の基底状態を取得するために, 実振幅, ハードウェア効率のアンサッツの表現性について検討する。量子ハードウェアノイズはエネルギーコスト関数の評価を損なうが、問題の小さなインスタンスは基底状態に一貫して収束する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 06:21:53 GMT)
A New Algorithm for Computing Branch Number of Non-Singular Matrices over Finite Fields [1.3]
状態差やリニアマスクにおけるゼロでない要素の数は、アクティブなSボックスと直接相関する。微分分岐数または線形分岐数は、SPN暗号の2つの連続するラウンドにおける活性S-ボックスの最小数を示す。本稿では,有限体上の非特異行列の分岐数を計算するための新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:20:04 GMT)
Quantum Routing with Teleportation [1.3]
量子系における相互作用制約の下で、量子ビットの任意の置換を実装する問題について検討する。特に,スワップベースおよびより一般的なユニタリルーティング手法による高速化の例を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:34:09 GMT)
Low dimensional representation of multi-patient flow cytometry datasets using optimal transport for minimal residual disease detection in leukemia [1.3]
急性骨髄性白血病(AML)におけるMRD(Representing and Minimal Residual Disease)は予後と予後に必須である。本稿では, 最適輸送(OT)に基づく統計的学習手法について検討し, フロー計測の低次元表現を実現する。特に、我々のOTベースのアプローチは、FlowSomアルゴリズムの結果の関連性および情報的2次元表現を可能にする。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:09:01 GMT)
SEAL: Suite for Evaluating API-use of LLMs [1.3]
SEALは、現実世界のAPI使用時に大きな言語モデルを評価するように設計されたエンドツーエンドのテストベッドである。既存のベンチマークを標準化し、API検索と計画をテストするエージェントシステムを統合し、リアルタイムAPIの不安定性に対処する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:16:49 GMT)
Quantifying Context Bias in Domain Adaptation for Object Detection [1.2]
オブジェクト検出のためのドメイン適応(DAOD)は、トレーニングされたモデルをソースからターゲットドメインに転送することを目的としている。フォグギーDにおける文脈バイアスは、適応中の背景特徴の変化を解析することによって研究されていない。我々は,文脈バイアスの理解が霧のDアプローチに影響を及ぼすことを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 03:01:50 GMT)
A Diagonal Structured State Space Model on Loihi 2 for Efficient Streaming Sequence Processing [1.1]
本稿では,Intel の Loihi 2 状態のニューロモルフィックプロセッサ上で,SSM S4D のトークン・バイ・トークン推論を行う。これにより、SSMの効率的なリアルタイムストリーミングアプリケーションへの新たな道が開ける。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:50:11 GMT)
Automatic Feature Learning for Essence: a Case Study on Car Sequencing [1.0]
問題インスタンスに最適な組み合わせを自動的に選択するために、機械学習モデルを構築するタスクについて検討する。学習プロセスの重要な部分は、選択モデルへの入力として機能するインスタンス機能を定義することである。私たちの貢献は、言語モデルを用いた問題インスタンスの高レベル表現から直接、インスタンス機能の自動学習です。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:06:44 GMT)
The solving degrees for computing Gröbner bases of affine semi-regular polynomial sequences [0.9]
本研究では,アフィン半正則配列とその均質化配列の解度について検討する。これらの結果から,Gr"オブザーバー基底の計算方法の正確性を数学的に厳密に評価できると考えられる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:30:23 GMT)
Origin of Robust $\mathbb{Z}_2$ Topological Phases in Stacked Hermitian Systems: Non-Hermitian Level Repulsion [0.9]
非自明な$mathbbZ$位相を持つ量子スピンホール絶縁体は、20年間大きな注目を集めてきた。一般に、量子スピンホール絶縁体の偶数の層が積み重なると、$mathbbZ$位相位相は$mathbbZ$自然により不安定になると考えられている。我々は、ロバスト性は一般的に、ハーミティゼーションから派生した対応する非エルミティアン系におけるレベル反発から生じるという体系的な理解を提供する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 05:40:57 GMT)
Decision support system for Forest fire management using Ontology with Big Data and LLMs [0.9]
火災リスクを評価し、資源需要を予測する火災指標が不可欠である。医療や環境モニタリングなどの分野におけるセンサネットワークの増加に伴い、セマンティックセンサーネットワークは、気候データ収集にますます利用されている。本稿では,Apache Sparkによる森林火災の早期検出,気象・地理データによる火災リスク予測の強化について論じる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 06:13:48 GMT)
Shadow Quantum Linear Solver: A Resource Efficient Quantum Algorithm for Linear Systems of Equations [0.8]
本稿では,デジタル量子デバイス上での量子線形システム問題(QLSP)の解法を提案する。その結果、大きな制御されたユニタリの必要性を回避し、システムサイズで対数的な多くの量子ビットを必要とする量子アルゴリズムが実現した。これを、線形代数の分解定理を利用して、2次元格子における離散化されたラプラス方程式を解くことで、実用的妥当性の物理問題に適用する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:47:57 GMT)
Dynamic Realms: 4D Content Analysis, Recovery and Generation with Geometric, Topological and Physical Priors [0.8]
私の研究は、4Dは3つの空間次元(x, y, z)と、形状や動きなどの時間次元tを含む4Dコンテンツの分析、回復、生成に焦点を当てています。私の研究は、幾何学的、トポロジ的、物理的優先事項を取り入れることで、4Dコンテンツ生成をより効率的、アクセシビリティ、高品質にすることを目的としています。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 03:46:51 GMT)
Two Deep Learning Solutions for Automatic Blurring of Faces in Videos [0.8]
本稿では,監視ビデオにおける顔ぼやけ問題に対処するための,ディープラーニングに基づく2つの選択肢を提案する。まず、顔を検出するために訓練された古典的な物体検出装置で構成され、その後、ぼやけている。第二に、Unetのようなセグメンテーションネットワークを訓練して、すべての顔がぼやけた入力画像のバージョンを出力する間接的アプローチである。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:59:44 GMT)
A multi-module silicon-on-insulator chip assembly containing quantum dots and cryogenic radio-frequency readout electronics [0.8]
量子処理ユニットは、デジタルおよびアナログ電子モジュールを含むより大きな情報処理システムのモジュールである。シリコンベースの量子コンピューティングは、同じ技術プラットフォームを使用してすべてのモジュールを製造する機会を提供する。シリコン量子デバイスの多重読み出しのための低温多モジュールアセンブリを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:30:00 GMT)
Continuous Variable Quantum Key Distribution with Single Quadrature Measurement at Arbitrary Reference Frame [0.7]
連続可変量子鍵分布(CVQKD)に対する二次スイッチングのないホモダイン検出法の提案この方式は,実用的なフリースペースおよびファイバベースの GMCS プロトコルベースのCVQKD システムに有利である。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:29:34 GMT)
Non-Markovian skin effect [0.7]
非マルコフ環境がリウヴィリアの皮膚効果をどう変えるかを示す。我々は、結合が反回転項を含む場合にのみ、スキンモード量子コヒーレンスが生成されることを確認した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:53:59 GMT)
Ultrabright fiber-coupled ploarization-entangled photon source with spectral brightness surpassing 2.0 MHz/mW/nm [0.7]
単一モードファイバに最適に結合する超高輝度偏光共役光子源を提案する。簡単なモードマッチング光学装置を用いることで,光子対のSMF結合と共有効率を最適化する。これは、CWレーザー励起バルク結晶を用いたSPDC光子の最も高いスペクトル輝度を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 23:50:03 GMT)
SDBA: A Stealthy and Long-Lasting Durable Backdoor Attack in Federated Learning [0.7]
フェデレートラーニング(Federated Learning)は、データのプライバシを維持しながら機械学習モデルをトレーニングする上で、有望なアプローチだが、その分散特性は、バックドア攻撃に対して脆弱である。本稿では,FL環境におけるNLPタスクのための新しいバックドアアタック機構であるSDBAを紹介する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:30:57 GMT)
Critic Loss for Image Classification [0.6]
CrtClは、ジェネレータ批判フレームワークにおける画像分類トレーニングを定式化する。 CrtClは、クロスエントロピー損失による負の副作用を軽減し、精度の学習損失法である。低ラベルデータ構造におけるCrtClの有効性を,アクティブラーニングの文脈で検討した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:41:33 GMT)
Boosting Healthcare LLMs Through Retrieved Context [0.6]
本研究では,医療領域におけるコンテキスト検索手法の境界について検討する。以上の結果から,LLMが確立した医療ベンチマークにおいて,最大規模のプライベートソリューションに匹敵するパフォーマンスを達成できることが判明した。特に,より信頼性の高いオープンエンド回答の生成を改善するために,OpenMedPromptを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:33:38 GMT)
Towards Flexible Anonymous Networks [0.6]
我々はボランティアベースの分散ネットワークのための新しいソフトウェアアーキテクチャを提案する。 FANは、開発者がソフトウェアの継続的進化を保証する能力を失うことなく、依存関係をプロトコル寛容からシフトさせる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:56:48 GMT)
A Novel Framework for the Automated Characterization of Gram-Stained Blood Culture Slides Using a Large-Scale Vision Transformer [0.5]
本研究では,グラムスライディング画像(WSI)の人工知能による特徴付けのための新しい枠組みを提案する。我々は,従来の畳み込みニューラルネットワーク(CNN)よりも大規模データセットにスケーラブルな,グラムスタンプWSI分類のための新しいトランスフォーマーベースモデルを開発した。本モデルでは, 475-slideデータセット上の5倍のネスト型クロスバリデーションを用いて, 0.858の分類精度と0.952のAUCを実現する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:02:21 GMT)
Polyatomic Complexes: A topologically-informed learning representation for atomistic systems [0.5]
原子系の表現について述べる。原子論系を符号化する一般的なアルゴリズムを提供する。各種タスクにおける最先端手法に匹敵する性能を報告する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 23:09:23 GMT)
Harmonic Path Integral Diffusion [0.5]
連続多変量確率分布からサンプリングする新しい手法を提案する。本手法は状態空間の起点を中心とするデルタ関数から時間依存ブリッジを構築する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:20:21 GMT)
Blind Spatial Impulse Response Generation from Separate Room- and Scene-Specific Information [0.4]
ユーザの実際の音響環境に関する知識は,環境にシームレスに溶け込む仮想音のレンダリングに不可欠である。最終出力において,室内パラメータと位置パラメータの両方がどう考慮されるかを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:41:31 GMT)
WisPerMed at BioLaySumm: Adapting Autoregressive Large Language Models for Lay Summarization of Scientific Articles [0.4]
本稿では,BioLaySumm2024共有タスクにおけるWisPerMedチームの作業について述べる。大規模言語モデル(LLM)、特にBioMistralとLlama3は微調整され、レイサマリーを作成するために使用された。実験によると、微調整は一般的に、最も評価されたメトリクスで最高のパフォーマンスをもたらす。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:03:32 GMT)
Temporal Graph Memory Networks For Knowledge Tracing [0.4]
本稿では,深部時間グラフメモリネットワークを用いて,知識状態の関連性と時間的ダイナミクスを協調的にモデル化する手法を提案する。また,グラフメモリモジュール上の時間減衰制約を用いて,学生の忘れ行動を表現する汎用手法を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:47:02 GMT)
Computational Pathology for Accurate Prediction of Breast Cancer Recurrence: Development and Validation of a Deep Learning-based Tool [0.4]
Deep-BCR-Autoは、乳がん再発リスクを予測するディープラーニングベースの計算病理学アプローチである。我々の方法論は2つの独立したコホートで検証された。 Deep-BCR-Autoは、患者を低頻度と高頻度のリスクカテゴリに分類する上で、堅牢なパフォーマンスを示した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:22:06 GMT)
Learning Diverse Robot Striking Motions with Diffusion Models and Kinematically Constrained Gradient Guidance [0.4]
私たちは、オフラインで制約付きで、多様なアジャイルの振る舞いを表現する、新しい拡散モデリングアプローチを開発しています。エアホッケーとリアル卓球の2つの課題領域において, KCGG を評価することで, 時間クリティカルなロボット作業に対するアプローチの有効性を実証する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:26:51 GMT)
Efficient and precise quantum simulation of ultra-relativistic quark-nucleus scattering [0.4]
クォーク核散乱のダイナミクスをシミュレートする,効率的かつ高精度な枠組みを提案する。我々のフレームワークは量子力学における様々な散乱問題の力学をシミュレートするために一般化することができる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:40:32 GMT)
Lateral Ventricle Shape Modeling using Peripheral Area Projection for Longitudinal Analysis [0.3]
側心室形状(LV)の変形は, 疾患に伴う特定の形態的変化を明らかにするために広く研究されている。周辺領域のプロジェクションを用いた新しい深層学習手法を提案し,その周辺領域を考慮したLV解析の試みを行った。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 01:49:24 GMT)
Cavity Quantum Electrodynamics with Atom Arrays in Free Space [0.3]
キャビティ量子電磁力学(キャビティQED)は、単一光子レベルでの光-物質相互作用の制御を可能にする。自由空間に閉じ込められた原子に基づく空洞QEDアーキテクチャを提案する。本稿では,従来の空洞QEDパラメータを用いて,原子の2次元配列を記述できることを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:01:27 GMT)
Evaluating the Usability of LLMs in Threat Intelligence Enrichment [0.3]
大規模言語モデル(LLM)は、脅威知能を著しく向上させる可能性がある。しかし、その信頼性、正確性、および不正確な情報を生成する可能性に関する懸念は継続する。本研究では、ChatGPT、Gemini、Cohere、Copilot、Meta AIの5つのLCMの総合的ユーザビリティ評価を行う。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:44:56 GMT)
Analytical derivation and extension of the anti-Kibble-Zurek scaling in the transverse field Ising model [0.3]
スピン基底状態からの偏差を定量化する欠陥密度は、相転移中の非平衡ダイナミクスを特徴づける。広く知られているKibble-Zurekスケーリングは、相転移中に欠陥密度がどのように進化するかを予測する。しかし、ノイズによって摂動できるため、アンチ・キブル・ズールクのスケーリングに繋がる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 06:32:44 GMT)
Adenocarcinoma Segmentation Using Pre-trained Swin-UNet with Parallel Cross-Attention for Multi-Domain Imaging [0.3]
本稿では,Swin-UNetアーキテクチャを並列モジュールで拡張した事前学習型エンコーダにより構成するフレームワークについて述べる。実験の結果, クロストラックでは0.7469, クロススキャナでは0.7597のセグメンテーションスコアが得られた。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:38:43 GMT)
LLM in the Shell: Generative Honeypots [0.3]
ハニーポットはサイバーセキュリティにおいて、早期発見、脅威情報収集、攻撃者の行動分析に不可欠なツールである。この研究は、Linuxライクなシェル出力を生成するLarge Language Modelsをベースとした、動的で現実的なソフトウェアハニーポットであるShelLMを導入している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:51:00 GMT)
Eigenstate localization in a many-body quantum system [0.2]
我々は、多体相互作用と多体移動エッジを持つ広い多体ハミルトンの存在を証明した。非零エネルギー密度以下のすべての固有状態は、ヒルベルト空間内の「エネルギー的に許容される構成」の指数的に小さな部分で局所化される。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:26:51 GMT)
EMERS: Energy Meter for Recommender Systems [0.2]
EMERSは,推奨システム実験のエネルギー消費の測定,監視,記録,共有を簡単にするソフトウェアライブラリである。 EMERSは、スマート電源プラグを用いてエネルギー消費を測定し、推奨システム実験のエネルギー消費を監視し比較するためのユーザインターフェースを提供する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:35:06 GMT)
Synthesis of Energy-Conserving Quantum Circuits with XY interaction [0.2]
我々は、XX+YY相互作用だけで実現できる$sqrtiSWAP$ゲートとエンタングルゲートから構築された量子回路について研究する。このようなゲートは、計算ベースで状態のハミング重みを保存する。一般エネルギー保存ユニタリを$sqrtiSWAP$ゲートと2個のアシラリー量子ビットのみを用いて合成する方法を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 01:20:42 GMT)
Advancing Global South University Education with Large Language Models [0.2]
研究は、グローバル・サウスとグローバル・ノースの間の高等教育の質の格差を示している。グローバル・サウスの生徒と教師の比率は、グローバル・ノースの生徒よりもかなり高い。インドネシア大学は、大きな言語モデルを統合することで品質学習と教育を強化する実験を開始した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:33:38 GMT)
Patch-Based End-to-End Quantum Learning Network for Reduction and Classification of Classical Data [0.2]
ノイズの多い中間スケール量子(NISQ)時代には、量子デコヒーレンス、クロストーク、不完全校正による誤差により、量子ビットの制御が制限される。量子ネットワークによって処理される場合,画像などの大規模古典データのサイズを小さくする必要がある。本稿では、このようなデータ削減を回避するために、古典的な注意機構を持つ動的パッチベースの量子ドメインデータ削減ネットワークを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:58:02 GMT)
Convergence rate of random scan Coordinate Ascent Variational Inference under log-concavity [0.2]
Coordinate Ascent Variational Inference schemeは、関心の確率分布の平均場近似を計算するために使われる一般的なアルゴリズムである。対象密度の対数共共振仮定に基づいてランダムスキャンバージョンを解析する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:27:50 GMT)
Bayesian computation with generative diffusion models by Multilevel Monte Carlo [0.2]
本稿では,拡散モデルによるベイズ計算のコストを大幅に削減するマルチレベルモンテカルロ戦略を提案する。提案したマルチレベルモンテカルロ法の有効性は、3つの標準計算イメージング問題で実証された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:57:08 GMT)
Instruction Tuning Vs. In-Context Learning: Revisiting Large Language Models in Few-Shot Computational Social Science [0.1]
In-context Learning (ICL) とインストラクションチューニング (IT) を用いた大規模言語モデル (LLM) の分類性能の評価を行った。 ICLは、明示的な勾配更新なしで例から学ぶことで、タスク適応の迅速な代替手段を提供する。私たちの研究は、CSSタスクを数ショットで処理する上で、ICLの重大な利点を強調しています。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 02:43:08 GMT)
Witnessing mass-energy equivalence with trapped atom interferometers [0.1]
本稿では,質量-エネルギー等価性から生じる量子重ね合わせ原理と重力時間拡張との相互作用を探索する実験装置を提案する。最先端の原子干渉計を利用して、地球の重力場の高度の重なり合いに閉じ込められた原子を、極端に小さなスケールまで長時間保持することができる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:42:05 GMT)
Views on AI aren't binary -- they're plural [0.1]
単純なバイナリはAI談話の正確なモデルではない、と私たちは主張する。私たちは、AI開発とガバナンスに取り組んでいる人々の広いコミュニティにおいて、個人がus-vs-themの衝突の発生を避けるためにどのように役立つかを具体的に提案します。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:23:47 GMT)
ViBERTgrid BiLSTM-CRF: Multimodal Key Information Extraction from Unstructured Financial Documents [0.0]
本稿では,BiLSTM-CRF層を組み込んだマルチモーダルトランスフォーマー(ViBERTgrid)を非構造化財務文書に適用する手法を提案する。提案した ViBERTgrid BiLSTM-CRF モデルでは,ファイナンシャルドメイン内の非構造化文書から名付けられたエンティティ認識の性能(最大2ポイント)が大幅に向上した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:28:06 GMT)
Using Agile Story Points and Game Theory Together: Better Software Planning and Development in Agile Software Development [0.0]
この研究は、アジャイルソフトウェア開発、ストーリーポイント推定、ゲーム理論の主な概念を統合します。本稿では,ゲーム理論の応用,特にVickrey AuctionとStag Hunt Gameを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:21:04 GMT)
Underwater SONAR Image Classification and Analysis using LIME-based Explainable Artificial Intelligence [0.0]
本稿では,水中画像分類結果の解釈に,eXplainable Artificial Intelligence (XAI)ツールの適用について検討する。ベンチマーク畳み込みニューラルネットワーク(CNN)アーキテクチャを用いた画像分類のための転写学習手法の広範な解析を行う。 XAIのテクニックは、結果の解釈可能性をより人間に準拠した方法で強調することで、信頼性と信頼性を高めます。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:39:14 GMT)
Uncertainty relations for quantum measurements from generalized equiangular tight frames [0.0]
情報過剰測定は、量子情報処理において貴重なツールである。互いに偏りのない基底を持つ$d+1$の存在は、素パワーである$d$に対して証明される。ある種の制限が過度に不注意に保たれることは興味深い。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 06:57:39 GMT)
Two-particle tunneling and the impact of interaction [0.0]
2つのボソンをダブルウェルでトンネルし、接触、ソフト、ハードコアのクーロン相互作用を調整可能な強度で行う。左井戸の2粒子基底状態の非相関トンネルの遷移は、1つの粒子を持つ状態との共鳴によるものである。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:47:20 GMT)
Tutorial: Extracting entanglement signatures from neutron spectroscopy [0.0]
このチュートリアルは、分光から量子スピンの絡み合いの証人を計算する最近の方法の教育的な紹介である。概念と方程式を簡潔に紹介し、データ分析プロトコルを定義し、三つの絡み合った目撃者の解釈について議論する: 1つの絡み合い、2つの絡み合い、および量子フィッシャー情報。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:46:45 GMT)
Towards Better Monolingual Japanese Retrievers with Multi-Vector Models [0.0]
日本語では、最も優れたディープラーニングに基づく検索手法は多言語密着型埋め込みに依存している。マルチ言語よりも2桁少ないデータで訓練されたマルチベクトルレトリバーのファミリーであるJaColBERTを紹介する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 02:51:31 GMT)
Total and Symmetry resolved Entanglement spectra in some Fermionic CFTs from the BCFT approach [0.0]
約2ドルのフェルミオンCFTの単一間隔における全スペクトルと対称性分解スペクトルについて検討する。ヒルベルト空間の分割は、絡み合う境界点の周りの円盤を切断し、精査の下で拡張対称性を保つ境界条件を課すことによって達成される。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:06:57 GMT)
The last Dance : Robust backdoor attack via diffusion models and bayesian approach [0.0]
拡散モデルは、前方と後方の学習原理に基づいて訓練された最先端のディープラーニング生成モデルである。人工知能研究の世界で人気のあるフレームワークであるHugging Faceから派生したオーディオトランスフォーマーに対するバックドア攻撃の可能性を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 05:19:58 GMT)
The Top Manifold Connectedness of Quantum Control Landscapes [0.0]
本稿では,地形の上部多様体を形成する大域最適制御解の経路接続性について数値的に検討する。状態-状態遷移確率を含む異なる量子制御目標に対して、観測可能な期待値とユニタリ変換は、そのような連続経路を容易に見つけることができる。後者の予想の意義は、原目的の完全な最適性を維持しつつも、補助目的を最適化できるトップ多様体内の位置を求めることである。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:42:53 GMT)
The ParlaSpeech Collection of Automatically Generated Speech and Text Datasets from Parliamentary Proceedings [0.0]
我々は,低リソース言語による大規模かつオープンな音声・テキスト対応データセットを構築するためのアプローチを提案する。我々は3つのスラヴ語、すなわちクロアチア語、ポーランド語、セルビア語に焦点を当てている。このパイロット実行の結果は、5000時間以上のスピーチと付随するテキストの書き起こしにまたがる、高品質な3つのデータセットである。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:12:18 GMT)
The Palomar twilight survey of 'Ayló'chaxnim, Atiras, and comets [0.0]
太陽近傍のツワイライト観測により、金星(アイロス)、地球(アティラス)、彗星の軌道上の小惑星の内部を検出できる。太陽から31から66度の範囲で、夕方と朝のツイライトに46,000回以上の露光が観測された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:56:45 GMT)
The Impact of Generative Artificial Intelligence on Ideation and the performance of Innovation Teams (Preprint) [0.0]
この研究は、知識の流出、ジェネレーション、応用に対するAIの効果を理解するために、知識スパイルオーバー理論を応用している。その結果,GenAIは神経回路の知識スパイルオーバー理論の重要な要素に肯定的な影響を与えることが明らかとなった。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:25:49 GMT)
Taylorformer: Probabilistic Modelling for Random Processes including Time Series [0.0]
時系列などのランダムなプロセスに対してTaylorformerを提案する。 1) ニューラルネットワークベースの確率モデルで使用するためにTaylor近似を適用するLocalTaylorラッパー,2) ガウス過程の平均予測がコンテキストデータの線形滑らか化にどのように影響するかに触発された方法で予測を行うMHA-Xアテンションブロックである。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:56:20 GMT)
SynthAI: A Multi Agent Generative AI Framework for Automated Modular HLS Design Generation [0.0]
本稿では,HLS設計の自動化手法であるSynthAIを紹介する。 SynthAIはReActエージェント、Chain-of-Thought(CoT)プロンプト、Web検索技術、Retrieval-Augmented Generationフレームワークを統合している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:38:16 GMT)
Stochastic Thermodynamics at the Quantum-Classical Boundary: A Self-Consistent Framework Based on Adiabatic-Response Theory [0.0]
マイクロサーマルマシンは将来の量子技術において重要な役割を果たすことを約束する。このようなデバイスを広く応用するには、出力を古典的自由度のような容易にアクセス可能なストレージシステムに流すための効果的な戦略が必要である。我々は,このような量子古典ハイブリッドデバイスを熱力学的に一貫した方法でモデル化できる自己整合理論フレームワークを開発した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:34:10 GMT)
Spectroscopy, Crystal-Field, and Transition Intensity Analyses of the C$_{\rm 3v}$(O$^{2-}$) Centre in Er$^{3+}$ Doped CaF$_{2}$ Crystals [0.0]
本稿では,CaF$:Er$3+$におけるC$_rm 3v$(O$2-$)中心の詳細な吸収とレーザーサイト選択分光について述べる。この遷移は、167$Er同位体から観測可能な超微細構造を持つ1GHzの低温不均一線を有する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 23:52:40 GMT)
Signature of attochemical quantum interference upon ionization and excitation of an electronic wavepacket in fluoro-benzene [0.0]
ベンゼンおよびフルオロベンゼン分子の異なる電子波束へのイオン化に伴う結合電子核動力学をシミュレートする。フルオロベンゼンでは、状態間および状態内量子干渉の両方を解き、アトケミカルと電荷指向力学の明確なシグネチャを残す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:49:31 GMT)
SOFI: Multi-Scale Deformable Transformer for Camera Calibration with Enhanced Line Queries [0.0]
我々は、カメラキャリブレットIon用のtextitmulti-Scale defOrmable transFormerを導入し、拡張された行クエリ、SOFIを提案する。 SOFIは、ライン内容とライン幾何学的特徴の両方を用いて、MSC-CとMSCCで使用される行クエリを改善している。テキストGoogleストリートビュー、WildのテキストHorizon Line、テキストHollicityデータセットの既存のメソッドよりも優れており、競合する推論速度を維持している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:17:38 GMT)
Rotational properties of two interacting cold polar molecules: linear, symmetric, and asymmetric tops [0.0]
分子を量子剛性ローターとしてモデル化し、自由度を考慮に入れます。分子の性質は、短い分離で磁場の方向に強く依存していることが分かる。後者は、分子双極子気体の自転自由度を説明できる可能性についての洞察を与える。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:07:49 GMT)
Quantum phase diagrams of Dicke-Ising models by a wormhole algorithm [0.0]
我々は,パラダイム的Dicke-Isingモデルのためのワームホールアルゴリズムを提案する。強磁性相互作用と反強磁性相互作用では、超固体格子の光-物質類似体が外対角超格子と対角磁気秩序で成立する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:54:20 GMT)
Quantum frustrated Wigner chains [0.0]
周期ポテンシャルのウィグナー連鎖は、長距離相互作用を伴う幾何学的フラストレーションのパラダイム的な例である。そこで, ソリトンは, 有効ディラック海上でのフェルミオン励起を荷電する, 巨大な長距離 (1+1) ティリングモデルにマッピングされることを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:50:12 GMT)
Quantum Error Correction of Qudits Beyond Break-even [0.0]
回路QEDアーキテクチャでは,Gottesman-Kitaev-Preskill(GKP)ボソニックコードを用いて,誤り訂正論理クォートとクォートを実現する。我々は 1.82 +/- 0.03 (1.87 +/- 0.03) の利得でブレーク・アン・エラーの補正を超えることができる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:36:17 GMT)
QUB-PHEO: A Visual-Based Dyadic Multi-View Dataset for Intention Inference in Collaborative Assembly [0.0]
QUB-PHEOは、人間-ロボット相互作用(HRI)研究を前進させる可能性を備えた、視覚に基づく、ダイアディックなデータセットを導入している。このデータセットは、2人の参加者間のリッチなマルチモーダルインタラクションをキャプチャします。 QUB-PHEOは微妙な相互作用の手がかりと意図をより深く分析し、この分野への貢献を約束する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:34:49 GMT)
Prompting Techniques for Reducing Social Bias in LLMs through System 1 and System 2 Cognitive Processes [0.0]
我々は, LLMにおけるバイアス, CoTプロンプト, 脱バイアスプロンプト, および二重プロセス理論の関係を直接的に検討する。人間のペルソナ、嫌悪感、システム2、CoTは、LLMの社会的偏見を減らしがちである。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 02:20:13 GMT)
Project SHADOW: Symbolic Higher-order Associative Deductive reasoning On Wikidata using LM probing [0.0]
本稿では,連想帰納的推論を用いた中間タスクで訓練された微調整言語モデルであるSHADOWを紹介する。 LM-KBC 2024チャレンジでSHADOWを評価し,F1スコア68.72%でベースライン解を20%上回る結果を得た。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:22:31 GMT)
PrivaMatch: A Privacy-Preserving DNA Matching Scheme for Forensic Investigation [0.0]
被疑者の身元や事件現場から得られた証拠等の調査に関する機密情報を調査機関に非公開にしておく必要がある。我々は,容疑者のDNAプロファイルと犯罪現場の証拠のプライバシーに関する複数の懸念に対処する,PrivaMatchと呼ばれる新しいDNAマッチング手法を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:22:31 GMT)
Positivity and entanglement of polynomial Gaussian integral operators [0.0]
正の保存は、オープン量子系の力学において重要な問題である。自己随伴積分ガウス作用素 $widehatkappa_PG$ の正当性について検討する。例えば、$widehatkappa_PG$ はガウス部分の正が正の場合にのみ正であることを示し、これは強で極めて簡単な正の検定をもたらす。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 22:52:57 GMT)
Oracle problems as communication tasks and optimization of quantum algorithms [0.0]
鍵となる疑問は、アルゴリズムが一定の数のクエリのみを使用して学習タスクをどの程度うまく成功させることができるかである。本研究では,出力と実値の相互情報を用いたアルゴリズムの性能測定を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:03:39 GMT)
Optimal Coherent Quantum Phase Estimation via Tapering [0.0]
量子位相推定は、多くの量子アルゴリズムを支える基本的なプリミティブの1つである。我々は,テープ型量子位相推定アルゴリズムと呼ばれる標準アルゴリズムの改良版を提案する。提案アルゴリズムは,高コストなコヒーレント中央値手法を必要とせず,最適なクエリ複雑性を実現する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:52:58 GMT)
One-Shot Image Restoration [0.0]
提案手法の適用性, 堅牢性, 計算効率を, 教師付き画像の劣化と超解像に応用できることを実験的に示す。本結果は,学習モデルのサンプル効率,一般化,時間複雑性を大幅に改善したことを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:24:54 GMT)
Nothing Conformal about Adaptive Conformal Inference [0.0]
適応共形推論 (Adaptive conformal Inference, ACI) は、非交換可能データの解法として提案されている。共形予測器を用いたACIが信頼性予測器よりも有利であるかどうかを検討する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:02:33 GMT)
Nonexponential decay law of the 2P-1S transition of the H-atom [0.0]
我々は水素原子の不安定な2P励起状態に対する生存確率$P(t)$を評価する。短い時間と長い時間に$P(t)$は指数法則からの偏差を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:27:05 GMT)
Natural Language Query Engine for Relational Databases using Generative AI [0.0]
この記事では、ジェネレーティブAIを活用してギャップを埋め、自然言語を使ってデータベースをクエリできる革新的なソリューションを紹介します。提案手法は,自然言語クエリを insql に翻訳し,構文的および意味的正当性を確保しつつ,検索したデータから自然言語応答を生成する。ユーザとデータベース間のインタラクションを合理化することにより、技術的専門知識のない個人がデータを直接的かつ効率的に扱えるようにし、価値ある洞察へのアクセスを民主化し、生産性を向上させる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 01:07:02 GMT)
Multiscale scattered data analysis in samplet coordinates [0.0]
グローバルにサポートされたラジアル基底関数に対するマルチスケールデータ分散スキームについて検討する。結果の一般化されたヴァンダーモンド行列をサンプル座標で表現することを提案する。各レベルにおける線形系の条件数は、特定のレベルとは独立に有界であることを証明する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:07:47 GMT)
MotifDisco: Motif Causal Discovery For Time Series Motifs [0.0]
連続グルコースモニター(CGM)から採取したグルコースの痕跡に着目した。モチーフ間の因果関係を識別し、定量化する能力は、これらのパターンをよりよく理解し、表現するためのメカニズムを提供することができる。時系列トレースからモチーフ間の因果関係を学習するための新しい因果発見フレームワークを開発した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:08:37 GMT)
Modeling a demographic problem using the Leslie matrix [0.0]
レスリー行列は1940年代に初めて提案され、1960年代半ばに人気を得た。レスリー行列の普遍性は、植物や動物の多様なライフサイクルにまで拡張され、非ヒト種においてユビキタスな道具となる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:57:01 GMT)
Many-body phases from effective geometrical frustration and long-range interactions in a subwavelength lattice [0.0]
幾何学的なフラストレーションと長距離結合は、物理学を通して異なる性質を持つ量子相を作るための鍵となる貢献者である。両成分がラマン誘導サブ波長格子に自然に出現する手法を提案する。フラストレーションと長距離結合の組み合わせがボソンの多体相を生成することを数値的に示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:17:12 GMT)
Making Data: The Work Behind Artificial Intelligence [0.0]
本稿では,ブラジルにおけるマイクロワークの実態を報告し,労働者の肖像画を提供する。これは、現状の不安定化を克服するための、より広範な努力の一歩である。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:12:24 GMT)
Machine Learning Toric Duality in Brane Tilings [0.0]
4d$mathcalN=1$量子場理論におけるセイベルグ双対性の研究に様々な機械学習手法を適用する。複雑な赤外双対性のネットワークはそのような理論の空間を相互接続し、それを普遍性類に分割する。我々は、conifold の $mathbbZ_mtimesmathbbZ_n$ orbifold で実現されたセイベルグ双対理論のクラスを特定するために、完全に連結されたニューラルネットワークを訓練する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:48:14 GMT)
Machine Learning Methods as Robust Quantum Noise Estimators [0.0]
従来の機械学習モデルでは、回路構成を分析して量子ノイズを推定する方法を示す。提案手法は,回路のロバスト性を低い誤差率で正確に予測できることを示す。これらの技術は、量子コードの品質とセキュリティを評価するために使用することができ、より信頼性の高い量子製品に繋がる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:00:12 GMT)
MRI Radiomics for IDH Genotype Prediction in Glioblastoma Diagnosis [0.0]
本稿では,MRIの放射線学的利用の最近の進展について概説する。 Isocitrate dehydrogenase (IDH) 変異の同定に焦点が当てられ、グリオ芽腫とグレードIVアストロサイトーマの診断に重要なバイオマーカーである。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:34:49 GMT)
Lost in the Logic: An Evaluation of Large Language Models' Reasoning Capabilities on LSAT Logic Games [0.0]
法学校入学試験(LSAT)における大規模言語モデル(LLM)の性能評価論理ゲームとその関連メタデータのデータセットを構築し、Chain-of-Thoughtプロンプト設定においてLLMの性能を広範囲に評価する。私は、モデルがより良いか悪いかを示す論理ゲームの種類と、人間のアノテーションから観察する論理エラーのタイプを分析します。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:37:40 GMT)
Logarithmic singularities of Renyi entropy as a sign of chaos? [0.0]
様々な二次元共形場理論におけるレニーエントロピーの対数特異点を解析する。ホログラフィック CFT におけるレニイエントロピーの対数特異点は常に存在するが、自由かつ有理な CFT におけるそのような特異点は存在しない。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:39:23 GMT)
Logarithmic Subdiffusion from a Damped Bath Model [0.0]
スペクトル密度がOhmicであるとき、メモリカーネルは$k(t) sim 1/t$ as $tto infty$のように振る舞う。メモリカーネルは有限積分を持たないので、半拡散的であり、拡散を$langleDelta Q2(t)rangle sim t/log(t)$ as $tto infty$として数値的に示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 23:37:47 GMT)
LX-mixers for QAOA: Optimal mixers restricted to subspaces and the stabilizer formalism [0.0]
与えられた部分空間を保存するミキサーの理解と構築を両立させる新しい形式主義を提示する。我々は、我々のアプローチを論理X-ミクサーまたは論理XQAOAと呼ぶ。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:59:36 GMT)
Investigating Robot Dogs for Construction Monitoring: A Comparative Analysis of Specifications and On-site Requirements [0.0]
本稿では,建設現場で現在利用可能なロボット犬の利用可能性について検討する。四足歩行ロボットを用いた大規模建設現場での実環境実験を行った。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:51:31 GMT)
Interaction dependence of the Hall response for the Bose-Hubbard triangular ladder [0.0]
磁場中におけるBose-Hubbard三角はしごのホール応答について検討する。我々は、弱い相互作用の限界からハードコア体制まで、幅広い相互作用の強さを考察する。様々なキラル状態の指紋にホール応答を適用できることが示される。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:59:32 GMT)
Institutional Platform for Secure Self-Service Large Language Model Exploration [0.0]
論文では、データセットキュレーション、モデルトレーニング、セキュア推論、テキストベースの特徴抽出を含む、システムのアーキテクチャと重要な特徴について概説する。プラットフォームはセキュアなLLMサービスの提供、プロセスとデータ分離の強調、エンドツーエンドの暗号化、ロールベースのリソース認証を目指している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:24:09 GMT)
Incomplete Multimodal Industrial Anomaly Detection via Cross-Modal Distillation [0.0]
3次元点雲とRGB画像に基づくマルチモーダル産業異常検出(IAD)は現在も進行中である。既存の品質制御プロセスは、光学および赤外線イメージングのような高速なインライン検査と高解像度だが時間を要するニアラインキャラクタリゼーション技術を組み合わせている。 IADのためのクロスモーダル蒸留フレームワークであるCMDIADを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:50:01 GMT)
Improving the Accessibility of Dating Websites for Individuals with Visual Impairments [0.0]
アクセシビリティが制限されているため、デートサービスの利用は困難であり、視覚障害のある人にとってはイライラする可能性がある。デートプラットフォームのプロフィール写真から、顔の表情、年齢、性別、子(レン)の存在などを自動的に認識できる実装がいくつか存在する。このプロジェクトの目的は、既存のシステムの能力をさらに強化するために、追加機能(ペット、屋内画像、屋外画像など)を組み込むことである。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:14:55 GMT)
Improving Emotion Recognition Accuracy with Personalized Clustering [0.0]
感情認識は、リアルタイムおよび実生活で動作する高速で離散的で非豪華なシステムで行うべきです。これらのカスタマイズされたモデルは、外部刺激に対する感情的な反応において類似点を共有する被験者のクラスタに適用できる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:42:36 GMT)
Identification and Localization of Cometary Activity in Solar System Objects with Machine Learning [0.0]
本稿では,太陽系天体の彗星活動の同定と位置決定に機械学習を用いる方法について論じる。まずは、恒星型源の存在下で、既知の、未知の、活動的な拡張された太陽系天体を特定することの課題について議論する。次に、拡張オブジェクト識別の課題に対処するため、ML技術の実装に関する議論に移行する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 17:56:32 GMT)
Hierarchical end-to-end autonomous navigation through few-shot waypoint detection [0.0]
人間のナビゲーションはランドマークと行動の関連によって促進される。現在の自律ナビゲーション方式は、正確な位置決め装置とアルゴリズム、および環境から収集されたセンサーデータの広範なストリームに依存している。本研究では,移動ロボットがこれまで知られていなかった環境をナビゲートできる階層型メタ学習手法を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 00:03:39 GMT)
Hands-on Quantum Programming Labs for EECS Students [0.0]
本稿では,電子工学と計算機科学(EECS)の学生に量子コンピューティングを教える実践的なアプローチを提案する。研究室は様々なトピックをカバーしており、絡み合い、量子ゲート、回路などの基本的な要素を含んでいる。教育者として、現場にいる仲間のインストラクターと教えの洞察とリソースを共有することを目的としている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 05:24:59 GMT)
Graph Network Models To Detect Illicit Transactions In Block Chain [0.0]
暗号通貨はマネーロンダリングのような違法な活動を増加させています残差ネットワーク型アーキテクチャ(GAT-ResNet)を用いたグラフアテンションネットワークの適用により,この問題に対処する新しい手法を提案する。以上の結果から,GAT-ResNetモデルが既存のグラフネットワークモデルよりも精度,信頼性,スケーラビリティに優れる可能性が示唆された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 04:38:44 GMT)
Google Quantum AI's Quest for Error-Corrected Quantum Computers [0.0]
Google Quantum AIは、実用的な量子コンピュータの開発を推進しているリーダーである。この研究は、量子コンピューティング技術の未来を形成する上で、Google Quantum AIのイニシアチブの変革的な影響を強調している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:56:14 GMT)
Good modelling software practices [0.0]
私たちは、モデルライフサイクルの実装の初期段階において、単純で簡単なプラクティスのリストをフォローする習慣を主張します。本研究は, 海洋生物群集の事例として, 海洋生物群集の例を示したものである。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:16:01 GMT)
Generating the Ground Truth: Synthetic Data for Soft Label and Label Noise Research [0.0]
実世界のデータからノイズのないデータセットを作成するためのフレームワークであるSynLABELを紹介する。ラベルノイズを精度よく定量化する能力と,既存の手法による改善を実証する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:15:52 GMT)
Generalized boson and fermion operators with a maximal total occupation property [0.0]
本稿では、ボソンとフェルミオンの生成と演算子に対する標準(反)交換関係の新しい一般化を提案する。 1つの生成と1つの演算子を含む標準(反)交換子関係のみが、分数係数を導入して変形する。フォック空間における生成および消滅作用素の作用から、群理論の枠組みが決定される。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:05:34 GMT)
Gamifying the Vehicle Routing Problem with Stochastic Requests [0.0]
我々は、古典的な物流問題をゲームとして表現するタスクを考え、エージェントにそれをプレイするよう訓練する。視点,視野,超人的ミニマップなど,さまざまなデザインがエージェントのパフォーマンスにどのような影響を与えるかを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 22:49:27 GMT)
GATher: Graph Attention Based Predictions of Gene-Disease Links [0.0]
GATherは、治療的遺伝子消失リンクを予測するために設計されたグラフアテンションネットワークである。様々なバイオメディカルソースからのデータを440万のエッジを持つグラフに統合する。 ROC AUCが0.69で, 有効性は0.79で臨床治験結果を予測する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 12:36:44 GMT)
Frobenius light cone and the shift unitary [0.0]
我々は、(特定の電力法指数に対して)シフトユニタリを長距離ベル対を作るのに必要な同じ時間で実装できないことを証明した。結果の証明と対称性保護型トポロジカルな状態と対称性保存型ハミルトニアンとの類似性は興味深い。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:35:50 GMT)
Fourier analysis of many-body transition amplitudes and states [0.0]
マルチ粒子およびマルチモード干渉装置の出力におけるカウント統計を解析する。我々は、部分的に区別可能なボソンとフェルミオンの干渉にフォーマリズムを適用する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:52:54 GMT)
Fine Tuning Text-to-Image Diffusion Models for Correcting Anomalous Images [0.0]
本研究では,DreamBooth法を用いて安定拡散3モデルを微調整することにより,このような問題を緩和する手法を提案する。 SSIM(Structure similarity Index)、Pak Signal-to-Noise Ratio(PSNR)、Frechet Inception Distance(FID)など、視覚的評価の精度向上を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 00:51:47 GMT)
FeruzaSpeech: A 60 Hour Uzbek Read Speech Corpus with Punctuation, Casing, and Context [0.0]
本稿では,ウズベキスタン語の読み上げ音声コーパスであるFeruzaSpeechを紹介する。 FeruzaSpeechはキリル文字とラテン文字の両方で転写されている。本稿では,FeruzaSpeechの統合によるCommonVoice 16.1のUzbekデータ,Uzbek Speech Corpusデータ,FeruzaSpeechデータに対する単語誤り率(WER)の増大について論じる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 03:07:30 GMT)
FOCQS: Feedback Optimally Controlled Quantum States [0.0]
FALQONのようなフィードバックベースの量子アルゴリズムは微調整の問題を避けるが、回路深度の追加と収束保証の欠如を犠牲にしている。我々は、従来の制御層を摂動的に更新するためにそれを利用する分析フレームワークを開発した。この摂動的手法は、フィードバックに基づくアルゴリズムの結果を改善するために、フィードバック最適化量子状態(FOCQS)と呼ぶ。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:00:06 GMT)
Exploring Requirements Elicitation from App Store User Reviews Using Large Language Models [0.0]
本研究は,大規模言語モデルのパワーを活用して,ユーザレビューの分析を行い,自動要求の導出を行うアプローチを提案する。有用性を示すようにラベル付けされたアプリレビューのデータセット上に,確立された3つのLMM BERT, DistilBERT, GEMMAを微調整した。評価の結果、BERTの精度は92.40%、F1スコアは92.39%であり、有用レビューを正確に分類する効果が示された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 18:57:31 GMT)
Exploring Error Types in Formal Languages Among Students of Upper Secondary Education [0.0]
高校生の形式言語における誤りの探索的研究について報告する。その結果,概念の非機能的理解の事例が示唆された。これらの発見は、学生がなぜこの話題に苦しむのか、より広い理解の出発点となる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:16:13 GMT)
Explainable and Human-Grounded AI for Decision Support Systems: The Theory of Epistemic Quasi-Partnerships [0.0]
我々は、倫理的で説明可能なAI(XAI)の要求を満たすことは、人間の意思決定者に3種類の人為的説明を提供するAI-DSSを開発することであると論じている。優れた人為的理由を構成するものに関する現在の理論が、この証拠を適切に説明していないか、あるいは開発に健全な倫理的アドバイスを提供していないかを実証する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:14:25 GMT)
Evaluating Synthetic Activations composed of SAE Latents in GPT-2 [0.0]
スパースオートエンコーダ(SAE)は、機械的解釈可能性において一般的に用いられる。最近の研究は、モデルが初期層でアクティベーションを乱すことが、モデルの最終層アクティベーションのステップ関数のような変化をもたらすことを示した。実際の活性化とSAE潜伏剤からなる合成活性化を比較した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:46:38 GMT)
Entropic Fluctuations in Statistical Mechanics II. Quantum Dynamical Systems [0.0]
我々は、エバンス・サールズゆらぎ定理のいくつかの可能な拡張を量子系に考慮し、比較する。モジュラー理論は古典的な位相空間収縮率の概念を量子領域に拡張する方法を提供する。得られた結果は、量子統計力学におけるエントロピー変動の性質に新たな光を当てた。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 19:12:14 GMT)
Entanglement transfer of a Rydberg W-state to a multi-mode photonic state [0.0]
3原子Rydberg系からの高効率な絡み合い転送を実現する頑健な量子プロトコルが開発されている。本研究は, 完全断熱プロトコルと非断熱遷移を制御した断熱プロトコルを用いて, 絡み合いの伝達が可能であることを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 23:08:12 GMT)
Enhancing Scientific Reproducibility Through Automated BioCompute Object Creation Using Retrieval-Augmented Generation from Publications [0.0]
IEEE Biocompute Object(BCO)標準は、ニーズに対処するが、準拠するドキュメントを作成するオーバーヘッドのため、採用上の課題に直面している。本稿では,Large Language Models(LLM)とRAG(Retrieval-Augmented Generation)を用いた科学論文からのBCOの自動生成手法を提案する。この実装には最適化された検索プロセスが含まれており、再ランク付けされた2パスの検索と、各BCOドメインに対して慎重に設計されたプロンプトが採用されている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:51:22 GMT)
Efficient Hamiltonian learning from Gibbs states [0.0]
自由エネルギー変動原理を用いて,ギブス状態の局所的な期待値からハミルトニアンを学習するアルゴリズムについて述べる。このアルゴリズムは、自由エネルギーを直接計算する必要を回避し、代わりに状態の摂動に関する自由エネルギーの導関数の効率的な推定を使用する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:01:51 GMT)
EDGE-Rec: Efficient and Data-Guided Edge Diffusion For Recommender Systems Graphs [0.0]
本稿では,ユーザとアイテムの機能だけでなく,リアルタイムなインタラクションの重み付けを生かした新しいアテンション機構を提案する。我々は,ユーザ・イテム相互作用グラフの重み付き相互作用行列を反復的に復調するために,新しいグラフ拡散変換器GDiTアーキテクチャを訓練する。テキスト条件付き画像生成の最近の進歩に触発されて,本手法は,従来の評価と同一スケールのユーザ・イテム評価を直接生成する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 03:23:20 GMT)
Dissipative dynamics of an open quantum battery in the BTZ spacetime [0.0]
量子電池の充電性能は、量子場の真空揺らぎの存在によってどのように影響されるかを考える。量子場の異なる境界条件は、異なる充電性能をもたらす可能性がある。本研究は,曲面時空における緩和効果を解明するための一般的な枠組みを提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:21:15 GMT)
Dirac Equation Solution with Generalized tanh-Shaped Hyperbolic Potential: Application to Charmonium and Bottomonium Mass Spectra [0.0]
一般化された接形双曲ポテンシャルを用いて、ディラック方程式の有界解を研究する。その結果,エネルギー固有値はポテンシャルパラメータと強く相関していることが示唆された。このポテンシャルを用いて、チャーモニウムとボトムニウムの質量スペクトルをモデル化し、計算されたクォーク質量スペクトルの結果が実験的に観測された値と密接に一致していることを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 20:40:59 GMT)
Deterministic Quantum Repeater with Single Atoms in Cavities [0.0]
将来の量子ネットワークにおいて、ファイバーの光子損失に対処するために、効率的な量子リピータが必要である。本稿では,光子-原子ゲートに基づく決定論的絡み合い生成と絡み合いスワップを用いた量子リピータ方式を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:37:07 GMT)
Designing an Interpretable Interface for Contextual Bandits [0.0]
我々は,盗賊の根底にある振る舞いを説明するために,ドメインの専門家に新しいインターフェースを設計する。技術的厳密さとアクセシブルなプレゼンテーションを慎重にバランスさせることで、非専門家に複雑な機械学習システムを管理する力を与えることが可能であることを示唆している。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:47:44 GMT)
Designing Pre-training Datasets from Unlabeled Data for EEG Classification with Transformers [0.0]
本稿では,未ラベル脳波(EEG)データからラベル付きデータセットを設計する方法を提案する。これらは、脳波信号の表現を学習するために、トランスフォーマーを事前訓練するために使用できる。本手法を,テンプル大学清水検出コーパスのてんかん発作予知タスクで検証した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:26:13 GMT)
Demonstration of Scully-Drühl-type quantum erasers on quantum computers [0.0]
本稿では,Scully-Dr"uhl型遅延チョイス量子消去器を真に実装した新しい量子回路を提案する。 IBM QuantumとIonQプロセッサで行った実験では、干渉パターンの回復が様々な程度に理論的な予測と密接に一致していることが示されている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:04:46 GMT)
Deep Learning Approach for Knee Point Detection on Noisy Data [0.0]
曲線上の膝点とは、曲線の上昇後に曲線が下降する点である。本研究では,正規化データに基づいて膝点を定義する。我々は、基盤となる真の分布の膝点を正確に検出するために、U-Netのようなアーキテクチャを持つ畳み込みニューラルネットワーク(CNN)を用いる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 23:29:19 GMT)
Deep Evidential Learning for Radiotherapy Dose Prediction [0.0]
本稿では放射線治療用線量予測分野におけるDeep Evidential Learningと呼ばれる不確実性定量化フレームワークの新たな応用法を提案する。このモデルは,ネットワークトレーニング完了時の予測誤差と相関関係を持つ不確実性推定に有効に活用できることを見出した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:45:43 GMT)
Data-driven model discovery with Kolmogorov-Arnold networks [0.0]
疎度条件を満たさないものを含む任意の力学系に対する一般的なモデル発見フレームワークを開発する。特に, 系の近似モデルが多数存在し, 正確な統計量で同じ不変量を生成することが, 非特異性を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:22:07 GMT)
Data Subsampling for Bayesian Neural Networks [0.0]
Penalty Bayesian Neural Networks - PBNNは,サブサンプルバッチデータによる可能性の評価を可能にする,新たなアルゴリズムである。 PBNNは,データサイズが小さい場合でも,予測性能が良好であることを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:18:33 GMT)
Cyclic image generation using chaotic dynamics [0.0]
訓練されたジェネレータの繰り返し適用は、異なるカテゴリ間で遷移する画像のシーケンスを生成する。生成された画像シーケンスは、元のトレーニングデータセットと比較して画像空間のより限られた領域を占める。その結果, 深部生成モデルによって定義される画像空間のカオス力学が生成した画像の多様性に寄与することが示唆された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 23:44:25 GMT)
Covariant quantum field theory of tachyons is unphysical [0.0]
タキオンはその特異な振る舞いのために代々の物理学者を魅了してきたが、実際の物理的問題は解決しなかった。ドラガンとエケルトは、超光度観測者は量子力学の基礎に関係しているかもしれないことを示した。タキオンの古典的および量子場理論が構築されていることを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 04:43:37 GMT)
Cooperative atomic emission from a line of atoms interacting with a resonant plane surface [0.0]
カシミール・ポルダー効果は、集合的な原子の周波数シフトと崩壊率を変化させることができる。自由空間において期待される協調効果は、原子が表面に近いときに欠落していることを示す。本研究では, 共振形地表面の前にあるセシウム6P3/2原子の研究を, この研究結果を実験的に実証するための最も有望なシナリオとして提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 23:51:24 GMT)
Control of solid-state nuclear spin qubits using an electron spin-1/2 [0.0]
電子スピン1/2による単一核スピンの制御を動的に分離した高周波ゲートを用いて改善した。我々の研究は、電子スピン1/2系における核スピン制御の課題と機会に関する重要な洞察を提供する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:53:00 GMT)
Confinement-induced field-linked states of ultracold polar molecules [0.0]
我々は、静電場と1次元高調波閉じ込めの助けを借りて、超低温二原子分子の対間に安定な結合状態が存在することを予測した。双極子長スケールのごく一部で二原子分子が結合しているため、これらの錯体は多原子化学やフェルミガス超流動対の探索を可能にする。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:57:52 GMT)
Conditional disclosure of secrets with quantum resources [0.0]
秘密の条件開示(英: Conditional revealsure of Secrets、CDS)は、通信、ランダム性、セキュリティの関係を研究する最も単純な暗号設定の一つである。近年、CDQSと呼ばれるプリミティブの量子アナログが定義され、量子位置検証の文脈で研究される$f$-routingに関連している。我々は,情報理論設定におけるプライバシと量子リソースの関係をよりよく理解することを目的として,CDQSの体系的研究を開始した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:03:27 GMT)
Complete complementarity relations in tree level QED processes [0.0]
我々は、木レベルでのQED散乱過程において、完全相補性関係(CCR)を利用して量子性の様々な側面を完全に特徴づける。分析の結果,フェルミオンのみを入力状態と出力状態として含む散乱過程において,最大絡み合いが保存されることがわかった。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:25:25 GMT)
Chattronics: using GPTs to assist in the design of data acquisition systems [0.0]
本稿では,データ取得システムの設計段階を支援するために,汎用事前学習変換器を用いた新しい手法を提案する。このソリューションは、LLMの会話的側面を保持するアプリケーションという形でパッケージ化されている。 160回の試行を経て、この研究はこれらのモデルがデータ取得システムの合成・補助ツールとして適切に機能する可能性があると結論付けている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:36:16 GMT)
Causal classification of spatiotemporal quantum correlations [0.0]
特定の量子相関は時間固有の矢印を持ち、時空をまたいだ一般的な量子相関の分類を可能にする。以上の結果から,特定の量子相関は時間的固有矢印を持ち,様々な因果構造との整合性に基づいて,時空間における一般量子相関の分類が可能であることが示唆された。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:20:41 GMT)
Building Tamil Treebanks [0.0]
ツリーバンクは重要な言語資源であり、豊富な言語アノテーションで構造化され注釈付けされたコーパスである。本稿では,手動アノテーション,計算文法,機械学習の3つのアプローチを用いて,タミル木バンクの作成について論じる。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 01:58:50 GMT)
Brotherhood at WMT 2024: Leveraging LLM-Generated Contextual Conversations for Cross-Lingual Image Captioning [0.0]
本稿では,英語から英語への多モーダル翻訳タスクにおけるブラザーフッド(Brotherhood)というチーム名でシステムについて述べる。我々は,イングリッシュ・ヒンディー語,イングリッシュ・ハウサ語,イングリッシュ・ベンガル語,イングリッシュ・マラヤラム語対の多モーダル翻訳作業に参加している。本稿では,多モーダル大言語モデル(LLM),特に GPT-4o と Claude 3.5 Sonnet を利用して,言語間画像キャプションを強化する手法を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:29:46 GMT)
BranchPoseNet: Characterizing tree branching with a deep learning-based pose estimation approach [0.0]
本稿では、ポーズ推定深層学習モデルを用いて、近位レーザー走査データ中の木の輪郭を自動的に検出するパイプラインを提案する。正確な輪郭検出は、木の成長パターン、木質に関する貴重な洞察を与え、林業価値連鎖全体にわたって木を追跡するバイオメトリックマーカーとして使われる可能性がある。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 07:10:11 GMT)
Bound States in the Continuum in a Double Whispering Gallery Resonator [0.0]
1次元導波路に結合した2つのwhispering Gallery Resonator (WGRs) による単一光子輸送について検討した。定常状態の伝送スペクトルと光密度を計算する。擬似BICは, 対称性を損なう微小な摂動によるフォトニック伝送において, 鋭い共鳴として現れることを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:43:25 GMT)
Beyond the Request: Harnessing HTTP Response Headers for Cross-Browser Web Tracker Classification in an Imbalanced Setting [0.0]
本研究は、二項化HTTP応答ヘッダを用いたWebトラッカー検出のための効果的な機械学習分類器を設計する試みである。 10の教師付きモデルがChromeデータ上でトレーニングされ、1年後のChromeデータセットを含むすべてのブラウザでテストされた。結果は、ChromeとFirefoxで高い精度、F1スコア、精度、リコール、最小ログロスエラーを示した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 11:33:15 GMT)
Benchmarking Edge AI Platforms for High-Performance ML Inference [0.0]
エッジコンピューティングは、通信遅延を減らし、リアルタイム処理を可能にする能力から、高性能で異質なSystem-on-Chipソリューションの興隆を促進している。現在のアプローチでは、現代的なハードウェアをスケールダウンすることが多いが、ニューラルネットワークワークロードのパフォーマンス特性は、大きく異なる場合がある。我々は、CPUのみ、CPU/GPU、CPU/NPU統合ソリューション間で、様々な線形代数およびニューラルネットワーク推論タスクのレイテンシとスループットを比較した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:27:27 GMT)
Automated Spatio-Temporal Weather Modeling for Load Forecasting [0.0]
電力は伝統的に、需要と断続的な生産(風、太陽)と整合性のある生産(水素、核、石炭、ガス)を予想して管理される。どちらも気象変数(温度、風、日光)に大きく依存している。気象観測所からの観測や気象モデルからのシミュレーションデータへのアクセスにより、どちらの現象もモデル化できると信じている。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 06:55:57 GMT)
Assessment of Submillimeter Precision via Structure from Motion Technique in Close-Range Capture Environments [0.0]
本研究では,SfM法が短距離キャプチャを用いた構造試験のためのサブミリ品質モデルを作成する可能性について検討した。テストボード上に撮像された画像と、テスト領域に適切に分布するスケールバー(SB)のセットと、80%のオーバーラップ率、垂直および斜め画像の統合により、RMSEの値は約0.1mmを得た。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 23:13:06 GMT)
Asking an AI for salary negotiation advice is a matter of concern: Controlled experimental perturbation of ChatGPT for protected and non-protected group discrimination on a contextual task with no clear ground truth answers [0.0]
実験によるChatGPTの4種類のバイアス監査を行った。我々は、各バージョンに98,800通のプロンプトを提出し、従業員の性別、大学、専攻を体系的に変更した。マルチモデルプラットフォームとしてのChatGPTは、そのようなタスクに対して信頼できるほど堅牢で一貫したものではない。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:48:32 GMT)
Anomalous diffusion in quantum system driven by heavy-tailed stochastic processes [0.0]
本研究では,ホッピングと待ち行列からなる非平衡量子系について検討する。ウェーブパケットの2乗幅を計算することで,様々な異常輸送現象が出現することを示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 15:38:46 GMT)
Analogous Alignments: Digital "Formally" meets Analog [0.0]
本稿では,デジタルブロックとアナログブロックを組み合わせた混合信号知的特性(IP)の実用的形式検証に着目する。 Digital and Analog Mixed-Signal (AMS)設計は、本質的に異なるが、形式的な検証設定でシームレスに統合される。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:38:31 GMT)
AlphaZip: Neural Network-Enhanced Lossless Text Compression [0.0]
本稿では,Large Language Model (LLM) を用いたロスレステキスト圧縮手法を提案する。第一に、トランスフォーマーブロックのような高密度ニューラルネットワークアーキテクチャを使用した予測、第二に、予測ランクをAdaptive Huffman、LZ77、Gzipといった標準的な圧縮アルゴリズムで圧縮する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 14:21:06 GMT)
Advancing Depression Detection on Social Media Platforms Through Fine-Tuned Large Language Models [0.0]
本研究では,利用者のソーシャルメディアデータからの抑うつ検出にLarge Language Models (LLMs) を用いることを検討した。微調整された GPT 3.5 Turbo 1106 と LLaMA2-7B モデルを使用することで、ソーシャルメディア投稿中の落ち込んだコンテンツを96.0パーセントの精度で識別することができた。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:18:25 GMT)
Adaptive Conformal Inference for Multi-Step Ahead Time-Series Forecasting Online [0.0]
有限サンプルカバレッジ保証を実現するために適応型共形推論アルゴリズムの適応性を提案する。私たちの多段階のACI手続きは、これらの保証を各予測ステップで継承し、全体的なエラー率を保証します。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 08:07:49 GMT)
Acting for the Right Reasons: Creating Reason-Sensitive Artificial Moral Agents [0.0]
道徳的意思決定を可能にする強化学習アーキテクチャの拡張を提案する。理由に基づくシールドジェネレータは、認識された規範的理由に従う行動にエージェントを結合する道徳的シールドを生成する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 13:38:57 GMT)
Accurate Automatic 3D Annotation of Traffic Lights and Signs for Autonomous Driving [0.0]
交通信号や道路標識などの交通管理対象の3D検出は、自動運転車にとって不可欠である。本稿では,信号機や標識の3次元バウンディングボックスアノテーションを自動生成する手法を提案する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 09:54:59 GMT)
About the role of short and long trajectories on the quantum optical state after high-harmonic generation [0.0]
高調波発生は高強度駆動場の高調波順序へのアップコンバージョンを伴う。我々は、運動場における光学的シュリンガー・キャット様状態の生成をハーモニック・ジェネレーションを用いて予測する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 21:24:38 GMT)
A novel agent with formal goal-reaching guarantees: an experimental study with a mobile robot [0.0]
強化学習 (Reinforcement Learning, RL) は, ロボット工学における多くの課題に対して有効かつ便利であることが示されている。この研究は、Crytic As Lyapunov Function(CALF)と呼ばれる新しい安全なモデルフリーRLエージェントを提示する。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 10:04:28 GMT)
A Resolution Independent Neural Operator [0.0]
我々は、DeepONetを非依存にするためのフレームワークを提供するRINOを紹介します。 RINOにより、DeepONetは任意に、しかし十分に微妙に識別された入力関数を処理できる。任意の(しかし十分にリッチな)サンプル入力および出力関数の処理におけるRINOの堅牢性と適用性を示す。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 03:16:26 GMT)
A Gated Residual Kolmogorov-Arnold Networks for Mixtures of Experts [0.0]
Gated Residual Kolmogorov-Arnold Networks (GRKAN)に基づく新しいMoEフレームワークであるKAMoEを紹介する。デジタル資産市場と不動産評価の実験を通じて、KAMoEは様々なタスクやモデルタイプで従来のMoEアーキテクチャを一貫して上回っていることを実証した。
論文参考訳（メタデータ） (Mon, 23 Sep 2024 16:11:43 GMT)