Any Image Restoration with Efficient Automatic Degradation Adaptation [132.8] 本研究は, 各種劣化の相似性を有効かつ包括的修復に活用し, 共同埋設を実現する統一的な方法を提案する。
我々のネットワークは、モデルの複雑さをトレーニング可能なパラメータで約82%、FLOPで約85%削減しつつ、新しいSOTAレコードを設定している。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:26:53 GMT)
LinSATNet: The Positive Linear Satisfiability Neural Networks [116.7] 本稿では,ニューラルネットワークに人気の高い正の線形満足度を導入する方法について検討する。
本稿では,古典的なシンクホーンアルゴリズムを拡張し,複数の辺分布の集合を共同で符号化する,最初の微分可能満足層を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 22:05:21 GMT)
Are Large Language Models Capable of Generating Human-Level Narratives? [114.3] 本稿ではストーリーテリングにおけるLLMの能力について考察し,物語の展開とプロットの進行に着目した。
本稿では,3つの談話レベルの側面から物語を分析するための新しい計算フレームワークを提案する。
談話機能の明示的な統合は、ニューラルストーリーテリングの40%以上の改善によって示されるように、ストーリーテリングを促進することができることを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:02:49 GMT)
Real-time 3D-aware Portrait Editing from a Single Image [111.3] 3DPEは、参照画像やテキスト記述など、与えられたプロンプトに従って顔画像を編集することができる。
軽量モジュールは、3Dポートレートジェネレータとテキスト・ツー・イメージ・モデルから蒸留される。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:43:41 GMT)
PixelLM: Pixel Reasoning with Large Multimodal Model [110.5] PixelLMはピクセルレベルの推論と理解のための効率的かつ効率的なLMMである。
コードブックトークンの隠された埋め込みからマスクを生成し、詳細なターゲット関連情報をエンコードする。
PixelLMは、さまざまなピクセルレベルの画像推論と理解タスクを網羅し、複数のベンチマークで確立されたメソッドよりも優れています。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:18:36 GMT)
MVSplat: Efficient 3D Gaussian Splatting from Sparse Multi-View Images [102.8] 入力としてスパースなマルチビュー画像を与えられたMVSplatは、クリーンなフィードフォワード3Dガウスを予測できる。
大規模RealEstate10KとACIDベンチマークでは、MVSplatは高速フィードフォワード推論速度(22fps)で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:10:22 GMT)
On Learning to Summarize with Large Language Models as References [101.8] 大型言語モデル (LLM) は、一般的な要約データセットにおける元の参照要約よりも人間のアノテーションに好まれる。
より小さなテキスト要約モデルに対するLLM-as-reference学習設定について検討し,その性能が大幅に向上するかどうかを検討する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:23:59 GMT)
Jailbreaking Black Box Large Language Models in Twenty Queries [97.3] 大規模言語モデル(LLM)は、敵のジェイルブレイクに対して脆弱である。
LLMへのブラックボックスアクセスのみのセマンティックジェイルブレイクを生成するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:24:57 GMT)
Privacy Side Channels in Machine Learning Systems [87.5] プライバシサイドチャネルは、システムレベルのコンポーネントを利用してプライベート情報を抽出する攻撃である。
例えば、差分プライベートなトレーニングを適用する前にトレーニングデータを重複させることで、保証可能なプライバシ保証を完全に無効にするサイドチャネルが生成されることを示す。
さらに,学習データセットに含まれる秘密鍵を抽出するために,言語モデルを学習データ再生からブロックするシステムを利用することを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:12:46 GMT)
WavCaps: A ChatGPT-Assisted Weakly-Labelled Audio Captioning Dataset for Audio-Language Multimodal Research [82.4] 約400kの音声クリップとペアキャプションを組み合わせた,大規模な音声キャプションデータセットであるWavCapsを紹介した。
オンラインハーベストな生の記述は非常にうるさいし、自動音声キャプションなどのタスクで直接使うには適さない。
本稿では,大規模な言語モデルであるChatGPTを用いて,ノイズの多いデータをフィルタリングし,高品質なキャプションを生成するための3段階処理パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 22:20:31 GMT)
Correcting the Mythos of KL-Regularization: Direct Alignment without Overparameterization via Chi-squared Preference Optimization [78.8] 新たなオフラインアライメントアルゴリズムである$chi2$-Preference Optimization(chi$PO)を提案する。
$chi$POは、正規化による不確実性に直面して悲観主義の原理を実装している。
過度な最適化には確実に堅牢であり、単一政治の集中性に基づいたサンプル複雑度保証を実現する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:08:40 GMT)
Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI [78.6] 人工知能(Embodied AI)は、人工知能(AGI)の実現に不可欠である
MLMとWMは、その顕著な知覚、相互作用、推論能力のために、大きな注目を集めている。
本調査では,Embodied AIの最近の進歩を包括的に調査する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:41:12 GMT)
Modeling and Driving Human Body Soundfields through Acoustic Primitives [76.1] 本研究では,人体が生成する全3次元音場をレンダリングし,高品質な空間オーディオ生成を実現するフレームワークを提案する。
我々は,3次元空間の任意の点において,全音響シーンを効率よく,正確にレンダリングできることを実証した。
我々の音響プリミティブは、従来の手法に比べて、音場表現が桁違い小さくなり、近接場レンダリングの欠陥を克服する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 01:05:13 GMT)
FuLG: 150B Romanian Corpus for Language Model Pretraining [76.1] 我々は,CommonCrawlから抽出した100,500万トンものルーマニア製コーパスであるFuLGを紹介する。
本稿では,既存のルーマニアのコーパスに対するアブレーション研究を通じてFuLGをフィルタリングし,比較する手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:32:48 GMT)
Physics-guided Active Sample Reweighting for Urban Flow Prediction [75.2] 都市フロー予測は、バス、タクシー、ライド駆動モデルといった交通サービスのスループットを見積もる、微妙な時間的モデリングである。
最近の予測解は、物理学誘導機械学習(PGML)の概念による改善をもたらす。
我々は、PN(atized Physics-guided Network)を開発し、P-GASR(Physical-guided Active Sample Reweighting)を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 15:44:23 GMT)
Diffusion-Refined VQA Annotations for Semi-Supervised Gaze Following [74.3] 訓練用視線モデルには、人間のアノテータによって注釈付けされた視線目標座標を持つ多数の画像が必要である。
タスクに2つの新しい前処理を導入することで、視線追跡のための最初の半教師付き手法を提案する。
提案手法は,GazeFollow画像データセットに基づく単純な擬似アノテーション生成ベースラインよりも優れている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:59:08 GMT)
Deep Time Series Models: A Comprehensive Survey and Benchmark [74.3] 時系列データは、現実世界のシナリオにおいて非常に重要である。
近年、時系列コミュニティで顕著なブレークスルーが見られた。
多様な分析タスクのためのディープ時系列モデルの公正なベンチマークとして、時系列ライブラリ(TSLib)をリリースします。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:31:55 GMT)
PALM: Predicting Actions through Language Models [74.1] 本稿では,長期的行動予測の課題に取り組むアプローチであるPALMを紹介する。
本手法は,従来の行動系列を追跡する行動認識モデルと,関連する環境の詳細を記述するための視覚言語モデルを含む。
実験の結果,PALMは長期的な行動予測作業において最先端の手法を超越していることがわかった。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:31:53 GMT)
LogoSticker: Inserting Logos into Diffusion Models for Customized Generation [73.6] テキスト・ツー・イメージ・モデルにロゴを挿入する作業を導入する。
我々の目標は、ロゴのアイデンティティを拡散モデルに挿入し、様々な状況下でシームレスに合成できるようにすることです。
この課題に対処するために,新しい2相パイプラインLogoStickerを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:54:49 GMT)
Random Latent Exploration for Deep Reinforcement Learning [71.9] 本稿ではRLE(Random Latent Exploration)と呼ばれる新しい探査手法を紹介する。
RLEはボーナスベースとノイズベース(ディープRLを効果的に探索するための2つの一般的なアプローチ)の強みを組み合わせたものである。
AtariとIsaacGymのベンチマークで評価し、RLEは他の手法よりも全タスクの総合スコアが高いことを示した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:55:22 GMT)
Evaluating and Analyzing Relationship Hallucinations in Large Vision-Language Models [69.8] 視覚関係の幻覚を評価するための新しいベンチマークであるR-Benchを紹介する。
R-Benchは、関係の存在に焦点を当てたイメージレベルの質問と、局所的な視覚的理解を評価するインスタンスレベルの質問を特徴としている。
我々は,関係関連性,主観関連性,関係対象性という,幻覚につながる3つの関係共起関係を同定する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 04:39:29 GMT)
WiNet: Wavelet-based Incremental Learning for Efficient Medical Image Registration [68.3] 深部画像登録は異常な精度と高速な推測を示した。
近年の進歩は、粗大から粗大の方法で密度変形場を推定するために、複数のカスケードまたはピラミッドアーキテクチャを採用している。
本稿では,様々なスケールにわたる変位/速度場に対して,スケールワイブレット係数を漸進的に推定するモデル駆動WiNetを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:51:01 GMT)
Open Vocabulary 3D Scene Understanding via Geometry Guided Self-Distillation [67.4] 2次元事前学習モデルから優れた3次元表現を学習するための幾何学ガイド自己蒸留(GGSD)を提案する。
3D表現の利点により、蒸留した3D学生モデルの性能は2D教師モデルよりも大幅に上回ることができる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:13:56 GMT)
GroupMamba: Parameter-Efficient and Accurate Group Visual State Space Model [66.4] 状態空間モデル(SSM)は、二次的複雑性を伴う長距離依存のモデリングにおいて効果的な性能を示した。
しかし、純粋なSSMベースのモデルは、コンピュータビジョンタスクにおける安定性と最適性能の達成に関連する課題に直面している。
本稿では,コンピュータビジョンのためのSSMベースのモデルをスケールする上での課題,特に大規模モデルの不安定性と非効率性について論じる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:59:58 GMT)
V-IRL: Grounding Virtual Intelligence in Real Life [65.9] V-IRLは、エージェントが仮想的で現実的な環境で現実世界と対話することを可能にするプラットフォームである。
私たちのプラットフォームは、様々な実践的なタスクを達成できるエージェントを開発するための遊び場として役立ちます。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:08:29 GMT)
PersLLM: A Personified Training Approach for Large Language Models [63.8] 社会実践, 一貫性, 動的発達という, 心理学に根ざした個性の原則を統合したPersLLMを提案する。
モデルパラメータに直接パーソナリティ特性を組み込み、誘導に対するモデルの抵抗性を高め、一貫性を高め、パーソナリティの動的進化を支援する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 04:18:43 GMT)
LaMI-DETR: Open-Vocabulary Detection with Language Model Instruction [63.7] 既存の手法は、視覚言語モデル(VLM)の頑健なオープン語彙認識機能を活用することにより、オープン語彙オブジェクト検出を強化している。
本稿では,視覚的概念間の関係を生かしたLanguage Model Instruction(LaMI)戦略を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:52:52 GMT)
AccDiffusion: An Accurate Method for Higher-Resolution Image Generation [63.5] AccDiffusionは、パッチワイドの高解像度画像生成をトレーニングなしで正確に行う方法である。
本稿では,異なるパッチに対する同一のテキストプロンプトが繰り返しオブジェクト生成を引き起こすことを明らかにする。
私たちのAccDiffusionは、初めて、バニラ画像認識プロンプトをパッチコンテンツ認識プロンプトのセットに分離することを提案しています。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 04:19:53 GMT)
Understanding Reinforcement Learning-Based Fine-Tuning of Diffusion Models: A Tutorial and Review [63.3] このチュートリアルは、下流の報酬関数を最適化するための微調整拡散モデルのための方法を網羅的に調査する。
PPO,微分可能最適化,報酬重み付きMLE,値重み付きサンプリング,経路整合性学習など,様々なRLアルゴリズムの適用について説明する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:35:32 GMT)
SegPoint: Segment Any Point Cloud via Large Language Model [62.7] 我々は,多種多様なタスクにまたがるポイントワイドセグメンテーションマスクを生成するSegPointと呼ばれるモデルを提案する。
SegPointは、単一のフレームワーク内でさまざまなセグメンテーションタスクに対処する最初のモデルである。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:58:03 GMT)
HazeCLIP: Towards Language Guided Real-World Image Dehazing [62.4] 既存の手法は、特に合成データセットにおいて、単一画像のデハージングにおいて顕著な性能を達成した。
本稿では,事前学習型デハジングネットワークの性能向上を目的とした言語誘導適応フレームワークHazeCLIPを紹介する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:18:25 GMT)
General Geometry-aware Weakly Supervised 3D Object Detection [62.3] RGB画像と関連する2Dボックスから3Dオブジェクト検出器を学習するための統合フレームワークを開発した。
KITTIとSUN-RGBDデータセットの実験により,本手法は驚くほど高品質な3次元境界ボックスを2次元アノテーションで生成することを示した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:52:08 GMT)
Streetscapes: Large-scale Consistent Street View Generation Using Autoregressive Video Diffusion [61.9] そこで本研究では,街並みを連続的に合成した街並みの景観を再現する手法を提案する。
我々の手法は、視覚的品質と一貫性を維持しつつ、複数の都市ブロックにまたがる、はるかに長い範囲のカメラ軌道にスケールすることができる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:56:30 GMT)
Towards AI-Powered Video Assistant Referee System (VARS) for Association Football [58.0] Video Assistant Referee (VAR)は、バックステージの審判が複数の視点からピッチ上のインシデントをレビューできるようにするイノベーションである。
VARは現在、高価なインフラと世界中の審判の欠如のために、プロリーグに限られている。
マルチビュービデオ解析における最新の知見を活用する半自動ビデオアシスタント参照システム(VARS)を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:18:23 GMT)
On Pretraining Data Diversity for Self-Supervised Learning [57.9] 我々は、より多様なデータセットを用いたトレーニングが、固定された計算予算の下での自己教師付き学習(SSL)のパフォーマンスに与える影響について検討する。
以上の結果から,事前学習データの多様性の増大はSSL性能を向上させるが,下流データへの分布距離が最小である場合に限る。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:15:00 GMT)
BEVWorld: A Multimodal World Model for Autonomous Driving via Unified BEV Latent Space [57.7] BEVWorldは,マルチモーダルセンサの入力を,環境モデリングのための統一的でコンパクトなBird's Eye View潜在空間にトークン化する手法である。
実験は、自律走行タスクにおけるBEVWorldの有効性を示し、将来のシーンを生成する能力を示し、知覚や動き予測のような下流タスクに恩恵を与える。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:33:43 GMT)
NeRF-MAE: Masked AutoEncoders for Self-Supervised 3D Representation Learning for Neural Radiance Fields [57.6] 提案手法は,RGB画像から有効な3D表現を生成する方法を示す。
我々は、この表現を、提案した擬似RGBデータに基づいて、180万枚以上の画像で事前訓練する。
我々は,NeRFの自己教師型プレトレーニングであるNeRF-MAE(NeRF-MAE)を目覚ましいスケールで実施し,様々な3Dタスクの性能向上を実現した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:59:48 GMT)
FANTAstic SEquences and Where to Find Them: Faithful and Efficient API Call Generation through State-tracked Constrained Decoding and Reranking [57.5] APIコール生成は、大規模言語モデルのツール使用能力の基盤となっている。
既存の教師付きおよびコンテキスト内学習アプローチは、高いトレーニングコスト、低いデータ効率、APIドキュメントとユーザの要求に反する生成APIコールに悩まされる。
本稿では,これらの制約に対処するため,FANTASEと呼ばれる出力側最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 23:44:02 GMT)
Less Peaky and More Accurate CTC Forced Alignment by Label Priors [57.5] 接続性時間分類(CTC)モデルはピーク出力分布を持つことが知られている。
本稿では, CTCのピーク動作を緩和し, 強制アライメント生成への適合性を向上させることを目的とする。
我々のCTCモデルはピーク後部を減らし、トークンのオフセットをより正確に予測することができる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:28:45 GMT)
SynthCLIP: Are We Ready for a Fully Synthetic CLIP Training? [57.4] 完全合成テキストイメージペアに基づいてトレーニングされたCLIPモデルであるSynthCLIPを提案する。
我々は人間の介入なしに画像と対応するキャプションの合成データセットを大規模に生成する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:21:29 GMT)
Open-Vocabulary 3D Semantic Segmentation with Text-to-Image Diffusion Models [57.4] Diff2Sceneは、テキスト画像生成モデルからの凍結表現と、サルエント・アウェアと幾何学的アウェアマスクを併用して、オープンな3次元セマンティックセマンティックセグメンテーションと視覚的グラウンドニングタスクに活用する。
競争ベースラインを上回り、最先端の手法よりも大幅に改善されていることを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:20:56 GMT)
OE-BevSeg: An Object Informed and Environment Aware Multimodal Framework for Bird's-eye-view Vehicle Semantic Segmentation [57.2] Bird's-eye-view (BEV)セマンティックセマンティックセグメンテーションは自律運転システムにおいて重要である。
本稿では,BEVセグメンテーション性能を向上させるエンドツーエンドマルチモーダルフレームワークであるOE-BevSegを提案する。
提案手法は,車両セグメンテーションのためのnuScenesデータセットにおいて,最先端の成果を大きなマージンで達成する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 03:48:22 GMT)
One Thousand and One Pairs: A "novel" challenge for long-context language models [56.6] NoChaは、67冊の架空の書籍に関する1,001対の真偽の主張のデータセットである。
当社のアノテータは、NoChaにおけるペアの最大シェアは、本全体に対するグローバルな推論を必要としていることを確認しています。
平均的なモデルでは、文レベルの検索しか必要としないペアの方が、グローバルな推論よりもはるかに優れています。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 21:47:24 GMT)
Pyramid Diffusion for Fine 3D Large Scene Generation [56.0] 拡散モデルは2次元画像と小型3次元オブジェクトの生成において顕著な結果を示した。
大規模な3Dシーンの合成への応用はめったに研究されていない。
本稿では,大規模拡散モデルを用いて,高品質な屋外シーンを段階的に生成するフレームワークであるPraamid Discrete Diffusion Model (PDD)を紹介する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:04:19 GMT)
When Do We Not Need Larger Vision Models? [56.0] 視覚モデルのサイズを拡大することが、より強力な視覚表現を得るためのデファクトスタンダードとなっている。
S$2のScaling on Scales(スケーリング・オン・スケール)のパワーを実演します。
1行のコードで任意のビジョンモデルにS$2$を適用可能なPythonパッケージをリリースします。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 02:54:35 GMT)
Spontaneous Style Text-to-Speech Synthesis with Controllable Spontaneous Behaviors Based on Language Models [55.9] 本稿では,言語モデルに基づく新たな自然音声合成システムを提案する。
自発音声における微妙な韻律変化を捉えるモデルの能力を高めるために, きめ細かい韻律モデリングを導入する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:42:38 GMT)
View-Consistent Hierarchical 3D Segmentation Using Ultrametric Feature Fields [52.1] 我々は3次元シーンを表すニューラル・レージアンス・フィールド(NeRF)内の新しい特徴場を学習する。
本手法は、ビュー一貫性の多粒性2Dセグメンテーションを入力とし、3D一貫性のセグメンテーションの階層構造を出力として生成する。
提案手法と,多視点画像と多粒性セグメンテーションを用いた合成データセットのベースラインの評価を行い,精度と視点整合性を向上したことを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 02:28:14 GMT)
Multiobjective Vehicle Routing Optimization with Time Windows: A Hybrid Approach Using Deep Reinforcement Learning and NSGA-II [52.1] 本稿では、時間窓を用いた多目的車両ルーティング問題(MOVRPTW)に対処するために、ウェイト・アウェア・ディープ・強化学習(WADRL)手法を提案する。
WADRLの結果を最適化するために非支配的ソート遺伝的アルゴリズム-II (NSGA-II) 法を用いる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 02:46:06 GMT)
A Closer Look at Benchmarking Self-Supervised Pre-training with Image Classification [51.4] 自己教師付き学習(SSL)は、データ自体が監視を提供する機械学習アプローチであり、外部ラベルの必要性を排除している。
SSLの分類に基づく評価プロトコルがどのように相関し、異なるデータセットのダウンストリーム性能を予測するかを検討する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 00:18:44 GMT)
PointSeg: A Training-Free Paradigm for 3D Scene Segmentation via Foundation Models [51.2] 我々は、市販の視覚基盤モデルを利用して、3Dシーン認識タスクに対処する学習自由パラダイムであるPointSegを提案する。
PointSegは正確な3Dプロンプトを取得してフレーム間で対応するピクセルを調整することで、任意の3Dシーンを分割することができる。
ScanNet、ScanNet++、KITTI-360データセット上の14.1$%、12.3$%、12.6$%のmAPは、最先端のトレーニングフリーモデルを大きく上回っている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 02:09:10 GMT)
Do Prompts Really Prompt? Exploring the Prompt Understanding Capability of Whisper [51.1] 本研究は,ハイパフォーマンス音声認識モデルであるWhisperとプロンプトの情報がどのように相互作用するかを考察する。
結果から,Whisperは人為的に文章のプロンプトを理解できない可能性が示唆された。
また、英語のプロンプトが両方の言語のデータセットで一般的にマンダリンよりも優れていることも指摘されている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 20:21:34 GMT)
A Survey of Artificial Intelligence in Gait-Based Neurodegenerative Disease Diagnosis [51.1] 神経変性疾患(神経変性疾患、ND)は、伝統的に医学的診断とモニタリングのために広範囲の医療資源と人的努力を必要とする。
重要な疾患関連運動症状として、ヒトの歩行を利用して異なるNDを特徴づけることができる。
人工知能(AI)モデルの現在の進歩は、NDの識別と分類のための自動歩行分析を可能にする。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:12:08 GMT)
Shape of Motion: 4D Reconstruction from a Single Video [51.0] 本稿では,全列長3D動作を特徴とする汎用動的シーンを再構築する手法を提案する。
シーン動作をコンパクトなSE3モーションベースで表現することで,3次元動作の低次元構造を利用する。
本手法は,3D/2Dの長距離動き推定と動的シーンにおける新しいビュー合成の両面において,最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:59:08 GMT)
Understanding Reference Policies in Direct Preference Optimization [50.7] DPO(Direct Preference Optimization)は、大規模言語モデル(LLM)の微調整のための訓練手法として広く使われている。
この研究は、参照モデルやポリシーに依存しているDPOの未検討の側面を探求する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:08:10 GMT)
MinD-3D: Reconstruct High-quality 3D objects in Human Brain [50.5] Recon3DMindは、fMRI(Functional Magnetic Resonance Imaging)信号から3次元視覚を再構成するための革新的なタスクである。
このデータセットは14人の参加者のデータを含み、3Dオブジェクトの360度ビデオが特徴である。
我々は,脳の3次元視覚情報をfMRI信号から復号化するための,新規で効果的な3段階フレームワークMinD-3Dを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:31:40 GMT)
Auditing for Racial Discrimination in the Delivery of Education Ads [50.4] 本稿では,教育機会のための広告配信において,人種的偏見を評価できる新たな第三者監査手法を提案する。
メタのアルゴリズムによる教育機会の広告配信における人種差別の証拠を見つけ、法的および倫理的懸念を訴える。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 19:12:25 GMT)
Reshaping the Online Data Buffering and Organizing Mechanism for Continual Test-Time Adaptation [49.5] 継続的なテスト時間適応は、訓練済みのソースモデルを適用して、教師なしのターゲットドメインを継続的に変更する。
我々は、オンライン環境、教師なしの自然、エラー蓄積や破滅的な忘れのリスクなど、このタスクの課題を分析する。
教師なしシングルパスデータストリームから重要サンプルを高い確実性で識別・集約する不確実性を考慮したバッファリング手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:05:01 GMT)
X-Former: Unifying Contrastive and Reconstruction Learning for MLLMs [49.3] X-FormerはCLとMIMの相補的な強度を利用するために設計された軽量トランスフォーマーモジュールである。
X-Formerは、2つの凍結した視覚エンコーダから視覚言語表現学習とマルチモーダル・マルチモーダル生成学習をブートストラップする。
さらに、凍結したLLMから視覚から言語への生成学習をブートストラップし、X-Formerの視覚的特徴をLLMで解釈できるようにする。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:39:54 GMT)
Quantum One-Wayness of the Single-Round Sponge with Invertible Permutations [49.2] スポンジハッシュは、広く使われている暗号ハッシュアルゴリズムのクラスである。
これまでのところ、不規則な置換は根本的なオープンな問題のままである。
ランダムな2n$-bit置換でゼロペアを見つけるには、少なくとも$Omega(2n/2)$多くのクエリが必要である。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 02:37:24 GMT)
I Can't Believe It's Not Scene Flow! [49.1] 現在のシーンフロー法では、小さな物体の動きを記述できない。
我々は,クラス認識と速度正規化が可能な新しい評価プロトコル,Bucket Normalized EPEを提案する。
評価コードはhttps://github.com/kylevedder/BucketedSceneFlowEval.comで公開しています。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:49:12 GMT)
ViLLa: Video Reasoning Segmentation with Large Language Model [48.8] そこで我々は,新しいビデオセグメンテーションタスクであるビデオ推論セグメンテーションを提案する。
このタスクは、複雑な入力テキストクエリが与えられたセグメンテーションマスクのトラックレットを出力するように設計されている。
ViLLa: 大規模言語モデルを用いたビデオ推論セグメンテーションを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:59:17 GMT)
On the Viability of Monocular Depth Pre-training for Semantic Segmentation [48.3] 本研究は,意味的タスクへの下流移動において,幾何学的タスクの事前学習が有効かどうかを考察する。
単分子深度は意味的セグメンテーションのための事前学習の実行可能な形式であり、共通ベースラインの改善によって検証される。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:36:22 GMT)
NNsight and NDIF: Democratizing Access to Foundation Model Internals [48.3] NNsightはオープンソースのPythonパッケージで、グラフを構築することで任意のPyTorchモデルの介入を表現できるシンプルなフレキシブルなAPIを備えている。
NDIFは、NNsight APIを通じて基礎的なLLMへのアクセスを提供する共同研究プラットフォームである。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:59:01 GMT)
Multi-Label Continual Learning for the Medical Domain: A Novel Benchmark [47.5] 一つのフレームワークにおける新しいクラス到着とドメインシフトの課題を組み合わせた新しいベンチマークを提案する。
本ベンチマークは,医療画像における多ラベル分類問題に対する現実的なCL設定をモデル化することを目的とする。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:00:42 GMT)
A Survey of Multimodal Large Language Model from A Data-centric Perspective [46.6] マルチモーダル大言語モデル(MLLM)は、複数のモーダルからのデータの統合と処理によって、標準的な大言語モデルの能力を高める。
データはこれらのモデルの開発と改良において重要な役割を担います。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:01:52 GMT)
Model-based Policy Optimization using Symbolic World Model [46.4] ロボット工学における学習に基づく制御手法の適用は、大きな課題を呈している。
1つは、モデルなし強化学習アルゴリズムがサンプル効率の低い観測データを使用することである。
シンボリック回帰によって生成されるシンボリック表現による遷移ダイナミクスの近似を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:49:21 GMT)
Multi-sentence Video Grounding for Long Video Generation [46.4] 長大映像生成のための多文ビデオグラウンドの勇敢で新しいアイデアを提案する。
提案手法は,画像・ビデオ編集,ビデオモーフィング,パーソナライズド生成,ビデオグラウンドニングの発達を,長いビデオ生成にシームレスに拡張する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:05:05 GMT)
From Words to Worlds: Compositionality for Cognitive Architectures [45.3] 大規模言語モデル(LLM)は非常に高性能なコネクショナリストシステムであるが、より構成性が高いか?
以下に紹介するタスクを含む,4つのLLMファミリーと3つのタスクカテゴリにまたがる経験的分析について述べる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:42:13 GMT)
PM-LLM-Benchmark: Evaluating Large Language Models on Process Mining Tasks [45.1] 大規模言語モデル(LLM)は、プロセスマイニング(PM)分析を半自動化する可能性がある。
ドメイン知識に着目したPMの総合ベンチマークであるPM-LLM-Benchmarkを提案する。
検討対象のLLMのほとんどは, 良好なレベルでプロセスマイニング作業を行うことができるが, エッジデバイス上で実行される小さなモデルはまだ不十分である。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:57:31 GMT)
Combining Constraint Programming Reasoning with Large Language Model Predictions [45.0] 制約プログラミング(CP)と機械学習(ML)は、テキスト生成において課題に直面します。
本稿では,Large Language Model (LLM) をCPに組み込んだ手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:15:55 GMT)
A Closer Look at GAN Priors: Exploiting Intermediate Features for Enhanced Model Inversion Attacks [44.0] Model Inversion (MI)攻撃は、出力情報を利用して、リリースされたモデルからプライバシーに敏感なトレーニングデータを再構築することを目的としている。
GAN(Generative Adversarial Network)の最近の進歩は、MI攻撃の性能向上に大きく貢献している。
本稿では,GAN構造を分解し,中間ブロック間の特徴を利用する中間特徴拡張生成モデル変換(IF-GMI)を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 19:16:22 GMT)
SOMONITOR: Explainable Marketing Data Processing and Analysis with Large Language Models [43.3] 説明可能なAIフレームワークであるSoMonitorを紹介します。
SoMonitorは、人間の直感とAIベースの効率の相乗効果を目指している。
マーケティングのあらゆる段階におけるマーケターを助ける。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 02:55:52 GMT)
Translate-and-Revise: Boosting Large Language Models for Constrained Translation [42.4] 制約付き翻訳には,大規模言語モデル(LLM)の機能を利用する。
LLMは、翻訳命令や制約をプロンプトとして取り込むことで、このタスクに容易に適応できる。
標準LLMよりも制約に基づく翻訳精度が15%向上したことを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:08:09 GMT)
Unmasking Social Bots: How Confident Are We? [41.9] 本稿では,ボット検出と不確実性の定量化の両方に対処することを提案する。
この二重焦点は、各予測の定量化の不確実性に関連する追加情報を活用することができるため、非常に重要である。
具体的には,予測を高い信頼性で行う場合のボットに対する標的的介入を促進するとともに,予測が不確実な場合の警告(例えば,より多くのデータ収集)を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 22:33:52 GMT)
Noninterference Analysis of Reversible Systems: An Approach Based on Branching Bisimilarity [41.9] 非干渉に対する古典的同値性に基づくアプローチは、主に弱いバイシミュレーションのセマンティクスに依存している。
本手法は,可逆計算の存在下での隠蔽チャネルの同定に十分でないことを示す。
バック・アンド・フォース計算の効果を捉えるためには、より表現力のある意味論に切り替える必要がある。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:40:00 GMT)
RoT: Enhancing Large Language Models with Reflection on Search Trees [41.7] 本稿では,木探索に基づくプロンプト手法の性能向上を目的としたLLMリフレクションフレームワークであるリフレクション・オン・サーチ・ツリー(RoT)について紹介する。
強力なLLMを使用して、以前の木探索経験からガイドラインを要約し、弱いLLMの能力を高める。
本稿では,RoTがより具体的で意味のあるガイドラインを生成するのを支援するために,歴史的検索プロセスから重要な情報を識別する新しい状態選択法を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 04:44:25 GMT)
Geometric Active Exploration in Markov Decision Processes: the Benefit of Abstraction [41.2] 我々は、MDP準同型形式を用いて、既知の幾何学的構造を抽象化によって活用する方法を示す。
また、サンプル効率のホモモルフィズムによる抽象化の利点を正式に把握する最初の分析も提示する。
本研究では, 科学的発見の課題に起因した環境において, 理論的, 実験的に解析するGeometric Active Exploration (GAE) アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:15:51 GMT)
Make a Strong Teacher with Label Assistance: A Novel Knowledge Distillation Approach for Semantic Segmentation [40.8] セマンティックセグメンテーションタスクのための新しい知識蒸留手法を提案する。
教師モデルトレーニングでは,ラベルをノイズにし,それをインプットに組み込み,軽量教師のパフォーマンスを効果的に向上させることを提案する。
本手法は,知識蒸留の有効性を高めるだけでなく,教師モデルや学生モデルを選択する際の柔軟性も向上させる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:08:04 GMT)
Robust Multivariate Time Series Forecasting against Intra- and Inter-Series Transitional Shift [40.7] 本稿では,時系列内/時系列間の相関関係を統合的に把握し,時変遷移分布をモデル化するための統一確率グラフモデルを提案する。
6つの高定常MTSデータセットに対する広範囲な実験により、JointPGMの有効性と効率を検証した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 06:16:03 GMT)
In Search of Lost Online Test-time Adaptation: A Survey [40.7] 本稿では,オンラインテスト時間適応(OTTA)に関する総合的な調査を紹介する。
我々はOTTAテクニックを3つの主要なカテゴリに分類し、それらをモダンなバックボーンであるビジョントランスフォーマー(ViT)を用いてベンチマークする。
以上の結果から,トランスフォーマーは多彩なドメインシフトに対するレジリエンスを高めていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:58:02 GMT)
Powerful and Flexible: Personalized Text-to-Image Generation via Reinforcement Learning [40.1] 個人化されたテキスト・画像生成のための新しい強化学習フレームワークを提案する。
提案手法は、テキストアライメントを維持しながら、視覚的忠実度に大きな差で既存の最先端手法よりも優れている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 15:34:04 GMT)
Variational-quantum-eigensolver-inspired optimization for spin-chain work extraction [39.6] 量子源からのエネルギー抽出は、量子電池のような新しい量子デバイスを開発するための重要なタスクである。
量子源からエネルギーを完全に抽出する主な問題は、任意のユニタリ演算をシステム上で行うことができるという仮定である。
本稿では,変分量子固有解法(VQE)アルゴリズムにインスパイアされた抽出可能エネルギーの最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:03:03 GMT)
Many Perception Tasks are Highly Redundant Functions of their Input Data [39.6] 視覚認識からセマンティックセグメンテーションに至るまで、多くの知覚タスクが、入力データの非常に冗長な機能であることを示す。
異なる部分空間に投影された画像や分光図は、データが最も変化する最上位部分空間であるかどうかに関わらず、これらのタスクを著しくうまく解決することができる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:24:25 GMT)
Breakdown of Measurement-Induced Phase Transitions Under Information Loss [39.4] 量子マンボディシステムは、測定誘起相転移(MIPT)を特徴付けることができる
MIPTは、平均的な観測器を通しては明らかにできないが、それぞれの軌道を別々に識別する能力が必要である。
観測者の各測定結果の識別能力の低下の下でMIPTの運命を探究する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:10:52 GMT)
The role of slicing in test-driven development [39.0] テスト駆動開発(TDD)は広く使われているアジャイルプラクティスです。
TDDの理論的枠組みとして,次のような特徴を持つフレームワークを提案する。
業界で実施されたコントロールされた実験を使用して、TDD、契約、スライス間の接続をチェックしました。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:10:38 GMT)
MeshFeat: Multi-Resolution Features for Neural Fields on Meshes [38.9] パラメトリック特徴格子符号化は、ニューラルネットワークの符号化手法として注目されている。
Euclidean空間のマルチレゾリューション機能グリッドの考え方を適応させるために,メッシュ用に調整されたパラメトリック機能であるMeshFeatを提案する。
テクスチャ再構築とBRDF表現に匹敵する再現品質を維持しつつ, 従来の表現と比較して, 大幅な高速化を示した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 15:29:48 GMT)
Making Reasoning Matter: Measuring and Improving Faithfulness of Chain-of-Thought Reasoning [38.6] 大きな言語モデル(LLM)は、質問に答える前にステップバイステップの推論を求めると、よりよいパフォーマンスを示すことが示されている。
モデルの最終回答がどの程度、説明された推論ステップに忠実であるかは定かではない。
FRODOは、小さなLMを調整して正しい推論ステップを生成し、これらのステップに対して堅牢な推論を行うためのフレームワークである。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:49:56 GMT)
On the Discriminability of Self-Supervised Representation Learning [38.6] 自己教師付き学習(SSL)は、最近、下流の視覚タスクで大きな成功を収めた。
特に複雑な下流タスクにおいて、SSLと教師あり学習(SL)の間には、注目すべきギャップがまだ残っている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 14:18:03 GMT)
Open-Canopy: A Country-Scale Benchmark for Canopy Height Estimation at Very High Resolution [38.0] 超高解像度(1.5m)キャノピー高さ推定のための最初のオープンアクセスおよびカントリースケールのベンチマークであるOpen-Canopyを紹介する。
また、異なる年に撮影された2つの画像間の天蓋の高さ変化検出のための最初のベンチマークであるOpen-Canopy-$Delta$を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:03:59 GMT)
SciCode: A Research Coding Benchmark Curated by Scientists [37.9] 言語モデル(LM)は、多くの挑戦的なタスクにおいて平均的な人間よりも優れており、挑戦的で高品質で現実的な評価を開発することはますます困難になっている。
このベンチマークには数学、物理学、化学、生物学、材料科学といった問題が含まれています。
クロード3.5-ソネット(Claude3.5-Sonnet)は、最も現実的な環境では、問題の4.6%しか解決できない。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:15:24 GMT)
Adjusting Logit in Gaussian Form for Long-Tailed Visual Recognition [37.6] 特徴レベルの観点から、長い尾の視覚認識の問題について検討する。
2つの新しいロジット調整法が提案され,計算オーバーヘッドの緩やかなモデル性能が向上した。
ベンチマークデータセットを用いて行った実験は,提案手法の最先端手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 06:33:49 GMT)
Understanding and Improving Transfer Learning of Deep Models via Neural Collapse [37.5] 分類問題に対する神経崩壊(NC)と伝達学習の関係について検討する。
機能崩壊と下流のパフォーマンスには強い相関関係がある。
提案手法は, 微調整パラメータを90%以上削減しつつ, 優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 22:07:44 GMT)
CodeV: Empowering LLMs for Verilog Generation through Multi-Level Summarization [37.4] 本稿では,オープンソースの命令調整型Verilog生成用LLMであるCodeVを紹介する。
CodeVは以前のオープンソースSOTAを14.4%(VerilogEvalのBetterV)と11.3%(RTLCoder in RTLLM)で相対的に上回っている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:43:08 GMT)
CoD, Towards an Interpretable Medical Agent using Chain of Diagnosis [36.3] CoD(Chain-of-Diagnosis)は、診断過程を医師の思考過程を反映した診断連鎖に変換する。
CoDは、意思決定における透明性を確保するために、病気の信頼性分布を出力する。
診断GPTは9604の疾患を診断することができる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:06:27 GMT)
Information Complexity of Stochastic Convex Optimization: Applications to Generalization and Memorization [36.3] 我々は,円錐曲線最適化(SCO)の文脈における記憶と学習の相互作用について検討する。
我々は,Steinke と Zakynthinou が提唱した条件付き相互情報(CMI)の枠組みを用いた記憶の定量化(2020年)
L2$ Lipschitz-bounded set and under strong convexity, every learner with a excess error have CMI bounded by $Omega (1/varepsilon2)$ and $Omega (1/varepsilon)$。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:37:59 GMT)
Comparing Pre-trained Human Language Models: Is it Better with Human Context as Groups, Individual Traits, or Both? [36.0] 人間中心の自然言語処理には、人間のコンテキストを言語モデルに組み込む必要がある。
現在、1)グループワイド属性(例:45歳以上)での事前トレーニング、または2)個々の特性の2つの方法が存在する。
事前学習モデルと,1)グループ属性,2)個人属性,3)ユーザレベルと文書レベルの5つのタスクに対する複合アプローチによる人間コンテキストとの比較を行った。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 21:57:20 GMT)
SPAMming Labels: Efficient Annotations for the Trackers of Tomorrow [35.8] SPAMは、人間の介入を最小限に抑えた高品質なラベルを提供するビデオラベルエンジンである。
我々は統合グラフの定式化を用いて、トラックの検知と同一性関連の両方のアノテーションに時間をかけて対処する。
我々はSPAMラベルでトレーニングされたトラッカーが人間のアノテーションでトレーニングされたトラッカーに匹敵する性能を発揮することを示した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 12:58:19 GMT)
Implicit Filtering for Learning Neural Signed Distance Functions from 3D Point Clouds [34.8] 幾何学的詳細を保存しながら暗黙の場を滑らかにする非線形暗黙フィルタを提案する。
我々の新規性は、符号付き距離場の勾配で隣接する入力点によって曲面(ゼロレベル集合)をフィルタリングできることにある。
入力された原点雲を勾配に沿って移動させることで、提案した暗黙のフィルタリングを非ゼロレベル集合に拡張することができる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:40:24 GMT)
Advancing Large Multi-modal Models with Explicit Chain-of-Reasoning and Visual Question Generation [34.5] 本稿では,大規模視覚・言語モデル(VLM)の開発に向けた新しいアプローチを提案する。
本稿では,質問に対して必要な知識を習得し,推論プロセスの堅牢性と説明可能性を高めるシステムを提案する。
データセットは、キャプション生成のような一般的なタスクから、専門家の知識を必要とする専門的なVQAタスクまで、さまざまなタスクをカバーする。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 02:35:30 GMT)
FSP-Laplace: Function-Space Priors for the Laplace Approximation in Bayesian Deep Learning [34.3] 我々は事前関数空間を用いて不確実性推定を伴うディープネットワークを実現する。
深層ネットワークの一般化を可能にする暗黙の帰納バイアスを利用する。
我々の手法は、事前知識が豊富であるような改善された結果を提供する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:08:58 GMT)
Learning from the Web: Language Drives Weakly-Supervised Incremental Learning for Semantic Segmentation [34.0] 我々は、新しいクラスを学習するためにも、広く利用可能なWebイメージを考えることができると論じている。
我々の知る限り、これは新しい概念の学習と既に学んだ概念の保存の両方のために、Webイメージにのみ依存する最初の作品である。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:14:49 GMT)
STS MICCAI 2023 Challenge: Grand challenge on 2D and 3D semi-supervised tooth segmentation [33.3] MICCAI 2023 Challenge on the Alibaba Tianchi Platformの一部として、Semi-supervised Teeth (STS) Challengeが開催された。
この課題は, 歯学の分野を前進させるために, 効果的な半教師付き歯のセグメンテーションアルゴリズムを検討することである。
2次元パノラマX線像と3次元CBCT歯量を含む2つのモダリティを提供する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:00:08 GMT)
Open-Source Conversational AI with SpeechBrain 1.0 [33.0] SpeechBrainはオープンソースのConversational AIツールキットで、PyTorchをベースとしている。
事前トレーニングされたモデルと、トレーニングに必要なコードとアルゴリズムの完全な“レシピ”の両方をリリースすることで、透明性と複製性を促進する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:26:57 GMT)
An Application of Large Language Models to Coding Negotiation Transcripts [33.0] 大規模言語モデル(LLM)は、自然言語処理(NLP)の分野で印象的な能力を示している。
本稿では,Vanderbilt AI Negotiation Lab による交渉テキスト解析における LLM の適用について検討する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:05:59 GMT)
PAS: Data-Efficient Plug-and-Play Prompt Augmentation System [32.7] 大型言語モデル(LLM)は、プラグアンドプレイAIシステムへの需要を増大させた。
LLMベースのプラグアンドプレイ自動プロンプトエンジニアリング(APE)システムであるPASを提案する。
PAS は従来の APE モデルと比較して、平均 6.09 ポイントの改善を達成している。
PASは人間の評価に優れており、ユーザのためのプラグインとしての適合性を強調している。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:46:34 GMT)
Motif-Consistent Counterfactuals with Adversarial Refinement for Graph-Level Anomaly Detection [30.6] 本稿では,グラフレベルの異常検出のための新しい手法Motif-consistent Counterfactuals with Adversarial Refinement (MotifCAR)を提案する。
このモデルは、あるグラフのモチーフと、識別(カテゴリ)情報を含むコアサブグラフと、別のグラフのコンテキストサブグラフを組み合わせて、生の反事実グラフを生成する。
MotifCARは高品質な反ファクトグラフを生成することができる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:04:57 GMT)
A Dataset and Benchmark for Shape Completion of Fruits for Agricultural Robotics [30.5] 本稿では,農業用視覚システムのための3次元形状補完データセットを提案する。
果実の3次元形状を推定するためのRGB-Dデータセットを提供する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:07:23 GMT)
Realizable $H$-Consistent and Bayes-Consistent Loss Functions for Learning to Defer [30.4] 非増加関数の$Psi$によってパラメータ化され、穏やかな条件下で実現可能な$H$一貫性を確立する。
分類誤差に基づくコスト関数の場合、これらの損失は仮説集合が対称かつ完全であるときに$H$一貫性境界を持つことを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:35:03 GMT)
Learning Visual Grounding from Generative Vision and Language Model [29.3] ビジュアルグラウンドタスクは、自然言語参照に基づいて画像領域をローカライズすることを目的としている。
生成的VLMには基底知識がすでに存在しており、適切なプロンプトによって引き起こすことができる。
本研究は,実世界における視覚的接地を拡大するための生成型VLMの可能性を実証するものである。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 20:29:49 GMT)
AgentDojo: A Dynamic Environment to Evaluate Attacks and Defenses for LLM Agents [27.7] 我々は、信頼できないデータ上でツールを実行するエージェントの評価フレームワークであるAgentDojoを紹介した。
AgentDojoは静的テストスイートではなく、新しいエージェントタスク、ディフェンス、アダプティブアタックを設計、評価するための環境である。
AgentDojoには97の現実的なタスク、629のセキュリティテストケースと、文献からのさまざまな攻撃および防御パラダイムが組み込まれています。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:37:28 GMT)
HORAE: A Domain-Agnostic Modeling Language for Automating Multimodal Service Regulation [27.0] この研究は、マルチモーダル規則をモデル化するための統一仕様言語であるHORAEの設計原則を提示する。
HORAEは、HORAEという名前の細調整された大規模言語モデルをさらに活用することで、インテリジェントなサービス規制パイプラインを促進する方法を示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:04:24 GMT)
Research on Tibetan Tourism Viewpoints information generation system based on LLM [26.9] 本研究は,チベット観光観光地における情報格差の影響について考察する。
LLM(Large Language Model)評価基準の確立という課題に対処する。
これは、教師付き微調整技術を採用した革新的なアプローチであるDualGen Bridge AIシステムを導入している。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 14:31:53 GMT)
LIDIA: Precise Liver Tumor Diagnosis on Multi-Phase Contrast-Enhanced CT via Iterative Fusion and Asymmetric Contrastive Learning [26.6] LIDIAと命名された多相造影CTを用いたLIver腫瘍DIAgnosisネットワークを現実シナリオとして提案する。
症例は1,921例,8,138例であった。
LIDIAは8種類の病変に対して平均93.6%のAUCを達成し、その効果を実証している。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:00:23 GMT)
INDIC QA BENCHMARK: A Multilingual Benchmark to Evaluate Question Answering capability of LLMs for Indic Languages [26.1] Indic-QAは、2つの言語ファミリーから11の主要なインドの言語に対して、公開可能なコンテキストベース質問答えデータセットとして最大である。
我々は、Geminiモデルを用いて合成データセットを生成し、パスを与えられた質問応答ペアを作成し、品質保証のために手作業で検証する。
様々な多言語大言語モデルと,その命令を微調整した変種をベンチマークで評価し,その性能,特に低リソース言語について検討した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:57:16 GMT)
MO-EMT-NAS: Multi-Objective Continuous Transfer of Architectural Knowledge Between Tasks from Different Datasets [26.0] 本研究では,NAS(MO-EMT-NAS)のための多目的マルチタスクフレームワークを提案する。
我々は,MO-EMT-NASがモデル性能と複雑性のトレードオフを柔軟に実現しつつ,最小限の分類誤差を改善することを示す。
MO-EMT-NASのランタイムは、対応する多目的シングルタスクアプローチと比較して59.7%から77.7%に削減されている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 03:12:35 GMT)
Tree semantic segmentation from aerial image time series [24.1] 1年以上にわたる空中データセット画像を用いて,樹木のセマンティックセグメンテーションを行う。
単体画像で訓練したモデルと時系列で訓練したモデルを比較し,木表現学がセグメンテーション性能に与える影響を評価する。
樹種分類の階層構造を,種,属,高水準の3つのレベルで予測を洗練させるカスタム・ロス・ファンクションを取り入れることで活用する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 02:19:57 GMT)
AnyControl: Create Your Artwork with Versatile Control on Text-to-Image Generation [24.1] 言語制御は効果的なコンテンツ生成を可能にするが、画像生成のきめ細かい制御に苦慮する。
AnyControlは、生成プロセスのガイドとして、統一されたマルチモーダル埋め込みを抽出する、新しいマルチControlフレームワークを開発している。
このアプローチは、ユーザ入力の全体的理解を可能にし、汎用的な制御信号の下で高品質で忠実な結果を生成する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 06:06:09 GMT)
Which Model Generated This Image? A Model-Agnostic Approach for Origin Attribution [24.0] 本研究では,生成した画像の起点属性を現実的に検討する。
ゴールは、ある画像がソースモデルによって生成されるかどうかを確認することである。
OCC-CLIPはCLIPをベースとしたワンクラス分類のためのフレームワークである。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:25:04 GMT)
Model Provenance via Model DNA [23.9] 本稿では,機械学習モデルの特徴を表現した新しいモデルDNAについて紹介する。
本研究では,対象モデルの事前学習モデルであるかどうかを識別できるモデル証明同定のための効率的なフレームワークを開発する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:53:10 GMT)
Towards AI-Architecture Liberty: A Comprehensive Survey on Design and Generation of Virtual Architecture by Deep Learning [23.6] ディープラーニングを活用した3D形状生成技術は、コンピュータビジョンとアーキテクチャデザインコミュニティの両方から大きな関心を集めている。
建築設計, 3次元形状技術, 仮想環境に関する149の関連記事について概説する。
深層学習支援アーキテクチャ生成における没入型システムとのユビキタスインタラクションの4つの重要な実現方法を強調した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:49:58 GMT)
Reconstruct the Pruned Model without Any Retraining [23.2] 本稿では,線形補間に基づく適応再構成(LIAR)フレームワークを提案する。
LIARはバックプロパゲーションや再トレーニングを必要とせず、様々なプルーニング基準やモジュールと互換性がある。
GLUE, SQuAD, WikiText, 常識推論などのベンチマークによる評価の結果, LIARはパラメータの50%を除去しても, 98%の精度でBERTモデルを維持できることがわかった。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:30:44 GMT)
PG-Attack: A Precision-Guided Adversarial Attack Framework Against Vision Foundation Models for Autonomous Driving [23.1] ビジョンファウンデーションモデルは、高度な能力のため、自律運転システムにますます採用されている。
これらのモデルは敵の攻撃を受けやすいため、自動運転車の信頼性と安全性に大きなリスクが生じる。
本稿では, 高精度マスク摂動攻撃と知覚テキストパッチ攻撃の2つの手法を組み合わせた, 高精度誘導逆攻撃フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 02:39:31 GMT)
SUSTechGAN: Image Generation for Object Recognition in Adverse Conditions of Autonomous Driving [23.0] 本稿では,2つの注意モジュールとマルチスケールジェネレータを備えた新しいSUSTechGANを提案する。
我々は、SUSTechGANと既存のよく知られたGANを用いて、雨と夜の悪天候下で駆動画像を生成し、生成した画像をオブジェクト認識ネットワークの再トレーニングに適用する。
実験の結果,SUSTechGANで生成した運転画像は,降雨時のヨロブ5の再学習性能を有意に向上した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 15:32:25 GMT)
All Roads Lead to Rome? Exploring Representational Similarities Between Latent Spaces of Generative Image Models [22.4] VAE、GAN、正規化フロー(NF)、拡散モデル(DM)の4つの生成画像モデルの潜時空間類似度を測定する。
我々の手法は、凍結された潜在空間間の線型写像を任意のエンコーダとデコーダのペアの「スティッチ」に訓練することを含む。
主な知見は,潜時空間間の線形写像が,潜時サイズの違いがあっても,ほとんどの視覚情報を保存できることである。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 12:23:57 GMT)
PoseCrafter: One-Shot Personalized Video Synthesis Following Flexible Pose Control [22.3] PoseCrafterは、フレキシブルポーズのコントロールに続くパーソナライズされたビデオ生成のためのワンショット方式である。
安定拡散と制御ネットに基づいて、我々は、高品質なビデオを生成するための推論プロセスを慎重に設計する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:50:45 GMT)
Personalized Federated Domain-Incremental Learning based on Adaptive Knowledge Matching [22.2] 適応型知識マッチングに基づくパーソナライズFDILアプローチ(pFedDIL)を提案する。
pFedDILでは、各クライアントが適切な漸進的なタスク学習戦略を利用できる。
pFedDILは、すべてのタスクの平均精度において、最先端のメソッドよりも14.35%高い性能を示すことを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:37:49 GMT)
Labeled Data Selection for Category Discovery [22.2] カテゴリー発見手法は、ラベルのない視覚データに新しいカテゴリを見つけることを目的としている。
ラベル付けされた集合に存在するカテゴリを変更することは、ラベル付けされていない集合で最終的に発見されるものに大きな影響を与える。
本稿では,ラベル付きデータとラベルなしデータとの類似性に基づいて,最適なラベル付きデータを自動的に選択する2つの新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:25:32 GMT)
GPSFormer: A Global Perception and Local Structure Fitting-based Transformer for Point Cloud Understanding [21.7] GPSFormerはGlobal Perception and Local Structure Fitting-based Transformerである。
GPSFormerは、目立った精度で点雲から詳細な形状情報を学ぶ。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:53:15 GMT)
Decision Focused Causal Learning for Direct Counterfactual Marketing Optimization [21.3] 決定集中学習(DFL)は機械学習(ML)と最適化をエンドツーエンドフレームワークに統合する。
しかし、DFLをマーケティングに展開するのは、複数の技術的課題のために簡単ではない。
本稿では,直接対物マーケティングのための意思決定型因果学習フレームワーク(DFCL)を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:39:44 GMT)
An Empirical Study and Analysis of Text-to-Image Generation Using Large Language Model-Powered Textual Representation [21.2] 既存のメソッドは、入力プロンプトを表現するためにCLIPモデルのテキストエンコーダを利用する。
大規模言語モデル(LLM)は多言語入力を提供し、より長いコンテキストに対応し、優れたテキスト表現を実現する。
LLMのテキスト表現を用いたテキスト・ツー・イメージモデルの高速な訓練を可能にする軽量なアダプタを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:14:19 GMT)
FairEM360: A Suite for Responsible Entity Matching [21.1] このデモでは、エンティティマーカの出力を監査するフレームワークであるFairEM360が紹介されている。
EMパイプラインの評価において,FairEM360がフェアネスの優先順位付けに寄与することを期待している。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 20:23:19 GMT)
Audio-visual Generalized Zero-shot Learning the Easy Way [20.6] 本稿では,EZ-AVGZLについて述べる。
我々は,VGGSound-GZSL,UCF-GZSL,ActivityNet-GZSLベンチマークについて広範な実験を行った。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 01:57:16 GMT)
Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts) [20.5] この第2回説明可能なAI for the Arts(XAIxArts)に関する国際ワークショップは、HCI、インタラクションデザイン、AI、説明可能なAI(XAI)、デジタルアートの研究者のコミュニティを集めて、XAI for the Artsの役割を探求した。
第16回 ACM Conference on Creativity and Cognition (C&C 2024) でワークショップを開催した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 12:01:56 GMT)
Adaptive Foundation Models for Online Decisions: HyperAgent with Fast Incremental Uncertainty Estimation [20.5] GPT-HyperAgentは,GPTとHyperAgentを併用した拡張手法である。
我々はHyperAgentが$tildeO(log T)$ per-step計算複雑性を用いて高速なインクリメンタル不確実性推定を実現することを証明した。
解析により,HyperAgentの遺残順序は線形文脈帯域における正確なトンプソンサンプリングと一致することが示された。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 06:16:09 GMT)
Sparse and geometry-aware generalisation of the mutual information for joint discriminative clustering and feature selection [19.1] GEMINIと呼ばれる相互情報の幾何を考慮した一般化を最大化しようとする識別クラスタリングモデルを導入する。
このアルゴリズムは,特徴探索の負担を回避し,識別クラスタリングモデルのみを設計しながら,高次元データや大量のサンプルに対して容易にスケーラブルである。
以上の結果から,Sparse GEMINIは競合アルゴリズムであり,関連基準や事前仮説を使わずに,クラスタリングに関して変数の関連するサブセットを選択することができることがわかった。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:44:18 GMT)
Multi-modal vision-language model for generalizable annotation-free pathology localization and clinical diagnosis [19.0] 医療画像から病理を自動的に定義することは、疾患の出現と進展を理解するのに役立つ。
既存のディープラーニングモデルは専門家のアノテーションに大きく依存しており、オープンな臨床環境での一般化機能が欠如している。
視覚言語モデルを提案する。
lingering-free pathology (AFLOC)
AFLocは病理学や分類学における最先端の手法を超越し、また5つの異なる病理の特定においてヒトのベンチマークよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:08:52 GMT)
LLMs as Function Approximators: Terminology, Taxonomy, and Questions for Evaluation [18.3] 本稿では,これらのモデルモデルにおける明瞭さの喪失が,「人工的な一般知性」などのメタファーにつながることを論じる。
この提案は、自然言語仕様に基づいて専門関数を近似する能力において、それらの一般化と潜在的な価値を見出すことである。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:49:56 GMT)
Qalam : A Multimodal LLM for Arabic Optical Character and Handwriting Recognition [18.3] 本研究はアラビア語 OCR と HWR 向けに設計された新しい基礎モデルである Qalam を紹介する。
提案手法は,HWRタスクが0.80%,OCRタスクが1.18%のワード誤り率(WER)を達成し,既存の手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 14:31:09 GMT)
FADE: A Task-Agnostic Upsampling Operator for Encoder-Decoder Architectures [18.2] FADEは、新しくて、プラグアンドプレイで、軽量で、タスクに依存しないアップサンプリングオペレータである。
FADEはタスク非依存であり,多くの密集予測タスクにおいて一貫した性能向上を示す。
リージョンとディテールに敏感なタスクの両方で,ロバストな機能アップサンプリングを初めて実施しました。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:32:36 GMT)
Simultaneous Localization and Affordance Prediction for Tasks in Egocentric Video [18.1] 本稿では,視覚的インプットとタスク記述を結びつけるために,空間的局所化されたエゴセントリックビデオのトレーニングを行うシステムを提案する。
提案手法は,VLMを用いてタスク記述の類似性を位置タグ付き画像にマッピングする手法よりも優れていることを示す。
このシステムは、ロボットがエゴセントリックな感覚を使って、自然言語で指定された新しいタスクの物理的な場所をナビゲートすることを可能にする。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:55:56 GMT)
CogniVoice: Multimodal and Multilingual Fusion Networks for Mild Cognitive Impairment Assessment from Spontaneous Speech [17.9] 音声データとそのテキストの書き起こしを分析し,MMSE(Mini-Mental State Examination)スコアの検出と推定を行う新しいフレームワークであるCogniVoiceを紹介した。
TAUKADIALチャレンジから英語と中国語の両方を含む包括的なデータセットを使用して、CogniVoiceはMCI分類とMMSE回帰タスクにおける最高のパフォーマンスベースラインモデルより優れている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:38:24 GMT)
On Causally Disentangled State Representation Learning for Reinforcement Learning based Recommender Systems [17.8] Reinforcement Learning-based Recommender Systems (RLRS)では、ユーザインタラクションの複雑さとダイナミズムは高次元でノイズの多い状態空間をもたらすことが多い。
状態を分解し、textbfCausal-textbfIntextbfDispensable textbfState Representationsを抽出するための革新的な因果的アプローチを導入する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 01:41:05 GMT)
Learn to Memorize and to Forget: A Continual Learning Perspective of Dynamic SLAM [17.7] 暗黙的な神経表現を伴う同時局所化とマッピング(SLAM)が注目されている。
動的環境のための新しいSLAMフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:35:48 GMT)
How Generalizable Is My Behavior Cloning Policy? A Statistical Approach to Trustworthy Performance Evaluation [17.6] 行動クローニングポリシーは、人間のデモンストレーションから学ぶことで複雑なタスクを解決することに成功している。
本稿では,任意の環境下でのロボット性能について,より低バウンドなフレームワークを提案する。
実験では,シミュレーションとハードウェアの両方におけるビジュモータ操作のポリシーを評価する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:45:25 GMT)
A Framework for Efficient Model Evaluation through Stratification, Sampling, and Estimation [17.4] 本稿では,階層化,サンプリング,推定を含むモデル評価のためのフレームワークを提案する。
モデル性能の正確な予測に基づいて,k平均クラスタリングによる成層化を行うことで,効率的に推定できることを示す。
また、データセットのラベル付けされていない部分におけるモデル精度の予測を利用するモデル支援推定器は、一般的に従来の推定値よりも効率的であることがわかった。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:43:12 GMT)
QestOptPOVM: An iterative algorithm to find optimal measurements for quantum parameter estimation [17.3] 最適正の演算子検定(POVM)を直接同定するアルゴリズム「QestPOVM」を導入する。
量子状態の複数コピー(最大6コピー)の厳密な試行を通じて,提案アルゴリズムの有効性と精度を実証した。
提案アルゴリズムは,最適なPOVMの明示的な形式を解明するためのツールとして機能し,量子パラメータ推定手法の理解を深める。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 03:23:33 GMT)
Analyzing and Bridging the Gap between Maximizing Total Reward and Discounted Reward in Deep Reinforcement Learning [17.2] 深層強化学習では、全報酬を最大化するのではなく、割引報酬の最大化がしばしば用いられる。
我々は,全報酬を最大化する政策に関連して,割引報酬を最大化することで得られる政策の最適度を分析した。
そこで我々は,強化学習アルゴリズムの性能向上を図るため,ある状況下で2つの目的の最適ポリシーを整合させる手法を開発した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:33:10 GMT)
Microservices-based Software Systems Reengineering: State-of-the-Art and Future Directions [17.1] クラウドベースのマイクロサービスアーキテクチャ(MSA)と互換性のあるソフトウェアを設計することは、パフォーマンス、スケーラビリティ、可用性の制限のために不可欠である。
我々は、静的、動的、ハイブリッドなアプローチが検討されているように再デプロイ可能なシステム内のサービスを特定する方法に関する、現在の研究を包括的に調査する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 21:59:05 GMT)
Enhancing Thermal Infrared Tracking with Natural Language Modeling and Coordinate Sequence Generation [16.9] 本研究では,座標情報と時間情報の利用性を高めるNLMTrackという新しいモデルを提案する。
実験により、NLMTrackは複数のベンチマークで最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:53:00 GMT)
HSEmotion Team at the 7th ABAW Challenge: Multi-Task Learning and Compound Facial Expression Recognition [16.9] HSEmotionチームは,第7回ABAW(Affective Behavior Analysis in-the-wild)コンペティションの2つの課題について報告する。
マルチタスク設定で事前学習したフレームレベルの顔特徴抽出器に基づく効率的なパイプラインを提案する。
ニューラルネットワークの軽量アーキテクチャを利用することで、私たちのテクニックのプライバシ意識を確保する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:47:49 GMT)
Improving Out-of-Distribution Generalization of Trajectory Prediction for Autonomous Driving via Polynomial Representations [16.9] 本稿では,2つの大規模動作データセット間でデータセットと予測タスクを均質化するOoDテストプロトコルを提案する。
モデルのサイズ、トレーニングの労力、推論時間を大幅に小さくすることで、IDテストのSotAに近いパフォーマンスに達し、OoDテストの堅牢性を大幅に向上します。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 12:00:32 GMT)
Evaluating the Elementary Multilingual Capabilities of Large Language Models with MultiQ [16.6] 大規模言語モデル(LLM)は、世界中の英語話者の大多数を含むすべての人にサービスを提供する必要がある。
近年の研究では、意図した用途に制限があるにもかかわらず、多くの言語でLSMを促すことが示されている。
我々は、27.4kのテスト質問に答える基本的なオープンエンド質問のための新しい銀標準ベンチマークであるMultiQを紹介する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:31:58 GMT)
Instance Selection for Dynamic Algorithm Configuration with Reinforcement Learning: Improving Generalization [16.5] 動的アルゴリズム構成(DAC)は、多様なインスタンスに対してアルゴリズムのハイパーパラメータを動的に設定するという課題に対処する。
Deep Reinforcement Learning (RL)でトレーニングされたエージェントは、そのような設定を解決するための経路を提供する。
我々は、過剰表現を克服するためにトレーニングインスタンスの代表的なサブセットを選択して、このサブセット上のエージェントを再訓練し、一般化性能を向上させることで、この問題を軽減するための一歩を踏み出した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:44:43 GMT)
Recent Advances of Continual Learning in Computer Vision: An Overview [16.5] 継続的な学習は、異なる時間ステップでやってくる新しい知識を学習し、融合し、蓄積する能力を持つ人間の学習プロセスと似ている。
本稿では,コンピュータビジョンにおける連続学習の最近の進歩を概観する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:27:05 GMT)
FocusDiffuser: Perceiving Local Disparities for Camouflaged Object Detection [16.4] 本研究では,カモフラージュされた物体の検出と解釈を,生成モデルがいかに向上させるかを検討するために,新しい拡散モデルであるFocusDiffuserを提案する。
提案実験により,FocusDiffuserは生成的視点から,カモフラージュされた物体検出の課題に効果的に対処できることを示した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 03:45:12 GMT)
Effective Illicit Account Detection on Large Cryptocurrency MultiGraphs [16.3] 暗号通貨関連の不正行為の増加は、ユーザーにとって大きな損失をもたらした。
現在の検出方法は、主に機能工学に依存しているか、あるいは暗号取引ネットワーク内の複雑な情報を活用するのに不十分である。
本稿では,有意なエッジを持つ有向多重グラフによってモデル化された暗号取引ネットワークにおける不正なアカウントを検出する効果的な方法であるDIAMを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:59:52 GMT)
TrialEnroll: Predicting Clinical Trial Enrollment Success with Deep & Cross Network and Large Language Models [16.0] 本稿では,大規模言語モデル(LLM)を付加した新しいディープ・アンド・クロスネットワークを開発した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 02:50:40 GMT)
TP2O: Creative Text Pair-to-Object Generation using Balance Swap-Sampling [15.9] 本稿では,2つのテキスト埋め込みの要素をランダムに交換することで,新しいオブジェクト画像を生成するスワッピング機構を提案する。
また、新たに生成された画像集合から小さなサブセットを効率的にサンプリングするためのバランススワップ領域も導入する。
私たちの研究結果は、カエルブロッコリーのような人間のアーティストとさえ競合しています。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:57:36 GMT)
Robust ASR Error Correction with Conservative Data Filtering [15.8] 大規模言語モデルに基づく誤り訂正(EC)は,自動音声認識(ASR)システムの性能を向上させる新しい技術である。
本稿では,ECトレーニングデータが満足すべき2つの基本的な基準を提案する。
低品質のECペアを特定し、そのようなケースでは修正を行わないようにモデルを訓練する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:05:49 GMT)
Similarity over Factuality: Are we making progress on multimodal out-of-context misinformation detection? [15.7] アウト・オブ・コンテクスト(OOC)の誤報は、マルチモーダルな事実チェックにおいて重大な課題となる。
証拠に基づくOOC検出の最近の研究は、ますます複雑なアーキテクチャへと向かっている。
画像テキスト対と外部画像とテキストエビデンスとの類似性を評価する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:08:55 GMT)
Large Language Model Enhanced Knowledge Representation Learning: A Survey [15.6] 言語モデルと知識表現学習(KRL)の統合は、人工知能(AI)分野における大きな進歩を示している。
LLMによるKRLの強化に関する研究が増えているにもかかわらず、これらの強化されたモデルのプロセスを分析する徹底的な調査は、顕著に欠落している。
3つの異なるトランスフォーマーアーキテクチャに基づいてこれらのモデルを分類し、様々なKRL下流タスクからの実験データを解析し、それぞれのアプローチの長所と短所を評価することで、この問題に対処する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 02:19:34 GMT)
Teaching Code LLMs to Use Autocompletion Tools in Repository-Level Code Generation [15.5] コード大言語モデル(LLM)は、リポジトリレベルの依存関係に対する認識の欠如により、リポジトリレベルのコード生成の制限に直面します。
ToolGenは、自動補完ツールをコードLLM生成プロセスに統合し、これらの依存関係に対処するアプローチです。
ToolGenは、Trigger InsertionとModel Fine-tuning(Offline)とツール統合コード生成(Online)の2つの主要なフェーズで構成されている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:04:38 GMT)
Enhancing Out-of-Vocabulary Performance of Indian TTS Systems for Practical Applications through Low-Effort Data Strategies [15.3] 低リソース言語用の公開TTSデータセットは一般的に10~20時間のデータを格納し、語彙のカバレッジが低くなる。
いくつかの実世界のアプリケーションからのOOV単語を含むベンチマークを作成する。
このような安価なデータを用いることで、音声品質やドメイン内性能に影響を与えず、OOV語の性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 12:03:14 GMT)
ROLeR: Effective Reward Shaping in Offline Reinforcement Learning for Recommender Systems [14.7] オフライン強化学習(RL)は,実世界のレコメンデーションシステムに有効なツールである。
本稿では,リコメンダシステムのためのオフライン強化学習における報酬と不確実性評価のためのモデルベースReward Shapingを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:07:11 GMT)
TransCAD: A Hierarchical Transformer for CAD Sequence Inference from Point Clouds [14.6] 物理物体の3次元スキャンによりCADモデルを推定する3次元リバースエンジニアリングは、有望な研究方向である。
本稿では,ポイントクラウドからCADシーケンスを予測するエンドツーエンドトランスフォーマーアーキテクチャであるTransCADを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:27:36 GMT)
Fast Registration of Photorealistic Avatars for VR Facial Animation [14.6] 我々は,アバター画像とHMC画像の領域ギャップが,最も困難であることを示す。
提案するシステムでは,ドメイン内の入力を反復的に処理するモジュールと,現在の推定値に条件付きアバター誘導画像-画像間ドメイン転送モジュールの2つに分割する。
本システムでは,オフラインでのオフライン最適化の必要性を排除し,直接回帰法よりも高い品質のオンライン登録を行う。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 22:39:33 GMT)
Beyond Chinchilla-Optimal: Accounting for Inference in Language Model Scaling Laws [14.5] 我々は,所与の品質と予測要求のモデルをトレーニングし,展開するために,最適LLMパラメータ数と事前学習データサイズを計算するために,Chinchillaスケーリング法を変更した。
我々は,パラメータ単位のトークンを極端な範囲にスケールするにつれて,モデルの品質が向上し続けることを確認するために,さまざまなサイズとパラメータ数の47モデルを訓練する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 14:23:29 GMT)
Robots Can Multitask Too: Integrating a Memory Architecture and LLMs for Enhanced Cross-Task Robot Action Generation [13.8] 大規模言語モデル(LLM)は、ロボットの知覚と身体能力による常識推論の基盤となるロボット応用に最近使用されている。
本稿では,タスク間を効果的に切り替える一方で,タスク間動作を生成するためのLLMをメモリプロセスに組み込むことに対処する。
その結果,5つのロボットタスクのベースラインよりも性能が大幅に向上し,ロボットの動作と適応タスク実行の知覚を組み合わせたLLMにメモリを統合する可能性が示された。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:38:21 GMT)
APS-USCT: Ultrasound Computed Tomography on Sparse Data via AI-Physic Synergy [13.8] 超音波CT(USCT)は優れた医用画像再構成技術である。
その利点にもかかわらず、高品質のUSCT再構成は多数のトランスデューサによる広範なデータ取得に依存している。
APS-USCTと呼ばれる,スパースデータによる撮像を容易にする新しいUSCT手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 20:30:41 GMT)
Fundamental Scaling Laws of Covert Communication in the Presence of Block Fading [13.8] 無線通信システムにおいて,信号フェードのようなチャネル障害は,隠蔽通信システムの効果的な実装と解析において課題となる。
本稿では,ブロックフェーディングチャネルで使用した$n$チャネルで隠蔽送信可能なビット数について,その計算結果を考慮し,カバート通信分野における初期処理を一般化する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 20:56:53 GMT)
The Art of Imitation: Learning Long-Horizon Manipulation Tasks from Few Demonstrations [13.7] TP-GMMの適用にはいくつかのオープンな課題がある。
我々はロボットのエンドエフェクター速度を方向と大きさに分解する。
次に、複雑な実証軌道からセグメントとシーケンスのスキルを抽出する。
私たちのアプローチでは,5つのデモから複雑な操作タスクを学習することが可能です。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 12:01:09 GMT)
Enhancing Computation Efficiency in Large Language Models through Weight and Activation Quantization [12.7] 本稿では,Large Language Models(LLMs)における後学習量子化(PTQ)に焦点を当てる。
本稿では,アクティベーション量子化対応スケーリング(AQAS)とシーケンス長対応キャリブレーション(SLAC)の2つの革新的な手法を提案する。
我々の技術はタスクの精度を大幅に向上させ、完全精度モデルに匹敵するレベルまで向上することを示した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 06:35:17 GMT)
PICASSO: A Feed-Forward Framework for Parametric Inference of CAD Sketches via Rendering Self-Supervision [12.6] CADスケッチを描画すると、提案フレームワークはCADソフトウェアにインポート可能なパラメトリックプリミティブに変換する。
PICASSOは、精密または手書きのスケッチ画像からパラメトリックCADスケッチの学習を可能にする。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:02:52 GMT)
A Coarse-to-Fine Place Recognition Approach using Attention-guided Descriptors and Overlap Estimation [12.6] 位置認識のための新しい粗大なアプローチを提案する。
粗い段階では、注意誘導ネットワークを用いて注意誘導記述子を生成する。
次に、素早い親和性に基づく候補選択プロセスを用いて、Top-Kの最も類似した候補を特定する。
細かな段階では、狭められた場所候補同士のペアの重複を推定し、最終一致を決定する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 02:12:57 GMT)
Attention Based Simple Primitives for Open World Compositional Zero-Shot Learning [12.6] 合成ゼロショット学習(CZSL)は属性とオブジェクトペアからなる未知の合成を予測することを目的としている。
この研究では、私たちのテストスペースが属性とオブジェクトの潜在的な組み合わせをすべて包含するオープンワールド構成ゼロショット学習(OW-CZSL)を探求しています。
提案手法では, 属性とオブジェクト間の自己認識機構を利用して, 目に見えるものから見えないものまで, より優れた一般化を実現する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:11:29 GMT)
Prover-Verifier Games improve legibility of LLM outputs [12.5] 小学校数学の問題を解く上での妥当性について検討する。
本稿では,Anil et al の Prover-Verifier Game にヒントを得たトレーニングアルゴリズムを提案する。
本研究は,解の正当性を検証することを目的とした,時間制約のある人間への正当性訓練の伝達を示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:58:18 GMT)
Measuring Stochastic Data Complexity with Boltzmann Influence Functions [12.5] テストポイントにおけるモデルの予測の不確かさを推定することは、分散シフトの下で信頼性とキャリブレーションを確保する重要な要素である。
温度スケールボルツマンの影響関数でモデルを線形化するpNML分布のスケーラブルかつ効率的な近似であるIF-COMPを提案する。
IF-COMPは不確実性の校正、誤ラベル検出、OOD検出のタスクに対して実験により検証され、そこでは強いベースライン法と一貫した一致または打ち負かされる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:16:59 GMT)
FBChain: A Blockchain-based Federated Learning Model with Efficiency and Secure Communication [12.2] 本稿では、上記の2つの問題を克服するフェデレートラーニング(FBChain)モデルを提案する。
まず、ブロックチェーンの不変性を利用して、ローカルモデルパラメータのグローバルモデルとハッシュ値を格納する。
第二に、Proof of Weighted Link Speed (PoWLS)コンセンサスアルゴリズムは、より重み付きリンク速度の高いノードを包括的に選択し、グローバルモデルとパッケージブロックを集約する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:41:28 GMT)
AID-AppEAL: Automatic Image Dataset and Algorithm for Content Appeal Enhancement and Assessment Labeling [12.0] Image Content Appeal Assessment (ICAA) は、画像のコンテンツが視聴者に対して生成する肯定的な関心のレベルを定量化する新しいメトリクスである。
ICAAは、画像の芸術的品質を判断する伝統的な画像美学評価(IAA)とは異なる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 20:51:31 GMT)
Towards Dynamic Feature Acquisition on Medical Time Series by Maximizing Conditional Mutual Information [11.9] 医療やウェアラブルにおいて、どの時系列を計測し、いつ測定するかを知ることが重要な課題だ。
条件付き相互情報から着想を得て,下流損失のみを用いてエンド・ツー・エンドの学習者へのアプローチを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:54:34 GMT)
Baba Is AI: Break the Rules to Beat the Benchmark [11.8] ババ・イズ・ユー(Baba Is You)というゲームに基づく新しいベンチマークを開発し、エージェントが環境とルールの両方を操作し、その上で単語が書かれた可動タイルで表現し、特定のゴールに到達してゲームに勝つ。
我々は、最先端の3つの大規模言語モデル(OpenAI GPT-4o、Google Gemini-1.5-Pro、Gemini-1.5-Flash)を検証し、ゲームのルールを操作・組み合わせなければならない場合、それらが劇的に失敗することを発見した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:30:48 GMT)
Mixture of Experts based Multi-task Supervise Learning from Crowds [11.8] 本稿では,群衆からのマルチタスク指導型学習の新たなパラダイムを提案する。
このパラダイム内では,Mixture of Experts をベースとしたマルチタスク監視学習(Multi-task Supervised Learning from Crowds)と呼ばれる,アイテム機能レベルでの作業行動モデルを提案する。
MMLCには2つの真理推論戦略が提案されている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:21:31 GMT)
Not Just Change the Labels, Learn the Features: Watermarking Deep Neural Networks with Multi-View Data [10.6] DNN内に効率よく透かしを埋め込むため,Multi-view dATa をベースとした新しい透かし手法 MAT を提案する。
提案手法を様々なベンチマークで検証し,モデル抽出攻撃に対する防御効果を示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:10:07 GMT)
Per-Gaussian Embedding-Based Deformation for Deformable 3D Gaussian Splatting [9.9] 3D Gaussian Splatting (3DGS)は、高速で高品質な新規ビュー合成を提供する。
標準的な3DGSを動的シーンを表現するために複数のフレームに変形させる自然な拡張である。
以前の作品は複雑な動的シーンを正確に再構築することができなかった。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:08:29 GMT)
AI-Assisted SQL Authoring at Industry Scale [9.6] SqlComposeは、生成AIを使用してデータ分析タスクを支援するツールである。
これは宣言的であり、形式的なテーブルスキーマを持ち、しばしば非線形で書かれる、という課題に対処する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:33:39 GMT)
An Agile Adaptation Method for Multi-mode Vehicle Communication Networks [9.6] 意思決定プロセスと強化学習を適用して、アジャイル適応機構を確立する。
Q-learningは、アジャイル適応強化学習モデルをトレーニングし、トレーニングされたモデルを出力するために使用される。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:04:34 GMT)
SpaDiT: Diffusion Transformer for Spatial Gene Expression Prediction using scRNA-seq [9.6] SpaDiTは、検出されていない遺伝子の予測のために、scRNA-seqとSTデータを統合したディープラーニング手法である。
本研究では,SpaDiTの有効性を,Seqベースおよび画像ベースSTデータの両方で広範な実験により実証した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:40:50 GMT)
Not All Frequencies Are Created Equal:Towards a Dynamic Fusion of Frequencies in Time-Series Forecasting [9.6] 時系列予測手法は、異なるシナリオに適用する場合、柔軟であるべきです。
本稿では、各フーリエ成分を個別に予測し、異なる周波数の出力を動的に融合する周波数動的融合(FreDF)を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:27:25 GMT)
Higher-order Spatio-temporal Physics-incorporated Graph Neural Network for Multivariate Time Series Imputation [9.5] 欠落値は、複雑な潜時相関と時系列の動的性質のために必須だが難しい問題である。
この問題に対処するために,高次時空間物理を組み込んだグラフニューラルネットワーク(HSPGNN)を提案する。
HSPGNNは従来のデータ駆動型モデルよりも優れた動的解析と説明を提供する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:29:44 GMT)
PriPL-Tree: Accurate Range Query for Arbitrary Distribution under Local Differential Privacy [9.4] 階層木構造と断片線形関数を組み合わせた新しいデータ構造であるPriPL-Treeを紹介する。
PriPL-Treeは、いくつかの行セグメントで基礎となるデータ分散を正確にモデル化し、レンジクエリのより正確な結果をもたらす。
新たなデータ対応アダプティブグリッドを用いた多次元ケースに拡張する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 14:05:35 GMT)
A data-flow oriented software architecture for heterogeneous marine data streams [9.3] 様々な公共団体が過去10年間に海底のデータを収集し、管理し、公開してきた。
システムのエンジニアリングにおけるデータ品質の影響について、明確な理解はありません。
本稿では,海洋データストリームの主設計決定とデータフロー指向コンポーネントとコネクタビューを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:40:19 GMT)
The Language of Infographics: Toward Understanding Conceptual Metaphor Use in Scientific Storytelling [9.3] 我々は概念メタファー(CMT)を可視化領域にマッピングし、科学インフォグラフィックでよく使われる視覚概念メタファーのパターンに対処する。
本分析は, 概念翻訳において, 存在論的, 配向的概念的メタファーが最も広く応用されていることを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:39:50 GMT)
Adaptive Correspondence Scoring for Unsupervised Medical Image Registration [9.3] 既存の手法では、画像再構成を主要な監視信号として用いている。
そこで本研究では,学習中の誤り残差を対応スコアマップで再重み付けする適応フレームワークを提案する。
我々のフレームワークは、量的にも質的にも、他の手法よりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 02:26:42 GMT)
Mask2Map: Vectorized HD Map Construction Using Bird's Eye View Segmentation Masks [9.1] 本稿では,自動運転アプリケーション用に設計された,新しいエンドツーエンドのオンラインHDマップ構築手法であるMask2Mapを紹介する。
このアプローチでは、シーン内のマップインスタンスのクラスと順序付けられたポイントセットを予測することに重点を置いています。
Mask2Mapは、従来の最先端メソッドよりも優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:48:52 GMT)
Improving Conversational Abilities of Quantized Large Language Models via Direct Preference Alignment [8.9] 量子化対応直接選好最適化(QDPO)は、量子化大言語モデル(LLM)の会話能力を改善する
各種言語における2つの命令調整LDMにおいて,QDPOは,既存のPTQや知識蒸留細調整技術と比較して,会話能力の向上に優れた性能を示した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 06:21:23 GMT)
MSPipe: Efficient Temporal GNN Training via Staleness-Aware Pipeline [8.9] メモリベースの時間グラフニューラルネットワーク(MTGNN)は、ノードメモリモジュールを使用して長期の時間依存を捕捉し保持する時間グラフニューラルネットワークのクラスである。
トレーニングパラダイム、モデルアーキテクチャ、メモリモジュールの欠如などにより、既存の静的GNNの最適化はMTGNNに直接適用できない。
モデル精度を維持しながらトレーニングスループットを最大化するMTGNNのための汎用的で効率的なフレームワークであるMSPipeを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:26:40 GMT)
Underwater Acoustic Signal Denoising Algorithms: A Survey of the State-of-the-art [8.9] この分野でかなりの進歩があったにもかかわらず、水中環境の複雑な性質は、デノナイジング過程を複雑にする固有の課題を生んでいる。
まず, 水中音響信号処理に関する基本的な課題について概説し, 信号減衰, ノイズ変動, 環境要因の影響について概説する。
このレビューは、従来の、分解ベース、学習ベースのテクニックなど、さまざまな分類アルゴリズムを体系的に分類し、議論し、それらの応用、利点、限界を強調している。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:14:59 GMT)
EaDeblur-GS: Event assisted 3D Deblur Reconstruction with Gaussian Splatting [8.8] ガウススプラッティング(EaDeblur-GS)を用いたイベント支援3次元デブロア再構成について述べる。
イベントカメラデータを統合して、3DGSの動作のぼかしに対する堅牢性を高める。
高速な3D再構成をリアルタイムで実現し、最先端の手法に匹敵する性能を示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:55:54 GMT)
IDs for AI Systems [8.8] 本稿では,AIシステムのインスタンスにIDを付加するフレームワークを提案する。
我々は、重要なアクターからのIDに対する大きな需要があるかもしれないと論じている。
さらなる研究により、IDはAIシステムが社会に浸透する世界を管理するのに役立つかもしれない。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:54:20 GMT)
Conformalized Link Prediction on Graph Neural Networks [8.8] グラフニューラルネットワーク(GNN)は様々なタスクに優れていますが、高い領域でのその応用は信頼性の低い予測によって妨げられます。
本稿では,GNNに基づくリンク予測の統計的保証を伴う予測区間を構築するために,分布自由かつモデルに依存しない不確実性定量化手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 22:06:38 GMT)
Research on Image Super-Resolution Reconstruction Mechanism based on Convolutional Neural Network [8.7] 超解像アルゴリズムは、同一シーンから撮影された1つ以上の低解像度画像を高解像度画像に変換する。
再構成過程における画像の特徴抽出と非線形マッピング手法は,既存のアルゴリズムでは依然として困難である。
目的は、高解像度の画像から高品質で高解像度の画像を復元することである。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 06:50:39 GMT)
Real-Time 3D Occupancy Prediction via Geometric-Semantic Disentanglement [8.6] 運転予測は自律運転(AD)において重要な役割を担っている
既存の手法はしばしば高い計算コストを発生させるが、これはADのリアルタイム要求と矛盾する。
ハイブリッドBEV-Voxel表現を用いた幾何学的意味的デュアルブランチネットワーク(GSDBN)を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 04:46:13 GMT)
Evaluating Large Language Models for Anxiety and Depression Classification using Counseling and Psychotherapy Transcripts [8.5] トランスモデルの確立と,機能工学によるサポートベクトルマシンの訓練を行った。
従来の機械学習手法と比較して,最先端のモデルでは分類結果の強化に失敗する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:26:09 GMT)
Multi-Objective Neural Architecture Search by Learning Search Space Partitions [8.5] ニューラルアーキテクチャ探索(NAS)タスクにLaMOOと呼ばれる新しいメタアルゴリズムを実装した。
LaMOOは、観測されたサンプルからモデルを学び、検索空間を分割し、将来性のある領域に集中することによって、検索プロセスを高速化する。
現実世界のタスクでは、LaMOOの精度は97.36%、CIFAR10の#Paramsはわずか600のサンプルで1.62万である。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 01:53:35 GMT)
Universal framework for simultaneous tomography of quantum states and SPAM noise [8.4] 本稿では,量子状態と測定ノイズの同時トモグラフィーを行うアルゴリズムを提案する。
本手法は、ユニタリ演算によって誘導される線形作用素空間の特性の解析に基づく。
一般の場合、このゲージ自由度は避けられないが、状態やノイズ特性に関する事前の知識を用いて、この縮退性を破ることができる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:21:53 GMT)
Fermi-Bose Machine achieves both generalization and adversarial robustness [8.2] 意味的に意味のある表現学習を提案し,同じラベルを持つ入力の表現を隠蔽層に縮小し,異なるラベルの表現を退避させる(フェルミオンに限る)。
この階層的な学習は自然界において局所的であり、生物学的に妥当である。
この局所的コントラスト学習をMNISTベンチマークデータセットに適用することにより、標準パーセプトロンの敵的脆弱性を大幅に軽減できることを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 06:55:46 GMT)
Policy Optimization for Personalized Interventions in Behavioral Health [8.1] デジタルプラットフォームを通じて提供される行動的健康介入は、健康結果を大幅に改善する可能性がある。
患者に対するパーソナライズされた介入を最適化して長期的効果を最大化する問題について検討した。
患者システムの状態空間を個別のレベルに分解するDecompPIをダブする新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 14:34:33 GMT)
A Comparative Study on Automatic Coding of Medical Letters with Explainability [7.8] 本研究では,NLP(Natural Language Processing)と機械学習(ML)による医療用文字の自動符号化の実現について検討する。
利用可能なMIMIC-IIIデータベースとHAN/HLANネットワークモデルをICDコード予測のために使用した。
実験では、97.98%のコードに対して有用な情報を提供した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:12:47 GMT)
Barycentric bounds on the error exponents of quantum hypothesis exclusion [7.8] 量子状態排除の最適誤差確率を情報理論の観点から検討する。
我々は分析を、量子チャネル排除のより複雑なタスクにまで拡張する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:27:36 GMT)
LiNR: Model Based Neural Retrieval on GPUs at LinkedIn [7.8] LiNRはLinkedInの大規模GPUベースの検索システムである。
大規模なインデックスに対して,フルスキャンと効率的なフィルタリングを取り入れたシステム拡張について述べる。
我々は、LiNRが業界初のLive-updated model-based search indexの1つであると考えている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:04:33 GMT)
Should we be going MAD? A Look at Multi-Agent Debate Strategies for LLMs [7.7] コスト、時間、正確性の間のトレードオフを探るため、さまざまな議論と戦略をベンチマークします。
マルチエージェントの議論システムは、現在の形式では、他の提案されたプロンプト戦略を確実に上回っているわけではない。
これらの結果に基づいて、エージェント合意レベルの調整など、議論戦略の改善に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:18:14 GMT)
HPPP: Halpern-type Preconditioned Proximal Point Algorithms and Applications to Image Restoration [7.6] Preconditioned Proximal Point (PPP)アルゴリズムは、画像復元におけるメソッド分割のための統一的なフレームワークを提供する。
PPPアルゴリズムは典型的には無限次元収束において退化し、不確実な解をもたらす。
本稿では,Halpern型HPPPアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 02:58:06 GMT)
SWinGS: Sliding Windows for Dynamic 3D Gaussian Splatting [7.6] 我々は動的シーンを再構築するために3次元ガウススプラッティングを拡張した。
我々は、競争力のある定量的性能を持つ一般的な動的シーンの高品質なレンダリングを作成する。
我々の手法は動的インタラクティブなビューアでリアルタイムで見ることができる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:18:51 GMT)
Dynamic Dimension Wrapping (DDW) Algorithm: A Novel Approach for Efficient Cross-Dimensional Search in Dynamic Multidimensional Spaces [7.4] 本研究では,新しい最適化アルゴリズム-動的次元ラッピング(DDW)アルゴリズムを提案する。
DDWは優れた探索効率を示し、実際の最適解に最も近い検索結果を提供する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:41:40 GMT)
Reducing Barriers to the Use of Marginalised Music Genres in AI [7.1] このプロジェクトの目的は、AIモデルで疎外された音楽のジャンルを使用する際の障壁を減らすことに関連する、eXplainable AI(XAI)の課題と機会を探ることである。
特定されたXAIの機会には、AIモデルの透明性とコントロールの改善、AIモデルの倫理とバイアスの説明、バイアスを減らすために小さなデータセットで大規模モデルの微調整、AIモデルによるスタイル移行の機会の説明などが含まれる。
私たちは現在、グローバルなInternational Responsible AI Musicコミュニティをまとめて、私たちのネットワークへの参加を招待するために、このプロジェクトを構築しています。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 12:10:04 GMT)
Beyond Words: On Large Language Models Actionability in Mission-Critical Risk Analysis [7.1] リスク分析の原則はコンテキストレスです。
リスク分析には、国内外の規制や基準に関する膨大な知識が必要である。
大規模な言語モデルは、人間よりも少ない時間で情報を素早く要約することができ、特定のタスクに微調整することができる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:21:10 GMT)
Fusion of Movement and Naive Predictions for Point Forecasting in Univariate Random Walks [6.9] 本研究では, 動作予測(バイナリ分類)を, 正確な1ステップ先進予測のためのナイーブ予測と融合させる新しい手法を提案する。
0.55のような中程度の運動予測精度で、ナイーブ予測を確実に上回る。
この方法は、正確な点予測が難しいが正確な運動予測が可能である場合に特に有利である。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:19:49 GMT)
Transformers Get Stable: An End-to-End Signal Propagation Theory for Language Models [6.8] 我々は,変換器モデルによる前方及び後方信号のモーメントを管理する統一信号伝搬理論を開発し,公式を提供する。
我々のフレームワークは、ハイアテンションスコアに関連する、消失/爆発の勾配、ランク崩壊、不安定性を理解し、緩和するために使用することができる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:59:35 GMT)
Enhancing Training Efficiency Using Packing with Flash Attention [6.7] Hugging Face SFTトレーナーは、最大シーケンス長までの複数のトレーニング例を組み合わせるためにパッキングを使用するオプションを提供する。
私たちは、各例の適切な注意マスクで、パッキングとFlashアテンションを有効化し、分析し、このトレーニングパラダイムの利点を示します。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:09:32 GMT)
DISCOVER: A Data-driven Interactive System for Comprehensive Observation, Visualization, and ExploRation of Human Behaviour [6.7] 我々は,人間行動分析のための計算駆動型データ探索を効率化するために,モジュール型でフレキシブルでユーザフレンドリなソフトウェアフレームワークを導入する。
我々の主な目的は、高度な計算方法論へのアクセスを民主化することであり、これにより研究者は、広範囲の技術的熟練を必要とせずに、詳細な行動分析を行うことができる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:28:52 GMT)
Conformal Performance Range Prediction for Segmentation Output Quality Control [6.5] 提案手法は,ユーザの特定確率に基底真理を含ませることの統計的保証を伴って,性能範囲を予測する新しい手法である。
FIVES網膜血管セグメンテーションデータセットへのアプローチを実証し、5つの一般的なサンプリングベース不確実性推定手法を比較した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:10:25 GMT)
PLANTS: A Novel Problem and Dataset for Summarization of Planning-Like (PL) Tasks [6.4] 我々は,新しい計画要約問題を導入し,データセットを提示し,PL要約を生成するベースライン手法を提供する。
我々は、この新たな問題とデータセットが要約の研究を再活性化できると信じており、これは解決された問題であると考える者もいる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 15:36:02 GMT)
Mapping the Empirical Evidence of the GDPR (In-)Effectiveness: A Systematic Review [6.4] 経験的証拠の質素な体が生成されているが、広く散在し、検討されていない。
そこで我々は,30年近くにわたる実証研究の総合的なレビューと合成を行う。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 21:53:58 GMT)
Long Input Sequence Network for Long Time Series Forecasting [6.0] 短時間の固定長入力は、長い時系列予測タスクにおけるディープラーニング手法の主なボトルネックである。
我々は,新しいシリーズ分解モジュール(MPSD)とマルチトークンパターン認識ニューラルネットワーク(MTPR)を導入する。
トークンのサイズは、モデルがフォーカスするスケールとそれに対応するコンテキストサイズを決定するため、主にモデルの振る舞いを規定する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:43:12 GMT)
Training-Free Model Merging for Multi-target Domain Adaptation [6.0] シーン理解モデルのマルチターゲット領域適応について検討する。
私たちのソリューションはモデルパラメータのマージとモデルバッファのマージという2つのコンポーネントで構成されています。
我々の手法は単純だが有効であり、データ組み合わせトレーニングベースラインと同等の性能を達成できる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:59:57 GMT)
Precision bounds for quantum phase estimation using two-mode squeezed Gaussian states [5.6] 2モードの圧縮真空状態が最適入力であり、対応する精度境界がハイゼンベルク極限よりも2。
我々の研究は、実用的な量子力学への重要な、そして有望なステップを示すかもしれない。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 12:01:19 GMT)
A Comprehensive Review of Recommender Systems: Transitioning from Theory to Practice [5.6] Recommender Systems(RS)は、パーソナライズされたアイテムの提案を提供することで、ユーザーエクスペリエンスを高める上で重要な役割を果たす。
この調査は、2017年から2024年までのRSの進歩を包括的にレビューする。
それは、eコマース、ヘルスケア、金融など、さまざまな分野の課題に対処する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:00:53 GMT)
With or Without Replacement? Improving Confidence in Fourier Imaging [5.5] 標準LASSOの性能を向上した重み付き再構成手法が, サンプリングと交換なしの遷移によってどのようにして実現されるかを示す。
本稿では、この再加重サンプリングのアイデアが、デバイアス推定器をいかに改善するかを説明する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 15:15:19 GMT)
High-Dimensional Confidence Regions in Sparse MRI [5.3] MRIの圧縮センシングのような医療画像の応用では、測定システムは複雑なフーリエ行列で表される。
本研究の目的は,MR画像の各画素に対する信頼区間を構築するために,この手法をMRIケースに拡張することである。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 15:18:02 GMT)
Fixed and Adaptive Simultaneous Machine Translation Strategies Using Adapters [5.3] 機械翻訳は、全入力を消費する前に翻訳を開始することで、リアルタイム翻訳の課題を解決することを目的としている。
wait-$k$ポリシーは、$k$ワードを消費した後、翻訳を開始することでソリューションを提供する。
本稿では,複数のレイテンシレベルを満たす1つのモデルを構築するという課題に対処する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 12:42:45 GMT)
Enhancing Quantum Machine Learning: The Power of Non-Linear Optical Reproducing Kernels [5.3] KerrカーネルはデータをKerrコヒーレント状態の位相と振幅にエンコードする。
本稿では,Kerrコヒーレント状態を用いた特徴空間を提案する。
月から乳がん診断まで,さまざまなデータセットを分析した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:23:22 GMT)
Transformer-based Single-Cell Language Model: A Survey [5.2] 変換器の構造と原理について詳述する。
本稿では,単一セルデータ解析のための単一セル言語モデルと大規模言語モデルについて概説する。
単一セル言語モデルの課題を論じ,将来性のある研究方向性を提供する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 06:43:12 GMT)
EvaluateXAI: A Framework to Evaluate the Reliability and Consistency of Rule-based XAI Techniques for Software Analytics Tasks [5.2] PyExplainerとLIMEは、ソフトウェア分析タスクにおけるMLモデルの予測を説明するために使用されている。
本稿では,これらの手法がMLモデルの信頼性と一貫した説明を生成する能力を評価する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 21:09:28 GMT)
CycleMix: Mixing Source Domains for Domain Generalization in Style-Dependent Data [5.1] 画像分類の場合、アルゴリズムが一般化に失敗する理由の1つは、トレーニングデータに存在する急激な相関に依存することである。
これらの関連性は、目に見えないテストデータには存在せず、その効果が著しく低下する。
本研究では,この領域一般化問題を,画像スタイルに起因する特徴を無視する頑健な特徴抽出器を訓練することにより緩和する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:43:26 GMT)
Dynamic Pricing in Securities Lending Market: Application in Revenue Optimization for an Agent Lender Portfolio [5.0] 証券貸出市場では,既存の文脈的バンディットの枠組みをうまく活用できることが示されている。
我々は、文脈的バンディットアプローチが、生成した総収益の少なくとも15%以上の典型的なアプローチを一貫して上回ることを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:42:37 GMT)
Exploring AI-enhanced Shared Control for an Assistive Robotic Arm [5.0] 特に,アートインテリジェンス(AI)を共有制御パラダイムに統合する方法について検討する。
特に,人間とロボットのインターフェースの簡潔な要件に着目した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 15:25:08 GMT)
New Capability to Look Up an ASL Sign from a Video Example [5.0] ASL符号のビデオの検索を可能にするために,Web上で公開された新しいシステムについて述べる。
ユーザは分析のためにビデオを提出し、最も可能性の高い5つのサインマッチが提示される。
このビデオ検索は、ASLビデオデータの言語アノテーションを容易にするために、最新のSignStreamソフトウェアに統合されています。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 15:14:35 GMT)
LeOCLR: Leveraging Original Images for Contrastive Learning of Visual Representations [4.7] 本稿では,新しいインスタンス識別手法と適応型損失関数を用いた表現学習における意味的特徴の解消を目的としたフレームワークであるLeOCLRを紹介する。
我々のアプローチは、ベースラインモデルと比較して、異なるデータセット間の表現学習を一貫して改善します。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:55:51 GMT)
Deep Functional Factor Models: Forecasting High-Dimensional Functional Time Series via Bayesian Nonparametric Factorization [4.6] ディープ・ファンクショナル・ファクター・モデル (DF2M) は、高次元関数時系列解析のために設計されたベイズ非パラメトリック・モデルである。
DF2Mは、ファクタモデルを構築し、カーネル関数にディープニューラルネットワークを統合することで、ニューラルネットワークを活用するための説明可能なアプローチを提供する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 23:01:50 GMT)
GDDS: A Single Domain Generalized Defect Detection Frame of Open World Scenario using Gather and Distribute Domain-shift Suppression Network [4.6] 我々はGDDS(Gather and Distribute Domain shift Suppression Network)を提案する。
ベースラインネットワークとしてワンステージネットワークを使用すると、検出精度と速度のバランスをとる。
GDDSは、オープンワールドシナリオにおける欠陥検出に、他の最先端の方法よりも速く、より良く適応することができる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:40:43 GMT)
MLSA4Rec: Mamba Combined with Low-Rank Decomposed Self-Attention for Sequential Recommendation [4.6] 本稿では,新しいハイブリッドレコメンデーションフレームワークであるMambaとLow-Rank Self-Attention for Sequential Recommendation (MLSA4Rec)を提案する。
MLSA4Recは、MambaとLSAモジュールによって洗練されたユーザの好み情報を組み合わせて、ユーザの次のインタラクションを正確に予測する。
実験結果から,MLSA4Recは実世界の3つのデータセットの推薦精度において,既存の自己注意モデルとMambaベースのシーケンシャルレコメンデーションモデルよりも優れていた。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 03:46:21 GMT)
CoDefeater: Using LLMs To Find Defeaters in Assurance Cases [4.4] 本稿では,大言語モデル (LLM) を利用して敗者を見つける自動化プロセスであるCoDefeaterを提案する。
2つのシステムの最初の結果は、LLMが安全アナリストを支援するために、既知の、予期せぬ破壊者を効率的に見つけることができることを示している。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:16:35 GMT)
Geometry and Local Recovery of Global Minima of Two-layer Neural Networks at Overparameterization [4.4] 大域ミニマ付近の2層ニューラルネットワークにおける損失景観の幾何学について検討する。
一般化誤差ゼロの大域的ミニマが、サンプルサイズが大きくなるにつれて、他の大域的ミニマと幾何的に分離されるかを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 01:09:59 GMT)
Discussion: Effective and Interpretable Outcome Prediction by Training Sparse Mixtures of Linear Experts [4.2] 我々は,ゲートと専門家のサブネットの両方がロジスティック回帰器である,スパースミクチャー・オブ・エキスパートを訓練することを提案する。
このアンサンブルのようなモデルは、各サブネット内の入力機能のサブセットを自動的に選択しながら、エンドツーエンドで訓練される。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:59:10 GMT)
COMCAT: Leveraging Human Judgment to Improve Automatic Documentation and Summarization [4.1] COMCATは、専門知識のあるコンテキストで大規模言語モデルを拡張することで、コメント生成を自動化するアプローチである。
C/C++ファイルにコメントを付けるためのCOMCATパイプラインを開発し、(1)コメントを配置する適切な場所を自動的に識別し、(2)各場所について最も有用なタイプのコメントを予測し、(3)選択した場所とコメントタイプに基づいてコメントを生成する。
被験者の87%に対して,COMCATが生成したコメントは,3つの指示的ソフトウェアエンジニアリングタスクにおける開発者のコード理解を最大12%向上させることを示した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:26:31 GMT)
Mean Teacher based SSL Framework for Indoor Localization Using Wi-Fi RSSI Fingerprinting [4.1] Wi-Fiフィンガープリントは、Wi-Fiデバイスの普及により、屋内のローカライズに広く応用されている。
従来の手法はスケーラビリティの問題のため、マルチビルドやマルチフロア環境には適していない。
本稿では,無線アクセスポイント選択,ノイズ注入,平均教師モデルに基づくニューラルネットワークのための新しい半教師付き学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:07:20 GMT)
SpeciaLex: A Benchmark for In-Context Specialized Lexicon Learning [4.1] SpeciaLexは、特殊レキシコンベースの制約に従う言語モデルの能力を評価するためのベンチマークである。
オープンおよびクローズドソース LLM の実証評価を行った。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:56:02 GMT)
Network Traffic Analysis of Medical Devices [4.1] 本研究では,医療機器8台の交通特性を,デバイスレベルでも,デバイスの個々の機能レベルでも詳細に分析する。
分析には、プロトコル、入出力トラフィックの量、DNSクエリ、トラフィック宛先の分析など、さまざまなメトリクスが含まれている。
医療機器用のネットワークツールの開発に有用な,ユニークなネットワーク特性とBluetoothトラヒック特性が得られた。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:57:13 GMT)
From A-to-Z Review of Clustering Validation Indices [4.1] 我々は、最も一般的なクラスタリングアルゴリズムを用いて、内部および外部クラスタリング検証指標の性能をレビューし、評価する。
内部クラスタリング検証と外部クラスタリング検証の両方の機能を調べるための分類フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:52:02 GMT)
Automated and Holistic Co-design of Neural Networks and ASICs for Enabling In-Pixel Intelligence [4.1] 放射能検出のための可読ASICなどの極端エッジAIシステムは、厳密なハードウェア制約の下で動作しなければならない。
理想的なソリューションを見つけることは、爆発的に拡張されたデザイン空間から最適なAIとASIC設計の選択を特定することを意味する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:58:05 GMT)
Optimistic Q-learning for average reward and episodic reinforcement learning [4.0] 平均報酬強化学習における後悔最小化のための楽観的なQ-ラーニングアルゴリズムを提案する。
我々の設定は、エピソジックな設定を厳密に一般化し、有界打撃時間の仮定よりも著しく制限的でない。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:49:09 GMT)
Latent Causal Probing: A Formal Perspective on Probing with Causal Models of Data [4.0] 構造因果モデル(SCM)を用いた探索の形式的視点を開発する。
我々は,合成グリッドワールドナビゲーションタスクの文脈において,最近のLMの研究を拡張した。
本手法は,LMがテキストの根底にある因果的概念を学習できることを示す,堅牢な実証的証拠を提供する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:59:27 GMT)
CoxSE: Exploring the Potential of Self-Explaining Neural Networks with Cox Proportional Hazards Model for Survival Analysis [4.0] 生存分析のための自己説明型ニューラルネットワーク(SENN)の可能性を探る。
我々は,局所線形対数ハザード関数を推定することにより,局所的に説明可能なCox比例ハザードモデル(CoxSE)を提案する。
また,生成した説明の安定性と一貫性を制御できるSENN(CoxSENAM)を併用したニューラル加算モデル(NAM)の修正も提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:32:54 GMT)
Search Engines, LLMs or Both? Evaluating Information Seeking Strategies for Answering Health Questions [3.9] 我々は,異なるWeb検索エンジン,LLM(Large Language Models)およびRAG(Research-augmented)アプローチを比較した。
健康問題に対処する可能性のあるウェブページの品質は、ランキングを下方へ下るにつれて低下しない。
評価の結果, Web エンジンは健康問題に対する正しい回答を見つける上で LLM よりも精度が低いことがわかった。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:11:09 GMT)
Hierarchical Stage-Wise Training of Linked Deep Neural Networks for Multi-Building and Multi-Floor Indoor Localization Based on Wi-Fi RSSI Fingerprinting [3.9] 本稿では,ニューラルネットワークを用いた大規模マルチビルディングとマルチフロア屋内ローカライゼーションの課題に対する新しい解を提案する。
階層的なステージワイドトレーニングフレームワークは、もともとのステージワイドトレーニングフレームワークを、複数のリンクネットワークの場合に拡張する。
提案したトレーニングフレームワークは、3次元の局所化誤差を11.78mから8.71mに著しく低減することができる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:43:26 GMT)
Graph Expansions of Deep Neural Networks and their Universal Scaling Limits [3.8] ニューラルネットワークのスケーリング限界を得るための統一的なアプローチを提案する。
ランダム行列理論の属拡大手法を用いる。
我々はジャコビアンの極限特異値分布のモーメントの公式を求める。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:33:35 GMT)
Learning-From-Mistakes Prompting for Indigenous Language Translation [3.8] 本稿では,低リソースの母国語翻訳を改善する手法を提案する。
我々のアプローチは、限られた数の並列翻訳例からなるデータストアの使用に基礎を置いています。
我々は、LLMをユニバーサルトランスレータとして使用するような設定において、LLMと文脈内学習技術のポテンシャルを利用する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:41:20 GMT)
General Vision Encoder Features as Guidance in Medical Image Registration [3.8] 医用画像登録における異種度指標において,一般的な視覚エンコーダの特徴がどの程度有効かを検討する。
心血管MRIデータに関する広範な実験では、従来の指標の付加的なガイダンスとして機能を使用することで、登録品質が向上することが判明した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:13:34 GMT)
Blood Glucose Control Via Pre-trained Counterfactual Invertible Neural Networks [3.7] 対実的可逆ニューラルネットワーク(CINN)に基づくイントロスペクティブ強化学習(RL)を提案する。
事前学習したCINNをRLエージェントのフリーズイントロスペクティブブロックとして使用し、フォワード予測と反ファクト推論を統合してポリシー更新を誘導する。
本稿では,BG予測における事前学習CINNの精度と一般化能力を実験的に検証した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 06:54:04 GMT)
Cross-Task Attack: A Self-Supervision Generative Framework Based on Attention Shift [3.6] 自己教師型クロスタスクアタックフレームワーク(CTA)を提案する。
CTAは、サンプルの注意領域をコアテンションマップから、アンチアテンションマップに近づけることで、クロスタスク摂動を生成する。
本研究では,複数の視覚課題に対する広範囲な実験を行い,提案手法の有効性を検証した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:01:10 GMT)
Quantum Key Distribution Routing Protocol in Quantum Networks: Overview and Challenges [3.5] 本稿では,量子鍵分布の文脈で確立されたルーティング設計手法を活用する可能性について検討する。
これらの手法の実装は、量子メモリのデコヒーレンス、キーレート生成、遅延遅延、量子システム固有のノイズ、限られた通信範囲、高度に専門化されたハードウェアの必要性など、重大な課題を提起する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 04:46:32 GMT)
Fast Scrambling at the Boundary [3.4] カオス上の量子境界を飽和させる多体系は、幅広い分野の関心を集めている。
非Fermi-Liquid物理を示す量子不純物モデルにおける多体量子カオスについて検討する。
この結果は, 境界における強い相関関係と量子カオスの分数化により, 最大カオスとなる非秩序モデルという2つの新しい特徴を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 15:55:44 GMT)
Werewolf Arena: A Case Study in LLM Evaluation via Social Deduction [3.4] Werewolf Arenaは大規模言語モデル(LLM)を評価するためのフレームワークである
ウェアウルフ・アリーナでは、LSMは互いに競い合っており、ゲームにおける詐欺、妄想、説得の複雑なダイナミクスをナビゲートしている。
Werewolf Arenaの実用性をGeminiとGPTモデルを備えたアリーナスタイルのトーナメントで実証する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 23:41:05 GMT)
A review of handcrafted and deep radiomics in neurological diseases: transitioning from oncology to clinical neuroimaging [2.7] ラジオミクス(Radiomics)は、画像データから定量的な情報を抽出する手法である。
本稿では,臨床から見た放射線パイプラインについて概説する。
神経画像診断における手技と深部放射線の応用について論じる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:12:07 GMT)
Crafting Efficient Fine-Tuning Strategies for Large Language Models [2.6] 200サンプル未満の細調整された大型言語モデル(LLM)は、製品属性抽出タスクにおいて、モデル精度を70%から88%に向上させることができる。
トレーニング時間全体の20%のモデルを評価するベイズハイパーパラメータ最適化法は,最終的なモデル性能と強く相関する。
このアプローチにより、独立したテストセットで評価すると、ベースラインモデルよりも精度が2%向上した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 21:36:00 GMT)
Data Alchemy: Mitigating Cross-Site Model Variability Through Test Time Data Calibration [2.6] Data Alchemyは、テンプレート学習フレームワークによるテスト時間データキャリブレーションと組み合わせて、説明可能な染色正規化手法である。
我々のフレームワークは、最小限の運用オーバーヘッドで精密医療を普及させることができる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:03:59 GMT)
Multi-stage tomography based on eigenanalysis for high-dimensional dense unitary quantum processes [2.6] 量子プロセストモグラフィー (Quantum Process Tomography, QPT) は、量子過程を推定する手法である。
我々は、孤立系に対応する一元的、おそらく密度の高いプロセス(すなわち、疎性制約のないプロセス)を考える。
まず, 2段階法を提案し, 検討された状態空間次元とともに段数が増加する2段階法に拡張する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 14:18:23 GMT)
Case-based reasoning approach for diagnostic screening of children with developmental delays [2.5] 年間7500件(発生遅延が疑われる)の疑わしい症例が中国安芸省白兵衛で発生していると推定されている。
発達遅滞児の介入の最適期間は6歳未満であることが国際研究で示されている。
本研究では,CNN-Transformerモデルとケースベース推論(CBR)を組み合わせたハイブリッドモデルを用いて,発達遅滞児のスクリーニング効率を向上させる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 04:28:52 GMT)
CCSRP: Robust Pruning of Spiking Neural Networks through Cooperative Coevolution [2.5] スパイキングニューラルネットワーク(SNN)は、様々な動的視覚タスクにおいて有望であることを示しているが、現実的なデプロイメントの準備が整ったものは、リソース制限と安全クリティカルな設定に不可欠なコンパクト性と堅牢性を欠いていることが多い。
我々は,協調的共進化を基盤としたSNNの革新的な頑健な刈り取り法であるCSRPを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 04:28:16 GMT)
Sortability of Time Series Data [2.5] 自己相関型定常時系列のデータセットにおいても、変数可能性などのデータセットの特定の特性が生じることを示す。
最も驚くべき発見は、調査対象の現実世界のデータセットが高いバラエティと低いR2$ソータビリティを示していることです。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:15:39 GMT)
Using LLMs to Automate Threat Intelligence Analysis Workflows in Security Operation Centers [2.5] このプロジェクトの目的は、CTIレポートの分析に関わる労働集約的な反復的なタスクを置き換えるAIエージェントの開発である。
LLM(例えばGPT-4)の革命的能力を利用するが、人間の介入は不要である。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 01:42:42 GMT)
QuIIL at T3 challenge: Towards Automation in Life-Saving Intervention Procedures from First-Person View [2.4] そこで我々は,Trauma THOMPSON (T3) Challengeにおける省力化介入手順における,多種多様な自動化タスクに対する解決策を提案する。
動作認識と予測のために,複数の入力を1つの画像にサンプリング・縫合する前処理戦略を提案する。
トレーニングのために,アクション辞書誘導型設計を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 06:55:26 GMT)
Exploring the Evidence-Based Beliefs and Behaviors of LLM-Based Programming Assistants [2.3] 本研究では,大規模言語モデル(LLM)がソフトウェア開発タスクを支援するために使用する信念と行動について検討する。
以上の結果から,LCMをベースとしたプログラミングアシスタントは,研究のクレームに関する曖昧な信念を持ち,回答を裏付ける信頼性のある証拠が欠如しており,実証的なSE研究による開発作業支援の実践は不可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 21:06:39 GMT)
Long-Term 3D Point Tracking By Cost Volume Fusion [2.3] テストタイムの微調整を必要とせず,新たなポイントやビデオに一般化する3Dの長期追跡のための,最初のディープラーニングフレームワークを提案する。
モデルでは,複数過去の外観と動き情報をトランスフォーマーアーキテクチャで統合し,全体的なトラッキング性能を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:34:47 GMT)
SecureVAX: A Blockchain-Enabled Secure Vaccine Passport System [2.3] ワクチンのパスポートは、パンデミックの間歩き回っている間、パスポート保有者により大きな自由を提供するドキュメンタリーの証拠として機能する。
デジタルワクチンパスポートシステムで直面する主な課題は、パスポート偽造、不正なデータアクセス、ワクチンセンターが入力した不正確な情報である。
我々のソリューションは、オフチェーンとオンチェーンの暗号計算を統合し、さまざまなエンティティ間のセキュアな通信を容易にする。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:45:43 GMT)
PetFace: A Large-Scale Dataset and Benchmark for Animal Identification [2.3] 動物顔識別のための包括的リソースであるPetFaceデータセットを紹介する。
PetFaceには、13の動物科の257,484個体と、実験動物とペット動物の両方を含む319種の品種が含まれている。
我々は、見知らぬ個人に対する再識別や、見つからない個人に対する検証を含むベンチマークを提供する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 14:28:31 GMT)
Shaded Route Planning Using Active Segmentation and Identification of Satellite Images [2.2] 脆弱なグループ、特に日光を浴びた歩道の歩行者やサイクリストは、ルート計画手法の開発を動機付けている。
本稿では,衛星画像から日陰領域を抽出するセグメンテーション基礎モデルを用いたパイプラインを初めて導入する。
これらのエリアは多層道路マップに統合され、ユーザーは距離と日陰の露出のバランスに基づいてルートをカスタマイズできる。
このシステムは、すでにオンラインで実装されており、デモビデオが公開されている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:57:11 GMT)
Training Foundation Models as Data Compression: On Information, Model Weights and Copyright Law [2.2] 本稿では,モデルの重みがトレーニングデータの圧縮表現を具現化する,トレーニング・アズ・圧縮の視点を紹介する。
本稿では,基礎モデルによるアウトプットの著作権侵害から生じる技術的・法的課題について考察する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:23:16 GMT)
Data-Driven Estimation of Conditional Expectations, Application to Optimal Stopping and Reinforcement Learning [2.2] 所望の条件予測を直接推定する,単純で純粋にデータ駆動の手法を提案する。
条件付き予測は、対応する最適解を用いた多くの最適化問題の記述に現れるため、データ駆動方式も適用範囲を広げる。
強化学習における最適停止・最適行動政策に適用して方法論を検証した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:57:30 GMT)
The Files are in the Computer: On Copyright, Memorization, and Generative AI [2.1] ニューヨーク・タイムズのOpenAIとマイクロソフトに対する著作権訴訟は、OpenAIのGPTモデルがNYTの記事を「記憶している」と主張している。
これらの議論は「記憶」の性質に関する曖昧さによって曇っている。
我々は、記憶の正確な定義を提供するために、技術的な文献を描きます。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 22:41:58 GMT)
How to quantify an examination? Evidence from physics examinations via complex networks [1.9] 試験のナレッジポイントネットワーク(KPN)は、ナレッジポイント(概念、法律等)をノードとして表現し、これらのポイントが同じ質問に現れるとリンクを追加することにより構成される。
構築されたKPNは、ほとんどの場合、強いアソシティと小さな世界効果を示すスケールフリーネットワークであることが判明した。
KPN内のコミュニティは明らかであり、キーノードは主に力学と電磁磁気に関係している。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:06:18 GMT)
Predicting Star Scientists in the Field of Artificial Intelligence: A Machine Learning Approach [1.8] 本研究では、機械学習技術を用いて、人工知能の分野におけるスター科学者の予測モデルを提案する。
上昇する星は、ほとんど全ての初期の特徴において、降着しない恒星と比べて異なるパターンを辿っていることがわかりました。
ジェンダーと民族の多様性は科学的コラボレーションにおいて重要な役割を担い、著者のキャリアの発展と成功に大きな影響を与える。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:50:18 GMT)
No More Sliding-Windows: Dynamic Functional Connectivity Based On Random Convolutions Without Learning [1.8] 本稿では,動的機能接続(DFC)の計算手法であるRandConを提案する。
RandConは、学習することなくBOLD信号上で直接畳み込み操作を行い、機能的な接続機能を抽出する。
実データから、この手法は、短時間のウィンドウ内で安定性を維持し、男女差をよりよく識別することを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 15:32:16 GMT)
Quantum Local Search for Traveling Salesman Problem with Path-Slicing Strategy [1.8] 我々は,トラベリングセールスマン問題(TSP)の解を最適化するために,量子局所探索と統合された新しいパススライシング戦略を提案する。
我々は、TSPを管理可能なサブプロブレムに分割するために、k平均とアンチk平均クラスタリングを含む様々なパススライシング手法を探索する。
これらは量子や古典的な解法を用いて解かれる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 15:55:01 GMT)
Zero and Finite Temperature Quantum Simulations Powered by Quantum Magic [1.6] 短期量子デバイス上での多体ハミルトニアンのキャラクタリゼーションを改善するために,量子情報理論に着想を得た手法を提案する。
本稿では,デジタルおよびアナログ量子ハードウェア上でのゼロおよび有限温度自由エネルギー計算において,本プロトコルが大幅な性能向上をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 14:11:22 GMT)
DuoFormer: Leveraging Hierarchical Visual Representations by Local and Global Attention [1.6] 本稿では、畳み込みニューラルネットワーク(CNN)の特徴抽出機能と視覚変換器(ViT)の高度な表現可能性とを包括的に統合した新しい階層型トランスフォーマーモデルを提案する。
インダクティブバイアスの欠如と、ViTの広範囲なトレーニングデータセットへの依存に対処するため、我々のモデルはCNNバックボーンを使用して階層的な視覚表現を生成する。
これらの表現は、革新的なパッチトークン化を通じてトランスフォーマー入力に適合する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 22:15:35 GMT)
LADDER: Revisiting the Cosmic Distance Ladder with Deep Learning Approaches and Exploring its Applications [1.4] LADDERはパンテオンIa型超新星の観測データに基づいて訓練されている。
宇宙論的な文脈における我々の手法の応用を実証し、一貫性チェックのためのモデルに依存しないツールとして機能する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 15:31:24 GMT)
Autonomous Navigation of Unmanned Vehicle Through Deep Reinforcement Learning [1.4] 本稿では,アッカーマンロボットのモデルとDDPGアルゴリズムの構造と応用について詳述する。
その結果、DDPGアルゴリズムは経路計画タスクにおいて従来のディープQネットワーク(DQN)およびダブルディープQネットワーク(DDQN)アルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:18:59 GMT)
Can LLMs Patch Security Issues? [1.3] LLM(Large Language Models)は、コード生成に優れた習熟度を示している。
LLMは人間と弱点を共有している。
我々は、LLMが生成した脆弱性のあるコードを自動的に洗練するフィードバック駆動セキュリティパッチング(FDSP)を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:42:57 GMT)
Intelligo ut Confido: Understanding, Trust and User Experience in Verifiable Receipt-Free E-Voting (long version) [1.3] 本研究は,電子投票プロトコルSeleneにおけるレシートフリー化に関する有権者の経験を評価することを目的とした300人の参加者を対象にした調査である。
実験では, ユーザビリティと信頼要因が低かったが, 信頼と理解の間に正の相関が認められた。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:49:39 GMT)
Empirical Analysis of Sri Lankan Mobile Health Ecosystem: A Precursor to an Effective Stakeholder Engagement [1.3] Sri Lankaは最近、健康を含む幅広い分野をカバーする最初のプライバシー法を成立させた。
テスト対象システムの78%には、消費者に最小限の可視性を持つ機密性の高い健康データを受け取るサードパーティドメインがある。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:38:25 GMT)
Experimental Sample-Efficient and Device-Independent GHZ State Certification [1.2] 量子資源の認証は、量子情報処理の開発において重要なツールである。
4ビットGHZ状態の単一コピーを効率よく,デバイスに依存しない認証を行う。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 14:01:42 GMT)
Optimal Mechanisms for Quantum Local Differential Privacy [1.1] 本稿では、量子局所微分プライバシー(QLDP)と呼ばれるフレームワークを紹介する。
QLDPはパラメータ$epsilon$を使用して、プライバシリークを管理し、個々の量子状態のプライバシを保証する。
量子ノイズの導入は、古典的なシナリオと同様のプライバシー保護を提供する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:46:16 GMT)
Cracking the neural code for word recognition in convolutional neural networks [1.1] 学習スクリプトにおける単語認識のために,単位の小さなサブセットがどのように特殊化されるかを示す。
これらのユニットは、単語の左または右の空白空間からの距離や特定の文字の識別に敏感であることを示す。
提案したニューラルネットワークは,文字の同一性や位置に関する情報を抽出し,不変な単語認識を可能にするメカニズム的な知見を提供する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:32:50 GMT)
Real-time Dynamics of the Schwinger Model as an Open Quantum System with Neural Density Operators [1.1] この研究は、ニューラルネットワークのパラメータによる正確な量子状態の近似の難しさを克服する機械学習アルゴリズムを開発する。
QCDのような理論における原理実証の証明として、1+1d格子シュウィンガーモデルにおけるリンドブラッド・マスター方程式を開量子系として解く方法が応用される。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:30:28 GMT)
A Master-Follower Teleoperation System for Robotic Catheterization: Design, Characterization, and Tracking Control [1.0] 本稿では,ロボットカテーテル化のための3自由度マスターフォロワ遠隔操作システムの設計と開発について述べる。
臨床医の手による介入と似ており、手術中にカテーテル座屈やねじれを除去するグリップインサート放出機構を備えている。
システムの性能は、典型的な円形、無限大のような、スパイラルな経路上での接近経路と開ループ経路の追跡によって評価される。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:06:48 GMT)
A Survey on Differential Privacy for SpatioTemporal Data in Transportation Research [1.0] 交通機関では、時空間データ収集が急増している。
このようなデータにおける微分プライバシーの最近の発展は、応用プライバシーの研究につながっている。
個人情報を公開することなく、研究や推論におけるこのようなデータの必要性に対処するために、重要な研究が提案されている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 03:19:29 GMT)
Personal Data Transfers to Non-EEA Domains: A Tool for Citizens and An Analysis on Italian Public Administration Websites [0.9] 我々は、20000以上のイタリア公共行政機関(PA)から第三者への個人データ転送を分析する。
データ転送の上位3つの目的地はAmazon、Google、Fonticonsで、悪いリクエストの70%を占めている。
技術政策に関して、これらの結果はPAデジタルインフラを改善するための更なるインセンティブの必要性を強調している。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 12:41:44 GMT)
LGDE: Local Graph-based Dictionary Expansion [0.9] ローカルグラフベース辞書拡張(英: Local Graph-based Dictionary Expansion、LGDE)は、単語の意味的近傍をデータ駆動で発見する手法である。
本稿では,LGDEが単語の類似性に基づくしきい値法よりもはるかに優れた性能で,キーワードのリストを充実させることを示す。
実験結果と専門ユーザ評価の結果から,LGDEは,多様体学習に基づく類似性ネットワークにより,より有用なキーワードでシード辞書を拡張していることが示唆された。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 06:11:41 GMT)
Discovering governing equation in structural dynamics from acceleration-only measurements [0.9] 本稿では,加速度のみの測定から力学系の支配方程式を発見するための新しい方程式探索アルゴリズムを提案する。
提案アルゴリズムは、方程式探索のためのライブラリベースのアプローチを採用し、擬似モデルを優先順位付けする。
提案アルゴリズムの有効性を,線形力学系と非線形力学系の両方を含む4つの構造力学の例を用いて示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:04:14 GMT)
Comprehensive Performance Evaluation of YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments [0.9] 本研究は, 商業用果樹園における果肉検出のためのYOLOv8, YOLOv9, YOLOv10オブジェクト検出アルゴリズムのすべての構成の性能評価を行った。
YOLOv9 は mAP@50 で YOLOv10 と YOLOv8 を上回り、YOLOv10x は 精度とリコールでテストされた 17 の構成で YOLOv10x を上回ります。
YOLOv8nはテストされた全ての構成の中で最も高い推論速度を示し、処理時間は4.1ミリ秒に達した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 01:58:57 GMT)
Time Synchronization of TESLA-enabled GNSS Receivers [0.9] 遅延可能な敵の下で,各アルゴリズムのセキュリティの証明を行う。
本稿では,認証ケイデンスが異なる2つのTESLAインスタンスを同時に使用する認証方式の意義について論じる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:48:49 GMT)
Compressed models are NOT miniature versions of large models [0.9] 4つのモデル特性を用いて,圧縮モデルと対応する大きなニューラルモデルを比較した。
全ての4つのモデル特性において、圧縮されたモデルはBERT大モデルと大きく異なる。
大きなニューラルモデルを置き換えるために圧縮モデルを使用することによる大きな副作用がある。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:28:50 GMT)
Open-World Visual Reasoning by a Neuro-Symbolic Program of Zero-Shot Symbols [0.8] この研究は、画像中の物体の空間的構成を見つけるために、ニューロシンボリックプログラミング(推論)と言語ビジョンモデル(学習)を組み合わせた最初のものである。
床に捨てられた道具を見つけ, パイプを漏らすことにより, 有効性を示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:40:22 GMT)
Lessons from a human-in-the-loop machine learning approach for identifying vacant, abandoned, and deteriorated properties in Savannah, Georgia [0.8] VADecideと呼ばれるHuman-in-the-loop Machine Learning(HITLML)モデルを作成し、ジョージア州サバンナのパーセルレベルのケーススタディに適用する。
その結果,人間の入力を伴わない機械学習モデルを用いた場合よりも,予測精度が高いことがわかった。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:31:57 GMT)
EarlyMalDetect: A Novel Approach for Early Windows Malware Detection Based on Sequences of API Calls [0.7] API呼び出しのシーケンスに基づく早期Windowsマルウェア検出のための新しいアプローチであるEarlyMalDetectを提案する。
EarlyMalDetectは、マルウェアプログラムがターゲットシステムで実行される前に予測し、公開することができる。
大規模な実験により,本手法はマルウェアの挙動を予測するのに極めて有効であることが示された。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:54:33 GMT)
Evaluating the performance-deviation of itemKNN in RecBole and LensKit [0.7] 本研究では、RecBoleおよびLensKitレコメンダシステムライブラリにおけるアイテムベースk-Nearest Neighbors(ItemKNN)アルゴリズムの性能について検討する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 14:04:36 GMT)
LSD3K: A Benchmark for Smoke Removal from Laparoscopic Surgery Images [0.7] 腹腔鏡下手術で手術器具が生み出す煙は視野を曖昧にし、外科医が正確に安全に手術を行う能力を損なう。
近年、腹腔鏡画像の喫煙が研究者の注目を集めているが、このタスクの開発を妨害する主要なボトルネックは、公開可能な高品質なベンチマークデータセットの欠如である。
我々は, 3000対の合成非均一煙像からなる, LSD3Kと呼ばれる腹腔鏡下手術画像デスモーキングのための新しい高品質データセットを構築した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 03:42:16 GMT)
Non-Contact Breath Rate Classification Using SVM Model and mmWave Radar Sensor Data [0.7] 提案システムは、呼吸速度に依存するFMCWレーダを用いて、非接触でデータを収集する。
様々なサポートベクターマシンカーネルを使用して、観測されたデータを正常な状態と異常な状態に分類する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:08:47 GMT)
Mixed-Curvature Decision Trees and Random Forests [0.7] 決定木とランダムフォレストアルゴリズムを積空間多様体に拡張する。
本手法は積多様体の分類と回帰のための単純で表現力豊かな方法を実現する。
実装と実験のコードはhttps://github.com/pchlenski/embedders.comで公開されている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 14:11:39 GMT)
Attention Overflow: Language Model Input Blur during Long-Context Missing Items Recommendation [0.7] 大きな言語モデル(LLM)は、プロンプトにリストされた項目から欠落した要素を提案できる。
しかし、そのパフォーマンスは、入力リストにすでに含まれているアイテムを提案し始めたため、あまりにも多くのアイテムを提示すると劣化する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:00:30 GMT)
Which objects help me to act effectively? Reasoning about physically-grounded affordances [0.6] この理解の重要な側面は、オブジェクトの余裕を検出することである。
提案手法は,大規模言語モデル (LLM) と視覚言語モデル (VLM) の対話を利用して,オープンワールドのアベイランス検出を実現する。
我々のシステムを物理的世界に接地することで、ロボットの体現と、遭遇する物体の本質的な性質を説明できる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:08:57 GMT)
End-To-End Clinical Trial Matching with Large Language Models [0.6] 大言語モデル(LLM)を用いた臨床試験のためのエンドツーエンドパイプラインを提案する。
本研究は,93.3%の症例において関連する候補試験を同定し,88.0%の予備的精度を達成している。
私たちの完全なエンドツーエンドパイプラインは、自律的または人間の監督の下で運用することができ、オンコロジーに限定されません。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 12:36:26 GMT)
RISC-V RVV efficiency for ANN algorithms [0.6] 本研究では、一般的なANNアルゴリズムにRVVを適用することの有効性について検討する。
アルゴリズムはRISC-Vに適応し、主要なボトルネックを特定した後、RVVを使用して最適化された。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:26:07 GMT)
Emergence of Sound in a Tunable Fermi Fluid [0.6] 本研究では, 相互作用するフェルミガスの輸送特性について, 周期的外乱に対する密度応答の測定により検討した。
音の出現を観測し,実験結果がFLの第一原理輸送方程式で定量的に理解されていることを確認する。
本研究は、このシステムをランドウのFL理論を研究するためのクリーンなプラットフォームとして確立し、よりエキゾチックな条件に拡張する方法を舗装する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:59:52 GMT)
Detecting out-of-distribution text using topological features of transformer-based language models [0.6] 本稿では,トランスフォーマーに基づく言語モデルからの自己注意マップのトポロジ的特徴を利用して,入力テキストの分布外の検出を行う。
BERT に対する我々のアプローチを評価し,従来の OOD アプローチと比較した。
以上の結果から,本手法はCLS埋め込みよりも優れており,ドメイン内分布サンプルとドメイン外分布サンプルを区別するが,ほぼ同一あるいは同一のデータセットと競合することを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:45:45 GMT)
Entanglement Entropy of ($\mathbf{2+1}$)-Dimensional SU(2) Lattice Gauge Theory on Plaquette Chains [0.6] 線形ラケット鎖上の2+1$次元におけるハミルトンSU(2)格子ゲージ理論の絡み合いエントロピーについて検討する。
ヒルベルト空間に存在しているスペクトルの中央にある量子多体傷は、高次の電場表現がヒルベルト空間基底に含まれると消滅する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:27:27 GMT)
Simulation of chiral motion of excitation within the ground-state manifolds of neutral atoms [0.4] 中性原子中のレーザー誘起ゲージ場は磁場の効果を模倣する手段として用いられる。
我々は中性原子基底状態多様体内の原子励起におけるキラル運動を生成する方法を提案する。
提案手法は、ヘキサゴナル中性原子格子を実装するために容易に拡張することができ、ハルデンモデルを実現するための基本単位として機能する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:21:22 GMT)
Deep Reinforcement Learning for Multi-Objective Optimization: Enhancing Wind Turbine Energy Generation while Mitigating Noise Emissions [0.4] 風力タービンの深部強化学習を用いたトルクピッチ制御フレームワークを開発した。
我々は、風力タービンパラメータの正確な制御を可能にするために、ブレード要素運動量解決器と組み合わされた二重深度Q-ラーニングを用いる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:21:51 GMT)
NeuroPlug: Plugging Side-Channel Leaks in NPUs using Space Filling Curves [0.4] 全ての公表された対策(CM)は、信号XにノイズNを付加する。
本研究では,このノイズを,対象の計測値,統計的解析値,様々な種類の推定側情報を用いて除去することが容易であることを示す。
我々はこれらの攻撃手法に免疫を持つ新しいCM NeuroPlugを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:40:41 GMT)
Neuromorphic Circuit Simulation with Memristors: Design and Evaluation Using MemTorch for MNIST and CIFAR [0.4] 本研究は,3つのデジタル畳み込みニューラルネットワークを構築し,訓練することにより,メモリ内処理にmemristorsを用いることの可能性を評価する。
これらのネットワークをmemtorchシステムに変換する。
シミュレーションは理想的な条件下で行われ、推論中に最小1%の精度の損失が得られた。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:30:33 GMT)
Behind the Smile: Mental Health Implications of Mother-Infant Interactions Revealed Through Smile Analysis [0.4] 笑顔に反映された母性感情制御をモデル化し,母性感情状態を分析した。
以上の結果から,母親の笑顔の時間動態と感情状態との相関が示唆された。
この研究は、他人の利益のために自分の感情を管理するものとして定義される感情労働についての洞察を与える。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 23:22:57 GMT)
A reinforcement learning strategy to automate and accelerate h/p-multigrid solvers [0.4] マルチグリッド法は非常に効率的であるが,各レベルのスムーズなスイープ数など,数値パラメータを微調整する必要がある。
本稿では、近似ポリシー最適化アルゴリズムを用いて、マルチグリッドパラメータを自動的に調整する。
以上の結果から,提案手法は定常状態シミュレーションの堅牢性を著しく向上させる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 21:26:28 GMT)
SecScale: A Scalable and Secure Trusted Execution Environment for Servers [0.4] Intelは、第11世代と第12世代のプロセッサで、最も信頼できるエンクレーブであるSGXを非推奨にする計画だ。
我々は、投機的実行を中心にした新しいアイデアを使用するSecScaleを提案する。
私たちは、最も近い競合相手よりも10%高速です。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 15:14:36 GMT)
Enhancing TinyML Security: Study of Adversarial Attack Transferability [0.4] この研究は、リソース制約の組込みハードウェア上でAIモデルの敵対的脆弱性を掘り下げるものである。
以上の結果から,強力なホストマシンからの敵攻撃は,ESP32やRaspberry Piなど,より小型で安全性の低いデバイスに転送される可能性が示唆された。
このことは、敵対的攻撃が小さなデバイスに拡張され、脆弱性が強調され、TinyMLデプロイメントにおける強化されたセキュリティ対策の必要性を強調していることを示している。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:49:46 GMT)
Optimized Quantum Simulation Algorithms for Scalar Quantum Field Theories [0.3] 量子コンピュータ上でのスカラー場理論の実用的なシミュレーション手法を提案する。
本手法はハミルトニアンの各種耐故障シミュレーションアルゴリズムを用いて実装する。
どちらの場合も、バウンダリが物理的に意味のあるシミュレーションを4つの物理量子ビット(106ドル)と1012ドル(T$-gate)の順番で行うことを示唆している。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:00:01 GMT)
Removing cloud shadows from ground-based solar imagery [0.3] 本稿では,U-Netアーキテクチャに基づくクラウドシャドウの除去手法を提案し,古典的監視と条件付きGANを比較した。
我々は,実画像と合成雲の新しいデータセットを用いて,2つの異なる画像モダリティについて評価を行った。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:38:24 GMT)
A light-weight and efficient punctuation and word casing prediction model for on-device streaming ASR [0.3] 自動音声認識(ASR)における句読解と単語ケーシング予測の必要性
本稿では,リアルタイムに句読解と単語ケーシングを共同で予測する軽量で効率的なモデルを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 04:01:12 GMT)
Neural Network Tire Force Modeling for Automated Drifting [0.3] 本稿では,物理に基づくアプローチの代替として,前輪横力を予測するニューラルネットワークアーキテクチャを提案する。
我々はこれらのモデルを基準ドリフト軌跡を追跡するために調整された非線形モデル予測コントローラに展開する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:58:01 GMT)
Are We Ready for Out-of-Distribution Detection in Digital Pathology? [0.3] デジタル病理学におけるOOD検出のベンチマーク研究について述べる。
我々は,適切な評価プロトコルの導入と,単一モデルとマルチモデルの両方における多様な検出器の比較について強調する。
我々は新たな洞察とガイドラインを提供し、今後の研究と議論の道を開く。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:07:32 GMT)
Telling different unravelings apart via nonlinear quantum-trajectory averages [0.3] ゴリーニ-コサコフスキー-スダルシャン-リンドブラッドマスター方程式は開量子系の密度行列を支配している。
異なる測定シナリオにおいて同一のMEが生成する未発見物を,操作的に識別する手法を提案する。
量子軌道平均分散は,これらの測定シナリオを識別できることを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:13:21 GMT)
Decentralised Governance for Autonomous Cyber-Physical Systems [0.2] 本稿では,サイバー物理システムが分散的に管理される可能性について検討する。
自律的な物理的空間を管理するための分散ガバナンスの考察と課題を強調することで、自律的なCPSのガバナンスにおける自律性は単なる技術的成果ではなく、機能的および社会的ダイナミクスの複雑なメッシュも含んでいることが明らかになった。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 14:40:06 GMT)
Survey in Characterization of Semantic Change [0.1] 言葉の意味を理解することは、異なる文化からの文章を解釈するのに不可欠である。
意味的変化は、計算言語学アルゴリズムの結果の品質に影響を与える可能性がある。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 12:28:27 GMT)
SignSpeak: Open-Source Time Series Classification for ASL Translation [0.1] 本稿では,低コストでリアルタイムなASL-to-Speech翻訳グローブと手話パターンの学習データセットを提案する。
このデータセットを、LSTM、GRU、Transformersなどの教師付き学習モデルでベンチマークし、最高のモデルが92%の精度を達成した。
当社のオープンソースデータセット、モデル、グローブデザインは、コスト効率を維持しつつ、正確かつ効率的なASLトランスレータを提供する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 20:36:03 GMT)
SignSpeak: Open-Source Time Series Classification for ASL Translation [0.1] 本稿では,低コストでリアルタイムなASL-to-Speech翻訳グローブと手話パターンの学習データセットを提案する。
このデータセットを、LSTM、GRU、Transformersなどの教師付き学習モデルでベンチマークし、最高のモデルが92%の精度を達成した。
当社のオープンソースデータセット、モデル、グローブデザインは、コスト効率を維持しつつ、正確かつ効率的なASLトランスレータを提供する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 20:36:03 GMT)
Opportunistic Sensor-Based Authentication Factors in and for the Internet of Things [0.1] 我々は、モノのインターネットにおいて、機会論的センサーベースの認証要素を構築するための新しいアイデアを提案する。
センサは新たな認証要素を作成するために利用でき、既存のオブジェクト間認証機構を強化することができる。
駐車場入場シナリオにおける実証実験を通じて,提案手法の有効性と有効性を示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:02:07 GMT)
Sequency Hierarchy Truncation (SeqHT) for Adiabatic State Preparation and Time Evolution in Quantum Simulations [0.1] 本稿では、量子シミュレーションにおける状態準備と時間発展に必要なリソースを削減するために、SeqHT(Sequency Hierarchy Truncation)方式を提案する。
これまで検討したシステムでは、周波数障害波動関数で計算されたオブザーバブルは、カットオフシークエンスの増加とともに、その正確な値に段階的に収束することが判明した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:08:40 GMT)
A Multi-Messenger Search for Exotic Field Emission with a Global Magnetometer Network [0.1] 本研究では,大エネルギーの天体物理現象で発生するエキゾチック低質量場(ELF)バーストを探索するための解析手法を提案する。
関連する重力波や電磁信号は、磁気センサ内のフェルミオンのスピンとの結合を介して相互作用するELFバーストの到来を告げる。
我々は、2020年3月11日にLIGO/Virgoによって検出された二元ブラックホール融合S200311bgと一致するGNOMEデータを用いて、この手法による最初の探索を行い、重要な事象は見つからなかった。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 22:11:12 GMT)
Attenuation-Aware Weighted Optical Flow with Medium Transmission Map for Learning-based Visual Odometry in Underwater terrain [0.0] 本稿では,水中環境における学習型単眼視計測(VO)の課題に対処する。
自律型水中車両(AUV)におけるVOシステムの精度を高める新しいwflow-TartanVOの導入
実世界の異なる水中データセットの評価は,ベースラインVO法におけるwflow-TartanVOの有効性を示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:00:15 GMT)
dzStance at StanceEval2024: Arabic Stance Detection based on Sentence Transformers [0.0] 本研究では,TF-IDF(Term Frequency-Inverse Document Frequency)とSentence Transformerを比較し,著者の姿勢を検出する。
本研究では,Sentence Transformer が TF-IDF 特性より優れていることを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 15:43:27 GMT)
dzNLP at NADI 2024 Shared Task: Multi-Classifier Ensemble with Weighted Voting and TF-IDF Features [0.0] 本稿では,dzNLPチームのNADI 2024共有タスクへの貢献について述べる。
我々のアプローチは、従来の機械学習技術に頼りながら、F1スコアと精度の点で競争性能を実証した。
私たちのモデルは極めて正確でしたが、幅広い方言ラベルを思い出すのに苦労し、改善すべき重要な領域を強調しました。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 15:47:42 GMT)
dzFinNlp at AraFinNLP: Improving Intent Detection in Financial Conversational Agents [0.0] 本稿では、金融対話エージェントにおける意図検出へのdzFinNlpチームの貢献について述べる。
我々の実験は有望な結果を示し、最良のモデルはArBanking77データセットで93.02%と67.21%のマイクロF1スコアを達成した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 14:37:20 GMT)
Vison condensation and spinon confinement in a kagome-lattice $\mathbb{Z}_2$ spin liquid: A numerical study of a quantum dimer model [0.0] 我々は,カゴメ格子上の$mathbbZ$ spin liquid(mathbbZ$SL)とボンドソリッド(VBS)の遷移について検討した。
この遷移は、$mathbbZ$スピン液体のバイソン励起の凝縮によって引き起こされる。
スピン液体とVBSの特徴を同時に示す興味深い状態が見つかる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 12:53:03 GMT)
Unruh-DeWitt Quantum Computing: Realizing Quantum Shannon Theory With Quantum Fields [0.0] この論文では、ヘリカルルッティンガー液体のボゾン化がフェルミオン系のRQIチャネルを構築するためのペダゴジカルアリーナを提供するため、友長・ルッティンガー液体の理論に重点を置いている。
複数の実験的な実システムを提案し,最大チャネル容量を確保するために設計制約を構築した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:00:49 GMT)
Uncovering Political Bias in Emotion Inference Models: Implications for sentiment analysis in social science research [0.0] 本稿では、社会科学研究における感情分析(SA)に使用される機械学習モデルにおける政治的バイアスの存在について検討する。
ポーランドの感情分析モデルを用いた偏見調査を行った。
以上の結果から, 人間のラテンダーによるアノテーションは, モデルの予測に政治的偏見を伝播させることが示唆された。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 20:31:07 GMT)
Uncertainty relations based on state-dependent norm of commutator [0.0] 我々は、B'ottcher-Wenzel不等式の一般化を利用して、通勤者の状態依存ノルムに基づく2つの不確実性関係を導入する。
第1の関係は数学的に証明され、第2の関係は数値的な証拠によって強く支持される。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 23:49:20 GMT)
Tsirelson inequalities: Detecting cheating and quantumness in a single framework [0.0] ティレルソンの不等式は量子性を検出する量子理論の強力な道具として登場した。
本稿では,古典的なシェルゲームにおける不正検出と空間的に分離されたシステムにおける量子性の探索という,Tsirelsonの不等式の有用性を活用する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:32:09 GMT)
The use of the symmetric finite difference in the local binary pattern (symmetric LBP) [0.0] LBPの特徴の数は、対称LPPを用いることで256から16に削減される。
顔検出および表情認識において, LBP定式化における対称有限差の利用について検討した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:34:02 GMT)
The Impact of School and Family Networks on COVID-19 Infections Among Dutch Students: A Study Using Population-Level Registry Data [0.0] 我々は、SARS-CoV-2送信に対する学校、家族、その他の社会接触の影響を調べるために、広範な登録データを用いている。
以上の結果から,SARS-CoV-2の普及における家庭と家族の伝達の重要性が学校設定に比較して強調された。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 21:49:01 GMT)
Temperature Distribution Prediction in Laser Powder Bed Fusion using Transferable and Scalable Graph Neural Networks [0.0] 本研究では, レーザ粉体融合プロセスにおける熱力学のシミュレーションにグラフニューラルネットワーク(GNN)を用いた新しい予測モデルを提案する。
提案モデルでは,L-PBFにおける熱伝達過程の複雑さを計算コストを大幅に削減する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:14:47 GMT)
Systematic input scheme for many-boson Hamiltonians via quantum walk [0.0] 我々は、多ボソンハミルトニアンのための新しい体系的な入力スキームを開発する。
この入力スキームの議論は、2次元の$phi 4$理論のライトフロントハミルトニアンに基づく。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:47:53 GMT)
Superresolving optical ruler based on spatial mode demultiplexing for systems evolving under Brownian motion [0.0] 任意の相対輝度を持つ2つの弱非コヒーレント源系の中心のブラウン運動が適応SPADE測定精度限界に及ぼす影響について検討した。
レイリーの呪いはそのようなシナリオに存在するが、SPADE測定は完全な直接撮像より優れている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:23:14 GMT)
Studying the Performance of the Jellyfish Search Optimiser for the Application of Projection Pursuit [0.0] プロジェクション追跡(PP)ガイド付きツアーは、PPインデックスとして知られる基準関数を対話的に最適化し、興味深いプロジェクションを明らかにすることで高次元データを探索する。
PPの最適化は非滑らかな関数を含む非自明なものであり、近距離からのみ検出できる小さなスキント角度のオプティマを含む。
本研究では,最近導入されたSwarmベースのアルゴリズムであるJellyfish Search Optimiser (JSO)の性能について検討した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:39:01 GMT)
Social Capital and Persistence in Computer Science of Google's Computer Science Summer Institute (CSSI) Students [0.0] 本研究では,CS支援プログラムが首都建設における持続性に与える影響について検討する。
私たちはGoogleのCSSIに注目し、大学院生にCSの3週間の紹介を提供しました。
プログラムから2~5年経過した参加者へのインタビューを用いて、CSSIが社会資本と長期CS持続性に与える影響を研究する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 21:50:21 GMT)
Self-Supervised Learning with Generative Adversarial Networks for Electron Microscopy [0.0] 本稿では,自己教師付き事前学習が,下流タスクの高精度な微調整をいかに促進するかを示す。
我々は、電子顕微鏡の文脈において、下流の様々なタスクにまたがる自己教師型事前学習の汎用性を実証する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:58:03 GMT)
Scikit-fingerprints: easy and efficient computation of molecular fingerprints in Python [0.0] ケモインフォマティクスにおける分子指紋の計算のためのPythonパッケージであるtextitscikit-fingerprintsを提案する。
私たちのライブラリは業界標準のScikit-learnインターフェースを提供しており、直感的な使用と機械学習パイプラインとの統合が容易です。
また、柔軟性があり、非常に効率的で、完全にオープンソースです。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:45:14 GMT)
Revisiting Attention for Multivariate Time Series Forecasting [0.0] 本研究ではまず周波数領域空間に基づく新しい注意機構である周波数スペクトルアテンション(FSatten)を提案する。
埋め込みにはフーリエ変換を使用し、従来のQとKの線形写像を置き換えるためにマルチヘッドスペクトルスケーリング(MSS)を導入している。
我々はさらに、スケールド直交注意(SOatten)と呼ばれるより一般的な手法を設計する。
実験の結果, FSatten と SOatten がSOTA を上回り, MTSF の基本的注意機構として優れていることがわかった。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 06:28:20 GMT)
Report on the Conference on Ethical and Responsible Design in the National AI Institutes: A Summary of Challenges [0.0] 2023年5月、ジョージア工科大学倫理・技術・ヒューマンインタラクションセンターは、国家AI研究所における倫理的・責任あるデザインに関する会議を組織した。
カンファレンスは3つの質問に焦点を当てた。 国家AI研究所がAIシステムの責任ある設計に関して直面している主な課題は何ですか?
この文書は、出席中の研究所の代表者が強調した課題をまとめたものである。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 22:30:08 GMT)
Qutrit and Qubit Circuits for Three-Flavor Collective Neutrino Oscillations [0.0] 我々は、高密度ニュートリノ系のフレーバーダイナミクスをシミュレートするためのクォートとキュービットの有用性を探求する。
量子ビット型および量子ビット型プラットフォーム上での3フレーバーニュートリノ系をシミュレーションするための新しい量子回路を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 21:56:31 GMT)
Queue-based Eco-Driving at Roundabouts with Reinforcement Learning [0.0] 我々は、交通の流れと交通効率を高めるために、混在する交通のラウンドアバウンドでエコ運転に対処する。
我々はルールベースと強化学習ベースのエコ自動運転システムという2つのアプローチを開発した。
その結果、どちらのアプローチもベースラインを上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:38:31 GMT)
Quantum statistical effects in one-particle densities: scattering and pair production [0.0] 非相互作用非相対論的粒子に作用する外部時間依存場によって生成される粒子-ホール対の時空間分解密度について検討した。
少なくともいくつかのケースでは、密度はフェルミ・ディラックやボース・アインシュタイン統計の影響を受けず、多粒子系の初期状態によってのみ決定されることが示されている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 21:34:11 GMT)
PyTreeNet: A Python Library for easy Utilisation of Tree Tensor Networks [0.0] この作業はPythonライブラリPyTreeNetのユーザガイドです。
ライブラリの機能を導入するためのコード例と演習が含まれている。
主な焦点は量子系の時間発展である。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:03:38 GMT)
Programmable adiabatic demagnetization for systems with trivial and topological excitations [0.0] 量子コンピュータや量子シミュレータ上で任意のハミルトニアンの低エネルギー状態を作成するためのプロトコルを提案する。
このプロトコルは、固体システムを極低温に冷却するために使用される断熱脱磁性技術にインスパイアされている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 14:33:05 GMT)
PRAGyan -- Connecting the Dots in Tweets [0.0] 本研究では、ツイートデータセットの因果解析を行うために、知識グラフ(KG)とLarge Language Models(LLM)の統合について検討する。
我々は、Neo4j(PRAGyan)データフォーマットに格納されたKGを利用して、因果推論に関連するコンテキストを検索する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 21:49:32 GMT)
PG-Rainbow: Using Distributional Reinforcement Learning in Policy Gradient Methods [0.0] 本稿では,分散強化学習フレームワークとポリシ勾配アルゴリズムを組み合わせた新しいアルゴリズムPG-Rainbowを紹介する。
政策ネットワークに報酬分配情報を統合することで、政策エージェントが強化された能力を取得するという経験的結果を示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 04:18:52 GMT)
Optimality and Noise-Resilience of Critical Quantum Sensing [0.0] 臨界量子センシングと受動量子戦略を比較して周波数推定を行う。
ユニタリの場合、どちらの戦略も光子数と精度2次スケーリングを達成するが、散逸の存在下では、これは批判的戦略にのみ当てはまる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:11:56 GMT)
Optimal Tree Tensor Network Operators for Tensor Network Simulations: Applications to Open Quantum Systems [0.0] ツリーテンソルネットワーク状態(TTNS)は、システムの波動関数を低ランクテンソルの積に分解する。
本稿では,任意の積和シンボル量子演算子に対して,最適かつ正確なツリーテンソルネットワーク演算子(TTNO)を自動構築するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 02:15:52 GMT)
Methods to Measure the Broncho-Arterial Ratio and Wall Thickness in the Right Lower Lobe for Defining Radiographic Reversibility of Bronchiectasis [0.0] 気管支狭窄診断の要点は,BAR(Brencho-Arterial ratio)の上昇である(小児では0.8)。
画像処理手法は、ローブやセグメントによるより高速な解釈と詳細な評価を容易にする。
そこで本稿では,BARの気道と動脈領域の正確な計測と計測方法を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 05:43:38 GMT)
Generative AI and the problem of existential risk [0.0] ジェネレーティブAIは、AIの現実的リスクに対する懸念の焦点となっている。
この章は、生成的AIに関連する存在的リスクの恐れを根底にしている重要な懸念を強調して、議論を軽視することを目的としている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:16:24 GMT)
General monogamy relations of the $S^{t}$ and $T^{t}_q$-entropy entanglement measures based on dual entropy [0.0] 新たに派生したモノガミーの不等式は,既存のものよりも厳密であることを示す。
これらの一般単ガミー関係に基づき、$N$-qubit状態に対する多部交絡指標の集合を構築する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:49:38 GMT)
General Distribution Learning: A theoretical framework for Deep Learning [0.0] 本稿では,機械学習の統計的タスクに対処する新しい理論学習フレームワークである一般分布学習(GD Learning)を評価する。
GDラーニングは、推定の真の基礎となる確率を推定し、カテゴリに適合するモデルを使用することに焦点を当てる。
本稿では,GD学習フレームワークにおける推定誤差,適合誤差,学習誤差の上限について検討する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:11:28 GMT)
From paintbrush to pixel: A review of deep neural networks in AI-generated art [0.0] 本稿では,AI生成技術開発に利用されてきた深層ニューラルネットワークアーキテクチャとモデルについて検討する。
古典的畳み込みネットワークから最先端拡散モデルまで、この分野のキープレーヤーについて検討する。
この論文は、AI生成技術の現状に関する技術的な説明と洞察の独特なブレンドによって、アートとコンピュータ科学の相互作用を実証する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 07:33:45 GMT)
Frequency dependence of nonsequential double ionization of atoms in strong laser fields [0.0] 完全な量子力学計算において、(非逐次)二重イオン化の周波数依存性を研究する。
また,フィールドサイクル数の影響などの時間依存性の影響についても検討した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 19:43:28 GMT)
Framework for Curating Speech Datasets and Evaluating ASR Systems: A Case Study for Polish [0.0] パブリックドメインで利用可能な音声データセットは、発見可能性と相互運用性の課題のために、しばしば利用されていない。
利用可能な音声データセットを調査し、カタログ化し、キュレートするための包括的なフレームワークが設計されている。
この研究は、ポーランド語における商用および無料のASRシステムの日付と比較して最も広範な比較である。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 21:32:12 GMT)
Fermion determinants on a quantum computer [0.0] このアルゴリズムは量子固有値変換と量子平均推定を使い、行列次元$V$で$O(Vlog(V))$のようにスケールするクエリ複雑性を与える。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 01:00:28 GMT)
Exploring Robot Trajectory Planning -- A Comparative Analysis of Algorithms And Software Implementations in Dynamic Environments [0.0] 軌道計画はModern & Advanced Roboticsにおいて重要な用語である。
これは、ロボットが時間が経つにつれて、スムーズで実現可能な経路を生成する方法です。
軌道計画は自動車産業ロボット、マニピュレータ、移動ロボットで広く使われている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:30:27 GMT)
Exploring Facial Biomarkers for Depression through Temporal Analysis of Action Units [0.0] 抑うつの有無で分類された被験者の映像データから表情を分析した。
その結果,グループ間の悲しみと幸福に関連するAUの強度に有意な差が認められた。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:55:01 GMT)
Exploration to early universe by Josephson Junction Switching Current Detector [0.0] ジョセフソンジャンクションスイッチング電流検出器(JJSCD)を用いた重力波背景探査法を提案する。
シャーの感度は、現実的にはhsimeq 10-19$、10-21$、楽観的には10-24$に達する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 16:01:40 GMT)
Exploiting nonequilibrium phase transitions and strong symmetries for continuous measurement of collective observables [0.0] 非平衡相転移を伴う強い対称性が、集合多体観測可能量を測定するためのプロトコルを考案する方法について論じる。
連続的に観測することで,時間積分した放射信号から直接全角運動量の値を推定できることが示される。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:51:31 GMT)
Experimental certification of level dynamics in single-photon emitters [0.0] 単一光子のエミッタは、新興量子技術にとって不可欠な資源である。
最も一般的に適用される試験は、エミッターエネルギーレベル構造を決定するためにハンベリー・ブラウン・アンド・ツイス(HBT)の装置を使用する。
我々は、同じHBT設定で記録された検出と非検出イベントのすべての正規化一致に基づいて完全な解析を行い、発光したフォトニック状態の期待特性を証明した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:27:27 GMT)
Enhanced Denoising of OCT Images Using Residual U-Net: A Cross-Modality Approach on PSOCT and ASOCT for Clinical Diagnostics [0.0] 本稿では,雑音を効果的に低減し,画像の明瞭度を向上するResidual U-Netアーキテクチャを用いた拡張型復調モデルを提案する。
ピーク信号ノイズ比(PSNR)はPS OCT画像に対して34.343$pm$1.113であり、構造類似度指数測定(SSIM)値は0.885$pm$0.030である。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 01:35:03 GMT)
Emergence of phantom cold dark matter from spacetime diffusion [0.0] 幾何学を定量化せずに一般相対性理論と場の量子論を整合させる方法は、計量を進化的に要求することである。
我々はその決定論的値から逸脱し、幻の冷たい暗黒物質(CDM)を発生させる空間計量の進化結果を見出した。
この幻の冷暗黒物質のエネルギー密度は平均的に正であり、CDMの宇宙現象を再現するために必要な条件である。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:00:02 GMT)
Efficient and Device-Independent Active Quantum State Certification [0.0] 絡み合った量子状態は多くの量子技術にとって必須の要素であるが、それらを使用する前に検証する必要がある。
既存のほとんどのアプローチは、名目上は同一かつ独立な(IID)量子状態のアンサンブルを作成し、その後、アンサンブルの各コピーを測定することに基づいている。
量子状態認証(QSC)を実験的に実装し、アンサンブルのサブセットのみを測定し、残りの状態の忠実さを認証する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 21:54:13 GMT)
Efficient High-Dimensional Entangled State Analyzer with Linear Optics [0.0] 線形光干渉計と補助フォトニック状態を用いて, 効率的な高次元交絡状態解析器を実現する方法を示す。
補助状態の絡み合いの度合いは、指数的に小さなシュミットランクによって定量化される以前のプロトコルよりもはるかに小さい。
これは、現在のハードウェアで実験的なデモを行う道を開くものだ。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 19:40:53 GMT)
Dynamical heterogeneity and large deviations in the open quantum East glass model from tensor networks [0.0] 数値テンソルネットワークを用いた散逸量子東モデルの非平衡ダイナミクスについて検討する。
我々は行列積状態を用いて、正確な対角化にアクセスできるものを超える大きさの量子ジャンプなき大きさの進化を表現する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:42:56 GMT)
Dynamic Sentiment Analysis with Local Large Language Models using Majority Voting: A Study on Factors Affecting Restaurant Evaluation [0.0] 本研究では,局所言語モデルを用いた感情分析モデルに多数決機構を導入する。
レストラン評価に関するオンラインレビューの3つの分析により、複数の試みによる過半数投票は、一つの試みによる大規模なモデルよりも、より堅牢な結果をもたらすことを示した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 00:28:04 GMT)
Characterization of Magnetic Labyrinthine Structures Through Junctions and Terminals Detection Using Template Matching and CNN [0.0] ジャンクションと終端と呼ばれる磁気ラビリンチンパターンの欠陥は、関心のポイントとなる。
本研究では,画像中の多数の小物体を検出するTM-CNNという新しい手法を提案する。
TM-CNNのF1スコアは0.991で、従来のテンプレートマッチングやCNNベースのオブジェクト検出アルゴリズムよりもはるかに優れていた。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 23:04:14 GMT)
Brick Wall Quantum Circuits with Global Fermionic Symmetry [0.0] 大域フェルミオン対称性を享受するレンガ壁量子回路について検討する。
フェルミオン対称性は臨界点の曲面に$H_gamma$をピンするが、その対称性を破ると非自明な位相となる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:27:58 GMT)
Bootstrapping Classical Shadows for Neural Quantum State Tomography [0.0] 古典的影を用いたクロスエントロピー損失関数の最適化のための新しい推定器を提案する。
この損失関数は、古典的な影の測定に基づいて訓練されたトランスフォーマーベースニューラルネットワークを用いて、GHZ状態の安定な再構成を実現するために利用できることを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 21:29:13 GMT)
BiasDPO: Mitigating Bias in Language Models through Direct Preference Optimization [0.0] 大規模言語モデル(LLM)は、自然言語処理の進歩において重要な役割を担っているが、バイアスの持続可能性には重大な懸念がある。
本稿では、英語テキストにおけるジェンダー、人種、宗教的偏見を緩和するために、DPO(Direct Preference Optimization)を用いた新しい枠組みを提案する。
バイアスのある完了よりもバイアスの少ない損失関数を開発することで、我々のアプローチは敬意と非差別的な言語を好む。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 22:32:20 GMT)
Bayesian sequential design of computer experiments for quantile set inversion [0.0] 複素数値シミュレータのようなシステムを表現する未知の多変量関数を考える。
我々の目的は、確率が与えられた閾値未満の出力につながる決定論的入力のセットを推定することである。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:21:58 GMT)
Ballistic conductance with and without disorder in a boundary-driven XXZ spin chain [0.0] 解析的手法と数値的手法を組み合わせた古典的変種について検討する。
古典的モデルは量子結果を顕著に再現する。
この現象学は結合障害を包含する上で極めて堅牢であることを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:00:00 GMT)
Attention in SRAM on Tenstorrent Grayskull [0.0] Tenstorrent Grayskullアーキテクチャは、コアの大きな分散グリッドを提供する。
Grayskull用の融合カーネルは、行列乗算、アテンションスケーリング、ソフトマックス演算を組み合わせたものである。
CPU実装と比較して、専用のSoftmaxカーネルの高速化は、最大10倍の価格である。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 20:19:36 GMT)
Assurance of AI Systems From a Dependability Perspective [0.0] リスクの高いコンピュータベースのシステムに対する古典的保証の原則を概説する。
次に、人工知能(AI)と機械学習(ML)を用いたシステムへのこれらの原則の適用を検討する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 23:55:43 GMT)
Apparent delay of the Kibble-Zurek mechanism in quenched open systems [0.0] クエンチ時間における新しい中間状態である$tau_q$を報告し、キブル・ズレック機構(KZM)の通常の妥当性を分離する。
これは、システムが断熱的な体制に入るように見えるため、$tau_q$による遷移時間のゆるいスケーリングに現れます。
この中間状態は、システムが衝動状態において凍結するのを防ぐ散逸によって出現する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 11:48:37 GMT)
Apparatus for Optical-Atomic System Integration & Calibration: 1 atm to 1$\times$10$^{-11}$ Torr in 24h [0.0] 本稿では,24時間以内で1時間10~11ドルTorrの排気,交換,避難が可能なロードロック装置を提案する。
本システムでは,超低温原子を用いた様々なフォトニックデバイスの高速試験とベンチマークを行うことができる。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 03:38:46 GMT)
An Analysis of European Data and AI Regulations for Automotive Organizations [0.0] 本報告では、欧州連合の一連のデータおよびAI規制を要約し、自動車製造組織のマネージャに対して分析する。
特に、以前の法律にルーツを見出す方法など、規制の関連する考え方を強調します。
全体として、我々は欧州連合のデータ規制を、歴史的先例に根ざした波の集合として特徴づけ、自動車産業に重要な意味を持つ。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 14:38:13 GMT)
Algorithms for Non-Negative Matrix Factorization on Noisy Data With Negative Values [0.0] 非負行列分解(Non- negative matrix factorization, NMF)は, ノイズデータを解析するための次元還元法である。
本稿では、入力データのノイズと導入された負性の両方を扱えるShift-NMFとNearly-NMFの2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 21:36:01 GMT)
Affordance Perception by a Knowledge-Guided Vision-Language Model with Efficient Error Correction [0.0] オープンワールド環境におけるロボットに対して,正確かつ行動可能な価格表現を提供する。
我々は、この知識ベースを基礎となる視覚言語モデル(VLM)に接続し、VLMに、より広い種類の新しい、目に見えないオブジェクトを誘導する。
空白表現,画像検出,ループ内の人間との混在は,ロボットが目標を達成するために対象を探索する上で有効である。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 10:24:22 GMT)
Absence of barren plateaus and scaling of gradients in the energy optimization of isometric tensor network states [0.0] 広いハミルトンと有限範囲の相互作用を持つ量子多体系のエネルギー問題を考える。
行列積状態,木テンソルネットワーク,およびマルチスケールエンタングル化再正規化アンサッツに対する変分最適化問題は,バレンプラトーを含まないことを証明した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 17:24:19 GMT)
AROhI: An Interactive Tool for Estimating ROI of Data Analytics [0.0] データ分析を行う場合、Return On Investmentを検討することが重要です。
この作業では、実証のための従来の高度なMLアプローチを提供する包括的なツールについて詳述する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:19:17 GMT)
AI-powered mechanisms as judges: Breaking ties in chess [0.0] 本稿では,AIによる客観的タイブレッシング機構を提案する。
本手法は,強力なチェスエンジンによって提案される最適動作と比較することにより,選手の動きの質を評価する。
このアプローチは、競争の公平性と完全性を高めるだけでなく、ゲームの高水準を維持している。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 13:58:34 GMT)
A time-parallel multiple-shooting method for large-scale quantum optimal control [0.0] 量子最適制御は、制御パルスを用いて量子システムを操り、論理ゲート変換を実現することにより、量子コンピューティングにおいて重要な役割を果たす。
勾配法や勾配のない縮小空間法、フルスペースコロケーション法など、様々な手法が開発されている。
本稿では,従来の手法の解の精度と計算効率のバランスをとることを目的とした,多重撮影に基づく中間的手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 23:57:26 GMT)
A novel translationally invariant supersymmetric chain with inverse-square interactions: partition function, thermodynamics and criticality [0.0] 我々は、ルート系に直接関連しない長距離相互作用を持つ翻訳不変su$(m|n)$スピン鎖の新しい族を導入する。
我々はこれらのモデルの対称性を研究し、この種のシステムのボソン-フェルミオン双対性特性の存在を確立した。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 18:00:20 GMT)
A new approach towards quantum foundation and some consequences [0.0] 6つの仮定に基づく一般的な理論が紹介される。
基本的な概念は、観測者または通信観測者のグループと関連付けられた理論変数である。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 19:54:58 GMT)
A new approach to delegate signing rights to proxy signers using isogeny-based cryptography [0.0] CSI-PS(commutative supersingular isogeny proxy signature)を提案する。
同種性に基づくグループアクション逆問題(IPGA)の硬度下では, uf-cmaが安全であることが証明された。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:19:19 GMT)
A deep latent variable model for semi-supervised multi-unit soft sensing in industrial processes [0.0] 半教師付きマルチユニットソフトセンシングのための潜時変動モデルを提案する。
この階層的で生成的なモデルは、ラベル付きデータとラベルなしデータの両方から学習するだけでなく、異なるユニットを共同でモデル化することができる。
半教師付き学習とマルチタスク学習を組み合わせることで,提案手法は優れた結果が得られることを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 09:13:22 GMT)
A Labelled Dataset for Sentiment Analysis of Videos on YouTube, TikTok, and Other Sources about the 2024 Outbreak of Measles [0.0] 本稿では2024年1月1日から5月31日までに264のウェブサイトで公表された麻疹の流行に関する4011件のビデオデータを含むデータセットを提案する。
YouTubeとTikTokはそれぞれ48.6%と15.2%を占めている。
これらのビデオのそれぞれについて、ビデオのURL、投稿のタイトル、投稿の説明、およびビデオの公開日をデータセット内の別の属性として提示する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 04:24:57 GMT)
A Foundation Model for Soccer [0.0] 提案するサッカーの基盤モデルでは,与えられたアクションの入力シーケンスから,サッカーの試合におけるその後のアクションを予測することができる。
概念実証として,プロサッカーリーグの3シーズンのデータに対して,トランスフォーマーアーキテクチャをトレーニングする。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 15:42:08 GMT)
A Construction of Quantum Stabilizer Codes from Classical Codes and Butson Hadamard Matrices [0.0] 古典的線型符号 C が次元 k の F_qn の部分集合であれば、[[nm, ks, d]]_q 量子安定化符号は C と D によって決定される。
一般正規化Butson Hadamard行列に対する量子符号の同じ構成を考察し、量子符号が安定化符号となる条件を探索する。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 14:00:38 GMT)
A BCS state formulation for the fermionic Tonks-Girardeau gas [0.0] フェルミオン型トンクス・ジラルドーガスの基底状態波動関数の代替式を提案する。
第二量子化の枠組みで提案された波動関数を表現することにより、フェルミオン型トンクス・ジラルドーガスの基底状態が数保存状態であることを示す。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 08:25:11 GMT)
"We're not all construction workers": Algorithmic Compression of Latinidad on TikTok [0.0] ビデオ共有プラットフォームTikTokのアルゴリズムシステムについて,ラテックスの人々がどのように経験するかを検討した。
TikTokのラテン系ユーザーは、ポジティブなコンテンツフィードとアイデンティティーコンテンツフィードを積極的に利用しているが、これらのフィードはネガティブなコンテンツによって中断されている。
論文参考訳(メタデータ) (Thu, 18 Jul 2024 22:30:19 GMT)