Fugu-MT: arxivの論文翻訳(概要)

Ego-Exo4D: Understanding Skilled Human Activity from First- and Third-Person Perspectives [194.1]
Ego-Exo4Dは、熟練した人間の活動を同時に捉えたエゴセントリックでエゴセントリックなビデオを中心にしている。世界の13都市から740人の参加者が123の異なる自然環境下でこれらの活動を行った。ビデオにはマルチチャンネルオーディオ、視線、3Dポイントクラウド、カメラポーズ、IMU、複数対の言語記述が添付されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:55:38 GMT)
Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Multimodal Models [146.2]
Molmoは、オープンネスのクラスで最先端のVLMの新たなファミリーである。私たちの重要なイノベーションは、人間のアノテーションから収集された、新しくて詳細な画像キャプションデータセットです。近い将来、モデルウェイト、キャプション、微調整データ、ソースコードをすべてリリースする予定です。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:59:51 GMT)
Walker: Self-supervised Multiple Object Tracking by Walking on Temporal Appearance Graphs [117.7]
これは、疎結合なボックスアノテーションとトラッキングラベルのないビデオから学習する、初めてのセルフ教師付きトラッカーである。 Walker氏はMOT17、DanceTrack、BDD100Kで競争力を発揮する最初のセルフトラッカーである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:00:00 GMT)
NTIRE 2024 Challenge on Stereo Image Super-Resolution: Methods and Results [106.3]
本稿では,立体像超解像(SR)における第3回 NTIRE チャレンジを要約する。この課題の課題は、限られた計算予算の下でx4の倍率を持つ高解像度のステレオ画像対に高解像度のステレオ画像対を超解することである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:59:36 GMT)
Visualizing Dynamics of Charges and Strings in (2+1)D Lattice Gauge Theories [104.0]
超伝導量子ビット格子における局所励起のダイナミクスについて検討する。閉じ込められた励起に対して、磁場はそれらを接続する弦の張力を誘導する。提案手法により,(2+1)D LGTにおける文字列のダイナミックスを実験的に画像化することができる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:59:05 GMT)
Language Models Learn to Mislead Humans via RLHF [101.0]
言語モデル(LM)は、特にタスクが複雑である場合に、人間にとって検出が難しいエラーを生成する。我々はこの現象を標準のRLHFパイプラインで研究し、モデル開発者が意図していないことから「U-SOPHISTRY」と呼ぶ。我々の研究は、RLHFの重要な障害モードを強調し、人間の調整を支援するためのさらなる研究を求めている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 00:32:31 GMT)
MMoE: Enhancing Multimodal Models with Mixtures of Multimodal Interaction Experts [92.8]
MMOE(Multimodal Mixtures of Experts)と呼ばれるマルチモーダルモデルの拡張手法を導入する。 MMoEは様々な種類のモデルに適用でき、改善できる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:30:28 GMT)
MMoE: Enhancing Multimodal Models with Mixtures of Multimodal Interaction Experts [92.8]
MMOE(Multimodal Mixtures of Experts)と呼ばれるマルチモーダルモデルの拡張手法を導入する。 MMoEは様々な種類のモデルに適用でき、改善できる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:30:28 GMT)
M^2PT: Multimodal Prompt Tuning for Zero-shot Instruction Learning [90.8]
MLLM(Multimodal Large Language Models)は、幅広い領域にわたる顕著なパフォーマンスを示す。本研究では,MLLMの効率的な命令チューニングのための新しいMultimodal Prompt Tuning (M$2$PT) 手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:24:39 GMT)
MMPT: Multimodal Prompt Tuning for Zero-shot Instruction Learning [90.8]
MLLM(Multimodal Large Language Models)は、幅広い領域にわたる顕著なパフォーマンスを示す。本研究では,MLLMの効率的な命令チューニングのためのMMPT(Multimodal Prompt Tuning)手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:24:39 GMT)
Event-Free Moving Object Segmentation from Moving Ego Vehicle [88.3]
動的シーンにおけるオブジェクトセグメンテーション(MOS)の移動は、自律運転において重要で困難だが、未調査の研究テーマである。ほとんどのセグメンテーション法は、光学フローマップから得られるモーションキューを利用する。我々は,光学的フローに頼らずにリッチなモーションキューを提供する,より優れた映像理解のためのイベントカメラを活用することを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:13:32 GMT)
Pre-trained Language Models Do Not Help Auto-regressive Text-to-Image Generation [82.5]
我々は,自動回帰テキスト・画像生成のための事前学習言語モデルを適用した。事前訓練された言語モデルは限られた助けを提供する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:58:21 GMT)
Language Models Learn to Mislead Humans via RLHF [81.3]
言語モデル(LM)は、特にタスクが複雑である場合に、人間にとって検出が難しいエラーを生成する。我々はこの現象を標準のRLHFパイプラインで研究し、モデル開発者が意図していないことから「U-SOPHISTRY」と呼ぶ。我々の研究は、RLHFの重要な障害モードを強調し、人間の調整を支援するためのさらなる研究を求めている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 00:32:31 GMT)
EventHallusion: Diagnosing Event Hallucinations in Video LLMs [80.0]
我々はまず,ビデオイベント理解におけるビデオLMMの幻覚現象を評価する新しいベンチマークであるEventHallusionを提案する。既存の VideoLLM が基盤モデルから派生した先行モデルと絡み合っているという観測に基づいて,私たちのEventHallusion はビデオ収集と注釈付質問によってキュレートされる。また,ビデオLLMの幻覚化問題に対処するため,TCD(Temporal Contrastive Decoding)と呼ばれるシンプルで効果的な手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:49:46 GMT)
EAGLE: Towards Efficient Arbitrary Referring Visual Prompts Comprehension for Multimodal Large Language Models [80.0]
本稿では,既存のアプローチよりもトレーニングの少ない任意の参照視覚的プロンプトの理解を促進するための,MLLM(Multimodal Large Language Models)を提案する。本手法は,視覚的プロンプトを,MLLMに理解可能な特定の空間領域を伝達する空間概念として応用する。我々はまた、MLLMの領域レベルの理解を視覚的プロンプトを参照する特定の形式にさらに引き離すための幾何非依存学習パラダイム(GAL)を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:22:00 GMT)
Degradation-Guided One-Step Image Super-Resolution with Diffusion Priors [75.2]
拡散に基づく画像超解像法 (SR) は、事前訓練された大規模なテキスト・画像拡散モデルを先行として活用することにより、顕著な成功を収めた。本稿では,拡散型SR手法の効率問題に対処する新しい一段階SRモデルを提案する。既存の微調整戦略とは異なり、SR専用の劣化誘導低ランク適応 (LoRA) モジュールを設計した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:15:21 GMT)
Generative Pre-trained Ranking Model with Over-parameterization at Web-Scale (Extended Abstract) [73.6]
ランク付け学習は、入力クエリに基づいて関連するWebページを優先順位付けするために、Web検索で広く使われている。本稿では,これらの課題に対処するために,経験的 UlineSemi-uline Supervised ulinePre-trained (GS2P) モデルを提案する。我々は,公開データセットと大規模検索エンジンから収集した実世界のデータセットの両方に対して,大規模なオフライン実験を行う。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:39:14 GMT)
JourneyBench: A Challenging One-Stop Vision-Language Understanding Benchmark of Generated Images [72.4]
生成した画像のベンチマークであるJourneyBenchをリリースし、モデルの微細なマルチモーダル推論能力を評価する。既存のベンチマークとは異なり、JourneyBenchは特異な想像上のシナリオにおいて、きめ細かいマルチモーダル推論を必要とする。 5つのタスクにまたがる結果から、JourneyBenchは最高のモデルでも非常に難しい。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 01:46:10 GMT)
JourneyBench: A Challenging One-Stop Vision-Language Understanding Benchmark of Generated Images [72.4]
生成した画像のベンチマークであるJourneyBenchをリリースし、モデルの微細なマルチモーダル推論能力を評価する。既存のベンチマークとは異なり、JourneyBenchは特異な想像上のシナリオにおいて、きめ細かいマルチモーダル推論を必要とする。 5つのタスクにまたがる結果から、JourneyBenchは最高のモデルでも非常に難しい。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 01:46:10 GMT)
FLaRe: Achieving Masterful and Adaptive Robot Policies with Large-Scale Reinforcement Learning Fine-Tuning [72.0]
FLaReは、堅牢な事前訓練された表現、大規模なトレーニング、勾配安定化技術を統合する大規模な強化学習フレームワークである。提案手法は,タスク完了に向けた事前訓練されたポリシーを整列し,これまで実証され,全く新しいタスクや実施状況において,最先端(SoTA)のパフォーマンスを達成する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:15:17 GMT)
DreamWaltz-G: Expressive 3D Gaussian Avatars from Skeleton-Guided 2D Diffusion [69.7]
テキストからアニマタブルな3Dアバター生成のための新しい学習フレームワークDreamWaltz-Gを提案する。このフレームワークのコアはScore DistillationとHybrid 3D Gaussian Avatar表現にある。我々のフレームワークは、人間のビデオ再現や多目的シーン構成など、多様なアプリケーションもサポートしています。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:59:45 GMT)
Scalable Ensemble Diversification for OOD Generalization and Detection [68.9]
SEDは、ハエのハードトレーニングサンプルを特定し、アンサンブルメンバーにこれらについて意見の一致を奨励する。モデル間でのペアの相違を解消する既存の方法において,コストのかかる計算を避ける方法を示す。 OODの一般化のために,出力空間(古典的)アンサンブルや重量空間アンサンブル(モデルスープ)など,複数の環境での多様化による大きなメリットを観察する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 10:30:24 GMT)
ChatCam: Empowering Camera Control through Conversational AI [67.3]
ChatCamは、ユーザーとの会話を通じてカメラの動きをナビゲートするシステムである。そこで本研究では,テキスト条件付きカメラ軌道生成のためのGPTに基づく自己回帰モデルであるCineGPTを提案する。また、正確なカメラ軌道配置を保証するアンカー決定器も開発した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 20:13:41 GMT)
In-Context Learning with Representations: Contextual Generalization of Trained Transformers [66.8]
In-context Learning (ICL) は、事前訓練された大規模言語モデルの能力を指し、推論中にいくつか例を挙げると、新しいタスクを学習できる。本稿では,非線形回帰タスクのレンズによる勾配降下による変圧器のトレーニングダイナミクスについて検討する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 19:16:16 GMT)
FAFA: Frequency-Aware Flow-Aided Self-Supervision for Underwater Object Pose Estimation [65.0]
無人水中車両(UUV)の6次元ポーズ推定のための周波数認識フロー支援フレームワークであるFAFAを紹介する。我々のフレームワークは、3DモデルとRGB画像のみに依存しており、実際のポーズアノテーションや奥行きのような非モダリティデータの必要性を軽減しています。本研究では,一般的な水中オブジェクトポーズベンチマークにおけるFAFAの有効性を評価し,最先端手法と比較して顕著な性能向上を示した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:54:01 GMT)
Attention Prompting on Image for Large Vision-Language Models [63.8]
本稿では,画像上の注意喚起という新しいプロンプト手法を提案する。我々は,CLIPのような補助モデルを用いて,テキストクエリに依存する入力画像に対するアテンションヒートマップを生成する。各種バイソン言語ベンチマークの実験により,本手法の有効性が検証された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:59:13 GMT)
RoboSense: Large-scale Dataset and Benchmark for Multi-sensor Low-speed Autonomous Driving [62.6]
本稿では,3種類のセンサ(Camera, LiDAR, Fisheye)をベースとしたマルチモーダルデータ収集プラットフォームを構築する。 RoboSenseという名前の大規模なマルチセンサーデータセットが構築されており、ニアフィールドシーンの理解を容易にする。 RoboSenseは、1133K以上の同期データと1.4Mの3DバウンディングボックスとIDをフル360円のビューに格納し、7.6Kの時間シーケンスに216Kのトラジェクトリを形成する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:29:27 GMT)
Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [62.0]
World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:48:25 GMT)
InstructIR: High-Quality Image Restoration Following Human Instructions [61.2]
本稿では,人間の手書きによる画像復元モデルを導出する手法を提案する。 InstructIRという手法は、いくつかの修復作業において最先端の結果を得る。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 20:29:36 GMT)
Single Image, Any Face: Generalisable 3D Face Generation [59.9]
我々は,制約のない単一画像入力を伴う3次元顔を生成する新しいモデルGen3D-Faceを提案する。私たちの知る限りでは、これは1枚の画像からフォトリアリスティックな3D顔アバターを作るための最初の試みであり、ベンチマークである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:56:37 GMT)
Uncertainty Representations in State-Space Layers for Deep Reinforcement Learning under Partial Observability [59.8]
線形状態空間モデルにおいて閉形式ガウス推論を行う独立なカルマンフィルタ層を提案する。効率的な線形リカレント層と同様に、Kalmanフィルタ層は並列スキャンを使用してシーケンシャルデータを処理している。実験により、不確実性推論が意思決定の鍵となる問題においてカルマンフィルタ層が優れており、他のステートフルモデルよりも優れていることが示された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:22:29 GMT)
Semi-LLIE: Semi-supervised Contrastive Learning with Mamba-based Low-light Image Enhancement [59.2]
本研究は、平均教師による半教師付き低照度強化(Semi-LLIE)フレームワークを提案する。照度分布を忠実に伝達するために、意味認識によるコントラスト損失を導入し、自然色による画像の強調に寄与する。また,大規模な視覚言語認識モデル(RAM)に基づく新たな知覚損失を提案し,よりリッチなテキストによる画像生成を支援する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 04:05:32 GMT)
Discriminative Anchor Learning for Efficient Multi-view Clustering [59.1]
マルチビュークラスタリング(DALMC)のための識別的アンカー学習を提案する。元のデータセットに基づいて、識別的なビュー固有の特徴表現を学習する。これらの表現に基づいて異なるビューからアンカーを構築することで、共有アンカーグラフの品質が向上します。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:11:17 GMT)
Source Attribution for Large Language Model-Generated Data [57.9]
合成テキストの生成に寄与したデータプロバイダを特定することで、ソース属性を実行できることが不可欠である。我々はこの問題を透かしによって取り組めることを示した。本稿では,アルゴリズム設計により,これらの重要な特性を満足する情報源属性フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:40:20 GMT)
Pre-trained Graphformer-based Ranking at Web-scale Search (Extended Abstract) [56.6]
本稿では,変換器の回帰能力をGNNのリンク予測強度と統合することを目的とした新しいMPGrafモデルを提案する。我々は、MPGrafの性能を厳格に評価するために、大規模なオフラインおよびオンライン実験を行っている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:33:47 GMT)
AIM 2024 Challenge on Efficient Video Super-Resolution for AV1 Compressed Content [56.6]
ビデオスーパーレゾリューション(VSR)は、特にストリーミングアプリケーションにおいて、低ビットレートおよび低解像度ビデオを強化するための重要なタスクである。本研究では,これらの課題に対処するために様々な手法をコンパイルし,その解決策はエンドツーエンドのビデオ超解像フレームワークである。提案されたソリューションは、一般的なケースとして540pから4K(x4)、モバイルデバイス向けに調整された360pから1080p(x3)の2つのアプリケーションのためのビデオアップスケーリングに取り組む。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:12:19 GMT)
Streaming Neural Images [56.4]
Inlicit Neural Representations (INR) は信号表現の新しいパラダイムであり、画像圧縮にかなりの関心を集めている。本研究では,INRの計算コスト,不安定な性能,堅牢性などの限界要因について検討する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:51:20 GMT)
Simple Image Signal Processing using Global Context Guidance [56.4]
ディープラーニングベースのISPは、深層ニューラルネットワークを使用してRAW画像をDSLRライクなRGBイメージに変換することを目指している。我々は,全RAW画像からグローバルなコンテキスト情報をキャプチャするために,任意のニューラルISPに統合可能な新しいモジュールを提案する。本モデルでは,多種多様な実スマートフォン画像を用いて,様々なベンチマークで最新の結果が得られる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:53:48 GMT)
Efficient Motion Prediction: A Lightweight & Accurate Trajectory Prediction Model With Fast Training and Inference Speed [56.3]
我々は,1つのGPU上で数時間のトレーニングをしながら,競争力の高いベンチマーク結果を実現する,新しい効率的な動き予測モデルを提案する。その低推論レイテンシは、特に限られたコンピューティングリソースを持つ自律アプリケーションへのデプロイに適している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:00:27 GMT)
Scaling Behavior for Large Language Models regarding Numeral Systems: An Example using Pythia [55.2]
本研究では, 変圧器を用いた大規模言語モデルを用いて, 異なる数値システムのスケーリング挙動について検討する。ベース10ドルシステムは、トレーニングデータスケール全体で、ベース102ドルまたは103ドルよりも一貫してデータ効率が高い。私たちは、トークンレベルの識別とトークンレベルの操作に苦労する、ベース100ドルとベース1,000ドルのシステムを特定します。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:08:31 GMT)
Non-asymptotic Convergence of Training Transformers for Next-token Prediction [55.0]
トランスフォーマーは、シーケンシャルなデータを扱う優れた能力のために、現代の機械学習において驚くべき成功を収めています。本稿では, 単層変圧器のトレーニング力学の微細な非漸近解析を行う。トレーニングされたトランスフォーマーは,データセットシフトによる非トーケン予測能力を示すことを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 20:22:06 GMT)
Tell Me What You Don't Know: Enhancing Refusal Capabilities of Role-Playing Agents via Representation Space Analysis and Editing [54.1]
我々は,文脈知識の競合要求,パラメトリック知識の競合要求,非競合要求を含む評価ベンチマークを開発する。ほとんどのRPAは、異なる競合要求に対して、大幅なパフォーマンスギャップを動作します。本稿では、競合する要求を拒否領域に都合よくシフトさせる軽量な表現編集手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:18:12 GMT)
Prompt Sliders for Fine-Grained Control, Editing and Erasing of Concepts in Diffusion Models [53.4]
概念スライダは、学習概念(属性/オブジェクト)によるきめ細かい画像制御と編集方法を導入したこのアプローチは、学習概念に使用されるローランドアダプタ(LoRA)のロードとアンロードにより、パラメータを追加し、推論時間を増加させる。そこで本研究では,テキストエンコーダを共有するモデル間で一般化可能な,テキスト埋め込みによる概念学習のための簡単なテキストインバージョン手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 01:02:30 GMT)
Search for Efficient Large Language Models [53.0]
大規模言語モデル(LLMs)は、人工知能研究の領域で長い間停滞してきた。軽量プルーニング、量子化、蒸留がLLMの圧縮に取り入れられ、メモリの削減と推論の加速を狙った。ほとんどのモデル圧縮技術は、最適アーキテクチャの探索を見越して重量最適化に重点を置いている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:32:12 GMT)
Towards General Text-guided Image Synthesis for Customized Multimodal Brain MRI Generation [51.3]
マルチモーダル脳磁気共鳴(MR)イメージングは神経科学や神経学において不可欠である。現在のMR画像合成アプローチは、通常、特定のタスクのための独立したデータセットで訓練される。テキスト誘導ユニバーサルMR画像合成モデルであるTUMSynについて述べる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:14:47 GMT)
Face Forgery Detection with Elaborate Backbone [50.9]
Face Forgery Detectionは、デジタル顔が本物か偽物かを決定することを目的としている。以前のFFDモデルは、偽造の手がかりを表現および抽出するために既存のバックボーンを直接使用していた。本稿では,実顔データセットを用いた自己教師型学習でVTネットワークを活用することで,バックボーンの事前トレーニングを提案する。次に、多様な偽の手がかりを抽出するバックボーンの能力を強化するために、競争力のあるバックボーンの微調整フレームワークを構築します。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:57:16 GMT)
SynChart: Synthesizing Charts from Language Models [50.7]
本研究は,LLMをデータ生成に単独で活用し,チャート理解に焦点をあてた競合するマルチモダリティモデルを開発する可能性を探る。約400万の多彩なチャートイメージと7500万以上の高密度アノテーションを含む大規模チャートデータセットであるSynChartを構築した。我々は,このデータセットを用いて4.2Bのグラフエキスパートモデルを訓練し,GPT-4Vを超え,ChartQAタスクでほぼGPT-4Oの性能を達成した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 00:18:12 GMT)
COHERENT: Collaboration of Heterogeneous Multi-Robot System with Large Language Models [49.2]
COHERENTは、異種マルチロボットシステムの協調のための新しいLCMベースのタスク計画フレームワークである。提案-実行-フィードバック-調整機構は,個々のロボットに対して動作を分解・割り当てするように設計されている。実験の結果,我々の研究は,成功率と実行効率の面で,従来の手法をはるかに上回っていることが明らかとなった。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:59:08 GMT)
COHERENT: Collaboration of Heterogeneous Multi-Robot System with Large Language Models [49.2]
COHERENTは、異種マルチロボットシステムの協調のための新しいLCMベースのタスク計画フレームワークである。提案-実行-フィードバック-調整機構は,個々のロボットに対して動作を分解・割り当てするように設計されている。実験の結果,我々の研究は,成功率と実行効率の面で,従来の手法をはるかに上回っていることが明らかとなった。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:59:08 GMT)
Disco4D: Disentangled 4D Human Generation and Animation from a Single Image [49.2]
textbfD4Dは、単一の画像から4Dの人間生成とアニメーションのための新しいフレームワークである。服を人体から遠ざける(SMPL-Xモデル) 鮮明なダイナミックスを備えた4Dアニメーションをサポートする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:46:06 GMT)
Differential Privacy Regularization: Protecting Training Data Through Loss Function Regularization [49.2]
ニューラルネットワークに基づく機械学習モデルのトレーニングには、機密情報を含む大きなデータセットが必要である。差分的にプライベートなSGD [DP-SGD] は、新しいモデルをトレーニングするために標準勾配降下アルゴリズム(SGD)を変更する必要がある。より効率的な方法で同じ目標を達成するための新しい正規化戦略が提案されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:59:32 GMT)
Critical spin models from holographic disorder [49.2]
連続ホログラフィーに存在しない準周期性障害を有するXXZスピン鎖の挙動について検討した。本研究は, 離散ホログラフィーモデルから対称性を導出した臨界相の存在を示唆するものである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:00:02 GMT)
How Transliterations Improve Crosslingual Alignment [48.9]
近年の研究では、アライメント目的を用いた多言語事前学習言語モデル(mPLM)が言語横断アライメントを改善することが示されている。本稿では, 言語間のアライメントを明示的に評価し, 翻訳に基づくアプローチにおける重要な要素を同定し, 性能向上に寄与する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 20:05:45 GMT)
Polarization-encoded quantum key distribution with a room-temperature telecom single-photon emitter [47.5]
単一光子源(SPS)は量子鍵分布(QKD)に直接適用できる GaN欠陥に基づく室温通信SPSを用いた分極符号化QKDの観測を行った。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:17:36 GMT)
Discovering the Gems in Early Layers: Accelerating Long-Context LLMs with 1000x Input Token Reduction [47.4]
大きな言語モデル(LLM)は、長いコンテキスト入力を扱う際、顕著な能力を示してきたが、これは計算リソースとレイテンシの増大によるものである。本研究では,LLM推論を高速化し,GPUメモリ使用量を削減するために,長期的ボトルネックに対する新たなアプローチを提案する。本稿では,LLMの初期レイヤをフィルタとして,入力トークンの選択と圧縮を行うアルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 23:14:47 GMT)
Towards Autonomous Supply Chains: Definition, Characteristics, Conceptual Framework, and Autonomy Levels [47.0]
パンデミックや地政学的な紛争など最近の世界的な混乱は、伝統的なサプライチェーンの脆弱性を著しく暴露している。パンデミックや地政学的な紛争など最近の世界的な混乱は、伝統的なサプライチェーンの脆弱性を著しく暴露している。自律的なサプライチェーン(ASC)が潜在的なソリューションとして登場し、乱流貿易環境における可視性、柔軟性、レジリエンスを高めている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:14:31 GMT)
MAPF-GPT: Imitation Learning for Multi-Agent Pathfinding at Scale [46.4]
マルチエージェントパスフィンディング(Multi-agent pathfinding)は、共有環境における複数のエージェントの衝突のないパスを見つけることを必要とする、難しい計算問題である。我々はMAPF-GPTと呼ばれるMAPF問題の基盤モデルを構築した。擬似学習を用いて、部分観測可能性の条件下での行動を生成するための準最適専門家軌道のセットに関する政策を訓練した。 MAPF-GPTは、様々な問題インスタンスにおいて、現在最も優れた学習可能なMAPF解法よりも優れていることを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:09:35 GMT)
RAP: Retrieval-Augmented Planner for Adaptive Procedure Planning in Instructional Videos [46.3]
本稿では,教育ビデオにおける適応的プロシージャ計画(Adaptive procedure planning)と呼ばれる,新しい実践的な設定を提案する。 RAPは自動回帰モデルアーキテクチャを用いて行動の結論を適応的に決定する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:20:39 GMT)
Vision-Language Model Fine-Tuning via Simple Parameter-Efficient Modification [46.3]
VLMのパラメータの微調整は、CLIPモデルの微調整が性能を低下させるため、事前訓練された知識を損なうと考えられている。 ClipFitはCLIPを微調整する手法で、余分なパラメータのオーバーヘッドを発生させることなく提案する。 ClipFitが0ショットCLIPの性能を平均調和平均精度7.27%向上できることを実証した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:07:18 GMT)
MixPolyp: Integrating Mask, Box and Scribble Supervision for Enhanced Polyp Segmentation [45.8]
MixPolypは、さまざまなアノテーションタイプ(マスク、ボックス、スクリブル)を単一のモデルに結合する。様々なアノテーションを扱うために、3つの新しい監視損失が導入された。 5つのデータセットの実験では、MixPolypの有効性が示されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:34:44 GMT)
Navigating the Nuances: A Fine-grained Evaluation of Vision-Language Navigation [45.4]
本研究では,視覚言語ナビゲーション(VLN)タスクのための新しい評価フレームワークを提案する。様々な命令カテゴリの現在のモデルをよりきめ細かいレベルで診断することを目的としている。フレームワークはタスクの文脈自由文法(CFG)を中心に構成されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 19:49:39 GMT)
Solar Active Regions Emergence Prediction Using Long Short-Term Memory Networks [45.0]
太陽表面における活動領域(AR)の形成を予測するために,Long Short-Term Memory(LSTM)モデルを開発した。音響パワーと磁束の時系列データセットを使用して、LSTMモデルを12時間前に連続強度を予測するために訓練する。これらの機械学習(ML)モデルは、次の磁束の出現と連続体強度の減少に伴う音響パワー密度の変動を捉えることができる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 23:09:46 GMT)
From angular coefficients to quantum observables: a phenomenological appraisal in di-boson systems [45.0]
マルチボソン過程のスピン構造にアクセスすることへの関心が高まっていることから, 双ボソン系の偏極係数とスピン相関係数について検討した。そこで本研究では,QCDとエレクトロオーク型の高次補正,オフシェルモデリング,およびフィデューシャルセレクションやニュートリノ再構成などの現実的な効果が避けられないことを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:30:54 GMT)
Effective (Floquet) Lindblad generators from spectral unwinding [45.0]
Floquet理論は、Floquet理論を用いることで、有効なジェネレータの探索を著しく促進できることを示す。この結果は, 複雑な多体系におけるFloquet Lindbladiansの工学的応用に関係している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:32:01 GMT)
MambaJSCC: Adaptive Deep Joint Source-Channel Coding with Generalized State Space Model [44.0]
MambaJSCCは、計算とパラメータのオーバーヘッドを低くして最先端のパフォーマンスを達成する。我々は,チャネル状態情報(CSI)をGSSMの初期状態に注入し,そのネイティブ応答を利用するCSI-ReST法を設計する。実験の結果,MambaJSCCは既存のJ SCC法より優れるだけでなく,パラメータサイズ,計算オーバーヘッド,推論遅延を大幅に低減することがわかった。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:37:51 GMT)
A Roadmap for Embodied and Social Grounding in LLMs [43.7]
大規模言語モデルとロボットシステムの融合は、ロボット分野における変革的パラダイムへと繋がった。 LLMの知識を経験的世界に根ざすことは、ロボット工学におけるLLMの効率を活かす重要な道であると考えられている。人間からインスピレーションを得て、この研究はエージェントが世界を把握し、経験するために必要な3つの要素に注意を向ける。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:09:23 GMT)
Decentralized Federated Learning with Gradient Tracking over Time-Varying Directed Networks [42.9]
本稿では,DSGTm-TVというコンセンサスに基づくアルゴリズムを提案する。グラデーショントラッキングとヘビーボールモーメントを取り入れて、グローバルな目的関数を最適化する。 DSGTm-TVでは、エージェントは近隣エージェントとの情報交換を用いて局所モデルパラメータと勾配推定を更新する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:23:16 GMT)
Guide-and-Rescale: Self-Guidance Mechanism for Effective Tuning-Free Real Image Editing [42.7]
本稿では,誘導機構による拡散サンプリングプロセスの修正に基づく新しい手法を提案する。本研究では,入力画像の全体構造を保存するための自己誘導手法について検討する。本稿では,人間の評価と定量的分析を通じて,提案手法が望ましい編集を可能にすることを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:44:21 GMT)
The Effect of Perceptual Metrics on Music Representation Learning for Genre Classification [42.1]
損失関数として知覚メトリクスで訓練されたモデルが知覚的に意味のある特徴を捉えることができることを示す。知覚的損失で訓練されたオートエンコーダから抽出した特徴を用いることで,音楽理解タスクのパフォーマンスが向上することが実証された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:29:21 GMT)
Looped Transformers for Length Generalization [42.0]
適応的なステップ数を持つループ変換器は長さの一般化を著しく向上することを示す。我々は,提案した学習アルゴリズムを用いてループ変換器を訓練し,様々なタスクに対して,高度に長大な一般化可能な解を学習することを確認する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:52:24 GMT)
Looped Transformers for Length Generalization [42.0]
適応的なステップ数を持つループ変換器は長さの一般化を著しく向上することを示す。我々は,提案した学習アルゴリズムを用いてループ変換器を訓練し,様々なタスクに対して,高度に長大な一般化可能な解を学習することを確認する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:52:24 GMT)
StreetSurfaceVis: a dataset of crowdsourced street-level imagery annotated by road surface type and quality [41.9]
ドイツから9,122枚のストリートレベルの画像からなる新しいデータセットであるStreetSurfaceVisを紹介した。多様な画像ソース間で高い精度を維持する頑健なモデルを実現することを目的としている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:24:35 GMT)
CVT-Occ: Cost Volume Temporal Fusion for 3D Occupancy Prediction [41.7]
視覚に基づく3次元占有予測は、深度推定における単眼視の固有の限界によって著しく困難である。本稿では,3次元占有予測の精度を向上させるために,時間とともにボクセルの幾何学的対応を通して時間的融合を導入する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:34:27 GMT)
CVT-Occ: Cost Volume Temporal Fusion for 3D Occupancy Prediction [41.7]
視覚に基づく3次元占有予測は、深度推定における単眼視の固有の限界によって著しく困難である。本稿では,3次元占有予測の精度を向上させるために,時間とともにボクセルの幾何学的対応を通して時間的融合を導入する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:34:27 GMT)
Towards Underwater Camouflaged Object Tracking: An Experimental Evaluation of SAM and SAM 2 [41.6]
本研究は,UW-COTという大規模水中カモフラージュ物体追跡データセットを提案する。本稿では,複数の高度な視覚オブジェクト追跡手法の実験的評価と,画像と映像のセグメンテーションの最新の進歩について述べる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:10:03 GMT)
SEN12-WATER: A New Dataset for Hydrological Applications and its Benchmarking [41.0]
気候と干ばつの増加は、世界中の水資源管理に重大な課題をもたらしている。本稿では,干ばつ関連分析のためのエンドツーエンドディープラーニングフレームワークを用いたベンチマークとともに,新しいデータセットであるSEN12-WATERを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:50:59 GMT)
Data-Centric AI Governance: Addressing the Limitations of Model-Focused Policies [40.9]
強力なAI能力に関する現在の規制は、"境界"または"フロンティア"モデルに絞られている。これらの用語は曖昧で一貫性のない定義であり、ガバナンス活動の不安定な基盤につながります。本稿では,モデルがもたらすリスクを評価する上で,データセットのサイズや内容が重要な要因であることを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:59:01 GMT)
Turn Every Application into an Agent: Towards Efficient Human-Agent-Computer Interaction with API-First LLM-Based Agents [40.9]
AXISは、ユーザインタフェースアクションよりもアプリケーションプログラミングインターフェース(API)を通してアクションを優先順位付けする、LLMベースの新しいエージェントフレームワークである。 Office Wordでの実験では、AXISはタスク完了時間を65%-70%削減し、認知負荷を38%-53%削減し、精度は97%-98%と人間と比較した。また、すべてのアプリケーションをエージェントに変え、エージェント中心のオペレーティングシステム(Agent OS)への道を開く可能性についても検討している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:58:08 GMT)
Dynamic Obstacle Avoidance through Uncertainty-Based Adaptive Planning with Diffusion [40.8]
本稿では,行動予測の不確実性に基づいた適応的生成計画手法を提案する。本手法は, 衝突回避性能を維持しつつ, 頻繁で計算コストが高く, 冗長な再計画の必要性を最小限に抑える。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:03:58 GMT)
Programming Every Example: Lifting Pre-training Data Quality like Experts at Scale [40.7]
我々は、データ精錬をプログラミングタスクとして扱う新しいフレームワーク、ProX(Programming Every Example)を紹介します。実験結果から, ProX処理データ上で事前学習したモデルは, 元のデータか, 他の選択手法でフィルタリングしたデータよりも2%以上優れていた。われわれは100Bコーパス、モデルと共にProXをオープンソース化し、再現可能な研究と将来のイノベーションのためのトレーニングと実装の詳細をすべて共有しています。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:28:13 GMT)
Toward Tiny and High-quality Facial Makeup with Data Amplify Learning [40.4]
小型メイクモデル「TinyBeauty」とともに「データ増幅学習」を提案する。 DALの中核となる考え方は、DDA(Diffusion-based Data Amplifier)を使用して、モデルトレーニングのために制限されたイメージを"増幅"することにある。 TinyBeautyはiPhone 13で460fpsという驚くべき速度を実現している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 10:34:03 GMT)
Scalable Learning of Segment-Level Traffic Congestion Functions [40.3]
本研究では,グローバルスケールおよびセグメントレベルの粒度で交通渋滞関数を識別するためのデータ駆動型フレームワークを提案する。道路毎に異なるパラメータの集合を推定する手法とは対照的に,大都市圏のすべての道路を横断する単一のブラックボックス関数を学習する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:50:55 GMT)
The Effect of Lossy Compression on 3D Medical Images Segmentation with Deep Learning [40.0]
我々は、20倍の圧縮損失がディープニューラルネットワーク(DNN)によるセグメンテーション品質に悪影響を及ぼさないことを示した。さらに、圧縮データに基づいて訓練されたDNNモデルを用いて、圧縮されていないデータを予測する能力を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:31:37 GMT)
TroL: Traversal of Layers for Large Language and Vision Models [39.3]
大言語とビジョンモデル(LLVM)は、大言語モデル(LLM)の一般化力によって駆動されている。 GPT-4VのようなクローズドソースLLVMと互換性のある既存のオープンソースLLVMは、大きすぎると考えられていることが多い。 1.8B, 3.8B, 7B LLMモデルサイズ, Traversal of Layers (TroL) を持つLLVMファミリーを新たに提案する。我々は、TroLが単純な層トラバースアプローチを採用しているが、より大きなモデルサイズを持つオープンソースのLLVMよりも効率的に性能を向上することを示した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:17:21 GMT)
Enhancing Feature Selection and Interpretability in AI Regression Tasks Through Feature Attribution [38.5]
本研究では、回帰問題に対する入力データの非形式的特徴をフィルタリングする特徴属性法の可能性について検討する。我々は、初期データ空間から最適な変数セットを選択するために、統合グラディエントとk平均クラスタリングを組み合わせた機能選択パイプラインを導入する。提案手法の有効性を検証するため, ターボ機械の開発過程における羽根振動解析を実世界の産業問題に適用した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:50:51 GMT)
Hyperbolic Metric Learning for Visual Outlier Detection [38.1]
Out-Of-Distribution (OOD)検出は、ディープラーニングモデルを安全クリティカルなアプリケーションにデプロイするために重要である。本研究は,OOD検出における双曲幾何学の強みを利用する計量フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 10:13:14 GMT)
Enhancing Investment Opinion Ranking through Argument-Based Sentiment Analysis [37.9]
本研究は,レコメンデーションシステムの有効性を改善するために,二元的議論マイニング手法を導入する。最初の戦略は、物価の目標と終了の相違を評価指標として使うことです。第2の戦略は、投資家の意見を採点するために議論的マイニングの原則を適用し、その後これらのスコアでランク付けする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 23:00:20 GMT)
Continual Adversarial Defense [37.4]
防衛システムは、敵データをオンラインで継続的に収集し、迅速に自己改善する。新たな攻撃への継続的な適応は、壊滅的な忘れ、少数ショット適応、メモリ効率適応、クリーンデータと逆データの両方において高い精度である。特にCADは、前回の攻撃に対して優れた性能を維持しつつ、最小限の予算と低コストの防衛失敗に迅速に適応することができる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 00:07:50 GMT)
World Model-based Perception for Visual Legged Locomotion [37.2]
我々は環境のワールドモデルを構築し、世界モデルに基づいたポリシーを学習する。 World Model-based Perceptionは、トラバーサビリティとロバストネスにおいて最先端のベースラインよりも優れています。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:47:31 GMT)
Quantum Advantage in Distributed Sensing with Noisy Quantum Networks [37.2]
分散センシングにおける量子優位性はノイズの多い量子ネットワークで実現できることを示す。この量子的優位性には絡み合いが必要であるが、真の多部絡みは一般に不要である。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:55:07 GMT)
Emotional Dimension Control in Language Model-Based Text-to-Speech: Spanning a Broad Spectrum of Human Emotions [37.1]
現在の感情的テキスト音声システムは、人間の感情の幅広い範囲を模倣する際の課題に直面している。本稿では,喜び,覚醒,支配の制御を容易にするTTSフレームワークを提案する。 TTSトレーニング中に感情的な音声データを必要とせずに、感情的なスタイルの多様性を合成することができる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:16:16 GMT)
EventHDR: from Event to High-Speed HDR Videos and Beyond [36.9]
本稿では,イベントシーケンスから高速HDR映像を再構成する畳み込みニューラルネットワークを提案する。我々はまた、ペア化された高速HDRビデオとイベントストリームの実際のデータセットを収集する新しい光学システムを開発した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:32:07 GMT)
Harnessing Diversity for Important Data Selection in Pretraining Large Language Models [36.9]
textttQuadは、データの影響を利用して、最先端の事前トレーニング結果を達成することによって、品質と多様性の両方を考慮する。多様性のために、textttQuadはデータセットを、各クラスタ内の同様のデータインスタンスと、異なるクラスタにわたる多様なインスタンスにクラスタする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:49:29 GMT)
Space-Based Quantum Internet: Entanglement Distribution in Time-Varying LEO Constellations [36.8]
本稿では、LEO衛星ネットワークの動的特性を活用して、絡み合い分布効率を向上させる新しいフレームワークを提案する。提案手法は,従来の手法と比較して,絡み合いの低減とスループットの向上に優れた性能を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:33:08 GMT)
Adverse Weather Optical Flow: Cumulative Homogeneous-Heterogeneous Adaptation [36.6]
実際の悪天候光流に対する累積均質不均一適応フレームワークを提案する。具体的には, 静的気象は, シーンの内在的な動きを変化させることのない, 深度結合同質な特徴を有する。合成-実遷移の場合、コストボリューム相関は、合成ドメインと実際の劣化ドメインの類似した統計ヒストグラムを共有することが判明した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:05:03 GMT)
Robotic Backchanneling in Online Conversation Facilitation: A Cross-Generational Study [36.1]
日本は、人口の認知低下率の増加や介護者の不足など、高齢化社会にまつわる多くの課題に直面している。人工知能(AI)、特に人間とコミュニケーション可能な、社会的に具体化された知的エージェントやロボットを使ったソリューションの探求が始まっている。本研究では,認知低下防止を目的としたグループ会話プロトコルのファシリテータとして機能するロボットをユーザスタディで評価した。我々は、ロボットの受容性を高め、グループ会話体験を楽しむために、自然な人間の話し方であるバックチャネルを使用するように、ロボットを改造した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:08:43 GMT)
PACE: marrying generalization in PArameter-efficient fine-tuning with Consistency rEgularization [35.9]
PACE は PArameter- efficient fine-tuning with Consistency rEgularization の一般化である。 PACEは、拡張一般化のための勾配を暗黙的に正規化するだけでなく、微調整および事前訓練されたモデルも暗黙的に整列して知識を保持することを示す。 PACEは、VTAB-1k、FGVC、少数ショット学習、ドメイン適応の4つの視覚適応タスクにおいて、既存のPEFTメソッドよりも優れている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:56:00 GMT)
Dynamic-Width Speculative Beam Decoding for Efficient LLM Inference [35.7]
大規模言語モデル(LLM)は多くの実世界のタスクで優れたパフォーマンスを示している。投機的復号化は有望な解決策として現れ、より小さな補助モデルを利用して将来のトークンをドラフトしている。本稿では,ビームサンプリングによる投機的復号化の新たな統合について検討する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 02:20:42 GMT)
A Survey of Low-bit Large Language Models: Basics, Systems, and Algorithms [34.8]
大規模言語モデル (LLM) は自然言語処理において顕著な進歩を遂げている。しかし、高価なメモリと計算の要求は、その実践的な展開に重大な課題をもたらしている。低ビット量子化は、モデルパラメータのビット幅を減らすことでこれらの課題を緩和するための重要なアプローチとして現れている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:38:02 GMT)
Keeping Up with the Language Models: Systematic Benchmark Extension for Bias Auditing [33.3]
我々は, LM生成語彙変動, 逆フィルタリング, 人間の検証を組み合わせることで, 既存のNLIのバイアスベンチマークを拡張した。 BBNLI-nextは最先端のNLIモデルの精度を95.3%から57.5%に下げることを示した。バイアスとモデル脆性の両方を考慮したバイアス対策を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:06:31 GMT)
HDFlow: Enhancing LLM Complex Problem-Solving with Hybrid Thinking and Dynamic Workflows [33.0]
大規模言語モデル(LLM)を用いた複雑な推論のための新しいフレームワーク HDFlow を提案する。このアプローチは,1) 複雑な問題をより管理可能なサブタスクに自動的に分解するDynamicという,ゆっくりと意図的な推論のための新しいアプローチ,2) 問題複雑性に基づいた高速で遅い思考を動的に結合するHybrid Thinkingという2つの主要なコンポーネントから構成される。 4つの推論ベンチマークの実験により、動的データセットによる遅い思考がChain-of-Thoughtを著しく上回り、ハイブリッド思考は計算効率と性能の効果的なバランスを保ちながら、最も高い精度を達成することが示された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 23:52:17 GMT)
Symbolic Music Generation with Non-Differentiable Rule Guided Diffusion [33.0]
音楽規則は、音の密度やコード進行などの音の特徴に象徴的な形で表されることが多い。本稿では,ルール関数の前方評価のみを必要とする新しいガイダンス手法である制御誘導(SCG)を提案する。 SCGは、非微分不可能なルールに対するトレーニング不要のガイダンスを初めて達成する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:12:27 GMT)
Results of the Big ANN: NeurIPS'23 competition [32.1]
2023年、NeurIPS 2023で開かれたBig ANN Challengeは、データ構造と検索アルゴリズムのインデックス化における最先端の進歩に焦点を当てた。本稿では,コンペティショントラック,データセット,評価指標,そして,トップパフォーマンスの応募の革新的なアプローチについて要約する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 23:24:56 GMT)
Moner: Motion Correction in Undersampled Radial MRI with Unsupervised Neural Representation [31.4]
放射状MRIにおける運動補正(MoCo)は、被験者の動作の予測不能のため難しい問題である。剛体動乱k空間データからアーチファクトフリーのMR画像と正確な動きを共同で解き、教師なしのMoCo法であるMonerを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:27:29 GMT)
CJEval: A Benchmark for Assessing Large Language Models Using Chinese Junior High School Exam Data [31.3]
CJEvalは中国の中学校のエクサム評価に基づくベンチマークである。 26,136個のサンプルから成っている。このベンチマークを用いて,LLMの潜在的な応用性を評価し,その性能を総合的に分析した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:35:35 GMT)
Spotlight Text Detector: Spotlight on Candidate Regions Like a Camera [31.2]
シーンテキストに有効なスポットライトテキスト検出器(STD)を提案する。スポットライト校正モジュール(SCM)と多変量情報抽出モジュール(MIEM)で構成される。我々のSTDは、様々なデータセットの既存の最先端手法よりも優れている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:19:09 GMT)
Focus Entirety and Perceive Environment for Arbitrary-Shaped Text Detection [31.2]
セグメンテーションベースのアプローチは、フレキシブルピクセルレベルの予測のため、顕著な競合候補として現れている。そこで本研究では,フォーカス全体モジュールと知覚環境モジュールからなる多情報レベルの任意形テキスト検出器を提案する。後者は、領域レベルの情報を抽出し、画素近傍の正のサンプルの分布にフォーカスするようモデルに促す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:24:37 GMT)
Mitigating the Bias of Large Language Model Evaluation [30.7]
LLM-as-a-Judgeのバイアスに関する系統的研究を提案する。クローズドソース・ジャッジモデルでは、表面品質の重要性を緩和するためにキャリブレーションを適用する。オープンソース・ジャッジ・モデルでは, 対照的な学習によってバイアスを軽減し, 学習から逸脱するが, 表面品質が向上する負のサンプルをキュレートする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:52:44 GMT)
TalkinNeRF: Animatable Neural Fields for Full-Body Talking Humans [30.4]
モノクラービデオからフルボディ音声のための動的ニューラルラジアンス場(NeRF)を学習する新しいフレームワークを提案する。本研究では,全身的な4次元動作を表現したNeRFベースの統合ネットワークであるTalkinNeRFを提案する。本研究は,手話の細粒化と表情によるフルボディ音声のアニメーションのための最先端性能を実証する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:51:57 GMT)
Multi-objective Evolution of Heuristic Using Large Language Model [29.3]
ヒューリスティックスは、様々な探索と最適化の問題に取り組むために一般的に用いられる。最近の研究は、その強力な言語と符号化能力を活用して、大規模言語モデル(LLM)を自動検索に取り入れている。本稿では,多目的最適化問題として探索をモデル化し,最適性能以外の実践的基準を導入することを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:32:41 GMT)
TaskMet: Task-Driven Metric Learning for Model Learning [29.0]
ディープラーニングモデルは、トレーニング手順が認識していない可能性のある下流タスクにデプロイされることが多い。本稿では,モデルのパラメータよりも1段階深いタスク損失信号を用いて,モデルがトレーニングした損失関数のパラメータを学習する。このアプローチは、最適な予測モデル自体を変更するのではなく、下流のタスクにとって重要な情報を強調するためにモデル学習を変更する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:03:12 GMT)
Detecting Adversarial Data via Perturbation Forgery [28.6]
逆検出は、自然データと逆データの間の分布とノイズパターンの相違に基づいて、データフローから逆データを特定し、フィルタリングすることを目的としている。不均衡および異方性雑音パターンを回避した生成モデルに基づく新しい攻撃本研究では,ノイズ分布の摂動,スパースマスク生成,擬似対向データ生成を含む摂動フォージェリを提案し,未知の勾配に基づく,生成モデルに基づく,物理的対向攻撃を検出することができる対向検出器を訓練する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 00:09:58 GMT)
The Differential and Boomerang Properties of a Class of Binomials [28.5]
F_2,u(x)=x2big (1+ueta(x)big)$ over $mathbbF_q$。我々は citebudaghyan 2024arithmetization において、$F_2,u$ が APN 函数であるような無限に多くの$q$ と $u$ が存在するという予想を否定する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:10:48 GMT)
The Differential and Boomerang Properties of a Class of Binomials [28.5]
F_2,u(x)=x2big (1+ueta(x)big)$ over $mathbbF_pn$。任意の$uinmathbbF_pn*$に対して$F_2,u$の均一性を決定する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:10:48 GMT)
Pruning Multilingual Large Language Models for Multilingual Inference [28.4]
本研究では,非英語言語におけるMLLMのゼロショット性能を向上させる方法について検討する。まず、翻訳を行う際のMLLMの挙動を分析し、翻訳過程において重要な役割を果たす大きな特徴があることを明らかにする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:15:50 GMT)
Post-hoc Reward Calibration: A Case Study on Length Bias [28.3]
リワードモデル(RM)は、トレーニングデータに突発的な相関を利用してバイアスを発生させることができる。これらのバイアスは、誤った出力ランキング、準最適モデル評価、望ましくない振る舞いの増幅につながる可能性がある。本稿では、追加データやトレーニングを使わずにバイアスを修正するという課題に対処する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:30:42 GMT)
Non-backtracking Graph Neural Networks [28.2]
本稿では、以前に訪れたノードからメッセージを取り込むことなくメッセージを更新する非バックトラックグラフニューラルネットワーク(NBA-GNN)を提案する。理論的には、NBA-GNNがGNNの過度な監視を緩和し、ブロック回復のための非追跡更新の印象的な性能を確立する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:19:47 GMT)
Robust Scene Change Detection Using Visual Foundation Models and Cross-Attention Mechanisms [27.9]
本稿では,視覚基礎モデルDINOv2の頑健な特徴抽出機能を活用したシーン変化検出手法を提案する。我々は,VL-CMU-CDとPSCDの2つのベンチマークデータセットに対するアプローチと,その視点評価バージョンについて検討した。実験では,F1スコアにおいて,特に画像ペア間の幾何学的変化を伴うシナリオにおいて,顕著な改善が示された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:55:27 GMT)
Towards Unified 3D Hair Reconstruction from Single-View Portraits [27.4]
そこで本研究では,統一パイプラインによるヘアタイプの一視点3D再構成を実現するための新しい手法を提案する。本実験は, 単一視像からの編み型3次元毛髪と非編み型3次元毛髪の再構築が可能であることを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:21:31 GMT)
Predictive Covert Communication Against Multi-UAV Surveillance Using Graph Koopman Autoencoder [27.2]
低確率検出(LPD)通信は、無線周波数(RF)信号の存在を隠蔽し、監視を回避することを目的としている。 UAVの将来の位置を正確に予測することは、リアルタイムのLPD通信を可能にするために不可欠である。マルチUAV監視下での地上アドホックネットワークにおける検出可能性の最小化を目的とした,予測被覆通信と呼ばれる新しいフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:02:45 GMT)
HazeSpace2M: A Dataset for Haze Aware Single Image Dehazing [27.0]
本研究では HazeSpace2M データセットを紹介した。これは Haze 型分類によるデハージングを強化するために設計された 200 万以上の画像の集合である。このデータセットを用いて, ヘイズ型分類手法を導入し, 特殊デハザーを用いてヘイズ画像の鮮明化を行う。本手法は, 実生活におけるヘイズ画像の鮮明さを向上させるために, 型別脱ヘイズを適用する前に, ヘイズタイプを分類する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 23:47:25 GMT)
PMSS: Pretrained Matrices Skeleton Selection for LLM Fine-tuning [26.9]
ローランク適応(LoRA)とその変種は、過度の推論コストを回避する能力により、最近多くの関心を集めている。本稿では,事前学習した重みに固有の意味情報と言語情報を活用しながら,低コストで高階更新を実現するPMSSを提案する。 PMSSは、トレーニング可能なパラメータがはるかに少ないタスク間で、LoRAや他の微調整メソッドよりも優れていることを示す実験である。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:20:24 GMT)
Learning with Dynamics: Autonomous Regulation of UAV Based Communication Networks with Dynamic UAV Crew [26.1]
Unmanned Aerial Vehicle (UAV) ベースの通信ネットワーク (UCN) は将来のモバイルネットワークにおいて重要なコンポーネントである。強化学習(RL)は、環境モデルから解放された適応的な意思決定能力に起因した、有望なソリューションである。本稿では、動的UAVセットを与えられた適応UCN制御のためのRLベースの戦略設計について述べる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:57:04 GMT)
Statewide Visual Geolocalization in the Wild [26.0]
本研究では,空中参照画像のデータベースと照合することにより,州規模の検索領域内において野生で撮影されたストリートビュー画像の位置を予測できる手法を提案する。探索領域を地理的なセルに分割し、セルと対応する画像を、テスト時に検索を行うために使用される共同埋め込み空間にマッピングするモデルを訓練する。実験により、この方法はマサチューセッツ州のクラウドソーシングプラットフォームMapillaryにアップロードされた全ストリートビュー写真の60.6%を、地道な場所の50m以内にローカライズすることに成功した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:18:19 GMT)
Pre-Finetuning with Impact Duration Awareness for Stock Movement Prediction [25.7]
本稿では、投資家の意見に基づいて、影響期間を推定する新しいデータセット、Impact Duration Estimation dataset(IDED)を紹介する。本研究は,IDEDを用いた言語モデルの構築により,テキストベースのストックムーブメント予測の性能向上が期待できることを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 23:06:55 GMT)
Historical Trajectory Assisted Zeroth-Order Federated Optimization [25.4]
フェデレートラーニング(Federated Learning)は、モデルを個別にトレーニングし、モデルの更新をアグリゲーションにアップロードすることを可能にする分散学習フレームワークである。勾配情報が得られない状況では、勾配をゼロオーダー情報から推定する必要がある。勾配推定法を改善するための非等方的サンプリング法を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:01:08 GMT)
Generative Adversarial Model-Based Optimization via Source Critic Regularization [25.2]
本稿ではアダプティブ・ソース・批評家正規化(aSCR)を用いた生成逆モデルに基づく最適化を提案する。 ASCRは、サロゲート関数が信頼できる設計空間の領域に最適化軌道を制約する。本稿では,aSCRを標準的なベイズ最適化に活用することにより,オフライン生成設計タスクのスイートにおいて,既存の手法よりも優れた性能を発揮することを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:07:41 GMT)
Bi-TTA: Bidirectional Test-Time Adapter for Remote Physiological Measurement [25.1]
リモート光胸腺撮影(r)は、カメラのみを用いて生理的信号を監視する非侵襲的アプローチとして注目されている。約束にもかかわらず、新しいドメインへのrモデルの適応性は、生理的信号の環境感受性のために妨げられている。 Bi-TTA(Bidirectional Test-Time Adapter)フレームワークについて紹介する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 19:55:20 GMT)
SynTQA: Synergistic Table-based Question Answering via Mixture of Text-to-SQL and E2E TQA [25.1]
テキスト・ツー・パースとエンドツーエンド質問応答(E2E TQA)は、表に基づく質問回答タスクの2つの主要なアプローチである。複数のベンチマークで成功したが、まだ比較されておらず、相乗効果は未解明のままである。ベンチマークデータセットの最先端モデルを評価することによって、さまざまな長所と短所を識別する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:18:45 GMT)
DemoRank: Selecting Effective Demonstrations for Large Language Models in Ranking Task [24.8]
本稿では,文節ランキングタスクにおいて,コンテキスト内デモを適切に選択する方法について検討する。ランキングタスクのためのデモ選択フレームワークであるDemoRankを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:36:49 GMT)
Holistic Automated Red Teaming for Large Language Models through Top-Down Test Case Generation and Multi-turn Interaction [24.5]
本研究では, 対角的, きめ細かなリスク分類に基づいて, テストケースの多様性を拡大する自動紅茶造法を提案する。提案手法は,新しい微調整戦略と強化学習技術を活用し,人的手法で多ターン探索を容易にする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:44:48 GMT)
ManiFoundation Model for General-Purpose Robotic Manipulation of Contact Synthesis with Arbitrary Objects and Robots [24.0]
汎用ロボットが幅広い操作タスクをこなせるようなモデルを開発する必要がある。本研究は,汎用ロボット操作の基礎モデルを構築するための包括的枠組みを導入する。私たちのモデルは、平均的な成功率を約90%達成します。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 04:21:06 GMT)
Enhancing Temporal Sensitivity and Reasoning for Time-Sensitive Question Answering [24.0]
Time-Sensitive Question Answering (TSQA)は、複数の時間進化事実を含む特定の時間的文脈を効果的に活用することを要求する。本稿では,時間的認知と推論を時間的情報認識の埋め込みとグラニュラコントラスト強化学習を通じて促進する新しい枠組みを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:13:21 GMT)
Disentangling Questions from Query Generation for Task-Adaptive Retrieval [22.9]
本研究では,BeIRベンチマークで表現された広範囲な検索意図に適応するクエリジェネレータEGGを提案する。提案手法は,従来よりも47倍小さいクエリジェネレータを用いて,探索対象の少ない4つのタスクにおいて,ベースラインと既存モデルの性能を向上する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 02:53:27 GMT)
Enabling Auditory Large Language Models for Automatic Speech Quality Evaluation [22.7]
音声品質評価は通常、平均評価スコア(MOS)や話者類似度(SIM)など、複数の側面から音声を評価する必要がある。本稿では,最近導入された聴覚大言語モデル(LLM)を用いた音声品質自動評価手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:44:44 GMT)
Blox-Net: Generative Design-for-Robot-Assembly Using VLM Supervision, Physics Simulation, and a Robot with Reset [22.7]
GDfRA(Generative Design-for-Robot-Assembly)という新しい問題を紹介します。このタスクは、自然言語のプロンプト(例えば'giraffe')と3Dプリントブロックのような利用可能な物理コンポーネントの画像に基づいてアセンブリを生成する。本稿では、生成視覚言語モデルとコンピュータビジョン、摂動解析、運動計画、物理ロボット実験の確立した手法を組み合わせたGDfRAシステムであるBlox-Netを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:42:20 GMT)
Zero-resource Hallucination Detection for Text Generation via Graph-based Contextual Knowledge Triples Modeling [22.1]
オープンな回答を持つテキスト生成のための幻覚検出はより困難である。外部資源のない長いテキストにおける幻覚の検出に関する最近の研究は、一貫性の比較を行っている。テキスト生成のためのグラフベースの文脈認識(GCA)幻覚検出を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 01:55:29 GMT)
MambaTalk: Efficient Holistic Gesture Synthesis with Selective State Space Models [22.0]
マルチモーダル統合によるジェスチャーの多様性とリズムを向上させるMambaTalkを紹介する。我々の手法は最先端のモデルの性能と一致するか超えている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:33:37 GMT)
Semi-Supervised Cognitive State Classification from Speech with Multi-View Pseudo-Labeling [21.8]
ラベル付きデータの欠如は、音声分類タスクにおいて共通の課題である。そこで我々は,新しい多視点擬似ラベル手法を導入したセミスーパーバイザードラーニング(SSL)フレームワークを提案する。感情認識と認知症検出タスクにおけるSSLフレームワークの評価を行った。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:51:19 GMT)
Is This a Bad Table? A Closer Look at the Evaluation of Table Generation from Text [21.7]
テーブルの品質評価のための既存の尺度は、テーブルの全体的なセマンティクスをキャプチャすることができない。テーブルのセマンティクスをキャプチャするテーブル評価戦略であるTabEvalを提案する。提案手法を検証するために,1250種類のウィキペディアテーブルのテキスト記述からなるデータセットをキュレートする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:27:50 GMT)
Demo: SGCode: A Flexible Prompt-Optimizing System for Secure Generation of Code [21.4]
本稿では,大規模言語モデル(LLM)でセキュアなコードを生成するフレキシブルなプロンプト最適化システムであるSGCodeを紹介する。これは、LLMとセキュリティツールを軽量な生成逆グラフニューラルネットワークと組み合わせて、生成されたコードのセキュリティ脆弱性を検出し、修正することで、プロンプトを最適化するアプローチです。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:17:27 GMT)
RoleBreak: Character Hallucination as a Jailbreak Attack in Role-Playing Systems [20.8]
大規模言語モデル(LLM)を利用したロールプレイングシステムは,感情コミュニケーションアプリケーションにおいてますます影響力を増している。これらのシステムは、事前に定義されたキャラクターロールから逸脱し、意図されたペルソナと矛盾しない応答を生成するという、キャラクター幻覚の影響を受けやすい。本稿では,RoleBreakフレームワークを導入し,攻撃的視点からキャラクターの幻覚を初めて体系的に分析する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:23:46 GMT)
Progressive Representation Learning for Real-Time UAV Tracking [20.8]
本研究では,UAV追跡のための新しいプログレッシブな表現学習フレームワークであるPRL-Trackを提案する。粗い表現学習では、外観情報と意味情報に依存する2つの革新的な規制が、外観干渉を緩和し、意味情報をキャプチャするために設計されている。表現の微妙な学習のために、粗いオブジェクト表現を介在させる新しい階層的モデリングジェネレータを開発した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:16:32 GMT)
Speech Robust Bench: A Robustness Benchmark For Speech Recognition [20.8]
Speech Robust Bench (SRB) は、さまざまな汚職に対するASRモデルの堅牢性を評価するためのベンチマークである。 SRBは114の入力摂動で構成されており、ASRモデルが野生に展開する際の不均一な破損をシミュレートする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 00:28:55 GMT)
A QoE-Aware Split Inference Accelerating Algorithm for NOMA-based Edge Intelligence [20.7]
本稿では,エッジインテリジェンスにおける分割推論の高速化を目的として,効率的な資源割当アルゴリズムを提案する。 ERAは、最適なモデル分割戦略とリソース割り当て戦略を見つけるために、リソース消費、QoE、および推論遅延を考慮に入れます。実験結果から,ERAの性能は従来の研究よりも優れていることが示された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 01:09:45 GMT)
Speech Recognition Rescoring with Large Speech-Text Foundation Models [20.1]
大規模言語モデル(LLM)は、大量のテキストデータを活用することで、人間の言語を理解する能力を示した。自動音声認識(ASR)システムは、しばしば利用可能な転写音声データによって制限される。最近の多モーダルな言語モデルでは、強い音声言語理解が示されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:17:23 GMT)
Projective Proximal Gradient Descent for A Class of Nonconvex Nonsmooth Optimization Problems: Fast Convergence Without Kurdyka-Lojasiewicz (KL) Property [20.0]
非滑らかな最適化問題は、学習にとって重要かつ困難である。本稿では,PSGDの高速収束を示す新しい解析法について述べる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:41:55 GMT)
Distribution Backtracking Builds A Faster Convergence Trajectory for Diffusion Distillation [19.9]
本研究では,拡散モデルのサンプリング速度を高速化する分散バックトラック蒸留(DisBack)を提案する。 DisBackは既存の蒸留法よりも高速で収束性が高く、ImageNet 64x64データセットのFIDスコアは1.38である。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:05:05 GMT)
Improving the Stability and Efficiency of Diffusion Models for Content Consistent Super-Resolution [18.7]
画像超解像 (SR) 結果の視覚的品質を高めるために, 予め訓練した潜伏拡散モデル (DM) の生成先行が大きな可能性を示唆している。本稿では、生成SR過程を2段階に分割し、DMを画像構造再構築に、GANを細かな細部改善に使用することを提案する。トレーニングを済ませると、提案手法、すなわちコンテンツ一貫性超解像(CCSR)は、推論段階における異なる拡散ステップの柔軟な利用を可能にする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:13:27 GMT)
The Vizier Gaussian Process Bandit Algorithm [18.7]
Google Vizierは、数百万の最適化を実行し、Googleの多くのリサーチとプロダクションシステムを加速した。本稿では,Open Source Vizierが提供するデフォルトアルゴリズムの実装の詳細と設計選択について論じる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:14:33 GMT)
MegaFake: A Theory-Driven Dataset of Fake News Generated by Large Language Models [18.7]
我々は、社会心理学の観点からフェイクニュースの作成を分析する。我々は LLM に基づく理論フレームワーク LLM-Fake Theory を開発した。我々はMegaFakeデータセットを評価するために包括的な分析を行う。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:21:26 GMT)
Learning Utilities from Demonstrations in Markov Decision Processes [18.2]
本稿では,実用機能を通じてエージェントのリスク態度を明確に表現する,マルコフ決定過程(MDP)の行動モデルを提案する。そこで我々は,MDPにおける実演から実用機能を通じて符号化された,観察対象者のリスク態度を推定するタスクとして,ユーティリティ学習問題を定義した。我々は, UL を有限データ型で証明可能な2つのアルゴリズムを考案し, サンプルの複雑さを解析する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:01:15 GMT)
Pose-Guided Fine-Grained Sign Language Video Generation [18.2]
本稿では,細粒度かつ動きに一貫性のある手話ビデオを生成するための新しい Pose-Guided Motion Model (PGMM) を提案する。まず,光学式フローワープによる特徴量の変形を解消する新しい粗い運動モジュール(CMM)を提案する。第2に、RGBのモーダル融合とポーズ特徴を導く新しいPose Fusion Module (PFM)を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:54:53 GMT)
GraphLoRA: Structure-Aware Contrastive Low-Rank Adaptation for Cross-Graph Transfer Learning [17.9]
グラフニューラルネットワーク(GNN)は、様々なグラフ解析タスクを扱うのに顕著な習熟度を示した。汎用性にもかかわらず、GNNはトランスファービリティにおいて重大な課題に直面し、現実のアプリケーションでの利用を制限している。グラフ領域によく訓練されたGNNを転送するための有効かつパラメータ効率のよいGraphLoRAを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:57:42 GMT)
Erase then Rectify: A Training-Free Parameter Editing Approach for Cost-Effective Graph Unlearning [17.9]
グラフアンラーニングは、訓練されたグラフニューラルネットワーク(GNN)からノード、エッジ、属性の影響を排除することを目的としている。既存のグラフアンラーニング技術は、しばしば残りのデータに対する追加のトレーニングを必要とし、かなりの計算コストをもたらす。本稿では,2段階の学習自由アプローチであるETR(Erase then Rectify)を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:20:59 GMT)
Zeroth-Order Policy Gradient for Reinforcement Learning from Human Feedback without Reward Inference [17.8]
本稿では,報酬推論を伴わない2つのRLHFアルゴリズムを提案する。鍵となる考え方は、人間の嗜好と異なる局所値関数を推定し、ゼロ階勾配近似器でポリシー勾配を近似することである。以上の結果から,報酬推論なしで一般RLHF問題の解法が確立できることが示唆された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:20:11 GMT)
FedRepOpt: Gradient Re-parameterized Optimizers in Federated Learning [17.6]
フェデレートラーニング(FL)は、エッジデバイス上で分散型に機械学習モデルをトレーニングするためのプライバシ保護手法として登場した。モデルのサイズが大きくなるにつれて、エッジデバイス上の勾配更新の頻度が減少し、最適なトレーニング結果が得られます。我々はこの問題に対処するため、FLのためにパラメータ化された勾配再パラメータであるFedRepOptを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 02:48:53 GMT)
Risk-averse learning with delayed feedback [17.6]
我々は,一点最適化と二点ゼロ階最適化に頼った2つのリスク逆学習アルゴリズムを開発した。その結果,2点リスク逆学習は1点アルゴリズムよりも少ない残差を達成できることが示唆された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:32:22 GMT)
Towards User-Focused Research in Training Data Attribution for Human-Centered Explainable AI [17.5]
XAIはAIを人間にとって理解しやすく有用なものにすることを目標としているが、形式主義や解法主義に頼りすぎていると批判されている。我々は,XAI研究コミュニティがユーザ関連性を確保するために,トップダウンでユーザ中心の視点を採用する方法を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:40:26 GMT)
CryptoTrain: Fast Secure Training on Encrypted Datase [17.2]
線形および非線形操作を扱うために,同型暗号化とOblivious Transfer(OT)を併用したハイブリッド暗号プロトコルを開発した。 CCMul-Precomputeと相関した畳み込みをCryptoTrain-Bに統合することにより、迅速かつ効率的なセキュアなトレーニングフレームワークを実現する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:06:14 GMT)
Deep Learning and Machine Learning, Advancing Big Data Analytics and Management: Handy Appetizer [17.0]
本では、ビッグデータ分析と管理の進歩を促進する上で、人工知能(AI)、機械学習(ML)、ディープラーニング(DL)の役割について論じている。ニューラルネットワークと、畳み込みニューラルネットワーク(CNN)のような技術がどのように機能するかを理解するのに役立つ、直感的な視覚化と実践的なケーススタディを提供する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:31:45 GMT)
Benchmarking Cognitive Biases in Large Language Models as Evaluators [16.8]
大規模言語モデル(LLM)は、簡単なプロンプトと文脈内学習を備えた自動評価器として有効であることが示されている。我々は,LLMの認知バイアスベンチマークを導入したランキングアウトプットの品質を評価対象として評価する。 LLMはテキスト品質評価器であり、バイアスベンチマークに強い指標を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:57:20 GMT)
Emotion-Driven Melody Harmonization via Melodic Variation and Functional Representation [16.8]
感情駆動のメロディは、望ましい感情を伝えるために、1つのメロディのための多様なハーモニーを生成することを目的としている。以前の研究では、異なるコードで同じメロディを調和させることで、リードシートの知覚的価値を変えることが困難であった。本稿では,シンボリック音楽の新たな機能表現を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:23:17 GMT)
Multi-UAV Pursuit-Evasion with Online Planning in Unknown Environments by Deep Reinforcement Learning [16.8]
マルチUAV追跡回避は、UAV群知能にとって重要な課題である。本研究では,協調戦略学習における部分的可観測性に対処するために,回避者予測強化ネットワークを導入する。我々は、2段階の報酬改善を通じて実現可能な政策を導出し、ゼロショット方式で実四重項にポリシーを展開する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:47:44 GMT)
Disk2Planet: A Robust and Automated Machine Learning Tool for Parameter Inference in Disk-Planet Systems [16.7]
本研究では、プロトプラネタリーディスク構造からディスクプラネタリーシステムにおける鍵パラメータを推論する機械学習ツールであるDisk2Planetを紹介する。我々のツールは完全自動化されており、Nvidia A100グラフィックス処理ユニットで1つのシステムで3分でパラメータを取得できる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:00:01 GMT)
On the Evaluation of Large Language Models in Unit Test Generation [16.4]
単体テストは、ソフトウェアコンポーネントの正しさを検証するために、ソフトウェア開発において不可欠な活動である。 LLM(Large Language Models)の出現は、ユニットテスト生成を自動化するための新しい方向性を提供する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:47:10 GMT)
Detecting Temporal Ambiguity in Questions [16.4]
時間的に曖昧な質問は、そのような質問の最も一般的なタイプの1つである。本アノテーションは,時間的あいまいさを捉え,時間的あいまいな質問を検出するタスクを研究することに焦点を当てている。本稿では,質問の曖昧なバージョンに基づく多様な検索戦略を用いて,新しいアプローチを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:59:58 GMT)
Privacy Evaluation Benchmarks for NLP Models [16.2]
NLP分野におけるプライバシ攻撃と防衛評価のベンチマークを示す。このベンチマークは、さまざまなモデル、データセット、プロトコルをサポートし、攻撃と防御戦略の包括的な評価のための標準化されたモジュールをサポートする。プライバシ攻撃のための連鎖したフレームワークを提案する。複数の攻撃をチェーンして、より高いレベルの攻撃目標を達成する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:03:05 GMT)
Cross-lingual Speech Emotion Recognition: Humans vs. Self-Supervised Models [16.1]
本研究では,人間のパフォーマンスとSSLモデルの比較分析を行った。また、モデルと人間のSER能力を発話レベルとセグメントレベルの両方で比較する。その結果,適切な知識伝達を行うモデルでは,対象言語に適応し,ネイティブ話者に匹敵する性能が得られることがわかった。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:27:17 GMT)
Ctrl-GenAug: Controllable Generative Augmentation for Medical Sequence Classification [16.0]
Ctrl-GenAugは新規で汎用的な生成拡張フレームワークである。高度に意味論的およびシーケンシャルな塩基配列合成を可能にし、誤って合成されたサンプルを抑圧する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:58:19 GMT)
Democratizing Signal Processing and Machine Learning: Math Learning Equity for Elementary and Middle School Students [16.0]
信号処理(SP)と機械学習(ML)は、優れた数学とコーディング知識に依存している。多くの学生は小学生に算術の強力な基礎を築けない。本稿では,SP教員と大学院生が,学外数学支援プログラムの開始と参加において,いかに重要な役割を果たすかを論じる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 19:28:12 GMT)
Generative Object Insertion in Gaussian Splatting with a Multi-View Diffusion Model [15.9]
ガウス散乱で表される3次元コンテンツに物体を挿入する新しい手法を提案する。提案手法では,事前学習した安定した映像拡散モデルに基づいて,MVInpainterと呼ばれる多視点拡散モデルを導入する。 MVInpainterの内部では、制御されたより予測可能なマルチビュー生成を可能にする制御ネットベースの条件付きインジェクションモジュールが組み込まれている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:52:50 GMT)
Counterfactual Token Generation in Large Language Models [15.9]
最先端の大規模言語モデルはステートレスであり、内部メモリや状態は保持しない。我々は,Gumbel-Max構造因果モデルに基づくトークン生成の因果モデルを開発する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:30:24 GMT)
Demystifying Issues, Causes and Solutions in LLM Open-Source Projects [15.9]
LLMオープンソースソフトウェアの開発と利用において,実践者が直面する問題を理解するための実証的研究を行った。 LLMの15のオープンソースプロジェクトから、クローズドな問題をすべて収集し、要件を満たす問題をラベル付けしました。本研究の結果から,モデル課題は実践者が直面する最も一般的な問題であることが示唆された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 02:16:45 GMT)
APILOT: Navigating Large Language Models to Generate Secure Code by Sidestepping Outdated API Pitfalls [15.9]
APILOTは、時代遅れのAPIのリアルタイム、即時更新可能なデータセットを維持している。拡張ジェネレーションメソッドを使用して、セキュアでバージョン対応のコードを生成するLLMをナビゲートする。古いコードレコメンデーションを平均89.42%削減し、パフォーマンス上のオーバーヘッドを制限できる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 00:37:40 GMT)
Functional Stochastic Gradient MCMC for Bayesian Neural Networks [15.8]
新たに設計された拡散力学による関数勾配モンテカルロスキームを提案する。本研究では,機能的SGMCMCの精度と不確かさの両面において,有意なSGMCMCと機能的変分推定法と比較して優れた性能を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:23:01 GMT)
General Detection-based Text Line Recognition [15.8]
我々は、テキスト行認識に対する一般的な検出に基づくアプローチを、印刷(OCR)や手書き(HTR)として導入する。我々の手法は、自己回帰復号に依存する最先端のHTR手法とは全く異なるパラダイムに基づいている。我々は、CASIA v2データセット上での中国語スクリプト認識と、BorgおよびCopialeデータセット上での暗号認識の最先端性能を改善した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:05:55 GMT)
Revisiting Space Mission Planning: A Reinforcement Learning-Guided Approach for Multi-Debris Rendezvous [15.7]
目的は、与えられたすべての破片を訪問して、ミッション全体のランデブーを最小限に抑えるシーケンスを最適化することである。ニューラルネットワーク(NN)ポリシーが開発され、さまざまなデブリフィールドを持つシミュレーションされた宇宙ミッションで訓練される。強化学習アプローチは計画効率を著しく向上させる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:50:01 GMT)
INT-FlashAttention: Enabling Flash Attention for INT8 Quantization [15.6]
INT-FlashAttentionは、FlashAttentionのフォワードワークフローと互換性のある最初の量子化アーキテクチャである。完全なINT8アクティベーションとGEMM(GeneralMatrix-multiplication)カーネルを備えたINT-FlashAttentionプロトタイプを実装した。実験の結果、INT-FlashAttentionは標準のFlashAttentionに比べて72%高速な推論速度と82%の量子化誤差を達成した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:02:25 GMT)
Improving Clinician Performance in Classification of EEG Patterns on the Ictal-Interictal-Injury Continuum using Interpretable Machine Learning [15.5]
集中治療室(ICUs)では、重度の脳損傷を防ぐために、重度疾患のある患者は脳波(EEGs)で監視される。ブラックボックスのディープラーニングモデルは信頼できない、トラブルシューティングが難しい、現実世界のアプリケーションでは説明責任が欠如している。本稿では,有害脳波パターンの存在を予測する新しい解釈可能な深層学習モデルを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 00:35:55 GMT)
Transient Adversarial 3D Projection Attacks on Object Detection in Autonomous Driving [15.5]
本稿では,自律運転シナリオにおける物体検出を対象とする3Dプロジェクション攻撃を提案する。本研究は, YOLOv3 と Mask R-CNN の物理環境における攻撃効果を示すものである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:27:11 GMT)
MSI-Agent: Incorporating Multi-Scale Insight into Embodied Agents for Superior Planning and Decision-Making [15.4]
マルチスケールインサイトエージェント(MSI-Agent)は、計画と意思決定能力を改善するために設計されたエンボディエージェントである。 GPT3.5 による計画において MSI が他の洞察戦略より優れていることを示す。 MSIはドメインシフトシナリオに直面するとき、より堅牢性を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:21:51 GMT)
A Character-Centric Creative Story Generation via Imagination [15.3]
多様な詳細なストーリ要素を持つ創造的なストーリ生成は、大規模な言語モデルの長年の目標である。我々はCCI(Character-centric Creative Story Generation via Imagination)と呼ばれる新しいストーリー生成フレームワークを紹介する。 CCIは創造的ストーリー生成のための2つの革新的なモジュールを特徴付けている。IG(Image-Guided Imagination)とMW(Multi-Writer model)である。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:54:29 GMT)
Non-invertible duality defects in one, two, and three dimensions via gauging spatially modulated symmetry [15.3]
空間変調対称性を用いた非可逆双対性欠陥を持つコンクリート格子モデルを構築した。我々の研究は、関連する対称性をゲージすることで、エキゾチックな双対性欠陥を構築するための統一的で体系的な分析フレームワークを提供する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:52:07 GMT)
MCI-GRU: Stock Prediction Model Based on Multi-Head Cross-Attention and Improved GRU [15.2]
本稿では,多頭部クロスアテンション機構と改良型GRUに基づくストック予測モデルMCI-GRUを提案する。 4つの主要株式市場での実験では、提案手法は複数の指標でSOTA技術を上回っている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:37:49 GMT)
Towards Trustworthy Reranking: A Simple yet Effective Abstention Mechanism [15.2]
実世界の制約に合わせた軽量な禁制機構を提案する。ブラックボックスシナリオにおける禁忌戦略を評価するためのプロトコルを提案する。実験複製と禁忌実装のためのオープンソースコードを提供する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:37:39 GMT)
Deep Generative Models through the Lens of the Manifold Hypothesis: A Survey and New Connections [15.2]
本研究では,低内在次元のデータモデリングにおいて,高周囲次元の確率の数値的不安定性は避けられないことを示す。次に、オートエンコーダの学習表現上のDGMは、ワッサーシュタイン距離をほぼ最小化するものとして解釈できることを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:00:00 GMT)
Beyond Turing Test: Can GPT-4 Sway Experts' Decisions? [15.0]
本稿では,生成したテキストが読者の判断にどう影響するかを,アマチュアと専門家の両方に焦点をあてる。以上の結果から,GPT-4はアマチュアとプロの双方の意思決定に影響を及ぼす説得的分析を生ずる可能性が示唆された。その結果、観客反応による実世界評価と、生成モデルによく用いられる現在の多次元評価器との間に高い相関関係が示された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:55:36 GMT)
Exploring Information-Theoretic Metrics Associated with Neural Collapse in Supervised Training [14.9]
本研究では,行列エントロピーや相互情報といった情報理論のメトリクスを用いて教師あり学習の分析を行う。行列エントロピーは,データ表現の情報内容と分類頭部重みの相互作用のみを記述できないが,データの類似性とクラスタリングの挙動を効果的に反映できることを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:26:06 GMT)
Goal-based Neural Physics Vehicle Trajectory Prediction Model [14.9]
本稿では、ゴールに基づくニューラル物理車両軌道予測モデル(GNP)を提案する。 GNPモデルは、車両の軌道予測を2段階のプロセスに単純化する。 GNPは4つのベースラインモデルと比較して最先端の長期予測精度を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 04:31:22 GMT)
Goal-based Neural Physics Vehicle Trajectory Prediction Model [14.9]
本稿では、ゴールに基づくニューラル物理車両軌道予測モデル(GNP)を提案する。 GNPモデルは、車両の軌道予測を2段階のプロセスに単純化する。 GNPは4つのベースラインモデルと比較して最先端の長期予測精度を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 04:31:22 GMT)
TSBP: Improving Object Detection in Histology Images via Test-time Self-guided Bounding-box Propagation [14.8]
オブジェクト検出タスクの最終結果にどのバウンディングボックスを含めるべきかを決定するために、グローバルしきい値(例:0.5)がしばしば適用される。低い閾値は検出リコールを増加させるが、より多くの偽陽性をもたらす可能性がある。このため、すべての有界ボックス候補に事前設定された大域しきい値(例:0.5)を用いることで、準最適解が導かれる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:09:04 GMT)
BitQ: Tailoring Block Floating Point Precision for Improved DNN Efficiency on Resource-Constrained Devices [14.5]
ブロック浮動小数点(BFP)量子化は、メモリと計算負荷を減らすための代表的な圧縮手法の1つである。組込みプラットフォーム上でのDNN推論の最良のBFP実装のためのBFPベースのビット幅対応解析モデルフレームワーク(BitQ')を開発した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:03:49 GMT)
Robust Online Classification: From Estimation to Denoising [14.5]
一般仮説クラスを用いて,特徴のオンライン分類をラベルに分類する。観測されたノイズラベルとノイズレス特徴を用いて予測を行う。性能は、真のラベルと比較する場合、ミニマックスリスクによって測定される。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:33:54 GMT)
On Extending Direct Preference Optimization to Accommodate Ties [14.4]
DPO のBradley-Terry モデルを2つのよく知られたモデリング拡張に置き換える。ニューラルネットワーク翻訳と要約の実験では、タスクパフォーマンスの劣化を伴わずに、これらのDPO変種のためのデータセットに明示的にラベル付けされたネクタイを追加できることが示されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 23:38:15 GMT)
The gap persistence theorem for quantum multiparameter estimation [14.3]
本稿では,Holevo Cram'er-Rao 境界 (HCRB) をいくつかの物理的動機付けられた問題に対して飽和させることは不可能であることを示す。さらに、SLDCRBがプローブ状態の1つのコピーで到達できない場合、プローブ状態の有限個のコピーの集合的な測定では到達できないことを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:18:28 GMT)
Wildlife Product Trading in Online Social Networks: A Case Study on Ivory-Related Product Sales Promotion Posts [14.3]
本稿では,オンラインソーシャルネットワークにおける野生生物製品販売促進行動の検出と認識の課題について論じる。我々は、疑わしい野生生物がポストやアカウントを売っているのを自動的に識別するフレームワークを構築している。我々は、これらの行動の性質に関する詳細な知見を提供し、違法な野生生物製品取引の理解と対策に貴重な情報を提供しています。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:57:43 GMT)
Asynchronous Fractional Multi-Agent Deep Reinforcement Learning for Age-Minimal Mobile Edge Computing [14.3]
計算集約的な更新のタイムラインを調査し、AoIを最小化するためにタスク更新とオフロードポリシーを共同で最適化する。具体的には、エッジ負荷のダイナミクスを考慮し、期待時間平均AoIを最小化するためにタスクスケジューリング問題を定式化する。提案アルゴリズムは,実験における最良基準アルゴリズムと比較して平均AoIを最大52.6%削減する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:33:32 GMT)
Large Language Model Predicts Above Normal All India Summer Monsoon Rainfall in 2024 [14.2]
本研究は,最新のLCMモデルであるPatchTSTの適応と微調整に着目し,AISMRを3ヶ月のリードタイムで正確に予測する。 2024年6月から9月にかけての降水量は921.6mmと推定される。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 10:32:18 GMT)
Hopf algebras and solvable unitary circuits [14.2]
我々は、離散空間と時間における量子多体ダイナミクスをモデル化するための、正確に解けるモデルの新たなファミリーを導入する。得られた正確な結果は、多くの身体の傷の量子的な現象、そしてより一般的には、制約された系における花束量子力学の現象に光を当てるかもしれない。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:54:19 GMT)
ZoDi: Zero-Shot Domain Adaptation with Diffusion-Based Image Transfer [14.0]
本稿では,ZoDiと呼ばれる拡散モデルに基づくゼロショット領域適応手法を提案する。まず,原画像の領域を対象領域に転送することで,対象画像の合成にオフ・ザ・シェルフ拡散モデルを用いる。次に、元の表現でソース画像と合成画像の両方を用いてモデルを訓練し、ドメイン・ロバスト表現を学習する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:08:46 GMT)
How to Connect Speech Foundation Models and Large Language Models? What Matters and What Does Not [13.9]
音声テキスト(S2T)タスクでは、新興ソリューションは、音声基礎モデル(SFM)のエンコーダの出力をアダプタモジュールを介して埋め込み空間に投影する。 5つのアダプタモジュール, 2つのLLM(ralMistとLlama), 2つのSFM(WhisperとSeamlessM4T)の組み合わせを2つのS2Tタスク、すなわち自動音声認識と音声翻訳で評価した。その結果、SFMは下流性能において重要な役割を担い、アダプタの選択は適度な影響があり、SFMとLLMに依存していることがわかった。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:54:29 GMT)
SCOI: Syntax-augmented Coverage-based In-context Example Selection for Machine Translation [13.9]
そこで本研究では,機械翻訳(MT)における文脈内例の選択に統語的知識を導入する。我々は、構文拡張されたコベレージベースのIn-context example selection (SCOI) という新しい戦略を提案する。提案するSCOIは,すべての学習自由手法の中で,平均COMETスコアが最も高い。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 10:00:03 GMT)
PeerArg: Argumentative Peer Review with LLMs [13.9]
本稿では,ピアレビューのレビューと意思決定プロセスを支援する新しいパイプラインを提案する。 PeerArg システムは LLM と知識表現の手法を組み合わせたシステムである。 3つの異なるデータセット上でPeerArgパイプラインの性能を評価する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:09:39 GMT)
LSR-IGRU: Stock Trend Prediction Based on Long Short-Term Relationships and Improved GRU [13.6]
LSR-IGRUという株価トレンド予測モデルを提案する。長期の株式関係と改良されたGRUインプットに基づいている。我々は,現在最先端のベースラインモデルよりも提案したLSR-IGRUの優位性を検証した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:38:48 GMT)
CombU: A Combined Unit Activation for Fitting Mathematical Expressions with Neural Networks [13.6]
異なる層にまたがる様々な次元で異なるアクティベーション機能を利用するCombU(CombU)を導入する。このアプローチは理論上、ほとんどの数学的表現を正確に適合させることが証明できる。 6つのState-Of-The-Art(SOTA)アクティベーション関数アルゴリズムと比較して、4つの数学的表現データセットで実施された実験は、CombUが16の指標のうち10のSOTAアルゴリズムより優れていることを示した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:26:09 GMT)
Models Can and Should Embrace the Communicative Nature of Human-Generated Math [13.5]
モデルが学習される数学データは、理想化された数学的実体だけでなく、豊かなコミュニケーション意図を反映していると論じる。我々は、人間生成数学において潜在するコミュニケーション意図から学習し、表現するAIシステムを提唱する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:08:08 GMT)
Fast Distributed Inference Serving for Large Language Models [13.3]
大規模言語モデル(LLM)のための分散推論サービスシステムであるFastServeについて述べる。 FastServeはLLM推論の自己回帰パターンを利用して、各出力トークンの粒度のプリエンプションを可能にする。我々は,FastServeのシステムプロトタイプを構築し,最先端のソリューションであるvLLMと比較して,同じ平均および末尾遅延条件下でのスループットを最大31.4xと17.9xに改善したことを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:57:51 GMT)
Overview of the First Shared Task on Clinical Text Generation: RRG24 and "Discharge Me!" [13.3]
本稿では,Radiology Report Generation (RRG24) と Discharge Summary Generation (Discharge Me! RRG24は、胸部X線を照射した放射線学報告の「フィンディング」と「印象」のセクションを生成する。退院!」は、救急科で入院した患者の退院要領の「Brief Hospital Course」と「Discharge Instructions」のセクションを作成。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 04:02:54 GMT)
Reactive Multi-Robot Navigation in Outdoor Environments Through Uncertainty-Aware Active Learning of Human Preference Landscape [13.2]
マルチロボットシステム(MRS)は、多様な能力を持つ複数のメンバーが存在するため、ミッションをより効率的に実行することができる。広範囲の現実世界環境にMSSを配置することは、不確実で様々な障害のために依然として困難である。本研究では, ランドスケープ・ラーニング・アンド・ビヘイビア・アライメント・フレームワーク(PLBA)を新たに設計した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:15:09 GMT)
Consistent estimation of generative model representations in the data kernel perspective space [13.1]
大規模言語モデルやテキストから画像への拡散モデルのような生成モデルは、クエリを提示すると関連する情報を生成する。同じクエリを表示すると、異なるモデルが異なる情報を生成する可能性がある。本稿では,一組のクエリのコンテキストにおける生成モデルの埋め込みに基づく表現に関する新しい理論的結果を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 19:35:58 GMT)
VFDelta: A Framework for Detecting Silent Vulnerability Fixes by Enhancing Code Change Learning [13.0]
オープンソースソフトウェア(OSS)の脆弱性修正は通常、調整された脆弱性開示モデルに従い、静かに修正される。この遅延は、修正が公表される前に悪意のある関係者がソフトウェアを悪用する可能性があるため、OSSユーザを危険に晒す可能性がある。既存のメソッドは、コード変更表現をコミットから学習することで脆弱性修正を分類する。 VFDeltaは、コードを取り囲む独立したモデルを用いて、変更前後にコードを埋め込む軽量で効果的なフレームワークである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 04:13:08 GMT)
ScanTalk: 3D Talking Heads from Unregistered Scans [13.0]
スキャンデータを含む任意のトポロジで3次元顔をアニメーションできる新しいフレームワークである textbfScanTalk を提案する。我々のアプローチは、固定トポロジ制約を克服するためにDiffusionNetアーキテクチャに依存しており、より柔軟でリアルな3Dアニメーションのための有望な道を提供する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:42:45 GMT)
Source-Free Domain Adaptation for YOLO Object Detection [13.0]
本稿では、現実世界の視覚システム、特に単発検出器のYOLOファミリーに対するドメイン適応技術に焦点を当てる。提案手法は,教師が学習対象の領域に固有の拡張を施した画像を受け取るためのフレームワークである。ラベルのない平均教師アーキテクチャを用いた自己学習の課題は、ノイズやドリフトする擬似ラベルによる精度の急激な低下である。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 01:22:10 GMT)
Go-SLAM: Grounded Object Segmentation and Localization with Gaussian Splatting SLAM [12.9]
Go-SLAMは動的環境の再構築に3DガウススティングSLAMを利用する新しいフレームワークである。本システムは,自然言語記述によるオブジェクトの検索を容易にする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:56:08 GMT)
Optical Lens Attack on Deep Learning Based Monocular Depth Estimation [12.9]
LensAttackは、自動運転車のカメラに光学レンズを戦略的に配置する物理的な攻撃だ。我々は,この攻撃をシミュレートし,運転シナリオにおける実環境性能を評価し,その影響を最先端のMDEモデルに示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:44:14 GMT)
IRASNet: Improved Feature-Level Clutter Reduction for Domain Generalized SAR-ATR [12.9]
本研究ではIRASNetと呼ばれるドメイン一般化SAR-ATRのためのフレームワークを提案する。 IRASNetは効果的な機能レベルのクラッタ削減とドメイン不変の機能学習を可能にする。 IRASNetは、性能を向上するだけでなく、特徴レベルのクラッタ低減を大幅に改善し、レーダ画像パターン認識の分野での貴重な進歩となる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:53:58 GMT)
ABCFair: an Adaptable Benchmark approach for Comparing Fairness Methods [12.8]
実世界の問題設定のデシラタに適応できるベンチマーク手法であるABCFairを紹介する。我々はABCFairを、大規模、伝統的両方のデータセットとデュアルラベル(バイアス付き、バイアスなし)データセットの両方で事前、内、および後処理の手法に適用する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:26:07 GMT)
OffRIPP: Offline RL-based Informative Path Planning [12.7]
IPPはロボット工学において重要なタスクであり、ターゲット環境に関する貴重な情報を収集するためには、エージェントが経路を設計する必要がある。トレーニング中のリアルタイムインタラクションを必要とせずに情報ゲインを最適化するオフラインRLベースのIPPフレームワークを提案する。我々は、広範囲なシミュレーションと実世界の実験を通して、この枠組みを検証する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:30:59 GMT)
Fast Distributed Inference Serving for Large Language Models [12.7]
大規模言語モデル(LLM)のための分散推論サービスシステムであるFastServeについて述べる。 FastServeはLLM推論の自己回帰パターンを利用して、各出力トークンの粒度のプリエンプションを可能にする。我々は,FastServeのシステムプロトタイプを構築し,最先端のソリューションであるvLLMと比較して,同じ平均および末尾遅延条件下でのスループットを最大31.4xと17.9xに改善したことを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:57:51 GMT)
Transport properties in a two-dimensional Su-Schrieffer-Heeger model in Quantum Hall Regime [12.6]
量子ホール状態における2次元Su-Schrieffer-Heeger (2D SSH)モデルの輸送特性について検討する。磁場の変化により、ギャップ位相から平らなバンド状態への遷移をゼロエネルギーで観測する。この遷移は、バルクまたはエッジに高度に局在した状態の出現によって特徴づけられる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:45:37 GMT)
Quantum Entanglement Allocation through a Central Hub [12.6]
我々は,集中型ハブアーキテクチャにおいて,$N$-qubit W状態の割り当てを行うためのローカル演算と古典的通信プロトコルを提案する。その結果、これらのプロトコルは、中央システム内で量子メモリの$N$ qubitsしか使用せず、それぞれWおよびGHZ状態の古典ビットに対して$N$2$と$N$の通信コストがかかることを決定的かつ正確に示している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 10:49:07 GMT)
Text2CAD: Generating Sequential CAD Models from Beginner-to-Expert Level Text Prompts [12.6]
テキストからパラメトリックCADモデルを生成するための最初のAIフレームワークであるText2CADを提案する。提案するフレームワークは,AI支援設計アプリケーションにおいて大きな可能性を秘めている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:19:33 GMT)
The FruitShell French synthesis system at the Blizzard 2023 Challenge [12.5]
本稿では,Blizzard Challenge 2023のためのフランス語音声合成システムを提案する。この課題は、女性話者から高品質な音声を生成することと、特定の個人によく似た音声を生成することの2つのタスクから構成される。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:39:08 GMT)
Implicit Neural Representations for Simultaneous Reduction and Continuous Reconstruction of Multi-Altitude Climate Data [12.3]
本稿では,多高度風速データの有効次元削減と連続表現を同時に実現するためのディープラーニングフレームワークを提案する。本研究の目的は,(1)多種多様な気候条件にまたがるデータ解像度を改善して高解像度の細部を復元すること,(2)大規模気候データセットのより効率的な保存のためのデータ次元の低減,(3)異なる高度で測定された風速データ間の交差予測を可能にすることである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:23:28 GMT)
Evaluating and Enhancing Large Language Models for Novelty Assessment in Scholarly Publications [12.2]
学術論文において,大規模言語モデルの新規性を評価する能力を評価するために,学術ノベルティベンチマーク(SchNovel)を導入する。 SchNovelは、arXivデータセットからサンプリングされた6つのフィールドにわたる15,000の論文からなる。 RAG-Noveltyは、類似論文の検索を利用して、人間レビュアーによるレビュープロセスをシミュレートし、新規性を評価する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 04:12:38 GMT)
Non-stationary BERT: Exploring Augmented IMU Data For Robust Human Activity Recognition [12.2]
HAR(Human Activity Recognition)は、モバイルデバイスの普及により、研究者から大きな注目を集めている。本研究では、携帯電話IMUデータからなるOPPOHARと呼ばれる人間の活動認識データセットを収集する。本研究では,ユーザ固有のアクティビティ認識を実現するための2段階のトレーニング手法により,非定常BERTと呼ばれる新しい軽量ネットワークを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:28:54 GMT)
Boosting Scientific Concepts Understanding: Can Analogy from Teacher Models Empower Student Models? [12.2]
本研究では,教師言語モデル(LM)による類推が,科学概念の理解にどのように役立つかを検討する。以上の結果から,自由形式類似は概念理解におけるLMの助けとなることが示唆された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:38:37 GMT)
Beyond Redundancy: Information-aware Unsupervised Multiplex Graph Structure Learning [12.1]
Unsupervised Multiplex Graph Learning (UMGL) は、手動ラベリングなしで様々なエッジタイプのノード表現を学習することを目的としている。本稿では,複数のグラフから融合グラフを教師なしで学習する,より現実的で困難なタスクに焦点を当てる。具体的には,提案する情報対応Unsupervised Multiplex Graph Fusion framework (InfoMGF) は,無関係ノイズを除去するためにグラフ構造を改良する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:00:26 GMT)
OAPT: Offset-Aware Partition Transformer for Double JPEG Artifacts Removal [11.9]
OAPTと呼ばれるJPEGアーティファクト除去のためのオフセット対応分割変換器を提案する。 8×8ブロック毎に最大4パターンのJPEG圧縮を行う。 OAPTは圧縮オフセット予測器と画像再構成器の2つのコンポーネントから構成される。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:50:28 GMT)
SimTxtSeg: Weakly-Supervised Medical Image Segmentation with Simple Text Cues [11.9]
我々は、単純なテキストキューを利用して高品質な擬似ラベルを生成する新しいフレームワーク、SimTxtSegを提案する。大腸ポリープ・セグメンテーションとMRI脳腫瘍セグメンテーションという2つの医療画像セグメンテーションの枠組みについて検討した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:03:54 GMT)
LLM-CARD: Towards a Description and Landscape of Large Language Models [11.7]
学術論文から大規模言語モデルに関する重要な情報を自動抽出・整理するシステムを開発することが重要である。本研究は、名前付きエンティティ認識(textbfNER)および関係抽出(textbfRE)手法を用いて、そのような先駆的なシステムを開発することを目的とする。 106の学術論文は, LLMの名前, ライセンス, 適用の3つの辞書を定義して処理した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:15:57 GMT)
VPTQ: Extreme Low-bit Vector Post-Training Quantization for Large Language Models [11.7]
大規模言語モデル(LLM)の極低ビット量子化のためのベクトル後学習量子化(VPTQ)を導入する。 VPTQはLLaMA-2で0.01$-$0.34$、Mistral-7Bで0.38$-$0.68$、LLaMA-3で4.41$-$7.34$を2ビットで還元する。また、モデル精度を高め、モデルをさらに圧縮する残差量子化および外れ値量子化をサポートするためにVPTQを拡張した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:25:45 GMT)
SeaSplat: Representing Underwater Scenes with 3D Gaussian Splatting and a Physically Grounded Image Formation Model [11.6]
本研究では,最近の3次元放射場の発展を生かした水中シーンのリアルタイムレンダリングを可能にするSeaSplatを紹介する。 SeaSplatを、アメリカ領ヴァージン諸島の水中車両が収集したSeaThru-NeRFデータセットの現実世界のシーンに適用する。水中画像形成はシーン構造を学習し, 深度マップを改良し, 3次元ガウス表現の活用による計算精度の向上を図った。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 20:45:19 GMT)
Hierarchical Tree-structured Knowledge Graph For Academic Insight Survey [11.6]
調査は、研究トレーニングを欠いている初心者研究者にとって、常に課題となっている。本研究は,階層的な木構造知識グラフを確立することにより,初心者研究者を対象とした研究インサイトサーベイを支援することを目的とする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:57:03 GMT)
The Overfocusing Bias of Convolutional Neural Networks: A Saliency-Guided Regularization Approach [11.5]
CNNは入力画像の狭い特定の領域に基づいて決定を行う。この振る舞いはモデルの一般化能力を著しく損なう可能性がある。この問題に対処するために、SGDrop(Saliency Guided Dropout)を紹介します。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:30:16 GMT)
Enhancing disease detection in radiology reports through fine-tuning lightweight LLM on weak labels [11.3]
合成ラベル付き微調整データセットは、医療領域における大きな言語モデル(LLM)を改善することができる。これらの知見は,医学領域におけるLSM専門化の今後の研究に有望な方向を提供するものである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 02:29:44 GMT)
A Rule-Based Approach for UI Migration from Android to iOS [11.2]
既存のAndroidアプリUIからiOSへのクロスプラットフォーム移行を可能にするGUIMIGRATORと呼ばれる新しいアプローチを提案する。 GuiMIGRATORは、UIスケルトンツリーを構築するために、Android UIレイアウト、ビュー、リソースを抽出し解析する。 GuiMIGRATORは、ターゲットコードテンプレートを使用して最終的なUIコードファイルを生成し、iOS開発プラットフォームでコンパイルされ、検証される。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:19:54 GMT)
XAI-guided Insulator Anomaly Detection for Imbalanced Datasets [11.2]
電力網は多くの産業において重要な要素であり、産業プロセスや技術にシームレスに電気エネルギーを供給している。ドローンは電力線を検査するためにますます配備され、その結果、高速で正確な処理を必要とする大量の視覚データの流れが生まれる。ディープラーニング手法はこのタスクで広く普及し、障害検出において貴重な資産であることが証明されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:19:42 GMT)
Translation of Multifaceted Data without Re-Training of Machine Translation Systems [11.2]
このプラクティスは、しばしば同じデータポイント内のコンポーネント間の相互関係を見落としている、と私たちは主張する。 MTパイプラインでは、データポイント内のすべてのコンポーネントが実装され、単一の翻訳シーケンスを形成します。学習データとしての有効性とともに,翻訳品質自体の大幅な向上を実現しています。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 02:15:32 GMT)
Multi-Robot Informative Path Planning for Efficient Target Mapping using Deep Reinforcement Learning [11.1]
本稿では,多ボット情報経路計画のための新しい深層強化学習手法を提案する。我々は、集中的な訓練と分散実行パラダイムを通じて強化学習政策を訓練する。提案手法は,他の最先端のマルチロボット目標マッピング手法よりも33.75%向上する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:27:37 GMT)
Are LLMs Ready for Real-World Materials Discovery? [10.9]
大規模言語モデル(LLM)は、材料科学の研究を加速する強力な言語処理ツールのエキサイティングな可能性を生み出します。 LLMは、物質理解と発見を加速する大きな可能性を秘めているが、現在は実用的な材料科学ツールとして不足している。材料科学におけるLLMの失敗事例として,複雑で相互接続された材料科学知識の理解と推論に関連するLCMの現在の限界を明らかにする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:43:59 GMT)
Context-Enhanced LLM-Based Framework for Automatic Test Refactoring [10.8]
テストの臭いは、設計プラクティスの貧弱さとドメイン知識の不足から生じます。我々は,Javaプロジェクトにおける自動テストのための文脈拡張型LLMベースのフレームワークUTRefactorを提案する。 6つのオープンソースのJavaプロジェクトから879のテストに対してUTRefactorを評価し、テストの匂いを2,375から265に減らし、89%の削減を実現した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:42:29 GMT)
A Hybrid Quantum Neural Network for Split Learning [10.8]
Split Learning(SL)は、リソースに制約のあるクライアントが、サーバとMLモデルを協調的にトレーニングすることを可能にする。 SL内のクライアントとサーバ間のデータプライバシの漏洩は、サーバ側のリコンストラクション攻撃のリスクをもたらす。本稿では,ハイブリッドQMLをSLに適用したHybrid Quantum Split Learning (HQSL)を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:38:05 GMT)
Unit Test Generation for Vulnerability Exploitation in Java Third-Party Libraries [10.8]
VULEUTは、クライアントソフトウェアプロジェクトで一般的に使用されているサードパーティ製ライブラリの脆弱性の悪用を自動検証するように設計されている。 VULEUTはまず、脆弱性条件の到達可能性を決定するためにクライアントプロジェクトを分析する。次に、Large Language Model (LLM)を活用して、脆弱性確認のためのユニットテストを生成する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:47:01 GMT)
AACLiteNet: A Lightweight Model for Detection of Fine-Grained Abdominal Aortic Calcification [10.8]
CVDは世界でも主要な死因であり、毎年1790万人が死亡している。 AACLiteNetは、粒度のAACスコアを高精度に予測する軽量なディープラーニングモデルである。計算コストは19.88倍、メモリフットプリントは2.26倍である。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:21:10 GMT)
MiniDrive: More Efficient Vision-Language Models with Multi-Level 2D Features as Text Tokens for Autonomous Driving [10.7]
視覚言語モデル(VLM)は、自律運転における汎用的なエンドツーエンドモデルとして機能する。既存のほとんどの手法は計算コストのかかるビジュアルエンコーダと大言語モデル(LLM)に依存している。提案するFE-MoE(Feature Engineering Mixture of Experts)モジュールとDI-Adapter(Dynamic Instruction Adapter)を組み込んだMiniDriveという新しいフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:53:39 GMT)
Bits-to-Photon: End-to-End Learned Scalable Point Cloud Compression for Direct Rendering [10.7]
我々は,レンダリング可能な3Dガウスアンに直接デコード可能なビットストリームを生成するポイントクラウド圧縮スキームを開発した。提案手法はスケーラブルなビットストリームを生成し,異なるビットレート範囲で複数の詳細レベルを実現する。提案手法は,高品質な点雲のリアルタイムカラーデコーディングとレンダリングをサポートし,自由視点でインタラクティブな3Dストリーミングアプリケーションを実現する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:01:55 GMT)
Geometry-aware Feature Matching for Large-Scale Structure from Motion [10.6]
大規模シナリオでは重なりが小さい場合にギャップを埋めるために,カラーキューに加えて幾何学的手がかりを導入する。提案手法は, 検出器フリー法からの高密度対応が幾何的に整合性を持ち, 精度が高いことを保証する。ベンチマークデータセットにおける最先端の機能マッチングメソッドよりも優れています。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 19:15:04 GMT)
Dashing for the Golden Snitch: Multi-Drone Time-Optimal Motion Planning with Multi-Agent Reinforcement Learning [10.6]
本稿では,マルチエージェント強化学習を用いた時間最適マルチドローン飛行のための分散ポリシーネットワークを提案する。飛行効率と衝突回避のバランスをとるために,最適化手法に着想を得たソフト衝突ペナルティを導入する。大規模シミュレーションにより, 単流体系と比較して性能のトレードオフはわずかに小さいものの, 衝突速度が低い状態で, 最適に近い性能を維持していることがわかった。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:09:52 GMT)
EF-Calib: Spatiotemporal Calibration of Event- and Frame-Based Cameras Using Continuous-Time Trajectories [10.3]
イベントカメラはフレームベースのカメラと融合する見込みがある。本稿では,固有カメラとフレームベースカメラを併用したステレオビジョンシステムの校正フレームワークEF-Calibを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:59:55 GMT)
StruQ: Defending Against Prompt Injection with Structured Queries [10.2]
大きな言語モデル(LLM)は、高度な言語理解機能を利用することで、テキストベースのタスクを実行できる。プロンプトインジェクション攻撃は重要な脅威であり、それらはモデルを騙して元のアプリケーションの命令から逸脱させ、代わりにユーザーディレクティブに従う。この問題に対処するための一般的なアプローチである構造化クエリを導入する。本システムでは, インジェクション攻撃に対する抵抗性を著しく改善し, 実用性にはほとんど, あるいは全く影響を与えない。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 19:48:39 GMT)
Revisiting inverse Hessian vector products for calculating influence functions [10.2]
影響関数は、モデルの出力をトレーニングデータに関連付ける一般的なツールである。本稿では,3つのハイパーパラメータ(スケーリング係数,バッチサイズ,ステップ数)がヘッセンのスペクトル特性によって選択可能であることを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:05:35 GMT)
Landscape of Policy Optimization for Finite Horizon MDPs with General State and Action [10.2]
我々は、一般的な状態と空間を持つマルコフ決定過程のクラスのためのフレームワークを開発する。勾配法は非漸近条件で大域的最適ポリシーに収束することを示す。その結果,多周期インベントリシステムにおける最初の複雑性が確立された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:56:02 GMT)
CodeInsight: A Curated Dataset of Practical Coding Solutions from Stack Overflow [10.2]
データセットは、明確化インテント、コードスニペットの関連、関連する3つのユニットテストの平均を含む例を提供する。 Pythonの専門家が作成した3,409の例を補完する私たちのデータセットは、モデル微調整とスタンドアロン評価の両方のために設計されています。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:18:52 GMT)
RLHFuse: Efficient RLHF Training for Large Language Models with Inter- and Intra-Stage Fusion [10.2]
既存のRLHFシステムは、プロダクションデプロイメントにおけるGPU利用の低さに悩まされている。 RLHFuseは、個々のタスクの合成として、従来のRLHFワークフローのビューを分解する。 RLHFuseは既存の最先端システムと比較してトレーニングのスループットを最大3.7倍に向上させる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:28:06 GMT)
RLHFuse: Efficient RLHF Training for Large Language Models with Inter- and Intra-Stage Fusion [10.2]
RLHF(Reinforcement Learning from Human Feedback)は、トレーニング後の重要なテクニックである。既存のRLHFトレーニングシステムは、各タスクを最小の実行ユニットと見なしているため、サブタスクレベルの最適化の機会を見越すことができる。 RLHFuseは、個々のタスクの合成としてRLHFワークフローの従来のビューを分解し、各タスクをよりきめ細かいサブタスクに分割する。 RLHFuseは既存の最先端システムと比較してトレーニングのスループットを最大3.7倍に向上させる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:28:06 GMT)
Ascend HiFloat8 Format for Deep Learning [10.1]
HiFloat8(HiF8)は、ディープラーニングのための8ビット浮動小数点データフォーマットである。通常の値符号化では、3ビットのマティーサを持つ7の指数、2ビットのマティーサを持つ8の指数、1ビットのマティーサを持つ16の指数を提供する。デノーマル値やサブノーマル値の符号化では、ダイナミックレンジを2の7つの余分なパワー(31から38ビネード)で拡張する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:11:58 GMT)
Navigating the Maze of Explainable AI: A Systematic Approach to Evaluating Methods and Metrics [10.0]
LATECは、20の異なる指標を用いて17の顕著なXAI手法を批判的に評価する大規模なベンチマークである。信頼性の低いランキングに繋がるメトリクスの衝突リスクを実証し、その結果、より堅牢な評価手法を提案する。 LATECは将来のXAI研究における役割を強化し、326kのサリエンシマップと378kのメトリクススコアを(meta-)データセットとして公開している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:07:46 GMT)
Evaluating Usability and Engagement of Large Language Models in Virtual Reality for Traditional Scottish Curling [9.9]
本稿では,VR(VR)環境におけるLarge Language Models(LLM)の革新的な応用について検討する。スコティッシュ・ボンスピエル・VR』で紹介された伝統的なスコットランドのカーリングに焦点を当てている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:06:53 GMT)
EMIT- Event-Based Masked Auto Encoding for Irregular Time Series [9.9]
データポイントが不均一な間隔で記録される不規則な時系列は、医療設定で一般的である。この変動は、患者の健康の重大な変動を反映し、情報的臨床的意思決定に不可欠である。本稿では,不規則な時系列に対するイベントベースのマスキングである,新しい事前学習フレームワーク EMIT を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 02:05:32 GMT)
The loss landscape of deep linear neural networks: a second-order analysis [9.9]
正方形損失を伴う深部線形ニューラルネットワークの最適化環境について検討する。我々は、すべての臨界点の中で、大域最小化点、厳格なサドル点、非制限サドル点を特徴づける。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:38:43 GMT)
Context-aware and Style-related Incremental Decoding framework for Discourse-Level Literary Translation [9.8]
文学テキストの翻訳は、ニュアンス的な意味、慣用的な表現、複雑な物語構造のために大きな課題を生んでいる。これらの課題に対処するために、我々はCPT(Continuous Pre-Training)とSFT(Supervised Fine-Tuning)を組み合わせた中国語-Llama2モデルを利用した。提案手法は,各文がより広い文脈で翻訳されることを保証する新しいインクリメンタル・デコーディング・フレームワークを含む。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 01:27:24 GMT)
A Computational Tsirelson's Theorem for the Value of Compiled XOR Games [9.8]
Kalaiらによって提案されたコンパイラは,任意の2プレーヤXORゲームに対して健全であることを示す。提案手法を用いて並列繰り返しXORゲームのコンパイル値の厳密なバウンダリを含む,いくつかの追加結果を得た。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:39:03 GMT)
FusionANNS: An Efficient CPU/GPU Cooperative Processing Architecture for Billion-scale Approximate Nearest Neighbor Search [9.7]
近似近接探索(ANNS)がデータベースとAIインフラストラクチャの重要なコンポーネントとして登場した。数十億のデータセットを対象とした高スループット,低レイテンシ,低コスト,高精度なANNSシステムであるFusionANNSを提案する。本稿では、CPUとGPU間のデータスワップを回避するための多層インデックス化、不要なI/Oや計算をなくすための再ランク付け、I/O効率をさらに向上するための冗長なI/Oデデューズという3つの新しい設計を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:14:01 GMT)
Data-driven Probabilistic Trajectory Learning with High Temporal Resolution in Terminal Airspace [9.7]
混合モデルとSeq2seqに基づくニューラルネットワークの予測および特徴抽出機能を活用するデータ駆動学習フレームワークを提案する。このフレームワークでトレーニングした後、学習したモデルは長期予測精度を大幅に向上させることができる。提案手法の精度と有効性は,予測された軌道と基礎的真実とを比較して評価する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:08:25 GMT)
T2Pair++: Secure and Usable IoT Pairing with Zero Information Loss [9.7]
我々は、慣性センサーを必要とせずに、IoTデバイスがユーザの物理的操作を検知できるようにする、Universal Operation Sensingと呼ばれる新しい技術を紹介した。この技術により、ユーザーはボタンを押したり、ノブをねじったりといった単純なアクションを使って、数秒でペアリングプロセスを完了することができる。ファジィコミットメントを使わず,情報損失をゼロにする,正確なペアリングプロトコルを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 00:41:02 GMT)
Claim-Guided Textual Backdoor Attack for Practical Applications [9.7]
CGBA(Crim-Guided Backdoor Attack)について紹介する。トリガとして固有のテキストクレームを活用することで、このような操作の必要性を排除する。 CGBAは、さまざまなデータセットやモデルに対して、その有効性とステルス性を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 04:53:27 GMT)
AutoSTF: Decoupled Neural Architecture Search for Cost-Effective Automated Spatio-Temporal Forecasting [9.6]
本稿では,自動時間予測のための切り離されたニューラルサーチフレームワークであるAutoSTFを提案する。提案手法は,最先端の自動時間予測手法と比較して最大13.48倍の高速化を実現する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:25:34 GMT)
Path-adaptive Spatio-Temporal State Space Model for Event-based Recognition with Arbitrary Duration [9.5]
イベントカメラはバイオインスパイアされたセンサーで、強度の変化を非同期に捉え、イベントストリームを出力する。本稿では, PAST-Act と呼ばれる新しいフレームワークを提案する。私たちはまた、コミュニティの利益のために任意の期間で、ArDVS100という名前の分レベルのイベントベースの認識データセットを構築しました。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:08:37 GMT)
Most Influential Subset Selection: Challenges, Promises, and Beyond [9.5]
我々は,最も集団的影響の大きいトレーニングサンプルのサブセットを特定することを目的とした,MISS(Most Influential Subset Selection)問題について検討する。我々は、MISにおける一般的なアプローチを包括的に分析し、その強みと弱点を解明する。本稿では,これらを反復的に適用した適応バージョンが,試料間の相互作用を効果的に捕捉できることを実証する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 20:00:23 GMT)
Automated Surgical Skill Assessment in Endoscopic Pituitary Surgery using Real-time Instrument Tracking on a High-fidelity Bench-top Phantom [9.4]
外科的スキルの改善は一般的に患者の成績の改善に関連しているが、評価は主観的であり、労働集約的である。内視鏡下垂体手術の鼻相を模範として,シミュレートされた手術に焦点を当てた新しい公開データセットが導入された。多層パーセプトロンは87%の精度で手術技量(初心者または専門家)を予測し、「可視時間測定のための全手術時間の割合」は高度な手術技量と相関した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:27:44 GMT)
Accelerating Multi-Block Constrained Optimization Through Learning to Optimize [9.2]
マルチブロックADMM方式の手法は、イット単位の複雑さを大幅に削減する。 MPALMは、マルチブロックADMMと類似の形式を共有し、収束を保証する。 MPALMのパフォーマンスは、ペナルティパラメータの選択に非常に敏感である。教師付き学習を用いて,このハイパーパラメータを適応的に選択する新しいL2O手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 19:58:29 GMT)
Hard Quantum Extrapolations in Quantum Cryptography [9.2]
普遍外挿タスクの量子アナログについて検討する。量子コミットメントが存在する場合、それは困難であり、量子空間にとって容易である。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 00:09:42 GMT)
Skyeyes: Ground Roaming using Aerial View Images [9.2]
地上画像のシーケンスを生成するための新しいフレームワークであるSkyeyesを紹介した。より具体的には、3D表現とビュー一貫した生成モデルを組み合わせることで、生成された画像間のコヒーレンスを保証する。画像は、空間的時間的コヒーレンスとリアリズムを改善し、空間的視点からシーンの理解と可視化を強化する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:21:43 GMT)
MLLM Is a Strong Reranker: Advancing Multimodal Retrieval-augmented Generation via Knowledge-enhanced Reranking and Noise-injected Training [9.0]
RagVLは、知識強化されたリグレードとノイズ注入トレーニングを備えた、新しいフレームワークである。我々はMLLMに簡単な命令テンプレートを付与し、そのランク付け能力を誘導する。例えば、データとトークンレベルでのトレーニング中に視覚ノイズを注入して、ジェネレータの堅牢性を高める。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:14:03 GMT)
Mnemosyne: Parallelization Strategies for Efficiently Serving Multi-Million Context Length LLM Inference Requests Without Approximations [8.9]
本稿では,対話型長期コンテキスト推論のための3つの重要なイノベーションを提案する。これらは適応的なチャンキングで、混合、シーケンスパイプライン並列(SPP)、キャッシュ並列(KVP)のプリフィルオーバーヘッドを削減する。これらのコントリビューションは3D戦略に統合され、Mnemosyneは対話的推論を少なくとも1000万トークンまで拡張し、並列処理で高いスループットを実現することができる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:21:05 GMT)
Bridge to Real Environment with Hardware-in-the-loop for Wireless Artificial Intelligence Paradigms [8.9]
無線標準IEEE802.11pをVehicular Adhoc Network(VANET)向けに改良する機械学習(ML)ソリューションは、シミュレーションの世界において一般的に評価されている。我々は、人工知能、複数のサービス、および実世界のシミュレートされた設定の両方でHDマップデータ(LiDAR)をテストするための、先駆的なハードウェア・イン・ザ・ループを開発した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:28:42 GMT)
Cyber Food Swamps: Investigating the Impacts of Online-to-Offline Food Delivery Platforms on Healthy Food Choices [8.7]
オンラインフードデリバリープラットフォームがユーザーの健康的な食品選択に与える影響は、まだ不明である。男性、低所得者、若年者、大都市にいる者は、O2Oプラットフォームを介してファーストフードを注文する傾向にある。ファーストフードの注文の比率が高いのは「サイバーフード湿地」であり、アクセス可能なファーストフードレストランの比率が高いことが特徴である。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:54:33 GMT)
Probing Omissions and Distortions in Transformer-based RDF-to-Text Models [8.6]
我々はRDF-to-Text生成に焦点をあて、BARTとT5のエンコーダ出力における欠落を探索する2つの方法を探る。我々は、省略されたエンティティと歪んだエンティティの両方をエンコーダの出力埋め込みで探索できることを発見した。このことは、エンコーダがこれらのエンティティに対してより弱い信号を発し、そのため情報の喪失の原因となることを示唆している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:54:16 GMT)
Robust Interaction-Based Relevance Modeling for Online e-Commerce Search [8.5]
従来のテキストマッチング技術は、検索意図のニュアンスを正確に捉えることができない。このような欠点に対処するために、ロバストなインタラクションベースのモデリングパラダイムを導入します。我々の知る限りでは、この手法は大規模なeコマース検索関連性計算のための対話に基づく最初のアプローチである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:00:18 GMT)
Building Real-time Awareness of Out-of-distribution in Trajectory Prediction for Autonomous Vehicles [8.4]
軌道予測は、自動運転車の周囲の障害物の動きを記述する。本稿では,自律走行車における軌道予測におけるアウト・オブ・ディストリビューションのリアルタイム認識を確立することを目的とする。提案手法は軽量であり, 軌道予測推定時にいつでもアウト・オブ・ディストリビューションの発生を処理できる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:43:58 GMT)
PIFS-Rec: Process-In-Fabric-Switch for Large-Scale Recommendation System Inferences [8.4]
本稿では,布地スイッチの下流ポートを介して,近距離データ処理を実現するPIFS-Recを提案する。 PIFS-Recは、業界標準のCXLベースのシステムであるPondの3.89倍のレイテンシを実現し、最先端のスキームであるBEACONを2.03倍に上回っている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:23:26 GMT)
A Visual-Analytical Approach for Automatic Detection of Cyclonic Events in Satellite Observations [8.3]
熱帯性サイクロンの位置と強度を推定することは、破滅的な気象事象を予測する上で重要な意味を持つ。サイクロンの検出と強度推定の現在のプロセスは、時間を要する物理に基づくシミュレーション研究を含む。本研究の目的は、画像入力とデータ駆動アプローチのみを用いて、サイクロンの検出、強度推定および関連する側面に焦点を当てることである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:52:04 GMT)
DroneWiS: Automated Simulation Testing of small Unmanned Aerial Systems in Realistic Windy Conditions [8.3]
DroneWiSは、sUAS開発者が現実的な風の条件を自動的にシミュレートし、sUASの風に対するレジリエンスをテストすることを可能にする。ガゼボやAirSimのような現在の最先端のシミュレーションツールとは異なり、DroneWiSは計算流体力学(CFD)を利用してユニークな風速を計算する。このシミュレーション機能は、困難で現実的な風の条件下でのsUASのナビゲーション能力について、開発者に深い洞察を提供する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:23:50 GMT)
data2lang2vec: Data Driven Typological Features Completion [8.3]
我々は1,749言語で70%以上の精度を達成し,多言語対応のPOSタグを導入した。また、タイポロジーに欠ける可能性のある機能に焦点を当てた、より現実的な評価設定も導入しています。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:32:57 GMT)
SelectiveKD: A semi-supervised framework for cancer detection in DBT through Knowledge Distillation and Pseudo-labeling [8.3]
がん検出モデルを構築するための半教師付き学習フレームワークであるSelectiveKDを提案する。本フレームワークは,選択的な拡張戦略を実装することで,教師の監督信号の潜在的なノイズを軽減する。複数のデバイスメーカーやロケーションから収集した1万以上の試験を,大規模な実世界のデータセットで評価した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:19:29 GMT)
Spacewalker: Traversing Representation Spaces for Fast Interactive Exploration and Annotation of Unstructured Data [8.2]
Spacewalkerは、複数のモダリティをまたいだデータの探索とアノテートのために設計されたインタラクティブなツールである。 Spacewalkerは、ユーザーがデータ表現を抽出し、低次元空間でそれらを視覚化することを可能にする。その結果,潜伏空間を横断し,マルチモーダルクエリを実行するツールの能力は,利用者の関連データを素早く識別する能力を大幅に向上させることがわかった。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 10:14:01 GMT)
Training Language Models to Win Debates with Self-Play Improves Judge Accuracy [8.1]
本稿では,学習モデルによるスケーラブルな監視手法としての議論の堅牢性を試行し,自己再生によって生成されたデータと議論する。言語モデルに基づく評価器は、モデルの判断が議論に勝つように最適化されたときに、より正確に質問に答える。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:28:33 GMT)
Non-asymptotic convergence analysis of the stochastic gradient Hamiltonian Monte Carlo algorithm with discontinuous stochastic gradient with applications to training of ReLU neural networks [8.1]
我々は、勾配ハミルトニアンモンテカルロのWasserstein-1 と Wasserstein-2 距離の目標測度への収束の非漸近解析を提供する。本研究の主な成果を説明するために、定量推定に関する数値実験と、金融と人工知能に関連するReLUニューラルネットワークに関わるいくつかの問題について考察する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:21:09 GMT)
Deep-Learning Recognition of Scanning Transmission Electron Microscopy: Quantifying and Mitigating the Influence of Gaussian Noises [8.0]
走査型透過電子顕微鏡(STEM)によるナノ粒子認識のための深層学習マスク領域ベースニューラルネットワーク(Mask R-CNN)を提案する。 The Mask R-CNN model were tested onsimulated STEM-HAADF results with different Gaussian noises, Particle shapes and Particle sizes, and the results showed that Gaussian noise has determined Influence on the accuracy of recognition。このフィルタリング認識手法はSTEM-HAADF実験結果にさらに適用され,従来のしきい値法と比較して満足度が向上した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:30:18 GMT)
Limitations of (Procrustes) Alignment in Assessing Multi-Person Human Pose and Shape Estimation [8.0]
我々は,映像監視のシナリオにおいて,人間の3Dポーズと形状を正確に推定する上での課題に焦点をあてる。地上面との3Dメッシュのアライメントを改良してメトリクスを強化することを目的としたRotAvatを紹介する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:15:18 GMT)
Ranking Manipulation for Conversational Search Engines [8.0]
本稿では,対話型検索エンジンが参照するソースのランク付け順序に対するインジェクションのインジェクションの影響について検討する。低品位製品を確実に促進する攻撃木を用いた脱獄技術を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:59:24 GMT)
Stochastic Multi-round Submodular Optimization with Budget [7.9]
我々は、アイテムの部分集合上で定義された単調部分モジュラー目的関数の和を、複数のラウンドで適応的に最大化することを目指している。目的関数はイベントの実現にも依存しており、全てのラウンドで選択できるアイテムの総数は、限られた予算で制限されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:53:01 GMT)
Stochastic Multi-round Submodular Optimization with Budget [7.9]
我々は、アイテムの部分集合上で定義された単調部分モジュラー目的関数の和を、複数のラウンドで適応的に最大化することを目指している。目的関数はイベントの実現にも依存しており、全てのラウンドで選択できるアイテムの総数は、限られた予算で制限されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:53:01 GMT)
3DDX: Bone Surface Reconstruction from a Single Standard-Geometry Radiograph via Dual-Face Depth Estimation [7.8]
単一のX線写真からの3D再構成は、いわゆる2D-3D再構成と呼ばれ、様々な臨床応用の可能性を秘めている。本稿では,X線画像から得られた複数の深度マップを同時に学習し,計算トモグラフィーの登録を行う手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:48:57 GMT)
Can Vision Language Models Learn from Visual Demonstrations of Ambiguous Spatial Reasoning? [7.8]
大規模視覚言語モデル(VLM)は多くのコンピュータビジョンタスクの最先端技術となっている。本稿では,空間的視覚曖昧性タスク (SVAT) と呼ばれる新しいベンチマークを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:45:02 GMT)
WasteGAN: Data Augmentation for Robotic Waste Sorting through Generative Adversarial Networks [7.8]
ムダGANと呼ばれる新しいGANアーキテクチャに基づくデータ拡張手法を提案する。提案手法は,ラベル付きサンプルのごく限られたセットから,セマンティックセグメンテーションモデルの性能を向上させることができる。次に、ムダGAN合成データに基づいて訓練されたモデルから予測される高品質なセグメンテーションマスクを活用し、セグメンテーション・アウェア・グルーピング・ポーズを計算する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:04:21 GMT)
GEIC: Universal and Multilingual Named Entity Recognition with Large Language Models [7.7]
ジェネレーションベース抽出とテキスト内分類(GEIC)の課題について紹介する。次に,多言語GEICフレームワークであるCascadeNERを提案する。我々はまた、Large Language Models(LLMs)用に特別に設計された最初のNERデータセットであるAnythingNERを紹介します。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:33:27 GMT)
Investigating Privacy Attacks in the Gray-Box Setting to Enhance Collaborative Learning Schemes [7.7]
我々は、攻撃者がモデルに限られたアクセスしかできないグレーボックス設定でプライバシ攻撃を研究する。 SmartNNCryptは、同型暗号化を調整して、より高いプライバシーリスクを示すモデルの部分を保護するフレームワークです。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:49:21 GMT)
Judgment of Thoughts: Courtroom of the Binary Logical Reasoning in Large Language Models [7.5]
本稿では,二項論理推論タスクに特化して設計された,素早い工学手法について述べる。この枠組みでは、裁判官、検察官、弁護士が、より信頼性が高く正確な推論を容易にするためにこの技術を利用する。実験結果から,本手法は既存手法よりも有意に優れていた。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:28:05 GMT)
PitRSDNet: Predicting Intra-operative Remaining Surgery Duration in Endoscopic Pituitary Surgery [7.5]
本稿では,下垂体手術中の残存手術期間(RSD)を予測するためのPitRSDNetを提案する。 PitRSDNet はワークフロー知識を RSD 予測に統合する。1) ステップと RSD を同時に予測するためのマルチタスク学習,2) 時間的学習と推論におけるコンテキストとしての事前ステップ。 PitRSDNetは、88のビデオを備えた新しい内視鏡下垂体手術データセットでトレーニングされ、従来の統計的および機械学習手法よりも競争力のあるパフォーマンス向上を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:03:22 GMT)
Unveiling Ontological Commitment in Multi-Modal Foundation Models [7.5]
ディープニューラルネットワーク(DNN)は、概念の豊かな表現とそれぞれの推論を自動的に学習する。そこで本研究では,葉柄概念の集合に対してマルチモーダルDNNから学習したスーパークラス階層を抽出する手法を提案する。最初の評価研究では、最先端基礎モデルから有意義な存在論的階級階層を抽出できることが示されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:24:27 GMT)
Fast decision tree learning solves hard coding-theoretic problems [7.4]
我々は、Ehrenfeucht と Haussler のアルゴリズムの改善により、$k$-NCP に対して$O(log n)$-approximation アルゴリズムが得られることを示す。これは、$k$-NCPのアルゴリズムを設計するための新しい道、あるいはEhrenfeucht と Haussler のアルゴリズムの最適性を確立するための道と解釈できる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:46:28 GMT)
AFIDAF: Alternating Fourier and Image Domain Adaptive Filters as an Efficient Alternative to Attention in ViTs [7.4]
本稿では,特徴抽出のためのFourierと画像領域フィルタリングを交互に行う手法を提案する。軽量モデル間の性能はImageNet-1K分類の最先端レベルに達する。我々のアプローチは、視覚変換器(ViT)を圧縮するための新しいツールとしても機能する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:15:46 GMT)
Let There Be Light: Robust Lensless Imaging Under External Illumination With Deep Learning [7.4]
レンズレスカメラは、アナログ光学からデジタル後処理へ画像形成をシフトすることで、従来のカメラの設計制約を緩和する。新しいカメラの設計や応用が可能である一方で、レンズレスイメージングは望ましくない干渉(他の情報源、ノイズなど)に非常に敏感である。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:24:53 GMT)
Topic-aware Causal Intervention for Counterfactual Detection [7.3]
本稿では,CFDの問題点を考察し,CFDモデルの拡張を目指す。従来のモデルは、偽造性を予測するための手がかりフレーズに依存しているため、テスト中にヒントフレーズのヒントが存在しない場合、大きなパフォーマンス低下に悩まされる。本稿では,入力文のグローバルな意味を捉えるために,ニューラルトピックモデルをCFDモデルに統合することを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:55:33 GMT)
Stochastic Subsampling With Average Pooling [7.2]
本研究では,プールにドロップアウト類似性を取り入れた,平均プールと呼ばれる新しいモジュールを提案する。サブサンプリングと平均プールの特性を記述し,不整合問題なくモジュールの設計に活用する。平均プーリングは、不整合問題による潜在的な性能劣化を伴わずに正規化効果を達成し、既存のディープニューラルネットワークに簡単に接続できる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:18:17 GMT)
Solidago: A Modular Collaborative Scoring Pipeline [7.1]
Solidagoはエンドツーエンドのモジュールパイプラインで、任意のユーザのコミュニティが任意の数のエンティティを共同でスコアできる。まず、プリトラストとピアツーピアのブーチを使用して、信頼スコアをユーザーに割り当てる。第2に、参加に基づいて、信頼スコアは、エンティティごとのユーザ当たりの投票権に変換される。第3に、各ユーザに対して、ユーザの評価データから嗜好モデルを学ぶ。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 20:19:42 GMT)
AI-driven View Guidance System in Intra-cardiac Echocardiography Imaging [7.1]
心内心エコー法(ICE)は、電気生理学(EP)と構造心疾患(SHD)の介入において重要な画像モダリティである。本稿では,人間によるループ内フィードバックを用いたAI駆動クローズドループビュー誘導システムを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:08:10 GMT)
Enhancing Nighttime UAV Tracking with Light Distribution Suppression [7.0]
本研究は,光分布抑制による夜間UAV追跡を向上する新しいエンハンサー,LDEnhancerを提案する。具体的には、光配信情報と画像コンテンツ情報とを分解する新規な画像コンテンツ改善モジュールを開発する。 NAT2024-2という不均一な光分布を持つ夜間UAV追跡データセットは、包括的な評価を提供するために構築されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:19:35 GMT)
Kolmogorov-Arnold Networks (KANs) for Time Series Analysis [6.9]
本稿では,KAN(Kolmogorov-Arnold Networks)の時系列予測への応用について紹介する。コルモゴロフ・アルノルドの表現定理に着想を得たカンスは、伝統的な線型重みをスプラインパラメタライズされた単変数関数に置き換えた。実世界の衛星トラフィック予測タスクにおいて,KANSAが従来のMLP(Multi-Layer Perceptrons)よりも優れていることを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:47:46 GMT)
Locally Regularized Sparse Graph by Fast Proximal Gradient Descent [6.9]
本稿では,SRSG を短縮した新しい正規化スパースグラフを提案する。スパースグラフは高次元データのクラスタリングに有効であることが示されている。 SRSGは他のクラスタリング手法よりも優れていることを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:57:47 GMT)
Revisiting Extragradient-Type Methods -- Part 1: Generalizations and Sublinear Convergence Rates [6.8]
本稿では、方程式と包摂性の両方を解くためのよく知られた指数関数法(EG法)を包括的に分析する。アルゴリズムのクラス全体のサブ線形ベストイテレートとラストイテレートの収束率を分析する。我々は、新しいアルゴリズムのクラスとそれに対応する収束結果を導入し、上述のEGフレームワークをモノトーンの包含に拡張する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:14:05 GMT)
Parameter-efficient Bayesian Neural Networks for Uncertainty-aware Depth Estimation [6.8]
大規模変換器を用いた視覚モデルにおける部分空間ベイズ推定のためのPEFT法の適合性について検討する。実のところ、BitFit、DiffFit、LoRA、CoLoRAはLoRAにインスパイアされた新しいPEFT法であり、ベイジアン推論はより堅牢で信頼性の高い予測性能を実現する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:49:25 GMT)
Monge-Kantorovich Fitting With Sobolev Budgets [6.7]
近似の性能をMonge-Kantorovich $p$-costで定量化する。次に、ソボレフ予算の制約の下で、機能的$mathscrJ_p(f)$を最小化するものとして問題を再構築する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 01:30:16 GMT)
AI-assisted Gaze Detection for Proctoring Online Exams [6.7]
高額のオンライン試験では、潜在的なルール違反を検知し、テストの安全性を確保することが重要である。本研究では,テストテイクがスクリーンから遠ざかっているかどうかを検知する作業について検討する。本稿では,AIを利用した視線検出システムを提案する。これにより,プロクターは異なる映像フレームをナビゲートし,テストテイクが同じ方向を向いている映像フレームを発見することができる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:31:37 GMT)
DALDA: Data Augmentation Leveraging Diffusion Model and LLM with Adaptive Guidance Scaling [6.7]
大規模言語モデル(LLM)と拡散モデル(DM)を利用した効果的なデータ拡張フレームワークを提案する。提案手法は,合成画像の多様性を増大させる問題に対処する。本手法は, 目標分布の付着性を維持しつつ, 多様性を向上した合成画像を生成する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:02:43 GMT)
Exploring the Use of ChatGPT for a Systematic Literature Review: a Design-Based Research [6.6]
体系的な文献レビューを行う上でChatGPTを使用する方法に関する実証的研究は限られている。本研究では、ChatGPTを用いて、同じ33論文のSLRを設計ベースのアプローチで実行した。ガイド原理は、ChatGPTを用いてSLRを実行する必要がある研究者のために、本研究から要約される。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 23:29:19 GMT)
Interpreting Deep Neural Network-Based Receiver Under Varying Signal-To-Noise Ratios [6.6]
本稿では,畳み込みニューラルネットワークに基づくレシーバモデルに着目し,ニューラルネットワークを解釈する新しい手法を提案する。この方法は、モデルのどのユニットまたはユニットが関心のチャネルパラメータに関する最も多く(または少なくとも)情報を含むかを特定する。リンクレベルのシミュレーション実験では、最も(少なくとも)信号対雑音比の処理に寄与する単位を特定する方法の有効性が示されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:26:19 GMT)
ControlCity: A Multimodal Diffusion Model Based Approach for Accurate Geospatial Data Generation and Urban Morphology Analysis [6.6]
本稿では,アクセス可能なVGIデータと完全なVGIデータを利用して,都市建物のフットプリントデータの生成を支援するマルチソース地理データ変換ソリューションを提案する。次に,多モード拡散モデルに基づく地理データ変換手法であるControlCityを提案する。世界の22都市での実験では、ControlCityが実際の都市建築パターンをシミュレートすることに成功している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:03:33 GMT)
How Effective are Self-Supervised Models for Contact Identification in Videos [6.5]
この研究は、8つの異なるCNNベースのビデオSSLモデルを使用して、特にビデオシーケンス内の物理的接触のインスタンスを特定することを目的としている。 Some-Something v2 (SSv2) と Epic-Kitchen (EK-100) のデータセットがこれらのアプローチを評価するために選ばれた。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:32:25 GMT)
Object-Aware Query Perturbation for Cross-Modal Image-Text Retrieval [6.5]
オブジェクト認識型クエリ摂動に基づくクロスモーダル画像テキスト検索フレームワーク」を提案する。提案手法では、既存のV&Lモデルのリッチな表現力と検索性能を維持しつつ、追加の微調整をすることなく、オブジェクト認識のクロスモーダルな画像テキスト検索が可能となる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:18:14 GMT)
Trotter error time scaling separation via commutant decomposition [6.4]
動的量子シミュレーションにおけるトロッター誤差の抑制は通常、より深い回路を走らせる必要がある。時間とともに基本的に異なるスケーリングを持つ不整合誤差成分を分離する可換分解の一般的なフレームワークを導入する。この定式化は, 従来の結果を直接再現するだけでなく, 高次積公式の誤差推定にも有効であることを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:25:50 GMT)
AXCEL: Automated eXplainable Consistency Evaluation using LLMs [6.4]
大規模言語モデル(LLM)は、産業と学術の両方で様々なタスクに広く使われている。本研究は,LLM(AXCEL)を用いた自動eXplainable Consistency評価を導入する。 AXCELは、詳細な推論を提供することで、一貫性スコアの説明を提供するプロンプトベースの一貫性メトリクスである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:45:52 GMT)
Small data deep learning methodology for in-field disease detection [6.3]
本稿では,ポテト作物の遅発症状を軽度に検出できる最初の機械学習モデルを提案する。提案手法は, 焦点損失関数を持つ深部畳み込みニューラルネットワークをベースとした, パッチ方式による高分解能画像の高精細化を実現する。本モデルでは, 早期症状の同定に高い精度と有効性を示した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:31:17 GMT)
PTQ4RIS: Post-Training Quantization for Referring Image Segmentation [6.3]
Referring Image (RIS) は、視覚情報と言語情報の両方を理解することによって、ある文によって参照されるオブジェクトを画像に分割することを目的としている。既存のRIS手法は、リソース制限エッジデバイスにおける実用上の考慮を無視して、トップパフォーマンスモデルを探索する傾向にある。 PTQ4RISと呼ばれる学習後量子化フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:23:46 GMT)
Topological SLAM in colonoscopies leveraging deep features and topological priors [6.2]
ColonSLAMは、古典的なマルチマップメートル法SLAMと深い特徴とトポロジカル事前を組み合わせた、大腸全体のトポロジカルマップを作成するシステムである。提案手法をエンドマップデータセットで実証し,実際の人間の探索における大腸全体の地図作成の可能性を示した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 10:56:08 GMT)
Zero-Shot Detection of LLM-Generated Text using Token Cohesiveness [6.2]
我々は,既存のゼロショット検出器を改善するために,トークン凝集性をプラグアンドプレイモジュールとして利用する汎用的なデュアルチャネル検出パラダイムを開発した。トークンの凝集度を計算するために,ランダムなトークンの削除と意味的差分測定を数ラウンドで行う。各種データセット,ソースモデル,評価設定の4つの最先端ベース検出器を用いた実験は,提案手法の有効性と汎用性を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:18:57 GMT)
Group-Feature (Sensor) Selection With Controlled Redundancy Using Neural Networks [6.2]
本稿では,MLP(Multi-layer Perceptron)ネットワークに基づく新しい特徴選択手法を提案する。グループ機能やセンサ選択の問題に対して一般化し、選択した特徴やグループ間の冗長性のレベルを制御できる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:34:42 GMT)
Evolutionary Greedy Algorithm for Optimal Sensor Placement Problem in Urban Sewage Surveillance [6.1]
本稿では,大規模有向ネットワークの効率的かつ効率的な最適化を実現するために,新しい進化的欲求アルゴリズム(EG)を提案する。提案手法は,香港の小規模合成ネットワークと大規模実世界の下水ネットワークの両方で評価される。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:27:51 GMT)
Math-PUMA: Progressive Upward Multimodal Alignment to Enhance Mathematical Reasoning [6.0]
MLLM(Multimodal Large Language Models)は、テキストベースの数学的問題の解法として優れている。彼らは、主に自然の風景画像で訓練されているため、数学的図形に苦しむ。本研究では,プログレッシブ・アップワード・マルチモーダルアライメントに着目したMath-PUMAを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:53:13 GMT)
Energy-Efficient & Real-Time Computer Vision with Intelligent Skipping via Reconfigurable CMOS Image Sensors [5.8]
ビデオベースのコンピュータビジョンアプリケーションは、一般的に、その重要性に関わらず、フレーム内のすべてのピクセルを読み、処理するため、高エネルギー消費に悩まされる。従来の作業では、入力パッチやピクセルをスキップし、最終タスクからのフィードバックを使ってスキップアルゴリズムをガイドすることで、このエネルギーを削減しようとしていた。本稿では,センサの読み出しフェーズにおいて,フレーム内の不規則領域や行を選択的にスキップすることで,エネルギー効率を向上させるカスタムデザインCMOSイメージセンサ(CIS)システムを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 20:32:55 GMT)
Efficient and generalizable nested Fourier-DeepONet for three-dimensional geological carbon sequestration [5.8]
データ駆動機械学習を用いた代理モデリングは、物理学に基づくシミュレーションを加速する上で有望な代替手段となっている。我々は、FNOの表現性と深層演算ネットワーク(DeepONet)のモジュラリティを組み合わせることにより、ネストしたフーリエ・ディープONetを開発した。この新しいフレームワークは、トレーニング用のネストされたFNOの2倍効率が高く、少なくとも80%低いGPUメモリを必要とする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 02:58:45 GMT)
Offline and Distributional Reinforcement Learning for Radio Resource Management [5.8]
強化学習(RL)は将来のインテリジェント無線ネットワークにおいて有望な役割を担っている。オンラインRLは無線リソース管理(RRM)に採用され、従来のスキームを継承している。本稿では,RRM問題に対するオフラインかつ分散的なRLスキームを提案し,静的データセットを用いたオフライントレーニングを実現する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:22:23 GMT)
Conditional Testing based on Localized Conformal p-values [5.7]
我々は、予測区間を反転させて局所化された共形p値を定義し、それらの理論的性質を証明した。これらの定義されたp-値は、その実用性を説明するためにいくつかの条件付きテスト問題に適用される。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:30:14 GMT)
VL4AD: Vision-Language Models Improve Pixel-wise Anomaly Detection [5.7]
本稿では,既存の異常検知器にVLエンコーダを組み込み,セマンティック・ワイドなVL事前学習を有効活用し,外乱認識を改善することを提案する。また,テキスト・プロンプトによるデータ・トレーニング不要の外部監視を可能にする新たなスコアリング機能を提案する。得られたVL4ADモデルは、広く使用されているベンチマークデータセット上での競合性能を達成する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 20:12:10 GMT)
Fast unconditional reset and leakage reduction in fixed-frequency transmon qubits [5.6]
量子ビットリセットとリークリダクションの両方を実装可能なプロトコルを示す。合計して、クビットリセット、リークリセット、カプラリセットの組み合わせは83nsで完了する。また,本プロトコルは,QECサイクル実行時間を短縮し,量子コンピュータにおけるアルゴリズムの忠実度を向上させる手段を提供する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:57:41 GMT)
AlignedKV: Reducing Memory Access of KV-Cache with Precision-Aligned Quantization [5.6]
混合精度量子化は重要なパラメータと重要でないパラメータを区別する。既存の手法は定性的分析と手動実験によってのみ重要なパラメータを識別できる。本稿では,パラメータの重要性を総合的に評価する定量的枠組みを構築するために,いわゆる「精度アライメント」という新しい基準を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 01:39:02 GMT)
MorphoSeg: An Uncertainty-Aware Deep Learning Method for Biomedical Segmentation of Complex Cellular Morphologies [5.5]
深層学習は医学や生物学的イメージング、特にセグメンテーションのタスクに革命をもたらした。細胞の形態の多様性と複雑さのため、生物学的な細胞を分断することは依然として困難である。我々は多能性癌細胞株であるNtera-2細胞の新しいベンチマークデータセットを導入する。トレーニング中の低線量領域からの仮想アウトリーチのサンプリングを取り入れた,複雑な細胞形態区分(MorphoSeg)のための不確実性を考慮したディープラーニングフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:25:06 GMT)
On Your Mark, Get Set, Predict! Modeling Continuous-Time Dynamics of Cascades for Information Popularity Prediction [5.5]
情報の普及を正確に予測する鍵は、基礎となる時間情報拡散過程を微妙にモデル化することにある。本稿では,情報人気予測のために,カスケードの連続時間ダイナミクスをモデル化したConCatを提案する。実世界の3つのデータセット上でConCatを評価するための広範な実験を行った。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:08:44 GMT)
SPL: A Socratic Playground for Learning Powered by Large Language Model [5.4]
ソクラティック・プレイグラウンド・フォー・ラーニング (SPL) は GPT-4 をベースとした対話型プレイグラウンドである。 SPLは、個人のニーズに合わせてパーソナライズされた適応的な学習体験を強化することを目的としている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 01:48:32 GMT)
FlexiTex: Enhancing Texture Generation with Visual Guidance [5.4]
視覚誘導によってリッチな情報を埋め込んで高品質なテクスチャを生成するFlexiTexを提案する。 FlexiTexのコアとなるVisual Guidance Enhancementモジュールは、テキストプロンプトの曖昧さを軽減するために、ビジュアルガイダンスからより具体的な情報を取り入れている。視覚的ガイダンスをさらに強化するため、異なるカメラポーズに基づいて方向指示を自動設計するDirection-Aware Adaptationモジュールを導入する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:45:56 GMT)
FlexiTex: Enhancing Texture Generation with Visual Guidance [5.4]
視覚誘導によってリッチな情報を埋め込んで高品質なテクスチャを生成するFlexiTexを提案する。 FlexiTexのコアとなるVisual Guidance Enhancementモジュールは、テキストプロンプトの曖昧さを軽減するために、ビジュアルガイダンスからより具体的な情報を取り入れている。視覚的ガイダンスをさらに強化するため、異なるカメラポーズに基づいて方向指示を自動設計するDirection-Aware Adaptationモジュールを導入する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:45:56 GMT)
CasFT: Future Trend Modeling for Information Popularity Prediction with Dynamic Cues-Driven Diffusion Models [5.3]
本稿では,観測情報ニューラルズとODEを用いて抽出したダイナミックキューを活用して,未来増加傾向の発生を導出するCasFTを提案する。 3つの実世界のデータセットで実施された実験は、CasFTが最先端のアプローチと比較して予測精度を改善することを示した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:03:16 GMT)
TransUKAN:Computing-Efficient Hybrid KAN-Transformer for Enhanced Medical Image Segmentation [5.3]
U-Netは現在、医療画像セグメンテーションの最も広く使われているアーキテクチャである。我々は、メモリ使用量と計算負荷を減らすためにkanを改善した。このアプローチは、非線形関係をキャプチャするモデルの能力を高める。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:03:46 GMT)
TransUKAN:Computing-Efficient Hybrid KAN-Transformer for Enhanced Medical Image Segmentation [5.3]
U-Netは現在、医療画像セグメンテーションの最も広く使われているアーキテクチャである。我々は、メモリ使用量と計算負荷を減らすためにkanを改善した。このアプローチは、非線形関係をキャプチャするモデルの能力を高める。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:03:46 GMT)
Domain-Independent Automatic Generation of Descriptive Texts for Time-Series Data [5.3]
時系列データからドメインに依存しない記述テキストを生成する手法を提案する。新たな後方アプローチを実装することで、観測データセットのための時間自動キャプションを作成する。実験の結果,TACOデータセットを用いて学習した対照的な学習ベースモデルでは,新しいドメインにおける時系列データのための記述テキストを生成することができることがわかった。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:04:03 GMT)
An Analysis of Minimum Error Entropy Loss Functions in Wireless Communications [5.1]
本稿では,無線通信における深層学習に適した情報理論損失関数として,最小誤差エントロピー基準を提案する。本手法は,大気上回帰法と室内局在法という2つの重要な応用のシミュレーションにより評価した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:45:47 GMT)
Commitments are equivalent to statistically-verifiable one-way state generators [5.1]
ワンウェイ状態発生器 (OWSG) は古典的なワンウェイ関数の自然な量子アナログである。我々は、O(n/log(n)-copy-OWSGs(nは入力長を表す)がポリ(n)-copy-OWSGsおよび量子コミットメントに等しいことを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:40:08 GMT)
Time Constant: Actuator Fingerprinting using Transient Response of Device and Process in ICS [4.9]
我々は Time Constant という新しいアクチュエータフィンガープリント技術を開発した。 Time Constantはアクチュエータと物理プロセスの過渡的なダイナミクスをキャプチャする。我々は、インサイダー敵の顔にコマンドインジェクションやリプレイアタックに抵抗する複写抵抗アクチュエータ指紋を開発する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 01:04:13 GMT)
Numerical Approximation Capacity of Neural Networks with Bounded Parameters: Do Limits Exist, and How Can They Be Measured? [4.9]
普遍近似は理論的には実現可能であるが,現実的な数値シナリオでは,Deep Neural Networks (DNN) は有限次元ベクトル空間でしか近似できない。ネットワークの系列の近似能力限界を定量化するために、textit$epsilon$ outer measure と textitNumerical Span Dimension (NSdim) の概念を導入する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:43:48 GMT)
Unique and Universal scaling in dynamical quantum phase transitions [4.8]
普遍性とスケーリングは平衡連続相転移の基本的な概念である。我々は、ゆっくりと駆動された動的量子相転移において臨界時間のユニークで普遍的なスケーリング挙動を公表する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:25:19 GMT)
Unique and Universal scaling in dynamical quantum phase transitions [4.8]
普遍性とスケーリングは平衡連続相転移の基本的な概念である。我々は、ゆっくりと駆動された動的量子相転移において臨界時間のユニークで普遍的なスケーリング挙動を公表する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:25:19 GMT)
Data-efficient Trajectory Prediction via Coreset Selection [4.7]
軌道予測モデルの訓練には2つの方法がある。簡単ミーム駆動のシナリオがデータセットを圧倒的に支配することが多い。コアセット選択に基づく新しいデータ効率訓練手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:00:11 GMT)
Feedforward Controllers from Learned Dynamic Local Model Networks with Application to Excavator Assistance Functions [4.7]
我々は、ゼロダイナミクスによるLMNのフィードバック線形化が有効なコントローラを生成するときの基準を提供する。実験では、外乱信号と複数の入力と出力を組み込むことで、学習した制御器の追跡性能が向上する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:40:07 GMT)
Benchmarking Cognitive Domains for LLMs: Insights from Taiwanese Hakka Culture [4.5]
本研究では,文化的知識の理解と処理において,大規模言語モデル(LLM)の性能を評価するためのベンチマークを提案する。この研究は、記憶、理解、応用、分析、評価、創造という6つの認知領域にわたるLLMを体系的に評価する多次元フレームワークを開発する。その結果,すべての認知領域,特に文化知識の正確な検索と応用を必要とするタスクにおいて,RAGの有効性が強調された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 00:31:18 GMT)
Understanding the Cognitive Complexity in Language Elicited by Product Images [4.4]
この研究は、製品イメージによって引き起こされる人間の言語の認知的複雑さを測定し、検証するためのアプローチを提供する。製品イメージの多彩な記述ラベルを含む大規模なデータセットを導入します。人間の評価された認知複雑性は、自然言語モデルを用いて近似できることを示した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 00:26:11 GMT)
Automating Traffic Model Enhancement with AI Research Agent [4.4]
Traffic Research Agent(TR-Agent)は、交通モデルを自律的に開発・洗練するAI駆動システムである。 TR-Agentは、複数のトラフィックモデルで大幅なパフォーマンス向上を実現している。研究とコラボレーションをさらに支援するため、私たちは実験で使用されるコードとデータの両方をオープンソース化しました。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:42:25 GMT)
DeformStream: Deformation-based Adaptive Volumetric Video Streaming [4.4]
ボリュームビデオストリーミングは没入型3D体験を提供するが、高い帯域幅要件とレイテンシの問題のために大きな課題に直面している。本稿では,メッシュベースの表現の変形性を生かして,ボリュームビデオストリーミング性能を向上させる新しいフレームワークであるAdaptive Volumetric Video Streamingを紹介する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 04:43:59 GMT)
Enhancing Post-Hoc Attributions in Long Document Comprehension via Coarse Grained Answer Decomposition [4.4]
ポストホック属性システムは、回答テキストをソース文書にマッピングするように設計されているが、このマッピングの粒度は未解決である。そこで本研究では,テンプレートを用いたテキスト内学習を用いて,帰属に対する回答の事実分解に関する新しい手法を提案し,検討する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:32:35 GMT)
AAPM: Large Language Model Agent-based Asset Pricing Models [4.3]
本稿では, LLMエージェントからの質的意思決定的投資分析と, 定量的な手動経済要因を融合した新たな資産価格手法を提案する。実験結果から,本手法はポートフォリオ最適化および資産価格誤差において,機械学習に基づく資産価格ベースラインよりも優れていることが示された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:27:35 GMT)
ECG-Image-Database: A Dataset of ECG Images with Real-World Imaging and Scanning Artifacts; A Foundation for Computerized ECG Image Digitization and Analysis [4.3]
ECG-Image-Databaseは、ECG時系列データから生成された心電図(ECG)画像の大規模かつ多種多様なコレクションである。我々は、オープンソースのPythonツールキットであるECG-Image-Kitを使用して、生のECG時系列から12リードのECGプリントアウトのリアルな画像を生成する。得られたデータセットには35,595個のソフトウェアラベル付きECGイメージが含まれており、幅広い画像アーティファクトと歪みがある。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 04:30:19 GMT)
Task Addition in Multi-Task Learning by Geometrical Alignment [4.2]
本稿では,限定データを用いた目標タスクの性能向上のためのタスク追加手法を提案する。これは、大規模データセット上で教師付きマルチタスク事前トレーニングによって達成され、続いて、各タスクに対するタスク固有のモジュールの追加とトレーニングが行われる。本実験は,従来のマルチタスク手法よりもGATEのタスク追加戦略の方が,計算コストに匹敵する優れた性能を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:56:00 GMT)
Going Beyond U-Net: Assessing Vision Transformers for Semantic Segmentation in Microscopy Image Analysis [4.2]
トランスモデルは顕微鏡画像のセグメンテーションプロセスを強化することを約束します。我々は、UNETR、Segment Anything Model、Swin-UPerNetなどのトランスフォーマーの有効性を評価し、確立されたU-Netモデルと比較する。その結果,従来のU-NetモデルやUnmodified Swin-UPerNetと比較してセグメンテーション性能が向上した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:53:48 GMT)
CNN Mixture-of-Depths [4.2]
畳み込みニューラルネットワーク(CNN)のためのMixture-of-Depths(MoD) 畳み込みニューラルネットワーク(CNN)のためのMixture-of-Depths(MoD)を紹介する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:19:04 GMT)
Synchronizable hybrid subsystem codes [4.1]
我々は、量子シンクロナイズ可能な符号、サブシステム符号、および古典的巡回符号の対から構築されたハイブリッド符号間の接続を確立する。また、パウリと同期の誤りを訂正できる同期可能なハイブリッドサブシステムコードを構築する方法を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:37:23 GMT)
One-Shot Machine Unlearning with Mnemonic Code [4.1]
人工知能(AI)アプリケーションに固有の倫理的およびプライバシー上の問題は、ディープラーニングの急速な普及に対する懸念が高まっている。機械学習(MU)は、トレーニングされたAIモデルを望ましくないトレーニングデータを忘れさせることによって、これらの問題に対処する研究領域である。残念なことに、既存のMUメソッドの多くは、忘れるのにかなりの時間と計算コストを必要とする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:51:23 GMT)
An Adaptive Re-evaluation Method for Evolution Strategy under Additive Noise [3.9]
本稿では,加法的なガウスホワイトノイズによる関数値の最適再評価数を適応的に選択する手法を提案する。実験では,CMA-ESのノイズハンドリング手法を人工的なテスト関数の集合上で実験的に比較した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:10:21 GMT)
Block-Attention for Efficient RAG [3.9]
本稿では,Retrieval-Augmented Generation(RAG)シナリオにおける推論遅延の増加とコストに対処するアテンションメカニズムであるBlock-Attentionを紹介する。各パスをブロックとして定義することで、Block-AttentionはすべてのパスのKV状態をプリコンプリートし、メモリにキャッシュすることができます。 4つのRAGベンチマークの実験では、ブロックの微調整後、ブロック注意モデルは自己注意モデルよりもパフォーマンス(Llama3で68.4%、Llama3で67.9%、Mistralで62.8%、59.6%)が良いことが示されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:46:42 GMT)
Block-Attention for Efficient RAG [3.9]
本稿では,Retrieval-Augmented Generation(RAG)シナリオにおける推論遅延の増加とコストに対処するアテンションメカニズムであるBlock-Attentionを紹介する。各パスをブロックとして定義することで、Block-AttentionはすべてのパスのKV状態をプリコンプリートし、メモリにキャッシュすることができます。 4つのRAGベンチマークの実験では、ブロックの微調整後、ブロック注意モデルは自己注意モデルよりもパフォーマンス(Llama3で68.4%、Llama3で67.9%、Mistralで62.8%、59.6%)が良いことが示されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:46:42 GMT)
Layout-Corrector: Alleviating Layout Sticking Phenomenon in Discrete Diffusion Model [3.9]
本稿では,レイアウトの調和を考慮し,レイアウト内の不調和要素を識別できる学習ベースモジュールを提案する。このモジュールは、様々な最先端DDMと組み合わせてレイアウト生成性能を継続的に向上させる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:24:43 GMT)
Accumulator-Aware Post-Training Quantization [3.8]
本稿では,学習後量子化のためのアキュムレータ対応拡張フレームワークであるAXEを紹介する。我々はAXEを一般化して、初めて多段階蓄積をサポートする。本研究では,アキュムレータビット幅とモデル精度とのトレードオフを,ベースライン法よりも大幅に改善した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:58:35 GMT)
Reinforcement Learning for Finite Space Mean-Field Type Games [3.8]
平均場型ゲーム(MFTG)は、大連立間のナッシュ均衡を記述する。有限空間設定でそのようなゲームに対する強化学習法を開発する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:15:26 GMT)
Embedding an ANN-Based Crystal Plasticity Model into the Finite Element Framework using an ABAQUS User-Material Subroutine [3.8]
本論文は、ユーザマテリアル(UMAT)サブルーチンを用いて、トレーニングニューラルネットワーク(NN)を有限要素(FE)フレームワークに組み込む実践的な方法を提案する。この研究は、ABAQUS UMATで広範囲に応用された複雑な非弾性な非線形経路依存材料応答である結晶の塑性を例証する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 10:47:18 GMT)
DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation [3.8]
拡散モデルの量子化はモデルを圧縮し加速する有望な方法である。既存の方法は、低ビット量子化のために、精度と効率の両方を同時に維持することはできない。拡散モデルのための新しい量子化フレームワークであるDilateQuantを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:56:46 GMT)
DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation [3.8]
拡散モデルの量子化はモデルを圧縮し加速する有望な方法である。既存の方法は、低ビット量子化のために、精度と効率の両方を同時に維持することはできない。拡散モデルのための新しい量子化フレームワークであるDilateQuantを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:56:46 GMT)
Quantifying Visual Properties of GAM Shape Plots: Impact on Perceived Cognitive Load and Interpretability [3.7]
GAM(Generalized Additive Models)は、機械学習のパフォーマンスと解釈可能性のバランスを提供する。本研究は,GAM形状プロットの視覚特性と認知負荷の関係について検討した。我々は,認知負荷を予測するための実用的なツールを提供するキンクの数に基づくシンプルなモデルを開発する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:36:14 GMT)
Examining the Rat in the Tunnel: Interpretable Multi-Label Classification of Tor-based Malware [3.6]
Tor上の悪意のあるトラフィックは混雑を誘発し、Torのパフォーマンスを低下させる。最近の研究は、捕獲されたTorのトラフィックを悪意または良心として正確に分類する可能性を実証している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:38:09 GMT)
A Differentiable Approach to Multi-scale Brain Modeling [3.6]
本稿では,脳シミュレータBrainPyを用いたマルチスケール微分脳モデリングワークフローを提案する。単一ニューロンレベルでは、微分可能なニューロンモデルを実装し、電気生理学的データへの適合を最適化するために勾配法を用いる。ネットワークレベルでは、生物学的に制約されたネットワークモデルを構築するためにコネクトロミックデータを組み込む。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:56:29 GMT)
Accelerating TinyML Inference on Microcontrollers through Approximate Kernels [3.6]
本研究では、近似計算とソフトウェアカーネル設計を組み合わせることで、マイクロコントローラ上での近似CNNモデルの推定を高速化する。 CIFAR-10データセットでトレーニングされたSTM32-Nucleoボードと2つの人気のあるCNNによる評価は、最先端の正確な推測と比較すると、平均21%のレイテンシ削減が可能であることを示している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:10:33 GMT)
Entailment-Driven Privacy Policy Classification with LLMs [3.6]
本稿では,プライバシーポリシーの段落をユーザが容易に理解できる意味のあるラベルに分類する枠組みを提案する。私たちのフレームワークは、F1スコアを平均11.2%改善します。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:07:05 GMT)
Log-normal Mutations and their Use in Detecting Surreptitious Fake Images [3.6]
我々は、一般的なブラックボックス最適化ツール、特にログ正規化アルゴリズムにインスパイアされた他のブラックボックス攻撃について検討する。偽検知器の攻撃に対数正規法を適用し,攻撃を成功させる。そして、これらの攻撃と深度検出を組み合わせることで、改良された偽検出装置を作成する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:00:21 GMT)
Log-normal Mutations and their Use in Detecting Surreptitious Fake Images [3.6]
我々は、一般的なブラックボックス最適化ツール、特にログ正規化アルゴリズムにインスパイアされた他のブラックボックス攻撃について検討する。偽検知器の攻撃に対数正規法を適用し,攻撃を成功させる。そして、これらの攻撃と深度検出を組み合わせることで、改良された偽検出装置を作成する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:00:21 GMT)
When Is Inductive Inference Possible? [3.5]
オンライン学習理論への新たなリンクを確立することにより,帰納的推論の厳密な特徴付けを行う。帰納的推論が可能であることは、仮説クラスがオンライン学習可能なクラスの可算和である場合に限る。私たちの主要な技術ツールは、新しい一様でないオンライン学習フレームワークです。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 19:38:47 GMT)
A Survey for Deep Reinforcement Learning Based Network Intrusion Detection [3.5]
本稿では,ネットワーク侵入検出における深部強化学習(DRL)の可能性と課題について考察する。 DRLモデルの性能は分析され、DRLは将来性を持っているが、近年の多くの技術は未解明のままである。この論文は、現実世界のネットワークシナリオにおけるDRLの展開とテストを強化するための推奨事項で締めくくっている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:39:30 GMT)
Severity Prediction in Mental Health: LLM-based Creation, Analysis, Evaluation of a Novel Multilingual Dataset [3.4]
大規模言語モデル(LLM)は、メンタルヘルス支援システムを含む様々な医療分野に統合されつつある。本稿では、広く使われているメンタルヘルスデータセットを英語から6言語に翻訳した新しい多言語適応法を提案する。このデータセットは、精神状態を検出し、複数の言語にわたる重症度を評価する上で、LLMのパフォーマンスを総合的に評価することを可能にする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:14:34 GMT)
Pre-trained Language Models Return Distinguishable Probability Distributions to Unfaithfully Hallucinated Texts [3.3]
本研究では,事前学習した言語モデルを用いて,不確実な生成確率と不確実性分布を不当に幻覚したテキストに戻すことを示す。 6つのデータセット上で24のモデルを調べることで、88～98%のケースが統計的に識別可能な生成確率と不確実性分布を返すことがわかった。提案アルゴリズムは,高信頼度指標を達成しつつ,音質の一般的な指標を維持しながら,他のベースラインよりも優れる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:22:30 GMT)
A Newton Method for Hausdorff Approximations of the Pareto Front within Multi-objective Evolutionary Algorithms [3.3]
本論文では,多目的進化アルゴリズムで用いられるパレートフロントのハウスドルフ近似に対するセットベースニュートン法を提案する。いくつかのベンチマークテスト関数と異なる基底進化アルゴリズムにおける後処理ステップとしてNewton法の利点を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:56:05 GMT)
Learning Representation for Multitask learning through Self Supervised Auxiliary learning [3.2]
ハードパラメータ共有アプローチでは、複数のタスクを通して共有されるエンコーダは、タスク固有の予測子に渡されるデータ表現を生成する。共有エンコーダが生成する表現の普遍性を改善することを目的としたダミー勾配ノルム正規化を提案する。 DGRは共有表現の品質を効果的に向上し、マルチタスク予測性能が向上することを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:08:35 GMT)
Adaptive Self-Supervised Learning Strategies for Dynamic On-Device LLM Personalization [3.2]
大規模言語モデル(LLM)は私たちがテクノロジと対話する方法に革命をもたらしたが、個々のユーザの好みに対するパーソナライズは依然として大きな課題である。本稿では,LSMを動的にパーソナライズするために自己指導型学習技術を利用する適応型自己監督学習戦略(ASLS)を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:35:06 GMT)
Fourier neural operators for spatiotemporal dynamics in two-dimensional turbulence [3.2]
フーリエ・ニューラル演算子(FNO)に基づくモデルと偏微分方程式(PDE)を組み合わせれば,流体力学シミュレーションを高速化できる。また、乱流の長期シミュレーションのために、機械学習モデルによって回避される必要のある純粋にデータ駆動アプローチの落とし穴についても論じる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:36:44 GMT)
AgRegNet: A Deep Regression Network for Flower and Fruit Density Estimation, Localization, and Counting in Orchards [3.1]
本稿では,樹木果樹冠内の花と果実の密度,数,位置を推定する,深い回帰に基づくネットワークAgRegNetを提案する。一般的なU-NetアーキテクチャにインスパイアされたAgRegNetは、エンコーダからデコーダへのスキップ接続と、エンコーダ機能抽出器としてConvNeXt-Tを改良したU字型ネットワークである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:19:32 GMT)
Fourier neural operators for spatiotemporal dynamics in two-dimensional turbulence [3.1]
フーリエ・ニューラル演算子(FNO)に基づくモデルと偏微分方程式(PDE)を組み合わせれば,流体力学シミュレーションを高速化できる。また、乱流の長期シミュレーションのために、機械学習モデルによって回避される必要のある純粋にデータ駆動アプローチの落とし穴についても論じる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:36:44 GMT)
Fourier neural operators for spatiotemporal dynamics in two-dimensional turbulence [3.1]
フーリエ・ニューラル演算子(FNO)に基づくモデルと偏微分方程式(PDE)を組み合わせれば,流体力学シミュレーションを高速化できる。また、乱流の長期シミュレーションのために、機械学習モデルによって回避される必要のある純粋にデータ駆動アプローチの落とし穴についても論じる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:36:44 GMT)
Alternative Telescopic Displacement: An Efficient Multimodal Alignment Method [3.1]
本稿では,マルチモーダル情報の融合に革命をもたらす機能アライメントに対する革新的なアプローチを提案する。提案手法では,異なるモードをまたいだ特徴表現の遠隔的変位と拡張の新たな反復的プロセスを用いて,共有特徴空間内の一貫性のある統一表現を導出する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:40:27 GMT)
Decomposition of Equivariant Maps via Invariant Maps: Application to Universal Approximation under Symmetry [3.1]
我々は、群 $G$ に関する不変写像と同変写像の関係の理論を発展させる。我々は、この理論をグループ対称性を持つディープニューラルネットワークの文脈で活用し、それらのメカニズムに関する新たな洞察を得る。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:27:41 GMT)
SWE2: SubWord Enriched and Significant Word Emphasized Framework for Hate Speech Detection [3.0]
本稿では,メッセージの内容のみに依存し,ヘイトスピーチを自動的に識別するSWE2という新しいヘイトスピーチ検出フレームワークを提案する。実験結果から,提案モデルでは0.975の精度と0.953のマクロF1が達成され,最先端の7つのベースラインを上回った。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:05:44 GMT)
An Effective, Robust and Fairness-aware Hate Speech Detection Framework [3.0]
既存のヘイトスピーチ検出手法には、いくつかの面で制限がある。我々は,データ拡張,公平性,不確実性を考慮した新しいフレームワークを設計する。本モデルは,攻撃シナリオと攻撃シナリオの両方で,最先端の8つの手法より優れている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:01:51 GMT)
Social Bias in Large Language Models For Bangla: An Empirical Study on Gender and Religious Bias [3.0]
LLM生成したバングラ語に対する2種類の社会的バイアスについて検討した。これは、バングラのLLMのバイアス評価を私たちの知識の最大限に活用する、この種の研究としては初めてのものです。すべてのコードとリソースは、Bangla NLPにおけるバイアス関連研究の進展のために公開されています。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:05:16 GMT)
A Hybrid Quantum-Classical AI-Based Detection Strategy for Generative Adversarial Network-Based Deepfake Attacks on an Autonomous Vehicle Traffic Sign Classification System [3.0]
著者らは、AV信号の分類システムを騙すために、生成的敵ネットワークベースのディープフェイク攻撃をいかに構築できるかを提示する。彼らは、ハイブリッド量子古典ニューラルネットワーク(NN)を活用したディープフェイクトラフィックサイン画像検出戦略を開発した。その結果、ディープフェイク検出のためのハイブリッド量子古典的NNは、ほとんどの場合、ベースラインの古典的畳み込みNNと似た、あるいは高い性能が得られることが示唆された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 19:44:56 GMT)
Verified Relative Safety Margins for Neural Network Twins [2.9]
相対安全マージン(RSM)の概念を紹介する。 RSMは決定が保存されているかどうかを確定できるが、品質を定量化することもできる。 MNIST, CIFAR10, および2つの実世界の医療データセットを用いたアプローチの評価を行った。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:23:37 GMT)
Cycle Counting under Local Differential Privacy for Degeneracy-bounded Graphs [2.9]
我々のアルゴリズムは、縮退有界グラフに対する (O(n1.5 + sqrtC_4) = O(n2)) の予測誤差を達成する。アルゴリズムの中核となる考え方は、前処理ステップに続く正確な三角形の数である。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:23:58 GMT)
CodonMPNN for Organism Specific and Codon Optimal Inverse Folding [2.9]
タンパク質のバックボーン構造と生物ラベルに条件付けられたコドン配列を生成するコドンMPNNを提案する。自然発生のDNA配列がコドン最適性に近い場合、コドンMPNNは高い発現率のコドン配列を生成することができる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:27:28 GMT)
Stress Detection from Photoplethysmography in a Virtual Reality Environment [2.9]
本稿では,非侵襲的かつ広く利用可能な生理的信号を用いて患者の精神状態を評価できる仮想現実治療プラットフォームを提案する。ケーススタディでは,平和状態とストレス状態の2つのバイナリ分類をPSG信号を用いて検出する方法について検討した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 23:29:30 GMT)
Spiders Based on Anxiety: How Reinforcement Learning Can Deliver Desired User Experience in Virtual Reality Personalized Arachnophobia Treatment [2.9]
プロシージャコンテンツ生成(PCG)と強化学習(RL)を利用したバーチャルリアリティ露光療法(VRET)の枠組みを提案する。この治療では、仮想クモを観察する患者が脱感作し恐怖症を減少させる。より一般的なルールベースのVRET法と比較して,本システムの優れた性能を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:30:39 GMT)
Identifying Unnecessary 3D Gaussians using Clustering for Fast Rendering of 3D Gaussian Splatting [2.9]
3D-GSは、速度と画質の両方においてニューラル放射場(NeRF)を上回った新しいレンダリングアプローチである。本研究では,現在のビューをレンダリングするために,不要な3次元ガウスをリアルタイムに識別する計算量削減手法を提案する。 Mip-NeRF360データセットの場合、提案手法は2次元画像投影の前に平均して3次元ガウスの63%を排除し、ピーク信号対雑音比(PSNR)を犠牲にすることなく全体のレンダリングを約38.3%削減する。提案されたアクセラレータは、GPUと比較して10.7倍のスピードアップも達成している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 01:29:37 GMT)
Cross-Lingual and Cross-Cultural Variation in Image Descriptions [2.9]
画像記述における言語間差異に関する大規模な実証的研究を行った。私たちは、31の言語とさまざまな場所の画像を持つマルチモーダルデータセットを使用します。我々の分析によると、地理的にあるいは遺伝的に近い言語のペアは、同じ実体に頻繁に言及する傾向がある。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:57:09 GMT)
Enhancing Recommendation with Denoising Auxiliary Task [2.8]
ユーザの振る舞いの任意性のため、ノイズの存在はリコメンデータシステムにおける次の行動を予測するための課題となる。提案手法は, 推薦システムにおいて, より正確に雑音列を再重み付けすることを目的とした, 自己監督型補助タスクジョイントトレーニング (ATJT) 手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:26:29 GMT)
Exploring Semantic Clustering in Deep Reinforcement Learning for Video Games [2.8]
セマンティッククラスタリング(セマンティッククラスタリング)とは、セマンティックな類似性に基づいて内部的にビデオ入力をグループ化するニューラルネットワークの本質的な能力を指す。本稿では,特徴量削減とオンラインクラスタリングを兼ね備えたセマンティッククラスタリングモジュールを統合したDRLアーキテクチャを提案する。ビデオゲームにおけるDRLにおける提案モジュールの有効性とセマンティッククラスタリング特性を検証する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:48:14 GMT)
CodecNeRF: Toward Fast Encoding and Decoding, Compact, and High-quality Novel-view Synthesis [2.7]
我々は,1つのフォワードパスでNeRF表現を生成可能なNeRF表現のためのニューラルネットワークであるCodecNeRFを提案する。近年のパラメータ効率のよい微調整手法に着想を得て,生成したNeRF表現を新しいテストインスタンスに効率よく適応させるファインタニング手法を提案する。提案したCodecNeRFは100倍以上の前例のない圧縮性能を達成し、符号化時間を大幅に短縮した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:16:41 GMT)
RESAA: A Removal and Structural Analysis Attack Against Compound Logic Locking [2.7]
本稿では,CLLでロックされた設計を分類し,重要なゲートを識別し,秘密鍵を明らかにするための様々な攻撃を実行するための新しいフレームワークRESAAを提案する。その結果、RESAAは比較的複雑なITC'99ベンチマーク回路で92.6%の精度を達成できることがわかった。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:14:36 GMT)
Weighted Cross-entropy for Low-Resource Languages in Multilingual Speech Recognition [2.7]
重み付きクロスエントロピーの新たな応用法を提案する。我々は5つの高ソース言語と1つの低リソース言語でWhisper多言語ASRモデルを微調整する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:09:09 GMT)
Training-free Zero-shot Composed Image Retrieval via Weighted Modality Fusion and Similarity [2.7]
合成画像検索(CIR)は、参照画像と修正テキストの組み合わせとしてクエリを定式化する。本稿では,ZS-CIRのためのトレーニングフリーアプローチを提案する。提案手法は単純で実装が容易であり,FashionIQおよびCIRRデータセットを用いた実験によりその有効性が検証された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 02:28:08 GMT)
Inline Photometrically Calibrated Hybrid Visual SLAM [2.7]
本稿では,Hybrid Direct-indirect visual SLAM (H-SLAM) 内でのオンラインシーケンシャルな測光キャリブレーションを組み合わせた視覚SLAMへの統合的アプローチを提案する。光度キャリブレーションは、異なる照明条件下での画素強度値の正規化に役立つ。また, H-SLAMの間接成分として, 検出された特徴が変動照明条件でより安定であることから, 具体的な利点が得られた。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:02:30 GMT)
Model Averaging and Double Machine Learning [2.6]
DDMLは, 従来の代替手法よりも, 部分的に未知の機能形式に対して頑健であることを示す。提案を実装したStaとRのソフトウェアを提供する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 20:56:11 GMT)
Zeeman polaritons as a platform for probing Dicke physics in condensed matter [2.5]
スピン-ボソン系はディックモデルとより互換性があり、超強結合光-マッターハイブリッドに対して予測される現象の実験的実現を追求するボソン-ボソン系よりも有利であることを示す。この結果は、スピン-ボソン系がディックモデルとより互換性があり、超強結合光-マッターハイブリッドに対して予測される現象の実験的実現を追求するボソン-ボソン系よりも有利であることを示している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 20:28:01 GMT)
Setting the AI Agenda -- Evidence from Sweden in the ChatGPT Era [2.5]
本稿では,ChatGPTのリリース前後におけるスウェーデンにおけるAIメタ議論の展開について検討する。議題設定理論の観点からは、議論を主導する政党政治のエリートであることを提案する。我々は、2010年代初頭から現在までのエリートレベルの文書のオリジナルのデータセットを、スウェーデンの主要な新聞に掲載されているオペ・エッセイを用いて描いている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:58:02 GMT)
Fast decision tree learning solves hard coding-theoretic problems [2.5]
我々は、Ehrenfeucht と Haussler のアルゴリズムの改善により、$k$-NCP に対して$O(log n)$-approximation アルゴリズムが得られることを示す。これは、$k$-NCPのアルゴリズムを設計するための新しい道、あるいはEhrenfeucht と Haussler のアルゴリズムの最適性を確立するための道と解釈できる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:46:28 GMT)
CaBRNet, an open-source library for developing and evaluating Case-Based Reasoning Models [2.4]
CaBRNetはCase-Based Reasoning Networks用のオープンソースでモジュール化された後方互換性のあるフレームワークである。本稿では,CaBRNetを提案する。CaBRNetはCase-Based Reasoning Networksのための,オープンソースでモジュール化された,後方互換性のあるフレームワークである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:32:03 GMT)
ChatDiet: Empowering Personalized Nutrition-Oriented Food Recommender Chatbots through an LLM-Augmented Framework [2.3]
ChatDietは、パーソナライズされた栄養指向の食品レコメンデーションチャットボット用に特別に設計された、新しいフレームワークである。 ChatDietは、オーケストラが補完する個人モデルと人口モデルを統合し、シームレスに関連する情報を検索し、処理する。 ChatDietの評価には説得力のあるケーススタディが含まれており、個別の栄養効果を推定するための因果的個人モデルを確立している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:31:09 GMT)
Symbolic State Partition for Reinforcement Learning [2.2]
優れたパーティショニングは、学習中の一般化と、事前経験のより効率的な活用を可能にする。パーティショニングは、状態成分間の非線形関係の存在において特に有害な近似を導入する。シンボル分割は, 環境行動に関して, 状態空間のカバレッジを向上し, 余分な報酬に対して強化学習がより優れていることを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 10:09:47 GMT)
A Versatile and Differentiable Hand-Object Interaction Representation [2.2]
CHOIR(Coarse Hand-Object Interaction Representation)は、HOIモデリングにおいて汎用的で微分可能である。 ChoIRは、パラメータがほとんどない密接な接触マップを表す。 Joint Diffusionは、雑音のある手-物体の相互作用を条件としたグリップ分布を学習するための拡散モデルである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:06:30 GMT)
Enhancing Automatic Keyphrase Labelling with Text-to-Text Transfer Transformer (T5) Architecture: A Framework for Keyphrase Generation and Filtering [2.2]
本稿では,テキスト・テキスト・トランスフォーマ(T5)アーキテクチャに基づくキーフレーズ生成モデルを提案する。また,T5アーキテクチャに基づく新しいキーフレーズフィルタリング手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:16:46 GMT)
TempFuser: Learning Agile, Tactical, and Acrobatic Flight Maneuvers Using a Long Short-Term Temporal Fusion Transformer [2.2]
TempFuserは、新しい長期の短期融合トランスアーキテクチャである。複雑なドッグファイト問題において、アジャイル、戦術、およびアクロバティックな飛行操作を学ぶことができる。我々のモデルは、優れた仕様で敵に面した場合でも、人間のようなアクロバティックな操作を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:09:05 GMT)
Information revival without backflow: non-causal explanations for non-Markovian quantum stochastic processes [2.1]
我々は、情報再生の研究が非マルコフ量子過程の研究において重要なパラダイムとなったと論じる。我々は、非因果リバイバル現象を詳細に検討し、短いマルコフ鎖の理論と非マルコフ性に関連付ける。我々は、システムのみの自由度の観点から、非因果リバイバルによって説明できないバックフローの存在を目撃するための運用条件を提供する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:03:15 GMT)
2024 BRAVO Challenge Track 1 1st Place Report: Evaluating Robustness of Vision Foundation Models for Semantic Segmentation [2.1]
2024年のBRAVO Challengeのトラック1では,モデルがCityscapesでトレーニングされ,その堅牢性はいくつかのアウト・オブ・ディストリビューション・データセットで評価される。我々のソリューションは、DINOv2に単純なセグメンテーションデコーダを付加し、モデル全体を微調整することで、ビジョンファウンデーションモデルによって学習された強力な表現を活用する。このアプローチは、より複雑な既存のアプローチよりも優れており、挑戦において第1位を獲得します。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:15:06 GMT)
The Role of Language Models in Modern Healthcare: A Comprehensive Review [2.0]
医療における大規模言語モデル(LLM)の適用は注目されている。本稿では,言語モデルの初期から現在までの軌跡を概観する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:15:15 GMT)
ReCycle: Resilient Training of Large DNNs using Pipeline Adaptation [2.0]
ReCycleは、障害発生時の効率的なトレーニング用に設計されたシステムである。分散トレーニングシステムに固有の機能的冗長性を活用する。複数の障害で高いトレーニングスループットを実現していることを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:43:50 GMT)
The loss landscape of deep linear neural networks: a second-order analysis [2.0]
正方形損失を伴う深部線形ニューラルネットワークの最適化環境について検討する。我々は、すべての臨界点の中で、大域最小化点、厳格なサドル点、非制限サドル点を特徴づける。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:38:43 GMT)
Optimal starting point for time series forecasting [2.0]
我々は、OSP-TSP(Optimal starting Point Time Series Forecast)と呼ばれる新しいアプローチを導入する。 XGBoostモデルとLightGBMモデルを利用してシーケンス長を調整することで、提案手法は時系列の最適開始点(OSP)を決定することができる。実験の結果,OSP-TSPアプローチに基づく予測は,完全なデータセットを用いた予測よりも一貫して優れていた。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:51:00 GMT)
FineZip : Pushing the Limits of Large Language Models for Practical Lossless Text Compression [2.0]
FineZipは、オンライン記憶と動的コンテキストのアイデアを組み合わせて圧縮時間を劇的に短縮する新しいテキスト圧縮システムである。 FineZipは上記のコーパスを9.5日と比較すると約4時間で圧縮できる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:58:35 GMT)
Bias Reduction in Social Networks through Agent-Based Simulations [2.0]
ネットワーク特性に基づいてフィードを構成する単純な欲求アルゴリズムにより、ランダムフィードに匹敵する知覚バイアスを低減できることを示す。このことは、ソーシャルネットワークのコンテキストにおけるレコメンダシステムの有効性を決定する上で、ネットワーク構造が持つ影響を裏付けるものである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 02:16:20 GMT)
Precision Aquaculture: An Integrated Computer Vision and IoT Approach for Optimized Tilapia Feeding [1.9]
伝統的な魚の養殖は効率の悪さを招き、環境問題や生産性を低下させる。我々はコンピュータビジョンとIoT技術を組み合わせて、ティラピアの正確な給餌を行う革新的なシステムを開発した。予備推計では、従来の農場に比べて58倍の増産が期待されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:34:45 GMT)
Precision Aquaculture: An Integrated Computer Vision and IoT Approach for Optimized Tilapia Feeding [1.9]
伝統的な魚の養殖は効率の悪さを招き、環境問題や生産性を低下させる。我々はコンピュータビジョンとIoT技術を組み合わせて、ティラピアの正確な給餌を行う革新的なシステムを開発した。予備推計では、従来の農場に比べて58倍の増産が期待されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:34:45 GMT)
Explicitly Modeling Pre-Cortical Vision with a Neuro-Inspired Front-End Improves CNN Robustness [1.8]
CNNは、一般的な汚職で腐敗した画像の分類に苦慮している。近年の研究では、霊長類一次視覚野(V1)のいくつかの特徴をシミュレートするCNNフロントエンドブロックを組み込むことで、全体のモデル堅牢性を向上させることが示されている。我々は、前皮質視覚処理をシミュレートする新しいフロントエンドブロックを組み込んだ、生物学的にインスパイアされたCNNモデルファミリーを2つ導入する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:43:29 GMT)
Digital Twins of Business Processes: A Research Manifesto [1.8]
モノのインターネット(Internet of Things)は、物理的プロセスの監視と自動化のために、組織的および産業的に広く採用されている。ビジネスプロセスの管理と保守の高度な方法は、ビジネスプロセスのデジタルツインが存在するため、到達範囲内にあります。本宣言は,事業プロセスとデジタルツインの関係を明らかにすることで,技術の現状に貢献することを目的としている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:43:46 GMT)
Application of AI-based Models for Online Fraud Detection and Analysis [1.8]
オンライン不正検出のためのAIおよびNLP技術に関する体系的文献レビューを行う。各種オンライン詐欺カテゴリを解析するための最先端NLP技術について報告する。データ制限の問題、トレーニングバイアスレポート、モデルパフォーマンスレポートにおけるメトリクスの選択的な表示などを特定します。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:47:03 GMT)
SDCL: Students Discrepancy-Informed Correction Learning for Semi-supervised Medical Image Segmentation [1.7]
半教師付き医用画像セグメンテーション(SSMIS)は、限られた医療ラベル付きデータの問題を緩和する可能性を実証している。本研究では,2人の生徒と1人の教師を含む学生の離散型情報修正学習フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:23:53 GMT)
Integrating curation into scientific publishing to train AI models [1.7]
我々は,複数モーダルデータキュレーションを学術出版プロセスに組み込んで,セグメント化された図形パネルやキャプションに注釈を付ける。 SourceData-NLPというデータセットには、620,000以上の注釈付きバイオメディカルエンティティが含まれている。我々は、名前付き認識、図形キャプションを構成パネルに分割すること、コンテキスト依存型セマンティックタスクを用いて、AIモデルをトレーニングするためのデータセットの有用性を評価する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:22:20 GMT)
Trading through Earnings Seasons using Self-Supervised Contrastive Representation Learning [1.7]
Contrastive Earnings Transformer (CET) は、Contrastive Predictive Coding (CPC) に根ざした自己教師型学習手法である。我々の研究は、株価データの複雑さを深く掘り下げ、さまざまなモデルが、時間と異なるセクターで急速に変化する収益データの関連性をどのように扱うかを評価している。 CETのCPCに関する基盤は、財務データ時代においても、一貫した株価予測を促進する、微妙な理解を可能にする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:09:59 GMT)
Sub-100 Hz Intrinsic Linewidth 852 nm Silicon Nitride External Cavity Laser [1.6]
動作波長852nm付近に100Hz以下の固有線幅を有する外部共振器レーザーを実演した。最大CW出力は24mW、波長可変は15nm、サイドモード抑制比は50dBを超える。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:56:38 GMT)
Immersion and Invariance-based Coding for Privacy-Preserving Federated Learning [1.6]
協調分散学習におけるプライバシ保護手法として,フェデレートラーニング(FL)が登場している。制御理論から差分プライバシーとシステム浸漬ツールを組み合わせたプライバシー保護FLフレームワークを提案する。提案手法は,局所モデルパラメータとグローバルモデルパラメータの両方に対して,任意のレベルの差分プライバシを提供するように調整可能であることを実証する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:04:42 GMT)
Conversational Health Agents: A Personalized LLM-Powered Agent Framework [1.5]
会話型健康エージェント(英: Conversational Health Agents、CHA)は、援助や診断などの医療サービスを提供する対話型システムである。我々は,対話エージェントがユーザの医療クエリに対してパーソナライズされた応答を生成するためのオープンソースのフレームワークであるopenCHAを提案する。 openCHAには、外部ソースから情報を集めるためのアクションを計画し実行するためのオーケストレータが含まれている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 04:50:38 GMT)
Proof of Thought : Neurosymbolic Program Synthesis allows Robust and Interpretable Reasoning [1.4]
大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、一貫性のない推論に苦戦している。本研究では,LLM出力の信頼性と透明性を高めるフレームワークであるProof of Thoughtを紹介する。主な貢献は、論理的整合性を高めるためのソート管理を備えた堅牢な型システム、事実的知識と推論的知識を明確に区別するための規則の明示である。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:35:45 GMT)
Euclidean and complex geometries from real-time computations of gravitational Rényi entropies [1.3]
適切な実時間経路積分は、ユークリッド法と一致するR'enyiエントロピーと関連する複素サドル点測地の両方をもたらすことを示す。これらの一般点の簡単な説明の後、JT重力を用いて関連するリアルタイム計算を詳細に説明する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 23:32:49 GMT)
Multi-objective Reinforcement Learning with Nonlinear Preferences: Provable Approximation for Maximizing Expected Scalarized Return [1.3]
軌道上の非線形選好を用いた多目的強化学習について検討した。非線形最適化のためのベルマン最適性の拡張形式を導出する。アルゴリズムによって計算される最適ポリシーと代替基準との間には,かなりのギャップがあることが示される。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:57:14 GMT)
Investigating OCR-Sensitive Neurons to Improve Entity Recognition in Historical Documents [1.3]
OCR感受性ニューロンは、歴史的文書におけるエンティティ認識に影響を及ぼす。クリーンでノイズの多いテキスト入力に応答してニューロンの活性化パターンを解析することにより、OCR感受性ニューロンを同定し、中和し、モデル性能を向上させる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:45:23 GMT)
Quantum Authenticated Key Expansion with Key Recycling [1.3]
本稿では,1つのプロトコルに認証とキー拡張の両方を統合する量子認証鍵拡張プロトコルを提案する。従来の認証鍵交換フレームワークに適合したQAKEフレームワークにおいて,プロトコルのセキュリティを解析する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 01:29:13 GMT)
Block Expanded DINORET: Adapting Natural Domain Foundation Models for Retinal Imaging Without Catastrophic Forgetting [1.3]
我々はDINOv2視覚変換器を自己教師あり学習を用いた網膜画像分類タスクに適用した。 DINORETとBE DINORETという2つの新しい基礎モデルを生成した。データ効率ではDINORETとBE DINORETがRETFoundより優れていた。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 20:17:16 GMT)
The Technology of Outrage: Bias in Artificial Intelligence [1.2]
人工知能と機械学習は、人々の意思決定をオフロードするためにますます使われています。過去において、この代替の根拠の1つは、機械が人間と違って公平で偏見のないものになることである。アルゴリズム的偏見に対して人々が感情的に反応する場合、我々は怒り、知性、道徳、政治の3つの形態を識別する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 20:23:25 GMT)
LiverUSRecon: Automatic 3D Reconstruction and Volumetry of the Liver with a Few Partial Ultrasound Scans [1.2]
超音波(US)スキャンによる肝体積測定は,USスキャン,ぼやけた境界,部分的な肝可視性などのノイズが原因で困難である。肝のCTスキャンを用いて構築した統計的形状モデル (SSM) と合わせて, 肝の非完全矢状面USスキャンのセグメンテーションマスクを用いて, これらの課題に対処する。 3次元肝再建は正確であり,自動肝体積計算に繋がる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 10:09:03 GMT)
Decoding Large-Language Models: A Systematic Overview of Socio-Technical Impacts, Constraints, and Emerging Questions [1.2]
この記事では、倫理的考察とともに、社会に肯定的な影響を与える可能性のある適用領域を強調します。これには、開発に関する責任ある考慮、アルゴリズムの改善、倫理的課題、社会的影響が含まれる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:36:30 GMT)
E-SQL: Direct Schema Linking via Question Enrichment in Text-to-SQL [1.2]
E-レポジトリは、直接スキーマリンクと候補述語拡張による課題に対処するために設計された新しいパイプラインである。 E-は、関連するデータベースアイテム(テーブル、列、値)と条件を質問に直接組み込むことで、自然言語クエリを強化し、クエリとデータベース構造の間のギャップを埋める。本研究では,従来の研究で広く研究されてきた手法であるスキーマフィルタリングの影響について検討し,先進的な大規模言語モデルと並行して適用した場合のリターンの低下を実証する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:02:48 GMT)
HVT: A Comprehensive Vision Framework for Learning in Non-Euclidean Space [1.2]
本稿では、双曲幾何学を統合した視覚変換器(ViT)の新たな拡張である、双曲型視覚変換器(HVT)を紹介する。従来のViTはユークリッド空間で作用するが、この手法は双曲的距離とM"オビウス変換を活用することにより自己認識機構を強化する。厳密な数学的定式化を行い、双曲幾何学を注意層、フィードフォワードネットワーク、最適化に組み込む方法を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:07:37 GMT)
Comparison of Atom Detection Algorithms for Neutral Atom Quantum Computing [1.2]
原子量子コンピュータでは、明るさまたはそれと同等のメートル法が推定され、原子の存在や欠如を予測するために使用される。我々は,複数の異なるアルゴリズムを調査し,その性能を精度と実行時間の両方で比較する。我々の比較では、光システムのPSFを用いて、各部位の光電子を最も多く返却する、グローバルな非線形最小二乗解法である、テストされたアルゴリズムについて示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:08:06 GMT)
Shifting from endangerment to rebirth in the Artificial Intelligence Age: An Ensemble Machine Learning Approach for Hawrami Text Classification [1.2]
ハフラミ語(Hawrami)はクルド語の方言で、絶滅危惧言語に分類される。本稿では2つの母語話者による15のカテゴリにラベル付けされた6,854項目のデータセットを用いて,さまざまなテキスト分類モデルを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:52:21 GMT)
Collaborative Comic Generation: Integrating Visual Narrative Theories with AI Models for Enhanced Creativity [1.1]
本研究は,概念的原理-共通オーサリング・イディオムと生成的・言語モデルを統合し,漫画作成プロセスを強化する理論に着想を得たビジュアル・ナラティブ・ジェネレーションシステムを提案する。主な貢献は、機械学習モデルを人間-AI協調コミック生成プロセスに統合すること、抽象的な物語理論をAI駆動コミック作成に展開すること、物語駆動画像シーケンスのカスタマイズ可能なツールである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:21:01 GMT)
SHEATH: Defending Horizontal Collaboration for Distributed CNNs against Adversarial Noise [1.0]
本稿では,適応脅威ハンドリング(SHEATH)を用いたセキュア水平エッジのための新しいフレームワークを提案する。 SHEATHは、HCエッジアーキテクチャにおけるCNNモデルの完全な知識を必要とせずに、脆弱性に対処することを目指している。本評価は,多様なCNN構成におけるSHEATHの適応性と有効性を示すものである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:45:04 GMT)
VectorSearch: Enhancing Document Retrieval with Semantic Embeddings and Optimized Search [1.0]
本稿では、高度なアルゴリズム、埋め込み、インデックス化技術を活用して洗練された検索を行うVectorSearchを提案する。提案手法は,革新的なマルチベクタ探索操作と高度な言語モデルによる検索の符号化を利用して,検索精度を大幅に向上させる。実世界のデータセットの実験では、VectorSearchがベースラインのメトリクスを上回っている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:58:08 GMT)
Benchmarking Domain Generalization Algorithms in Computational Pathology [1.0]
本研究の目的は,3つのCPathタスクに対する30のDGアルゴリズムの有効性を,7,560回のクロスバリデーション実行を通じて評価することである。我々はこれらのアルゴリズムを統一的で堅牢なプラットフォームを用いて評価し、モダリティ固有の技術と、事前訓練された基礎モデルのような最近の進歩を取り入れた。自己教師型学習とステンド増強が他の手法より一貫して優れており、事前訓練されたモデルやデータ拡張の可能性を強調している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:21:43 GMT)
Realism in Action: Anomaly-Aware Diagnosis of Brain Tumors from Medical Images Using YOLOv8 and DeiT [1.0]
本研究は,脳腫瘍の診断・分類に深層学習(DL)技術を活用することでこの問題に対処する。 NBML(National Brain Mapping Lab)は、30の腫瘍患者と51の正常患者を含む81の患者を対象とする。このアプローチは、信頼できる腫瘍の検出と分類において有望な進歩を示し、現実の医療画像シナリオにおける腫瘍診断の潜在的な進歩を提供する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 10:45:52 GMT)
Explain the Black Box for the Sake of Science: the Scientific Method in the Era of Generative Artificial Intelligence [0.9]
科学的手法は自然科学と応用科学の全ての分野における人間の進歩の基盤である。我々は、人類の科学的発見のための複雑な推論が、少なくとも人工知能の出現以前には重要な存在であると主張している。決定を下す上で重要なデータAIシステムを知ることは、ドメインの専門家や科学者との接触点になる可能性がある。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 02:42:18 GMT)
Accelerating Giant Impact Simulations with Machine Learning [0.8]
観測された太陽系外惑星の人口に基づく惑星形成モデルの制約は、合成惑星系の大規模なサンプルを生成する必要がある。重要なボトルネックは、惑星の胚が重力的に進化して惑星を形成する巨大な衝突フェーズをシミュレートすることである。本稿では,多惑星系における衝突結果を予測する機械学習(ML)手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:02:04 GMT)
Relating Wigner's Friend scenarios to Nonclassical Causal Compatibility, Monogamy Relations, and Fine Tuning [0.8]
LF no-go定理は因果モデリングの分野において重大な課題をもたらすことを示す。非古典的因果モデルでは、No Fine-Tuning原則に違反することなくLF不等式違反を説明できないことが証明された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:13:45 GMT)
Observation of spin squeezing with contact interactions in one- and three-dimensional easy-plane magnets [0.8]
多粒子系の絡み合いは、古典的な相関だけで達成できる以上の感度測定を可能にする。ここでは、厳密な短距離接触相互作用によるスピンスクイーズを実演する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:16:31 GMT)
Koopman-driven grip force prediction through EMG sensing [0.7]
脳卒中や多発性硬化症などの症状による手機能の喪失は日常活動に大きな影響を及ぼす。本研究は,1対のsEMGセンサを用いた中包把持時の精度の高い力推定を実現することを目的とする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 20:28:57 GMT)
Relating Wigner's Friend Scenarios to Nonclassical Causal Compatibility, Monogamy Relations, and Fine Tuning [0.7]
LF no-go定理は因果モデリングの分野において重大な課題をもたらすことを示す。非古典的因果モデルでは、No Fine-Tuning原則に違反することなくLF不等式違反を説明できないことが証明された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:13:45 GMT)
A vision-based framework for human behavior understanding in industrial assembly lines [0.7]
本稿では,産業用組立ラインにおける人間の行動の把握と理解のためのビジョンベースフレームワークを提案する。このフレームワークは高度なコンピュータビジョン技術を活用し、労働者の位置と3Dポーズを推定し、作業姿勢、行動、タスク進捗を分析する。重要なコントリビューションは、現実的な環境でキャプチャされたドメイン関連アセンブリアクションを含む、CarDAデータセットの導入である。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:03:13 GMT)
Metric Entropy-Free Sample Complexity Bounds for Sample Average Approximation in Convex Stochastic Programming [0.7]
本稿では,凸問題や強凸プログラミング(SP)問題におけるサンプル平均近似(SAA)について検討する。 SAAのサンプルの複雑さは、計量エントロピーの定量化から完全に解放されることを示している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 02:47:56 GMT)
Optimal Visual Search with Highly Heuristic Decision Rules [0.7]
そこで,本研究では,対象物の位置を適切に区分けした簡単なディスプレイを探索する際に,人間が使用する決定プロセスについて検討する。性能はベイズ最適決定プロセスと比較され、異なる候補位置からの情報が統計的に独立であるという仮定で比較された。驚くべきことに、ヒトは胎児の感度が著しく低下しているにもかかわらず、最適よりもわずかに良く行動した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:51:21 GMT)
Classification of Gleason Grading in Prostate Cancer Histopathology Images Using Deep Learning Techniques: YOLO, Vision Transformers, and Vision Mamba [0.6]
本研究は,3つの深層学習手法であるYOLO,Vision Transformers,Vision Mambaの有効性を,病理組織像からグリーソングレードを正確に分類し,比較した。ビジョン・マンバ(Vision Mamba)は、病理画像におけるグリーソン分類の最も効果的なモデルとして登場し、精度と計算効率のバランスを提供する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:36:18 GMT)
A Multi-Dataset Classification-Based Deep Learning Framework for Electronic Health Records and Predictive Analysis in Healthcare [0.6]
本研究では,複数のデータセットを分類するための新しいディープラーニング予測分析フレームワークを提案する。 Residual NetworksとArtificial Neural Networksを組み合わせたハイブリッドディープラーニングモデルを提案し,急性および慢性疾患を検出する。厳密な実験と評価の結果,網膜基底像,肝硬変ステージ,心疾患診断予測では,93%,99%,95%の精度が得られた。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:13:39 GMT)
Efficient Feature Interactions with Transformers: Improving User Spending Propensity Predictions in Gaming [0.6]
本稿では,ユーザがゲームラウンドに費やす確率を予測する問題について議論し,様々なダウンストリームアプリケーションに利用できるようにする。例えば、利用者の支出適性に応じて極端にインセンティブを与えるか、または利用者の支出適性に基づいて製品リストをパーソナライズすることで、ユーザーをアップセラーする。提案したアーキテクチャは,ゲームラウンドにおけるユーザの使用状況を予測するタスクにおいて,既存のモデルよりも優れていることを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:40:51 GMT)
Polyatomic Complexes: A topologically-informed learning representation for atomistic systems [0.5]
原子系の表現について述べる。原子論系を符号化する一般的なアルゴリズムを提供する。各種タスクにおける最先端手法に匹敵する性能を報告する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:26:49 GMT)
Pix2Next: Leveraging Vision Foundation Models for RGB to NIR Image Translation [0.5]
RGB入力から高画質近赤外(NIR)画像を生成する新しい画像画像変換フレームワークPix2Nextを提案する。マルチスケールのPatchGAN識別器は、様々な詳細レベルでリアルな画像生成を保証し、慎重に設計された損失関数は、グローバルなコンテキスト理解と局所的な特徴保存を結びつける。提案手法により、追加のデータ取得やアノテーションの取り組みなしに、NIRデータセットのスケールアップが可能となり、NIRベースのコンピュータビジョンアプリケーションの進歩が加速する可能性がある。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:51:47 GMT)
Non-stabilizerness Entanglement Entropy: a measure of hardness in the classical simulation of quantum many-body systems [0.5]
我々は、量子状態に対する最小残差エントロピーである非安定化性エンタングルメントエントロピーの概念を導入する。量子多体系の古典的なシミュレーションにおいて、新しい実用的でより良い難易度尺度として機能する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:06:04 GMT)
Heralded optical entanglement distribution via lossy quantum channels: A comparative study [0.5]
量子絡み合いは様々な量子技術の基盤となる。本研究は,多部構成のグリーンベルガー・ホーネ・ザイリンガー状態(GHZ)を損失量子チャネルを介して分配する3つの隠蔽スキームを示唆する。成功確率と予測効率を比較することで、各スキームは、当事者数、チャンネル距離、セキュリティ要件に応じて、それぞれ独自の利点があることがわかった。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:08:21 GMT)
A random measure approach to reinforcement learning in continuous time [0.4]
連続時間強化学習におけるモデル探索のためのランダムな計測手法を提案する。これらのランダム測度の構築はブラウン運動とポアソンランダム測度を利用する。グリッドサンプリング限界SDEは、最近の連続RL文献の探索SDEとサンプルSDEを置き換えることができると論じる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:34:09 GMT)
Learning Bipedal Walking for Humanoid Robots in Challenging Environments with Obstacle Avoidance [0.3]
深層強化学習は、動的歩行を実現するためのヒューマノイドロボットの実装に成功している。本稿では,政策に基づく強化学習を用いて,障害物が存在する環境下での2足歩行を実現することを目的とする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:02:04 GMT)
Measuring Entanglement by Exploiting its Anti-symmetric Nature [0.3]
フォン・ノイマンやレーニエントロピーのようなほとんどの絡み合い測度は、外積の観点で表せることを示す。本稿では,フェルミオンの非対称性を利用してエンタングルメントエントロピーを効率的に測定することを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:00:02 GMT)
In-Context Ensemble Improves Video-Language Models for Low-Level Workflow Understanding from Human Demonstrations [0.3]
Standard Operating procedureは、ビデオデモに基づいて、ビジネスソフトウェアワークフローのための低レベルのステップバイステップのガイドを定義する。近年の大規模ビデオ言語モデルの進歩は、人間の実演記録を解析することにより、SOP生成を自動化する可能性を秘めている。 SOP生成のためのビデオ言語モデルを用いたテキスト内学習について検討する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:50:49 GMT)
Model aggregation: minimizing empirical variance outperforms minimizing empirical error [0.3]
多様なモデルからの予測を単一のより正確な出力に集約する,データ駆動型フレームワークを提案する。モデルはブラックボックス関数として扱う、モデルに依存しない、最小限の仮定を必要とする、広範囲のモデルからの出力を組み合わせることができる。従来の解法と機械学習モデルをうまく統合して、堅牢性と精度の両方を改善する方法を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:33:21 GMT)
Exploring the mechanisms of qubit representations and introducing a new category system for visual representations: Results from expert ratings [0.3]
量子物理学(QP)教育では、図表や数学的概念に結びつく視覚補助などの表現の使用が不可欠である。我々は、表現研究、QP教育、および量子科学の特定の側面からの洞察に基づく新しい識別基準を開発する。 4つの国からの専門家21人が、Bloch sphere、Circle Notation、Quantum Bead、Pie chart(Qake)モデルという4つのキュービット表現を用いてこのカテゴリシステムを評価した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:16:09 GMT)
Measurable No-signalling Correlations [0.3]
第二可算コンパクトハウスドルフ空間の四重項上で定義される符号なし相関について検討する。我々は、Stinespring's Dilation Theoremの測定可能なバージョンを確立する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:58:08 GMT)
Quantum Long Short-Term Memory (QLSTM) vs Classical LSTM in Time Series Forecasting: A Comparative Study in Solar Power Forecasting [0.3]
本研究は、ソーラー発電予測のための量子長期記憶(QLSTM)モデルと古典的長期記憶(LSTM)モデルの比較を行う。調査の結果,トレーニング収束の加速やテスト損失の大幅な削減など,QLSTMによる有望な改善が明らかになった。継続的な進歩により、量子機械学習は再生可能エネルギー時系列予測におけるパラダイムシフトを提供することができる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:06:47 GMT)
Physics-Informed Graph-Mesh Networks for PDEs: A hybrid approach for complex problems [0.2]
物理インフォームドグラフニューラルネットワークと有限要素からの数値カーネルを組み合わせたハイブリッドアプローチを提案する。モデルの理論的性質を研究した後、2次元と3次元の複素幾何学に応用する。我々の選択はアブレーション研究によって支持され,提案手法の一般化能力を評価する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:52:29 GMT)
Demo2Vec: Learning Region Embedding with Demographic Information [0.2]
単純でアクセスが容易な人口統計データによって、最先端領域の埋め込みの質が向上することを示す。 KL分散に基づく既存のプレトレイン法は移動情報に偏りがあることが判明した。ニューヨークとシカゴの双方の実験結果から、モビリティと収入がプレトレインデータの組み合わせで最高のものであることが示されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:39:16 GMT)
Finite State Machine with Input and Process Render [0.2]
本稿では,FSMシミュレーションのビデオを生成するFSM(Finite State Machines)の自動可視化ツールを開発した。教育者はFSMと入力文字列の任意の形式的定義を入力でき、FSMIPRはそのシミュレーションのビデオを生成する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:14:15 GMT)
A Few Hypocrites: Few-Shot Learning and Subtype Definitions for Detecting Hypocrisy Accusations in Online Climate Change Debates [0.2]
偽犯罪の告発は、オンライン気候論争において中心的なレトリック要素である。大規模テキスト分析では、偽善罪の告発検出は未調査のツールである。本稿では,偽犯罪の告発検出をNLPにおける独立したタスクとして定義する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 10:56:28 GMT)
Towards a Realistic Long-Term Benchmark for Open-Web Research Agents [0.2]
我々は,金融・コンサルティングにおいて日常的に行われる8つの現実的・乱雑なタスクを評価する。これは既存のベンチマークのギャップを、実際の人間による経済的価値の業務を構成していない'ピザを次のアドレスに注文する'といったタスクで埋める。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:52:49 GMT)
Towards a Realistic Long-Term Benchmark for Open-Web Research Agents [0.2]
ファイナンスやコンサルティングにおいて日常的に行われている,実世界のオープンウェブ研究課題に対するエージェントの評価を行った。我々は、o1-preview、GPT-4o、Claude-3.5 Sonnet、Llama 3.1 (405b)、GPT-4o-miniといったエージェントアーキテクチャを構築し、テストした。 LLM全体では、サブタスクをサブエージェントに委譲する機能を備えたReActアーキテクチャが最もよく機能した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:52:49 GMT)
Neural Network Architecture Search Enabled Wide-Deep Learning (NAS-WD) for Spatially Heterogenous Property Awared Chicken Woody Breast Classification and Hardness Regression [0.2]
世界の養鶏産業は、木質乳房(WB)の形で難しい問題に直面している。 WBは年間最大2億ドルの経済損失を出している。 WBの根本原因はまだ特定されていない。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:57:09 GMT)
Commonly Interesting Images [0.2]
我々は、特定の状況下では、すべての画像が特定の観察者にとって興味深いものであると論じる。写真共有プラットフォームのFlickrのさまざまなユーザーによる2.5kの画像コレクションの分析により、画像の特徴が一般的に興味深いものになっていることが判明した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:36:59 GMT)
Unified Embedding Based Personalized Retrieval in Etsy Search [0.2]
グラフ, 変換器, 項ベース埋め込みを終末に組み込んだ統合埋め込みモデルを学習することを提案する。我々のパーソナライズされた検索モデルは、検索購入率5.58%、サイト全体のコンバージョン率2.63%によって、検索体験を著しく改善する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:01:50 GMT)
From Deception to Detection: The Dual Roles of Large Language Models in Fake News [0.2]
フェイクニュースは、情報エコシステムと公衆信頼の整合性に重大な脅威をもたらす。 LLM(Large Language Models)の出現は、フェイクニュースとの戦いを変革する大きな可能性を秘めている。本稿では,偽ニュースに効果的に対処する各種LLMの能力について検討する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:57:29 GMT)
Analysis of Centrifugal Clutches in Two-Speed Automatic Transmissions with Deep Learning-Based Engagement Prediction [0.2]
本研究は,様々なクラッチ構成が伝達力学に及ぼす影響を系統的に検討した。 Deep Neural Network(DNN)モデルは、スプリングプリロードや靴の質量といったパラメータを用いてクラッチエンゲージメントを予測する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 00:43:03 GMT)
Design and Fabrication of Robust Hybrid Photonic Crystal Cavities [0.1]
不均一に集積されたハイブリッドフォトニック結晶キャビティは、固体で光学的に対応可能な量子メモリとの強い光-物質相互作用を可能にする。高品質(Q)ハイブリッドフォトニック結晶を実現するための鍵となる課題は、空気中の懸濁装置と比較して基板上の指数コントラストが減少することである。そこで我々は,基板による損失の詳細な理解を利用したハイブリッドフォトニック結晶の設計手法を開発した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:50:38 GMT)
Towards a complete classification of holographic entropy inequalities [0.1]
ホログラフィックエントロピーの不等式、縮尺写像、部分立方体の間の試行性を利用する。ホログラフィックエントロピーの不等式の有効性は縮尺写像の存在によって示唆される。また、興味深い副生成物、特に、候補量子エントロピー不等式を生成する手順を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 19:55:31 GMT)
Differentiating and Integrating ZX Diagrams with Applications to Quantum Machine Learning [0.1]
我々は、ZX-計算の枠組み内での微分と積分を実現することにより、ZXを解析的視点に高める。本稿では,バレンプラトーの解析に量子機械学習を応用し,ZX計算の新しい解析フレームワークを具体的に解説する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:51:59 GMT)
Dynamics of Pseudoentanglement [0.0]
量子絡み合いのダイナミクスは、孤立多体系における熱平衡の出現を説明する上で中心的な役割を果たす。近年の研究では、多体状態のアンサンブルを記述する擬似絡み合いの概念が導入されている。量子系の熱平衡を達成するためには、どの程度の絡み合いが必要か?
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:21:53 GMT)
Quantum error correction-inspired multiparameter quantum metrology [0.0]
生成器間の対称性を持つノイズレス推定問題のクラスにおいて、最適なプローブ状態と測定方法を得るための戦略を提案する。このフレームワークの鍵は、Knill と Laflamme の量子エラー補正条件に類似した一連の量子気象条件の導入である。四面体対称性と、細調整された$S_3$対称性は、SU(2)推定に最適なプローブ状態を与える最小の対称性群であることを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 00:06:12 GMT)
YCB-Ev 1.1: Event-vision dataset for 6DoF object pose estimation [0.0]
このデータセットは、YCB-Videoデータセットで使用されるのと同じ21のYCBオブジェクトに対して、6DoFオブジェクトのポーズを提供する。データセットは21の同期イベントとRGB-Dシーケンスで構成され、合計で13,851フレームである。 BOP課題に対して事前学習を行った2つの最先端アルゴリズムの一般化能力を評価する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:26:19 GMT)
Wide-field microwave magnetic field imaging with nitrogen-vacancy centers in diamond [0.0]
マイクロ波(MW)磁場のマイクロスケール横方向分解能の非侵襲イメージングは、様々な用途において重要である。 NV中心磁力計は、$mu$mスケールの解像度、ミリスケールの視野、高感度、そして様々なサンプルと互換性のない非侵襲イメージングを提供する理想的なツールとして登場した。本研究は, 差動レービ周波数測定に基づく新しいNV磁気メトリープロトコルを実証し, 弱いMW磁場の画像化にNV広視野イメージング能力を拡張した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 00:38:13 GMT)
What is the relationship between Slow Feature Analysis and the Successor Representation? [0.0]
遅い特徴解析(SFA)と後継表現(SR)の比較 SFAとSRは、機械学習の異なる分野に由来するが、それらは数学と、それらが敏感である情報のタイプの両方において、重要な特性を共有している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:57:07 GMT)
Website visits can predict angler presence using machine learning [0.0]
漁業活動と環境または経済要因を関連付ける予測モデルは、典型的には歴史的データに依存している。湖のインフォメーションサイトだけで、毎日のアングルボートの存在を78%の精度で予測できるようになった。モデルは、モデル訓練に含まれる既知の湖で最大0.77のR2を達成したが、未知の湖では不十分であった。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 23:26:52 GMT)
Using LLM for Real-Time Transcription and Summarization of Doctor-Patient Interactions into ePuskesmas in Indonesia [0.0]
本稿では,局所的大言語モデル(LLM)を用いて医師と患者の会話の書き起こし,翻訳,要約を行う手法を提案する。我々はWhisperモデルとGPT-3を用いて、それらをePuskemasの医療記録形式に要約する。このイノベーションは、過密化された施設やインドネシアの医療提供者に対する管理上の負担といった課題に対処する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:13:42 GMT)
Ultra-low latency quantum-inspired machine learning predictors implemented on FPGA [0.0]
ツリーネットワーク(TN)は、量子多体系を表現するために用いられる計算パラダイムである。最近の研究は、機械学習(ML)タスクの実行にTNを適用する方法を示している。本研究では、FPGA(Field-Programmable Gate Array)技術の低ハードウェアを利用して、TTNを高周波リアルタイムアプリケーションに利用することを検討した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:59:26 GMT)
Topological photon pumping in quantum optical systems [0.0]
完全結合型ライス・ミールモデルの拡張版を導入する。我々は1次元エミッタ鎖上の光子のトポロジカル保護および分散無分散輸送を数値的に示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:55:26 GMT)
Topological Foundations of Reinforcement Learning [0.0]
本稿では,バナッハの不動点定理と強化学習アルゴリズムの収束の関連性について述べる。距離空間、ノルム空間、バナッハ空間などの関連する概念をよりよく理解するために導入する。我々は、強化学習アルゴリズムが収束する理由を示すために、バナッハ空間上の作用素の観点からベルマン方程式を記述する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:21:23 GMT)
Thermalization rates and quantum Ruelle-Pollicott resonances: insights from operator hydrodynamics [0.0]
指数減衰率$overlineg$と局所ユニタリ進化の性質を拡散する作用素の関係を導出する。我々の計算は、ランダムなユニタリ回路の解析結果に基づいているが、エルゴディックフロケ系では同様の結果が成り立つと論じている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:07:46 GMT)
The poison of dimensionality [0.0]
本稿では,機械学習モデルのサイズが毒性の脆弱性に与える影響について理解を深める。実験では、モデル表現力の増強と毒薬の攻撃面の増大の基本的なトレードオフを明らかにする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 20:06:33 GMT)
The Credibility Transformer [0.0]
このトランスフォーマーアーキテクチャに新しい信頼性機構を導入する。この新しい信頼性メカニズムは、トレーニングを安定させるのに非常に有益であることを示す。私たちのCredibility Transformerは、最先端のディープラーニングモデルよりも優れた予測モデルをもたらします。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:16:45 GMT)
Tesla's Autopilot: Ethics and Tragedy [0.0]
7段階の倫理的意思決定プロセスを用いて、ユーザーの行動、システムの制約、および規制の影響を調べる。この出来事は、自動車産業が自律技術を採用する際の倫理的課題を広く評価するきっかけとなった。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:53:33 GMT)
Temporal Bell inequalities in a many-body system [0.0]
2つのスピンの時間的クレーター-ホルン不等式は、2つの測定されたパーティがスピンチェーンで接続されている場合、測定間の非ゼロ時間間隔で違反することを示す。我々の結果は、多体構成で予想されるように、リーブ・ロビンソン境界は情報の拡散の基本的な限界として光の速度を代用していることを示唆している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 19:00:47 GMT)
TFT-multi: simultaneous forecasting of vital sign trajectories in the ICU [0.0]
医療データにおける軌道予測は、計算手法の精度ケアと臨床統合において重要な研究領域である。我々は、多次元時系列予測ツールであるフレームワーク時間融合変換器(TFT)を拡張し、TFT-multiを提案する。集中治療室で記録された5つのバイタルサイン (血圧, 脈拍, SpO2, 温度, 呼吸速度) の予測にTFT-multiを適用した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:13:29 GMT)
TFT-multi: simultaneous forecasting of vital sign trajectories in the ICU [0.0]
医療データにおける軌道予測は、計算手法の精度ケアと臨床統合において重要な研究領域である。我々は、多次元時系列予測ツールであるフレームワーク時間融合変換器(TFT)を拡張し、TFT-multiを提案する。集中治療室で記録された5つのバイタルサイン (血圧, 脈拍, SpO2, 温度, 呼吸速度) の予測にTFT-multiを適用した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:13:29 GMT)
Susceptibility Formulation of Density Matrix Perturbation Theory [0.0]
密度行列摂動理論は時間非依存の応答計算のための計算効率の良いフレームワークを提供する。代わりに、観測可能な状態の静的感受性を計算するために、双対定式化(英語版)という別の方法を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:34:21 GMT)
Super Level Sets and Exponential Decay: A Synergistic Approach to Stable Neural Network Training [0.0]
指数減衰と高度な反オーバーフィッティング戦略を統合する動的学習率アルゴリズムを開発した。適応学習率の影響を受けて、損失関数の超レベル集合が常に連結であることを証明する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:27:17 GMT)
Sub-ballistic operator growth in spin chains with heavy-tailed random fields [0.0]
ハイゼンベルク図形の中で進化する任意の作用素が1/alpha$未満の動的指数で拡散することは不可能であることを示す。この結果は、この障害が従来の輸送を確実に阻止する幅広いモデルのファミリーを確立する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:00:25 GMT)
Squeezing Quantum States in Three-Dimensional Twisted Crystals [0.0]
波動力学の基本的な考え方は、周期媒質内の伝播は、保存された結晶モータが離散格子変換の集合に置換されたときにそれらの変換を定義するブロッホ波によって記述できるということである。不規則な空間周期が競合する順序づけられた材料では、この一般的な原理は効果がなく、しばしば劇的な結果をもたらす。例えば、電荷またはスピン密度波からの対称性の破れた結晶、結晶学的に禁止された点対称性の回折パターンを生成する準周期格子、層間の相対的な回転(ツイスト)を持つ2次元格子のスタックなどがある。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 04:01:01 GMT)
Spectral gaps of local quantum channels in the weak-dissipation limit [0.0]
保存則のない一般カオス量子多体系の力学をバルク散逸の弱い条件下で考察する。これらの散逸動力学の生成元である量子チャネル$mathcalE$は、熱力学的極限が最初に取られるとき、散逸強度$gammaから0$として非ゼロギャップを保持する。我々は、$gamma から 0$ の極限のギャップは、ユニタリ力学のパラメータをチューニングすることによって非解析的に変化できると主張している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:00:07 GMT)
Sparsity, Regularization and Causality in Agricultural Yield: The Case of Paddy Rice in Peru [0.0]
本研究は,ペルー各地の水田収量の正確な予測モデルを構築するために,農業国勢調査データとリモートセンシング時系列を統合した。スパースレグレッションとElastic-Net正規化技術を利用して、重要リモートセンシング変数間の因果関係を同定する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 19:16:54 GMT)
Solving Free Fermion Problems on a Quantum Computer [0.0]
指数関数的に改善されたポリ(n$)コストで量子アルゴリズムによって解くことができるような自由フェルミオン問題をいくつか提示する。強結合ハミルトニアンの力学と熱状態の文脈において、そのようなユニタリを量子回路として効率的に実現できることを実証する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:03:18 GMT)
Sociotechnical Approach to Enterprise Generative Artificial Intelligence (E-GenAI) [0.0]
この記事では、プロバイダ、エンタープライズ、顧客間の関係に焦点を当てた、ビジネスエコシステムに焦点を当てている。この記事では、SCM、ERP、CRMのGenAIベースのプラットフォームと、BI、FL、TRIZ、KM、IKMのGenAIベースのプラットフォームを統合するE-GenAIビジネスエコシステムについて説明する。本研究では,Large Language Models (LLM) のダイナミクスを理解するために,有限オートマトンを用いてFollowersとFolloweesの関係をモデル化する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:39:55 GMT)
Simulating the quantum Fourier transform, Grover's algorithm, and the quantum counting algorithm with limited entanglement using tensor-networks [0.0]
我々は、限られた絡み合いを持つ量子アルゴリズムの実行をシミュレートする。絡み合いが幾分小さくても,アルゴリズムは高い忠実度で実行可能であることがわかった。我々の結果は、将来の量子コンピュータ上でこれらのアルゴリズムを実行することを約束している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:53:30 GMT)
Simulating black hole quantum dynamics on an optical lattice using the complex Sachdev-Ye-Kitaev model [0.0]
超低温原子を用いた光学格子上のアナログブラックホールシミュレーションのための低エネルギーモデルを提案する。我々はランダムに無限の範囲で相互作用するフェルミオンの系を記述するSachdev-Ye-Kitaev(SYK)モデルを用いる。低エネルギーでは、SYKモデルは創発的な共形対称性を示し、AdS2時空付近の極端ブラックホール溶液と双対である。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 02:02:36 GMT)
Schr\"odinger bridge based deep conditional generative learning [0.0]
我々は条件分布を学習するための新しいSchr"odinger Bridgeに基づく深層生成手法を提案する。本手法を低次元および高次元条件生成問題に適用する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 19:08:13 GMT)
Scalable quantum eraser for superconducting integrated circuits [0.0]
超伝導量子プロセッサにおけるマルチキュービットリセットのための高速かつスケーラブルな手法を提案する。我々は、周波数可変トランスモンキュービットとトランスモンライクなカップラの実現可能性を利用して、完全なプログラム可能な超伝導消去ヘッドを設計する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:04:04 GMT)
Reflected entropy in random tensor networks III: triway cuts [0.0]
整数 R'enyi の反射エントロピーは、ネットワークを通しての最小三路切断によって決定されることを示す。三角カット問題によって示唆される整数 R'enyi パラメータからの自然な外挿は、ホログラフィック予想 $S_R=2EW$ を意味する。このことは、ホログラフィック状態における三部体の絡み合いの存在と、ビットスレッドによって動機付けられた二部体の絡み合い構造とのギャップに光を当てる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:00:00 GMT)
Real-time estimation of overt attention from dynamic features of the face using deep-learning [0.0]
遠隔学習への移行に伴い、教師は様々な学生のエンゲージメントに適応するために必要な視覚的フィードバックを失っている。本稿では,目,頭,顔の動きに基づいて注目度を推定するために,手軽に利用可能な前面映像を提案する。我々は,眼球運動に基づく注意度を推定するために,深層学習モデルを訓練する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:34:19 GMT)
Real-time estimation of overt attention from dynamic features of the face using deep-learning [0.0]
我々は,眼球運動に基づく注意度を推定するために,深層学習モデルを訓練する。学生が同じ教育ビデオを見ている間、10秒間隔で眼球運動の物体間相関を測定した。ソリューションは軽量で、クライアント側で操作できるため、オンラインの注意監視に関連するプライバシー上の懸念が軽減される。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:34:19 GMT)
Random Forest Regression Feature Importance for Climate Impact Pathway Detection [0.0]
気候源のRF時流下流衝撃の連鎖を発見し, ランク付けするための新しい手法を開発した。より複雑な2つのベンチマークを実行することで生成されたデータのアンサンブルに本手法を適用した。 RFRの重要度に基づくアプローチは、両方のテストケースで既知の影響経路を正確に検出できる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 04:18:53 GMT)
Quantum-Classical Sentiment Analysis [0.0]
感情分析におけるHCQC(Hybrid classical-quantum classifier)の適用について検討する。 HCQCは分類精度ではTransformerと比較して性能が劣るが,適度に良い近似解に収束するのにはかなり時間がかかることが示唆された。この実験はまた、D-Wave特性によって部分的には開示されていないHCQCにおける重要なボトルネックを明らかにした。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:40:19 GMT)
Quantum thermodynamics for general bipartite interacting autonomous systems [0.0]
サブシステムの内部エネルギーは相互作用する量子系ではよく定義されていない。サブシステム進化を記述するマスター方程式が最小散逸の原理に従うことを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 23:20:19 GMT)
Quantum circuit for $\mathbb{Z}_3$ lattice gauge theory at nonzero baryon density [0.0]
格子ゲージ理論は3クォーク境界状態を持つ最も単純な離散ゲージ理論である。ヒルベルト空間は有限次元であるため、非零バリオン密度での格子ゲージ理論の量子シミュレーションをテストするのに使うことができる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 20:49:48 GMT)
PhD Forum: Efficient Privacy-Preserving Processing via Memory-Centric Computing [0.0]
ホモモルフィック暗号化(HE)とセキュアマルチパーティ計算(SMPC)は、暗号化されたデータの処理を可能にすることにより、データのセキュリティを高める。既存のアプローチでは、特別なハードウェアを使用して計算オーバーヘッドを改善することに重点を置いている。我々は、最近利用可能なPIMハードウェアを用いて、効率的なプライバシ保存計算を実現するフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:37:50 GMT)
Optimized Monte Carlo Tree Search for Enhanced Decision Making in the FrozenLake Environment [0.0]
Monte Carlo Tree Search (MCTS) は複雑な意思決定問題を解決する強力なアルゴリズムである。本稿では,古典的強化学習課題であるFrozenLake環境に適用したMCTS実装を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:04:53 GMT)
On-orbit Servicing for Spacecraft Collision Avoidance With Autonomous Decision Making [0.0]
本研究は、宇宙船衝突回避演習(CAM)を支援するために、AIによるOOSミッションの実装を開発する。本稿では、RL(Reinforcement Learning)を用いて訓練された自律型サーベイラを提案し、ターゲット衛星と宇宙デブリの衝突を自律的に検出し、絶滅危惧衛星とのランデブーとドッキングを行い、最適なCAMを実行する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:40:37 GMT)
On the role of Artificial Intelligence methods in modern force-controlled manufacturing robotic tasks [0.0]
ロボットマニピュレータの強化におけるAIの役割は、スマートマニュファクチャリングにおける重要なイノベーションに急速に結びついている。この記事では、これらのイノベーションを実効力によって制御されたアプリケーションにまとめ、高品質な生産標準を維持する必要性を強調します。この分析は、AI技術を検証するための共通のパフォーマンスメトリクスの必要性を強調した、将来の研究方向性の視点で締めくくっている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:29:26 GMT)
Non-collapsing electric readout of arbitrary Andreev qubits [0.0]
非復調プロトコルは、符号化された情報を破壊することなく、アンシラ量子ビットを用いて量子ビットの脆弱な量子状態を特定する。ここでは、量子ドットジョセフソン接合で定義されるアンドレフ量子ビットを考える。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:12:16 GMT)
New technologies and AI: envisioning future directions for UNSCR 1540 [0.0]
論文は、WMDの開発、普及、潜在的な誤用におけるAI技術の増大する影響に対処するため、UNSCR 1540の拡張を要求する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:41:12 GMT)
Neural Network Plasticity and Loss Sharpness [0.0]
近年の研究では、新しいタスクにおける塑性損失は、非定常RLフレームワークにおける損失ランドスケープのシャープネスと高い関係があることが示されている。我々は,スムーズなミニマを追求し,バニラ予測設定における一般化能力を評価されたシャープネス正則化手法について検討した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 19:20:09 GMT)
Multipartite information in sparse SYK models [0.0]
場の量子論では、任意の空間領域間の絡み合いエントロピーを含む特定の不等式が成立する。そこで本研究では,Sachdev-Ye-Kitaev(SYK)モデルとスパースSYKモデルの類似エントロピー不等式について検討する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:41:12 GMT)
More on quantum measuring systems and the holographic principle [0.0]
古典化されたホログラフィックテンソルネットワークのユークリッド系における量子測定系の構造について検討する。その結果、ユークリッド体制の次の図が得られた。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:14:18 GMT)
More on quantum measuring systems and the holographic principle [0.0]
古典化されたホログラフィックテンソルネットワークのユークリッド系における量子測定系の構造について検討する。その結果、ユークリッド体制の次の図が得られた。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:14:18 GMT)
Metaheuristic Method for Solving Systems of Equations [0.0]
遺伝的アルゴリズムは、様々なテストケースにわたる正確なソリューションを一貫して提供した。 GAの重要な利点は、解空間を広く探索し、複数の解の集合を明らかにすることである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:14:08 GMT)
Mapping Technical Safety Research at AI Companies: A literature review and incentives analysis [0.0]
レポートは、3つの主要なAI企業が実施する安全なAI開発に関する技術研究を分析している。 Anthropic、Google DeepMind、OpenAI。私たちは安全なAI開発を、大規模な誤用や事故のリスクを生じにくいAIシステムの開発であると定義しました。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:19:25 GMT)
MaViLS, a Benchmark Dataset for Video-to-Slide Alignment, Assessing Baseline Accuracy with a Multimodal Alignment Algorithm Leveraging Speech, OCR, and Visual Features [0.0]
本稿では,講演ビデオとそれに対応するスライドの整合性を示すベンチマークデータセットを提案する。音声、テキスト、画像の特徴を活用する新しいマルチモーダルアルゴリズムを導入する。 SIFT(0.56)と比較して平均精度は0.82で、約11倍高速である。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:24:42 GMT)
Long-distance device-independent quantum key distribution using single-photon entanglement [0.0]
デバイス非依存の量子鍵分布(DIQKD)により、2人の誠実なユーザーがセキュアな通信チャネルを確立することができる。単一光子経路の絡み合った状態の隠蔽的準備を利用して, DIQKDのフォトニック実現を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:39:03 GMT)
Liouvillian skin effects and fragmented condensates in an integrable dissipative Bose-Hubbard model [0.0]
ホッピング振幅に適合する速度に調整された損失の有無で,任意の相互作用強度でBose-Hubbardモデルのダイナミクスを解くことができることを示す。ベーテ・アンザッツ解を解析することにより、弱い相互作用でさえシステムの定性的特徴を変化させることが分かる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:56:12 GMT)
Linking in Style: Understanding learned features in deep learning models [0.0]
畳み込みニューラルネットワーク(CNN)は抽象的な特徴を学び、オブジェクト分類を行う。本稿では,CNNにおける学習特徴を可視化し,体系的に解析する自動手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:28:48 GMT)
Learning phase-space flows using time-discrete implicit Runge-Kutta PINNs [0.0]
非線型結合微分方程式系の多次元位相空間解を得るための枠組みを提案する。本手法は,座標を関数として扱うコンテキストに適応する。この修正により、外部場における粒子の運動方程式を効率的に解くことができる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:24:18 GMT)
LLaMa-SciQ: An Educational Chatbot for Answering Science MCQ [0.0]
大規模言語モデル(LLM)は、数学的な推論を必要とするタスク、特に多重選択質問(MCQ)にしばしば苦労する。我々は,STEM分野におけるMCQの解決と理解を支援するLLaMa-SciQを開発した。数学的推論では、LLaMa-SciQはGSM8kデータセットで74.5%、MATHデータセットで30%の精度を達成した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 09:41:46 GMT)
KIPPS: Knowledge infusion in Privacy Preserving Synthetic Data Generation [0.0]
生成的ディープラーニングモデルは、ドメイン制約のある離散的および非ガウス的特徴をモデル化するのに苦労する。生成モデルは、プライバシーリスクであるセンシティブな機能を繰り返す合成データを生成する。本稿では,知識グラフから知識グラフにドメインと規則的知識を注入する新しいモデルKIPPSを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 19:50:03 GMT)
Iterative Improvement of an Additively Regularized Topic Model [0.0]
本稿では,トピックモデルの反復的学習法を提案する。いくつかの自然言語テキストの収集実験により、提案したITARモデルは、他の人気のあるトピックモデルよりも優れた性能を示した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 20:50:00 GMT)
Integer Fluxonium Qubit [0.0]
ゼロ磁場中において、適切に設計されたフラクソニウム回路を動作させることから導かれる超伝導量子ビットについて述べる。キュービットは、約4GHzの周波数を持ち、エネルギー緩和品質係数は、0.7時間107ドルである。我々の研究は、従来のトランスモンの周波数範囲で機能する「使用可能な部分的に保護された」超伝導量子ビットを確立する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:36:45 GMT)
Informed deep hierarchical classification: a non-standard analysis inspired approach [0.0]
出力層の前に配置された特定のプロジェクション演算子を備えた多出力ディープニューラルネットワークで構成されている。このようなアーキテクチャの設計は、LH-DNN(Lexicographic Hybrid Deep Neural Network)と呼ばれ、異なる研究分野と非常に離れた研究分野のツールを組み合わせることで実現されている。アプローチの有効性を評価するために、階層的な分類タスクに適した畳み込みニューラルネットワークであるB-CNNと比較する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:12:50 GMT)
Improving satellite imagery segmentation using multiple Sentinel-2 revisits [0.0]
我々は、微調整された事前学習されたリモートセンシングモデルのフレームワークにおいて、リビジョンを使用する最善の方法を探る。モデル潜在空間における複数の再試行からの融合表現は、他の再試行法よりも優れていることが判明した。 SWINトランスフォーマーベースのアーキテクチャは、U-netやViTベースのモデルよりも優れている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:13:33 GMT)
Harnessing the Potential of Gen-AI Coding Assistants in Public Sector Software Development [0.0]
GitHub Copilot - GovTech Singaporeのエンジニアリング生産性プログラム(EPP) 報告書は、AI Code Assistantツールが開発者の生産性を高め、公共セクターにおけるアプリケーション品質を向上させる大きな可能性を強調している。と分類し、GitHub Copilotのようなクラウド上のGen-AI Coding Assistantツールを使用するようにアドバイスしている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 23:59:45 GMT)
Grüneisen parameter as an entanglement compass and the breakdown of the Hellmann-Feynman theorem [0.0]
Gr"uneisen ratio $Gamma$, すなわち、熱膨張と比熱の比の特異部分は、有限のT$と量子臨界点(QCP)の両方を探索するために広く用いられている。チューニングパラメータ$lambda$の関数として絡み合いを計算する量子アナログを$Gamma$に提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:40:53 GMT)
Growth and Spectroscopy of Lanthanide Doped Y$_2$SiO$_5$ Microcrystals for Quantum Information Processing [0.0]
ランタンをドープしたY$_2$SiO$_5$マイクロ結晶を, 溶液燃焼, 固体, ゾル-ゲル合成技術を用いて調製した。低温下でのNd$3+, Eu$3+およびEr$3+のドープ材料のレーザーサイト選択蛍光測定により, 成長した微結晶は光学的品質が高いことが示された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:18:59 GMT)
Graph Pruning Based Spatial and Temporal Graph Convolutional Network with Transfer Learning for Traffic Prediction [0.0]
本研究では,グラフプルーニングと転送学習の枠組みに基づく新しい時空間畳み込みネットワーク(TL-GPSTGN)を提案する。その結果、単一のデータセット上でのTL-GPSTGNの異常な予測精度と、異なるデータセット間の堅牢なマイグレーション性能が示された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 00:59:23 GMT)
GeoBiked: A Dataset with Geometric Features and Automated Labeling Techniques to Enable Deep Generative Models in Engineering Design [0.0]
GeoBikedは4つの355枚の自転車画像を含むようにキュレーションされており、構造的および技術的特徴を付加している。大規模基盤モデルを用いてデータラベリングを自動化する手法を提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:57:59 GMT)
Generalizable Error Modeling for Human Data Annotation: Evidence From an Industry-Scale Search Data Annotation Program [0.0]
本稿では,検索関連アノテーションタスクにおける潜在的なエラーを検出するために訓練された予測誤差モデルを提案する。そこで本研究では,中程度のモデル性能(AUC=0.65-0.75)で誤差を予測できることを示す。本稿では,高い予測誤差確率のタスクを優先することで,修正されたアノテーションエラーの量を大幅に増加させるという,監査の文脈におけるモデルの有用性を実証する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:41:14 GMT)
Game4Loc: A UAV Geo-Localization Benchmark from Game Data [0.0]
クロスビューペアデータの部分的マッチングを含む,より実用的なUAV測位タスクを提案する。実験により,UAV測地のためのデータとトレーニング手法の有効性が示された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:33:28 GMT)
GB-RVFL: Fusion of Randomized Neural Network and Granular Ball Computing [0.0]
ランダムベクトル汎関数リンク(RVFL)ネットワークは、強力な一般化能力を持つ顕著な分類モデルである。トレーニングサンプルの代わりに粒状球(GB)を入力として使用する粒状球RVFL(GB-RVFL)モデルを提案する。提案したGB-RVFLおよびGE-GB-RVFLモデルは,KEEL,UCI,NDC,バイオメディカルデータセットを用いて評価した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:33:01 GMT)
Functional Integral Construction of Topological Quantum Field Theory [0.0]
単位の$n+1$ alterfold TQFTを導入し、$n$次元格子モデル上の線型汎関数から構成する。単位球面$n$-圏は数学的に定義され、格子モデルの局所量子対称性として現れる。特に、線形汎函数から非可逆ユニタリ 3+1 折りたたみ TQFT を構築し、その局所量子対称性を明示的な20j-記号を持つイジン型ユニタリ球面3圏として導出する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:15:35 GMT)
Free Independence and the Noncrossing Partition Lattice in Dual-Unitary Quantum Circuits [0.0]
二重単位量子回路のカオス力学の詳細について検討する。相関子を量子チャネルのクラスの縮約として記述することにより、それらの指数的崩壊を証明できる。また,双対ユニタリ回路の複製手法も開発しており,本手法は有用であり,自己の利害関係にある可能性がある。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:00:00 GMT)
Fermionic parton theory of Rydberg $\mathbb{Z}_2$ quantum spin liquids [0.0]
位相的に順序付けられた$mathbbZ_2$量子スピン液体(QSL)における対称性分数化パターンについて述べる。また, 今後の実験の参考として, 動的構造因子の詳細な解析を行った。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:00:00 GMT)
Fate of non-Hermitian free fermions with Wannier-Stark ladder [0.0]
ワニエ・スタークの局在は非エルミート自由フェルミオンの絡み合い挙動を動的に変化させる。定常状態半鎖絡みのエントロピーを観察し、2つの異なる地域法域を同定する。本研究は,非エルミート皮膚効果と無障害局所化との相互作用から出現する新規な絡み合い相について考察した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:49:22 GMT)
Fair Mixed Effects Support Vector Machine [0.0]
機械学習の公正性は、トレーニングデータに存在するバイアスを緩和し、不完全性をモデル化することを目的としている。これは、モデルが民族性や性的指向といった繊細な特徴に基づいて決定するのを防ぐことで達成される。両問題を同時に処理できるベクターマシンアルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:32:51 GMT)
Extracting Dynamical Maps of Non-Markovian Open Quantum Systems [0.0]
Lambda(tau)$は、システムと1つ以上の熱浴を、弱くも強くもない強度で突然結合することによって生じることを示す。我々はChoi-Jamiolkowski同型を使い、$hatLambda(tau)$を完全に再構成することができる。スピンレスフェルミ連鎖と単一不純物アンダーソンモデルとの相互作用の数値的な例は、我々のアプローチが大きなスピードアップをもたらす状態を示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:09:03 GMT)
Exposing Assumptions in AI Benchmarks through Cognitive Modelling [0.0]
文化AIベンチマークは、しばしば測定された構成物に関する暗黙の仮定に頼っており、不適切で明確な相互関係を持つ曖昧な定式化に繋がる。構造方程式モデルとして定式化された明示的認知モデルを用いて,これらの仮定を明らかにする。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:55:02 GMT)
Ethical and Scalable Automation: A Governance and Compliance Framework for Business Applications [0.0]
本稿では、AIが倫理的で、制御可能で、実行可能で、望ましいものであることを保証するフレームワークを紹介する。異なるケーススタディは、学術と実践の両方の環境でAIを統合することで、このフレームワークを検証する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:39:28 GMT)
Entanglement Hamiltonian and effective temperature of non-Hermitian quantum spin ladders [0.0]
非エルミートスピンはしごの絡み合いと絡み合いエネルギースペクトルを解析的に検討した。我々の発見は非エルミート系における量子エンタングルメントに関する新たな知見を提供する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:20:24 GMT)
Enhancing Guardrails for Safe and Secure Healthcare AI [0.0]
私は、医療特有のニーズに合うように、Nvidia NeMo Guardrailsのような既存のガードレールフレームワークの強化を提案します。私は、医療におけるAIの安全で信頼性が高く正確な使用を確実にし、誤情報リスクを軽減し、患者の安全性を向上させることを目指しています。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:30:06 GMT)
Enhanced Wavelet Scattering Network for image inpainting detection [0.0]
本稿では,低レベル雑音解析に基づく塗装前駆体検出のための革新的なアイデアをいくつか提案する。これはDual-Tree Complex Wavelet Transform (DT-CWT)と畳み込みニューラルネットワーク(CNN)を組み合わせて、偽エリア検出とローカライゼーションを実現している。提案手法は最先端手法に対してベンチマークを行い,提案手法よりも優れた性能を示した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:27:05 GMT)
Dynamics of Heisenberg XYZ spin Quantum Battery [0.0]
量子電池の内部力学は、その性能に影響を与える可能性がある。スピン相互作用における異方性や外部磁場といった重要な要素は、仕事の出力を最適化する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:46:36 GMT)
Dynamic Cooling on Contemporary Quantum Computers [0.0]
我々は,N-1$以上の同じ量子ビットを加熱することにより,ターゲット量子ビットを冷却する動的冷却の問題を考察した。低温条件下では, 冷却に伴う作業コストが指数関数的に有利であることを示す。そこで本研究では,少量の冷却能力を放棄することで,回路の複雑さを大幅に低減できる準最適冷却アルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:30:22 GMT)
Don't Trust A Single Gerrymandering Metric [0.0]
これらの指標のそれぞれが,ゲーリーマンダリングを検出するために,単一の孤立量として使用する場合,ゲーム可能であることを示す。我々は,山登り法を用いて,メートル法上の境界に制約された地区計画を生成するとともに,当事者が獲得した地区数を最大又はほぼ最大化する。これらの結果の明らかな結果の1つは、ゲーリーマンダリングを避けるために、再分権委員会が満たさなければならないメートル法上の事前境界を指定することの事実を示すことである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 02:40:09 GMT)
Dispute resolution in legal mediation with quantitative argumentation [0.0]
我々は,仲介目標の受容性を決定する際に,当事者の知識と仲介者の知識を統合するQuAMフレームワークを導入する。また、目的引数の受け入れ可能性と、その引数に関連付けられた変数に割り当てられた値との関係をモデル化する新しい形式も開発する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:05:46 GMT)
Dimension reduction and the gradient flow of relative entropy [0.0]
次元減少は科学で広く用いられ、高次元データを低次元空間にマッピングする。本研究では,近傍埋め込み(SNE)技術の基礎となる基本的な数学的モデルと,その一般的な変種であるt-SNEについて検討する。目的は、これらの点を最適な方法で低次元にマッピングし、類似点がより近いようにすることである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 14:23:04 GMT)
Dichotomy in the effect of chaos on ergotropy [0.0]
本稿では,2つの量子カオスモデルを用いて,システムから最大単位抽出可能なエルゴトロピーについて検討する。アンシラを補助するシナリオでは、カオスは状態が分かっているときにエルゴトロピーを高める。対照的に、状態が不明な場合には、カオスと作業の間に負の相関関係を確立する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 03:28:04 GMT)
Deformation of a one dimensional ferromagnetic domain wall due to double exchange interaction with a free electron system [0.0]
磁気相互作用よりも大きい化学ポテンシャルでは、磁壁はより大きな幅に向けて大きく変形する。エネルギーと伝導度は、このプロトタイプモデル内のBlochとN'eelの磁区壁と同一である。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 05:33:32 GMT)
DRIM: Learning Disentangled Representations from Incomplete Multimodal Healthcare Data [0.0]
実生活の医療データは、しばしばマルチモーダルで不完全であり、高度なディープラーニングモデルの必要性を助長する。データ疎性にもかかわらず、共有表現とユニークな表現をキャプチャする新しい方法であるDRIMを紹介する。本手法はグリオーマ患者の生存予測タスクにおける最先端のアルゴリズムよりも優れており,モダリティの欠如に対して頑健である。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:13:57 GMT)
DEMO enhanced BPMN [0.0]
BPMNは、形式的なセマンティクス、曖昧さ、マルチパーティのコラボレーションをモデリングする際の制限の欠如に悩まされています。 DEMOのトランザクションパターンの厳密さとより実践的で広く採用されているBPMNフレームワークを組み合わせる新しいアプローチを提案し、実証した。この組み合わせはビジネスプロセスのモデリングを豊かにし、実践者と研究者の両方にとってより一貫性があり信頼性の高いツールを提供する、と我々は主張する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:43:29 GMT)
Couples can be tractable: New algorithms and hardness results for the Hospitals / Residents problem with Couples [0.0]
本研究は,ソリューションが安定したマッチングや,存在しない報告であるHRCを用いて,病院・居住者の問題を研究するものである。ほぼ可能な安定マッチングを見つけることができる新しい時間アルゴリズムを提案する。また,本アルゴリズムは,グラフがループを持つ多重グラフである安定なbマッチング問題の可解性も示している。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:23:09 GMT)
Classification of Non-native Handwritten Characters Using Convolutional Neural Network [0.0]
非ネイティブユーザによる英語文字の分類は、カスタマイズされたCNNモデルを提案することによって行われる。我々はこのCNNを、手書きの独立した英語文字データセットと呼ばれる新しいデータセットでトレーニングする。 5つの畳み込み層と1つの隠蔽層を持つモデルでは、文字認識精度において最先端モデルよりも優れる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 04:36:14 GMT)
Classical and Quantum Analysis of Light Transmission Through Polarizing Filters [0.0]
角度の異なる偏光フィルタからなる系を通過する光の挙動を解析する。次に、状態記法を用いて現象を記述するために量子力学を適用し、光子の偏光状態の射影の確率論的解釈を行う。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 00:25:51 GMT)
Characterizing stable regions in the residual stream of LLMs [0.0]
モデル出力が小さいアクティベーション変化に敏感なままであるトランスフォーマーの残ストリーム内の「安定領域」を同定する。これらの領域はトレーニング中に現れ、トレーニングの進行やモデルサイズの増加に伴ってより定義される。解析の結果、これらの安定な領域は、類似の領域内のクラスタを誘導する意味的区別と一致し、同一領域からのアクティベーションは、同様の次のトークン予測をもたらすことが示唆された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:27:02 GMT)
Boson-fermion algebraic mapping in second quantization [0.0]
生成と演算子のボゾン代数からフェルミオン代数への写像に基づく構造を導出する手法を提案する。この構造は非可換グラスマン型変数を含む変形グラスマン代数に対応する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:37:34 GMT)
Bi-Filtration and Stability of TDA Mapper for Point Cloud Data [0.0]
カバーサイズとtextbf$epsilon$ を同時に増加させることで安定性を得る方法を示す。特に,2つのデータセット間のホモロジー群の被覆サイズと$epsilon$はtextbf2$delta$-interleavedであることを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 21:08:47 GMT)
Benchmarking Deep Learning Models for Object Detection on Edge Computing Devices [0.0]
YOLOv8 (Nano, Small, Medium), EfficientDet Lite (Lite0, Lite1, Lite2), SSD (SSD MobileNet V1, SSDLite MobileDet) など,最先端のオブジェクト検出モデルの評価を行った。これらのモデルをRaspberry Pi 3、4、5、TPUアクセラレーター、Jetson Orin Nanoといった一般的なエッジデバイスにデプロイし、エネルギー消費、推論時間、平均精度(mAP)といった重要なパフォーマンス指標を収集しました。この結果から,SSD MobileNet V1などの低mAPモデルの方がエネルギー効率が高く,高速であることが示唆された。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 10:56:49 GMT)
BabyLlama-2: Ensemble-Distilled Models Consistently Outperform Teachers With Limited Data [0.0]
本研究では,BabyLMコンペティションのための1000万語コーパス上で,2人の教師から事前訓練された3億4500万のパラメータモデル蒸留であるBabyLlama-2を提案する。 BLiMPとSuperGLUEのベンチマークでは、BabyLlama-2は、同じデータミックスと教師モデルで、1000万ワードデータセットと1億ワードデータセットの両方でトレーニングされたベースラインを上回っている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 19:46:49 GMT)
BRDF-NeRF: Neural Radiance Fields with Optical Satellite Images and BRDF Modelling [0.0]
本稿では,Rahman-Pinty-Verstraete (RPV) BRDFモデルを用いたBRDF-NeRFを提案する。 BRDF-NeRFは目に見えない角度から新しいビューを合成し、高品質なデジタル表面モデルを生成する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:19:45 GMT)
Automatic Library Migration Using Large Language Models: First Results [0.0]
API移行タスクをサポートするためにChatGPTの利用を検討している研究の最初の成果を報告する。一番良い結果はワンショットのプロンプトで達成され、次に思考の連鎖が続くことを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:17:06 GMT)
Assessing the Level of Toxicity Against Distinct Groups in Bangla Social Media Comments: A Comprehensive Investigation [0.0]
本研究は, トランスジェンダー, 先住民, 移民の3つの特定のグループを対象として, ベンガル語における有毒なコメントを同定することに焦点を当てた。この方法論は、データセット、手動のアノテーションの作成と、Bangla-BERT、bangla-bert-base、distil-BERT、Bert-base-multilingual-casedといったトレーニング済みのトランスフォーマーモデルの使用を含む。実験の結果、Bangla-BERTは代替モデルを超え、F1スコアは0.8903に達した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:48:59 GMT)
An Integrated Deep Learning Framework for Effective Brain Tumor Localization, Segmentation, and Classification from Magnetic Resonance Images [0.0]
脳内の腫瘍は、様々な種類の脳細胞から生じる脳組織内の異常な細胞増殖によって生じる。本研究は,MRI画像からのグリオーマの局在,セグメンテーション,分類のためのDLフレームワークを提案する。提案モデルでは,早期診断を可能とし,患者に対してより正確な治療オプションを提供することで,医療用AIの進歩を期待できる結果が得られた。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 18:38:57 GMT)
An Alternative to Multi-Factor Authentication with a Triple-Identity Authentication Scheme [0.0]
デュアルパスワードログイン認証システムには、外部と対話するための2つのエントリポイント(ユーザ名とパスワードフィールド)がある。個人情報を使わずに、ユーザー名とパスワードについて識別子を定義することはできない。利用可能なユーザのログイン名とパスワードが無意味なハッシュ要素のマトリックスにランダムに変換されることが鍵となるトリプルアイデンティティ認証が確立される。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:48:32 GMT)
An Adaptive Screen-Space Meshing Approach for Normal Integration [0.0]
この研究は、画像領域に適応的な表面三角測量を導入し、その後、三角形メッシュ上で通常の積分を行う。曲率に基づいて、平坦な領域を識別し、画素を三角形に集約する。ピクセルグリッドと比較して、トライアングルメッシュは表面の詳細に局所的に適応し、スペーサー表現を可能にします。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 13:12:58 GMT)
Amplifying hybrid entangled states and superpositions of coherent states [0.0]
増幅スキームの忠実度とHESの利得はコヒーレント状態のそれと同じであることを示す。 SCSは、コヒーレント状態の振幅に依存する増幅スキームによって非常に非自明な振る舞いを示す。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 02:24:22 GMT)
Against (unitary) interpretation (of quantum mechanics): removing the metaphysical load [0.0]
我々は「ユニタリ量子力学」が量子力学の解釈であることを示す。単位」対運用上の不一致の根源は、後者が測定プロセスを不可逆的に扱うことである。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:19:44 GMT)
Advancing Cyber Incident Timeline Analysis Through Rule Based AI and Large Language Models [0.0]
本稿では,ルールベース人工知能(R-BAI)アルゴリズムとLarge Language Models(LLM)を組み合わせた新しいフレームワークGenDFIRを紹介する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 06:50:29 GMT)
Adaptive Error-Bounded Hierarchical Matrices for Efficient Neural Network Compression [0.0]
本稿では,物理インフォームドニューラルネットワーク(PINN)に適した動的,エラーバウンドな階層行列 (H-matrix) 圧縮手法を提案する。提案手法は,ニューラル・タンジェント・カーネル(NTK)の本質的性質を保ちながら,大規模物理モデルにおける計算複雑性とメモリ要求を低減させる。実験により, この手法は, 高精度を維持し, 一般化能力を向上させることにより, Singular Value Decomposition (SVD) やプルーニング, 量子化などの従来の圧縮手法よりも優れていることを示した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 16:41:07 GMT)
AI-Driven Risk-Aware Scheduling for Active Debris Removal Missions [0.0]
低地球軌道でのデブリは、宇宙の持続可能性と宇宙船の安全性に対する重大な脅威である。装甲輸送車両(OTV)は破片の軌道離脱を促進し、将来の衝突リスクを減らす。深部補強学習(DRL)に基づく装甲決定計画モデルを構築し,OTVを最適デブリ除去シークエンシングを計画する。提案手法を用いることで、最適なミッションプランを見つけ、衝突リスクの高い破片のリスクハンドリングを含む自律的に計画の更新を学べることが示されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 15:16:07 GMT)
AI Enabled Neutron Flux Measurement and Virtual Calibration in Boiling Water Reactors [0.0]
原子炉コア内の3次元の電力分布を正確に把握することは、原子炉の安全かつ経済的操作を保証するために不可欠である。機械学習(ML)は、メンテナンスコストの削減、オンラインローカル電力測定の精度の向上、オフラインとオンライン電力分布間のバイアスの低減に使用されている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 22:30:09 GMT)
A parametric framework for kernel-based dynamic mode decomposition using deep learning [0.0]
提案されたフレームワークは、オフラインとオンラインの2つのステージで構成されている。オンラインステージでは、これらのLANDOモデルを活用して、所望のタイミングで新しいデータを生成する。高次元力学系に次元還元法を適用して, トレーニングの計算コストを低減させる。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 11:13:50 GMT)
A Novel Framework for Analyzing Structural Transformation in Data-Constrained Economies Using Bayesian Modeling and Machine Learning [0.0]
農業経済からより多様化した産業やサービスベースのシステムへの移行は、経済発展の重要な要因である。低所得国と中所得国(LMIC)では、データの不足と信頼性の欠如が、このプロセスの正確な評価を妨げる。本稿では,ベイジアン階層モデリング,機械学習に基づくデータ計算,因子分析を統合することで,これらの課題に対処する新しい統計フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 08:39:41 GMT)
A Noisy Approach to Intrinsically Mixed-State Topological Order [0.0]
得られた混合状態は内在的に混合状態位相秩序(imTO)を示すことができることを示す。我々は、ある異常な1-形式対称性の下でデコヒートされた混合状態が強い対称性を持つ、イムト(ImTO)を総称的にガグアウトすることは、イムト(ImTO)をもたらすことを見出した。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 23:29:55 GMT)
A Learning Support Method for Multi-threaded Programs Using Trace Tables [0.0]
マルチスレッドプログラムは、並列処理のためにアプリケーションプロセスを複数のスレッドに分割することで、応答性とリソースの保存を改善することが期待されている。しかし、スケジューリングと複数のスレッドの相互作用のため、実行時の動作はシングルスレッドプログラムよりも複雑である。トレーステーブルを用いたマルチスレッドプログラムの学習ツールを提案する。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 07:46:38 GMT)
A Counterdiabatic Route to Entanglement Steering and Dynamical Freezing in the Floquet Lipkin-Meshkov-Glick Model [0.0]
この研究は、反断熱駆動(CD)が、長い時間、絡み合った軌道に沿って集合スピン系を操る強力なツールであることを示した。特に、CD駆動は周期的に駆動されるリプキン-メシュコフ-グリックモデルにおいて、多くの初期状態に対する近似的なストロボスコピック凍結と永遠の絡み合い振動をもたらす。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 12:39:11 GMT)
A Concise Mathematical Description of Active Inference in Discrete Time [0.0]
本論文の主部は、アクション選択の理論を詳述した詳細な例を含む、このトピックの基本的紹介として機能する。付録では、より微妙な数学的詳細が議論されている。この部分は、既に活発な推論文学を研究しているが、数学的詳細や導出を理解するのに苦労している読者を対象としている。
論文参考訳（メタデータ） (Wed, 25 Sep 2024 17:59:18 GMT)