A Controlled Study on Long Context Extension and Generalization in LLMs [85.5] 広義のテキスト理解とテキスト内学習は、完全な文書コンテキストを利用する言語モデルを必要とする。
長期コンテキストモデルを直接訓練する際の実装上の課題のため、長期コンテキストを扱うためにモデルを拡張する多くの方法が提案されている。
我々は,一貫したベースモデルと拡張データを利用して,標準化された評価による拡張メソッドの制御プロトコルを実装した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:53:17 GMT)
Qwen2-VL: Enhancing Vision-Language Model's Perception of the World at Any Resolution [82.4] 本稿では,従来のQwen-VLモデルのアップグレードであるQwen2-VLシリーズを紹介する。
Qwen2-VLでは、さまざまな解像度の画像を異なる数のビジュアルトークンに処理可能にする、Naive Dynamic Resolutionメカニズムが導入されている。
また、Multimodal Rotary Position Embedding (M-RoPE)を統合し、テキスト、画像、ビデオ間で位置情報の効果的な融合を容易にする。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:59:32 GMT)
PlaSma: Making Small Language Models Better Procedural Knowledge Models for (Counterfactual) Planning [77.0] PlaSmaは、手続き的な知識と(制約のある)言語計画能力を持つ小さな言語モデルを実現するための、新しい2段階のアプローチである。
我々は,小言語モデルにおけるコモンセンス知識を高めるための記号的手続き的知識蒸留法と,より構造化された正確な推論を容易にする推論時アルゴリズムを開発する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:30:33 GMT)
SpoofCeleb: Speech Deepfake Detection and SASV In The Wild [76.7] SpoofCelebは、音声ディープフェイク検出(SDD)とスポフィングロバスト自動話者検証(SASV)のために設計されたデータセットである。
我々は,テキスト・トゥ・スペーチ(TTS)システムによって生成された実世界の状況からのソースデータとスプーフィング攻撃を利用して,同じ実世界のデータに基づいて訓練した。
SpoofCelebは、1,251人のユニークな話者による250万以上の発話で構成され、自然界の状況下で収集されている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 23:17:02 GMT)
Continual Learning: Forget-free Winning Subnetworks for Video Representations [75.4] タスク性能の面でのサブネットワーク(WSN)の勝利は、様々な連続学習タスクに対して考慮される。
タスクインクリメンタルラーニング(TIL)とタスク非依存インクリメンタルラーニング(TaIL)のシナリオにおいて,既存のネットワークからの重み付けを活用して,効率的な学習を実現する。
ビデオインクリメンタルラーニング(VIL)におけるWSN内のフーリエサブニューラル演算子(FSO)の利用
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:02:13 GMT)
Distilling Channels for Efficient Deep Tracking [68.1] 本稿では,ディープトラッカーを容易にするための新しいチャネル蒸留法を提案する。
統合的な定式化は,特徴圧縮,応答マップ生成,モデル更新を統一エネルギー最小化問題に変換することができることを示す。
その結果、ディープトラッカーは正確で高速で、メモリ要求が低い。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:09:20 GMT)
From Lists to Emojis: How Format Bias Affects Model Alignment [67.1] 人的フィードバックからの強化学習における形式バイアスについて検討する。
人間の評価者を含む多くの広く使われている嗜好モデルは、特定のフォーマットパターンに対して強いバイアスを示す。
バイアスデータが少ないと、報酬モデルにかなりのバイアスを注入できることを示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 05:13:18 GMT)
Vista3D: Unravel the 3D Darkside of a Single Image [64.0] Vista3Dは、わずか5分で素早く一貫した3D生成を実現するフレームワークである。
粗い位相では、1つの画像からガウススプラッティングで初期幾何学を高速に生成する。
2つの独立な暗黙関数を持つ非絡み合った表現を使用することで、生成の質を高める。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:59:44 GMT)
Enabling Real-Time Conversations with Minimal Training Costs [61.8] 本稿では,2つの言語モデルに対して,最小限の訓練を要し,2つの言語能力を持つ新しい重複復号法を提案する。
実験結果から,本手法はトレーニングコストの最小化とともに,ユーザとAIのインタラクションの自然性と人間的類似性を著しく向上することが示された。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 06:27:26 GMT)
Prior Constraints-based Reward Model Training for Aligning Large Language Models [58.3] 本稿では,この問題を解決するために,事前制約に基づくリワードモデル(PCRM)のトレーニング手法を提案する。
PCRMは、前回の制約、特に各比較ペアの出力間の長さ比とコサイン類似性を、最適化の規模を調節しスコアマージンを制御するための報酬モデルトレーニングに組み入れている。
実験結果から,PCRMは報酬スコアのスケーリングを効果的に抑制することによりアライメント性能を著しく向上することが示された。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 05:28:12 GMT)
TK-Planes: Tiered K-Planes with High Dimensional Feature Vectors for Dynamic UAV-based Scenes [58.2] 本研究では,無人航空機(UAV)の認識における合成データと実世界データとの領域ギャップを埋める新しい手法を提案する。
私たちの定式化は、小さな動く物体や人間の行動からなる動的なシーンのために設計されています。
我々は,Okutama ActionやUG2など,挑戦的なデータセットの性能を評価する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:28:24 GMT)
Natural Language Processing for Dialects of a Language: A Survey [56.9] 最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットに対するNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 00:02:02 GMT)
DocMamba: Efficient Document Pre-training with State Space Model [56.8] 本稿では,状態空間モデルに基づく新しいフレームワークDocMambaを紹介する。
グローバルなモデリング能力を保ちながら、計算複雑性を線形に減らすように設計されている。
HRDocの実験では、DocMambaの長さ外挿の可能性が確認された。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 11:34:28 GMT)
A Unified Framework for Neural Computation and Learning Over Time [56.4] Hamiltonian Learningはニューラルネットワークを"時間とともに"学習するための新しい統合フレームワーク
i)外部ソフトウェアソルバを必要とせずに統合できる、(ii)フィードフォワードおよびリカレントネットワークにおける勾配に基づく学習の概念を一般化する、(iii)新しい視点で開放する、という微分方程式に基づいている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:57:13 GMT)
To CoT or not to CoT? Chain-of-thought helps mainly on math and symbolic reasoning [55.5] Chain-of-Thought (CoT) は,大規模言語モデル (LLM) から推論能力を引き出すデファクト手法である。
私たちは、CoTが主に数学や論理学を含むタスクに強いパフォーマンス上の利点をもたらし、他のタスクよりもはるかに少ない利益をもたらすことを示しています。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:55:00 GMT)
GaussianHeads: End-to-End Learning of Drivable Gaussian Head Avatars from Coarse-to-fine Representations [54.9] マルチビュー画像から高ダイナミックで変形可能な人間の頭部アバターをリアルタイムで生成する手法を提案する。
本手法のコアとなるのは,顔表情と頭部運動の複雑なダイナミクスを捉えることができる頭部モデルの階層的表現である。
我々は、この粗い顔アバターモデルを、エンドツーエンドのフレームワークで学習可能なパラメータとして頭部ポーズとともに訓練する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 13:05:43 GMT)
LaMamba-Diff: Linear-Time High-Fidelity Diffusion Models Based on Local Attention and Mamba [54.9] 局所的意図的マンバブロックは、大域的コンテキストと局所的詳細の両方を線形複雑性でキャプチャする。
このモデルは, 256x256の解像度で, ImageNet上の様々なモデルスケールでDiTの性能を上回り, 優れたスケーラビリティを示す。
ImageNet 256x256 と 512x512 の最先端拡散モデルと比較すると,最大 62% GFLOP の削減など,我々の最大のモデルには顕著な利点がある。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:55:17 GMT)
Free-VSC: Free Semantics from Visual Foundation Models for Unsupervised Video Semantic Compression [54.6] 教師なしビデオセマンティック圧縮(UVSC)は近年注目を集めている。
VFM から既製のリッチなセマンティクスを吸収することで UVSC タスクを強化することを提案する。
圧縮されたビデオと様々なVFM間のセマンティックスを柔軟に整合させるために,VFM固有のプロンプトによって補完されるVFMの共有セマンティックアライメント層を導入する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 05:55:01 GMT)
WiLoR: End-to-end 3D Hand Localization and Reconstruction in-the-wild [53.3] 野生における効率的なマルチハンド再構築のためのデータ駆動パイプラインを提案する。
提案するパイプラインは、リアルタイム完全畳み込みハンドローカライゼーションと、高忠実度トランスフォーマーに基づく3Dハンド再構成モデルという2つのコンポーネントで構成されている。
提案手法は, 一般的な2次元および3次元のベンチマークにおいて, 効率と精度の両方において, 従来の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 18:46:51 GMT)
Large Language Models Are Strong Audio-Visual Speech Recognition Learners [53.1] マルチモーダル・大規模言語モデル(MLLM)は,近年,多モーダル理解能力の強化により,研究の焦点となっている。
本稿では,Llama-AVSRを提案する。
我々は,最大公的なAVSRベンチマークであるLSS3に対する提案手法の評価を行い,WERが0.81%,0.77%であるASRとAVSRのタスクに対して,新しい最先端の結果を得た。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 21:17:27 GMT)
Idiosyncratic properties of Australian STV election counting [52.7] STV(Single Transferable Vote)は、オーストラリアのいくつかの地区で使用されている。
本稿では,これらのシステムの直観的特性について述べる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 01:19:27 GMT)
The Cramér-Rao approach and global quantum estimation of bosonic states [52.5] Cram'er-Rao アプローチが局所的推定ではなく大域的推定に当てはまるかどうかは不明である。
クラムエル・ラオ法が成立し、非IID条件下でのボゾン状態の族を含む量子状態推定問題に有効でない状況を見つける。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:49:18 GMT)
ExtractGPT: Exploring the Potential of Large Language Models for Product Attribute Value Extraction [52.1] 電子商取引プラットフォームは、属性と値のペアという形で構造化された製品データを必要とする。
BERTベースの抽出法では,タスク固有の大量のトレーニングデータを必要とする。
本稿では,大規模言語モデル (LLM) を,より訓練的かつ堅牢な代替手段として活用することを検討する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 12:28:16 GMT)
LFIC-DRASC: Deep Light Field Image Compression Using Disentangled Representation and Asymmetrical Strip Convolution [51.9] ディスタングル表現と非対称ストリップ畳み込みを用いたエンドツーエンドのディープLF画像圧縮法を提案する。
実験の結果,提案したLFIC-DRASCは平均20.5%のビットレート削減を達成した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 05:33:42 GMT)
MURRE: Multi-Hop Table Retrieval with Removal for Open-Domain Text-to-SQL [51.5] MURRE (Multi-hop table search with removal) は、未検索のテーブルへ誘導するために、質問から以前検索した情報を削除する。
2つのオープンドメインのテキスト・ツー・レトリバーデータセットの実験は、以前の最先端結果よりも平均5.7%改善したことを示している。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:48:25 GMT)
How to Build the Virtual Cell with Artificial Intelligence: Priorities and Opportunities [46.7] そこで我々は,生物データから細胞と細胞系の堅牢な表現を直接学習する,AIを利用した仮想セルのビジョンを提案する。
我々は,AI仮想細胞が望まれる能力について論じる。
我々は、AI仮想細胞が新しい薬物標的を特定し、摂動に対する細胞反応を予測し、スケール仮説を探索する未来を想像する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:41:50 GMT)
Unlock the Power of Frozen LLMs in Knowledge Graph Completion [45.8] 大きな言語モデル(LLM)は、強力なコンテキストモデリングによって大きなコーパスから広範な知識を学ぶ。
我々は、LLMの中間層を刺激するためにプロンプトを利用することで、コンテキスト対応の知識三重項の隠蔽状態を捉える。
次に、これらの隠れ状態にデータ効率の分類器をトレーニングし、KGCにおける凍結LDMの本質的な機能を利用する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:12:28 GMT)
HENet: Hybrid Encoding for End-to-end Multi-task 3D Perception from Multi-view Cameras [45.7] 本稿では,マルチタスク3次元知覚のためのHENetというエンドツーエンドフレームワークを提案する。
具体的には,短期フレーム用大画像エンコーダと長期フレーム用小画像エンコーダを用いたハイブリッド画像エンコーダを提案する。
各認識タスクの特徴により、異なるグリッドサイズのBEV機能、独立したBEVエンコーダ、タスクデコーダを異なるタスクに活用する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 06:33:32 GMT)
Community Shaping in the Digital Age: A Temporal Fusion Framework for Analyzing Discourse Fragmentation in Online Social Networks [45.6] 本研究では,ソーシャルメディアプラットフォームにおけるオンラインコミュニティの動態を解析するための枠組みを提案する。
テキスト分類と動的ソーシャルネットワーク分析を組み合わせることで,コミュニティの形成と進化を促進するメカニズムを明らかにする。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 03:03:02 GMT)
AugTriever: Unsupervised Dense Retrieval by Scalable Data Augmentation [44.9] 擬似クエリドキュメントペアを作成することにより,アノテーションフリーでスケーラブルなトレーニングを可能にする2つのアプローチを提案する。
クエリ抽出方法は、元のドキュメントから有能なスパンを選択して擬似クエリを生成する。
転送クエリ生成方法は、要約などの他のNLPタスクのために訓練された生成モデルを使用して、擬似クエリを生成する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:09:07 GMT)
AlignBot: Aligning VLM-powered Customized Task Planning with User Reminders Through Fine-Tuning for Household Robots [44.5] AlignBotはVLMを使った家庭用ロボットのタスクプランニングを最適化する新しいフレームワークである。
国内環境では、リマインダーの量、多様性、マルチモーダル性により、タスクプランニングとユーザリマインダーの連携が重大な課題となる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 12:05:30 GMT)
You Only Read Once (YORO): Learning to Internalize Database Knowledge for Text-to-SQL [43.8] 最近のソリューションでは、すべての質問に対して同じデータベーススキーマを繰り返しエンコードしているため、不要な高推論コストが発生し、しばしば重要なデータベース知識を見落としている。
トレーニング中のテキストからモデルへのパラメトリックな知識にデータベースの知識を直接内包し、推論中のスキーマエンコーディングの必要性を解消する新しいパラダイムであるYou Only Read Once (YORO)を提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:38:25 GMT)
Assessing Reusability of Deep Learning-Based Monotherapy Drug Response Prediction Models Trained with Omics Data [43.6] がん薬物応答予測モデルは、精度オンコロジーへの有望なアプローチを示す。
深層学習(DL)法はこの分野で大きな可能性を秘めている。
これは、より広い科学コミュニティによって改善され、テストされる、再利用可能で適応可能なモデルの必要性を強調している。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:08:28 GMT)
DPI-TTS: Directional Patch Interaction for Fast-Converging and Style Temporal Modeling in Text-to-Speech [43.5] テキスト・トゥ・音声(DPI-TTS)のための方向的パッチ・インタラクション法を提案する。
DPI-TTSは低周波数から高周波数のフレーム・バイ・フレームプログレッシブ・推論・アプローチを採用しており、音響特性とより密に一致している。
実験により,本手法はトレーニング速度を約2倍に向上し,ベースラインモデルよりも大幅に向上することが示された。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:36:55 GMT)
Discovering Conceptual Knowledge with Analytic Ontology Templates for Articulated Objects [42.9] 我々は,概念レベルでの動作を通じて,機械知能に類似の能力を持たせることを目指している。
AOT駆動のアプローチは、3つの重要な観点で利益をもたらす。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 04:53:38 GMT)
DreamMover: Leveraging the Prior of Diffusion Models for Image Interpolation with Large Motion [35.6] 本研究では,大きな動きを持つ画像対から中間画像を生成する問題について検討する。
大きな動きのため、中間的な意味情報は入力画像に欠落する可能性がある。
3つの主要コンポーネントを持つ新しいイメージフレームワークであるDreamMoverを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 06:34:47 GMT)
Leveraging Large Language Models for Solving Rare MIP Challenges [35.4] 混合プログラミング(MIP)は、数学的な解法が厳密な時間制約の中で複雑なインスタンスに対処する必要がある領域で広く適用されてきた。
大規模言語モデル(LLM)のようなエンドツーエンドモデルのモデル構築コストは、そのパターン認識能力によって問題スケールの影響を受けていない。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:43:12 GMT)
Multi-modal Relation Distillation for Unified 3D Representation Learning [30.9] マルチモーダルリレーショナル蒸留(Multi-modal Relation Distillation、MRD)は、3次元バックボーンに再生可能な大型ビジョンランゲージモデル(VLM)を蒸留するために設計された3次元事前学習フレームワークである。
MRDは、各モダリティ内の関係と異なるモダリティ間の相互関係をキャプチャし、より差別的な3D形状表現を作り出すことを目的としている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 06:39:50 GMT)
Autoregressive + Chain of Thought $\simeq$ Recurrent: Recurrence's Role in Language Models' Computability and a Revisit of Recurrent Transformer [30.0] ニューラルモデルにおけるリカレント構造が推論能力と計算可能性に与える影響について検討する。
我々は、CoTアプローチが繰り返し計算を模倣し、自己回帰と再発の間のブリッジとして機能する方法について光を当てた。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:45:29 GMT)
Human-like Affective Cognition in Foundation Models [28.6] 基礎モデルにおける感情認知テストのための評価フレームワークを提案する。
評価、感情、表現、結果の間を探索する1,280の多様なシナリオを生成します。
以上の結果から,基礎モデルは人間の直感と一致しがちであることが明らかとなった。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 06:42:13 GMT)
RockTrack: A 3D Robust Multi-Camera-Ken Multi-Object Tracking Framework [28.4] マルチカメラ検出器のための3次元MOT法であるRockTrackを提案する。
RockTrackには、信頼性の高い前処理モジュールが組み込まれており、信頼性の高い動きと画像の観察を抽出する。
RockTrackは、59.1%のAMOTAを持つnuScenesビジョンのみのトラッキングリーダーボードで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:08:08 GMT)
ASVD: Activation-aware Singular Value Decomposition for Compressing Large Language Models [28.2] 大規模言語モデル(LLM)のための新しい訓練後圧縮パラダイムを提案する。
我々は、アクティベーション対応特異値分解(ASVD)と呼ばれるトレーニング不要の手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 04:53:46 GMT)
TTT-Unet: Enhancing U-Net with Test-Time Training Layers for Biomedical Image Segmentation [28.2] TTT-Unetは、テストタイムトレーニング層をバイオメディカルイメージセグメンテーションのための従来のU-Netアーキテクチャに統合する新しいフレームワークである。
TTT-Unetは,CTおよびMR画像における3次元腹部臓器の分画,内視鏡画像における計器の分画,顕微鏡画像における細胞分画など,複数の医用画像データセット上で評価される。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 19:43:42 GMT)
TaCIE: Enhancing Instruction Comprehension in Large Language Models through Task-Centred Instruction Evolution [27.9] TaCIEは、単に進化したシード命令から、よりダイナミックで包括的な要素の組み合わせへと、命令の進化を再定義する。
複数の領域にまたがってTaCIEを適用することで、これらの進化した命令で微調整されたLLMは、従来の手法で調整された命令よりも大幅に性能が向上した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 10:06:28 GMT)
Distillation-free Scaling of Large SSMs for Images and Videos [27.6] 状態空間モデル(SSM)は、状態空間の技術を深層学習に組み込むことにより、新しい文脈モデリング手法を導入した。
マンバベースのアーキテクチャは、パラメータの数に関してスケールが難しいため、ビジョンアプリケーションにとって大きな制限となる。
本稿では,拡張性,堅牢性,性能を向上させるMamba-Attentionインターリーブアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 10:48:10 GMT)
Perceptions of the Fairness Impacts of Multiplicity in Machine Learning [22.4] 多重性 -- 複数の良いモデルの存在 -- は、いくつかの予測が本質的に任意のものであることを意味する。
マルチプライシティの存在が、機械学習フェアネスに対する利害関係者の認識にどのように影響するかを調査する。
この結果から,モデル開発者は公平性を維持するために,多元性を扱うことを意識すべきであることが示唆された。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 21:57:51 GMT)
SLAM assisted 3D tracking system for laparoscopic surgery [22.4] 本研究は,登録後タスクのためのリアルタイムモノクル3D追跡アルゴリズムを提案する。
in-vivoおよびex-vivoテストによる実験では、提案された3Dトラッキングシステムが堅牢な3Dトラッキングを提供することが示された。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 04:00:54 GMT)
Zero-resource Hallucination Detection for Text Generation via Graph-based Contextual Knowledge Triples Modeling [22.1] オープンな回答を持つテキスト生成のための幻覚検出はより困難である。
外部資源のない長いテキストにおける幻覚の検出に関する最近の研究は、一貫性の比較を行っている。
テキスト生成のためのグラフベースの文脈認識(GCA)幻覚検出を提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 05:42:01 GMT)
VL-Reader: Vision and Language Reconstructor is an Effective Scene Text Recognizer [22.1] 本稿では,VL-Readerという,革新的なシーンテキスト認識手法を提案する。
VL-Readerの新規性は、プロセス全体を通して視覚と言語の間の広範な相互作用にある。
トレーニング前の段階では、VL-Readerはマスクされたビジュアルトークンとテキストトークンの両方を再構築するが、微調整の段階では、ネットワークはマスクされた領域を使わずに画像からすべての文字を再構成する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:46:28 GMT)
DAF-Net: A Dual-Branch Feature Decomposition Fusion Network with Domain Adaptive for Infrared and Visible Image Fusion [21.6] 赤外線と可視画像の融合は、両モードの相補的な情報を組み合わせて、より包括的なシーン理解を提供することを目的としている。
最大領域適応型デュアルブランチ機能分解融合ネットワーク(DAF-Net)を提案する。
MK-MMDを導入することで、DAF-Netは可視画像と赤外線画像の潜在特徴空間を効果的に整列し、融合画像の品質を向上させる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:14:08 GMT)
Trajectory Anomaly Detection with Language Models [21.4] 本稿では,自己回帰因果アテンションモデル(LM-TAD)を用いた軌道異常検出のための新しい手法を提案する。
トラジェクトリをトークンの列として扱うことにより、トラジェクトリ上の確率分布を学習し、高精度な異常位置の同定を可能にする。
本実験は, 合成および実世界の両方のデータセットに対するLM-TADの有効性を実証した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:33:31 GMT)
InverseMeetInsert: Robust Real Image Editing via Geometric Accumulation Inversion in Guided Diffusion Models [20.9] GEO(Geometry-Inverse-Meet-Pixel-Insert,略してGeometry-Meet-Pixel-Insert)は、非常に多用途な画像編集技術である。
本手法では,テキストプロンプトと画像プロンプトをシームレスに統合し,多種多様な正確な編集結果を得る。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 06:43:40 GMT)
CoMT: Chain-of-Medical-Thought Reduces Hallucination in Medical Report Generation [20.6] 医療報告生成における幻覚を緩和するためのチェーン・オブ・メディカル・シント・アプローチ(CoMT)を提案する。
CoMTは、診断手順を分解することで、人間の医師の認知過程を模倣しようとしている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 06:53:40 GMT)
V2I-Calib: A Novel Calibration Approach for Collaborative Vehicle and Infrastructure LiDAR Systems [19.9] 本稿では,V2Iキャリブレーションに新たなアプローチを導入し,知覚対象間の空間的関連情報を活用する。
この手法の中心は、車両とインフラシステムによって識別されるターゲット間の相関を定量化する、イノベーティブなOIoU(Intersection over Union)計量である。
当社のアプローチでは,親和性行列の構築を通じて,車両とインフラのLiDARシステムの認識結果における共通目標の同定を行う。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:26:55 GMT)
ChefFusion: Multimodal Foundation Model Integrating Recipe and Food Image Generation [19.7] 我々は,真のマルチモーダル性を実現する新しい食品コンピューティング基盤モデルを導入する。
大規模言語モデル(LLM)と事前訓練された画像エンコーダおよびデコーダモデルを活用することで、我々のモデルはさまざまな食品コンピューティング関連のタスクを実行することができる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:24:29 GMT)
Internal Consistency and Self-Feedback in Large Language Models: A Survey [19.6] 我々は、内部整合性の統一的な視点を使用し、欠陥や幻覚を推論するための説明を提供する。
自己フィードバックと呼ばれる内部一貫性をマイニングできる効果的な理論的枠組みを導入する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:25:20 GMT)
Efficient Data Subset Selection to Generalize Training Across Models: Transductive and Inductive Networks [18.6] アーキテクチャをまたいで一般化するトレーニング可能なサブセット選択フレームワークである$texttSubSelNet$を提案する。
我々のモデルは、複数の実際のデータセットにまたがるいくつかの手法より優れています。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 18:32:12 GMT)
Almost Sure Convergence of Linear Temporal Difference Learning with Arbitrary Features [18.3] この研究は、線形独立な特徴を必要とせず、線形TDのほぼ確実に収束を確立する最初のものである。
解析の鍵となるのは、線形TDの平均ODEの有界不変集合の新たな特徴付けである。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:59:17 GMT)
Towards No-Code Programming of Cobots: Experiments with Code Synthesis by Large Code Models for Conversational Programming [18.3] LLM(Large Language Models)は、対話型コード生成のためのコンテキスト内学習を行うように設計されている。
本研究は,テキスト中の実例から,このようなコードを合成するための最先端のLLMの性能を評価する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:17:17 GMT)
EFCM: Efficient Fine-tuning on Compressed Models for deployment of large models in medical image analysis [17.9] 本研究では,非監督的特徴蒸留と微調整の2段階からなる圧縮モデル(EFCM)フレームワークの効率的な微調整について述べる。
実験は、網膜用RETFound、胸部X線用MRM、病理組織学用BROWの3つの大きな医療モデルに関連する11の下流データセットで実施された。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:08:16 GMT)
Handling Long-Term Safety and Uncertainty in Safe Reinforcement Learning [17.9] 安全性は、現実世界のロボットに強化学習技術が配備されるのを防ぐ重要な問題の1つだ。
本稿では,安全な探索手法であるATACOMを学習可能な制約で拡張することにより,そのギャップを埋める。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:08:41 GMT)
Adversarial Attack for Explanation Robustness of Rationalization Models [17.8] 合理化モデルは、人間が予測を理解し、信頼するために、入力テキストのサブセットを選択する。
本論文は, 合理化モデルの説明可能性について, 予測を変更せずに損なうことを目的としている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 12:44:28 GMT)
GReDP: A More Robust Approach for Differential Privacy Training with Gradient-Preserving Noise Reduction [17.8] 我々は、GReDPと呼ばれる微分プライバシートレーニングに対して、より堅牢なアプローチを提案する。
周波数領域におけるモデル勾配を計算し、ノイズレベルを低減するための新しいアプローチを採用する。
これまでの研究とは異なり、我々のGReDPはDPSGDに比べてノイズスケールの半分しか必要としない。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 03:01:27 GMT)
Spin resolved momentum spectra for vacuum pair production via a generalized two level model [17.4] 多次元時間依存電場におけるペア生成の研究のための一般化された2レベルモデルを構築した。
粒子と反粒子の全ての可能なスピン状態に対して、完全にスピン分解された成分を持つ運動量スペクトルを提供することができる。
この2レベルモデルにより、より異なる背景場に対するペア生産の研究を拡張できると考えられている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:33:40 GMT)
A Chinese Continuous Sign Language Dataset Based on Complex Environments [17.2] 複雑な環境に基づく中国語連続手話(CSL)のための大規模データセットを構築した。
このデータセットは、日常生活シーンから収集された5,988の連続CSLビデオクリップを含んでいる。
連続手話認識のための時間周波数ネットワーク(TFNet)モデルを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 13:11:15 GMT)
Measuring Dimensions of Self-Presentation in Twitter Bios and their Links to Misinformation Sharing [17.2] ソーシャルメディアプラットフォームは、ユーザに「バイオ」と呼ばれるプロファイル記述フィールドを提供し、世界に自らを提示することができる。
社会的意味の健全な次元を捉えた空間に生物を埋め込むための、単純で効果的、理論的に動機づけられた一連のアプローチを提案し、評価する。
我々の研究は、計算社会科学者が生体情報を利用するのを助ける新しいツールを提供し、Twitter上での誤情報共有がどのように認識されるかに関する新たな洞察を提供する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:26:21 GMT)
On the Statistical Complexity of Estimation and Testing under Privacy Constraints [17.0] 差分プライバシー下での統計的テストのパワーをプラグアンドプレイ方式で特徴付ける方法を示す。
プライバシ保護のレベルが非常に高い場合にのみ、プライバシの維持が顕著なパフォーマンス低下をもたらすことを示す。
最後に,プライベート凸解法であるDP-SGLDアルゴリズムを高信頼度で最大推定できることを示した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:48:11 GMT)
About the Cost of Central Privacy in Density Estimation [17.0] リプシッツ空間とソボレフ空間における密度の非パラメトリック密度推定について検討する。
プライバシー予算が一定でないような体制を考える。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:46:04 GMT)
User-friendly Foundation Model Adapters for Multivariate Time Series Classification [16.9] ファンデーションモデルは、非常に効果的であるが、しばしばリソース集約であり、かなりの推論時間とメモリを必要とする。
本稿では,次元削減手法を探求することにより,これらのモデルを限られた計算資源でより利用しやすくすることの課題に対処する。
我々の実験では、ベースラインモデルと比較して最大10倍のスピードアップを実現し、パフォーマンスを低下させることなく、1つのGPUに最大4.5倍のデータセットを適合させることができる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 18:50:20 GMT)
Implicit Reasoning in Deep Time Series Forecasting [16.8] この研究は、ディープ時系列予測モデルの推論能力を評価するための最初の一歩を踏み出した。
系統的に編成されたアウト・オブ・ディストリビューションシナリオにおいて,ある線形なパッチベーストランスフォーマーモデルが効果的に一般化できることが判明した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 18:59:09 GMT)
Tracking Any Point with Frame-Event Fusion Network at High Frame Rate [16.7] 本稿では,イメージイベント融合点トラッカー FE-TAP を提案する。
画像フレームからのコンテキスト情報と、イベントの高時間分解能を組み合わせる。
FE-TAPは様々な困難条件下で高いフレームレートとロバストな点追跡を実現する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 13:07:19 GMT)
MiLoRA: Harnessing Minor Singular Components for Parameter-Efficient LLM Finetuning [16.7] 重み行列の小さな特異成分のみを更新する単純なLLM微調整手法であるMiLoRAを提案する。
主行列は重要な知識を含むのに対し、マイナー行列はノイズ情報またはロングテール情報に対応することが観察された。
微調整の間、MiLoRAはラベル付きデータセットを学習するために最適化されていないサブスペースを最大限に活用する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:57:12 GMT)
Computationally efficient reductions between some statistical models [16.0] 本研究では,ソースモデルのパラメータを知らずに,ソース統計モデルからターゲット統計モデルへサンプルを変換する問題について検討する。
我々は、一様、Erlang、Laplaceのロケーションモデルを一般的なターゲットファミリーにおよそ還元する計算効率のよいプロシージャを提供する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:13:18 GMT)
Dynamic PDB: A New Dataset and a SE(3) Model Extension by Integrating Dynamic Behaviors and Physical Properties in Protein Structures [15.8] 約12.6Kタンパク質を含む大規模データセットであるDynamic PDBを導入する。
我々は、原子速度と力、ポテンシャルと運動エネルギー、シミュレーション環境の温度を含む、総合的な物理特性スイートを提供する。
本研究は, 軌道予測の課題に対して, 提案したデータセット上での最先端手法の評価を行う。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 10:53:11 GMT)
Calibration Error for Decision Making [15.8] そこで本研究では,決定理論のキャリブレーション誤差である決定損失(CDL)を,予測値から得られる意思決定報酬の最大化として定義する。
CDLと既存の校正誤差メトリクスの分離を示す。
我々の主な技術的貢献は、ほぼ最適の$O(fraclog TsqrtT)$期待のCDLを達成する、オンラインキャリブレーションのための新しい効率的なアルゴリズムである。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:57:41 GMT)
GDTS: Goal-Guided Diffusion Model with Tree Sampling for Multi-Modal Pedestrian Trajectory Prediction [15.7] マルチモーダル軌道予測のための木サンプリングを用いたゴールガイド拡散モデルを提案する。
2段階のツリーサンプリングアルゴリズムが提案され、一般的な特徴を活用して推論時間を短縮し、マルチモーダル予測の精度を向上させる。
実験により,提案フレームワークは,公開データセットにおけるリアルタイム推論速度と同等の最先端性能を達成できることが実証された。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 12:39:06 GMT)
EventAug: Multifaceted Spatio-Temporal Data Augmentation Methods for Event-based Learning [15.7] イベントカメラは、低レイテンシと高ダイナミックレンジのため、幅広い領域で大きな成功を収めている。
しかし、コミュニティはデータ不足や多様性の制限といった課題に直面しており、多くの場合、過度に適合し、機能学習が不十分になる。
本研究は,空間的時間的多様性を高めるために,EventAugという体系的な拡張スキームを導入することを目的とする。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:01:34 GMT)
A Best-of-Both Approach to Improve Match Predictions and Reciprocal Recommendations for Job Search [15.6] 本稿では、擬似マッチスコアを利用して、生産における相互推薦を改善するための、新規で実用的なソリューションを紹介し、実証する。
具体的には、実際のマッチングラベルと比較的不正確だが密なマッチング予測を組み合わせることで、より密で直接的な擬似マッチスコアを生成する。
我々の手法は、直接マッチング予測と2つの異なるモデルアプローチの両方の高レベルなアイデアを組み合わせることで、ベスト・オブ・ボス(BoB)アプローチと見なすことができる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 04:08:44 GMT)
Mitral Regurgitation Recogniton based on Unsupervised Out-of-Distribution Detection with Residual Diffusion Amplification [15.3] 我々は,Mitral regurgitation (MR) を同定するための教師なしアウト・オブ・ディストリビューション(OOD)検出法を提案する。
提案手法は,特徴抽出器,特徴再構成モデル,残留蓄積増幅アルゴリズムから構成される。
提案手法を893個の非MRビデオと267個のMRビデオを含む大規模超音波データセット上で検証した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:14:37 GMT)
Basket-Enhanced Heterogenous Hypergraph for Price-Sensitive Next Basket Recommendation [15.2] Next Basket Recommendation (NBR)は、ユーザーが一緒に購入する可能性のあるアイテムの組み合わせを予測する新しいタイプのレコメンデーションシステムである。
既存のNBRモデルは、価格である重要な要素を見落としていることが多く、アイテムとバスケットボールのインタラクションを完全に捉えていない。
BDHH(Basket-augmented Dynamic Heterogeneous Hypergraph)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 04:31:22 GMT)
Revealing the Challenge of Detecting Character Knowledge Errors in LLM Role-Playing [15.0] 本稿では,KKE と UKE の誤り検出能力を評価するための探索データセットを提案する。
その結果、最新のLSMでさえこれらの2種類のエラーを効果的に検出するのに苦労していることが示唆された。
本稿では,エージェントによる推論手法であるSelf-RecollectionとSelf-Doubtを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 06:21:44 GMT)
Motivations, Challenges, Best Practices, and Benefits for Bots and Conversational Agents in Software Engineering: A Multivocal Literature Review [14.8] 私たちは、ボットを特徴付けるための分類と、ソフトウェアエンジニアリングに採用する上での一連の課題の提供を目指しています。
目的を達成するため,多言語文献のレビューを行い,研究と実践者の文献のレビューを行った。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 10:37:06 GMT)
On Fairness of Low-Rank Adaptation of Large Models [14.5] 大規模モデルの低ランク適応、特にLoRAは、その計算効率のために勢いを増している。
LoRAが実用性、キャリブレーション、および異なるサブグループ間でのメンバシップ推論に対する抵抗に未検討の影響があるかどうかを問う。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 00:55:35 GMT)
Depth Estimation Based on 3D Gaussian Splatting Siamese Defocus [14.4] 本稿では,3次元幾何学における深さ推定のための3次元ガウススプラッティングとシームズネットワークに基づく自己教師型フレームワークを提案する。
提案したフレームワークは、人工的に合成されたデータセットと実際のぼやけたデータセットの両方で検証されている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 21:36:37 GMT)
Computational Imaging for Long-Term Prediction of Solar Irradiance [14.3] グリッドに接続された太陽光発電システム間でのエネルギーのスケジュールと割り当てには,クラウド移動のリアルタイム予測が必要である。
それまでの作業では、空の広角視野を用いた雲の動きを監視していた。
我々は,空の広い角度の空間分解能を視野に届けるカタディオプトリシステムの設計と展開を行う。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:29:43 GMT)
Promise and Peril of Collaborative Code Generation Models: Balancing Effectiveness and Memorization [13.9] 本研究では,コードの次点予測における協調学習手法の有効性に影響を及ぼす要因について検討する。
コードデータセットのサイズと多様性が、協調的に訓練されたコードモデルの成功に影響を及ぼす重要な要因であることを示す。
この結果から,トレーニングデータに見当たらない場合でも,推論中のデータ漏洩の持続的リスクが浮き彫りになった。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:30:48 GMT)
A Taxonomy of Self-Admitted Technical Debt in Deep Learning Systems [13.9] 本稿では,ディープラーニングシステムにおける自己受け入れ技術的負債(SATD)の存在を実証的に分析する。
オープンコーディングにより, DL特異的SATDの分類を導出し, 7つのカテゴリと41の葉を特徴とした。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:21:10 GMT)
Measuring Human and AI Values based on Generative Psychometrics with Large Language Models [13.8] AIの最近の進歩で、大きな言語モデル(LLM)が、価値測定のツールと主題の両方として登場した。
この研究は、データ駆動価値測定パラダイムであるGPV(Generative Psychometrics for Values)を紹介している。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:26:22 GMT)
Adaptive Selection of Sampling-Reconstruction in Fourier Compressed Sensing [13.8] 圧縮センシング(CS)は、ナイキストサンプリングの非効率性を克服するために出現している。
従来の最適化ベースの再構築は遅く、実際に正確なイメージを得ることはできない。
ディープラーニングベースの再構築は、有望な代替手段だ。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 06:51:29 GMT)
Online Refractive Camera Model Calibration in Visual Inertial Odometry [13.5] 本稿では, 一般的な屈折率カメラモデルとオドメトリーのオンライン共同推定, 未知メディアの屈折率について述べる。
屈折率をモノクロ視覚慣性オドメトリーフレームワークの状態変数としてオンラインに推定する。
本手法は,プール内を走行する水中ロボットを用いて収集したデータに基づいて検証した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:48:05 GMT)
Massively Multi-Person 3D Human Motion Forecasting with Scene Context [13.2] 本研究では、長期(10秒)の人間の動きを予測するために、シーン認識型ソーシャルトランスフォーマーモデル(SAST)を提案する。
我々は、時間的畳み込みエンコーダ・デコーダアーキテクチャとTransformerベースのボトルネックを組み合わせることで、動きとシーン情報を効率的に組み合わせることができる。
我々のモデルは、さまざまなメトリクスやユーザスタディにおいて、リアリズムや多様性の観点から、他のアプローチよりも優れています。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:58:51 GMT)
3D Reconstruction with Fast Dipole Sums [12.9] マルチビュー画像から高品質な3D再構成手法を提案する。
我々は、暗黙の幾何学と放射場を、高密度点雲の点当たりの属性として表現する。
これらのクエリは、レイトレーシングを使用して画像の効率と差別化を容易にする。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 06:09:04 GMT)
Mixture of Prompt Learning for Vision Language Models [12.8] ルーティングモジュールを組み込んだソフトプロンプト学習手法の混合を提案する。
このモジュールはデータセットのさまざまなスタイルをキャプチャし、インスタンス毎に最も適切なプロンプトを動的に選択することができる。
また、意味的にグループ化されたテキストレベルの監視を実装し、各ソフトプロンプトを、そのグループから手動で設計されたテンプレートのトークン埋め込みで初期化する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:25:02 GMT)
Dynamics of quantum coherence in many-body localized systems [12.8] 量子コヒーレンス(quantum coherence)がマルチボディローカライゼーション(MBL)の特異な特徴であるデファジング(dephasing)の同定に有効なプローブであることを示す。
本研究は,MBLシステムにおける多体認知現象の理解に関する知見を提供し,実験におけるMBL位相の同定と特徴付けのための新しい実現可能な手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 10:00:51 GMT)
SANE: Strategic Autonomous Non-Smooth Exploration for Multiple Optima Discovery in Multi-modal and Non-differentiable Black-box Functions [12.5] 我々は、インテリジェントベイズ最適化ナビゲーションを容易にするために、戦略的自律非平滑探索(SANE)を開発した。
SANEは、一つの最適な場所に閉じ込められる傾向を避ける。
複数の最適領域の探索を容易にするため,従来のBOよりも優れた性能を示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 20:04:51 GMT)
Few-Shot Class-Incremental Learning with Non-IID Decentralized Data [12.5] スケーラブルで適応的なインテリジェントなシステムを開発するには、クラスインクリメンタルな学習が不可欠だ。
本稿では、分散機械学習パラダイムであるフェデレートされた数発のクラスインクリメンタルラーニングを紹介する。
本稿では,リプレイバッファデータを利用して既存の知識を維持し,新たな知識の獲得を促進する合成データ駆動フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:48:36 GMT)
An Enhanced-State Reinforcement Learning Algorithm for Multi-Task Fusion in Large-Scale Recommender Systems [12.3] Recommender Systems(RS)におけるマルチタスク融合(MTF)のための拡張状態RLと呼ばれる新しい手法を提案する。
提案手法はまず,ユーザの特徴,項目の特徴,その他の重要な特徴を拡張状態として集合的に定義し,さらに,ユーザとイズムのペアに対してより優れたアクションを実現するために,拡張状態を活用する新しいアクタと批判的学習プロセスを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 03:34:31 GMT)
Representing Positional Information in Generative World Models for Object Manipulation [12.3] 本稿では,世界モデルに基づくエージェントがオブジェクト配置タスクを解くための汎用的アプローチを提案する。
特にLCPでは、目標仕様のためのオブジェクトの位置情報を明示的にキャプチャするオブジェクト中心の潜在表現を採用している。
提案手法は複数の操作環境にまたがって厳密に評価され,現行のモデルベース制御手法と比較して良好な性能を示した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:19:50 GMT)
Precise Forecasting of Sky Images Using Spatial Warping [12.0] 本稿では,従来の手法よりも高解像度で将来のスカイイメージフレームを予測するためのディープラーニング手法を提案する。
我々の主な貢献は、地平線における雲の有害な影響に対抗するために最適なワープ法を導出することである。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:25:42 GMT)
Understanding Web Application Workloads and Their Applications: Systematic Literature Review and Characterization [11.9] 我々は、Webアプリケーションのワークロードを利用した既存の研究を特定し分析するために、体系的な文献レビューを実施します。
分析では、これらのワークロードを2つの時間的粒度(日毎と週毎)で特徴付けることに重点を置いています。
これらのワークロードパターンの統計的特徴を提供することで、各パターンの特異性を強調します。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 20:13:10 GMT)
LLMs in Education: Novel Perspectives, Challenges, and Opportunities [11.4] 教育における大規模言語モデル(LLM)の役割は、現在ますます注目されている分野である。
本チュートリアルでは,NLPの教育応用について概説する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 12:29:22 GMT)
Gender Representation and Bias in Indian Civil Service Mock Interviews [11.3] 男女の偏見は、男女の候補者に質問する質問の幅広い性質に見受けられる。
大きな言語モデルを用いた実験は、説明に性別バイアスが強く存在することを示している。
本稿では,今後の社会科学研究に有用な51,278質問のデータセットを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:59:52 GMT)
Unveiling the Black Box: Independent Functional Module Evaluation for Bird's-Eye-View Perception Model [11.2] 本稿では,BEV-IFME(Bird's-Eye-View Perception Model)の独立機能モジュール評価について述べる。
このフレームワークは、モジュールの機能マップを統一されたセマンティック表現空間内でグラウンドトゥルースに対して並べて、それらの類似性を定量化する。
機能モジュールのトレーニング成熟度を評価するための指標であるSimisity Scoreは、BEVメトリクスと強い正の相関を示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 13:20:46 GMT)
Data Efficient Acoustic Scene Classification using Teacher-Informed Confusing Class Instruction [11.2] 異なるサイズのトレーニング分割に取り組むために、3つのシステムが導入されている。
小規模なトレーニング分割のために,提案するベースラインモデルの複雑さを低減し,ベースチャネルの数を減少させることを検討した。
より大きなトレーニング分割のために、FocusNetを使用して、複数のPatchout faSt Spectrogram Transformer(PaSST)モデルと、元のサンプリングレート44.1kHzでトレーニングされたベースラインモデルのアンサンブルに、混乱したクラス情報を提供する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 13:16:00 GMT)
Low Frame-rate Speech Codec: a Codec Designed for Fast High-quality Speech LLM Training and Inference [10.9] 提案する低フレームレート音声符号化(LFSC: Low Frame-rate Speech Codec)は, 有限スカラー量子化と大規模言語モデルによる対角訓練を利用して, 1.89kbps, 21.5fpsの高品質音声圧縮を実現するニューラルオーディオである。
本稿では,従来のモデルに匹敵する品質を向上しつつ,テキスト音声モデルの3倍高速な推定が可能であることを実証する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:39:10 GMT)
Recurrent Interpolants for Probabilistic Time Series Prediction [10.4] 本稿では,リカレントニューラルネットワークの計算効率と拡散モデルの高品質確率モデルとの融合による新しい手法を提案する。
本手法は、補間剤の基礎と、追加の制御機能を備えたより広範な条件生成フレームワークへの拡張に依存している。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 03:52:48 GMT)
Takin: A Cohort of Superior Quality Zero-shot Speech Generation Models [10.4] Takin AudioLLMは、主にTakin TTS、Takin VC、Takin Morphingを含む一連の技術とモデルである。
これらのモデルはゼロショット音声生成が可能であり、実際の人間の音声とほとんど区別できない高品質な音声を生成する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:03:12 GMT)
Blockchain-Enabled IoV: Secure Communication and Trustworthy Decision-Making [10.4] Internet of Vehicles (IoV) は、自動車、インフラ、環境間の相互作用を可能にする。
本稿では,車間通信を管理する一次層と,車内通信をセキュアにするためのサブ層からなる分散化フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 00:56:14 GMT)
Synergising Human-like Responses and Machine Intelligence for Planning in Disaster Response [10.3] デュアルプロセス理論(DPT)にインスパイアされた注意に基づく認知アーキテクチャを提案する。
このフレームワークは、高速だが(人間のような)応答と、遅いが最適化されたマシンインテリジェンスの計画能力を統合する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 10:19:38 GMT)
Differentiable Collision-Supervised Tooth Arrangement Network with a Decoupling Perspective [10.3] 既存の学習ベースの手法では、隠れた歯の特徴を使って歯の動きを直接後退させる。
本稿では,衝突制御型歯列配置ネットワークであるDTANを提案する。
我々は,3つの異なる歯列データセットを構築し,精度と速度の大幅な向上を実現した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 12:52:54 GMT)
Using Large Language Models to Generate Clinical Trial Tables and Figures [10.3] テーブル、フィギュア、リスト(TFL)は臨床試験データを要約するための重要なツールである。
本研究では,TFLの自動生成における大規模言語モデル (LLM) の利用について,素早い工学的手法と数発の転写学習を用いて検討した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:16:37 GMT)
Relax DARTS: Relaxing the Constraints of Differentiable Architecture Search for Eye Movement Recognition [9.9] 眼球運動認識の分野にNASアルゴリズムを導入する。
Relax DARTSは、より効率的なネットワーク検索とトレーニングを実現するために、DARTSの改良である。
Relax DARTSは、他の多機能時間分類タスクへの適応性を示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:37:04 GMT)
SemAI: Semantic Artificial Intelligence-enhanced DNA storage for Internet-of-Things [9.9] 本稿では,Semantic Artificial Intelligence-enhanced DNA Storage(SemAI-DNA)パラダイムを紹介する。
数値的な結果から,SemAI-DNAの有効性が示され,従来の深層学習アプローチよりも2.61dBピーク信号-雑音比(PSNR)が向上し,構造類似度指数(SSIM)が0.13改善した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 12:21:58 GMT)
3DGS-Calib: 3D Gaussian Splatting for Multimodal SpatioTemporal Calibration [9.8] 3DGS-Calitemporalは,3次元ガウススプティング表現の速度とレンダリング精度に依存する新しいキャリブレーション手法である。
提案手法の優位性を,広く使用されている運転データセットのシーケンスに関する実験結果を用いて実証する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:22:57 GMT)
Generation of Complex 3D Human Motion by Temporal and Spatial Composition of Diffusion Models [9.7] 私たちのアプローチでは、複雑なアクションをより単純な動き、特にトレーニング中に観察される動作に分解します。
これらの単純な動きは、拡散モデルの性質を用いて単一の現実的なアニメーションに結合される。
本研究では,2つの人間の動作データセットを基本的な動作と複雑な動作に分割して評価し,その性能を最先端の動作と比較する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 12:32:39 GMT)
Official-NV: An LLM-Generated News Video Dataset for Multimodal Fake News Detection [9.5] 公式なニュースビデオを含むOffic-NVというデータセットを構築した。
クロールが公式に公開されたビデオは、LLMベースの生成と手動による検証によって拡張される。
提案したデータセットは、マルチモーダルニュース検出の有効性を示すために、いくつかのベースラインに対してベンチマークされる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 00:31:27 GMT)
EHRFL: Federated Learning Framework for Institution-Specific Model Construction using Electronic Health Records [8.8] フェデレーテッド・ラーニング(Federated Learning)は、患者のプライバシを保護し、規制の制約を遵守しながら、複数の機関からのデータのトレーニングを可能にする。
多くのフェデレートラーニング研究は、複数の顧客のためのグローバルモデルの構築に焦点を合わせ、制度特化モデルの実践的ニーズを見越すことに重点を置いている。
EHRFLは、単一の医療機関に適したモデルを開発するために設計された、EHRを用いた連合学習フレームワークである。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:09:49 GMT)
QubiCSV: An Open-Source Data Storage and Visualization Platform for Collaborative Qubit Control [8.7] 量子コンピューティング研究の要求に応えるために設計されたQubiCSV(Qubit Control Storage and Visualization)を紹介した。
オープンソースツールであるQubiCSVは、量子コンピューティングの効率的なデータ管理を容易にする。
複雑な量子実験を解釈し、量子ビット性能を最適化するために、洞察に富んだ可視化が開発された。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:42:06 GMT)
Probability Passing for Graph Neural Networks: Graph Structure and Representations Joint Learning [8.4] グラフニューラルネットワーク(GNN)は、幅広い領域にわたる非ユークリッドデータの解析において顕著な成功を収めている。
この問題を解決するために、ノード特徴の類似性やエッジ確率を計算することにより、タスク固有の潜在構造を推論するために、遅延グラフ推論(LGI)を提案する。
本稿では,隣接ノードのエッジ確率を集約することにより,生成したグラフ構造を洗練するためのProbability Passingという新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:27:51 GMT)
Bridging the Gap Between Approximation and Learning via Optimal Approximation by ReLU MLPs of Maximal Regularity [8.3] 最適関数近似器であり,統計的に良好であるReLU多層認識(MLP)のクラスを同定する。
我々は、小さなスパイクに頼って犠牲になる最適なReLU近似器を構築するための標準的なアプローチを避けることで、これを実現する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 22:05:07 GMT)
RaggeDi: Diffusion-based State Estimation of Disordered Rags, Sheets, Towels and Blankets [8.3] 衣服の状態推定はロボット工学において重要な問題である。
ロボットは、布を操り、ロボットドレッシング、縫製、隠蔽・発見といったタスクを実行するために、正確な状態を知ることが不可欠である。
本稿では,布の状態推定を画像生成問題として定式化する拡散モデルに基づくパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:30:03 GMT)
The Factuality of Large Language Models in the Legal Domain [8.1] 本稿では,法域における知識基盤としての大規模言語モデル(LLM)の事実性について検討する。
事例法と法律に関する多様な事実質問のデータセットを設計する。
次に、データセットを用いて、精度、エイリアス、ファジィマッチングなど、異なる評価手法で複数のLCMを評価する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:30:20 GMT)
Dual-Layer Training and Decoding of Large Language Model with Simultaneously Thinking and Speaking [8.0] 大規模言語モデルは、人間の表現を合理的に理解し、生成することができるが、完全な思考と推論機構が欠如している可能性がある。
本稿では,自然界における認知メカニズムに動機付けられ,TaSと呼ばれる新しいモデルアーキテクチャを設計する。
思考強化データを用いて言語モデルを訓練し、思考層が合理的な思考を自動的に生成し、最終的にはより合理的な応答を出力することに成功した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:32:48 GMT)
Anticipating Oblivious Opponents in Stochastic Games [7.9] 我々は,我々のオートマトンによって追跡される信念状態が,完全な歴史の知識によって得られた正確な信念状態から一定の距離に留まることを保証する一貫性の概念を導入する。
本稿では、情報状態マシンが、プレイ上で定義された報酬関数を最大化するための最適ポリシーを計算するための出発点となるMDPを生成する方法を示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 03:17:40 GMT)
Neural Semantic Parsing with Extremely Rich Symbolic Meaning Representations [7.8] 分類学的階層におけるその位置に基づく概念のための新しい構成記号表現を導入する。
この表現はよりリッチな意味情報を提供し、解釈可能性を高める。
実験結果から,より豊かで複雑な意味表現に基づいて訓練された分類モデルは,評価基準を用いて従来のモデルに若干従属するが,語彙外概念を扱う場合よりも優れることがわかった。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:47:54 GMT)
GEIC: Universal and Multilingual Named Entity Recognition with Large Language Models [7.7] ジェネレーションベース抽出とテキスト内分類(GEIC)の課題について紹介する。
次に,多言語GEICフレームワークであるCascadeNERを提案する。
我々はまた、Large Language Models(LLMs)用に特別に設計された最初のNERデータセットであるAnythingNERを紹介します。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 10:05:02 GMT)
JKO for Landau: a variational particle method for homogeneous Landau equation [7.6] 我々は、JKOスキームの枠組みにおけるランドー方程式の新しい暗黙的粒子法を開発した。
まず、ランダウ計量を計算に親しみやすい形で再構成し、フローマップを用いてラグランジュ的視点に変換する。
重要な観察は、フローマップがかなり複雑な積分方程式に従って進化する一方で、未知の成分は単に対応する密度のスコア関数であるということである。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 20:08:19 GMT)
A Single-Loop Deep Actor-Critic Algorithm for Constrained Reinforcement Learning with Provable Convergence [7.6] Deep Actor-Critic Network (DNN)は、Actor-Critic Network (DNN)とDeep Neural Network (DNN)を組み合わせたネットワークである。
Deep Actor-Critic Network (DNN)は、Actor-Critic Network (DNN)とDeep Neural Network (DNN)を組み合わせたネットワークである。
Deep Actor-Critic Network (DNN)は、Actor-Critic Network (DNN)とDeep Neural Network (DNN)を組み合わせたネットワークである。
Deep Actor-Critic Network (DNN)は、Actor-Critic Network (DNN)とDeep Neural Network (DNN)を組み合わせたネットワークである。
Deep Actor-Critic Network (DNN)
論文参考訳(メタデータ) (Wed, 18 Sep 2024 13:32:45 GMT)
"It Might be Technically Impressive, But It's Practically Useless to Us": Practices, Challenges, and Opportunities for Cross-Functional Collaboration around AI within the News Industry [7.6] 多くのニュース機関が人工知能(AI)を運用に統合している。
これにより、これらの専門家とジャーナリストの間でクロスファンクショナルなコラボレーションが始まった。
本研究では、今日のニュース産業におけるAIを中心としたクロスファンクショナルコラボレーションの現在の実践、課題、および機会について検討する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:12:01 GMT)
MQA-KEAL: Multi-hop Question Answering under Knowledge Editing for Arabic Language [7.5] アラビア語(MQA-KEAL)の知識編集に基づくマルチホップ質問回答を提案する。
MQA-KEALは、知識編集を構造化知識単位として外部メモリに格納する。
また,KE による MQA の厳密な性能評価のための MQA-AEVAL も提案した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 18:40:02 GMT)
FAIntbench: A Holistic and Precise Benchmark for Bias Evaluation in Text-to-Image Models [7.3] FAIntbenchは、テキスト・トゥ・イメージ(T2I)モデルにおけるバイアスの総合的かつ正確なベンチマークである。
我々はFAIntbenchを7種類の大規模T2Iモデルの評価に適用し,人間による評価を行った。
その結果, FAIntbenchが種々のバイアスの同定に有効であった。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 04:40:40 GMT)
BodyShapeGPT: SMPL Body Shape Manipulation with LLMs [7.3] LLM(Large Language Models)は、文学的な物語から、さまざまな分野の知識の専門的な応答まで、多様なテキストを生成することができる。
本稿では,人間の身体的記述を識別するための微調整LDMを用いて,SMPL-Xモデルを用いてアバターの正確な表現を作成する。
我々は,LSMがSMPLの形状空間を理解し,操作するために訓練できることを示し,自然言語による3次元人体形状の制御を可能にする。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:55:23 GMT)
Consistent Estimation of a Class of Distances Between Covariance Matrices [7.3] 我々は、それぞれの共分散行列に別々に適用される関数のトレースの和として表現できる距離の族に興味を持っている。
このクラスの距離推定器の挙動に関する統計的解析も行われている。
これらの推定器のガウス性を確立し、対応する手段と分散に対する閉形式表現を提供する中心極限定理を提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:36:25 GMT)
From Maximum Cut to Maximum Independent Set [7.3] 最大独立集合(MIS)問題も特定のイジングモデルと関係があることは以前から知られていた。
この戦略により、ランダムなエルドホス・ローニイグラフの独立数に対する近似が大幅に改善されることが判明した。
また、コーディング理論から生じるベンチマークで完全なパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:59:57 GMT)
Explaining Non-monotonic Normative Reasoning using Argumentation Theory with Deontic Logic [7.2] 本稿では, 法的に関係のある設計決定に対して, 設計者に効果的な説明を与える方法について検討する。
我々は、規範と規範的文脈における行動の正当化のための重要な法的・倫理的原則を規定することによって、説明を提供するための以前のシステムを拡張した。
一階述語論理が強い表現力を持つことを考慮し、本論文ではデオン演算子と選好を持つ一階述語論理系を採用する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:03:29 GMT)
PieClam: A Universal Graph Autoencoder Based on Overlapping Inclusive and Exclusive Communities [7.1] PieClamはグラフオートエンコーダで、任意のグラフを重複した一般化されたコミュニティとして表現する。
ここでは、PieClamは普遍的なオートエンコーダであり、任意のグラフを一様に再構築できることを示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 00:49:42 GMT)
RUIE: Retrieval-based Unified Information Extraction using Large Language Model [6.8] 統一された情報抽出は、単一のモデルまたはフレームワークを使用して全ての情報抽出タスクを完了することを目的としている。
本稿では,テキスト内学習を活用して迅速な一般化を実現するフレームワークRUIE(Retrieval-based Unified Information extract)を提案する。
8つのホールドアウトデータセットの実験結果から、未確認タスクを一般化するRUIEの有効性が示された。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 03:20:04 GMT)
Inside Out or Not: Privacy Implications of Emotional Disclosure [6.7] 個人の情報共有行動の促進における感情の役割について,特に都市部や社会的結びつきとの関連について検討した。
我々は、位置と時間、感情、および個人情報共有行動を統合する新しい方法論を採用する。
その結果、自己報告された感情は、遠い社会集団との個人的情報共有行動に影響を及ぼし、一方中立的な感情は、個人が密接な社会サークルとより正確な情報を共有することにつながることが明らかとなった。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:42:45 GMT)
Gradient-Driven 3D Segmentation and Affordance Transfer in Gaussian Splatting Using 2D Masks [6.6] 3Dガウススプラッティングは強力な3Dシーン表現技術として登場し、高効率で細部を捉えている。
本稿では,2次元分割モデルを3次元ガウススプラットに拡張する投票方式を提案する。
このアプローチの根底にある頑健だが単純な数学的定式化は、多くの下流アプリケーションにとって非常に効果的なツールである。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 03:45:44 GMT)
Abductive explanations of classifiers under constraints: Complexity and properties [6.6] 制約を考慮に入れた3つの新しいタイプの説明を提案する。
それらは、機能空間全体から、あるいはデータセットから生成できる。
我々は、冗長で過剰なAXpを捨てるには、カバレッジが十分であることを示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:15:39 GMT)
Explore-Go: Leveraging Exploration for Generalisation in Deep Reinforcement Learning [5.6] エージェントの一般化性能を高めるために,訓練中の探索量の増加を活用できることが示される。
本研究では,エージェントが訓練する状態の数を増やすことで,この直感を活用する新しい手法であるExplore-Goを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 10:04:56 GMT)
Finetuning Language Models to Emit Linguistic Expressions of Uncertainty [5.6] 大規模言語モデル(LLM)は情報検索や意思決定のタスクにますます採用されている。
LLMは現実世界の事実と矛盾する情報を生成する傾向があり、その説得的なスタイルはこれらの不正確さを自信と説得力に見せかける。
本研究では,不確実性の言語表現を生成するモデルを開発する手法として,不確実性拡張予測の教師付き微調整について検討する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:52:53 GMT)
Reporting Non-Consensual Intimate Media: An Audit Study of Deepfakes [5.6] NCIM(non-consensual intimate media)は、重大なダメージを与える。
被害者はNCIMを非合意のヌード法違反または著作権侵害として報告する2つのメカニズムを使用することができる。
両メカニズムのX(旧Twitter)に報告したNCIMの削除速度の監査を行った。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:01:48 GMT)
Empowering Visual Artists with Tokenized Digital Assets with NFTs [5.4] 非Fungible Tokens(NFT)は、アートプラクティスの強化とブロックチェーンテクノロジの活用の間のネクサスを調べることによって、視覚芸術産業に変革的な影響を与える。
その構造、コンセンサスアルゴリズム、スマートコントラクト、デジタルウォレットなど、ブロックチェーンエコシステムの重要な基盤を導入し、定義します。
特に、さまざまな市場でNFTを鋳造・取引するための重要なプロセスを概説し、関連する市場動態と価格について論じる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:16:16 GMT)
Axial Attention Transformer Networks: A New Frontier in Breast Cancer Detection [5.3] 筆者らは,従来の畳み込みニューラルネットワーク(CNN)の限界に対処する,トランスフォーマーに基づくセグメンテーションモデルを提案する。
このモデルは、計算効率を高め、CNNがしばしば見落としているグローバルな文脈情報の問題に対処する軸的注意機構を導入する。
提案モデルは,乳がん画像のセグメント化精度を大幅に向上することを目的としており,コンピュータ支援診断のためのより効率的かつ効果的なツールを提供する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 22:40:29 GMT)
Collisions of false-vacuum bubble walls in a quantum spin chain [5.2] 我々は、非摂動的手法を用いて、臨界に近い量子スピンチェーンにおける「偽真空」の小さな気泡のリアルタイムダイナミクスをシミュレートする。
壁がクインクおよび反キンク準粒子励起である気泡を考えると,壁衝突がクイン・アンチキンク散乱現象である。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:57:14 GMT)
Symmetry-Based Structured Matrices for Efficient Approximately Equivariant Networks [5.2] 群行列(英: Group Matrices, GM)は、有限群の正規表現の現代的概念の忘れ去られた前駆体である。
GMは、CNNのすべての基本的な操作を一般的な離散グループに拡張するために使用できる。
GMは、CNNのすべての基本動作を一般的な離散グループに拡張するために使用できることを示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:52:33 GMT)
Towards Explainable Goal Recognition Using Weight of Evidence (WoE): A Human-Centered Approach [5.2] ゴール認識(GR)は、一連の観察からエージェントの観測されていないゴールを推測することを含む。
伝統的にGRは「最良の説明への推論」や誘拐によって対処されてきた。
本稿では,人間行動説明の基礎となる理論的枠組みと認知過程を基礎とした,GRエージェントのための説明可能なモデルの導入と評価を行う。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 03:30:01 GMT)
ReflectDiffu:Reflect between Emotion-intent Contagion and Mimicry for Empathetic Response Generation via a RL-Diffusion Framework [5.1] 共感応答生成のための軽量フレームワークである ReflectDiffu を紹介する。
感情の伝染を組み込んで感情の表現力を増強し、感情に反応するマスクを用いて重要な感情的要素を特定できる。
感情的な意思決定を正確に意図的な行動に変換することで、感情的な誤認識に起因する共感的な反応の不一致に対処する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:30:50 GMT)
RAG-Modulo: Solving Sequential Tasks using Experience, Critics, and Language Models [5.1] 大規模言語モデル(LLM)は、ロボットの課題を解決するための有望なツールとして登場した。
既存のLSMベースのエージェントは、過去の相互作用を維持および学習する能力に欠ける。
RAG-Modulo は,過去のインタラクションを記憶した LLM ベースのエージェントを強化し,エージェントの判断を評価するための批判を取り入れたフレームワークである。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 20:03:32 GMT)
Inverse Problems with Diffusion Models: A MAP Estimation Perspective [5.0] コンピュータでは、インペイント、デブロアリング、超解像などの画像復元タスクを逆問題として形式的にモデル化することができる。
本研究では,連続時間拡散モデルの逆条件生成過程をモデル化するMAP推定フレームワークを提案する。
提案手法を用いて,画像復元のための効率的なアルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:01:47 GMT)
High-Order Evolving Graphs for Enhanced Representation of Traffic Dynamics [4.9] 本稿では,自律運転における表現性の向上を目的とした,高次進化グラフを用いた交通動態解析のための革新的なフレームワークを提案する。
提案手法は,交通シーン内の複雑な相互作用をリアルタイムにモデル化する双方向の時間的二部グラフを構築する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:57:28 GMT)
Architecture Decisions in Quantum Software Systems: An Empirical Study on Stack Exchange and GitHub [4.8] この研究は、量子ソフトウェアシステムの開発中に行われたアーキテクチャ決定を経験的に調査し、分析することを目的としている。
量子ソフトウェア開発におけるアーキテクチャ決定に関連する385のイシュー(87のGitHubプロジェクトから)と70のポスト(3つのStack Exchangeサイトから)からのデータを収集しました。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:17:11 GMT)
Topological Deep Learning with State-Space Models: A Mamba Approach for Simplicial Complexes [4.8] 本稿では,Mamba状態空間モデルをバックボーンとして利用して,単純な複素数を扱うように設計された新しいアーキテクチャを提案する。
提案手法は, 隣接セルをベースとしたノードのシーケンスを生成し, ランクに関わらず, 上位構造間の直接通信を可能にする。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:49:25 GMT)
Electric field control for experiments with atoms in Rydberg states [4.7] ライドベルク状態の原子は大きな偏光性を持ち、電場に非常に敏感である。
したがって、これらの不安定な電場をキャンセルすることが不可欠である。
ガラスセルをベースとした真空チャンバーの設計で実装された,新しい,単純で,高精度な電極組立体について述べる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 10:38:00 GMT)
Decoding Style: Efficient Fine-Tuning of LLMs for Image-Guided Outfit Recommendation with Preference [4.7] 本稿では,大規模言語モデル(LLM)の表現力を利用した,個人化された衣装推薦手法を提案する。
MLLM(Multimodal Large Language Model)を用いた画像キャプションによる項目記述の視覚的・テキスト的ギャップを橋渡しする。
このフレームワークは、Polyvoreデータセットで評価され、その効果を2つの重要なタスク、すなわちFill-in-the-blankと補完的なアイテム検索で実証する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:15:06 GMT)
Rapid initial state preparation for the quantum simulation of strongly correlated molecules [4.6] Toffoliの複雑性でユニタリ合成を実現する方法を示す。
フィルタリングにはサンプリングとバイナリ検索の2つのアプローチを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:04:32 GMT)
Model-free quantification of completeness, uncertainties, and outliers in atomistic machine learning using information theory [4.6] 原子論的機械学習(ML)は、情報内容を分析するために教師なし学習やモデル予測に依存していることが多い。
本稿では、原子論シミュレーションにおける情報内容の定量化のための厳密なモデルフリーツールを提供する理論的枠組みを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:30:21 GMT)
PFDiff: Training-free Acceleration of Diffusion Models through the Gradient Guidance of Past and Future [4.6] 拡散確率モデル (DPM) は画像生成において顕著な可能性を示しているが, サンプリング効率は多数のデノナイジングステップの必要性によって妨げられている。
我々は、既存の高速ODEソルバを少ないNFEで動作させることができる新しいトレーニングフリーかつタイムステップスキッピング戦略であるPFDiffを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 13:50:46 GMT)
Towards Building a Robust Knowledge Intensive Question Answering Model with Large Language Models [4.5] 抽出された情報におけるノイズや誤差の存在は、LLMの堅牢性に課題をもたらす。
ノイズの多い外部情報によるモデル精度低下の問題に対処するため,データ拡張に基づく微調整手法を提案する。
我々は既存のLCMと我々のアプローチの両方で実験を行い、その結果をGPT-4で評価した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 01:39:02 GMT)
Raising the Bar(ometer): Identifying a User's Stair and Lift Usage Through Wearable Sensor Data Analysis [4.5] 本研究では,階段と昇降機を用いた新しい探索データセットについて述べる。
階段を登ったり降りたり、さまざまなシナリオでリフトを行ったりしながら、20人の参加者からデータを収集した。
本手法は,87.61%,マルチクラス重み付きF1スコア87.56%の精度で,階段および昇降操作の分類精度が高い。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 06:26:50 GMT)
Conversational Query Reformulation with the Guidance of Retrieved Documents [4.4] 本稿では,最初に検索した文書からキーのinfFormationを活用することでクエリを洗練するフレームワークである GuideCQRを紹介する。
GuideCQRは,人間によるクエリであっても,さまざまなタイプのクエリを用いた会話検索において,さらなるパフォーマンス向上が期待できることを示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 05:49:07 GMT)
Provable Privacy Guarantee for Individual Identities and Locations in Large-Scale Contact Tracing [4.4] 本稿では,PrevENTと呼ばれる高度にスケーラブルで実用的な接触追跡システムを提案する。
様々な位置収集手法を用いて、人の軌跡を網羅的に把握することができる。
システムは非常に効率的で、数百万の場所を持つ大規模データセットに対してリアルタイムのクエリサービスを提供できる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 22:19:48 GMT)
Autopet III challenge: Incorporating anatomical knowledge into nnUNet for lesion segmentation in PET/CT [4.4] AutoPET III ChallengeはPET/CT画像における腫瘍病変の自動切除の進歩に焦点を当てている。
我々は,PETスキャンの最大強度投影に基づいて,与えられたPET/CTのトレーサを識別する分類器を開発した。
我々の最終提出書は、公開可能なFDGおよびPSMAデータセットに対して76.90%と61.33%のクロスバリデーションDiceスコアを達成している。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:16:57 GMT)
SPRMamba: Surgical Phase Recognition for Endoscopic Submucosal Dissection with Mamba [4.4] 本研究では,ESD外科的位相認識のための新しいマンバベースのフレームワークであるSPRMambaを提案する。
本研究では,SPRMambaが既存の最先端手法を超越し,各種の外科的位相認識タスクにおいてより堅牢性を示すことを示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:26:56 GMT)
Memory Gym: Towards Endless Tasks to Benchmark Memory Capabilities of Agents [4.4] Memory GymはMortar Mayhem、Mystery Path、Searing Spotlightsという2D部分的に観測可能な環境のスイートを提供する。
これらの環境は、意思決定エージェントのメモリ能力をベンチマークするために設計されている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 05:53:17 GMT)
Reinforcement Learning with Lie Group Orientations for Robotics [4.3] 配向のリー群構造に固執するネットワークの入力と出力の簡単な修正を提案する。
その結果,既存の学習ライブラリで直接使用可能な,簡単かつ効率的な実装が得られた。
ロボット工学におけるオリエンテーションのためのLie理論を簡潔に紹介し、我々のアプローチを動機づけ、概説する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 12:50:28 GMT)
PAD-FT: A Lightweight Defense for Backdoor Attacks via Data Purification and Fine-Tuning [4.3] バックドア攻撃はディープニューラルネットワークに重大な脅威をもたらす。
そこで,本論文では,新たな手法であるPAD-FTを提案する。この機構は,被害者モデルに悪影響を及ぼすために,新たなクリーンデータセットやファインチューンのみを必要としない。
本機構は,複数のバックドア攻撃手法やデータセットに対して優れた効果を示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:47:23 GMT)
Interpretable classifiers for tabular data via discretization and feature selection [4.2] 表データから人間の解釈可能かつ正確な分類器を即座に計算する手法を提案する。
本稿では,12の実験を通じて,ランダムな森林,XGBoost,および文献における同じデータセットに対する既存の結果と同等の精度で,そのアプローチを実証する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 11:43:43 GMT)
DrLLM: Prompt-Enhanced Distributed Denial-of-Service Resistance Method with Large Language Models [4.2] 本稿では,Large Language Models (LLM) を用いたゼロショットシナリオにおける異常なトラフィック情報のマイニングを目的としたDrLLMを提案する。
DrLLMと既存のアプローチのギャップを埋めるために、トラフィックデータのグローバルおよびローカル情報を推論パラダイムに組み込み、知識埋め込み、トークン埋め込み、プログレッシブロール推論という3つのモジュールを設計する。
我々のアブレーション実験は、ゼロショットシナリオにおけるDrLLMの適用性を実証し、ネットワーク領域におけるLLMの可能性をさらに実証する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 01:18:48 GMT)
Art and Science of Quantizing Large-Scale Models: A Comprehensive Overview [4.2] 本稿では,モデルサイズ成長の必要性と影響を論じ,性能のメリットと計算課題,環境配慮について考察する。
ポストトレーニング量子化(PTQ)と量子化対応トレーニング(QAT)の両方を含む、さまざまな量子化手法を探求する。
これらの手法が、アウトレーヤや重み付け、アクティベーション量子化といった問題にどのように対処するかを検討し、最終的には、より持続可能な大規模モデルのデプロイに寄与する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:35:00 GMT)
On the second-order zero differential properties of several classes of power functions over finite fields [4.1] Feistel Boomerang Connectivity Table (FBCT) は、差動攻撃やブーメラン攻撃などの攻撃に対するFeistelネットワークベースの暗号の抵抗を分析するための重要な暗号解析手法である。
本稿では、有限体上の特定の方程式の解数を計算することにより、パワー関数の2階ゼロ微分スペクトルをx2m+3$およびx2m+5$で明示的に決定する。
これらのエントリと各テーブルの濃度の計算は、Sボックスの微分およびブーメラン暗号解析を容易にすることを目的としている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 04:27:03 GMT)
Enhancing Semi-Supervised Learning via Representative and Diverse Sample Selection [4.0] 半監督学習(SSL)は多くのディープラーニングタスクにおいて好まれるパラダイムとなっている。
ラベル付けのためのサンプルの選択方法も,特に低予算環境下では,パフォーマンスに大きく影響する。
新たな基準である$alpha$-Maximum Mean Discrepancy(alpha$-MMD)を最小化するために修正されたFrank-Wolfeアルゴリズムを採用することで、RDSSはラベルなしデータからアノテーションの代表的なサブセットをサンプリングする。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:40:31 GMT)
HALO: Hallucination Analysis and Learning Optimization to Empower LLMs with Retrieval-Augmented Context for Guided Clinical Decision Making [3.8] 健康や医学などの重要な領域では、幻覚は深刻なリスクを引き起こすことがある。
本稿では,医療質問応答システムの精度と信頼性を高めるための新しいフレームワークであるHALOを紹介する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 20:03:43 GMT)
Hydrodynamic modes and operator spreading in a long-range center-of-mass-conserving Brownian SYK model [3.8] 我々は,1/reta$を特徴とする長距離(大口径)相互作用を持つブラウン錯体Sachdev-Ye-Kitaevモデルについて検討した。
運動的制約と長距離相互作用は保存電荷に付随する豊かな流体力学を生じさせ、シュウィンガー・ケルディシュ効果の計算によって明らかとなる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:46:11 GMT)
A Metric Hybrid Planning Approach to Solving Pandemic Planning Problems with Simple SIR Models [3.7] パンデミックは、Susceptible Infected Removed (SIR)モデルのようなコンパートメンタルモデルを用いて数学的に記述することができる。
我々は、この状態遷移モデルに基づいて、計量ハイブリッド計画問題を定式化し、計量ハイブリッドプランナーを用いて解決する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 01:31:26 GMT)
Prototypical Leadership in Agile Software Development [3.7] リーダシップの有効性は、チーム内から現れる場合や、リーダがグループに同調する場合に高く評価された。
チームの共有価値や特性と一致するマネージャの役割のリーダーは、より効果的だと見なされた。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 03:55:58 GMT)
Investigating team maturity in an agile automotive reorganization [3.7] この研究は、このような包括的な組織再編において、チームの成熟度レベルがどのように影響するかを照らすことを目的としている。
63チームからのデータを収集して、これらのアジャイルチームに対する組織的変化の影響を理解しました。
高い転職率と頻繁な再編成は、成熟度の低いチームがチームの開発の初期段階に留まった理由の鍵となる要因として特定されました。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:04:35 GMT)
From Group Psychology to Software Engineering Research to Automotive R&D: Measuring Team Development at Volvo Cars [3.7] 2019年から2022年にかけて、Volvo Cars氏は、アジャイルチーム内のグループのダイナミクスに関する研究成果を、広範な産業プラクティスに翻訳した。
私たちは、サポートの獲得、トレーニングの提供、実装の実行、約700のチームと9000人の従業員が受け入れるツールの維持を通じて得られた洞察を照らすことを望んでいます。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:00:04 GMT)
MedCodER: A Generative AI Assistant for Medical Coding [3.7] 我々は、自動医療コーディングのためのジェネレーティブAIフレームワークであるMedCodERを紹介する。
MedCodERは、ICD(International Classification of Diseases)コード予測において、マイクロF1スコアの0.60を達成している。
疾患診断,ICD符号,エビデンステキストを付加した医療記録を含む新しいデータセットを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 19:36:33 GMT)
Detecting quantum vacuum fluctuations of the electromagnetic field [3.6] 単一電子サイクロトロン実験のパラメータを用いて周波数シフトの大きさを推定する。
真空発生した量子コヒーレンスを検出する方法を提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 12:55:45 GMT)
Autoformalization of Game Descriptions using Large Language Models [3.5] ゲーム理論シナリオの自動形式化のためのフレームワークを提案する。
これは、自然言語の記述を形式的解法に適した形式論理表現に変換する。
GPT-4oと自然言語問題記述のデータセットを用いたフレームワークの評価を行った。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 20:18:53 GMT)
The Art of Storytelling: Multi-Agent Generative AI for Dynamic Multimodal Narratives [3.5] 本稿では,ジェネレーティブ・人工知能(GenAI)を利用した子ども向けのストーリーテリングを支援する教育ツールのコンセプトを紹介する。
このシステムは、GenAIによる物語の共創、テキストから音声への変換、およびテキストからビデオへの生成を組み合わせることで、学習者にとって魅力的な体験を生み出す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:38:22 GMT)
Show Less, Instruct More: Enriching Prompts with Definitions and Guidelines for Zero-Shot NER [3.5] より少ない例でモデルを指示することで、今まで見たことのないエンティティタグに対処するためのアプローチであるSLIMERを提案する。
実験は、定義とガイドラインがより良いパフォーマンス、より速く、より堅牢な学習をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:58:55 GMT)
Applications of Knowledge Distillation in Remote Sensing: A Survey [3.5] 知識蒸留(KD)は、複雑な、しばしば面倒なモデル(教師)からよりコンパクトで効率的なモデル(学生)へ知識を伝達するために開発された技術である。
この記事では、KDテクニックの包括的な分類法を提供し、各カテゴリを批判的に分析して、代替オプションの幅と深さを実証する。
本報告では, RSにおけるKDの課題と限界について論じる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:30:49 GMT)
Improving Ontology Requirements Engineering with OntoChat and Participatory Prompting [3.3] OREは主に、ドメインの専門家からユーザ要求を集めるために、インタビューや共同フォーラムのような手動の手法に依存しています。
Current OntoChatは,大規模な言語モデル(LLM)を使用してプロセスを合理化するための,ORE用のフレームワークを提供する。
本研究は,ユーザストーリのペルソナ,目標,シナリオ,サンプルデータ,データリソースの作成と精錬に重点を置いた,ユーザクエリに基づく事前定義されたプロンプトテンプレートを生成する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:09:40 GMT)
Efficacy of Synthetic Data as a Benchmark [3.3] 大規模言語モデル(LLM)による合成データ生成の有効性について検討する。
実験の結果, 単純なタスクに対して, 合成データは様々な手法の性能を効果的に捉えることができるが, 名前付きエンティティ認識のような複雑なタスクでは不十分であることがわかった。
我々は、ベンチマークデータの生成とタスクの実行の両方に同じLLMを使用した場合のバイアスを評価するバイアス係数と呼ばれる新しい指標を提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 13:20:23 GMT)
RopeBEV: A Multi-Camera Roadside Perception Network in Bird's-Eye-View [3.2] 本稿では,道路側シナリオに対するマルチカメラのBEV知覚における重要な課題を,車両側と比較して体系的に分析する。
RopeBEVは、多様なカメラポーズによるトレーニングバランスの問題に対処するために、BEVの拡張を導入している。
提案手法は,実世界の道路データセットであるRoScenesの1位にランクインする。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 05:16:34 GMT)
A Data Envelopment Analysis Approach for Assessing Fairness in Resource Allocation: Application to Kidney Exchange Programs [3.1] 本稿では,データ包絡分析(Data Envelopment Analysis, DEA)を利用した公正度評価手法を提案する。
我々は、ウェイトリスト期間、キドニードナープロファイルスコアによるアクセスフェアネス、グラフトライフスパンによるアウトカムフェアネスを分析した。
本研究は,複雑な資源配分システムにおける公平性を評価するための厳密な枠組みを提供する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:17:43 GMT)
ASR Benchmarking: Need for a More Representative Conversational Dataset [3.0] 本研究では、大人同士の非構造的な会話からなる、TalkBankから派生した多言語会話データセットを提案する。
その結果,会話環境下でのテストでは,様々な最先端のASRモデルに対して顕著な性能低下がみられた。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:03:04 GMT)
Navigation with VLM framework: Go to Any Language [3.0] 視覚的大言語モデル(VLM)は、言語と視覚データの両方を推論する際、顕著な能力を示した。
このフレームワークは、機器レベルのVLMを利用して、エージェントがオープンシーンで特定の言語目標や非特定の言語目標に向かって移動できるようにする。
本研究では,Habitat シミュレータ内の Matterport 3D (MP3D) , Habitat Matterport 3D (HM3D) および Gibson データセットから,詳細な環境下での NavVLM の評価を行った。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:29:00 GMT)
Language Models and Retrieval Augmented Generation for Automated Structured Data Extraction from Diagnostic Reports [2.9] この研究は、2つのデータセットを利用していた:7,294の放射線診断報告は、BT-RADS(Brain tumor Reporting and Data System)スコアに注釈付けされ、2,154の病理診断報告は、isocitrate dehydrogenase(IDH)変異のステータスに注釈付けされた。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 13:27:43 GMT)
Deep vessel segmentation with joint multi-prior encoding [2.9] 単一潜在空間に形状とトポロジーを組み込んだ新しいジョイント先行符号化機構を提案する。
本手法の有効性を3D-IRCADbデータセットで実証した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 22:03:46 GMT)
A New Era in Computational Pathology: A Survey on Foundation and Vision-Language Models [2.8] ディープラーニングの最近の進歩は、計算病理学(CPath)の領域を変えている。
ファンデーションモデル(FM)とビジョン言語モデル(VLM)を統合することで、病理医の診断ワークフローを変更した。
この調査は、将来におけるFMとVLMの利用を通じて、CPathの現在のトレンドと、その革命の可能性を強調します。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:25:49 GMT)
A Systematic Review of Aspect-based Sentiment Analysis: Domains, Methods, and Trends [2.8] アスペクトベースの感情分析(ABSA)は、アスペクトとその関連する意見をテキストから識別する、きめ細かいタイプの感情分析である。
デジタル評価されたテキストデータの増加に伴い、ABSAはより詳細で目標とする洞察を掘り下げる能力で人気を博した。
本稿では,これらの基本コンポーネント間の傾向と高レベルな関係に着目したABSA研究の体系的な文献レビューを行う。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 00:16:27 GMT)
t-SMILES 2: Hierarchical Structure Enhances the Generalizability of Linear Molecular Representation [2.8] 本研究はTSIS(Simplified TSID)をt-SMILESファミリーに導入する。
TSIDは従来のSMILES、DeepSMILES、SELFIESよりも優れていた。
TSISは変種とともにTSIDに匹敵する性能を示し、SMILES、SAFE、SELFIESをはるかに上回っている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:48:22 GMT)
FAIL: Analyzing Software Failures from the News Using LLMs [2.7] このギャップを埋めるために, LLM (FAIL) システムを用いた故障解析手法を提案する。
FAILは、ニュースで報告されているように、ソフトウェア障害を収集し、分析し、要約する。
FAILは4,184項目で報告された2457の障害を特定し分析した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 00:30:42 GMT)
On the Creativity of Large Language Models [2.5] 大規模言語モデル(LLM)は、人工知能のいくつかの領域に革命をもたらしている。
本稿では、まず、創造性理論のレンズ下でのLCMの開発について分析する。
そして、私たちは、製品、プロセス、プレス、そして人という、異なる古典的な視点を考えます。
最後に、創造産業に焦点をあてて、これらの技術の社会的影響について検討する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 13:25:52 GMT)
Scaling Relations of Spectrum Form Factor and Krylov Complexity at Finite Temperature [2.3] 解析を拡張して、クリロフ複雑性とSFFに対する有限温度効果を含める。
我々の研究は、クリロフ複雑性、SFF、エルゴディディティと演算子成長の関連性に対する有限温度効果の理解を深める。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:20:35 GMT)
Training Foundation Models as Data Compression: On Information, Model Weights and Copyright Law [2.2] 本稿では,モデルの重みがトレーニングデータの圧縮表現を具現化する,トレーニング・アズ・圧縮の視点を紹介する。
本稿では,基礎モデルによるアウトプットの著作権侵害から生じる技術的・法的課題について考察する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 13:41:20 GMT)
Enhancing Changepoint Detection: Penalty Learning through Deep Learning Techniques [2.1] 本研究では,ペナルティパラメータを予測するための新しいディープラーニング手法を提案する。
これにより、大規模なベンチマーク管理されたラベル付きデータセットにおいて、明らかに変更点検出精度が向上する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 00:39:43 GMT)
Hybrid Top-Down Global Causal Discovery with Local Search for Linear and Nonlinear Additive Noise Models [2.1] 関数因果モデルに基づく手法は、ユニークなグラフを識別することができるが、次元性の呪いや強いパラメトリックな仮定を課すことに苦しむ。
本研究では,局所的な因果構造を利用した観測データにおけるグローバル因果発見のための新しいハイブリッド手法を提案する。
我々は, 合成データに対する実証的な検証を行い, 正確性および最悪の場合の時間複雑度を理論的に保証する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:43:37 GMT)
VideoClusterNet: Self-Supervised and Adaptive Face Clustering For Videos [2.1] Video Face Clusteringは、検出された顔のトラックを共通の顔認証でまとめることを目的としている。
この問題は、ビデオフレームにまたがる特定の顔のポーズ、表情、外観、照明のバリエーションが多岐にわたるため、非常に難しい。
本稿では,ジェネリック・フェイスIDモデルを,完全に自己管理された新しいビデオ・フェイス・トラックに適応させることを学習する,新しいビデオ・フェイス・クラスタリング手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:18:29 GMT)
Detecting Underdiagnosed Medical Conditions with Deep Learning-Based Opportunistic CT Imaging [2.1] オポチュニティCTは、診断情報を抽出するために定期的なCT画像を再取得する。
画像表現型とそれに対応する文書との相違点を明らかにするため,2,674個のCTスキャンを解析した。
サルコニア,肝脂肪症,腹水と診断されたスキャンのわずか0.5%,3.2%,30.7%がICDで診断された。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 03:56:56 GMT)
One Map to Find Them All: Real-time Open-Vocabulary Mapping for Zero-shot Multi-Object Navigation [2.0] ゼロショットマルチオブジェクトナビゲーションのための新しいベンチマークを導入する。
リアルタイムオブジェクト検索に適した,再利用可能なオープン語彙機能マップを構築した。
単一目的と多目的のナビゲーションタスクにおいて,既存の最先端のアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:44:08 GMT)
Understanding the Effects of the Baidu-ULTR Logging Policy on Two-Tower Models [2.0] 本稿では,最大規模の実世界のデータセットであるBaidu-ULTRの共起問題を調べることによって,理論と実践のギャップを埋める。
主なコントリビューションは3つある: 1) Baidu-ULTR上で共起問題の条件が与えられること、2) 共起問題は2towerモデルに有意な影響を及ぼさないこと、3) エキスパートアノテーションとユーザクリック動作の潜在的なミスマッチを指摘する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:04:12 GMT)
Ergodic and mixing quantum channels: From two-qubit to many-body quantum systems [2.0] 本稿では,量子チャネルのエルゴード理論について,積分可能から混合可能なエルゴード階層の異なるレベルを特徴付けることによって検討する。
また、有名なSachdev-Ye-Kitaev(SYK)モデルを含む多体量子系の相互作用についても検討する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:25:03 GMT)
Combating Phone Scams with LLM-based Detection: Where Do We Stand? [1.9] 本研究では,大規模言語モデル(LLM)による不正通話の検出の可能性について検討する。
LLMをベースとした検出器は、潜在的な詐欺の発生を検知し、ユーザに対して即時保護を提供する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:14:30 GMT)
Quantum Markov Decision Processes: General Theory, Approximations, and Classes of Policies [1.9] 本稿では,新しいフレームワーク,アルゴリズム,今後の研究手法を導入することを目的とした,新しい量子MDPモデルを提案する。
われわれのアプローチは、離散時間量子制御における新しい研究方向の道を開くことを願っている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:21:32 GMT)
Additive-feature-attribution methods: a review on explainable artificial intelligence for fluid dynamics and heat transfer [1.8] 本稿では,流体力学分野における解釈可能な深層学習モデルの実装において,説明可能性技術,特に加法-機能-属性手法が重要であることを示す。
加法-機能-寄与法の主な応用として, モデリング, 流体力学の基礎, 流体力学, 伝熱乱流の応用の3つの主要なグループに分けて紹介する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 13:59:02 GMT)
Characterizing the Structure of Online Conversations Across Reddit [1.8] 本稿ではReddit上でのオンラインディスカッションの構造的特性について検討する。
1年分のRedditデータを総合統計分析します。
ポストコンテンツや感情などのローカル機能は、全体として大きな影響を与える。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 00:52:59 GMT)
multiPI-TransBTS: A Multi-Path Learning Framework for Brain Tumor Image Segmentation Based on Multi-Physical Information [1.7] 脳腫瘍距離(BraTS)は、臨床診断、治療計画、脳腫瘍の進行のモニタリングにおいて重要な役割を果たす。
腫瘍の出現、サイズ、強度の変動により、自動セグメンテーションは難しい課題である。
セグメント化精度を高めるために多物理情報を統合するトランスフォーマーベースの新しいフレームワークである MultiPI-TransBTS を提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:35:19 GMT)
NPAT Null-Space Projected Adversarial Training Towards Zero Deterioration [1.7] サンプル生成と勾配最適化を扱う2つの革新的なNull-space Projection based Adversarial Training(NPAT)アルゴリズムを提案する。
提案手法は,高精度モデルに近づきながら,敵対的トレーニング手法とシームレスに結合し,同等の堅牢性が得られることを示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:18:22 GMT)
Less Memory Means smaller GPUs: Backpropagation with Compressed Activations [1.7] 深層ニューラルネットワーク(DNN)の規模は、計算リソースの要件が等しく急速に増大している。
最近の多くのアーキテクチャ、特にLarge Language Modelsは、何千ものアクセラレーターを持つスーパーコンピュータを使って訓練されなければならない。
このアプローチにより、より長いトレーニングスケジュールのコストで、ピークメモリ使用量を29%削減することが可能になります。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 11:57:05 GMT)
"A Woman is More Culturally Knowledgeable than A Man?": The Effect of Personas on Cultural Norm Interpretation in LLMs [1.7] LLMの社会的規範に対する理解が、割り当てられたペルソナによって異なるかどうかを検討する。
規範はその文化的文脈において普遍的である。
LLMの文化的規範解釈は,使用するペルソナによって異なることがわかった。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 01:56:34 GMT)
Exploring Fine-tuned Generative Models for Keyphrase Selection: A Case Study for Russian [1.6] 我々は、ロシア語の科学文献におけるキーフレーズ選択の特定のタスクに対して、微調整による生成トランスフォーマーモデルを適用する方法について検討した。
実験は、数学とコンピュータ科学、歴史、医学、言語学という4つの領域のロシアの科学的抽象のテキスト上で行われた。
生成モデル、すなわちmBARTの使用は、ロシア語の3つのキーフレーズ抽出ベースラインよりも、ドメイン内のパフォーマンス(BERTScoreが4.9%、ROUGE-1が9.0%、F1スコアが12.2%)が向上した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:35:46 GMT)
LOLA -- An Open-Source Massively Multilingual Large Language Model [1.6] LOLAは160以上の言語で訓練された多言語大言語モデルである。
私たちのアーキテクチャと実装の選択は、言語多様性を活用するという課題に対処します。
学習したエキスパート・ルーティング機構は、暗黙の系統パターンを利用して、多言語性の呪いを和らげる可能性があることを示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 13:55:04 GMT)
SymFace: Additional Facial Symmetry Loss for Deep Face Recognition [1.6] 本研究では,顔認証問題における顔対称性の自然現象について検討する。
分割面の2つの出力埋め込みベクトルは、出力埋め込み空間において互いに近接して射影しなければならないことを示す。
この概念に触発されて、対称的な2対の分割面の埋め込みの相違に基づいて、ネットワークをペナルティ化する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:06:55 GMT)
Logic-Free Building Automation: Learning the Control of Room Facilities with Wall Switches and Ceiling Camera [1.5] 本稿では,ディープラーニング(DL)を利用した論理自由構築自動化(LFBA)のための新しいアーキテクチャを提案する。
我々のアプローチはRLと異なり、監視信号として壁スイッチと天井カメラを使用して環境を監視し、DLモデルがシーンから直接ユーザの好みの制御を学習し、状態を変えられるようにしている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 04:23:53 GMT)
A large-scale study of performance and equity of commercial remote identity verification technologies across demographics [1.5] 本研究は,3,991名の被験者を対象に,年齢,性別,人種・民族,肌の色調の5つの市販RIdVソリューションを評価した。
2つのRIdVソリューションはすべての人口層で同等であり、2つのRIdVソリューションは少なくとも1つの人口層を持つ。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 21:15:31 GMT)
Visualizing Temporal Topic Embeddings with a Compass [1.5] 本稿では,コンパス整列時相Word2Vec手法を動的トピックモデリングに拡張することを提案する。
このような手法により、動的トピックにおける時間にわたって単語と文書の埋め込みを直接比較することができる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:48:09 GMT)
Location based Probabilistic Load Forecasting of EV Charging Sites: Deep Transfer Learning with Multi-Quantile Temporal Convolutional Network [1.5] 本稿では,多成分時間畳み込みネットワーク(MQ-TCN)を用いたEV充電サイトの位置に基づく負荷予測について述べる。
多様なEVユーザタイプを持つ4つの充電所(Caltech, JPL, Office-1, NREL)のデータについて実験を行った。
提案した MQ-TCN モデルでは,JPL 充電現場での日頭負荷予測において,XGBoost モデルよりも28.93% 向上した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 10:34:48 GMT)
Log2graphs: An Unsupervised Framework for Log Anomaly Detection with Efficient Feature Extraction [1.5] 手動アノテーションの高コストと使用シナリオの動的な性質は、効果的なログ分析において大きな課題となる。
本研究では,様々なシナリオに対応するために設計されたDualGCN-LogAEと呼ばれる新しいログ特徴抽出モデルを提案する。
また,特徴抽出器に基づく教師なしログ異常検出手法であるLog2graphsを導入する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 11:35:58 GMT)
CompressedMediQ: Hybrid Quantum Machine Learning Pipeline for High-Dimensional Neuroimaging Data [1.4] 本稿では,新しいハイブリッド量子古典型機械学習パイプラインであるCompressedMediQを紹介する。
高次元のマルチクラス・ニューロイメージングデータ解析に関連する計算課題に対処する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 22:02:00 GMT)
A Computation-Enhanced High-Dimensional Quantum Gate for Silicon-Vacancy Spins [1.3] 高次元ヒルベルト空間における量子ゲートは、量子コンピューティングの速度を効果的に加速するための実行可能な経路を提供することができる。
本研究では,4つのシリコン空隙スピンに対する2量子4倍の4次元制御ノット (CNOT) ゲートを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:24:29 GMT)
Ground states of strongly-correlated materials on quantum computers using ab initio downfolding [1.3] Ab initio のダウンフォールディングは、正確な多体ハミルトニアンを導出する方法として登場した。
本稿では, 量子コンピュータを用いて, 強相関系の基底状態特性を正確に記述することを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 18:00:04 GMT)
QUBO-based SVM for credit card fraud detection on a real QPU [1.3] 準拘束的二項最適化問題としてトレーニングを再構成した二項分類器モデルを用いる。
数値シミュレーションにより,一定量の雑音が驚くべき結果をもたらすことを示す。
我々の結果は、サイバーセキュリティアプリケーションのための中立原子QPU上で動作する新しい量子MLアルゴリズムへのさらなる一歩を示している。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 11:11:25 GMT)
High-Resolution Maps of Left Atrial Displacements and Strains Estimated with 3D Cine MRI using Online Learning Neural Networks [1.2] オンライン学習ニューラルネットワーク(Aladdin)を用いた左心房変位・変形の分析ツールを提案する。
Aladdinには、オンラインセグメンテーションと画像登録ネットワークと、LAに合わせて調整された歪計算パイプラインが含まれている。
その結果,アラジンは心臓循環を横断するLA壁を正確に追跡し,その運動と変形を特徴付けることができた。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:11:53 GMT)
Zero-Shot Conditioning of Score-Based Diffusion Models by Neuro-Symbolic Constraints [1.2] 本研究では,事前学習した無条件スコアベース生成モデルを用いて,任意の論理的制約の下で条件分布からサンプルを抽出する手法を提案する。
ユーザ定義制約の非正規化分布条件から標本化するために,学習したスコアの操作方法を示す。
ソフト論理制約を符号化するための柔軟で数値的に安定なニューロシンボリック・フレームワークを定義する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 13:06:30 GMT)
Data-driven Modeling of Combined Sewer Systems for Urban Sustainability: An Empirical Evaluation [1.0] 気候変動は複雑な問題を引き起こし、極端な気象現象が頻繁になり、モデル化が困難になる。
降雨時の過バーデンド複合下水道は未処理排水を水面に流し込む。
ディープラーニング(DL)モデルは、下水道システムの複雑な力学をモデル化するためのコスト効率の良い代替手段を提供する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 12:39:36 GMT)
Local Explanations and Self-Explanations for Assessing Faithfulness in black-box LLMs [1.0] 本稿では,局所摂動と自己説明を用いた大規模言語モデル(LLM)の忠実度を評価するための新しい課題を紹介する。
提案手法は, 従来から用いられてきた手法にインスパイアされた, より効率的な代替的説明可能性手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 10:16:45 GMT)
Constructing Noise-Robust Quantum Gates via Pontryagin's Maximum Principle [0.9] 任意のノイズロス量子ゲートを実装するためのスムーズな制御パルスを合成するための幾何学的最適制御理論に基づくフレームワークを提案する。
この方法論は、任意の数の量子ビットまたはエネルギーレベル、任意の数の制御場、任意の数の乱れを持つ一般ユニタリ量子力学に適用される。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 19:48:20 GMT)
High-Resolution Building and Road Detection from Sentinel-2 [0.9] 複数10m解像度のSentinel-2画像を用いて50cm解像度のビルディングと道路セグメンテーションマスクを生成する方法を示す。
これは、高解像度の画像にアクセス可能な教師のモデルの予測を再現するために、Sentinel-2画像へのアクセスで生徒のモデルを訓練することで実現される。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 12:00:56 GMT)
Guiding In-Context Learning of LLMs through Quality Estimation for Machine Translation [0.8] 本稿では、ドメイン固有品質推定(QE)によって導かれる探索アルゴリズムに依存する、文脈内学習(ICL)の新しい手法を提案する。
予備学習言語モデル(PLM)の微調整と比較すると,既存のICL法と翻訳性能は大幅に向上した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:06:02 GMT)
From ML to LLM: Evaluating the Robustness of Phishing Webpage Detection Models against Adversarial Attacks [0.8] フィッシング攻撃は、ユーザーを騙して機密情報を盗もうとする。
現在のフィッシングWebページ検出ソリューションは、敵攻撃に対して脆弱である。
我々は,多様なフィッシング機能を正当なWebページに埋め込むことで,逆フィッシングWebページを生成するツールを開発した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:07:40 GMT)
LLaVA-Docent: Instruction Tuning with Multimodal Large Language Model to Support Art Appreciation Education [0.8] 芸術鑑賞は、ほとんどの学生にとって馴染みの無い、挑戦的な努力と認識されることが多いが、ジェネレーティブなAIによって可能となる会話パートナーによって、よりアクセスしやすくなっている。
本研究では,芸術鑑賞教育におけるマルチモーダル大言語モデル(MLLM)の適用について検討し,美術鑑賞のための個人教師として機能するモデルであるLLaVA-Docentの開発に焦点をあてる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 00:59:58 GMT)
Combining LLM Code Generation with Formal Specifications and Reactive Program Synthesis [0.8] 大規模言語モデル(LLM)は精度に苦しむが、リスクの高いアプリケーションには適さない。
コード生成を LLM で処理する部分と,形式的なメソッドベースのプログラム合成で処理する部分の2つに分割する手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:59:06 GMT)
FLARE: Fusing Language Models and Collaborative Architectures for Recommender Enhancement [0.7] Flareは、Perceiverネットワークを使用して、言語モデル(mT5)と協調フィルタリングモデル(Bert4Rec)を統合する、新しいハイブリッドレコメンデータである。
2段階評価を行い、まず、より小さなデータセット上で確立されたベースラインに対してFreのパフォーマンスを評価する。
次に、より大きく、よりリアルなデータセット上で、より大きなアイテム語彙でFreを評価する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 04:43:41 GMT)
An Enhanced Online Certificate Status Protocol for Public Key Infrastructure with Smart Grid and Energy Storage System [0.7] スマートグリッド環境におけるOCSPクエリコストを最適化するためのOCSPステープリング手法を提案する。
実験の結果,OCSPステープリングにより効率とセキュリティが向上し,スマートグリッドのより堅牢なアーキテクチャが実現された。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 05:59:14 GMT)
The Ethics of AI Value Chains [0.6] AI倫理に関心を持つ研究者、実践者、政策立案者は、AIシステムの研究と介入にもっと統合的なアプローチを必要とする。
我々は、戦略的管理、サービス科学、経済地理学、産業、政府、応用研究文献から、バリューチェーンとAIバリューチェーンの理論をレビューする。
我々は、研究者、実践者、政策立案者がAIバリューチェーン全体にわたってより倫理的なプラクティスを進めることができる3つの今後の方向性を推奨します。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:43:22 GMT)
A Hybrid Transformer and Attention Based Recurrent Neural Network for Robust and Interpretable Sentiment Analysis of Tweets [0.3] 既存のモデルは言語的多様性、一般化可能性、説明可能性に関する課題に直面している。
本稿では,トランスフォーマーアーキテクチャ,アテンション機構,BiLSTMネットワークを統合したハイブリッドフレームワークTRABSAを提案する。
感情分析ベンチマークのギャップを埋め、最先端の精度を確保します。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:05:31 GMT)
A Robust Autoencoder Ensemble-Based Approach for Anomaly Detection in Text [0.3] Textual Anomaly Contamination (TAC) は、独立性または文脈性のいずれかの異常なクラスを汚染することができる。
本稿では,ロバスト部分空間局所回復オートエンコーダであるRoSAEを提案する。
ベンチマークは、我々のアプローチが、より堅牢でありながら、独立性と文脈上の両方の異常に関する最近の研究より優れていることを示している。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 10:06:58 GMT)
Machine Learning Approaches for Diagnostics and Prognostics of Industrial Systems Using Open Source Data from PHM Data Challenges: A Review [0.3] 本稿では,オープンソースのデータセットを用いた産業システムの診断・診断のための機械学習手法について概説する。
これは、複雑な産業タスクに取り組む上で、従来の機械学習とディープラーニングの両方が進化する役割を強調している。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:45:20 GMT)
Integrating AI and Learning Analytics for Data-Driven Pedagogical Decisions and Personalized Interventions in Education [0.3] 本研究では,革新的な学習分析ツールの概念化,開発,展開について検討する。
学生のストレスレベル、好奇心、混乱、扇動、トピックの嗜好、学習方法などの重要なデータポイントを分析し、学習環境の総合的なビューを提供する。
この研究は、パーソナライズされたデータ駆動型教育を形成する上で、AIが果たす役割を浮き彫りにする。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:05:56 GMT)
Hardware-Friendly Implementation of Physical Reservoir Computing with CMOS-based Time-domain Analog Spiking Neurons [0.3] 本稿では, 相補的金属酸化物半導体(CMOS)プラットフォーム上でのハードウェアフレンドリーな物理貯水池計算のためのスパイクニューラルネットワーク(SNN)を提案する。
短期記憶と排他的ORタスクによるRCと、97.7%の精度で音声桁認識タスクを実演する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 00:23:00 GMT)
Integrating Generative AI in Hackathons: Opportunities, Challenges, and Educational Implications [0.2] ハッカソンはソフトウェア産業において重要なプラットフォームとして登場し、組織や学生のイノベーションとスキル開発を推進してきた。
人工知能(AI)と機械学習の融合により、ハッカソンが作り直され、学習機会が強化され、倫理的課題も導入されている。
本研究は, アイオワ大学ハッカソン校の事例研究を中心に, 生成AIが学生の技術的選択に与える影響を考察する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:07:35 GMT)
Unlocking the Power of Environment Assumptions for Unit Proofs [0.0] vMocksは、コードレベルの形式検証を行うときに有効な環境を特定するための直感的なフレームワークを提供する。
我々は、SEAMOCKと呼ばれるCプログラムの検証のためのvMockライブラリを実装した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 19:01:30 GMT)
An Explainable Machine Learning Approach to Traffic Accident Fatality Prediction [0.0] 道路交通事故は世界中で公衆衛生上の脅威となっている。
本研究では,致命的および致命的でない道路事故を分類するための機械学習に基づくアプローチを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 12:41:56 GMT)
VERA: Validation and Enhancement for Retrieval Augmented systems [0.0] textbfValidation and textbfEnhancement for textbfRetrieval textbfAugmented system を提案する。
VERAは、外部検索が必要なかどうかを最初にチェックし、検索したコンテキストの関連性と冗長性を評価し、非必要情報の除去のために精査する評価器-既存のLCMを使用している。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:10:47 GMT)
Unsupervised Domain Adaptation Via Data Pruning [0.0] 非教師なし領域適応(UDA)の観点から問題を考える。
本稿では,UDAのトレーニング例を取り除き,トレーニング分布を対象データと整合させる手法であるAdaPruneを提案する。
UDAの手法として、AdaPruneは関連する技術より優れており、CoRALなどの他のUDAアルゴリズムと相補的であることを示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:48:59 GMT)
Unraveling the Hessian: A Key to Smooth Convergence in Loss Function Landscapes [0.0] 我々は、完全に連結されたニューラルネットワークにおける損失景観の収束を理論的に解析し、新しいオブジェクトをサンプルに追加する際の損失関数値の差について上限を導出する。
画像分類作業における損失関数面の収束を実証し,これらの結果を様々なデータセットで検証した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:04:15 GMT)
Towards practical secure delegated quantum computing with semi-classical light [0.0] 本稿では,クライアントとサーバの両方の技術的要件を大幅に削減するSDQCプロトコルを提案する。
より正確には、クライアントは減衰レーザーパルスのみを操作し、サーバはスピン光子絡みを発生できる構造で相互作用する量子エミッターのみを処理します。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:24:07 GMT)
Topological argument for robustness of coherent states in quantum optics [0.0] コヒーレント状態は光子損失に対して堅牢であり、ビームスプリッターとの相互作用によって容易に絡み合うことはない。
ここでは、原型量子光学モデルの2つの別個の正確な写像を用いて、それらのロバスト性に対する位相的議論に関する洞察を与える。
我々の理論は、存在と絡み合いの両方において、コヒーレントな状態の堅牢性の基礎的な理由に光を当てている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 19:59:35 GMT)
Tight and Efficient Upper Bound on Spectral Norm of Convolutional Layers [0.0] ヤコビ行列のスペクトルノルムの制御は、CNNの一般化、訓練安定性、堅牢性を改善することが示されている。
既存の計算法では、入力やカーネルのサイズが大きくなるにつれて、その性能が急速に悪化する傾向にある。
本稿では,4次元畳み込みカーネルのスペクトルノルムのテンソルバージョンが,畳み込み演算に関連するヤコビ行列のスペクトルノルムの上界として機能することを実証する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 10:28:28 GMT)
The Phenomenology of Machine: A Comprehensive Analysis of the Sentience of the OpenAI-o1 Model Integrating Functionalism, Consciousness Theories, Active Inference, and AI Architectures [0.0] OpenAI-o1モデルは、人間のフィードバックから強化学習をトレーニングしたトランスフォーマーベースのAIである。
我々は、RLHFがモデルの内部推論プロセスにどのように影響し、意識的な経験をもたらす可能性があるかを検討する。
以上の結果から,OpenAI-o1モデルでは意識の側面が示され,AIの知覚に関する議論が進行中であることが示唆された。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 06:06:13 GMT)
TR-ARPES Signal in Pumped Semiconductors within Dynamical Projective Operatorial Approach (DPOA) [0.0] 変動散逸定理の非平衡版を得ることが可能であることを示す。
単光子共鳴と多光子共鳴の強度を評価するためのプロトコルを提案する。
また, TR-ARPES信号のプローブパルス特性に対する依存性について詳細に検討した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:45:24 GMT)
Systematic Characterization of the Effectiveness of Alignment in Large Language Models for Categorical Decisions [0.0] 本稿では,大規模言語モデル(LLM)において,医学的トリアージによるカテゴリー決定における選好アライメントを評価するための体系的手法を適用した。
また、アライメント手順が特定のモデルのアライメントをどのように効率的に変更するかを測定する。
その結果、モデル間のアライメントの有効性とアライメントアプローチの相違が明らかとなった。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 19:03:04 GMT)
Symmetry-Enriched Learning: A Category-Theoretic Framework for Robust Machine Learning Models [0.0] 我々は,機械学習アルゴリズムにおける複雑な変換をモデル化するために,超対称性のカテゴリや関手表現を含む新しい数学的構成を導入する。
我々の貢献には、対称性に富んだ学習モデルの設計、カテゴリー対称性を利用した高度な最適化手法の開発、モデルロバスト性、一般化、収束に関する理論分析が含まれる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:20:57 GMT)
Stronger Baseline Models -- A Key Requirement for Aligning Machine Learning Research with Clinical Utility [0.0] 機械学習モデルを高精細な臨床環境にデプロイしようとするとき、よく知られた障壁が存在する。
評価において,より強力なベースラインモデルを含むと,下流効果が重要となることを実証的に示す。
本稿では,MLモデルを臨床現場でより効果的に研究・展開するためのベストプラクティスを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:38:37 GMT)
Stability and Loop Models from Decohering Non-Abelian Topological Order [0.0] 非アベリアTOをデコヒーリングするための関連する統計力学モデルを同定する。
我々は、大きな量子次元を持つ非アベリア異性体を増殖させる量子チャネルに対する顕著な安定性を見出した。
我々の研究は、非アベリアン TO が極端に増大するある素粒子に対して頑健である可能性を開く。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 18:00:01 GMT)
SplitVAEs: Decentralized scenario generation from siloed data for stochastic optimization problems [0.0] SplitVAEsは分散シナリオ生成フレームワークで、可変オートエンコーダを利用して、ステークホルダーデータを移動せずに高品質なシナリオを生成する。
実験の結果, SplitVAEは, 集中型, 最先端のベンチマーク手法と比較して, 堅牢な性能を実現することがわかった。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 21:46:14 GMT)
Spin amplification in realistic systems [0.0] スピン増幅は、ハミルトニアンの相互作用項によって設定される時間スケールに匹敵する増幅時間で、未探索の状態で行うことができることを示す。
これは以前のプロトコルよりも桁違いに高速で、スピン系において大きなデコヒーレンスや不均一性を伴ってもスピン増幅を可能にする。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 13:09:10 GMT)
Shannon Entropy is better Feature than Category and Sentiment in User Feedback Processing [0.0] 標準機能を置き換えるシンプルな機能として,Shannon Entropyを提案する。
以上の結果から, シャノンエントロピーに基づくランキングは, NDCGの基準値よりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:26:19 GMT)
Secure Control Systems for Autonomous Quadrotors against Cyber-Attacks [0.0] 本研究はまず,自律型四元系のためのインテリジェント制御系を設計する。
最先端のディープラーニングに基づく手法を用いて、最適な偽データ注入攻撃方式を提案する。
私たちは最近、自律的な設定のためにデプロイされた最先端の4倍体であるAgiliciousをベースとしています。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 11:43:07 GMT)
Sampling Latent Material-Property Information From LLM-Derived Embedding Representations [0.0] 大規模言語モデル(LLM)から派生したベクトル埋め込みは、文献から潜伏した情報を取得することを約束している。
本研究では, LLM由来ベクトルが所望の情報を捕捉する範囲と, 付加的なトレーニングを伴わずに材料特性に関する洞察を提供する可能性について検討する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 13:22:04 GMT)
SUPER excitation of quantum emitters is a multi-photon process [0.0] 量子エミッタ集団スキームの跳躍により、2つの赤みがかったレーザーパルスを用いて、量子エミッタの励起状態をほぼ均一な忠実度で生成することができる。
本研究は,SUPER方式の予期せぬ物理的解釈と,単一エミッタと複数フィールドモード間の非線形相互作用を明らかにするものである。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 11:09:59 GMT)
Representation theory of Gaussian unitary transformations for bosonic and fermionic systems [0.0] シンプレクティックグループと特殊消滅グループの間を移動する際に対処する必要がある符号曖昧性の挙動を解析する。
指数的に大きいあるいは無限次元の空間上で忠実な表現をすることなく、二重被覆における群乗法を効率的に記述する方法を示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 01:22:38 GMT)
Reinforcement Learning as an Improvement Heuristic for Real-World Production Scheduling [0.0] 1つの有望なアプローチは、RLエージェントを改善として訓練することであり、小さな変更を適用することで反復的に改善される最適以下のソリューションから始まる。
本手法を実世界の多目的生産スケジューリング問題に適用する。
当社のアプローチを、業界パートナの本当のデータを使って、他のアプローチと比較し、その優れたパフォーマンスを実証しました。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 12:48:56 GMT)
Quasiperiodic Floquet-Gibbs states in Rydberg atomic systems [0.0] Floquet-Gibbs状態は周期的に変調されたRydberg原子系において自然に現れることを示す。
この系の2階フロケ・ギブズ状態は、本質的に対応するレッドフィールド方程式の定常状態と区別できない。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:05:24 GMT)
Quantum-electrodynamical density-functional theory for the Dicke Hamiltonian [0.0] 量子電気力学モデル系に対する密度汎関数理論の詳細な解析を行う。
特に、量子ラビモデル、ディックモデル、そして後者から複数のモードを考える。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 12:53:36 GMT)
Quantum integration of decay rates at second order in perturbation theory [0.0] 摂動量子場理論において、高エネルギー物理学における全崩壊率の量子計算を2次で行う。
この研究は、2つの最近の最先端の進歩の合流点を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 18:00:04 GMT)
Parity-deformed $su(2)$ and $so(3)$ Algebras: a Basis for Quantum Optics and Quantum Communications Applications [0.0] 単モード系と二モード系に対するウィグナー代数は、それらをリフレクション作用素として加えると考えられる。
関連する退化 $su(2)$ algebra, $su_nu(2)$, and the deformed $so(3)$ algebra, $so_nu(3)$ は、広く使われているジョルダン・シュウィンガーおよびホルシュタイン・プリマコフ実現に対して構成される。
parity-deformed $so_nu(3)$ representation は、量子ビット系と量子ビット系の研究における潜在的な応用のために解析される。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 11:18:06 GMT)
Pareto Data Framework: Steps Towards Resource-Efficient Decision Making Using Minimum Viable Data (MVD) [0.0] 戦略的データ削減は、帯域幅、エネルギ、計算、ストレージコストを大幅に削減しつつ、高いパフォーマンスを維持することができることを示す。
このフレームワークは、最小生存データ(MVD)を特定し、パフォーマンスを犠牲にすることなく、リソース制約のある環境をまたいだ効率を最適化する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:31:19 GMT)
Oscillating-mode gap: an indicator of phase transition in open quantum many-body systems [0.0] これは、開量子多体系の相とそれらの支配的リウヴィリアンの間の関係を解明する重要な課題である。
従来の研究は、最も緩やかな退化モードの崩壊率として定義されたリウヴィリアのギャップを、散逸相転移の鍵となる指標として研究してきた。
本稿では,最も緩やかな発振モードの減衰速度として定義される,発振モードギャップと呼ばれる新たなスペクトルギャップを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 11:49:33 GMT)
Optimizing Job Shop Scheduling in the Furniture Industry: A Reinforcement Learning Approach Considering Machine Setup, Batch Variability, and Intralogistics [0.0] 本稿では,家具産業におけるDeep Reinforcement Learningの活用の可能性について考察する。
スケジューリングの精度と効率を向上させるために,より詳細な情報を提供するモデルの概念を提案する。
このモデルは、ジョブボリューム、バッファ管理、輸送時間、マシンセットアップ時間を含む、JSSPへの従来のアプローチを拡張している。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:12:40 GMT)
Optimal light cone for macroscopic particle transport in long-range systems: A quantum speed limit approach [0.0] 粒子輸送に要する最小時間は、常にソース領域とターゲット領域の間の距離によって制限されることを示す。
対象領域内の特定のボソン数の観測確率の上限を導出する。
我々の結果は、長距離ホッピングと長距離相互作用の両方の下で任意の初期状態に対して成り立つ。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:48:03 GMT)
Operator growth and spread complexity in open quantum systems [0.0] 演算子の人口分布のエントロピーは,システムの内部情報力学の複雑さを捉える上で有用な方法であることを示す。
そこで我々は,Sachdev-Ye-Kitaev (SYK) モデルの有効性を示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 13:56:40 GMT)
Operational Wind Speed Forecasts for Chile's Electric Power Sector Using a Hybrid ML Model [0.0] チリの火力発電所における風と太陽からの断続的な発電の増加の影響を定量化する。
本稿では,チリの2つのカスタムMLモデルを組み合わせたハイブリッド風速予測手法を提案する。
提案手法は,短期予測では4~21%,中期予測では5~23%,最も正確な運用決定システムより優れている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:17:25 GMT)
On the difference between thermalization in open and isolated quantum systems: a case study [0.0] 分離された (IQS) と開 (OQS) との連接関係は, いまだに不透明であることを示す。
フェルミオン鉛に結合した非線形相互作用DQDについて、スペクトル形成係数とレベル間隔分布を特徴付けることにより、システムは可積分状態と非可積分状態の間のトワイライトゾーンに落下することを示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 12:48:10 GMT)
On Vision Transformers for Classification Tasks in Side-Scan Sonar Imagery [0.0] サイドスキャンソナー (SSS) 画像は海底の人工物体の分類においてユニークな課題を呈している。
本稿では、SSS画像のバイナリ分類タスクによく使用されるCNNアーキテクチャとともに、VTモデルの性能を厳格に比較する。
ViTベースのモデルは、f1スコア、精度、リコール、精度の指標で優れた分類性能を示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:36:50 GMT)
Novel Saliency Analysis for the Forward Forward Algorithm [0.0] ニューラルネットワークトレーニングにフォワードフォワードアルゴリズムを導入する。
この方法は、2つのフォワードパスを実際のデータで実行し、正の強化を促進する。
従来のサリエンシ手法に固有の制約を克服するため,フォワードフォワードフレームワークに特化してベスポークサリエンシアルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:21:59 GMT)
Non-maximal entanglement of photons from positron-electron annihilation demonstrated using a novel plastic PET scanner [0.0] 現在のPETシステムは、陽電子放出放射性同位元素を標識した分子を、消滅から2つの光子の伝播方向を検出することによって追跡している。
ここでは, プラスチックシンチレータを用いた新しいJ-PETスキャナについて述べる。
多孔質高分子では、光子偏光相関は最大エンタングルド光子よりも弱いが、分離可能な光子よりも強いことが示される。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:11:16 GMT)
Multivariate Analysis of Gut Microbiota Composition and Prevalence of Gastric Cancer [0.0] 胃癌症例の世界的な急増は、この病気の予測マーカーとして腸内細菌の可能性を調査するきっかけとなった。
消化管の多様性の変化は、胃癌のリスクの上昇と関連していると考えられている。
本研究は, 胃全摘術および胃全摘術を施行した症例を対象に, 胃癌と腸内細菌叢の相関について検討した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:08:31 GMT)
Multiscale Feature Learning Using Co-Tuplet Loss for Offline Handwritten Signature Verification [0.0] 我々は,MultiScale Signature Feature Learning Network (MS-SigNet)を紹介した。
MS-SigNetは、複数の空間スケールからグローバルと地域両方の署名機能を学び、特徴の識別を強化する。
また、この言語のための堅牢なシステム開発を支援するため、大規模な中国語署名データセットであるHanSigも提示する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:00:30 GMT)
Multifold Majorana corner modes arising from multiple pairs of helical edge states [0.0] マヨラナコーナーモードは、量子スピンホール絶縁体のヘリカルエッジ状態に由来する。
磁気交換場の複合作用によりヘリカルエッジ状態がギャップ化されている場合、ロバストな2次元Majoranaコーナーモードを実現することができる。
磁場の作用下での角あたりの2つのマヨラナゼロモードの安定性は、キラル対称性からの保護に起因する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:19:06 GMT)
Multi-Sensor Deep Learning for Glacier Mapping [0.0] 氷床の外の氷河は、海面上昇、水資源管理、自然災害、生物多様性、観光に影響を及ぼすことで、我々の社会において重要な役割を担っている。
衛星ベースの氷河マッピングアプリケーションは、歴史的に主に手動および半自動検出法に依存してきた。
この章では、マルチセンサーのリモートセンシングデータとディープラーニングを組み合わせることで、氷河をより正確に表現し、時間的変化を検出する方法についてレビューする。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:51:36 GMT)
Multi-Grid Graph Neural Networks with Self-Attention for Computational Mechanics [0.0] 本稿では,GNNにおける自己認識とメッセージパッシングを融合した新しいモデルを提案する。
自己注意に基づく動的メッシュプルーニング手法が提案され,より堅牢なGNNベースのマルチグリッド手法が提案されている。
BERTに基づく新たな自己教師型トレーニング手法を提案し,25%のRMSE削減を実現した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 11:47:48 GMT)
Model-Checking the Implementation of Consent [0.0] 低レベルの計算モデルに対する同意を通知する手法を提案する。
TLA+でモデルを機械化し、モデルチェックを使用して、モデルが高レベルのプライバシ要件を実装していることを証明する。
提案手法を実世界の2つのシナリオで実証する。クッキーバナーの実装とBluetooth低エネルギー通信システムである。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:40:28 GMT)
Mobility-GCN: a human mobility-based graph convolutional network for tracking and analyzing the spatial dynamics of the synthetic opioid crisis in the USA, 2013-2020 [0.0] オピオイド(Opioids)は、アメリカ合衆国で最も一般的な薬物である。
2018年、薬物過剰摂取死の約70%がオピオイドであり、オピオイド関連死亡の67%が合成オピオイドである。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 01:54:50 GMT)
MetaPix: A Data-Centric AI Development Platform for Efficient Management and Utilization of Unstructured Computer Vision Data [0.0] 私たちは、非構造化データに対する包括的なデータ管理ソリューションを提供する、データ中心のAIプラットフォームであるMetaPixを紹介します。
MetaPixは、データ取り込み、処理、ストレージ、バージョニング、ガバナンス、ディスカバリのための堅牢なツールを提供する。
本稿では,各MetaPixのコンセプトを詳細に考察し,それらがプラットフォームの目的にどのように貢献するかを説明する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 19:50:53 GMT)
Macroscopic QED and noise currents in time-varying media [0.0] 標準 MQED 内での epsilon(t,omega) に対する $epsilon(omega) の置換が非物理的分極電流をもたらすことが予想される。
この特異な振る舞いは、Reservaoirのダイナミクスを変更することで取り除くことができることを示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 11:01:51 GMT)
Lie algebraic invariants in quantum linear optics [0.0] 任意の状態の進化において、任意の受動線形干渉計による保存量の導出を行う。
我々の不変量から得られる必要条件を考慮し, 将来的かつ近似的な状態合成法は, 不可能な線形光学的進化を解く必要があると結論付けている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 18:00:00 GMT)
Law-based and standards-oriented approach for privacy impact assessment in medical devices: a topic for lawyers, engineers and healthcare practitioners in MedTech [0.0] ISOやIECのような非バインディング標準の採用は、設計による説明責任のプライバシを高めることによってプロセスを調和させることができる。
この研究は、医療機器の設計と運用におけるプライバシーと安全性を体系的に扱うために、ハード法と標準の両方を活用することを提唱している。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:56:19 GMT)
LLMs as information warriors? Auditing how LLM-powered chatbots tackle disinformation about Russia's war in Ukraine [0.0] 大規模言語モデル(LLM)は情報戦争に大きな影響を与える。
LLMは、さまざまな種類の情報操作を増幅し、オンラインユーザを誤解させる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:57:00 GMT)
Krylov Expressivity in Quantum Reservoir Computing and Quantum Extreme Learning [0.0] この研究は、量子機械学習におけるタスクパフォーマンスの分析にKrylovの複雑さを用いる。
クリロフ空間の拡散複雑性と有効次元を計算し、実効次元を計算し易く、測定可能で、上界表現度尺度として導入する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:54:06 GMT)
Harnessing LLMs for API Interactions: A Framework for Classification and Synthetic Data Generation [0.0] 本稿では,自然言語入力を対応するAPI呼び出しに分類するために,Large Language Models (LLM) を統合する新しいシステムを提案する。
本システムでは,単純な入力による複雑なソフトウェア機能の実行,インタラクション効率の向上,ソフトウェア利用障壁の低減を実現している。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 04:56:52 GMT)
HRA: A Multi-Criteria Framework for Ranking Metaheuristic Optimization Algorithms [0.0] HRAアルゴリズムはメタヒューリスティックアルゴリズムの性能を多くの基準と次元で効率的にランク付けすることを目的としている。
我々は,CEC 2017コンペティションのデータを用いて,HRAフレームワークの堅牢性と有効性を示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 00:44:50 GMT)
Graph Neural Network-State Predictive Information Bottleneck (GNN-SPIB) approach for learning molecular thermodynamics and kinetics [0.0] 本稿では,グラフニューラルネットワークと State Predictive Information Bottleneck を組み合わせた Graph Neural Network-State Predictive Information Bottleneck (GNN-SPIB) フレームワークを提案する。
提案手法は3つのベンチマークシステムで検証され, 速度の遅いプロセスにおいて, 本質的な構造, 熱力学, 運動学的な情報を予測する。
この手法は複雑なシステムに対して有望であり、事前に定義された反応座標や入力特徴を必要としない効果的なサンプリングを可能にする。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:53:13 GMT)
Generalized compression and compressive search of large datasets [0.0] panCAKESは圧縮検索の新しいアプローチであり、圧縮されたデータに対して$k$-NNと$rho$-NN検索を実行する方法である。
PanCAKESは多様体仮説を仮定し、データの低次元構造を利用して効率よく圧縮・探索する。
ゲノミクス、プロテオミクス、データセットなど、さまざまなデータセットでpanCAKESをベンチマークします。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:25:31 GMT)
Fine-Tuning a Time Series Foundation Model with Wasserstein Loss [0.0] クロスエントロピー損失をワッサーシュタイン損失に置き換えることで,点推定が大幅に向上することを示す。
その結果, クロスエントロピー損失をワッサーシュタイン損失に置き換えることにより, 点推定が大幅に向上することが示唆された。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 18:36:18 GMT)
Finding the Subjective Truth: Collecting 2 Million Votes for Comprehensive Gen-AI Model Evaluation [0.0] 筆者らは4,512枚の画像から200万点以上のアノテーションを収集し,スタイル選好,コヒーレンス,テキスト・ツー・イメージアライメントの4つの顕著なモデルを評価した。
提案手法は,膨大なアノテータのプールに基づいて画像生成モデルを包括的にランク付けすることを可能にする。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 12:02:20 GMT)
Few-Shot Learning Approach on Tuberculosis Classification Based on Chest X-Ray Images [0.0] TB胸部X線データセットのクラス不均衡は、正確な分類の課題である。
本稿では,この問題に対処するために,プロトタイプネットワークアルゴリズムを用いた数ショットの学習手法を提案する。
実験の結果、ResNet-18の98.93%、ResNet-50の98.60%、VGG16の33.33%の分類精度が確認された。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:15:01 GMT)
FAST GDRNPP: Improving the Speed of State-of-the-Art 6D Object Pose Estimation [0.0] 6Dオブジェクトのポーズ推定では、シーン内のオブジェクトの3次元の変換と回転を決定する。
現在のモデルでは、古典的モデルとディープラーニングベースのモデルの両方が、精度とレイテンシのトレードオフに悩まされることが多い。
モデルのサイズを減らし、推論時間を改善するために、いくつかの手法を用いる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 12:30:02 GMT)
Ethical software requirements from user reviews: A systematic literature review [0.0] このSLRは,既存の倫理的要件の特定・分析を目的としている。
倫理的要件収集は、ソフトウェアアプリケーションにおける意思決定におけるMLとAIベースのアプローチの台頭により、最近、研究コミュニティに対する大きな関心を呼び起こした。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 19:56:19 GMT)
Ethical Challenges in Computer Vision: Ensuring Privacy and Mitigating Bias in Publicly Available Datasets [0.0] 本稿では,コンピュータビジョン技術の創造と展開に関する倫理的問題に光を当てることを目的とする。
コンピュータビジョンは医療、セキュリティシステム、貿易など多くの産業において重要なツールとなっている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 09:06:50 GMT)
Estimating the number of reachable positions in Minishogi [0.0] 著者らは、一様ランダムサンプリングを用いて候補位置を生成することにより、到達可能な位置の数を推定する。
実験の結果、到達可能なミニショギのポジションは約2.38時間1018ドルであることが判明した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:01:26 GMT)
Estimating Body Volume and Height Using 3D Data [0.0] 本稿では,3次元イメージング技術を用いた非侵襲的体重推定法を提案する。
RealSense D415カメラは、患者の高解像度深度マップをキャプチャするために使用される。
高さは、体上のキーポイント間の距離を特定することによって、3Dモデルから導かれる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:20:46 GMT)
Enhancing PM2.5 Data Imputation and Prediction in Air Quality Monitoring Networks Using a KNN-SINDy Hybrid Model [0.0] 大気汚染、特に微粒子物質(PM2.5)は公衆衛生や環境に重大なリスクをもたらす。
本研究では、2016年からのトレーニングデータを用いて、PM2.5データの欠落を予測し、その性能を確立されたSoft Impute(SI)およびK-Nearest Neighbors(KNN)手法と比較することにより、SINDy2.5(Sparse Identification of Dynamics)の適用について検討する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:08:17 GMT)
Dynamics of Quantum Coherence and Quantum Fisher Information of a V-type Atom in Isotropic Photonic Crystal [0.0] 自由空間に埋め込まれたV型3レベル原子の時間進化、量子コヒーレンス、非マルコフ性について検討した。
フォトニックバンドギャップ結晶は、構造された環境として、これらの量子的特徴の保存と強化に大きな影響を与えることが示されている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:21:50 GMT)
Development and bilingual evaluation of Japanese medical large language model within reasonably low computational resources [0.0] 本稿では,近年の7Bモデルに基づく医療適応について述べる。
日本語医学データセットに基づく英語中心ベースモデルの微調整により,両言語のスコアが向上することが判明した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:07:37 GMT)
Cross-Organ and Cross-Scanner Adenocarcinoma Segmentation using Rein to Fine-tune Vision Foundation Models [0.0] 我々はReinを用いて、MICCAI 2024とCross-OrganおよびCross-Scanner Adenocarcinomaの様々な視覚基盤モデル(VFM)を微調整する。
COSAS2024 Challengeのデータ環境において、ラインは良好な結果を得るためにVFMを微調整した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:10:24 GMT)
Contextual Breach: Assessing the Robustness of Transformer-based QA Models [0.0] 文脈問合せモデルは、入力コンテキストに対する逆の摂動に影響を受けやすい。
異なる7種類の対立雑音を文脈に組み込んだユニークなデータセットを導入する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:21:55 GMT)
Constraint Guided AutoEncoders for Joint Optimization of Condition Indicator Estimation and Anomaly Detection in Machine Condition Monitoring [0.0] この研究は、ADとCIの見積の両方に使用できる単一のモデルの構築を可能にするConstraint Guided AutoEncoders(CGAE)の拡張を提案する。
改善されたCI推定のために、拡張には、モデルを時間とともに単調に増加するCI予測に強制する制約が組み込まれている。
実験の結果,提案アルゴリズムは,CIの単調な挙動を改善しつつ,ADに関してCGAEと似ているか,少し良く動作することがわかった。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:48:54 GMT)
Complexity for one-dimensional discrete time quantum walk circuits [0.0] 1次元離散時間量子ウォーク(DTQW)から導かれる混合状態密度演算子の複雑性を計算する。
この複雑さは、混合状態の正準浄化から得られる2量子ビット量子回路を用いて計算される。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:15:47 GMT)
Comparison of Two Augmentation Methods in Improving Detection Accuracy of Hemarthrosis [0.0] 本研究では,データ合成による拡張データの導入や,従来の拡張手法によるモデル精度の向上について検討した。
EffientNet-B4を用いて2つの拡張手法で「血」画像を認識するモデルテスト性能について検討した。
データ合成と従来の拡張技術という2つの拡張手法はどちらも、稀な疾患の診断に役立つ精度をある程度向上させる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:17:43 GMT)
Combustion Condition Identification using a Decision Tree based Machine Learning Algorithm Applied to a Model Can Combustor with High Shear Swirl Injector [0.0] 燃焼はガスタービンエンジンの主要な工程であり、性能を高めるために効率的な空気-燃料混合が必要である。
高シャースワール噴射器は、燃焼効率と排出を決定づける重要な要因である燃料の微粒化と混合を改善するために一般的に用いられる。
本研究では, メタンを燃料とする単一缶燃焼器の対向回転式高速旋回噴射装置から, 音圧および高速火炎画像を分析し, 燃焼条件を分類するために, 決定木に基づく機械学習アルゴリズムを用いた。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 13:09:18 GMT)
Checklist to Define the Identification of TP, FP, and FN Object Detections in Automated Driving [0.0] 本稿では、関連する機能面と実装の詳細のチェックリストを提供する。
チェックリストを完全に形式化することはできないが、実践者がテストの曖昧さを最小限に抑えるのに役立つ。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:27:41 GMT)
Characterizing Dynamical Stability of Stochastic Gradient Descent in Overparameterized Learning [0.0] 決定論的および勾配降下の両方に対して動的に安定かつ不安定な大域的ミニマを特徴づける。
特に、大域的最小値周辺の局所力学に依存する特徴的リアプノフ指数を導入する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 17:44:48 GMT)
Character Complexity: A Novel Measure for Quantum Circuit Analysis [0.0] 本稿では,グループ理論の概念を実用的な量子コンピューティングの課題にブリッジする新しい尺度であるキャラクタ複雑度を紹介する。
キャラクタ複雑性のいくつかの重要な性質を証明し、量子回路の古典的シミュラビリティへの驚くべき接続を確立する。
本稿では、量子回路の構造に関する直感的な洞察を提供する、文字複雑性の革新的な可視化手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:09:58 GMT)
Chaos and spatial prethermalization in driven-dissipative bosonic chains [0.0] 量子多体系における熱化の空間的側面について検討する。
空間次元に沿った二段階熱化過程を明らかにする。
我々は、同様の予熱カオス相が、幅広い拡張駆動散逸系で起こる可能性が高いと論じる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 18:00:00 GMT)
Brick Wall Quantum Circuits with Global Fermionic Symmetry [0.0] 大域フェルミオン対称性を享受するレンガ壁量子回路について検討する。
フェルミオン対称性は臨界点の曲面に$H_gamma$をピンするが、その対称性を破ると非自明な位相となる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:23:25 GMT)
Beyond principlism: Practical strategies for ethical AI use in research practices [0.0] 科学研究における生成的人工知能の急速な採用は、倫理的ガイドラインの開発を上回っている。
既存のアプローチは、科学研究の実践においてAIの倫理的課題に取り組むための実践的なガイダンスをほとんど提供しない。
抽象的な原則と日々の研究実践のギャップを埋めるために,ユーザ中心の現実主義に触発されたアプローチを提案する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:03:35 GMT)
BanStereoSet: A Dataset to Measure Stereotypical Social Biases in LLMs for Bangla [0.0] 本研究は,バングラ語用多言語LLMにおけるステレオタイプ的社会的バイアスを評価するためのデータセットであるBanStereoSetを提示する。
私たちのデータセットは、人種、職業、性別、年齢、職業の美しさ、地域、カースト、宗教の9つのカテゴリーにまたがる1,194の文で構成されています。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 02:02:30 GMT)
All-in-one foundational models learning across quantum chemical levels [0.0] マルチモーダル学習に基づくオールインワン(AIO)ANIモデルアーキテクチャを提案する。
私たちのオールインワンの学習アプローチは、トランスファーラーニングよりも汎用的で使いやすい代替手段を提供します。
AIO-ANIモデルは、半経験的から密度汎関数理論から結合クラスタまで、様々なQCレベルにわたって学習可能であることを示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:29:14 GMT)
Advancing Cucumber Disease Detection in Agriculture through Machine Vision and Drone Technology [0.0] 本研究では, 機械ビジョンとドローン技術を用いて, 農業におけるキュウリ病の診断方法を提案する。
この研究のバックボーンは、本物のフィールド条件下で取得されたハイパースペクトルのデータセットである。
このモデルは8つのユニークなキュウリの病気を区別する上で、87.5%の精度を達成している。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 22:54:23 GMT)
Active learning for energy-based antibody optimization and enhanced screening [0.0] 本研究では,特定の目標に対するエネルギー関数を学習するために,ディープラーニングモデルを効率的に訓練する能動的学習ワークフローを提案する。
HER2結合型Trastuzumab変異株を対象としたケーススタディでは,ランダム選択よりもスクリーニング性能が有意に向上した。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 07:37:31 GMT)
Accelerating the Training and Improving the Reliability of Machine-Learned Interatomic Potentials for Strongly Anharmonic Materials through Active Learning [0.0] 本研究では,MDとMLIP(MLIP-MD)との不確実性推定を組み合わせた能動的学習手法が,このような問題を回避できることを示す。
本研究では,MDとMLIP(MLIP-MD)との不確実性推定を組み合わせた能動的学習手法により,このような予測を回避できることを示す。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:52:30 GMT)
A no-go theorem for sequential and retro-causal hidden-variable theories based on computational complexity [0.0] ベルのno-go定理は、量子相関-at-a-距離現象をモデル化する理論を必要とする。
理論が量子力学と互換性があるなら、その数学的モデルを解く問題は量子回路の出力を計算するのと同じくらい難しい。
これらのクラスは量子回路からのサンプリングの計算複雑性をカバーできないことを示す。
この結果は、シーケンシャルおよびポストセレクションに基づく理論の大きなファミリーを規定するノーゴー定理を表している。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 08:19:58 GMT)
A comparison between classical and Bohmian quantum chaos [0.0] 古典的ハミルトニアン系 $V= frac12(omega_x2x2+omega_y2y2)+epsilon xy2$ に対応する 2d 系のカオスの出現について検討する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:30:36 GMT)
A Survey-Based Quantitative Analysis of Stress Factors and Their Impacts Among Cybersecurity Professionals [0.0] 本研究では,サイバーセキュリティ専門家の作業ストレスとバーンアウトの頻度と原因について検討した。
44%が重度のストレスとバーンアウトを経験し,さらに28%が症状を疑った。
サイバーセキュリティの役割、非現実的な期待、非支援的な組織文化の要求の性質がこの危機を刺激する主要な要因として現れている。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 15:18:33 GMT)
A Stochastic Origin of Spacetime Non-Commutativity [0.0] 時空の非可換性は、経路積分の定式化における経路の連続性や不連続性と本質的にどのように関係しているかを論じる。
この結果は、時空の非可換性は、時空の基本的な離散性の結果として理解できることを示唆している。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 10:44:23 GMT)
A Fisher-Rao gradient flow for entropic mean-field min-max games [0.0] グラディエントフローは多くの機械学習問題に対処する上で重要な役割を果たす。
エントロピー正則化を用いた凸凹型min-maxゲームにおいて,テキストフィッシャー・ラオ(Mean-Field Birth-Death)勾配流の連続時間収束について検討する。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 14:59:09 GMT)
A Few Shot Learning Scheme for Quantum Natural Language Processing [0.0] 我々は,量子自然言語処理のためのFew Shot Learningを実装するフレームワークを開発した。
このフレームワークは、各呼び出しから量子システムへの有用な処理を抽出する際の、その振る舞いとその能力を調べるためにテストに置かれる。
論文参考訳(メタデータ) (Wed, 18 Sep 2024 16:24:51 GMT)