The RoboDepth Challenge: Methods and Advancements Towards Robust Depth Estimation [97.6] 我々は,RoboDepth Challengeの優勝ソリューションを要約する。
この課題は、堅牢なOoD深度推定を容易にし、前進させるように設計された。
この課題が、堅牢で信頼性の高い深度推定に関する将来の研究の基盤となることを願っている。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 23:49:07 GMT)
Synatra: Turning Indirect Knowledge into Direct Demonstrations for Digital Agents at Scale [97.2] LLMは、デジタル環境と対話し、特定の目的を完遂する自律エージェントとして機能する。
デジタルタスクに対する大規模な直接的なデモが欠如していることもあって、正確性はまだ十分ではない。
我々は、この間接的な知識を大規模に直接監督するアプローチであるSynatraを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 00:51:45 GMT)
HelloBench: Evaluating Long Text Generation Capabilities of Large Language Models [89.3] 長文生成における大規模言語モデルの性能を評価するために,階層長文生成ベンチマーク(HelloBench)を導入する。
HelloBenchはブルームの分類に基づいて、長いテキスト生成タスクをオープンエンドQA、要約、チャット、テキスト補完、テキスト生成の5つのサブタスクに分類する。
また,人的評価に要する時間と労力を大幅に削減する人的評価手法である階層的長文評価(HelloEval)を提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 15:38:11 GMT)
Self-supervised Shape Completion via Involution and Implicit Correspondences [89.2] 3次元形状の完成は、教師付きトレーニングや、完全な形状の例による分布学習によって伝統的に解決される。
近年, 完全な3次元形状の例を必要としない自己指導型学習手法が注目されている。
形状完遂作業のための非対角的自己教師型手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 10:04:38 GMT)
CDChat: A Large Multimodal Model for Remote Sensing Change Description [82.5] LMMの微調整に利用できる変更記述命令データセットを導入し、RS画像のより優れた変更記述を提供する。
我々は,LLaVA-1.5モデルを若干の修正を加えて,変更記述命令データセットを微調整し,良好な性能が得られることを示した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 17:31:02 GMT)
Video Instance Shadow Detection Under the Sun and Sky [82.0] ViShadowは、半教師付きビデオインスタンスのシャドウ検出フレームワークである。
クロスフレームペアリングのための対照的な学習を通じて、シャドーとオブジェクトインスタンスを識別する。
一時的な消失を管理するための検索機構が導入された。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 05:51:30 GMT)
GPT-4 as a Homework Tutor can Improve Student Engagement and Learning Outcomes [80.6] 我々は,中学生が第二言語として英語を学習するための対話型宿題セッションを,GPT-4で実施できるプロンプト戦略を開発した。
従来の宿題を GPT-4 の宿題に置き換え,4つの高校生の授業でランダム化比較試験(RCT)を行った。
学習結果の大幅な改善,特に文法の増大,学生のエンゲージメントについて検討した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 11:22:55 GMT)
Controlling Risk of Retrieval-augmented Generation: A Counterfactual Prompting Framework [77.5] 我々は、RAGモデルの予測が誤りであり、現実のアプリケーションにおいて制御不能なリスクをもたらす可能性がどの程度あるかに焦点を当てる。
本研究は,RAGの予測に影響を及ぼす2つの重要な潜伏要因を明らかにする。
我々は,これらの要因をモデルに誘導し,その応答に与える影響を解析する,反実的プロンプトフレームワークを開発した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:52:14 GMT)
EuroLLM: Multilingual Language Models for Europe [76.9] オープンウェイトな多言語LLMの開発を目的としたEuroLLMプロジェクトを紹介した。
これまでの進捗状況を概説し、データ収集とフィルタリングプロセスについて詳述する。
マルチリンガル・ジェネラル・ベンチマークと機械翻訳の性能について報告する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:51:36 GMT)
HAICOSYSTEM: An Ecosystem for Sandboxing Safety Risks in Human-AI Interactions [76.4] 本稿では,多様な複雑な社会的相互作用におけるAIエージェントの安全性を調べるフレームワークであるHAICOSYSTEMを提案する。
私たちは7つの領域(医療、金融、教育など)にわたる92のシナリオに基づいて1840のシミュレーションを実行します。
我々の実験は、最先端のLSMは、プロプライエタリかつオープンソースの両方で、50%以上のケースで安全リスクを示すことを示した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 19:47:21 GMT)
Gen2Act: Human Video Generation in Novel Scenarios enables Generalizable Robot Manipulation [74.7] Gen2Actは、ゼロショットのヒューマンビデオ生成として言語条件の操作をキャストし、生成したビデオに対して単一のポリシーで実行します。
実世界の多様なシナリオにおいて,Gen2Actがロボットデータに存在しないタスクに対して,未知のオブジェクトタイプを操作したり,新たな動作を実行したりすることができることを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 17:57:33 GMT)
MonoFormer: One Transformer for Both Diffusion and Autoregression [70.8] 本稿では,自己回帰と拡散の両面において1つの変圧器を共有するという,単純な考え方を提案する。
実験結果から,本手法は現在の最先端手法に匹敵する画像生成性能が得られた。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 17:51:04 GMT)
Reliability in Semantic Segmentation: Can We Use Synthetic Data? [69.3] セマンティックセグメンテーションモデルの現実的信頼性を総合的に評価するために、合成データを具体的に生成する方法を初めて示す。
この合成データは、事前訓練されたセグメンタの堅牢性を評価するために使用される。
セグメンタのキャリブレーションとOOD検出能力を向上するために,我々のアプローチをどのように活用できるかを実証する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 13:05:28 GMT)
The Roles of Generative Artificial Intelligence in Internet of Electric Vehicles [65.1] 我々は、電気自動車(IoEV)のインターネットにおけるGenAIの応用を調査・調査する。
我々は,IoEV用GenAIを,EVのバッテリ層,電気自動車(EV)層,EV層付きスマートグリッド,セキュリティ層という4つの異なるレイヤに分類した。
まず、IoEVアプリケーションの各レイヤで使用されるさまざまなGenAI技術を紹介し、その後、GenAIモデルをトレーニングするための公開データセットを要約する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 05:12:10 GMT)
Federated Large Language Models: Current Progress and Future Directions [63.7] 本稿では,LLM(FedLLM)のフェデレーション学習について調査し,最近の進歩と今後の方向性を明らかにする。
ファインチューニングと迅速な学習という2つの重要な側面に注目し、既存の作業と関連する研究課題について議論する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 04:14:33 GMT)
OmniBench: Towards The Future of Universal Omni-Language Models [63.5] OmniBenchは、視覚的、音響的、テキスト的入力を同時に認識し、解釈し、推論するモデルの能力を厳格に評価するために設計された新しいベンチマークである。
本研究の主目的は,ほとんどのOLMが3モーダル文脈における指示追従能力と推論能力に限界があることである。
我々は,OLMの性能を多様に向上させるため,より堅牢な3モーダル統合技術とトレーニング戦略の開発に重点を置くことを目的としている。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:51:45 GMT)
Efficient Motion Prediction: A Lightweight & Accurate Trajectory Prediction Model With Fast Training and Inference Speed [56.3] 我々は,1つのGPU上で数時間のトレーニングをしながら,競争力の高いベンチマーク結果を実現する,新しい効率的な動き予測モデルを提案する。
その低推論レイテンシは、特に限られたコンピューティングリソースを持つ自律アプリケーションへのデプロイに適している。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:58:27 GMT)
ImPoster: Text and Frequency Guidance for Subject Driven Action Personalization using Diffusion Models [55.4] 提案するImPosterは,「運転」動作を行う「ソース」対象のターゲット画像を生成する新しいアルゴリズムである。
私たちのアプローチは完全に教師なしで、キーポイントやポーズといった追加のアノテーションへのアクセスは不要です。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 01:25:19 GMT)
MaskBit: Embedding-free Image Generation via Bit Tokens [54.8] 我々は,VQGANの実証的,体系的な検討を行い,近代化されたVQGANを導いた。
ビットトークンを直接操作する新しい埋め込み不要な生成ネットワークは、ImageNet 256x256ベンチマークで1.52の最先端FIDを達成し、わずか305Mパラメータのコンパクトなジェネレータモデルである。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:12:12 GMT)
Cross Layer Optimization and Distributed Reinforcement Learning for Wireless 360° Video Streaming [54.6] 本稿では,各ユーザに対して利用可能なレートを最大化し,ユーザのQoEを最大化するために効率的に利用するクロスレイヤ最適化手法を提案する。
この問題を2つの相互関連サブプロブレムに分解できることを示す。
複数の独立エージェントの並列学習を活用し,アプリケーション層サブプロブレムを解くために,アクタ・クリティカル・ディープ・強化学習(DRL)を提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:55:21 GMT)
ViKL: A Mammography Interpretation Framework via Multimodal Aggregation of Visual-knowledge-linguistic Features [54.4] MVKLは,マルチビュー画像,詳細な表示,報告を含む最初のマルチモーダルマンモグラフィーデータセットである。
このデータセットに基づいて、教師なし事前学習のチャラリングタスクに焦点を当てる。
視覚,知識,言語機能を相乗化するフレームワークであるViKLを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 05:01:23 GMT)
C-Pack: Packed Resources For General Chinese Embeddings [52.4] C-Packは、一般的な中国の埋め込みの分野を著しく前進させるリソースのパッケージである。
C-MTEBは6つのタスクと35のデータセットをカバーする中国のテキスト埋め込みのベンチマークである。
C-MTPは、埋め込みモデルをトレーニングするためのラベル付きおよびラベルなしの中国語コーパスからキュレートされた巨大なテキスト埋め込みデータセットである。
C-TEMは、複数のサイズをカバーする埋め込みモデルのファミリーである。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 03:01:25 GMT)
A Comprehensive Framework for Evaluating API-oriented Code Generation in Large Language Models [51.2] GitHub CopilotやChatGPTのような大規模言語モデル(LLM)は、コード生成の強力なツールとして登場した。
API指向コード生成におけるLLMの機能を評価するために設計されたフレームワークであるAutoAPIEvalを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 17:13:43 GMT)
Knowledge Editing in Language Models via Adapted Direct Preference Optimization [50.6] 大きな言語モデル(LLM)は、時間とともに時代遅れになる可能性がある。
知識編集は、高価なリトレーニングを必要としないウェイトアップデートを使用して、この課題を克服することを目的としている。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:48:36 GMT)
Watch Every Step! LLM Agent Learning via Iterative Step-Level Process Refinement [50.5] 反復的なステップレベルプロセスリファインメント(IPR)フレームワークは、エージェントトレーニングを強化するためのステップバイステップのガイダンスを提供する。
3つの複雑なエージェントタスクに関する我々の実験は、我々のフレームワークが様々な強力なベースラインより優れていることを示した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 10:01:31 GMT)
Empirical Insights on Fine-Tuning Large Language Models for Question-Answering [50.1] 大規模言語モデル(LLM)は、大量のデータセットの事前トレーニングを通じて、広範囲な世界の知識を符号化する。
我々は,事前学習したLLMが記憶する知識の量に基づいて,教師付き微調整(SFT)データを分類した。
実験の結果,SFTの段階では60個のデータポイントが事前学習中に符号化された知識を活性化することができ,LLMがQAタスクを実行できることがわかった。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:38:38 GMT)
Unlocking Markets: A Multilingual Benchmark to Cross-Market Question Answering [49.7] 製品関連質問応答(PQA)は、ユーザに対して正確な回答を提供するために、製品関連リソースを活用する。
マルチリンガル・クロスマーケット・プロダクト・ベースの質問回答(MCPQA)の新たな課題を提案する。
11言語にまたがる17のマーケットプレースから700万以上の質問からなる大規模なデータセットを導入します。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:24:34 GMT)
GGHead: Fast and Generalizable 3D Gaussian Heads [49.0] 3D GANは、比較的遅い列車とレンダリング速度のために、高解像度でサンプルを生成するのに苦労しています。
本稿では、3次元GANフレームワーク内での最近の3次元ガウススプラッティング表現を取り入れた生成ガウスヘッド(GGHead)を提案する。
高品質な3Dコンセントヘッドのリアルタイム生成とレンダリングを初めて10242ドルで実証した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:48:19 GMT)
Protein Conformation Generation via Force-Guided SE(3) Diffusion Models [48.5] 新しいタンパク質コンホメーションを生成するために、深層生成モデリング技術が用いられている。
本稿では,タンパク質コンフォメーション生成のための力誘導SE(3)拡散モデルConfDiffを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:37:16 GMT)
Supervised Fine-Tuning: An Activation Pattern Optimization Process for Attention Heads [47.6] 本研究では,SFTプロセスがLLMを下流タスクに適応させるプロセスについて,注意パターンの観点から検討する。
LLMは、SFT中にタスク固有のアテンションヘッドを選択的に活性化し、(2)複雑なタスクのアクティベーションパターンは基本的なタスクパターンの組み合わせであり、(3)少数のパラメータの変化は、少数のサンプル上でSFT後のアクティベーションパターンに大きな影響を与える。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:34:50 GMT)
Unimotion: Unifying 3D Human Motion Synthesis and Understanding [47.2] フレキシブル・モーション・コントロールとフレームレベルのモーション・理解を両立できる初のマルチタスク・ヒューマン・モーション・モデルであるUnimotionを導入する。
Unimotionは、グローバルテキストやローカルフレームレベルのテキストでモーションを制御できる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:20:06 GMT)
Long-Tailed 3D Detection via Multi-Modal Fusion [47.0] 本研究では,Long-Tailed 3D Detection (LT3D) の問題点について検討した。
単モードLiDARとRGB検出器を独立に訓練した多モード遅延核融合(MMLF)により,レアクラスの精度が特に向上することが指摘されている。
提案するMMLFアプローチは,従来の作業よりもLT3Dの性能を著しく向上させる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 00:56:24 GMT)
Orthogonal Finetuning for Direct Preference Optimization [46.4] 重み付き優先度最適化(RoPO)法によるDPOの微調整を提案する。
RoPOは、超球面エネルギー不変量を維持するために、重みパラメータの回転および等級ストレッチング更新を行う。
我々のモデルは、トレーニング可能なパラメータの0.0086%しか使用せずに、元の表現能力を維持しながら、人間の好みと完全に一致します。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 03:22:15 GMT)
EnIGMA: Enhanced Interactive Generative Model Agent for CTF Challenges [46.3] 本稿では,CTF(Capture The Flag)課題を自律的に解決するLMエージェントであるEnIGMAを紹介する。
EnIGMAは、CTFチャレンジの成功率を改善するために、新しいエージェント・コンピュータ・インタフェース(ACI)を導入した。
我々は、LMエージェントがインタラクティブなコマンドラインユーティリティを実行できるインタラクティブエージェントツールのコンセプトを確立した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 15:06:01 GMT)
A Fairness-Oriented Reinforcement Learning Approach for the Operation and Control of Shared Micromobility Services [46.1] 本研究では,共有マイクロモビリティサービスにおける性能最適化とアルゴリズムフェアネスのバランスについて検討する。
提案手法は,Q-Learningを駆使して,異なる領域にまたがるジーニ指数を用いて等価な結果を得る。
総合データを用いたケーススタディは、私たちの洞察を検証し、都市マイクロモビリティにおける公正の重要性を強調します。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:24:11 GMT)
Deep chroma compression of tone-mapped images [46.1] 本稿では,HDRトーンマップ画像の高速かつ信頼性の高いクロマ圧縮のための生成逆ネットワークを提案する。
提案手法は,色精度において,最先端の画像生成および拡張ネットワークよりも優れることを示す。
このモデルはリアルタイムのパフォーマンスを実現し,計算資源が限られているデバイスに展開する上で有望な結果を示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:31:55 GMT)
Deep Ensembles Meets Quantile Regression: Uncertainty-aware Imputation for Time Series [45.8] 量子回帰に基づくタスクネットワークのアンサンブルを用いて不確実性を推定する新しい手法であるQuantile Sub-Ensemblesを提案する。
提案手法は,高い損失率に頑健な高精度な計算法を生成するだけでなく,非生成モデルの高速な学習により,計算効率も向上する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 03:39:37 GMT)
Unsupervised dMRI Artifact Detection via Angular Resolution Enhancement and Cycle Consistency Learning [45.4] 拡散磁気共鳴イメージング(dMRI)は神経画像研究において重要な技術であり、脳組織の基盤構造を非侵襲的に探究することができる。
臨床dMRIデータは、取得中に様々なアーティファクトに影響を受けやすいため、信頼性の低いその後の分析に繋がる可能性がある。
我々は、$textbfU$n $textbfd$MRI $textbfA$rtifact $textbfD$etection via $textbfA$ngular Resolution Enhancement and $textbfC$ycleと呼ばれる新しい教師なしディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:56:10 GMT)
The multi-state geometry of shift current and polarization [45.0] 量子状態プロジェクタを用いて、ゲージ不変な形式を明示的に開発する。
電子偏光のモーメントと正確な関係を解くシフト電流の簡単な表現を提供する。
占有状態の歪度と固有多状態幾何の和への分解を明らかにする。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:00:02 GMT)
Numerical determination of the width and shape of the effective string using Stochastic Normalizing Flows [45.0] フローベースアーキテクチャは,格子上に正規化された有効弦理論の数値シミュレーションにおいて,効率的なツールであることが証明されている。
本研究では,非平衡モンテカルロシミュレーションに基づく最先端ディープラーニングアーキテクチャである正規化フローを用いて,異なる実効文字列モデルについて検討する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:59:44 GMT)
Efficiency of Dynamical Decoupling for (Almost) Any Spin-Boson Model [45.0] 構造ボソニック環境と結合した2レベル系の動的疎結合を解析的に検討した。
このようなシステムに対して動的疎結合が機能する十分な条件を見つける。
私たちの境界は、様々な関連するシステムパラメータで正しいスケーリングを再現します。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 04:58:28 GMT)
Scaling Synthetic Data Creation with 1,000,000,000 Personas [44.1] 私たちは、Webデータから自動的にキュレートされた10億の多様なペルソナのコレクションであるPersona Hubを紹介します。
この10億のペルソナ(世界の人口の13%)は、世界の知識の分散キャリアとして機能し、大きな言語モデルにカプセル化されたほぼ全ての視点に到達することができる。
ペルソナ駆動のデータ合成は、汎用的で、スケーラブルで、柔軟性があり、使いやすく、合成データ作成とアプリケーションの実践におけるパラダイムシフトを促進する可能性があることを実証する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 00:38:10 GMT)
Barbie: Text to Barbie-Style 3D Avatars [43.2] 多様な高品質なバービーのような衣服やアクセサリーを身に着けた3Dアバターを作るための新しいフレームワークであるBarbieを提案する。
バービーは人体と衣服のセマンティックアライズされたモデルによって、アバターの細粒度のゆがみを達成している。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 04:43:32 GMT)
Racing the Market: An Industry Support Analysis for Pricing-Driven DevOps in SaaS [42.9] このパラダイムは価格の使用を普及させ、プロバイダが幅広いサブスクリプションオプションを顧客に提供できるようにした。
これにより、ユーザにとって広大な設定スペースが作成され、機能の選択と、ニーズに最も適した保証がサポートされる。
これらの価格変更の理由にかかわらず、価格要素の変更頻度は増加し続けている。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:52:33 GMT)
Flow to Rare Events: An Application of Normalizing Flow in Temporal Importance Sampling for Automated Vehicle Validation [42.5] 本稿では,危険事象の分布を表現し,生成し,再重み付けする手法を提案する。
リスク指標関数を導入することにより、リスクのあるまれな事象の分布は、自然主義的な運転分布から理論的に推測される。
その結果、希少な事象分布から背景車両の操作をサンプリングすることで、テストシナリオを危険状態へと進化させる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:51:30 GMT)
Identification For Control Based on Neural Networks: Approximately Linearizable Models [42.2] 本研究では,非線形システムの効率的な制御設計と安定性解析のための制御指向同定手法を提案する。
ニューラルネットワークは離散時間非線形状態空間モデルを特定し、時間領域の入力出力挙動を近似する。
ネットワークは、同定されたモデルがフィードバックによってほぼ線形化可能であるように構成され、制御則が学習段階から自明に従うことを保証する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:31:22 GMT)
Quantum heat engine based on quantum interferometry: the SU(1,1) Otto cycle [42.1] 本稿では, 量子オットーサイクルに基づく量子熱エンジンについて述べる。その作用物質は, 各断熱変換の終端におけるSU(1,1)干渉過程の同じ結果を再現する。
この装置は、SU (1,1) 干渉計の異常な量子力学的特徴を利用して、サイクルの各断熱ストローク中の関連する観測物の不確実性の源をよりよく識別する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:26:15 GMT)
Too Many Frames, Not All Useful: Efficient Strategies for Long-Form Video QA [40.5] 広い時間間隔にまたがるロングフォームビデオは、非常に冗長な情報である。
正しい応答を生成するために必要な全ての情報は、しばしばフレームの小さなサブセットに含まれる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 00:57:54 GMT)
Learning Multiple Probabilistic Decisions from Latent World Model in Autonomous Driving [40.4] 自己回帰世界モデルは、堅牢な一般化能力を示すが、不確実性モデリングや自己導出が不十分なため、行動の導出に困難に直面する。
本研究では,環境の次状態とエゴ車両の動作を混合分布としてモデル化するフレームワークであるLatentDriverを提案する。
LatentDriverは最先端の強化学習と模倣学習を超越し、エキスパートレベルのパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 04:26:24 GMT)
Exact gradients for linear optics with single photons [38.7] 一般化パラメータシフト則を用いて位相シフト器に関する量子回路の勾配解析式を導出する。
そこで本研究では,表現のシフト数を減らし,全体の複雑さを低減できる2つの戦略を提案する。
数値的に、この一般化されたパラメータシフト規則は、代替手法よりも少ないパラメータ更新ステップでコスト関数の最小値に収束できることを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:02:06 GMT)
A Modular-based Strategy for Mitigating Gradient Conflicts in Simultaneous Speech Translation [38.7] 同時音声翻訳(SimulST)は、ストリーミング音声入力を継続的に処理しながら、ターゲット言語テキストを生成する。
本稿では,より微細なモジュラレベルでの衝突を検知し,勾配予測を用いて解決するMGCM(Modular Gradient Conflict Mitigation)戦略を提案する。
実験の結果,MGCMは特に中・高遅延条件下で,SimulSTの性能を著しく向上することが示された。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:27:43 GMT)
Towards Graph Prompt Learning: A Survey and Beyond [38.6] 大規模"事前訓練と迅速な学習"パラダイムは、顕著な適応性を示している。
この調査は、この分野における100以上の関連する研究を分類し、一般的な設計原則と最新の応用を要約する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:43:35 GMT)
AI Can Be Cognitively Biased: An Exploratory Study on Threshold Priming in LLM-Based Batch Relevance Assessment [38.0] 大規模言語モデル(LLM)は高度な理解能力を示しているが、トレーニングデータから人間のバイアスを継承する可能性がある。
関連判定におけるしきい値プライミング効果の影響について検討した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:23:15 GMT)
Improvement and generalization of ABCD method with Bayesian inference [36.1] 我々は、利用可能な情報を活用することに集中し、通常のデータ駆動型ABCD法を再考する努力を注いでいる。
ABCD法とは対照的に,異なる背景の性質の理解をいかに活用できるかを示す。
この単純化されたモデルにおいて、ベイズフレームワークは信号分数を得る際のABCD法感度よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 19:24:16 GMT)
Lessons Learned from a Unifying Empirical Study of Parameter-Efficient Transfer Learning (PETL) in Visual Recognition [36.0] 視覚変換器の文脈における代表的PETL法に関する統一的な実証的研究を行う。
PETL法は、低ショットのベンチマークVTAB-1Kで非常によく似た精度が得られる。
PETLは、多くのショットレシエーションでも有用であり、フルFTよりも同等で、時には精度が向上する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 19:57:40 GMT)
Merging LoRAs like Playing LEGO: Pushing the Modularity of LoRA to Extremes Through Rank-Wise Clustering [35.5] Low-Rank Adaptation (LoRA) は、様々なドメインに最適化された大規模言語モデル(LLM)の一般的なテクニックとして登場した。
LoRA合成の既存の方法は、主に追加の訓練を必要とするタスク固有の適応に焦点を当てている。
本稿では,LoRAにおける各ランクに対応するパラメータが独立単位として機能する最小意味単位(MSU)の概念を紹介する。
我々は、異なるLoRAから$k$のクラスタにMSUをグループ化することで、ランクワイズパラメータクラスタリングを行うLoRA-LEGOフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 15:08:41 GMT)
FMDLlama: Financial Misinformation Detection based on Large Language Models [35.5] 大規模言語モデル (LLM) は様々な分野で優れた性能を示している。
本研究では,FMDLlamaを提案する。FMDLlamaは,FMDタスクのための,命令データを含む微調整Llama3.1に基づく最初のオープンソース命令追従LLMである。
FMD-B 上の様々な LLM と比較し,ChatGPT だけでなく,他のオープンソース LLM よりも優れています。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 20:44:30 GMT)
Planning in the Dark: LLM-Symbolic Planning Pipeline without Experts [34.6] 大規模言語モデル(LLM)は、自然言語で記述された計画課題の解決において有望であるが、それらの直接的な使用はしばしば矛盾した推論と幻覚をもたらす。
本稿では,自然言語記述の多種多様な解釈を考慮し,複数の候補を生成するアクションスキーマライブラリを構築する手法を提案する。
実験の結果、パイプラインは直接LLM計画アプローチよりもプランニングが優れていることが示された。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:33:12 GMT)
Overcoming Reward Model Noise in Instruction-Guided Reinforcement Learning [34.6] 視覚言語モデル(VLM)は、疎い報酬環境においてより情報的な報酬信号を提供する補助報酬モデルとして注目を集めている。
適切なノイズハンドリングを行わないVLMモデルを用いた強化学習エージェントは,探索駆動手法のみに依存するエージェントよりも性能が劣ることを示す。
そこで本研究では,新しい雑音耐性報酬関数であるBiMIを紹介する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:45:20 GMT)
DifFUSER: Diffusion Model for Robust Multi-Sensor Fusion in 3D Object Detection and BEV Segmentation [34.4] DifFは3次元オブジェクト検出とBEVマップセグメンテーションにおける多モード融合のための拡散モデルを利用する新しいアプローチである。
DifFは拡散の固有のノイズ発生特性から利点を生かし、センサーの故障時にセンサーの特徴を洗練または合成することができる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 06:34:05 GMT)
Learn and Don't Forget: Adding a New Language to ASR Foundation Models [34.0] ファンデーションASRモデルは、ウィスパーの100言語など、多くの言語をサポートすることが多い。
微調整は単純ではあるが、元の集合の精度を低下させることがある。
EWCは特定のターゲット言語のパフォーマンスを維持する可能性に対して、代替的な妥協を提供する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 15:04:49 GMT)
Making Text Embedders Few-Shot Learners [33.5] 本稿では,高品質なテキスト埋め込みを実現するために,少数の例を用いた新しいモデルbge-en-iclを提案する。
提案手法では,タスク関連例をクエリ側に直接統合することで,タスク間の大幅な改善を実現している。
MTEBおよびAIR-Benchベンチマークによる実験結果から,本手法がSOTA(State-of-the-art)性能を新たに設定することを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 03:30:19 GMT)
Fine-Tuning is Fine, if Calibrated [33.4] 事前訓練されたモデルの微調整は、以前に学んだ他のクラスにおいて、モデルの精度を劇的に低下させることが示されている。
本論文は,「微調整モデルで損傷を受けたものは何か?」という根本的な疑問に答えることを目的として,この問題を体系的に解剖する。
微調整されたモデルは、他のクラス間の関係を忘れたり、これらのクラスを認識するために機能を劣化させたりしない。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:35:16 GMT)
Lighter And Better: Towards Flexible Context Adaptation For Retrieval Augmented Generation [32.3] 我々はFlexRAG(Flexible Context Adaptation for RAG)と呼ばれる新しいアプローチを導入する。
このアプローチでは、検索したコンテキストは、LLM(Large Language Models)によって符号化される前に、コンパクトな埋め込みに圧縮される。
FlexRAGの重要な特徴は柔軟性であり、多様な圧縮比を効果的にサポートし、重要なコンテキストを選択的に保存することを可能にする。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 03:25:36 GMT)
FSF-Net: Enhance 4D Occupancy Forecasting with Coarse BEV Scene Flow for Autonomous Driving [31.9] 粗いBEVシーンフローに基づく4次元占有予測手法FSF-Netを提案する。
IoUとmIoUの9.56%と10.87%を達成した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:08:22 GMT)
Archon: An Architecture Search Framework for Inference-Time Techniques [31.7] 大規模言語モデル(LLM)の能力を高めるために、推論時のテクニックが、非常に効果的なツールとして登場しています。
推論時間技術と1つ以上のLLMを組み合わせたシステムを開発する上でのベストプラクティスについては,まだ理解が限られている。
推論時アーキテクチャを設計するための自動化フレームワークであるArchonを紹介します。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 05:08:18 GMT)
CJEval: A Benchmark for Assessing Large Language Models Using Chinese Junior High School Exam Data [31.3] CJEvalは中国の中学校のエクサム評価に基づくベンチマークである。
26,136個のサンプルから成っている。
このベンチマークを用いて,LLMの潜在的な応用性を評価し,その性能を総合的に分析した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:00:28 GMT)
Seeing Faces in Things: A Model and Dataset for Pareidolia [30.4] Face pareidolia'は、他の無作為な刺激の中で、顔のような構造の知覚を記述する。
人間のアノテートしたパレドリックな顔を持つ5万個のウェブ画像からなる「モノの顔」の画像データセットを提示する。
動物の顔や人間の顔を検知する進化的な必要性は、このギャップのいくつかを説明できるかもしれない。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:50:21 GMT)
A2PO: Towards Effective Offline Reinforcement Learning from an Advantage-aware Perspective [30.0] 本稿では,オフライン学習におけるアドバンテージ・アウェア政策最適化(A2PO)手法を提案する。
A2POは条件付き変分自動エンコーダを用いて、絡み合った行動ポリシーの動作分布をアンタングルする。
D4RLベンチマークの単一品質データセットと混合品質データセットの両方で実施された実験では、A2POがA2POよりも優れた結果が得られることが示された。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:06:51 GMT)
BeSimulator: A Large Language Model Powered Text-based Behavior Simulator [28.1] 本研究では,BeSimulatorをテキストベースの環境下での動作シミュレーションの試みとして紹介する。
BeSimulatorはシナリオを一般化し、長距離複素シミュレーションを実現する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:37:04 GMT)
What could go wrong? Discovering and describing failure modes in computer vision [27.6] 言語に基づく誤り説明可能性(LBEE)の問題を定式化する。
我々は,共同視覚・言語埋め込み空間で機能するソリューションを提案する。
提案手法は,特定の誤りの原因に関連する非自明な文を分離する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:58:34 GMT)
Second Order Bounds for Contextual Bandits with Function Approximation [26.1] 我々は,時間軸の平方根ではなく,測定分散の総和の平方根と,スケーリングの残差を満たすアルゴリズムを開発した。
これらの境界は文脈線形問題において2階境界を導出する既存の手法を一般化する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 15:42:04 GMT)
Will Large Language Models be a Panacea to Autonomous Driving? [26.0] 自律運転(AD)技術の開発は、モジュール化とエンドツーエンドの2つの主要な技術的パスに従っている。
本稿では,ADシステムにおける大規模言語モデル(LLM)の適用可能性について,詳細な分析を行う。
LLMベースの人工知能(AGI)がハイレベルADを実現する鍵となるのか?
論文参考訳(メタデータ) (Tue, 24 Sep 2024 03:12:12 GMT)
Revisiting Acoustic Features for Robust ASR [25.7] 生物学的聴覚知覚に触発された音響特性を発達させる先行研究のアプローチを再考する。
本研究では、周波数マスキングと側方抑制の神経心理学的現象をシミュレートするために、周波数マスキング分光法(FreqMask)とガンマトン分光法(DoGSpec)の相違という2つの新しい音響特性を提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:58:23 GMT)
Time-MoE: Billion-Scale Time Series Foundation Models with Mixture of Experts [25.5] Time-MoEは、より大きく、より有能な基礎モデルを予測するために設計された、スケーラブルで統一されたアーキテクチャである。
Time-MoEは、予測毎にネットワークのサブセットだけを活性化することで、計算効率を向上させる。
時系列基礎モデルを24億のパラメータに拡張し,予測精度を大幅に向上させた。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:42:18 GMT)
An Invitation to Deep Reinforcement Learning [24.8] ターゲット目標を最大化するためにディープニューラルネットワークをトレーニングすることが、マシンラーニングの成功の標準的なレシピになっています。
共通目的として、連合(IoU)、二言語評価(BLEU)スコア、報酬は教師付き学習では最適化できない。
強化学習(Reinforcement Learning, RL)は、未分化の目的を最大化するために、ディープニューラルネットワークを最適化するための有望な代替手段として登場した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:39:56 GMT)
Low Latency Point Cloud Rendering with Learned Splatting [24.6] 点のばらつきと不規則さのため、点雲の高品質なレンダリングは困難である。
既存のレンダリングソリューションには、品質とスピードのどちらかが欠けている。
対話的,自由なビューング,高忠実度クラウドレンダリングを実現するフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 23:26:07 GMT)
CogGPT: Unleashing the Power of Cognitive Dynamics on Large Language Models [24.1] 本稿では,大規模言語モデル(LLM)の認知力学の概念を提案し,縦断的研究のインスピレーションを得て,それに対応する課題を提案する。
この課題に向けて,LLMの認知力学を評価し,参加者による調査を通じて検証する新しいベンチマークであるCogBenchを開発した。
本稿では,生涯の認知力学の強化を目的とした,革新的な反復的認知機構を特徴とするタスク用CogGPTを紹介する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:41:19 GMT)
Audio Editing with Non-Rigid Text Prompts [24.0] 提案した編集パイプラインは,入力音声に忠実な音声編集を作成可能であることを示す。
追加、スタイル転送、インペイントを行うテキストプロンプトを探索する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 11:25:49 GMT)
MINERS: Multilingual Language Models as Semantic Retrievers [23.7] 本稿では,意味検索タスクにおける多言語言語モデルの有効性を評価するためのベンチマークであるMINERSを紹介する。
我々は,200以上の多言語にわたるサンプルの検索において,LMの堅牢性を評価する包括的なフレームワークを構築した。
以上の結果から,意味論的に類似した埋め込みを検索することで,最先端のアプローチと競合する性能が得られることが示された。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 15:43:28 GMT)
Enhancing Text-to-SQL Capabilities of Large Language Models via Domain Database Knowledge Injection [23.4] 大きな言語モデル(LLM)は、スキーマの問題とドメイン固有のデータベース知識の欠如によって、問題に直面します。
本稿では,従来の知識を取り入れたLLMの理解能力を高めるための知識注入手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:24:03 GMT)
EEGUnity: Open-Source Tool in Facilitating Unified EEG Datasets Towards Large-Scale EEG Model [22.9] 本稿では、EEG'、'バッチ処理'、'Correction'、'Large Language Model Boost'のモジュールを組み込んだオープンソースのツールであるEEGUnityを紹介する。
EEGUnityの機能は、高いデータ品質と一貫性を確保し、大規模なEEGデータ研究の信頼性の高い基盤を提供する。
その結果、解析とデータ処理におけるEEGUnityの性能と柔軟性が示された。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:25:40 GMT)
MM-CamObj: A Comprehensive Multimodal Dataset for Camouflaged Object Scenarios [22.7] MM-Camデータセットを初めて構築し、Cam-AlignとCam-Instructの2つのサブセットからなる。
MM-Camデータセットに基づいて,カモフラージュシーンのタスク処理に特化したLVLMであるCam-Llavaを提案する。
GPT-4oに比べて7タスク中4タスクで25.84%改善した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 13:34:13 GMT)
Time Evidence Fusion Network: Multi-source View in Long-Term Time Series Forecasting [22.6] 本稿では,情報融合の観点から,Time Evidence Fusion Network (TEFN) という新しいバックボーンアーキテクチャを提案する。
提案したTEFNは精度、効率、安定性、解釈可能性のバランスをとり、時系列予測に望ましい解である。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:57:39 GMT)
Towards Ground-truth-free Evaluation of Any Segmentation in Medical Images [22.4] 本研究では,Segment Anything Model (SAM) が生成するセグメンテーションの質と,医療画像におけるその変種を評価するために,ゼロトラストフリー評価モデルを構築した。
この評価モデルは、入力画像と対応するセグメンテーション予測との一貫性と一貫性を解析することにより、セグメンテーション品質スコアを推定する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:56:16 GMT)
SurgIRL: Towards Life-Long Learning for Surgical Automation by Incremental Reinforcement Learning [21.4] 我々は外科的強化学習(SurgIRL)を通して外科的自動化政策を訓練する
SurgIRLは,(1)外部方針(知識)を参照して新たなスキルを獲得し,(2)これらのスキルを蓄積・再利用して,複数の未確認課題を段階的に解決すること(インクリメンタルラーニング)を目的としている。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 01:27:46 GMT)
Small Language Models: Survey, Measurements, and Insights [21.2] 小型言語モデル (SLM) は大規模言語モデル (LLM) に比べて学術的関心が著しく少ない。
59の最先端のオープンソースSLMを調査し、アーキテクチャ、トレーニングデータセット、トレーニングアルゴリズムという3つの軸にわたる技術革新を分析します。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 06:36:56 GMT)
MIMO: Controllable Character Video Synthesis with Spatial Decomposed Modeling [21.1] キャラクタビデオ合成は、ライフライクなシーン内でアニマタブルなキャラクターのリアルなビデオを作成することを目的としている。
Miloは、文字ビデオを制御可能な属性で合成できる新しいフレームワークである。
Miloは、任意のキャラクタへの高度なスケーラビリティ、新しい3Dモーションへの一般化、インタラクティブな現実世界のシーンへの適用性を実現している。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 15:00:07 GMT)
Bridging Speech and Text: Enhancing ASR with Pinyin-to-Character Pre-training in LLMs [21.0] そこで本研究では,Pinyinの埋め込みシーケンス上で,対応する漢字を生成するための大規模言語モデル(LLM)の事前学習を提案する。
このステップにより、LLMは実際の音声データに遭遇する前に発音特徴からテキストを生成することができる。
AISHELL-1コーパスでは,ベースラインに比べてASRタスクが9.5%改善した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:06:31 GMT)
SDFit: 3D Object Pose and Shape by Fitting a Morphable SDF to a Single Image [19.7] 単一画像から3Dオブジェクトのポーズと形状を復元することに集中する。
最近の研究は、主に有限データセットからの学習に依存しているため、一般化に苦慮している。
SDFitと呼ばれる新しいフレームワークでこれらの制限に対処する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 15:22:04 GMT)
When Witnesses Defend: A Witness Graph Topological Layer for Adversarial Graph Learning [19.6] 逆グラフ学習を計算トポロジー、すなわちグラフの永続的ホモロジー表現から新たなツールで橋渡しする。
グラフ上の逆解析において、グラフ全体の位相情報の損失を最小限に抑えながら、グラフの健全な形状特性にのみ焦点をあてることのできる証人複体の概念を導入する。
証人機構を組み込んだWitness Graph Topological Layer (WGTL) を設計し、局所的およびグローバルなトポロジカルグラフの特徴表現を体系的に統合し、その影響を頑健な正規化されたトポロジ的損失によって自動的に制御する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 13:51:05 GMT)
Neuron-Level Knowledge Attribution in Large Language Models [19.5] 本稿では,重要なニューロンをピンポイントする静的手法を提案する。
他の7つの手法と比較して,本手法は3つの指標にまたがる優れた性能を示す。
また,注目層とフィードフォワード層の両方にわたる6種類の知識を解析するために,本手法を適用した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 20:36:03 GMT)
How do Large Language Models Learn In-Context? Query and Key Matrices of In-Context Heads are Two Towers for Metric Learning [19.5] 文分類作業における文脈内学習(ICL)のメカニズムについて,意味的無関係なラベルを用いた検討を行った。
ICLの精度は87.6%から24.4%に大きく影響している。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 20:27:53 GMT)
Unsupervised Text Representation Learning via Instruction-Tuning for Zero-Shot Dense Retrieval [19.4] 命令チューニングによる教師なしテキスト表現学習手法を提案する。
関連する合成クエリの表現によってコーパス表現を拡張できることを実証する。
我々は,全指標の平均ゼロショット検索性能を著しく改善した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 23:03:13 GMT)
CamelEval: Advancing Culturally Aligned Arabic Language Models and Benchmarks [19.4] 本稿では、アラビア語話者の価値観や好みに合わせて特別に設計されたアラビア語と英語のバイリンガルなLLMであるJuhainaを紹介する。
私たちのモデルは924億のパラメータを含み、最大8,192トークンのコンテキストウィンドウでトレーニングされています。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:49:21 GMT)
Model-in-the-Loop (MILO): Accelerating Multimodal AI Data Annotation with LLMs [19.3] 本稿では,AI/MLモデルをアノテーションプロセスに統合するMILOフレームワークを提案する。
我々の研究は、専門家のアノテータと大規模言語モデル(LLM)の長所を生かした協調パラダイムを導入する。
マルチモーダルデータアノテーションに関する実験的な3つの研究は、MILOが処理時間を短縮し、データ品質を改善し、アノテータエクスペリエンスを向上させることの有効性を示している。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 05:00:07 GMT)
CHBench: A Chinese Dataset for Evaluating Health in Large Language Models [19.2] 中国初の総合保健関連ベンチマークであるCHBenchを紹介する。
CHBenchには、メンタルヘルスに関連する6,493のエントリと、身体健康に焦点を当てた2,999のエントリが含まれている。
このデータセットは、正確な健康関連情報を理解し、生成する中国のLCMの能力を評価する基盤となる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 05:44:46 GMT)
A Unified Hallucination Mitigation Framework for Large Vision-Language Models [18.6] 幻覚緩和のための統一的な枠組みであるデンティストを提示する。
中心となるステップは、まずクエリを分類し、次に分類結果に基づいて幻覚緩和の異なるプロセスを実行することである。
MMbenchでは、画像品質の精度が13.44%/10.2%/15.8%向上した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 22:36:58 GMT)
Training Data Attribution: Was Your Model Secretly Trained On Data Created By Mine? [17.7] テキスト・ツー・イメージ・モデルに対するインジェクションフリーなトレーニングデータ属性法を提案する。
我々のアプローチでは、異なるサンプルを発見できるアルゴリズムを開発し、それらを固有の透かしとして利用する。
実験により,疑わしいモデルのトレーニングデータのソースを特定する精度が80%以上であることが確認された。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 06:23:43 GMT)
Deep Learning Technology for Face Forgery Detection: A Survey [17.5] ディープラーニングにより、高忠実度顔画像やビデオの作成や操作が可能になった。
この技術はディープフェイクとしても知られ、劇的な進歩を遂げ、ソーシャルメディアで人気を博している。
ディープフェイクのリスクを低減するため、強力な偽造検出方法を開発することが望ましい。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 01:04:08 GMT)
Self-Supervised Any-Point Tracking by Contrastive Random Walks [17.5] 我々はグローバルマッチング変換器を訓練し、コントラッシブなランダムウォークを通してビデオを通してサイクル整合性のあるトラックを見つける。
提案手法はTapVidベンチマークで高い性能を達成し,従来の自己教師付きトラッキング手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 17:59:56 GMT)
Leveraging Estimated Transferability Over Human Intuition for Model Selection in Text Ranking [17.5] モデル選択に対する効果的なアプローチとして、転送可能性推定(TE)が登場している。
本稿では,予測ランクを転送可能性として計算し,モデルのランク付け能力を明確に反映することを提案する。
得られた手法であるAdaptive Ranking Transferability (AiRTran)は、モデル間の微妙な差異を効果的に捉えることができる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 15:48:03 GMT)
EvoFA: Evolvable Fast Adaptation for EEG Emotion Recognition [17.3] 本稿では,脳波データに適したオンライン適応フレームワークであるEvolvable Fast Adaptation (EvoFA)を提案する。
EvoFAは、Few-Shot Learning(FSL)の迅速な適応と、ドメイン適応(DA)の分布マッチングを2段階の一般化プロセスを通じて統合する。
テストフェーズでは、設計された進化可能なメタ適応モジュールが、ターゲット(テスト)データの限界分布と進化するソース(トレーニング)データとを反復的に調整する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 04:35:10 GMT)
Data Augmentation for Sparse Multidimensional Learning Performance Data Using Generative AI [17.2] 学習パフォーマンスデータは、適応学習における正しい解答や問題解決の試みを記述している。
学習性能データは、適応的なアイテム選択のため、ほとんどの実世界のアプリケーションでは、非常にスパースな(80%(sim)90%の欠落)傾向にある。
本稿では,学習者のデータの分散性に対処するために,学習者のデータを拡張するための体系的フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 00:25:07 GMT)
Efficient Parallelization Layouts for Large-Scale Distributed Model Training [17.2] 本研究では,大規模言語モデルのトレーニング構成に関する総合的研究を行う。
マイクロバッチサイズを1にすることで,トレーニングレイアウトの効率が向上するのが普通だ。
最も効率的な構成により、さまざまなモデルサイズに対して最先端のトレーニング効率を達成できます。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 15:42:51 GMT)
Adversarial Watermarking for Face Recognition [17.1] 顔認識システムでは、データの完全性とセキュリティを確保する上で、透かしが重要な役割を果たす。
顔認識モデルに対する透かしと敵攻撃の相互作用について検討する。
提案手法は,顔のマッチング精度を67.2%削減する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:58:32 GMT)
Teaching Tailored to Talent: Adverse Weather Restoration via Prompt Pool and Depth-Anything Constraint [15.7] 予測不能な気象入力を処理するために,新しいパイプラインT3-DiffWeatherを導入する。
我々は、サブプロンプトを自律的に組み合わせて天気予報を構築するプロンプトプールを採用している。
提案手法は,様々な合成および実世界のデータセットにまたがって最先端の性能を実現する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 04:46:18 GMT)
Efficient and Effective Model Extraction [15.6] Model extractは、最小限のオーバーヘッドで機械学習・アズ・ア・サービス(ML)APIから機能的に類似したコピーを作成することを目的としている。
本稿では,クエリ準備とトレーニングルーチンの両方に焦点をあて,効率的なモデル抽出(E3)アルゴリズムを提案する。
E3は計算コストを最小化しながら最先端の手法よりも優れた一般化を実現する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 04:29:40 GMT)
Leveraging Local Structure for Improving Model Explanations: An Information Propagation Approach [15.6] 本稿では,各画素の属性スコアを説明情報源としてモデル化したIPropを提案する。
IPropは既存の属性ベースの説明手法と互換性がある。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 19:48:47 GMT)
FairBranch: Mitigating Bias Transfer in Fair Multi-task Learning [15.3] マルチタスク学習(MTL)は、無関係なタスクが相反する勾配で共有パラメータを更新することで、互いに悪影響を及ぼすことに悩む。
これは負の転送と呼ばれ、シングルタスク学習(STL)と比較してMTLの精度が低下する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:06:33 GMT)
Communication and Energy Efficient Federated Learning using Zero-Order Optimization Technique [15.0] Federated Learning(FL)は、複数のユーザがユーザのデータのプライバシを維持しながら、協力的にモデルをトレーニングできる、一般的な機械学習テクニックである。
FLにおける重要な課題は、アップロード方向の通信ボトルネックと、それに対応する機器のエネルギー消費である。
本手法は, 標準勾配法に比べて, 通信オーバヘッドとエネルギーの面で優れていることを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 20:57:22 GMT)
Future-Proofing Medical Imaging with Privacy-Preserving Federated Learning and Uncertainty Quantification: A Review [14.9] AIはすぐに、病気の診断、予後、治療計画、治療後の監視のための臨床実践のルーチンになるかもしれない。
患者のデータを取り巻くプライバシー上の懸念は、医療画像にAIが広く採用される上で大きな障壁となる。
Federated Learning(FL)は、機密データを共有することなく、AIモデルを協調的にトレーニングするためのソリューションを提供する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:55:32 GMT)
Linear Contextual Bandits with Interference [14.8] 線形CB(LinCB)における干渉に対処するための体系的枠組みを導入する。
本稿では、報酬モデリングプロセスにおける干渉効果を明示的に定量化する一連のアルゴリズムを提案する。
提案手法の有効性をシミュレーションおよびMovieLensデータに基づく合成データを用いて実証した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 02:51:00 GMT)
Hyperbolic Image-and-Pointcloud Contrastive Learning for 3D Classification [14.4] 双曲型画像・ポイントクラウドコントラスト学習法(HyperIPC)を提案する。
モジュラー内分岐に対しては、点雲の双曲的埋め込み表現を探索するために、本質的な幾何学的構造に依存する。
クロスモーダルブランチでは、画像を利用してポイントクラウドをガイドし、強力なセマンティック階層的相関を確立する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:13:37 GMT)
IRSC: A Zero-shot Evaluation Benchmark for Information Retrieval through Semantic Comprehension in Retrieval-Augmented Generation Scenarios [14.3] 本稿では,多言語RAGタスクにおける埋め込みモデルの性能評価のためのIRSCベンチマークを提案する。
このベンチマークには、クエリ検索、タイトル検索、パラグラフ検索、キーワード検索、要約検索の5つのタスクが含まれている。
1)IRSCベンチマーク,2)SSCIとRCCIメトリクス,3)埋め込みモデルの言語間制限に関する洞察などです。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 05:39:53 GMT)
Symmetries and Expressive Requirements for Learning General Policies [14.3] 国家の対称性は、計画と一般化計画において重要な役割を果たす。
一般計画の場合、非対称状態の区別も重要である。
一般的なポリシーを学習するための最近のアプローチは、記述論理から派生した状態特徴またはグラフニューラルネットワークを介して学習する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:04:47 GMT)
Incorporating Human Flexibility through Reward Preferences in Human-AI Teaming [14.3] 我々は、人間-AI PbRL協調ゲームを開発し、RLエージェントが、作業目標と人間の協調行動への嗜好を引き出すために、人間-AI PbRL協調ゲームを開発する。
このゲーム定式化では、まず、人間が一定のポリシーに従うか、RLエージェントをオンザフライで適応するかに基づいて、チームのパフォーマンスを評価するために、ヒューマンフレキシビリティの概念を導入する。
私たちはこの2つの側面に沿った特別なケースを強調します。それは、特定オーケストレーションと呼ばれ、人間は柔軟で、エージェントは人間のポリシーを完全にアクセスできます。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:52:34 GMT)
Language-based Audio Moment Retrieval [14.2] 音声モーメント検索(AMR)と呼ばれる新しいタスクを提案し設計する。
従来の言語ベースの音声検索タスクとは異なり、AMRはテキストクエリに基づいて、未編集の長い音声の関連モーメントを予測することを目的としている。
我々は、モーメントアノテーションを付加した大規模なシミュレーションオーディオ録音からなる専用のデータセット、Clatho-Momentを構築した。
次に、AMRタスクの基本的なフレームワークとして、Audio Moment DETR (AM-DETR) と呼ばれるDETRベースのモデルを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 02:24:48 GMT)
XTRUST: On the Multilingual Trustworthiness of Large Language Models [14.1] 大規模言語モデル(LLM)は、自然言語処理(NLP)タスクにまたがる顕著な機能を示している。
現在AIコミュニティが占めている重要な質問は、これらのモデルの能力と制限に関するものだ。
Xは、最初の総合的な多言語信頼性ベンチマークである。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 05:38:33 GMT)
Initialization of Monocular Visual Navigation for Autonomous Agents Using Modified Structure from Small Motion [13.7] 弱視射影シーンにおける単分子エージェントを頑健に初期化するために、最先端の因子グラフ最適化パイプラインを提案する。
提案手法は,弱視射影を示す実写型衛星検査画像に対して検証する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 21:33:14 GMT)
KernJC: Automated Vulnerable Environment Generation for Linux Kernel Vulnerabilities [13.5] Linuxカーネルの脆弱性の再現はシステムセキュリティにおいて重要なタスクである。
選択したカーネルバージョンの複製が脆弱であることを保証するのは難しい。
多くの脆弱性は、デフォルト設定で構築されたカーネルでは再現できない。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 00:56:36 GMT)
Takin: A Cohort of Superior Quality Zero-shot Speech Generation Models [13.4] Takin AudioLLMは、主にTakin TTS、Takin VC、Takin Morphingを含む一連の技術とモデルである。
これらのモデルはゼロショット音声生成が可能であり、実際の人間の音声とほとんど区別できない高品質な音声を生成する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 02:00:54 GMT)
CompoNeRF: Text-guided Multi-object Compositional NeRF with Editable 3D Scene Layout [13.4] テキストから3Dの形式は、AR/VRのための編集可能な3Dシーンを作成する上で重要な役割を果たす。
最近の進歩は、テキストから3Dオブジェクト生成のための事前訓練された拡散モデルとニューラルラジアンス場(NeRF)を融合させる可能性を示している。
編集可能な3Dシーンレイアウトとオブジェクト固有およびシーンワイドガイダンス機構を統合することで,CompoNeRFと呼ばれる新しいフレームワークを提案する。
本フレームワークは,マルチビューCLIPスコア測定によって最大54%の改善を実現している。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 11:28:21 GMT)
Scaling Deep Learning Computation over the Inter-Core Connected Intelligence Processor with T10 [13.3] AIチップ上でコア間通信帯域とオンチップメモリを利用する最初のDLコンパイラであるT10を提案する。
T10は、オンチップメモリ消費とコア間通信オーバーヘッドのトレードオフをグローバルに最適化する。
実際のコア間接続型AIチップであるGraphcore IPUによる評価は、最大3.3$times$パフォーマンス改善を示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 03:17:47 GMT)
Score-based Neural Ordinary Differential Equations for Computing Mean Field Control Problems [13.3] 本稿では,ディープニューラルネットワークに基づく一階および二階のスコア関数を表すニューラルディファレンシャル方程式のシステムを提案する。
本研究では,個々の雑音に対する平均粘性場制御(MFC)問題を,提案したニューラルODEシステムによって構成された制約のない最適化問題に再構成する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 21:45:55 GMT)
Proactive Schemes: A Survey of Adversarial Attacks for Social Good [13.2] コンピュータビジョンにおける敵攻撃は、入力データに微妙な摂動を導入することによって、機械学習モデルの脆弱性を悪用する。
テンプレートと呼ばれる追加信号を用いて入力データを暗号化するプロアクティブなスキーム手法の台頭について検討し,ディープラーニングモデルの性能向上を図る。
この調査は、これらのプロアクティブなスキーム、暗号化と学習プロセスの方法論と、現代のコンピュータビジョンや自然言語処理アプリケーションへの応用を掘り下げている。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 22:31:56 GMT)
Developer Reactions to Protestware in Open Source Software: The cases of color.js and es5.ext [13.0] そこで我々は,2つの有名な抗議ウェア,すなわち color.js と es5-ext について検討した。
抗議者の議論の分類を確立させることで、スタンスを表現したり、技術的緩和の指示を与えるといったポストを特定できる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 02:26:48 GMT)
ComiCap: A VLMs pipeline for dense captioning of Comic Panels [13.0] 本稿では,VLM(Vision-Language Models)を利用して高密度の接地キャプションを得るパイプラインを提案する。
13,000冊の書籍に200万件以上のパネルをアノテートしました。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:59:58 GMT)
HiQA: A Hierarchical Contextual Augmentation RAG for Multi-Documents QA [13.0] コンテンツにカスケードメタデータと複数ルート検索機構を統合した,高度な多文書質問応答(MDQA)フレームワークであるHiQAを提案する。
また、MDQAの評価と研究を行うMasQAというベンチマークもリリースしました。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:25:37 GMT)
Self-attention as an attractor network: transient memories without backpropagation [12.8] 擬似的類似性に類似した局所エネルギー項の微分として自己アテンション層が得られることを示す。
本稿では,自己注意をアトラクタネットワークとして解釈する新たな枠組みを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:19:56 GMT)
3D-JEPA: A Joint Embedding Predictive Architecture for 3D Self-Supervised Representation Learning [12.7] 3D-JEPAは、新しい3D SSRLフレームワークである。
本稿では,十分な情報的コンテキストブロックといくつかの代表的ターゲットブロックを生成するマルチブロックサンプリング戦略を提案する。
対象ブロックの再構成を強化するためのコンテキスト認識デコーダを提案する。
全体として、3D-JEPAは、エンコーダとコンテキスト対応デコーダアーキテクチャを用いて、コンテキストブロックからターゲットブロックの表現を予測する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 06:53:59 GMT)
Towards Universal Large-Scale Foundational Model for Natural Gas Demand Forecasting [12.6] 本稿では,天然ガス需要予測に適した基礎モデルを提案する。
提案手法は,現実シナリオの予測精度を向上させるために,コントラスト学習を利用する。
ENNグループによる大規模データセットを用いた広範囲な実験を行った。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 06:44:29 GMT)
Deep Learning Techniques for Automatic Lateral X-ray Cephalometric Landmark Detection: Is the Problem Solved? [12.4] ケパロメトリランドマーク検出(Cephalometric Landmark Detection, CCL-Detection)データセットは,脳波ランドマーク検出のための最大かつ包括的なデータセットである。
本稿では,最先端のディープラーニング手法が脳波のランドマーク検出にどの程度役立つかを測定する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:03:13 GMT)
Adversarial Attacks on Machine Learning-Aided Visualizations [12.4] ML4VISのアプローチは、ML固有の敵攻撃の影響を受けやすい。
これらの攻撃は視覚化世代を操作でき、アナリストが騙され、判断が損なわれる。
本稿では,ML と ML の両視点の全体像レンズを用いて,敵攻撃による ML 支援視覚化の潜在的な脆弱性について検討する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 13:58:37 GMT)
SelFLoc: Selective Feature Fusion for Large-scale Point Cloud-based Place Recognition [12.4] 物体や建物の表面にはLiDARの点が散在しており、異なる軸に沿って強い形状の先行している。
特定の軸に沿ったメッセージパッシングを強化するために、スタックド非対称畳み込みブロック(SACB)が設計されている。
SFFB(Selective Feature Fusion Block)は,特定の鍵領域における局所的特徴を選択的に増強するために提案される。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 01:42:41 GMT)
Low-degree Security of the Planted Random Subgraph Problem [12.3] 植付されたランダムな部分グラフを最大$kleq n1 - Omega(1)$まで検出する際の低次硬さを証明した。
我々は,(1) ランダム関数のための通信最適化多元的PSMプロトコル,(2) 共有サイズが$(1 + epsilon)log n$ for any $epsilon > 0$ に対して,最大$r$の任意の最小限の連立関係を再構築し,最大$ell = o(epsilon log n)1/(r-1)$までの未定部分集合に対して秘密保持する,という予想を適用した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:42:00 GMT)
Tumbling Down the Rabbit Hole: How do Assisting Exploration Strategies Facilitate Grey-box Fuzzing? [12.3] 本研究は, グレーボックスファジッターの探査支援に関する総合的研究としては初めてである。
そこで本研究では,基本ファジタAFL上で,各シードに対して独自の辞書を生成するCDFUZZを提案する。
CDFUZZは,全ベンチマークプロジェクトのエッジカバレッジを平均16.1%向上させる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:56:00 GMT)
Self-Elicitation of Requirements with Automated GUI Prototyping [12.3] SERGUIは、自動GUIプロトタイピングアシスタントに基づく、要求の自己適用を可能にする新しいアプローチである。
SerGUIは、NLR(Natural Language Requirements)ベースのGUI検索を通じて、大規模なGUIリポジトリに具現化された膨大なプロトタイピング知識を活用する。
提案手法の有効性を評価するため,予備評価を行った。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:40:38 GMT)
VisioPhysioENet: Multimodal Engagement Detection using Visual and Physiological Signals [12.2] 本稿では、視覚的手がかりと生理的信号を利用してエンゲージメントを検出する新しいシステムであるPhysioENetを紹介する。
DAiSEEデータセットの精度は63.09%である。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:36:19 GMT)
Fields of The World: A Machine Learning Benchmark Dataset For Global Agricultural Field Boundary Segmentation [12.0] Fields of The World (FTW)は、農業分野のインスタンスセグメンテーションのための新しいベンチマークデータセットである。
FTWは70,462個のサンプルを持つ以前のデータセットよりも桁違いに大きい。
FTWで訓練されたモデルは、留保国において、ゼロショットと微調整性能が向上していることを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 17:20:58 GMT)
On Collaboration in Distributed Parameter Estimation with Resource Constraints [12.0] センサやエージェントはパラメータ推定の精度を最大化するためにリソース割り当てを最適化する必要がある。
センサやエージェントのデータ収集と協調ポリシー設計の問題を定式化する。
最適なデータ収集と協調ポリシーを学習するために,マルチアームバンディットアルゴリズムを適用した新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:18:27 GMT)
dnaGrinder: a lightweight and high-capacity genomic foundation model [11.6] 現在のゲノム基盤モデルは、しばしば重要なトレードオフに直面している。
我々は、ユニークで効率的なゲノム基盤モデルであるdnaGrinderを紹介する。
dnaGrinderはゲノム配列内の長距離依存関係を管理するのに優れ、性能を損なうことなく計算コストを最小化できる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 03:20:07 GMT)
Towards Synthetic Data Generation for Improved Pain Recognition in Videos under Patient Constraints [11.5] 本研究では、合成データを活用して、ビデオに基づく痛み認識モデルを強化する新しいアプローチを提案する。
本稿では,小さな参加者プールからニュアンスな顔の動きを捉え,リアルな3次元顔モデルを合成するパイプラインを提案する。
このプロセスは8,600個の合成顔を生成し、様々な角度と視点から本物の痛み表現を正確に反映する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:33:57 GMT)
Identified-and-Targeted: The First Early Evidence of the Privacy-Invasive Use of Browser Fingerprinting for Online Tracking [11.0] オンライン広告の領域におけるブラウザフィンガープリントの利用に関する懸念の高まりに対処することが不可欠である。
本稿では,ブラウザのフィンガープリント設定の調整による広告の変化を特定するための新しいフレームワークFPTrace'を提案する。
FPTraceを用いて、ユーザ追跡と広告ターゲティングのためにブラウザの指紋認証が使用されているかどうかを大規模に測定する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 01:39:16 GMT)
TabEBM: A Tabular Data Augmentation Method with Distinct Class-Specific Energy-Based Models [10.9] TabEBMはEnergy-Based Models (EBMs)を用いたクラス条件生成法である
実験の結果,TabEBMは既存の手法よりも高品質で統計的忠実度の高い合成データを生成することがわかった。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:25:59 GMT)
Exploring the traditional NMT model and Large Language Model for chat translation [10.5] 本稿では,Huawei Translation Services Center(HW-TSC)のWMT24チャット翻訳共有タスクへの提出について述べる。
実験では、チャットデータを用いた微調整モデルや、最小ベイズリスク(MBR)復号化や自己学習など、さまざまな戦略を探求した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:48:25 GMT)
Count on Your Elders: Laplace vs Gaussian Noise [10.4] 多くの環境では、ラプラスノイズはガウスノイズよりも好まれるかもしれないと我々は主張する。
ガウス機構によって付加される雑音は、常に同値な分散のラプラスノイズに置き換えることができることを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 13:15:47 GMT)
PALLM: Evaluating and Enhancing PALLiative Care Conversations with Large Language Models [10.3] 大規模言語モデル(LLM)は、複雑なコミュニケーションメトリクスを評価するための新しいアプローチを提供する。
LLMは受動的センシングシステムとジャスト・イン・タイム・イン・タイム・イン・イン・介入システムとの統合を通じて、分野を前進させる可能性を提供する。
本研究は, 言語, 文脈内学習, 推論能力を活用した緩和ケアコミュニケーションの質評価手法としてLLMについて検討する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 13:03:24 GMT)
Joint Pruning and Channel-wise Mixed-Precision Quantization for Efficient Deep Neural Networks [10.2] ディープニューラルネットワーク(DNN)は、エッジデバイスへのデプロイメントに重大な課題をもたらす。
この問題に対処する一般的なアプローチは、プルーニングと混合精度量子化である。
そこで本研究では,軽量な勾配探索を用いて共同で適用するための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:06:26 GMT)
WebQuest: A Benchmark for Multimodal QA on Web Page Sequences [10.0] WebQuestは、複数のWebページにわたる推論を必要とする、複数ページの質問回答データセットである。
本データセットは,多くのWebページから情報抽出,マルチモーダル検索,および情報の合成を評価する。
我々は、GPT-4V、Gemini Flash、Claude 3、InstructBLIP、PaliGemmaなどのオープンソースモデルなど、主要なプロプライエタリなマルチモーダルモデルを評価します。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:38:02 GMT)
Semantics-Controlled Gaussian Splatting for Outdoor Scene Reconstruction and Rendering in Virtual Reality [9.9] Gaussian Splatting (GS)はバーチャルリアリティー(VR)における新しいビュー合成とリアルタイムレンダリングを可能にする
シーンエンハンスメントや3Dアセットを組み込むためには、クラスごとのガウスのセグメンテーションが不可欠である。
本研究ではセグメンテーション駆動型GSアプローチであるSemantics-Controlled GS (SCGS)を提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 10:44:42 GMT)
A Mobile Payment Scheme Using Biometric Identification with Mutual Authentication [9.9] キャッシュレス決済システムには、キャッシュよりも多くのメリットがあるが、欠点もある。
フェイク端末、スキミング、無線接続、リレー攻撃は永続的な問題である。
生体認証に基づく新しいモバイル決済方式を提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:37:55 GMT)
Multilingual Transfer and Domain Adaptation for Low-Resource Languages of Spain [9.3] スペイン語からアラゴネーズ(es-arg)、スペイン語からアラン語(es-arn)、スペイン語からアストゥリアン語(es-ast)の3つの翻訳作業に参加した。
これら3つの翻訳タスクでは、多言語翻訳、正規化ドロップアウト、前方翻訳、前方翻訳、音声認識、アンサンブル学習など、深層トランスフォーマー・ビッグアーキテクチャのトレーニングに基づくニューラルマシン翻訳(NMT)モデルに対するトレーニング戦略を用いる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:46:27 GMT)
Every Dataset Counts: Scaling up Monocular 3D Object Detection with Joint Datasets Training [9.3] 本研究では,多種多様な3次元および2次元データセットを用いたモノクロ3次元物体検出モデルの学習パイプラインについて検討した。
提案フレームワークは,(1)様々なカメラ設定にまたがって機能するロバストなモノクル3Dモデル,(2)異なるクラスアノテーションでデータセットを適応するための選択学習戦略,(3)2Dラベルを用いた擬似3Dトレーニング手法により,2Dラベルのみを含むシーンにおける検出性能を向上させる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 10:18:44 GMT)
Learning Linear Dynamics from Bilinear Observations [8.2] 本稿では,線形状態遷移と双線形観測を併用した部分的に観察された力学系の実現について考察する。
プロセスと測定ノイズの非常に穏やかな仮定の下で、未知の力学行列を学習するための有限時間解析を提供する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 23:11:47 GMT)
Subsampling Suffices for Adaptive Data Analysis [8.2] ほとんどの古典的なテクニックは、データセットがアナリストのクエリとは独立していると仮定し、データセットが複数の適応的に選択されたクエリのために再利用される一般的な設定に分解する。
クエリが適応的に選択された場合でも、クエリが引き続き表現されるという、非常に単純な仮定のセットを特定します。
このサブサンプルベースのフレームワークの単純さにより、以前の作業でカバーされていないさまざまな現実世界のシナリオをモデル化することができる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:42:58 GMT)
Can We Count on LLMs? The Fixed-Effect Fallacy and Claims of GPT-4 Capabilities [8.1] いくつかの決定論的タスクにおけるGPT-4の性能の測定について述べる。
タスク・プロンプトや入力集団における一見自明な修正は、サンプリング効果によって説明できるよりもはるかに大きな差をもたらすことが判明した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 17:34:07 GMT)
From Passive Watching to Active Learning: Empowering Proactive Participation in Digital Classrooms with AI Video Assistant [7.9] SAM(Study with AI Mentor)は、教育ビデオと、大規模言語モデルを利用したコンテキスト対応チャットインターフェースを統合する高度なプラットフォームである。
140人の参加者を対象としたクラウドソーシングによるユーザスタディにおいて、SAMは事前および事前知識テストによって評価された。
結果はSAMユーザーが96.8%の精度でより優れた知識を得られることを示した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:12:36 GMT)
Resource Efficient Boolean Function Solver on Quantum Computer [7.8] グロバーのアルゴリズムは、量子コンピュータ上の非線形方程式系を解く最もよく知られた量子探索アルゴリズムの1つである。
本稿では,Groverのフレームワーク下での反復効率向上のための3つの新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:10:10 GMT)
DataGpt-SQL-7B: An Open-Source Language Model for Text-to-SQL [7.8] 我々は,データアクセスと分析を非専門ユーザ向けに民主化する,コンパクトで微調整されたモデルと自己定義機構のスイートを提案する。
我々のシステムであるDataGpt-sqlは、スパイダーデブで87.2%の精度を達成した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 11:38:08 GMT)
Bridging Environments and Language with Rendering Functions and Vision-Language Models [7.7] 視覚言語モデル(VLM)は、基底言語に非常に大きな可能性を秘めている。
本稿では,言語条件付きエージェント(LCA)構築問題の新しい分解法を提案する。
また,VLMを用いたLCAの高速化と品質向上についても検討した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:24:07 GMT)
ReLEP: A Novel Framework for Real-world Long-horizon Embodied Planning [7.7] 本稿では,RelePについて紹介する。
コアには細調整された大きな視覚言語モデルがあり、プランをスキル機能のシーケンスとして定式化している。
ReLEPは、幅広い日々のタスクをこなし、他の最先端のベースラインメソッドより優れている。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 01:47:23 GMT)
Machine Learning Aided Scattering Mitigation in a Quantum System [7.6] 我々はLong Short-Term Memory (LSTM) を用いて量子系の散乱による有害な影響を軽減する。
我々の装置では、高温のルビジウム蒸気の4波混合により2モードの励起光を生成し、1つのモードが散乱器によって量子相関を乱す。
我々は,光子損失が大きいにもかかわらず,74.7%の相互情報の回復と87.7%の2モードのスクイージングの回復を実証した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 21:11:26 GMT)
Signatures of quantum criticality in the complex inverse temperature plane [7.6] 線形あるいは閉曲線上の異なるフィッシャー零点を同定し、1次元逆場イジングモデルに対する領域壁励起や制限中間子との対応を解明する。
フィッシャー零点の交叉挙動は、量子相転移の近傍における臨界性の興味深い図である。
我々の結果は、量子相転移のためのフィッシャー零点の重要な特徴を明白に示し、量子臨界性を探るために新しい経路を開く。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:57:11 GMT)
Facing Asymmetry -- Uncovering the Causal Link between Facial Symmetry and Expression Classifiers using Synthetic Interventions [7.6] ブラックボックスモデルは片側性顔面麻痺患者のパフォーマンスを低下させる。
我々は、因果推論からの洞察を用いて仮説を調査する。
本研究は,ブラックボックスモデルの挙動に影響を及ぼす因果因子を同定するためのケーススタディとして機能する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:53:35 GMT)
Algorithmic Drift: A Simulation Framework to Study the Effects of Recommender Systems on User Preferences [7.6] 本稿では,長期シナリオにおけるユーザ-リコメンダ間のインタラクションを模倣するシミュレーションフレームワークを提案する。
本稿では,ユーザの嗜好に対するアルゴリズムの影響を定量化する2つの新しい指標について紹介する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 21:54:22 GMT)
Inferring Scientific Cross-Document Coreference and Hierarchy with Definition-Augmented Relational Reasoning [7.1] 本稿では,全文文献を検索することで,概念記述の文脈依存的な定義を生成する手法を提案する。
さらに,2つの概念がどのように関連しているか,あるいは異なるのかを記述したリレーショナル定義を生成し,論文間のリンクの推論に関わる爆発に対処する効率的な再分類アプローチを設計する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:18:34 GMT)
Benchmarking Robustness of Endoscopic Depth Estimation with Synthetically Corrupted Data [7.0] 本稿では,内視鏡的深度推定モデルのロバスト性を評価するためのベンチマークを提案する。
本稿では, 誤差, 精度, 堅牢性の尺度を組み合わせた新しい尺度であるDepth Estimation Robustness Score(DERS)を紹介する。
本フレームワークを用いた2つの単分子深度推定モデルの網羅的解析により, 悪条件下での信頼性に関する重要な情報を明らかにした。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 13:04:54 GMT)
Artificial Human Intelligence: The role of Humans in the Development of Next Generation AI [6.9] 我々は、倫理的、責任があり、堅牢なインテリジェントシステムを開発する上で人間が果たす重要な役割に焦点を当て、人間とマシンインテリジェンスの間の相互作用を探求する。
我々は、次世代AI開発における人間中心の方向性を提案するために、共生設計の利点を活かして、将来的な視点を提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:02:20 GMT)
Tarsier: Recipes for Training and Evaluating Large Video Description Models [6.3] 本稿では,大規模ビデオ言語モデルのファミリであるTarsierを紹介した。
厳密に設計された2段階のトレーニング手順により、Tarsierモデルは既存のオープンソースモデルよりもはるかに強力なビデオ記述能力を示す。
ビデオの説明に加えて、Tarsierは汎用的なジェネラリストモデルであることが証明され、9つの公開ベンチマークで新しい最先端の結果が得られた。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 04:41:08 GMT)
Disentangling Age and Identity with a Mutual Information Minimization Approach for Cross-Age Speaker Verification [6.2] 本稿では,相互情報(MI)最小化に基づくCASVの非交叉表現学習フレームワークを提案する。
正試料と負試料の年齢差を用いて,老化を考慮したMI最小化損失関数を提案する。
実験の結果,提案手法はVox-CAの複数のクロスエイジテストセットにおいて,他の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 11:08:23 GMT)
A Formalization of Image Vectorization by Region Merging [6.2] 画像ベクトル化は粗い領域のマージによって構築可能であることを示す。
我々は、任意の領域分割から誘導される双対グラフと原始グラフの交互操作により、この手法を定式化する。
また、全てのベクトル化法で暗黙的に曲線の滑らか化は、形状保存アフィンスケール空間によって実現できることを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 10:04:44 GMT)
Logical Characterizations of Recurrent Graph Neural Networks with Reals and Floats [6.2] 本稿では,2つのシナリオにおいて,繰り返しグラフニューラルネットワーク(GNN)の正確な論理的特徴について述べる。
フロートに対して、繰り返しGNNと一致する形式主義は数えられるルールベースのモーダル論理であり、実数に対しては適切な無限のモーダル論理を用いる。
キャラクタリゼーションを適用することで、モナディック二階述語論理で定義可能なグラフ特性と比較して、無限論理と規則論理は等しく表現力があることが証明できる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 11:06:21 GMT)
Goal-guided Generative Prompt Injection Attack on Large Language Models [6.2] 大規模言語モデル(LLM)は、大規模ユーザ指向自然言語タスクの強力な基盤を提供する。
多数のユーザは、ユーザインターフェースを通じて、逆テキストや命令を容易に注入することができる。
これらの戦略が攻撃の成功率とどのように関係し、モデルセキュリティを効果的に改善するかは不明である。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 05:16:59 GMT)
Scenario of Use Scheme: Threat Model Specification for Speaker Privacy Protection in the Medical Domain [5.4] 本稿では,話者のプライバシを守らなければならない相手を特徴付けるアタッカーモデルと,その防衛を規定するプロテクタモデルとを組み込んだユースケースシナリオ・オブ・ユース・スキームを提案する。
本稿では,特定のシナリオ・オブ・ユース(Senario of Use)の具体例と,パーキンソン検出の実用性を維持しつつ,ジェンダー推論攻撃から話者データを保護するための一連の実験について述べる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:07:47 GMT)
MirrorStories: Reflecting Diversity through Personalized Narrative Generation with Large Language Models [5.4] 本研究では,パーソナライズされた「ミラーストーリー」作成におけるLarge Language Models(LLM)の有効性について検討する。
ミラーストリーズ(MirrorStories)は、名前、性別、年齢、民族性、読者の興味、ストーリーモラルといった要素を統合した1500のパーソナライズされた短編小説のコーパスである。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 01:30:14 GMT)
GraphGI:A GNN Explanation Method using Game Interaction [5.1] グラフニューラルネットワーク(GNN)は、様々な領域で広く利用されている。
現在のグラフ説明技術は、キーノードやエッジの識別に重点を置いており、モデル予測を駆動する重要なデータ機能に寄与している。
本稿では,対話力の高い連立関係を識別し,説明文として提示する新しい説明法GraphGIを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 03:24:31 GMT)
Semi-Supervised Learning Approach for Efficient Resource Allocation with Network Slicing in O-RAN [5.1] 本稿では資源配分問題に対する革新的なアプローチを紹介する。
Open Radio Access Network (O-RAN) におけるネットワークスライシングとリソース割り当てのために、複数の独立したx-appplications (xAPPs) を協調することを目的としている。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 19:37:20 GMT)
Order of Magnitude Speedups for LLM Membership Inference [5.1] 大規模言語モデル(LLM)は、コンピューティングを広く革新させるという約束を持っているが、その複雑さと広範なトレーニングデータもまた、プライバシの脆弱性を露呈している。
LLMに関連する最も単純なプライバシーリスクの1つは、メンバーシップ推論攻撃(MIA)に対する感受性である。
文書がモデルのトレーニングセットに属しているか否かを判断するために,小さな量子レグレッションモデルのアンサンブルを利用する低コストMIAを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 17:48:58 GMT)
Exploring the Impact of Outlier Variability on Anomaly Detection Evaluation Metrics [4.9] 本研究では,異なる条件下で広く使用されている3つの異常検出指標の挙動について検討する。
本稿では,これらの指標の従来の理解に挑戦し,様々な条件下でのニュアンスな行動を明らかにする。
本研究は、異常検出における計量選択と解釈のより洗練された理解に寄与し、この分野の研究者と実践者の両方に貴重な洞察を提供する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 11:39:09 GMT)
(In)Security of Mobile Apps in Developing Countries: A Systematic Literature Review [4.9] 発展途上国では、教育、金融、農業、医療などいくつかの重要な分野が、主に携帯端末上でモバイルアプリ技術を通じてサービスを提供している。
途上国では、モバイルアプリのセキュリティが最重要課題となっている。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:24:51 GMT)
Potential Field as Scene Affordance for Behavior Change-Based Visual Risk Object Identification [4.9] 行動変化に基づく視覚的リスクオブジェクト識別(Visual-ROI)について検討する。
既存の手法はしばしば空間的精度と時間的一貫性に重大な制限を呈する。
本稿では,これらの課題を克服するために,バードアイビュー表現を用いた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:17:50 GMT)
Real-Time Detection of Electronic Components in Waste Printed Circuit Boards: A Transformer-Based Approach [4.8] 我々は、WPCBから異なるタイプの電子部品を選択的に分解する実践的アプローチを提案してきた。
本稿では,実時間検出TRansformerモデルアーキテクチャの電子部品検出と局所化のリアルタイム精度を評価する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 22:59:52 GMT)
Improving Emotional Support Delivery in Text-Based Community Safety Reporting Using Large Language Models [4.7] 130の高等教育機関から,8,239件のインシデントに対して57,114件のメッセージを含む2年間のチャットログを分析した。
調査の結果, インシデントの種類, サービス時間, サポート時間の経時的変化など, ディスペンサーによる感情支援の有意な変化がみられた。
感情的サポートの一貫性と品質を改善するため,我々は細調整されたLarge Language Model(LLM)を開発し,実装した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 03:47:02 GMT)
A Distributed Approach to Autonomous Intersection Management via Multi-Agent Reinforcement Learning [4.7] 高度な補助システムに3Dサラウンドビュー技術を活用することで、自律走行車は集中制御装置を必要とせずに交差点のシナリオを正確にナビゲートできることを示す。
従来型のAIM技術に対する革新的な代替手段としてのアプローチを検証し,その結果の完全な有効性を確保する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:04:50 GMT)
Neural Coordination and Capacity Control for Inventory Management [4.5] この論文は、キャパシティ制御機構のバックテストと、在庫管理のための深層強化学習の最近の進歩と相容れないキャパシティ制御機構のバックテストとバックテストとは何を意味するのかという質問に動機づけられている。
まず、Amazonのキャパシティ制限の1つの歴史的なサンプルパスしか持たないため、実世界のシナリオの空間をカバーする制約パスの分布からサンプリングする手法を提案する。
第2に,Madeka et al. 2022のExo-IDP(Exogenous Decision Process)の定式化を拡張して,定期レビュー在庫管理問題に留意し,一定の容量を示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:23:10 GMT)
Exploring the potential of collaborative UAV 3D mapping in Kenyan savanna for wildlife research [4.5] 生物多様性に基づく保護アプリケーションは、研究者に多くのデータ取得の利点を示してきた。
組み込みデータ処理ハードウェアを備えたUAVプラットフォームは、3D環境マッピング、監視、監視ソリューションを通じて、保全上の課題をサポートすることができる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:33:02 GMT)
PDT: Uav Target Detection Dataset for Pests and Diseases Tree [4.5] 本研究は,樹木害虫や病害虫の検出を目的とした,UAVベースの高精度データセットの開発である。
公開データセットとネットワークデータを集約することで、Common Weed and Cropデータセットを導入します。
最後に, 雑草, 害虫, 病気の作物画像の高精度検出のためのYOLO-Dense Pest (YOLO-DP) モデルを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 02:37:27 GMT)
Can Go AIs be adversarially robust? [4.5] 自然対策を加えることで、Goの堅牢性が達成できるかどうかを考察する。
これらの防御策のいくつかは、以前発見された攻撃から守られているが、新しく訓練された敵には耐えられない。
我々の研究結果は、堅牢なAIシステムの構築は、非常に超人的なシステムであっても、最も難易度の高い設定で難しいことを示唆している。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:38:38 GMT)
Interpretable statistical representations of neural population dynamics and geometry [4.5] そこで我々は,manifold dynamics を局所流れ場に分解し,それらを共通潜在空間にマッピングする表現学習手法 MARBLE を提案する。
シミュレーションされた非線形力学系,リカレントニューラルネットワーク,および霊長類および歯列類からの実験的単一ニューロン記録において,創発的低次元潜伏表現が発見された。
これらの表現はニューラルネットワークや動物間で一貫性があり、認知計算の堅牢な比較を可能にする。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 06:54:53 GMT)
Deep Multimodal Collaborative Learning for Polyp Re-Identification [4.4] 大腸内視鏡によるポリープ再同定は、大きなギャラリーの同じポリープと異なるカメラで撮影された異なるビューの画像とを一致させることを目的としている。
ImageNetデータセットでトレーニングされたCNNモデルを直接適用する従来のオブジェクトReIDの手法は、不満足な検索性能をもたらす。
本稿では,ポリプ再同定のためのDMCLという新しい多モーダル協調学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:35:17 GMT)
Do LLMs Know When to NOT Answer? Investigating Abstention Abilities of Large Language Models [4.4] Abstention Ability (AA) は、Large Language Model (LLM) の信頼性の重要な側面である。
これまでの研究では、AAを改善する試みがあったが、標準化された評価方法が欠如していた。
本稿では,ブラックボックス評価手法と新しいデータセットAbstain-QAを導入することで,このギャップを埋める。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:25:58 GMT)
Learning Compact Channel Correlation Representation for LiDAR Place Recognition [4.4] 我々は,LDAR位置認識のためのC3Rという,コンパクトなチャネル相関表現を学習するための新しい手法を提案する。
提案手法は,特徴行列をより小さなグループに分割し,グループ的な共分散行列を計算し,学習可能な集約戦略を用いて集約する。
大規模でパブリックな4つのLiDAR位置認識データセットについて広範な実験を行い、精度とロバスト性に対するアプローチの優位性を検証する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:40:22 GMT)
Improving Robustness and Reliability in Medical Image Classification with Latent-Guided Diffusion and Nested-Ensembles [4.2] 深層学習は高い予測精度と不確実性推定を実現することが示されている。
テスト時の入力画像のゆがみは、パフォーマンスを著しく低下させる可能性がある。
LaDiNEは,入力画像から情報および不変潜伏変数を推定できる,新規で堅牢な確率的手法である。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 19:33:34 GMT)
Distribution-Level Feature Distancing for Machine Unlearning: Towards a Better Trade-off Between Model Utility and Forgetting [4.2] 近年の研究では、トレーニングされたモデルを忘れるべきデータを学習させるために、さまざまな機械学習アルゴリズムが提案されている。
本稿では,相関崩壊を防止しつつ,効率よくインスタンスを忘れる新しい手法であるDLFDを提案する。
提案手法はデータサンプルを合成し,生成したデータ分布が特徴空間で忘れられているサンプルの分布から遠ざかるようにする。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 05:27:24 GMT)
Exact Fisher zeros and thermofield dynamics across a quantum critical point [4.1] 開量子系の量子相転移や非単位力学をよりよく理解するために、フィッシャーゼロがどのように用いられるかを示す。
我々は、Z$を量子回路で実現し、探索することができることを指摘している。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 15:17:19 GMT)
Testing Dependency of Weighted Random Graphs [4.1] 本研究では,2つのランダムグラフ間のエッジ依存性を検出するタスクについて検討する。
一般のエッジウェイト分布に対して、最適テストが情報理論上可能か不可能となるしきい値を確立する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:07:57 GMT)
Flight: A FaaS-Based Framework for Complex and Hierarchical Federated Learning [4.0] Federated Learning(FL)は、モデルを分散デバイス上でトレーニングし、中央サーバに集約する分散機械学習パラダイムである。
これは複雑な階層的な多層トポロジをサポートし、非同期アグリゲーションをサポートし、データプレーンからコントロールプレーンを分離する新しいFLフレームワークである。
その結果,FlightはFlighterを超えるスケールで最大2048個の同時デバイスをサポートし,FLを複数のモデルで削減できることがわかった。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 22:49:27 GMT)
SLIMER-IT: Zero-Shot NER on Italian Language [4.0] 定義とガイドラインに富んだプロンプトを活用するゼロショットNERのための命令チューニング手法であるSLIMER-ITを紹介する。
他の最先端モデルと比較すると、SLIMER-ITの非表示エンティティタグに対する優位性が示される。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:57:25 GMT)
Data Poisoning-based Backdoor Attack Framework against Supervised Learning Rules of Spiking Neural Networks [3.9] スパイキングニューラルネットワーク(SNN)は、低エネルギー消費と高ロバスト性で知られている。
本稿では,バックドア攻撃時の教師付き学習規則により訓練されたSNNの堅牢性について検討する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 02:15:19 GMT)
A Survey of Stance Detection on Social Media: New Directions and Perspectives [3.9] 姿勢検出は 感情コンピューティングにおける 重要なサブフィールドとして現れました
近年は、効果的な姿勢検出手法の開発に対する研究の関心が高まっている。
本稿では,ソーシャルメディア上での姿勢検出手法に関する包括的調査を行う。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 03:06:25 GMT)
Code-Survey: An LLM-Driven Methodology for Analyzing Large-Scale Codebases [3.8] 我々は,大規模規模の探索と解析を目的とした最初のLCM駆動型手法であるCode-Surveyを紹介した。
調査を慎重に設計することで、Code-Surveyはコミット、Eメールなどの構造化されていないデータを、構造化、構造化、分析可能なデータセットに変換する。
これにより、複雑なソフトウェアの進化を定量的に分析し、設計、実装、保守、信頼性、セキュリティに関する貴重な洞察を明らかにすることができる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 17:08:29 GMT)
GS-Net: Global Self-Attention Guided CNN for Multi-Stage Glaucoma Classification [3.8] 緑内障は、タイムリーに検出されない限り、不可逆的な盲目を引き起こす一般的な眼疾患である。
本稿では,効率的な多段階緑内障分類のためのグローバル自己注意型ネットワークGS-Netを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 13:30:38 GMT)
Layer-wise Model Merging for Unsupervised Domain Adaptation in Segmentation Tasks [3.8] フリーでトレーニングされたモデルの豊富さを活用して、モデルマージにコストフリーのアプローチを導入します。
初期レイヤを統一しながら、タスク固有の最終レイヤの特異性を維持することを目的としている。
このアプローチは、パフォーマンスを高めるために不可欠な、すべてのレイヤにおけるパラメータの一貫性を保証する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:19:30 GMT)
Gapless Spin Liquid and Non-local Corner Excitation in the Spin-1/2 Heisenberg Antiferromagnet on Fractal [3.8] Sierpi'nski ガスケット上のスピン-1/2$反強磁性ハイゼンベルクモデルについて検討する。
フラクタル多孔質の特徴は、エキゾチックな量子状態を示す新しい種類のフラストレーションを生み出す。
我々の結果は、このフラクタルスピン系の複数の重要な性質を不明瞭に指摘している。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 17:09:25 GMT)
We Have a Package for You! A Comprehensive Analysis of Package Hallucinations by Code Generating LLMs [3.5] パッケージ幻覚は、大規模な言語モデルを使用してコードを生成する際に、ファクトコンフリクトのエラーから生じる。
本稿では,プログラム言語間におけるパッケージ幻覚の厳密かつ包括的評価を行う。
幻覚パッケージの平均パーセンテージは、商用モデルでは少なくとも5.2%、オープンソースモデルでは21.7%である。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 21:46:56 GMT)
On the calibration of powerset speaker diarization models [3.4] パワーセット話者ダイアリゼーションモデルの校正について検討する。
トップラベルの信頼性は、高いエラー領域を確実に予測するために使用することができる。
低信頼領域でのトレーニングは、より良いキャリブレーションモデルを提供する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:56:42 GMT)
A Scoping Review of Earth Observation and Machine Learning for Causal Inference: Implications for the Geography of Poverty [3.4] コンピュータビジョンの初期の研究は、生活状態を推定するために予測モデルを使用した。
近年の作業は、この結果を予測するためにEOデータを使うだけでなく、因果推論を行うためにも使われている。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 20:50:21 GMT)
Lattice-Based Vulnerabilities in Lee Metric Post-Quantum Cryptosystems [3.3] 量子コンピューティングに直面したセキュアな暗号システムの必要性から、量子後暗号は注目されている。
我々は、ジェネリックリー計量に基づくMcEliece型暗号システムを検討し、格子ベースの攻撃に対するセキュリティを評価する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:21:33 GMT)
Design and Evaluation of a CDSS for Drug Allergy Management Using LLMs and Pharmaceutical Data Integration [3.3] Heliotはドラッグアレルギー管理のための革新的なCDSSである。
LLM(Large Language Models)と総合的な薬品データリポジトリを統合する。
ヘリオットの高精度、精度、リコール、F1スコアは、複数の実験走行で100%に達した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:55:10 GMT)
Revealing the propagation dynamic of Laguerre-Gaussian beam with two Bohm-like theories [3.3] x-ボーム理論とp-ボーム理論を用いて、単モードと重畳モードラゲール・ガウスビームの位置と運動量軌道を構築する。
発振速度と回転速度が初期位置と伝播距離に及ぼす影響を定量化し、自由空間においてもLGビームがサブルミナル効果を示すことを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 01:08:44 GMT)
Content Significance Distribution of Sub-Text Blocks in Articles and Its Application to Article-Organization Assessment [3.2] サブテキストブロックのコンテンツ重要度分布(CSD)の概念を定式化する。
特に,Hugging FaceのSentence Transformerを利用して文脈文の埋め込みを生成する。
近似 CSD-1 は正確な CSD-1 とほぼ同一であることを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 11:59:02 GMT)
Chasing the Shadows: TTPs in Action to Attribute Advanced Persistent Threats [3.2] 本研究は,CAPTAINという属性法を提示することにより,属性過程における脅威分析を支援することを目的とする。
提案手法は、Cosine、Euclidean、Longest Common Subsequenceといった従来の類似度対策よりも優れている。
CAPTAINは61.36%(トップ-1)と69.98%(トップ-2)の精度で属性を行い、既存の最先端属性法を上回ります。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:59:27 GMT)
Semi-strong Efficient Market of Bitcoin and Twitter: an Analysis of Semantic Vector Spaces of Extracted Keywords and Light Gradient Boosting Machine Models [3.2] 本研究は,5年間の変動期間におけるビットコイン市場における効率的市場仮説の検証を延長するものである。
ターゲットトピック"Bitcoin"を含む28,739,514の資格付きツイートを分析します
以上の結果から, 78.06% (83.08%), 84.63% (87.77%), 94.03% (94.60%) の時間帯, 4時間ごと, 毎日の強気(ビーリッシュ)市場の動きは, オーガニックツイート内での公開情報によるものであることが示唆された。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 11:42:23 GMT)
Toward Unified Practices in Trajectory Prediction Research on Drone Datasets [3.1] 高品質なデータセットの可用性は、自動運転車の行動予測アルゴリズムの開発に不可欠である。
本稿では,動き予測研究における特定のデータセットの利用の標準化の必要性を強調した。
これを実現するためのツールとプラクティスのセットを提案します。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:18:59 GMT)
Interactive Example-based Explanations to Improve Health Professionals' Onboarding with AI for Human-AI Collaborative Decision Making [3.0] 成長する研究は、人間とAIの協調的な意思決定において、ユーザの意思決定フェーズにおけるAI説明の使用について調査している。
以前の研究では、間違ったAI出力に対する過信の問題が見つかった。
医療従事者のAIによるオフボード化を改善するために,インタラクティブな例に基づく説明を提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:20:09 GMT)
Grounded Computation & Consciousness: A Framework for Exploring Consciousness in Machines & Other Organisms [2.9] 本稿では,意識のオントロジ的基盤の必要性について論じるとともに,計算記述をオントロジ的基質に基底付けるための形式的枠組みを導入する。
2つのシステム間の定性的経験の差を推定する手法が実証された。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:34:05 GMT)
WeQA: A Benchmark for Retrieval Augmented Generation in Wind Energy Domain [2.9] ドメイン関連RAGベンチマークを生成するための包括的なフレームワークを提案する。
我々のフレームワークは、人間(ドメインの専門家)-AI大言語モデル(LLM)による自動質問応答生成に基づいている。
風力エネルギー領域の第一級ベンチマークであるWeQAを導入することで、この枠組みを実証する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 22:50:15 GMT)
The Digital Transformation in Health: How AI Can Improve the Performance of Health Systems [2.8] モバイルヘルスは、医療提供と患者のエンゲージメントに革命をもたらす可能性がある。
適応的な介入の配信を可能にする人工知能と強化学習プラットフォームを提案する。
このプラットフォームの柔軟性は、さまざまなモバイルヘルスアプリケーションやデジタルデバイスに接続し、パーソナライズされたレコメンデーションを送信することで、デジタルツールがヘルスシステムの結果に与える影響を大幅に改善することができる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 13:52:15 GMT)
On the Principles behind Opinion Dynamics in Multi-Agent Systems of Large Language Models [2.8] 対話型大言語モデル(LLM)の集団内における意見の進化について研究する。
我々は、他のLSMの意見とコンセンサスを求めるLLMの傾向に基づいて、意見交換を促進するバイアスを識別する。
これらのバイアスは、意見の変化に対する説得力のある理由の欠如、議論への参加意欲、割当値の配分などの影響を受けている。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 17:37:28 GMT)
Do the Right Thing, Just Debias! Multi-Category Bias Mitigation Using LLMs [2.8] 本稿では,9つの社会的バイアスカテゴリーを含む1507の文対を慎重にキュレートした新しいデータセットであるANUBISを紹介する。
我々は,T5 のような最先端のモデルを評価し,効果的なバイアス緩和のために Supervised Fine-Tuning (SFT), Reinforcement Learning (PPO, DPO), In-Context Learning (ICL) を利用する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:05:10 GMT)
From Pixels to Words: Leveraging Explainability in Face Recognition through Interactive Natural Language Processing [2.8] 顔認識(FR)は深層学習の発展とともに大きく進歩し、いくつかの応用において高い精度を実現している。
これらのシステムの解釈可能性の欠如は、説明責任、公平性、信頼性に関する懸念を引き起こす。
モデルに依存しない説明可能な人工知能(XAI)と自然言語処理(NLP)技術を組み合わせることにより、FRモデルの説明可能性を高めるインタラクティブなフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 13:40:39 GMT)
Open Conversational LLMs do not know most Spanish words [2.7] 我々は,オープンソースチャットLLMがスペイン語の単語に対して持つ知識を,参照辞書における単語のサンプルをテストすることによって評価する。
その結果、オープンソースのチャットLLMは、単語の重要部分に対して誤った意味を生じさせ、文脈で文章を書くためにほとんどの単語を正しく利用できないことがわかった。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 13:25:01 GMT)
Nearly degenerate ground states of a checkerboard antiferromagnet and their bosonic interpretation [2.7] チェッカーボード格子上の反強磁性(AF)結合を持つ系は強いフラストレーションを受けており、2次元から1次元のクロスオーバーと関連していることを示す。
Projectedangled Simplex States Entx network ansatz を用いて、フラストレーション領域におけるほぼ退化状態の多数を同定する。
対応するボゾン像は低エネルギー物理学の直感的な理解を与える。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:37:17 GMT)
Unveiling Language Competence Neurons: A Psycholinguistic Approach to Model Interpretability [2.7] 本研究では,3つの課題にまたがる言語モデルにおけるニューロンレベルの表現について,心理言語学的パラダイムを用いて検討する。
以上の結果から,GPT-2-XLは音形課題に苦しむ一方で,音性関連と暗黙の因果性の両方において,人間のような能力を示すことが示唆された。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:40:33 GMT)
Selection of Prompt Engineering Techniques for Code Generation through Predicting Code Complexity [2.6] 本稿では,クエリを分類するプロキシとしてコード複雑性を利用するPET非依存の選択モデルであるPET-Selectを提案する。
PET-Selectは単純な問題と複雑な問題を区別し、各クエリの複雑性レベルに最も適したPETを選択することができる。
MBPPとHumanEvalベンチマークによる評価では、パス@1の精度が1.9%向上し、トークン使用率が74.8%減少した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 19:28:55 GMT)
Problem-oriented AutoML in Clustering [2.5] Problem-oriented AutoML in Clustering (PoAC)フレームワークは、クラスタリングタスクを自動化する新しいフレキシブルなアプローチを導入している。
PoACはクラスタリング問題、CVI、メタ機能の間の動的接続を確立し、ユーザーはこれらのコンポーネントをカスタマイズできる。
PoACはアルゴリズムに依存しないため、追加のデータや再トレーニングを必要とせずに、異なるクラスタリング問題にシームレスに適応する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:25:53 GMT)
Lessons for Editors of AI Incidents from the AI Incident Database [2.5] AIインシデントデータベース(AIID)は、AIインシデントをカタログ化し、インシデントを分類するプラットフォームを提供することでさらなる研究を支援するプロジェクトである。
この研究は、AIIDの750以上のAIインシデントのデータセットと、これらのインシデントに適用された2つの独立した曖昧さをレビューし、AIインシデントをインデックス化し分析する一般的な課題を特定する。
我々は、インシデントプロセスが原因、害の程度、重大さ、あるいは関連するシステムの技術的詳細に関連する不確実性に対してより堅牢になるよう、軽減策を報告する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 19:46:58 GMT)
HLB: Benchmarking LLMs' Humanlikeness in Language Use [2.4] 20大言語モデル(LLM)を評価する総合的人間類似度ベンチマーク(HLB)を提案する。
実験では2000人以上の被験者から回答を収集し,LSMの成果と比較した。
以上の結果から,LLMが様々な言語レベルにおいてヒトの反応をいかにうまく再現するかの微妙な相違が明らかとなった。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:02:28 GMT)
Nine-year-old children outperformed ChatGPT in emotion: Evidence from Chinese writing [2.4] この研究は、ChatGPTと9歳の子どもたちの、物語と科学の両方の話題について、中国語の筆記パフォーマンスを和らげた。
以上の結果から,9歳児は書字の流布度や結束度において,ChatGPT以上に優れていた。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:50:52 GMT)
Large-scale digital phenotyping: identifying depression and anxiety indicators in a general UK population with over 10,000 participants [2.3] 英国在住の一般住民10,129名のデータを横断的に分析した。
参加者は、ウェアラブル(Fitbit)データと、うつ病(PHQ-8)、不安(GAD-7)、ムードに関する自己申告アンケートを、研究アプリを通じて共有した。
気分,年齢,性別,BMI,睡眠パターン,身体活動,心拍数など,うつ病の重症度と不安度との間に有意な関連が認められた。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:05:17 GMT)
Measurement-based quantum computation in symmetry protected topological states of one-dimensional integer spin systems [2.2] 半整数スピンに加えて、整数スピン鎖もフレームワークに組み込むことができる。
MBQCの効率を特徴付ける計算順序パラメータを同定し、ハルダン相における1$チェーンのスピンに対して、凝縮物質物理学における従来の文字列順序パラメータと一致する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:12:54 GMT)
An ensemble framework approach of hybrid Quantum convolutional neural networks for classification of breast cancer images [2.2] 量子ニューラルネットワークは、ネットワークモデルを学習してスケールアップする能力において、古典的なニューラルネットワークを置き換えるのに適していると考えられている。
医用画像分類は、ディープラーニング、特に畳み込みニューラルネットワークの応用によく関係している。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 10:43:27 GMT)
Automatic Registration of SHG and H&E Images with Feature-based Initial Alignment and Intensity-based Instance Optimization: Contribution to the COMULIS Challenge [2.2] ヘマトキシリンおよびエオシンスライドに対する非侵襲的第二高調波発生顕微鏡は非常に望ましいが、未解決の問題である。
第2高調波画像は部分的情報のみを含むため、この課題は困難である。
本稿では,自動キーポイントマッチングに基づく手法と,インスタンス最適化に基づく変形可能な登録手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:55:40 GMT)
Smart Grid Security: A Verified Deep Reinforcement Learning Framework to Counter Cyber-Physical Attacks [2.2] スマートグリッドは戦略的なサイバー物理攻撃に対して脆弱である。
悪意のある攻撃は、高ワットのIoT(Internet of Things)ボットネットデバイスを使用して電力需要を操作することができる。
グリッドオペレータは、設計段階でサイバー物理攻撃の潜在的なシナリオを見落としている。
本稿では,スマートグリッドに対する攻撃を緩和する安全な深層強化学習(DRL)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 05:26:20 GMT)
Improving Intersession Reproducibility for Forearm Ultrasound based Hand Gesture Classification through an Incremental Learning Approach [2.1] 前腕の超音波画像は、人間のマシンインタフェースを開発するための手の動きを分類するために使用することができる。
従来,1つの被験者に超音波を用いたジェスチャー分類を行ったが,評価前にプローブの除去は行わなかった。
本研究は,超音波による手動作分類の微調整による漸進的な学習が,記憶,処理能力,時間を節約しながら精度を向上させることを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 19:26:21 GMT)
Hand Gesture Classification Based on Forearm Ultrasound Video Snippets Using 3D Convolutional Neural Networks [2.1] 前腕超音波は手の動きに伴う筋形態の変化について詳細な情報を提供しており、手の動きを推定するのに使用できる。
従来の研究は、畳み込みニューラルネットワーク(CNN)などの技術を用いて、2次元(2次元)超音波画像フレームの解析に重点を置いてきた。
本研究は3次元CNNに基づく手法を用いて,ジェスチャー認識のための超音波ビデオセグメント内の時間パターンをキャプチャする。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 19:51:41 GMT)
Cooperative Resilience in Artificial Intelligence Multiagent Systems [2.1] 本稿では, 協調レジリエンスの明確な定義とその定量化手法を提案する。
その結果は、集団システムが破壊に直面してどのように準備し、抵抗し、回復し、幸福を維持し、変革するかを分析する上で、レジリエンス指標の重要な役割を強調している。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 17:13:07 GMT)
Quantum coherent and measurement feedback control based on atoms coupled with a semi-infinite waveguide [2.1] 量子フィードバック制御は原子・フォトニック系の所望の状態を生成するために適用可能であることを示す。
このセットアップでは、初期励起原子が導波路に1つの光子を放出することができ、終端ミラーや他の原子によって反射され、異なるフィードバックループを確立することができる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 15:13:20 GMT)
iGAiVA: Integrated Generative AI and Visual Analytics in a Machine Learning Workflow for Text Classification [2.0] 視覚分析(VA)を用いて,大規模言語モデルを用いた合成データの生成を誘導する手法を提案する。
本稿では,データ不足の種別について論じ,その識別を支援するVA技術について述べるとともに,対象データ合成の有効性を実証する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:19:45 GMT)
RISCORE: Enhancing In-Context Riddle Solving in Language Models through Context-Reconstructed Example Augmentation [2.0] 本稿では,多様な推論技術を必要とする滑車の性能に異なるプロンプト技術がどう影響するかを考察する。
本稿では,文脈的に再構成された文ベースのパズルを生成し,活用する完全自動プロンプト手法RISCOREを紹介する。
実験の結果,RISCOREは言語モデルの性能を縦・横ともに向上させることがわかった。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:35:09 GMT)
VideoPatchCore: An Effective Method to Memorize Normality for Video Anomaly Detection [1.9] ビデオ異常検出(VAD)は、コンピュータビジョン内の映像分析と監視において重要な課題である。
本稿では,VideoPatchCore と呼ばれる VAD の効率的なメモリ手法を提案する。
提案手法では,メモリ最適化を優先する構造を導入し,映像データの特徴に合わせて3種類のメモリを設定する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:38:41 GMT)
TSFeatLIME: An Online User Study in Enhancing Explainability in Univariate Time Series Forecasting [1.9] 本稿では, TSLIMEを拡張したTSFeatLIMEというフレームワークを提案する。
TSFeatLIMEは補助的特徴をサロゲートモデルに統合し、クエリされた時系列と生成されたサンプルの間の一対のユークリッド距離を考察する。
その結果,TSFeatLIMEフレームワーク下でのサロゲートモデルは,距離を考慮したブラックボックスの挙動を,精度を犠牲にすることなくより良くシミュレートできることがわかった。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 10:24:53 GMT)
Embedding Knowledge Graph in Function Spaces [1.9] 本稿では,ベクトル空間ではなく有限次元の関数空間内で操作することで,従来の手法から分岐する新しい埋め込み手法を提案する。
埋め込みに関数を適用することで、より自由度が高くなり、合成や微分、プリミティブなエンティティ表現といった操作が可能になる、と我々は主張する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:33:44 GMT)
A real-time, scalable, fast and highly resource efficient decoder for a quantum computer [1.9] 我々は、Collision Clusteringデコーダを導入し、FPGAおよびASICハードウェア上で実装する。
我々は、主量子誤り訂正方式である曲面符号を用いて論理記憶実験をシミュレートする。
我々は、超伝導量子ビットのような高速動作モードの要求に合致するMHz復号速度を実証する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 10:01:00 GMT)
Quantum Machine Learning in Drug Discovery: Applications in Academia and Pharmaceutical Industries [1.8] 量子コンピューティングと機械学習 - 量子機械学習 - のネクサスは、化学の大幅な進歩の可能性を秘めている。
本稿では, 薬物発見の文脈において, ゲート型量子コンピュータにおける量子ニューラルネットワークの可能性について検討する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 01:17:34 GMT)
Comparing on-off detector and single photon detector in photon subtraction based continuous variable quantum teleportation [1.8] 単光子検出器とオンオフ検出器という2つの異なる光子検出器を2モード圧縮真空状態に光子サブトラクションを実装するために検討する。
生成された2つの異なる光子減算TMSV状態は、連続量子テレポーテーションにおける資源状態として個別に利用される。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 13:12:30 GMT)
GaRField++: Reinforced Gaussian Radiance Fields for Large-Scale 3D Scene Reconstruction [1.8] 本稿では,3次元ガウススプラッティングに基づく大規模シーン再構築のための新しい枠組みを提案する(3DGS)。
スケーラビリティ問題に対処するため,大規模シーンを複数のセルに分割し,各セルの候補ポイントクラウドとカメラビューとを相関させる。
本研究では,大規模シーン再構成の最先端手法よりも連続的に高忠実度レンダリング結果を生成することを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 15:03:24 GMT)
A Multi-Level Approach for Class Imbalance Problem in Federated Learning for Remote Industry 4.0 Applications [1.7] フォグシステムを用いたディープニューラルネットワーク(DNN)モデルのトレーニングは、フェデレートラーニング(FL)技術が解決可能なセキュリティ上の問題を引き起こす。
この場合、新しい課題は、局所的なデータセットで継承され、グローバルモデルの性能を低下させることができるクラス不均衡問題である。
さらに、グローバルモデルのロバスト性を高めるために、関連するワーカーモデルを選択する効率的な手法をグローバルレベルで採用する必要がある。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 06:52:07 GMT)
Individually tunable tunnelling coefficients in optical lattices using local periodic driving [1.6] 光格子における個々のトンネルリンクを局所的に制御する方法を理論的に示す。
Floquet理論を用いて、1次元のトンネル振幅を個別に制御する方法を実証する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 05:23:59 GMT)
Triggering Dark Showers with Conditional Dual Auto-Encoders [1.6] 本稿では,コライダにおける一般およびモデルに依存しない新しい物理探索のための条件付きデュアルオートエンコーダ(CoDAE)のファミリーを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:05:46 GMT)
Concurrent spin squeezing and light squeezing in an atomic ensemble [1.5] 本稿では,原子-光相互作用に基づく新しいプロトコルを提案する。
我々は、0.61pm0.09mathrmdB$と0.65+0.11_-0.10mathrmdB$を熱原子アンサンブルで同時スピンスクイーズした結果を報告する。
我々の方法は、光学、低温原子、閉じ込められたイオンなどの他の量子プラットフォームに拡張することができる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 04:55:29 GMT)
Beats of Bias: Analyzing Lyrics with Topic Modeling and Gender Bias Measurements [1.5] 本稿では,英語の歌詞におけるジェンダーバイアスの分析と判断に,トピックモデリングとバイアス計測技術を用いる。
我々は多種多様な話題,特に最大集団において,多量の挑発的・偽義的な歌詞を観察した。
インテリジェンスと強さに関連する単語は、外見や弱さよりも、ジャンルにまたがる男性バイアスを示す傾向にあり、それは女性バイアスの強い単語である。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 10:24:53 GMT)
Cyber Knowledge Completion Using Large Language Models [1.5] IoT(Internet of Things)をCPS(Cyber-Physical Systems)に統合することで,サイバー攻撃面が拡大した。
CPSのリスクを評価することは、不完全で時代遅れのサイバーセキュリティ知識のため、ますます困難になっている。
近年のLarge Language Models (LLMs) の進歩は、サイバー攻撃による知識の完成を促進するユニークな機会となる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 15:20:39 GMT)
Real-Time Pedestrian Detection on IoT Edge Devices: A Lightweight Deep Learning Approach [1.5] 本研究では,AIoT(Artificial Intelligence of Things)エッジデバイス上での軽量ディープラーニングモデルの実装について検討する。
You Only Look Once (YOLO)ベースのDLモデルは、リアルタイムな歩行者検出のためにデプロイされる。
シミュレーションの結果、最適化されたYOLOモデルは、高速な推論速度147ミリ秒、フレームレート2.3フレーム/秒、精度78%でリアルタイムな歩行者検出を実現できることが示された。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 04:48:41 GMT)
GSplatLoc: Grounding Keypoint Descriptors into 3D Gaussian Splatting for Improved Visual Localization [1.4] 3D Gaussian Splatting (3DGS) は、空間的特徴を持つ3次元幾何学とシーンの外観の両方をコンパクトに符号化することができる。
モデルの空間的理解を改善するために,高密度キーポイント記述子を3DGSに蒸留することを提案する。
提案手法はNeRFMatchやPNeRFLocなど,最先端のニューラル・レンダー・ポース(NRP)法を超越した手法である。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 23:18:32 GMT)
Beyond Text-to-Text: An Overview of Multimodal and Generative Artificial Intelligence for Education Using Topic Modeling [1.4] 本研究では、トピックモデリングを用いて、教育におけるマルチモーダル・ジェネレーティブAIの研究環境をマッピングする。
発見は、教育的文脈におけるテキスト・トゥ・テキスト・モデルに重点を置いており、他のモダリティは未探索であることを示している。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:11:24 GMT)
Aided design of bridge aesthetics based on Stable Diffusion fine-tuning [1.4] ブリッジの実際の写真データセットが構築され、Stable DiffusionはTextual Inversion、Dreambooth、Hypernetwork、Loraの4つのメソッドを使用して微調整される。
微調整されたモデルは、多くの革新的な新しいブリッジタイプを生成することができ、人間のデザイナーに豊かなインスピレーションを与えることができる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:18:32 GMT)
Towards Enhancing Linked Data Retrieval in Conversational UIs using Large Language Models [1.4] 本稿では,既存のシステムにおけるLarge Language Models(LLM)の統合について検討する。
LLMの高度な自然言語理解機能を活用することで、Webシステム内のRDFエンティティ抽出を改善する。
本手法の評価は,ユーザクエリに対するシステム表現性と応答精度の顕著な向上を示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:31:33 GMT)
Boosting Code-Switching ASR with Mixture of Experts Enhanced Speech-Conditioned LLM [1.4] 我々は,Mixture of Experts (MoE) ベースのコネクタと統合された音声条件付き大規模言語モデル (LLM) を提案する。
音声認識タスクへのLLMのテキスト生成能力を向上するためのIDIT機構を提案する。
また、複数の言語を効率的に管理するMoEアーキテクチャとのコネクタも提示する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:20:22 GMT)
Machine learning approaches for automatic defect detection in photovoltaic systems [1.1] 太陽電池(PV)モジュールは、製造、設置、運用中に損傷を受けやすい。
無人航空機による運用中のPVモジュールの継続的な監視が不可欠である。
コンピュータビジョンは、大規模なPVプラントの欠陥を監視するための、自動的で非破壊的で費用対効果の高いツールを提供する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 13:11:05 GMT)
Towards Representation Learning for Weighting Problems in Design-Based Causal Inference [1.1] 本稿では,有望な理論的特性を維持しつつ,フレキシブルな表現を学習するエンド・ツー・エンド推定手法を提案する。
このアプローチは、様々な共通因果推論タスクにおいて競合することを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 19:16:37 GMT)
English offensive text detection using CNN based Bi-GRU model [1.1] テキストが攻撃的であるか否かを分類する新しいBi-GRU-CNNモデルを提案する。
Bi-GRUモデルとCNNモデルの組み合わせは、既存のモデルよりも優れている。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 01:29:24 GMT)
VascX Models: Model Ensembles for Retinal Vascular Analysis from Color Fundus Images [1.0] カラーファンドス画像(CFI)から網膜血管を解析するための包括的モデルアンサンブルであるVascXモデルを紹介する。
当社のモデルは、さまざまなベンダーのデバイス間での堅牢なパフォーマンス、さまざまなレベルの画像品質レベル、さまざまな病理を達成しました。
VascXモデルでは、実装を簡素化し、自動網膜血管解析の品質を向上させることを目的とした、堅牢で実用性の高いモデルアンサンブルと推論コードを提供しています。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:19:31 GMT)
A novel open-source ultrasound dataset with deep learning benchmarks for
spinal cord injury localization and anatomical segmentation [1.0] ブタ脊髄の矢状切片からなる10,223モード(Bモード)画像の超音波データセットを提案する。
損傷部位をローカライズするために,いくつかの最先端オブジェクト検出アルゴリズムの性能指標をベンチマークした。
ヒトの超音波脊髄画像におけるセグメンテーションモデルのゼロショット一般化能力を評価する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 20:22:59 GMT)
Beyond the Black Box: A Statistical Model for LLM Reasoning and Inference [1.0] 本稿では,大規模言語モデル(LLM)の振る舞いを説明する新しいベイズ学習モデルを提案する。
我々は,先行した多項遷移確率行列で表される理想的な生成テキストモデルに基づく理論的枠組みを開発し,LLMがこの行列をどのように近似するかを検討する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 13:30:25 GMT)
Contextual Evaluation of Large Language Models for Classifying Tropical and Infectious Diseases [1.0] 我々は、オープンソースの熱帯感染症(TRIND)データセットを構築し、11000以上のプロンプトを産出する人口統計学的、意味論的、消費者的増強を含むように拡張した。
一般のLSMと医学のLSMと、LSMの結果を人間の専門家と比較し、LSMのパフォーマンスを評価した。
本研究では, TRINDs-LMのプロトタイプを開発し, LLMが健康にどのような影響を及ぼすかを知るための遊び場を提供する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 23:39:49 GMT)
MDS-ED: Multimodal Decision Support in the Emergency Department -- a Benchmark Dataset for Diagnoses and Deterioration Prediction in Emergency Medicine [1.0] 我々は,MIMIC-IVに基づくベンチマークプロトコルと,救急部門におけるマルチモーダル意思決定支援評価の初期結果を紹介する。
患者到着から1.5時間後, 人口統計, バイオメトリックス, バイタルサイン, 検査値, 心電図波形など, 多様なデータモダリティを利用する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 15:20:57 GMT)
Enhancing Kurdish Text-to-Speech with Native Corpus Training: A High-Quality WaveGlow Vocoder Approach [0.9] 我々は、21時間中央クルド語音声コーパス上でクルド語ウェーブグローボコーダを訓練することにより、タコトロンに基づくクルド語TTSシステムを改善する。
我々の適応型WaveGlowモデルは、4.91の印象的なMOSを実現し、クルド語音声合成の新しいベンチマークを設定できる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 06:02:36 GMT)
Artificial Intelligence for Secured Information Systems in Smart Cities: Collaborative IoT Computing with Deep Reinforcement Learning and Blockchain [0.9] IoT(Internet of Things)の急速な拡張は、特にスマートシティやスマートマニュファクチャリングのようなインフラストラクチャにおいて、プライバシ、セキュリティ、データの整合性に関連する問題を引き起こしている。
本稿では,IoTを活用したスマートシティにおけるモバイルトランスミッションとセキュアなデータ交換を最適化するためのブロックチェーンと深層強化学習の統合について検討する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 20:25:20 GMT)
A Comprehensive Evaluation of Large Language Models on Mental Illnesses [0.8] GPT-4とLlama 3はバイナリ障害検出において優れた性能を示し、特定のデータセットで最大85%の精度に達した。
素早いエンジニアリングは モデル性能を高める上で 重要な役割を担った
有望な結果にもかかわらず、我々の分析では、データセット間のパフォーマンスのばらつきや、注意深いプロンプトエンジニアリングの必要性など、いくつかの課題を特定した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 02:58:52 GMT)
Mixture of Tokens: Continuous MoE through Cross-Example Aggregation [0.8] エキスパートの混合(MoE)モデルは、言語とビジョンタスクの境界を押し広げています。
MoTは単純で連続的なアーキテクチャであり、スパースMoEモデルと同様にパラメータの数をスケーリングすることができる。
我々の最良のモデルは、言語事前学習における高密度トランスフォーマーモデルよりも3倍のトレーニング速度を達成する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:40:57 GMT)
Development and Validation of Heparin Dosing Policies Using an Offline Reinforcement Learning Algorithm [0.8] 本研究では,強化学習に基づくパーソナライズされたヘパリン投与ポリシーを提案する。
オフラインRL環境における分配エラーを最小限に抑えるため,バッチ制約ポリシを実装した。
本研究はヘパリン投与の実践を強化し、医学における高度な意思決定支援ツールの開発の前例を確立する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 05:20:38 GMT)
LLM-Cure: LLM-based Competitor User Review Analysis for Feature Enhancement [0.7] 本稿では,大規模言語モデル(LLM)に基づく機能拡張のための競合ユーザレビュー分析を提案する。
LLM-Cureは、LCMを適用して、レビュー内の特徴を特定し、分類する。
LLM-Cureは、ユーザーレビューに苦情を付けると、苦情に関連する競合アプリの高い評価(4と5の星)のレビューをキュレートする。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 04:17:21 GMT)
Improving Performance in Colorectal Cancer Histology Decomposition using Deep and Ensemble Machine Learning [0.7] 組織学的にヘマトキシリンとエオシンで染色されたサンプルは、一般的に大腸癌管理に用いられている。
近年の研究では、手軽に利用できる画像から臨床関連バイオマーカーの抽出を容易にするための畳み込みニューラルネットワーク(CNN)の可能性を強調している。
CNNベースのバイオマーカーは、スピード、自動化、最小コストの利点を付加して、患者の結果をゴールデンスタンダードと同等に予測することができる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 20:20:51 GMT)
Center-fixing of tropical cyclones using uncertainty-aware deep learning applied to high-temporal-resolution geostationary satellite imagery [0.7] GeoCenterと呼ばれるディープラーニングアルゴリズムは、熱帯サイクロンの表面循環中心の位置を決定するために使用される。
赤外線衛星画像のアニメーションを取り込み、ラグタイムで最大3時間までの10チャンネルを含む。
GeoCenterは平均/平均/RMS誤差を26.9/23.3/32.0 km、熱帯系では25.7/22.3/30.5 km、カテゴリー2〜5ハリケーンでは15.7/13.6/18.6 kmと達成している。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 23:39:56 GMT)
Training Neural Networks for Modularity aids Interpretability [0.7] ネットワークの解釈可能性を改善するためのアプローチは、クラスタ可能性、すなわち独立して研究できる解離クラスタにモデルを分割することである。
事前学習されたモデルは非常にクラスタ化できないため、非相互作用クラスタの形成を促進するエンメシュメントロス関数を用いてモデルをよりモジュラーに訓練する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 05:03:49 GMT)
SurGen: Text-Guided Diffusion Model for Surgical Video Generation [0.7] SurGenは、外科用ビデオ合成に適したテキスト誘導拡散モデルである。
標準画像およびビデオ生成指標を用いて,出力の視覚的および時間的品質を検証する。
本研究は, 外科研修生に有用な教育ツールとして, 拡散モデルが有用であることを示すものである。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 23:23:50 GMT)
More Consideration for the Perceptron [0.6] 既存の入力の積として計算された追加入力を組み込んだ従来のパーセプトロンの強化であるゲートパーセプトロンを導入する。
これにより、パーセプトロンは機能間の非線形相互作用をキャプチャし、複雑なデータセットの分類と回帰の能力を大幅に改善する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 10:57:14 GMT)
Optimization of partially isolated quantum harmonic oscillator memory systems by mean square decoherence time criteria [0.6] ハイゼンベルクの画像量子記憶は、デコヒーレンス水平線上で初期状態を維持する能力を利用する。
系変数の重み付き平均二乗偏差に対する忠実度しきい値で以前に定義された量子メモリヒーレンス時間を用いて、このアプローチを部分的に分離されたサブシステムに適用する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 04:10:27 GMT)
Segmentation Strategies in Deep Learning for Prostate Cancer Diagnosis: A Comparative Study of Mamba, SAM, and YOLO [0.6] 本研究は,前立腺癌組織像の分画のための深層学習法であるMamba,SAM,YOLOの比較分析を行った。
Gleason 2019 と SICAPv2 という2つの総合データセット上で,Dice スコア,精度,リコール指標を用いてこれらのモデルの性能を評価した。
H-Vmunetモデルの高度なアーキテクチャは、高階の視覚状態空間と2D選択的スキャン操作を統合することで、効率的かつセンシティブな病変検出を可能にする。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:04:29 GMT)
Implicit assessment of language learning during practice as accurate as explicit testing [0.6] コンピュータ支援型言語学習において,2つの文脈における学生の能力評価に項目応答理論(IRT)を用いる。
まず、効率は良いが正確な適応テストで徹底的なテストを置き換えることを目的としている。
第2に,エクササイズによる実践の文脈から直接,テストなしで学習者の能力を正確に推定できるかどうかを検討する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:40:44 GMT)
Bipolar fuzzy relation equations systems based on the product t-norm [0.6] 双極性ファジィ関係方程式は、未知変数を考慮したファジィ関係方程式とその論理的連結否定の一般化として生じる。
本稿では,最大積t-ノルム組成に基づく双極性ファジィ関係方程式系の研究に焦点をあてる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:09:13 GMT)
OPAL: Outlier-Preserved Microscaling Quantization Accelerator for Generative Large Language Models [0.6] 本稿では, OPAL と呼ばれるエネルギー効率の高い LLM アクセラレータを生成タスクに適用するハードウェア・ソフトウェア共同設計手法を提案する。
OPALは、電力効率を最大化するためにシフトと減算のみを必要とするソフトマックス演算にlog2ベースの近似を使用する。
その結果、エネルギー効率を 1.62.2x に改善し、面積を 2.43.1x に減らし、精度を損なうことができる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 06:11:12 GMT)
Lightweight single-image super-resolution network based on dual paths [0.6] ディープラーニングのシングルイメージ超解像(SISR)アルゴリズムには,畳み込みニューラルネットワークとTransformerに基づく2つのモデルがある。
本稿では,2方向相補的畳み込みとトランスフォーマーに基づく,軽量なマルチスケール機能融合ネットワークモデルを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:24:24 GMT)
Exploring VQ-VAE with Prosody Parameters for Speaker Anonymization [0.5] 本稿ではベクトル量子変分自動エンコーダ(VQ-VAE)に基づくエンドツーエンドネットワークを用いた話者匿名化手法について検討する。
言語的・感情的な内容を保持しながら、話者のアイデンティティを特に標的にし、修正するためにこれらのコンポーネントをアンタングルするように設計されている。
この手法は感情情報の保存において,ほとんどのベースライン技術より優れていることを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:55:10 GMT)
Camera Calibration and Stereo via a Single Image of a Spherical Mirror [0.5] 本稿では,球面ミラーを内蔵した単一ビューを用いたカメラキャリブレーション手法を提案する。
正確な校正を行う上で,本手法の有効性を示す。
本手法は, 簡便なカタディオプトリ・ステレオシステムの開発の道筋をたどる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:36:48 GMT)
Deep Circuit Compression for Quantum Dynamics via Tensor Networks [0.5] 本稿では,デジタル量子コンピュータ上でリアルタイムなシミュレーションが可能な圧縮回路を生成するためのコンパイルアルゴリズムを提案する。
与えられた深さについては、アルゴリズムは同じ深さの全てのトロッター化よりも正確である。
52-qubit 2D Transverse-Field IsingプロパゲータをIBM Heavy-Hexトポロジにコンパイルすることでこれを実証する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:00:05 GMT)
Beyond the binary: Limitations and possibilities of gender-related speech technology research [0.5] 本論文は,2013年から2023年にかけてのISCAインター音声出版において,スピーチと性,性別に関する107件の研究論文をレビューした。
用語学、特にジェンダーという言葉は、未特定であり、しばしば社会科学における一般的な見解とは相容れない方法で使われている。
我々は、すでに疎遠化されているグループにこれが引き起こす潜在的な問題に注意を向け、スピーチやジェンダーの取り組みについて研究者が自問するように提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 17:40:26 GMT)
Zero-shot 3D Segmentation of Abdominal Organs in CT Scans Using Segment Anything Model 2 [0.4] 我々は,8施設のTotalSegmentator CTデータセットのサブセットを用いて,SAM2の腹腔内臓器の分画能力を評価した。
The Dice similarity coefficient (DSC) and " negative prompts" were analyzed。
肝 0.821 pm 0.192,右腎 0.862 pm 0.212,左腎 0.870 pm 0.154,脾 0.891 pm 0.131。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:50:18 GMT)
HamLib: A library of Hamiltonians for benchmarking quantum algorithms and hardware [0.4] 量子量子ハミルトニアンの大規模なデータセットを提示する。
HamLibと呼ばれるデータセットはオンラインで無料で利用でき、問題のサイズは2から1000キュービットである。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 21:15:47 GMT)
AUGUR, A flexible and efficient optimization algorithm for identification of optimal adsorption sites [0.4] 我々のモデルは、グラフニューラルネットワークとガウス過程を組み合わせて、柔軟で効率的で対称性に配慮した翻訳、回転不変の予測器を作成する。
これは、現在の最先端のアプローチよりもはるかに少ないイテレーションで、大規模で複雑なクラスタの最適位置を決定する。
手作りの特徴に頼らず、あらゆる分子にシームレスに使用することができる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:03:01 GMT)
Automated Assessment of Multimodal Answer Sheets in the STEM domain [0.4] この研究は、人工知能(AI)を用いた自動評価手法の実装を通じて、効率的で信頼性の高いグレーティング手法を開発するためのものである。
第一に、STEMにおけるテキスト回答の評価、正確な比較と評価のためのサンプル回答の活用、高度なアルゴリズムと自然言語処理技術によって実現された2つの重要な分野に貢献する。
視覚的表現と意味的意味のギャップを埋めることで,手作業による介入を最小限に抑えつつ,正確な評価を実現する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 05:10:13 GMT)
In-Context Ensemble Improves Video-Language Models for Low-Level Workflow Understanding from Human Demonstrations [0.3] Standard Operating procedureは、ビデオデモに基づいて、ビジネスソフトウェアワークフローのための低レベルのステップバイステップのガイドを定義する。
近年の大規模ビデオ言語モデルの進歩は、人間の実演記録を解析することにより、SOP生成を自動化する可能性を秘めている。
SOP生成のためのビデオ言語モデルを用いたテキスト内学習について検討する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:41:01 GMT)
Automated test generation to evaluate tool-augmented LLMs as conversational AI agents [0.3] 対話型AIエージェントを評価するテスト生成パイプラインを提案する。
当社のフレームワークでは,ユーザ定義の手順に基づく多種多様なテストを生成するためにLLMを使用している。
ツール拡張LDMは単一のインタラクションでよく機能するが、完全な会話を扱うのに苦労することが多い。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:57:43 GMT)
Transformer based time series prediction of the maximum power point for solar photovoltaic cells [0.2] 本稿では,太陽太陽電池セルにおける深層学習に基づく最大パワーポイントトラッキング(MPPT)の改良を提案する。
本稿では, 環境条件を包括的に表現する。
提案モデルでは, 広範囲の大気環境において, 強靭で動的かつ非相対的に電力点追跡を行う。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 17:26:55 GMT)
Nonlocal order parameter of pair superfluids [0.2] ペア超流動は非局所順序パラメータ(奇数パリティ)で厳密に定義できることを示す。
その結果, 対超流動における相関密度変動の役割に新たな光を当てた。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 15:30:41 GMT)
Simultaneously enhancing brightness and purity of WSe$_2$ single photon emitter using high-aspect-ratio nanopillar array on metal [0.2] 報告されている単一光子エミッタは、そのような応用に対する認識された要件に満たないことが多い。
これらのエミッタは、優れた純度(高いエミッションレートでも)を示し、ナノピラーから排出されるガスを加熱する金のバックリフレクタの使用により、カップリングを改善した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:33:05 GMT)
Facial Expression-Enhanced TTS: Combining Face Representation and Emotion Intensity for Adaptive Speech [0.1] FEIM-TTSはゼロショット音声合成モデルである。
モデルはLSS3、CREMA-D、MELDデータセットを使用してトレーニングされ、適応性を示している。
TTSに感情的なニュアンスを組み込むことで、Webコミックのダイナミックで魅力的な聴覚体験を可能にし、視覚障害者がこれらの物語をより完全に楽しめるようにする。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:01:12 GMT)
Unleashing the Potential of Synthetic Images: A Study on Histopathology Image Classification [0.1] 病理組織像分類は様々な疾患の正確な同定と診断に重要である。
合成画像は、既存のデータセットを効果的に増強し、最終的に下流の病理組織像分類タスクの性能を向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:02:55 GMT)
Repetition effects in a Sequential Monte Carlo sampler [0.1] 最近導入されたモンテカルロ法(SMC)におけるサンプル反復の頻度について検討した。
SMCは、最近政治的再分権のために導入されたシーケンシャルなモンテカルロ法である。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 19:33:16 GMT)
Single and entangled atomic systems in thermal bath and the Fulling-Davies-Unruh effect [0.1] 本研究では, 熱浴中で静的な2レベル原子系とエンタングルド原子系の文脈で, フルリング・ダヴィース・ウンルー効果を再検討する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:39:30 GMT)
Predicting Deterioration in Mild Cognitive Impairment with Survival Transformers, Extreme Gradient Boosting and Cox Proportional Hazard Modelling [0.1] 本稿では,認知の劣化を予測するために,サバイバル・トランスフォーマーの新たなアプローチと極勾配促進モデルを提案する。
提案手法は、アルツハイマー認知症における早期発見と介入をより正確にするためのこれらの手法の可能性を強調している。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 16:49:43 GMT)
Vulnerabilities that arise from poor governance in Distributed Ledger Technologies [0.0] 分散Ledger Technologiesにおけるガバナンスの現在の実装は、いくつかの攻撃を受けやすいままである。
我々は、優れたガバナンス特性の最も適切な分類を選択し、優れたガバナンスプロトコルが満たすべき正式なセキュリティ概念を指し示します。
優れたガバナンスプロパティが欠如していることから生じる多くの脆弱性について概説する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 10:19:00 GMT)
Upper-body free-breathing Magnetic Resonance Fingerprinting applied to the quantification of water T1 and fat fraction [0.0] そこで本稿では, 動き補正(MoCo) MRF T1-FF という新しい手法を提案し, 最適化された予備動作スキャンを用いて運動場を推定する。
MRFマップでは, 呼吸筋, 肝臓, ぼやけなどの運動に強く影響された部位において, 運動補正後の運動の減少と, 失明の進行が顕著であった。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 15:57:35 GMT)
Universal Session Protocol: A General Solution to Remote Code Execution [0.0] 現在、TCP/IPモデルは、アプリケーションへの接続に対するすべての要求を無条件で満たすことで、匿名で脆弱性を悪用することができる。
セッション層を含むTCP/IPモデルのアーキテクチャの変更として、ユニバーサルセッションプロトコルを提案しています。
ユニバーサルセッションプロトコルは、セキュリティクリティカルシステムにおける不正なデータ処理を排除する緊急かつ重要な必要性に対処する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 00:02:06 GMT)
Unique entanglement dynamics of two-qubit separable and Werner states in a discrete qubit environment [0.0] 均質な環境では、分離状態の絡み合いのダイナミクスはサブシステム間の相互作用に影響される。
ホワイトノイズ環境では、絡み合いの減衰時間は環境の大きさによってのみ決定される。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 17:08:30 GMT)
Undergrads Are All You Have [0.0] GPT-UGRDは自然言語処理タスクのLamaモデルと同等であり、場合によっては同等であることを示す。
我々は,この新モデルを研究や他の文脈で利用する際の,実装,応用,マルチテナント化,社会的意味について概説する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 02:35:41 GMT)
Two-band atomic superfluidity in the presence of an orbital Feshbach resonance [0.0] アルカリ-アース系フェルミ原子系のオービタル・フェシュバッハ共鳴の存在下での超流動特性について検討した。
我々は,超流動秩序パラメータ,化学ポテンシャル,密度変動,密度分布,相関とコヒーレンス長,基底状態エネルギー,BCS-BECクロスオーバー領域におけるタンの接触密度など,様々な静的特性を計算した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 17:17:58 GMT)
Transfer learning for financial data predictions: a systematic review [0.0] 金融時系列データは、正確な株価予測に重大な課題を提起する。
伝統的な統計手法は、線形性や正規性といった仮定を、金融時系列の非線形の性質には適さないものとした。
機械学習の方法論は、データ内の非線形関係をキャプチャすることができる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 20:52:32 GMT)
Toward Conceptual Modeling for Propositional Logic: Propositions as Events [0.0] 本稿では,物間機械(TM)モデルと呼ばれる高レベル図形表現に命題論理言語を適用することを考察する。
究極的な研究目的は、TMモデリングと命題論理の完全なセマンティックアライメントを単一の構造に求めることである。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 03:45:24 GMT)
To Explore the Potential Inhibitors against Multitarget Proteins of COVID 19 using In Silico Study [0.0] 新型コロナウイルスの感染拡大に伴う世界的なパンデミックは、未解決の公衆衛生危機を招いた。
分子ドッキングと機械学習レグレッションを組み合わせた治療薬の探索を行った。
我々は、-19.7 kcal/molから-12.6 kcal/molの範囲で、それぞれZINC (3873365, 85432544, 8214470, 85536956, 261494640) を含む新規な5種類の阻害薬を提案した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 22:19:56 GMT)
Thermalization without detailed balance: population oscillations in the absence of coherences [0.0] 詳細なバランスに従うオープン量子系は指数関数的に熱平衡に崩壊する。
温度上昇は熱化ダイナミクスの急激な遷移を示す新しい例外点を生じることを示す。
さらなる温度上昇は、量子コヒーレンスなしでもエネルギーレベルの人口の振動を引き起こす。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 11:46:14 GMT)
The multimode nature of spacetime entanglement in QFT [0.0] 4次元平時空における自由で質量を持たないスカラー量子場の真空状態における多重モードの絡み合いの存在を実証する。
このような多モード絡み合いは操作的に抽出可能であり、絡み合い収穫プロトコルでよく議論される絡み合いの基礎を形成する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:01:55 GMT)
The Separability Problem in Quantum Mechanics: Insights from Research on Axiomatics and Human Language [0.0] ヒルベルト空間に量子フォーマリズムの構造的制限があることを示し、別の系の記述を妨げている。
問題は、分離性が基本レベルでの可能性であり、形式主義がその数学的構造に統合されるべきかどうかである。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 10:05:45 GMT)
The Influence of Quantum Correlation on the Holonomy of Spatially-Structured Photons [0.0] 幾何学的位相における絡み合いの顕在化は空間構造光子に対して解明される。
絡み合いパラメータは、分離可能な状態の統計的重ね合わせと量子相関の2つの異なる方法で表される。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 19:03:57 GMT)
Random ensembles of symplectic and unitary states are indistinguishable [0.0] ユニタリ状態 $t$-designs は、ユニタリ群 $mathbbU(d)$ 上の設計を形成するアンサンブルからユニタリを持つ参照純粋状態の進化によって得られる。
我々は、Haarランダムシンプレクティック状態 -- すなわち、$mathbbSP(d/2)$ -- のハール測度に従ってサンプリングされたユニタリを持つ参照状態の進化によって得られる状態 -- がユニタリ状態 $t$-Designs となるかどうかを研究する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 23:12:18 GMT)
Quantum systems coupled to environments via mean field interactions [0.0] 量子系が平均場法で環境に結合すると、その有効力学は時間依存ハミルトニアンを持つユニタリ群によって支配されることを示す。
システム状態内の絡み合いは動的に変化しないことを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:21:10 GMT)
Quantum interferences and gates with emitter-based coherent photon sources [0.0] 2019年、放出された単一光子状態は真空成分とのコヒーレンスを含むことが示されている。
このような光子数コヒーレンスが量子干渉実験をどう変えるかを示す。
本稿では,2量子ゲートの効率と忠実度を考慮に入れ,量子プロトコルへの影響について述べる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 10:33:30 GMT)
Quantum Probability via the Method of Arbitrary Functions [0.0] 我々は、量子測定のおもちゃモデルにおいて、ボルンの規則確率はユニタリなシュル「オーディンガーダイナミクス」から導かれると論じる。
この結果は,初期力学パラメータとは独立な普遍的制限行動の一種としてボルン則を確立した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 21:00:11 GMT)
Quantum Entanglement on Black Hole Horizons in String Theory and Holography [0.0] 我々はユークリッドBTZブラックホールの$mathbbZ_N$オービフォールドの正確な1ループ分割関数を計算する。
奇数整数$N>1$で知られている分割関数のモジュラ積分に対するタキオン的寄与を解析する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:47:08 GMT)
Quantifying the limits of controllability for the nitrogen-vacancy electron spin defect [0.0] 固体電子スピン量子ビットは、感度を高めデバイスコヒーレンスを改善するために、集団反転の制御配列に依存する。
量子センシングなどの応用における集団反転の限界と潜在的影響は定量的に評価されていない。
高忠実度多重パルス列に対するナノ秒制御の潜在的実現可能な機構を同定する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 20:28:04 GMT)
Preparing Ground and Excited States Using Adiabatic CoVaR [0.0] CoVarince Root find with classical shadows (CoVaR) は、変分量子回路のトレーニングのための新しいパラダイムとして最近導入された。
対象ハミルトニアンの断熱モーフィングを導入し,初期温暖開始が分かっていない場合,CoVaRがターゲットハミルトニアンの固有状態の調製に成功できることを実証した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 15:38:38 GMT)
Optomechanical dark matter instrument for direct detection [0.0] 我々は,超流動ヘリウムと相互作用する暗黒物質を光学的空洞で考える。
実効場理論を用いて、暗黒物質がフォノンから発散する速度を高密度で駆動する音響モードで計算する。
堆積されたフォノン(mu$eV)は、ポンプレーザーとの光学的相互作用によって光子に変換される。
この光子を効率よく検出することができ、keVスケールの暗黒物質を感度よくプローブする手段を提供する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:13:42 GMT)
Optimizing the number of measurements for vibrational structure on quantum computers: coordinates and measurement schemes [0.0] 本研究では, 異なる座標系と測定方式が無調波, 振動状態の推定に必要な測定値に与える影響について検討する。
平均3倍(1.5倍)、最大7倍(2.5倍)、適切な座標変換による測定回数の削減を実証する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:36:28 GMT)
NER-Luxury: Named entity recognition for the fashion and luxury domain [0.0] 我々は、ファッションと高級産業のための英語で匿名認識モデルを開発する際の課題に対処する。
豪華なアノテーションスキームを用いた36以上のエンティティ型の分類を導入し、明確な階層分類を考慮に入れた40K以上の文のデータセットを作成する。
ファッション,美容,時計,宝石,香料,化粧品,高級品の5種類の微調整モデルを紹介し,審美的側面と量的側面に等しく焦点を合わせている。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 06:58:28 GMT)
Mitigating Digital Discrimination in Dating Apps -- The Dutch Breeze case [0.0] 2023年9月、オランダの非差別機関であるオランダ人権研究所は、オランダのデートアプリであるBreezeが、彼らのアルゴリズムが非白人に対して差別されたことを疑って正当化されたことを決定した。
i) Breezeのマッチングアルゴリズムにおける民族性に基づく差別は違法か? (ii) デートアプリはマッチングアルゴリズムにおける差別を緩和または阻止するか?
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:47:04 GMT)
Measuring Correlation and Entanglement between Molecular Orbitals on a Trapped-Ion Quantum Computer [0.0] 分子軌道間の相関と絡み合いの定量化は、強い相関反応過程における量子効果の役割を解明することができる。
ここでは、量子H1-1トラップイオン量子コンピュータを用いて、軌道相関と絡み合いを定量化するフォン・ノイマンエントロピーを計算する。
以上の結果から,波動関数に逆スピン開殻配置がない限り,片軌道の絡み合いが生じることが示唆された。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:24:29 GMT)
Instance Segmentation of Reinforced Concrete Bridges with Synthetic Point Clouds [0.0] ナショナルブリッジ検査基準は、詳細な要素レベルの橋の検査を必要とする。
伝統的に、検査官は損傷に基づく構造的要素の評価によって手動で評価を割り当てる。
3つの異なる手法を用いて合成データを生成する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:28:41 GMT)
Innovative Speech-Based Deep Learning Approaches for Parkinson's Disease Classification: A Systematic Review [0.0] パーキンソン病(PD)は早期の発声障害を伴うことが多い。
近年のAIの進歩、特に深層学習(DL)は、音声データの解析を通じてPD診断を大幅に強化している。
しかし、研究の進展は、パブリックアクセス可能な音声ベースのPDデータセットの限定的利用によって制限されている。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 06:29:29 GMT)
Inflation does not create entanglement in local observables [0.0] ド・ジッター時空の宇宙的パッチにおけるバンチ・ダヴィエ真空中の自由大スカラー場の絡み合いとミンコフスキー時空におけるスカラー場の絡み合いを比較した。
デ・シッターの空間的局所化場モード間の絡み合いは、大規模に体により多くの絡み合いが保存されているにもかかわらず少ない。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:01:12 GMT)
Improvements to SDXL in NovelAI Diffusion V3 [0.0] 本技術報告では,ノベルAI拡散V3の訓練過程におけるSDXLの変更について報告する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 11:57:12 GMT)
Harnessing two-photon dissipation for enhanced quantum measurement and control [0.0] 量子計測と制御に強い2光子散逸の3つの重要な応用について述べる。
まず,高光子数でのウィグナー断層撮影で発生する限界を克服する効果を示す。
第2に、猫量子ビット上の普遍ゲートの実現の可能性を示し、猫量子ビット状態と0および1光子の重畳の間のコヒーレントマッピングを利用する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:47:32 GMT)
Glitch in Time: Exploiting Temporal Misalignment of IMU For Eavesdropping [0.0] 慣性測定ユニット(IMU)は、音響盗聴攻撃に対して脆弱である。
Googleは、IMUへの許可なしアクセスに対して200Hzのレート制限を課し、このようなサイドチャネル攻撃を中和することを目指している。
本研究は,これらの保護を回避する新たなエクスプロイトであるSTAGを紹介する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 20:04:44 GMT)
Genuine non-Gaussian entanglement of light and quantum coherence for an atom from noisy multiphoton spin-boson interactions [0.0] 絡み合いと量子コヒーレンスは、量子技術の進歩において中心的な役割を果たす。
ここでは、2モードの多重光子Jaynes-Cummings (MPJC) モデルを考える。
エンタングルメントと量子コヒーレンスがどのように最適に生成され、その後に操作されるかを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:40:13 GMT)
Generative 3D Cardiac Shape Modelling for In-Silico Trials [0.0] 人工大動脈の形状をモデル化・生成する深層学習法を提案する。
このネットワークは、CT画像から再構成された大動脈根メッシュのデータセットに基づいて訓練される。
学習した埋め込みベクトルからサンプリングすることで、実際の患者解剖に類似した新しい形状を生成することができる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:59:18 GMT)
Gapped and gapless quantum spin liquids on the ruby lattice [0.0] 平均整合構造上のルビースピンの合計50U$bbZ(1)および182の異なる状態を示す。
また、平均整合構造上のスピンの反Respecting space-group理論を合計64個得る。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:00:00 GMT)
GPTCast: a weather language model for precipitation nowcasting [0.0] GPTCastは、レーダベースの降雨をアンサンブルする深層学習法である。
我々は、トークン化レーダ画像を用いて降水動態を学習するために、GPTモデルを用いて予測を行う。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:50:58 GMT)
Fuzzy gauge theory for quantum computers [0.0] 連続ゲージ理論は無限次元局所ヒルベルト空間を持つ。
ファジィゲージ理論」というゲージ理論の新しい量子化法を提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 22:01:02 GMT)
From Predictive Importance to Causality: Which Machine Learning Model Reflects Reality? [0.0] SHAPに基づく特徴量と因果的特徴量との間には,中程度のスピアマンランク相関が0.48であることがわかった。
この研究は、予測力と不動産評価の因果的な洞察を組み合わせた統合的なアプローチの必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 17:06:31 GMT)
Fluctuation-induced Bistability of Fermionic Atoms Coupled to a Dissipative Cavity [0.0] 光格子を受けるフェルミオン原子の定常相図について検討し,光子損失を伴う微細な光学キャビティに結合した。
自己組織相への遷移はポンプ強度の臨界値で起こる。
驚くべきことに、さらに大きなポンプ強度では、キャビティフィールドと原子の2つの自己組織化された安定解が生まれ、不安定性の存在を示唆する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:33:06 GMT)
Five questions and answers about artificial intelligence [0.0] 人工知能(AI)の急速な進歩は、社会で多くの論争を引き起こしている。
本稿では,AIに関する知識の普及に寄与する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:19:55 GMT)
Finite Entanglement Entropy in String Theory [0.0] オービフォールド分割関数に対するタキオン的寄与は、物理領域$0N leq 1$で有限である式に適切にまとめて解析的に継続できることが示される。
情報パラドックス,量子重力,ホログラフィーにおけるエンタングルメントエントロピーの有限性の影響について論じる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:09:25 GMT)
FaaF: Facts as a Function for the evaluation of generated text [0.0] ファクト・アズ・ア・ファンクション(Facts as a Function, FaaF)は,大規模言語モデル(LM)の関数呼び出し機能を活用した事実検証タスクである。
FaaFは、テキスト中のサポート対象の事実を識別する能力を大幅に向上すると同時に、プロンプトベースの手法に比べて効率とコストを大幅に削減する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 11:39:42 GMT)
Explaining word embeddings with perfect fidelity: Case study in research impact prediction [0.0] 単語埋め込みを訓練したロジスティック回帰に基づく分類モデルのための自己モデルRated Entities (SMER)。
SMERは,テキスト中の個々の単語の予測平均と正確に一致するので,理論上は説明モデルと完全に一致していることを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:28:24 GMT)
Entanglement growth via splitting of a few thermal quanta [0.0] 量子分割は、アインシュタイン=ポドルスキー=ローゼン状態によって実証されたガウスの絡み合いの重要な生成物である。
閉じ込められたイオンと超伝導回路における効率的なトリリニアプロセスを含む最近の実験は、数個の熱量子の分裂をテストするための相補的な可能性を開いた。
本研究では,3dB以上の蒸留式2次スクイーズ法により,強い三線形カップリングが大量の非古典性を生成することを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:17:12 GMT)
Entanglement classification and \emph{non-k}-separability certification via Greenberger-Horne-Zeilinger-class fidelity [0.0] 多体量子系は、エンプク分離性と絡み合い深さの概念を用いて特徴づけることができる。
量子状態がemphk-分離可能であるのは、emphk 絡み合ったサブシステムの混合として表現できる場合である。
提案手法は,3量子系を既知のローカル操作と古典的通信クラスに分類することに成功している。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 10:48:11 GMT)
Entanglement Negativity and Replica Symmetry Breaking in General Holographic States [0.0] ランダムテンソルネットワーク(RTN)では、R'enyi negativity $mathcalE (2k)$さえも計算する支配的なサドルが、$mathbbZ_2k$レプリカ対称性を総称的に破ることがわかった。
これは2次元CFT法によるホログラムの負性率の以前の計算に疑問を投げかけるものである。
一般ホログラフィック状態において、$mathcalE (2k)$のサドルが実際に$mathbbZ_2k$のレプリカ対称性を破っていることを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:28:41 GMT)
Entanglement Entropy in String Compactifications [0.0] タイプIIコンパクト化のオービフォールドにおける絡み合いエントロピーを4次元と6次元に計算する。
これらのモデルにおけるすべてのタキオン寄与は、10次元と同様の物理的領域において 0 N leq 1$ の有限エントロピーをもたらす再仮定と解析的連続性を持つことを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:40:47 GMT)
Enhancing the Energy Gap of Random Graph Problems via XX-catalysts in Quantum Annealing [0.0] グラフの端面に複数のXX触媒を用いると、最小エネルギーギャップが著しく向上することを示す。
その結果, 1次相転移が重くなればなるほど, 触媒はギャップを開くのに有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:00:01 GMT)
Enhancing IoT based Plant Health Monitoring through Advanced Human Plant Interaction using Large Language Models and Mobile Applications [0.0] 本稿では、植物が人間に「話す」ことを可能にする新しい植物コミュニケーションアプリケーションの開発について述べる。
このアプリは、リアルタイムの対話機能を備えたシームレスなユーザー体験を提供する。
植物とのコネクティビティを育むことで、このシステムは植物ケアのプラクティスを強化し、持続可能性を促進し、AIとIoT技術のための革新的なアプリケーションを導入します。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:26:47 GMT)
Enhanced Unsupervised Image-to-Image Translation Using Contrastive Learning and Histogram of Oriented Gradients [0.0] 本稿では,Contrastive Unpaired Translation (CUT)モデルに基づく,教師なし画像から画像への変換手法を提案する。
この新しいアプローチは、セマンティックラベルなしでも画像のセマンティック構造を確実に保存する。
本手法は,GTA5データセットから都市景観データセットのリアルな都市シーンへの合成ゲーム環境の変換について検討した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:44:27 GMT)
Efficiency of neural quantum states in light of the quantum geometric tensor [0.0] ニューラル量子状態 (NQS) ans" はモンテカルロの変分アルゴリズムにおいて有望であることが示されている。
本研究では,スピン1双正弦波鎖の異なる相における基底状態を表現するための浅部ニューラルネットワークの効率について検討した。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:21:07 GMT)
Effect of Etching Methods on Dielectric Losses in Transmons [0.0] 弱酸溶液中での湿式エッチングと塩素系プラズマを用いた乾式エッチングの2種類のアルミニウムエッチング法を用いて作製したトランスモンについて実験的に検討した。
ドライエッチングキュービットの緩和とコヒーレンス時間は、ウェットエッチングキュービットの2倍以上である。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 13:52:12 GMT)
Eavesdropping on the BB84 Protocol using Phase-Covariant Cloning: Experimental Results [0.0] BB84プロトコルは、ノイズレス量子チャネル上でのセキュリティを保証する。
このようなシステムにおける許容誤差のレベルはまだ不明であり、eavesdropperによって生のキーに関する情報がどの程度得られるかは不明である。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 17:57:40 GMT)
Diffusion Models to Enhance the Resolution of Microscopy Images: A
Tutorial [0.0] このチュートリアルは、分散確率モデル(DDPM)をスクラッチから構築するためのガイドを提供する。
我々は、低解像度の顕微鏡画像を対応する高解像度バージョンに変換することに注力する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 22:29:22 GMT)
Development and Application of a Sentinel-2 Satellite Imagery Dataset for Deep-Learning Driven Forest Wildfire Detection [0.0] 深層学習(DL)による山火事検出のための森林山火事画像ペアの前後にラベル付き10,000枚以上の高解像度ラベル付き衛星画像データセットを構築した。
その結果, 森林火災の検出において, EF効率の高いNet-B0モデルが最も高い精度を92%以上達成できることが示唆された。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:25:02 GMT)
Deep convolutional framelets for dose reconstruction in BNCT with Compton camera detector [0.0] BNCTは、中性子捕捉反応10B(n,$alpha$)7Liに基づいて、がん組織に対して高い選択性を有する、革新的な放射線治療である。
本研究の目的は,BNCTコンプトンカメラ画像のシミュレーションデータセットを用いて,線量分布を推定するディープニューラルネットワークモデルを開発することである。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 09:34:19 GMT)
Curve-Fitted QPE: Extending Quantum Phase Estimation Results for a Higher Precision using Classical Post-Processing [0.0] 本稿では、標準QPE回路と曲線フィッティングを用いた古典的後処理からなるハイブリッド量子古典的アプローチを提案する。
提案手法は,最適クラム'er-Rao低境界性能で高精度であり,最大振幅推定アルゴリズムと変分量子固有解器の誤差分解能に匹敵することを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 05:15:35 GMT)
Ciphertext Malleability in Lattice-Based KEMs as a Countermeasure to Side Channel Analysis [0.0] 本稿では,Raviらによって公開されているいくつかのポスト量子暗号プリミティブの暗号文変換性に起因する脆弱性について論じる。
我々は,同じ暗号文の可読性を利用した新しい対策を提案し,その実用性をいくつかのPQCプリミティブに適用することについて議論する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 14:07:48 GMT)
Bayesian Federated Inference for regression models based on non-shared multicenter data sets from heterogeneous populations [0.0] 回帰モデルでは、サンプルサイズは予測器の数に対して十分な大きさでなければならない。
異なる(医療)センターで収集された異なるデータセットからデータをポーリングすることはこの問題を軽減するが、プライバシー規制やロジスティックな問題のためにしばしば実現不可能である。
別の方法は、センター内のローカルデータを別々に分析し、統計的推測結果とベイズ連邦推論(BFI)手法を組み合わせることである。
このアプローチの目的は、組み合わせたデータに対して統計的解析を行った場合、何を発見したのかを、別々の中心における推論結果から計算することである。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 12:04:40 GMT)
Assessing Simplification Levels in Neural Networks: The Impact of Hyperparameter Configurations on Complexity and Sensitivity [0.0] MNISTデータセットを使用して実施された実験は、ハイパーパラメータ、複雑性、感度の関係に関する洞察を提供することを目的としており、ニューラルネットワークにおけるこれらの概念のより深い理論的理解に寄与している。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 13:39:04 GMT)
A geometric formulation to measure global and genuine entanglement in three-qubit systems [0.0] 我々は、量子ビット成分の減少密度行列の最小固有値で定義される絡み合わせポリトープを考える。
これらの尺度は、大域的および真の絡み合いを識別し、対応する2つの分離可能なセグメント上のポリトープの所定の点の投影と拒絶にそれぞれ関連付けられる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 18:57:00 GMT)
A decision-theoretic model for a principal-agent collaborative learning problem [0.0] 本稿では,主成分が適切な凝集係数の集合を決定する主成分設定を伴う協調学習フレームワークについて考察する。
提案したフレームワークは安定性と一般化の点でいくつかの利点があるが、主役とエージェントは必ずしもサンプル分布や互いのデータセットの品質を知る必要はない。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 13:08:51 GMT)
A Zero-Shot Open-Vocabulary Pipeline for Dialogue Understanding [0.0] ドメイン分類と状態追跡(DST)をひとつのパイプラインに統合するゼロショットオープン語彙システムを提案する。
我々のアプローチには、より能力の低いモデルに対する質問応答タスクとしてDSTを再構成し、より適応可能なモデルに自己修正プロンプトを採用することが含まれる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:33:41 GMT)
A Survey on Recent Random Walk-based Methods for Embedding Knowledge Graphs [0.0] 知識グラフ上の機械学習、ディープラーニング、NLPメソッドは、異なる分野に存在する。
知識グラフは通常、高次元を持つので、それらを低次元ベクトル空間に変換する必要がある。
埋め込みは、入力データ固有の特徴が保存される方法で高次元ベクトルを変換できる低次元空間である。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 02:11:55 GMT)
A Multi-operator Ensemble LSHADE with Restart and Local Search Mechanisms for Single-objective Optimization [0.0] mLSHADE-RLは、シングルオブジェクト最適化におけるCEC 2017コンペティションの勝者の1つであるLSHADE-cnEpSinの拡張版である。
DE/current-to-pbest-weight/1はアーカイブなし、DE/current-to-pbest/1はアーカイブなし、DE/current-to-ordpbest-weight/1は元のLSHADE-cnEpSinに統合される。
LSHADE-cnEpSinは、CEC 2024コンペティションにおいて、単一目的制約付き最適化で30次元でテストされる。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 11:49:08 GMT)
A Monte Carlo Tree Search approach to QAOA: finding a needle in the haystack [0.0] 変分量子アルゴリズム(VQA)は、短期量子ハードウェアの限られた能力に対応するために設計された、ハイブリッド量子古典法の一種である。
本稿では,正規パラメータパターンの活用が決定木構造に深く影響し,フレキシブルかつノイズ耐性のある最適化戦略を可能にすることを示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 08:57:57 GMT)
A Computer Vision Approach for Autonomous Cars to Drive Safe at Construction Zone [0.0] 自律運転システム(ADS)を搭載した車は、適応クルーズ制御、衝突警報、自動駐車など、様々な最先端機能を備えている。
本稿では,多様なドリフト条件下で構築ゾーンや機能で動作可能なコンピュータビジョン技術を利用した,革新的で高精度な道路障害物検出モデルを提案する。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 07:11:00 GMT)
A Comprehensive Survey of Bias in LLMs: Current Landscape and Future Directions [0.0] 大規模言語モデル(LLM)は、前例のないテキスト生成、翻訳、理解能力を提供することで、自然言語処理(NLP)の様々な応用に革命をもたらした。
彼らの広範な展開は、これらのモデルに埋め込まれたバイアスに関して、重大な懸念をもたらしました。
本稿では, LLMにおけるバイアスの包括的調査を行い, これらのバイアスに関するタイプ, ソース, 影響, 緩和戦略について, 広範なレビューを行うことを目的としている。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 19:50:38 GMT)
A Butterfly Effect in Encoding-Decoding Quantum Circuits [0.0] 2部代数的外秩序相関器(mathcalA$-OTOC)によるスクランブルの測定
熱力学の限界では、無限小ノイズがマクロ情報スクランブルを誘導するテクシットバタフライ効果を示す。
論文参考訳(メタデータ) (Tue, 24 Sep 2024 22:01:14 GMT)