Scene-Text Grounding for Text-Based Video Question Answering [97.1] テキストベースのビデオ質問応答(TextVideoQA)の既存の取り組みは、不透明な意思決定とシーンテキスト認識への依存で批判されている。
我々は,モデルに質問への回答を強制し,関連するシーンテキスト領域を解釈させることにより,グラウンドドテキストビデオQAを研究する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 05:13:11 GMT)
SF-DQN: Provable Knowledge Transfer using Successor Feature for Deep Reinforcement Learning [89.0] 本稿では、複数のRL問題が異なる報酬関数を持つが、基礎となる遷移力学を共有する転写強化学習(RL)問題を考察する。
この設定では、各RL問題(タスク)のQ-関数を後継特徴(SF)と報酬マッピングに分解することができる。
GPIを用いたSF-DQNの証明可能な一般化保証を用いた最初の収束解析を確立する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 22:49:54 GMT)
Can-Do! A Dataset and Neuro-Symbolic Grounded Framework for Embodied Planning with Large Multimodal Models [85.6] 具体的計画能力を評価するために設計されたベンチマークデータセットであるCan-Doを紹介する。
私たちのデータセットには400のマルチモーダルサンプルが含まれており、それぞれが自然言語のユーザ指示、環境を描写した視覚イメージ、状態変化、対応するアクションプランで構成されています。
ニューログラウンド(NeuroGround)は、まず認識された環境状態において計画生成を基礎とし、次に象徴的な計画エンジンを活用してモデル生成計画を強化する、ニューログラウンド(NeuroGround)を提案する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 00:30:11 GMT)
ViViDex: Learning Vision-based Dexterous Manipulation from Human Videos [82.0] 我々は人間のビデオから視覚に基づくポリシー学習を改善するためにViViDexを提案する。
最初は強化学習と軌道誘導報酬を使って、各ビデオに対する州ベースのポリシーを訓練する。
次に、州ベースのポリシーから成功したエピソードをロールアウトし、特権情報を使用しずに統一された視覚ポリシーをトレーニングします。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 22:44:51 GMT)
Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [79.1] コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。
本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 09:31:58 GMT)
Rydberg Atomic Quantum Receivers for Classical Wireless Communication and Sensing [71.9] Rydberg 原子量子受信機 (RAQR) は無線周波数 (RF) 信号を受信するために設計されている。
RAQRは魅力的なスケーラビリティを示し、革新的でコンパクトな受信機の構築に貢献する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 15:55:02 GMT)
OStr-DARTS: Differentiable Neural Architecture Search based on Operation Strength [70.8] 分散アーキテクチャサーチ(DARTS)は、効果的なニューラルネットワークサーチの有望な技術として登場した。
DARTSは、アーキテクチャの劣化につながる、よく知られた退化問題に悩まされている。
最終損失に対する操作の重要性を推定する操作強度に基づく新しい基準を提案する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 13:16:07 GMT)
Knowledge Verification to Nip Hallucination in the Bud [69.8] 本研究では、アライメントデータに存在する外部知識と基礎LPM内に埋め込まれた固有の知識との矛盾を検証し、最小化することにより、幻覚を緩和する可能性を示す。
本稿では,知識一貫性アライメント(KCA, Knowledge Consistent Alignment)と呼ばれる新しい手法を提案する。
6つのベンチマークで幻覚を減らし, バックボーンとスケールの異なる基礎的LCMを利用することで, KCAの優れた効果を実証した。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 03:32:52 GMT)
Strength Lies in Differences! Improving Strategy Planning for Non-collaborative Dialogues via Diversified User Simulation [69.6] 本研究では,多様なユーザとの戦略的対話に携わる非協力的対話エージェントについて検討する。
これは既存の対話エージェントに2つの大きな課題をもたらす。
本稿では,ユーザ認識型戦略計画モジュールと人口ベーストレーニングパラダイムを取り入れた,適切な戦略計画の能力を高めるためのTripを提案する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 11:34:19 GMT)
Unveiling Narrative Reasoning Limits of Large Language Models with Trope in Movie Synopses [66.7] チェーン・オブ・シンクレット(CoT)プロンプトを備えた大規模言語モデルは、多段階の推論能力を示している。
本研究では,映画シナプスのトロープを利用して,最先端LLMの抽象的推論能力を評価する。
本稿では,これらの課題に対処し,F1スコアを11.8ポイント向上するためのトロープワイズクエリ手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 05:50:18 GMT)
PoIFusion: Multi-Modal 3D Object Detection via Fusion at Points of Interest [65.5] PoIFusionは、関心点(PoIs)におけるRGBイメージとLiDARポイントクラウドに関する情報を融合するフレームワークである。
提案手法は,各モダリティの視点を維持し,計算にやさしいプロジェクションと計算によってマルチモーダル特徴を得る。
我々はnuScenesとArgoverse2データセットについて広範囲に実験を行い、我々のアプローチを評価した。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 06:53:07 GMT)
A Coding Framework and Benchmark towards Low-Bitrate Video Understanding [63.1] 我々は,従来のコーデックとニューラルネットワーク(NN)の両方を活用する,従来型ニューラル混合符号化フレームワークを提案する。
このフレームワークは、動画の移動効率の良いセマンティック表現を確実に保持することで最適化される。
8つのデータセットに3つのダウンストリームタスクを備えた低ビットレートビデオ理解ベンチマークを構築し、このアプローチの顕著な優位性を実証した。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 09:47:26 GMT)
Free-VSC: Free Semantics from Visual Foundation Models for Unsupervised Video Semantic Compression [54.6] 教師なしビデオセマンティック圧縮(UVSC)は近年注目を集めている。
VFM から既製のリッチなセマンティクスを吸収することで UVSC タスクを強化することを提案する。
圧縮されたビデオと様々なVFM間のセマンティックスを柔軟に整合させるために,VFM固有のプロンプトによって補完されるVFMの共有セマンティックアライメント層を導入する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 08:23:33 GMT)
Mine yOur owN Anatomy: Revisiting Medical Image Segmentation with Extremely Limited Labels [54.6] 我々は、Mine yOur owN Anatomy (MONA) と呼ばれる、新しい半教師付き2次元医用画像セグメンテーションフレームワークを紹介する。
まず、先行研究では、すべてのピクセルがモデルトレーニングに等しく重要であると論じており、我々はこの1つだけで意味のある解剖学的特徴を定義できないことを経験的に観察している。
第2に,医療画像を解剖学的特徴の集合に分解できるモデルを構築する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 16:13:30 GMT)
Accelerated Stochastic ExtraGradient: Mixing Hessian and Gradient Similarity to Reduce Communication in Distributed and Federated Learning [50.4] 分散コンピューティングはデバイス間の通信を伴うため、効率性とプライバシという2つの重要な問題を解決する必要がある。
本稿では,データ類似性とクライアントサンプリングのアイデアを取り入れた新しい手法について分析する。
プライバシー問題に対処するために,付加雑音の手法を適用し,提案手法の収束への影響を解析する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 00:49:10 GMT)
Lidar Panoptic Segmentation in an Open World [50.1] ライダーパノプティクス(LPS)は自動運転車の安全な配備に不可欠である。
LPSは、セマンティッククラスの事前に定義された語彙であるライダーポイントを認識し、セグメント化することを目的としている。
階層的な方法で入力クラウドのクラスタリングとオーバーセグメンテーションを提案し,次にバイナリポイントセグメント分類を行う。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 00:10:20 GMT)
The Brain Tumor Segmentation (BraTS) Challenge: Local Synthesis of Healthy Brain Tissue via Inpainting [50.0] 脳腫瘍患者の場合、画像取得の時系列は通常、すでに病理的なスキャンから始まる。
多くのアルゴリズムは、健康な脳を分析し、病変を特徴とする画像の保証を提供しないように設計されている。
例えば、脳解剖学のパーセレーション、組織セグメンテーション、脳抽出のアルゴリズムがある。
そこで参加者は、損傷した脳から健康な脳スキャンを合成するための塗装技術を探る。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 14:34:23 GMT)
Testing Causal Models with Hidden Variables in Polynomial Delay via Conditional Independencies [50.0] 観測データに対して仮説化された因果モデルをテストすることは、多くの因果推論タスクにとって重要な前提条件である。
モデルは指数関数的に多くの条件付き独立関係(CI)を仮定できるが、これら全てをテストすることは実用的でなく不必要である。
隠れ変数を持つ因果グラフのc-LMPを導入し、これらのCIを多時間間隔でリストする遅延アルゴリズムを開発した。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 21:05:56 GMT)
How to Blend Concepts in Diffusion Models [48.7] 近年の手法は複数の潜在表現とその関連性を利用しており、この研究はさらに絡み合っている。
我々のゴールは、潜在空間における操作が根底にある概念にどのように影響するかを理解することです。
我々の結論は、宇宙操作によるブレンドの概念は可能であるが、最良の戦略はブレンドの文脈に依存する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 07:02:35 GMT)
Low-Light Enhancement Effect on Classification and Detection: An Empirical Study [48.7] 我々は,低照度画像強調法(LLIE)が高レベル視覚タスクに与える影響を評価する。
本研究は,人間の視覚知覚における画像強調と,機械解析における切り離しを示唆するものである。
この洞察は、人間と機械の視覚の両方のニーズに合致するLLIE技術の開発に不可欠である。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 14:21:31 GMT)
From Lazy to Rich: Exact Learning Dynamics in Deep Linear Networks [47.1] 人工ネットワークでは、これらのモデルの有効性はタスク固有の表現を構築する能力に依存している。
以前の研究では、異なる初期化によって、表現が静的な遅延状態にあるネットワークや、表現が動的に進化するリッチ/フィーチャーな学習体制のいずれかにネットワークを配置できることが強調されていた。
これらの解は、豊かな状態から遅延状態までのスペクトルにわたる表現とニューラルカーネルの進化を捉えている。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 23:19:04 GMT)
Selective Annotation via Data Allocation: These Data Should Be Triaged to Experts for Annotation Rather Than the Model [42.7] 我々は、SANTと呼ばれる選択的なアノテーションフレームワークを提案する。
提案した誤り認識トリアージと二重み付け機構により、トリアージ・ツー・ヒューマンデータとトリアージ・ツー・モデルデータの両方を効果的に活用する。
実験の結果、SANTは他のベースラインを一貫して上回り、専門家とモデルワーカーの両方にデータの適切な割り当てを通じて高品質なアノテーションをもたらすことが示された。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 11:18:59 GMT)
DICE: Detecting In-distribution Contamination in LLM's Fine-tuning Phase for Math Reasoning [40.6] 大規模言語モデル(LLM)の性能向上に寄与する分布内汚染
本研究では, LLMの内部状態を利用して汚染を検出・検出する新しい手法であるDICEを提案する。
実験により、DICEは様々なLSMおよび数学推論データセットにまたがる分布内汚染を検出するのに高い精度を示している。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 12:40:35 GMT)
MaskedMimic: Unified Physics-Based Character Control Through Masked Motion Inpainting [38.2] MaskedMimicは、物理に基づく文字制御を一般的なモーションインペイント問題として定式化する新しいアプローチである。
MaskedMimicは、モーションインペイントによる文字制御を統一することにより、多目的な仮想文字を生成する。
これらのキャラクターは複雑なシーンに動的に適応し、必要に応じて多様な動きを構成でき、よりインタラクティブで没入的な体験を可能にする。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 11:10:59 GMT)
Towards Online Continuous Sign Language Recognition and Translation [37.2] 連続手話認識の研究は、聴覚障害者と聴覚障害者のコミュニケーションギャップを埋めるのに不可欠である。
我々は、手話辞書を開発し、その辞書上で孤立手話認識モデルを訓練し、入力手話シーケンスにスライディングウインドウアプローチを用いる。
我々のオンライン認識モデルは、グロス・トゥ・テキスト・ネットワークを統合することで、オンライン翻訳をサポートするように拡張することができる。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 17:15:32 GMT)
Using Natural Language Processing to find Indication for Burnout with Text Classification: From Online Data to Real-World Data [36.1] バーンアウトは、疲労、シニシズム、およびプロの効能の低下によって特徴づけられる。
自然言語処理と機械学習の最近の進歩は、バーンアウトを検出するための有望なツールを提供する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 08:13:17 GMT)
Harnessing Vision-Language Pretrained Models with Temporal-Aware Adaptation for Referring Video Object Segmentation [34.4] 現在の参照ビデオオブジェクト(RVOS)メソッドは通常、バックボーンとして独立して事前訓練された視覚と言語モデルを使用する。
画素レベルの予測に事前学習した表現を適応させる時間認識型プロンプトチューニング手法を提案する。
提案手法は最先端のアルゴリズムに対して良好に動作し,強力な一般化能力を示す。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 06:32:08 GMT)
SAC-KG: Exploiting Large Language Models as Skilled Automatic Constructors for Domain Knowledge Graphs [32.9] 本稿では,大規模言語モデル(LLM)をドメイン知識グラフのためのスキル自動コンストラクタとして活用するための汎用的なKG構築フレームワークであるSAC-KGを提案する。
SAC-KGは、専門的で正確なマルチレベルKGを生成するために、LLMをドメインエキスパートとして効果的に扱う。
実験により、SAC-KGは100万以上のノードで自動的にドメインKGを構築し、89.32%の精度を達成することが示された。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 13:55:23 GMT)
One Model for Two Tasks: Cooperatively Recognizing and Recovering Low-Resolution Scene Text Images by Iterative Mutual Guidance [32.9] 高分解能(HR)画像からのシーンテキスト認識(STR)は著しく成功したが、低分解能(LR)画像でのテキスト読取は依然として困難である。
近年,多くのシーンテキスト画像超解像(STISR)モデルがLR画像の超解像(SR)画像を生成するために提案され,SR画像上でSTRが実行されることにより認識性能が向上した。
本稿では,LRシーンのテキスト画像の同時認識と復元を効果的に行う,画像と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 15:05:25 GMT)
ISC4DGF: Enhancing Directed Grey-box Fuzzing with LLM-Driven Initial Seed Corpus Generation [32.6] ディレクトグレーボックスファジィング(DGF)は、特定の脆弱性に焦点を絞って必須となっている。
ISC4DGFはLarge Language Models (LLMs) を用いてDGFのための最適化された初期シードコーパスを生成する
ISC4DGFは35.63倍のスピードアップと616.10倍の目標到達を達成した。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 06:27:28 GMT)
m&m's: A Benchmark to Evaluate Tool-Use for multi-step multi-modal Tasks [31.0] 我々は、33のツールを含む4K以上のマルチステップマルチモーダルタスクを含むベンチマークであるm&m'sを紹介する。
これら各タスククエリに対して、この現実的なツールセットを使用して自動生成されたプランを提供する。
1,565のタスクプランの高品質なサブセットを提供する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 06:08:23 GMT)
EchoAtt: Attend, Copy, then Adjust for More Efficient Large Language Models [29.6] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて優れた性能を示している。
本稿では,レイヤ間の注目パターンの類似性を解析し,活用することにより,トランスフォーマーベースモデルの最適化を目的とした,新しいフレームワークであるEchoAttを紹介する。
TinyLLaMA-1.1Bによる最良の結果は、EchoAttが推論速度を15%改善し、トレーニング速度を25%改善し、パラメータ数を約4%削減し、ゼロショット性能を改善したことを示している。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 21:08:37 GMT)
Investigating Layer Importance in Large Language Models [28.2] 大規模言語モデル (LLM) は、テキストの理解と処理に際し、注目を集めている。
LLMの理解の欠如は、安全クリティカルなシナリオへの展開を妨げ、より良いモデルの開発を妨げる。
本研究は, LLMの基盤層を同定し, 今後の研究におけるその重要な役割を浮き彫りにする。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 09:53:13 GMT)
Learning to Adapt SAM for Segmenting Cross-domain Point Clouds [25.7] 3Dセグメンテーションタスクにおける教師なしドメイン適応(UDA)は、非常に難しい課題である。
本稿では,3次元特徴空間とSAMの特徴空間との整合性を大幅に向上させる,革新的なハイブリッド機能拡張手法を提案する。
提案手法は,広く認識されている多くのデータセットで評価され,最先端の性能を実現する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 16:16:44 GMT)
SAFDNet: A Simple and Effective Network for Fully Sparse 3D Object Detection [22.1] SAFDNetは、完全にスパースな3Dオブジェクト検出のための単純かつ高効率なアーキテクチャである。
オープン、nuScenes、Argoverse2データセットについて広範な実験を行った。
SAFDNetは以前の最高のハイブリッド検出器HEDNetを2.1倍高速で2.6%のmAPで上回った。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 15:34:34 GMT)
Unsupervised Word Discovery: Boundary Detection with Clustering vs. Dynamic Programming [22.0] 我々は、ラベルなし音声を単語のようなセグメントに分割し、それらを辞書に集約するという長年の課題について考察する。
そこで我々は, 隣接した自己教師付き特徴の相似性を用いて単語境界を予測し, 予測セグメントをクラスタ化して辞書を構築するという, より単純な戦略を提案する。
公平な比較のために、より優れた機能と境界制約を持つ古いES-KMeans動的プログラミング手法を更新する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 15:16:43 GMT)
Rethinking Semantic Parsing for Large Language Models: Enhancing LLM Performance with Semantic Hints [20.8] 本稿では,意味的ヒントをプロンプト内に埋め込む新しいプロンプト手法であるSENSEを提案する。
実験の結果、SENSE は様々なタスクで LLM のパフォーマンスを継続的に改善していることがわかった。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 14:35:09 GMT)
Can VLMs Play Action Role-Playing Games? Take Black Myth Wukong as a Study Case [20.1] 本研究の目的は,複雑なアクションゲーム環境にマルチモーダルエージェントを適用するための新たな洞察と方向性を提供することである。
我々は、既存の視覚言語モデルの能力境界を探求する研究プラットフォームとして、ARPG、Black Myth: Wukong'を選択した。
記録されたゲームプレイビデオとマウスとキーボードアクションを含む操作ログを含む人間の操作データセットをリリースする。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 09:51:58 GMT)
Exploring Multilingual Probing in Large Language Models: A Cross-Language Analysis [19.4] 大規模言語モデル(LLM)の探索技術は主に英語に焦点を合わせており、世界の言語の大部分を見下ろしている。
複数のオープンソースのLCMモデルで実験を行い、探索精度、層間の傾向、および複数の言語に対する探索ベクトル間の類似性を解析した。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 14:14:05 GMT)
Protein-Mamba: Biological Mamba Models for Protein Function Prediction [18.6] タンパク質-マンバは、タンパク質機能予測を改善するために、自己教師付き学習と微調整の両方を活用する新しい2段階モデルである。
実験の結果,Protein-Mambaはいくつかの最先端手法と比較して,競争力を発揮することが示された。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 22:51:56 GMT)
RPKI: Not Perfect But Good Enough [18.4] Resource Public Key Infrastructureプロトコルは、インターネットルーティングに暗号化セキュリティを追加するために標準化された。
ホワイトハウスは2024年9月4日、インターネットセキュリティへのロードマップで、RPKIはドメイン間ルーティングを確保するための成熟した、容易に利用できる技術であることを示した。
本研究は、RPKIの成熟度を実運用レベルの技術として初めて包括的に研究したものである。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 16:21:14 GMT)
Learning New Tasks from a Few Examples with Soft-Label Prototypes [18.4] ソフトラベルのプロトタイプ(SLP)に基づく新しい数ショット学習手法を提案する。
これまでにないNLPタスク(4,8,16)の学習に重点を置いている。
このデータ・リーン・セッティングにおけるテスト作業の大部分において,本手法が優れた性能を発揮することを実験的に実証した。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 09:54:47 GMT)
Pomo3D: 3D-Aware Portrait Accessorizing and More [16.8] Pomo3Dは3Dポートレート操作フレームワークで、ポートレートやアクセサリーを分解して再コンパイルすることで、自由にアクセゾライズできる。
Scribble2Accessoriesモジュールを導入し、Pomo3Dがユーザ絵のアクセサリー・スクリブル・マップから3Dアクセサリーを作成できるようにする。
上記のオブジェクトレベルの操作に加えて、Pomo3Dはジオメトリやテクスチャのグローバルあるいはローカルな編集やアバターのスタイリングなど、ポートレートの編集オプションも備えている。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 13:03:24 GMT)
Thinking in Granularity: Dynamic Quantization for Image Super-Resolution by Intriguing Multi-Granularity Clues [16.3] 本稿では,画像の固有特性を活かしたグラニュラーDQを提案する。
グラニュラーDQは局所パッチの多粒度解析を行い、その情報密度をさらに探究する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 06:29:54 GMT)
Fake It till You Make It: Curricular Dynamic Forgery Augmentations towards General Deepfake Detection [15.9] 我々は,textbfCurricular textbfDynamic textbfForgery textbfAugmentation (CDFA)と呼ばれる新しいディープフェイク検出法を提案する。
CDFAは、偽造拡張ポリシーネットワークでディープフェイク検出器を共同で訓練する。
そこで本研究では,CDFAが各種難燃性ディープフェイク検出器のクロスデータセットおよびクロスマニピュレーション性能を著しく向上できることを示す。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 13:51:22 GMT)
Towards Model-Agnostic Dataset Condensation by Heterogeneous Models [13.2] 我々は,クロスモデル相互作用により,普遍的に適用可能なコンデンサ画像を生成する新しい手法を開発した。
モデルのコントリビューションのバランスとセマンティックな意味の密接な維持により,本手法は,モデル固有凝縮画像に関連する制約を克服する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 17:13:07 GMT)
Detecting a Fifth-Force Gauge Boson via Superconducting Josephson Junctions [12.9] 超伝導ジョセフソン接合を用いた第5の力による量子位相差を検出する新しい設計法を提案する。
この実験は、ゲージボソンが0.01,$eVから10,$eVの範囲内にある場合、ゲージカップリングに最も敏感であることがわかった。
これは、新しい物理をミリ以下の小さなスケールで測定するための新しい道を開く。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 11:53:23 GMT)
A Unified Approach for Learning the Dynamics of Power System Generators and Inverter-based Resources [12.7] 再生可能エネルギーの統合と電気化のためのインバータベースの資源(IBR)は、電力系統の動的解析に大きく挑戦する。
同期ジェネレータ(SG)とIRBの両方を考慮するため、この研究は個々の動的コンポーネントのモデルを学ぶためのアプローチを示す。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 14:07:10 GMT)
On the Hardness of Decentralized Multi-Agent Policy Evaluation under Byzantine Attacks [12.7] 完全分散型マルチエージェント政策評価問題について,最大$f$の障害エージェントの存在下で検討する。
特に、モデル中毒設定を伴ういわゆるビザンツの欠陥モデルに焦点を当てる。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 03:11:54 GMT)
Dormant: Defending against Pose-driven Human Image Animation [12.1] ポーズ駆動の人間の画像アニメーションは、非常に進歩し、1枚の写真から鮮明でリアルな人間のビデオを生成することができる。
逆に、攻撃者が利用可能な1つの画像を使って、政治、暴力、その他の違法コンテンツを含むビデオを作成することで、画像誤使用のリスクが悪化する。
本研究では,ポーズ駆動型人体画像アニメーション技術に対する防御を目的とした,新しい保護手法であるDormantを提案する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 12:51:32 GMT)
To Err Is AI! Debugging as an Intervention to Facilitate Appropriate Reliance on AI Systems [11.7] 最適な人間とAIのコラボレーションのためのビジョンは、人間のAIシステムへの「適切な依存」を必要とする。
実際には、アウト・オブ・ディストリビューションデータにおける機械学習モデルの性能格差は、データセット固有のパフォーマンスフィードバックを信頼できないものにしている。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 09:43:27 GMT)
Green Federated Learning: A new era of Green Aware AI [11.5] フェデレートラーニング(FL)は、このニーズに対処する新たな機会を提供する。
グリーンアウェアなAIアルゴリズムの既存の取り組みとギャップをナビゲートし、理解するためのロードマップを、研究者、ステークホルダ、関心のある関係者に提供することが重要です。
この調査は主に、100を超えるFL作品を特定し分析することで、この目的を達成することを目的としている。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 22:07:15 GMT)
Exact mean and variance of the squared Hellinger distance for random density matrices [11.5] 量子状態間のヘリンジャー距離は、量子情報理論において重要な測度である。
本稿では,ガンマ分布に基づいて,対応する確率密度関数の近似式を提案する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 18:56:49 GMT)
Estimating the Completeness of Discrete Speech Units [11.3] 我々は情報理論の観点から、情報が存在するか(情報完全性)とアクセス可能か(情報アクセシビリティ)に答える。
HuBERT離散単位には話者情報が十分存在しており、残音には音声情報が十分存在しており、ベクトル量子化が絡み合っていないことを示す。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 18:40:09 GMT)
Patch Ranking: Efficient CLIP by Learning to Rank Local Patches [11.2] ViT効率を向上する現在の戦略はパッチトークンのプルーニングに重点を置いているが、CLIPのマルチモーダルな性質に対処するには不足している。
我々は「黄金ランキング」を確立するための欲求探索手法を提案し、このランキングを近似するために特別に訓練された軽量な予測器を導入する。
CLIPのViTではパッチトークンの40%を削減できたが、7つのデータセットの平均精度損失は0.3に過ぎなかった。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 22:04:26 GMT)
What Are They Doing? Joint Audio-Speech Co-Reasoning [11.0] 最近のAuditory Large Language Models (ALLM)は、単一のモデル内で音声と音声を同時に処理できるようにする。
音声処理と音声処理を統合する新しいタスクであるJASCO(Joint Audio-Speech Co-Reasoning)を導入する。
一般的なALLMの合理化能力を評価するために,共同音声合成ベンチマークを構築した。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 16:45:57 GMT)
Event Camera Data Dense Pre-training [10.9] 本稿では,イベントカメラデータを用いた高密度予測タスクに適したニューラルネットワークの事前学習を目的とした,自己教師付き学習フレームワークを提案する。
フレームワークをトレーニングするために、さまざまなシーンと動きパターンを特徴とする合成イベントカメラデータセットをキュレートする。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 12:28:40 GMT)
Can Large Language Models Logically Predict Myocardial Infarction? Evaluation based on UK Biobank Cohort [10.7] 大規模言語モデル (LLMs) は臨床的意思決定支援の分野で非常に進歩している。
本研究の目的は,急性心筋梗塞(MI)の発症リスクを論理的推論で予測できることを定量的に評価することである。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 14:57:31 GMT)
An Empirical Study of Refactoring Engine Bugs [7.4] Eclipse、IntelliJ IDEA、Netbeansのバグを分析することで、エンジンのバグに関する最初の体系的な研究を示す。
これらのバグは, タイプ, 症状, 根本原因, トリガー条件によって分析した。
我々のトランスファービリティー調査では、これらのエンジンの最新バージョンに130の新たなバグが見つかった。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 22:09:39 GMT)
On the extreme points of sets of absolulely separable and PPT states [7.0] 絶対分離可能状態 (resp. PPT) は、任意の大域的ユニタリ演算の下では分離可能状態 (resp. positive partial transpose) のままである。
各極点が少なくとも3つの異なる固有値を持つことを示す。
また、qutrit-qudit系における任意の極点が、少なくとも7つの異なる固有値を持つことを示す。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 07:17:25 GMT)
Predicting User Stances from Target-Agnostic Information using Large Language Models [6.9] ターゲットに依存しないソーシャルメディア投稿のコレクションから,ターゲットに対するユーザの姿勢を予測できるLarge Language Models(LLMs)機能について検討した。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 11:21:16 GMT)
Secrets of Edge-Informed Contrast Maximization for Event-Based Vision [6.7] イベントカメラは、高速非同期イベントの形で画像平面内の強度勾配(エッジ)の動きをキャプチャする。
コントラストヒストグラム(CM)は、この効果を逆転させ、鋭い空間構造を生成できる最適化フレームワークである。
CMをユニモーダル(イベントのみ)からバイモーダル(イベントとエッジ)に拡張する新しいハイブリッドアプローチを提案する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 22:22:26 GMT)
Proof Automation with Large Language Models [6.6] 大規模言語モデル(LLM)は、自然言語で非公式な証明を自動的に生成する可能性を示している。
本稿では,まず LLM に初期証明を生成することを促し,次に目標とする記号法を利用して低レベルの問題を反復的に修復する,新しい生成・修復手法である PALM を提案する。
その結果、PALMは他の最先端の手法よりも大幅に優れており、76.6%から180.4%の定理を証明できた。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 00:19:27 GMT)
XRec: Large Language Models for Explainable Recommendation [5.6] 我々は、XRecと呼ばれるモデルに依存しないフレームワークを導入し、大規模言語モデルがレコメンデーションシステムにおけるユーザの振る舞いを説明することを可能にする。
我々の実験は、説明可能なレコメンデータシステムにおいて、ベースラインアプローチよりも優れた、包括的で意味のある説明を生成するXRecの能力を実証した。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 14:50:52 GMT)
Enhancing Automated Program Repair with Solution Design [5.5] DRCodePilot は GPT-4-Turbo の APR 機能を DR をプロンプト命令に組み込むことで拡張する手法である。
DRCodePilotはGPT-4を直接利用するよりも4.7倍高いフルマッチ比を達成しています。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 03:16:38 GMT)
Full characterization of an all fiber source of heralded single photons [5.5] パルス励起自発4光波混合から発生する光子対をベースとした1光子源の共有化を実証する。
1550nm帯の単一光子源は、光子計数法とホモダイン検出法の両方で特徴付けられる。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 04:37:50 GMT)
A Visualized Malware Detection Framework with CNN and Conditional GAN [5.5] 本稿では,機械学習活用者が経験する共通問題に対処する統合フレームワークを提案する。
すなわち、拡張付き画像提示システムは、良性/悪性サンプルの同一性を保存するように設計されている。
条件付きジェネレーティブ・アドバイサル・ネットワークに基づくモデルを用いて合成画像を生成する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 13:29:10 GMT)
SPAQ-DL-SLAM: Towards Optimizing Deep Learning-based SLAM for Resource-Constrained Embedded Platforms [5.4] 本稿では,現在最先端のDL-SLAMアルゴリズムであるDROID-SLAMのアーキテクチャにSPAQ(Structured Pruning and Quantization)を適用したフレームワークを提案する。
DROID-SLAMモデルの最適化版であるSPAQ-DROIDSLAMモデルは、FLOPを18.9%削減し、全体のモデルサイズを79.8%削減する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 16:19:47 GMT)
AR Overlay: Training Image Pose Estimation on Curved Surface in a Synthetic Way [5.0] 本稿では,複数のロゴイメージを同時に検出できるパイプラインを提案する。
本稿では,複数のロゴイメージを同時に検出できるパイプラインを提案し,入力として元の画像のみを必要とする。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 19:44:46 GMT)
Model-Free Learning and Optimal Policy Design in Multi-Agent MDPs Under Probabilistic Agent Dropout [4.9] 本研究では,マルチエージェント・マルコフ決定プロセス(MDP)について検討し,エージェント・ドロップアウトとポスト・ドロップアウトシステムに対するポリシーの計算を行う。
まず,1つのMDPで,期待されるポストドロップアウトシステムの価値を表現できることを示す。
さらに,モデルのない状況下では,ロバストなMDP値を,プリドロップアウトシステムによって生成されたサンプルで推定できることが示唆された。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 17:10:12 GMT)
AggregHate: An Efficient Aggregative Approach for the Detection of Hatemongers on Social Platforms [4.6] ヘイト・モンガーの検出には,ヘイトフルテキストやユーザ・アクティビティ,ユーザ・ネットワークを考慮し,マルチモーダル・アグリゲーティブ・アプローチを検討する。
本手法は, コーデックメッセージの分類, ドッグホイストリング, 人種的ガスライティングの改善, 介入対策の通知に有効である。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 14:29:49 GMT)
Deciphering Hate: Identifying Hateful Memes and Their Targets [4.6] BHMにおけるヘイトフルミーム検出のための新しいデータセットについて紹介する。
データセットは、7,148のミームとコードミキシングされたキャプションで構成され、(i)憎しみのあるミームを検知し、(ii)ターゲットとする社会的実体を検知する。
これらの課題を解決するために,メメから重要なモダリティ特徴を体系的に抽出するマルチモーダルディープニューラルネットワークDORAを提案する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 15:50:05 GMT)
EQ-CBM: A Probabilistic Concept Bottleneck with Energy-based Models and Quantized Vectors [4.5] 概念ボトルネックモデル(CBM)は、人間の理解可能な概念を活用して解釈可能性を高める効果的なアプローチとして注目されている。
既存のCBMは、決定論的概念の符号化と一貫性のない概念への依存によって問題に直面し、不正確な結果となった。
本稿では,確率論的概念エンコーディングによりCBMを強化する新しいフレームワークであるEQ-CBMを提案する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 23:43:45 GMT)
Prediction and Detection of Terminal Diseases Using Internet of Medical Things: A Review [4.4] AI駆動モデルでは、心臓疾患、慢性腎臓病(CKD)、アルツハイマー病、肺がんの予測において98%以上の精度が達成されている。
IoMTデータは巨大で異種であり、患者のプライバシを保護するための相互運用性とセキュリティを確保するための複雑さが増している。
今後の研究は、データ品質と相互運用性を改善するために、データの標準化と高度な前処理技術に焦点を当てるべきである。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 15:02:33 GMT)
Investigating the Impact of Hard Samples on Accuracy Reveals In-class Data Imbalance [4.3] AutoMLドメインでは、モデルの有効性を評価するための重要な指標として、テスト精度が宣言される。
しかし、主性能指標としての試験精度の信頼性は疑問視されている。
トレーニングセットとテストセット間のハードサンプルの分布は、これらのセットの難易度に影響を与える。
本稿では,ハードサンプル識別法を比較するためのベンチマーク手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 11:38:14 GMT)
Nirjas: An open source framework for extracting metadata from the source code [4.0] メタデータとコメントはどんなソフトウェア開発プロセスにおいても重要な要素です。
我々はPythonベースのオープンソースフレームワークであるNirjasを紹介し、構造化された方法でメタデータを抽出するのに役立つ。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 22:09:35 GMT)
RobotFingerPrint: Unified Gripper Coordinate Space for Multi-Gripper Grasp Synthesis [3.8] 本稿では,複数のグリップの合成を把握するための統一グリップ座標空間として,新しい表現を導入する。
空間は3次元の球面の2次元表面であり、緯度と緯度を座標とし、全てのロボットグリップパーに共有される。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 16:25:31 GMT)
Can a Neural Model Guide Fieldwork? A Case Study on Morphological Inflection [3.5] 言語学のフィールドワークは、言語の文書化と保存において重要な要素である。
本稿では,言語学者をフィールドワーク中に指導し,言語学者と話者の相互作用のダイナミクスを説明する新しいモデルを提案する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 23:40:03 GMT)
Challenging the Performance-Interpretability Trade-off: An Evaluation of Interpretable Machine Learning Models [3.4] 一般化加法モデル(GAM)は、完全に解釈可能でありながら、複雑で非線形なパターンをキャプチャするための有望な特性を提供する。
本研究では、20のベンチマークデータセットの収集に基づいて、7つのGAMの予測性能を7つの機械学習モデルと比較した。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 12:58:52 GMT)
A new method for optical steel rope non-destructive damage detection [3.2] 本稿では,高高度(空中ロープウェイ)における鋼ロープの非破壊損傷検出のための新しいアルゴリズムを提案する。
RGBD-UNetという名前のセグメンテーションモデルは、複雑な背景から鋼のロープを正確に抽出するように設計されている。
VovNetV3.5と呼ばれる検出モデルは、通常の鋼ロープと異常鋼ロープを区別するために開発された。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 12:30:23 GMT)
Knowledge Transfer from High-Resource to Low-Resource Programming Languages for Code LLMs [2.9] 本稿では,半合成データを用いた低リソース言語上でのコードLLMの性能向上に有効な手法を提案する。
このアプローチを適用して,Julia,Lua,OCaml,R,Racketの各トレーニング項目を数万個生成する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 03:53:23 GMT)
SOS: Segment Object System for Open-World Instance Segmentation With Object Priors [2.9] 画像中の任意の未知のオブジェクトを、訓練中に限定された注釈付きオブジェクトの集合から一般化することで分割する手法を提案する。
提案手法はCOCO, LVIS, ADE20kデータセットに対して強力な一般化能力を示し, 最先端技術と比較して81.6%の精度向上を実現している。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 23:35:31 GMT)
The X Types -- Mapping the Semantics of the Twitter Sphere [2.7] ソーシャルネットワークは、影響力のあるエンティティが人気のあるアカウントに対応する世界知識の貴重な情報源を形成する。
意味オントロジーを保持する事実知識ベース(KB)とは異なり、構造化された意味情報はソーシャルメディアでは利用できない。
本研究では、約200万のTwitterアカウントのソーシャルKBについて検討する。
例えば、あるアカウントが政治家や音楽家に属しているかどうかを判断する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 20:22:16 GMT)
A Persistent Hierarchical Bloom Filter-based Framework for Authentication and Tracking of ICs [2.6] 本研究では,持続階層型ブルームフィルタ(PHBF)フレームワークを導入し,サプライチェーン全体で100%の精度で高速かつ正確なIC認証を実現する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 04:15:01 GMT)
Exploiting Minority Pseudo-Labels for Semi-Supervised Semantic Segmentation in Autonomous Driving [2.6] マイノリティ・クラス・ラーニングを強化するためのプロフェッショナル・トレーニング・モジュールと、より包括的なセマンティック情報を学ぶための一般的なトレーニング・モジュールを提案する。
実験では,ベンチマークデータセットの最先端手法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 13:58:19 GMT)
Magic Mirror on the Wall, How to Benchmark Quantum Error Correction Codes, Overall ? [2.3] 量子誤り訂正符号(Quantum Error Correction Codes、QECC)は、ノイズやエラーの悪影響から量子状態を保護することにより、量子コンピューティングの進歩において重要なものである。
QECCの分野では大幅な改善があったが、それらを一貫した基準で評価するための統一的な方法論はいまだ解明されていない。
本稿では,QECCの最初のベンチマークフレームワークについて述べる。
我々は、与えられたシナリオの特定の要求に適応するQECCを選択するための体系的な戦略を開発し、量子誤り訂正に対する調整されたアプローチを容易にする。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 18:21:58 GMT)
Evaluating Source Code Quality with Large Languagem Models: a comparative study [2.3] 本稿では,静的解析ツールとしてLarge Language Model (LLM) を用いて得られた結果について述べる。
GPT 3.5 TurboとGPT 4oの2種類のモデルを比較し,合計1,641クラスの分析を行った。
GPT 4o版では、低品質と評価されたコードに高い分類を割り当てることで、以前のモデルとSonarから切り離された結果が示されなかった。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 15:05:25 GMT)
Fairness-Optimized Synthetic EHR Generation for Arbitrary Downstream Predictive Tasks [2.1] 本稿では,実EHRデータと整合した合成EHRデータを生成するパイプラインを提案する。
下流タスクと2つの異なるEHRデータセットにまたがるパイプラインの有効性を実証する。
提案したパイプラインは、ヘルスAIアプリケーションの公正性に対処する既存のツールボックスに、広く適用可能な補完ツールを追加することができる。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 19:54:14 GMT)
Flag Proxy Networks: Tackling the Architectural, Scheduling, and Decoding Obstacles of Quantum LDPC codes [1.9] 本稿では,高次曲面符号と高次カラー符号の2種類のQLDPC符号について考察する。
次数4 FPNは、それぞれ2.9times$と5.5times$で、d = 5$平面面符号よりも空間効率が高い。
双曲符号は、その平面コードに匹敵するエラー率を持つ。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 01:08:58 GMT)
ESPERANTO: Evaluating Synthesized Phrases to Enhance Robustness in AI Detection for Text Origination [1.8] 本稿では,検出を回避する新しい手法としてバックトランスレーションを紹介する。
本稿では、これらの裏書きされたテキストを組み合わせて、オリジナルのAI生成テキストの操作されたバージョンを生成するモデルを提案する。
我々は,この手法を,オープンソースと3つのプロプライエタリシステムを含む9つのAI検出器上で評価する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 01:13:22 GMT)
A Dataset of Uniswap daily transaction indices by network [1.8] DeFi(Decentralized Finance)は、仲介者なしで直接取引を可能にすることで、従来の金融を再構築している。
レイヤ2(L2)ソリューションは、レイヤ1(L1)システムを超えた、DeFiエコシステムのスケーラビリティと効率を高めるために登場しています。
この研究は、L1ネットワークとL2ネットワークの両方にわたる主要な分散取引であるUnixwapから5000万件以上のトランザクションを分析し、ギャップを埋める。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 10:13:49 GMT)
Geometric Optimization of Quantum Control with Minimum Cost [1.8] 微分幾何学の観点から量子制御の最適化について検討する。
コスト関数を定義することにより、軌跡の長さによってコストを定量化する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 17:15:34 GMT)
Scoring rule nets: beyond mean target prediction in multivariate regression [1.8] 条件付きCRPSは、CRPSを拡張する厳密な適切なスコアリングルールである。
本研究では,合成データと実データの両方において,条件CRPSがMLEより優れていることを示す。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 14:09:12 GMT)
Training a high-performance retinal foundation model with half-the-data and 400 times less compute [1.7] ムーアフィールドズアイ病院(MEH)の研究者たちは、90万枚の画像でトレーニングされた網膜基盤モデルであるRETFound-MEHを提案した。
最近、データ効率のよいDERETFoundが提案され、わずか15万の公開画像でトレーニングされている。
本稿では,75,000枚しか公開されていない画像と400倍の計算量でトレーニングされた網膜基盤モデルであるRETFound-Greenのトレーニングに使用する,新しいToken Restructionの目標を提案する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 17:25:40 GMT)
Opinion Mining on Offshore Wind Energy for Environmental Engineering [1.6] 我々は、オフショア風力エネルギーに関する大衆の意見を研究するために、ソーシャルメディアデータに対する感情分析を行う。
我々は、TextBlob、VADER、SentiWordNetという3つの機械学習モデルを適用する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 01:51:43 GMT)
Blockchain Based Information Security and Privacy Protection: Challenges and Future Directions using Computational Literature Review [1.4] ブロックチェーン技術は、個々のセキュリティとプライバシの強化で大きな人気を集めています。
論文の急激な普及は、手動分析と合成の課題を提示している。
セキュリティとプライバシに関するトピックを10つ特定し、各トピックについて詳細な説明を提供します。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 14:41:43 GMT)
Uncovering EDK2 Firmware Flaws: Insights from Code Audit Tools [1.3] ファームウェア分析のための一般的なコード監査ツールは、ファームウェアのセキュリティを強化する重要な領域を特定するのに有効であることが証明された。
UEFI Development Kit II (EDK2) はファームウェアアーキテクチャを形成する上で重要な役割を果たしている。
ファームウェア分析用に特別に設計されたオープンソースツールの不足は、適応可能で革新的なソリューションの必要性を強調している。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 12:29:28 GMT)
Evaluating the Performance and Robustness of LLMs in Materials Science Q&A and Property Predictions [1.3] 大規模言語モデル(LLM)は科学的研究に革命をもたらす可能性があるが、ドメイン固有のアプリケーションにおける堅牢性と信頼性はいまだ不十分である。
本研究は材料科学分野におけるLCMの総合的評価とロバスト性解析を行う。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 19:31:16 GMT)
The Ability of Large Language Models to Evaluate Constraint-satisfaction in Agent Responses to Open-ended Requests [0.6] 我々は,新しいArithmetic Constraint-Satisfaction(ACS)ベンチマークデータセットを開発し,リリースする。
このデータセットは、対応する制約を持つ複雑なユーザリクエスト、エージェント応答、応答における各制約の満足度を示すヒューマンラベルで構成されている。
ほとんどのモデルにはまだ改善のための重要なヘッドルームがあることを示し、エラーは主に推論の問題に起因する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 09:27:42 GMT)
Evaluating the Quality of Code Comments Generated by Large Language Models for Novice Programmers [0.2] LLM(Large Language Models)は、初心者プログラマのためのコードコメントを生成することを約束しているが、その教育効果は過小評価されている。
本研究は, GPT-4, GPT-3.5-Turbo, Llama2によるコメントの指導的品質を評価する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 09:03:48 GMT)
Faster Mixing of Higher-Dimensional Random Reversible Circuits [0.1] 我々の主な成果は、深さに依存するサブ線形-in-$n$のランダム可逆回路の自然なクラスを初めて構築することである。
我々の構築は、実用的な暗号の考慮によって動機付けられており、DESやAESといった実用的なブロック暗号の設計に着想を得ている。
我々の回路モデルの主な特徴は、高次元格子上に構築されたゲートアーキテクチャである。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 22:28:14 GMT)
Paying Attention to Deflections: Mining Pragmatic Nuances for Whataboutism Detection in Online Discourse [0.1] 物語をディスラプトし、不信を喚起する強力なツールである「Whataboutism」は、量的NLP研究において未発見のままである。
我々は、TwitterとYouTubeからの新しいデータセットを導入し、オーバーラップと、どこが問題なのか、プロパガンダ、そしてTu quoqueの誤用の区別を明らかにした。
我々の実験は、その正確な検出において、非常に独特な課題をもたらし、新しい方法が導入された。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 22:22:27 GMT)
SynBench: A Synthetic Benchmark for Non-rigid 3D Point Cloud Registration [0.0] 本稿では,SimToolを用いた新たな非剛性クラウド登録データセットであるSynBenchを紹介する。
これは、2つの点集合の間の対応する点の基礎的真実を提供し、主要な登録課題を包含する。
著者らは、SynBenchは将来の非厳格なクラウド登録手法により、彼らの成果を公平に比較できると考えている。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 14:46:20 GMT)
Zero Knowledge Games [0.0] 本稿では,選手の公開発表時の情報伝達に関する共通知識を生成する線形変換として,修正されたスライディングブロックコードを導入する。
両プレイヤーに通知されるゼロ知識ゲームは、混合戦略ナッシュ均衡に確立された信頼の効力を有する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 19:50:58 GMT)
Theoretical and Empirical Advances in Forest Pruning [0.0] 回帰林の精度と回帰樹の解釈可能性という両世界の最善を尽くすアプローチである森林伐採を再考する。
我々は、非常に弱い仮定の下で、未伐採林に対するラッソ伐採林の利点を証明した。
テストされたほとんどのシナリオでは、森林伐採法が1つ以上あり、原生林と同等かそれ以上の精度が得られていることがわかった。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 16:55:11 GMT)
Stability for Inference with Persistent Homology Rank Functions [0.0] 我々は統計学と機械学習のツールとして、永続的ホモロジーランク関数を再考する。
階数関数によって捕捉される永続的ホモロジーの使用は、既存の非永続的アプローチよりも明らかな改善をもたらす。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 21:55:19 GMT)
Sonoluminescence: Photon production in time dependent analog system [0.0] ソノルミネッセンス(ソノルミネッセンス、英: Sonoluminescence)は、振動する気体の気泡が周期的に可視周波数範囲で光の光を発する現象である。
アナログ幾何学の観点から発振気泡をモデル化し,電磁場の最小結合処方則を提案する。
我々の分析は、アナログ背景におけるパラメトリック共鳴が、量子場理論の枠組みにおいてそのような現象を説明する上で、基本的な役割を担っていることを示唆している。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 05:52:10 GMT)
Simulating Schwinger model dynamics with quasi-one-dimensional qubit arrays [0.0] 我々は、合成量子スピン格子上でシュウィンガーモデルダイナミクスを実行するための戦略を開発する。
我々は、大域磁場パターンが格子シュヴィンガー・ハミルトニアンと同等の界面のコヒーレント量子力学を駆動できることを示した。
この研究は、短期量子シミュレーターが素粒子物理学に即時関係する問題に対処する道を開く。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 17:58:25 GMT)
Scattering of TE and TM waves and quantum dynamics generated by non-Hermitian Hamiltonians [0.0] 本稿では, TEおよびTM波の散乱を動的に定式化し, 媒体の遷移行列を有効非単項量子系の進化演算子として与える方法を提案する。
本稿では、TE波やTM波を反射しない媒体を所定の波数と入射角で同定する上で、この観測の適用について論じる。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 10:01:19 GMT)
SARF: Enhancing Stock Market Prediction with Sentiment-Augmented Random Forest [0.0] 本研究では、FinGPT生成AIモデルと従来のランダムフォレストモデルを用いた感情分析を統合することで、株式市場の予測に新たなアプローチを導入する。
本稿では,感情特徴をランダムフォレストフレームワークに組み込んだ「感性増強ランダムフォレスト(SARF)」という新たな方法論を提案する。
実験の結果,SARFは従来のランダムフォレストモデルやLSTMモデルよりも平均精度が9.23%向上し,予測誤差が低かった。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 20:22:10 GMT)
Quantum signatures of bistability and limit cycle in Kerr-modified cavity magnomechanics [0.0] 両立状態に着目したKerr修飾キャビティマグメカニクスシステムについて検討した。
2つの安定な枝と1つの不安定な枝が中央に存在する。
双安定および周期解の両方からなる豊富な位相図を報告し、それらの周りの量子相関について検討する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 12:54:46 GMT)
Quantum determinism and completeness restored by indistinguishability and long-time particle detection [0.0] 量子物理学における測定データは、統計的、マクロなプロセスの結果としてのみ厳密に解釈できると論じる。
シュル・オーディンガー・キャットとベルの実験により、ボルン・ルールが1つの粒子のレベルで放棄されると、リアリズム、局所性、因果関係が復元されることを示した。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 18:15:24 GMT)
Privacy-Preserving Logistic Regression Training with A Faster Gradient Variant [0.0] プライバシー保護のロジスティック回帰トレーニングのために、$quadratic$ $gradient$と呼ばれる効率的な勾配を導入する。
実験結果から,改良アルゴリズムは収束速度を大幅に向上することが示された。
二次勾配法は、一階勾配降下法と二階ニュートン・ラフソン法を統合できる可能性が高い。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 13:34:28 GMT)
Performance of Human Annotators in Object Detection and Segmentation of Remotely Sensed Data [0.0] 本研究では,アノテータの性能に及ぼすアノテーション戦略,不均衡データのレベル,事前経験の影響を評価することを目的とする。
この実験は、0.15textbf$m$のピクセルサイズを持つ画像を用いて行われ、専門家と非専門家の両方が関与する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 15:41:40 GMT)
On logic and generative AI [0.0] 進行中のAI革命は、神経科学、哲学、コンピュータ科学、論理学を含む多くの根本的な問題を提起している。
次のダイアログの目標は、AI革命によって引き起こされた基礎的な問題に気づくための基礎を味わう若い論理学者を刺激することである。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 14:31:58 GMT)
On a measure of intelligence [0.0] このコラムは、フランシス・ショレット(Franccois Chollet)による「インテリジェンス、インテリジェンスの測定、および関連する問題に関する小さな議論である。
議論には記事の批判のモチーフが含まれている。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 15:49:31 GMT)
Nested Dirichlet models for unsupervised attack pattern detection in honeypot data [0.0] 共通の意図を共有しているように見えるクラスタリング攻撃は、脅威追跡の専門家にとって非常に価値がある。
本稿では,ハニーポットから収集した端末セッションコマンドをクラスタリングするためのディリクレ分布トピックモデルについて検討する。
セッションをクラスタリングする主な実践的意味は2つある。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 21:05:36 GMT)
NP-Completeness and Physical Zero-Knowledge Proofs for Zeiger [0.0] 与えられたゼーガーパズルの可解性を決定することは、非等値な正の3SAT問題からの還元によってNP完全であることが証明される。
また,Zeigerの物理ゼロ知識証明プロトコルを構築することで,証明者がパズルの解の存在を物理的に示すことができる。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 04:25:13 GMT)
Linear Independence of Generalized Neurons and Related Functions [0.0] ニューロンの線形独立性は、ニューラルネットワークの理論解析において重要な役割を果たす。
任意の層と幅を持つニューロンの問題を考察し、汎用的な解析的活性化関数の単純かつ完全な特徴付けを与える。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 21:09:15 GMT)
Lesion Segmentation in Whole-Body Multi-Tracer PET-CT Images; a Contribution to AutoPET 2024 Challenge [0.0] 本研究は, 画像前処理, トレーサ分類, 病変分割ステップを組み込んだワークフローによるAutoPET MICCAI 2024チャレンジに寄与する。
このパイプラインの実装により、モデルのセグメンテーション精度が大幅に向上した。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 14:50:46 GMT)
Is animal magnetoreception quantum? A perspective from the energy resolution limit [0.0] 超伝導量子干渉デバイスのような多くの磁気センサは、エネルギー分解能の限界を満たすことが示されている。
この制限は、センサの磁気感度が時間とともにエネルギーの積に変換されると、プランク定数によって下界されることを示している。
ここでは、生物磁気センサ、特に動物が磁場を感知すると考えられる3つの磁気受容機構について検討する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 19:57:20 GMT)
Information acquisition, scrambling, and sensitivity to errors in quantum chaos [0.0] カオスのシグナチャは、古典的なものがカオスである量子系を研究することによって理解することができる。
可積分性、非可積分性、カオスの概念は古典的な類似を持たないシステムに拡張される。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 06:31:14 GMT)
Holomorphic Floer theory I: exponential integrals in finite and infinite dimensions [0.0] 我々は指数積分と関連する壁交差構造について議論する。
我々は、モース・ノヴィコフ理論を正則ケースに特に一般化する対応する理論を発展させる。
系として、指数積分の摂動展開は復活する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 08:46:21 GMT)
Ethical Challenges in Computer Vision: Ensuring Privacy and Mitigating Bias in Publicly Available Datasets [0.0] 本稿では,コンピュータビジョン技術の創造と展開に関する倫理的問題に光を当てることを目的とする。
コンピュータビジョンは医療、セキュリティシステム、貿易など多くの産業において重要なツールとなっている。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 16:40:09 GMT)
Encoder with the Empirical Mode Decomposition (EMD) to remove muscle artefacts from EEG signal [0.0] 本稿では,経験的モード分解(EMD)法と機械学習アーキテクチャを組み合わせることで,脳波信号からアーティファクトを効果的に除去する手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 19:22:22 GMT)
Efficient computation of cumulant evolution and full counting statistics: application to infinite temperature quantum spin chains [0.0] 量子生成関数(QGF)を効率的に計算する数値計算法を提案する。
累積量の高精度な推定値を取得し,QGFから完全なカウント統計を再構築する。
我々の結果は、等方的可積分量子スピン鎖に対するカルダル-パリ-張予想に挑戦する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 13:41:38 GMT)
EconLogicQA: A Question-Answering Benchmark for Evaluating Large Language Models in Economic Sequential Reasoning [0.0] EconLogicQAは、大規模言語モデル(LLM)の逐次推論能力を評価するために設計されたベンチマークである。
モデルは複数の相互接続されたイベントを識別し、シーケンスし、経済論理の複雑さを捉える必要がある。
ベンチマークデータセットはhttps://huggingface.co/datasets/yinzhu-quan/econ_logic_qaで公開されています。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 17:48:02 GMT)
Domain knowledge-guided machine learning framework for state of health estimation in Lithium-ion batteries [0.0] 実際の電気自動車運転からオンラインに抽出できる健康指標を5つ提案する。
提案したインジケータは、電池のエネルギーとパワーフェードに関する物理的な洞察を提供する。
充電プロファイルと実世界の運転条件の一部を計算し、リアルタイムのバッテリー劣化推定を容易にする。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 19:39:53 GMT)
Discovering stochastic dynamical equations from biological time series data [0.0] 本稿では,変数の時系列データを入力とし,微分状態方程式を出力する方程式探索を提案する。
時系列データのみから,正しい方程式を復元し,その安定性を正確に推定できることを示す。
魚の学習と単細胞移動という2つの実世界のデータセット上で,本手法を実証する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 11:03:47 GMT)
Detection of pulmonary pathologies using convolutional neural networks, Data Augmentation, ResNet50 and Vision Transformers [0.0] がん、肺炎、結核、線維症などの異なる肺疾患患者のX線画像とCTスキャンのデータセットを使用する。
医用画像から肺病変を検出するために、畳み込みニューラルネットワーク(CNN)、データ拡張、ResNet50、ビジョントランスフォーマー(ViT)に基づく手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 13:54:28 GMT)
Defining a new perspective: Enterprise Information Governance [0.0] 本稿では,企業情報ガバナンスの新たな定義を戦略的枠組みとして追加する。
これは、より新しく、より明確に規制されたアプローチをとるために、以前の定義に基づいて構築される。
それは、情報とデータの定義、情報とデータに関する戦略、データ管理、エンタープライズアーキテクチャ、ガバナンス、そして、戦略的な取り組みのタイプとしてのガバナンスに目を向けます。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 10:28:00 GMT)
Coverage and Bias of Street View Imagery in Mapping the Urban Environment [0.0] ストリートビュー画像(SVI)は、都市研究において貴重なデータ形式として出現し、都市環境を地図化し、知覚する新しい方法を可能にしている。
本研究では,都市環境におけるSVIの特徴レベルを推定するための新しいワークフローを提案する。
ロンドンをケーススタディとして、SVIが都市の特徴をカバーし表現する能力の潜在的なバイアスを特定するために、3つの実験が実施された。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 02:58:43 GMT)
Coherence influx is indispensable for quantum reservoir computing [0.0] 量子系が非定常ESPを満たすための十分かつ必要な条件を解析する。
MRCにおけるスペクトル半径とコヒーレンス流入に対応するパラメータは,その線形記憶容量と直接相関することを示す。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 06:06:22 GMT)
Classification of the Subgroups of the Two-Qubit Clifford Group [0.0] 2量子パウリ群を含む2量子クリフォード群の56個の部分群の完全分類を行う。
GAPが提供するグループライブラリに対して、これらのグループを参照する。
また、2量子クリフォード階層の上位の群のいくつかの族を列挙する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 23:21:55 GMT)
Cesno: The Initial Design of a New Programming Language [0.0] この記事では、Cesnoという新しい言語を紹介します。
Cesnoの構文は他の人気のある言語と似ているため、学習と作業が簡単になる。
この記事では、Cesnoの文法の設計について検討し、Cesnoがどのようにコードを処理し、コンパイルするかを概観し、Cesnoのコードがどのようなもので、どのように開発に役立てるかを検証します。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 03:06:29 GMT)
Brain Surgery: Ensuring GDPR Compliance in Large Language Models via Concept Erasure [0.0] 本稿では、リアルタイムな未学習を実現することによって、すべての局所的なAIモデルを読み取るための変革的手法である脳手術を紹介する。
Brain Surgeryは、さまざまなAIアーキテクチャにデプロイ可能なモジュラーソリューションを提供する。
このツールは、プライバシ規則の遵守を保証するだけでなく、ユーザが自身のプライバシ制限を定義できるようにし、AI倫理とガバナンスの新しいパラダイムを作成する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 21:42:20 GMT)
Beyond Words: Evaluating Large Language Models in Transportation Planning [0.0] 本研究では,大規模言語モデル(LLM),特にGPT-4とPhi-3-miniの評価を行い,交通計画の充実を図る。
この結果は、都市交通計画におけるGenAI技術の変革の可能性を示している。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 16:20:00 GMT)
A convergent scheme for the Bayesian filtering problem based on the Fokker--Planck equation and deep splitting [0.0] 非線形フィルタリング密度を近似する数値スキームを導入し、収束率を確立する。
予測ステップでは、このスキームはフォッカー・プランク方程式と深い分割スキームを近似し、ベイズの公式を通して正確な更新を行う。
その結果、従来の予測更新フィルタリングアルゴリズムが、トレーニング後の新しい観測シーケンスのためにオンラインで動作している。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 20:25:45 GMT)
A competitive baseline for deep learning enhanced data assimilation using conditional Gaussian ensemble Kalman filtering [0.0] 条件付きガウスEnKF(CG-EnKF)と正常スコアEnKF(NS-EnKF)の2つの非線形拡張について検討した。
我々はこれらのモデルを、スコアフィルタ(SF)と呼ばれる最先端のディープラーニングに基づく粒子フィルタと比較する。
解析の結果,CG-EnKFとNS-EnKFは非ガウス的な雑音摂動を処理できることがわかった。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 02:54:33 GMT)
A New Simple Vision Algorithm for Detecting the Enzymic Browning Defects in Golden Delicious Apples [0.0] 視覚アルゴリズムは、酵素的ブラウニングプロセスによって引き起こされるゴールデンデリシアスリンゴの表面欠陥を抽出し、識別するように設計されている。
提案した視覚アルゴリズムの画像処理部は, リンゴの欠陥表面積を97.15%の精度で抽出した。
以上の特徴から, 平均0.0065以下の画像は, 欠陥リンゴに属さないことが明らかとなった。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 07:33:45 GMT)
A Neuromorphic Implementation of the DBSCAN Algorithm [0.0] DBSCANはノイズの存在下でクラスタリングを行うアルゴリズムである。
我々は、DBSCANをニューロモルフィズム的に実装できる2つの構造を提供する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 02:41:19 GMT)
A Large Language Model and Denoising Diffusion Framework for Targeted Design of Microstructures with Commands in Natural Language [0.0] 自然言語処理(NLP)、大言語モデル(LLM)、拡散確率モデル(DDPM)を統合したフレームワークを提案する。
我々のフレームワークは、事前訓練されたLLMによって駆動されるコンテキストデータ拡張を用いて、多様なマイクロ構造記述子のデータセットを生成し、拡張する。
再学習されたNERモデルは、ユーザが提供する自然言語入力から関連するマイクロ構造記述子を抽出し、DDPMによってターゲットとなる機械的特性とトポロジ的特徴を持つマイクロ構造を生成する。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 14:45:22 GMT)
A High-Performance External Validity Index for Clustering with a Large Number of Clusters [0.0] 本稿では,Stable Matching Based Pairing (SMBP)アルゴリズムを提案する。
多数のクラスタを持つ大規模データセットにおけるクラスタリング評価のための高性能な外部妥当性指標である。
これは、多数のクラスタを持つバランスのとれた、バランスの取れていない、大規模なデータセットに特に有効である。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 14:08:57 GMT)
A Feature Engineering Approach for Literary and Colloquial Tamil Speech Classification using 1D-CNN [0.0] コンピュータが両方の形式の言語を受理し、処理し、会話できるように、フロントエンドシステムを提案する。
時間にわたって特徴の包絡を学習する1次元畳み込みニューラルネットワーク(1D-CNN)を提案する。
提案された1D-CNNは手作りの特徴を使って訓練され、F1スコアは0.9803、MFCCで訓練されたF1スコアは0.9895である。
論文参考訳(メタデータ) (Sun, 22 Sep 2024 07:20:42 GMT)