MetaFormer Baselines for Vision [166.0] 私たちはMetaFormerのベースラインモデルをいくつか導入し、最も基本的なミキサーや一般的なミキサーを使用します。
MetaFormerはパフォーマンスのしっかりとした低いバウンダリを保証します。
また,新たなアクティベーションであるStarReLUは,GELUと比較してFLOPを減少させるが,性能は向上する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 05:55:44 GMT)
MM-Vet: Evaluating Large Multimodal Models for Integrated Capabilities [153.4] 複雑なマルチモーダルタスクにおける大規模マルチモーダルモデル(LMM)を評価する評価ベンチマークであるMM-Vetを提案する。
近年のLMMは、黒板に書かれた数学の問題を解くこと、ニュース画像の出来事や有名人を推論すること、視覚的ジョークを説明することなど、様々な興味深い能力を示している。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 05:46:03 GMT)
MM-Vet v2: A Challenging Benchmark to Evaluate Large Multimodal Models for Integrated Capabilities [146.5] MM-Vet v2は、"image-text sequence understanding"と呼ばれる新しい"image-text sequence understanding"機能を含んでいる。
MM-Vet v2を用いて大規模マルチモーダルモデルのベンチマークを行った結果,Claude 3.5 Sonnetはスコア71.8の最良のモデルであり,スコア71.0のGPT-4oより若干優れていた。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 06:08:00 GMT)
Towards Dynamic Message Passing on Graphs [104.1] グラフニューラルネットワーク(GNN)のための新しい動的メッセージパッシング機構を提案する。
グラフノードと学習可能な擬似ノードを、測定可能な空間関係を持つ共通空間に投影する。
ノードが空間内を移動すると、その進化する関係は動的メッセージパッシングプロセスのための柔軟な経路構築を促進する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 03:08:21 GMT)
ESCAPE: Equivariant Shape Completion via Anchor Point Encoding [79.6] 回転同変形状補完を実現するためのフレームワークであるESCAPEを紹介する。
ESCAPEは、形状からアンカーポイントを選択し、すべてのポイントを全てのアンカーポイントまでの距離として表現することで、独特の符号化戦略を採用している。
ESCAPEは任意の回転と翻訳をまたいだ堅牢で高品質な再構成を実現する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 20:05:14 GMT)
TED-VITON: Transformer-Empowered Diffusion Models for Virtual Try-On [78.3] TED-VITONはGarment Semantic (GS) Adapterを統合した新しいフレームワークである。
これらのイノベーションは、視覚的品質とテキストの忠実さにおける最先端(SOTA)のパフォーマンスを可能にする。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 14:37:22 GMT)
ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.9] ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 13:55:56 GMT)
Scaling New Frontiers: Insights into Large Recommendation Models [74.8] MetaのジェネレーティブレコメンデーションモデルHSTUは、パラメータを数千億に拡張することでレコメンデーションシステムのスケーリング法則を説明している。
我々は、これらのスケーリング法則の起源を探るため、包括的なアブレーション研究を行っている。
大規模なレコメンデーションモデルの今後の方向性に関する洞察を提供する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 07:27:20 GMT)
DUET: A Tuning-Free Device-Cloud Collaborative Parameters Generation Framework for Efficient Device Model Generalization [66.3] デバイスモデル一般化(Device Model Generalization, DMG)は、デバイス上での機械学習アプリケーションにおいて、実用的ながら実証されていない研究トピックである。
本稿では,Device-cloUdコラボレーティブパラメトリクスフレームワークDUETを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 16:50:02 GMT)
Automating Feedback Analysis in Surgical Training: Detection, Categorization, and Assessment [65.7] 本研究は,非構造化現実記録からの外科的対話を再構築するための最初の枠組みを紹介する。
外科訓練では,ライブ手術中に訓練者に提供する形式的言語フィードバックは,安全性の確保,行動の即時修正,長期的スキル獲得の促進に不可欠である。
本フレームワークは,音声活動の検出,話者ダイアリゼーション,自動音声認識と,幻覚を除去する新たな拡張機能を統合する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 10:35:12 GMT)
BDefects4NN: A Backdoor Defect Database for Controlled Localization Studies in Neural Networks [65.7] ローカライゼーション研究のための最初のバックドア欠陥データベースであるBDefects4NNを紹介する。
BDefects4NNは、ラベル付きバックドア欠陥DNNを神経細胞の粒度で提供し、欠陥根の原因の制御された局在化研究を可能にする。
本研究は, バックドア欠陥に対して限られた有効性を示す6つの障害局所化基準と2つの欠陥修復手法の評価実験を行った。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 09:52:48 GMT)
A Lesson in Splats: Teacher-Guided Diffusion for 3D Gaussian Splats Generation with 2D Supervision [65.3] 本研究では,ガウスプレートの拡散モデルであるSplatDiffusionを導入し,単一画像から3次元構造を生成する。
既存の方法は決定論的フィードフォワード予測に依存しており、2Dデータからの3D推論の本質的な曖昧さを扱う能力を制限する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 00:29:57 GMT)
FIction: 4D Future Interaction Prediction from Video [63.4] ビデオから4次元のインタラクション予測を導入する。
人間の活動のインプットビデオが与えられたら、その人が次に対話する3D位置のオブジェクトを予測することが目的だ。
提案手法は,従来の自己回帰的および(リフト)2次元ビデオモデルよりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 18:44:17 GMT)
Quantum Information Processing, Sensing and Communications: Their Myths, Realities and Futures [61.3] 量子機械学習の最先端、知識ギャップ、今後の発展について論じる。
我々は、究極的には安全な量子通信の分野における将来的な研究のアイデアをまとめて結論付けている。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 22:28:02 GMT)
Job-SDF: A Multi-Granularity Dataset for Job Skill Demand Forecasting and Benchmarking [59.9] Job-SDFは、ジョブスキルの需要予測モデルをトレーニングし、ベンチマークするために設計されたデータセットである。
2021年から2023年にかけて、中国の大手オンライン求人プラットフォームから集められた1035万件の求人広告に基づいている。
本データセットは,職業,企業,地域レベルなど,さまざまな粒度でのスキル需要予測モデルの評価を可能にする。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 03:49:57 GMT)
EventGPT: Event Stream Understanding with Multimodal Large Language Models [59.7] イベントカメラは、視覚情報を非同期なピクセル変更ストリームとして記録し、不満足な照明や高ダイナミックな条件下でのシーン認識に優れる。
既存のマルチモーダル大言語モデル(MLLM)は、自然のRGBイメージに集中しており、イベントデータがより適合するシナリオでは失敗する。
イベントストリーム理解のための最初のMLLMであるEventGPTを紹介する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 14:38:40 GMT)
GATE OpenING: A Comprehensive Benchmark for Judging Open-ended Interleaved Image-Text Generation [59.5] MLLM(Multimodal Large Language Models)は視覚的理解と生成に大きく貢献している。
インターリーブされた画像テキストコンテンツを生成することは依然として課題であり、統合されたマルチモーダル理解と生成能力が必要である。
Gate Openingは56の現実世界タスクにわたる5,400の高品質な人間アノテーションインスタンスからなるベンチマークである。
IntJudgeはオープンなマルチモーダル生成手法を評価するための判断モデルである。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 16:07:41 GMT)
Robust Federated Learning Over the Air: Combating Heavy-Tailed Noise with Median Anchored Clipping [57.4] 重み付き雑音による有害な影響に対処するため,メディアアンコールド・クリッピング (MAC) と呼ばれる新しい勾配クリッピング法を提案する。
また、MAC下でのアナログオーバー・ザ・エア・フェデレーション学習によるモデルトレーニングの収束率の解析式も導出する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 13:04:28 GMT)
Right Place, Right Time! Generalizing ObjectNav to Dynamic Environments with Portable Targets [55.6] 非定常オブジェクトを用いた動的環境にObjectNavを一般化するための新しい定式化を提案する。
まず、既存のトポロジ的シーングラフをダイナマイズする際のいくつかの課題に対処する。
次に、強化学習とLarge Language Model(LLM)に基づくナビゲーションアプローチを組み合わせたP-ObjectNavのベンチマークを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 21:42:37 GMT)
A Cross-Scene Benchmark for Open-World Drone Active Tracking [54.2] Drone Visual Active Trackingは、視覚的な観察に基づいてモーションシステムを制御することで、対象物を自律的に追跡することを目的としている。
DATと呼ばれるオープンワールドドローンアクティブトラッキングのためのクロスシーンクロスドメインベンチマークを提案する。
また、R-VATと呼ばれる強化学習に基づくドローン追跡手法を提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 09:37:46 GMT)
Separate Anything You Describe [53.3] 言語クエリオーディオソース分離(LASS)は,CASA(Computer auditory scene analysis)の新しいパラダイムである
AudioSepは、自然言語クエリによるオープンドメインオーディオソース分離の基礎モデルである。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 15:17:03 GMT)
Instruction Tuning for Large Language Models: A Survey [52.9] 我々は、教師付き微調整(SFT)の一般的な方法論を含む、文献の体系的なレビューを行う。
また、既存の戦略の欠陥を指摘しながら、SFTの潜在的な落とし穴についても、それに対する批判とともに検討する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 22:01:51 GMT)
Revisiting Self-Supervised Heterogeneous Graph Learning from Spectral Clustering Perspective [52.7] 自己教師付きヘテロジニアスグラフ学習(SHGL)は様々なシナリオにおいて有望な可能性を示している。
既存のSHGLメソッドには2つの大きな制限がある。
ランクと二重整合性制約によって強化された新しいフレームワークを導入する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 09:33:20 GMT)
ChatSplat: 3D Conversational Gaussian Splatting [51.4] ChatSplatは3D言語フィールドを構築するシステムで、3D空間内でリッチなチャットベースのインタラクションを可能にする。
ビューレベルのインタラクションのために,各ビューのレンダリングされた特徴マップをトークンにエンコードするエンコーダを設計し,それを大規模言語モデルで処理した。
シーンレベルでは、ChatSplatはマルチビュートークンを組み合わせて、シーン全体を考慮したインタラクションを可能にする。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 08:59:30 GMT)
What Matters When Repurposing Diffusion Models for General Dense Perception Tasks? [49.8] 最近の研究は、高密度知覚タスクのためのT2I拡散モデルを簡単に調整することで有望な結果を示す。
拡散前処理における伝達効率と性能に影響を及ぼす重要な要因を徹底的に検討する。
我々の研究は、濃密な視覚認知タスクに特化した効果的な決定論的ワンステップ微調整パラダイムであるGenPerceptの開発において頂点に達した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 12:13:57 GMT)
Stealthy Backdoor Attack via Confidence-driven Sampling [49.7] バックドア攻撃は、悪質なトリガをDNNモデルに過剰に挿入することを目的としており、テストシナリオ中に不正な制御を許可している。
既存の方法では防衛戦略に対する堅牢性が欠如しており、主に無作為な試薬を無作為に選別しながら、引き金の盗難を強化することに重点を置いている。
信頼性スコアの低いサンプルを選別し、これらの攻撃を識別・対処する上で、守備側の課題を著しく増大させる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 18:53:52 GMT)
Quantifying perturbation impacts for large language models [49.2] 本稿では、頻繁な仮説テスト問題として摂動解析を再構成するフレームワークDBPAを紹介する。
摂動影響評価におけるDBPAの有効性を示すとともに,摂動解析の汎用性を示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 16:13:09 GMT)
SyncVIS: Synchronized Video Instance Segmentation [48.8] 我々はSyncVISという新しいフレームワークを用いて同期モデリングを行う。
SyncVISはビデオレベルのクエリの埋め込みを明示的に導入し、ビデオレベルのクエリとフレームレベルのクエリの埋め込みを同期させる2つの主要なモジュールを設計する。
提案手法は,提案手法の有効性と汎用性を実証し,最先端の結果を得る。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 16:43:20 GMT)
Voice Attribute Editing with Text Prompt [48.5] 本稿では,テキストプロンプトを用いた音声属性編集という新しい課題を紹介する。
目標は、テキストプロンプトに記述された動作に応じて、音声属性を相対的に修正することである。
この課題を解決するために,エンドツーエンド生成モデルであるVoxEditorを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 03:49:30 GMT)
Beyond Pixels: Text Enhances Generalization in Real-World Image Restoration [47.9] 拡散に基づく復元モデルの生成能力を再活性化するために,テキストを補助的不変表現として用いることを提案する。
Res-Captionerは、画像の内容や劣化レベルに合わせて拡張されたテキスト記述を生成するモジュールである。
様々な現実世界のシナリオを捉えるために設計された新しいベンチマークであるRealIRを提示する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 16:36:22 GMT)
PINNfluence: Influence Functions for Physics-Informed Neural Networks [47.3] 物理インフォームドニューラルネットワーク(PINN)は、物理科学における偏微分方程式への深層学習の柔軟で有望な応用として登場した。
本稿では,ポストホックのPINNの検証とデバッグに,インフルエンス関数(IF)の適用について検討する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 06:47:45 GMT)
Perturb and Recover: Fine-tuning for Effective Backdoor Removal from CLIP [46.3] 本論文は, 微調整による潜在的有毒モデルのクリーニングに焦点を当てた。
BlendedやBadNetのバックドア攻撃で使用される単純な構造的トリガに対して,既存のクリーニング技術は有効ではないことを示す。
PAR、Perturb、Recoverは驚くほどシンプルで効果的なメカニズムで、CLIPモデルからバックドアを取り除きます。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 08:39:12 GMT)
CoRNStack: High-Quality Contrastive Data for Better Code Ranking [45.2] CoRNStackは、複数のプログラミング言語にまたがるコードのための、大規模で高品質なコントラストトレーニングデータセットです。
このデータセットは、ノイズ正の除去のために一貫性フィルタリングを用いてキュレートされ、さらに硬い負のマイニングによって濃縮される。
我々は、CoRNStackを用いた埋め込みモデルの対照的なトレーニングが、様々なコード検索タスクにおける最先端のパフォーマンスをもたらすことを実証した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 23:54:12 GMT)
ReVersion: Diffusion-Based Relation Inversion from Images [45.1] 本稿では,既存の画像から特定の関係を学習することを目的としたリレーショナル・インバージョン・タスクを提案する。
我々は、凍結した事前学習されたテキスト-画像拡散モデルを用いて関係プロンプトを学習する。
学習した関係プロンプトを適用して、新しいオブジェクト、バックグラウンド、スタイルで関係固有の画像を生成する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 14:04:22 GMT)
PoCo: Policy Composition from and for Heterogeneous Robot Learning [44.1] 現在のメソッドは通常、1つのポリシーをトレーニングするために、1つのドメインからすべてのデータを収集し、プールします。
多様なモダリティやドメインにまたがる情報を組み合わせるための,ポリシ・コンポジションと呼ばれる柔軟なアプローチを提案する。
提案手法はタスクレベルの構成をマルチタスク操作に使用することができ,分析コスト関数を用いて推論時のポリシー動作を適応させることができる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 15:55:50 GMT)
SemiCD-VL: Visual-Language Model Guidance Makes Better Semi-supervised Change Detector [43.2] Change Detection (CD) は、画像間のセマンティックな変化でピクセルを識別することを目的としている。
VLM誘導に基づく半教師付きCD手法,すなわちSemiCD-VLを提案する。
本稿では,VLMに基づく混合変化イベント生成(CEG)戦略を提案し,ラベルなしCDデータに対して擬似ラベルを出力する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 08:24:11 GMT)
Noninterference Analysis of Reversible Systems: An Approach Based on Branching Bisimilarity [41.9] 非干渉に対する古典的同値性に基づくアプローチは、主に弱いバイシミュレーションのセマンティクスに依存している。
本手法は,可逆計算の存在下での隠蔽チャネルの同定に十分でないことを示す。
バック・アンド・フォース計算の効果を捉えるためには、より表現力のある意味論に切り替える必要がある。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 10:00:36 GMT)
DynSUP: Dynamic Gaussian Splatting from An Unposed Image Pair [41.8] 本稿では,ガウスアンを動的環境に適合させるために,事前のポーズを伴わずに2つの画像しか利用できない手法を提案する。
この戦略は、ダイナミックシーンを断片的に剛性成分に分解し、ダイナミックオブジェクトのカメラのポーズと動きを共同で推定する。
合成と実世界の両方のデータセットに対する実験により、我々の手法は最先端のアプローチを大きく上回っていることが示された。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 15:25:33 GMT)
Multi-View Incongruity Learning for Multimodal Sarcasm Detection [40.1] マルチモーダルサルカズム検出(MSD)は下流の様々なタスクに不可欠である。
既存のMSD法は、素早い相関に依存する傾向がある。
本稿では,マルチモーダルサルカズム検出のためのコントラスト学習(MICL)によるマルチモーダルイングルリティの統合手法を提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 10:29:36 GMT)
2DMamba: Efficient State Space Model for Image Representation with Applications on Giga-Pixel Whole Slide Image Classification [40.1] マンバは線形複雑性と高い並列性を持つ選択的状態空間モデル(SSM)を導入した。
画像の2次元空間構造を組み込んだ新しい2次元選択型SSMフレームワークである2DMambaを提案する。
WSI分類と生存分析のための10の公開データセットの実験では、2DMambaimがAUCで2.48%$、F1で3.11%$、精度で2.47%$、C-indexで5.52%$まで改善している。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 05:42:58 GMT)
BEV-SUSHI: Multi-Target Multi-Camera 3D Detection and Tracking in Bird's-Eye View [39.8] 本稿では,BEV-SUSHIという3次元物体検出・追跡フレームワークを提案する。
鳥の目視で3Dオブジェクトを検出するために、カメラキャリブレーションパラメータを必要とするマルチビュー画像を集約する。
既存の方法とは異なり、BEV-SUSHIは様々なシーンにまたがって印象的な一般化性を持ち、カメラの設定も様々である。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 06:18:06 GMT)
DistRL: An Asynchronous Distributed Reinforcement Learning Framework for On-Device Control Agents [38.0] DistRLは、モバイルデバイス制御エージェントのオンラインRLファインチューニングの効率を高めるために設計された、新しいフレームワークである。
平均して、DistRLはトレーニング効率を3倍改善し、主要な同期マルチマシンメソッドよりも2.4倍高速なトレーニングデータ収集を可能にする。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 02:09:21 GMT)
An Inversion-based Measure of Memorization for Diffusion Models [38.0] Inversion-based measure of memorization, InvMM, which search for a sensitive latent noise distribution account on the replication of a image。
非条件拡散モデルとテキスト誘導拡散モデルの両方で実施された包括的実験は、InvMMが重記憶された画像を検出することを実証している。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 05:03:30 GMT)
VISTA: Enhancing Long-Duration and High-Resolution Video Understanding by Video Spatiotemporal Augmentation [37.3] 現在の大規模マルチモーダルモデル(LMM)は、長期化や高解像度化ビデオの処理と解釈において重大な課題に直面している。
本稿では,VISTAを提案する。VISTAは,既存のビデオキャプションデータセットから,長期化および高解像度ビデオ命令追従ペアを合成するフレームワークである。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 18:27:28 GMT)
AlignMamba: Enhancing Multimodal Mamba with Local and Global Cross-modal Alignment [37.2] クロスモーダルアライメントはマルチモーダル表現融合に不可欠である。
マルチモーダル核融合の効率的かつ効率的な方法であるAlignMambaを提案する。
完全かつ不完全なマルチモーダル核融合タスクの実験は,提案手法の有効性と有効性を示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 14:47:41 GMT)
Learning Transferable Features for Implicit Neural Representations [37.1] Inlicit Neural representations (INR) は、逆問題やニューラルレンダリングなど、様々な応用で成功している。
我々は新しいINRトレーニングフレームワークSTRAINERを導入し、新しい信号にINRを適合させるトランスファー可能な特徴を学習する。
我々は,複数の領域内および領域外信号適合タスクおよび逆問題に対するSTRAINERの評価を行った。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 17:48:24 GMT)
TGTOD: A Global Temporal Graph Transformer for Outlier Detection at Scale [36.2] 本稿では,アウトリア検出のための新しいエンドツーエンドのテンポラルグラフ変換器TGTODを提案する。
TGTODは、時間グラフ内の構造的および時間的依存関係をモデル化するために、グローバルな注意を払っている。
実験によりTGTODの有効性が示され, 61%のAP改善が得られた。
我々の効率評価の結果,TGTOD は時間グラフの既存の変換器に比べて 44 倍のトレーニング時間を短縮できることがわかった。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 22:24:55 GMT)
EDTformer: An Efficient Decoder Transformer for Visual Place Recognition [34.9] 視覚的位置認識(VPR)は、クエリ画像の一般的な地理的位置を決定することを目的としている。
特徴集約のための効率的なデコーダ変換器(EDTformer)を提案する。
EDTformerは、VPRのための堅牢で非ネイティブなグローバル表現を生成する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 12:14:36 GMT)
Improving Multimodal LLMs Ability In Geometry Problem Solving, Reasoning, And Multistep Scoring [34.4] 本稿では,LVLM(Large Vision Language Models)の問題解決能力を高めるため,GPSM4Kを提案する。
GPSM4Kは7~12年生の数学教科書から手作業で抽出した2157個の質問応答対を含んでいる。
このデータセットは、LVLMの幾何学的推論能力を評価するための優れたベンチマークとなる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 15:19:23 GMT)
The Malicious Use of Artificial Intelligence: Forecasting, Prevention, and Mitigation [34.1] このレポートは、悪意あるAI使用による潜在的なセキュリティ脅威の状況を調査し、これらの脅威を予測し、予防し、軽減する方法を提案する。
AIがデジタル、物理的、政治的領域における脅威の風景に影響を与える方法を分析した後、AI研究者や他の利害関係者に対して4つの高いレベルのレコメンデーションを行う。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 17:59:04 GMT)
Intelligent Model Update Strategy for Sequential Recommendation [34.0] 我々はIntellectReqを紹介した。IntellectReqはエッジで動作するように設計されており、最小の通信オーバーヘッドでパラメータ要求のコスト対効果を評価できる。
本研究では,実時間ユーザ動作を正規分布に変換するために統計マッピング手法を用い,モデルの不確実性を定量化するためにマルチサンプル出力を用いる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 16:41:49 GMT)
DVasMesh: Deep Structured Mesh Reconstruction from Vascular Images for Dynamics Modeling of Vessels [33.7] 血管動態シミュレーションは、幾何学と血管疾患の進行との関係を研究する上で不可欠である。信頼性の高い力学シミュレーションは、高品質な血管メッシュに依存している。
既存のメッシュ生成メソッドのほとんどは手作業によるアノテーションに大きく依存しています。
そこで本研究では,DVasMeshと呼ばれる深層学習に基づく血管画像からヘキサヘドラルな血管メッシュを直接生成する手法を提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 15:05:28 GMT)
SEED4D: A Synthetic Ego--Exo Dynamic 4D Data Generator, Driving Dataset and Benchmark [32.3] マルチビューデータ作成のためのカスタマイズ可能で時間的に使いやすいデータ生成装置を提案する。
我々の静的(3D)データセットは、2kのシーンから212kの内向きと外向きの車両画像を含んでいる。
我々の動的(4D)データセットは、10k軌道からの16.8M画像を含み、それぞれが100ポイントの時間でサンプリングされる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 08:43:56 GMT)
Document Haystacks: Vision-Language Reasoning Over Piles of 1000+ Documents [32.0] 大規模マルチモーダルモデル (LMM) は視覚言語理解において顕著な進歩を遂げた。
それらは、多数の画像に対して複雑な推論を必要とする現実世界のアプリケーションにおいて制限に直面している。
我々はDocHaystackとInfoHaystackという2つの文書ハイスタックベンチマークを導入し、大規模ビジュアル文書検索と理解においてLMMの性能を評価する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 19:13:25 GMT)
Provable Partially Observable Reinforcement Learning with Privileged Information [31.3] 基礎状態の部分観測性は、一般に強化学習(RL)において重要な課題を呈する。
実際には、シミュレーターからの状態へのアクセスのような特定のエンフ情報は、訓練に利用されてきた。
この設定において、単純で実用的なパラダイムを再検討し、検討する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 22:26:27 GMT)
FiffDepth: Feed-forward Transformation of Diffusion-Based Generators for Detailed Depth Estimation [31.1] FiffDepthは拡散ベースのイメージジェネレータをフィードフォワードアーキテクチャに変換し、詳細な深さ推定を行うフレームワークである。
精度、安定性、詳細性を向上し、様々な現実世界のシナリオでMDEパフォーマンスを大幅に改善する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 04:59:34 GMT)
Vid-Morp: Video Moment Retrieval Pretraining from Unlabeled Videos in the Wild [31.0] 本稿では,アノテーションのコスト削減のための新しいパラダイムを提案する。
不完全な疑似アノテーションの直接事前学習は、不一致の文-ビデオペアや不正確な時間境界など、重大な課題を呈する。
本稿では,セマンティックス誘導の洗練とメモリ・コンセンサス補正の2つの相からなるReCorrectアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 13:49:21 GMT)
ROSE: A Reward-Oriented Data Selection Framework for LLM Task-Specific Instruction Tuning [29.0] Reward-Oriented inStruction data sElectionを導入し、タスク固有の命令チューニングのためのデータ選択を最適化する。
ROSEは、最もタスク関連のトレーニングデータポイントを選択するために、数ショットの選好検証セットに対するトレーニングデータポイントの影響を近似するために影響定式化を適用する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 01:01:09 GMT)
Weakly-Supervised Semantic Segmentation with Image-Level Labels: from Traditional Models to Foundation Models [28.5] 弱教師付きセマンティックセマンティックセグメンテーション(WSSS)はピクセルレベルのラベルを避ける効果的なソリューションである。
私たちは、WSSSの最も難しい形態であるイメージレベルのラベルによるWSSSに焦点を当てています。
本稿では,WSSS の文脈において,Segment Anything Model (SAM) などの視覚基盤モデルの適用性について検討する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 14:27:28 GMT)
Generative Model for Synthesizing Ionizable Lipids: A Monte Carlo Tree Search Approach [28.1] イオン化可能な脂質は、効果的なメッセンジャーRNA(mRNA)輸送のための脂質ナノ粒子(LNP)の開発に必須である。
新しい電離可能な脂質を設計する伝統的な手法は一般的に時間を要するものであり、強力な解決策として深層生成モデルが登場している。
本研究は, 合成可能な電離性脂質に対するモンテカルロ木探索(MCTS)に基づく生成モデルについて検討する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 13:34:22 GMT)
A Deep Generative Model for the Design of Synthesizable Ionizable Lipids [28.1] イオン化可能な脂質はRNA保護において重要な役割を担い、細胞質への輸送を促進する。
深層生成モデルは、このプロセスを加速し、従来の手法と比較して大きな候補空間を探索することができる。
本モデルは, 新規なイオン化可能な脂質構造を生成し, 合成可能なビルディングブロックを用いた合成経路を提供し, 合成可能性に対処する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 18:33:22 GMT)
Motion-Aware Optical Camera Communication with Event Cameras [28.0] 本稿では,イベントカメラを利用した新しいシステムについて紹介する。
高速なローカライゼーションとデータストリーミングを実現するために,動的視覚マーカーとイベントベースのトラッキングアルゴリズムを提案する。
注目すべきは、イベントカメラのユニークな機能は、画面のリフレッシュレートとカメラの動きに関する問題を緩和し、静的条件下では最大114Kbpsのスループットを実現することである。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 14:06:31 GMT)
BIGCity: A Universal Spatiotemporal Model for Unified Trajectory and Traffic State Data Analysis [27.6] 本稿では,STデータ解析のための最初のマルチタスク・マルチデータモダリティ(MTMD)モデルであるBIGCityを紹介する。
最初の課題を克服するため、BIGCityは、トラジェクトリとトラフィック状態の両方を統一形式で表現する新しいSTユニットを導入した。
実世界のデータセットの実験では、BIGCityは8つのタスクで最先端のパフォーマンスを実現し、18のベースラインを上回っている。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 20:10:55 GMT)
Improving Physics Reasoning in Large Language Models Using Mixture of Refinement Agents [27.1] ミキチャー・オブ・リファインメント・エージェント(Mixture of Refinement Agents, MORA)は、大規模言語モデル(LLM)のための新しいエージェント・リファインメント・フレームワークである。
MoRAは、前述の誤りを訂正することで、LLM生成ベースソリューションを反復的に洗練し、その結果、オープンソースのLLMの性能が大幅に向上する。
我々は、SciEvalおよびMMLUサブセットに対する我々のアプローチと、我々の物理データセット(PhysicsQA)を評価する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 14:15:55 GMT)
A Comprehensive Guide to Explainable AI: From Classical Models to LLMs [26.1] 説明可能な人工知能(XAI)は、AIシステムにおける透明性と解釈可能性の必要性の高まりに対処する。
決定木、線形回帰、サポートベクトルマシンといった従来のモデルの解釈可能性を探る。
本書は、SHAP、LIME、Grad-CAM、反実的説明、因果推論などの実践的なテクニックを提示する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 13:01:01 GMT)
Optimal Algorithms for Augmented Testing of Discrete Distributions [25.8] 予測器は3つのプロパティテストタスクすべてに必要なサンプル数を実際に削減できることを示す。
我々のアルゴリズムの重要な利点は、予測の精度への適応性である。
アルゴリズムによって達成されるサンプルの複雑さの改善は、情報理論的に最適であることを示すために、より低い境界を提供する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 21:31:22 GMT)
Sliced-Wasserstein-based Anomaly Detection and Open Dataset for Localized Critical Peak Rebates [25.5] 我々はスライス-ワッサーシュタイン計量を用いた新しい教師なし異常検出法(AD)を提案する。
このフィルタリング技術は、機械学習モデルを重要なセクターにデプロイするMLOpsパイプラインにおいて、概念的に興味深い。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 03:54:57 GMT)
Hallo3: Highly Dynamic and Realistic Portrait Image Animation with Diffusion Transformer Networks [25.4] ポートレートアニメーションのための予め訓練されたトランスフォーマーに基づくビデオ生成モデルの最初の応用について紹介する。
提案手法は,ベンチマーク実験と新たに提案したワイルドデータセットを用いて検証する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 08:54:30 GMT)
Circuit Complexity Bounds for RoPE-based Transformer Architecture [25.3] 経験的証拠は、$mathsfRoPE$ベースのTransformerアーキテクチャは、従来のTransformerモデルよりも優れた一般化能力を示していることを示している。
我々は、$mathsfTC0 = mathsfNC1$, a $mathsfRoPE$-based Transformer with $mathrmpoly(n)$-precision, $O(1)$ layer, hidden dimension $d leq O(n)$が算術式評価問題を解くことができないことを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 06:39:41 GMT)
Oracle-guided Dynamic User Preference Modeling for Sequential Recommendation [25.1] シーケンシャルレコメンデーション(Oracle4Rec)のためのオラクル誘導動的ユーザ嗜好モデリング手法を提案する。
Oracle4Recはまず、2つの別々のエンコーダを通して過去と将来の情報を抽出し、その後、オラクルガイドモジュールを通じて前方のモデルを学ぶ。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 14:01:17 GMT)
Unsupervised Variational Translator for Bridging Image Restoration and High-Level Vision Tasks [24.1] textbfVariational textbfTranslator (VaT)
既存の修復や高レベルのビジョンネットワークの再訓練は不要である。
VaTはラベルを必要とせずに上記の最適化目標を達成する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 03:29:46 GMT)
Toward Real-Time Edge AI: Model-Agnostic Task-Oriented Communication with Visual Feature Alignment [23.8] タスク指向通信はエッジ推論システムの通信効率を向上させるための有望なアプローチを示す。
リアルタイムアプリケーションは、未完成のカバレッジやエッジサーバの潜在的な誤動作など、現実的な課題に直面している。
本研究では,多様なシステム間で共有アンカーデータを利用する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 15:52:05 GMT)
Categorical Keypoint Positional Embedding for Robust Animal Re-Identification [23.0] 動物再同定(ReID)は生態学研究において欠かせない道具となっている。
ヒトのReIDとは異なり、動物のポーズの多様性の高さ、環境条件の多様性、動物データに事前訓練されたモデルを直接適用できないことなど、動物ReIDは重大な課題に直面している。
本研究は,1つの注釈付き事前学習拡散モデルを用いたキーポイント伝搬機構を導入する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 14:09:00 GMT)
Denoising-Contrastive Alignment for Continuous Sign Language Recognition [22.8] 連続手話認識は,手話ビデオからテキストグルースへの符号認識を目的としている。
現在のクロスモダリティアライメントパラダイムは、ビデオ表現を導くためにテキスト文法の役割を無視することが多い。
本稿では,映像の表現性を高めるために,Denoising-Contrastive Alignmentパラダイムを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 12:06:46 GMT)
Uhura: A Benchmark for Evaluating Scientific Question Answering and Truthfulness in Low-Resource African Languages [22.5] 原文(投稿日:2010/01/16)へのリンク Uhura - 6種類のアフリカ言語における2つのタスクに焦点を当てた新しいベンチマークを提示する。
最初のデータセットであるUhura-ARC-Easyは、複数の選択科学の質問で構成されている。
2つめのUhura-TruthfulQAは、健康、法律、金融、政治などのトピックに関するモデルの真偽をテストする安全ベンチマークである。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 19:46:40 GMT)
Playable Game Generation [22.2] 本稿では,ゲームデータ生成,自動回帰型DiT拡散モデル,プレイヤビリティに基づく評価フレームワークなどを含むemphPlayGenを提案する。
PlayGenはリアルタイムインタラクションを実現し、十分な視覚的品質を確保し、正確なインタラクティブなメカニクスシミュレーションを提供する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 16:53:02 GMT)
SITransformer: Shared Information-Guided Transformer for Extreme Multimodal Summarization [22.0] XMSMO (Extreme Multimodal Summarization with Multimodal Output) は魅力的な要約手法である。
既存のメソッドは、マルチモーダルデータが関連のない情報を含むことが多い問題を見落としている。
極多モード要約のための共有情報誘導変換器SITransformerを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 10:30:10 GMT)
A Semi-Supervised Approach with Error Reflection for Echocardiography Segmentation [21.7] 心エコー法による半教師付きセグメンテーションアーキテクチャの誤差反射戦略を提案する。
この戦略は、未ラベル画像セグメンテーションの不正確さをモデルに反映させ、擬似ラベル生成の堅牢性を高める。
また,ラベル付き画像とラベルなし画像間の経験的分布ギャップを最小限に抑えるため,マルチスケール混合戦略と呼ばれる効果的なデータ拡張戦略を導入する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 07:35:09 GMT)
Ref-GS: Directional Factorization for 2D Gaussian Splatting [21.2] Ref-GSは2次元ガウススプラッティングにおける方向光分解の新しいアプローチである。
提案手法は,様々なオープンワールドシーンのレンダリングに優れると同時に,幾何を正確に復元する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 17:43:32 GMT)
EZ-HOI: VLM Adaptation via Guided Prompt Learning for Zero-Shot HOI Detection [21.1] 本稿では,効率的なゼロショットHOI検出(EZ-HOI)のための新しい学習フレームワークを提案する。
まず、学習可能なプロンプトに対してLarge Language Model(LLM)とVLMガイダンスを導入し、詳細なHOI記述と視覚的セマンティクスを統合して、VLMをHOIタスクに適用する。
我々は,既存の手法と比較して,トレーニング可能なパラメータの10.35%から33.95%しか持たない,さまざまなゼロショット設定における最先端性能を実現していることを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 01:35:19 GMT)
Lightweight Contenders: Navigating Semi-Supervised Text Mining through Peer Collaboration and Self Transcendence [20.9] PS-NETは、軽量モデルによる半教師付きテキストマイニングに適した新しいフレームワークである。
PS-NETはオンライン蒸留を取り入れ、教師モデルを模倣して軽量の学生モデルを訓練する。
また、互いに協力的に教え合う学生同士のアンサンブルも統合されている。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 16:44:27 GMT)
CoMM: A Coherent Interleaved Image-Text Dataset for Multimodal Understanding and Generation [20.1] 我々は、生成したマルチモーダルコンテンツの一貫性、一貫性、アライメントを高めるために設計された高品質なデータセットであるCoMMを紹介する。
CoMMは、教育内容とビジュアルストーリーテリングに焦点を当て、多様なソースからの生データを活用する。
さまざまな品質評価指標は、フィルタされたデータセットの高品質さを証明するように設計されている。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 11:39:46 GMT)
Detecting entanglement and nonlocality with minimum observable length [20.0] 検出長」は、絡み合いや非局所性を検証するのに必要な測度を定量化する計量である。
検出長フレームワークを,様々な絡み合いカテゴリや非局所現象を含むように拡張する。
検出長が短い証人は,一定の条件下で優れた性能を示すことを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 12:40:50 GMT)
Paint Outside the Box: Synthesizing and Selecting Training Data for Visual Grounding [20.0] データ不足に対処するための新しいフレームワークPOBF(Paint Outside the Box, then Filter)を提案する。
PoBFは、ボックスの外側に塗布してイメージを合成し、以前の作品で遭遇したラベルの不一致問題に対処する。
PoBFは4つのデータセットで優れたパフォーマンスを実現し、平均5.83%の改善を提供する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 05:47:59 GMT)
Computational Bottlenecks of Training Small-scale Large Language Models [19.7] 小型の大規模言語モデル(SLM)は、消費者のコストと効率性の要求により注目されている。
本研究では,SLMの学習における計算的ボトルネックについて検討する。
私たちは、ドル当たりの損失や秒単位のトークンといったメトリクスを使用して、ポピュラーなクラウドサービス上のこれらの要因を評価します。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 11:27:09 GMT)
Photoacoustic Iterative Optimization Algorithm with Shape Prior Regularization [19.0] 光音響イメージング(PAI)は、再構成された結果の品質を低下させる固有の限界に悩まされる。
本研究では,2次元と3次元のPAI再構成結果に対する新たな最適化手法を提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 07:02:36 GMT)
SongBsAb: A Dual Prevention Approach against Singing Voice Conversion based Illegal Song Covers [18.8] 我々は,SVCに基づく違法な楽曲カバーに取り組むための,最初の積極的なアプローチであるSongBsAbを提案する。
SongBsAbは、リリース前に歌声に摂動を追加するため、使用時にはSVCのプロセスが干渉される。
我々は,SongBsAbの5つの多種多様かつ有望なSVCモデルに対する防止効果,無害性,ロバスト性を実証した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 04:06:27 GMT)
Deep learning-driven pulmonary artery and vein segmentation reveals demography-associated vasculature anatomical differences [17.6] 非造影CTおよび肺動脈造影(CTA)におけるHiPaS(Hi-abundant lung artery-vein)の有用性
精巧な手書きアノテーションを用いた1,073CTボリュームのHiPaSを,確立した多中心データセット上で訓練し,検証した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 11:49:00 GMT)
Strategic Demand-Planning in Wireless Networks: Can Generative-AI Save Spectrum and Energy? [17.6] 本稿では、需要ラベル付け、需要形成、需要再スケジューリングによる戦略的需要計画の概念を紹介する。
GenAIは、無線ネットワークにおける需要形成を容易にする強力なツールとして提案されている。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 11:31:18 GMT)
Geometric Point Attention Transformer for 3D Shape Reassembly [17.3] 本稿では,幾何学的関係に関する推論の課題に対処するネットワークを提案する。
我々は大域的な形状情報と局所的な対幾何学的特徴と、各部分の回転ベクトルや変換ベクトルとして表されるポーズを統合する。
意味的および幾何学的組立作業におけるモデルの評価を行い、絶対的なポーズ推定において従来の手法よりも優れていたことを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 08:00:56 GMT)
AdaScale: Dynamic Context-aware DNN Scaling via Automated Adaptation Loop on Mobile Devices [16.5] 我々は,動的コンテキストへの深層モデルの適応を自動化する弾性推論フレームワークであるAdaScaleを紹介した。
AdaScaleは精度を5.09%向上し、トレーニングオーバーヘッドを66.89%削減し、推論遅延を1.51倍から6.2倍に高速化し、エネルギーコストを4.69倍削減する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 08:33:56 GMT)
Memories of Forgotten Concepts [16.5] 削除された概念画像は正しい潜伏子を用いて生成可能であることを示す。
これを拡張して、消去された概念セットのすべてのイメージに対して、消去された概念を生成する多くのシードを生成することができることを示す。
この結果から,概念情報の完全消去は困難である可能性が示唆された。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 12:12:24 GMT)
Sketch-Guided Motion Diffusion for Stylized Cinemagraph Synthesis [16.0] Sketch2Cinemagraphは、フリーハンドスケッチからスタイリングされたシネマグラフの条件付き生成を可能にするスケッチ誘導フレームワークである。
生成した景観画像の流動領域における運動場を推定する新しい潜在運動拡散モデルを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 01:32:59 GMT)
Enhancing Brain Age Estimation with a Multimodal 3D CNN Approach Combining Structural MRI and AI-Synthesized Cerebral Blood Volume Data [15.9] 我々は,脳年齢を予測するためにVGGアーキテクチャを用いた深層学習モデルを開発した。
我々のモデルは3.95年間の平均絶対誤差(MAE)とテストセット上の(R2 = 0.94)の相関を達成し、類似したデータでトレーニングされた既存モデルよりも優れていた。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 21:54:08 GMT)
Unified Universality Theorem for Deep and Shallow Joint-Group-Equivariant Machines [15.7] ここでの「構成的」は、パラメータの分布が、リッジレット変換として知られる閉形式式で与えられることを示している。
我々の主定理はまた、浅いネットワークと深いネットワークの両方に対する普遍近似定理を統一する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 16:49:16 GMT)
Particle-based 6D Object Pose Estimation from Point Clouds using Diffusion Models [15.6] 本研究では,6次元オブジェクトのポーズ推定のための拡散モデルを提案する。
推論の間、訓練された生成モデルは複数の粒子、すなわち仮説をサンプリングすることができる。
本稿では,追加のトレーニングや計算集約的な操作を必要としない2つの新規かつ効果的なポーズ選択戦略を提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 14:52:44 GMT)
TSUBF-Net: Trans-Spatial UNet-like Network with Bi-direction Fusion for Segmentation of Adenoid Hypertrophy in CT [15.5] アデノイド肥大は小児における閉塞型睡眠時無呼吸症候群の一般的な原因である。
3次元医用画像分割フレームワークであるTSUBF-Netを紹介する。
TSUBF-NetはHD95:7.03、IoU:85.63、DSC:92.26という最先端の手法よりも優れている。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 12:21:23 GMT)
Synergizing Motion and Appearance: Multi-Scale Compensatory Codebooks for Talking Head Video Generation [15.2] トーキングヘッドビデオ生成は、音源画像から人物の身元と運転映像からの動作を保存したリアルなトーキングヘッドビデオを作成することを目的としている。
この分野における有望な進歩にもかかわらず、正確なポーズときめ細かい顔の細部を同時に生成することは、依然として困難かつ重要な問題である。
顔の動き条件と外観特徴の両方を効果的に洗練するために、動作と外観のコードブックを共同で学習し、マルチスケールのコードブック補償を実行することを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 07:54:07 GMT)
Hierarchical Prompt Decision Transformer: Improving Few-Shot Policy Generalization with Global and Adaptive [14.9] 本稿では,検索拡張によって実現した階層的プロンプト手法を提案する。
本手法は,2層のソフトトークンを導出プロンプトとして学習する。
アダプティブトークンは、キュレートされたデモセグメントから動的に取得され、コンテキスト対応のガイダンスが保証される。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 22:02:07 GMT)
Improving Shift Invariance in Convolutional Neural Networks with Translation Invariant Polyphase Sampling [14.7] ダウンサンプリング演算子は畳み込みニューラルネットワーク(CNN)のシフト不変性を破る
翻訳不変多相サンプリング(TIPS)と呼ばれる学習可能なプーリング演算子を提案する。
TIPSは精度、シフト一貫性、シフト忠実度で一貫したパフォーマンス向上をもたらす。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 18:48:37 GMT)
UTG: Towards a Unified View of Snapshot and Event Based Models for Temporal Graphs [14.6] スナップショットベースおよびイベントベース機械学習モデルを統一するフレームワークであるUTG(Unified Temporal Graph)を導入する。
時系列リンク予測タスクにおいて、スナップショットとイベントベースモデルの両方を時間グラフの両タイプで評価する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 23:07:27 GMT)
Protect Your Secrets: Understanding and Measuring Data Exposure in VSCode Extensions [14.4] Visual Studio Code(VSCode)におけるクロスエクステンションインタラクションのセキュリティ問題について検討し、さまざまなエクステンション間でデータエクスポージャーによって引き起こされる脆弱性について明らかにした。
我々の研究は、敵が秘密裏にクレデンシャル関連のデータを入手したり、操作したりできるような、インパクトの高いセキュリティ上の欠陥を発見しました。
当社のツールを現実世界のVSCodeエクステンション27,261に適用することにより、その8.5%がクレデンシャル関連のデータ漏洩にさらされていることが分かりました。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 07:08:53 GMT)
FlashSLAM: Accelerated RGB-D SLAM for Real-Time 3D Scene Reconstruction with Gaussian Splatting [14.1] FlashSLAMは、3Dガウススプラッティングを有効かつ堅牢な3Dシーン再構築に活用する新しいSLAMアプローチである。
既存の3DGSベースのSLAMメソッドは、スパースビューの設定や大きなカメラの動きの間、しばしば不足する。
提案手法は,従来手法よりも平均追跡精度を最大92%向上させる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 05:44:38 GMT)
Preserving Privacy in Software Composition Analysis: A Study of Technical Solutions and Enhancements [14.1] ソフトウェアコンポジション分析(Software composition analysis、SCA)は、入力ソフトウェアアプリケーションにおいて、オープンソースソフトウェアコンポーネントを識別するプロセスを指す。
SCAはユーザがアプリケーションのソースコードをリモートのSCAサーバにアップロードする必要がある。
プライバシーに関する懸念は、SCA技術が現実世界のシナリオで使用されるのを妨げています。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 17:17:29 GMT)
Deep evolving semi-supervised anomaly detection [14.0] 本研究の目的は,連続的半教師付き異常検出(CSAD)のタスクを形式化することである。
本稿では,半教師付きデータを扱うための変分オートエンコーダ(VAE)のベースラインモデルを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 15:48:37 GMT)
Advanced Video Inpainting Using Optical Flow-Guided Efficient Diffusion [13.6] 本稿では、FloEDと呼ばれる光フロー誘導高効率拡散を用いた高度な映像インペイントフレームワークを提案する。
FloEDはデュアルブランチアーキテクチャを採用しており、フローブランチが最初に破損したフローを復元し、マルチスケールフローアダプタがメインの塗装ブランチにモーションガイダンスを提供する。
バックグラウンド復元とオブジェクト除去の両タスクの実験は、FloEDがパフォーマンスと効率の両方の観点から最先端の手法より優れていることを示した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 15:45:26 GMT)
Learning on Less: Constraining Pre-trained Model Learning for Generalizable Diffusion-Generated Image Detection [13.6] 拡散モデルは、現実的な画像生成を可能にし、誤報のリスクを高め、公衆信頼を損なう。
現在、既存の手法の限定的な一般化能力のため、目に見えない拡散モデルによって生成された画像の検出は困難である。
我々はLearning on Less (LoL) という,シンプルで効果的な学習方法を提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 04:01:43 GMT)
A Wave is Worth 100 Words: Investigating Cross-Domain Transferability in Time Series [13.6] 本稿では、ウェーブ量子化(WQ4TS)に基づく新しいクロスドメイン事前学習手法を提案する。
我々は、異なる領域からの時系列データを共通のスペクトル潜在空間に転送し、モデルが共通の空間から直接異なる領域の時間的パターン知識を学習できるようにする。
提案されたWQ4TSは全タスクの87.5%で最高のパフォーマンスを達成し、全てのタスクにおけるメトリクスの平均的な改善は34.7%である。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 11:35:06 GMT)
Explicit and data-Efficient Encoding via Gradient Flow [13.4] 遅延空間にデータを直接エンコードするために勾配流を用いたデコーダのみの手法を提案する。
共役法を用いてデコーダを訓練し、コストのかかる積分を最小限の精度で回避できることを示す。
この研究は、正確で効率的なエンコーディングが不可欠である科学への機械学習の統合の道を開いた。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 15:54:50 GMT)
Retrieval Augmented Instruction Tuning for Open NER with Large Language Models [13.3] オープンネームエンティティ認識(NER)の課題に焦点をあてて,IE用検索強化教育チューニング(RA-IT)について検討する。
各トレーニングサンプルに対して、トレーニングデータセットから意味論的に類似したサンプルをコンテキストとして検索し、元の命令の入力にプリペイトする。
実験により, RA-ITの有効性は, 様々なデータサイズ, 英語と中国語のシナリオで検証された。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 09:02:35 GMT)
Improving Decoupled Posterior Sampling for Inverse Problems using Data Consistency Constraint [13.3] 本稿では,逆問題に対するGDPS ( Guided Decoupled Posterior Smpling) を提案する。
我々はこの手法を潜在拡散モデルとツイーディの公式に拡張する。
GDPSは最先端のパフォーマンスを実現し、既存の手法よりも精度を向上させる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 03:57:21 GMT)
Towards Adaptive Mechanism Activation in Language Agent [13.0] 本稿では,TextbfAdaptive textbfLanguage textbfAgent textbfMechanism textbfActivation Learning with Self-Explorationを提案する。
専門家モデルに依存することなく、メカニズムアクティベーション適応性を最適化することに焦点を当てている。
実験により下流エージェントタスクの大幅な改善が示された。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 08:10:04 GMT)
Token Cropr: Faster ViTs for Quite a Few Tasks [13.0] 本稿では,タスク関連性に基づいてトークンをエンドツーエンドに選択する方法を学習する補助予測ヘッドを用いたトークンプルーナを提案する。
画像分類,セマンティックセグメンテーション,オブジェクト検出,インスタンスセグメンテーションについて評価し,1.5~4倍の性能低下を示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 20:58:29 GMT)
SaFL: Sybil-aware Federated Learning with Application to Face Recognition [13.0] Federated Learning(FL)は、顧客間で共同学習を行う機械学習パラダイムである。
マイナス面として、FLは研究を開始したばかりのセキュリティとプライバシに関する懸念を提起している。
本稿では,SAFL と呼ばれる FL の毒殺攻撃に対する新しい防御法を提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 20:10:57 GMT)
Learning Mamba as a Continual Learner [12.7] 本稿では,メタ学習のMambaCLを継続学習者として提案する。
選択正則化を取り入れることで、MambaCLを効果的に訓練することができる。
MCLにおけるMambaの性能と一般化能力について実験と分析を行った。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 11:43:46 GMT)
MiKASA: Multi-Key-Anchor & Scene-Aware Transformer for 3D Visual Grounding [12.5] 3Dビジュアルグラウンドティングでは、自然言語記述と対応するオブジェクトを3D空間でマッチングする。
既存の手法は、オブジェクト認識の正確さや複雑な言語クエリの解釈に苦慮している場合が多い。
我々は,自己注意に基づくシーン認識オブジェクトエンコーダと,元来のマルチキーアンカー技術を統合したMiKASA変換器を提案する。
我々のモデルは、Sr3DとNr3Dの両方のデータセットに対するReferit3Dチャレンジにおいて、最も高い総合的精度を達成する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 14:57:40 GMT)
Batch Calibration: Rethinking Calibration for In-Context Learning and Prompt Engineering [12.3] Batch (BC) は、バッチ入力からコンテキストバイアスを制御する、単純だが直感的な手法である。
BCはゼロショットであり、推論のみであり、追加コストは無視できない。
10以上の自然言語理解および画像分類タスクにおいて,従来のキャリブレーションベースラインに対する最先端性能を示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 01:36:50 GMT)
Tree-Wasserstein Distance for High Dimensional Data with a Latent Feature Hierarchy [12.3] 2つの重要な側面を持つ高次元データに対する新しいツリー・ワッサースタイン距離(TWD)を提案する。
まず、我々のTWDは、潜在的な特徴階層を持つデータのために特別に設計されています。
データ観測に基づいて計算したTWDが、潜在特徴階層で定義されたTWDを確実に回復することを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 02:36:26 GMT)
Learn to Unlearn: Meta-Learning-Based Knowledge Graph Embedding Unlearning [11.8] 本稿ではメタラーニングに基づく知識グラフ埋め込みアンラーニングフレームワークであるMetaEUを紹介する。
ベンチマークデータセットの実験では、未学習のKG埋め込みの有効性が示されている。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 16:43:04 GMT)
Exploring the Abilities of Large Language Models to Solve Proportional Analogies via Knowledge-Enhanced Prompting [11.6] 比例アナロジー補完のための15K多重質問回答データセットを提案する。
様々な知識を付加したプロンプト設定において,現代大規模言語モデル(LLM)の性能を評価する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 16:15:14 GMT)
A Survey on Human-Centric LLMs [11.5] 大型言語モデル(LLM)は人間の認知と行動をシミュレートすることができる。
この調査は個々のタスクと集合タスクの両方のパフォーマンスに焦点を当てている。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 08:37:51 GMT)
Predictive Inference With Fast Feature Conformal Prediction [11.5] 我々は,新しい非整合性スコアを特徴とするFast Feature Conformal Prediction (FFCP)を導入し,実用化に有用である。
実証的な検証では、FFCPは特徴整形予測(FCP)と互換性があり、計算時間の約50倍の大幅な短縮を実現している。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 03:14:04 GMT)
Towards Unified Molecule-Enhanced Pathology Image Representation Learning via Integrating Spatial Transcriptomics [11.0] 我々はUMPIRE(Unified Molecule-enhanced Pathology Image Representationn Learning framework)を紹介する。
UMPIREは、遺伝子発現プロファイルからの相補的な情報を活用して、マルチモーダル事前学習をガイドすることを目的としている。
この分子的視点は、病理画像の埋め込みを学習するための、堅牢でタスクに依存しない訓練信号を提供する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 03:09:52 GMT)
WAFFLE: Multimodal Floorplan Understanding in the Wild [10.8] WAFFLEは20K近いフロアプラン画像と、さまざまなビルディングタイプ、場所、データフォーマットにまたがるインターネットデータから算出されたメタデータからなる、新しいデータセットである。
WAFFLEは,従来のデータセットでは実現不可能な,識別的および生成的の両方において,新たなビルディング理解タスクの進行を可能にすることを示す。
WAFFLEをコードとトレーニングされたモデルとともに公開し、研究コミュニティに建物のセマンティクスを学ぶための新しい基盤を提供する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 20:19:33 GMT)
VISUALCODER: Guiding Large Language Models in Code Execution with Fine-grained Multimodal Chain-of-Thought Reasoning [10.7] 視覚制御フローグラフ(CFG)を用いたマルチモーダル・チェーン・オブ・ソート(CoT)推論を統合することで,コード推論を強化する,シンプルかつ効果的なアプローチであるVisual Coderを導入する。
コードスニペットを対応するCFGと整合させることで、Visual Coderは実行フローに関する深い洞察を提供し、コードの振る舞いをより正確に予測できる。
実験により,視覚的CFGによるLLMの増大は,コード推論タスクにおいて,テキストベースのCFG記述を著しく上回ることを示した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 07:55:12 GMT)
LUIEO: A Lightweight Model for Integrating Underwater Image Enhancement and Object Detection [10.6] 本稿では,水中画像の強調と検出精度の向上を同時に行うマルチタスク学習手法を提案する。
統合モデルは、情報通信と異なるタスク間の共有を動的に調整することを可能にする。
数値実験により,提案モデルが視覚性能,物体検出精度,検出効率を満足できることを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 14:01:30 GMT)
BiCo-Fusion: Bidirectional Complementary LiDAR-Camera Fusion for Semantic- and Spatial-Aware 3D Object Detection [10.3] 新しいトレンドはマルチモーダル入力、すなわちLiDARとカメラを融合させることである。
LiDARの機能は詳細なセマンティック情報と格闘し、カメラは正確な3D空間情報を欠いている。
BiCo-Fusionは、ロバストなセマンティックおよび空間認識の3Dオブジェクト検出を実現する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 07:07:02 GMT)
Sensitively searching for microwave dark photons with atomic ensembles [10.0] 本研究では、原子アンサンブルの混合誘起量子状態遷移を非破壊的に探すことにより、ダーク光子を検出することが可能なアプローチを提案する。
具体的には、人工原子アンサンブル検出器を用いて、ミリ波帯とセンチ波帯の暗黒光子が検出可能であることを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 12:20:45 GMT)
Differentiable Inverse Rendering with Interpretable Basis BRDFs [9.9] 逆レンダリングは、撮影画像から幾何と空間的に変化するBRDFの両方を再構成しようとする。
本稿では,解釈可能な基底BRDFを生成する微分可能な逆レンダリング手法を提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 22:35:05 GMT)
Long text outline generation: Chinese text outline based on unsupervised framework and large language mode [9.6] 本研究では,教師なしフレームワークと大規模モデルを組み合わせた中国語のアウトライン生成手法を提案する。
具体的には、まず、エンティティと構文的依存関係に基づいた章特徴グラフデータを生成する。
グラフ注意層に基づく表現モジュールは、章グラフデータの深い埋め込みを学習し、プロット境界を分割する。
最後に、各プロットセグメントの要約を生成し、全体像を生成するために、大きなモデルを用いる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 13:46:15 GMT)
Towards Cross-View-Consistent Self-Supervised Surround Depth Estimation [9.6] 連続画像からの自己監督下周深度推定は経済的な代替手段を提供する。
従来のSSSDE法では、画像間で情報を融合する異なるメカニズムが提案されているが、それらのいくつかは、クロスビュー制約を明示的に考慮している。
本稿では,SSSDEのクロスビュー一貫性を高めるために,効率的で一貫したポーズ推定設計と2つの損失関数を提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 15:58:23 GMT)
VisOnlyQA: Large Vision Language Models Still Struggle with Visual Perception of Geometric Information [9.4] 我々は、LVLM(Large Vision Language Models)の視覚知覚能力を評価する新しいデータセットVisOnlyQAを紹介する。
我々のデータセットは、推論などの他の機能に依存しない、きめ細かい視覚情報のために、LVLMの視覚的知覚を解析することを可能にする。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 19:46:22 GMT)
A Comparative Study of LLM-based ASR and Whisper in Low Resource and Code Switching Scenario [9.3] 大規模言語モデル(LLM)は、様々なNLPタスクにまたがる例外的なパフォーマンスを誇示している。
低リソース環境下での音声認識の課題に対処する可能性については、未検討のままである。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 08:07:01 GMT)
Prompt as Free Lunch: Enhancing Diversity in Source-Free Cross-domain Few-shot Learning through Semantic-Guided Prompting [9.1] ソースフリーのクロスドメイン数ショット学習タスクは、最小限のサンプルを使用して、トレーニング済みのモデルをターゲットのドメインに転送することを目的としている。
本稿では2つのフェーズに分けられるSeGD-VPTフレームワークを提案する。
最初のステップは、各サポートサンプルに多様性プロンプトを追加し、様々な入力を生成し、サンプルの多様性を高めることで、機能の多様性を高めることを目的としている。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 11:00:38 GMT)
Learning Aggregation Rules in Participatory Budgeting: A Data-Driven Approach [8.9] PB(Participatory Budgeting)は、様々なプロジェクトを通じて公共資金を配分する民主的なプロセスを提供する。
PBのオーガナイザは、文献に精通していないか、あるいは既存のルールが期待を反映していないため、アグリゲーションルールを選択する際の課題に直面している。
本稿では,この課題に対処するために機械学習を利用した新しいデータ駆動手法を提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 18:13:27 GMT)
Counting Like Transformers: Compiling Temporal Counting Logic Into Softmax Transformers [8.9] 時間カウントロジックの $textsfK_textt$[#] と RASP の $textsfC-RASP$ を紹介します。
それらが互いに等価であることを示し、それらが結合されていない入力サイズを持つ将来のマスキング型ソフトアテンショントランスの形式的表現性に最もよく知られた下界であることを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 20:48:11 GMT)
InvestESG: A multi-agent reinforcement learning benchmark for studying climate investment as a social dilemma [8.9] InvestESGは、ESG開示義務が企業気候投資に与える影響を研究するために設計された、新しいマルチエージェント強化学習(MARL)ベンチマークである。
我々の実験は、十分な資本を持つESGを意識した投資家がいなければ、開示委任統治下での企業緩和努力は限定的であることを示している。
地球温暖化のリスクに関するより多くの情報を提供することで、投資家が関与しなくても、企業は緩和により多くの投資をすることができる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 05:18:12 GMT)
DIVD: Deblurring with Improved Video Diffusion Model [8.8] 拡散モデルとビデオ拡散モデルは、画像生成やビデオ生成の分野で優れている。
本稿では,ビデオデブロアリングに特化してビデオ拡散モデルを提案する。
我々のモデルは既存のモデルより優れており、様々な知覚的指標について最先端の結果が得られる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 11:39:02 GMT)
Needle: A Generative-AI Powered Monte Carlo Method for Answering Complex Natural Language Queries on Multi-modal Data [8.8] マルチモーダルデータはしばしば、その中にエンコードされたリッチな情報を適切にキャプチャする詳細な記述を見逃す。
これにより、複雑な自然言語クエリに答えることが、これらのドメインにおいて大きな課題となる。
既存の文献は、自然言語と画像で共同で訓練されたベクトル表現による画像データのこの課題に対処している。
本稿では,ジェネレーティブAI(GenAI)を用いたモンテカルロ方式を導入することにより,この問題に対処するための一歩を踏み出した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 01:36:41 GMT)
Decoupled Vertical Federated Learning for Practical Training on Vertically Partitioned Data [8.8] 本稿では,故障を伴うトレーニングを行うためのデカップリング型VFL(DVFL)を提案する。
DVFLは、ローカルな教師なしの目的を用いて、コミュニケーションラウンド間のトレーニングを分離する。
二次的な利点として、DVFLはデータの効率を高め、勾配ベースの攻撃に対する免疫を提供する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 18:13:30 GMT)
Potential Field Based Deep Metric Learning [8.7] ディープメトリック学習は、意味的に意味のある表現空間を学ぶためにネットワークを訓練する。
物理学における静電場に着想を得た新しい合成DMLモデルを提案する。
このような減衰は,クラス内変動が大きく,ラベルノイズも大きい実世界のデータセットの性能向上に有効であることを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 05:22:22 GMT)
One to beat them all: "RYU" -- a unifying framework for the construction of safe balls [8.6] 安全領域を構築するための新しいフレームワーク「RYU」を提案する。
我々のフレームワークは、目的関数が2つのコンポーネントから構成される標準的なケースに適用されます。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 15:02:17 GMT)
PACA: Perspective-Aware Cross-Attention Representation for Zero-Shot Scene Rearrangement [8.4] PACAはシーンアレンジメントのためのゼロショットパイプラインである。
オブジェクトレベルの表現を生成するために,生成,セグメンテーション,特徴エンコーディングを単一ステップに統合する表現を開発する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 11:38:07 GMT)
Provably Scalable Black-Box Variational Inference with Structured Variational Families [8.3] 我々は、あるスケールの行列構造が$mathcalOleft(Nright)$のより優れた反復複雑性を達成できることを示し、$N$に対するより良いスケーリングを示唆している。
大規模階層モデルの理論的結果を実証的に検証する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 00:44:02 GMT)
Support-Set Context Matters for Bongard Problems [8.0] ボナード問題(英: Bongard problem)とは、正負のイメージと負のイメージの集合から抽象的な「概念」を導出する必要があるIQテストの一種である。
現在の機械学習手法は、IQテストの一種であるボンガード問題を解くのに苦労している。
従来の作業よりも大幅に向上し,Bongard-LOGOとBongard-HOIの精度が向上した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 00:09:44 GMT)
No Size Fits All: The Perils and Pitfalls of Leveraging LLMs Vary with Company Size [7.7] 大規模言語モデル(LLM)は、さまざまな組織における戦略的ユースケースの展開において、重要な役割を担っている。
LLMの活用が成功する際の課題や課題は、組織の大きさによって大きく異なる可能性がある。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 16:11:18 GMT)
DPA: Dual Prototypes Alignment for Unsupervised Adaptation of Vision-Language Models [7.6] 本研究では,視覚-テクスチュアルモデルのための教師なしドメイン適応手法であるDPAを紹介する。
双対プロトタイプの概念を導入し、出力の凸結合とともに別個の分類器として機能する。
それは、特に初期の訓練において、堅牢な自己訓練を促進するために擬似ラベルをランク付けする。
13の下流視覚タスクの実験では、DPAはゼロショットCLIPと最先端の教師なし適応ベースラインを大きく上回っている。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 14:53:07 GMT)
Adaptive Constraint Integration for Simultaneously Optimizing Crystal Structures with Multiple Targeted Properties [7.6] Adaptive Crystal Synthesizer (SMOACS) を用いた同時多目的最適化
SMOACSは、モデル再トレーニングを必要とせずに、適応的制約を最適化プロセスに統合することを可能にする。
我々は,135個の原子サイトまでの大きな原子配置において,電気的中立性を維持するという困難な制約を満たす中で,バンドギャップの最適化を実証した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 20:58:49 GMT)
Training a neural netwok for data reduction and better generalization [7.5] スパース学習者の動機は、優れた一般化に必要なものだけを選択することで入力(特徴)を圧縮することである。
人工的な特徴の選択により,無関係な特徴を無視する段階から,それらを取り出す段階へ,顕著な段階的変化を示す。
このアプローチは、高次元データを意味のある罰則のコンパクトで解釈可能な部分集合に解釈するために圧縮された特徴を検知する形態であると見なすことができる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 11:10:31 GMT)
Quantum Convolutional Neural Network with Flexible Stride [7.4] 本稿では,新しい量子畳み込みニューラルネットワークアルゴリズムを提案する。
異なるタスクに対応するために、柔軟にストライドを調整できます。
データスケールの指数加速度を、従来のものに比べて少ないメモリで達成することができる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 02:37:06 GMT)
Rotation Invariant Quantization for Model Compression [7.3] トレーニング後のニューラルネットワーク(NN)モデル圧縮は、メモリリソースが限られているデバイスに大規模なメモリ消費モデルを展開するための魅力的なアプローチである。
NNモデル全体の量子化に単一パラメータを用いる回転不変量子化(RIQ)手法を提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 19:15:57 GMT)
Unveiling Inclusiveness-Related User Feedback in Mobile Applications [7.2] Reddit、Google Play Store、Xからのフィードバックを、世界で最も人気のある50のアプリに活用しています。
社会-技術基盤理論のアプローチを用いて,3つの情報源にまたがる22,000のポストを分析した。
我々は, アルゴリズムバイアス, 技術, デモグラフィ, アクセシビリティ, その他の人的価値の5つのカテゴリからなる包括性に関する分類を整理した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 05:13:07 GMT)
Burning RED: Unlocking Subtask-Driven Reinforcement Learning and Risk-Awareness in Average-Reward Markov Decision Processes [7.0] 平均回帰マルコフ決定プロセス(MDPs)は、不確実性の下でのシーケンシャルな意思決定の基盤となる枠組みを提供する。
平均再帰型MDPのユニークな構造特性を考察し,これを用いてReward-Extended Differential (RED) 強化学習を導入する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 15:49:16 GMT)
Estimating Continuous Muscle Fatigue For Multi-Muscle Coordinated Exercise: A Pilot Study on Walking [6.8] 多筋協調時間運動の疲労を評価するには、複数の筋肉の適応の疲労によって引き起こされる特性を表す神経筋の特徴が必要である。
そこで本研究では,筋肉補償と脊髄モジュール活性化の特徴による疲労の描写と,生理的合理的モデルによる連続疲労の推定を提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 19:02:51 GMT)
Stochastic Hessian Fittings with Lie Groups [6.6] プレコンディション勾配降下法(PSGD)によるヘシアンフィッティング基準について検討した。
最適化問題としてのヘッセン整合自身は、ある種の一般リー群において穏やかな条件下で強く凸である。
この発見により、ヘシアンフィッティングは、よく定義されたリー群最適化問題へと変換される。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 05:15:11 GMT)
K-UD: Revising Korean Universal Dependencies Guidelines [6.3] 我々は,韓国語分析の文脈において,UDの構文依存の定義を洗練することを目的としている。
我々の目的は、UD内でのコンセンサスを達成するだけでなく、依存構造を用いて韓国語文を分析するためのUDフレームワークを超えて合意を得ることである。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 15:41:05 GMT)
A Cognac shot to forget bad memories: Corrective Unlearning in GNNs [6.1] 我々は,最近定式化された矯正的未学習の問題について検討した。
現在のグラフアンラーニング手法は、操作された集合が全て知られている場合でも、操作の効果を解き放たない。
コニャックというグラフアンラーニング手法を導入し、5%しか特定されていない場合でも操作セットの効果を解き放つことができる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 12:23:25 GMT)
TraCS: Trajectory Collection in Continuous Space under Local Differential Privacy [5.9] ローカルディファレンシャルプライバシ(LDP)は、データコレクタが信頼できない場合でも、ユーザに対して証明可能なプライバシ保証を提供する。
既存の軌道収集手法は、離散的な位置空間に対してのみ LDP を保証する。
本稿では,連続空間に対する LDP を保証する2つのトラジェクトリコレクション手法を提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 00:07:04 GMT)
MambaNUT: Nighttime UAV Tracking via Mamba and Adaptive Curriculum Learning [5.9] バックボーンとして線形複雑性を持つ状態空間モデルを用いる純マンバベースのトラッキングフレームワークを提案する。
本稿では,サンプリング戦略と損失重みを動的に調整する適応型カリキュラム学習(ACL)手法を提案する。
複数の夜間UAV追跡ベンチマークでの被曝実験は、提案されたMambaNUTが最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 00:51:23 GMT)
LVLM-COUNT: Enhancing the Counting Ability of Large Vision-Language Models [5.9] 大規模視覚言語モデル(LVLM)は、訓練中に遭遇する物体の数を超えるタスクを数えるのに苦労する。
分割・対数手法を用いてLVLMのカウント能力を向上し、カウント問題をサブカウントタスクに分割する。
当社のアプローチは,さまざまなデータセットやベンチマークにまたがるカウント機能の向上を実証しています。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 05:50:22 GMT)
Learning to Forget using Hypernetworks [5.6] HyperForgetは、ターゲットデータに関する知識を欠くモデルをサンプリングする機械学習フレームワークである。
未学習モデルは、リザーブセットの精度を保ちながら、リザーブセットの精度をゼロとした。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 10:43:11 GMT)
CtrlNeRF: The Generative Neural Radiation Fields for the Controllable Synthesis of High-fidelity 3D-Aware Images [5.5] 生成神経放射場(GRAF)は、3Dの監督なしにランダムノイズzから画像を生成することができる。
実際には、形状と外観をそれぞれz_sとz_aでモデル化し、推論中に別々に操作する。
本稿では,複数のシーンを共有重みで表現するために,単一のネットワークを用いた制御可能な生成モデルを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 10:19:24 GMT)
Unlocking Korean Verbs: A User-Friendly Exploration into the Verb Lexicon [5.4] Sejong辞書データセットは、形態学、構文、意味表現を広範囲にカバーしている。
このデータセット内のラベル付き言語構造は、単語とフレーズの関係を明らかにする基盤を形成する。
本稿では,動詞関連情報の収集と統合を目的としたユーザフレンドリーなWebインターフェースを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 14:32:47 GMT)
Explaining Object Detectors via Collective Contribution of Pixels [5.3] 本稿では,複数画素の集合的寄与を考慮した物体検出手法を提案する。
我々のアプローチはゲーム理論の概念、特にシェープの値と相互作用を活用して説明を提供する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 04:04:32 GMT)
Roll in the Tanks! Measuring Left-wing Extremism on Reddit at Scale [5.2] 我々はRedditで、53Kの著者による1300万件の投稿を分析した。
戦車は明らかに大きな極左共同体の周辺にある。
戦車は社会問題よりも国家レベルの政治イベントに重点を置いている。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 17:18:39 GMT)
Does chat change LLM's mind? Impact of Conversation on Psychological States of LLMs [5.1] 近年の大規模言語モデル(LLM)の成長は,マルチエージェントシステムを通じて,より信頼性の高い人間中心のインタラクションを可能にしている。
マルチエージェントインタラクションにおける心理的状態の変化について検討し,会話深度,話題,話者の影響に着目した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 13:19:32 GMT)
Sensitivity Analysis on Policy-Augmented Graphical Hybrid Models with Shapley Value Estimation [5.1] 一般非線形ポリシ拡張グラフィカル(pKG)ハイブリッドモデルに対する総合感度解析フレームワークを提案する。
提案手法は, バイオマニュファクチャリングにおける効率的な解釈と安定なプロセス制御を支援する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 12:51:55 GMT)
Generative Language Models Potential for Requirement Engineering Applications: Insights into Current Strengths and Limitations [5.0] 本稿では,ChatGPT と Gemini の多種多様な要求工学応用への応用の可能性について検討する。
両方の言語モデルのパフォーマンスを、既存のタスク固有の機械学習予測器と従来の言語モデルと比較する。
我々の実験によると、GeminiはChatGPTよりも精密な迅速なエンジニアリングを必要としている。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 20:20:58 GMT)
Mean-Field Sampling for Cooperative Multi-Agent Reinforcement Learning [4.9] マルチエージェント強化学習のための新しいアルゴリズムを提案する。
この学習されたポリシーは、サブサンプルエージェントの数が増加するにつれて、$tildeO (1/sqrtk)$の順序で最適ポリシーに収束することを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 03:45:17 GMT)
Seldom: An Anonymity Network with Selective Deanonymization [4.7] 我々は、選択的匿名化を統合した匿名ネットワークであるSeldomを設計する。
Seldomは、法執行機関が、不正行為を犯すユーザの匿名化IDを選択的にアクセスすることを可能にしない。
セルダムは匿名ネットワークにおける犯罪行為の固有の問題に対して実用的で展開可能な技術的解決策を提供する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 22:31:31 GMT)
Exploring Large Vision-Language Models for Robust and Efficient Industrial Anomaly Detection [4.7] CLAD(Contrastive Cross-Modal Training)を用いた視覚言語異常検出法を提案する。
CLADは、視覚的特徴とテキスト的特徴をコントラスト学習を用いて共有埋め込み空間に整列する。
CLADは画像レベルの異常検出と画素レベルの異常局所化の両方において最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 17:00:43 GMT)
Reducing Reasoning Costs -- The Path of Optimization for Chain of Thought via Sparse Attention Mechanism [4.6] この研究は、いくつかの関連するトークンにのみ焦点をあてるスパースアテンションメカニズムを使うことを提案する。
この実験は、MIT OpenCourseWareの線形代数テスト問題の解法において、このモデルの推論時間、正当性スコア、思考長の連鎖とo1プレビューを比較して比較した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 13:08:57 GMT)
Deep Learning for Longitudinal Gross Tumor Volume Segmentation in MRI-Guided Adaptive Radiotherapy for Head and Neck Cancer [4.4] 頭頸部癌に対するMRI誘導適応放射線療法(MRgART)には,GTVの正確なセグメンテーションが不可欠である。
本研究では,放射線前療法 (pre-RT) と中放射線中療法 (mid-RT) の併用が課題である。
我々はMRgARTにおけるGTVセグメンテーションを促進するためのDLモデルのコレクションを提示し,放射線オンコロジーの合理化の可能性を示した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 03:57:18 GMT)
Retrieving Implicit and Explicit Emotional Events Using Large Language Models [4.2] 大規模言語モデル (LLM) は近年,その優れたパフォーマンスから注目されている。
本研究では,LLMのコモンセンスにおける感情検索能力について検討する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 15:07:29 GMT)
HouseLLM: LLM-Assisted Two-Phase Text-to-Floorplan Generation [4.2] 本稿では,Large Language Model (LLM) を誘導して初期レイアウトを生成する2段階のテキスト・ツー・フロアプラン生成手法を提案する。
我々は、ユーザテキスト仕様に基づいてLCMを誘導するためにChain-of-Thoughtアプローチを導入し、よりユーザフレンドリで直感的な住宅レイアウト設計を可能にした。
実験結果から,本手法は全指標の最先端性能を実現し,実用的ホームデザインにおける有効性を検証した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 02:12:08 GMT)
Combining Blockchain and Biometrics: A Survey on Technical Aspects and a First Legal Analysis [4.1] 本稿では,ブロックチェーンとバイオメトリックスの組み合わせに関する技術文献調査を行う。
これには、この統合に関する最初の法的分析が含まれており、課題や可能性に光を当てている。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 20:17:28 GMT)
Calibration through the Lens of Interpretability [4.0] キャリブレーションは、分類精度の上に有用なラベルの確率推定が必要な場合、頻繁に呼び出される概念である。
本研究では,キャリブレーションの概念に関する公理的研究を開始する。
キャリブレーションされたモデルの望ましい特性とそれに対応する評価指標をカタログ化し,その実現可能性と対応性について分析する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 19:28:16 GMT)
Mathematical Frameworks of All-Quantum Mode Adaptable Communication Processors [3.9] 全量子モード適応は、異なる量子ノードを共通のネットワークに適応させるのに不可欠である。
本稿では、異なる量子信号間の整合性を管理する上で重要な3つの重要な要素であるモード展開、モード縮小、モードマッピングに焦点を当てる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 17:58:52 GMT)
What You See Is What You Get: Attention-based Self-guided Automatic Unit Test Generation [3.8] 本稿では,AUGER(Attention-based Self-guided Automatic Unit Test GenERation)アプローチを提案する。
AUGERには欠陥検出とエラートリガーという2つのステージがある。
F1スコアと欠陥検出精度で4.7%から35.3%向上した。
ユニットテスト生成において、最先端(SOTA)アプローチよりも23から84のエラーを発生させることができる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 14:28:48 GMT)
From Priest to Doctor: Domain Adaptaion for Low-Resource Neural Machine Translation [3.7] 多くの言語は、高性能汎用ニューラルネットワーク翻訳(NMT)モデルを訓練するのに不十分なデータを持っている。
世界中の言語の多くは、高性能汎用ニューラルマシン翻訳(NMT)モデルをトレーニングするのに不十分なデータを持っている。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 21:06:08 GMT)
Linear Probe Penalties Reduce LLM Sycophancy [3.6] 大規模言語モデル(LLM)は、しばしばサイコファンであり、正確または客観的なステートメントよりもユーザとの合意を優先する。
ヒトフィードバック(RLHF)からの強化学習において、この問題行動はより顕著になる
本研究では,報酬モデル内でサイコファンシーのマーカーを識別し,ペナルティ化する線形探索法を開発し,サイコファンの行動を妨げる報酬を生成する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 21:11:28 GMT)
Local vs. Global: Local Land-Use and Land-Cover Models Deliver Higher Quality Maps [3.6] アフリカの人口の約20%が栄養不足に悩まされ、8億8800万人が2022年に食料不足を軽度から重度に経験した。
土地利用と土地被覆の地図は、作物の土地をマッピングするなど、食料の安全に対処するための重要な洞察を提供する。
本研究では,多様なデータソースを用いて局所的な土地被覆地図を作成する教師学生モデル構成によるデータ中心型フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 11:48:58 GMT)
Efficient Deployment of Transformer Models in Analog In-Memory Computing Hardware [3.4] 本稿では,AIMCハードウェア上に事前学習したトランスフォーマーモデルをデプロイするための新しい手法を提案する。
ハードウェアを意識したトレーニングを必要とする従来のアプローチとは異なり、当社の手法はオリジナルのモデルを再トレーニングすることなく、ダイレクトデプロイメントを可能にします。
提案手法は,複数のタスクにまたがって単一のアナログモデルを再利用できるため,マルチタスクシナリオにおいて特に魅力的である。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 22:48:24 GMT)
WaKA: Data Attribution using K-Nearest Neighbors and Membership Privacy Principles [3.4] WaKAは、個々のデータポイントのモデル損失分布への寄与を測定する新しい属性法である。
WaKAは汎用的であり、プライバシーリスクを評価するために、MIA(メンバシップ推論攻撃)として後部攻撃として使用できる。
不均衡なデータセット上でのデータ最小化タスク(削除や追加)において、WAKAはShapley Valuesよりも堅牢性が高いことを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 16:18:23 GMT)
Alpha Mining and Enhancing via Warm Start Genetic Programming for Quantitative Investment [3.4] 伝統的遺伝プログラミング(GP)は、しばしばストックアルファ因子発見に苦しむ。
GPはランダムな探索よりも,将来性のある領域に注目する方が優れている。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 17:13:54 GMT)
Online Poisoning Attack Against Reinforcement Learning under Black-box Environments [3.4] 本稿では,ブラックボックス環境で動作する強化学習エージェントに適したオンライン環境汚染アルゴリズムを提案する。
まず,報酬関数や状態遷移を害する攻撃手法を提案する。
ペナルティに基づく手法と二段階の改革を併用して、問題を制約のないものに変換する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 12:43:23 GMT)
Incentivizing Truthful Collaboration in Heterogeneous Federated Learning [3.4] データの不均一性がクライアントの更新操作インセンティブに与える影響について検討する。
我々は、大規模な勾配更新の送信を非インセンティブ化する支払いルールを開発する。
我々は、クライアントの支払いとグローバルモデルの収束率に明確な境界を導出する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 22:04:12 GMT)
Decision Transformer vs. Decision Mamba: Analysing the Complexity of Sequential Decision Making in Atari Games [3.3] 本研究は、強化学習タスクのシーケンスモデリングにおける、DT(Decision Transformer)とDM(Decision Mamba)のパフォーマンスの相違について分析する。
この研究は、DMがBreakoutとQbertのゲームで一般的にDTを上回っ、一方DTはHeroやKung Fu Masterといったより複雑なゲームでより良いパフォーマンスを示した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 08:37:10 GMT)
Skew-Probabilistic Neural Networks for Learning from Imbalanced Data [3.2] 本稿では,確率論的ニューラルネットワーク(PNN)とスキューノーマルカーネル関数を用いた不均衡なデータ指向分類器を提案する。
柔軟性を向上するスキュー正規分布を利用することで、提案したスキュー確率ニューラルネットワーク(SkewPNN)は、下層のクラス密度をよりよく表現できる。
いくつかのデータセットにおける実データ解析により、SkiwPNNとBA-SkewPNNは、バランスの取れたデータセットと不均衡なデータセットの両方において、最先端の機械学習手法よりも大幅に優れていることが示されている。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 11:36:53 GMT)
DMFourLLIE: Dual-Stage and Multi-Branch Fourier Network for Low-Light Image Enhancement [3.2] 本稿では,DMFourLLIE(Dual-Stage Multi-Branch Fourier Low-Light Image Enhancement)フレームワークを提案する。
第1段階は、赤外線画像からの構造情報を統合し、位相成分を増強する。
第2段階は、堅牢な画像再構成のために、マルチスケールとフーリエの畳み込み枝を組み合わせたものである。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 05:44:50 GMT)
Intermediate Outputs Are More Sensitive Than You Think [3.2] 本稿では、自由度(DoF)と中間出力の感度に基づいて、深層コンピュータビジョンモデルにおけるプライバシーリスクを測定する新しいアプローチを提案する。
本研究では,各層に保持される情報量を評価するためにDoFを利用するフレームワークを提案し,これをヤコビ行列のランクと組み合わせて入力変動に対する感度を評価する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 06:40:28 GMT)
Alternators For Sequence Modeling [3.0] 交代子(英: alternator)は、列の非マルコフ力学モデルの新しい族である。
交替器は、観測軌跡ネットワーク(OTN)と特徴軌跡ネットワーク(FTN)の2つのニューラルネットワークを備える。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 00:49:32 GMT)
SOUL: A Semi-supervised Open-world continUal Learning method for Network Intrusion Detection [2.8] 本研究では,ラベル不足とオープンワールド学習(OWL)の設定に着目し,連続学習に基づくネットワーク侵入検出(NID)の攻撃クラス検出を改善する。
我々は,NID のOWLを SOUL と呼ばれる半教師付き連続学習法として定式化し,限定的な注釈付きデータを用いて,完全教師付きモデルと同等の分類性能を実現する。
提案手法は,4つの標準ネットワーク侵入検出データセットを用いて評価する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 17:57:34 GMT)
Leveraging Retrieval-Augmented Generation for Persian University Knowledge Retrieval [2.7] 本稿では,Large Language Models (LLM) を用いたレトリーバル拡張生成(RAG)パイプラインを用いた革新的なアプローチを提案する。
大学公式Webページからデータを体系的に抽出することにより、ユーザクエリに対する正確で文脈的に関連する応答を生成する。
実験の結果, 生成した応答の精度と関連性に大きな改善が認められた。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 13:31:14 GMT)
Models That Prove Their Own Correctness [2.7] 我々は,その出力の正しさを証明する自己証明モデルを,対話的証明を通じて検証アルゴリズムとして$V$で訓練する。
ランダムな入力に対して高い確率で、モデルは正しい出力 *and* を生成し、その正しさを$V!$に証明する。
学習方法は,GCDを演算する自己証明変換器を訓練するために用いられ,その解答の正しさが証明される。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 21:18:32 GMT)
DoorINet: Door Heading Prediction through Inertial Deep Learning [2.6] 慣性センサーは様々な用途で広く使われている。
このような課題に対処するため、姿勢基準系アルゴリズムを適用する。
室内環境では、磁力計は性能を低下させる干渉に悩まされる。
ドアマウント型,低コストな慣性センサから方向角を計算するための,エンドツーエンドのディープラーニングフレームワークであるDoorINetを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 08:33:42 GMT)
DPCSpell: A Transformer-based Detector-Purificator-Corrector Framework for Spelling Error Correction of Bangla and Resource Scarce Indic Languages [2.6] スペル訂正(スペルりょう、英: Spelling error correction)は、テキスト中のミスペル語を識別し、修正するタスクである。
バングラ語と資源不足のIndic言語におけるスペルエラー訂正の取り組みは、ルールベース、統計、機械学習ベースの手法に重点を置いていた。
本稿では,従来の問題に対処し,デノナイジング変換器をベースとした新しい検出器-ピューリフィエータ-コレクタDPCを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 18:45:39 GMT)
AI Meets Antimatter: Unveiling Antihydrogen Annihilations [2.5] CERNのALPHA-g実験は、反物質に対する重力の影響を初めて直接測定することを目的としている。
この測定では、検出器内の消滅の垂直位置を正確に予測する必要がある。
本稿では,PointNet深層学習アーキテクチャに基づくモデルアンサンブルを用いた消滅位置復元手法を提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 20:28:12 GMT)
Introduction to Reinforcement Learning [2.5] 強化学習(Reinforcement Learning, RL)は、累積報酬を最大化するために環境と対話して意思決定を行う訓練エージェントに焦点を当てる。
本稿ではRLの概要を述べるとともに,その中核となる概念,方法論,さらに学ぶためのリソースについて述べる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 04:34:53 GMT)
Well log data generation and imputation using sequence-based generative adversarial networks [2.2] 健全なログデータにおけるギャップと不正確さは、貯水池の評価において重大な不確実性をもたらす可能性がある。
本研究では,ログデータ生成とインプットに特化して設計されたGAN(Sequence-based Generative Adversarial Network)を利用した新しいフレームワークを提案する。
実験により,空間系列解析における他の深層学習モデルと比較して,データのギャップを埋める際の精度が優れていることが示された。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 07:50:34 GMT)
The Advancement of Personalized Learning Potentially Accelerated by Generative AI [2.1] ジェネレーティブAI(GAI)の急速な発展は、教育の様々な側面に革命的な変化をもたらした。
本研究は, GAIによるパーソナライズされた学習の様々な側面の強化の可能性について, 既存研究の徹底的な分析を通じて検討した。
GAIは、個人の好みやニーズに合わせて適応的な学習体験を提供する際、例外的な能力を示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 06:01:14 GMT)
Refine3DNet: Scaling Precision in 3D Object Reconstruction from Multi-View RGB Images using Attention [2.0] 本稿では,自己認識機構を備えた視覚的自動エンコーダと3Dリファインダネットワークを備えたハイブリッド戦略を提案する。
提案手法はJTSOと組み合わせて, 単一・多視点3次元再構成における最先端技術よりも優れる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 08:53:39 GMT)
Hierarchical Prompting Taxonomy: A Universal Evaluation Framework for Large Language Models [1.9] 本稿では,人間の認知原理に基づく階層型確率分類(HPT)について述べる。
様々なタスクの認知的要求を調べることにより、大規模言語モデル(LLM)を評価するように設計されている。
HPTは、多様なシナリオでLLMの問題解決スキルを評価するための信頼性の高い方法を提供している。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 17:45:28 GMT)
Post-Vaccination COVID-19 Data Analysis: Privacy and Ethics [1.8] 新型コロナウイルス(COVID-19)のパンデミックは、健康、経済、平和の面で世界に大きな影響を与えている。
予防接種プロセスは、市民のプライバシーと個人データの誤用に関するいくつかの疑問を提起する。
本稿では,予防接種データの検証と分析を行うブロックチェーンベースのアプリケーションを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 11:41:32 GMT)
Assisting Tibetan Students in Learning Quantum Mechanics via Mathematica [1.6] チベット人学生は主観的な学習感を持つ傾向があり、漢人学生(多国籍)はマテマティカの操作技術に重点を置いている。
また,チベットの学生と漢の学生は,MathematicaでQMを学習した後,時間に依存しないシュロディンガー方程式を限定的に改善することが示唆された。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 15:11:20 GMT)
Generative Modeling of Neural Dynamics via Latent Stochastic Differential Equations [1.5] 本稿では,生体神経系の計算モデル構築のためのフレームワークを提案する。
我々は、微分ドリフトと拡散関数を持つ結合微分方程式系を用いる。
これらのハイブリッドモデルは,刺激によって誘発される神経および行動応答の予測において,競争力を発揮することを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 09:36:03 GMT)
Voice Biomarker Analysis and Automated Severity Classification of Dysarthric Speech in a Multilingual Context [1.5] 運動性発声障害であるDysarthriaは、声質、発音、韻律に深刻な影響を与え、発話の可知性が低下し、生活の質が低下する。
本論文は,英語,韓国語,タミル語という3つの言語を解析し,多言語性難聴度分類法を提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 00:05:00 GMT)
Field-induced quantum interference of inelastic scattering in ultracold atomic collisions [1.5] 量子干渉のXploitingは、超低温非弾性散乱において重要な課題である。
種々の非弾性散乱チャネルから生じる2体損失率内における検出可能な量子干渉を実現する手法を提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 09:36:50 GMT)
Quantum thermalization of Quark-Gluon Plasma [1.4] 強い結合定数を持つクォークグルーオンプラズマにおける量子熱化の出現を示す。
熱化特性が劇的に異なるため, 熱化におけるトポロジカル真空の非自明な役割を観察する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 03:55:37 GMT)
QABISAR: Query-Article Bipartite Interactions for Statutory Article Retrieval [1.4] 法定項目検索のための新しいフレームワークであるQABISARを紹介する。
クエリと記事間の双方向のインタラクションを活用して、それらに固有のさまざまな側面をキャプチャします。
実世界のエキスパートアノテートデータセットに関する実験は、その効果を実証している。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 18:58:17 GMT)
MIMIC: Multimodal Islamophobic Meme Identification and Classification [1.3] 反イスラムヘイトスピーチは、文脈に依存した、修辞的なメッセージによって特徴付けられるミームの中に現れた。
この研究は、新しいデータセットを提示し、ミーム内の反イスラム憎悪を特定するために特別に調整されたViLT(Vision-and-Language Transformer)に基づく分類器を提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 05:44:01 GMT)
Rethinking Cognition: Morphological Info-Computation and the Embodied Paradigm in Life and Artificial Intelligence [1.1] 本研究の目的は,情報,計算,認知に関する現在の研究のより広い文脈に,ロレンツォ・マグナニス・エコ認知計算主義を配置することである。
我々は、認知を、物理的、化学的、生物学的領域にまたがる自己集合、自己組織化、自己ポエシスのプロセスによって駆動される、同時モルフォロジー計算の網としてモデル化する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 10:04:53 GMT)
Exploring Cognition through Morphological Info-Computational Framework [1.1] 情報と計算は、認知と分離的に関連付けられている。
本章では、自然を認識者のための計算構造として結びつける研究について論じる。
認知の具体化を理解することは、生物学、進化、知性理論、AI、ロボット工学、その他の分野において重要である。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 09:56:38 GMT)
The Forking Way: When TEEs Meet Consensus [1.1] 信頼された実行環境(TEE)とブロックチェーンを組み合わせるプラットフォームが増えている。
本稿では,現在のブロックチェーンソリューションがTEEをどのように統合しているか,フォーク攻撃に対してどの程度の安全かをシステム化する。
我々は、TEEとコンセンサスを結びつける4つの幅広い手段を特定し、それらの制限を分析し、治療の可能性について議論する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 07:04:29 GMT)
Comprehensive framework for evaluation of deep neural networks in detection and quantification of lymphoma from PET/CT images: clinical insights, pitfalls, and observer agreement analyses [1.0] 本研究はPET/CT画像からの自動リンパ腫分離における重要なギャップに対処する。
アウト・オブ・ディストリビューションテストを導入し、モデルの一般化可能性に関する懸念を提起する研究はほとんどない。
高い代謝活性を有する大強度病変に対して,ネットワークがより優れた性能を示すことを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 22:01:58 GMT)
Enhancing the Generalization Capability of Skin Lesion Classification Models with Active Domain Adaptation Methods [0.7] 自己教師付き学習(SSL)、教師なしドメイン適応(UDA)、アクティブドメイン適応(ADA)を組み合わせた皮膚病変分類モデルの一般化能力向上手法を提案する。
このアプローチの主なステップは、自然言語データセット上のSSL事前トレーニングモデルの選択、すべての利用可能な皮膚病変データセットに対するSSL再トレーニング、ラベル付きソースドメインデータ上のモデルの微調整、そして最後にADAメソッドの実装である。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 06:53:12 GMT)
Vastextures: Vast repository of textures and PBR materials extracted from real-world images using unsupervised methods [0.7] Vastexturesは50,000のテクスチャとPBR素材のリポジトリで、教師なしのプロセスを用いて現実世界の画像から抽出される。
天然画像から採取した2次元テクスチャと、これらのテクスチャから生成されたSVBRDF/PBR材料からなる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 00:19:01 GMT)
VideoSAVi: Self-Aligned Video Language Models without Human Supervision [0.7] VideoSAViは視覚言語モデル(VLM)のための新しい自己学習パイプラインである
広範囲のマニュアルアノテーションなしで独自のトレーニングデータを生成する。
VideoSAViは、複数のベンチマークで大幅に改善されている。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 00:33:05 GMT)
SelfPrompt: Autonomously Evaluating LLM Robustness via Domain-Constrained Knowledge Guidelines and Refined Adversarial Prompts [0.6] 本稿では,大規模言語モデル(LLM)のロバスト性を自律的に評価する新しいフレームワークを提案する。
本稿では,ドメイン制約付き知識グラフ三重項から記述文を生成し,敵対的プロンプトを定式化する。
この自己評価機構により、LCMは外部ベンチマークを必要とせずにその堅牢性を評価することができる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 10:58:53 GMT)
From Open Vocabulary to Open World: Teaching Vision Language Models to Detect Novel Objects [0.6] オープン語彙オブジェクト検出(OVD)に関する最近の研究により、非有界語彙によって定義されたオブジェクトの検出が可能になった。
OVDは'oracle'によって提供される正確なプロンプトに依存しており、シーンの知覚を駆動するといった重要なアプリケーションでの使用を制限する。
我々は,OVDモデルをオープンワールドで動作させるフレームワークを提案し,新しいオブジェクトを段階的に識別し,学習する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 10:23:18 GMT)
Quantum kernel learning Model constructed with small data [0.6] 我々は、小型データを用いて、画像検査における様々な異常を検出するために量子機械学習を使用することを目指している。
特定の量子カーネルに埋め込まれたSVMによる学習は、古典的なカーネルに比べてAUCの値が著しく高かった。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 12:12:58 GMT)
Large Language Models as Mirrors of Societal Moral Standards [0.6] 言語モデルは、限られた範囲において、様々な文化的文脈において道徳的規範を表現することができる。
本研究は,40か国以上の道徳的視点を包含するWVSとPEWという2つの調査から得られた情報を用いて,これらのモデルの有効性を評価する。
その結果、偏見は単言語モデルと多言語モデルの両方に存在することが示され、それらは通常、多様な文化の道徳的複雑さを正確に捉えるには不十分である。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 20:20:35 GMT)
LLMs as mirrors of societal moral standards: reflection of cultural divergence and agreement across ethical topics [0.6] 大規模言語モデル(LLM)は、そのパフォーマンス能力の最近の進歩により、様々な領域においてますます重要になっている。
本研究は,LLMが道徳的視点において,異文化間の差異や類似性を正確に反映しているかどうかを考察する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 20:39:42 GMT)
BERT or FastText? A Comparative Analysis of Contextual as well as Non-Contextual Embeddings [0.4] 埋め込みの選択は、NLPタスクのパフォーマンス向上に重要な役割を果たす。
本研究では,Marathi言語固有のNLP分類タスクに,コンテキストBERTベース,非コンテキストBERTベース,FastTextベースの様々な埋め込み技術が与える影響について検討する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 17:10:16 GMT)
Overcoming the Thermal-Noise Limit of Microwave Measurements by Pre-cooling with an Active Cold Load [0.3] 本稿では,マイクロ波空洞の電磁モードを占有する劣化熱光子の大部分が,測定を行う直前に除去する「アクティブ予冷却(APC)」法を提案する。
この負荷は商業用低雑音増幅器(LNA)の入力の形を取る。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 17:28:38 GMT)
ChainGuard: A Blockchain-based Authentication and Access Control Scheme for Distributed Networks [0.3] ChainGuardは、スマートコントラクトに基づいた、完全に分散化された認証とアクセス制御機構である。
当社のスキームは,複数の組織間のユーザインタラクションを同時にサポートし,セキュリティ,効率,透明性を向上します。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 05:38:53 GMT)
Computational Methods for Breast Cancer Molecular Profiling through Routine Histopathology: A Review [0.3] 近年の人工知能の進歩により、デジタル病理学は標的となる分子およびより広い眼生マーカーの病理像を解析できるようになった。
これらの技術は、通常のヘマトキシリンおよびエオシン染色画像から直接ゲノム、転写、プロテオミクス、代謝マーカーなどの様々なバイオマーカーを抽出する機能を提供する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 08:13:49 GMT)
Identifying Root Causes of Null Pointer Exceptions with Logical Inferences [0.2] 我々はNull Pointer Exceptions(NPE)のための新しい論理的フォールトローカライズ手法であるLogicFLを提案する。
ロジックプログラミングでは、LogicFLはヒューマン開発者の障害ローカライゼーションの推論プロセスを模倣し、欠陥コードやテスト実行に関する収集された事実を論理的に推論した後、NPEの原因を特定する。
Apache CommonsプロジェクトとDefects4Jベンチマークによる76のNPEバグの実証的な評価で、LogicFLは障害箇所を正確に特定し、67のバグの原因となる正確なコードフラグメントを特定した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 23:48:00 GMT)
SEAM: A Secure Automated and Maintainable Smart Contract Upgrade Framework [0.2] ダイヤモンドパターンを用いた標準ソリデーティ契約のアップグレード可能なバージョンへの変換を自動化する新しいフレームワークSEAMを提案する。
SEAMはアップグレードプロセスを単純化し、関数セレクタの衝突とストレージスロットの衝突という2つの主要な脆弱性に対処する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 05:43:59 GMT)
Quantum simulation of the phase transition of the massive Thirring model [0.2] QMETTSは、巨大なThiringモデルの相転移と熱力学特性を正確に再現することができる。
その結果,QMETTSはサイリングモデルの相転移と熱力学特性を正確に再現できることがわかった。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 13:10:16 GMT)
Collaborative Proof-of-Work: A Secure Dynamic Approach to Fair and Efficient Blockchain Mining [0.2] 本稿では,ネットワークの効率性と公平性を高めるために,新しい協調的協調作業(CPoW)マイニング手法を提案する。
従来の鉱業の中央集権化とエネルギー不足に対処することによって、この研究はより持続可能なブロックチェーンエコシステムに寄与する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 05:59:27 GMT)
STEVE-Audio: Expanding the Goal Conditioning Modalities of Embodied Agents in Minecraft [0.2] 本稿では,新しい入力モダリティからエージェントの潜在目標空間へのマッピングを学習することで,制御モダリティを拡張する手法を提案する。
我々は、マインクラフトの挑戦的な領域にアプローチを適用し、目標条件を拡張し、オーディオモダリティを含める。
結果として得られる音声条件エージェントは、元のテキスト条件および視覚条件エージェントと同等のレベルで実行することができる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 19:48:57 GMT)
Application of Analytical Hierarchical Process and its Variants on Remote Sensing Datasets [0.2] ガンガ川は地球上で最も重要な川流域の一つである。
大気汚染の重大な問題に直面しており、その脆弱性を効果的かつ標的とした修復努力のために評価することが不可欠である。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 11:24:03 GMT)
Fractal decompositions and tensor network representations of Bethe wavefunctions [0.0] 一般の$M$-粒子Beの1d格子上の波動関数の絡み合い構造について検討する。
我々は、Bethe波動関数がフラクタル多重粒子分解を受け入れることを示す。
我々はより大きな一般化されたベーテ波動関数のクラスを提唱した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 18:13:56 GMT)
Unmasking Trees for Tabular Data [0.0] 勾配型決定木を用いた表計算(および生成)の簡易な方法であるUnmaskingTreesを提案する。
条件生成サブプロブレムを解決するために,木分類器のバランス木に適合するBaltoBotを提案する。
従来の方法とは異なり、条件分布のパラメトリックな仮定は必要とせず、多重モーダル分布を持つ特徴を収容する。
我々はついに2つのアプローチをメタアルゴリズムとみなし、TabPFNを用いた文脈内学習に基づく生成モデリングを実証した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 04:36:57 GMT)
Towards Privacy-Preserving Medical Imaging: Federated Learning with Differential Privacy and Secure Aggregation Using a Modified ResNet Architecture [0.0] 本研究では,局所的な差分プライバシーとセキュアアグリゲーションを組み合わせたフェデレート学習フレームワークを提案する。
また、差分プライバシーに最適化されたResNetアーキテクチャであるDPResNetを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 05:52:29 GMT)
Thermal Vision: Pioneering Non-Invasive Temperature Tracking in Congested Spaces [0.0] サーマルカメラを用いた非侵襲温度推定に関する既存の研究は、主にスパース設定に焦点を当てている。
本研究では,サーマルカメラとエッジデバイスを組み合わせた非侵襲温度推定システムを提案する。
提案した顔検出モデルは, インデータセットとクロスデータセットの両方において, 84以上の印象的なmAPスコアを達成している。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 15:52:51 GMT)
Text Is Not All You Need: Multimodal Prompting Helps LLMs Understand Humor [0.0] ユーモアはしばしば多モーダルであり、意味を伝えるための音声的曖昧さ、リズム、タイミングに依存している。
そこで本研究では,TTSシステムを用いて生成したジョークのテキストと音声形式の両方をLLMで表現する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 06:49:31 GMT)
SPILDL: A Scalable and Parallel Inductive Learner in Description Logic [0.0] SPILDL は DL-Learner (DL を用いた ILP 学習の最先端) に基づいている
DLベースのILP学習者として、SPILDLは$mathcalALCQImathcal(D)$ DL言語をターゲットにしており、結合の解離として表現されたDL仮説を学習することができる。
SPILDLは、共有メモリと分散メモリの両方のアプローチを組み合わせたハイブリッド並列アプローチを採用している。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 14:33:37 GMT)
Recurrent Aggregators in Neural Algorithmic Reasoning [0.0] 我々は同変アグリゲーション関数をリカレントニューラルネットワークで置き換える。
我々のアプローチは、ノードが自然な順序付けを持つとき、適切に接地する。
RNARの顕著な成果は、HapsortとQuickselectタスクにおける最先端の結果である。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 15:07:43 GMT)
Reality of the Eigenvalues of the Hilbert-Pólya Hamiltonian [0.0] Hilbert-P'olya Conjecture に対してハミルトニアンを提案する。
我々は、変換されたハミルトニアンの固有函数が二乗可積分であること、そして決定的に、固有値が実であることを明確に示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 14:07:38 GMT)
Quench Spectroscopy for Dissipative and Non-Hermitian Quantum Lattice Models [0.0] 超流動相に閉じ込められた開ボース・ハッバード鎖の動力学を, 突然の大域的クエンチに導入した。
この散逸性量子格子モデルのクエンチ分光を行うために、観測可能なそれぞれのクエンチスペクトル関数を計算する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 01:24:11 GMT)
Quantum entanglement entropy and Tomonaga-Luttinger liquid to liquid transition in biquadratic spin-1 XY chain with rhombic single-ion anisotropy [0.0] 量子相転移は、ロンボリック単一イオン異方性を持つ2重四面体スピン-1$XY鎖で研究される。
3つのスピンネマティック相と2つの友長・ルッティンガー液相があり、中心電荷は$c = 1$である。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 09:16:58 GMT)
Quantum emitter interacting with a dispersive dielectric object: a model based on the modified Langevin noise formalism [0.0] その結果,エミッタは中温浴と散乱浴の2つの異なるボソニック浴に結合していることがわかった。
これら2つの浴からなる電磁環境を1つのボゾン浴に効果的に置き換えることのできる条件を同定する。
特に、中・散乱支援浴の初期状態が同じ温度の熱状態である場合、中・散乱支援のスペクトル密度の和に等しいスペクトル密度の単一ボソニック浴が元の電磁環境と同値であることが判明した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 07:27:02 GMT)
Quantum correlations under environmental decoherence [0.0] 量子エンタングルメントの進化といくつかの量子相関を、エンタングルメント、局所的な量子不確実性、測定によって引き起こされる非局所性を超えて検討する。
定常状態の量子相関は初期状態とは独立であり、低温の有限温度ではゼロではない。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 11:02:25 GMT)
Quantum Dynamics Happens Only on Paper: QBism's Account of Decoherence [0.0] QBismは長い間、量子状態、POVM要素、クラウス演算子、さらには同じ布から切り離されるユニタリ演算さえ認識してきた。
ファン・フラッセンの反射原理に基づく表現定理を提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 21:16:30 GMT)
Probing nonlocal correlations in magnetic rare-earth clusters [0.0] 希土類スピン錯体とその磁気特性について検討した。
本分析により, 微分コンダクタンスプロファイルにおける構造間の1対1対応が明らかとなった。
コンダクタンスプロファイルにおける個々のブレイディングパターンは、エンタングルメントエントロピーの段階的変化に対応している。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 03:43:30 GMT)
Position Paper: Model Access should be a Key Concern in AI Governance [0.0] 下流でのAIシステムのユースケース、メリット、リスクは、システムに与えられたアクセスと、誰へのアクセスに大きく依存します。
私たちは、組織や政府が責任あるエビデンスベースのアクセス決定を行うのを支援することに焦点を当てた、新たな分野であるモデルアクセスガバナンスに注目します。
私たちは、AI評価組織、フロンティアAI企業、政府、国際機関が経験的に主導されたアクセスガバナンスに関するコンセンサスを構築するのを支援するために、4つのレコメンデーションを作成しています。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 14:59:07 GMT)
Plasmon-polaritons on a single electron [0.0] この偏光演算子は、コヒーレント散乱過程における単一電子波パケットの誘電率を記述する。
外部電磁場の波長は、電子波パケットの典型的な変動スケールよりもはるかに小さい。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 10:00:46 GMT)
Patent-publication pairs for the detection of knowledge transfer from research to industry: reducing ambiguities with word embeddings and references [0.0] 我々は、特許を研究の経済的影響の代案として利用するために、出版と出版の両面を識別する。
当社の完全なデータ処理パイプラインは無償で利用可能です。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 21:58:44 GMT)
Partially factorized variational inference for high-dimensional mixed models [0.0] 変分推論は、特にベイズ的文脈において、そのような計算を行う一般的な方法である。
標準平均場変動推論は,高次元の後方不確かさを劇的に過小評価することを示した。
次に、平均場仮定を適切に緩和すると、不確実な定量化が高次元で悪化しない手法が導かれることを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 01:37:11 GMT)
Pairwise Discernment of AffectNet Expressions with ArcFace [0.0] 本研究は、顔の感情認識(FER)を通して人間の感情を認識するコンピュータを教えるための予備的なステップである。
その結果,同調的ドメイン伝達学習の価値,顔の感情パターンを学習する際のデータセットの不均衡による課題,FERタスクにおけるモデル性能を高めるためのペアワイズ学習の有効性が明らかになった。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 10:18:55 GMT)
Optomechanical system with nonlinear interactions: photon blockade, collapse and revival of optical oscillations [0.0] 光学系における光学場の平均振幅について検討した。
このようなシステムにおける光子遮断,崩壊,光発振の再生の効果を実現することができる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 17:50:04 GMT)
Multi-Class Abnormality Classification in Video Capsule Endoscopy Using Deep Learning [0.0] このレポートでは、Capsule Vision 2024 Challengeに対するTeam Seq2Cureのディープラーニングアプローチの概要を概説する。
コンボリューションニューラルネットワーク(CNN)とトランスフォーマーベースアーキテクチャのアンサンブルを利用して,ビデオカプセル内視鏡フレームの多クラス異常分類を行う。
提案手法は精度86.34パーセント,AUC-ROC平均スコア0.9908を検証セットで達成した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 11:58:37 GMT)
Multi-Agent Collaboration in Incident Response with Large Language Models [0.0] インシデント対応(IR)はサイバーセキュリティの重要な側面であり、サイバー攻撃を効果的に対処するために、迅速な意思決定と協調的な努力が必要である。
大きな言語モデル(LLM)をインテリジェントエージェントとして活用することは、IRシナリオにおけるコラボレーションと効率を高めるための新しいアプローチを提供する。
本稿では,Backdoors & Breaches フレームワークを用いた LLM ベースのマルチエージェントコラボレーションの適用について検討する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 03:12:26 GMT)
Leveraging Intermediate Neural Collapse with Simplex ETFs for Efficient Deep Neural Networks [0.0] ニューラルネットワークの最終層を単純なETFに制約することで、モデルの精度を犠牲にすることなくトレーニング可能なパラメータの数を削減できることを示す。
本稿では, 汎用フレームワークであるAdaptive-ETFと, トランスフォーマブロック内のフィードフォワード層に単純なETF制約を適用するETF-Transformerを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 16:44:55 GMT)
Late fusion ensembles for speech recognition on diverse input audio representations [0.0] 音声音声の多種多様な表現について検討し、E-Branchformerモデルの後期融合アンサンブルの性能に与える影響について検討する。
我々は、同等のテクニックでトレーニングされた最先端のモデルに対して、1%から14%$の改善が依然として達成可能であることを示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 10:19:24 GMT)
Large Language Models in Politics and Democracy: A Comprehensive Survey [0.0] 大規模言語モデル(LLM)は、政策作成、政治コミュニケーション、分析、ガバナンスなど、様々な分野に可能性を提供する。
LLMは、政治プロセスにおける効率性、傾倒性、意思決定を向上させる機会を提供する。
また、バイアス、透明性、説明責任に関する課題も提示する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 15:23:34 GMT)
Improving Vietnamese Legal Document Retrieval using Synthetic Data [0.0] 大きな注釈付きデータセットの不足は、特にベトナムの法律文書にとって大きな課題となっている。
本稿では,ベトナムの法律文に対する高品質で多様な合成クエリを生成するために,大規模言語モデルを活用した新しいアプローチを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 03:28:26 GMT)
HT-HEDL: High-Throughput Hypothesis Evaluation in Description Logic [0.0] High-Throughput hypothesis Evaluation in Description Logic (HT-HEDL) は帰納的論理プログラミング(ILP)学習者のための仮説評価エンジンである。
HT-HEDLは、仮説計算を改善するために、マルチコアCPUの計算能力とマルチGPUを集約する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 13:01:48 GMT)
G-RAG: Knowledge Expansion in Material Science [0.0] Graph RAGはグラフデータベースを統合して、検索プロセスを強化する。
文書のより詳細な表現を実現するために,エージェントベースの解析手法を実装した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 01:21:24 GMT)
Frequency-Resolved Simulations of Highly Entangled Biphoton States: Beyond the Single-Pair Approximation. II. Application to Entanglement-based Quantum Key Distribution [0.0] 両光子量子状態を用いた量子鍵分布(QKD)系の時間・周波数分解シミュレーションについて述べる。
結果は、キーレートと量子ビット誤り率の対応する測定値と一致することが示されている。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 20:20:50 GMT)
Frequency-Resolved Simulations of Highly Entangled Biphoton States: Beyond the Single-Pair Approximation. I. Theory [0.0] 両光子状態の検出確率の増大について,共同スペクトル振幅の次数の増加の観点から検討する。
この拡張により、高いスペクトル絡み合いを示す量子状態を含む効率的な時間または周波数分解数値シミュレーションが可能になる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 20:20:47 GMT)
Free and Customizable Code Documentation with LLMs: A Fine-Tuning Approach [0.0] 開発者がサポートツールとして利用できる,LLM(Big Language Model)ベースのアプリケーションを紹介します。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 08:38:18 GMT)
Floquet driven long-range interactions induce super-extensive scaling in quantum battery [0.0] フロッケ駆動に伴う長距離(LR)相互作用は、量子電池の性能を向上させることができる。
電力の超線形スケーリングは、横磁場と比較して相互作用の強度を増大させる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 18:10:59 GMT)
Finite-time quantum equilibration for continuous variables [0.0] 我々は、量子力学における平衡の理論を発展させた。
主に、量子力学が半群によって生成される場合、すなわちハミルトニアンが純粋に絶対連続スペクトルを持つような場合に焦点を当てる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 22:11:45 GMT)
Explorations in Self-Supervised Learning: Dataset Composition Testing for Object Classification [0.0] 対象分類のための自己教師付き学習(SSL)モデルの性能に及ぼす画像特性の異なるデータセットを用いたサンプリングと事前学習の影響について検討する。
低解像度画像では深度事前学習モデルの方が有効であるのに対し、RGB事前学習モデルは高解像度画像ではより優れていた。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 11:21:01 GMT)
Dependence of the induced vacuum energy of scalar matter in the background of an impenetrable magnetic tube on the coupling to the space-time curvature [0.0] 磁束を内包した有限厚さ管の背景における量子化荷電スカラー物質場の真空偏極を考察する。
一般化されたロビン境界条件では、全誘導真空エネルギーは平時時における結合$xi$に依存する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 21:01:23 GMT)
Corn Yield Prediction Model with Deep Neural Networks for Smallholder Farmer Decision Support System [0.0] 作物の収量予測は、気象変数と土壌変数の相互作用がないという仮定に基づいてモデル化されている。
本稿では、相互作用の存在を論じ、Kendall相関係数を用いて微細にモデル化することができる。
提案したトウモロコシ収量モデルの目的は、小作農が賢く知的に養殖できるようにすることである。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 08:43:03 GMT)
Construction of generalized samplets in Banach spaces [0.0] 我々は、点評価よりも、バナッハ空間の関数へのサンプルトの異なるステップを拡張する。
一般化されたサンプルト係数に対する抽象的な局所化結果を、標本トの支持とバナッハ空間要素の近似性に関して導出した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 20:14:37 GMT)
Coherence of Symmetry-Protected Rotational Qubits in Cold Polyatomic Molecules [0.0] 極性多原子分子は、回転状態の量子ビットを符号化する理想的なプラットフォームを提供するが、ほとんど探索されていない。
対称保護分子状態間の長寿命コヒーレンスを観測する。
その結果、観測された量子ビットは外部の電場の大きさに敏感であり、磁場にしか依存しない。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 11:43:44 GMT)
Clustering with Neural Network and Index [0.0] CNNI(Clustering with Neural Network and Index)と呼ばれる新しいモデルが導入されている。
CNNIはニューラルネットワークを使用してデータポイントをクラスタリングし、内部クラスタリング評価インデックスが損失関数として機能する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 04:02:40 GMT)
CineXDrama: Relevance Detection and Sentiment Analysis of Bangla YouTube Comments on Movie-Drama using Transformers: Insights from Interpretability Tool [0.0] 本稿では,まずコメントの関連性を評価し,関連するものに対する感情分析を行うシステムを提案する。
手作業で収集した14,000のコメントと前処理されたコメントのデータセットを導入し、関連性(関連性または非関連性)と感情(肯定的または否定的)に注釈を付ける。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 21:35:43 GMT)
Bridging Fairness Gaps: A (Conditional) Distance Covariance Perspective in Fairness Learning [0.0] 距離共分散統計を選択的に利用することにより、統計的観点から公平性ギャップを橋渡しする。
我々は、機械学習プロセスにサンプル(条件付き)距離共分散を管理可能なペナルティ項として組み込むことにより、公平性を高める。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 08:01:19 GMT)
Boundaries, frames and gravitational limits to objectivity [0.0] 重力物理学におけるエッジモードと境界電荷、古典的および量子重力の力学、量子参照フレームの3つの異なる展開に焦点をあてる。
これらの研究の方向性は、実際には複数の方法で関連付けられており、同じ研究プログラムの異なる側面と見なすことができる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 22:53:40 GMT)
Binary Feature Mask Optimization for Feature Selection [0.0] モデルの結果を考慮した特徴を選択する新しいフレームワークを提案する。
機械学習モデルの予測を用いてマスク演算子を得る。
実生活データセットの大幅な性能向上を示す。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 09:09:53 GMT)
Bilinear Convolution Decomposition for Causal RL Interpretability [0.0] 強化学習(RL)モデルを解釈する試みは、しばしば帰属や探究のような高度な技術に依存している。
本研究では、畳み込みニューラルネットワーク(ConvNets)の非線形性を双線型変種に置き換え、これらの制限に対処可能なモデルのクラスを作成することを提案する。
モデルフリー強化学習環境では,バイリニアモデルの変形が相容れないことを示し,ProcGen環境上での並べ比較を行う。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 19:32:04 GMT)
BAFPN: Bi directional alignment of features to improve localization accuracy [0.0] 現在の視覚モデルは、しばしば多スケール情報を抽出するために特徴ピラミッドを利用する。
Feature Pyramid Network (FPN) は、最も広く使われている古典建築の一つである。
従来のFPNは、グローバルスケールでの空間的不整合に完全に対処できず、オブジェクトの高精度なローカライゼーションにおいて、最適以下のパフォーマンスをもたらす。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 04:44:06 GMT)
Automatic answering of scientific questions using the FACTS-V1 framework: New methods in research to increase efficiency through the use of AI [0.0] 本稿では FACTS-V1 (Filtering and Analysis of Content in Textual Sources) フレームワークのプロトタイプについて述べる。
このアプリケーションの助けを借りて、多数の科学論文を自動的に抽出し、分析し、オープンアクセス文書サーバから解釈することができる。
このフレームワークの目的は、既存のデータに基づいた将来の科学的質問に対するレコメンデーションを提供することである。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 18:55:39 GMT)
ARChef: An iOS-Based Augmented Reality Cooking Assistant Powered by Multimodal Gemini LLM [0.0] 本稿では,ARとコンピュータビジョン(CV)を調理プロセスに統合したiOSアプリケーションのプロトタイプを提案する。
我々は、Googleのジェミニ大言語モデル(LLM)を利用して、カメラの視野に基づいて成分を特定し、栄養情報を使ってレシピの選択を生成する。
ユーザーは食事の好みを入力し、各食事の格付けをすることで、食事の提案をパーソナライズすることができる。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 00:52:51 GMT)
AI Safety Frameworks Should Include Procedures for Model Access Decisions [0.0] ダウンストリームのユースケース、メリット、リスクは、モデルにどのようなアクセスが提供されるかに大きく依存します。
既存の安全フレームワークとAI開発者利用ポリシーは、与えられたモデルによって引き起こされるリスクが、与えられたオーディエンスに提供するアクセスのレベルに依存することを認識している。
本稿では、モデルアクセスに関する決定を行うための透明な手順を概説することにより、フロンティアAI企業が既存の安全フレームワークの上に構築することを提案する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 13:41:44 GMT)
A Quantum Computing Approach to Simulating Corrosion Inhibition [0.0] 本研究は,アルミニウム表面の腐食抑制機構を解明するためのハイブリッド量子古典計算法の体系的実装を示す。
本稿では,密度汎関数理論(DFT)と量子アルゴリズムを有効空間埋め込み方式で組み合わせた統合ワークフローを提案する。
古典的DFT計算に対するベンチマークによるADAPT-VQEアルゴリズムは,1,2,4-トリアゾールと1,2,4-トリアゾール-3-チオールの結合エネルギー-0.386 eVと-1.279 eVを達成する。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 20:03:38 GMT)
A Comprehensive Survey on Dynamic Software Updating Techniques in IoTs [0.0] 本稿では、DSUのエネルギー効率の向上、運用耐久性の向上、IoT環境におけるセキュリティ強化における重要な機能を強調する。
従来の方法からオーバー・ザ・エア(Over-the-Air)の更新やコンテナベースのソリューションといった高度なプラクティスまで、DSUの基本的アプローチとメカニズムについて詳しく説明している。
本研究の目的は、DSU戦略の今後の発展をガイドし、IoTデバイスのレジリエンス、機能、持続可能性を高めることである。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 03:35:52 GMT)
3D-PDR Orion dataset and NeuralPDR: Neural Differential Equations for Photodissociation Regions [0.0] オリオンバーにおける光解離領域(PDR)のシミュレーションデータセットを提案する。
3D-PDRでシミュレートした初期条件の異なる8192モデルのデータセットを提供する。
次に、Augmented Neural Ordinary Differential Equation (ANODE)ベースのモデルに焦点を当て、異なるアーキテクチャをベンチマークする。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 10:30:34 GMT)
"Give me the code" -- Log Analysis of First-Year CS Students' Interactions With GPT [0.0] 本稿では,69人の新入生がプロジェクト課題の中で特定のプログラミング問題を解くために用いたプロンプトを解析する。
本研究は,未解決のプロンプト技術を用いているにもかかわらず,ほとんどの学生がGPTをうまく活用できたことを示唆している。
学生の半数は、複数のGPT生成ソリューションから選択する際の判断を訓練する能力を示した。
論文参考訳(メタデータ) (Sun, 01 Dec 2024 19:02:28 GMT)