Forest2Seq: Revitalizing Order Prior for Sequential Indoor Scene Synthesis [109.5] 本研究では,屋内シーンの合成を順序認識型シーケンシャル学習問題として定式化するフレームワークであるフォレスト2Seqを提案する。
クラスタリングに基づくアルゴリズムと幅優先のアルゴリズムを用いることで、フォレスト2セックは意味のある順序付けを導き、トランスフォーマーを使用してリアルな3Dシーンを自動回帰的に生成する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 14:32:53 GMT)
Re-ReST: Reflection-Reinforced Self-Training for Language Agents [101.2] 言語エージェントにおける自己学習は、エージェント自体から監督を生成することができる。
リフレクション強化自己学習(Reflection-Reinforced Self-Training, Re-ReST)は, テキストレフレクタを用いて低品質な試料を精製する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 05:56:23 GMT)
WorkArena++: Towards Compositional Planning and Reasoning-based Common Knowledge Work Tasks [86.0] 大型言語モデル(LLM)は人間のような知性を模倣することができる。
WorkArena++は、Webエージェントの計画、問題解決、論理的/論理的推論、検索、コンテキスト的理解能力を評価するように設計されている。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 07:15:49 GMT)
Mind the Interference: Retaining Pre-trained Knowledge in Parameter Efficient Continual Learning of Vision-Language Models [79.3] ドメインクラスのインクリメンタル学習は現実的だが、継続的な学習シナリオである。
これらの多様なタスクに対処するために、事前訓練されたビジョンランゲージモデル(VLM)を導入し、その強力な一般化性を実現する。
事前訓練されたVLMにエンコードされた知識は、新しいタスクに適応する際に妨げられ、固有のゼロショット能力を損なう。
既存の手法では、膨大なオーバーヘッドを必要とする余分なデータセットに知識蒸留でVLMをチューニングすることで、この問題に対処している。
我々は、事前学習した知識を保持できるDIKI(Distributed-Aware Interference-free Knowledge Integration)フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 12:19:37 GMT)
Unlocking Textual and Visual Wisdom: Open-Vocabulary 3D Object Detection Enhanced by Comprehensive Guidance from Text and Image [70.0] Open-vocabulary 3D object detection (OV-3DDet) は、新しい3Dシーン内において、目に見えないものの両方をローカライズし、認識することを目的としている。
視覚基盤モデルを利用して、3Dシーンにおける新しいクラスを発見するための画像的ガイダンスを提供する。
オープン語彙の3Dオブジェクト検出における基礎モデルの可能性を明らかにするとともに,精度と一般化の大幅な向上を示す。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 04:50:04 GMT)
Multi-branch Collaborative Learning Network for 3D Visual Grounding [66.7] 3D参照表現理解(3DREC)とセグメンテーション(3DRES)は重なり合う目標を持ち、コラボレーションの可能性を示している。
我々は,3DRECタスクと3DRESタスクに個別のブランチを採用することで,各タスクの特定の情報を学ぶ能力が向上すると主張している。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 13:27:14 GMT)
A Survey of Models for Cognitive Diagnosis: New Developments and Future Directions [66.4] 本研究の目的は,認知診断の現在のモデルについて,機械学習を用いた新たな展開に注目した調査を行うことである。
モデル構造,パラメータ推定アルゴリズム,モデル評価方法,適用例を比較して,認知診断モデルの最近の傾向を概観する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 18:02:00 GMT)
V-IRL: Grounding Virtual Intelligence in Real Life [65.9] V-IRLは、エージェントが仮想的で現実的な環境で現実世界と対話することを可能にするプラットフォームである。
私たちのプラットフォームは、様々な実践的なタスクを達成できるエージェントを開発するための遊び場として役立ちます。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 07:00:42 GMT)
Larimar: Large Language Models with Episodic Memory Control [62.7] Larimarは、分散エピソードメモリで大規模言語モデルを拡張するための、脳にインスパイアされたアーキテクチャである。
複数のファクト編集ベンチマークの実験結果は、Larimarが最も競争力のあるベースラインに匹敵する精度を達成したことを示している。
本稿では,Larimarを用いた選択的事実認識,情報漏洩防止,入力コンテキスト長の一般化のためのメカニズムを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 00:51:44 GMT)
Exploring Phrase-Level Grounding with Text-to-Image Diffusion Model [61.4] 本稿では,DiffPNGフレームワークについて紹介する。DiffPNGフレームワークは,プロセスを局所化,分節化,分節化の一連のステップに分解することで,分節化のための拡散のアーキテクチャを活用する。
PNGデータセットを用いた実験により, ゼロショットPNGタスク設定において, DiffPNGが強い性能を発揮することが示された。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 13:06:34 GMT)
InstructIR: High-Quality Image Restoration Following Human Instructions [61.2] 本稿では,人間の手書きによる画像復元モデルを導出する手法を提案する。
InstructIRという手法は、いくつかの修復作業において最先端の結果を得る。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 16:34:45 GMT)
Language Models Encode Collaborative Signals in Recommendation [57.9] 先進的なLM表現から線形にマッピングされた項目表現は、より優れたレコメンデーション性能が得られることを示す。
これらの知見に触発され,AlphaRecという名前のシンプルかつ効果的な協調フィルタリング(CF)モデルを提案する。
AlphaRecは、多層パーセプトロン(MLP)、グラフ畳み込み、コントラスト学習(CL)損失関数の3つの主要コンポーネントで構成されている。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 17:05:24 GMT)
Hierarchical Temporal Context Learning for Camera-based Semantic Scene Completion [57.2] カメラによるセマンティックシーンの補完を改善するための,新たな時間的文脈学習パラダイムであるHTCLを提案する。
提案手法は,Semantic KITTIベンチマークで1st$をランク付けし,mIoUの点でLiDARベースの手法を超えている。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 05:15:40 GMT)
DECIDER: A Dual-System Rule-Controllable Decoding Framework for Language Generation [57.1] 制約付き復号法は,事前学習言語モデル(PLM)が生成するテキストの意味やスタイルを,推論中に特定のターゲット語を用いて制御することを目的としている。
我々は, PLM を制御するためのタスクの完了方法に関するルールをプログラムできる新しい復号化フレームワーク DECIDER を提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 15:32:31 GMT)
See Further for Parameter Efficient Fine-tuning by Standing on the Shoulders of Decomposition [56.9] パラメータ効率の細かいチューニング(PEFT)は、パラメータの選択したサブセットを最適化し、残りを固定し、計算とストレージのオーバーヘッドを大幅に削減することに焦点を当てている。
分解の観点からそれらを分離することで、すべてのアプローチを統一する第一歩を踏み出します。
本稿では,PEFT技術の性能向上を目的とした,単純かつ効果的なフレームワークとともに,新しい2つのPEFT手法を提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 15:44:42 GMT)
HiDe-PET: Continual Learning via Hierarchical Decomposition of Parameter-Efficient Tuning [55.9] 予備学習モデル(PTM)とパラメータ効率チューニング(PET)を組み合わせた連続学習(CL)統合フレームワークを提案する。
タスク固有知識とタスク共有知識を取り入れることで目的を明示的に最適化する革新的な手法である階層分解PET(HiDe-PET)を提案する。
提案手法は,近年の強いベースラインの幅広いスペクトルに対して,極めて優れた性能を示す。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 01:50:25 GMT)
Iterative Nash Policy Optimization: Aligning LLMs with General Preferences via No-Regret Learning [55.7] 我々は,新しいアルゴリズム,反復的ナッシュポリシー最適化(INPO)を提案する。
従来の方法とは異なり、INPOは個々の応答に対する期待される勝利率を推定する必要性を回避している。
LLaMA-3-8BベースのSFTモデルで、INPOはAlpacaEval 2.0で41.5%の勝利率、Arena-Hardで38.3%の勝利率を達成した。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 09:51:26 GMT)
Training Task Experts through Retrieval Based Distillation [55.5] ReBase(Retrieval Based Distillation)は、まずリッチなオンラインソースからデータを抽出し、それをドメイン固有のデータに変換する手法である。
SQADは最大7.8%,MNLIは1.37%,BigBench-Hardは1.94%向上した。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 18:27:59 GMT)
Multimodal Prompt Learning with Missing Modalities for Sentiment Analysis and Emotion Recognition [52.5] 本稿では,欠落したモダリティの問題に対処するために,即時学習を用いた新しいマルチモーダルトランスフォーマーフレームワークを提案する。
提案手法では,生成的プロンプト,欠信号プロンプト,欠信号プロンプトの3種類のプロンプトを導入している。
迅速な学習を通じて、トレーニング可能なパラメータの数を大幅に削減する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 13:55:56 GMT)
Expert Proximity as Surrogate Rewards for Single Demonstration Imitation Learning [52.0] IL(Single-demonstration mimicion Learning)は、複数の専門家による実演の取得がコストのかかる、あるいは実現不可能な実世界のアプリケーションに対して、実践的なアプローチである。
典型的なIL設定とは対照的に、シングルデモレーションILは1つの専門家軌道のみにアクセスするエージェントを含む。
本稿では, この設定におけるスパース報酬信号の問題を強調し, 提案手法であるTransition Discriminator-based IL (TDIL) を用いてこの問題を軽減することを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 06:51:03 GMT)
A Survey on 3D Gaussian Splatting [52.0] 3D Gaussian splatting (GS) は、明示的なラディアンス場とコンピュータグラフィックスの領域において、トランスフォーメーション技術として登場した。
本稿では,3D GSの領域における最近の発展と重要な貢献について,初めて体系的に概説する。
前例のないレンダリング速度を実現することで、3D GSは、仮想現実からインタラクティブメディアなど、数多くのアプリケーションを開くことができる。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 11:18:33 GMT)
DIALECTBENCH: A NLP Benchmark for Dialects, Varieties, and Closely-Related Languages [49.4] DIALECTBENCHは,NLPの品種に対する大規模ベンチマークとして初めて提案される。
これにより、異なる言語でNLPシステムの性能を総合的に評価することができる。
標準言語と非標準言語間の性能格差の相当な証拠を提供する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 18:21:30 GMT)
Personalized Language Modeling from Personalized Human Feedback [49.3] 人間のフィードバックからの強化学習(Reinforcement Learning from Human Feedback, RLHF)は、人間の好みに合わせて大きな言語モデルを微調整するために一般的に用いられる。
本研究では,パーソナライズされた言語モデルを構築する手法を開発することにより,この問題に対処することを目的とする。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 19:31:21 GMT)
Large Language Model as an Assignment Evaluator: Insights, Feedback, and Challenges in a 1000+ Student Course [49.3] 大規模言語モデル(LLM)による自動評価が現実世界の教室で適用可能かどうかは不明である。
本報告では,1028人の大学生を対象に,GPT-4を自動課題評価装置として利用する方法について述べる。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 00:17:24 GMT)
CosyVoice: A Scalable Multilingual Zero-shot Text-to-speech Synthesizer based on Supervised Semantic Tokens [48.7] 本稿では, ベクトル量子化をエンコーダに挿入することにより, 多言語音声認識モデルから導出される, 教師付きセマンティックトークンを用いた音声表現を提案する。
トークンをベースとした拡張性のあるゼロショットTSシンセサイザーであるCosyVoiceは,テキスト・ツー・ツー・ケン生成のためのLLMと,トークン・ツー・音声合成のための条件付きフローマッチングモデルから構成される。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 15:16:19 GMT)
Just read twice: closing the recall gap for recurrent language models [41.9] 情報リコールの硬さは,集合不整合性と呼ばれる問題の硬さに還元されることを示す。
本稿では,JRT-Promptを提案する。
また、プロセスプロンプトに非因果プレフィックス-線形アテンションを使用し、99%のトランスフォーマー品質を提供するJRT-RNNを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 19:55:09 GMT)
SmurfCat at PAN 2024 TextDetox: Alignment of Multilingual Transformers for Text Detoxification [41.9] 本稿では,SmurfCatチームのPAN-2024コンペティションにおける多言語テキストの解法を提案する。
機械翻訳によるデータ拡張と特別なフィルタリング手法を用いて,テキストのデトックス化のための追加の多言語並列データセットを収集した。
テキストデトキシフィケーションタスクにおいて,mT0 や Aya などの多言語列列列列モデルを微調整した。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 17:19:34 GMT)
EventGround: Narrative Reasoning by Grounding to Eventuality-centric Knowledge Graphs [41.9] 本研究では,事象中心の知識グラフに自由文を接地する問題に対処するため,EventGroundと呼ばれる初期包括的フレームワークを提案する。
これらの問題に対処するために、単純で効果的な解析と部分的な情報抽出方法を提案する。
基礎知識を取り入れた我々の枠組みは、解釈可能な証拠を提供しながら最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 04:37:32 GMT)
SPO: Sequential Monte Carlo Policy Optimisation [41.5] SPO:Sequential Monte Carlo Policy optimizationを紹介する。
我々は,SPOがロバストな政策改善と効率的なスケーリング特性を提供することを示した。
モデルフリーおよびモデルベースラインと比較して,統計的に有意な性能向上を示す。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 09:48:13 GMT)
Aligned Unsupervised Pretraining of Object Detectors with Self-training [41.0] 物体検出器の教師なし事前訓練は、近年、物体検出器訓練の重要な要素となっている。
本稿では、この問題を緩和し、3つの単純かつ重要な要素からなるフレームワークを提案する。
当社の戦略は,スクラッチ(背骨を含む)からの事前トレーニングも可能であり,COCOのような複雑な画像にも適用可能であることを示す。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 10:46:52 GMT)
MenuCraft: Interactive Menu System Design with Large Language Models [40.8] ユーザインタフェースのためのメニューシステム設計は多くの設計オプションと様々なヒューマンファクターを含む課題である。
大規模な言語モデルは、事前学習した知識を使ってメニューシステムの設計と精巧化に役立てることができる。
我々は、メニューデザインのためのAI支援デザイナであるMenuCraftを提案し、デザイナと対話システムによるメニューデザインを可能にする。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 01:21:07 GMT)
Diffusion as Sound Propagation: Physics-inspired Model for Ultrasound Image Generation [40.4] 本稿では,物理に基づく拡散モデルを導入することにより,生成されたUS画像の品質を向上させる新しい手法を提案する。
提案モデルは超音波画像における音波伝搬の自然な挙動を模倣する米国固有のスケジューラスキームを取り入れたものである。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 16:09:20 GMT)
CLIMB: A Benchmark of Clinical Bias in Large Language Models [39.8] 大規模言語モデル(LLM)は、臨床的な意思決定にますます応用されている。
バイアスを示す可能性は、臨床の株式に重大なリスクをもたらす。
現在、LSMにおけるそのような臨床バイアスを体系的に評価するベンチマークが欠如している。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 03:41:51 GMT)
Replication in Visual Diffusion Models: A Survey and Outlook [39.2] 視覚拡散モデルにおける再現性の最初の包括的なレビューを提供する。
我々は既存の研究を分析して、この現象を明らかにし、理解し、緩和する。
多様な研究から得られた知見により,AI技術と社会的善との交わりを深く理解した研究者や実践者を育成することを目的とする。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 06:39:16 GMT)
Physics-Informed Neural Networks for Dynamic Process Operations with Limited Physical Knowledge and Data [38.4] 化学工学では、プロセスデータを取得するのが高価であり、複雑な現象を完全にモデル化することは困難である。
特に,直接観測データも方程式も利用できない状態の推定に着目する。
PINNは、測定されていない状態を妥当な精度で推測でき、純粋にデータ駆動モデルよりも低データシナリオでよりよく一般化できる。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 11:30:50 GMT)
Offboard Occupancy Refinement with Hybrid Propagation for Autonomous Driving [37.7] 3Dセマンティックシーンコンプリート(3D Semantic Scene Completion, SSC)は、コンピュータビジョンにおいて重要な課題である。
OccFinerは,視覚による占有率予測の精度を高めるために設計された,新しいオフボードフレームワークである。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 13:29:28 GMT)
Cross-Modal Conditioned Reconstruction for Language-guided Medical Image Segmentation [35.1] 本稿では,言語誘導医療画像(RecLMIS)を提案する。
実験では、公開されているMosMedData+データセット上で、LViTを3.74%のmIoUで上回り、RecLMISの優位性を実証した。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 17:57:36 GMT)
The infrastructure powering IBM's Gen AI model development [34.8] IBMは、生成的AIモデル開発を支えるハイブリッドクラウドインフラストラクチャについて説明している。
Velaは、IBM Cloudに直接統合されたAI最適化スーパーコンピュータ機能である。
Blue Velaは大規模で汎用的なオンプレミスホスティング環境である。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 18:39:33 GMT)
Bidirectional Uncertainty-Based Active Learning for Open Set Annotation [28.6] オープンセットのシナリオにおけるアクティブな学習は、最も価値のある例を特定するという、新たな課題を示している。
従来の手法では、信頼性の低い情報的事例の選択が優先されていた。
最近の手法は、最も可能性の高い既知の例を好んでいる。
双方向不確実性に基づくアクティブラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 03:48:33 GMT)
Open Ad Hoc Teamwork with Cooperative Game Theory [28.6] アドホックなチームワークは、事前の調整や共同トレーニングなしに、チームメイトと協力するエージェントの設計を必要とする、困難な問題を引き起こします。
有望な解決策の1つは、制限のない数のエージェントを扱うためにグラフニューラルネットワークの一般化性を活用することである。
本稿では,ゲームフレームワークをベースとしたCIAOという新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 12:43:35 GMT)
Collective Innovation in Groups of Large Language Models [28.5] 我々は,人間向けに開発されたクリエイティブビデオゲームLittle Alchemy 2をプレイするLarge Language Models (LLMs)について研究した。
本研究では,その行動に関する情報を共有するLLMのグループについて検討し,集団的パフォーマンスに対する社会的接続性の影響に着目した。
我々の研究は、ジェネレーティブ人工知能アルゴリズムと人間が互いに革新するにつれて、ますます関連性が高まっている集団イノベーションの今後の研究の機会と課題を明らかにします。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 13:59:46 GMT)
Fast Proxy Experiment Design for Causal Effect Identification [27.9] 因果効果を推定する2つのアプローチは、観察的および実験的(ランダム化)な研究である。
対象変数の直接実験は、コストがかかりすぎるか、実行不可能である可能性がある。
プロキシ実験は、メインターゲットと比較して、介入するコストの低い変数に対して実施される。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 11:09:38 GMT)
Mind the Model, Not the Agent: The Primacy Bias in Model-based RL [27.4] モデルフリー強化学習(MFRL)におけるプライマリシーバイアス(プライマリシーバイアス)とは、エージェントが早期データに適合し、新しいデータから学習する能力を失う傾向をいう。
これまでの研究では、エージェントのパラメータをリセットするといった単純な手法を用いることで、MFRLの優劣バイアスを大幅に緩和できることが示されている。
本研究は,モデルベース強化学習(MBRL)におけるプライマリシーバイアスの調査に焦点をあてる。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 14:32:02 GMT)
Emilia: An Extensive, Multilingual, and Diverse Speech Dataset for Large-Scale Speech Generation [26.6] エミリア (Emilia) は、第1の多言語音声生成データセットである。
Emilia-Pipeは、Wildの音声データを高品質なトレーニングデータに変換するために設計された、最初のオープンソースの前処理パイプラインである。
Emiliaのスケールアップを容易にするため、オープンソースのパイプラインであるEmilia-Pipeは、数分間のモデルトレーニングに備えた1時間の生音声データを処理できる。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 13:24:54 GMT)
SMART: Submodular Data Mixture Strategy for Instruction Tuning [26.2] SMART(Submodular Data Mixture strAtegy for InstRuction Tuning)を新たなデータ混合戦略として紹介する。
微調整の予算が与えられると、SMARTはタスク間で予算を再分配し、各タスクから非冗長サンプルを選択する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 09:58:08 GMT)
Enhancing Hallucination Detection through Perturbation-Based Synthetic Data Generation in System Responses [25.7] 本稿では,システム応答を書き換えることで,忠実な出力と幻覚的な出力の両方を自動的に生成する手法を提案する。
実験結果から、我々の生成したデータセットを微調整したT5ベースモデルが、最先端のゼロショット検出器を超越していることが判明した。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 19:19:32 GMT)
Model-agnostic meta-learners for estimating heterogeneous treatment effects over time [24.9] パーソナライズド医療などの多くの分野において、時間とともにヘテロジニアス治療効果(HTE)を推定することが重要である。
モデルに依存しないメタラーナーをいくつか提案し、任意の機械学習モデルと組み合わせて使用することができる。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 07:07:48 GMT)
Medical Unlearnable Examples: Securing Medical Data from Unauthorized Training via Sparsity-Aware Local Masking [24.9] 商用AIモデルのトレーニングのような、認可されていない使用の恐れは、研究者が貴重なデータセットを共有するのを妨げる。
本研究では,画像全体ではなく重要な画素領域を選択的に摂動するSALM法を提案する。
実験により,SALMは,異なるモデルの不正なトレーニングを効果的に防止し,従来のSoTAデータ保護手法より優れていることが示された。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 13:36:22 GMT)
An Improved Method for Personalizing Diffusion Models [23.2] 拡散モデルは印象的な画像生成能力を示している。
テキストインバージョンやドリームブートのようなパーソナライズされたアプローチは、特定の画像を用いたモデルのパーソナライゼーションを強化する。
提案手法は,新たな情報統合におけるモデルの本来の知識を維持することを目的としている。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 09:52:04 GMT)
CoLeaF: A Contrastive-Collaborative Learning Framework for Weakly Supervised Audio-Visual Video Parsing [23.1] 弱教師付き音声視覚ビデオ解析手法は,ビデオレベルラベルのみを用いて,可聴性のみ,可視性のみ,可視性のみ,可聴性のみを検出することを目的としている。
埋め込み空間におけるクロスモーダルコンテキストの統合を最適化する新しい学習フレームワークであるCoLeaFを提案する。
我々の実験は、CoLeaFがデータセット上で平均1.9%と2.4%のFスコアで最先端の結果を大幅に改善することを示した。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 11:03:00 GMT)
To Generate or Not? Safety-Driven Unlearned Diffusion Models Are Still Easy To Generate Unsafe Images ... For Now [22.8] 拡散モデル(DM)は、現実的で複雑な画像の生成に革命をもたらした。
DMはまた、有害なコンテンツの生成やデータ著作権の侵害など、潜在的な安全上の危険性も導入している。
安全駆動の未学習技術の発展にもかかわらず、その有効性に対する疑念は続いている。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 23:10:59 GMT)
Self-Paced Sample Selection for Barely-Supervised Medical Image Segmentation [22.7] 画像登録によって生成された擬似ラベルには大きなノイズが伴う。
医用画像セグメンテーションのためのセルフペーストサンプル選択フレームワーク(SPSS)を提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 03:36:23 GMT)
$\textbf{S}^2$IP-LLM: Semantic Space Informed Prompt Learning with LLM for Time Series Forecasting [21.9] 本稿では,LLM(S2$IP-LLM)を用いたセマンティック空間インフォームドプロンプト学習を提案し,事前学習された意味空間と時系列埋め込み空間とを整合させる。
提案した$S2$IP-LLMは,最先端のベースラインよりも優れた予測性能が得られることを示す。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 19:14:34 GMT)
Does DetectGPT Fully Utilize Perturbation? Bridging Selective Perturbation to Fine-tuned Contrastive Learning Detector would be Better [21.9] 選択的摂動の対照的な学習により,新しい微調整検出器Pecolaを提案する。
実験の結果、ペコラは4つの公開データセットで平均1.20%の精度で最先端のSOTA(State-of-the-art)を上回っている。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 07:38:05 GMT)
Spatial-Temporal Large Language Model for Traffic Prediction [21.7] 交通予測のための時空間大言語モデル(ST-LLM)を提案する。
ST-LLMでは,各位置の時間ステップをトークンとして定義し,空間的位置とグローバルな時間的パターンを学習するための空間的時間的埋め込みを設計する。
実トラフィックデータセットの実験において、ST-LLMは最先端のモデルより優れた空間時空間学習器である。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 23:57:29 GMT)
Learning graph geometry and topology using dynamical systems based message-passing [21.6] 本稿では,グラフ力学の表現力に基づいて構築されたGNNのメッセージパッシングパラダイムであるDYMAGを紹介する。
DYMAGは、熱と波動の方程式に基づく複雑なグラフ力学と、カオス解を持つより複雑な方程式を利用する。
我々はDYMAGがErd"os-Renyiとブロックランダムグラフの生成パラメータを復元する際の優れた性能を実証した。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 23:08:05 GMT)
G-DIG: Towards Gradient-based Diverse and High-quality Instruction Data Selection for Machine Translation [21.5] 本稿では,機械翻訳のための高品質かつ多様な命令微調整データを自動的に選択する,勾配に基づく新しい手法を提案する。
私たちの重要なイノベーションは、個々のトレーニング例がトレーニング中にモデルにどのように影響するかを分析することです。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 08:16:28 GMT)
VideoCoT: A Video Chain-of-Thought Dataset with Active Annotation Tool [21.2] 我々は,能動的学習パラダイムの下で,機械と人間の専門家を組み合わせた自動アノテーションツールを開発した。
MLLMの複雑な推論能力を最大化するために,CoTを利用して収集したデータセットに基づくベンチマークを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 13:10:23 GMT)
PTaRL: Prototype-based Tabular Representation Learning via Space Calibration [21.0] タブラルデータは、医療、エンジニアリング、金融など、さまざまな現実世界の分野において、主に重要な役割を担っている。
近年のディープラーニングの成功により、ディープネットワーク(Transformer、ResNetなど)に基づく機械学習(ML)メソッドの多くは、ベンチマーク上での競合的なパフォーマンスを実現している。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 13:32:03 GMT)
Stability and Generalization for Stochastic Recursive Momentum-based Algorithms for (Strongly-)Convex One to $K$-Level Stochastic Optimizations [20.8] STORMベースのアルゴリズムは、K$レベル(K geq 3$)の最適化問題を解決するために広く開発されている。
本稿では,STORMに基づく3つの代表的なアルゴリズムを包括的に分析する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 07:07:04 GMT)
DTR: A Unified Deep Tensor Representation Framework for Multimedia Data Recovery [20.3] 本稿では,Deep Latent生成モジュールとDeep Transformモジュールを組み合わせた統合Deep Representationフレームワークを提案する。
提案手法は, 定量化と定性化の両面において, 特に細部回復において, 最先端の手法と比較して優れた性能を実現する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 05:44:40 GMT)
Strategy-Proof Auctions through Conformal Prediction [19.8] 厳密な統計的保証で戦略の安全性を達成するための新しいアプローチを導入する。
提案手法の主な特徴は, (i) 試行時間における戦略保護性違反の定量化に使用される後悔予測モデルの定式化, (ii) 新たなオークションにおいて,データ駆動機構が戦略保護性要件に高い確率で適合することを保証するために, 予測された後悔を利用するオークション受理規則である。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 14:48:38 GMT)
How Effective are State Space Models for Machine Translation? [19.5] トランスフォーマーは現在のNLPのアーキテクチャとして選択されているが、注意層は長いコンテキストではスケールしない。
最近の研究は、注意を線形リカレント層に置き換えることを提案する。
これらのモデルが機械翻訳においてトランスフォーマーと競合するかどうかは不明である。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 20:21:49 GMT)
OvSW: Overcoming Silent Weights for Accurate Binary Neural Networks [19.4] バイナリニューラルネットワーク(BNN)における重み付け更新の効率性について検討する。
バニラBNNでは、トレーニング中に重量の50%以上が変化していない。
この問題に対処するために、オーバーカム・サイレント・ウェイト(OvSW)を提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 05:01:20 GMT)
Advancing Prompt Recovery in NLP: A Deep Dive into the Integration of Gemma-2b-it and Phi2 Models [18.9] プロンプトの設計と有効性は、NLP研究における困難で比較的未解決の分野である。
本稿では,事前学習した言語モデルと戦略のスペクトルを用いて,迅速な回復手法の徹底的な検討を行う。
厳密な実験と詳細な解析により、Gemma-2b-it + Phi2 model + Pretrainの優れた性能を解明する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 02:15:26 GMT)
A Flexible, Equivariant Framework for Subgraph GNNs via Graph Products and Graph Coarsening [18.7] グラフグラフニューラルネットワーク(サブグラフGNN)は,グラフをサブグラフの集合として表現することで,メッセージパスGNNの表現性を向上する。
以前のアプローチでは、ランダムにまたは学習可能なサンプリングによって選択されたサブグラフのサブセットのみを処理することを提案していた。
本稿では,これらの問題に対処する新しいSubgraph GNNフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 09:32:11 GMT)
Provably Efficient Long-Horizon Exploration in Monte Carlo Tree Search through State Occupancy Regularization [18.3] 状態占有度を正則化した政策最適化に基づく木探索アルゴリズムを導出し,それをボリュームMCTSと呼ぶ。
本研究では,この状態占有率の正規化目標に対する近似解として,カウントベース探索とサンプリングベース動作計画が導出可能であることを示す。
我々は,いくつかのロボットナビゲーション問題に対して本手法を試行し,Volume-MCTSがAlphaZeroより優れており,長期探査特性が著しく向上していることを見出した。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 22:58:52 GMT)
Prototypical Reward Network for Data-Efficient RLHF [17.2] RLHF(Reinforcement Learning from Human Feedback)の報奨モデルが大規模言語モデル(LLM)の微調整に有効であることが証明された。
提案するフレームワークであるProto-RMは,人間からのフィードバックに制限された報酬モデルを改善するために,プロトタイプネットワークを活用している。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 16:29:17 GMT)
Dynamic Position Transformation and Boundary Refinement Network for Left Atrial Segmentation [17.1] 左心房細動は不整脈(心房細動)の診断において重要な手法である。
LAセグメンテーションの現在のほとんどの方法は、入力データがオブジェクト指向のセンタートリミングによって取得されると厳密に仮定している。
本稿では,これらの問題に対処するための新しい動的位置変換と境界改善ネットワーク(DPBNet)を提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 22:09:35 GMT)
MMR-Mamba: Multi-Modal MRI Reconstruction with Mamba and Spatial-Frequency Information Fusion [17.1] MMR-MambaはMRI再建のためのマルチモーダル機能を完全にかつ効率的に統合する新しいフレームワークである。
具体的には,空間領域におけるTCM(Target modality-guided Cross Mamba)モジュールの設計を行う。
次に、フーリエ領域におけるグローバル情報を効率的に統合するための選択周波数融合(SFF)モジュールを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 18:19:38 GMT)
Differentiable Modal Synthesis for Physical Modeling of Planar String Sound and Motion Simulation [17.0] 非線形弦の運動特性をシミュレーションする新しいモデルを提案する。
我々は物理ネットワークフレームワークにモーダル合成とスペクトルモデリングを統合する。
経験的評価は、弦運動シミュレーションにおいて、アーキテクチャが優れた精度を達成することを示す。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 23:36:51 GMT)
Federated Learning for Medical Image Analysis: A Survey [16.8] 医療画像における機械学習は、しばしば基本的なジレンマに直面している。
有望なソリューションとして、クロスサイトデータを共有することなく、さまざまなサイトからのデータに基づいて機械学習モデルの協調トレーニングを可能にするフェデレーション学習が近年注目を集めている。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 23:37:17 GMT)
TrojanRAG: Retrieval-Augmented Generation Can Be Backdoor Driver in Large Language Models [16.7] 大規模言語モデル(LLM)は、自然言語処理(NLP)において顕著なパフォーマンスにもかかわらず、潜在的なセキュリティ脅威に対する懸念を提起している。
バックドア攻撃は当初、LLMがあらゆる段階で重大な損害を受けていることを証明したが、コストとロバスト性は批判されている。
本稿では,Retrieval-Augmented Generationにおいて,共同でバックドア攻撃を行うTrojanRAGを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 05:03:53 GMT)
IL-TUR: Benchmark for Indian Legal Text Understanding and Reasoning [16.1] 世界中の法制度は、事例や文書の指数的な増加と共に浸水している。
法律文書を自動的に処理し理解するためのNLPおよびML技術を開発する必要がある。
本稿では, IL-TUR: Benchmark for Indian Legal Text Understanding and Reasoningを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 14:55:04 GMT)
Online Drift Detection with Maximum Concept Discrepancy [13.5] 最大概念差に基づく新しい概念ドリフト検出手法であるMDD-DDを提案する。
本手法は,概念埋め込みのコントラスト学習により,様々な形態のコンセプトドリフトを適応的に同定することができる。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 13:57:50 GMT)
Studying the Impact of TensorFlow and PyTorch Bindings on Machine Learning Software Quality [13.1] C#、Rust、Python、JavaScriptのバインディングがソフトウェアの品質に与える影響について調査する。
実験により、あるモデルがひとつのバインディングでトレーニングされ、同じフレームワークの別のバインディングでの推論に使用されることが、精度を損なうことなく明らかとなった。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 18:39:27 GMT)
PAPM: A Physics-aware Proxy Model for Process Systems [12.9] 本稿では,プロセスシステムの一部の物理を組み込んだ物理対応プロキシモデル(PAPM)を提案する。
PAPMは平均性能が6.7%向上するのに対して、FLOPは少なく、パラメータの1%しか必要としない。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 02:10:05 GMT)
Active Coarse-to-Fine Segmentation of Moveable Parts from Real Images [12.9] 実屋内シーンのRGB画像から移動可能な部分の高精度なインスタンスセグメンテーションのための,最初のアクティブラーニング(AL)モデルを提案する。
能動セグメンテーションを監督するためにマスク付きアテンション機構を利用するトランスフォーマーを用いる。
画像の11.45%を手動でアノテートするだけで、セマンティックラベルによる完全に検証可能な部分分割が得られる。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 18:15:01 GMT)
Domain-Adaptive Full-Face Gaze Estimation via Novel-View-Synthesis and Feature Disentanglement [12.9] 本稿では、教師なしドメイン適応のためのトレーニングデータ合成と視線推定モデルからなる効果的なモデルトレーニングパイプラインを提案する。
提案したデータ合成は、単一画像の3D再構成を利用して、3次元の顔形状データセットを必要とせずに、ソース領域から頭部ポーズの範囲を広げる。
本稿では、視線関連特徴を分離し、背景アグリゲーション整合性損失を導入し、合成音源領域の特性を生かしたディエンタングリングオートエンコーダネットワークを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 19:06:10 GMT)
Can Model Uncertainty Function as a Proxy for Multiple-Choice Question Item Difficulty? [12.6] 我々は、質問に答える際の弱点と見なされるような、生成的な大規模モデルの側面を活用する。
本研究では、不確実性の2つの異なる指標と実際の学生の反応分布の相関について検討する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 10:48:04 GMT)
Prospective Messaging: Learning in Networks with Communication Delays [12.6] 物理的に実現されたニューラルネットワークでは、ニューロン間通信遅延がユビキタスである。
遅延は、最先端の継続的ニューラルネットワークが単純なタスクを学習するのを妨げていることを示す。
そこで我々は,現在利用可能な信号に基づいて通信遅延を予測し,通信遅延を補償することを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 20:54:14 GMT)
Ternary Spike-based Neuromorphic Signal Processing System [12.3] 我々は、スパイキングニューラルネットワーク(SNN)と量子化技術を利用して、エネルギー効率が高く軽量なニューロモルフィック信号処理システムを開発する。
我々のシステムは、しきい値適応符号化(TAE)法と量子第三次SNN(QT-SNN)の2つの主要な革新によって特徴づけられる。
提案方式の効率性と有効性は、エネルギー効率の高い信号処理のための有望な経路としての可能性を強調している。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 09:32:19 GMT)
Towards Bridging the Cross-modal Semantic Gap for Multi-modal Recommendation [12.3] マルチモーダルレコメンデーションはレコメンデーションシステムの性能を大幅に向上させる。
既存のマルチモーダルレコメンデーションモデルは、マルチメディア情報伝搬プロセスを利用してアイテム表現を豊かにする。
本稿では,モダリティ間のセマンティックギャップをブリッジし,詳細な多視点セマンティック情報を抽出する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 07 Jul 2024 15:56:03 GMT)
P2P: Part-to-Part Motion Cues Guide a Strong Tracking Framework for LiDAR Point Clouds [11.3] 外観マッチングに基づく3次元物体追跡法は,LiDAR点雲による外観情報の不十分さに長年悩まされてきた。
連続点雲に対するパート・ツー・パートのモーション・モデリングを提案し,textbfP2Pと呼ばれる新しいトラッキング・フレームワークを提案する。
本稿では,P2P-pointとP2P-voxelモデルについて述べる。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 02:37:24 GMT)
Music Era Recognition Using Supervised Contrastive Learning and Artist Information [11.1] 音楽時代情報は、プレイリストの生成とレコメンデーションにとって重要な機能である。
音声から年齢を予測するために,音声に基づくモデルを開発した。
アーティスト情報が入手可能な場合には,マルチモーダル入力を受信するための音声モデルを拡張し,マルチモーダルコントラスト学習(MMC)と呼ばれるフレームワークを開発し,トレーニングを強化する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 13:43:55 GMT)
KAE: A Property-based Method for Knowledge Graph Alignment and Extension [11.0] 本稿では、新しいプロパティベースのアライメントアプローチを含む知識グラフ(KG)拡張のための機械学習ベースのフレームワークを提案する。
主な直観は、etypeを意図的に定義する性質であり、この定義はetypeを名付けるために使われる特定のラベルとは独立である。
実験の結果,KGアライメント手法の有効性と,提案したKG拡張フレームワークの優位性を示した。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 10:17:03 GMT)
PEDANTS (Precise Evaluations of Diverse Answer Nominee Text for Skinflints): Efficient Evaluation Analysis and Benchmarking for Open-Domain Question Answering [10.4] 人間のQAコミュニティから採用されているマシンQAを評価するためのガイドラインとデータセットを提供する。
また、正確なマッチングやニューラル手法よりも、より効率的で、低リソースで、解釈可能なQA評価手法を提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 01:14:16 GMT)
Evolutionary Trigger Detection and Lightweight Model Repair Based Backdoor Defense [10.3] ディープニューラルネットワーク(DNN)は、自律運転や顔認識など、多くの分野で広く利用されている。
DNNモデルのバックドアは、トリガーによる有毒な入力によってアクティベートされ、誤った予測につながる。
進化的トリガ検出と軽量モデル修復に基づく効率的なバックドア防御を提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 14:50:59 GMT)
Federated Knowledge Transfer Fine-tuning Large Server Model with Resource-Constrained IoT Clients [10.3] 我々は、モノのインターネットにおける大規模モデルのトレーニングを促進するために、KoALA(Federated Knowledge Transfer Fine-tuning Large Server Model with Resource-Constrained IoT Clients)を提案する。
フェデレートされた学習と知識の蒸留を利用して、小さなモデルとのコラボレーションを通じて大きなモデルを更新する。
また,本手法は,類似のトレーニング性能を実現するだけでなく,ローカルストレージやコンピュータパワーリソースの必要性を著しく低減する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 05:46:01 GMT)
GaussReg: Fast 3D Registration with Gaussian Splatting [10.0] ポイントクラウドの登録は、大規模な3Dシーンのスキャンと再構築の基本的な問題である。
我々は,ポイントクラウド登録のための新しい粗粒度フレームワークであるGaussRegを提案する。
提案手法は,複数のデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 04:35:51 GMT)
D2-LRR: A Dual-Decomposed MDLatLRR Approach for Medical Image Fusion [9.5] 二重分解型MDLatLRR(D2-LRR)と呼ばれる多層分解法を提案する。
D2-LRRはLatLRRから抽出された全ての画像の特徴を効果的に分析し、利用する。
詳細部分は核ノーム操作で融合し、基本部分は平均的な戦略で融合する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 11:39:46 GMT)
ElecBench: a Power Dispatch Evaluation Benchmark for Large Language Models [9.4] 大規模言語モデル(LLM)は、効率を改善し、電力セクターのインテリジェントな進歩を促進するための重要な技術となっている。
これらの可能性にもかかわらず、電力セクターにおけるLCMの性能評価ベンチマークが欠如していることは、これらの技術の有効利用を制限している。
ElecBenchは、セクター固有のシナリオを包括的にカバーすることで、既存の評価ベンチマークの欠点を克服することを目指している。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 13:38:05 GMT)
YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention [8.8] 従来の溶解度予測技術は、しばしば分子トラクチャーの複雑な性質を捉えるのに失敗し、予測と実際の結果の間に顕著な違いをもたらす。
本研究では,注目に基づくトランスフォーマー,Long Short-Term Memory(LSTM)ネットワーク,GCN(Graph Convolutional Networks)を組み合わせた新しいディープラーニングフレームワークを提案する。
相関係数(R2$)が0.59、ルート平均角誤差(RMSE)が0.57、ベンチマークモデルのスコアが0.52(R2$)と0.61(RMSE)を上回った。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 14:10:38 GMT)
How to characterize imprecision in multi-view clustering? [8.7] エントロピー制約(MvLRECM)に基づくマルチビュー低ランク明示的c-meansを提案する。
MvLRECMでは、各オブジェクトは異なるクラスタに属し、意思決定時の不確実性を特徴付ける。
さらに、エントロピー重み付けと低ランク制約を用いて、インプレクションの低減と精度の向上を図る。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 04:47:49 GMT)
Experimental investigation of direct non-Hermitian measurement and uncertainty relation towards high-dimensional quantum domain [8.6] 非エルミート射影プロトコルを提案し、非エルミート不確実性関係について検討する。
量子光学回路において量子シミュレータを実験的に構築し、単一光子量子トリット上の3次元非エルミタン量子測定を実現する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 11:20:27 GMT)
FinLangNet: A Novel Deep Learning Framework for Credit Risk Prediction Using Linguistic Analogy in Financial Data [7.9] FinLangNetは、言語構造を反映する構造において、クレジットローンの軌跡を概念化する。
我々はFinLangNetが従来の統計手法を超越して信用リスクを予測することを示した。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 14:59:55 GMT)
VC Theory for Inventory Policies [7.7] 我々は、いくつかのよく知られた在庫政策のクラスを学ぶための一般化保証を証明している。
コンテキストのない古典的な設定に焦点をあてるが、要求シーケンスの任意の分布が可能である。
本研究は,ブラックボックス学習機械にベースストックと在庫配置の概念を組み込むことが有用であることを示す。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 19:32:17 GMT)
MelodyVis: Visual Analytics for Melodic Patterns in Sheet Music [7.7] MelodyVisは、音楽学の専門家と協力して、デジタルシート音楽におけるメロディパターンを探索するビジュアルアプリケーションである。
このシステムは、8つの原子演算子(転位とミラーリング)を使ってメロディの反復と変奏を捉えている。
論文参考訳(メタデータ) (Sun, 07 Jul 2024 16:04:21 GMT)
Faux Polyglot: A Study on Information Disparity in Multilingual Large Language Models [7.6] Retrieval Augmented Generation (RAG)により、Large Language Models (LLM) は情報検索において重要な役割を担っている。
RAGに基づく情報検索において,LLMの言語的嗜好について検討した。
その結果,LLMは問合せ言語と同一言語における情報に対して,情報検索と回答生成の両方において,体系的な偏りを示した。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 21:26:36 GMT)
Quantum Hamiltonian Algorithms for Maximum Independent Sets [6.8] 最大独立集合問題に対処する2つの量子ハミルトンアルゴリズムを比較する。
それらが数学的に等価であることを示すが、一見すると全く異なるように見える。
数値シミュレーションにより,性能に有意な差が見られ,実験プロトコルの改善が示唆された。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 15:48:15 GMT)
Artificial Intelligence for Scientific Research: Authentic Research Education Framework [6.8] 我々は,補完的な技術を持つ学生チームが,自然科学研究者のために有用な人工知能(AI)ソリューションを開発するプログラムを実装した。
当社のアプローチは、特定のニーズに対して機械学習の有用性を評価する機会を得る科学者に直接利益をもたらす。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 14:54:20 GMT)
AiGAS-dEVL: An Adaptive Incremental Neural Gas Model for Drifting Data Streams under Extreme Verification Latency [6.7] ストリーミング設定では、データフローはパターン(コンセプトドリフト)の非定常性をもたらす要因によって影響を受ける。
本稿では,AiGAS-dEVLという新しい手法を提案する。これは,時間とともにストリーム内で検出されるすべての概念の分布を特徴付けるために,神経ガスの増大に依存する。
我々のアプローチは、時間とともにこれらの点の挙動をオンライン分析することで、特徴空間における概念の進化が定義できるようになることを明らかにしている。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 14:04:57 GMT)
Estimation of the Area and Precipitation Associated with a Tropical Cyclone Biparjoy by using Image Processing [6.7] 本稿では,リモートセンシングデータを用いて降水量と被害地域への影響を推定する手法を提案する。
サイクロンに関連付けられた降水クラスターの同定と抽出に画像処理技術が用いられた。
その結果、ビパルジョイはインドとアラビア海の平均降水量は53.14mm/日であり、インドの境界は1日11.59mm/日であり、面積は411.76000平方キロメートルである。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 04:41:27 GMT)
Deep Learning for Protein-Ligand Docking: Are We There Yet? [6.1] 実用的タンパク質リガンドドッキングのための最初の包括的なベンチマークであるPoseBenchを紹介する。
PoseBenchは、研究者がApo-to-holoタンパク質-リガンドドッキングとタンパク質-リガンド構造生成のためのDLドッキング法を厳格かつ体系的に評価することを可能にする。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 19:12:04 GMT)
iSign: A Benchmark for Indian Sign Language Processing [6.0] iSignは、Indian Sign Language (ISL) 処理のベンチマークである。
我々は118K以上のビデオ文/フレーズペアを持つ最大のISL- Englishデータセットの1つをリリースする。
ISLの動作に関するいくつかの言語的な洞察を、提案したベンチマークに関する洞察を提供する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 15:07:35 GMT)
Multi-level Reliability Interface for Semantic Communications over Wireless Networks [5.9] ジョイントソースチャネル符号化(JSCC)は、ソースメッセージをチャネル入力シンボルに直接マッピングする。
本稿では,新しいマルチレベル信頼性インタフェースを用いて,ソースマッピングとチャネルマッピングを個別に,順次に設計することを提案する。
この研究は、無線ネットワークにおける意味コミュニケーションの実現に向けた重要なステップである。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 20:15:10 GMT)
Beyond Binary Gender Labels: Revealing Gender Biases in LLMs through Gender-Neutral Name Predictions [5.9] 我々は、大きな言語モデルにおける潜在的な性バイアスについて研究し、対処するために、さらにジェンダーカテゴリー、すなわち「中立」を導入する。
性別予測の精度を高めるために出生年を増やすことの影響について検討する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 05:59:09 GMT)
Enhancing Label-efficient Medical Image Segmentation with Text-guided Diffusion Models [5.9] TextDiffは、安価な医療用テキストアノテーションを通じて意味表現を改善する。
その結果,TextDiffは,少数のトレーニングサンプルのみで,最先端のマルチモーダルセグメンテーション手法よりもはるかに優れていることがわかった。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 10:21:08 GMT)
BugNIST -- a Large Volumetric Dataset for Object Detection under Domain Shift [5.8] BugNISTデータセットは,12種類のバグタイプ9154マイクロCTボリュームと,密充填されたバグミックス388ボリュームからなる。
このデータセットは、ソースとターゲットドメインで同じ外観のオブジェクトによって特徴づけられる。
本研究では,3次元物体検出手法のフィールド化をめざして,ベースライン検出解析を行う。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 21:10:27 GMT)
DIVESPOT: Depth Integrated Volume Estimation of Pile of Things Based on Point Cloud [5.7] 本稿では,ポイントクラウド技術に基づくDIVESPOT(Depth Integrated Volume EStimation of Pile Of Things)を提案する。
不安定な計測ポーズの課題に対して、点雲ポーズ補正とフィルタリングアルゴリズムが設計されている。
光干渉に対処し、トレーニングデータに依存するのを避けるために、高さ分布に基づく地上特徴抽出アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 15:40:00 GMT)
FastSpiker: Enabling Fast Training for Spiking Neural Networks on Event-based Data through Learning Rate Enhancements for Autonomous Embedded Systems [5.6] FastSpikerは、学習率の強化を通じて、イベントベースのデータに対する高速SNNトレーニングを可能にする、新しい方法論である。
我々は、FastSpikerが最大10.5倍高速なトレーニング時間と88.39%低い二酸化炭素排出量を提供し、イベントベースの自動車データセットの最先端または同等の精度を達成することを示した。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 05:17:17 GMT)
LTLBench: Towards Benchmarks for Evaluating Temporal Logic Reasoning in Large Language Models [5.5] 時間的推論(TR)は人工知能の重要な構成要素である。
TR能力の様々な側面を評価するために、様々なデータセットが様々な方法で構築されている。
本研究は,LLMのTR能力を評価するために,データセット構築のためのパイプラインを設計・開発するための新しいアプローチを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 16:37:06 GMT)
Survey on biomarkers in human vocalizations [4.7] 調査報告では, 技術の一般的な分類法を提案し, 現状の進歩と課題を概観する。
声道バイオマーカーは、しばしば別のセンサーの信号を近似したり、基礎となる精神的、認知的、生理的状態を特定する二次的な尺度である。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 08:09:28 GMT)
A Review of AI and Machine Learning Contribution in Predictive Business Process Management (Process Enhancement and Process Improvement Approaches) [4.5] 我々は、ビジネスプロセス管理におけるAI/MLの統合を検討するため、学術文献の体系的なレビューを行う。
ビジネスプロセス管理とプロセスマップでは、AI/MLはプロセスメトリクスの運用データを使用して大幅に改善されている。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 18:26:00 GMT)
Vid3D: Synthesis of Dynamic 3D Scenes using 2D Video Diffusion [3.5] 本稿では,現在のアプローチのように時間とともに多視点一貫性を明示的に実施する必要があるか,あるいはモデルが各タイムステップの3次元表現を独立に生成するのに十分なのかを検討する。
本稿では,2次元映像拡散を利用して3次元映像を生成するモデルVid3Dを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 06:12:53 GMT)
Development of Cognitive Intelligence in Pre-trained Language Models [3.2] 近年の研究では、大規模事前学習言語モデルにおける創発的認知能力の証拠が示されている。
PLMの発達軌跡は、人間の認知発達に対する最大限の調整の窓を一貫して示している。
この窓のあと、トレーニングは損失を減らすという工学的な目標に役立っているように見えるが、人間の認知との整合性を高めるという科学的目標ではない。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 07:54:05 GMT)
Towards Improving Unit Commitment Economics: An Add-On Tailor for Renewable Energy and Reserve Predictions [3.2] 日頭単位コミットメント(UC)は、予測を最適化するプロセスで実行される。
本稿では,予測最適化プロセスのアドオンとして展開されたUCのRES保存予測のコスト指向の調整手法を提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 22:00:33 GMT)
Quantum Supercriticality in the Ising Model and Rydberg Atom Array [3.0] 普遍的なスケーリングの挙動を特徴とする超臨界性は、古典的な液体ガス臨界点に接近する興味深い現象として現れる。
本研究では,この重要な概念を量子臨界点(QCP)近傍の量子多体系に拡張する。
超臨界で流体のような量子状態は、強く揺らぎ、非常に絡み合っている。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 17:52:02 GMT)
Privacy of the last iterate in cyclically-sampled DP-SGD on nonconvex composite losses [2.5] 現在の会計手法は、DP-SGD実装とは大きく異なる仮定を定めている。
勾配関数の弱サイズパラメータが近づくと、我々の境界は以前に確立された凸境界に収束することを示す。
非Lipschitz および連続損失関数の場合、DP-SGD 実装の数の観点から、より弱い境界を提供する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 02:35:55 GMT)
Deep Probability Aggregation Clustering [2.5] 本稿では,PAC(Probability Aggregation Clustering)と呼ばれるセンタレスクラスタリングアルゴリズムを提案する。
PACはクラスタ中心を回避し、クラスタリングを最適化問題として新しい目的関数で定式化し、確率空間と分布空間を整列する。
実験により、PACはクラスタリングの堅牢性と性能が優れており、DPACは最先端のディープクラスタリング手法よりも著しく優れていることが示された。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 03:31:00 GMT)
JSCDS: A Core Data Selection Method with Jason-Shannon Divergence for Caries RGB Images-Efficient Learning [2.5] ディープラーニングモデルのパフォーマンスは、高品質なデータに依存し、相当なトレーニングリソースを必要とする。
本稿では,Jensen-Shannon Divergence (JSCDS) を用いたコアデータ選択手法を提案する。
JSCDSは、予測性能と時間消費において、他のデータ選択方法よりも優れています。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 03:36:14 GMT)
A Deep Dive into the Factors Influencing Financial Success: A Machine Learning Approach [2.1] 本稿では、機械学習アルゴリズムとアプローチを用いて、個別の経済的成功に寄与する様々な社会経済的要因について考察する。
労働統計局による1997年度全国縦断調査の結果を調査する。
このデータセットは、収入変数と個人の社会経済変数からなる。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 06:01:45 GMT)
Addressing single object tracking in satellite imagery through prompt-engineered solutions [2.1] 衛星映像における小型物体の学習自由点追跡手法を提案する。
我々の戦略は、リモートセンシングアプリケーションにおける衛星画像に適したロバストな追跡ソリューションの大幅な進歩を示している。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 23:50:29 GMT)
GitHub Marketplace for Automation and Innovation in Software Production [2.1] GitHub Marketplaceは自動化ツールをホストし、GitHubがホストするプロジェクトの運用を支援する。
本研究では, プラットフォームの特徴, 特徴, 方針について検討し, 生産自動化における共通テーマを明らかにする。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 23:55:15 GMT)
Towards Perceived Security, Perceived Privacy, and the Universal Design of E-Payment Applications [1.8] 私たちは、ユーザとテストしたい機能を含むE支払いアプリケーションの高忠実なプロトタイプを作成しました。
セキュリティとプライバシの両方が、E支払いアプリケーションのユーザにとって重要であることが分かっています。
一部の参加者は、アプリケーションのユーザビリティに基づいて、セキュリティとプライバシの強さを認識します。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 17:15:09 GMT)
SwiftBrush: One-Step Text-to-Image Diffusion Model with Variational Score Distillation [1.6] テキストと画像の拡散モデルは、しばしば遅い反復的なサンプリングプロセスに悩まされる。
我々は$textbfSwiftBrush$という新しいイメージフリー蒸留方式を提案する。
SwiftBrushは、COCO-30Kベンチマークで、$textbf16.67$のFIDスコアと$textbf0.29$のCLIPスコアを達成している。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 06:20:58 GMT)
Mini-Giants: "Small" Language Models and Open Source Win-Win [1.5] 小さな言語モデルは繁栄し、ますます有能になっている。
KaggleやMini-giantsのようなオープンソースコミュニティは、技術的、倫理的、社会的に、多くの点で勝利するだろう、と私たちは主張しています。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 06:42:31 GMT)
State Estimation and Control for Stochastic Quantum Dynamics with Homodyne Measurement: Stabilizing Qubits under Uncertainty [1.5] 本稿では, ホモダイン測定を用いたリアプノフに基づく制御手法を提案する。
従来の量子フィルタリングと拡張カルマンフィルタの修正版について検討した。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 23:34:20 GMT)
Synthetic Test Data Generation Using Recurrent Neural Networks: A Position Paper [1.4] 多くの組織、特に公共部門では、プライバシー上の懸念から、テスト目的で生産データを使用することはできない。
代替手段は、匿名化されたデータ、または合成生成されたデータを使用することである。
予備実験では、リカレントニューラルネットワークを用いて、代表的かつ高精度なデータを生成することができた。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 15:28:41 GMT)
Compact Proofs of Model Performance via Mechanistic Interpretability [1.4] 本稿では,モデル性能に関する形式的保証を導出し,コンパクトに証明するために,機械的解釈可能性を用いることを提案する。
提案手法は, 最大K$タスクで訓練した151個の小型変圧器の精度について, 下限を正式に証明して試作する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 19:19:51 GMT)
Beyond static AI evaluations: advancing human interaction evaluations for LLM harms and risks [1.3] ヒューマンインタラクション評価」は、人間-モデルインタラクションの評価に焦点を当てている。
安全に焦点を当てた3段階のHIE設計フレームワークを提案する。
我々は,HIEのコスト,複製性,非表現性に関する懸念に対処するための具体的な勧告で締めくくっている。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 13:16:32 GMT)
Biomedical Nested NER with Large Language Model and UMLS Heuristics [1.3] そこで本研究では,生物医学的テキストから8種類のネスト名のエンティティを抽出するシステムを提案する。
本システムでは,BioNNE検証セットで0.39点,試験セットで0.348点を得た。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 19:37:40 GMT)
Learning Closed-form Equations for Subgrid-scale Closures from High-fidelity Data: Promises and Challenges [1.3] 2次元乱流とレイリー・ブエナード対流のフィルタ数値シミュレーションから閉包を学習する。
発見された閉包はテイラー級数の先頭項と一致することを示す。
これらの知見は,任意のマルチスケールシステムのクロージャモデリングに関係している。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 13:40:20 GMT)
A Fair Post-Processing Method based on the MADD Metric for Predictive Student Models [1.1] 予測的学生モデルにおけるアルゴリズム的公正性を評価するために,新しい尺度が開発された。
本稿では,適切な予測モデルの結果の正確性を保ちつつ,公平性を向上することを目的とした後処理手法を提案する。
我々は、シミュレーションと実世界の教育データを用いて、オンラインコースにおける学生の成功を予測するタスクについて実験を行った。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 14:53:41 GMT)
Smart Camera Parking System With Auto Parking Spot Detection [1.1] PakStaと呼ばれる新しい手法で駐車場の状態を自動識別する。
本手法はPakLocのオブジェクト検出器を用いて,ビデオフレーム内の駐車場の占有状況を同時に判定する。
提案手法がPKLotデータセットに与える影響は, 人的労働力の94.25%を大幅に削減する結果となった。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 19:00:11 GMT)
A Blueprint for Auditing Generative AI [1.0] 生成AIシステムは創発的な能力を示し、幅広い下流タスクに適応できる。
既存の監査手順は、生成的AIシステムによって引き起こされるガバナンスの課題に対処できない。
本稿では、生成AIシステムの設計と普及を行う技術提供者のガバナンス監査、事前学習後の生成AIシステムのモデル監査、生成AIシステムに基づくアプリケーションのアプリケーション監査という3層的なアプローチを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 11:56:54 GMT)
BiRoDiff: Diffusion policies for bipedal robot locomotion on unseen terrains [0.9] 未知の地形での移動は、二足歩行ロボットが新しい現実世界の課題に対処するために不可欠である。
複数の地形を移動させる単一の歩行制御系を学習する軽量なフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 16:03:33 GMT)
A Hybrid Registration and Fusion Method for Hyperspectral Super-resolution [0.9] 本稿ではRAF-NLRGSというハイブリッド登録・融合モデルを提案する。
RAFモデルは、残余データグループに埋め込まれた貴重な情報を活用するために、制約付きグループ空間を組み込む。
一般化ガウスニュートン(GGN)アルゴリズムと近似交互最適化(PAO)の枠組みも提示する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 06:36:19 GMT)
Geometric Transformation Uncertainty for Improving 3D Fetal Brain Pose Prediction from Freehand 2D Ultrasound Videos [0.9] 2次元胎児脳画像における3次元面の自動位置決めのための不確実性を考慮した深層学習モデルを提案する。
提案手法であるQAERTSは、現状や不確実性に基づくアプローチよりも優れたポーズ推定精度を示す。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 16:54:09 GMT)
Semantic Segmentation for Real-World and Synthetic Vehicle's Forward-Facing Camera Images [0.9] これは、車両の前向きカメラからの実世界の画像と合成画像の両方におけるセマンティックセグメンテーション問題の解決策である。
我々は、さまざまな屋外状況の様々な領域でよく機能するロバストモデルの構築に集中する。
本稿では,意味的セグメンテーション問題における領域適応のための実世界のデータと合成データの併用の有効性について検討する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 17:28:45 GMT)
Explainable AI: Comparative Analysis of Normal and Dilated ResNet Models for Fundus Disease Classification [0.8] 本稿では網膜基底像からの疾患分類のための拡張Residual Network(ResNet)モデルを提案する。
拡張畳み込みフィルタは、ResNetモデルの上位層における通常の畳み込みフィルタを置き換えるために使用される。
拡張されたResNetモデルは、平均F1スコアが0.71、0.70、0.69、0.67、0.70の通常のResNetと比較して有望な結果を示す。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 17:03:12 GMT)
CAV-AD: A Robust Framework for Detection of Anomalous Data and Malicious Sensors in CAV Networks [0.8] CAVはセンサーの読み取りに頼っているため、重大な脅威に弱い。
これらの読み取りを操作することは、CAVネットワークのセキュリティを損なう可能性がある。
本稿では,CAV-ADと呼ばれる異常検出のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 18:19:03 GMT)
Quantum correlation of Hawking radiations for mass-superposed BTZ black holes [0.8] ウンルー・デウィット検出器モデルを用いた最近の研究により、ブラックホール質量重畳の量子的シグネチャが明らかになった。
本稿では,等時密度密度相関関数を用いて,BTZブラックホールの質量重畳を再検討する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 15:59:22 GMT)
Physically Accessible and Inaccessible Quantum Correlations of Dirac Fields in Schwarzschild Spacetime [0.7] textitAliceとtextitBobは、Schwarzschildブラックホールの近くでtextitGisin状態を共有する。
ホーキングデコヒーレンス(英語版)は、物理的にアクセス可能な領域におけるディラック場の量子相関を減少させる。
ホーキングのデコヒーレンスは物理的に到達不能な領域と時空の領域で増大するので、ディラック場の量子相関は再帰する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 22:55:13 GMT)
Stabilizing an individual charge fluctuator in a Si/SiGe quantum dot [0.7] 電荷ノイズは、シリコンスピン量子ビットにおけるゲート密度の改善の大きな障害である。
我々は、半導体量子ドットにおける電荷ノイズを低減させる新しい手法を、ノイズ源自体を制御することによって示す。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 17:02:20 GMT)
qLUE: A Quantum Clustering Algorithm for Multi- Dimensional Datasets [0.7] qLUEは、点数とその密度の両方で線形にスケールする量子クラスタリングアルゴリズムである。
我々は、qLUEが複雑なデータ解析タスクを処理するための有望な方法であることを示す。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 06:26:22 GMT)
Spatio-temporal Structure of Excitation and Inhibition Emerges in Spiking Neural Networks with and without Biologically Plausible Constraints [0.1] 学習可能なシナプス遅延を組み込んだスパイキングニューラルネットワーク(SNN)モデルを提案する。
接続除去のためのDEEP Rと接続のためのRigLを組み合わせた動的プルーニング戦略を実装した。
より生物学的に妥当なモデルにおいても,再導入・時間的興奮・抑制のパターンが出現することが観察された。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 11:55:48 GMT)
Using Bibliometrics to Detect Unconventional Authorship Practices and Examine Their Impact on Global Research Metrics, 2019-2023 [0.0] 2019年から2023年の間に、16の大学が世界平均の15倍以上の研究成果を上げた。
本研究は,出版の指標をインフレーションするために,贈与や名誉,販売された著作物など,伝統的でない著作物への依存を示唆するパターンを検出した。
この研究は、大学、政策立案者、資金調達機関、ランキング機関、認定機関、学術出版社、研究者による改革の必要性を強調し、学術的完全性を維持し、グローバルなランキングシステムの信頼性を確保する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 22:20:34 GMT)
The US Algorithmic Accountability Act of 2022 vs. The EU Artificial Intelligence Act: What can they learn from each other? [0.0] USAAは、自動意思決定システムの利点とリスクのバランスをとるための実践的なアプローチである。
しかし、改善の余地はまだあります。
このコメンテータは、アメリカAAAが欧州人工知能法(European Artificial Intelligence Act)からどのように情報を提供し、学べるかを強調している。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 12:31:13 GMT)
The Switch, the Ladder, and the Matrix: Models for Classifying AI Systems [0.0] AI倫理の原則と実践の間にはまだギャップがある。
AI倫理を運用しようとする組織が直面する大きな障害のひとつは、明確に定義された材料スコープの欠如である。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 12:16:01 GMT)
Synthetic Participatory Planning of Shard Automated Electric Mobility Systems [0.0] 本稿では,大規模言語モデル(LLM)を批判的に活用してデジタルアバターを作成する,新しい合成参加手法を提案する。
これらの調整可能なエージェントは、目標を共同で識別し、SAEMS代替案を構想し、評価し、リスクと制約の下で実施をストラテジズする。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 21:56:23 GMT)
Superluminal Propagation of Composite Collective Modes in Superconductor-Ferromagnet Heterostructures [0.0] 合成集合モードのスペクトルである$omega(k)$は、$H_demH_an$と$H_dem>H_an$の場合、定性的に異なる形式であることを示す。
強磁性体における中等方性あるいは弱い異方性に対して、集合モードの群速度は群速度が無限で超光度である屈折点を示す。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 18:01:17 GMT)
Some Issues in Predictive Ethics Modeling: An Annotated Contrast Set of "Moral Stories" [0.0] 本稿では、道徳的ジレンマをテキストベース入力に変換する際の問題を特定することによって、倫理モデリングの総合的指標としての正確性に挑戦する。
我々は,データ誤表現の特定形態が分類器の精度をどの程度損なうかの具体的な推定値を得る。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 03:22:49 GMT)
Quantum state of fields in $SU(\infty)$ Quantum Gravity ($SU(\infty)$-QGR) [0.0] SU(infty)$-QGRは、最近提案された宇宙の量子モデルである。
$SU(infty)$-QGR は、上記の 4D パラメータ空間上で定義される内部対称性と $SU(infty)$ - 重力のヤン・ミルズゲージ理論の形式を持つ。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 09:20:29 GMT)
Quantum Multiplier Based on Exponent Adder [0.0] 指数加算器(QMbead)に基づく量子乗算器を提案する。
QMbeadは$log_2(n)$ qubitsで2つの$n$-bit整数を乗算する。
QMbeadの時間複雑性は、最も高速な古典的乗算アルゴリズムHarvey-Hoevenアルゴリズムと同一である。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 14:52:32 GMT)
Predicting Word Similarity in Context with Referential Translation Machines [0.0] タスクを機械翻訳性能予測(MTPP)としてキャストすることで、英語の2単語間の類似性を識別する。
我々は、トレーニングとテストセットの共通表現を可能にするレファレンシャル翻訳機械(RTM)を使用している。
RTMは、グレードドドワード類似性(GWSC)タスクの上位結果を達成することができる。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 09:36:41 GMT)
Operationalising AI governance through ethics-based auditing: An industry case study [0.0] 倫理に基づく監査(EBA、Ethics Based auditing)とは、過去の行動や現在の行動が道徳的原則や規範との整合性について評価される、構造化されたプロセスである。
この記事では、EBAの手続きを、実現可能かつ効果的に統合する必要がある組織的状況について、詳細な説明を提供する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 12:22:38 GMT)
On the power of data augmentation for head pose estimation [0.0] 本稿では, 自然画像へのより良い一般化を実現するために, 合成データの異なるフレーバーの組み合わせを提案する。
精度と効率の両面での競合モデルが得られ、実際のリアルタイムアプリケーションで完全な6つのDoFポーズ推定が可能となる。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 13:19:51 GMT)
On the importance of learning non-local dynamics for stable data-driven climate modeling: A 1D gravity wave-QBO testbed [0.0] データ駆動パラメータ化の大きな問題は、大規模プロセスの数値解法と統合する際の不安定性である。
本研究では,重力波をパラメータ化した準双年振動(QBO)の1次元モデルを用いて,空間非局所力学の学習の重要性を示す。
風面からの強制力を正確に予測していると思われるNNベースのパラメータ化は、非局所的ダイナミクスを捕捉するにはRFが小さすぎる場合、不安定なシミュレーションを引き起こすが、同じ大きさで大きめのRFのNNは安定である。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 01:15:52 GMT)
On the Anatomy of Attention [0.0] 本稿では、機械学習モデルについて体系的に関連付け、推論するために、カテゴリ理論図式形式を導入する。
我々の図は直感的にアーキテクチャを提示するが、重要な詳細を欠くことなく、モデル間の自然な関係はグラフィカルな変換によって捉えられる。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 17:03:05 GMT)
On Quantum Pushdown Systems with Various Extensions [0.0] 我々は、エム確率的プッシュダウン系の量子アナログとエムマルコフ連鎖を定義する。
さらに、確率計算木論理の量子アナログを定義する必要があるかどうかについても検討する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 12:14:42 GMT)
Normative Conditional Reasoning as a Fragment of HOL [0.0] 本稿では(参照に基づく)条件付き規範推論の機械化について論じる。
我々の焦点は条件付き義務のためのAqvistのシステムEとその拡張である。
フレームワークの2つの可能性について検討する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 14:51:25 GMT)
Multimodal Language Models for Domain-Specific Procedural Video Summarization [0.0] 本研究では,ビデオ要約とステップ・バイ・ステップ・インストラクション生成のためのマルチモーダルモデルについて検討する。
提案手法は,料理や医療処置など特定の領域におけるパフォーマンスを向上させるための微調整のTimeChatに焦点をあてる。
以上の結果から, ドメイン固有の手続きデータに微調整を施すと, TimeChatは長めの動画において, 重要な指導ステップの抽出と要約を大幅に改善できることがわかった。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 15:50:46 GMT)
Morse Code-Enabled Speech Recognition for Individuals with Visual and Hearing Impairments [0.0] 提案モデルでは,ユーザからの音声を音声認識層に送信し,テキストに変換する。
モース符号変換はプロセスであるため、モデルの精度は音声認識に完全に依存する。
提案されたモデルのWERと精度はそれぞれ10.18%と89.82%と決定される。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 09:54:29 GMT)
Memory, Consciousness and Large Language Model [0.0] 本稿では,大言語モデルとTulvingの記憶理論の双対性の存在を示唆する仮説を提案する。
検索におけるTulvingの相乗的エコフォリーモデル(SEM)と,LLMで観測された創発的能力の対応性について検討した。
意識はこの双対性に基づく創発的能力の一形態と考えられるかもしれないと推測する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 14:58:22 GMT)
Machine Learning, Deep Learning and Data Preprocessing Techniques for Detection, Prediction, and Monitoring of Stress and Stress-related Mental Disorders: A Scoping Review [0.0] メンタルストレスとそれに伴う精神障害(MD)は、公衆衛生上の重要な問題である。
機械学習(ML)の出現により、これらの問題を理解し、対処するための計算技術を活用する可能性がある。
本研究の目的は,精神ストレスとMDの検出,予測,分析に使用されるML方法論のスコープを検討することである。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 16:31:46 GMT)
Leggett-Garg Inequality for Bosons in a Double-Well Potential [0.0] 二重井戸電位におけるボソン系のレゲット・ガルグ不等式(LGI)の違反について検討した。
我々の分析では、LGIはジョゼフソンの振動によって侵害されているが、強い結合状態では非侵害であることが明らかとなった。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 08:53:27 GMT)
Interpreting the Residual Stream of ResNet18 [0.0] 本稿では、InceptionV1に欠けているアーキテクチャメカニズムである残留ストリームに特に焦点をあてて、ResNet18を調査する。
残差ストリームチャネルの多くは、入力の小型特徴とブロックの大規模特徴とを混合して、スケール不変表現を計算している。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 12:13:03 GMT)
Information FOMO: The unhealthy fear of missing out on information. A method for removing misleading data for healthier models [0.0] ミスリーディングや不要なデータは、マシンラーニング(ML)モデルの健全性や正確性に大きく影響します。
本稿では,データセット内の重要な情報を特定するシーケンシャルな選択法を提案する。
これらの不安定性は、基礎となるマップの複雑さの結果であり、極端な事象や重い尾と結びついている。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 15:44:26 GMT)
Generating multi-scale NMC particles with radial grain architectures using spatial stochastics and GANs [0.0] 電極性能と陰極粒子の形態の関係は 難しい。
現在では、代表性を達成するために、完全な粒度の細かい粒子を多数画像化することは不可能である。
2次元データから代表的3次元情報を生成する立体生成対向ネットワーク(GAN)に基づくモデルフィッティング手法を提案する。
一度校正すると、このマルチスケールモデルは、統計的に実験データに類似した仮想陰極粒子を迅速に生成することができる。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 11:23:17 GMT)
Flood of Techniques and Drought of Theories: Emotion Mining in Disasters [0.0] 感情のマイニングは、災害時の人間の感情を理解するための重要なツールとなっている。
本研究の目的は,災害時における感情のマイニングに関する既存の研究を要約することである。
我々は感情のマイニング手法の有効性と信頼性を高めることを目的としている。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 00:43:05 GMT)
Experiments with truth using Machine Learning: Spectral analysis and explainable classification of synthetic, false, and genuine information [0.0] 本稿では, スペクトル分析, 可視化, 説明可能性の観点から, テキスト形式での合成, 偽, 真の情報を解析する。
情報を表現するために、複数のデータセットに様々な埋め込み技術が使用される。
分類は複数の機械学習アルゴリズムを用いて行われる。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 18:31:09 GMT)
Ensemble Boost: Greedy Selection for Superior Recommender Systems [0.0] 本研究は,レコメンデーション品質向上のためのアンサンブル技術の適用について検討する。
そこで本研究では,10種類の推薦モデルからトップkレコメンデーションを組み合わせる新しい手法を提案する。
提案手法の有効性を評価するために,5つの異なるデータセットの実験を行った。
論文参考訳(メタデータ) (Sun, 07 Jul 2024 00:50:52 GMT)
Discounted Pseudocosts in MILP [0.0] 割引擬似コストの概念を導入し、MILP(mixed-integer linear programming)への応用を探る。
強化学習の概念を統合することで,前向きの視点を疑似コスト推定に取り入れた新しいアプローチを提案する。
本研究では,ディスカウントされた擬似費用の背景にあるモチベーションを提示し,一段階の探索の後,枝分かれに対する期待される報酬をどう表現するかを議論する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 19:41:38 GMT)
Detecting new obfuscated malware variants: A lightweight and interpretable machine learning approach [0.0] 本稿では,高度に正確で軽量で解釈可能な,難読化マルウェアを検出する機械学習システムを提案する。
本システムでは,1つのマルウェアサブタイプ,すなわちSpywareファミリーのTransponderでのみ訓練されているにもかかわらず,15種類のマルウェアサブタイプを検出することができる。
トランスポンダー中心のモデルは99.8%を超え、平均処理速度はファイルあたり5.7マイクロ秒であった。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 12:41:40 GMT)
Challenges and Best Practices in Corporate AI Governance:Lessons from the Biopharmaceutical Industry [0.0] 我々は、AIガバナンスを運用しようとする組織が直面する課題について議論する。
これらには、AIガバナンスの物質的スコープをどのように定義するかに関する質問が含まれている。
私たちは、一般的なベストプラクティスでAIガバナンスフレームワークを設計、実装する責任を持つプロジェクトマネージャ、AI実践者、データプライバシオフィサーを提供したいと思っています。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 12:01:42 GMT)
Beyond Check-in Counts: Redefining Popularity for POI Recommendation with Users and Recency [0.0] 本稿では,POIの人気,チェックイン数,チェックイン登録者数に時間的影響を考慮し,信頼度を重視した人気度の定義を提案する。
実験結果から,POIの信頼度を考慮した人気定義では,単にチェックイン数に基づく人気定義よりも性能がよいことが示された。
論文参考訳(メタデータ) (Sun, 07 Jul 2024 13:23:15 GMT)
Beware of diffusion models for synthesizing medical images -- A comparison with GANs in terms of memorizing brain MRI and chest x-ray images [0.0] BRATS20, BRATS21, 胸部X線肺炎データセットを用いてStyleGANと拡散モデルの訓練を行い, 脳MRIおよび胸部X線画像の合成を行った。
以上の結果から,拡散モデルは,特に小規模なデータセットにおいて,StyleGANと比較してトレーニングイメージを記憶する可能性が示唆された。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 19:09:39 GMT)
Auditing of AI: Legal, Ethical and Technical Approaches [0.0] AI監査は、研究と実践の急速に成長している分野である。
AI監査に対する異なるアプローチには、さまざまな余裕と制約がある。
AIガバナンスメカニズムとしての監査の進化における次のステップは、これらの利用可能なアプローチのインターリンクであるべきです。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 12:49:58 GMT)
Artificial intelligence, rationalization, and the limits of control in the public sector: the case of tax policy optimization [0.0] AIシステムに対する批判の大部分が、Weberianの合理化の中心にあるよく知られた緊張から生まれたものであることを示す。
分析の結果,社会的・経済的平等を促進する機械的税制の構築が可能であることが示唆された。
また、AIによるポリシーの最適化は、他の競合する政治的価値観を排除することによってもたらされる、とも強調している。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 11:54:14 GMT)
Active Learning and Bayesian Optimization: a Unified Perspective to Learn with a Goal [0.0] 本稿では,適応サンプリング,アクティブラーニング,ベイズ最適化の膨大なファミリー間の類似点と相違点を明らかにするために,適応サンプリング手法の一般的な分類を提案する。
様々なベンチマーク問題に対するベイズスキームの性能を調査する学習基準を適用するためのガイドラインを提供する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 14:38:37 GMT)
AI and Social Theory [0.0] 我々は、人工知能(AI)が意味するものを定義することから始まる、AI駆動型社会理論のプログラムをスケッチする。
そして、AIベースのモデルがデジタルデータの可用性を増大させ、予測力に基づいて異なる社会的理論の有効性をテストするためのモデルを構築します。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 12:26:16 GMT)
A new approach towards quantum foundation and some consequences [0.0] 6つの仮定に基づく一般的な理論が紹介される。
基本的な概念は、観測者または通信観測者のグループと関連付けられた理論変数である。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 12:26:53 GMT)
A Theory of Machine Learning [0.0] 本稿では,この理論が統計学と計算学習理論の共通仮定に挑戦していることを示す。
本稿では, 自然言語処理とマクロ経済学のケーススタディについて, 新理論の観点から概説する。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 23:57:10 GMT)
A Multiparty Quantum Private Equality Comparison scheme relying on $\ket{ GHZ_{ 3 } }$ states [0.0] 本稿では,マルチパーティ量子プライベート比較を実現する革新的な絡み合いベースのプロトコルを提案する。
これは、億万長者の数に関係なく、プロトコルがGHZ3三重項のみを使用するためである。
このプロトコルは情報理論上は安全であり、外部の関係者が占いや内部のプレイヤーがお互いの秘密の番号を知るのを妨げている。
論文参考訳(メタデータ) (Sun, 7 Jul 2024 14:21:22 GMT)