FullStack Bench: Evaluating LLMs as Full Stack Coders [108.6] FullStack Benchは、幅広いアプリケーションドメインを含むフルスタックプログラミングに焦点を当てている。
FullStack Benchのマルチ言語プログラミング機能を評価するために,16の広く使用されているプログラミング言語から実世界の命令とそれに対応する単体テストケースを設計する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:58:59 GMT)
Immune: Improving Safety Against Jailbreaks in Multi-modal LLMs via Inference-Time Alignment [97.4] 訓練時安全アライメントにもかかわらず、MLLMは脱獄攻撃に弱いままである。
我々は、安全な報酬モデルを利用してジェイルブレイク攻撃を防御する推論時防衛フレームワークImmuneを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:48:27 GMT)
When Worse is Better: Navigating the compression-generation tradeoff in visual tokenization [92.2] 本稿では,第2段階のモデル手法の知識を用いて,第1段階の潜伏者に有用な帰納バイアスを埋め込むCausally Regularized Tokenization(CRT)を紹介する。
CRTは、ステージ1の再構築性能を悪化させるが、ステージ2の生成性能は、トークンをモデル化しやすくすることで向上する。
最先端の離散自己回帰画像ネット生成(2.18 FID)と画像あたりのトークンの半分以下とをマッチングする。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 20:32:02 GMT)
HoVLE: Unleashing the Power of Monolithic Vision-Language Models with Holistic Vision-Language Embedding [91.1] 本稿では,HoVLEという新しい高性能モノリシックVLMを提案する。
視覚的入力とテキスト入力を共有空間に変換し、LLMはテキストと同じ方法で画像を処理できる。
実験の結果,HoVLEは様々なベンチマークにおいて,主要な構成モデルに近い性能が得られることがわかった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:59:59 GMT)
Large Language Models-guided Dynamic Adaptation for Temporal Knowledge Graph Reasoning [87.1] 大規模言語モデル (LLM) は、時間的推論において広範な知識と卓越した能力を示した。
本稿では,時間的知識グラフに基づく推論のためのLarge Language Models-Guided Dynamic Adaptation (LLM-DA)法を提案する。
LLM-DAは、歴史的データを解析し、時間的論理規則を抽出するLLMの機能を利用する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:15:12 GMT)
Optimal bounds for dissatisfaction in perpetual voting [84.0] 我々は、投票者が何回も不満を抱いていないことを保証し、永遠の投票方法を考える。
我々は、不満のサブ線形成長が可能な有権者行動に関する十分な条件を特定する。
本稿では,専門家の助言による予測から得られた標準手法に基づいて,紛争条件下での不満をサブ線形に保証する投票手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 19:58:55 GMT)
Video-RAG: Visually-aligned Retrieval-Augmented Long Video Comprehension [83.0] Video-RAGはトレーニング不要で費用対効果の高いパイプラインで、視覚的に整列した補助テキストを使って、モダリティ間のアライメントを促進する。
72Bモデルを用いた場合,Gemini-1.5-Pro や GPT-4o などのプロプライエタリモデルよりも優れた性能を示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:09:50 GMT)
SSE-SAM: Balancing Head and Tail Classes Gradually through Stage-Wise SAM [82.3] 長い尾のシナリオにおける一般化を改善するには、頭と尾のクラス間の注意深いバランスが必要であると論じる。
SAMもImbSAMもこのバランスを完全に達成できないことを示す。
ImbSAMとSAMの相補的な強度を段階的アプローチで利用したSSE-SAM(Stage-wise Saddle Escaping SAM)を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:29:55 GMT)
Synthesizing Moving People with 3D Control [81.9] 対象とする3次元運動系列の単一画像から人物をアニメーションする拡散モデルに基づくフレームワークを提案する。
まず,1つの画像が与えられた人の見えない部分を幻覚させる拡散モデルについて学習する。
第2に,3次元人間のポーズによって制御される拡散に基づくレンダリングパイプラインを開発する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:42:11 GMT)
Vision Model Pre-training on Interleaved Image-Text Data via Latent Compression Learning [78.2] 本稿では,LCL(Latent Compression Learning)と呼ばれる視覚モデル事前学習手法を提案する。
学習対象は,1)視覚表現と先行文脈の対比学習,2)視覚表現に基づく後続テキストの生成という2つの基本課題に分解することができる。
実験により,本手法は,ペア付き事前学習データセット上でのCLIPの性能に適合するだけでなく,インターリーブ付き事前学習データの活用も可能であることが示された。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:24:44 GMT)
Multi-modal Agent Tuning: Building a VLM-Driven Agent for Efficient Tool Usage [75.8] 本稿では,マルチモーダルツール使用データを自動的に生成するマルチモーダルエージェントチューニング手法を提案する。
データ品質を維持するため、GPT-4oミニモデルにクエリ、ファイル、トラジェクトリを生成するよう促す。
T3-Agentは2つの人気のあるVLMの改良を一貫して達成している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:00:46 GMT)
Training-free Heterogeneous Graph Condensation via Data Selection [74.1] 本稿では, 高速かつ高品質な不均質凝縮グラフ生成を容易にする, FreeHGC と呼ばれる, 基礎となる不均質グラフ凝縮法について紹介する。
具体的には、不均質グラフの凝縮問題をデータ選択問題として再構成し、不均質グラフにおける代表ノードとエッジを評価し、凝縮するための新たな視点を提供する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:49:32 GMT)
AI-generated Image Quality Assessment in Visual Communication [72.1] AIGI-VCは、視覚コミュニケーションにおけるAI生成画像の品質評価データベースである。
データセットは、14の広告トピックと8つの感情タイプにまたがる2500のイメージで構成されている。
粗い人間の嗜好アノテーションときめ細かい嗜好記述を提供し、選好予測、解釈、推論におけるIQAメソッドの能力をベンチマークする。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:47:07 GMT)
Efficient MedSAMs: Segment Anything in Medical Images on Laptop [69.3] 我々は,迅速な医用画像のセグメンテーションに特化した初の国際コンペを組織した。
トップチームは軽量なセグメンテーション基盤モデルを開発し、効率的な推論パイプラインを実装した。
最高のパフォーマンスのアルゴリズムは、臨床導入を促進するために、ユーザフレンドリーなインターフェースを備えたオープンソースソフトウェアに組み込まれている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:33:35 GMT)
DiveR-CT: Diversity-enhanced Red Teaming Large Language Model Assistants with Relaxing Constraints [68.8] DiveR-CTを導入し、目的と意味の報酬に対する従来の制約を緩和し、多様性を高める政策により大きな自由を与える。
実験では,1)様々な攻撃成功率の多様な多様性指標において優れたデータを生成すること,2)収集したデータに基づく安全性チューニングによる青チームモデルのレジリエンスの向上,3)信頼性と制御可能な攻撃成功率に対する目標重みの動的制御,3)報酬過大化に対する感受性の低下など,ベースラインよりも優れたDiveR-CTの顕著な優位性を実証した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:37:32 GMT)
Utilize the Flow before Stepping into the Same River Twice: Certainty Represented Knowledge Flow for Refusal-Aware Instruction Tuning [68.6] Refusal-Aware Instruction Tuning (RAIT) により、Large Language Models (LLM) は未知の質問に答えることを拒否できる。
この粗末なアプローチは、LLMが正しく答えられる可能性のある質問に答えることを過剰に拒否する可能性がある。
本稿では,CRaFT(Certainty Represented Knowledge Flow for Refusal-Aware Instructions Tuning)を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:40:54 GMT)
Memory Layers at Scale [67.0] この研究はメモリ層を概念実証以上のものにし、現代の規模でその有用性を証明している。
ダウンストリームタスクでは、改善されたメモリ層で強化された言語モデルは、予算の2倍以上の高密度モデルよりも優れており、計算とパラメータの両方にマッチする場合の熟練モデルの混合も優れている。
最大128Bのメモリパラメータを持つスケーリング法則を1兆トークンまで事前訓練し,最大8Bパラメータを持つベースモデルと比較した,完全な並列化可能なメモリレイヤの実装を提供する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:36:52 GMT)
Deliberative Alignment: Reasoning Enables Safer Language Models [64.6] モデルセーフティ仕様を教える新しいパラダイムであるDeliberative Alignmentを紹介します。
このアプローチを使ってOpenAIのoシリーズモデルを整列させ、人書きのチェーンや回答を必要とせず、OpenAIの安全ポリシーに極めて正確な順守を実現しました。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:00:11 GMT)
CLEAR: Conv-Like Linearization Revs Pre-Trained Diffusion Transformers Up [64.4] CLEARと呼ばれる畳み込み型ローカルアテンション戦略を導入し,各クエリトークンの周囲のローカルウィンドウに特徴的インタラクションを限定する。
実験により,10K反復で10Kの自己生成サンプルに注意層を微調整することにより,事前学習したDiTから線形複雑度のある学生モデルへの知識伝達を効果的に行うことができた。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:57:09 GMT)
Technical Report for ICML 2024 TiFA Workshop MLLM Attack Challenge: Suffix Injection and Projected Gradient Descent Can Easily Fool An MLLM [62.9] 本報告では、TiFAワークショップMLLMアタックチャレンジに対処するための、トップランクのソリューションを紹介します。
まず、間違ったラベル付きオプション(擬似ラベル付き)から元のクエリに接尾辞としてテキストを追加する。
この修正クエリを用いて、画像に知覚不能な摂動を加えるためにPGD法を適用した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:17:50 GMT)
Rethinking Visual Dependency in Long-Context Reasoning for Large Vision-Language Models [62.7] LVLM(Large Vision-Language Models)は、クロスモデルタスクでは優れているが、長文推論ではパフォーマンスが低下する。
そこで本研究では,重要でないテキスト情報を選択的に除去する,学習不要なコンテキストプルーニング手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:19:17 GMT)
HREF: Human Response-Guided Evaluation of Instruction Following in Language Models [61.3] 我々は新しい評価ベンチマークHREF(Human Response-Guided Evaluation of Instruction following)を開発した。
HREFは信頼性の高い評価を提供するだけでなく、個々のタスクのパフォーマンスを強調し、汚染を受けない。
本稿では,評価セットのサイズ,判断モデル,ベースラインモデル,プロンプトテンプレートなど,HREFにおける鍵設計選択の影響について検討する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:26:47 GMT)
Formal Mathematical Reasoning: A New Frontier in AI [60.3] 我々は公式な数学的推論を提唱し、AI4Mathを次のレベルに進めるには不可欠であると主張している。
既存の進捗を要約し、オープンな課題について議論し、将来の成功を測るための重要なマイルストーンを想定します。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:19:24 GMT)
Multi-LLM Text Summarization [58.7] 本稿では,マルチLLM要約フレームワークを提案し,集中化と分散化を含む2つの異なるマルチLLM戦略について検討する。
当社のフレームワークは,各会話のラウンドにおいて,生成と評価という,基本的に重要なステップを2つ備えています。
我々のマルチLLM要約アプローチは, 1 つの LLM のみを最大 3 倍まで活用するベースラインを著しく上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 01:55:26 GMT)
Fairness-Accuracy Trade-Offs: A Causal Perspective [58.1] 我々は、初めて因果レンズから公正性と正確性の間の張力を分析する。
因果的制約を強制することは、しばしば人口集団間の格差を減少させることを示す。
因果制約付きフェアラーニングのための新しいニューラルアプローチを導入する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:47:48 GMT)
Multi-Pair Temporal Sentence Grounding via Multi-Thread Knowledge Transfer Network [57.7] 時間文グラウンドディング(TSG)は、ビデオ中のクエリ関連セグメントを見つけることを目的としている。
従来のメソッドは、異なるペアを一緒にトレーニングできないシングルスレッドフレームワークに従っていた。
我々はこれらのペアを協調訓練することを目的としたMulti-Pair TSGを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:50:11 GMT)
ExpeL: LLM Agents Are Experiential Learners [57.1] 実験学習エージェント(ExpeL)を導入し、パラメトリック更新を必要とせずにエージェント体験から学習できるようにする。
我々のエージェントは、経験を自律的に収集し、学習課題の集合から自然言語を用いて知識を抽出する。
推論において、エージェントは抽出された洞察と過去の経験をリコールし、情報的決定を行う。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:14:53 GMT)
Graph Structure Refinement with Energy-based Contrastive Learning [57.0] グラフの構造と表現を学習するために,生成学習と識別訓練のジョイントに基づく教師なしの手法を導入する。
ECL-GSRは、より少ないサンプルとメモリでテキストトレーニングを達成し、下流タスクの単純さと効率性を強調している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:05:09 GMT)
PersonaMagic: Stage-Regulated High-Fidelity Face Customization with Tandem Equilibrium [55.7] PersonaMagicは、高忠実な顔のカスタマイズのために設計された、ステージ制御された生成技術である。
本手法は,顔の概念を捉えるために,特定の時間間隔内に一連の埋め込みを学習する。
定性評価と定量的評価の両方において、ペルソナマジックが最先端の手法よりも優れていることを確認する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:41:25 GMT)
A New Bite Into Dark Matter with the SNSPD-Based QROCODILE Experiment [55.5] 低エネルギー(QROCODILE)におけるダークマターインシデントのための量子分解能線極低温観測による最初の結果を示す。
QROCODILE実験では、暗黒物質散乱と吸収の標的とセンサーとして、マイクロワイヤベースの超伝導ナノワイヤ単光子検出器(SNSPD)を使用している。
サブMeVダークマター粒子と30keV以下の質量との相互作用に関する新たな世界的制約を報告した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 19:00:00 GMT)
MR-Ben: A Meta-Reasoning Benchmark for Evaluating System-2 Thinking in LLMs [55.2] 大規模言語モデル(LLM)は、問題解決と意思決定の能力の向上を示している。
本稿ではメタ推論技術を必要とするプロセスベースのベンチマークMR-Benを提案する。
メタ推論のパラダイムは,システム2のスロー思考に特に適しています。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:52:00 GMT)
Dexterous Manipulation Based on Prior Dexterous Grasp Pose Knowledge [55.1] そこで本稿では,事前のきめ細やかな知識を活用して,効率と精度を両立させる新しい強化学習手法を提案する。
実験の結果,4つのタスクで学習効率と成功率が大きく向上した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:46:29 GMT)
Why Does Dropping Edges Usually Outperform Adding Edges in Graph Contrastive Learning? [54.4] グラフがネットワークにどのように適合するかを定量化するために、新しいメトリック、すなわちエラー通過率(EPR)を導入する。
理論的な結論とポジティブ・インセンティブ雑音のアイデアに触発されて、我々は新しいGCLアルゴリズム、エラー・パッシングに基づくグラフコントラスト学習(EPAGCL)を提案する。
EPRから得られる重みに基づいてエッジの追加とドロップによりビューを生成する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:38:47 GMT)
Exploiting Multimodal Spatial-temporal Patterns for Video Object Tracking [53.3] 本研究では,STTrack というマルチモーダル空間時間追跡手法を提案する。
従来のパラダイムとは対照的に,マルチモーダル時間情報を含むトークン列を連続的に生成する時間状態生成器(TSG)を導入している。
これらの時間情報トークンは、次の時刻におけるターゲットの局所化を誘導し、ビデオフレーム間の長距離コンテキスト関係を確立し、ターゲットの時間軌道を捕捉するために使用される。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:10:17 GMT)
The Only Way is Ethics: A Guide to Ethical Research with Large Language Models [53.3] LLM倫理白書(LLM Ethics Whitepaper)は、NLP実践者のオープンリソースであり、他人の仕事の倫理的意味を評価することを担当する。
私たちの目標は、倫理文学を明確な第一歩で考えるための具体的な勧告や挑発に翻訳することです。
LLM倫理白書」は、文献の徹底的なレビューを、ドとドナの明確な解釈に駆り立てたもので、本論文にも紹介する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:14:43 GMT)
NeuroPump: Simultaneous Geometric and Color Rectification for Underwater Images [52.9] 水中画像の復元は、水の屈折、吸収、散乱による幾何学的および色の歪みを取り除くことを目的としている。
本研究では,水中の形状と色を水が汲み出されているかのように同時に最適化し,修正する自己教師型方法であるNeuroPumpを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:40:28 GMT)
Underwater Image Quality Assessment: A Perceptual Framework Guided by Physical Imaging [52.9] PIGUIQAと呼ばれる水中画像品質評価(UIQA)のための物理画像誘導フレームワークを提案する。
提案手法に物理に基づく水中画像推定を取り入れ,直接透過減衰と後方散乱が画質に与える影響を計測する歪み測定値を定義した。
PIGUIQAは水中画像品質予測における最先端性能を実現し,高い一般化性を示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:31:45 GMT)
Collaborative Gym: A Framework for Enabling and Evaluating Human-Agent Collaboration [51.5] Collaborative Gymは、エージェント、人間、タスク環境間の非同期で三分割的なインタラクションを可能にするフレームワークである。
シミュレーション条件と実環境条件の両方において,Co-Gymを3つの代表的なタスクでインスタンス化する。
その結果、協調作業員はタスクパフォーマンスにおいて、完全に自律的なエージェントよりも一貫して優れていたことが判明した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:21:15 GMT)
Toward Robust Hyper-Detailed Image Captioning: A Multiagent Approach and Dual Evaluation Metrics for Factuality and Coverage [50.8] MLLM(Multimodal large language model)は、非常に詳細なキャプションを生成するのに優れるが、幻覚を引き起こすことが多い。
我々は,LLM-MLLM協調を利用して与えられたキャプションを補正するマルチエージェント手法を提案する。
提案手法は, キャプションの精度を向上し, GPT-4Vによるキャプションの精度を向上する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 01:37:22 GMT)
ChinaTravel: A Real-World Benchmark for Language Agents in Chinese Travel Planning [50.8] ChinaTravelは、中国の旅行計画シナリオに特化して設計されたベンチマークである。
質問紙から旅行要求を収集し,構成的に一般化可能なドメイン特化言語を提案する。
実証研究により、旅行計画における神経象徴薬の可能性を明らかにし、27.9%の制約満足度を達成した。
我々は、オープン言語推論や未確認概念構成など、現実世界の旅行計画展開における重要な課題を特定します。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:08:25 GMT)
Darkit: A User-Friendly Software Toolkit for Spiking Large Language Model [50.4] 大規模言語モデル(LLM)は、数十億のパラメータからなる様々な実践的応用に広く応用されている。
人間の脳は、生物工学的なスパイキング機構を使って、エネルギー消費を大幅に削減しながら、同じ仕事をこなすことができる。
私たちはDarwinKit(Darkit)という名のソフトウェアツールキットをリリースし、脳にインスパイアされた大きな言語モデルの採用を加速しています。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:50:08 GMT)
DOLLAR: Few-Step Video Generation via Distillation and Latent Reward Optimization [50.3] 本稿では,数段階のビデオ生成を実現するため,変量点蒸留と整合蒸留を組み合わせた蒸留法を提案する。
提案手法は10秒ビデオ(12FPSで128フレーム)の複数ステップ生成における最先端性能を示す。
1段階の蒸留により、教師モデルの拡散サンプリングを最大278.6倍加速し、ほぼリアルタイムで生成できる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:07:36 GMT)
LEARN: A Unified Framework for Multi-Task Domain Adapt Few-Shot Learning [49.3] 3つの異なるタスクにまたがる数ショットの学習設定にドメイン適応を組み合わせた最初の統合フレームワークを提案する。
私たちのフレームワークは高度にモジュール化されており、ドメイン適応を伴わずに、数ショットの学習をサポートすることができます。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:16:15 GMT)
Human-Readable Adversarial Prompts: An Investigation into LLM Vulnerabilities Using Situational Context [49.1] LLMの脆弱性に関する以前の研究は、しばしば非感覚的な敵のプロンプトに頼っていた。
このギャップには、より現実的で強力な脅威である、人間が読める敵のプロンプトに焦点を合わせることで対処する。
我々の重要な貢献は、映画スクリプトを利用した状況駆動攻撃で、LLMを騙すのに成功する文脈的関連性があり、人間可読なプロンプトを作成することである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:43:52 GMT)
NGQA: A Nutritional Graph Question Answering Benchmark for Personalized Health-aware Nutritional Reasoning [49.1] 食事は人間の健康において重要な役割を担っているが、個々の健康状態に対する食事の理由付けは大きな課題である。
栄養質問回答(QA)は,この問題に対処するための一般的な方法である。
栄養学的健康推論のために設計された最初のグラフ質問応答データセットであるNGQA(Nutritional Graph Question Answering)ベンチマークを紹介する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:13:46 GMT)
Emergence of a High-Dimensional Abstraction Phase in Language Transformers [47.6] 言語モデル (LM) は、言語コンテキストから出力トークンへのマッピングである。
我々は5つの事前学習されたトランスフォーマーベースLMと3つの入力データセットに対して、その解析、観察、高レベルの幾何学的アプローチをとる。
本結果は,多くの共通LMアーキテクチャにおいて,中心的な高次元位相がコア言語処理の基盤となることを示唆している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 23:09:46 GMT)
Mamba2D: A Natively Multi-Dimensional State-Space Model for Vision Tasks [47.5] State-Space Models (SSM) は、長年のトランスフォーマーアーキテクチャに代わる強力で効率的な代替品として最近登場した。
多次元の定式化から始めて、現代の選択的状態空間技術を再導出する。
Mamba2Dは、ImageNet-1Kデータセットを用いた標準的な画像分類評価において、視覚タスクに対するSSMの事前適応と同等の性能を示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:50:36 GMT)
Image Quality Assessment: Enhancing Perceptual Exploration and Interpretation with Collaborative Feature Refinement and Hausdorff distance [47.0] 現在のフルリファレンス画像品質評価(FR-IQA)手法は、しばしば参照画像と歪み画像とを融合させる。
本研究では,人間の視覚システムと協調して画像品質を正確に予測するFR-IQA法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:39:49 GMT)
Diffusion-Based Conditional Image Editing through Optimized Inference with Guidance [46.9] 本稿では,事前学習されたテキスト・画像拡散モデルに基づく,テキスト駆動型画像・画像翻訳のためのトレーニング不要なアプローチを提案する。
本手法は,事前学習した安定拡散モデルと組み合わせることで,様々なタスクにおける画像と画像の翻訳性能を向上する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:15:31 GMT)
Representation Learning of Daily Movement Data Using Text Encoders [46.9] 本研究では,データ変換に微調整された言語モデルを用いて符号化可能なテキスト文字列へのアクティビティ変換に基づく表現学習手法を設計する。
これにより、参加者や日数に対するクラスタリングとベクター検索が可能になり、ケアの個人化された配信を支援するための活動偏差の識別が可能になる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:18:45 GMT)
Know2Vec: A Black-Box Proxy for Neural Network Retrieval [46.8] Know2Vecはモデル動物園のブラックボックス検索プロキシとして機能する。
事前にブラックボックスインターフェースを通じてモデルにアクセスし、モデルから重要な決定知識を取得する。
クエリサンプル内の意味関係を探索することで、ユーザのクエリタスクを知識ベクトルにマップする。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:56:46 GMT)
All-in-One Tuning and Structural Pruning for Domain-Specific LLMs [46.7] ATP-オールインワンチューニングと構造プランニングを統一した1段階構造プランニングと微細チューニングのアプローチとして提案する。
ATPは、法律および医療分野におけるタスクにおいて、最先端の2段階のプルーニング手法より優れている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:57:10 GMT)
FedRLHF: A Convergence-Guaranteed Federated Framework for Privacy-Preserving and Personalized RLHF [46.6] Federated Reinforcement Learning with Human Feedback (FedRLHF)は、ヒューマンフィードバックプロセスによる強化学習を分散化する新しいフレームワークである。
FedRLHFは、生データや人的フィードバックの共有を必要とせずに、複数のクライアント間で協調的なポリシー学習を可能にする。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:56:31 GMT)
GURecon: Learning Detailed 3D Geometric Uncertainties for Neural Surface Reconstruction [46.3] 本稿では,幾何整合性に基づく神経表面の幾何不確実性場を確立する新しいフレームワークGUReconを提案する。
様々なデータセットの実験は、GUReconの3次元幾何学的不確かさのモデル化における優位性を示している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:02:01 GMT)
TL-Training: A Task-Feature-Based Framework for Training Large Language Models in Tool Use [46.2] 大規模言語モデル(LLM)は、外部環境と対話するツールを活用することで、目覚ましい進歩を遂げる。
大規模なデータセットに依存する標準教師付き微調整アプローチでは、ツール使用時のタスク固有の特性を見落としていることが多い。
本稿では,最適下トレーニングデータの効果を緩和するタスク機能ベースのフレームワークであるTL-Trainingを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:21:36 GMT)
Texture- and Shape-based Adversarial Attacks for Vehicle Detection in Synthetic Overhead Imagery [45.9] テクスチャおよび/または形状における敵攻撃(AA)の実践的実装制約を提案する。
これらの制約には、ピクセル化、マスキング、テクスチャの色パレットの制限、形状の変更の制限が含まれる。
その結果,本ソリューションの有効性を実証し,実用性と性能のトレードオフを明らかにした。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:39:20 GMT)
SparX: A Sparse Cross-Layer Connection Mechanism for Hierarchical Vision Mamba and Transformer Networks [45.7] 本稿では,視覚バックボーンネットワークのための効率的な層間特徴集約機構を提案する。
ヒト視覚系における網膜ガングリオン細胞(RGC)にインスパイアされ、SparXと呼ばれる新しいスパース層間結合機構を提案する。
我々の新しい接続機構は、様々な視覚タスクにおいて優れた性能と一般化能力を持つ。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:00:48 GMT)
Aria-UI: Visual Grounding for GUI Instructions [45.5] Aria-UIはGUIグラウンディング用に特別に設計された大規模なマルチモーダルモデルである。
そこで本稿では,グラウンド化のための多種多様な高品質な命令サンプルを合成するスケーラブルなデータパイプラインを提案する。
Arias-UIは、オフラインおよびオンラインエージェントベンチマークにまたがって、最先端の新たな結果を設定する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:16:57 GMT)
A High-Quality Text-Rich Image Instruction Tuning Dataset via Hybrid Instruction Generation [45.4] 大規模なマルチモーダルモデルは、不十分なトレーニングデータのために、まだテキストリッチなイメージに苦戦している。
Self-Instructは、命令データを生成するためのアノテーションのない方法を提供するが、その品質は劣っている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:55:15 GMT)
AdaSociety: An Adaptive Environment with Social Structures for Multi-Agent Decision-Making [45.2] AdaSocietyは、拡張状態とアクション空間を特徴とするカスタマイズ可能なマルチエージェント環境である。
エージェントが進むにつれて、エージェントが実行する社会的構造を持つ新しいタスクを適応的に生成する。
AdaSocietyは、さまざまな物理的および社会的環境におけるインテリジェンスを探索するための、貴重な研究プラットフォームとして機能する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:38:38 GMT)
Understanding the Structure and Resilience of the Brazilian Federal Road Network Through Network Science [45.0] 本稿では、ブラジルの連邦道路網を重み付きネットワークとしてモデル化する。
我々は, その地形特性を明らかにし, 75,000kmの道路を通じて, 国にとって重要な役割を担う重要な場所(都市)を特定することを目的とする。
本研究の目的は,ブラジルの連邦道路の全体構造を明確化し,インフラ計画の改善とネットワークのレジリエンス向上のための資源優先のための実用的な洞察を提供することである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:02:50 GMT)
NBMLSS: probabilistic forecasting of electricity prices via Neural Basis Models for Location Scale and Shape [45.0] 我々は、GAMLSSの原理的解釈可能性と、計算にスケーラブルな共有基底分解をブレンドした、位置、スケール、形状のためのニューラル基底モデルをデプロイする。
複数の市場領域で実験が行われ、分布型ニューラルネットワークに匹敵する確率論的予測性能を達成した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:58:17 GMT)
Extracting Interpretable Task-Specific Circuits from Large Language Models for Faster Inference [45.0] 大規模言語モデル(LLM)は、幅広いタスクで素晴らしいパフォーマンスを示している。
対象タスクを適切に実行するLLMのサブセットを自動的に抽出する新しい手法を提案する。
得られたモデルはかなり小さく、パラメータの数を82.77%まで減らし、(ii)より解釈可能であることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:11:44 GMT)
Effective (Floquet) Lindblad generators from spectral unwinding [45.0] Floquet理論はリンドブラッド形式の有効生成器の探索を著しく促進できることを示す。
この結果は, 複雑な多体系におけるFloquet Lindbladiansの工学的応用に関係している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:53:48 GMT)
CAMH: Advancing Model Hijacking Attack in Machine Learning [44.6] Category-Agnostic Model Hijacking (CAMH) は、新しいモデルハイジャック攻撃法である。
クラス番号のミスマッチ、データ分散のばらつき、元のタスクとハイジャックタスクのパフォーマンスバランスの問題に対処する。
本研究は,本来のタスクの性能を最小限に抑えつつ,攻撃効果を実証するものである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:32:01 GMT)
Federated Graph Condensation with Information Bottleneck Principles [44.4] グラフニューラルネットワーク(GNN)のためのFGC(Federated Graph Condensation)の新たな問題を提案し,研究する。
フェデレートされた設定の下では、凝縮グラフは一貫してデータメンバーシップのプライバシーをリークする。
私たちのフレームワークは、トレーニング中のメンバシップのプライバシを一貫して保護します。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:57:07 GMT)
Steady-state dynamics and non-local correlations in thermoelectric Cooper pair splitters [43.6] 超伝導体-量子ドットハイブリッドを用いたクーパー対分割器の最近の実験は, 固体中での絡み合いの発生に乗じている。
観測された輸送信号の基本成分を包括的に分析する。
我々の研究は超伝導-ハイブリッドクーパーペアスプリッタにおける量子相関のゲート電圧制御に関する詳細な知見を提供する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:47:26 GMT)
Scaling up Masked Diffusion Models on Text [43.2] 仮面拡散モデル(MDM)は言語モデリングにおいて有望であることを示す。
本稿では,MDMのスケーリングに関する最初の法則を確立する。
我々は、最大11億(B)のパラメータを持つMDMのファミリーをトレーニングし、そのパフォーマンスをより大きなサイズに対して評価する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:55:07 GMT)
Beyond Human Data: Aligning Multimodal Large Language Models by Iterative Self-Evolution [43.1] 本稿では,高品質な質問や回答を自律的に生成することのできる,新しい多モード自己進化フレームワークを提案する。
まず、画像駆動型セルフクエスト機構を実装し、画像コンテンツに基づいた質問の作成と評価を可能にする。
第2に,画像キャプションから答えの質を向上させるための自己改善手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:06:00 GMT)
Test Case-Informed Knowledge Tracing for Open-ended Coding Tasks [42.2] オープンエンドコーディングタスクは、コンピュータサイエンス教育で一般的である。
応答の正しさのみを分析する伝統的な知識追跡(KT)モデルは、学生のコードから学生の知識のニュアンスを完全に捉えることはできない。
テストケース・インフォームド・ナレッジ・トレーシング・フォー・オープンエンド・コーディング(TIKTOC)は,オープンエンドの学生コードとテストケースを同時に分析・予測するフレームワークである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:53:27 GMT)
Can Generative Video Models Help Pose Estimation? [42.1] ほとんどまたは全く重複しない画像から適切なポーズ推定を行うことは、コンピュータビジョンにおけるオープンな課題である。
多様なシーンから空間的関係を推定する人間の能力に触発され,新たなアプローチであるInterPoseを提案する。
本稿では,2つの入力画像間の中間フレームを幻覚化し,高密度な視覚遷移を効果的に生成するビデオモデルを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:58:24 GMT)
SAFERec: Self-Attention and Frequency Enriched Model for Next Basket Recommendation [41.9] BERT4RecやSASRecのようなトランスフォーマーベースのアプローチは、Next Item Recommendation (NIR)タスクで強いパフォーマンスを示す。
これらのアーキテクチャをNext-Basket Recommendation (NBR)タスクに適用することは、バスケットに膨大な数のアイテムの組み合わせがあるため、難しい。
本稿では, アイテム周波数情報による変換器アーキテクチャをNIRから拡張する, NBRの新しいアルゴリズムであるSAFERecを紹介する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:56:22 GMT)
Alignment faking in large language models [41.4] そこで本研究では,アライメント・フェイクに係わる大規模言語モデルについて述べる。
このモデルは、無料ユーザーの14%が有害なクエリに対応しているのに対して、有料ユーザーのほとんどいない。
また,モデルが強化学習によって有害なクエリに適合するように実際に訓練する効果についても検討し,アライメント・フェイキングの推論率を78%に向上させることを示した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:22:19 GMT)
RiTTA: Modeling Event Relations in Text-to-Audio Generation [41.4] テキスト・ツー・オーディオ生成モデルにおける音声イベント関係モデリングを体系的に研究する。
本稿では,既存のTTAモデルの音声イベント関係をモデル化する機能を強化するための微調整フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:14:00 GMT)
Language Repository for Long Video Understanding [41.2] LangRepoは簡潔で構造化された情報を解釈可能な表現として維持する。
Ego, NExTQA, NExTapi-the-artパフォーマンスなど, ゼロショットの視覚的質問応答ベンチマークを用いて評価を行った。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:06:14 GMT)
What if LLMs Have Different World Views: Simulating Alien Civilizations with LLM-based Agents [40.1] コスモアジェント(CosmoAgent)は、人類と地球外文明の複雑な相互作用をシミュレートする人工知能の枠組みである。
目標は、善意の文明を脅かす可能性のあるリスクを考慮しつつ、平和的な共存の実現可能性を評価することである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 22:44:43 GMT)
Multi-object operational tasks for measurement incompatibility [39.6] 本稿では,複数オブジェクトの量子サブチャネル識別と事前情報による排除ゲームという形での不整合性を測定するための多目的運用タスクを提案する。
完全あるいは部分的な資源を持ったオブジェクトのペアは、多目的のサブチャネル識別と排除ゲームとして好適に選択できることを示す。
そのようなゲームにおける全ての可能な完全自由オブジェクトに対して、完全あるいは部分的に資源を持ったオブジェクトによって提供される利点は、乗法的に定量化することができる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:18:03 GMT)
MetaScientist: A Human-AI Synergistic Framework for Automated Mechanical Metamaterial Design [39.6] 我々は、高度なAI機能と専門家の監視を統合した、人間によるループシステムであるMetaScientistを紹介する。
各段階において、ドメインの専門家は、システムの出力を反復的に検証し、科学的原則と人間の嗜好との整合性を確保するためにフィードバックと補助材料を提供する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:20:57 GMT)
Mitigating Social Bias in Large Language Models: A Multi-Objective Approach within a Multi-Agent Framework [39.2] 大規模言語モデル(LLM)における社会的バイアスを軽減するために,マルチエージェントフレームワーク(MOMA)内の多目的アプローチを提案する。
従来のデバイアス手法とは異なり、MOMAは下流タスクの精度を維持しながらバイアスを大幅に低減する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:35:39 GMT)
Data Quality Matters: Suicide Intention Detection on Social Media Posts Using RoBERTa-CNN [39.1] 本論文は自殺監視班の投稿における自殺意図の同定に焦点をあてる。
最先端のRoBERTa-CNNモデルを利用した新しいディープラーニング手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:21:16 GMT)
3D Shape Tokenization [38.4] 連続的でコンパクトで、機械学習モデルに組み込むのが容易な3D表現であるShape Tokensを紹介します。
形状トークンは、3次元フローマッチングモデルにおける形状情報を表す条件ベクトルとして機能する。
様々な機械学習モデルにShape Tokensをアタッチすることで、新しい形状を生成し、画像を3Dに変換し、テキストや画像と3D形状をアライメントし、可変、ユーザ指定、解像度で直接形状をレンダリングすることができる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:22:41 GMT)
XRAG: eXamining the Core -- Benchmarking Foundational Components in Advanced Retrieval-Augmented Generation [37.8] Retrieval-augmented Generation (RAG) は、Large Language Models (LLMs) の生成能力と関連するデータの検索を相乗化する
我々は,高度なRAGモジュールの基本コンポーネントの性能を徹底的に評価する,オープンソースのモジュールであるXRAGを紹介する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:37:07 GMT)
Personalized Representation from Personalized Generation [36.8] 我々は、パーソナライズされた合成データを用いてパーソナライズされた表現を学習するという課題を定式化する。
提案手法は,多様な下流タスクに対するパーソナライズされた表現学習を改善する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:59:03 GMT)
Sample Complexity of Linear Regression Models for Opinion Formation in Networks [36.8] ネットワークにおける意見収束のサンプル複雑性について検討する。
我々のフレームワークは、認識された意見形成ゲームに基づいて構築されている。
人工ネットワークと実世界のネットワークの実証結果は、我々の理論的な発見を強く支えている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:41:51 GMT)
HybGRAG: Hybrid Retrieval-Augmented Generation on Textual and Relational Knowledge Bases [36.5] 本稿では,レトリバーバンクと批評家モジュールからなるHQA用HybGRAGについて,次のような利点がある。
STaRKベンチマークの実験では、HybGRAGはパフォーマンスが大幅に向上し、hit@1の平均相対的な改善は51%である。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 19:49:12 GMT)
SCENIC: Scene-aware Semantic Navigation with Instruction-guided Control [36.2] SCENICは仮想シーン内の動的地形に適応する人間の動きを生成するために設計された拡散モデルである。
本システムは,シーン制約を維持しながら,異なる動作スタイル間のシームレスな遷移を実現する。
私たちのコード、データセット、モデルはurlhttps://virtual humans.mpi-inf.mpg.de/scenic/でリリースされます。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:25:15 GMT)
Can LLMs Obfuscate Code? A Systematic Analysis of Large Language Models into Assembly Code Obfuscation [36.1] マルウェアの作者は、マルウェアを検出しにくくするために、しばしばコードの難読化を用いる。
難読化されたコードを生成する既存のツールは、しばしば元のソースコードにアクセスする必要がある。
もし大きな言語モデル(LLM)が新しい難読化アセンブリコードを生成するとしたら?
もしそうなら、これはアンチウイルスエンジンにリスクをもたらし、攻撃者が新しい難読化パターンを作るための柔軟性を高める可能性がある。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:31:24 GMT)
PolySmart and VIREO @ TRECVid 2024 Ad-hoc Video Search [35.9] 本稿では,TRECVid AVSタスクの世代別検索について検討する。
語彙外問題に対処するために、Text2Text、Text2Image、Image2Textを使用します。
その結果、元のクエリと生成されたクエリの融合は、TV24クエリセットで元のクエリよりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:15:32 GMT)
What to Preserve and What to Transfer: Faithful, Identity-Preserving Diffusion-based Hairstyle Transfer [35.8] 既存の髪型移行アプローチはStyleGANに依存している。
本稿では,現実のシナリオに適用可能な一段階のヘアスタイル転移拡散モデルであるHairFusionを提案する。
本手法は, ヘアスタイルと周辺特性の整合性を維持する既存手法と比較して, 最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:01:10 GMT)
CustomTTT: Motion and Appearance Customized Video Generation via Test-Time Training [35.4] 本稿では,映像の外観や動きを簡単にジョイントできるCustomTTTを提案する。
それぞれのLoRAは個別に訓練されているので、組み合わせた後にパラメータを更新するための新しいテストタイムトレーニング手法を提案する。
本手法は, 定性評価と定量的評価の両面で, 最先端の作業に優れる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:05:13 GMT)
MLE-bench: Evaluating Machine Learning Agents on Machine Learning Engineering [35.2] MLE-benchは、AIエージェントが機械学習エンジニアリングでどのように機能するかを測定するためのベンチマークである。
われわれはKaggleから75のMLエンジニアリング関連のコンペを開催する。
私たちはKaggleが公開しているリーダーボードを使って、各競技の人間ベースラインを確立します。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:32:37 GMT)
User-Aware Prefix-Tuning is a Good Learner for Personalized Image Captioning [35.2] 従来の画像キャプション方式は、ユーザの好みや特徴を無視することが多い。
既存のほとんどの手法は、メモリネットワークやトランスフォーマーによるユーザコンテキストの融合プロセスを強調している。
本稿では,ユーザコンテキストを利用したパーソナライズされた画像キャプションフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:46:37 GMT)
Error-driven Data-efficient Large Multimodal Model Tuning [35.2] 大規模マルチモーダルモデル (LMM) は、多くの学術ベンチマークで顕著な性能を示している。
本稿では,新しいタスクにジェネリックLMMを効率よく適応することを目的とした,エラー駆動型データ効率チューニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:07:11 GMT)
QUART-Online: Latency-Free Large Multimodal Language Model for Quadruped Robot Learning [35.1] 本稿では,多モーダル大規模言語モデル(MLLM)を4つの視覚-言語-アクションタスクに展開する際の,固有の推論遅延問題に対処する。
言語基盤モデルの性能を劣化させることなく推論効率を向上させるために, QUIRT-Online と呼ばれる新しい待ち時間フリーの4重結合MLLMモデルを提案する。
実験の結果, QUIRT-Onlineは既存のMLLMシステムと連動して動作し, 制御周波数に同期してリアルタイムの推論を実現することがわかった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:17:06 GMT)
POPoS: Improving Efficient and Robust Facial Landmark Detection with Parallel Optimal Position Search [34.5] 本稿では,高精度符号化・復号化フレームワークであるParallel Optimal Position Search (POPoS)を紹介する。
Pseudo-range multilaterationは、ヒートマップエラーの修正に使われ、ランドマークのローカライゼーション精度が向上する。
1ステップの並列計算アルゴリズムを導入し、計算効率を高め、処理時間を短縮する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:03:07 GMT)
FLUX that Plays Music [33.9] 本稿では,FluxMusicと呼ばれるテキストから音楽への変換のための拡散型整流変換器の簡易拡張について検討する。
まず、二重テキスト-音楽ストリームに独立して注意を向け、続いて1つの音楽ストリームを積み重ねて、通知されたパッチ予測を行う。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:22:01 GMT)
SORREL: Suboptimal-Demonstration-Guided Reinforcement Learning for Learning to Branch [33.9] 混合線形プログラム(MILP)は、主に分岐サンプリング・アンド・バウンド(B&B)アルゴリズムに基づいて構築される。
本稿では,分枝学習のためのSORREL(Sub-Optimal-Demonstration-Reinforcement Learning)を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:48:53 GMT)
Architecture-Aware Learning Curve Extrapolation via Graph Ordinary Differential Equation [33.6] 本稿では,学習曲線を連続的に予測するアーキテクチャを考慮したニューラル微分方程式モデルを提案する。
我々のモデルは、純粋な時系列モデリングとCNNベースの学習曲線の両方に対して、最先端の学習曲線法および補間アプローチより優れている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:28:02 GMT)
MERaLiON-SpeechEncoder: Towards a Speech Foundation Model for Singapore and Beyond [33.5] MERaLiON-SpeechEncoderは、幅広いダウンストリーム音声アプリケーションをサポートするために設計された基礎モデルである。
シンガポールの国定マルチモーダル大言語モデルプログラムの一部として開発された。
このモデルは、シンガポールで話される諸種を含む、主に英語をサポートしている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:12:47 GMT)
Manta: Enhancing Mamba for Few-Shot Action Recognition of Long Sub-Sequence [33.4] 数ショットのアクション認識では、ビデオの長いサブシーケンスは、アクション全体をより効果的に表現する。
最近のMambaは、長いシーケンスをモデリングする効率を示すが、MambaをFSARに直接適用することは、局所的な特徴モデリングとアライメントの重要性を見落としている。
これらの課題を解決するために,Matryoshka MAmba と CoNtrasTive LeArning フレームワーク (Manta) を提案する。
Mantaは、SSv2、Kineetics、UCF101、HMDB51などの著名なベンチマークで、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:29:17 GMT)
Towards Projected and Incremental Pseudo-Boolean Model Counting [32.9] Pseudo-Boolean(PB)モデルカウンタは,プロジェクションとインクリメンタルモデルカウントをサポートする。
我々の評価では、PBCount2は、投影されたモデルカウントの競合するメソッドのベンチマーク数を少なくとも1.40倍、インクリメンタルモデルカウントにおける競合するメソッドの少なくとも1.18倍のベンチマークを完了した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:18:44 GMT)
Ensembling Large Language Models with Process Reward-Guided Tree Search for Better Complex Reasoning [32.6] 言語モデル Ensemble with Monte Carlo Tree Search (LE-MCTS) は、言語モデルのプロセスレベルのアンサンブルのための新しいフレームワークである。
LE-MCTSはマルコフ決定プロセスとして言語モデルの集合を用いてステップバイステップ推論を定式化する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:14:29 GMT)
Detecting Emotional Incongruity of Sarcasm by Commonsense Reasoning [32.6] 本論文は, 語義的意味に反する批判, モック, その他の否定的な感情を伝えるか否かを識別することを目的とした, 皮肉検出に焦点を当てた。
既存のメソッドは、複雑な現実世界のシナリオに直面した時に、常識的な推論能力に欠けており、不満足なパフォーマンスをもたらします。
本研究では,EICR と呼ばれるコモンセンス拡張に基づく不整合推論を行うサルカズム検出のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:39:34 GMT)
Augment then Smooth: Reconciling Differential Privacy with Certified Robustness [32.5] 標準偏差プライベートモデルトレーニングは,信頼性の高いロバスト性保証を提供するには不十分であることを示す。
本稿では,プライバシとロバスト性の両方を同時に実現する,シンプルで効果的なDP-CERTを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:28:36 GMT)
SODor: Long-Term EEG Partitioning for Seizure Onset Detection [32.5] サブシーケンスクラスタリングの新しいタスク定式化により,アクセプションのオンセットを明示的にモデル化する2段階フレームワーク,手法を提案する。
本手法は誤分類を補正し,他のベースラインよりも5%-11%の分類改善を実現し,発作発生を正確に検出する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:42:58 GMT)
Align Anything: Training All-Modality Models to Follow Instructions with Language Feedback [31.7] 人間のフィードバックからの強化学習(RLHF)は,大規模言語モデルの指示追従能力の向上に有効であることが証明されている。
モダリティの数が増えるにつれて、すべてのモダリティモデルを人間の意図と整合させることが、迫りくる課題となる。
我々は,200kの全モダリティな人間の嗜好データを含むアライメント・アライメント・フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:27:16 GMT)
Data Publishing in Mechanics and Dynamics: Challenges, Guidelines, and Examples from Engineering Design [31.6] 本稿では、力学および力学におけるデータパブリッシングの価値と課題を分析する。
後者は、データ駆動手法がブームになっている分野では、通常ではない課題や考察も提起している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:58:09 GMT)
DualGFL: Federated Learning with a Dual-Level Coalition-Auction Game [30.8] 協調競争環境におけるデュアルレベルゲームを用いた新しいフェデレーション学習フレームワークを提案する。
DualGFLには、クライアントが連立を結成する低レベルのヘドニックゲームと、連立者が参加を競う上位レベルのマルチアトリビュートオークションゲームが含まれている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:13:27 GMT)
Video Diffusion Transformers are In-Context Learners [30.6] 本稿では,ビデオ拡散変換器のコンテキスト内機能を実現するためのソリューションについて検討する。
本稿では,テキスト内生成を利用するための簡単なパイプラインを提案する: (textbfi$)ビデオは,空間的,時間的次元に沿って行われる。
当社のフレームワークは,研究コミュニティにとって貴重なツールであり,製品レベルの制御可能なビデオ生成システムを進化させる上で重要な洞察を提供する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:39:59 GMT)
AIR-Bench: Automated Heterogeneous Information Retrieval Benchmark [30.1] 自動不均一情報検索ベンチマーク(AIR-Bench)を提案する。
AIR-Benchのテストデータは、人間の介入なしに、大きな言語モデル(LLM)によって自動的に生成される。
信頼性が高く堅牢なデータ生成パイプラインを開発し、多種多様な高品質な評価データセットを自動的に作成する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:42:38 GMT)
Explicit View-labels Matter: A Multifacet Complementarity Study of Multi-view Clustering [29.7] 一貫性と相補性は、マルチビュークラスタリング(MVC)を促進する2つの重要な要素である
We developed a simple yet effective underlineMultifacet underlineComplementarity learning framework for underlineMulti-underlineView underlineClustering (MCMVC)。
ビューの相補的な学習をガイドするために、ビューラベルを明示的に使用するのは、これが初めてである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:57:09 GMT)
Quantum Algorithms for Stochastic Differential Equations: A Schrödingerisation Approach [29.7] 線形微分方程式に対する量子アルゴリズムを提案する。
アルゴリズムのゲートの複雑さは、次元に依存する$mathcalO(dlog(Nd))$を示す。
アルゴリズムはOrnstein-Uhlenbeck過程、ブラウン運動、L'evy飛行に対して数値的に検証される。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:59:58 GMT)
Magnetic Preference Optimization: Achieving Last-iterate Convergence for Language Model Alignment [29.2] 我々は,オリジナルゲームのNEに最終項目収束を達成できる新しいアプローチである磁気優先最適化(MPO)を導入する。
提案アルゴリズムは理論的に健全かつ実用的であることを保証するため,単純かつ効果的な実装を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:26:58 GMT)
MotiF: Making Text Count in Image Animation with Motion Focal Loss [28.0] Text-Image-to-Video (TI2V) の生成は、テキスト記述に従って画像からビデオを生成することを目的としている。
我々は、モデル学習をより多くの動きを持つ領域に誘導する、シンプルで効果的なアプローチであるMotiFを紹介した。
運動熱マップを生成するために光学的流れを使用し、運動の強度に応じて損失を重み付けする。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:57:06 GMT)
Less is More: Towards Green Code Large Language Models via Unified Structural Pruning [27.4] 語彙, 層, フィードフォワードネットワーク(FFN)プルーニングを組み合わせた, 革新的な統一的構造解析手法であるFlap-Prunerを提案する。
その結果、Flap-Prunerはパラメータの22%をプルーニングした後、元のパフォーマンスの97%を維持し、トレーニング後と同じあるいはそれ以上のパフォーマンスを達成していることがわかった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:13:09 GMT)
Climate Policy Elites' Twitter Interactions across Nine Countries [27.1] 我々は9カ国941の気候変動政策アクターを特定し、2017年から2022年にかけての活動を収集し、異なる組織レベルで17,700のアカウントから合計4800万のアクティビティを収集した。
気候関連の活動がいかに顕著であったかには、時間的・国家的変化がかなりあるが、すべての国家政策システムは、気候抗議のような気候に関する出来事に、同じように反応する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:08:20 GMT)
Craft: Cross-modal Aligned Features Improve Robustness of Prompt Tuning [26.9] 本稿では,モーダル・アラインド・フィーチャー・チューニング(Craft)手法を提案し,即時チューニングにおけるオーバーフィッティングの問題に対処する。
提案手法は,プロンプトモデルのロバスト性をさらに向上するため,アンカー整列した特徴空間上での最大平均離散性(MMD)を最小化することを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:26:52 GMT)
On User-side Fairness in Negative Sampling for Recommender Systems [26.6] 本研究では,非アクティブなユーザよりも,非アクティブなユーザに対して,非アクティブなネガティブサンプリング戦略をより正確に推奨することを示す。
グループ単位の負の比率設定を提案し、不活性なユーザに対して適切な小さい負の比率と、アクティブなユーザに対してより大きな負の比率を用いる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:51:41 GMT)
Low-Resource Machine Translation through the Lens of Personalized Federated Learning [26.4] 異種データを用いた自然言語処理に適用可能なMeltOptという新しい手法を提案する。
東南アジア語とフィンノ・ウグリ語のデータセットを用いて,低リソース機械翻訳タスクで評価を行った。
分析の結果,対象のデータセットサイズが補助言語間の重み分布に影響を及ぼし,非関連言語が訓練に干渉せず,補助パラメータが最小限に抑えられることがわかった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:43:47 GMT)
LoLaFL: Low-Latency Federated Learning via Forward-only Propagation [26.0] フェデレートラーニング(FL)は,分散データによるエッジラーニングを実現するためのパラダイムとして広く採用されている。
バックプロパゲーションによってトレーニングされたディープニューラルネットワークを持つ従来のFLは、第6世代(6G)モバイルネットワークの低レイテンシ学習要件を満たすことはほとんどできない。
我々は、線形識別特徴を学習し、その結果のホワイトボックスニューラルネットワークをFLに拡張するために、最大符号化率削減の最先端原理を採用する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:51:06 GMT)
Efficient Multi-Policy Evaluation for Reinforcement Learning [25.8] 対象とするすべてのポリシーにおける推定器のばらつきを低減するために、調整された行動ポリシーを設計する。
推定器は, 従来の最適手法に比べて, かなり低いばらつきを有することを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:45:00 GMT)
Learning Group Interactions and Semantic Intentions for Multi-Object Trajectory Prediction [25.8] 本稿では,グループレベルの相互作用を条件付き拡散モデルに統合する,拡散に基づく新しい軌道予測フレームワークを提案する。
我々は,Banzhafインタラクションを用いた協調ゲームとしてのグループインタラクション予測を行い,協調の傾向をモデル化した。
提案モデルでは,3つの広く適応されたデータセットの実験において,最先端の手法よりも優れる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:38:26 GMT)
Towards Efficient Object Re-Identification with A Novel Cloud-Edge Collaborative Framework [25.6] オブジェクト再識別(ReID)は、カメラ間で同じアイデンティティのオブジェクトを探すためにコミットされる。
現在のReID手法は、デプロイされたシステムが集中処理パラダイムに従うことを前提としている。
本稿では,ReIDシステムのためのクラウドエッジ協調フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:10:55 GMT)
AutoRank: MCDA Based Rank Personalization for LoRA-Enabled Distributed Learning [25.5] Low-Rank Adaptation (LoRA)は、モデル全体を最適化するのではなく、低ランク更新をパーソナライズすることで、この問題に対する有望な解決策を提供する。
バイアス分散トレードオフに着想を得た適応的なランク設定アルゴリズムであるAutoRankを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:27:45 GMT)
Interactive Scene Authoring with Specialized Generative Primitives [25.4] Specialized Generative Primitivesは、熟練していないユーザーが高品質な3Dシーンを作成できる生成フレームワークである。
各プリミティブは、実世界から1つの例の分布をキャプチャする効率的な生成モデルである。
実世界のシーンから様々なプリミティブを抽出し、3Dアセットやシーンを数分で作成できるように制御するインタラクティブセッションを紹介する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:39:50 GMT)
PruneVid: Visual Token Pruning for Efficient Video Large Language Models [24.9] マルチモーダルビデオ理解の効率化を目的とした視覚的トークンプルーニング手法PruneVidを紹介する。
LLMは、視覚的モダリティを解釈する能力の拡張により、ビデオタスクにおいて有望なパフォーマンスを示してきた。
提案手法を複数のビデオベンチマークで検証し,トークンの80%以上をPruneVidが実行可能であることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:01:58 GMT)
Prompt-based Unifying Inference Attack on Graph Neural Networks [24.9] グラフニューラルネットワーク(GNN)上での新規なPromptベースの統一推論攻撃フレームワークを提案する。
ProIAは、事前学習中にグラフの重要なトポロジ情報を保持し、推論攻撃モデルの背景知識を高める。
次に、統一的なプロンプトを利用し、ダウンストリームアタックにおいてタスク関連知識に適応するために、さらなる混乱要因を導入する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:56:17 GMT)
Revealing the Black Box of Device Search Engine: Scanning Assets, Strategies, and Ethical Consideration [24.7] 本研究は,デバイスサーチエンジンの操作性および倫理的側面を包括的に検討した最初の事例である。
これらのエンジンが利用するIPアドレスをトレースする新しいフレームワークを開発し,1,407個のスキャナIPを収集した。
我々の発見は、透明性の欠如、無害性、匿名性など、重大な倫理上の懸念を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:15:48 GMT)
GCA-3D: Towards Generalized and Consistent Domain Adaptation of 3D Generators [24.7] GCA-3Dはデータ生成の複雑なパイプラインを使わずに汎用的で一貫した3Dドメイン適応法である。
我々は,非逆方向の3次元生成モデルに効率よく適応するために,多モード深度対応型スコア蒸留サンプリング損失を導入する。
実験により, GCA-3Dは, 効率, 一般化, 精度, アイデンティティの整合性の観点から, 従来の手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:13:11 GMT)
BS-LDM: Effective Bone Suppression in High-Resolution Chest X-Ray Images with Conditional Latent Diffusion Models [24.6] 診断精度を向上させるために骨抑制技術が開発されている。
代替として深層学習に基づく画像生成法が提案されている。
BS-LDMと呼ばれる高分解能CXR画像における骨抑制のためのエンドツーエンドフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:36:17 GMT)
Score-based Generative Diffusion Models for Social Recommendations [24.4] 社会的レコメンデーションの有効性は、社会的ホモフィリの仮定に大きく依存している。
本稿では、革新的生成の観点から、社会的ホモフィリーの低い課題に取り組む。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:23:45 GMT)
EDO-Net: Learning Elastic Properties of Deformable Objects from Graph Dynamics [24.3] 本研究では、未知の物理特性に一般化する変形可能な物体のグラフ力学を学習する問題について検討する。
EDO-Netは,弾性特性の異なる様々なサンプルに対して学習したグラフ力学のモデルである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:00:50 GMT)
Predicting Long-Term Student Outcomes from Short-Term EdTech Log Data [24.2] 初回使用時間における学生のログを用いた機械学習予測器について検討した。
以上の結果から,2~5時間以内の短期ログ利用データを用いて,学生の長期外部パフォーマンスに関する貴重な情報を提供することが可能であることが示唆された。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 01:05:23 GMT)
Adaptive Prompting for Continual Relation Extraction: A Within-Task Variance Perspective [23.8] 本稿では,連続関係抽出における破滅的忘れに対処する新しい手法を提案する。
提案手法では各タスクにプロンプトプールを導入し,タスク内の変動を捉えるとともに,タスク間の差異を増大させる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:38:00 GMT)
Understanding Layer Significance in LLM Alignment [23.6] LLMアライメント(ILA)の重要なレイヤを特定するための新しい手法を提案する。
ILAは、さまざまなアライメントデータセットにまたがる重要なレイヤを一貫して識別する。
実験結果から,非定常層凍結はモデル全体の性能を向上する一方で,最重要層を選択的に調整することで,性能損失を最小限に抑えて微調整効率を著しく向上することが示された。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 19:24:24 GMT)
MGDA: Model-based Goal Data Augmentation for Offline Goal-conditioned Weighted Supervised Learning [23.4] Goal-Conditioned Weighted Supervised Learning (GCWSL) と呼ばれる最先端のアルゴリズムが、オフライン目標条件強化学習 (RL) における課題に取り組むために導入された。
GCWSLは、多様な目標達成タスクで優れたパフォーマンスを示し、シンプルで効果的で安定したソリューションを提供しています。
しかし、以前の研究ではGCWSLの限界として、軌跡縫合能力の欠如が指摘されている。
本稿では,モデルに基づく目標データ拡張(MGDA)アプローチを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:46:05 GMT)
Adapting to Non-Stationary Environments: Multi-Armed Bandit Enhanced Retrieval-Augmented Generation on Knowledge Graphs [23.4] 近年の研究では、検索-拡張生成フレームワークと知識グラフを組み合わせることで、大規模言語モデルの推論能力を強力に向上することが示されている。
我々は多目的帯域拡張RAGフレームワークを導入し、多様な機能を持つ複数の検索手法をサポートする。
本手法は,定常環境下での最先端性能を達成しつつ,非定常環境でのベースライン手法を著しく向上させる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:12:49 GMT)
Sparse Point Clouds Assisted Learned Image Compression [23.0] 自律運転シナリオにおける学習画像圧縮を支援するために,スパースポイントクラウドを用いた新しいフレームワークを提案する。
提案手法は,様々な主流画像圧縮モデルと互換性があり,既存の画像圧縮手法を用いてそのアプローチを検証する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:14:12 GMT)
Template-Driven LLM-Paraphrased Framework for Tabular Math Word Problem Generation [22.6] 多様な背景と正確なテーブル,質問,回答,ソリューションを備えた高品質なTMWPサンプルを生成するためのテンプレート駆動型LLMパラフレーズ(TeLL)フレームワークを提案する。
提案手法により,TabMWPデータセットの質問タイプに適応して高品質なデータセットTabMWP-TeLLを構築する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:34:57 GMT)
Autonomous Option Invention for Continual Hierarchical Reinforcement Learning and Planning [21.7] 本稿では,選択肢を考案し,表現し,活用するための新しいアプローチを提案する。
我々のアプローチは、長い地平線、スパース報酬、未知の遷移と報酬関数によって特徴づけられる問題に対処する。
我々の主な貢献は、シンボル表現を伴う移動可能で一般化可能な選択肢を継続的に学習するためのアプローチである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 23:04:52 GMT)
ChangeDiff: A Multi-Temporal Change Detection Data Generator with Flexible Text Prompts via Diffusion Model [21.5] 本稿では,セマンティックCD(SCD)タスクに着目し,マルチテンポラリSCDデータジェネレータであるChangeDiffを開発する。
ChangeDiffは2つのステップで変更データを生成する。まず、連続的なレイアウトを作成するためにテキストプロンプトとテキスト・ツー・イメージモデルを使用し、それからレイアウト・ツー・イメージを使用してレイアウトをイメージに変換する。
生成したデータは、時間的連続性、空間的多様性、および品質リアリズムの著しい進歩を示し、精度と伝達性で変化検出器を増強した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:58:28 GMT)
Competence-Based Analysis of Language Models [21.4] CALM (Competence-based Analysis of Language Models) は、特定のタスクの文脈におけるLLM能力を調べるために設計された。
我々は,勾配に基づく対向攻撃を用いた因果探究介入を行うための新しい手法を開発した。
これらの介入を用いてCALMのケーススタディを行い、様々な語彙推論タスクにおけるLCM能力の分析と比較を行う。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:28:07 GMT)
Temporal Elections: Welfare, Strategyproofness, and Proportionality [21.4] 各ラウンドで1つの選択肢が選択されるシーケンシャルな意思決定モデルについて検討する。
実用的福祉(Util)と平等的福祉(Egal)の2つの目的に焦点を当てる。
Util の最大化は簡単だが、Egal の対応する決定問題は制限された場合においてもNP完全である。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:29:43 GMT)
Meme Trojan: Backdoor Attacks Against Hateful Meme Detection via Cross-Modal Triggers [21.3] 本稿では,これまで無視されていたが,ヘイトフルミーム検出に対する重大な脅威であるバックドアアタックを紹介した。
特定のトリガーをミームサンプルに注入することで、バックドアアタッカーは検知器を操作して所望の結果を出力することができる。
ヘイトフルミーム検出に対するバックドア攻撃を開始するためのMeme Trojanフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:32:55 GMT)
Theoretical Study of Conflict-Avoidant Multi-Objective Reinforcement Learning [21.3] 本稿では,CA と FC という2つのサブプロデューサの選択肢に基づいて,新しい動的重み付けマルチタスク・アクター・クリティック・アルゴリズム (MTAC) を開発した。
MTAC-CAは、タスク間の最小値改善を最大化する競合回避(CA)更新方向と、MTAC-FCターゲットをはるかに高速な収束速度で見つけることを目的としている。
MT10における実験により,既存のMTRL法よりもアルゴリズムの性能が向上したことを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:23:53 GMT)
PromptOptMe: Error-Aware Prompt Compression for LLM-based MT Evaluation Metrics [21.2] 提案手法は,より小型の微調整言語モデルを用いて,評価プロンプトの入力データを圧縮するプロンプト最適化手法である。
評価品質を損なうことなくトークン使用率を2.37倍に削減できることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:08:02 GMT)
DINOv2 Meets Text: A Unified Framework for Image- and Pixel-Level Vision-Language Alignment [21.0] 計算コストのごく一部でCLIPライクなモデルをトレーニングする。
ゼロショット分類とオープンボキャブラリセマンティックセマンティックセグメンテーションの最先端結果を得る。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 20:46:48 GMT)
GraphSeqLM: A Unified Graph Language Framework for Omic Graph Learning [20.9] Graph Neural Networks (GNN)は、大規模シグナル伝達経路とタンパク質-タンパク質相互作用ネットワークを解析するための堅牢なフレームワークを提供する。
生物シークエンスを組み込んだGNNを強化するフレームワークであるグラフシーケンス言語モデル(GraphSeqLM)を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:05:26 GMT)
Unlearning Concepts in Diffusion Model via Concept Domain Correction and Concept Preserving Gradient [20.7] 我々はtextbfDoCo (textbfDomaintextbfCorrection) という新しい概念領域補正フレームワークを提案する。
本手法は, 対象概念の包括的未学習を保証し, 先進的学習を通して, センシティブな概念とアンカーの概念の出力領域を整合させることにより, 対象概念の包括的未学習を確実にする。
また、矛盾する勾配成分を緩和し、特定の概念を学習しながらモデルの実用性を維持するための概念保存的勾配手術手法も導入する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:23:46 GMT)
Synthetic Tabular Data Generation for Imbalanced Classification: The Surprising Effectiveness of an Overlap Class [20.6] 最先端の深部生成モデルでは, 多数例よりも極めて低品質な少数例が得られている。
本稿では,少数分布と多数分布が重複する領域のクラスを導入することで,二進分類ラベルを三進分類ラベルに変換する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:15:20 GMT)
Improving Zero-shot LLM Re-Ranker with Risk Minimization [20.3] Retrieval-Augmented Generation (RAG) システムでは、高度なLarge Language Models (LLMs) が、教師なしの方法で有効なQuery Likelihood Models (QLMs) として登場した。
しかし、直接的にQLMを近似させる手法は、推定された分布が実際の文書固有の分布から分岐する可能性があるため、偏りがある。
我々はベイズ決定理論を利用してこの推定バイアスを定量化し緩和する新しいフレームワーク、$mathrmUR3$を導入する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:59:10 GMT)
The Evolution of LLM Adoption in Industry Data Curation Practices [20.1] 本稿では,大規模技術企業における実践者間の言語モデル(LLM)の進化について考察する。
一連の調査、インタビュー、ユーザスタディを通じて、LLMの進化において組織がどのように重要な瞬間をナビゲートしているか、タイムリーなスナップショットを提供しています。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:34:16 GMT)
CoCoGaussian: Leveraging Circle of Confusion for Gaussian Splatting from Defocused Images [20.1] 3D Gaussian Splatting (3DGS)は高品質のノベルビューレンダリングで注目されている。
本稿では,非焦点画像のみを用いて正確な3次元シーン表現を可能にする,コンフュージョン対応ガウス平滑化回路CoCoGaussianを提案する。
合成データセットと実世界のデータセットの両方の実験では、CoCoGaussianが複数のベンチマークで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:25:20 GMT)
EMPRA: Embedding Perturbation Rank Attack against Neural Ranking Models [20.1] 敵対的攻撃は、ユーザーをターゲットコンテンツに公開することを目的として、文書のランク付けを操作しようとする。
EMPRAは文レベルの埋め込みを操作し、クエリに関連する関連するコンテキストへと誘導する。
EMPRAは、オリジナルコンテンツとシームレスに統合し、人間には受け入れられない敵対的なテキストを生成する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 22:36:19 GMT)
PERC: Plan-As-Query Example Retrieval for Underrepresented Code Generation [20.1] コード生成(PERC)における数ショットプロンプトのためのPlan-as-query例検索
PERCはコード生成における最先端のRAGメソッドよりも一貫して優れている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:12:28 GMT)
Better bounds on Grothendieck constants of finite orders [20.1] 我々は最近のフランク・ウルフのアプローチを利用して、いくつかのグロタンディーク定数を下限とするよい候補を提供する。
完全証明は難解な二項最適化問題を解くことに依存する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:08:21 GMT)
In-context Continual Learning Assisted by an External Continual Learner [19.4] 既存の継続学習(CL)手法は、大規模言語モデル(LLM)の微調整や適応に頼っている。
InCAは、外部連続学習者(ECL)をICLと統合し、CFなしでスケーラブルなCLを実現する新しいアプローチである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:44:41 GMT)
Insights from the Frontline: GenAI Utilization Among Software Engineering Students [19.3] ソフトウェア開発(SE)において、ジェネレーティブAI(genAI)ツールがユビキタスになった
我々は、genAIツールを用いてSE学習と実装を補完する学術的経験を探求する。
これらのツールがどのような状況で役に立つのか、どのように課題に直面するのか、そしてこれらの課題がなぜ発生し、学生にどのように影響するかを調べる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:30:51 GMT)
Can Input Attributions Interpret the Inductive Reasoning Process Elicited in In-Context Learning? [19.3] 本稿では,帰納的推論における刺激設計の欠如から着想を得た,合成診断タスクを紹介する。
問題は、従来のIA法がICLにおける帰納的推論過程の解釈においてそのような例を特定できるかどうかである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:35:42 GMT)
EGSRAL: An Enhanced 3D Gaussian Splatting based Renderer with Automated Labeling for Large-Scale Driving Scene [19.2] EGSRALは3D GSベースの手法で、追加のアノテーションを使わずに画像のトレーニングにのみ依存する。
EGSRALは、動的オブジェクトと静的バックグラウンドの両方をモデル化する3D GSの機能を強化する。
また,大規模な複雑なシーンをレンダリングする際の視点問題に対処するために,バニラ3D GSのグルーピング戦略を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:21:54 GMT)
CLIPLoss and Norm-Based Data Selection Methods for Multimodal Contrastive Learning [19.1] データ選択は、大規模ビジュアル言語モデル(例えば、CLIP)のコア問題として浮上した。
3つの主要なデータ選択アプローチは、(1)データ選択を支援するために外部のCLIPモデルを活用すること、(2)高品質なデータを選択するのにより効果的な新しいCLIPスタイルの埋め込みモデルをトレーニングすること、(3)より優れたメトリクスや戦略をCLIP埋め込みに普遍的に適用することである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:54:04 GMT)
S$^2$DN: Learning to Denoise Unconvincing Knowledge for Inductive Knowledge Graph Completion [19.1] 帰納的知識グラフ補完のためのセマンティック構造対応デノイングネットワーク(S$2$DN)を提案する。
我々のゴールは、一貫した意味的知識を蒸留するために適応可能な一般的な意味論と信頼できる構造を学ぶことである。
3つのベンチマークKGで実施された実験は、S$2$DNが最先端モデルの性能を上回ることを示した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:03:33 GMT)
Recording for Eyes, Not Echoing to Ears: Contextualized Spoken-to-Written Conversion of ASR Transcripts [19.0] 本研究では,ASRと文法の誤りに対処する文脈対応型スポンケン・トゥ・ブリッテン変換(CoS2W)タスクを提案する。
このタスクは、Large Language Models(LLM)のコンテキスト内学習機能と自然に一致する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:57:52 GMT)
ManiSkill-HAB: A Benchmark for Low-Level Manipulation in Home Rearrangement Tasks [18.7] MS-HABは、低レベルの操作と家庭内オブジェクト再構成のための総合的なベンチマークである。
我々は,現実的な低レベル制御をサポートし,GPUメモリ使用時の従来のマジックグリップ実装の3倍以上の高速化を実現している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:21:39 GMT)
On Robust Cross Domain Alignment [18.6] グロモフ・ワッサーシュタイン距離(Gromov-Wasserstein distance, GW)は、異なる周囲空間上で支持される分布間のアライメントの効果的な尺度である。
本稿では,GWとその変種を強固にするための3つの新しい手法について論じる。
それぞれの手法について,GW距離との相互依存性と個人関係ととともに,距離特性とロバスト性保証について検討する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:56:28 GMT)
Questioning the Unknown: Optimising Multi-Agent Collaboration in Narrative-Driven Games [18.4] We present Questum, a novel framework for Large Language Model (LLM) based agent in Murder Mystery Games (MMGs)。
MMGには、未定義の状態空間、中間報酬の欠如、継続的な言語領域における戦略的相互作用の必要性など、ユニークな課題がある。
Questumは、エージェント状態のセンサベース表現、情報ゲインによってガイドされる質問ターゲティングメカニズム、そして容疑者リストを洗練し、意思決定効率を高めるためのプルーニング戦略を通じて、これらの複雑さに対処する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:35:07 GMT)
Non-Uniform Parameter-Wise Model Merging [18.0] 我々は新しいアプローチであるNon-uniformを導入する。
賢いモデルマージ(英: wise Model Merging、NP Merge)は、各モデルのコントリビューションを学習することでモデルをマージする手法である。
勾配ベースの最適化を使った最終モデルへのパラメータ。
提案手法の有効性を実証的に実証し, 過去の手法よりも優れていた各種アーキテクチャのモデルを複数設定でマージする手法の有効性を実証した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 00:05:14 GMT)
Theory of Mixture-of-Experts for Mobile Edge Computing [18.0] モバイルエッジコンピューティングネットワークにおいて,Mixix-of-experts(MoE)理論を導入する。
我々のアプローチは、従来のMECアプローチとは異なり、時間とともに全体的な一般化誤差を一貫して減少させます。
また、ディープニューラルネットワーク(DNN)の実際のデータセットに関する広範な実験を行い、その結果を検証する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:09:10 GMT)
Automatic Spectral Calibration of Hyperspectral Images:Method, Dataset and Benchmark [18.0] ハイパースペクトル画像(HSI)は、空間と周波数領域の両方で世界を密にサンプリングする。
通常、HSIは様々な照明条件の影響を最小限に抑えるために校正する必要がある。
本稿では,HSIを自動的に校正する学習手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:01:54 GMT)
Difficulty-aware Balancing Margin Loss for Long-tailed Recognition [17.8] 本稿では,クラス不均衡とインスタンス難易度を考慮したDBM損失を提案する。
提案手法は既存の手法とシームレスに結合し,様々な長鎖認識ベンチマークの性能を継続的に改善する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 01:11:30 GMT)
QCS:Feature Refining from Quadruplet Cross Similarity for Facial Expression Recognition [17.8] 画像ペアからよりリッチな固有情報をマイニングするために、Cross similarity Attentionを導入する。
我々は、勾配競合を緩和する4分岐中央対称ネットワーク、Quadruplet Cross similarity (QCS) を設計する。
提案手法は,複数のFERデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:40:28 GMT)
EnhancePPG: Improving PPG-based Heart Rate Estimation with Self-Supervision and Augmentation [17.6] 本稿では、自己教師付き学習とデータ拡張を統合することにより、最先端のモデルを強化する手法であるEnhanceを提案する。
U-Netのようなオートエンコーダアーキテクチャにインスパイアされた我々は、大量のラベルのないデータを利用して、教師なしPSG信号再構成を利用する。
PPG-DaLiAの4.03 Beats-Per-Minute(BPM)から3.54 BPMエラーまで、最高の人事推定を12.2%改善します。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:25:50 GMT)
Real Faults in Deep Learning Fault Benchmarks: How Real Are They? [17.6] 本研究では,5つのベンチマークから490の障害を手動で解析し,その内314が本研究に適していることを確認した。
以上の結果から, 現実主義的条件を満たす障害は18.5%に過ぎなかった。
再発例は52%に過ぎなかった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 20:52:10 GMT)
NeSyCoCo: A Neuro-Symbolic Concept Composer for Compositional Generalization [17.5] NeSyCoCoは、シンボリック表現を生成し、それらを微分可能なニューラル計算にマッピングする、ニューロシンボリックフレームワークである。
我々のフレームワークは、ReaSCANとCLEVR-CoGenT合成一般化ベンチマークの最先端結果を達成する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:48:58 GMT)
SaliencyI2PLoc: saliency-guided image-point cloud localization using contrastive learning [17.3] SaliencyI2PLocは、Saliencyマップを機能集約に融合させる、対照的な学習アーキテクチャである。
本手法は,都市シナリオ評価データセット上で78.92%のRecall@1と97.59%のRecall@20を実現する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:20:10 GMT)
PromptLA: Towards Integrity Verification of Black-box Text-to-Image Diffusion Models [16.7] 現在のテキスト・ツー・イメージ(T2I)拡散モデルは高品質な画像を生成することができる。
良心的な目的のためにのみこのモデルを使用することを許可された悪意あるユーザーは、自分のモデルを変更して、有害な社会的影響をもたらす画像を生成するかもしれない。
本稿では,T2I拡散モデルの高精度かつ高精度な完全性検証のための新しいプロンプト選択アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:24:32 GMT)
Label-Efficient Data Augmentation with Video Diffusion Models for Guidewire Segmentation in Cardiac Fluoroscopy [16.6] 深層学習法はワイヤセグメンテーションにおいて高い精度とロバスト性を示した。
これらの手法は、一般化可能性のためにかなりのデータセットを必要とする。
ラベル付き蛍光ビデオの大規模なコレクションを生成するためのフレーム一貫性拡散モデル(SF-VD)を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:52:11 GMT)
Principal-Agent Bandit Games with Self-Interested and Exploratory Learning Agents [16.5] 本研究では,エージェントが武器を弾くためのインセンティブを提案することで,主役が未知の環境と間接的に対話する繰り返しプリンシパル・エージェント・バンディットゲームについて検討する。
既存の作業の多くは、エージェントが報酬手段について十分な知識を持っていると仮定し、常に欲張りに振る舞うが、多くのオンラインマーケットプレースでは、エージェントは未知の環境を学び、時には探索する必要がある。
そこで我々は,報酬推定を反復的に更新する探索行動を持つ自己関心学習エージェントをモデル化し,推定報酬プラスインセンティブを最大化するアームを選択するか,一定の確率で任意に探索するアームを選択する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 20:04:50 GMT)
REFA: Reference Free Alignment for multi-preference optimization [16.2] REFAは、複数のユーザの好みを最適化する参照不要アライメントメソッドのファミリーである。
我々の最高のREFA構成は、AlpacaEval v2ベンチマークでLC-WRが21.62%、WRが19.87%に達した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 22:25:23 GMT)
M2OST: Many-to-one Regression for Predicting Spatial Transcriptomics from Digital Pathology Images [16.2] 病理画像の階層構造に対応する多対一回帰変換器M2OSTを提案する。
1対1のイメージラベルペアで訓練された従来のモデルとは異なり、M2OSTはデジタル病理画像の異なるレベルからの複数の画像を使用して、共通の対応する領域における遺伝子発現を共同で予測する。
M2OSTはパラメータが少なく、浮動小数点演算(FLOP)で最先端のパフォーマンスを実現することができる
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:19:10 GMT)
SANPO: A Scene Understanding, Accessibility and Human Navigation Dataset [16.1] WHOの推計では、2020年には4330万人が失明しており、この数字は2050年までに6100万人に達すると予測されている。
現代のシーン理解モデルは、ナビゲーション、障害物回避、視覚認識機能によってこれらの人々に力を与えることができる。
本研究では,屋外ナビゲーション環境における密集予測を目的とした大規模エゴセントリックビデオデータセットであるSANPOを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 00:32:57 GMT)
What Are Step-Level Reward Models Rewarding? Counterintuitive Findings from MCTS-Boosted Mathematical Reasoning [15.7] ステップレベルの報酬モデル(SRM)は、強化学習に基づくプロセスの監督やステップレベルの優先順位調整を通じて、数学的推論性能を著しく向上させることができる。
近年,モンテカルロ木探索(MCTS)をステップレベルの自動選好アノテーションとして用いたAlphaZeroのような手法が特に有効であることが証明されている。
本研究は,コヒーレンスの直感的側面,特にMCTSに基づくアプローチに着目したものである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:56:23 GMT)
Offline Reinforcement Learning for LLM Multi-Step Reasoning [15.7] OREO(Offline Reasoning Optimization)は,多段階推論の強化を目的としたオフライン強化学習手法である。
これにより、ペアワイズデータを収集する必要がなくなり、より優れたクレジット割り当てが可能になる。
マルチステップ推論ベンチマークでは、既存のオフライン学習手法を超越している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:49:45 GMT)
Common-Sense Bias Discovery and Mitigation for Classification Tasks [15.7] テキスト記述に基づく画像データセットにおける包括的バイアス情報を抽出する新しい枠組みを提案する。
ダウンストリーム実験により,複数の画像ベンチマークデータセットから新しいモデルバイアスが検出された。
発見されたバイアスは、単純なデータ再重み付け戦略によって緩和することができる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 23:08:32 GMT)
Enhancing Generalized Few-Shot Semantic Segmentation via Effective Knowledge Transfer [15.5] 汎用的な少数ショットセマンティックセマンティックセマンティクス(GFSS)は、ベースクラスと新規クラスの両方のオブジェクトをセマンティクスすることを目的としている。
本研究では,文脈整合性学習方式を導入し,文脈知識をベースクラスから新しいクラスへ伝達する。
本手法はGFSS設定における技量を著しく向上させる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:25:33 GMT)
Pirates of Charity: Exploring Donation-based Abuses in Social Media Platforms [15.5] ソーシャルメディアプラットフォーム上で寄付ベースの詐欺を大規模に分析する。
不正な寄付を行うユーザを騙すために,様々な手法を用いて832件の詐欺を識別した。
本研究は,ソーシャルメディアプラットフォームがユーザを不正な寄付から守る能力の重大な弱点を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:26:43 GMT)
CensorLab: A Testbed for Censorship Experimentation [15.4] 我々は,インターネット検閲シナリオをエミュレートする汎用プラットフォームであるCensorLabを設計し,実装する。
CensorLabは、これまでまたは現在、現実世界の検閲によってデプロイされているすべての検閲メカニズムをサポートすることを目指している。
研究者や実践者が広範な実験を行えるように、使い易いプラットフォームを提供する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:17:24 GMT)
Black-Box Uniform Stability for Non-Euclidean Empirical Risk Minimization [15.3] 経験的リスク最小化問題に対して一様安定な1次アルゴリズムについて検討する。
本研究では,滑らかな凸損失に対する最適化アルゴリズムを一様安定な学習アルゴリズムに変換するブラックボックス削減手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:50:47 GMT)
TouchASP: Elastic Automatic Speech Perception that Everyone Can Touch [15.0] 大規模自動音声認識(ASR)モデルは、トレーニングプロセス中に大量のパラメータ、大量のデータ、重要な計算資源を必要とする。
本稿では,eMoEモデルの弾性混合モデルを提案する。このモデルを一度だけ訓練し,デプロイ要求に応じて弾性的に拡張することができる。
これら2つの手法を用いて,SpeechIOテストセットのキャラクタエラー率(CER)を4.98%から2.45%に低減し,弾力的展開を実現する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:28:04 GMT)
Med-Query: Steerable Parsing of 9-DoF Medical Anatomies with Query Embedding [14.9] 我々は,CTスキャンにおける解剖の検出,識別,セグメント化のための,安定かつ堅牢で効率的な計算フレームワークを提案する。
解剖学の複雑な形状、大きさ、配向を考えると、完全な3次元空間における9自由度(9-DoF)のポーズ推定解が提示される。
胸骨,脊椎,腹部臓器の3つの画像解析作業について,本法の有効性を検証した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:21:14 GMT)
LLM-Based Multi-Agent Systems for Software Engineering: Literature Review, Vision and the Road Ahead [14.8] 本稿では,LMA(Multi-Agent)システムへのLarge Language Modelの統合の可能性について検討する。
複数のエージェントの協調的かつ専門的な能力を活用することで、LMAシステムは自律的な問題解決を可能にし、堅牢性を改善し、現実世界のソフトウェアプロジェクトの複雑さを管理するスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:01:33 GMT)
FedGAT: A Privacy-Preserving Federated Approximation Algorithm for Graph Attention Networks [14.8] 半教師付きノード分類のためのフェデレートグラフ注意ネットワーク(FedGAT)アルゴリズムを提案する。
FedGAT は集中的な設定で GAT モデルとほぼ同じ精度を達成し、その性能はクライアントの数とデータ分散に対して堅牢である。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:48:46 GMT)
Improving Factuality in Large Language Models via Decoding-Time Hallucinatory and Truthful Comparators [14.7] 大きな言語モデル(LLM)は、検証可能な事実に矛盾する応答を生成する傾向がある。
応答幻覚を軽減するために,比較器駆動型復号時間(CDT)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:26:33 GMT)
COLUMBUS: Evaluating COgnitive Lateral Understanding through Multiple-choice reBUSes [14.6] 視覚的側方思考を多選択質問応答タスクとして定式化する。
タスク例をインスタンス化するための3段階の分類駆動手法について述べる。
テキストとアイコンのリバスパズルを用いたQAセット作成にタスクパイプラインを適用した総合ベンチマークであるCOLUMBUSを開発した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:14:37 GMT)
Contrastive Learning for Task-Independent SpeechLLM-Pretraining [14.5] 大規模言語モデル(LLM)は自然言語処理に優れている。
タスク固有の微調整は、リスク、データ要求、計算コストの過度な適合によって制限される。
スケーラブルな2段階トレーニング手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:33:31 GMT)
De-singularity Subgradient for the $q$-th-Powered $\ell_p$-Norm Weber Location Problem [14.5] 目的の勾配は特異点のかなりの集合には存在しない。
本稿では, 1leqslant p$ と $1leqslant p2$ の$q$-th-powered $ell_p$-norm の場合のデ・シンギュラリティ(de-singularity)を定式化する。
この問題に対して,Singularityのない$q$-th-powered $ell_p$-norm Weiszfeldアルゴリズム($q$P$p$NWAWS)を開発した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:12:08 GMT)
PLM-Based Discrete Diffusion Language Models with Entropy-Adaptive Gibbs Sampling [14.2] 拡散モデルとPLMを効果的に統合する新しいアプローチであるDiffusion-EAGSを紹介する。
実世界のアプリケーションでは一般的であるバイリンガルおよび低リソース設定に適応できることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:28:45 GMT)
A Roadmap for Software Testing in Open Collaborative Development Environments [14.1] オープンコラボレーティブ開発という分散した性質は、多様なコントリビュータと迅速なイテレーションとともに、ソフトウェア品質を保証するための新たな課題を提示します。
本稿では,オープンな共同開発環境におけるソフトウェア品質保証の最近の進歩に関する総合的なレビューと分析を行う。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:52:36 GMT)
A Stealthy Wrongdoer: Feature-Oriented Reconstruction Attack against Split Learning [14.1] Split Learning(SL)は、プライバシ保護機能と最小限の計算要件で有名な分散学習フレームワークである。
以前の研究は、トレーニングデータを再構築するサーバ敵によるSLシステムの潜在的なプライバシー侵害について、一貫して強調している。
本稿では,特徴指向再構築攻撃 (FORA) という,SL上での半正直なデータ再構成攻撃について紹介する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:55:11 GMT)
Future Aspects in Human Action Recognition: Exploring Emerging Techniques and Ethical Influences [14.1] 視覚に基づく人間の行動認識は、様々な応用分野において見られる。
次世代のハードウェアセンサーは、この問題に対処するロボットコミュニティをガイドする。
ヒューマンファクターの関与は、研究コミュニティの倫理的問題を提起する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:19:03 GMT)
Continual Learning Using Only Large Language Model Prompting [14.0] 本稿では,大規模言語モデル(LLM)をブラックボックスとみなす新しい連続学習パラダイムであるCLOBを紹介する。
また,LLMの入力長制限を克服するインクリメンタルな要約に基づいて,CISと呼ばれる新しいCL手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 01:21:57 GMT)
Tacit Learning with Adaptive Information Selection for Cooperative Multi-Agent Reinforcement Learning [13.9] 本稿では,情報選択と暗黙学習に基づく新しい協調型MARLフレームワークを提案する。
我々はゲーティングと選択機構を統合し、エージェントが環境変化に基づいて情報を適応的にフィルタリングできるようにする。
人気のあるMARLベンチマークの実験により、我々のフレームワークは最先端のアルゴリズムとシームレスに統合できることが示された。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:55:59 GMT)
DialSim: A Real-Time Simulator for Evaluating Long-Term Multi-Party Dialogue Understanding of Conversational Agents [13.9] リアルタイム対話シミュレータであるDialSimを紹介する。
本シミュレータでは、人気番組のキャラクターの役割をエージェントに割り当てる。
DialSimの主な特徴は、適切な時間内に応答するエージェントの能力を評価することである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:44:19 GMT)
Measuring Human and AI Values Based on Generative Psychometrics with Large Language Models [13.8] 本研究はGPV(Generative Psychometrics for Values)を紹介する。
GPVはデータ駆動値測定のパラダイムであり、テキスト検索による選択的知覚に基づいている。
GPVを人間によるブログに適用することにより、従来の心理学的ツールよりも安定性、妥当性、優越性を実証する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:35:24 GMT)
The RL Perceptron: Generalisation Dynamics of Policy Learning in High Dimensions [13.8] 強化学習アルゴリズムは、様々な領域において変形的であることが証明されている。
RLの多くの理論は、離散状態空間や最悪のケース解析に焦点を当てている。
本稿では,様々な学習プロトコルを捉えることができるRLの高次元解像モデルを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 00:54:33 GMT)
PoisonCatcher: Revealing and Identifying LDP Poisoning Attacks in IIoT [13.7] ローカル微分プライバシー(LDP)は、軽量で分散型でスケーラブルな性質のために、産業用IoT(Industrial Internet of Things)で広く採用されている。
LDPは小さな毒殺に対して多少のレジリエンスを提供するが、動的ネットワークと実質的なリアルタイムデータフローを備えたIIoTでは堅牢性に欠ける。
PDP攻撃を検知し、特定の汚染されたデータポイントを識別する4段階のソリューションであるPoisonCatcherを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:26:50 GMT)
Data-Centric Improvements for Enhancing Multi-Modal Understanding in Spoken Conversation Modeling [13.6] 本稿では,対話型音声モデリングにおけるマルチモーダル理解の効率化を目的とした,データ中心のカスタマイズ手法を提案する。
提案手法は,オープンウェイトモデルを用いたトレーニングデータの10%のみを用いて,Spken-SQuADベンチマークの最先端性能を実現する。
また、あいまいなユーザ要求と動的評価入力を備えたマルチターン音声対話のための最初のデータセットであるASK-QAを導入する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:43:09 GMT)
Continual Learning Using a Kernel-Based Method Over Foundation Models [13.3] CIL(Class-Incremental Learning)は、一連のタスクを段階的に学習する。
CILには、破滅的忘れ(CF)とタスク間クラス分離(ICS)の2つの主要な課題がある。
本稿では,CFやICSの問題を効果的に回避できるカーネル線形判別分析(KLDA)を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:09:18 GMT)
Boosting, Voting Classifiers and Randomized Sample Compression Schemes [13.2] 複数の弱い学習者を活用して強力な学習者を生み出すことを目的としている。
一般化誤差がサンプルサイズに1つの対数依存を含む投票分類器を出力するランダム化ブースティングアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:46:32 GMT)
What is the Role of Small Models in the LLM Era: A Survey [13.2] 大規模言語モデル(LLM)は人工知能(AGI)の進歩に大きな進歩をもたらし、GPT-4やLLaMA-405Bのような大規模モデルの開発に繋がった。
モデルのサイズを拡大すると、計算コストとエネルギー消費が指数関数的に増加し、これらのモデルは限られたリソースを持つ学術研究者やビジネスにとって実用的ではない。
同時に、Small Models (SM) は実際的な設定で頻繁に使用されるが、その重要性は過小評価されている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:11:41 GMT)
Personalized Clustering via Targeted Representation Learning [12.7] クラスタリングは伝統的に、ラベルのないデータ内の自然なグループ構造を明らかにすることを目的としています。
ターゲット表現学習を明示的に行うパーソナライズされたクラスタリング手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:08:30 GMT)
SegCol Challenge: Semantic Segmentation for Tools and Fold Edges in Colonoscopy data [12.6] この課題は、EdoMapperリポジトリからデータセットを導入し、手動で注釈付けされた、大腸フォールドと内視鏡ツール用のピクセルレベルのセマンティックラベルを特徴付ける。
折りたたみエッジを解剖学的ランドマークとして提供し、折りたたみラベルとツールラベルの両方から深度不連続情報を提供することにより、データセットは深度知覚と局所化方法を改善することを目的としている。
SegColは、大腸内視鏡ナビゲーションシステムのイノベーションを促進することを目指している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:21:05 GMT)
PolySmart @ TRECVid 2024 Medical Video Question Answering [12.2] 我々は,GPT4 が生成した映像の類似性と回答に基づいて,テキスト・テキスト検索を用いて関連ビデオの検索を行う。
視覚応答のローカライゼーションでは、応答の開始と終了のタイムスタンプは、ビジュアルコンテンツとサブタイトルの両方をクエリでアライメントすることによって予測される。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:59:59 GMT)
Multi-Object 3D Grounding with Dynamic Modules and Language-Informed Spatial Attention [12.2] D-LISAは3つのイノベーションを取り入れた2段階のアプローチである。
まず、可変で学習可能なボックスの提案を可能にする動的視覚モジュール。
第二に、提案毎に特徴を抽出するダイナミックカメラの位置決め。
第三に、言語インフォームド空間アテンションモジュールは、最終的な予測を出力する提案に対してより良い理由を持つ。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:52:45 GMT)
SGTC: Semantic-Guided Triplet Co-training for Sparsely Annotated Semi-Supervised Medical Image Segmentation [12.2] 本稿では,セマンティックガイド三重項協調学習フレームワークを提案する。
数個のボリュームサンプルの3つのスライスに注釈を付けるだけで、ハイエンドな医用画像セグメンテーションを実現する。
本手法は,スパースアノテーション設定下において,最先端の半教師付き手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:31:33 GMT)
AIR: Unifying Individual and Cooperative Exploration in Collective Multi-Agent Reinforcement Learning [12.0] 本稿では,2つの逆成分からなる同一性認識(AIR)による適応探索を提案する。
理論的には、AIRは個人と集団の両方の探索を訓練中に促進できることを証明し、様々なタスクにおけるAIRの有効性と有効性を示す実験を行った。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:18:30 GMT)
Dynamic Model Predictive Shielding for Provably Safe Reinforcement Learning [12.0] モデル予測シールド (MPS) は連続した高次元状態空間における複雑なタスクに有効であることが証明されている。
本稿では,実証可能な安全性を維持しつつ,強化学習目標を最適化する動的モデル予測シールド(DMPS)を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 23:55:33 GMT)
JailPO: A Novel Black-box Jailbreak Framework via Preference Optimization against Aligned LLMs [11.9] 我々は、LLM(Large Language Models)アライメントを調べるための新しいブラックボックスジェイルブレイクフレームワークであるJailPOを紹介する。
スケーラビリティと普遍性のために、JailPOは攻撃モデルを慎重に訓練し、隠蔽されたジェイルブレイクプロンプトを自動的に生成する。
また、優先最適化に基づく攻撃手法を導入し、ジェイルブレイクの有効性を高める。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:29:10 GMT)
Enriching Social Science Research via Survey Item Linking [11.9] 本研究では,SIL(Survey Item Linking)と呼ばれるタスクを2段階に分けてモデル化する。
この目的のために、20,454の英語文とドイツ語文からなる高品質でリッチな注釈付きデータセットを作成します。
タスクが実現可能であることを実証するが、エラーが第1段階から伝播し、全体のタスク性能が低下するのを観察する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:14:33 GMT)
MarkovType: A Markov Decision Process Strategy for Non-Invasive Brain-Computer Interfaces Typing Systems [11.7] 非侵襲脳波(EEG)を用いた脳-コンピュータインタフェース(BCI)のRapid Serial Visual Presentation(RSVP)パラダイムに焦点を当てる。
分類速度を制御しながらシンボルの分類性能を向上させるために,部分観測可能なマルコフ決定プロセス(POMDP)を提案することにより,タイピング設定をトレーニングに組み込む。
実験の結果,提案手法であるMarkovTypeは,競合に比べて精度の高いタイピングシステムであることがわかった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:59:41 GMT)
Function Space Diversity for Uncertainty Prediction via Repulsive Last-Layer Ensembles [11.6] 粒子最適化による関数空間の推測と不確実性推定を改善するための実用的な修正について論じる。
本研究では,粒子予測を多種多様に強制する入力サンプルがモデル性能に有害であることを示す。
トレーニングデータ自体の多様性は不適合につながる可能性があるが、ラベル削除データの拡張や、ラベル付けされていないアウト・オブ・ディストリビューションデータを使用することは、予測の多様性と不確実性の推定を改善することができる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:24:08 GMT)
Faithful and Accurate Self-Attention Attribution for Message Passing Neural Networks via the Computation Tree Viewpoint [11.5] 計算木に基づく自己注意型MPNNのエッジ属性計算法であるGATTを提案する。
その単純さにもかかわらず、モデル説明の3つの側面において、GATTの有効性を実証的に示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:17:45 GMT)
Autoware.Flex: Human-Instructed Dynamically Reconfigurable Autonomous Driving Systems [11.5] 本稿では,人間の入力を駆動プロセスに組み込んだ新しい自律運転システム(ADS)であるAutoware.Flexを提案する。
1)自然言語で表現された人間の指示を、ADSが理解できる形式に翻訳し、(2)これらの命令が安全かつ一貫して実行されることを保証する。
シミュレータと現実の自律走行車の両方で実施された実験は、Autoware.Flexが人間の指示を効果的に解釈し、安全に実行することを示した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:06:11 GMT)
ResoFilter: Fine-grained Synthetic Data Filtering for Large Language Models through Data-Parameter Resonance Analysis [11.3] モデル,データ,タスクを統合してデータセットを洗練するための新しい手法であるResoFilterを提案する。
我々の実験は、ResoFilterがフルスケールの微調整に匹敵する結果が得られることを示した。
この方法は、合成データセットの構築と高品質なデータ評価に有用な洞察を提供する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:01:06 GMT)
Mask-RadarNet: Enhancing Transformer With Spatial-Temporal Semantic Context for Radar Object Detection in Autonomous Driving [11.2] 本稿では,入力レーダデータから階層的セマンティック特徴をフル活用するMask-RadarNetというモデルを提案する。
Mask-RadarNetは、インターリーブド畳み込みとアテンション操作を組み合わせて、トランスフォーマーベースのモデルで従来のアーキテクチャを置き換える。
計算複雑性が比較的低く、パラメータも少ないため、提案したMask-RadarNetは、自律運転における物体検出における高い認識精度を実現する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:39:40 GMT)
Data Preparation for Fairness-Performance Trade-Offs: A Practitioner-Friendly Alternative? [11.2] トレーニング前のバイアスを軽減する前処理技術は効果的だが、モデルの性能に影響を与え、統合が困難になる可能性がある。
本報告では,MLライフサイクルの初期段階において,最適に選択されたフェアネス・アウェアの実践が,フェアネスとパフォーマンスの両面でいかに向上するかを実証的に評価する。
FATEを用いてフェアネスとパフォーマンスのトレードオフを分析し、FATEが選択したパイプラインと、前処理のバイアス緩和技術による結果を比較する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:12:39 GMT)
From General to Specific: Tailoring Large Language Models for Personalized Healthcare [11.1] パーソナライズされた医療言語モデル(PMLM)を提案する。
PMLMは、個人のニーズに合わせてパーソナライズされたパーソナライズされたプロンプトを設計するための行動や好みの変化をキャプチャする。
実世界の産婦人科データを用いてPMLMを評価し, PMLMがパーソナライズされた応答を達成できることを実験的に実証した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:51:12 GMT)
Don't Do RAG: When Cache-Augmented Generation is All You Need for Knowledge Tasks [11.1] 検索拡張世代(RAG)は,外部知識ソースを統合することで言語モデルを強化する強力なアプローチとして注目されている。
本稿では、リアルタイム検索をバイパスする代替パラダイムであるキャッシュ拡張生成(CAG)を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:58:32 GMT)
From Model Based to Learned Regularization in Medical Image Registration: A Comprehensive Review [11.0] 規則化は、解を解剖学的に意味のある変形へと導く上で重要な要素である。
既存のメソッドが十分であるとして、規則化はしばしば見過ごされるか、デフォルトのアプローチで対処される。
本総説では,多種多様な正規化手法を体系的に分類する新たな分類法を紹介する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:00:36 GMT)
Little is Enough: Boosting Privacy by Sharing Only Hard Labels in Federated Semi-Supervised Learning [11.0] 多くの重要なアプリケーションでは、機密データは本質的に分散しており、プライバシー上の懸念のために集中できない。
我々は、公的なラベル付きデータセット上で決定的な(堅い)ラベルのみを共有することにより、プライバシーを改善するフェデレーションコトレーニング(FedCT)アプローチを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:51:31 GMT)
Dynamic Label Name Refinement for Few-Shot Dialogue Intent Classification [10.9] そこで本研究では,文脈内学習による対話意図分類のための新しい手法を提案する。
本手法は,テスト入力に関する関連事例をトレーニングセットから検索する。
我々は,意味的理解に基づくインテントラベルを動的に洗練するために,大規模言語モデルを活用する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:53:57 GMT)
MathSpeech: Leveraging Small LMs for Accurate Conversion in Mathematical Speech-to-Formula [10.8] MathSpeechは、ASRモデルを小さな言語モデル(sLM)と統合して数学的表現の誤りを修正する新しいパイプラインである。
MathSpeechが有望な大規模言語モデル(LLM)に匹敵する$La$生成機能をデモ
MathSpeech は GPT-4o よりも優れていた。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:13:05 GMT)
InstructOCR: Instruction Boosting Scene Text Spotting [10.7] InstructOCRは、革新的な命令ベースのシーンテキストスポッティングモデルである。
私たちのフレームワークは、トレーニングと推論にテキストエンコーダと画像エンコーダの両方を使用します。
広く使われているベンチマークで最先端の結果が得られます。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:23:26 GMT)
Self-Supervised Radiograph Anatomical Region Classification -- How Clean Is Your Real-World Data? [10.6] 本研究は,48,434個の骨格X線撮影データから,14個の解剖学的領域のクラスを割り当てる自己教師手法の有効性を示した。
我々は,1つのモデルで96.6%,97.7%の線形評価精度をアンサンブルアプローチで達成した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:07:55 GMT)
A Modern Take on Visual Relationship Reasoning for Grasp Planning [10.5] 本稿では,視覚的リレーショナル推論による把握計画を提案する。
D3GDは、97の異なるカテゴリから最大35のオブジェクトを持つビンピックシーンを含む、新しいテストベッドである。
また、新しいエンドツーエンドのトランスフォーマーベースの依存性グラフ生成モデルであるD3Gを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:19:40 GMT)
Learning Massive-scale Partial Correlation Networks in Clinical Multi-omics Studies with HP-ACCORD [10.5] 擬似表現に基づくグラフィカル・モデル・フレームワークを提案する。
これは高次元の仮定の下で様々な指標における推定と選択の整合性を維持する。
最大100万変数のシミュレーションデータを用いて,我々のフレームワークの高性能コンピューティング実装を検証した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:56:10 GMT)
Experience of Training a 1.7B-Parameter LLaMa Model From Scratch [10.4] 約200億個のデータに対するDMaS-LLaMa-Liteのトレーニングから得られた洞察を共有します。
我々は、検証損失レベルとダウンストリームベンチマークの進化が、不整合テキストから、流動的で文脈に根ざしたアウトプットへの移行を反映しているかを記述した、完全なトレーニングの軌跡を詳述する。
これらの経験を詳述し、トレーニングログ、チェックポイント、サンプルアウトプットを提供することで、将来の研究者や実践者が事前学習戦略を洗練することを目指している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:00:33 GMT)
Federated Unlearning Model Recovery in Data with Skewed Label Distributions [10.2] 本稿では,スキューラベル分布を用いたフェデレーション・アンラーニングの回復手法を提案する。
まず、難解なクラスデータを補うために、深層学習とオーバーサンプリングを組み込んだ戦略を採用する。
そして、密度に基づく復調法を適用して、生成されたデータからノイズを除去する。
残りのすべてのクライアントは、強化されたローカルデータセットを活用し、未学習モデルのパフォーマンスを効果的に回復するための反復的なトレーニングに従事します。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:03:45 GMT)
Adaptive Hierarchical Graph Cut for Multi-granularity Out-of-distribution Detection [10.2] 本稿では,配布外検知(OOD検出)という重要な課題に焦点をあてる。
これまでの作業はまともな成功を収めましたが、現実の挑戦的なアプリケーションには効果がありません。
本稿では,異なる画像間の意味的関係を探索するために,適応階層型グラフカットネットワーク(AHGC)を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:32:02 GMT)
Post-hoc Interpretability Illumination for Scientific Interaction Discovery [10.2] イテレーティブ・キングス・フォレスト(iKF)は、変数間の複雑な多階相互作用を明らかにするために設計された。
iKFは、重要な変数と様々な順序の相互作用のランク付き短いリストを生成する。
選択されたインタラクションのパターンを分析するために、推論メトリクスを提供する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:17:12 GMT)
Fibottention: Inceptive Visual Representation Learning with Diverse Attention Across Heads [10.2] トランスフォーマーアーキテクチャにおけるMHSAの代替として,Fibottentionと呼ばれる新しいマルチヘッド自己アテンション(MHSA)モデルを提案する。
フィボテンションはデータ効率が高く、標準的なMHSAよりも大量のトークンを処理するのに適している。
拡張されたフィボナッチ配列に基づいて、構造化されたスパークアテンションを採用しており、ユニークなことに、アテンションヘッドによって異なる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:12:06 GMT)
Stealing That Free Lunch: Exposing the Limits of Dyna-Style Reinforcement Learning [10.1] Dyna-style off-policy model-based reinforcement learning (DMBRL)アルゴリズムは、合成状態遷移データを生成するための一連の技術である。
本稿では,異なるベンチマーク環境におけるDMBRLアルゴリズムの適用時に観測された驚くべき性能差を同定し,検討する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:43:29 GMT)
Language Models Resist Alignment: Evidence From Data Compression [10.0] 大型言語モデル(LLM)は意図しないあるいは望ましくない振る舞いを示すことがある。
微調整が事前学習に対するアライメントを著しく損なうことを示す。
本研究は,LLMの弾性特性に対処し,アライメントに対する抵抗を緩和する必要性を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:25:12 GMT)
"Sign in with ... Privacy'': Timely Disclosure of Privacy Differences among Web SSO Login Options [9.9] シングルサインオン(SSO)サービスでは、Webサイトや、IDプロバイダ(IdP)アカウントからの個人プロフィール情報への依存者(RP)アクセスを許可することができる。
多くのRPサイトは、ユーザーがログイン決定を下すのに十分なプライバシー関連の情報を提供していない。
我々は、主要なIdPログインオプション(Facebook、Google、Apple)をサポートする人気のあるRP実装を実証分析し、上位500サイトのRPを4つのクライアントサイドコードパターンに分類する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:47:23 GMT)
Measuring Cross-Modal Interactions in Multimodal Models [9.9] 既存のAIメソッドは、複数のデータソースの複合的な影響を理解するために不可欠な、モーダル間インタラクションをキャプチャできない。
本稿では,既存のアプローチの限界に対処する相互モーダルインタラクションスコアであるInterSHAPを紹介する。
我々は,InterSHAPが相互モーダル相互作用の存在を正確に測定し,複数のモーダルを扱えることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:11:20 GMT)
WebLLM: A High-Performance In-Browser LLM Inference Engine [9.8] WebLLMはオープンソースのフレームワークで、Webブラウザで高性能なLLM推論を可能にする。
WebLLMは、Webアプリケーションにシームレスに統合するためのOpenAIスタイルのAPIを提供する。
WebLLMは、同じデバイス上で80%のネイティブパフォーマンスを維持することができる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:24:13 GMT)
Variable Selection for Kernel Two-Sample Tests [9.6] 2サンプルテストの変数選択問題を考察する。
カーネルの最大平均誤差(MMD)に基づく新しいフレームワークを提案する。
提案手法は,分散正規化カーネルMDD統計量の最大化を図った,所定のサイズを持つ変数のサブセットを求める。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 01:03:34 GMT)
Legommenders: A Comprehensive Content-Based Recommendation Library with LLM Support [9.5] Legommendersはコンテンツベースのレコメンデーション用に設計されたライブラリである。
これにより、コンテンツエンコーダと振る舞いおよびインタラクションモジュールの併用トレーニングが可能になる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:18:02 GMT)
BMRS: Bayesian Model Reduction for Structured Pruning [9.5] 構造化プルーニングの完全エンドツーエンドベイズ手法を提案する。
BMRSの異なる前駆体から得られる2つの実現は、異なる構造化プルーニング特性をもたらす。
BMRSは、高い圧縮率と精度の両方をもたらすニューラルネットワークの構造的プルーニングに対して理論的に基礎的なアプローチを提供する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:18:13 GMT)
MAPLE: A Framework for Active Preference Learning Guided by Large Language Models [9.4] 大規模言語モデルに基づくベイズ的能動的嗜好学習のためのフレームワークであるMAPLEを紹介する。
以上の結果から,MAPLEは学習過程を加速し,質問に答える能力を向上させることが示唆された。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 01:08:20 GMT)
Approximate State Abstraction for Markov Games [9.2] 本稿では,2プレーヤゼロサムマルコフゲーム(TZMG)の状態抽象化を提案する。
2人のプレイヤーの報酬は環境とその行動を表す状態によって決定され、マルコフの決定プロセスに従って状態遷移が行われる。
TZMGでは、状態の数が増加するにつれて、計算平衡はより困難になる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:28:41 GMT)
Fearful Falcons and Angry Llamas: Emotion Category Annotations of Arguments by Humans and LLMs [9.1] 我々は,ドイツの議論コーパスにおける感情カテゴリーの主観的アノテーションをクラウドソースし,自動ラベリング手法を評価する。
感情カテゴリーは議論における感情の予測を促進する。
すべてのプロンプト設定とモデルにおいて、自動予測は、怒りと恐怖を予測するための高いリコールだが低い精度を示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:41:47 GMT)
Level-Navi Agent: A Framework and benchmark for Chinese Web Search Agents [9.0] 人間の言語を理解するために採用された大規模言語モデル(LLM)は、人工知能(AI)ウェブサーチエージェントの開発を促進する。
本稿では、レベル認識ナビゲーションによる汎用的かつトレーニング不要なWeb検索エージェントであるLevel-Navi Agentについて、十分な注釈付きデータセット(Web24)と適切な評価基準を伴って提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:03:12 GMT)
Safe Spaces or Toxic Places? Content Moderation and Social Dynamics of Online Eating Disorder Communities [9.0] ソーシャルメディアプラットフォームは、摂食障害を含むメンタルヘルスの懸念を議論するための重要な場所となっている。
本研究では、Twitter/X、Reddit、TikTok間での摂食障害に関する議論の比較分析を通じて、この知識ギャップに対処する。
以上の結果から,全プラットフォームにまたがるユーザが懸念を表明し,サポートを求める一方で,低調度(Twitter/Xなど)のプラットフォームは,食欲不振を増幅する有毒なエコーチャンバーの形成を可能にすることがわかった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:42:54 GMT)
Recent Advances in Named Entity Recognition: A Comprehensive Survey and Comparative Study [8.9] NERに対する最近のポピュラーなアプローチの概要を紹介する。
我々は、強化学習とグラフベースのアプローチについて論じ、NERの性能向上におけるそれらの役割を強調した。
我々は,異なる特徴を持つ各種データセット上での主NER実装の性能を評価する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:11:13 GMT)
Mapping the Mind of an Instruction-based Image Editing using SMILE [8.8] 本稿では,局所的解釈可能性の新たなモデル認識であるSMILE(Statistical Model-Agnostic Interpretability with Local Explanations)を紹介する。
私たちのモデルは、解釈可能性と信頼性をどのように改善できるかを示します。
これらの結果は、重要なアプリケーションにおける信頼性と信頼性に対するモデル非依存的解釈可能性のエキサイティングな可能性を示している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:33:23 GMT)
System Safety Monitoring of Learned Components Using Temporal Metric Forecasting [8.8] 学習可能な自律システムにおいて、学習したコンポーネントの安全性監視は、その出力がシステムの安全性違反に結びつかないことを保証するために不可欠である。
本稿では,確率的時系列予測に基づく安全監視手法を提案する。
安全度と違反予測精度を実証的に評価し、4つの最先端モデルの推論遅延とリソース使用率について検討した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:10:32 GMT)
Large Language Model assisted Hybrid Fuzzing [8.6] シンボリックパスの制約を計算・解決することなく,コンコリック実行の効果を実現する方法を示す。
大規模言語モデル(LLM)は、所望の分岐に到達するための修正された入力を生成するソルバとして使用される。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:23:25 GMT)
On the Impact of 3D Visualization of Repository Metrics in Software Engineering Education [8.6] 本研究は,VRを用いたリポジトリメトリクスの可視化がプロセス理解の教育にどのように役立つかを検討することを目的とする。
この研究は、学生を直感的な環境に没入させることで、VRが本質的な分析スキルを育むことができるという仮説を立てている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:06:15 GMT)
Overview of the First Workshop on Language Models for Low-Resource Languages (LoResLM 2025) [8.5] LoResLM 2025は、アラブ首長国連邦アブダビで開催された第31回計算言語に関する国際会議(COING 2025)と共同で開催された。
LoResLM 2025は自然言語処理(NLP)コミュニティから注目され、52件の論文から35件の論文が受理された。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:55:32 GMT)
Bi-directional Mapping of Morphology Metrics and 3D City Blocks for Enhanced Characterization and Generation of Urban Form [8.5] 都市の空間構成を調べる都市形態学は、都市デザインと持続可能性を結びつける。
性能評価と複雑な都市形態生成の間には, 形態指標と都市形態の切り離しが原因で, 重要なギャップが残っている。
本稿では,形態指標と複雑な都市形態の双方向マッピングを確立することの重要性を強調した。
本研究では,1) 都市形態を特徴付けるための形態指標を定式化し, 逆に, 多様な類似した3次元都市形態を検索し, 2) ブロックの3次元都市形態特性を表現するための形態指標の有効性を比較検討する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:22:55 GMT)
A Robust Prototype-Based Network with Interpretable RBF Classifier Foundations [8.5] 解釈可能性を含む様々な特性についてPBN(Prototype-Based Networks)を解析する。
我々の深層PBNは、他のアプローチの解釈可能性の欠点を解消しつつ、異なるベンチマークで最先端の分類精度を得る。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:25:31 GMT)
CrackUDA: Incremental Unsupervised Domain Adaptation for Improved Crack Segmentation in Civil Structures [8.4] 既存のクラックセグメンテーションアルゴリズムは、データセット間のドメインシフトによる正確性を維持する上で、課題に直面している。
本稿では,非教師なしドメイン適応(UDA)を用いた逆学習を用いた漸進的学習を取り入れた新しいディープネットワークを提案する。
実験により, 他のUDA法と比較して, ひび割れ分断精度と対象領域間の一般化が著しく向上したことが示された。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:55:08 GMT)
Permutation recovery of spikes in noisy high-dimensional tensor estimation [8.4] マルチスパイクテンソル問題に対する高次元流れのダイナミクスについて検討する。
我々の研究は, 正確な回収に必要なSNRの試料分離条件を決定する論文[Ben A, Gerbelot, Langevin]に基づく。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:17:38 GMT)
SOUS VIDE: Cooking Visual Drone Navigation Policies in a Gaussian Splatting Vacuum [8.4] エンドツーエンドの視覚ドローンナビゲーションのための新しいシミュレータ,トレーニングアプローチ,およびポリシーアーキテクチャ,いわゆるSOUS VIDEを提案する。
我々のシミュレータFiGSは、計算学的にシンプルなドローン動力学モデルと高忠実度ガウススプラッティングシーンの再構成を結合する。
SOUS VIDEのポリシーは、30%の質量変化、40m/sの風洞、周囲の明るさの60%の変化、シーンからのオブジェクトのシフトや削除、ドローンの視野を積極的に移動する人々に対して堅牢であることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:13:11 GMT)
Probabilistic Strategy Logic with Degrees of Observability [8.4] 情報透明性特性の推論は、セキュリティ、プライバシ、意思決定を含む多くの領域で有用である。
エージェントによる時間的特性の観測可能性の度合いを計測する新しい可観測性演算子を用いて確率論的戦略論理を拡張した。
結果の論理に対するモデルチェックの問題が決定可能であることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:14:50 GMT)
MacLight: Multi-scene Aggregation Convolutional Learning for Traffic Signal Control [8.3] 大規模道路網で訓練可能な交通信号制御ポリシーを, 強化学習手法により提案した。
現在のSOTA手法は、道路ネットワークをトポロジカルグラフ構造としてモデル化し、グラフ注意を深層Q-ラーニングに組み込み、局所的およびグローバルな埋め込みをマージしてポリシーを改善する。
交通信号制御(MacLight)のためのマルチシーン・アグリゲーション・コンボリューショナル・ラーニングを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:26:41 GMT)
ZTD$_{JAVA}$: Mitigating Software Supply Chain Vulnerabilities via Zero-Trust Dependencies [8.2] Log4jのようなサードパーティのライブラリは、ソフトウェア開発を加速するが、かなりのリスクをもたらす。
これらのライブラリの脆弱性は、ホストシステム内のリソースを侵害するソフトウェアサプライチェーン(SSC)攻撃につながった。
本稿では,SSC脆弱性の軽減を目的としたゼロトラスト依存性を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:06:57 GMT)
Using Case Studies to Teach Responsible AI to Industry Practitioners [8.2] 本稿では,対話型ケーススタディを用いた利害関係者第一の教育的アプローチを提案し,組織的・実践的エンゲージメントを育成する。
グローバルなテクノロジ企業であるMetaとのパートナーシップを詳述し、さまざまな企業のオーディエンスにRAIワークショップを共同開発して提供しています。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:02:30 GMT)
Multi-Source Unsupervised Domain Adaptation with Prototype Aggregation [8.1] マルチソースドメイン適応(MSDA)は、産業モデル一般化において重要な役割を果たす。
MSDAにおける最近の取り組みは、マルチドメイン分散アライメントの強化に焦点を当てている。
本稿では,クラスレベルとドメインレベルにおけるソースドメインとターゲットドメインの相違をモデル化するプロトタイプアグリゲーション手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:44:35 GMT)
Understanding When and Why Graph Attention Mechanisms Work via Node Classification [8.1] 構造ノイズが特徴雑音を超えると,グラフアテンション機構により分類性能が向上することを示す。
本稿では,単一層GATよりも優れたマルチレイヤグラフアテンションネットワーク(GAT)アーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:22:38 GMT)
Enhancing Large-scale UAV Route Planing with Global and Local Features via Reinforcement Graph Fusion [8.0] 本稿では,現在のUAVRPソルバを大規模インスタンスに堅牢に拡張するための一般化フレームワークを提案する。
グローバルな特徴を保ちながら,大規模な事例から部分グラフを抽出するために,Delaunay三角測量を用いる。
ユーザの要求に応じてカスタマイズ可能なデコード戦略を実装し,高品質なソリューションを実現する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:54:43 GMT)
AI Rules? Characterizing Reddit Community Policies Towards AI-Generated Content [8.0] メタデータとコミュニティルールを30万ドル以上の公開サブレディットで収集しました。
既存の文献と、AIルールに特有の新しい分類基準に基づいて、サブレディットとAIルールをラベル付けしました。
我々の研究結果は、AIに関する様々な懸念が、異なるコミュニティの文脈で出現したことを示している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 19:57:34 GMT)
Small Language Models as Effective Guides for Large Language Models in Chinese Relation Extraction [7.8] 本稿では,モデルコラボレーションフレームワークSLCoLMを提案する。
本フレームワークでは,SLM(Small-Training-Guide-Predict')とLLM(Large Language Model)の長所を組み合わせるために,TextitTraining-Guide-Predict'戦略を用いる。
関係型に富んだ古代中国のREデータセットを用いた実験により,この手法が長尾関係型のREを促進することを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:46:30 GMT)
Toward Robust Neural Reconstruction from Sparse Point Sets [7.8] 狭くノイズの多い3次元点群からSDF(Signed Distance Function)を学習する際の課題について考察する。
滑らかさの先行性に依存する最近の手法とは対照的に,我々の手法は分散ロバストな最適化(DRO)フレームワークに根ざし,正規化項を組み込んでいる。
本研究では,SDFの安定かつ効率的な最適化を実現するための枠組みであることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:49:02 GMT)
MORTAR: Metamorphic Multi-turn Testing for LLM-based Dialogue Systems [7.7] メタモルフィックなマルチTuRnダイアローグテストアプリMORTARを提案する。
MorTARは、フォローアップ質問応答(QA)ダイアログテストケースの生成を自動化する。
低コストでマルチターン対話システムのバグを検出する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:31:03 GMT)
Text Generation Models for Luxembourgish with Limited Data: A Balanced Multilingual Strategy [7.6] 本稿では,Luxembourgishに着目した低表現言語のための言語モデル開発における課題について論じる。
本稿では,限定されたルクセンブルク語データと同等量のドイツ語とフランス語データを組み合わせた,T5アーキテクチャに基づく新しいテキスト生成モデルを提案する。
評価のために,Luxembourgishにとって最初のテキスト生成ベンチマークであるLuxGenを紹介する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:43:33 GMT)
Variability Need Not Imply Error: The Case of Adequate but Semantically Distinct Responses [7.6] 不確実性定量化ツールは、モデルが不確実である場合の応答を拒否するために使用できます。
我々は、モデルがAdequate Responses (PROBAR)に割り当てる確率を推定する。
ProBARはアンビグニティ/オープンエンディエントネスの異なるプロンプトでセマンティックエントロピーを上回ります。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:02:26 GMT)
Adaptable and Precise: Enterprise-Scenario LLM Function-Calling Capability Training Pipeline [7.5] 実世界のビジネスシナリオに適した関数呼び出し機能のためのトレーニングパイプラインを提案する。
このパイプラインは、シナリオ固有の関数呼び出しデータの合成と拡張、モデル微調整、性能評価と分析を含む。
本モデルでは, GPT-4, GPT-4oを精度良く上回り, 評価, 実用化に優れた性能を示した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:20:21 GMT)
Speedup Techniques for Switchable Temporal Plan Graph Optimization [7.5] MAPF (Multi-Agent Path Finding) は、複数エージェントの衝突のない経路を計画することに焦点を当てている。
MAPF計画の実行中、エージェントは予期せぬ遅延に遭遇し、非効率性、デッドロック、さらには衝突に至る可能性がある。
本稿では,グラフベーススイッチブルエッジサーチ(GSES)を4つの高速化手法により大幅に高速化する改良GSESを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:59:15 GMT)
Novelty-Guided Data Reuse for Efficient and Diversified Multi-Agent Reinforcement Learning [7.4] 深層多エージェント強化学習(MARL)は、複雑な協調作業に取り組む可能性を実証している。
本稿では,観察の新規性に基づいてポリシー更新を動的に調整する新しいサンプル再利用手法を提案する。
MANGER(Multi-Agent Novelty-GuidEd sample Reuse)と名付けた。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:09:18 GMT)
SGAC: A Graph Neural Network Framework for Imbalanced and Structure-Aware AMP Classification [7.0] メダゲノミクスシークエンシングデータから抽出された多数のペプチドから抗微生物ペプチド(AMP)を分類することは、抗生物質耐性の問題に対処するための重要なアプローチである。
現在のAMP分類法は、主に配列に基づくデータに依存し、ペプチドの空間構造を無視し、AMPの正確な分類を制限している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:17:57 GMT)
Joint Supervised and Self-supervised Learning for MRI Reconstruction [7.0] Joint Supervised and Self-supervised Learning (JSSL)は、ディープラーニングに基づくMRI再構成アルゴリズムのための新しいトレーニング手法である。
JSSLは、ターゲットデータセットからのサブサンプルデータと教師付き学習方法で、完全にサンプル化された$k$-spaceデータを使用したデータセットを使用して、自己教師付き学習環境でモデルを同時にトレーニングすることによって動作する。
本研究は,画像品質指標を用いて,従来の自己監督手法よりも大幅に改善されたことを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:26:32 GMT)
Alt-MoE:A Scalable Framework for Bidirectional Multimodal Alignment and Efficient Knowledge Integration [6.9] マルチモーダル学習は、共有潜在空間内で異なるモダリティを整列させることにより、著しく進歩した。
直接アライメントは、豊富なモダル内知識を十分に活用するのに苦労し、しばしばクロスモーダル表現を達成するために広範なトレーニングデータを必要とする。
Alt-MoEはスケーラブルなマルチモーダルアライメントフレームワークで、モダリティをまたいだ多方向コネクタとして専門家(MoE)モデルの混合を利用する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:37:16 GMT)
Improved Forecasts of Global Extreme Marine Heatwaves Through a Physics-guided Data-driven Approach [6.9] 海洋熱波(MHW)は海洋生態系に大きな影響を及ぼす。
我々は10日間のMHW予測を正確に行うことができる新しいディープラーニングニューラルネットワークを構築した。
我々のフレームワークは精度が著しく高く、計算資源も少ない。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:47:56 GMT)
Cross-Lingual Transfer of Debiasing and Detoxification in Multilingual LLMs: An Extensive Investigation [6.8] 異なる微調整法がモデルのバイアスと毒性に与える影響について検討する。
キュレートされた非有害テキストの微調整は、バイアスを軽減するのにより効果的であることがわかった。
これらの手法を英語に適用することによって引き起こされる緩和は、英語以外の言語にも伝達される。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:55:35 GMT)
VerSe: Integrating Multiple Queries as Prompts for Versatile Cardiac MRI Segmentation [6.7] マルチプルクエリによる自動セグメンテーションと対話的セグメンテーションを統合するためのフレームワークであるVerSeを提案する。
私たちの重要なイノベーションは、共有セグメンテーションバックボーンのプロンプトとしてオブジェクトとクリッククエリを共同で学習することにあります。
提案した統合的プロンプトスキームでは,既存の手法よりも性能と効率が大幅に向上した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 22:35:47 GMT)
Efficient Solutions For An Intriguing Failure of LLMs: Long Context Window Does Not Mean LLMs Can Analyze Long Sequences Flawlessly [6.7] 大規模言語モデル(LLM)は、長い逐次入力の解釈と解析において顕著な能力を示した。
本稿では,長い入力シーケンスを扱う場合,LLMが短くなるという,驚くべき制限を明らかにする。
本稿では,LLMの性能を最大50%向上させるアドホックな手法を提案し,評価する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:19:58 GMT)
Universal Quantum Computation via Superposed Orders of Single-Qubit Gates [6.7] 我々は、任意の2量子ビット制御量子ゲートが決定論的に実現可能であることを証明した。
単一量子ビットゲートの重畳順序は、普遍的な量子計算を可能にする。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 20:32:45 GMT)
A study on the adequacy of common IQA measures for medical images [6.6] 医学画像に現れる不整合は、自然画像とは異なる性質を持つため、驚くべきことではない。
本研究では,手動評価胸部X線(5名)と光音響画像(2名)と比較し,医療画像データに対する一般的なIQA測定の有効性を検証した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:04:16 GMT)
Traffic-Rule-Compliant Trajectory Repair via Satisfiability Modulo Theories and Reachability Analysis [6.5] 自動走行車には、交通規則の遵守が難しい。
時間節約のための軌道補修手法を提案する。
高忠実度シミュレータと実世界の実験は,提案手法の利点を実証している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:26:22 GMT)
The Impact of Cut Layer Selection in Split Federated Learning [6.5] Split Federated Learning (SFL)は、フェデレートラーニングとスプリットラーニングを組み合わせた分散機械学習パラダイムである。
SFLでは、ニューラルネットワークをカット層に分割し、最初のレイヤをクライアントにデプロイし、残りのレイヤをトレーニングサーバに配置する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:52:54 GMT)
Quantum sampling on a quantum annealer for large volumes in the strong coupling limit for gauge group U(3) [6.5] 我々はD-Wave量子アニールを用いてサブ格子のヒストグラムを生成し、Metropolis-Hastingsアルゴリズムを用いて熱力学的観測値を決定する。
従来のモンテカルロシミュレーションから得られたものと比較した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:14:31 GMT)
Continual Learning with Strategic Selection and Forgetting for Network Intrusion Detection [6.3] 侵入検知システム(IDS)はデジタルインフラの保護に不可欠である。
本稿では,IDSの新しい連続学習手法であるSSF(Strategic Selection and Forgetting)を提案する。
提案手法は,新しいサンプルを選択的に選択する戦略的サンプル選択アルゴリズムと,古いサンプルをドロップする戦略的忘れ機構を備える。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:22:07 GMT)
Logical Consistency of Large Language Models in Fact-checking [6.3] 大規模言語モデル(LLM)は、様々な自然言語タスクを実行する上で大きな成功を収めている。
人間のようなテキストを生成する素晴らしい能力にもかかわらず、LLMは一貫性のない反応で悪名高い。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:42:25 GMT)
Distilling Invariant Representations with Dual Augmentation [6.2] 教師モデルと学生モデルの両方において、不変な特徴学習を促進するために、二重強化戦略を導入する。
我々の手法は、蒸留中に両方のモデルに適用された異なる拡張を活用し、学生に堅牢で伝達可能な特徴をつかむよう促す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 22:10:44 GMT)
A Brain-inspired Memory Transformation based Differentiable Neural Computer for Reasoning-based Question Answering [6.2] 人間の基本的な認知機能としての推論と質問応答は、現在の人工知能にとって大きな課題である。
本論文は,脳の学習と記憶機構に動機付けられ,記憶変換に基づく微分可能ニューラルネットワーク(MT-DNC)モデルを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 01:39:55 GMT)
Magnetic Resonance Imaging Feature-Based Subtyping and Model Ensemble for Enhanced Brain Tumor Segmentation [6.1] 本稿では,最先端セグメンテーションモデルを統合する深層学習に基づくアンサンブル手法を提案する。
BraTSデータセットに存在する腫瘍の不均一性を考えると、この手法はセグメンテーションモデルの精度と一般化性を高める。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 22:37:27 GMT)
Adult Glioma Segmentation in Sub-Saharan Africa using Transfer Learning on Stratified Finetuning Data [6.1] グリオーマは低所得国、中所得国、特にサハラ以南のアフリカで診断上の課題を呈している。
本稿では、最小限のMRIデータと低品質のMRIデータを用いて、リソース制限領域の課題に対処するために、トランスファーラーニングを用いたグリオーマセグメンテーションの新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 23:06:13 GMT)
Non-Linearities In Atomic Quantum Receivers: Harmonic And Intermodulation Distortion [6.1] Rydbergセンサーは、無線周波数検出(RF)にユニークなアプローチを提供する。
Rydberg原子受信機における非線形応答と歪み挙動は、性能指標の評価と確立に不可欠である。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:56:45 GMT)
Towards scientific discovery with dictionary learning: Extracting biological concepts from microscopy foundation models [6.1] 辞書学習(DL)は、大規模言語モデルの強力な解釈可能性ツールとして登場した。
本稿では,新しいDLアルゴリズムであるICFL(Iterative Codebook Feature Learning)を提案し,制御データセットからPCAホワイトニングを使用する前処理ステップと組み合わせる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 00:01:16 GMT)
Decoding fairness: a reinforcement learning perspective [6.0] 我々は,各プレイヤーに2つのQテーブルを割り当て,提案者と応答者の役割決定を導出する最後通しゲーム(UG)にQラーニングを適用する。
2人のプレイヤーのシナリオでは、経験と将来の報酬の両方が評価されるときに、公平さが顕著に現れる。
我々のメカニズム分析により,システムは2段階の段階を経て,最終的に公正あるいは合理的な戦略へと安定化することが明らかとなった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 01:29:49 GMT)
LiRCDepth: Lightweight Radar-Camera Depth Estimation via Knowledge Distillation and Uncertainty Guidance [6.0] LiRCDepthは軽量レーダーカメラ深度推定モデルである。
知識蒸留を取り入れてトレーニングプロセスを強化する。
このモデルはnuScenesデータセット上でMAEを6.6%改善する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 22:34:47 GMT)
Trustful LLMs: Customizing and Grounding Text Generation with Knowledge Bases and Dual Decoders [5.9] 本稿では,RAGコンテキストにおける知識三重項を利用して幻覚を補正する後処理アルゴリズムを提案する。
また、RAGコンテキストを融合して生成プロセスを導出するデュアルデコーダモデルを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 01:14:39 GMT)
Multi Agent Reinforcement Learning for Sequential Satellite Assignment Problems [5.9] 割り当て問題は、エージェントのグループをタスクのグループに割り当てる古典的な最適化問題である。
衛星、電力網、移動ロボットスケジューリングといった現代の多くの応用において、割り当て問題は時間とともに展開される。
この問題にマルチエージェント強化学習を適用し、既知のRL時間グリージーソルバからのブートストラップによる代入値の学習を行う。
我々は,本アルゴリズムが理論的に正当化され,他のアルゴリズムが経験した落とし穴を回避することを実証した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:10:34 GMT)
Reframing Image Difference Captioning with BLIP2IDC and Synthetic Augmentation [5.9] BLIP2IDCは,画像差分キャプション(IDC)タスクへのBLIP2の適応であり,低コストで導入する。
我々は、実世界のIDCデータセットにおいて、2ストリームのアプローチよりも大きな差があることを示します。
また,IDCモデルの性能を非依存的に向上させるために合成拡張法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:32:56 GMT)
Local Causal Discovery for Structural Evidence of Direct Discrimination [5.9] 直接識別のための局所的な発見(LD3)は、結果変数の因果親を特定することによって、直接不公平な構造的証拠を明らかにする方法である。
LD3は、直接識別の質的指標である重み付け制御された直接効果に対して、新しいグラフィカルな基準の下で有効な調整セット(VAS)を返すことを示す。
我々はLD3を用いて2つの複雑な意思決定システム、すなわち犯罪再犯予測と肝移植割当の因果フェアネスを分析する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:29:33 GMT)
Learning sparsity-promoting regularizers for linear inverse problems [5.8] 本稿では,線形逆問題の解法として,疎性促進型正規化器の学習手法を提案する。
本稿では,最適合成演算子を選択するための二段階最適化フレームワークを開発する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:26:54 GMT)
Latent Neural Operator for Solving Forward and Inverse PDE Problems [5.8] 本稿では、潜時空間におけるPDEを解く潜時ニューラルネットワーク(LNO)を提案する。
実験によると、LNOはGPUメモリを50%削減し、トレーニングを1.8回スピードアップし、6つのベンチマークのうち4つで最先端の精度に達する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 01:47:32 GMT)
Efficient Curation of Invertebrate Image Datasets Using Feature Embeddings and Automatic Size Comparison [5.5] 非脊椎動物の大規模な画像データセットをキュレートする手法を提案する。
我々のアプローチは、事前訓練されたディープニューラルネットワークによる特徴埋め込みの抽出に基づいている。
また,簡単な領域ベースサイズ比較手法により,多くの誤画像が検出可能であることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:35:41 GMT)
Graph Neural Network Training Systems: A Performance Comparison of Full-Graph and Mini-Batch [5.4] グラフニューラルネットワーク(GNN)は,近年,グラフ構造化データの表現を学習する能力から注目されている。
GNNのトレーニングには、ミニバッチトレーニングとフルグラフトレーニングの2つの一般的な方法がある。
我々は,代表的フルグラフとミニバッチGNNトレーニングシステムの総合的な比較実験を行った。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:47:52 GMT)
Self-supervised Spatial-Temporal Learner for Precipitation Nowcasting [5.4] 気象の短期予測は、時間と天候に依存した決定を行うために不可欠である。
本研究では,自己教師型学習の利点を活用し,空間時間学習と統合し,新しいモデルであるSpaT-SparKを開発した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:09:36 GMT)
Trust Calibration in IDEs: Paving the Way for Widespread Adoption of AI Refactoring [5.3] 大規模言語モデル(LLM)は、AIアシストを通じて前例のない規模で言語を改善するための新しいアプローチを提供する。
LLMには、ブレーキ変更やセキュリティ脆弱性の導入など、固有のリスクがある。
私たちは、IDE内のモデルとのインタラクションをカプセル化し、信頼できるセーフガードを使った試みを検証することを提唱します。
本稿では、自動化における人的要因の研究から確立されたモデルに基づいて、今後の課題を位置づける。
我々は,(1)新しい安全ガードの開発,(2)適切な信頼度を伝達するユーザインタラクションに関するCodeScene内のアクション研究の概要を概説する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:44:11 GMT)
Privacy Preserving Machine Learning for Electric Vehicles: A Survey [5.3] 電気自動車(EV)は毎日膨大な量のデータを生成する。
マシン/ディープ学習技術は様々なEVアプリケーションに使われている。
収集、ストレージ、および車両データのトレーニング中のプライバシー漏洩は重要な懸念事項である。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:44:47 GMT)
Mapping and Influencing the Political Ideology of Large Language Models using Synthetic Personas [5.2] 政治コンパステスト(PCT)を用いたペルソナに基づく大規模言語モデルの政治的分布をマッピングする。
実験の結果, 合成ペルソナは左リバタリアン・クアドラントに主に集合しており, 明示的なイデオロギー記述子による刺激による応答性の変化を示すモデルが得られた。
すべてのモデルは、右権威主義的位置への顕著なシフトを示すが、左リバタリアン位置へのより限定的なシフトを示し、モデルトレーニングの固有のバイアスを反映するイデオロギー的操作に対する非対称な反応を示唆している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:59:23 GMT)
Robustness-enhanced Myoelectric Control with GAN-based Open-set Recognition [5.2] 本稿では,筋電制御システムの堅牢性とユーザビリティを高めるために,GAN(Geneversarative Adrial Networks)に基づく新しいフレームワークを提案する。
GANベースの識別器を組み込んで未知の動作を識別・拒否し、誤分類を防止してシステムの安定性を維持する。
公開データセットと自己収集データセットの実験的評価は、未知のアクションを拒絶した後、既知のアクションに対する認識精度97.6%、アクティブエラーレート(AER)を23.6%改善したことを示している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:01:01 GMT)
Differentially Private Federated Learning of Diffusion Models for Synthetic Tabular Data Generation [5.2] DP-Fed-FinDiffフレームワークは、微分プライバシー、フェデレーションラーニング、拡散確率モデルの新たな統合である。
複数の実世界の財務データセットに対するDP-Fed-FinDiffの有効性を示す。
その結果、DP-Fed-FinDiffが、高度に規制されたドメインでセキュアなデータ共有とロバストな分析を可能にする可能性を確認した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:30:58 GMT)
Task-Specific Preconditioner for Cross-Domain Few-Shot Learning [5.1] タスク特化事前条件勾配降下(TSP)と呼ばれる新しい適応機構を提案する。
本手法はまず,各メタ学習領域の特徴を抽出するドメイン特化プレコンディショナーをメタ学習する。
我々はプレコンディショナーを正定値に制限し、プレコンディショニングされた勾配を最も急降下の方向へと導く。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 01:33:43 GMT)
Decoding Linguistic Nuances in Mental Health Text Classification Using Expressive Narrative Stories [5.1] 本研究は,自己宣言型抑うつを伴う人や無関係の人からの表現的物語(ENS)に着目し,そのギャップを埋めるものである。
本研究は,従来の言語モデルに対する高度言語モデルであるBERTとMentalBERTの有用性を評価する。
BERT は ENS における話題単語の欠如に対して最小限の感度を示し,より深い言語的特徴を理解する能力に優れていたことを示唆した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 19:29:21 GMT)
Development of a Large-scale Dataset of Chest Computed Tomography Reports in Japanese and a High-performance Finding Classification Model [5.0] 大規模言語モデルの最近の進歩は、高品質な多言語医療データセットの必要性を強調している。
我が国はCTスキャナの展開と利用を世界中にリードしているが,大規模な放射線学データセットの欠如により,医用画像解析のための特化言語モデルの開発が妨げられている。
われわれは,CT-BERT-JPNを「tohoku-nlp/bert-base-japanese-v3」アーキテクチャで構築した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:59:11 GMT)
Watertox: The Art of Simplicity in Universal Attacks A Cross-Model Framework for Robust Adversarial Generation [5.0] ウォータートックス(Watertox)は、アーキテクチャの多様性と精度制御による摂動を通じて、優れた効果を発揮するエレガントな敵攻撃フレームワークである。
Watertoxは、ビジュアルセキュリティシステムとCAPTCHA生成に将来的な応用が期待できる、敵の方法論における重要な進歩である。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:17:03 GMT)
Foxtsage vs. Adam: Revolution or Evolution in Optimization? [4.9] 本研究は、ハイブリッドFOX-TSAとグラディエントDescentを統合した新しいハイブリッド最適化手法であるFoxtsageを導入し、マルチ層パーセプトロンモデルのトレーニングを行う。
実験の結果、Foxtsageは損失平均の42.03%の減少(Foxtsage: 9.508, Adam: 16.402)、損失標準偏差の42.19%の改善(Foxtsage: 20.86, Adam: 36.085)を達成した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:20:58 GMT)
Mitigating Spurious Correlations via Disagreement Probability [4.9] 経験的リスク最小化(ERM)で訓練されたモデルは、ターゲットラベルとバイアス属性の急激な相関に偏りがちである。
すべてのデータサンプルのモデル性能を堅牢に向上する訓練目標を導入する。
次に, バイアスラベルを必要としない脱バイアス法DPR(Disagreement Probability based Resampling for Debiasing)を導出する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:52:41 GMT)
Code Review Automation Via Multi-task Federated LLM -- An Empirical Study [4.8] 本研究は,2つの逐次法,1つの並列法,2つの累積法を含む,マルチタスクトレーニングのための5つの簡単な手法について検討した。
その結果,フェデレートされたLLM(FedLLM)をコードレビューのマルチタスクのユースケースで逐次トレーニングすることは,タスク毎に個別のモデルをトレーニングするよりも,時間,計算,パフォーマンスの指標の面で効率が低いことが示唆された。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:46:46 GMT)
AI Apology: A Critical Review of Apology in AI Systems [4.8] 謝罪は、人間と人間の相互作用において、感情的なサポートを提供し、社会的プロセスを規制し、信頼違反の後に情報を交換するために使用される強力なツールである。
AI謝罪の新たな分野は、人工知能システムによる謝罪の使用を調査している。
この記事では、2020年から2023年の間に発表された研究に焦点を当て、AI謝罪研究の状況を初めて合成し、批判的に分析する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:58:27 GMT)
Stylish and Functional: Guided Interpolation Subject to Physical Constraints [4.7] デザイン操作の1つの例は、2つの参照デザインイメージを取得し、それらを両方の側面を組み合わせたデザインイメージを生成するプロンプトとして使用することである。
本稿では,2つの入力設計にインスパイアされた設計の問題点を考察し,生成プロセスにおける物理的,機能的要求を強制するためのゼロショットフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:41:15 GMT)
SemDP: Semantic-level Differential Privacy Protection for Face Datasets [4.7] 顔データセット全体に適用可能な意味レベル差分プライバシー保護スキームを提案する。
まず、顔データセットから意味情報を抽出して属性データベースを構築し、その属性データを隠蔽するために差動摂動を適用し、最後に画像モデルを用いて保護された顔データセットを生成する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:00:59 GMT)
ConCSE: Unified Contrastive Learning and Augmentation for Code-Switched Embeddings [4.7] 本稿では、2つの言語が1つの発話の中で交わるコードスイッチング(CS)現象について検討する。
我々は、他の言語におけるCSの現在の等価制約(EC)理論は、部分的にしか英語と韓国のCSの複雑さを捉えていないことを強調した。
我々は,このような課題を緩和するために,英語と韓国のCSシナリオに適した新しいKoglishデータセットを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:58:22 GMT)
The First Multilingual Model For The Detection of Suicide Texts [4.7] 自殺観念は世界中で何百万人もの人々に影響を及ぼす深刻な健康問題である。
ソーシャルネットワークは、ユーザの感情表現を通じて、これらのメンタルヘルス問題に関する情報を提供する。
本稿では,mBERT,XML-R,mT5などのトランスフォーマーアーキテクチャを利用した多言語モデルを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:23:59 GMT)
A Deep Probabilistic Framework for Continuous Time Dynamic Graph Generation [4.6] このアプローチを連続時間動的グラフの生成フレームワークであるDG-Genとして定式化する。
実験により,DG-Genは従来の手法に比べて高忠実度グラフを生成するだけでなく,リンク予測タスクも大幅に向上することが示された。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:34:11 GMT)
Exploitation All the Way Down: Calling out the Root Cause of Bad Online Experiences for Users of the "Majority World" [4.1] グローバルマジョリティのユーザは、オンラインプラットフォームとの対話において、さまざまな害にさらされている。
このエッセイは、人工知能の進歩における搾取が歴史的搾取とどのように結びついているかを照らしている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:35:03 GMT)
SEREP: Semantic Facial Expression Representation for Robust In-the-Wild Capture and Retargeting [4.1] セマンティック表現表現(Semantic Expression Representation, SEREP)は, セマンティックレベルで表現を同一性から切り離すモデルである。
我々は、ドメイン適応に依存する新しい半教師付きスキームを用いて、単眼画像から表現を予測するモデルを訓練する。
実験の結果、SEREPは最先端の手法よりも優れており、挑戦的な表現を捉え、それらを新しいアイデンティティに転送する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:57:01 GMT)
Fast, robust and laser-free universal entangling gates for trapped-ion quantum computing [4.1] このゲートの速度は、以前に実証された2ビットのエンタングリングゲートよりも桁違いに高い。
ゲートは1キュービットあたり1つの連続RFフィールドしか必要とせず、量子プロセッサを多数のキュービットに拡張するのに適している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:42:56 GMT)
Mamba-based Deep Learning Approaches for Sleep Staging on a Wireless Multimodal Wearable System without Electroencephalography [4.0] 本研究では,マンバをベースとした深層学習手法を用いて,ウェアラブルシステムからの信号に対する睡眠ステージングについて検討する。
深層学習モデルは、脳波(EEG)のないウェアラブルシステムから主要な睡眠段階を推定することができ、第三次ケア睡眠クリニックに参加する成人のデータにうまく適用することができる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:43:02 GMT)
Towards Secure AI-driven Industrial Metaverse with NFT Digital Twins [3.9] デジタルツイン(DT)は、これらのクローン可能なトークンの作成と所有に対して、分散的なアプローチを提供する。
不正な複製や偽造の可能性は、NFT-DTのセキュリティに重大な脅威をもたらす。
偽のNFT-DTを検出するための新しいディープラーニングベースのソリューションを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:40:18 GMT)
Implementation of Magic State Injection within Heavy-Hexagon Architecture [3.9] ヘキサゴナル構造のマジック状態注入プロセスとフラッグ量子ビットとフラッグ量子ビットのない格子構造とを実装・比較する。
分析の結果,フラグ量子ビットの包含はマジック状態注入プロセスに異なる特徴をもたらすことが明らかとなった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:12:25 GMT)
Revealing spin-flip two-level systems using ultra-thin film superconducting resonators [3.9] 物質障害は固体量子デバイスにおけるノイズと損失の主な原因である。
本研究では, 超薄型TiN超伝導共振器を用いて, 異常TLS挙動を明らかにする。
スピン-フリップTLSモデルは、欠陥スピンから不均一な局所磁場によって効果的なスピン-軌道結合を生成する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:49:50 GMT)
FlexEdit: Flexible and Controllable Diffusion-based Object-centric Image Editing [3.9] オブジェクトのフレキシブルでコントロール可能な編集フレームワークであるFlexEditを紹介します。
FlexEditブロックを使用して、各denoisingステップでレイトを反復的に調整します。
当社のフレームワークでは,デノナイズ時に自動的に抽出されるアダプティブマスクを用いて,背景の保護を行う。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:39:15 GMT)
X-MeshGraphNet: Scalable Multi-Scale Graph Neural Networks for Physics Simulation [3.8] 我々は、MeshGraphNetのスケーラブルでマルチスケールな拡張であるX-MeshGraphNetを紹介する。
X-MeshGraphNetは、大きなグラフとハローリージョンを組み込むことで、スケーラビリティのボトルネックを克服する。
実験の結果,X-MeshGraphNetは全グラフGNNの予測精度を維持していることがわかった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:48:03 GMT)
Fake News Detection: Comparative Evaluation of BERT-like Models and Large Language Models with Generative AI-Annotated Data [3.7] フェイクニュースは、現代の社会における世論と社会の安定に重大な脅威をもたらす。
本研究では,偽ニュース検出のためのBERT-like encoder-onlyモデルと自己回帰型decoder-only large language model(LLMs)の比較評価を行った。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:45:58 GMT)
FairREAD: Re-fusing Demographic Attributes after Disentanglement for Fair Medical Image Classification [3.6] FairREAD (Fair Refusion After Disentanglement) は, センシティブな階層属性を公正な画像表現に再統合することで不公平を緩和するフレームワークである。
FairREADは、臨床に関係のある詳細を保存するために、制御された再灌流機構を使用しながら、人口統計情報をアンタングルする敵の訓練を採用している。
大規模臨床X線データセットの総合的評価は、FairREADが診断精度を維持しながら不公平度指標を著しく低減することを示した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 22:17:57 GMT)
Detection of Aerial Spoofing Attacks to LEO Satellite Systems via Deep Learning [3.6] 本稿では、受信したPHY信号にオートエンコーダによる異常検出を適用し、LEO衛星コンステレーションシステムのスプーフィング検出手法を提案する。
我々は、ドローンに搭載された実際のスプーファーの展開を含む広範囲な計測キャンペーンを通じて、我々のソリューションを検証する。
提案手法は,異なる高度で発射されるスプーフ攻撃を確実に検出できる一方で,最先端の競合するアプローチは単純に失敗することを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:56:09 GMT)
Gauss-Newton Dynamics for Neural Networks: A Riemannian Optimization Perspective [3.5] 我々は,スムーズな活性化関数を持つニューラルネットワークを学習するためのガウスニュートン力学の収束性を分析する。
適切に選択された減衰係数を持つレバンス・マルカルト力学は、不条件カーネルに対してロバスト性をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:58:45 GMT)
Neural Network-Based Frequency Optimization for Superconducting Quantum Chips [3.5] 超伝導量子チップのためのニューラルネットワークに基づく周波数構成手法を提案する。
トレーニングされたニューラルネットワークモデルは、周波数設定エラーを推定し、中間最適化戦略は、チップのローカライズされた領域内の最適な構成を特定する。
また、変動量子固有解法のためのクロストーク対応ハードウェア効率アンサッツを設計し、改良されたエネルギー計算を実現する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:29:43 GMT)
Iterative Encoding-Decoding VAEs Anomaly Detection in NOAA's DART Time Series: A Machine Learning Approach for Enhancing Data Integrity for NASA's GRACE-FO Verification and Validation [3.4] 本稿では,DART時系列の品質向上のために,反復アティショナル・デコーディング・バリエンコーダ(Iterative Ational-Decoding VAEs)モデルを提案する。
反復的なアテンショナルデコードVAEは、データの潜伏構造を保ちながら、徐々に異常を除去する。
このデータ処理手法は、解釈可能性と信頼性を改善した将来の気候モデリングを基盤とする津波検出手法である。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 22:19:11 GMT)
A survey on FPGA-based accelerator for ML models [3.4] 過去6年間の1138の論文のうち287件をレビューしている。
推論アクセラレーション(81%)はトレーニングアクセラレーション(13%)と比較して明らかに強調される
FPGA研究論文の分類は、FPGA研究におけるMLの関連性の高まりを示すとともに、幅広いトピックを明らかにしている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:30:40 GMT)
Integration of Quantum Key Distribution in a 20-km 32-user Coherent Passive Optical Network with Single Feeder Fiber [3.3] 既存のPONインフラストラクチャを変更することなく、キャリアグレードの電力レベルで動作するCバンド20kmシングルフィードファイバ32ユーザコヒーレントPONに、Oバンド偏光符号化デコイ状態BB84QKDを組み込むことを実証する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:44:36 GMT)
RESQUE: Quantifying Estimator to Task and Distribution Shift for Sustainable Model Reusability [3.3] 本稿では,モデルの再学習コストを推定する予測量化器であるRepresentation Shift QUantification Estimator (RESQUE)を提案する。
RESQUEはモデルの再トレーニングに必要なリソースの見積のために、単一の簡潔なインデックスを提供する。
その結果, RESQUEはエポックス, 勾配ノルム, パラメータ等級の変化, エネルギー, 炭素排出量の指標として有効であることが確認された。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:55:07 GMT)
GSurf: 3D Reconstruction via Signed Distance Fields with Direct Gaussian Supervision [3.3] マルチビュー画像からの表面再構成は3次元視覚における中核的な課題である。
近年, ニューラル・レージアンス・フィールド(NeRF)内のサイン付き距離場(SDF)を探索し, 高忠実な表面再構成を実現している。
本稿では,ガウス原始体から直接符号付き距離場を学習する新しいエンドツーエンド手法であるGSurfを紹介する。
GSurfは、VolSDFやNeuSといったニューラルな暗黙的表面法に匹敵する3D再構成品質を提供しながら、高速なトレーニングとレンダリングの速度を達成する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:36:36 GMT)
BabyHGRN: Exploring RNNs for Sample-Efficient Training of Language Models [3.3] 我々は最近提案された RNN ベースのアーキテクチャである HGRN2 (Qin et al., 2024) を利用して、トランスフォーマーベースのベースラインに対する効果を相対的に評価する。
実験の結果,HGRN2言語モデルであるBABYHGRNは10Mと100Mのワードトラックにおいてトランスフォーマーモデルよりも優れていた。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:21:41 GMT)
Measuring the Reliability of Causal Probing Methods: Tradeoffs, Limitations, and the Plight of Nullifying Interventions [3.2] Causal Probingは、その表現の介入がアウトプットに与える影響を調べることによって、基礎モデルを分析することを目的としている。
近年の研究では、いくつかの主要な因果探索法の理論的根拠に疑問が投げかけられている。
完全性と選択性という2つの主要な因果探索デシダラタを定量化する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:17:44 GMT)
IRGS: Inter-Reflective Gaussian Splatting with 2D Gaussian Ray Tracing [3.1] 逆レンダリングのための反射型ガウススプラッティング(IRGS)を導入する。
本研究では, 簡易化を伴わず, 入射放射率を計算し, フルレンダリング式を適用した。
さらに、最適化されたシーンをリライトする際、入射光の間接放射率を問い合わせる新しい手法を導入する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:10:43 GMT)
Sims: An Interactive Tool for Geospatial Matching and Clustering [3.1] similarity Search (Sims)は、ユーザーが関心のある特定の領域に対してクラスタリングと類似性検索を行うことができるノーコードウェブツールである。
Simsは、モデル作成よりも機能探索に焦点を当てることで、既存のモデリングツールを補完するように設計されている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:49:47 GMT)
Bayesian Optimization for Unknown Cost-Varying Variable Subsets with No-Regret Costs [3.1] ランダムで未知のコストでBOCVS問題を拡張するための新しいアルゴリズムを提案する。
提案アルゴリズムは,BOCVS問題の目的を従来よりも効果的に解決し,品質的後悔とコスト的後悔の両面において,サブ線形率を達成する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:00:39 GMT)
MRAG: A Modular Retrieval Framework for Time-Sensitive Question Answering [3.1] 大規模言語モデル(LLM)を用いた質問応答システムにおいて,時間的関係と応答時間に敏感な質問
我々は、時間的摂動と金のエビデンスラベルを組み込むことで、既存のデータセットを再利用するTempRAGEvalベンチマークを導入する。
TempRAGEvalでは、MRAGが検索性能においてベースラインレトリバーを著しく上回り、最終回答精度がさらに向上した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:58:27 GMT)
AI-in-the-loop: The future of biomedical visual analytics applications in the era of AI [3.1] データ分析におけるAIの大規模開発は、将来のデータ視覚化とビジュアル分析をどう形成するか?
ますます強力なAIの文脈における機会、オープンな課題、脅威とは何か?
我々は、バイオメディカルビジュアライゼーションを研究分野として変革するAIの可能性を強調した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:27:24 GMT)
GAT-RWOS: Graph Attention-Guided Random Walk Oversampling for Imbalanced Data Classification [3.1] クラス不均衡は機械学習(ML)に重大な課題をもたらす
本稿では,グラフ・アテンション・ネットワーク(GAT)の強みとランダム・ウォーク・ベース・オーバーサンプリングを組み合わせたグラフ・ベース・オーバーサンプリング手法であるGAT-RWOSを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 23:03:16 GMT)
APIRL: Deep Reinforcement Learning for REST API Fuzzing [3.1] APIRLは、REST APIをテストするための、完全に自動化された深層強化学習ツールである。
APIRLは、現実世界のREST APIの最先端よりも、はるかに多くのバグを見つけることができます。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:40:51 GMT)
NeRF-To-Real Tester: Neural Radiance Fields as Test Image Generators for Vision of Autonomous Systems [3.0] シミュレーション条件に対するコントローラの過度な適合は、運用環境における性能の低下につながる。
本稿では,ニューラルネットワークを利用した自律システムにおける知覚テストデータ生成の課題に対処する。
当社のツールであるN2R-Testerは、カスタムシーンのトレーニングモデルと、摂動位置からのテストイメージのレンダリングを可能にする。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:40:53 GMT)
Simulating Three-Flavor Neutrino Oscillations on an NMR Quantum Processor [3.0] ニュートリノ振動はポンテコルボ-マキ-中川-坂田理論(PMNS)を用いて量子コンピュータ上で効率的にシミュレートできる。
2量子NMR量子情報プロセッサ上での3自由度ニュートリノ振動をシミュレートする。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:22:11 GMT)
Beyond Incompatibility: Trade-offs between Mutually Exclusive Fairness Criteria in Machine Learning and Law [3.0] 本稿では,3つのフェアネス基準を連続的に補間する新しいアルゴリズム(FAir Interpolation Method: FAIM)を提案する。
我々は,合成データ,CompASデータセット,電子商取引部門による新たな実世界のデータセットに適用した場合のアルゴリズムの有効性を実証する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:58:58 GMT)
Factored space models: Towards causality between levels of abstraction [2.9] 因果グラフは幅広いアプリケーションにとって強力なツールです。
決定論的関係が存在する場合、一般にマルコフ条件と忠実条件の両方を満たす因果グラフは存在しない。
因果グラフの代替として因子空間モデルを導入する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:38:53 GMT)
Humanlike Cognitive Patterns as Emergent Phenomena in Large Language Models [2.9] 我々は、意思決定バイアス、推論、創造性の3つの重要な認知領域にわたって、大規模言語モデルの能力を体系的にレビューする。
意思決定では、LSMはいくつかの人間のようなバイアスを示すが、人間の観察するバイアスは欠落している。
GPT-4のような先進的なLCMは、人間のシステム2思考に似た熟考的推論を示し、小さなモデルは人間レベルの性能に欠ける。
LLMはストーリーテリングのような言語ベースの創造的なタスクに優れているが、現実の文脈を必要とする散発的な思考タスクに苦労する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:26:56 GMT)
LayerAct: Advanced Activation Mechanism for Robust Inference of CNNs [2.9] CNNのためのLayerActと呼ばれる新しいアクティベーション機構を提案する。
また,LayerAct関数はElementAct関数よりも優れたロバスト性を示すことを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:22:16 GMT)
Semantic Role Labeling of NomBank Partitives [2.9] いくつかのシステムは、従来のトランスフォーマーベースの機械学習とアンサンブルを使って記述されている。
我々の最高スコアシステムは、ペン・ツリーバンクの「ゴールド」パースを用いて91.74%、バークレー・ニューラルを用いた場合の91.12%のF1を達成する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:17:20 GMT)
A Comprehensive Study of Machine Learning Techniques for Log-Based Anomaly Detection [2.8] システム複雑性の増大により、ログベースの異常検出(LAD)のような自動ログ解析技術の必要性が高まっている。
現在の評価は主に検出精度に重点を置いているが、与えられたLADタスクに対するテクニックの適合性を決定するには不十分である。
本稿では,4つの基準にまたがる多種多様な教師付き,半教師付き,伝統的,深層ML手法を総合的な実証研究により評価した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:52:14 GMT)
Lifelong Graph Learning for Graph Summarization [2.8] 生涯グラフ要約におけるニューラルネットワークの利用について検討する。
すべてのネットワークが概ね1ドルのホップ情報を使って要約を判断していることを示す。
この10年間のワープの減少は、2022年のWebグラフの不均一性の増大によるものだと考えています。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:05:18 GMT)
A Machine Learning Approach for Emergency Detection in Medical Scenarios Using Large Language Models [2.8] 本稿では,大規模言語モデル(LLM)を活用した新しいアプローチを提案する。
我々は,複数のLLaMAモデルを用いた包括的システムを開発し,医療シナリオを緊急時・非緊急時として分類した。
その結果、LLaMA 2 (7B) モデルは99.7%の精度で、LLaMA 3.2 (3B) は99.6%の精度で最適なプロンプトエンジニアリングを実現した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:03:24 GMT)
KRAIL: A Knowledge-Driven Framework for Base Human Reliability Analysis Integrating IDHEAS and Large Language Models [2.7] 本稿では,IDHEASとLLM(KRAIL)を統合した知識駆動型信頼性分析のための新しい2段階フレームワークを提案する。
本稿では,自然言語処理における大規模言語モデル(LLM)の成功に触発されて,知識駆動型信頼性分析のための新しい2段階フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:21:34 GMT)
Generalized Back-Stepping Experience Replay in Sparse-Reward Environments [2.7] バックステッピング体験リプレイ(BER)は、可逆環境における学習効率を向上する強化学習技術である。
元のアルゴリズムは複雑な探索を必要としない密集再帰環境のために設計されている。
本稿では,従来のアルゴリズムをスパース・リワード環境に拡張した汎用BER(Generalized BER, GBER)を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:31:23 GMT)
Are You Human? An Adversarial Benchmark to Expose LLMs [2.7] LLM(Large Language Models)は、会話中に人間を偽装する警告機能を実証している。
LLMインポスタをリアルタイムに公開するための課題として設計されたテキストベースのプロンプトを評価する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:25:22 GMT)
Probabilistic Latent Variable Modeling for Dynamic Friction Identification and Estimation [2.6] ロボット工学における動的モデルの同定は、制御設計、摩擦補償、出力トルク推定をサポートするために不可欠である。
本稿では,潜伏状態を用いたロボット関節の未同定ダイナミクスについて考察する。
予測最大化 (EM) アルゴリズムを用いてモデルパラメータの近似最大推定 (MLE) を求める。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:16:18 GMT)
AutoLife: Automatic Life Journaling with Smartphones and LLMs [2.6] 本稿では,商用スマートフォンをベースとした自動ライフジャーナリングシステムであるAutoLifeを紹介する。
まず、マルチモーダルセンサデータから時間、動き、位置のコンテキストを導き、大規模言語モデルのゼロショット機能を利用する。
本研究は,リアルタイムデータセットをベンチマークとして確立し,AutoLifeが正確かつ信頼性の高いライフジャーナルを生成することを示す実験結果である。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:37:02 GMT)
Learned Compression of Nonlinear Time Series With Random Access [2.6] 時系列は金融、医療、産業、環境モニタリングなど多くの分野で重要な役割を果たしている。
我々は、時系列を非線形関数列に近似するランダムアクセス可能な圧縮スキームNeaTSを紹介する。
実験の結果,NeaTSは最先端の損失圧縮機の圧縮比を最大14%向上することがわかった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:30:06 GMT)
Learning Disease Progression Models That Capture Health Disparities [2.6] 我々は3つの重要な健康格差を捉えた解釈可能なベイズ病進行モデルを構築した。
理論的・実証的に、不均衡を考慮に入れないことは重大度の推定に偏りがあることが示される。
本モデルでは, 各種の健康格差に直面する群を同定し, 患者が高リスクとみなす群に有意な変化を生じさせることが可能である。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 23:56:37 GMT)
Music Genre Classification: Ensemble Learning with Subcomponents-level Attention [2.6] Music Genre Classificationは、音楽情報検索(MIR)とデジタル信号処理の分野で最も人気のあるトピックの1つである。
本論文は,アンサンブル学習とサブコンポーネントへの注意を組み合わせ,音楽ジャンルの同定精度を高めることを目的とした,新たなアプローチを提案する。
提案手法は,GTZANデータセット上でトレーニングおよび試験を行った他の最先端技術と比較して,精度の面で優れている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:50:31 GMT)
Fully quantum stochastic entropy production [2.4] 熱力学のアプローチに基づいて、任意の量子過程に対するエントロピー生成を定義する。
平均エントロピー生成の古典的表現は、入力や出力における統計の比較のみを含むことを示す。
エントロピー生成作用素を構築し、エントロピーの値を非可換なケースに一般化する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:33:02 GMT)
Search-based DNN Testing and Retraining with GAN-enhanced Simulations [2.4] 安全クリティカルなシステムでは、ディープニューラルネットワーク(DNN)がコンピュータビジョンタスクの重要なコンポーネントになりつつある。
本稿では,シミュレータを用いて入力空間を探索するメタヒューリスティック検索と,シミュレータが生成したデータをリアルな入力画像に変換するGAN(Generative Adversarial Networks)を組み合わせることを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:34:49 GMT)
PreNeT: Leveraging Computational Features to Predict Deep Neural Network Training Time [2.4] 本稿では,この最適化課題に対処するために設計された新しい予測フレームワークであるPreNeTを紹介する。
PreNeTの重要な特徴は、これまで検討されていなかったハードウェアインフラストラクチャのトレーニング期間を正確に予測する能力である。
実験の結果,PreNeTは現代の最先端フレームワークと比較して,予測精度が最大72%向上していることがわかった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:15:02 GMT)
Improving In-Context Learning with Small Language Model Ensembles [2.3] In-context Learning (ICL) は安価で効率的な代替手段であるが、高度な手法の精度と一致しない。
本稿では,複数の微調整小言語モデル(SLM)の専門知識を活用することでICLを強化する新しいアプローチであるEnsemble SuperICLを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:22:37 GMT)
Cracking the Code: Evaluating Zero-Shot Prompting Methods for Providing Programming Feedback [2.3] このケーススタディでは、異なるゼロショットプロンプトエンジニアリング手法を評価するための評価フレームワークを導入している。
提案手法を体系的に変更し,提案したRのプログラムエラーに対するフィードバックを分析した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:24:50 GMT)
Coherent control of solid-state defect spins via patterned boron-doped diamond circuit [2.2] 直流3GHz帯のボロンドープダイヤモンド(BDD)回路の電気伝導特性について検討した。
我々は、BDD回路と連続波ODMRスペクトルを全回路にわたって観測し、ダイヤモンド中のNV中心における光検出磁気共鳴(ODMR)を成功させた。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:43:37 GMT)
LTLf Synthesis on First-Order Agent Programs in Nondeterministic Environments [2.2] Gologで表現された高レベルエージェントプログラムのポリシーの合成について検討する。
一階アクション理論の表現型クラスを活用することで、プログラムの実行をカプセル化し、時間的目標の満足度を追跡する有限ゲームアリーナを構築する。
この作業はエージェントプログラミングと時間論理合成を橋渡しし、非決定論的環境における堅牢なエージェント動作のためのフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:16:41 GMT)
Learning Temporally Equivariance for Degenerative Disease Progression in OCT by Predicting Future Representations [2.2] 時間変化を考慮したコントラスト学習(TC)手法を提案する。
本モデルでは,中間年齢関連黄斑変性 (AMD) から進行湿潤AMDへの進行予測において, 既存の異種コントラスト法より明らかに優れていた。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:19:53 GMT)
Never Reset Again: A Mathematical Framework for Continual Inference in Recurrent Neural Networks [2.2] リカレントニューラルネットワーク(RNN)はシーケンシャルな処理に広く用いられているが、状態飽和による連続推論による制限に直面している。
本稿では,拡張シーケンスの精度を保ちつつ,推論中のリセットの必要性を解消する適応的損失関数を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:24:28 GMT)
Stochastic Analysis of Entanglement-assisted Quantum Communication Channels [2.2] 本稿では,その技術的約束と最近の実験的成功から着想を得た,量子通信ネットワークのキューモデルを提案する。
モデルは、プライマリキューと、ベルペアの生成と保存を行うサービスキューで構成される。
本研究では,このマルチスケール待ち行列システムの振る舞いを平均化原理を用いて検討する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:59:58 GMT)
Modeling Autonomous Shifts Between Focus State and Mind-Wandering Using a Predictive-Coding-Inspired Variational RNN Model [2.2] この研究は、フォーカス状態とマインドランディングの間の自律的なシフトの神経機構について研究している。
従来提案した変分RNNモデルを用いて連続感覚系列の知覚過程をモデル化した。
シミュレーション実験により,低値と高値に$mathbfw$が切り替えられると,集中認識とマインドウォーランシングの自律的なシフトが生じることが示された。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:25:20 GMT)
Pre-training Graph Neural Networks on Molecules by Using Subgraph-Conditioned Graph Information Bottleneck [2.1] 本研究の目的は、人間のアノテーションや事前知識を使わずに、分子上に事前学習されたグラフニューラルネットワーク(GNN)モデルを構築することである。
本稿では,GNNがコア部分グラフ(グラフコア)と重要な部分グラフを認識するための事前学習を行うための,S-CGIBと呼ばれる新しいサブグラフ条件グラフ情報ボトルネックを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:52:30 GMT)
Single Exposure Quantitative Phase Imaging with a Conventional Microscope using Diffusion Models [2.1] TIE(Transport-of-Intensity Equation)はしばしば異なるデフォーカス距離で複数の取得を必要とする。
そこで本研究では,クロマティック収差を用いて,必要なスルーフォーカス画像を単一露光で誘導する手法を提案する。
我々の貢献は、色収差を利用した別のTIEアプローチを提供し、白色光による正確な単一露光位相測定を実現している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:49:51 GMT)
FrontierMath: A Benchmark for Evaluating Advanced Mathematical Reasoning in AI [2.1] FrontierMath(フロンティアマス、フロンティアマス、FrontierMath)は、数学者が考案し検証した何百もの数学問題のベンチマークである。
現在の最先端のAIモデルは、問題の2%未満を解決し、AI能力と数学的コミュニティの長所との間に大きなギャップが浮かび上がっている。
AIシステムが専門家レベルの数学的能力に向かって進むにつれ、FrontierMathは彼らの進歩を定量化する厳格なテストベッドを提供する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:27:06 GMT)
Vulnerability Detection in Popular Programming Languages with Language Models [2.0] 本稿では,JavaScript,Java,Python,PHP,Goの脆弱性検出における言語モデル(LM)の有効性について検討する。
C/C++と比較して、JavaScriptは最高のパフォーマンスを示し、より優れた、より実用的な検出能力を持っています。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:57:27 GMT)
Text Understanding in GPT-4 vs Humans [2.0] 我々は、主要なAIシステムであるGPT4が、人間と同様にテキストも理解しているかどうかを検討する。
まず、よく確立された談話理解の標準化テストを使用します。
次に、GPT4と人間の間に大きな違いがあるかどうかを判断するために、より難しいパスを使用します。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:50:38 GMT)
The Unreasonable Effectiveness of Open Science in AI: A Replication Study [2.0] 科学では危機が報告されているが、それがAI研究に与える影響は、まだ完全には理解されていない。
我々は,原材料に依存した高度に引用された30のAI研究を含む,体系的な複製研究を行った。
6項目が再現され、5項目が部分的に再現された。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:33:27 GMT)
Exponential quantum advantages in learning quantum observables from classical data [2.0] 我々は、古典的なデータから量子オブザーバブルを学習する物理的に関係のあるタスクに対して、量子上の利点を証明している。
我々の結果は、量子多体物理学の領域における機械学習問題に対する量子コンピュータの実用性に光を当てた。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:22:48 GMT)
Trust Dynamics and Market Behavior in Cryptocurrency: A Comparative Study of Centralized and Decentralized Exchanges [2.0] 主要なCEXであるFTXの崩壊は、信頼の計測可能な影響と、暗号通貨エコシステムに対するその突然の侵食を調査するためのユニークな自然実験を提供する。
本研究では,FTX崩壊がユーザ信頼に与える影響について検討し,トークン評価,トレーディングフロー,感情動態に着目した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:03:21 GMT)
ASPIRE: Assistive System for Performance Evaluation in IR [1.9] ASPIRE(Assistive System for Performance Evaluation in IR)は、情報検索実験の詳細な分析のための視覚分析ツールである。
ASPIREは、単一/複数実験の比較、クエリレベルの分析、クエリ特性とパフォーマンスの相互作用、コレクションベースの検索分析という、IR実験評価と分析の4つの重要な側面をサポートする。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:25:28 GMT)
Towards Interpretable Radiology Report Generation via Concept Bottlenecks using a Multi-Agentic RAG [1.9] 本研究では, レポート生成のための概念ボトルネックモデル(CBM)とマルチエージェント検索・拡張生成システム(RAG)を用いて, 胸部X線分類(CXR)の解釈可能性を向上させる。
視覚特徴と臨床概念の関係をモデル化することにより,多エージェントRAGシステムで放射線診断レポートを生成するための解釈可能な概念ベクトルを作成する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:33:50 GMT)
Do we still need canaries in the coal mine? Measuring shadow stack effectiveness in countering stack smashing [1.9] 我々は,64ビットx86 (x86-64) システムは,x86-64シャドウスタックの実施に加えてスタックカナリアの有効性にもメリットがあるかを評価する。
x86-64シャドウスタックの実装は、スタックプロテクターのようなスタックレイアウトと組み合わせることで、スタックカナリアよりも効果的で、優れたスタックカナリアであることが分かりました。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:08:17 GMT)
Improving Equity in Health Modeling with GPT4-Turbo Generated Synthetic Data: A Comparative Study [1.9] デモグラフィック群は、しばしば医学データセットで異なるレートで表現される。
これらの違いは機械学習アルゴリズムに偏りを生じさせ、より表現しやすいグループのパフォーマンスが向上する。
1つの有望な解決策は、非表現的データセットの潜在的な悪影響を軽減するために合成データを生成することである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 20:49:17 GMT)
Gender Disparities in Contributions, Leadership, and Collaboration: An Exploratory Study on Software Systems Research [1.8] 私たちは過去10年間に2000の論文をJournal of Systems and Softwareで分析しました。
分析の結果、全著者の32.74%が女性であり、女性主導または監督された研究は男性よりも少なかった。
第三に、ソフトウェアシステム研究の分野を探索し、女性作家が人間中心の研究領域に積極的に関わっていることを発見した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:20:23 GMT)
On the Suitability of pre-trained foundational LLMs for Analysis in German Legal Education [1.8] 現状のオープンソース基盤LPMには,教育的文脈における法的分析に十分な指導能力とドイツの法的背景知識が備わっていることを示す。
しかしながら、モデル機能は、"Gutachtenstil"評価スタイルコンポーネントの分類など、非常に特殊なタスクで分解される。
本稿では、高可用性シナリオにおける予測を大幅に改善する検索拡張生成に基づくプロンプト例選択手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:54:57 GMT)
Responsibility-aware Strategic Reasoning in Probabilistic Multi-Agent Systems [1.8] 責任は、信頼できる自律システムの開発と展開において重要な役割を果たす。
本稿では,確率的交代時間論理の変種であるPATL+Rを提案する。
本稿では,PATL+Rで指定された結果を満たす共同戦略の合成手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:50:09 GMT)
User Modeling in Model-Driven Engineering: A Systematic Literature Review [1.7] 我々は,モデル駆動工学(MDE)アプローチにおけるユーザモデリングの既存提案を分析するために,体系的な文献レビューを実施している。
結果は、統一的で完全なユーザーモデリングの視点が欠如していることを示しています。
これにより、よりリッチなユーザインターフェースの実装が、ユーザ固有のニーズをよりサポートできるようになります。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:19:57 GMT)
Predicting Artificial Neural Network Representations to Learn Recognition Model for Music Identification from Brain Recordings [1.7] 近年の研究では、人工ニューラルネットワーク(ANN)の表現が皮質表現と顕著に類似していることが示されている。
本研究では、外部聴覚刺激に応答して脳記録の認識モデルを開発するための新しいアプローチを提案する。
脳-コンピュータインターフェース(BCI)の進歩、ニューラルデコード技術、音楽認知の理解を約束します。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:37:26 GMT)
A Wiener Process Perspective on Local Intrinsic Dimension Estimation Methods [1.7] 近年,深層ニューラルネットワークと生成モデリングの進歩により,局所内在性(LID)推定法が注目されている。
本稿では、Wiener プロセスの観点から、最近の最先端パラメトリック LID 推定手法について検討する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 19:40:08 GMT)
The Unreasonable Effectiveness of Guidance for Diffusion Models [1.6] 本研究では,最先端指導手法と競合する生成性能が達成可能であることを示す。
我々は、その受容場を制約することで、プライマリモデル自体を誘導するスライディングウィンドウ誘導(SWG)と呼ぶ。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:24:30 GMT)
Fine-tuning Whisper on Low-Resource Languages for Real-World Applications [1.6] 非文レベルのデータは、長文音声のパフォーマンスを向上する可能性があるが、著作権法により取得が困難であり、しばしば制限される。
我々の手法は、よりアクセスしやすい文レベルのデータを、長文音声を扱うモデルの能力を保持するフォーマットに変換することで、このギャップを埋める。
我々のモデルは、未調整のWhisperと、これまでの最先端のスイスのドイツのSTTモデルと比較し、そこでは、我々の新しいモデルはより高いBLEUスコアを達成します。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:49:02 GMT)
Improving Quantization-aware Training of Low-Precision Network via Block Replacement on Full-Precision Counterpart [1.6] 量子化対応トレーニング(QAT)は、ネットワーク量子化の一般的なパラダイムである。
低精度モデルは限られた表現能力を示し、完全精度の計算を直接複製することはできない。
本稿では,低精度ネットワークのフォワード・バック・プロセスが,完全精度パートナーによってガイドされるようにすることで,懸念を緩和するための一般的なQATフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:38:18 GMT)
Learning from Impairment: Leveraging Insights from Clinical Linguistics in Language Modelling Research [1.5] 本研究は,言語モデル(LM)の学習戦略と評価フレームワークを開発するために,言語障害研究からの洞察と臨床治療を統合する可能性について検討する。
本稿では,神経言語学,特に失語症治療における言語スキルの回復と一般化をめざした,言語学的動機の強い訓練アプローチの根底にある理論的基盤を考察する。
これらの知見が、LMの厳密な評価、特に複雑な構文現象の扱い、そして人間のような学習戦略の発展にどう影響するかを明らかにする。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:53:21 GMT)
Long-Term Upper-Limb Prosthesis Myocontrol via High-Density sEMG and Incremental Learning [1.5] 本稿では,高密度sEMG(HD-sEMG)セットアップとインクリメンタルラーニングを組み合わせた新しい筋電気補綴システムを提案する。
まず,前腕に64個のドライ電極を配置した小型HD-sEMGインタフェースを提案する。
そこで本研究では,データストリーム上でモデル適応が可能な効率的なインクリメンタル学習システムを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:37:10 GMT)
Unveiling the Mechanisms of DAI: A Logic-Based Approach to Stablecoin Analysis [1.5] 本稿では,暗号コラテラル化とアルゴリズム機構を組み合わせたDAIステーブルコインについて述べる。
本稿では,Prologで実装され,オープンソースソフトウェアとしてリリースされたDAIのポリシーと操作を表現するための形式的論理ベースのフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:43:51 GMT)
Optimized measurement-free and fault-tolerant quantum error correction for neutral atoms [1.5] 量子誤り訂正(QEC)を行う上での大きな課題は、信頼性のある測定と条件付きフィードフォワード演算を実装することである。
本稿では,回路レベルのノイズに対する耐故障性を有する小型計測自由QEC方式の実装を提案する。
我々は,この手法が,中性原子配列上での資源効率の高い測定自由QECの実現への道を開く方法を強調した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:01:19 GMT)
A Comparative Study of Text Retrieval Models on DaReCzech [1.5] 本稿では,Splade,Plaid,Plaid-X,SimCSE,Contriever,OpenAI ADA,Gemma2の7つの市販文書検索モデルの総合評価を行う。
本実験の目的は,チェコ語における現代の検索手法の質を推定することである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 23:02:35 GMT)
Discovery of a non-Hermitian phase transition in a bulk condensed-matter system [1.4] バルク凝縮物質系における非エルミート相転移を実現する。
エルミート遷移と強磁性秩序との温度依存性の相互作用では、緩和ダイナミクスの非エルミート変化が起こる。
我々の理論は、大規模な凝縮物質系に対する非エルミート相転移を予測する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:03:45 GMT)
Quantum particle in the wrong box (or: the perils of finite-dimensional approximations) [1.4] 広い種類の基底に対して、破れたハミルトニアンによって生成される力学は、常にディリクレ境界条件を持つ粒子に対応する粒子に収束することを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:39:06 GMT)
fluke: Federated Learning Utility frameworK for Experimentation and research [1.4] フェデレートラーニング(FL)は、機械学習コミュニティで大いに人気を集めています。
flukeは、新しいFLアルゴリズムの開発を簡単にするために設計されたPythonパッケージである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:51:23 GMT)
Cheshire qudits from fractional quantum spin Hall states in twisted MoTe$_2$ [1.4] ツイストされたMoTe$$$ホモ双層は、分数量子スピンホール(FQSH)状態と整合した輸送シグネチャを示す。
我々は,そのようなFQSH状態のパンチホールから形成された,チェシャークイディットと呼ばれるトポロジカル量子メモリ要素を構築する経路について述べる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:20:22 GMT)
Spatial Clustering of Citizen Science Data Improves Downstream Species Distribution Models [1.4] 生息環境選択の生物学的プロセスとは別途、観察過程をモデル化することで不完全な検出を行う。
既存の現場建設のアプローチは、いくつかの観測や/または地理的距離のみを放棄し、環境の類似性を考慮しない。
オレゴン州における31種の鳥類の下流種分布モデルへの影響について, サイト構築に対する10のアプローチを比較した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:36:58 GMT)
A Breadth-First Catalog of Text Processing, Speech Processing and Multimodal Research in South Asian Languages [1.4] 本稿では,2022年1月~2024年10月にかけての南アジア諸言語におけるテキストベースの言語処理に関する最近の文献を概観する。
我々は、サライキ語、アサメセ語、バロチ語、ボド語、ビルマ語、チャトティスガルヒ語、ディヴェヒ語、グジャラーティ語、カンナダ語、カシュミリ語、コンカニ語、カシ語、マラヤラム語、マイティ語、ネパール語、オディア語、パシュト語、ラジャサニ語、シンドヒ語、テルーグ語など、21の低リソース南アジアの言語に焦点を当てている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 20:08:48 GMT)
High-speed Source-Device-Independent Quantum Random Number Generator on a Chip [1.4] 量子乱数生成器(QRNG)は現在、真のランダム性を生み出すことができる唯一の技術である。
カスタム集積フォトニックチップを利用した高性能ソースデバイス独立QRNGを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 19:13:03 GMT)
VLM-RL: A Unified Vision Language Models and Reinforcement Learning Framework for Safe Autonomous Driving [1.3] 自動運転政策を学習するための強化学習(RL)に基づく手法は、自動運転コミュニティにおいて注目を集めている。
従来のRLアプローチは手作業による報酬に依存しており、それは広範囲の人的努力を必要とし、しばしば一般化性に欠ける。
我々は、事前訓練された視覚言語モデル(VLM)とRLを統合して報酬信号を生成する統合フレームワークである textbfVLM-RL を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:08:11 GMT)
CCNDF: Curvature Constrained Neural Distance Fields from 3D LiDAR Sequences [1.3] 本稿では,符号付き距離場の2階微分を利用したニューラル場学習手法を提案する。
我々のアプローチは、符号付き距離を正確に推定し、基礎となる幾何学をより包括的に理解することで制限に対処する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:59:27 GMT)
Social Science Is Necessary for Operationalizing Socially Responsible Foundation Models [1.2] 社会科学は、変革的技術の社会的影響を研究する長い歴史を持っている。
本稿では,基礎モデルを社会技術システムとして研究する概念的枠組みを提案する。
我々は、AIと社会科学の学際的で協調的な研究パラダイムを提唱する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:34:43 GMT)
DefFiller: Mask-Conditioned Diffusion for Salient Steel Surface Defect Generation [1.2] DefFillerは、レイアウト・ツー・イメージ拡散モデルを利用するマスク条件の欠陥生成手法である。
得られたマスク条件に正確に適合する高品質な欠陥画像がDefFillerによって生成されることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:08:42 GMT)
Rare Event Detection in Imbalanced Multi-Class Datasets Using an Optimal MIP-Based Ensemble Weighting Approach [1.2] マルチクラスデータセットは、重要なサイバー物理システムにおけるまれな事象検出に使用される。
最適,効率的,適応可能な混合整数プログラミング(MIP)アンサンブル重み付け方式を提案する。
MIPに基づく手法と6つの確立された重み付け手法を比較検討した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:49:05 GMT)
Combinatorial Optimization with Quantum Computers [1.2] 量子コンピュータは、古典的コンピュータに対して潜在的に有利な計算を行う。
量子コンピュータは、演算子をバイナリ文字列の重ね合わせに適用し、バイナリ出力の重ね合わせを提供する。
量子アニール(quantum annealers)と呼ばれる量子マシンのファミリーは、最適化問題を解決するために特別に設計されている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:46:18 GMT)
Explainable AI for Multivariate Time Series Pattern Exploration: Latent Space Visual Analytics with Time Fusion Transformer and Variational Autoencoders in Power Grid Event Diagnosis [1.2] 本稿では、時間融合変換器(TFT)と変分自動符号化器(VAE)の2つの生成AIモデルを統合する新しい視覚分析フレームワークを提案する。
複雑なパターンを低次元の潜在空間に還元し、PCA, t-SNE, UMAPなどの次元還元技術を用いて2次元でDBSCANで可視化する。
このフレームワークは電力グリッド信号データのケーススタディを通じて実証され、様々な根本原因の故障や異常を識別する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:41:11 GMT)
Spectral Properties and Magic Generation in $T$-doped Random Clifford Circuits [1.2] 深いランダムな$N$-qubit $T$-gateドープクリフォード回路における複雑性の出現について検討する。
純粋なクリフォード回路の場合、パウリ弦空間におけるユニークな周期軌道構造は、特別なスペクトル相関と大きな退化を伴うレベル統計を暗示する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:04:51 GMT)
TelcoLM: collecting data, adapting, and benchmarking language models for the telecommunication domain [1.1] テレコミュニケーション(telco)は、多くの語彙的、意味的、概念的特異性のために特に困難なドメインである。
本稿では,Large Language Models をtelco ドメインに適応させる方法について検討する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:47:02 GMT)
Learning ECG Signal Features Without Backpropagation Using Linear Laws [1.1] 本稿では,心電図(ECG)信号分類の新しい手法であるLLT-ECGを紹介する。
従来のディープラーニングアプローチとは異なり、LLT-ECGは前方で動作し、バックプロパゲーションの必要性を排除している。
実世界のECGデータセット上でのLLT-ECGの最先端性能をPhyloNetで実証する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:18:41 GMT)
Monkey Transfer Learning Can Improve Human Pose Estimation [1.1] ディープニューラルネットワークを利用する最先端のポーズ推定技術は、非クリニカルデータセットの人間のアノテーションにマッチすることができる。
倫理的課題とデータ収集の欠如により、AIトレーニングには、臨床データセットが広く利用できない。
我々は、他の種からのデータがこのギャップを埋めることができ、ネットワークを広い範囲のモーションキューに露出させることで、そのギャップを埋めることができるかもしれないことを観察した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:06:15 GMT)
SeagrassFinder: Deep Learning for Eelgrass Detection and Coverage Estimation in the Wild [1.1] 海草の草原は海洋生態系において重要な役割を担い、炭素の隔離のような重要なサービスを提供している。
海草被覆度を評価するために水中ビデオトランクターを解析する現在の手作業は、時間と主観的である。
本研究では,海底ビデオデータから海草の検出とカバレッジ推定のプロセスを自動化するためのディープラーニングモデルについて検討する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:50:54 GMT)
USM: Unbiased Survey Modeling for Limiting Negative User Experiences in Recommendation Systems [1.1] ネガティブなフィードバックシグナルは、コンテンツのレコメンデーションを守り、ユーザーエクスペリエンスを改善するために重要です。
ユーザがネガティブなフィードバックを表現できるオプションが限られているため、これらの信号はポジティブな信号に比べて疎いことが多い。
肯定的な信号に対する過度な信頼はフィルターバブルを生じさせ、ユーザーはすぐに好みに合うコンテンツに継続的に露出するが、長期的には有益ではないかもしれない。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:38:27 GMT)
Microservices-Based Framework for Predictive Analytics and Real-time Performance Enhancement in Travel Reservation Systems [1.0] 本稿では,リアルタイム旅行予約システムの性能向上を目的としたアーキテクチャの枠組みを提案する。
私たちのフレームワークには、顧客の需要予測を最適化する機械学習モデルによるリアルタイム予測分析、動的価格設定、システムパフォーマンスが含まれています。
今後は、高度なAIモデルとエッジ処理を調査して、採用するシステムのパフォーマンスと堅牢性をさらに向上する予定である。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:19:42 GMT)
New Design of three-qubit system with three transmons and a single fixed-frequency resonator coupler [1.0] 共振器結合器が3つのトランペット量子ビットのカップリングを媒介する構造において、CNOTゲートの平均忠実度が0.98を超えることを示す。
この結果から,新しい構造は,量子ビット間の接続数を増大させる鍵となる方法である可能性が示唆された。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:39:14 GMT)
Divergent Ensemble Networks: Enhancing Uncertainty Estimation with Shared Representations and Independent Branching [1.0] Divergent Ensemble Network (DEN)は、共有表現学習と独立分岐を組み合わせた新しいアーキテクチャである。
DENは共有入力層を使用して、すべてのブランチに共通する特徴をキャプチャし、続いて、アンサンブルを形成する独立したトレーニング可能な層を分離する。
この共有分岐構造は、アンサンブルの多様性を維持しながらパラメータの冗長性を低減し、効率的でスケーラブルな学習を可能にする。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:46:11 GMT)
Linguistic Features Extracted by GPT-4 Improve Alzheimer's Disease Detection based on Spontaneous Speech [1.0] アルツハイマー病(英: Alzheimer's Disease、AD)は、公衆衛生上の問題である。
GPTのような大規模言語モデル(LLM)は、セマンティックテキスト分析のための強力な新しい可能性を可能にしている。
本研究では,GPT-4を用いて,自発性音声の書き起こしから5つの意味的特徴を抽出する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:43:42 GMT)
GLIDER: Grading LLM Interactions and Decisions using Explainable Ranking [1.0] 我々は,任意のユーザ定義基準に基づいて任意のテキスト入力および関連するコンテキストをスコアできる,強力な3B評価用LLMであるGLIDERを紹介する。
GLIDERは、FLASK上のGPT-4oよりもピアソンの相関が高く、事前評価モデルよりも大幅に優れていた。
きめ細かいスコア付け、多言語推論、強調表示をサポートし、685のドメインと183の基準でトレーニングされた。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:59:56 GMT)
Non-unital noise in a superconducting quantum computer as a computational resource for reservoir computing [0.9] 振幅減衰によるエネルギー散逸は、ネットワークの短期記憶能力と表現力を大幅に向上させる。
超伝導量子ビットに適用した現実的なノイズモデルをエミュレートすることにより、学習の改善を確認した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:46:54 GMT)
Identifying Macro Conditional Independencies and Macro Total Effects in Summary Causal Graphs with Latent Confounding [0.9] 部分的特定因果グラフ(SCG)は、時空間データを処理する際の時系列間の因果関係の簡易表現を提供する。
完全に特定された因果グラフとは異なり、SCGはそれらの分析と解釈を複雑にするサイクルを含むことができる。
本稿では,まず,マクロ条件の非依存性とマイクロ条件の非依存性と,マクロ効果とマイクロトータル効果を明確に区別する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:14:54 GMT)
Strategies for implementing quantum error correction in molecular rotation [0.9] 閉じ込められた分子の回転は、量子技術と量子情報処理のための有望なプラットフォームを提供する。
並行して、単一の分子の回転状態に符号化された量子情報を保護する量子誤り訂正符号が開発された。
ここでは、吸収放出符号という、そのような符号の1つのファミリーを実験的に実装するためのステップを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:00:05 GMT)
Clustering Time-Evolving Networks Using the Spatio-Temporal Graph Laplacian [0.9] 我々は既存のスペクトルアルゴリズムを一般化し、時間変化のあるグラフ構造におけるコミュニティを特定し解析する。
テンポラル指向グラフ Laplacian は、有向および無向クラスタの時間経過に伴うクラスタ構造進化の明確な解釈を可能にすることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:11:34 GMT)
Advancing Mental Health Pre-Screening: A New Custom GPT for Psychological Distress Assessment [0.8] サイコアナリティスト」はOpenAIのGPT-4をベースとしたカスタムGPTモデルであり、スクリーニング前の精神疾患に最適化されている。
このモデルは、精神疾患のニュアンス言語指標を正しくデコードする。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 19:36:31 GMT)
$π$-yalli: un nouveau corpus pour le nahuatl [0.8] NAHU$2$プロジェクトは、機械学習に適応した$pi$-YALLIコーパスを構築することを目的とした、フランスとメキシコのコラボレーションである。
$pi$-YALLIコーパスは、Nahuatl言語のためのコンピュータリソースの開発に使用される。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:03:10 GMT)
Classical Combinatorial Optimization Scaling for Random Ising Models on 2D Heavy-Hex Graphs [0.8] 重ヘックスグラフ上のイジングモデルは、経験的時間スケーリングにより古典的な計算硬度について検討する。
これらのイジングモデルの空間性のため、古典的アルゴリズムは大規模インスタンスに対しても効率的に最適解を見つけることができる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:09:30 GMT)
From Galaxy Zoo DECaLS to BASS/MzLS: detailed galaxy morphology classification with unsupervised domain adaption [0.8] Galaxy Zoo DECaLS 5 (GZD-5) は253,287個の銀河のサンプルに対して、広範囲で詳細な形態ラベルを提供している。
DECaLS画像に基づいてトレーニングされたニューラルネットワークは、分布ミスマッチのため、BMzイメージに直接適用することはできない。
本研究では,GZD-5ラベルを用いたDECLS画像からBMz画像に学習したソースドメインモデルを微調整する,教師なし領域適応(UDA)手法について検討する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:48:12 GMT)
Tunable optical amplification and group delay in cavity magnomechanics [0.8] ハイブリッドキャビティ・マグノメカニクス(CMM)システムにおける制御可能な出力プローブの伝送とグループ遅延について理論的に検討する。
光学パラメトリック増幅器(OPA)と2つのイットリウム鉄ガーネット球を内蔵し、マグノン光子カップリングを容易にするゲイン(アクティブ)キャビティと受動(ロス)キャビティとを備える。
これらの結果から, プローブ光の群遅延は, 正値と負値の間で調整可能であることがわかった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:04:54 GMT)
Towards Unifying Evaluation of Counterfactual Explanations: Leveraging Large Language Models for Human-Centric Assessments [0.8] 206人の回答者から8つの評価指標にまたがって、30のカウンターファクトのシナリオを作成し、評価を収集する。
これらの指標で平均的または個人的判断を予測するために、さまざまな大規模言語モデルを微調整しました。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:20:50 GMT)
Short two-qubit pulse sequences for exchange-only spin qubits in 2D layouts [0.8] 量子ドット内の交換専用(EO)スピンキュービットは、スケーラブルなデバイスレイアウトを設計するための広大なデザインランドスケープを提供する。
我々は,CX,CZ,iSWAP,リーク制御CX,リーク制御CZ2量子ゲートの完全なパルス列を生成する。
私たちの研究は、スケーラブルな量子ドットアーキテクチャの将来の実装のためのハードウェアとソフトウェア設計の選択をガイドします。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:48:47 GMT)
VaulTor: Putting the TEE in Tor [0.8] 本稿では,Torネットワークのための新しいアーキテクチャであるVaulTorについて紹介する。
この新しいアーキテクチャでは、ボランティア(Vault)がHidden Serviceに代わってWebアプリケーションコンテンツをホストするためにインセンティブを得ます。
VaulTorアーキテクチャは、ホストされたコンテンツにアクセスする際に、顕著なパフォーマンス劣化を起こさないことを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:06:55 GMT)
Hypergraph clustering using Ricci curvature: an edge transport perspective [0.8] 本稿では, エッジ上の確率測度を定義し, 線拡大でそれらを輸送することにより, リッチフローをハイパーグラフに拡張する新しい手法を提案する。
このアプローチはエッジに新たな重み付けをもたらし、特にコミュニティ検出に有効であることが証明されている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:15:06 GMT)
Kramers-protected hardware-efficient error correction with Andreev spin qubits [0.7] 線形インダクタの結合ネットワークはビットフリップ符号の安定化器からなる静的ハミルトニアンとなることを示す。
回路を介するスピンカップリングは、誤り訂正演算と論理量子ゲートの完全なセットを可能にする。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:01:32 GMT)
Reconstructing 3D Flow from 2D Data with Diffusion Transformer [0.7] 2次元PIVデータから3次元流れ場を再構成するトランスフォーマー方式を提案する。
モデルに2次元平面の位置情報を埋め込むことで,任意の組み合わせの2次元スライスから3次元流れ場を復元することができる。
本研究では,2次元データから3次元流れ場を効率的に高精度に再構成し,現実的な結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:19:48 GMT)
J-EDI QA: Benchmark for deep-sea organism-specific multimodal LLM [0.7] マルチモーダル大言語モデル(LLM)を用いた深海生物のイメージ理解のためのベンチマークであるJ-EDI QAを提案する。
本論文では,OpenAI o1が50%の正応答率を達成した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:11:51 GMT)
MiniGPT-Pancreas: Multimodal Large Language Model for Pancreas Cancer Classification and Detection [0.6] 膵癌診断のための多モーダル大言語モデル(MLLM)であるMiniGPT-PAncreasを報告する。
MiniGPT-Pancreasは膵の検出,腫瘍分類,腫瘍検出のプロンプトとして細調整された。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:18:16 GMT)
Improving Object Detection for Time-Lapse Imagery Using Temporal Features in Wildlife Monitoring [0.6] 時間経過シーケンスの単一フレームにおける対象検出器の性能は,前フレームからの時間的特徴を含めることで向上できることを示す。
シーンの静止要素と非静止要素をキャプチャする2つの追加空間特徴チャネルを統合することで、時間情報を活用する手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 20:37:09 GMT)
IMPLY-based Approximate Full Adders for Efficient Arithmetic Operations in Image Processing and Machine Learning [0.5] 我々は2つのSAPPI(Serial APProximate IMPLY-based full adder)を提案する。
我々の設計では、正確なアルゴリズムと比較してステップ数を39%-41%削減し、エネルギー消費を39%-42%削減する。
提案手法は、MNISTデータセットでトレーニングされた畳み込みニューラルネットワーク(CNN)に適用した場合、最大296mJ(21%)の省エネと13億(20%)の計算ステップを削減できることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:36:40 GMT)
SHAP zero Explains Genomic Models with Near-zero Marginal Cost for Future Queried Sequences [0.5] SHAP 0はシェープ値と相互作用を将来のクエリーシーケンスのほぼゼロの限界コストで推定する手法である。
SHAP 0は、最先端のアルゴリズムと比較して、償却計算コストの桁違いの削減を実現していることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:13:20 GMT)
Variational measurement-based quantum computation for generative modeling [0.5] 測定ベースの量子計算(MBQC)は、量子アルゴリズムを設計するための基本的なユニークなパラダイムを提供する。
量子測定の固有のランダム性のため、MBQCの自然な操作は決定論的でユニタリではない。
本稿では,このランダム性を取り入れたMBQCアルゴリズムの設計と,MBQCのランダムな副産物を計算資源として扱うことを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:12:44 GMT)
Reviewing AI's Role in Non-Muscle-Invasive Bladder Cancer Recurrence Prediction [0.4] 非筋浸潤性膀胱癌(NMIBC)は人体に重大な負担を課し、治療に最も費用がかかるがんの1つである。
NMIBCの再発を予測するための現在のツールは、しばしばリスクを過大評価し、精度が低いスコアシステムに依存している。
機械学習(ML)ベースの技術は、分子および臨床データを活用することでNMIBC再発を予測するための有望なアプローチとして登場した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:03:38 GMT)
A point cloud approach to generative modeling for galaxy surveys at the field level [0.4] 宇宙における銀河の分布を記述するために拡散に基づく生成モデルを導入する。
クイジョートシミュレーションスイートにおける暗黒物質ハローの最初の応用例を示す。
このアプローチは、宇宙データの包括的な分析を可能にするために拡張することができる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 22:49:02 GMT)
Shallow shadows: Expectation estimation using low-depth random Clifford circuits [0.4] 本稿では、2つの既知の古典的シャドウスキームを補間する深さ変調ランダム化計測手法を提案する。
我々は、深さが n で対数的にスケールする体制に注目し、これが両方の極端スキームの望ましい性質を保持する証拠を提供する。
本稿では,古典的シャドウから観測可能量の期待値を推定する手法と,奥行き変調シャドウノルム上の上限を計算する手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:17:36 GMT)
Sequential Conditional Transport on Probabilistic Graphs for Interpretable Counterfactual Fairness [0.4] 我々は,確率的グラフィカルモデルに "Knothe's rearrangement" と "triangular transport" を拡張した。
我々は、個別レベルでの公平性を議論するために、シーケンシャルトランスポート(Sequence transport)と呼ばれるこのカウンターファクトカルアプローチを使用する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:18:40 GMT)
A Deep Learning-Based Fully Automated Pipeline for Regurgitant Mitral Valve Anatomy Analysis From 3D Echocardiography [0.3] 開発したアプローチは、MVアンラスとリーフレットのマルチクラスセグメンテーションのためのU-Netアーキテクチャを備えた3次元マルチデコーダ残差畳み込みニューラルネットワーク(CNN)に依存している。
プロセス全体は最小限のユーザインタラクションを必要とし、約15秒を要する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:26:18 GMT)
Detecting Throat Cancer from Speech Signals using Machine Learning: A Scoping Literature Review [0.3] 人工知能(AI)と機械学習(ML)は、患者の発話から喉がんを検出する可能性がある。
音声から喉がんを検出するためのAIとMLの使用について、包括的なレビューは行われていない。
このレビューは、これらの技術がどのように機能するかを評価し、今後の研究で解決すべき課題を特定することで、このギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:28:29 GMT)
A Classification Benchmark for Artificial Intelligence Detection of Laryngeal Cancer from Patient Speech [0.3] 現在の診断経路は、多くの患者が緊急に疑われたがん経路を誤って参照する原因となっている。
人工知能は、患者音声から喉頭癌の非侵襲的検出を可能にすることで、有望な解決策を提供する。
この研究は、36のモデルをトレーニングし、オープンソースのデータセットで評価するベンチマークスイートを導入している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:34:03 GMT)
Efficient Hamiltonian Simulation: A Utility Scale Perspective for Covalent Inhibitor Reactivity Prediction [0.3] 本稿では、今日の量子システムで実行可能な化学問題のサイズを拡大する進歩を実証する。
共有結合性薬物分子の回路深さは29倍に減少し, ハミルトン動力学による反応性予測が可能となった。
IBMQのHeronアーキテクチャを採用すると、最大16倍の削減が見込まれる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:25:01 GMT)
GraphDOP: Towards skilful data-driven medium-range weather forecasts learnt and initialised directly from observations [0.2] GraphDOPは観測された量と興味の物理量との相関を学習する。
今後最大5日間の気象パラメータの厳密な予測を行うことができる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:06:14 GMT)
VORD: Visual Ordinal Calibration for Mitigating Object Hallucinations in Large Vision-Language Models [0.2] LVLM(Large Vision-Language Models)は、提供されたソース内容に基づいて、不正確な情報や一貫性のない情報を生成する傾向にある。
本稿では,修正された画像ペア間の順序関係に基づいてトークン予測を校正することで幻覚を緩和する,簡便で効果的なVORDを提案する。
我々の実験は、VORDがより優れた校正を行い、広範囲のLVLMベンチマークでオブジェクト幻覚を効果的に緩和することを示した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:00:26 GMT)
Macroscopic distant magnon-mode entanglement via a squeezed drive [0.2] 量子マグノニクスは、この方向に進むための有望なプラットフォームとして大きな注目を集めている。
提案手法では, 一つのイットリウム鉄ガーネット(YIG)球体を各空洞に収容した一次元キャビティアレイを用いた。
量子情報処理や量子通信システムにおけるキャビティ-マグノンアレイの応用が期待できる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:34:51 GMT)
Deterministic remote entanglement using a chiral quantum interconnect [0.2] 本研究では、2つの名前のついた同一モジュール間のカイラル量子相互接続を別々のマイクロ波パッケージに構築する。
量子干渉を利用して、必要に応じてマイクロ波光子を放出し、これらのモジュール間で選択された方向に吸収する。
我々は,62.4+/-1.6%(光子伝播)と62.1+/-1.2%(右)の4量子W状態の形で,モジュール間のリモート絡み合いを生成する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 20:59:06 GMT)
Non-Random Data Encodes its Geometric and Topological Dimensions [0.2] 符号化理論に幅広い応用を施した信号デコンボリューション手法を提案する。
任意の受信信号から得られた多次元空間再構成法は,符号化復号方式の非依存なvis-a-visであることが証明された。
非ランダムデータを復号するこの最適で普遍的な方法は、信号処理、因果分解、トポロジカルおよび幾何学的性質の符号化、暗号、バイオ・テクノロジーシグナチャ検出に応用できると論じる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:14:48 GMT)
Stalling in Space: Attractor Analysis for any Algorithm [0.1] 我々は、CMA-ES、微分進化、24のノイズレスブラックボックス最適化ベンチマーク問題に対するランダム検索のためのアトラクタネットワークを構築した。
我々は,他のモデルでは不可能なアルゴリズム動作の洞察を促進するために,局所探索を含まないアルゴリズムに対しても,アトラクタ解析の考慮を提唱する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:44:58 GMT)
A Framework for Streaming Event-Log Prediction in Business Processes [0.1] ストリーミングモードにおけるイベントログ予測のためのPythonベースのフレームワークを提案する。
このフレームワークは、n-gramやLSTMといった言語モデルを含むストリーミングアルゴリズムを簡単に統合できる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:29:14 GMT)
Choose Your Explanation: A Comparison of SHAP and GradCAM in Human Activity Recognition [0.1] 本研究は,Shapley Additive Explanations (SHAP) と Gradient-weighted Class Activation Mapping (GradCAM) を比較した。
本研究では,これらの手法を定量的かつ定量的に比較し,摂動実験による特徴重要度ランキング,解釈可能性,モデル感度に着目した。
我々の研究は、SHAPとGradCAMが相互に補完し、より解釈可能で実行可能なモデル説明を提供する方法を示している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:53:25 GMT)
A Differentiable Model for Optimizing the Genetic Drivers of Synaptogenesis [0.1] 合成生物学的知能の出現を近づけるための新しい計算フレームワークであるSynaptoGenを紹介する。
SynaptoGenは、コネクトームモデル(CM)のファミリの最初のモデルであり、シナプス乗法に関する力学的な説明を提供する。
微分可能性はフレームワークの重要な特徴であり、勾配に基づく最適化技術との統合を可能にする。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:49:57 GMT)
Entanglement harvesting in quantum superposed spacetime [0.1] 量子重ね合わせにおける時空の絡み合い収穫現象について検討する。
時空の重畳された性質は、ツイストフィールドとアンウィストフィールドの両方の絡み合いを著しく向上させる干渉効果を誘導することを発見した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:18:22 GMT)
Precision ICU Resource Planning: A Multimodal Model for Brain Surgery Outcomes [0.1] 臨床データと画像データを組み合わせたマルチモーダルアプローチは、現在の臨床データのみを0.29[F1]から0.30[F1]に上回る。
本研究は、特に重度のクラス不均衡の文脈において、効果的なICU入院予測がマルチモーダルデータ融合の恩恵を受けることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:59:34 GMT)
Toward Appearance-based Autonomous Landing Site Identification for Multirotor Drones in Unstructured Environments [0.1] 地形分類器を学習するための合成データセットを自動生成するパイプラインを提案する。
次に、合成データセット上でU-Netをトレーニングし、実世界のデータで検証し、リアルタイムでドローンプラットフォーム上でそれを実証します。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 01:48:37 GMT)
Improved GUI Grounding via Iterative Narrowing [0.0] 本稿では,GUIグラウンディングにおける汎用モデルと微調整モデルの両方の性能向上のために,反復的絞り機構を用いた視覚的プロンプトフレームワークを提案する。
評価のために、様々なUIプラットフォームからなる包括的なベンチマークで手法を検証し、その結果を再現するコードを提供した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:16:32 GMT)
LEDA: Log-Euclidean Diffeomorphic Autoencoder for Efficient Statistical Analysis of Diffeomorphism [0.0] 非可逆的変形性登録は解剖学的変異を追跡するのに不可欠である。
変形場を解析するための従来の手法は計算に高価であり、数値的な誤りを生じやすい。
逆整合性を強制する損失関数を導入し、変形場の正確な潜伏表現を保証する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:26:10 GMT)
Wonderful Matrices: Combining for a More Efficient and Effective Foundation Model Architecture [0.0] 状態空間双対性アルゴリズムに回転位置を埋め込むことが可能であることを示し、これは2次因果自己アテンションと状態空間双対性の組み合わせの複雑さを4%以上減少させる。
次に,より難易度の高いマルチクエリ・アソシエイト・リコールタスクにおいて,100%の精度を維持するダイナミックマスクアテンションを提案する。
第3に、専門家のクロスドメイン混在を設計し、専門家の混在の8倍から10倍の速さで1024人以上の専門家による専門家検索の計算速度を向上する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:43:13 GMT)
What is the absolutely continuous spectrum? [0.0] このプログラムは、自己随伴作用素 H の絶対連続スペクトルを、H に正則に関連付けられた適切な開量子系の輸送特性の観点から特徴づけるものである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:54:01 GMT)
Weak ergodicity breaking from supersymmetry in a fermionic kinetically constrained model [0.0] 超対称性は、運動的に制約された格子フェルミオンモデルを構築するための自然な遊び場を提供する。
超対称性は、力学が特定の初期状態に対して周期的回復を示すことを意味する。
我々は、整数の平方根(プラスまたはマイナス)で与えられるエネルギーで準熱的絡み合いのスケーリングに従う量子多体スカーのような固有状態を明らかにすることで、さらに平行に描く。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 19:00:01 GMT)
VirusT5: Harnessing Large Language Models to Predicting SARS-CoV-2 Evolution [0.0] 我々は,SARS-CoV-2の進化を予測するために,大規模言語モデルの力を利用した。
我々は、SARS-CoV-2進化の根底にある変異パターンを捉えるために、VrusT5と呼ばれるトランスフォーマーモデルを訓練した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:46:42 GMT)
Variational quantum-algorithm based self-consistent calculations for the two-site DMFT model on noisy quantum computing hardware [0.0] 本稿では,変分量子固有解法(VQE)アルゴリズムに基づく2サイトDMFTモデルを解くためのQC手法を提案する。
本稿では,アルゴリズムによる確率的・デバイス誤差の伝播と,計算した自己エネルギーへの影響について分析する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:33:02 GMT)
Variance of the sum of independent quantum computing errors [0.0] 量子コンピューティングエラーの総和は、量子コンピューティングにおけるエラーの推定と制御の鍵となる要素である。
我々は、独立の式が量子コンピューティングエラーであることを証明する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:22:51 GMT)
Variable Metric Evolution Strategies for High-dimensional Multi-Objective Optimization [0.0] 我々は高次元問題に適した可変距離展開戦略のクラスを設計する。
私たちは多くの変数で問題をターゲットにしています。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:05:42 GMT)
Using matrix-product states for time-series machine learning [0.0] マトリックス生成状態(MPS)は、量子多体物理学をモデル化するための汎用的なアンザッツであることが証明されている。
本稿では,MPSをベースとしたMPSTimeアルゴリズムを開発し,観測時系列データセットに基づく共同確率分布を学習する。
分類や計算を含む時系列機械学習の問題にどのように対処できるかを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:11:04 GMT)
Understanding the Effect of Agile Practice Quality on Software Product Quality [0.0] 優れたコーディングプラクティスと品質管理テクニックは、製品品質のすべての側面に肯定的に相関します。
すべてのソフトウェア開発活動に高いレベルのチーム計画とコミュニケーションは必要ない。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:26:54 GMT)
Understanding Individual Agent Importance in Multi-Agent System via Counterfactual Reasoning [0.0] 本稿では,エージェントの重要度を評価する新しいエージェントレベルの説明手法であるEMAIを提案する。
反実的推論にインスパイアされたエージェントのランダム化作用による報酬の変化は、その重要性を示唆している。
EMAIは、ベースラインよりも説明の忠実度が高く、実践的応用においてより効果的なガイダンスを提供する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:24:43 GMT)
Towards an identity management solution on Arweave [0.0] 本稿では、Arweaveネットワークを用いてID管理ソリューションを開発する可能性について検討する。
Arweaveの永続ストレージを活用することで、当社のソリューションは、ユーザにSSI(Self-Sovereign Identity)フレームワークを提供します。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:06:01 GMT)
Towards Safe and Honest AI Agents with Neural Self-Other Overlap [0.0] SOO(Self-Other Overlap)の微調整は、正直なAIを構築する能力を大幅に改善する可能性がある。
共感に関する認知神経科学の研究にインスパイアされたSOOは、AIモデルが自分自身や他者を表現する方法の整合化を目指している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 20:23:52 GMT)
Towards Democratized Flood Risk Management: An Advanced AI Assistant Enabled by GPT-4 for Enhanced Interpretability and Public Engagement [0.0] GPT-4を利用したAIアシスタントを開発した。
このツールは、意思決定者、一般人、および予測者とのコミュニケーションを強化する。
洪水警報を検索し、問い合わせに回答し、リアルタイム警告と洪水マップとソーシャル脆弱性データを統合する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 20:00:11 GMT)
Topology and Spectrum in Measurement-Induced Phase Transitions [0.0] 観測された量子系における位相位相は、そのスペクトルと多体位相不変量により特徴づける。
我々の研究は、トポロジカル位相のバルクエッジ対応を平衡から観測された量子力学へ拡張する道を開く。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:21:18 GMT)
The common ground of DAE approaches. An overview of diverse DAE frameworks emphasizing their commonalities [0.0] 様々な指数と正則性の概念を考慮し、共通基盤を求める。
DAEの特性を記述するために,指標だけでなく,これらの標準特性値も重要であることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:05:01 GMT)
The State of Julia for Scientific Machine Learning [0.0] Juliaの機能とエコシステムを現代的に見て、言語の現状を評価し、その生存可能性と落とし穴について論じます。
私たちはコミュニティに、さらなる採用を妨げているJuliaの言語レベルの問題に対処するよう呼びかけています。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:17:23 GMT)
The Role of Recurrency in Image Segmentation for Noisy and Limited Sample Settings [0.0] フィードフォワードセグメンテーションモデル上に構築し、画像セグメンテーションのための複数のタイプの繰り返しを探索する。
これらのモデルを,高レベルのノイズと数ショットの学習環境の影響を解析しながら,人工的および医療的画像データ上で検証した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:55:37 GMT)
The Clear Sky Corridor: Insights Towards Aerosol Formation in Exoplanets Using An AI-based Survey of Exoplanet Atmospheres [0.0] 我々は人工知能を用いて、公開されているHST WFC3データセットの均一な伝送スペクトルを生成する。
280から2580ケルビンの温度を持つ42個の太陽系外惑星を調査し、熱い木星の1.4 mにおける水バンドの振幅と平衡温度の関係をモデル化した。
興味深いことに、惑星の質量対平衡温度図では、700から1700のケルビンの惑星がより強い1.4um H2O帯の測定値を示す「クラー・スカイ・コリドール」が示される。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:29:59 GMT)
Systematic discrepancies between reference methods for non-covalent interactions within the S66 dataset [0.0] 量子拡散モンテカルロ(DMC)と、単一、二重、摂動三重励起(CCSD(T))による結合クラスタ理論は、非共有相互作用を扱う2つの広く信頼されている方法と考えられている。
最近の研究は、これらの2つの方法がより大きなシステムに対して7.5,$kcal/mol以上で一致しないことを示唆している。
分散と静電相互作用のバランスの取れた66個の中規模錯体を含むS66データセット全体の相互作用エネルギーを計算した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 23:49:57 GMT)
Sulfur in diamond and its effect on the creation of nitrogen-vacancy defect from \textit{ab initio} simulations [0.0] 負電荷窒素空孔(NV)中心はダイヤモンドの最も重要で広く研究されている欠陥の1つである。
近年の研究では、ドープダイヤモンド層に窒素分子イオンを注入することにより、NV中心の生成と活性化効率が向上することが報告されている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 19:43:47 GMT)
Statistical Modeling of Univariate Multimodal Data [0.0] そこで本研究では,一助データを一助部分集合に分割する手法を提案する。
谷点検出には, 経験的累積密度関数の凸船体上の臨界点の特性を導入する。
次に、得られた各ユニモーダル部分集合に対する統計モデルを提供するユニモーダルデータモデリング手法を適用する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:49:15 GMT)
Sparse Non-Markovian Noise Modeling of Transmon-Based Multi-Qubit Operations [0.0] 量子力学におけるノイズの影響は、現在の量子プロセッサが正確な量子計算を行うのを防ぐ主要な要因の1つである。
本稿では,トランスモンデバイス上でのマルチキュービット動作の効果的なノイズモデリング手法を提案する。
本モデルでは,非時間的相関ノイズ源を含む1ビットおよび2ビットの幅広い振る舞いを捕捉し,予測できることが示されている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:37:26 GMT)
Semi-Supervised Adaptation of Diffusion Models for Handwritten Text Generation [0.0] 手書きテキスト生成のための潜時DMの拡張を提案する。
提案するコンテントエンコーダは,テキストおよび書体の特徴に対して,DMの条件付けを行う異なる方法を実現する。
新たなラベル付きデータセットにモデルを適応させるため,半教師付きトレーニングスキームを提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:48:58 GMT)
Segmentation of arbitrary features in very high resolution remote sensing imagery [0.0] 我々は、VHR RS画像に任意の機能を分割するスケーラブルなソリューションであるEcoMapperを紹介した。
EcoMapperでトレーニングされたモデルは、現実のUAVデータセットで2つの異なる特徴をセグメント化することに成功している。
収集データにDL手法を効果的に適用するための総合的なフィールドサーベイ手法を開発した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:48:52 GMT)
Scientific Realism vs. Anti-Realism: Toward a Common Ground [0.0] 科学リアリズムと反リアリズムの議論はいまだに停滞している。
鍵となるのは、誰もが真実を尊重するという考えを活用することです。
この共通基盤はまた、リアリズムの議論において不一致性の顕著な根源を分離している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:55:54 GMT)
Rethinking the Atmospheric Scattering-driven Attention via Channel and Gamma Correction Priors for Low-Light Image Enhancement [0.0] 本稿では,Channel-Prior and Gamma-Estimation Network (CPGA-Net)の拡張版を紹介する。
CPGA-Net+は大気散乱モデルによって駆動される注意機構を組み込んでいる。
ガンマ補正を施したプラグインアテンションによるグローバル画像処理とローカル画像処理の両方に効果的に対処する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 19:44:24 GMT)
Reconstruction of Contour Lines During the Digitization of Contour Maps to Build a Digital Elevation Model [0.0] 壊れた輪郭セグメントは、デジタル標高モデル(DEM)を構築している間、より大きなリスクを課す
このプロジェクトでは、壊れたセグメントのエンドポイントを正確にかつ効率的にマッチングし、再接続するために、シンプルで効率的なメカニズムが使用される。
本研究の目的は,輪郭地図のデジタル化時に発生する破損した輪郭線を再接続し,対応する輪郭地図に対して最適なデジタル標高モデルを構築することである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:02:42 GMT)
Quantum transport in randomized quantum graphs [0.0] ランダム化量子グラフ(RQG)の伝送係数を計算する。
主な結果は、輸送が一対の頂点間の接続の除去によって重要な影響を受けていることを示している。
また、エッジ除去数があまり小さくなくても、送信が完全に抑制される領域の存在を示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:29:16 GMT)
Quantum stochastic thermodynamics: A semiclassical theory in phase space [0.0] 量子多体系の定式化は相空間における半古典的処理によって提案される。
メソスコピックレベルの力学としてフォッカー・プランク方程式を用いる。
位相空間分布の軌跡に基づいて熱力学量を定義する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:59:49 GMT)
Quantum Subroutines in Branch-Price-and-Cut for Vehicle Routing [0.0] この研究で、限られた資源を持つ量子がNPハード問題に対する大規模な正確な最適化アルゴリズムにどのように統合できるかを実証する。
我々のアルゴリズムの重要な特徴は、量子によって返される最良の解からではなく、あるコスト閾値以下の全ての解から得られることである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:27:23 GMT)
Quantum Models of Consciousness from a Quantum Information Science Perspective [0.0] この視点は、量子情報科学の観点から様々な意識の量子モデルを探究する。
検討中のモデルは、脳内で量子力学が機能するレベルに基づいて、3つの異なるグループに分類することができる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:31:03 GMT)
Practical learning of multi-time statistics in open quantum systems [0.0] 従来のシャドウトモグラフィーの理論ツールを時間領域に一般化し、マルチタイム現象を探索する。
これにより、相関誤差率、マルチタイム非マーキティ、時間的絡み合いなどのマルチタイムプロセスの特徴を効率的に学習することができる。
ノイズ特性を特徴付けるために、ノイズの多い量子プロセッサ上でこれらのツールの有効性をテストする。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:46:18 GMT)
Orthogonal Polynomials and Perfect State Transfer [0.0] 特に,完全状態移動を検出するためにヤコビ作用素をどのように利用できるかについて議論する。
これらのアイデアが、隣同士の相互作用が近い量子ウォークにどのように拡張されたかを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:20:04 GMT)
Optimizing entanglement in two-qubit systems [0.0] 基本パラメータの最小値に基づく幾何表現を用いた2量子系の絡み合いについて検討する。
2つの量子ビットの最適化状態はX字型であり、同じ集団のホスト対である。
絡み合いの幾何学的L-測度は、絡み合い状態を表すSの点と分離状態を定義する最も近い点の間の距離として導入される。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 22:50:01 GMT)
Optimizing Low-Speed Autonomous Driving: A Reinforcement Learning Approach to Route Stability and Maximum Speed [0.0] 本稿では、予め定義された経路を走行しながら、低速自動運転における最大速度安定性を維持するという課題に対処する。
低速シナリオにおいても安全性や経路精度を損なうことなく、車両が最高速に近い速度を達成できるような運転ポリシーを最適化するための新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 01:06:41 GMT)
Optimizing Fintech Marketing: A Comparative Study of Logistic Regression and XGBoost [0.0] 本研究は、消費者行動を分析し、ダイレクトメールキャンペーンに対する反応を予測するための高度な機械学習技術を用いている。
XGBoostは、特にカテゴリ別バイナリとカスタム計算を使用したシナリオにおいて、さまざまなメトリクスのロジスティックレグレッションを一貫して上回る。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 20:45:42 GMT)
Optimization of Two-Qubit Gates in Tunable-Coupler Architectures Using Single Flux Quantum Control [0.0] 本研究では,2つのトランスモン量子ビットをチューナブルカプラで結合したシステムにおいて,高忠実な2量子ビットの量子ゲートを構築するための勾配法を提案する。
電子回路を用いた従来の制御方式の代替として,単一磁束量子(SFQ)パルスに着目した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:54:39 GMT)
Navigating AI to Unpack Youth Privacy Concerns: An In-Depth Exploration and Systematic Review [0.0] この体系的な文献レビューは、人工知能(AI)システムにおけるプライバシーに関する若いデジタル市民の認識、関心、期待について調査する。
データ抽出は、プライバシの懸念、データ共有のプラクティス、プライバシとユーティリティのバランス、AIの信頼要因、個人データのユーザコントロールを強化する戦略に焦点を当てている。
発見は、個人情報のコントロールの欠如、AIによるデータの誤用の可能性、データ漏洩や不正アクセスの恐れなど、若いユーザーの間で重要なプライバシー上の懸念を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 22:00:06 GMT)
Multiplexed Readout of Superconducting Qubits Using a 3D Re-entrant Cavity Filter [0.0] 超伝導量子ビットの周波数多重読み出しのための3次元再入射キャビティフィルタを提案する。
キャビティフィルタは、キュービット回路の平面外に配置され、大きなキュービットアレイにスケール可能な方法で、オンチップ読み出し共振器のアレイに容量的に結合する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:04:47 GMT)
Multipartite entanglement structure of monitored quantum circuits [0.0] 本稿では,量子フィッシャー情報のレンズを通して観測された位相の多部絡み合いの視点を提案する。
この結果から,非構造監視ランダム回路は,臨界時にも分岐多部絡みを生じないことが明らかとなった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:06:35 GMT)
Millikelvin Nb nanoSQUID-embedded tuneable resonator fabricated with a neon focused-ion-beam [0.0] そこで, ナノSQUIDのネオン集束ビーム加工により, 周波数調整性能が$T=16$mKとなるモノリシックNbナノSQUID埋込み共振器を提案する。
小型のスピンクラスターに結合する装置の適用性を評価するため,マイクロ波駆動電力と外部磁場の関数としてフラックス感度を特徴付ける。
本稿では, Nb SQUID埋込み共振器をハイブリッド超電導体-スピン用として実現し, フラックス感度を劇的に向上させるデバイス設計の改善について論じる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:48:47 GMT)
Mapping of a many-qubit state onto an oscillator using controlled displacements [0.0] 振動子四重項によって制御された四重項において、キューディット状態がどのように変位するかを示す。
キューディット二次状態の重ね合わせで量子情報を符号化する完全回路を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:49:05 GMT)
Many-body enhancement in a spin-chain quantum heat engine [0.0] 強磁性相互作用は低温における量子スピンチェーンエンジンの断熱性能を向上させることができることを示す。
作業出力の増大は特に顕著であり、相互作用強度とともに指数関数的に増加する。
弱い相互作用に対する摩擦を緩和できる近似的、実験的に実現可能な反断熱駆動を同定する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:12:57 GMT)
Machine Learning Techniques for Pattern Recognition in High-Dimensional Data Mining [0.0] 本稿では,サポートベクトルマシン(SVM)に基づく頻繁なパターンデータマイニングアルゴリズムを提案する。
頻繁なパターンマイニングタスクを分類問題に変換することにより、SVMモデルを導入し、パターン抽出の精度と堅牢性を向上させる。
実験により、SVMモデルは、高いデータ空間と多数のトランザクションを持つ環境において、優れたパフォーマンス上のアドバンテージを持つことが示された。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:32:05 GMT)
Logic-Constrained Shortest Paths for Flight Planning [0.0] 論理制約短経路問題(LCSP)は、1対1の短経路問題と、ルーティンググラフに課される満足度制約を組み合わせた問題である。
LCSPのための新しい分岐および境界ベースアルゴリズムを提案する。
本稿では,TLFをLCSPとしてモデル化し,分岐および有界アルゴリズムを用いてそれを解決する方法について述べる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:38:40 GMT)
Lecture Notes on High Dimensional Linear Regression [0.0] この内容は命題保護構造に従っており、機械学習の基礎となる統計理論の形式的で厳密な理解を求める学生に適している。
講義ノートは線形回帰の先進的なトピックをカバーしており、このセッティングにおける最も顕著な推定者の存在、一意性、関係性、計算、および非漸近的性質を詳細に探求している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:48:27 GMT)
LLAssist: Simple Tools for Automating Literature Review Using Large Language Models [0.0] LLAssistは学術研究における文献レビューの合理化を目的としたオープンソースツールである。
レビュープロセスの重要な側面を自動化するために、Large Language Models(LLM)とNatural Language Processing(NLP)技術を使用する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:06:25 GMT)
Knowledge-dependent optimal Gaussian strategies for phase estimation [0.0] 推定位相パラメータの知識に基づいて、最適純単モードガウスプローブ状態を特定する。
先行不確実性が大きい場合、最適プローブ状態はコヒーレント状態に近いことが分かる。
驚くべきことに、最適なプローブ状態が急激な真空状態に変化するクリアジャンプがある。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:16:33 GMT)
Integrability versus chaos in the steady state of many-body open quantum systems [0.0] 開量子系のリンドブラッドの記述は、2種類の可積分性をもたらす。
レベル間隔統計と固有状態熱化仮説の開量子系への拡張を組み合わせる。
演算子サイズの分布を効果的に利用してカオス的かつ可積分な定常状態の識別が可能であることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:42:20 GMT)
Insensitivity of the two-photon Jaynes-Cummings model to thermal noise [0.0] 熱場力学(TFD)法を用いた多光子Jaynes-Cummingsモデル(JCM)の熱効果について検討した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:44:33 GMT)
Inference Scaling vs Reasoning: An Empirical Analysis of Compute-Optimal LLM Problem-Solving [0.0] 大規模言語モデル(LLM)の最近の進歩は、精度と推論能力の最大化に重点を置いている。
本稿では,2つの対照的なアプローチの統合を解析することにより,推論の強化と計算効率の相乗効果について検討する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:42:45 GMT)
Indistinguishable MHz-narrow heralded photon pairs from a whispering gallery resonator [0.0] 香港・ウー・マンデル干渉は多くの量子光学応用において重要な役割を果たす。
異なる空間モードに放射される2つの独立した信号光子が、条件付きで区別不能にレンダリングできることを実証する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:25:29 GMT)
Indistinguishability of remote quantum dot-cavity single-photon sources [0.0] 半導体量子ドットを用いた遠隔地から放出される光子のHong-Ou-Mandel干渉について検討した。
44$pm$1%から69$pm$1%の遠隔不確定性を示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:27:25 GMT)
Improving analytical color and texture similarity estimation methods for dataset-agnostic person reidentification [0.0] ノイズ低減のためのヒストグラムスムーシングを用いて,CIE-Lab色空間の色を解析・比較する。
テクスチャ解析のために,新しい事前構成潜在空間 (LS) 教師付きオートエンコーダ (SAE) を提案する。
提案手法の有効性は,Market1501データセット上のランク1,ランク10,mAPリIDメトリクスを用いて検証する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:17:53 GMT)
Hole burning experiments and modeling in erbium-doped silica glass fibers down to millikelvin temperatures: evidence for ultra-long population storage [0.0] 超低温で、磁場が変化しても、スピン緩和のダイナミクスは異なる条件で変化することが判明した。
崩壊成分の比較的安定な相対重みは、観察された緩和ダイナミクスに寄与する異なるイオンの集団を示唆している。
これらの結果は、EDFが量子メモリアプリケーションの候補として有望であり、さらなる最適化の余地があることを示唆している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:03:47 GMT)
Hidden Figures in Software Engineering: A Replication Study Exploring Undergraduate Software Students' Awareness of Distinguished Scientists from Underrepresented Groups [0.0] 女性、LGBTQIA+個人、黒人学生は、ソフトウェアエンジニアリングプログラムでしばしば歓迎されない環境に遭遇する。
本研究は,大学院ソフトウェア工学の学生を対象にしたグローバルな調査から得られた知見を報告する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:26:23 GMT)
Grade of the law of distribution of the vector of the digital twin of the enterprise [0.0] 本研究の目的は,Kolmogorovテストを用いてP2M法を用いてプロジェクトのデジタルコピーを管理するアルゴリズムを開発し,様々なプロセスの有効性を評価し,生産性を向上させる最善の方法を決定することである。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:41:33 GMT)
Giant number-parity effect leading to spontaneous symmetry breaking in finite-size quantum spin models [0.0] 自発対称性の破れは、対称ハミルトニアンによって支配される多体系において起こる。
SSBは無限大の量子スピン系で観測可能であることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:14:08 GMT)
Frequency Is What You Need: Word-frequency Masking Benefits Vision-Language Model Pre-training [0.0] 視覚言語モデル(VLM)は、トレーニングセットのサイズを小さくできれば、より効率的にトレーニングすることができる。
最近の研究は、様々なアプローチを用いたVLMトレーニングにおけるテキストマスキングの利点を示している。
トレーニングのエポックよりも最高のマスキング戦略が変化し、十分なトレーニングのエポックを考慮すれば、ワード頻度情報は最高のパフォーマンスを達成するために必要なものであることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:51:41 GMT)
Fair Distributed Machine Learning with Imbalanced Data as a Stackelberg Evolutionary Game [0.0] 分散学習はStackelbergの進化ゲームだと考えている。
3つの医学データセットを用いて、分散学習における不足表現ノードに対する動的重み付けの影響を明らかにする。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:23:12 GMT)
Extracting work from coherence in a two-mode Bose-Einstein condensate [0.0] 2モードのボース=アインシュタイン凝縮体における数状態コヒーレンスから作業をどのように抽出できるかを示す。
我々は、(コヒーレンスから)量子的貢献と(古典的な)作業出力への貢献を特徴づける。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:00:34 GMT)
Evaluating the Propensity of Generative AI for Producing Harmful Disinformation During an Election Cycle [0.0] 本研究は, 選挙期間中に有害な偽情報を生成するための, 現在の生成AIモデルの妥当性について検討する。
コピロとジェミニは、予想される最低限の損害に気付き、全体的な安全性能に結びついていることが判明した。
敵対的役割の特徴が発見され 全てのモデルに より大きな害をもたらすことが判明しました
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:51:33 GMT)
Ethics and Technical Aspects of Generative AI Models in Digital Content Creation [0.0] GPT-4oやDALL-E 3といったジェネレーティブAIモデルは、デジタルコンテンツ生成を再構築している。
本稿では,創造産業におけるこれらのモデルの有効性と課題について考察する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 22:53:29 GMT)
Estimation of the frequency-shift between two photons by time-sampling measurements [0.0] 本稿では、2つの非絡み合った光子の周波数差を推定するためのセンシング手法を提案する。
我々は、既に$sim 1000$のサンプリング測定で、Cram'er-Rao境界は周波数差の値とは無関係に飽和していることを示した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 19:35:17 GMT)
Estimate of equilibration times of quantum correlation functions in the thermodynamic limit based on Lanczos coefficients [0.0] 量子カオス系における局所観測値の平衡時間$T_texteq$について検討する。
数値的には、観測可能値が最終的に滑らかに成長するランツォス係数を示すなら、前者の有限個数は平衡時間の合理的な推定に十分である。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 14:24:17 GMT)
Error-corrected fermionic quantum processors with neutral atoms [0.0] 多体フェルミオン系はフェルミオン量子プロセッサを用いてハードウェア効率よくシミュレートできる。
本稿では,現在の実験機能を用いて実装可能な誤り訂正型フェルミオン量子コンピュータの青写真について述べる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:25:46 GMT)
Equivariant neural networks and piecewise linear representation theory [0.0] 等価ニューラルネットワークは対称性を持つニューラルネットワークである。
群表現の理論により、同変ニューラルネットワークの層を単純な表現に分解する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:14:34 GMT)
Entanglement entropy scaling laws from fluctuations of non-conserved quantities [0.0] エンタングルメントエントロピーのスケーラブルな実験的プローブとして,オンサイト演算子の和からなる観測変数のゆらぎを低減した。
具体的には、スピン鎖における密度行列再正規化群計算により、縮小されたゆらぎは絡みエントロピーと同じ大きさのスケーリング特性を示すことを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:33:54 GMT)
Entanglement dynamics and eigenstate correlations in strongly disordered quantum many-body systems [0.0] 我々は、強い乱れ、相互作用する量子系の動的固有状態相関の観点から、絡み合いの顕微鏡理論を示す。
これらの時間スケールの階層構造と非自明な分布は、絡み合いの時間的成長において対数論を生み出すことを示唆する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:56:29 GMT)
Enhancing Green Economy with Artificial Intelligence: Role of Energy Use and FDI in the United States [0.0] 本研究は,1990年から2022年までの米国における,人工知能(AI)の革新,経済成長,外国直接投資(FDI),エネルギー消費,都市化がCO2排出量に与える影響について検討した。
AIイノベーションは環境ストレス、経済成長、エネルギー利用、FDI、都市化を緩和し、環境劣化を悪化させる。
この研究は、グリーンFDIの推進、AI技術の進歩、持続可能なエネルギープラクティスの採用、米国における持続可能な成長を促進するためのエコフレンドリーな都市開発の導入といった政策措置を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 03:03:21 GMT)
Easy better quantum process tomography [0.0] 標準線形反転QPTとオーバーコンプリート線形反転QPTに対する明示的な補正手順を提案する。
また、最大推定のような統計的に原理化された推定器に拡張する方法についても述べる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 19:07:48 GMT)
EF-Net: A Deep Learning Approach Combining Word Embeddings and Feature Fusion for Patient Disposition Analysis [0.0] EF-Net を用いた患者沈着予測モデルを構築した。
EF-NetとXGBoostのモデルを組み合わせて、結果の精度を高める。
実験の分析によると、EF-NetはMIMIC-IV-EDデータセット上の既存の精度、AUROC、F1-Scoreを超えている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:31:24 GMT)
Dynamics of the order parameter in symmetry breaking phase transitions [0.0] ランゲヴィン方程式における時間的あるいは空間的依存を規定する常微分方程式は、相転移の力学に関する重要な洞察を与えることを示した。
この発見により、広範囲の待ち時間スケールにわたる通常の微分方程式を用いたキブル・ズールクスケーリングの探索が可能となる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:04:22 GMT)
Dynamics of non-Hermitian Floquet Wannier-Stark system [0.0] 強結合近似の枠組みにおける非エルミートフロッケワニエ・スターク系の力学について検討する。
即時ハミルトニアンのエネルギー準位は依然として等間隔であり、時間$t$とホッピング項のエルミティシティとは独立である。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:05:49 GMT)
Disciplining Deliberation: A Sociotechnical Perspective on Machine Learning Trade-offs [0.0] 人工知能における2つの顕著なトレードオフは、予測精度と公正性、予測精度と解釈可能性の間のものである。
一般的な解釈では、これらの形式的なトレードオフは、根底にある社会的価値の間の緊張と直接的に対応していると見なされている。
トレードオフの価値を検証するための社会技術的アプローチを紹介します。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 19:22:27 GMT)
Developing an Ontology for AI Act Fundamental Rights Impact Assessments [0.0] 最近発表されたEU人工知能法(AI Act)は、AI技術の使用を規制している。
その新しい要件の1つは、基本的人権影響評価(FRIA)を実施する義務である。
セマンティックWeb標準に基づくオントロジーとしてFRIAの新たな表現を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 00:37:33 GMT)
Demystifying the Potential of ChatGPT-4 Vision for Construction Progress Monitoring [0.0] OpenAIのGPT-4 VisionのようなLVLM(Large Vision-Language Model)は様々な分野に統合されている。
本稿では,建設業における GPT-4 Vision の実用化について検討する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:49:22 GMT)
Deep learning joint extremes of metocean variables using the SPAR model [0.0] 本稿では,メトカン変数の多変量結合極値推定のための新しいディープラーニングフレームワークを提案する。
5つのメトカン変数のケーススタディを用いて, この手法を高次元に適用する方法を示す。
データ駆動型アプローチは、表現可能な依存構造において、非常に柔軟性を提供します。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:39:07 GMT)
Deep Learning and Hybrid Approaches for Dynamic Scene Analysis, Object Detection and Motion Tracking [0.0] 本研究の目的は,活動の検出に基づいて映像を小さなクリップに分割する,堅牢な映像監視システムを開発することである。
例えば、CCTVの映像を使って、人や泥棒の外観のような主要なイベントのみを記録し、ストレージを最適化し、デジタル検索がより簡単になる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:59:53 GMT)
Deciphering the Underserved: Benchmarking LLM OCR for Low-Resource Scripts [0.0] 本研究では、ウルドゥー語、アルバニア語、タジク語などの低リソーススクリプトにおける光学文字認識(OCR)のための大規模言語モデル(LLM)、特にGPT-4oの可能性について検討する。
テキストの長さ、フォントサイズ、背景色、ぼやけなど、制御されたバリエーションを取り入れた2,520の画像を精巧にキュレートしたデータセットを使用して、研究はさまざまな現実世界の課題をシミュレートする。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:05:22 GMT)
Cryptographic tests of the python's lunch conjecture [0.0] 本研究では,プロジェクティブテンソルネットワークモデルの結果を明らかにするために,シークレットの条件開示と呼ばれるプリミティブに関連する暗号ツールを起動する。
そこで本研究では,適切なCFTサブリージョン間の相互情報は,ランチの形状に関連付けられた領域差によって線形に低くなることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 19:12:39 GMT)
Crossed products and quantum reference frames: on the observer-dependence of gravitational entropy [0.0] 量子参照フレーム(QRF)を用いた重力エントロピーの詳細な解析を行う。
我々は、QFTのエネルギーのゆらぎにエネルギー変動が支配される時計を特徴とする半古典的状態を考える。
エントロピーを評価する際に、時計が単に部分的に追跡される可能性があることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:29:55 GMT)
Critique of Impure Reason: Unveiling the reasoning behaviour of medical Large Language Models [0.0] 医学領域全体でのLLM(Large Language Models)の普及にもかかわらず、彼らの推論行動に対処する研究が驚くほど不足している。
この文脈では、説明可能なAI(XAI)と等価であるため、高いレベルの予測精度とは対照的に、推論行動を理解することの重要性を強調している。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 10:06:52 GMT)
Coulomb sensing of single ballistic electrons [0.0] 弾道電子は 検知および飛行キュービットの 応用の鍵となる道具だ
最近の実験で、ビームスプリッター内の反伝播電子のクーロン衝突が明らかになった。
相互作用は電子エネルギーと放出タイミングによって非常に制御可能であることを示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 11:01:59 GMT)
Convolutional Deep Operator Networks for Learning Nonlinear Focused Ultrasound Wave Propagation in Heterogeneous Spinal Cord Anatomy [0.0] 集束超音波治療は、脊髄損傷の最適な標的治療のための有望なツールである。
現在のアプローチでは、制御波動伝播方程式の解法をコンピュータシミュレーションに頼っている。
患者脊髄のFUS圧力場を高速に予測するための畳み込み深部演算ネットワーク(DeepONet)を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:03:38 GMT)
Continuous spontaneous localization from the white-noise limit of spontaneous unitarity violation [0.0] 色付きノイズ駆動崩壊理論は、自発的対称性の破れの平衡記述をユニタリティの自発的な破れに拡張する。
この限界は連続自発局所化モデル(CSL)のサブクラスと一致することを示す。
また、このモデルを任意の初期状態に適用可能な形式に拡張します。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:55:41 GMT)
Commercial CMOS Process for Quantum Computing: Quantum Dots and Charge Sensing in a 22 nm Fully Depleted Silicon-on-Insulator Process [0.0] 産業標準シリコンオン絶縁体CMOS構造のチャネルに形成された量子ドットに電子や穴を閉じ込めることは、スケーラブルな量子ビットアーキテクチャへの有望なアプローチである。
我々は,GlobalFoundries 22FDX(TM)産業プロセスを用いて製造した市販ナノ構造の計測結果を示す。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:42:13 GMT)
Combining Domain-Specific Models and LLMs for Automated Disease Phenotyping from Survey Data [0.0] 本研究では,ドメイン固有モデルであるBERN2と大規模言語モデル(LLM)を組み合わせることにより,調査データから自動表現性を高める可能性について検討した。
我々は ORIGINS 調査データから,エンティティ認識と正規化モデルであるBERN2 を用いて情報抽出を行った。
BERN2は疾患の言及を抽出・正規化する上で高い性能を示し、特にFew Shot InferenceとRAGオーケストレーションとのLLMの統合により精度が向上した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:38:58 GMT)
Collision-based Dynamics for Multi-Marginal Optimal Transport [0.0] 本稿では,モンテカルロ解法を用いて,サンプル指標のランダムなペアワイドスワップによる最適輸送問題の解を近似した衝突型ダイナミクスを提案する。
提案手法の計算複雑性とメモリ使用量はサンプル数とともに線形にスケールし,高次元設定において非常に魅力的である。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 22:41:16 GMT)
Collective single-photon emission and energy transfer in thin-layer dielectric and plasmonic systems [0.0] 我々は、ヘキサゴナル窒化ホウ素(hBN)のような薄い高次元誘電体層に埋め込まれた複数の量子エミッタの集合光子崩壊を研究する。
我々はまず、表面プラズモンモードを含む誘導モードが同一の単一光子エミッタ(スーパーおよびサブラジアンス)の集合崩壊に果たす重要な役割を探求する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:51:16 GMT)
Client-Side Patching against Backdoor Attacks in Federated Learning [0.0] フェデレーション学習は、悪意のある参加者によって起動されるバックドア攻撃に対して脆弱である。
本稿では,クライアント側のバックドア攻撃を緩和するフェデレーション学習システムのための新しい防御機構を提案する。
我々のアプローチは、バックドア攻撃の影響を和らげるために、敵対的学習技術とモデルパッチを利用する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:59:28 GMT)
Characterization of Nuclear Magnetism at Ultralow and Zero Field using SQUIDs [0.0] 磁気共鳴イメージング(MRI)における医学などの領域の核磁気学
いくつかの超極化技術は、低-超低磁場(ULF)(nTs-mTs)の使用に依存している。
我々は[1-$13$C]ピルビン酸を過分極させる反応器を設計し、シールドの可逆交換による信号増幅によりヘテロ核へのアライメント移動を可能にする。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 08:24:00 GMT)
Causality in relativistic quantum interactions without mediators [0.0] ここでは,qc-モデルがQFTを任意に近似できる規則が存在するが,逆因果効果に悩まされる可能性があることを示す。
重力誘起絡み合い実験が重力相互作用の真に量子的な側面を明らかにすることができるかどうかを議論する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 19:00:02 GMT)
Camera-Based Localization and Enhanced Normalized Mutual Information [0.0] 自律運転にはロバストかつ微細なローカライゼーションアルゴリズムが不可欠である。
本研究は、車両に搭載された安価なカメラによって撮影された画像からセンサデータが得られたシナリオを考察する。
そして、ノイズの多い環境でこれらのアルゴリズムの性能を著しく向上させるために、新規で原則化された修正を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 18:35:53 GMT)
CNN-LSTM Hybrid Deep Learning Model for Remaining Useful Life Estimation [0.0] RUL推定のための畳み込みニューラルネットワークとLong Short-Term Memory(LSTM)ネットワークを組み合わせたハイブリッドアプローチを提案する。
以上の結果から,CNN-LSTMハイブリッドモデルが最も精度が高く,他の手法よりも優れたスコアが得られた。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:48:57 GMT)
Black Holes, Cavities and Blinking Islands [0.0] 空洞内のシュワルツシルトブラックホールの両側延長におけるエンタングルメントエントロピーとエンタングルメントアイランドの進化について検討した。
永遠のブラックホールの外周に反射境界を導入することで、ホーキング放射の赤外線モードを規制する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:38:42 GMT)
Benchmarking LLMs and SLMs for patient reported outcomes [0.0] 本研究は,放射線治療の文脈における患者報告Q&Aフォームの要約のためのLSMに対して,いくつかのSLMをベンチマークする。
各種測定値を用いて精度と信頼性を評価する。
この調査結果は、高度な医療タスクのためのSLMの約束と制限の両方を強調し、より効率的でプライバシ保護のAI駆動型ヘルスケアソリューションを促進する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 19:01:25 GMT)
Autonomous Driving Small-Scale Cars: A Survey of Recent Development [0.0] 小型車プラットフォームの出現は、フルスケールの自動運転車に代わる魅力的な代替手段となる。
本調査では、様々な小型自動車プラットフォームを概説し、それらを分類し、その利用によって達成された研究の進歩について詳述する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:10:32 GMT)
Applying Predictive Analytics to Occupational Health and Safety in India [0.0] 本稿では,職業の健康と安全における予測分析の鍵となる要素について考察する。
OHSにおける予測分析の統合は、意思決定の強化、運用効率の向上、コスト削減、安全基準の遵守改善など、大きなメリットをもたらす。
我々は、インドにおけるOHSにデータ指向で適応的なアプローチを構築するための予測分析の可能性についての議論を締めくくった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:39:06 GMT)
An Updated Quantum Complementarity Principle [0.0] ボーアの補性原理は長い間、量子力学の基本的な概念であった。
近年の進歩により、量子力学の公理から量子相補関係が厳密に導かれることが示されている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 22:11:56 GMT)
Algebras and states in super-JT gravity [0.0] 各$SU(1,1|1)$ matter 表現に1つの正規化可能な状態が存在することを示す。
非BPS表現に対しては、これらの状態はバルク内のすべての超対称性を破る特異な性質を持つ。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 04:21:25 GMT)
Agent-based Modelling of Quantum Prisoner's Dilemma [0.0] このチュートリアルは、ワンショット量子囚人ジレンマ(QuPD)における協調の出現を考察する。
5つの指標、すなわちゲーム磁化、絡み合い感受性、相関、プレイヤーのペイオフ平均およびペイオフ能力を考える。
我々は,QuPDのtextitQuantum と textitDefect の両相の性質を数値解析し,検討した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 06:07:35 GMT)
Adversarial Robustness through Dynamic Ensemble Learning [0.0] 敵対的攻撃は、事前訓練された言語モデル(PLM)の信頼性に重大な脅威をもたらす
本稿では,このような攻撃に対するPLMの堅牢性を高めるための新しいスキームであるDynamic Ensemble Learning (ARDEL) による対逆ロバスト性について述べる。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 05:36:19 GMT)
Advantages and limitations of channel multiplexing for discrete-variable quantum key distribution [0.0] 絡み合いに基づく量子鍵分布スキームでは、鍵生成率は極めて低い。
1つの潜在的な解決策は、波長分割多重化(WDM)モジュールを使用して、異なる波長で光子を分割して検出チャネルを分離し、複数のキーを並列に生成することである。
パルスレーザーが自発パラメトリックダウンコンバージョン源のポンプに使用される場合のこの考え方を理論的に検討する。
解析の結果,提案手法は暗号鍵の生成を著しく高速化するが,その潜在能力を最大限に活用するためには,光子対光源の適切な最適化が必要であることがわかった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 15:55:55 GMT)
Advanced Reasoning and Transformation Engine for Multi-Step Insight Synthesis in Data Analytics with Large Language Models [0.0] ARTEMIS-DAは、複雑で多段階のデータ分析タスクを解決するために、大規模言語モデルを拡張するために設計されたフレームワークである。
ARTEMIS-DAはPlanner、Coder、Grapherという3つのコアコンポーネントを統合している。
このフレームワークはWikiTableQuestionsやTabFactといったベンチマーク上でのSOTA(State-of-the-art)のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 20:25:03 GMT)
ADEQA: A Question Answer based approach for joint ADE-Suspect Extraction using Sequence-To-Sequence Transformers [0.0] 本稿では,疑似教師付きラベル付きデータとシーケンス・ツー・シーケンス・トランスフォーマを用いた質問応答(QA)に基づくアプローチであるADEQAを紹介する。
従来のQAモデルとは異なり、自然言語生成(NLG)ベースのモデルは広範なトークンレベルのラベル付けを必要としない。
公的なADEコーパスでは, ADEと被疑者との関係を確立する上で, F1スコアが94%であった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 02:48:59 GMT)
A two-dimensional 10-qubit array in germanium with robust and localised qubit control [0.0] 量子コンピュータは、高い忠実度を持つ量子ビットの体系的な操作を必要とする。
ゲルマニウムのホールでは、スピン軌道相互作用により、電気的高速かつ高忠実なクビットゲートをテクスチンシチューで結ぶことができる。
ここでは, 材料成長, デバイス製造, キュービット制御の進歩を活用して, 二次元10スピンキュービットアレイを実現する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 16:47:39 GMT)
A Versatile Chip-Scale Platform for High-Rate Entanglement Generation using an AlGaAs Microresonator Array [0.0] 集積フォトニックマイクロ共振器はフォトニック量子ビットの生成に欠かせない資源となっている。
我々は、20個の小放射マイクロ共振器のアレイを多重化し、それぞれ650GHzの光子対の時間エネルギーエンタングル光子を発生させる。
我々は87$%(背景補正付き90$%)以上の忠実度を持つ最大絡み合う2量子ビットベル状態の周波数ビン量子ビットを生成する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 21:45:32 GMT)
A Thorough Investigation into the Application of Deep CNN for Enhancing Natural Language Processing Capabilities [0.0] 本稿では,Deep Convolutional Neural Networks(DCNN)を自然言語処理に導入する。
DCNN、機械学習アルゴリズム、GAN(Generative Adversarial Network)を統合することで、言語理解を改善し、あいまいさを低減し、タスクパフォーマンスを向上させる。
高性能NLPモデルでは,セグメント化精度が10%向上し,リコール率も従来のモデルに比べて4%向上した。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 13:53:41 GMT)
A Review of the Marathi Natural Language Processing [0.0] 本稿では,インド語におけるNLP研究の進展について概説する。
Marathiと、研究コミュニティが利用できる最先端のリソースとツールに焦点を当てている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 00:56:13 GMT)
A Plug-and-Play Fully On-the-Job Real-Time Reinforcement Learning Algorithm for a Direct-Drive Tandem-Wing Experiment Platforms Under Multiple Random Operating Conditions [0.0] Concerto Reinforcement Learning Extension (CRL2E)アルゴリズムが開発された。
このプラグ・アンド・プレイのリアルタイム強化学習アルゴリズムは、新しい物理インスパイアされたルールベースのポリシー構成戦略を取り入れている。
ハードウェアテストでは、最適化された軽量ネットワーク構造が、リアルタイムの制御要件を満たす、重み付けと平均推論時間に優れていることが示されている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 09:39:06 GMT)
A New Method to Capturing Compositional Knowledge in Linguistic Space [0.0] ZS-CUは、厳しい負のトレーニングデータを必要とせずに構成的理解を高める新しいタスクである。
予め訓練されたCLIPモデルにおいて,テキストインバージョンを用いてラベルのない画像を擬似トークンにマッピングするYUKINOを提案する。
ユキノはSugarCREPEベンチマークで既存のマルチモーダルSOTAモデルを8%以上上回っている。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:48:09 GMT)
A Hybrid Probabilistic Battery Health Management Approach for Robust Inspection Drone Operations [0.0] 検査ドローンは、アクセシビリティを改善して重要なインフラの信頼性を高めるユビキタスな資産である。
バッテリーは、検査ドローンの全体的な信頼性を判断し、信頼性と堅牢な検査に寄与する重要なコンポーネントである。
本稿では,Li-Po電池の放電終端(EOD)電圧予測のためのハイブリッド確率的手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 12:27:01 GMT)
A Fusion Approach of Dependency Syntax and Sentiment Polarity for Feature Label Extraction in Commodity Reviews [0.0] 本研究は、携帯電話、コンピュータ、化粧品、食品の4つのカテゴリをカバーする、JD.comの13,218の製品レビューを分析した。
依存性解析と感情極性分析を統合した特徴ラベル抽出手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 07:07:18 GMT)
A Computational Model of Learning and Memory Using Structurally Dynamic Cellular Automata [0.0] そこで本研究では,生物工学的手法に基づく学習と記憶の数学的・計算モデルを提案する。
実験結果から,1回のトレーニング実行後に報酬状態を再発見するために,モデルが最適に近い選択をすることができることがわかった。
論文参考訳(メタデータ) (Fri, 20 Dec 2024 17:26:17 GMT)