Beyond Human Data: Scaling Self-Training for Problem-Solving with Language Models [115.5] 人為的なデータに基づく微調整言語モデル(LM)が普及している。
我々は、スカラーフィードバックにアクセス可能なタスクにおいて、人間のデータを超えることができるかどうか検討する。
ReST$EM$はモデルサイズに好適にスケールし、人間のデータのみによる微調整を大幅に上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 03:12:09 GMT)
MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training [103.7] MLLM(Performant Multimodal Large Language Models)を構築する。
特に,さまざまなアーキテクチャコンポーネントとデータ選択の重要性について検討する。
本稿では,画像キャプチャ,インターリーブ画像テキスト,テキストのみのデータを組み合わせた大規模マルチモーダル事前学習について述べる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:51:04 GMT)
BLINK: Multimodal Large Language Models Can See but Not Perceive [96.4] Blinkはマルチモーダル言語モデル(LLM)のための新しいベンチマークであり、他の評価では見つからないコア視覚知覚能力に焦点を当てている。
Blinkは14の古典的なコンピュータビジョンタスクを3,807の複数の質問に修正し、単一の画像や複数の画像と組み合わせて視覚的にプロンプトする。
GPT-4V と Gemini は 51.26% と 45.72% であり、ランダムな推測よりも 13.17% と 7.63% 高い。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:59:54 GMT)
Introducing v0.5 of the AI Safety Benchmark from MLCommons [94.1] 本稿では,MLCommons AI Safety Working Groupが作成したAI Safety Benchmarkのv0.5を紹介する。
このベンチマークは、チャットチューニング言語モデルを使用するAIシステムの安全性リスクを評価するように設計されている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:01:00 GMT)
A Mean-Field Analysis of Neural Gradient Descent-Ascent: Applications to Functional Conditional Moment Equations [90.9] 無限次元関数クラス上で定義されるミニマックス最適化問題について検討する。
また、勾配降下度アルゴリズムの収束とニューラルネットワークの表現学習についても検討する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:46:08 GMT)
LongEmbed: Extending Embedding Models for Long Context Retrieval [87.6] 本稿では、埋め込みモデルのコンテキストウィンドウ拡張について検討し、追加のトレーニングを必要とせず、制限を32kまで押し上げる。
まず、新たに構築したLongEmbedベンチマークにおいて、コンテキスト検索のための現在の埋め込みモデルの性能について検討する。
実験では、PlaceRoのようなトレーニング不要のコンテキストウィンドウ拡張戦略が、既存の埋め込みモデルのコンテキストウィンドウを複数の折り畳みで効果的に拡張できることが示されている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 11:29:23 GMT)
Matching the Statistical Query Lower Bound for k-sparse Parity Problems with Stochastic Gradient Descent [83.9] 勾配勾配降下(SGD)は,$d$次元ハイパーキューブ上の$k$パリティ問題を効率的に解くことができることを示す。
次に、SGDでトレーニングされたニューラルネットワークがどのようにして、小さな統計的エラーで$k$-parityの問題を解決するかを実証する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:57:53 GMT)
Moving Object Segmentation: All You Need Is SAM (and Flow) [82.8] SAMのセグメンテーション能力と移動物体の発見・グループ化能力を利用する光フローとSAMを組み合わせた2つのモデルについて検討する。
第1のモデルでは、RGBではなく光の流れを入力としてSAMに適応させ、第2のモデルではRGBを入力として、フローをセグメント化プロンプトとして使用する。
これらの驚くほど単純な方法は、追加の修正なしに、シングルオブジェクトとマルチオブジェクトのベンチマークにおいて、以前のアプローチをかなり上回っている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:59:53 GMT)
Towards Large Language Models as Copilots for Theorem Proving in Lean [81.9] 大規模な言語モデルでリーン推論を実行するためのフレームワークであるLean Copilotを紹介します。
証明手順を提案し、中間的な証明目標を完了し、関連する前提を選択するためのツールを構築します。
実験により, 提案手法の有効性を実証し, 提案手法の有効性を検証した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 22:54:08 GMT)
SocREval: Large Language Models with the Socratic Method for Reference-Free Reasoning Evaluation [78.2] 我々は,参照フリー推論評価における新規な設計手法であるSocREvalを開発した。
SocREvalはGPT-4の性能を大幅に改善し、既存の参照フリーおよび参照ベース推論評価指標を上回っている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 21:53:10 GMT)
V2Xum-LLM: Cross-Modal Video Summarization with Temporal Prompt Instruction Tuning [76.3] Instruct-V2Xumは、YouTubeから3万の多様な動画を出力するクロスモーダルビデオ要約データセットである。
V2Xum-LLMは、ビデオ要約タスクを1つの大きな言語モデル(LLM)テキストデコーダに統合する最初のフレームワークである。
実験により、V2Xum-LLaMAは複数のビデオ要約タスクにおいて強力なベースラインモデルより優れていることが示された。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:32:46 GMT)
Enhancing Suicide Risk Assessment: A Speech-Based Automated Approach in Emergency Medicine [74.8] 救急部門における自殺リスクのある患者に対する専門的な精神医学的評価やケアへのアクセスが遅れたことは、タイムリーな介入において顕著なギャップを生じさせる。
自動自殺リスク評価のための非侵襲的音声ベースアプローチを提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:33:57 GMT)
AesExpert: Towards Multi-modality Foundation Model for Image Aesthetics Perception [74.1] 我々は,21,904の多様なソースイメージと88Kの人間の自然言語フィードバックを備えたコーパスリッチな審美的批評データベースを開発した。
AesExpertと呼ばれる、マルチモダリティのAesthetic Expertモデルを実現するために、オープンソースの一般基盤モデルを微調整します。
実験により、提案したAesExpertモデルは、最先端のMLLMよりもはるかに優れた審美的知覚性能を提供することが示された。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 10:10:00 GMT)
Dynamic Typography: Bringing Text to Life via Video Diffusion Prior [73.7] 動的タイポグラフィー(Dynamic Typography)と呼ばれる自動テキストアニメーション方式を提案する。
意味的意味を伝えるために文字を変形させ、ユーザプロンプトに基づいて活気ある動きを注入する。
本手法は,ベクトルグラフィックス表現とエンドツーエンド最適化に基づくフレームワークを利用する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 06:06:29 GMT)
Reka Core, Flash, and Edge: A Series of Powerful Multimodal Language Models [69.4] Rekaモデルはテキスト、画像、ビデオ、オーディオ入力で処理し、推論することができる。
Reka EdgeとReka Flashは最先端のモデルであるだけでなく、多くの大きなモデルよりも優れています。
最も有能で最大のモデルであるReka Coreは、自動評価と盲人評価の両方において、最高のフロンティアモデルにアプローチしています。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:59:48 GMT)
The Dog Walking Theory: Rethinking Convergence in Federated Learning [68.6] Federated Learning(FL)は、さまざまなクライアントがプライベートデータを共有せずに、ひとつの強力なグローバルモデルをトレーニングできる、協調学習パラダイムである。
FLは様々なアプリケーションで有望な結果を示してきたが、異なるクライアント間でのデータ分散シフトに起因する収束問題に悩まされていることが知られている。
本稿では,クライアントのローカルトレーニングを指導するためのemphleashタスクとして,サーバ側の外部から容易に収束できるタスクを活用する新しいFLアルゴリズムemphFedWalkを提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 04:25:21 GMT)
AID: Attention Interpolation of Text-to-Image Diffusion [64.9] AID(Attention Interpolation via Diffusion)という,トレーニング不要な手法を導入する。
AIDは補間された注意を自己注意と融合させ、忠実性を高める。
また,条件に依存した生成過程として,拡散による条件誘導注意補間(AID)も提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 05:11:54 GMT)
LongVQ: Long Sequence Modeling with Vector Quantization on Structured Memory [63.4] 自己保持機構の計算コストは、長いシーケンスの実用性を制限する。
我々はLongVQと呼ばれる新しい手法を提案し、長さ固定されたコードブックとしてグローバルな抽象化を圧縮する。
LongVQは動的グローバルパターンとローカルパターンを効果的に維持し、長距離依存性の問題の欠如を補うのに役立つ。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 05:50:53 GMT)
Estimating the Hessian Matrix of Ranking Objectives for Stochastic Learning to Rank with Gradient Boosted Trees [63.2] グラディエントブースト決定木(GBDT)のランク付け手法について紹介する。
我々の主な貢献は、二階微分、すなわちヘッセン行列に対する新しい推定器である。
推定器を既存のPL-Rankフレームワークに組み込む。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 13:53:32 GMT)
Character is Destiny: Can Large Language Models Simulate Persona-Driven Decisions in Role-Playing? [59.0] ペルソナ駆動意思決定における大規模言語モデルの能力のベンチマークを行う。
高品質な小説において, LLM が先行する物語の登場人物の判断を予測できるかどうかを考察する。
その結果、現状のLLMは、このタスクに有望な能力を示すが、改善の余地は十分にあることが示された。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:40:59 GMT)
Rephrase and Respond: Let Large Language Models Ask Better Questions for Themselves [58.0] 本稿では,Rephrase and Respond'(RaR)という手法を提案する。
RaRは、パフォーマンスを改善するためのシンプルだが効果的なプロンプト方法として機能する。
また,RaRは理論的にも経験的にも,一般的なChain-of-Thought(CoT)法と相補的であることを示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 23:49:56 GMT)
Language Imbalance Can Boost Cross-lingual Generalisation [57.3] 本研究では,言語間一般化の非直感的な新規ドライバである言語不均衡について検討する。
学習中に支配的な言語が存在することが、あまり頻度の低い言語の性能を高めることを観察する。
分析を実言語に拡張するにつれ、頻繁な言語は依然として恩恵を受けていますが、言語不均衡が言語間の一般化を引き起こすかどうかは決定的ではありません。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 13:21:34 GMT)
Parallel Decoding via Hidden Transfer for Lossless Large Language Model Acceleration [54.9] 本稿では,複数連続するトークンを1つのフォワードパスで同時に復号する,新しい並列復号法,すなわちthithidden Transferを提案する。
加速度測定では,Medusa や Self-Speculative decoding など,単モデル加速技術よりも優れています。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 09:17:06 GMT)
FecTek: Enhancing Term Weight in Lexicon-Based Retrieval with Feature Context and Term-level Knowledge [54.6] FEature Context と TErm レベルの知識モジュールを導入して,革新的な手法を提案する。
項重みの特徴コンテキスト表現を効果的に強化するために、FCM(Feature Context Module)が導入された。
また,用語レベルの知識を効果的に活用し,用語重みのモデル化プロセスをインテリジェントに導くための用語レベルの知識誘導モジュール(TKGM)を開発した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:58:36 GMT)
The Efficiency Spectrum of Large Language Models: An Algorithmic Survey [54.2] LLM(Large Language Models)の急速な成長は、様々なドメインを変換する原動力となっている。
本稿では,LLMのエンドツーエンドのアルゴリズム開発に不可欠な多面的効率性について検討する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:10:28 GMT)
Hint-enhanced In-Context Learning wakes Large Language Models up for knowledge-intensive tasks [54.2] 大規模言語モデル(LLM)の規模拡大に伴い、インコンテキスト学習(ICL)能力が出現した。
我々は、オープンドメイン質問応答におけるICLのパワーを探るため、Hint-enhanced In-Context Learning(HICL)と呼ばれる新しいパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:08:44 GMT)
NIR-Assisted Image Denoising: A Selective Fusion Approach and A Real-World Benchmark Dataset [53.8] 近赤外(NIR)画像を活用して、視認可能なRGB画像の復調を支援することで、この問題に対処する可能性を示している。
既存の作品では、NIR情報を効果的に活用して現実のイメージを飾ることに苦戦している。
先進デノナイジングネットワークにプラグイン・アンド・プレイ可能な効率的な選択核融合モジュール(SFM)を提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 19:30:49 GMT)
MARformer: An Efficient Metal Artifact Reduction Transformer for Dental CBCT Images [53.6] 金属歯のインプラントはCBCTイメージングの過程で不愉快な金属加工物をもたらす可能性がある。
歯科用CBCT画像から金属アーティファクト低減(MAR)を実現するための効率的なトランスフォーマーを開発した。
P2FFN (Patch-wise Perceptive Feed Forward Network) も提案されている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 08:49:03 GMT)
Customizing Text-to-Image Diffusion with Camera Viewpoint Control [53.6] モデルカスタマイズのためのカメラ視点の明示的な制御を可能にする新しいタスクを導入する。
これにより、テキストプロンプトによって、さまざまな背景シーンのオブジェクトプロパティを変更することができます。
本稿では,新しいオブジェクトのレンダリング・ビュー依存的な特徴に対して,2次元拡散過程を条件付けることを提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:59:51 GMT)
When Authentication Is Not Enough: On the Security of Behavioral-Based Driver Authentication Systems [53.2] 本研究では,機械学習(ML)とディープラーニング(DL)アーキテクチャに基づく軽量な行動ベースドライバ認証システムの開発を行う。
我々は、新たな回避攻撃のクラスであるGAN-CANを初めて提案し、攻撃者が完璧な攻撃成功率でこれらのシステムをどのように活用できるかを示した。
コントリビューションを通じて、これらのシステムを安全に採用する実践者を支援し、車の盗難を軽減し、ドライバーのセキュリティを高める。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 13:42:07 GMT)
MeshLRM: Large Reconstruction Model for High-Quality Mesh [52.7] MeshLRMは、わずか4つの入力画像から1秒未満で高品質なメッシュを再構築することができる。
提案手法は,スパースビューからのメッシュ再構築を実現し,多くのダウンストリームアプリケーションを実現する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:59:41 GMT)
Mobile-Agent: Autonomous Multi-Modal Mobile Device Agent with Visual Perception [52.6] 自律型マルチモーダルモバイルデバイスエージェントMobile-Agentを紹介する。
Mobile-Agentはまず視覚認識ツールを利用して、アプリのフロントエンドインターフェイス内の視覚的要素とテキスト的要素の両方を正確に識別し、特定する。
そして、複雑なオペレーションタスクを自律的に計画し、分解し、ステップバイステップでモバイルアプリをナビゲートする。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 06:53:38 GMT)
BIRD: A Trustworthy Bayesian Inference Framework for Large Language Models [52.5] 大規模言語モデルに対するBIRDと呼ばれるベイズ推論フレームワークを提案する。
BIRDはモデル決定のための制御可能かつ解釈可能な確率推定を提供する。
実験の結果、BIRDは65%以上の人の判断と一致した確率推定を生成することがわかった。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 20:17:23 GMT)
Online Advertisements with LLMs: Opportunities and Challenges [52.0] 本稿では,オンライン広告システムにおけるLarge Language Models(LLM)の活用の可能性について検討する。
プライバシー、レイテンシ、信頼性、そしてそのようなシステムが満たさなければならないユーザや広告主の満足度など、基本的な要件を探求します。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:45:12 GMT)
NeRF-MAE: Masked AutoEncoders for Self-Supervised 3D Representation Learning for Neural Radiance Fields [51.9] 提案手法は,RGB画像から有効な3D表現を生成する方法を示す。
我々は、この表現を、提案した擬似RGBデータに基づいて大規模に事前訓練し、合計で1.6万枚以上の画像を生成する。
我々は,NeRFの自己教師型プレトレーニングであるNeRF-MAE(NeRF-MAE)を目覚ましいスケールで実施し,様々な3Dタスクの性能向上を実現した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:59:57 GMT)
From $r$ to $Q^*$: Your Language Model is Secretly a Q-Function [50.8] Reinforcement Learning From Human Feedback (RLHF)は、次世代のジェネレーティブAIモデルの成功に不可欠である。
直接選好最適化(DPO)は代替手法として登場している。
DPOは標準のRLHF設定と同じ目的を達成しているが、2つのアプローチの間にはミスマッチがある。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:37:02 GMT)
Self-Polish: Enhance Reasoning in Large Language Models via Problem Refinement [50.6] Self-Polish(SP)は、与えられた問題を徐々に洗練し、より理解しやすく解けるように誘導することによって、モデルの推論を促進する新しい方法である。
SPは、CoTのような答え/推論サイドの他のすべてのプロンプトメソッドであり、最先端の技術とのシームレスな統合を可能にし、さらなる改善を可能にします。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 07:27:00 GMT)
Advancing the Robustness of Large Language Models through Self-Denoised Smoothing [50.5] 大規模言語モデル(LLM)は大きな成功を収めたが、敵の摂動に対する脆弱性は大きな懸念を引き起こしている。
本稿では,LLMのマルチタスク特性を活用して,まずノイズの入力を識別し,次にこれらの復号化バージョンに基づいて予測を行う。
LLMのロバスト性を高めるために個別のモデルを訓練する必要がある従来のコンピュータビジョンのスムース化技術とは異なり、本手法は効率と柔軟性を著しく向上させる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:47:00 GMT)
MambaPupil: Bidirectional Selective Recurrent model for Event-based Eye tracking [50.3] 事象に基づく視線追跡は、高時間分解能と低冗長性で非常に有望である。
点眼、固定、ササード、スムーズな追跡を含む眼球運動パターンの多様性と急激さは、眼球運動の局所化に重要な課題を提起する。
本稿では、文脈時空間情報を完全に活用するための双方向の長期シーケンスモデリングと時間変化状態選択機構を提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 11:09:25 GMT)
Dynamic Modality and View Selection for Multimodal Emotion Recognition with Missing Modalities [46.5] 音声(声)や表情(画像)などの複数のチャンネルは、人間の感情を理解するのに不可欠である。
重要なハードルのひとつは、AIモデルが特定のモダリティの欠如を管理する方法だ。
本研究の中心は,1つのモダリティの欠如に直面した2つの戦略の性能とレジリエンスを評価することである。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:18:14 GMT)
AmbigDocs: Reasoning across Documents on Different Entities under the Same Name [46.3] 混乱したエンティティの言及を扱うことは、言語モデル(LM)にとって重要なスキルである。
この機能をテストするために、新しいベンチマークであるAmbigDocsを導入しました。
あいまいな名前とそれに対応する答えの集合を含む質問を生成する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:12:01 GMT)
Spot-Compose: A Framework for Open-Vocabulary Object Retrieval and Drawer Manipulation in Point Clouds [45.9] この研究は、人間中心環境におけるロボットのインタラクションと操作のための包括的なフレームワークに、最近の手法を統合することを目的としている。
具体的には,コモディティ3Dスキャナの3次元再構成をオープン語彙のインスタンスセグメンテーションに活用する。
本研究では,動的オブジェクト検索と引き出し開口を含む実世界の2つの実験において,モデルの性能とロバスト性を示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:01:15 GMT)
Cost-Performance Optimization for Processing Low-Resource Language Tasks Using Commercial LLMs [45.4] 大規模言語モデル(LLM)は、高リソース言語(HRL)に対する印象的なゼロ/ファウショット推論と生成品質を示す。
いくつかは低リソース言語(LRL)でトレーニングされ、優れたパフォーマンスを実現しています。
LLM は HRL よりも LRL よりも多くのトークンを生成するため,LRL が価格面で不利であることを示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:35:07 GMT)
NL2FOL: Translating Natural Language to First-Order Logic for Logical Fallacy Detection [45.3] 本研究では,自然言語を一階論理に変換することによって,論理的誤りを確実に検出する手法を設計する。
次に、満足度モデュロ理論(SMT)を用いて、式の有効性を推論する。
私たちのアプローチは堅牢で解釈可能で、トレーニングデータや微調整は必要ありません。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 00:20:48 GMT)
A survey on hardware-based malware detection approaches [45.2] ハードウェアベースのマルウェア検出アプローチは、ハードウェアパフォーマンスカウンタと機械学習技術を活用する。
このアプローチを慎重に分析し、最も一般的な方法、アルゴリズム、ツール、および輪郭を形成するデータセットを解明します。
この議論は、協調的有効性のための混合ハードウェアとソフトウェアアプローチの構築、ハードウェア監視ユニットの不可欠な拡張、ハードウェアイベントとマルウェアアプリケーションの間の相関関係の理解を深めている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 08:27:28 GMT)
Predicting and Enhancing the Fairness of DNNs with the Curvature of Perceptual Manifolds [44.8] 近年の研究では、テールクラスは必ずしも学習が困難ではないことが示されており、サンプルバランスのデータセットではモデルバイアスが観察されている。
本研究ではまず,モデルフェアネスを解析するための幾何学的視点を確立し,次いで,一連の幾何学的測度を体系的に提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 08:54:01 GMT)
InstructIE: A Bilingual Instruction-based Information Extraction Dataset [44.7] 大規模言語モデルは、一般的な自然言語処理でうまく機能するが、その有効性は情報抽出に最適ではない。
最近の研究は、情報抽出命令に関する広範なデータがないことが主な理由であることを示している。
InstructIEは、12のドメインをカバーするバイリンガル命令に基づく情報抽出データセットである。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:20:19 GMT)
FreeDiff: Progressive Frequency Truncation for Image Editing with Diffusion Models [44.3] 我々は、プログレッシブな$textbfFre$qu$textbfe$ncy truncationを用いて、ユニバーサル編集タスクのための$textbfDiff$usionモデルのガイダンスを洗練するために、新しいフリーアプローチを導入する。
本手法は,様々な編集タスクや多様な画像に対して,最先端の手法で比較結果を得る。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 04:47:28 GMT)
WHAM: Reconstructing World-grounded Humans with Accurate 3D Motion [44.0] WHAM(World-grounded Humans with Accurate Motion)は、ビデオから世界座標系で3次元の人間の動きを再構成する。
SLAM法から推定されるカメラ角速度と人間の動きを用いて、身体のグローバルな軌跡を推定する。
複数のWildベンチマークで、既存の3Dモーションリカバリ手法よりも優れています。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 19:43:25 GMT)
TriForce: Lossless Acceleration of Long Sequence Generation with Hierarchical Speculative Decoding [43.3] キーバリュー(KV)キャッシュは、効率的なロングシーケンスサポートのボトルネックとして現れている。
TriForceは階層的な投機的復号化システムであり、長いシーケンス生成にスケーラブルである。
トリフォースの頑丈さは、様々な温度で一貫して卓越した性能で強調されている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 05:25:54 GMT)
Monotonic Paraphrasing Improves Generalization of Language Model Prompting [42.7] MonoParaはエンド・ツー・エンドのデコーディング戦略であり、プロンプトや命令を下位のパープレクティリティに言い換える。
いかなる訓練も必要とせず、単調に言い換えられたプロンプトや命令の難易度を下げることができる。
また、乱雑なタスク命令に対するLMの一般化を効果的に改善することが示されている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 05:22:01 GMT)
On the Content Bias in Fréchet Video Distance [42.7] Fr'echet Video Distance (FVD)は、ビデオ生成モデルを評価するための重要な指標である。
本稿では,時間的リアリズムよりもフレーム単位の品質に対するFVDの偏りについて検討する。
近年の大規模自己監督型ビデオモデルから抽出された特徴を持つFVDは画質に偏りが小さいことを示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:59:58 GMT)
Finding A Taxi with Illegal Driver Substitution Activity via Behavior Modelings [42.1] タクシーの違法ドライバー代替(IDS)活動は、タクシー業界において重大な違法行為である。
現在、IDSの活動は法執行機関によって手動で管理されている。
法執行機関がIDS活動の傾向にあるタクシーを効率的に見つけるのに役立つ計算手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 01:47:31 GMT)
Quantum thermodynamics of the spin-boson model using the principle of minimal dissipation [41.9] 本研究では, 環境が作業量, 熱量, エントロピー生産量に与える影響について検討した。
その結果, 弱い結合形態の作業, 熱, エントロピー生産に有意な差が認められた。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:11:18 GMT)
A Perspective on Deep Vision Performance with Standard Image and Video Codecs [41.7] エッジデバイスや携帯電話などのリソース制約のあるハードウェアは、ディープビジョンモデルにおける推論に必要な計算リソースを提供するために、クラウドサーバーに依存していることが多い。
本稿では,ディープビジョンパイプラインにおける標準化コーデックの導入がもたらす意味について検討する。
JPEGとH.264の符号化により、幅広い視覚タスクやモデルにおける精度が大幅に低下することがわかった。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:58:05 GMT)
VideoGigaGAN: Towards Detail-rich Video Super-Resolution [41.4] ビデオ・スーパーレゾリューション(VSR)アプローチは、アップサンプリングされたビデオに顕著な時間的一貫性を示す。
本稿では,高頻度の細部と時間的整合性を持つビデオを生成する新しい生成型VSRモデルであるVideoGigaGANを紹介する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:59:53 GMT)
ShadowRefiner: Towards Mask-free Shadow Removal via Fast Fourier Transformer [41.0] 影に影響された画像は、しばしば色と照明の空間的な違いが顕著に現れる。
我々はFast Fourier Transformerを介してマスクレスシャドウ除去・精細ネットワーク(ShadowRefiner)を導入する。
本手法は,NTIRE 2024画像シャドウ除去チャレンジのフィデリティトラックにおいて,第2位を達成し,パーセプチュアルトラックのタイトルを獲得した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 03:53:33 GMT)
Fast Benchmarking of Asynchronous Multi-Fidelity Optimization on Zero-Cost Benchmarks [40.8] 我々は、ゼロコストベンチマークで効率的な並列HPOを実現するPythonパッケージを紹介した。
提案手法は,ファイルシステムに格納された情報に基づいて,正確な返却順序を算出する。
私たちのパッケージは pip install mfhpo-simulator でインストールできます。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 01:56:05 GMT)
Exploring Automated Distractor Generation for Math Multiple-choice Questions via Large Language Models [40.5] マルチチョイス質問(MCQ)は、評価や実践において、管理しやすく、格付けし、信頼性の高いフォーマットであるため、ほぼ全てのレベルの教育においてユビキタスである。
MCQの最も重要な側面の1つは、実際の学生の間でよくある誤りや誤解を狙った誤った選択肢である。
現在まで、高品質なイントラクタを開発するというタスクは、拡張性に制限のある教師や学習コンテンツデザイナにとって、労働力と時間を要するプロセスのままである。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:12:19 GMT)
Reuse Your Rewards: Reward Model Transfer for Zero-Shot Cross-Lingual Alignment [39.9] ゼロショット・クロスランガルアライメントのための簡単なアプローチを評価する。
言語間の整列モデルは、非整列モデルよりも人間の方が好まれる。
異なる言語報酬モデルでは、同言語報酬モデルよりも優れた整列モデルが得られることがある。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:52:36 GMT)
Functional Protein Design with Local Domain Alignment [39.8] 本稿では,タンパク質データベースから抽出したテキストアノテーションを組み込んだマルチモーダルなタンパク質設計フレームワークであるProtein-Alignment Generation (PAAG)を提案する。
具体的には、マルチレベルアライメントモジュール内でPAAGは、対応するドメインアノテーションに条件付けられた特定のドメインを含むタンパク質を明示的に生成することができる。
実験の結果,PAAGのタンパク質表現が7つの予測タスクよりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 09:37:54 GMT)
Evaluating AI for Law: Bridging the Gap with Open-Source Solutions [32.6] 本研究では,ChatGPTのような汎用AIの法的質問応答における性能を評価する。
これらの問題を克服するためにドメイン固有の知識によって強化された基礎モデルを活用することを提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:26:01 GMT)
ASID: Active Exploration for System Identification in Robotic Manipulation [32.3] 本稿では,少数の実世界のデータを活用して,シミュレーションモデルを自律的に洗練し,正確な制御戦略を立案する学習システムを提案する。
本研究は, ロボット操作作業における調音, 質量, その他の物理パラメータの同定における, このパラダイムの有効性を実証する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:35:38 GMT)
Does Gaussian Splatting need SFM Initialization? [31.7] 3次元ガウススプラッティングは、シーン再構成と新規なビュー合成のための汎用的で効果的な方法として受け入れられている。
Structure-from-Motion (SFM) アルゴリズムは克服すべき重要な限界である。
SFMデータへの依存を回避するために、NeRF再構成をどのように利用できるかを示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 23:52:42 GMT)
Policy Improvement using Language Feedback Models [31.7] 本稿では, 言語フィードバックモデル (LFM) を導入し, 模擬学習に望ましい行動を特定する。
LFMを訓練するために,言語記述に適応した視覚的軌跡について,Large Language Models (LLMs) からフィードバックを得た。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 20:35:32 GMT)
Leveraging Domain Knowledge for Efficient Reward Modelling in RLHF: A Case-Study in E-Commerce Opinion Summarization [31.6] 本稿では,ドメイン知識を$varphi$に注入する新しい手法を提案する。
E-Commerce Opinion Summarizationにおける我々のアプローチを検証する。
コントリビューションには、新しいReward Modelingテクニックと2つの新しいデータセットが含まれています。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 06:38:22 GMT)
Precise Asymptotics for Spectral Methods in Mixed Generalized Linear Models [31.6] 混合一般化線形モデルにおいて、統計的に独立な2つの信号を推定する問題を考える。
我々の特徴付けは、ランダム行列、自由確率、および近似メッセージパッシングアルゴリズムの理論からのツールの混合を利用する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 11:18:20 GMT)
MolCRAFT: Structure-Based Drug Design in Continuous Parameter Space [31.5] 近年, 構造に基づく医薬品デザイン(SBDD)の創成モデルが有望な成果を上げている。
我々は,自己回帰的手法を適用し,SBDDに拡散する際の不整合問題の要因について,徹底的に研究する。
連続パラメータ空間で機能する最初のSBDDモデルであるWessを紹介し、新しいノイズ低減サンプリング戦略を紹介します。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:43:39 GMT)
A Family of Pretrained Transformer Language Models for Russian [31.2] 本稿では、エンコーダ(ruBERT, ruRoBERTa, ruELECTRA)、デコーダ(ruGPT-3)、エンコーダ-デコーダ(ruT5, FRED-T5)にまたがる13個のロシアトランスフォーマーLMのコレクションを紹介する。
本稿では, モデルアーキテクチャの設計と事前学習について報告し, それらの一般化能力をロシア語理解および生成データセットおよびベンチマーク上で評価した結果について述べる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 07:54:25 GMT)
RAM: Towards an Ever-Improving Memory System by Learning from Communications [30.9] RAMは、常に改善されたメモリを備えた革新的なRAGベースのフレームワークである。
シミュレーションと実ユーザの両方による実験は、従来のRAG法や自己知識法よりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 09:58:51 GMT)
Deep Learning Based Code Generation Methods: Literature Review [30.2] 本稿では、自然言語記述に従って関連するコードフラグメントを生成することを目的としたコード生成タスクに焦点を当てる。
本稿では,ディープラーニングに基づくコード生成手法に関する現在の研究を体系的にレビューする。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 08:18:20 GMT)
Optimal Parallelization Strategies for Active Flow Control in Deep Reinforcement Learning-Based Computational Fluid Dynamics [29.5] 本研究では、DRLに基づくアルゴリズムを並列設定で最適化することに焦点を当てる。
我々は、AFC問題に使用される既存の最先端DRLフレームワークを検証し、その効率ボトルネックについて議論する。
並列効率を約49%から約78%に向上させ,60コアで約47倍の高速化を実現した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:56:02 GMT)
A Quadrature Approach for General-Purpose Batch Bayesian Optimization via Probabilistic Lifting [29.5] GPyTorch/BoTorchをベースとしたPythonライブラリであるSOBERと呼ばれるカーネル二次構造を用いた確率的昇降によるバッチベイズ最適化のための汎用的でモジュール化されたフレームワークを提案する。
1) 統一されたアプローチ下での下流タスクの冗長性。
2) ドメインに依存しないサンプリング(例えば、離散変数と混合変数、非ユークリッド空間)を提供する、取得関数の勾配を必要としない勾配のないサンプリング器。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 14:30:46 GMT)
MaskCD: A Remote Sensing Change Detection Network Based on Mask Classification [29.2] 深層学習を用いたリモートセンシング(RS)画像からの変化(CD)を文献的に広く研究している。
入力画像対から分類マスクを適応的に生成し,変化領域を検出するMaskCDを提案する。
ピクセルワイズ表現を学習可能なマスク提案に復号することで、望まれる変更対象を再構築する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 11:05:15 GMT)
A Survey on Open Information Extraction from Rule-based Model to Large Language Model [29.0] オープン情報抽出(OpenIE)は、構造化されていないテキストから構造化情報を引き出すための重要なNLPタスクである。
本調査では,2007年から2024年までのOpenIE技術の概要を概説し,時系列的視点を強調した。
この記事では、OpenIEアプローチをルールベース、ニューラル、トレーニング済みの大規模言語モデルに分類し、時系列フレームワーク内でそれぞれについて議論する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 03:47:27 GMT)
Enhance Robustness of Language Models Against Variation Attack through Graph Integration [28.3] 文字変動攻撃に対する言語モデルのロバスト性を高めるための新しい手法であるCHINese vAriatioN Graph Enhancementを提案する。
CHANGE は PLM の逆操作テキストの解釈を本質的に強化する。
多数のNLPタスクで実施された実験は、CHANGEが敵の攻撃と戦う際に、現在の言語モデルより優れていることを示している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 09:04:39 GMT)
RoNID: New Intent Discovery with Generated-Reliable Labels and Cluster-friendly Representations [27.8] New Intent Discovery (NID)は、オープンワールドシナリオにおける新しい意図グループを特定することを目的としている。
現在の手法は、不正確な擬似ラベルと表現学習に問題がある。
本稿では,EMスタイルの手法により最適化されたロバスト・ニューインテント・ディスカバリー・フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 06:54:55 GMT)
Evaluating the Security of Merkle Trees in the Internet of Things: An Analysis of Data Falsification Probabilities [27.5] 本稿では,メルクルパスの長さとハッシュ長を考慮し,データ改ざん確率を計算する理論的枠組みを開発する。
実験的な実験により理論モデルが検証され、様々なハッシュ長とメルクルパス長を持つシミュレーションが探索された。
以上の結果より, より長いメルクル経路との逆関係と, ハッシュ長の増加に伴うファルシフィケーション確率の低下が示唆された。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 11:24:12 GMT)
NORMAD: A Benchmark for Measuring the Cultural Adaptability of Large Language Models [26.6] 大規模言語モデルがアウトプットを多様な文化的規範に適応できるかどうかは不明である。
我々は75カ国の社会的・文化的規範を表す2.6kストーリーを含む新しいデータセットであるNormAdを紹介した。
我々の研究は、LLMがあらゆる文脈の粒度にわたる文化的推論に苦慮していることを明らかにした。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:48:50 GMT)
Routers in Vision Mixture of Experts: An Empirical Study [26.5] Mixture-of-Experts (MoE)モデルは、計算コストを大幅に増加させることなく、モデル容量をスケールアップする有望な方法である。
MoEsの主要なコンポーネントはルータであり、どのパラメータ(専門家)プロセスのサブセットが埋め込み(トークン)を特徴付けるかを決定する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:48:31 GMT)
One-Shot Sequential Federated Learning for Non-IID Data by Enhancing Local Model Diversity [26.1] 我々は,局所モデルの多様性向上戦略を提案することにより,非IIDデータに対する一発の逐次フェデレーション学習を改善する。
提案手法は,既存のワンショットPFL法よりも優れた性能を示し,最先端のワンショットSFL法と比較して精度が向上する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:31:48 GMT)
Simultaneous Interpretation Corpus Construction by Large Language Models in Distant Language Pair [25.5] 同時機械翻訳(SiMT)システムにおいて、SIコーパスを用いた訓練は高品質で低レイテンシなシステムを実現する効果的な方法である。
本稿では,既存の音声翻訳コーパスを解釈型データに変換し,原語順を維持し,大言語モデル(LLM-SI-Corpus)を用いてソースコンテンツ全体を保存する手法を提案する。
LLM-SI-Corpusを用いたテキスト・テキスト・音声・テキスト設定における微調整SiMTモデルは、オフラインデータセットでトレーニングされたモデルと同じ品質を維持しながら、レイテンシを低減することを実証する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:24:12 GMT)
JailBreakV-28K: A Benchmark for Assessing the Robustness of MultiModal Large Language Models against Jailbreak Attacks [24.7] 本稿では,大規模言語モデルのジェイルブレイクを成功させる手法が,MLLMのジェイルブレークに等しく有効かどうかを検討する。
MLLM への LLM ジェイルブレイク手法の転送性を評価するための先駆的なベンチマークである JailBreakV-28K を紹介する。
LLMの高度なジェイルブレイク攻撃と、最近のMLLMのジェイルブレイク攻撃によるイメージベースのジェイルブレイク入力により、20000のテキストベースのジェイルブレイクプロンプトを生成します。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:11:53 GMT)
Is this the real life? Is this just fantasy? The Misleading Success of Simulating Social Interactions With LLMs [24.6] 大規模言語モデル(LLM)はより豊かな社会シミュレーションを可能にし、様々な社会現象の研究を可能にしている。
最近の研究は、これらのシミュレーションについて、人間とAIエージェントが現実世界で関与する不完全で情報非対称な相互作用と、基本的には異なっています。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:55:07 GMT)
The devil is in the object boundary: towards annotation-free instance segmentation using Foundation Models [24.5] オブジェクト検出とインスタンスのセグメンテーションでは、SAMやDINOのような基礎モデルは満足なパフォーマンスを達成するのに苦労する。
我々は、新しい分類優先発見パイプラインにおいて、$textbfZip$, $textbfZ$ips up CL$textbfip$, SAMを提案する。
Zipは、COCOデータセット上のSAMのマスクAPを12.5%大きく向上させ、さまざまな設定で最先端のパフォーマンスを確立する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 07:22:38 GMT)
Value Approximation for Two-Player General-Sum Differential Games with State Constraints [24.0] Hamilton-Jacobi-Isaacs (HJI) PDEを数値的に解くことで、2プレイヤー差分ゲームにおける平衡フィードバック制御が可能になるが、次元性(CoD)の呪いに直面している。
物理インフォームドニューラルネットワーク(PINN)は、PDEの解決においてCoDを緩和する可能性を示しているが、バニラPINNはサンプリングの性質から不連続な解を学ぶのに不足している。
本研究では,(1)監督均衡とHJI PDEの両方が指導するハイブリッド学習手法,(2)価値硬化手法の3つの可能性について検討する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 04:53:16 GMT)
Not All Voxels Are Equal: Hardness-Aware Semantic Scene Completion with Self-Distillation [23.9] セマンティックコンプリート(セマンティックコンプリート、セマンティックコンプリート、セマンティックコンプリート、セマンティックコンプリート、セマンティックコンプリート)は、自動運転車に密集した幾何学的およびセマンティック情報を提供する。
既存の方法は通常、ボクセルの分類問題を定式化し、訓練中に各ボクセルを等しく扱う。
本稿では,シーンモデルを訓練するためのHアプローチを提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 07:25:59 GMT)
Visually grounded few-shot word learning in low-resource settings [23.8] そこで本研究では,数組の単語イメージ対から新しい単語とその視覚的描写を学習する音声モデルを提案する。
提案手法では,与えられた単語イメージの例対を用いて,音声と画像の大規模なコレクションから教師なしの単語イメージトレーニングペアを抽出する。
この新しいモデルでは、既存の英語ベンチマークの以前のアプローチよりも少ないショットでより良いパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:36:53 GMT)
Cross-view and Cross-pose Completion for 3D Human Understanding [22.8] 画像のみを用いて人間中心のデータを扱う自己教師付き学習に基づく事前学習手法を提案する。
身体中心タスクのためのモデルと手中心タスクのためのモデルを事前訓練する。
汎用的なトランスフォーマーアーキテクチャでは、これらのモデルは、広範囲の人間中心の下流タスクにおいて、既存の自己教師付き事前学習方法より優れている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 09:03:04 GMT)
Planning with Language Models Through The Lens of Efficiency [22.5] 我々は、LSMを計画に使用するコストを分析し、最近の傾向が極めて不経済的であることを強調する。
我々は,より効率的な手法を提案し,計算資源の有責任な利用を論じる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 01:27:29 GMT)
Aligning Language Models to Explicitly Handle Ambiguity [22.1] 音声言語では、発話は効率性のために不完全または曖昧な形をしていることが多い。
モデルがユーザクエリの本質的なあいまいさを十分に扱うためには、非常に重要です。
本稿では,あいまいな入力を明示的に処理する対話エージェントのアライメント手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 07:59:53 GMT)
LibriSQA: A Novel Dataset and Framework for Spoken Question Answering with Large Language Models [22.0] 本稿では,LibriSQAデータセット上でSpoken Question Answering(SQA)タスクを実行するための軽量なエンドツーエンドフレームワークを提案する。
ASRをSQAフォーマットに書き換えることで、ASRタスクの処理におけるフレームワークの機能をさらに裏付ける。
我々の経験的発見は、多モーダル情報の整合と解釈に対するLLMの適性を高め、ユニバーサル多モーダルLLMの開発への道を開いた。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 08:13:58 GMT)
Simultaneous Detection and Interaction Reasoning for Object-Centric Action Recognition [21.7] エンドツーエンドのオブジェクト中心のアクション認識フレームワークを提案する。
同時に1つのステージで検出と相互作用の推論を行う。
我々はSomes-ElseとIkea-Assemblyという2つのデータセットで実験を行う。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 05:06:12 GMT)
UIClip: A Data-driven Model for Assessing User Interface Design [20.7] ユーザインタフェースの設計品質と視覚的関連性を評価するための機械学習モデルUIClipを開発した。
UIClipがUI設計品質の即時評価に依存するダウンストリームアプリケーションをどのように促進するかを示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 20:43:08 GMT)
From Image to Video, what do we need in multimodal LLMs? [19.9] MLLM(Multimodal Large Language Models)は、マルチモーダル情報を理解する上で重要な機能を示す。
画像LLMからの映像LLMのための資源効率の高い開発パイプラインRED-VILLMを提案する。
我々のアプローチは、よりコスト効率が高くスケーラブルなマルチモーダルモデルの進歩の可能性を強調します。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 02:43:37 GMT)
SelectLLM: Can LLMs Select Important Instructions to Annotate? [19.6] 我々はSelectLLMを紹介した。これは大規模言語モデルで未記述の命令を選択的にアノテートするためのフレームワークである。
我々の実験では、SelectLLMは命令チューニングベンチマークにおいて、他の最先端の手法と一致し、性能が良くなることを示した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 01:35:12 GMT)
XIMAGENET-12: An Explainable AI Benchmark Dataset for Model Robustness Evaluation [19.4] XIMAGENET-12は、200K以上の画像と15,410のマニュアルセマンティックアノテーションで構成されている。
本研究では、ロバスト性評価のための定量的基準を開発し、様々な条件下での視覚モデルの性能の微妙な理解を可能にする。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 11:57:49 GMT)
Quantifying Aleatoric and Epistemic Uncertainty with Proper Scoring Rules [19.2] 不確実性表現と定量化は機械学習において最重要である。
本稿では,適切なスコアリングルールに基づいて,アレータリックおよび(現状)不確実性の定量化のための尺度を提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 14:20:19 GMT)
CogME: A Cognition-Inspired Multi-Dimensional Evaluation Metric for Story Understanding [19.1] 本稿では,物語理解に着目したAIモデルを対象とした認知型多次元評価指標であるCogMEを紹介する。
我々は,タスクの性質を理解することに基づくメトリクスの必要性を論じ,人間の認知過程と密接に整合するように設計されている。
このアプローチは、従来の全体的なスコアを超えて洞察を提供し、より高い認知機能をターゲットにしたより洗練されたAI開発のための道を開く。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 08:11:49 GMT)
FedEval-LLM: Federated Evaluation of Large Language Models on Downstream Tasks with Collective Wisdom [19.1] 大規模言語モデル(LLM)の協調学習のための有望なソリューションとして、フェデレートラーニング(FL)が登場した。
ラベル付きテストセットと類似度に基づくメトリクスに依存する従来の評価手法は、許容できる答えのサブセットのみをカバーする。
我々は、ラベル付きテストセットや外部ツールに依存することなく、下流タスクにおけるLCMの信頼性の高い性能測定を提供するFedEval-LLMを提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:46:26 GMT)
Vesper: A Compact and Effective Pretrained Model for Speech Emotion Recognition [18.7] 本稿では,一般的な大規模事前学習モデル(PTM)を音声感情認識タスクに適用するパラダイムを提案する。
本稿では,Vesperという,感情固有の事前学習エンコーダを提案する。
ヴェスパーは、アコースティックおよびセマンティック表現をキャプチャする能力を改善するために階層的およびクロスレイヤーな自己スーパービジョンを使用している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 13:08:07 GMT)
Measuring Feature Dependency of Neural Networks by Collapsing Feature Dimensions in the Data Manifold [18.6] ニューラルネットワークモデルの特徴依存性を測定するための新しい手法を提案する。
その動機は、人間が理解可能な機能から情報を使っているかどうかを問うことによって、モデルをよりよく理解することにある。
本手法は,合成画像データに基づいて学習した深層ニューラルネットワークモデルを用いて実験を行った。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:10:18 GMT)
Noise Stability Optimization for Flat Minima with Tight Rates [18.0] 関数 $F(W) = mathbbE_U[f(W + U)]$ を最小化する方法を示す。
私たちは、U$と$-U$の両方にノイズを加えるシンプルな実用的なアルゴリズムを設計します。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 23:59:01 GMT)
Accounting for AI and Users Shaping One Another: The Role of Mathematical Models [17.9] 我々は,AIとユーザが相互にどのように形成するかを数学的に規定する形式的相互作用モデルの開発を論じる。
ユーザと対話するAIシステムを設計、評価、監査する際に、正式なインタラクションモデルを活用するようにコミュニティに呼びかけます。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:49:02 GMT)
FedMID: A Data-Free Method for Using Intermediate Outputs as a Defense Mechanism Against Poisoning Attacks in Federated Learning [17.8] フェデレーション学習は、クライアントからのローカルアップデートを組み合わせてグローバルモデルを生成する。
本稿では,中間出力に基づく局所モデルの関数的マッピングを用いて,フェデレート学習における中毒攻撃の防御を行う新しいパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 05:10:05 GMT)
How far are AI-powered programming assistants from meeting developers' needs? [17.8] GitHub CopilotのようなIDE内AIコーディングアシスタントツール(ACAT)は、開発者のコーディング習慣に大きな影響を与えている。
我々は,実開発シナリオをシミュレートし,27人のコンピュータサイエンス学生を募集し,その振る舞いを3つのACATを用いて調査する。
ACATは一般的にタスク完了率を高め、時間を短縮し、コード品質を改善し、自己認識の生産性を高めます。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 08:51:14 GMT)
CoReS: Orchestrating the Dance of Reasoning and Segmentation [17.8] セグメンテーションを推論する行為は、人間の視覚探索の認知段階を反映すべきである。
本稿では,Reasoning and Segmenting (CoReS) の連鎖を紹介する。
実験では、ReasonSegデータセットで最先端の手法を7.1%上回るCoReSの優れた性能を示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 03:36:58 GMT)
Seeing Motion at Nighttime with an Event Camera [17.4] イベントカメラは、高時間分解能(マイクロ秒)と高ダイナミックレンジ(120dB)で動的に反応する
主に学習可能なイベントタイムスタンプキャリブレーションモジュール(LETC)を含む夜間イベント再構築ネットワーク(NER-Net)を提案する。
我々は、64,200の空間的および時間的に整列した画像GTと低照度イベントを含む、同軸イメージングにより、ペア化された実光イベントデータセット(RLED)を構築した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 03:58:27 GMT)
Adaptive Catalyst Discovery Using Multicriteria Bayesian Optimization with Representation Learning [17.0] 高性能触媒は、持続可能なエネルギー変換と人間の健康に不可欠である。
触媒の発見は、巨大で高次元の構造と合成空間をナビゲートするための効率的なアプローチがないため、課題に直面している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:11:06 GMT)
Exploring Boundaries and Intensities in Offensive and Hate Speech: Unveiling the Complex Spectrum of Social Media Discourse [17.0] 本稿では,3つのタスクに対して8,258のツイートをアノテートしたAmharicのベンチマークデータセットを提案する。
私たちの研究は、ほとんどのツイートが攻撃的でない、憎悪の度合いの低いレベルに属することを強調しています。
民族的および政治的憎悪の対象の出現は、我々のデータセットに顕著に重複しており、エチオピアの社会政治の景観における複雑な関係を強調している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 09:52:50 GMT)
Long-lived oscillations of false and true vacuum states in neutral atom systems [16.9] 長距離リドバーグ相互作用を持つ1次元反強磁性中性原子鎖における偽状態と真真空状態の長寿命振動について検討した。
反強磁性中性原子系とは異なる準粒子振動の新しいスペクトルシグネチャを同定する。
提案装置の現在の中性原子プラットフォーム上での実験的アクセシビリティを評価する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:52:14 GMT)
False vacuum decay and nucleation dynamics in neutral atom systems [16.9] 偽真空崩壊と核生成は非平衡力学現象を研究する機会を与える。
最近の研究は、1次元強磁性イジングスピンと超流体における偽真空崩壊を調べた。
ライドバーグ相互作用を持つ1次元反強磁性中性原子鎖における偽真空核生成ダイナミクスについて検討した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:39:47 GMT)
How Do Recommendation Models Amplify Popularity Bias? An Analysis from the Spectral Perspective [16.7] 勧告システム(RS)は、しばしば人気バイアスに悩まされる。
本稿では,主特異値の大きさに罰則を課すことにより,このバイアスを軽減する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 08:59:32 GMT)
Stronger, Fewer, & Superior: Harnessing Vision Foundation Models for Domain Generalized Semantic Segmentation [16.1] 私たちはまず、ドメイン一般化セマンティック(DGSS)の文脈における様々なビジョン基礎モデル(VFM)を評価し、活用する。
DGSS にパラメータ効率よく VFM を利用するための頑健な微調整手法,すなわち Rein を導入する。
トレーニング可能なパラメータが少ないため、ReinはDGSSタスクのVFMを効率よく微調整し、完全なパラメータの微調整を驚くほど上回った。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 08:33:37 GMT)
mOthello: When Do Cross-Lingual Representation Alignment and Cross-Lingual Transfer Emerge in Multilingual Models? [15.9] 本稿では,2つの質問を探索するテストベッドとして,合成タスクであるMultilingual Othello(mOthello)を提案する。
多言語事前学習で訓練されたモデルは、全ての入力言語にまたがる言語ニュートラル表現を学習できないことがわかった。
本稿では,言語ニュートラル表現の学習を誘導し,言語間移動を促進する多言語事前学習手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:03:08 GMT)
Demonstration of DB-GPT: Next Generation Data Interaction System Empowered by Large Language Models [15.7] 我々は,大規模な言語モデルを従来のデータインタラクションタスクに統合した,革新的で製品対応のPythonライブラリDB-GPTを提案する。
DB-GPTは、自然言語で記述されたデータインタラクションタスクを理解し、LLMを利用したコンテキスト認識応答を提供するように設計されている。
サービス指向マルチモデル管理フレームワーク(SMMF)は、データのプライバシとセキュリティを保証する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 00:45:26 GMT)
Can We Catch the Elephant? The Evolvement of Hallucination Evaluation on Natural Language Generation: A Survey [15.7] 自然言語生成の幻覚(NLG)は、部屋の象のように見えますが、しばしば見落とされています。
大きな言語モデル(LLM)では、さまざまな下流タスクやカジュアルな会話で幻覚が発生する。
本稿では,幻覚評価手法の進化に関する包括的調査を行う。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 09:52:18 GMT)
Chimera: A Lossless Decoding Method for Accelerating Large Language Models Inference by Fusing all Tokens [15.6] 投機的サンプリングに特化して設計された新しいフレームワークを提案する。
このフレームワーク内では、以前に生成されたトークンを効果的に活用し、後続の単語を予測する軽量なドラフトモデルを導入する。
我々は、バニラ自動回帰復号方式と比較して平均遅延速度比が2.7倍になるという印象的な結果を示した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:23:16 GMT)
Towards Realistic Scene Generation with LiDAR Diffusion Models [15.5] 拡散モデル(DM)はフォトリアリスティック画像合成において優れているが、LiDARシーン生成への適応は大きなハードルとなる。
我々は,LiDARシーンのリアリズムを捉えるために,LiDAR拡散モデル(LiDM)を提案する。
具体的には、実世界のLiDARパターンをシミュレートするための曲線ワイド圧縮、シーン幾何学を学ぶための点ワイド座標調整、フル3Dオブジェクトコンテキストに対するパッチワイド符号化を導入する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 19:22:37 GMT)
AquaSonic: Acoustic Manipulation of Underwater Data Center Operations and Resource Management [14.9] 水中データセンター(UDC)は、そのエネルギー効率と環境サステナビリティの恩恵により、次世代のデータストレージとして約束されている。
本研究は, 耐故障性記憶装置, 資源配分ソフトウェア, 分散ファイルシステムのUDCにおける音響インジェクション攻撃に対する特異な脆弱性を明らかにする。
我々は、プロファイルされたハードディスクドライブのデータセットに基づいてトレーニングされた、偽陽性率0%、真陽性率98.2%に達する新しい機械学習ベースの検出システムを定式化する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 00:26:29 GMT)
Efficiently Adversarial Examples Generation for Visual-Language Models under Targeted Transfer Scenarios using Diffusion Models [14.6] 本稿では,自然に制約のない逆の例を生成するAdvDiffVLMを紹介する。
本手法は,既存のトランスファーベース攻撃法と比較して10Xから30Xまでの高速化を実現する。
特にAdvDiffVLMは、GPT-4Vを含む商用VLMをブラックボックス方式で攻撃できる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 13:34:08 GMT)
Street TryOn: Learning In-the-Wild Virtual Try-On from Unpaired Person Images [14.6] そこで本研究では,StreetTryOnベンチマークを用いて仮想試行性能の評価を行う。
そこで本研究では,一組の人物画像から,ペアデータなしで学習できる新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 19:38:18 GMT)
A unified Fourier slice method to derive ridgelet transform for a variety of depth-2 neural networks [14.5] リッジレット変換は、与えられた関数$f$をパラメータ分布$gamma$にマッピングする擬逆演算子である。
ユークリッド空間上のディープ2完全連結ネットワークに対して、リッジレット変換は閉形式表現まで発見されている。
有限体 $mathbbF_p$ 上のネットワーク、抽象ヒルベルト空間 $mathcalH$ 上の群畳み込みネットワーク、非コンパクト対称空間 $G/K$ 上の完全連結ネットワーク、プーリング層など、様々な現代的なネットワークに対して変換を導出する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 19:10:58 GMT)
X-Light: Cross-City Traffic Signal Control Using Transformer on Transformer as Meta Multi-Agent Reinforcement Learner [14.1] X-Light という名前の都市間メタマルチエージェント信号制御のための Transformer on Transformer (TonT) モデルを提案する。
目に見えないシナリオに直接移行する場合、平均で+7.91%、場合によっては+16.3%のベースラインメソッドを超越する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 11:17:58 GMT)
MVDream: Multi-view Diffusion for 3D Generation [14.1] 本稿では,テキストプロンプトから一貫した多視点画像を生成可能な拡散モデルMVDreamを紹介する。
2次元データと3次元データの両方から学習すると、多視点拡散モデルは2次元拡散モデルの一般化可能性と3次元レンダリングの整合性を達成することができる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 04:12:32 GMT)
A Closer Look at AUROC and AUPRC under Class Imbalance [13.8] 機械学習(ML)において、精度-リコール曲線(AUPRC)の下の領域は、クラス不均衡のバイナリ分類タスクにおいて、受信操作特性(AUROC)の下の領域とモデルの比較において優れた指標である。
本稿では, AUROC と AUPRC が確率論的用語で簡潔に関連できることを示す, 新たな数学的解析を通じて, この概念に挑戦する。
AUPRCは、一般的な信念に反して、クラス不均衡の場合には優れておらず、また、より頻度の高い正のラベルを持つサブポピュレーションのモデル改善を不当に支持する傾向にあるため、有害な指標である可能性も示している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 13:25:26 GMT)
Measuring Social Norms of Large Language Models [13.6] 本稿では,大規模言語モデルが社会規範を理解するかどうかを検証するための新たな課題を提案する。
我々のデータセットは、402のスキルと12,383の質問からなる、最大の社会的規範スキルのセットを特徴としている。
本研究では,大規模言語モデルに基づくマルチエージェント・フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 07:03:58 GMT)
Active robustness against the detuning-error for Rydberg quantum gates [13.5] 本稿では,多彩なノイズ源の影響に対して活発なロバスト性を有するRydbergブロックゲート群について紹介する。
堅牢なパルスを持つゲートは、2光子デチューニングに作用するあらゆる種類のエラーに対する感度を著しく向上させることができる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 02:32:00 GMT)
The Explicit values of the UBCT, the LBCT and the DBCT of the inverse function [13.2] 本稿では、任意の$n$に対して、逆関数 $F(x)=x2n-2$ over $gf_2n$ の性質をさらに調べる。
F(x)$のDBCTの詳細な分析は、ブーメラン攻撃に対するSボックスの抵抗性の評価に寄与する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 14:13:40 GMT)
From Form(s) to Meaning: Probing the Semantic Depths of Language Models Using Multisense Consistency [13.2] 言語間の一貫性とパラフレーズに重点を置いています。
モデルのマルチセンス一貫性が欠如していることに気付き、検証のためにいくつかのフォローアップ分析を実行する。
この観点では、LLMの理解は、一貫性と人間的類似性にはまだ程遠い、と結論付けています。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:48:17 GMT)
MIDGET: Music Conditioned 3D Dance Generation [13.1] MIDGETと呼ばれるMusIc条件付き3DダンスGeneraTionモデルを導入し、音楽リズムに合わせて鮮やかで高品質なダンスを生成する。
フィールドにおける課題に対処するため,1) 異なるポーズ符号を格納するためのモーションVQ-VAEモデルに基づく事前学習されたメモリコードブック,2) 音楽とモーションの短縮によるポーズ符号を生成するモーションGPTモデル,3) 音楽特徴抽出のためのシンプルなフレームワーク,の3つの新しいコンポーネントを紹介した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 10:20:37 GMT)
Predicting human decisions with behavioral theories and machine learning [13.0] BEAST Gradient Boosting (BEAST-GB) は,行動理論を機械学習技術と相乗する新しいハイブリッドモデルである。
BEAST-GBは,人的リスク選択のデータセットとして最大規模で,最先端のパフォーマンスを実現していることを示す。
また、BEAST-GBは、新しい実験コンテキストにおける選択の振る舞いを効果的に予測するため、堅牢なドメイン一般化機能を示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 07:10:17 GMT)
Large Language Models Can Plan Your Travels Rigorously with Formal Verification Tools [12.9] 大規模言語モデル(LLM)は、複雑な最適化問題を正確に解くことができない。
本研究では, LLM を満足度変調理論 (SMT) 問題として, 旅行計画問題の定式化と解決を可能にする枠組みを提案する。
我々のフレームワークは、データセットの平均成功率は78.6%、TravelPlannerは85.0%の有効なプランを生成することができる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 04:36:37 GMT)
Challenging Negative Gender Stereotypes: A Study on the Effectiveness of Automated Counter-Stereotypes [12.7] 本研究では,オンラインコミュニケーションにおいて,ジェンダーのステレオタイプに自動的に対抗し,挑戦する11の戦略について検討する。
我々は、AIによるジェンダーベースのカウンターステレオタイプを参加者に提示し、攻撃性、妥当性、そして潜在的有効性を評価するよう依頼する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 01:48:28 GMT)
A Survey on the Densest Subgraph Problem and Its Variants [11.7] デンスト部分グラフ問題は、与えられたグラフにおいて、誘導された部分グラフが密度の測度を最大化する頂点の部分集合を見つける必要がある。
近年では、この問題に対する研究の関心が復活し、いくつかの重要な貢献がなされている。
本調査は,本文献で提案されている多くの変種について,基礎的な結果の概要と包括的報告を提供する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:30:56 GMT)
Sharing Parameter by Conjugation for Knowledge Graph Embeddings in Complex Space [11.3] 知識グラフ(英: Knowledge Graph, KG)は、現実世界における実体と関係の図形表現である。
KGのスケールアップと完成の必要性は,KGE(Knowledge Graph Embedding)を自動生成する。
KGEモデルにおける複素数に対する共役パラメータを用いたパラメータ共有手法を提案する。
本手法は,最先端の非共役モデルに匹敵する性能を保ちつつ,メモリ効率を2倍に向上させる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 00:05:02 GMT)
Who Validates the Validators? Aligning LLM-Assisted Evaluation of LLM Outputs with Human Preferences [11.2] EvalGenは、評価基準の生成とアサーションの実装において、ユーザに自動アシストを提供する。
質的研究は、EvalGenに対する全体的なサポートを見出すが、主観性と反復的なアライメントのプロセスを強調している。
ユーザはアウトプットを格付けする基準が必要ですが、アウトプットのグレードは、ユーザが基準を定義するのに役立つのです。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:45:27 GMT)
Runtime Analyses of NSGA-III on Many-Objective Problems [11.0] 本稿では,一般的な多目的ベンチマーク問題mLOTZ,mOMM,mCOCZにおけるNSGA-IIIのランタイム解析について述べる。
これらのパラメータは,問題次元,目的数,適合範囲によってどのようにスケールするかを示す。
我々の知る限り、これらは3つ以上の目的に対してNSGA-IIIの最初のランタイム解析である。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 08:09:35 GMT)
Towards Multi-modal Transformers in Federated Learning [10.8] 本稿では,視覚言語領域におけるMFL(Transfer Multi-modal Federated Learning)のシナリオについて検討する。
我々は,クライアント間の非モダリティと相互モダリティのギャップに対処することによって,FedCola(Federated modality complementary and collaboration)と呼ばれる新しいフレームワークを導入する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 19:04:27 GMT)
A Survey of Trojans in Neural Models of Source Code: Taxonomy and Techniques [10.8] 我々は、説明可能なAIと安全なAIの文献を研究し、コードの神経モデルの毒性を理解する。
まず、コードのためのトロイの木馬AIの新しい分類法を確立し、コードのニューラルモデルにおけるトリガーの新しいアスペクトベースの分類を示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 19:41:54 GMT)
Improving the interpretability of GNN predictions through conformal-based graph sparsification [9.6] グラフニューラルネットワーク(GNN)は、グラフ分類タスクの解決において最先端のパフォーマンスを達成した。
エッジやノードを除去することで,最も予測可能なサブグラフを見つけるGNNエンハンチング手法を提案する。
我々は、共形予測に基づく報奨関数で得られる二段階最適化を解決するために強化学習を頼りにしている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:34:47 GMT)
Full Shot Predictions for the DIII-D Tokamak via Deep Recurrent Networks [9.5] 我々は、DIII-Dトカマクからの歴史的データを用いて、プラズマ放電のフルタイム進化を予測することができる深い再帰ネットワークを訓練する。
続いて、異なるトレーニングと推論の手順が、ショット予測の品質とキャリブレーションにどのように影響するかを検討する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 00:05:57 GMT)
Gaining More Insight into Neural Semantic Parsing with Challenging Benchmarks [9.3] 並列平均銀行における意味解析と意味テキスト生成のためのニューラルモデルの評価を行った。
まず、事前のランダム分割の代わりに、標準的なテストデータの信頼性を向上させるために、より体系的な分割手法を提案する。
第二に、標準的なテストセットを除いて、談話構造を含む長いテキストを持つものと、構成的一般化に対処するものという2つの課題セットを提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 07:59:12 GMT)
Replication in Requirements Engineering: the NLP for RE Case [9.3] 自然言語処理(NLP)技術は要求工学(RE)分野に広く応用されている。
複製は、研究の文脈特異性を含むいくつかの要因によって妨げられる。
我々は、複製関連情報を強調した研究論文の構造化要約を提供することを目的として、IDカードと呼ばれる新しいアーティファクトを提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 09:20:13 GMT)
GraFIQs: Face Image Quality Assessment Using Gradient Magnitudes [9.2] 顔画像品質評価(FIQA)は、顔認識(FR)システムにおける顔画像の有用性を推定する。
本研究では,事前学習したFRモデルの重量変化を検査し,顔画像の品質を評価する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 14:07:08 GMT)
Improving the perception of visual fiducial markers in the field using Adaptive Active Exposure Control [8.9] 本稿では、画像取得時のシャープ照明変動に対処するための勾配型アクティブカメラ露光制御手法を提案する。
視覚タグを用いた水中操作の典型的なシナリオを考慮し,本手法と他の最先端露光制御法との比較実験を行った。
その結果,ロボットの局所化精度は有意に向上した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 10:10:56 GMT)
Parallel Best Arm Identification in Heterogeneous Environments [8.9] 異種協調学習モデルにおける最適な腕識別問題の時間と通信ラウンド数のトレードオフについて検討する。
ほぼ厳密な上界と下界を証明することにより、不均一な環境での協調学習が、同質な環境での学習よりも本質的に困難であることを示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 14:31:11 GMT)
Resilience through Scene Context in Visual Referring Expression Generation [8.9] 画像中のオブジェクトに対する参照表現生成(REG)におけるコンテキストの役割について検討する。
我々は、REGにおけるシーンコンテキストに関する新たな視点を捉え、REGモデルをより弾力性のあるものにするためのリソースとして、コンテキスト情報が考えられることを仮定する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:10:38 GMT)
Reducing Bias in Pre-trained Models by Tuning while Penalizing Change [8.9] 大量のデータに基づいてトレーニングされた深層モデルには、トレーニング期間中に存在する暗黙のバイアスが組み込まれていることが多い。
新しいデータは、しばしば高価で、自律運転や医療意思決定のような分野では入手が困難である。
本稿では,事前学習モデルを用いて,事前検出したバイアスを軽減するために重みを適応する変化ペナライゼーションに基づく手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:12:38 GMT)
SPOT: Point Cloud Based Stereo Visual Place Recognition for Similar and Opposing Viewpoints [8.3] Same Place Opposing Trajectory (SPOT) は、ステレオ・ビジュアル・オドメトリー(VO)によって推定される構造にのみ依存する対向VPRの手法である。
我々は、様々な照明条件下で、同様の方向と反対方向に駆動される6.7-7.6kmのルートを持つ公開データセット上でSPOTを評価する。
SPOTは、反対の視点のケースで最大91.7%のリコールを100%精度で達成し、また、全てのベースラインのテストや実行よりも高速なストレージを必要とする。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:09:10 GMT)
When Medical Imaging Met Self-Attention: A Love Story That Didn't Quite Work Out [8.1] 2つの異なる医療データセットに異なる自己注意変異を持つ、広く採用されている2つの畳み込みアーキテクチャを拡張します。
完全畳み込みモデルに比べてバランスの取れた精度は著しく改善されていない。
また, 皮膚病変画像における皮膚内視鏡像などの重要な特徴は, 自己注意を用いても学ばないことが明らかとなった。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:18:41 GMT)
Exploring the landscape of large language models: Foundations, techniques, and challenges [8.0] この記事では、コンテキスト内学習の力学と微調整アプローチのスペクトルについて光を当てている。
革新的な強化学習フレームワークを通じて、LLMが人間の好みとより緊密に連携する方法について検討する。
LLMデプロイメントの倫理的側面は議論され、マインドフルで責任あるアプリケーションの必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 08:01:20 GMT)
CigaR: Cost-efficient Program Repair with LLMs [8.0] CigaRはコスト効率のよいプログラム修復ツールで、パッチの自動生成に低数のトークンを使用する。
広く使用されているDefects4JとHumanEval-Javaデータセットの429のバグに関する実験は、CigaRがトークンコストを73%削減したことを示している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:00:59 GMT)
Sandi: A System for Accountability and Applications in Direct Communication [7.8] Sandiは、説明責任を通じてオンラインコミュニケーションへの信頼をもたらすシステムである。
スコアは、以前の通信に基づいて送信者の信頼度を測定する。
Sandiは、送信者に対するスコア完全性保証、送信者と受信者に対する完全な通信プライバシー保証、レポーティングレシーバーを保護するレポータープライバシ保証、送信者を保護するアンリンクビリティ保証を提供する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 23:04:07 GMT)
Robust Reinforcement Learning Objectives for Sequential Recommender Systems [7.4] 我々は、報酬の形で直接ユーザーフィードバックを取り入れ、ユーザのパーソナライズを高めるレコメンデーションシステムを開発する。
RLアルゴリズムを採用することで、政治外のトレーニング、拡張可能なアクションスペース、十分な報酬信号を持つデータセットの不足など、課題が提示される。
これらの課題に対して、より効果的な解決策を提供するための拡張された方法論を導入します。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 00:22:56 GMT)
Frequency-Aware Masked Autoencoders for Multimodal Pretraining on Biosignals [7.4] 周波数空間における生体信号の表現をパラメータ化することを学ぶ周波数対応マスク付きオートエンコーダを提案する。
得られたアーキテクチャは、事前トレーニング中にマルチモーダル情報を効果的に利用し、テスト時に様々なタスクやモダリティにシームレスに適応できる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:48:44 GMT)
TrACT: A Training Dynamics Aware Contrastive Learning Framework for Long-tail Trajectory Prediction [7.3] 本稿では,よりリッチなトレーニングダイナミックス情報を,原型的コントラスト学習フレームワークに組み込むことを提案する。
我々は,2つの大規模自然主義データセットを用いたアプローチの実証評価を行った。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 23:12:46 GMT)
AQM: A Refresh of the Abstract Qubit Model for Quantum Computing Co-design [7.2] 量子ビットは量子情報科学と応用の構成要素である。
より高度なアルゴリズムとアプリケーションのための数学的フレームワークを提供する抽象量子ビットモデル(AQM)を導入する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 19:23:35 GMT)
An Online Spatial-Temporal Graph Trajectory Planner for Autonomous Vehicles [6.9] 本稿では,安全で快適なトラジェクトリを生成するために,新しいオンライン時空間グラフトラジェクトリプランナを提案する。
プランナーをサポートするために、プランナーの運動的制約を決定する単純な振舞い層も提示される。
その結果,提案したプランナは,前方方向と同等の快適な乗り心地を実現しつつ,安全かつ実現可能な軌道を生成できることが示唆された。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:22:29 GMT)
On the generic increase of observational entropy in isolated systems [6.9] ランダムに選択されたユニタリ進化のシステムの観測エントロピーが、圧倒的な確率で増加する傾向を示す。
システムの初期状態に関わらず,システムの大きさが十分に粗い観察では,その状態がマイクロカノニカル分布と実質的に区別できないことを示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 08:27:04 GMT)
FCNCP: A Coupled Nonnegative CANDECOMP/PARAFAC Decomposition Based on Federated Learning [6.9] 本研究は,FCNCPと呼ばれるフェデレート学習に基づく,効率的な非負結合テンソル分解アルゴリズムフレームワークを開発することを提案する。
これは高次元データ表現と分解におけるテンソル分解の優れた識別性能を組み合わせたものである。
片側刺激は左右半球の活性化領域においてより対称な成分を誘導することがわかった。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 04:30:18 GMT)
Partial Large Kernel CNNs for Efficient Super-Resolution [6.8] 超解法(PLKSR)のためのPartial Large Kernel CNNを導入する。
PLKSRは、待ち時間68.1%、最大GPUメモリ占有率80.2%の削減を実現している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 01:55:44 GMT)
Investigating Guiding Information for Adaptive Collocation Point Sampling in PINNs [6.5] 物理インフォームドニューラルネットワーク(PINN)は、偏微分方程式や系の近似解を得る手段を提供する。
PINNの解の質は、これらのコロケーション点の数や分布を含む多くのパラメータに依存する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:58:31 GMT)
OPTiML: Dense Semantic Invariance Using Optimal Transport for Self-Supervised Medical Image Representation [6.4] 自己教師付き学習(SSL)は、アノテーションなしで学習できることから、医用画像解析の有望な技術として登場した。
本稿では, 最適トランスポート(OT)を用いたSSLフレームワークOPTiMLを導入し, 密接なセマンティック不変性と細粒度の詳細を捉える。
実験の結果,OPTiMLはすべての評価課題において最先端の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 02:59:48 GMT)
Augmenting emotion features in irony detection with Large language modeling [6.3] 本研究では,感情中心のテキスト強化を促進するために,大規模言語モデル(LLM)を即時学習で適用する,新たな皮肉検出手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:11:17 GMT)
A Clustering Method with Graph Maximum Decoding Information [6.1] 本稿では,CMDIと呼ばれるグラフベースモデルにおけるデコード情報の最大化のための新しいクラスタリング手法を提案する。
CMDIは2次元構造情報理論を、グラフ構造抽出とグラフ分割という2つのフェーズからなるクラスタリングプロセスに組み込んでいる。
3つの実世界のデータセットに対する実証的な評価は、CMDIが古典的ベースライン法より優れており、より優れた復号化情報比(DI-R)を示すことを示している。
これらの結果から,デコード情報の品質と計算効率を向上させるCMDIの有効性が示され,グラフベースのクラスタリング解析において有用なツールとして位置づけられた。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:22:12 GMT)
MPC of Uncertain Nonlinear Systems with Meta-Learning for Fast Adaptation of Neural Predictive Models [6.0] ニューラル状態空間モデル(NSSM)は、ディープエンコーダネットワークがデータから非線形性を学ぶ非線形系を近似するために用いられる。
これにより非線形系を潜在空間の線形系に変換し、モデル予測制御(MPC)を用いて効果的な制御動作を決定する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 11:29:43 GMT)
Explaining latent representations of generative models with large multimodal models [6.0] データ生成潜在因子の解釈可能な表現を学習することは、人工知能の発展にとって重要なトピックである。
大規模マルチモーダルモデルを用いた生成モデルにおいて,各潜伏変数を包括的に記述するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 03:54:39 GMT)
Stance Detection on Social Media with Fine-Tuned Large Language Models [5.7] 自然言語処理における重要なタスクであるスタンス検出は、テキスト解析に基づいて著者の視点を決定する。
本研究は,早期の機械学習アプローチから画期的なBERTモデルへの移行による姿勢検出手法の進化を評価する。
総合的な比較を行うため、ゼロショットおよび少数ショット学習シナリオにおいて、これらのモデルの性能を評価する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 13:25:29 GMT)
Using a Local Surrogate Model to Interpret Temporal Shifts in Global Annual Data [5.7] 本稿では、グローバルソースの年次データにおける経年変化を説明することに焦点を当てる。
我が国では、国民の幸福指数、経済自由度、人口指標に光を当てるために、LIME(Local Interpretable Model-Agnostic Explanations)を採用している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 03:17:45 GMT)
Grammatical Error Correction for Code-Switched Sentences by Learners of English [5.7] CSWテキスト上で文法誤り訂正システムの利用を初めて検討する。
我々は、既存のGECコーパス内で異なるテキストのスパンを翻訳することで、合成されたCSW GECデータセットを生成する。
次に,CSW比,スイッチポイント係数,言語制約に基づいて,これらのスパンを選択する方法について検討する。
我々の最良のモデルは、モノリンガルデータセット上でのモデルの性能に影響を与えることなく、3つのCSWテストセットの平均1.57ドルF_0.5$を達成する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 20:05:30 GMT)
Aligning language models with human preferences [5.1] 大量のテキストデータに基づいて訓練された言語モデル(LM)は高度なスキルを習得することができる。
また、人間の嗜好に反する行動を示す。
LMを人間の好みに合わせるためのいくつかのアプローチを検討します。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:55:18 GMT)
Sketch-guided Image Inpainting with Partial Discrete Diffusion Process [5.0] スケッチ誘導インペイントのための新しい部分離散拡散法(PDDP)を提案する。
PDDPは画像のマスキング領域を破損させ、手描きスケッチで条件付けられたこれらのマスキング領域を再構築する。
提案するトランスモジュールは,2つの入力を受信する。マスク領域を含む画像はインペイントされ,クエリスケッチは逆拡散過程をモデル化する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 07:07:38 GMT)
CAUS: A Dataset for Question Generation based on Human Cognition Leveraging Large Language Models [5.0] 本稿では,大規模言語モデル,特に GPT-4 を用いて,不確実性を解決するための認知過程をエミュレートするためのCAUSデータセットを提案する。
我々のアプローチは、推論とクエリの生成を刺激するために、不確実性に埋め込まれたシーン記述を提供することである。
以上の結果から, GPT-4は, 適切な文脈や指示が与えられた場合に, 適切な質問を効果的に生成し, そのニュアンスを把握できることが示唆された。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 01:31:19 GMT)
CMNEE: A Large-Scale Document-Level Event Extraction Dataset based on Open-Source Chinese Military News [4.8] 大規模で文書レベルのオープンソースである中国の軍事ニュースイベント抽出データセットであるCMNEEを提案する。
17,000の文書と29,223のイベントが含まれており、すべて軍事領域の事前定義されたスキーマに基づいて手動で注釈付けされている。
我々は,複数の最先端イベント抽出モデルを体系的評価で再現する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:02:35 GMT)
HCL-MTSAD: Hierarchical Contrastive Consistency Learning for Accurate Detection of Industrial Multivariate Time Series Anomalies [4.8] 本稿では,産業用MSSにおける異常検出のための自己教師付き階層的コントラスト整合学習手法を提案する。
HCL-MTSADはマルチレイヤのコントラスト損失を発生させることで、データの一貫性とタイムスタンプと時間的関連を広範囲にマイニングすることができる。
HCL-MTSADの異常検出能力は、F1スコアの平均1.8%で最先端のベンチマークモデルを上回っている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 04:15:35 GMT)
REF$^2$-NeRF: Reflection and Refraction aware Neural Radiance Field [4.7] 本稿では,ガラスケースを含むシーンのNeRFモデリング手法を提案する。
リフレクションとリフレクションは、視聴者の視点に依存して独立な要素を用いてモデル化される。
既存の手法と比較して,ガラス屈折率と全体像のより正確なモデリングが可能である。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 13:03:44 GMT)
A cooperative strategy for diagnosing the root causes of quality requirement violations in multiagent systems [4.7] 本稿では,マルチエージェントシステムにおける品質要件違反の根本原因を特定することに焦点を当てた協調戦略を提案する。
この戦略により、エージェントは互いに協力し合って、これらの違反がサービスプロバイダや関連するコンポーネント、あるいは通信インフラから生じるものかどうかを識別できます。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 14:41:33 GMT)
Toward Short-Term Glucose Prediction Solely Based on CGM Time Series [4.7] TimeGluは、CGM時系列データに基づく短期的なグルコース予測のためのエンドツーエンドパイプラインである。
患者の個人データを追加することなく、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 06:02:12 GMT)
DualFluidNet: an Attention-based Dual-pipeline Network for FLuid Simulation [4.7] 本研究では,注意型デュアルパイプネットワークを用いた3次元流体シミュレーションの革新的手法を提案する。
グローバルな流体制御と物理法則のバランスを改善する方法を見つける。
また、より複雑なシーンを扱うネットワークの能力をさらに探求する新たなデータセットであるTurton3Dを提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 10:14:31 GMT)
Can LLMs perform structured graph reasoning? [4.7] LLM(Pretrained Large Language Models)は、言語ベースのプロンプトだけで様々な推論能力を示す。
本稿では,半構造化タスクのプロキシとして,様々なグラフ推論タスクを設計する。
上記の課題に対して,5種類のインストラクト微細化LDM (GPT-4, GPT-3.5, Claude-2, Llama-2, Palm-2) をベンチマークした。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:04:12 GMT)
Visualization for Trust in Machine Learning Revisited: The State of the Field in 2023 [4.6] 可視化手法を解説したピアレビュー論文を収集し、以前に確立された分類スキーマに基づいて分類し、オンラインサーベイブラウザで542のテクニックを収集した。
この結果から,過去3年間の機械学習モデルの信頼性向上に向けて,可視化技術の急速な発展傾向が示唆された。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:20:41 GMT)
Information theory unifies atomistic machine learning, uncertainty quantification, and materials thermodynamics [4.6] 情報の正確な記述は、原子論モデリングにおける様々な問題に関係している。
本稿では, 位相変換, 運動事象, データセットの最適性, モデルなしUQの予測を原子シミュレーションから統一する情報理論フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:50:15 GMT)
FastVPINNs: Tensor-Driven Acceleration of VPINNs for Complex Geometries [4.6] 変分物理学情報ニューラルネットワーク(VPINN)は偏微分方程式の解法として変分損失関数を用いる。
FastVPINNは、従来のhp-VPINNと比較して、エポックあたりの平均トレーニング時間を100倍に短縮する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 10:21:28 GMT)
Polarization-entangled quantum frequency comb from a silicon nitride microring resonator [4.4] 集積マイクロ共振器は量子周波数コム(QFC)の実現を促進する
集積化窒化ケイ素マイクロ共振器とサニャック干渉計を組み合わせたブロードバンド偏光結合量子周波数コムを試作した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 01:09:48 GMT)
Towards a Foundation Model for Partial Differential Equation: Multi-Operator Learning and Extrapolation [4.3] 本稿では,PROSE-PDEという科学問題に対するマルチモーダル基礎モデルを提案する。
本モデルは,物理系の制御方程式を並列に学習しながら,システムの将来の状態を予測できるマルチオペレータ学習手法である。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:34:20 GMT)
Adjoint Sensitivities of Chaotic Flows without Adjoint Solvers: A Data-Driven Approach [4.3] 随伴感度分析は、すべてのシステムのパラメータに関して、興味のある量の勾配を提供する。
コード固有でない随伴解法を提案する。
カオス流の長期平均勾配に対するその応用を実証する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:51:12 GMT)
VisEvol: Visual Analytics to Support Hyperparameter Search through Evolutionary Optimization [4.2] 機械学習(ML)モデルのトレーニングフェーズでは、通常、いくつかのハイパーパラメータを設定する必要がある。
本稿では、ハイパーパラメータのインタラクティブな探索と、この進化過程への介入を支援するビジュアル分析ツールVisEvolを紹介する。
VisEvolの実用性と適用性は,2つのユースケースと,ツールの有効性を評価するML専門家へのインタビューで実証された。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:23:23 GMT)
StackGenVis: Alignment of Data, Algorithms, and Models for Stacking Ensemble Learning Using Performance Metrics [4.2] 機械学習(ML)では、バッグング、ブースティング、スタックングといったアンサンブル手法が広く確立されている。
StackGenVisは、スタック化された一般化のためのビジュアル分析システムである。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:02:16 GMT)
FeatureEnVi: Visual Analytics for Feature Engineering Using Stepwise Selection and Semi-Automatic Extraction Approaches [4.2] 本稿では,機能工学プロセスを支援するために特別に設計された視覚分析システムであるFeatureEnViを紹介する。
提案システムは,ユーザが最も重要な機能を選択し,元の機能を強力な代替品に転換し,異なる機能生成の組み合わせを試すのに役立つ。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:00:24 GMT)
Device (In)Dependence of Deep Learning-based Image Age Approximation [4.1] 時間的画像法医学の目標は、同じデバイスからの画像に対して、デジタル画像の年齢を近似することである。
本研究では,一つのデバイスからの画像にネットワークをトレーニングし,異なるデバイスからの画像にトレーニングされたモデルを適用することにより,これを実証的に評価する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 08:05:23 GMT)
A Configurable Pythonic Data Center Model for Sustainable Cooling and ML Integration [4.0] データセンター設計の極めて高速なプロトタイピングを可能にするPythonライブラリであるPyDCMを紹介した。
我々は、PyDCMの能力を実証し、データセンターをモデリングするためのEnergyPlusの既存の作業と比較する。
PyDCMは、サステナビリティを重視したデータセンタコントロールを示すスタンドアロンのGymnasium環境としても使用できる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 20:25:33 GMT)
A Survey on 3D Egocentric Human Pose Estimation [3.6] エゴセントリックな人間のポーズ推定は、人間のポーズを推定し、ファースト・パーソン・カメラの観点から身体表現を開発することを目的としている。
近年、XR技術、人間とコンピュータのインタラクション、フィットネストラッキングといった分野に幅広く応用されているため、広く普及している。
エゴセントリックな3次元ポーズ推定に関する提案された解決策に基づく体系的な文献レビューは行われていない。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 05:09:04 GMT)
GraphER: A Structure-aware Text-to-Graph Model for Entity and Relation Extraction [3.6] 自然言語処理(NLP)における情報抽出は重要な課題である
グラフ構造学習(GSL)として定式化する手法を提案する。
この定式化により、エンティティとリレーショナル予測のためのより良い相互作用と構造インフォームド決定が可能になる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 20:09:37 GMT)
EnriCo: Enriched Representation and Globally Constrained Inference for Entity and Relation Extraction [3.6] 結合実体と関係抽出は、特に知識グラフの構築において、様々な応用において重要な役割を担っている。
既存のアプローチはしばしば、表現の豊かさと出力構造におけるコヒーレンスという2つの重要な側面に欠ける。
本研究では,これらの欠点を緩和するEnriCoを紹介する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 20:15:48 GMT)
DF-DM: A foundational process model for multimodal data fusion in the artificial intelligence era [3.3] 本稿では,データマイニングのためのマルチモーダルデータフュージョンの新しいプロセスモデルを提案する。
我々のモデルは、効率と信頼性を改善しつつ、計算コスト、複雑さ、バイアスを減らすことを目的としている。
本研究は,糖尿病網膜症における網膜画像と患者のメタデータを用いた予測,衛星画像を用いた家庭内暴力予測,インターネット,国勢調査データ,放射線画像と臨床ノートによる臨床像と人口動態の同定という3つのユースケースを通じて有効性を示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:52:42 GMT)
Control-based Graph Embeddings with Data Augmentation for Contrastive Learning [3.3] グラフ上に定義された動的ネットワークの制御特性を利用した教師なしグラフ表現学習の課題について検討する。
対照的な学習における重要なステップは、入力グラフから'拡張'グラフを作成することである。
本稿では,ネットワークの制御特性を活用して,これらの拡張グラフを生成するユニークな手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 00:10:49 GMT)
End-To-End Training and Testing Gamification Framework to Learn Human Highway Driving [3.2] 本稿では,自律走行自動車のためのゲームベースのエンドツーエンド学習およびテストフレームワークを提案する。
人気ゲーム「グランドセフト・オートV」を使って高速道路の運転データを収集する。
エンド・ツー・エンドのアーキテクチャは、ゲーム画面の画像により車両を制御する操舵およびスロットル値を予測する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 05:14:08 GMT)
Theory of Mobility Rings in Non-Hermitian Systems [3.2] 非エルミート系におけるモビリティ・エッジは環構造を持ち、これは「モビリティ・リング」と呼ばれる。
この論文で提案されるモビリティ環理論は、すべての非エルミート系に対して普遍的である。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:37:45 GMT)
Self-supervised Learning of Rotation-invariant 3D Point Set Features using Transformer and its Self-distillation [3.2] 本稿では,オブジェクトレベルでの高精度かつ回転不変な3次元点集合特徴を取得するための,自己教師付き学習フレームワークを提案する。
トークンを改良し,それを3次元点集合ごとに表現的回転不変の特徴に集約するために,自己認識機構を用いる。
提案アルゴリズムは,既存のアルゴリズムよりも高精度な回転不変の3次元点集合特徴を学習する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 23:40:16 GMT)
Blind Localization and Clustering of Anomalies in Textures [2.6] 画像中の異常検出と局所化は、コンピュータビジョンにおける成長分野である。
そこで本稿では,視覚障害者を対象とした画像のクラスタリング手法を提案する。
本稿では,視覚異常局所化とコントラスト学習を組み合わせた新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:11:02 GMT)
Entanglement generation between two comoving Unruh-DeWitt detectors in the cosmological de Sitter spacetime [2.5] 2つの共振型2レベル検出器を同時に空間的位置で検討する。
検出器は個別にスカラー場に結合し、2つの検出器間の結合につながる。
対数ネガティリティを計算し、2つの検出器間の遅い時間に発生する絡み合いの度合いを定量化する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 06:20:07 GMT)
DeepLocalization: Using change point detection for Temporal Action Localization [2.5] DeepLocalizationは、ドライバーの行動を監視するために明示的に調整されたアクションのリアルタイムローカライゼーションのために考案された革新的なフレームワークである。
我々の戦略は、ビデオ大言語モデル(Video Large Language Model, Video-LLM)と並行して、グラフベースの変更点検出を時間内のピンポイント行動に活用し、アクティビティを正確に分類する、という2つのアプローチを採用している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:25:59 GMT)
A Time-Inhomogeneous Markov Model for Resource Availability under Sparse Observations [2.4] ルーティングアルゴリズムのようなスマートシティアプリケーションにとって、現在の状況に関する正確な時間情報は不可欠である。
観測頻度が非常に稀な場合でも正確な予測が可能な時間不均一離散マルコフモデルを提案する。
我々の新しいモデルは、最近の観測を過去のデータとブレンドすることができ、将来の状態に有用な確率的推定を提供する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:00:59 GMT)
GenVideo: One-shot Target-image and Shape Aware Video Editing using T2I Diffusion Models [2.4] ターゲット画像認識型T2Iモデルを利用した動画編集のためのGenVideoを提案する。
提案手法は,編集の時間的一貫性を維持しつつ,形状や大きさの異なる対象オブジェクトで編集を処理する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 23:25:27 GMT)
Electrical control of a Kondo spin screening cloud [2.3] 不純物スピンは、コンドスクリーニング雲(Kondo screening cloud)と呼ばれる、低温で伝導電子によって遮蔽される量子的絡み合いである。
我々はこのような近藤箱を実現し、絡みを制御・監視するためのアプローチを開発する。
電気的手法により固体中の空間的に拡張された量子多体絡みを操作・検出する方法を提供する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 07:16:30 GMT)
Subtraction and Addition of Propagating Photons by Two-Level Emitters [2.3] 本研究では,非ガウス量子演算を伝搬場モードに実装するには,受動的2レベル非線形性が十分であることを示す。
直観的量子軌道モデルの要素による単一光子サブトラクション過程を正確に記述する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:55:33 GMT)
TaCOS: Task-Specific Camera Optimization with Simulation [2.3] 本稿では,カメラをロボットタスクで協調設計するための新しいエンドツーエンド最適化手法を提案する。
提案手法は,最近のコンピュータグラフィックス技術と物理カメラ特性を利用して,ソフトウェアでカメラのプロトタイプを作成する。
物理カメラとの比較により, カメラシミュレーションの精度を検証し, 一般的な市販カメラよりも高い性能のカメラの設計を実証する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 01:10:44 GMT)
A Symmetric Regressor for MRI-Based Assessment of Striatal Dopamine Transporter Uptake in Parkinson's Disease [2.2] ドーパミントランスポーター(DAT)イメージングはパーキンソン病(PD)のモニタリングに一般的に用いられている
近年,ニコラル領域のMRIパッチはより安全で簡便な代替手段として提案されている。
本稿では,MRI パッチからの DAT 取り込み量を予測する対称回帰器を提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 06:18:48 GMT)
emrQA-msquad: A Medical Dataset Structured with the SQuAD V2.0 Framework, Enriched with emrQA Medical Information [2.2] emrQA-msquadデータセットは、医学用語の複雑さに対処するために開発された。
Span抽出タスク専用の医療データセットが導入され、システムの堅牢性が強化された。
BERT、RoBERTa、Tiny RoBERTaといったモデルの微調整により、F1スコアの範囲での応答精度は0.75から1.00に向上した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 10:06:00 GMT)
The Emerging AI Divide in the United States [2.0] 本研究では,米国住民の新たな生成型AIツールChatGPTに関する知識の空間的差異を特徴づける。
西海岸州ではChatGPTを検索するユーザが最も多く、アパラチア州や湾岸州では検索率が継続的に低い。
生成的AI技術は斬新なものだが、初期の取り込みの違いは、デジタルの限界化の慣れ親しんだ道を辿っているように見える。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 08:33:35 GMT)
Centralized vs. Decentralized Multi-Agent Reinforcement Learning for Enhanced Control of Electric Vehicle Charging Networks [1.9] 本稿では,MARL(Multi-Agent Reinforcement Learning)フレームワークを用いた分散・協調型充電戦略の新たなアプローチを提案する。
本手法は, 住宅街におけるEV群を対象としたDDPGアルゴリズムに基づいて構築した。
以上の結果から, CTDE-DDPGフレームワークは, 政策のばらつきや訓練の複雑さが高いにもかかわらず, 総変動率を約36パーセント, 充電コストを平均9.1程度削減することにより, 充電効率を著しく向上させることが示唆された。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 21:50:03 GMT)
How to Benchmark Vision Foundation Models for Semantic Segmentation? [1.9] 本稿では,視覚基盤モデル(VFM)をセマンティックセグメンテーションのためにベンチマークする方法について検討する。
様々なVFMを様々な設定で微調整し、個々の設定がパフォーマンスランキングとトレーニング時間に与える影響を評価する。
データセットとドメインシフト間でのパフォーマンスランキングが異なるため、トレーニングと評価に複数のデータセットを使用することも推奨されている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 13:27:29 GMT)
D4C Glove-train: Solving the RPM and Bongard-logo Problem by Circumscribing and Building Distribution for Concepts [1.8] 本稿では,RPM問題を解決する新しいベースラインモデルLico-Netを紹介する。
我々は、分布を通して抽象的推論問題において基礎となる概念を提唱するD3Cアプローチを推進している。
D3Cの計算効率を高めるために,D3C-cos変種を提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:26:39 GMT)
FaceFilterSense: A Filter-Resistant Face Recognition and Facial Attribute Analysis Framework [1.7] 面白い自撮りフィルターは、顔の生体認証システムの機能に大きく影響を与えている。
現在、顔のキーポイントを歪めているARベースのフィルターやフィルターは、最近流行し、裸眼でも顔が認識不能になっている。
これらの制約を緩和するため、我々は最新のフィルタの全体的影響分析を行い、フィルタ画像を用いたユーザ認識モデルを提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 09:43:26 GMT)
Graph Edits for Counterfactual Explanations: A comparative study [1.5] 我々は,グラフ編集における過去の取り組みを,比較研究を行うことで,反現実的な説明として拡張する。
この目的のために、我々は入力データをグラフとして表現すべきかという重要な研究課題を提起する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 14:29:29 GMT)
Entangled states from arborescent knots [1.5] このような結び目からベル状態、GHZ状態、クラスター状態を構築することができることを示す。
後者は、測定ベースの量子コンピュータの基盤を形成するため、特に興味深い。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 14:36:04 GMT)
Negotiating the Shared Agency between Humans & AI in the Recommender System [1.4] ユーザエージェンシーに関する懸念は、固有の不透明性(情報非対称性)とアルゴリズムにおける一方的な出力(パワー非対称性)の性質から生じている。
我々は,エージェントの種類がユーザの知覚や経験にどのように影響するかを理解し,人間とAIの対話システムのためのガイドラインや設計を洗練するための実証的な証拠を提供する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:05:22 GMT)
TensAIR: Real-Time Training of Neural Networks from Data-streams [1.4] 本稿では,ANNをリアルタイムにトレーニングする最初のOLシステムであるTensAIRについて述べる。
TensAIRは、分散化および非同期アーキテクチャを使用してANNモデルをトレーニングすることで、優れたパフォーマンスとスケーラビリティを実現する。
我々は、(1)ネットワークにデプロイされたワーカノードの数、(2)データバッチが到着するスループットの観点から、TensAIRがほぼ線形なスケールアウト性能を達成することを実証的に実証した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:07:35 GMT)
Enhancing AI Diagnostics: Autonomous Lesion Masking via Semi-Supervised Deep Learning [1.4] 本研究では,乳房超音波(US)画像における乳房病変の鑑別を目的とした,関心領域(ROI)を自律的に生成することを目的とした,教師なし領域適応手法を提案する。
我々の半教師付き学習アプローチは、真のアノテーションを持つ小さな母乳USデータセットで訓練された原始モデルを利用する。
このモデルはドメイン適応タスクのために反復的に洗練され、当社のプライベートな無注釈乳房データセットに擬似マスクを生成します。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:25:00 GMT)
NLP-enabled trajectory map-matching in urban road networks using transformer sequence-to-sequence model [1.4] 本稿では、列列から列へのディープラーニングモデル、特にトランスフォーマーベースのエンコーダデコーダモデルを紹介し、マップマッチングアルゴリズムのサロゲートとして実行する。
このモデルは、ニューヨーク州マンハッタンで収集されたGPSトレースを使って訓練され、評価されている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:39:23 GMT)
Simultaneous upper and lower bounds of American option prices with hedging via neural networks [1.4] 本稿では,ニューラルネットワークを用いたアメリカンスタイルオプション価格問題の解法を2つ紹介する。
最初の方法は、一連のニューラルネットワークを使用して、オプション価格の下限と上限の両方を同時に計算する。
2つ目の方法は1つのグローバルネットワークで同じ目標を達成する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 01:50:32 GMT)
Deep Gaussian mixture model for unsupervised image segmentation [1.4] 多くのタスクにおいて、十分なピクセルレベルのラベルを得るのは非常に困難である。
本稿では,ガウス混合モデル(GMM)と教師なしディープラーニング技術を組み合わせた手法を提案する。
マルチシーケンスMRI画像における梗塞領域分割の例について, 様々な実験において本手法の利点を実証する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:20:59 GMT)
Terrain-Informed Self-Supervised Learning: Enhancing Building Footprint Extraction from LiDAR Data with Limited Annotations [1.3] フットプリントマップの構築は、広範な後処理なしで正確なフットプリント抽出を約束する。
ディープラーニング手法は、一般化とラベルの効率の面で課題に直面している。
リモートセンシングに適した地形認識型自己教師型学習を提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 07:42:19 GMT)
Acting upon Imagination: when to trust imagined trajectories in model based reinforcement learning [1.3] モデルベース強化学習(MBRL)は、行動の結果を予測する環境力学のモデル(s)を学習することを目的としている。
仮想軌道のオンライン評価のための不確実性推定手法を提案する。
その結果,性能を犠牲にすることなく計算コストを大幅に削減できることがわかった。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 23:45:00 GMT)
PID Tuning using Cross-Entropy Deep Learning: a Lyapunov Stability Analysis [1.2] この研究は、そのようなコントローラの安定性を実証的に研究する実験とメトリクスを提案する。
クロスエントロピー深層学習法を用いて適応パラメータを決定するLB適応制御系において,この安定性解析を行う。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 09:22:08 GMT)
Resource analysis for quantum-aided Byzantine agreement with the four-qubit singlet state [1.2] 分散コンピューティングでは、ビザンツ断層(Byzantine fault)は、コンポーネントが不整合に振る舞う状態であり、システムの異なるコンポーネントに対して異なる症状を示す。
我々の研究は、量子通信プロトコルを多ビットの絡み合った状態に展開する上で重要な工学的側面を強調している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 06:26:43 GMT)
Concept Induction using LLMs: a user experiment for assessment [1.2] 本研究では,人間に対する説明として意味のある高レベルな概念を生成するために,LLM(Large Language Model)の可能性を探る。
我々は、LLMによって生成された概念を、人間によって生成された概念とECII概念誘導システムという、他の2つの方法と比較する。
人為的な説明は依然として優れているが, GPT-4 から派生した概念は, ECII が生成した概念よりも人間にとって理解しやすいことが示唆された。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 03:22:02 GMT)
When LLMs are Unfit Use FastFit: Fast and Effective Text Classification with Many Classes [1.2] 我々はFastFitを提案する。FastFitは、高速で正確な数ショット分類を提供するためのメソッドであり、Pythonパッケージ設計である。
FastFitは、バッチコントラスト学習とトークンレベルの類似度スコアを組み合わせた、新しいアプローチを採用している。
パッケージはGitHubとPyPiで公開されており、NLP実践者向けのユーザフレンドリなソリューションを提供している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:48:05 GMT)
Corpus Christi: Establishing Replicability when Sharing the Bread is Not Allowed [1.1] コーパス生成に大きな影響を及ぼすバイナリ分析の課題を特定する。
私たちは、複製性と代表性という科学的目標を育むための重要なコーパス要件の枠組みを導き出すためにそれらを使用します。
このフレームワークを44階層の論文に適用し,704個のデータポイントを収集し,現在コーパス作成の共通基盤がないことを示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 08:14:40 GMT)
Computer-Aided Diagnosis of Thoracic Diseases in Chest X-rays using hybrid CNN-Transformer Architecture [1.1] 自動コンピュータ支援診断システムは、胸部X線を解釈し、実行可能な洞察を提供することで、放射線科医を増強することができる。
本研究では,DenseNet121 Convolutional Neural Network(CNN)を付加した新しいアーキテクチャを適用した。
胸部X線による胸部疾患の診断において, 自己注意でCNNを増強する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 01:46:31 GMT)
Follow-Me AI: Energy-Efficient User Interaction with Smart Environments [1.1] この記事では、スマート環境とのユーザインタラクションを強化するために設計されたコンセプトであるFollow-Me AIを紹介します。
Follow-Me AIは、ユーザの同意に基づいてデータ管理を交渉し、環境制御を調整し、ユーザの好みに応じて、環境内で利用可能なリソースを計算します。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 20:00:25 GMT)
E-Vote Your Conscience: Perceptions of Coercion and Vote Buying, and the Usability of Fake Credentials in Online Voting [1.1] オンライン投票は、個人投票よりも有権者の強制と投票による購入の影響を受ける。
1つの緩和策は、有権者に偽の投票資格を付与し、強制執行者に与えることである。
偽の資格証は実際のものと同一に見えるが、最終集計から無言で省略された投下票である。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 10:57:32 GMT)
Thermalization of isolated quantum many-body system and the role of entanglement [1.0] 絡み合いは, 普遍的ではなく, 特に熱分解剤として作用する可能性が示唆された。
特に, エンタングルエネルギー固有状態における観測対象の期待値とその限界値は観測対象のミクロカノニカルおよび標準平均値と等価であることを示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 22:09:40 GMT)
AI-Based Automated Speech Therapy Tools for persons with Speech Sound Disorders: A Systematic Literature Review [1.0] 新型コロナウイルス(COVID-19)パンデミックは、音声障害(SSD)患者のための自動音声治療ツールの要件を開始した。
このような自動化ツールを設計するためのガイドラインや,その自動化の度合いは,人間の専門家に比較して存在しない。
モバイルベースでゲーミフィケーションされたアプリケーションは、最も頻繁な介入方法であった。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 20:42:41 GMT)
From port-based teleportation to Frobenius reciprocity theorem: partially reduced irreducible representations and their applications [1.0] 我々は、$n$システムに作用するポートベースのテレポーテーション作用素のスペクトルが、対称群 $S(n-1)subset S(n)$ に対して、Jucys-Murphy作用素のスペクトルと非常に単純な方法で連結されていることを示す。
このことは、対称群の表現論の観点から、テレポーレーションと基本対象の1つの間の技術的なレベルの関係を示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 07:56:51 GMT)
VCC-INFUSE: Towards Accurate and Efficient Selection of Unlabeled Examples in Semi-supervised Learning [1.0] 既存の手法では、ラベルのないデータを効果的かつ効率的に利用できない。
本稿では,変分信頼度 (VCC) と影響Function-based Unlabeled Sample Elimination (INFUSE) の2つの手法を提案する。
提案手法は,複数のデータセットや設定において有効であり,誤り分類率を低減し,トレーニング時間を短縮する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 06:59:40 GMT)
What does CLIP know about peeling a banana? [1.0] 知的なロボットが日々の生活の物体を使えるようにするためには、必要なタスクに応じて物体を分割できることが不可欠だ。
従来の割当セグメンテーションのための教師付き学習手法は、高価なピクセルレベルのアノテーションを必要とする。
本稿では,大規模な事前学習型ビジョンランゲージモデルに埋め込まれた暗黙のアベイランス知識を活用することで,これらの制約を克服するAffordanceCLIPを提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 09:06:05 GMT)
Neural Networks with Causal Graph Constraints: A New Approach for Treatment Effects Estimation [1.0] 因果グラフからの追加情報を考慮した新しいモデルNN-CGCを提案する。
本手法は因果グラフの不完全性に対して頑健であり,部分因果情報の使用は無視するよりも望ましいことを示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 14:57:17 GMT)
Warped Time Series Anomaly Detection [0.9] 本稿では,繰り返し動作を伴うシステムに焦点をあて,時系列の外れ値を検出する問題に対処する。
WarpEd Time Series Anomaly Detection (WETSAND) と呼ばれる全体的なアプローチは、動的時間ワープアルゴリズムとその変種を利用する。
実験の結果、ウェットサンドは大きな信号にスケールし、人間に親しみやすいプロトタイプを計算し、非常に少ないデータで動作し、オートエンコーダのような汎用的な異常検出アプローチよりも優れていることがわかった。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:35:24 GMT)
The graph alignment problem: fundamental limits and efficient algorithms [0.9] グラフ同型問題のノイズバージョンは、エッジの大部分を保存する2つのグラフのノード間のマッチングを見つけることを目的としている。
この論文は、この問題の基本的な情報理論的限界を理解すること、および、基礎となるデータのアライメントを回復できるアルゴリズムを設計および分析することに焦点を当てている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:31:13 GMT)
Explainable Deep Learning Models for Dynamic and Online Malware Classification [0.9] 本研究の目的は,様々な実行環境にまたがる説明可能なマルウェア分類を探索することである。
我々は、動的およびオンライン分析環境から得られた特徴に基づいてマルウェアを分類するために、フィードフォワードニューラルネットワーク(FFNN)と畳み込みニューラルネットワーク(CNN)を訓練する。
計算されたグローバルおよびローカルな説明の詳細な評価を行い、制限について議論し、最終的にはバランスの取れたアプローチを達成するための推奨事項を提示します。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 19:07:51 GMT)
From Language Models to Practical Self-Improving Computer Agents [0.9] 我々は、多様なコンピュータタスクを実行し、自己改善できるAIコンピュータエージェントを作成するための方法論を開発する。
我々は、LLMエージェントに検索、インターネット検索、Webナビゲーション、テキストエディタ機能を増強するよう促す。
このエージェントは、これらの様々なツールを効果的に利用して、自動ソフトウェア開発やWebベースのタスクを含む問題を解決する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 07:50:10 GMT)
Enhanced LFTSformer: A Novel Long-Term Financial Time Series Prediction Model Using Advanced Feature Engineering and the DS Encoder Informer Architecture [0.9] 本研究では,拡張LFTSformerと呼ばれる長期金融時系列の予測モデルを提案する。
このモデルは、いくつかの重要なイノベーションを通じて、自分自身を区別する。
さまざまなベンチマークストックマーケットデータセットに関するシステマティックな実験は、強化LFTSformerが従来の機械学習モデルより優れていることを示している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 09:25:34 GMT)
The collective use and evaluation of generative AI tools in digital humanities research: Survey-based results [0.7] 生成人工知能(GenAI)技術は研究に革命をもたらした。
本稿では,デジタル人文科学研究者がGenAI技術をどのように採用し,実践し,批判的に評価するかを考察する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:33:00 GMT)
Diamond surfaces with lateral gradients for systematic optimization of surface chemistry for relaxometry -- A low pressure plasma-based approach [0.6] 窒素空孔(NV)中心と呼ばれるダイヤモンドの欠陥は、前例のない感度で測定できる。
理想的なセンシング性能を達成するには、NVセンターは表面からナノメートル以内に配置する必要がある。
ダイヤモンドの表面を比較するためにいくつかの試みがなされている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 07:47:44 GMT)
Parametrically-controlled microwave-photonic interface for the fluxonium [0.6] マイクロ波誘起パラメトリック変換によるフラキソニウムと走行光子との対面方式を実験的に実証した。
実演方式のシンプルさと柔軟性により,フラキソニウムをベースとしたリモートエンタングルメントアーキテクチャが実現される。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 01:55:02 GMT)
Assessing the Solvency of Virtual Asset Service Providers: Are Current Standards Sufficient? [0.4] VASPは、分散台帳技術(DLT)を介してウォレットに整理された暗号通貨の交換、保持、転送を可能にする
DLTトランザクションの公開にもかかわらず、VASPの暗号保持は、まだ体系的な監査手続きの対象にはなっていない。
本稿では,3つの異なる情報源からの相互参照データを用いて,VASPの可解性を評価する手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:45:35 GMT)
Methods and strategies for improving the novel view synthesis quality of neural radiation field [0.3] NeRF技術は、2D画像からシーンの3D暗黙モデルを学び、現実的な新しいビューイメージを合成することができる。
NeRF画像のレンダリング品質を改善する必要があるという問題に対して、多くの研究者が過去3年間のレンダリング品質を改善するための様々な方法を提案している。
この研究は、研究者がこの分野における現在の技術状況と進化の文脈を素早く理解するのに役立ちます。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 01:37:42 GMT)
HalluciBot: Is There No Such Thing as a Bad Question? [0.3] HalluciBotは、生成前の幻覚の確率を予測するモデルである。
推論中には何世代も起動しない。
幻覚的クエリのユーザ説明責任を計測するルーシックな手段を提供する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 22:56:57 GMT)
The quantum gravity seeds for laws of nature [0.3] 我々は、空間と時間が基本でないかもしれない量子重力の枠組みの中で、標準法則(Hu)が直面する課題について議論する。
量子エンタングルメント、量子遷移振幅、および量子因果履歴の役割を強調した。
これらの特徴はまた、量子重力と量子情報理論の間の実りある重なり合いを強調している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:12:52 GMT)
Current Trends in Digital Twin Development, Maintenance, and Operation: An Interview Study [0.3] デジタルツイン(DT)は、しばしば物理的実体と対応する仮想実体(VE)のペアリングとして定義される。
デジタル双生児の生活段階と密接に関連している産学専門職19名を対象に半構造化面接を行った。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:00:32 GMT)
An introduction to infinite projected entangled-pair state methods for variational ground state simulations using automatic differentiation [0.3] テンソルネットワークは 量子物質の相の基底状態の大規模なクラスを 忠実かつ効率的に捉えます
近年、量子状態の変分最適化に関する複数の提案が進められている。
本稿では,iPEPSフレームワークの現状を概観し,自動微分の詳細な解説を行う。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:04:52 GMT)
A New Reliable & Parsimonious Learning Strategy Comprising Two Layers of Gaussian Processes, to Address Inhomogeneous Empirical Correlation Structures [0.1] 利用可能なデータの相関構造における不均一性に対処しながら,変数のペア間の機能的関係を学習するための新しい戦略を提案する。
探索関数を非定常ガウス過程(GP)の標本関数としてモデル化し、他の複数のGP内にネストする。
私たちはこの新しい学習戦略を実際のデータセットで説明します。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 19:21:28 GMT)
Code conversion with the quantum Golay code for a universal transversal gate set [0.1] The $[[7,1,3]$ Steane code and $[[23,1,7]$ quantum Golay code has been identified as good candidate for fault-tolerant quantum computing through code concatenation。
この手順の重要な要素は、[49,1,5]$ triorthogonal code である。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:06:29 GMT)
Approximation of group explainers with coalition structure using Monte Carlo sampling on the product space of coalitions and features [0.1] 我々は、与えられたMLモデルと予測ベクトルに基づく限界ゲームに対して、幅広い種類の線形ゲーム値と連立値に焦点を当てる。
我々はモンテカルロサンプリングアルゴリズムを設計し、背景データセットのサイズに線形に依存する複雑さを減らし、それらを推定する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:14:32 GMT)
Quasiparticle cooling algorithms for quantum many-body state preparation [0.1] 本研究では, 準粒子冷却力学を記述するための動力学理論フレームワークを開発し, 異なる冷却アルゴリズムの効率を比較する。
この研究は、準粒子冷却アルゴリズムを、短期量子プロセッサ上での多体状態準備のための実用的で堅牢な方法として確立する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 13:31:30 GMT)
p-Adic Quantum Mechanics, the Dirac Equation, and the violation of Einstein causality [0.0] 本稿では、量子力学におけるプランク長におけるローレンツ対称性の破れについて研究する。
位置変数として3次元の p-進ベクトルを用いるが、時間は実数のままである。
プランク長の p-進は光速とは独立であり、空間の対称性の群によって決定される。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 21:03:58 GMT)
floZ: Evidence estimation from posterior samples with normalizing flows [0.0] 本研究では,非正規化後部分布から抽出したサンプル群からベイズ証拠(およびその数値的不確実性)を推定する新しい手法を提案する。
解析的に証拠が知られている分布、最大15のパラメータ空間次元で検証し、証拠を推定するための2つの最先端技術と比較する。
例えば、変分推論、マルコフ連鎖モンテカルロサンプル、あるいは非正規化後密度からサンプルを届ける他の方法から証拠を推定する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:16:02 GMT)
WebXR, A-Frame and Networked-Aframe as a Basis for an Open Metaverse: A Conceptual Architecture [0.0] この研究は、AフレームとNetworked-Aframeフレームワークを活用する、WebXRベースのクロスプラットフォームの概念アーキテクチャを提案する。
空間ウェブアプリの概念を導入することにより,メタバースについての議論に寄与する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 08:29:48 GMT)
ViLLM-Eval: A Comprehensive Evaluation Suite for Vietnamese Large Language Models [0.0] ViLLM-Evalは、基礎モデルの高度な知識と推論能力を測定するために設計された総合的な評価スイートである。
ViLLM-Eval上での最も先進的なLCMの徹底的な評価により、最高の性能のモデルでさえ改善の余地があることが判明した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 07:41:23 GMT)
Urban highways are barriers to social ties [0.0] 都市ハイウェイは社会的つながりの低下と関連していることを示す。
この障壁効果は特に短い距離で強く、ブラック地区を意図的に破壊したり孤立させたりするために建設された道路の歴史的事例と一致している。
本研究では,エビデンスに基づく空間的不等式低減のための再検討計画について報告する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:56:40 GMT)
Towards an Approximation Theory of Observable Operator Models [0.0] 無限次元過程をモデル化するために可観測作用素モデル(OOMs)を用いることは、重要な理論的課題となる。
将来の分布空間上の内積構造が厳密に確立され、可観測作用素の連続性が証明される。
この論文で証明された元の定理は、将来の分布の無限次元空間をヒルベルト空間にするという根本的な障害を記述している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 10:45:47 GMT)
Toward a Quantum Information System Cybersecurity Taxonomy and Testbed: Exploiting a Unique Opportunity for Early Impact [0.0] 我々は、量子情報システムの最新の進歩を考慮に入れた、量子サイバーセキュリティの脆弱性に対する予備的な分類法を提案する。
我々は、サイバーセキュリティと量子情報システムの専門家が共同でソフトウェアとハードウェアのセキュリティを実験的に評価できるようにするための、特定の目的のために設計、実装されたテストベッド環境を構想する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:56:21 GMT)
The inherent goodness of well educated intelligence [0.0] 本稿では,生物と人工シリコンのどちらがコンピュータ上に存在するのか,その知性について検討する。
インテリジェンスの本質は、黄金の規則である「一つの集団的な行動」または「局所的な行動のグローバルな結果を知る」ことが分かる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 19:01:01 GMT)
The State of the Art in Enhancing Trust in Machine Learning Models with the Use of Visualizations [0.0] 機械学習(ML)モデルは、医学、バイオインフォマティクス、その他の科学など、様々な分野の複雑な応用で使われている。
しかし、ブラックボックスの性質のため、それらが提供する結果を理解し、信頼することは難しいこともある。
これにより、MLモデルの信頼性向上に関連する信頼性の高い視覚化ツールの需要が増加した。
本稿では,インタラクティブな可視化によるMLモデルの信頼性向上について,STAR(State-of-the-Art Report)を提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:00:21 GMT)
Supervised Contrastive Vision Transformer for Breast Histopathological Image Classification [0.0] 浸潤性乳管癌(Invasive ductal carcinoma,IDC)は乳癌の最も多い形態である。
In this present a novel approach, Supervised Contrastive Vision Transformer (SupCon-ViT) to improve the classification of IDC。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 01:59:27 GMT)
Star exponentials from propagators and path integrals [0.0] 我々は、変形量子化形式に現れる恒星指数と、量子力学におけるプロパゲータに関連するファインマンの経路積分の関係に対処する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:17:44 GMT)
Social Links vs. Language Barriers: Decoding the Global Spread of Streaming Content [0.0] 我々は、Netflix、Spotify、YouTubeの3つの重要なストリーミングサービスの社会的側面を、各国のコンテンツの普及に重点を置いて検討する。
2年間のトレンドチャートデータセットを使用して、ストリーミングコンテンツは、ビデオ指向(Netflix)とオーディオ指向(Spotify)の2つのタイプに分けられる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 13:06:59 GMT)
Singular-limit analysis of gradient descent with noise injection [0.0] 雑音勾配降下系の小さなステップサイズの極限における極限ダイナミクスについて検討する。
ノイズの構造が限界過程の形状だけでなく、進化が起こる時間スケールにも影響を及ぼすことを示す。
結果はニューラルネットワークのトレーニングにインスパイアされているが、この定理は非自明なゼロロス集合を持つ損失のノイズ勾配勾配に適用される。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:13:58 GMT)
Simple Information Processing Tasks with Unbounded Quantum Advantage [0.0] 古典的システムに対する量子システムの明確な非有界な優位性を検出することは可能であることを示す。
古典的なシステムで可能な全ての量子通信タスクを実装するのに必要なすべての調整されたアクションを格納するために、有限記憶は使用できない。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 11:10:43 GMT)
Separating the wave and particle attributes of two entangled photons [0.0] 我々の常識では、量子オブジェクトの波動と粒子の性質は分離できない。
本研究では、2つの絡み合った光子の波動特性と粒子特性を空間的に分離する実現可能な手法を提案する。
我々のスキームはまた、2つの絡み合った光子の波動特性と粒子特性の観測がボーアの相補性原理に従うことを保証している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 07:45:48 GMT)
Self-Adjusting Evolutionary Algorithms Are Slow on Multimodal Landscapes [0.0] 正の結果が他の局所最適値に拡張されないことを示す。
歪んだOneMaxベンチマークでは、自己調整の$(1, lambda)$-EAは、アルゴリズムがローカルオプティマからエスケープされるのを防ぐため、エリート的アルゴリズムと同じように遅くなる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 10:01:08 GMT)
Scalable spin squeezing from critical slowing down in short-range interacting systems [0.0] 本稿では,2次元U(1)対称系において,短距離相互作用でもスケーラブルなスクイージングが実現可能であることを示す。
本研究は,量子シミュレーションと情報処理の多くの関連プラットフォームにおいて,潜在的な気象学的関心を持つ巨大な絡み合った状態を実現するための道を開くものである。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 21:29:43 GMT)
Redefining the Shortest Path Problem Formulation of the Linear Non-Gaussian Acyclic Model: Pairwise Likelihood Ratios, Prior Knowledge, and Path Enumeration [0.0] 本稿では,LiNGAM-SPPフレームワークの3倍拡張を提案する。
パラメータチューニングの必要性は、kNNベースの相互情報の代わりに、ペアワイズ確率比を用いて排除される。
先行知識の組み入れは、すべての因果順序のグラフ表現に実装されたノードスキッピング戦略によって実現される。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 05:59:28 GMT)
Recoil heating of a dielectric particle illuminated by a linearly polarized plane wave within the Rayleigh regime [0.0] 電磁界のゆらぎから生じる粒子に作用するゆらぎ力を導出する。
リコイル加熱は、浮遊光学の基本的な限界を課す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:35:18 GMT)
RAGAR, Your Falsehood RADAR: RAG-Augmented Reasoning for Political Fact-Checking using Multimodal Large Language Models [0.0] マルチモーダルなファクトチェックの信頼性と効率を高めるための革新的なアプローチを導入する。
これらのアプローチは、過去の証拠に基づいて答える必要がある次の質問を推論することで、マルチモーダルなクレームを扱うように設計されている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 10:25:42 GMT)
PureForest: A Large-scale Aerial Lidar and Aerial Imagery Dataset for Tree Species Classification in Monospecific Forests [0.0] 木種分類用に設計された大規模でオープンなマルチモーダルデータセットであるPureForestデータセットを提案する。
樹種分類のための現在の一般のLidarデータセットは、ほとんどの場合、数十ヘクタールの注釈付きヘクタールの小さな領域にしか達しないため、多様性が低い。
対照的に、PureForestは18の樹種を13のセマンティッククラスに分類し、449の異なる単種林に339 km$2$で分布する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 10:23:10 GMT)
Pseudo-random generators using linear feedback shift registers with output extraction [0.0] 擬似ランダムビットストリームを生成するために線形フィードバックシフトレジスタによって供給される3つの抽出器について検討した。
本報告の焦点は擬似ランダムビットストリームの品質とLFSRからの一次ストリームのビットの効率性である。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 09:03:09 GMT)
Protecting gauge symmetries in the the dynamics of SU(3) lattice gauge theories [0.0] この研究は、SU(3)ゲージ理論の正確な力学を1+1$次元でシミュレートするための対称性保護プロトコルを2つ提示する。
ここで提示される対称性保護スキームは、量子色力学の完全な理論をシミュレートするための重要なステップである。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 13:05:22 GMT)
ParaFusion: A Large-Scale LLM-Driven English Paraphrase Dataset Infused with High-Quality Lexical and Syntactic Diversity [0.0] 既存のデータセットは構文と語彙の多様性に欠けており、結果として原文によく似たパラフレーズが生じる。
本研究では,Large Language Models (LLM) を用いた大規模かつ高品質な英語パラフレーズデータセットであるParaFusionを紹介する。
ParaFusionは、高品質なデータで既存のデータセットを拡張し、語彙と構文の多様性を著しく向上し、セマンティックな類似性を維持している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 09:02:45 GMT)
OpenBezoar: Small, Cost-Effective and Open Models Trained on Mixes of Instruction Data [0.0] 本研究では,OpenLLaMA 3Bv2をベースモデルとして,OpenBezoarファミリを微調整するレシピについて述べる。
我々はまず、Falcon-40Bモデルのオープンかつ非制限的命令微調整版を用いて、合成命令微調整データを生成する。
次に、コスト効率のよいQLoRAに基づく教師あり微調整を各スキームで逐次行う。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 13:57:18 GMT)
NeuroLGP-SM: Scalable Surrogate-Assisted Neuroevolution for Deep Neural Networks [0.0] 進化的アルゴリズムは、人工深層ニューラルネットワーク(DNN)のアーキテクチャ構成とトレーニングにおいて重要な役割を果たす
本研究では, DNNから出力される表現型距離ベクトルと, Kriging partial Least Squares (KPLS) を用いて探索する。
提案手法はニューロLinear Genetic Programming surrogate model (NeuroLGP-SM) と名付けられ, 完全評価を必要とせず, DNNの適合性を効率的に正確に推定する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 10:39:50 GMT)
Mapping back and forth between model predictive control and neural networks [0.0] 2次コストと線形制約を持つ線形系に対するモデル予測制御(MPC)は、暗黙のニューラルネットワークとして正確に表現されていることを示す。
また、MPCの暗黙のニューラルネットワークを明示的なニューラルネットワークに"解き放つ"方法も導入されている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 09:29:08 GMT)
Learning the Domain Specific Inverse NUFFT for Accelerated Spiral MRI using Diffusion Models [0.0] 我々は多コイル高アンサンプドスパイラルMRIのための生成拡散モデルに基づく再構成アルゴリズムを作成する。
超高速スキャン時間(2D画像では0.02秒)で再構成した画像に高品質(構造的類似度 > 0.87)を示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:40:23 GMT)
Large Language Models in Targeted Sentiment Analysis [0.0] 命令調整型大言語モデル(LLM)の感情分析能力について検討する。
RuSentNE-2023の感情分析の最良の結果は、微調整されたFlan-T5-xlによって達成された。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:16:16 GMT)
Large Language Models for Synthetic Participatory Planning of Shared Automated Electric Mobility Systems [0.0] 本稿では,大規模言語モデル(LLM)を批判的に活用してデジタルアバターを作成する,新しい合成参加手法を提案する。
これらの調整可能なエージェントは、目標を共同で識別し、SAEMS代替案を構想し、評価し、リスクと制約の下で実施をストラテジズする。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:51:23 GMT)
Is artificial consciousness achievable? Lessons from the human brain [0.0] 進化の観点から,人工意識の発達に関する問題を分析する。
我々は、人間の脳の進化と、その意識との関係を参照モデルとして捉えている。
我々は,AIの認知処理における共通点と,人間の意識経験との違いを明確にすることを提案する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:59:44 GMT)
Intelligence Education made in Europe [0.0] 共同インテリジェンス教育がいかに成功するかを示す。
我々は、すべての諜報機関と連邦機関が共に学術的に教育されているドイツの経験を描いている。
これらの経験がヨーロッパレベル、すなわちICEにどのように移行されたかを示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:25:46 GMT)
Instability of quadratic band degeneracies and the emergence of Dirac points [0.0] V$ の典型的な小さな線形変形の下では、高対称性の $boldsymbolM$ 上の二次帯域縮退点がディラック点であることを示す。
ウェーブパペットは、$boldsymbolD+$ または $boldsymbolD-$ のいずれかの近傍でスペクトル局在化され、対流項を持つディラック方程式の系によって支配される。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 20:14:50 GMT)
Increasing Interference Detection in Quantum Cryptography using the Quantum Fourier Transform [0.0] 量子フーリエ変換(QFT)を利用した2つの量子暗号プロトコルを提案する。
これらのプロトコルの最も重要な点は、このQFTの有効性を活用する新しいQKD手法である。
さらに、既存の量子暗号化手法をQFTベースのアプローチで拡張して、盗聴検出を改善する方法について述べる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 21:04:03 GMT)
How Population Diversity Influences the Efficiency of Crossover [0.0] 我々は,$(mu+1)$ Genetic Algorithm on LeadingOnesをスピードアップするのに,多様性の量が必要であるという公式かつ一般的な基準を与える。
自然に進化する多様性は、任意の$mu=O(sqrtn/log2 n)$に対して実質的なスピードアップを与えるに足らないことを示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:41:27 GMT)
Generalizing Machine Learning Evaluation through the Integration of Shannon Entropy and Rough Set Theory [0.0] 我々は、粗集合論の粒度とシャノンエントロピーの不確かさの定量化を相乗化する包括的枠組みを導入する。
我々の手法は様々なデータセットで厳密にテストされており、予測性能を評価するだけでなく、基礎となるデータの複雑さとモデルロバスト性を照らす能力を示している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 21:22:42 GMT)
Full range spectral correlations and their spectral form factors in chaotic and integrable models [0.0] 系のスペクトルの固有エネルギー間の相関は、量子カオスの定義的な特徴である。
線形ランプは短距離エネルギー相関だけでは形成できない。
本研究は,カオス的行動と可積分的行動の相互補間を行う XXZ spin chain with disorder について述べる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:21:20 GMT)
Fortify the Guardian, Not the Treasure: Resilient Adversarial Detectors [0.0] アダプティブアタックとは、攻撃者が防御を意識し、その戦略を適応させる攻撃である。
提案手法は, クリーンな精度を損なうことなく, 敵の訓練を活用して攻撃を検知する能力を強化する。
CIFAR-10とSVHNデータセットの実験的評価により,提案アルゴリズムは,適応的敵攻撃を正確に識別する検出器の能力を大幅に向上することを示した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:13:09 GMT)
Exact Solution of Bipartite Fluctuations in One-Dimensional Fermions [0.0] 交互状態から始まる一次元非相互作用フェルミオン力学における二部晶変動のばらつきについて検討する。
その結果, 実験で観測された分散成長と, 適合パラメータを伴わずに定量的に一致していることが判明した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 07:11:32 GMT)
Enhancing Financial Inclusion and Regulatory Challenges: A Critical Analysis of Digital Banks and Alternative Lenders Through Digital Platforms, Machine Learning, and Large Language Models Integration [0.0] 本稿では,デジタル銀行と代替銀行が金融包摂性に与える影響とビジネスモデルがもたらす規制課題について考察する。
デジタルプラットフォーム、機械学習(ML)、Large Language Models(LLM)の統合について論じる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 05:00:53 GMT)
Enhancing Embedding Performance through Large Language Model-based Text Enrichment and Rewriting [0.0] 本稿では,大規模な言語モデル(LLM)を活用して埋め込み処理前に入力テキストを豊かに書き直しすることで,埋め込み性能を向上させる新しい手法を提案する。
このアプローチの有効性は、Banking77 Classification、TwitterSemEval 2015、Amazon Counter-factual Classificationの3つのデータセットで評価されている。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:58:56 GMT)
Enhancing Educational Efficiency: Generative AI Chatbots and DevOps in Education 4.0 [0.0] 本研究は,コンピュータサイエンス教育におけるイノベーティブな教育的アプローチをもたらすものである。
人工知能(AI)とDevOpsから借用された方法論を組み合わせて、コンテンツ管理システム(CMS)開発における学習経験を強化する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:45:39 GMT)
Efficient Sentiment Analysis: A Resource-Aware Evaluation of Feature Extraction Techniques, Ensembling, and Deep Learning Models [0.0] 我々は,資源コストに着目した文書レベルの感情分析モデルを評価する。
より小さなデータセットでは,資源消費の差が大きくなるにつれて精度の差が小さくなることがわかった。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:06:17 GMT)
Effective light-induced Hamiltonian for atoms with large nuclear spin [0.0] 外部共鳴光との結合は、核スピン状態の選択的かつコヒーレントに操作するための重要なツールである。
このような非共鳴光による超低温フェルミオン原子の核スピン状態に対する有効ハミルトニアンの体系的導出を示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:00:01 GMT)
Doped stabilizer states in many-body physics and where to find them [0.0] この研究は、ドープ安定化状態と多体量子系における固有状態の構造の基本的な関係を明らかにする。
我々は,低エネルギー固有状態の探索,クエンチダイナミクスのシミュレーション,およびこれらのシステムにおけるエンタングルメントエントロピーの計算といったタスクに対して,効率的な古典的アルゴリズムを開発する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 01:43:35 GMT)
Decoupled sound and amplitude modes in trapped dipolar supersolids [0.0] 遷移中の超流動モードから発生した第1の音、第2の音、ヒッグスモードがいかに分離されたかを示す。
この結果は、調和トラップにおけるゴールドストーンとヒッグスモードの結合の概念を統一する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 17:59:41 GMT)
Coupled states of cold 174-Yb atoms in a high-finesse cavity [0.0] 我々は,Yb原子の狭間結合線の強い集合結合から高精細光空洞の単一モードに生じる着衣状態の形成を実験的に理論的に検討した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 13:27:42 GMT)
Constraints on extra dimensions theories from gravitational quantum barrier experiments [0.0] 我々は、超低温中性子を含む量子バウンサー実験を、ブレーンワールドのシナリオで論じる。
概して、超次元理論は、短距離での重力相互作用の強化を予測している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 20:20:30 GMT)
Complexity of Supersymmetric Systems and the Cohomology Problem [0.0] 我々は、$mathcal N=2 $ 超対称性を持つフェルミオンハミルトニアンの文脈における局所ハミルトニアン問題の複雑さを考える。
これを研究する主な動機は、超対称系の基底状態エネルギーがちょうどゼロであることと、あるコホモロジー群が非自明であることである。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 11:28:25 GMT)
Claim Check-Worthiness Detection: How Well do LLMs Grasp Annotation Guidelines? [0.0] ファクトチェックを必要とするテキストセグメントを識別するために、ゼロショットと少数ショットのLCMプロンプトを使用する。
各種領域の5つのCD/CWデータセットに対して,LLMの予測精度と校正精度を評価した。
提案手法により, 最適急進的冗長性はドメイン依存であり, 文脈の追加は性能を向上しないことがわかった。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 13:31:05 GMT)
Can we accurately read or write quantum data? [0.0] 私は、全ハミルトニアンが下から有界であれば、正確な測定と準備は不可能であることを示す。
この結果は、量子制御、量子コンピューティング、その他の量子技術の限界を再評価する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:55:50 GMT)
Can quantum theory be underpinned by a non-local hidden variable theory ? [0.0] 本稿では,2つの観測可能な部分系を持つ二部量子状態の一般ベル型非局所隠れ変数理論(NLHVT)による記述を考察する。
CGLMP (Collins-Gisin.-Liden-Massar-Popescu) 型のベル不等式を導出した。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 02:09:57 GMT)
CARE to Compare: A real-world dataset for anomaly detection in wind turbine data [0.0] 風力タービンの予測保守分野において,異常検出は重要な役割を担っている。
さまざまなアプローチの比較では、さまざまなドメインのデータで構成されたベンチマーク、アクセス不可能なデータ、あるいは障害に関する詳細な情報を持たない数少ない公開データセットのいずれかが使用されている。
本稿では、3つの異なる風力発電所にわたる36基の風力タービンのデータを含む高品質なデータセットを公表する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 05:56:21 GMT)
Beacon, a lightweight deep reinforcement learning benchmark library for flow control [0.0] 本研究では,7つの軽量な1次元フロー制御問題と2次元フロー制御問題からなるオープンソースのベンチマークライブラリであるBeaconを提案する。
このコントリビューションでは、考慮すべき7つの問題を記述し、参照制御ソリューションを提供する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 08:58:27 GMT)
Back to Basics: Fast Denoising Iterative Algorithm [0.0] ノイズ低減のための高速反復アルゴリズムであるBack to Basics (BTB)を紹介する。
光コヒーレンス・トモグラフィー(OCT)における白色ガウス雑音の存在下での自然像,ポアソン分布画像デノイング,スペックル抑制の3症例について検討した。
実験結果から,提案手法は画像品質を効果的に向上しうることを示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:39:15 GMT)
Area laws from classical entropies [0.0] 局所量子エントロピーの領域法則的なスケーリングは、量子場、多体系、時空に固有の絡み合いの中心的特徴である。
不確実性原理によって導かれる真空寄与が減じられた場合、測定分布に対する古典的エントロピーに等しく現れることを示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:52:56 GMT)
Area laws for classical entropies in a spin-1 Bose-Einstein condensate [0.0] 古典エントロピーを好適に選択した古典的エントロピーとその古典的相互情報は、量子場理論で知られている量子エントロピーの典型的特徴を含む様々な解析的および数値的な証拠を提供する。
我々は、k-アネレスト近傍推定器を用いて、基礎となる量子状態について追加の仮定をせずに、有限個のサンプルからエントロピー量を推定する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:53:17 GMT)
Area laws and thermalization from classical entropies in a Bose-Einstein condensate [0.0] 局所量子エントロピーは、基礎となる量子状態の非線形機能である。
好適に選択された古典的エントロピーがそれらの量子アナログと全く同じ特徴を捉えていることを示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 16:53:03 GMT)
Apparent violation of causality in relativistic quantum mechanics [0.0] 相対論的理論では、微視的因果関係の原理は、情報は光速よりも速く移動できない」。
ここでは、質量を持たない粒子と質量粒子の波動関数を考える。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 11:04:57 GMT)
Anharmonic Effects on the Squeezing of Axion Perturbations [0.0] 本研究では, 地平線出口から放射支配エポックまで, 軸索の変動モードの進化について検討した。
非調和効果を考慮に入れれば、量子力学的粒子の生成と摂動のスクイーズ化が促進されることが分かる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 21:45:31 GMT)
Analytic thermodynamic properties of the Lieb-Liniger gas [0.0] 本稿では, 1次元ボース気体のリーブ・ライニガー模型の有限温度熱力学量を記述する, 近似解析手法の現状について概説する。
この量子多体理論のパラダイムモデルは、物理学の多くの分野において重要な役割を果たす。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 23:12:21 GMT)
An Adaptive Metaheuristic Framework for Changing Environments [0.0] 本稿では動的環境向けに設計された適応メタヒューリスティックフレームワーク(AMF)を紹介する。
AMFは、問題の動的表現、リアルタイムセンシングシステム、適応技術を組み合わせて、継続的に変化する最適化環境をナビゲートする。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 13:47:53 GMT)
Algebras of Interaction and Cooperation [0.0] 協調と相互作用の系は代数の乗法構造を持つベクトル空間で表される。
自然数の基本的な解釈は自然代数学をもたらし、協調と相互作用に関する統一的な見解を与える。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 08:01:43 GMT)
Advancing Applications of Satellite Photogrammetry: Novel Approaches for Built-up Area Modeling and Natural Environment Monitoring using Stereo/Multi-view Satellite Image-derived 3D Data [0.0] この論文は、ステレオおよびマルチビュー衛星画像から得られた3次元地理空間データに基づく、いくつかの新しいアプローチを探求する。
衛星由来の3Dデータによる空間的・時間的課題に対処する新しいアプローチの4つの部分を紹介する。
概して、この論文は、都市や環境問題に対処する衛星フォトグラムの応用の可能性を示している。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 20:02:52 GMT)
Actions francophones autour des normes e-learning à l'ISO [0.0] e-Learningの将来は、ICT標準化国際インスタンス内で構築される予定だ。
教育技術の標準化に責任を負うISOのサブミッション36は、間違いなく最も目立ったものである。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 12:29:30 GMT)
Abnormal solutions of Bethe--Salpeter equation with massless and massive exchanges [0.0] We present the main properties of the so called ''abnormal solutions' of the Wick-Cutkosky model。
これらの解は、非常に小さな結合エネルギーを持つにもかかわらず、非相対論的極限には存在しない。
我々は、タキオン状態によってモデルを損なうことなく、そのような特異な解を得ることができる条件を決定する。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 13:41:14 GMT)
A relation between Krylov and Nielsen complexity [0.0] クリロフ複雑性とニールセン複雑性は量子進化複雑性の定量化に成功している。
2つの量の間に関係があることが示される。
すなわち、状態進化のクリロフ複雑性の時間平均は、ある行列のトレースとして表すことができる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:34:05 GMT)
A new dataset for measuring the performance of blood vessel segmentation methods under distribution shifts [0.0] VessMAPは、より大きな非注釈データセットから関連画像を慎重にサンプリングして取得した異種血管セグメンテーションデータセットである。
ベースデータセットから原型と非典型の両方を選択する手法を開発した。
新しいデータセットの可能性を示すために、ニューラルネットワークの検証性能は、ネットワークのトレーニングに使用する分割によって大きく変化することを示す。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 15:50:37 GMT)
A multi particle toy system with analytic solutions to investigate composite bosons in a harmonic potential [0.0] 2種類のフェルミオンが複合ボソンを形成する3次元玩具システムを構築した。
基底関数は内部および外部ガウス関数から構成される。
内部ガウス関数では、複合ボソンはフェルミオン的非有界な振る舞いからボゾン的有界な振る舞いへと調整することができる。
論文参考訳(メタデータ) (Thu, 18 Apr 2024 18:39:04 GMT)
A Large-Scale Exploration of $μ$-Transfer [0.0] この$mu$-ization(mu$P)は、大規模なニューラルネットワークモデルを構築する際の課題に対する潜在的な解決策を提供する。
明らかな約束にもかかわらず、$mu$Pのスケーリングルールはまだ広く採用されていない。
この研究は、$mu$Pを実証的に調査し、単純な質問に答えることを目的としている:$mu$-Transferは、実際に最適な学習率を得られるか?
論文参考訳(メタデータ) (Thu, 18 Apr 2024 14:56:50 GMT)