-
Deepseek-V2技术报告解读!全网最细!
深度求索Deepseek近日发布了v2版本的模型,沿袭了1月发布的 Deepseek-MoE(混合专家模型)的技术路线,采用大量的小参数专家进行建模,同时在训练和推理上加入了更多的优化。沿袭了一贯的作风,Deepseek对模型(基座和对话对齐版本)进行了...
-
爆火后反转?「一夜干掉MLP」的KAN:其实我也是MLP
多层感知器(MLP),也被称为全连接前馈神经网络,是当今深度学习模型的基础构建块。MLP 的重要性无论怎样强调都不为过,因为它们是机器学习中用于逼近非线性函数的默认方法。 但是最近,来自 MIT 等机构的研究者提出了一种非常有潜力的替代方法 ——KAN。...
-
微调大语言模型的七个步骤
译者 | 布加迪 审校 | 重楼 在最近一年半的时间里,自然语言处理(NLP)领域发生了显著的变化,这主要得益于OpenAI的GPT系列等大语言模型(LLM)的兴起。 这些功能强大的模型已彻底改变了我们处理自然语言任务的方法,在翻译、情绪分析和文本自动...
-
小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具
语言,不仅仅是文字的堆砌,更是表情包的狂欢,是梗的海洋,是键盘侠的战场(嗯?哪里不对)。 语言如何塑造我们的社会行为? 我们的社会结构又是如何在不断的言语交流中演变的? 近期,来自复旦大学和小红书的研究者们通过引入一种名为AgentGroupChat的...
-
MindSpore强化学习:使用PPO配合环境HalfCheetah-v2进行训练
本文分享自华为云社区《MindSpore强化学习:使用PPO配合环境HalfCheetah-v2进行训练》,作者: irrational。 半猎豹(Half Cheetah)是一个基于MuJoCo的强化学习环境,由P. Wawrzyński在“A Cat...
-
LLM和RAG技术的比较探索
作者 | Ashok Gorantla 整理 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 在人工智能(AI)的动态环境中,两种开创性的技术——大型语言模型(LLM)和检索增强生成(RAG)——在理解和生成类人文本方面脱颖而出。本...
-
深入理解并掌握 Spring AI 与 Open AI 的使用方法
Spring AI,作为行业领导者,通过其强大、灵活的API和先进的功能,为各种行业提供了颠覆性的解决方案。在本专题中,我们将深入探讨Spring AI在各领域的应用示例。每个案例都将展示Spring AI如何满足特定需求,实现目标,并将这些LESSON...
-
利用Spring Boot以及Spring AI构建生成式人工智能应用
Spring AI,作为行业领导者,通过其强大、灵活的API和先进的功能,为各种行业提供了颠覆性的解决方案。在本专题中,我们将深入探讨Spring AI在各领域的应用示例,每个案例都将展示Spring AI如何满足特定需求,实现目标,并将这些LESSON...
-
人工智能的十大局限性
在技术创新领域,人工智能(AI 是我们这个时代最具变革性和前景的发展之一。人工智能凭借其分析大量数据、从模式中学习并做出智能决策的能力,已经彻底改变了从医疗保健和金融到交通和娱乐等众多行业。然而,在取得显著进步的同时,人工智能也面临着阻碍其充分发挥潜力的...
-
洞察全球人工智能芯片竞赛
在当代技术领域,人工智能(AI 已经成为一股变革力量,渗透到现代生活的各个方面。从虚拟助手到自动驾驶汽车,人工智能应用依赖于专门的硬件来增强其计算能力。推动人工智能技术进步的关键组件之一是人工智能芯片的开发,也被称为人工智能加速器或神经处理单元(NPU...
-
如何基于香橙派AIpro对视频/图像数据进行预处理
本文分享自华为云社区《如何基于香橙派AIpro对视频/图像数据进行预处理》,作者: 昇腾CANN。 受网络结构和训练方式等因素的影响,绝大多数神经网络模型对输入数据都有格式上的限制。在计算机视觉领域,这个限制大多体现在图像的尺寸、色域、归一化参数等。如果...
-
基于香橙派AIpro将开源框架模型转换为昇腾模型
本文分享自华为云社区《如何基于香橙派AIpro将开源框架模型转换为昇腾模型》,作者:昇腾CANN。 在前面的介绍中,我们知道了如何基于香橙派AIpro开发AI推理应用,也大致了解到在推理之前,需要把原始网络模型 (可能是 PyTorch 的、Tensor...
-
轨迹预测系列 | HiVT之进化版QCNet到底讲了啥?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 HiVT的进化版(不先看HiVT也能直接读这篇),性能和效率上大幅提升。 文章也很容易阅读。 【轨迹预测系列】【笔记】HiVT: Hierarchical Vector Transformer for...
-
Next ’24 - 踏上云端新旅程
作者 | Google Cloud CEO, Thomas Kurian 去年,全世界才开始想象生成式 AI 将为企业带来怎样的转变,如今这些转变正在逐步展开。 而 Google 一直遵循着相同的原则:打造人人都能受益的 AI 技术,尽力为更多人带来更...
-
【探索AI】人人都在讲AIGC,什么是AIGC?
AIGC 概述 示例展示 我们日常用到的一些工具/应用 核心技术介绍 核心技术的算法解析 案例及部分代码实现 1. 艺术作品 2. 设计项目 3. 影视特效 4. 广告创意 总结 一张图先了解下: 概述 "人工智能生成创造...
-
谷歌向微软英特尔全面宣战:首款自研Arm CPU,最强大模型公测,AI视频对垒Sora
昨晚的Google Cloud Next2024大会上,谷歌接连放出一堆模型和产品王炸:Gemini1.5Pro公开可用、上线音频处理能力;代码模型CodeGemma上新,首款自研Arm处理器Axion正式向微软和亚马逊宣战……这次,谷歌要以量取胜。 昨天...
-
谷歌向微软英特尔全面宣战!首款自研Arm CPU,最强大模型公测,AI视频对垒Sora
昨天的谷歌Next大会可是太精彩了,谷歌一连放出不少炸弹。 - 升级「视频版」Imagen 2.0,下场AI视频模型大混战 - 发布时被Sora光环掩盖的Gemini 1.5 Pro,正式开放 - 首款Arm架构CPU发布,全面对垒微软/亚马逊/英伟达/...
-
JAVA项目接入百度文心一言文本对话功能
依赖 <dependency> <groupId>com.squareup.okhttp3</groupId> <artifactId>okh...
-
Ascend C 自定义PRelu算子
本文分享自华为云社区《Ascend C 自定义PRelu算子》,作者: jackwangcumt。 1 PRelu算子概述 PReLU是 Parametric Rectified Linear Unit的缩写,首次由何凯明团队提出,和LeakyRe...
-
完整指南:如何使用 Stable Diffusion API
Stable Diffusion 是一个先进的深度学习模型,用于创造和修改图像。这个模型能够基于文本描述来生成图像,让机器理解和实现用户的创意。使用这项技术的关键在于掌握其 API,通过编程来操控图像生成的过程。 在探索 Stable Diffusion...
-
Ascend C 自定义算子 Kernel Launch调用入门
本文分享自华为云社区《Ascend C 自定义算子 Kernel Launch调用入门》,作者: jackwangcumt。 1 Kernel Launch概述 根据官方说明文档的介绍,Ascend C对外开放核函数的基础调用(Kernel Lau...
-
深度学习与AIGC:未来的智能生活
1.背景介绍 深度学习和人工智能生成(AIGC 是当今最热门的研究领域之一,它们在各个领域的应用都取得了显著的成果。深度学习是一种通过神经网络模拟人类大脑工作方式的机器学习方法,它已经在图像识别、自然语言处理、语音识别等领域取得了显著的成果。而人...
-
标题:探索AI绘画:使用深度学习生成艺术
正文: 随着计算机技术的发展,人工智能在各个领域取得了显著的成果。 通过训练深度学习模型,AI可以学习大量的艺术作品,从而生成具有独特风格和创意的新作品。 本文将介绍如何使用Python和TensorFlow实现一个简单的AI绘画程序。...
-
[NLP]使用Alpaca-Lora基于llama模型进行微调教程
Stanford Alpaca 是在 LLaMA 整个模型上微调,即对预训练模型中的所有参数都进行微调(full fine-tuning)。但该方法对于硬件成本要求仍然偏高且训练低效。 [NLP]理解大型语言模型高效微调(PEFT 因此, Alpac...
-
玩转大模型!用Replicate一键部署
Replicate是一个云端的机器学习模型运行平台。它可以让用户使用云端API 直接运行机器学习模型,而无需了解复杂的机器学习模型内部构造。 Replicate允许用户在Python或Jupyter Notebook中运行模型,并在云端进行模型的部...
-
【热门话题】Stable Diffusion:本地部署教程
?个人主页: 鑫宝Code?热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ?个人格言: "如无必要,勿增实体" 文章目录 Stable Diffusion:本地部署教程 一、引言 二、环境准备 1...
-
无需服务器!浏览器上直接运行近 700 个 AI 模型!
本文阿宝哥将介绍 Github 上一个超强的开源项目 —— transformers.js[1]。有了它,你可以直接在浏览器中运行 Transformers,无需服务器! 利用它提供的超能力,你可以在浏览器上直接运行不同的 AI 模型,实现很多非常有用的...
-
AIGC之gradio系列学习教程(二)Components
简述: 让我们继续了解一下 Gradio 的一些主要功能。本指南旨在对构建演示时应注意的各种事项进行高级概述。 Components Gradio 包含 30 多个预构建组件(以及许多用户构建的自定义组件),只需一行代码即可在演示中用...
-
JS 的 AI 时代来了!
JS-Torch 简介 JS-Torch[1] 是一个从零开始构建的深度学习 JavaScript 库,其语法与 PyTorch[2] 非常接近。它包含一个功能齐全的张量对象(可跟踪梯度)、深度学习层和函数,以及一个自动微分引擎。 图片 PyTorch...
-
Llama提速500%!谷歌美女程序员手搓矩阵乘法内核
谷歌的美女程序员,将Llama的推理速度提高了500%! 近日,天才程序员Justine Tunney发推表示自己更新了Llamafile的代码, 图片 她重写了84个新的矩阵乘法内核,使得Llamafile可以更快地读取提示和图像。 与llama.cp...
-
超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 在大模型落地应用的过程中,端侧 AI 是非常重要的一个方向。 近日,斯坦福大学研究人员推出的 Octopus v2 火了,受到了开发者社...
-
AI语音识别工具Universal-1:38秒可以处理60分钟音频 比fast Whisper更快
AssemblyAI 最新研究成果展示了他们的 Universal-1模型在多语言环境中的表现,该模型在准确性和鲁棒性方面均取得了行业领先地位。先说结果,Universal-1比Whisper Large-v3更准确,比fast Whisper更快,38秒...
-
人工智能与半导体:共生关系
人工智能(AI 和半导体已经形成了一种共生关系,相互推动彼此的成长和进化。 人工智能前所未有的计算需求推动了更强大、更专业的半导体技术的发展,而半导体制造的进步使越来越复杂的人工智能系统得以创建。 人工智能对半导体的影响 人工智能的兴起迎来了计算需求的...
-
小白也能微调大模型:LLaMA-Factory使用心得
大模型火了之后,相信不少人都在尝试将预训练大模型应用到自己的场景上,希望得到一个垂类专家,而不是通用大模型。 目前的思路,一是RAG(retrieval augmented generation ,在模型的输入prompt中加入尽可能多的“目标领域”的相...
-
AI语音识别神器Openai Whisper对中文的支持如何?
文章目录 前言 一、资料准备 二、Whisper环境搭建 第一步:安装whisper 第二步:安装ffmpeg 三、Whisper测试 总结 其他相关 前言 语音识别一直以来都是人工智能领域中一个不容忽视的技术,随着大模型时...
-
AI视频风格转换动漫风:Stable Diffusion+TemporalKit
话不多说,直接开干。 基本方法 首先通过 Temporal-Kit 这个插件提取视频中的关键帧图片,然后使用 Stable Diffusion WebUI 重绘关键帧图片,然后再使用 Temporal-Kit 处理转换后的关键帧图片,它会自动补充关键...
-
社交媒体与AIGC:如何改变内容创作与推荐
1.背景介绍 社交媒体平台已经成为现代人们交流、分享和获取信息的重要来源。随着人工智能(AI 和机器学习技术的发展,社交媒体平台也开始广泛地采用这些技术来改善内容创作和推荐。这篇文章将探讨如何将人工智能生成式(AIGC 技术与社交媒体平台结合,从...
-
Stable diffusion下载安装sd-webui-prompt-all-in-one插件
下载地址 prompt-all-in-one https://github.com/Physton/sd-webui-prompt-all-in-one.git Git 手动下载 all-in-one 安装步骤 git clone https...
-
【换模型更简单】如何用 Serverless 一键部署 Stable Diffusion_
作者|寒斜(阿里云智能技术专家) 前文回顾 AI 作画火了,如何用 Serverless 函数计算部署 Stable Diffusion?【自己更换模型】如何用 Serverless 一键部署 Stable Diffusion? 本篇章是阿里云函...
-
【Python实用API】语音转文本-whisper
Whisper安装及使用教程 0.Whisper介绍 1.Whisper安装 1.1 依赖库安装 1.2 Whisper安装 2.Whisper使用 2.1 Whisper基本使用(语音识别) 2.2 Whisper进阶使用 2.2.1...
-
大模型中常用的注意力机制GQA详解以及Pytorch代码实现
分组查询注意力 (Grouped Query Attention 是一种在大型语言模型中的多查询注意力 (MQA 和多头注意力 (MHA 之间进行插值的方法,它的目标是在保持 MQA 速度的同时实现 MHA 的质量。 这篇文章中,我们将解释GQA的...
-
Meta LLaMA 2实操:从零到一搭建顶尖开源大语言模型【超详篇】
前言 本文章由 [jfj] 编写,所有内容均为原创。涉及的软件环境是在nvidia-docker环境进行的,如对docker未了解如何使用的,可以移步上一篇文章nvidia-docker安装详解。 在 nvidia-docker 容器中运行时,Dock...
-
探索使用对比损失的孪生网络进行图像相似性比较
简介 在计算机视觉领域,准确地测量图像相似性是一项关键任务,具有广泛的实际应用。从图像搜索引擎到人脸识别系统和基于内容的推荐系统,有效比较和查找相似图像的能力非常重要。Siamese网络与对比损失结合,为以数据驱动方式学习图像相似性提供了强大的框架。在...
-
ChatGPT实战100例 - (15) 还不会写 Stable Diffusion (SD) 绘画提示词?没关系,ChatGPT帮你搞定
文章目录 ChatGPT实战100例 - (15 还不会写 Stable Diffusion (SD 绘画提示词?没关系,ChatGPT帮你搞定 一、把场景描述转为镜头语言 二、把镜头语言转换为Prompt 三、把Prompt转换为图片...
-
MidJourney制作缩略图的几种方式
背景 使用MidJourney生成图片,如果在prompt上不设置特殊的指令参数,官方默认返回的图片清晰度比较高,尺寸也很大。项目中我们自己会把MidJourney生成的原图保存一份,这样就会存在一个问题,因为MidJourney分辨率很高,占用的空间...
-
采用生成式人工智能系统可能会改变企业的云架构
从数据可用性和安全性到大型语言模型和选择和监控,企业采用生成式人工智能意味着需要重新审视自己的云架构。 所以,很多企业正在重新构建云架构,同时也在开发生成式人工智能系统。那么,这些企业需要做些什么改变?新兴的最佳实践是什么?行业专家表示,在过去的20年...
-
stable-diffusion.cpp 一个文件解决stable diffusion所有环境,不需要python,stable-diffusion.dll动态库C#调用Demo
stable-diffusion.cpp 一个文件解决stable-diffusion所有环境,不需要python,stable-diffusion.dll动态库C#调用Demo 目录 介绍 效果 Text To Image Image To...
-
增强包容性:如何利用Edge ML支持具有特殊需求的个人
译者 | 李睿 审校 | 重楼 科技进步为具有特殊需要的人带来了新的解决方案。边缘机器学习(Edge ML 是一项开创性技术,它使机器学习算法更接近数据源,从而减少延迟,并提高实时处理能力。 本文讨论了Edge ML在解决具有特殊需求的个人所面临的独特...
-
揭秘 ChatGPT:流式输出的神奇原理与 SSE 技术
ChatGPT,作为人工智能领域的佼佼者,以其卓越的自然语言处理能力和广泛的应用场景,赢得了众多用户的青睐。其中,ChatGPT的流式输出功能更是让人印象深刻。那么,ChatGPT是如何实现流式输出的呢?这背后离不开Server-Sent Events(...
-
llama.cpp部署多模态视觉模型到应用实践
一、安装cmake https://cmake.org/ 因为我使用是win10系统cmake版本是3.26.4,请根据自己系统选择版本。 二、下载源码 git clone https://github.com/ggerganov/llam...