-
Stable Diffusion背后原理(Latent Diffusion Models)
前言 2023年第一篇博客,大家新年好呀~ 这次来关注一下Stable Diffusion背后的原理,即 High-Resolution Image Synthesis with Latent Diffusion Models 这篇论文。 之前关注的...
-
CounterPoint:预计PC制造商将在2024年发布新的AI驱动的PC
全球个人电脑 (PC 市场在经历连续八个季度的下滑后,终于在 2023 年第四季度迎来一丝曙光。虽然出货量同比仍旧下降了 0.2%,但这标志着跌幅减缓,为未来复苏带来了希望。 图源备注:图片由AI生成,图片授权服务商Midjourney Counte...
-
GPU+生成式人工智能助力提升时空数据分析
译者 | 朱先忠 审校 | 重楼 摘要:通过实战案例介绍,本文指出随着基于GPU加速的数据库技术为时间序列和空间数据带来更好的性能和精度水平,生成式人工智能技术将使得非领域专家也能够进行复杂的时空数据处理。 引言 时空数据来自手机、气候传感器、金融市场交...
-
diffusers加速文生图速度;stable-diffusion、PixArt-α
参考: https://pytorch.org/blog/accelerating-generative-ai-3/ https://colab.research.google.com/drive/1jZ5UZXk7tcpTfVwnX33dDuefNMcn...
-
llama.cpp模型推理之界面篇
目录 前言 一、llama.cpp 目录结构 二、llama.cpp 之 server 学习 1. 介绍 2. 编译部署 3. 启动服务 4、扩展或构建其他的 Web 前端 5、其他 前言 在《基于llama.cpp学习开源LL...
-
ai绘画 ai模型对显卡的要求
AI是由很多层计算组成的,每一层计算都无差别地计算所有的节点,甚至是对所有的节点的排列组合。由于没有局部性,运行内存需要能够放得下一整个模型至少一层的运算量。如果运行内存不够大,就得把运算好的数据存储起来,放在外存,然后在外存读出没有运算的数据继续算,那这...
-
小扎All in 开源AGI:正训练Llama 3,年底将有35万块H100
小扎宣布新目标:All in 开源AGI。 不错,小扎又All in了,正是OpenAI谷歌必争之地。 不过在AGI之前,着重强调了是Open Sourse(开源)的。 图片 此举受到不少好评,一如此前LIama系列大模型开源之时。 图片 图片 不过此次...
-
小扎砸数百亿美元猛攻开源AGI!狂掷60万块H100,爆50倍GPT-4算力
【新智元导读】今天,小扎正式宣战「开源AGI」!下一代大模型Llama3正在训练,年底将拥有35万块H100,届时算力总和达60万块H100。为了追赶OpenAI,成立十年的FAIR团队纳入GenAI,全力奔赴AGI。 自Llama2、Code Llama...
-
视觉Mamba来了:速度提升2.8倍,内存能省87%
号称「全面包围 Transformer」的 Mamba,推出不到两个月就有了高性能的视觉版。 本周四,来自华中科技大学、地平线、智源人工智能研究院等机构的研究者提出了 Vision Mamba(Vim)。 论文地址:https://arxiv.or...
-
吞吐量提升5倍,联合设计后端系统和前端语言的LLM接口来了
大型语言模型 (LLM 越来越多地用于需要多个链式生成调用、高级 prompt 技术、控制流以及与外部环境交互的复杂任务。然而,用于编程和执行这些应用程序的现有高效系统存在着明显的缺陷。 现在,开源社区的研究者们面向 LLM 提出了一种结构化生成语言(...
-
大型语言模型中最大的瓶颈:速率限制
作者 | Matt Asay策划 | 言征 速率限制意味着每个人都在等待更好的计算资源或不同的生成人工智能模型。 大型语言模型(LLM),如OpenAI的GPT-4和Anthropic的Claude 2,凭借其生成类人文本的能力,吸引了公众的想象力。...
-
2024年AI PC“乱花迷人眼”,企业和消费者到底该如何选择?
在日前举办的CES 2024大会上,AI PC(人工智能电脑)的概念和产品随处可见。 英特尔、AMD、英伟达和高通等公司都在会上宣传,自家的PC在运行AI任务方面有多么出色。微软更是说,2024年将是“AI驱动的Windows电脑元年”。 那么,AI...
-
GPU库存将到60万个!扎克伯格确认新目标:创建通用人工智能
1月19日消息,在科技领域,一股热潮正席卷而来,它源于一种坚定的信念,即科技行业正迈向实现超人、神级智能的道路上。引领这股潮流的旗手包括OpenAI,他们宣称要创造出这种通用人工智能(AGI)。而谷歌人工智能项目负责人杰米斯·哈萨比斯(Demis Ha...
-
WidthFormer:实时自动驾驶!助力基于Transformer的BEV方案量产
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&行业理解 基于BEV的transformer方案今年量产的主要方案,transformer结构和CNN相比,特征提取能力更强,但需要较多的算力,这也是为什么许多车上都是1~2颗orin...
-
手把手教你Midjourney|入门·订阅管理套餐
大家好,这里是Dennis的AI说,上一期是教大家如何注册一个账号,那么今天的教程教是教会大家如何在Midjourney上购买套餐以及后续的退订步骤。 Midjourney里购买套餐主要是针对于后续的做图时间速度,不同套餐生成图片的速度是不一样的。 如...
-
新一代注意力机制Lightning Attention-2:无限序列长度、恒定算力开销、更高建模精度
大语言模型序列长度的限制,极大地制约了其在人工智能领域的应用,比如多轮对话、长文本理解、多模态数据的处理与生成等。造成这一限制的根本原因在于当前大语言模型均采用的 Transformer 架构有着相对于序列长度的二次计算复杂度。这意味着随着序列长度的增加...
-
Stability AI发布全新代码模型Stable Code 3B,媲美70亿Code Llama,没GPU也能跑
今天,Stability AI发布了自家在2024年的第一个模型——Stable Code3B。 顾名思义,Stable Code3B专注于代码能力,实际的表现也是非常亮眼。 在仅仅3B参数的规模之下,达到了比肩Code Llama7B的效果。 相...
-
Stable Diffusion with Diffusers 学习笔记: 原理+完整pipeline代码
文章目录 01 使用 02 Stable Diffusion 的工作原理 The autoencoder (VAE The U-Net The Text-encoder Latent Diffusion 又快又高效的原因 Stable Di...
-
一文读懂大型语言模型参数高效微调:Prefix Tuning与LLaMA-Adapter
芝士AI吃鱼 在快速发展的人工智能领域中,高效、有效地使用大型语言模型变得日益重要,参数高效微调是这一追求的前沿技术,它允许研究人员和实践者在最小化计算和资源占用的同时,重复使用预训练模型。这还使我们能够在更广泛的硬件范围内训练...
-
使用 Transformers 为多语种语音识别任务微调 Whisper 模型
本文提供了一个使用 Hugging Face 🤗 Transformers 在任意多语种语音识别 (ASR 数据集上微调 Whisper 的分步指南。同时,我们还深入解释了 Whisper 模型、Common Voice 数据集以及微调等理论知识,...
-
AIGC内容分享(十二):AIGC探索之旅AIGC探索之旅
目录 前言 引言:AI时代,未来已来 AIGC简介与发展历程 早期萌芽阶段(1950s-1990s) 沉淀积累阶段(1990s-2010s) 快速发展阶段(2010s至今) 大模型与AIGC的关联 大模型概述 大模型的定义和特点 典型大...
-
【Stable diffusion inpaiting】训练自己数据集
https://github.com/advimman/lama/tree/7dee0e4a3cf5f73f86a820674bf471454f52b74f prepare your data: 1 Create masks named as `[...
-
基于 PAI-EAS 一键部署 Stable Diffusion AIGC 绘画
人工智能平台PAI完成云上Stable Diffusion以文生图应用搭建,支持两种方式: 使用交互式建模 PAI-DSW 使用模型在线服务 PAI-EAS 两种部署适用人群: 1.使用交互式建模 PAI-DSW 部署Stable Diffus...
-
【Stable Diffusion XL】huggingface diffusers 官方教程解读
文章目录 01 Tutorial Deconstruct a basic pipeline Deconstruct the Stable Diffusion pipeline Autopipeline Train a diffusion mo...
-
和普通电脑区别在哪:联想公布AI PC五大核心特征
快科技1月17日消息,在今天下午的联想拯救者及消费生态新品发布会上,联想官方公布了AI PC五大核心特征,回答了AI PC和普通电脑到底有何区别的问题。 联想表示,AI PC的第一个核心特征就是本地混合AI算力,拥有CPU GPU NPU本地混合计算架构,...
-
SDXL 1.0出图效果直逼Midjourney!手把手教你快速体验!
介绍 最近,Stability AI正式推出了全新的SDXL 1.0版本。经过我的实际测试,与之前的1.5版本相比,XL的效果有了巨大的提升,可以说是全方位的超越。不仅在理解提示词方面表现出色,而且图片的构图、颜色渲染和画面细腻程度都有了很大的进步,实际...
-
AI视野:Stability AI发布代码模型Stable Code3B;书生·浦语2.0正式开源;阿里推新项目MotionShop;Win11新增AI生成图像功能
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 🤖📈💻💡大模型动态 Stabili...
-
Stability AI发布全新代码模型Stable Code 3B!媲美70亿Code Llama,没GPU也能跑
今天,Stability AI发布了自家在2024年的第一个模型——Stable Code 3B。 图片 顾名思义,Stable Code 3B专注于代码能力,实际的表现也是非常亮眼。 在仅仅3B参数的规模之下,达到了比肩Code Llama 7B的效果...
-
【AIGC】Controlnet:基于扩散模型的文生图的可控性
前言 controlnet可以让stable diffusion的生图变得可控。 文章连接:https://arxiv.org/pdf/2302.05543.pdf 摘要 冻结了stable diffusion的预训练模型并重用它的预训练...
-
Stable Diffusion模型概述
Stable Diffusion 1. Stable Diffusion能做什么? 2. 扩散模型 2.1 正向扩散 2.2 反向扩散 3. 训练如何进行 3.1 反向扩散 3.2 Stable Diffusion模型 3.3 潜在扩散模...
-
语音识别whisper的介绍、安装、错误记录
介绍 Whisper是OpenAI于2022年9月份开源的通用的语音识别模型。它是在各种音频的大型数据集上训练的模型,也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。 论文链接:https://arxiv.org/abs/2212.04...
-
Stability AI发布Stable Code3B填补AI代码生成的空白
在AI领域,Stability AI公司于2024年推出了其首个新型人工智能模型:商业许可的(通过会员资格)Stable Code3B。该模型仅拥有30亿参数,专注于软件开发的代码完成能力,可在没有专用GPU的笔记本上本地运行,并在性能上具有竞争力,可与M...
-
AI绘画指南:在CentOS7中安装Stable Diffusion WebUI
一、安装GPU驱动 1.1 购买云服务器 在腾讯云选购一台GPU型的服务器(最好的境外的,境外的服务器后面关于镜像加速的步骤都可以跳过) 购买成功之后腾讯的站内信会发送初始的密码给你,登录成功后会自动帮我们安装相关的驱动,提示整个过程大概需要20分...
-
Stability AI发布Stable Code 3B模型,没有GPU也能本地运行
在文生图领域大火的 Stability AI,今天宣布了其 2024 年的第一个新 AI 模型:Stable Code 3B。顾名思义,Stable Code 3B 是一个拥有 30 亿参数的模型,专注于辅助代码任务。 无需专用 GPU 即可在笔记本电...
-
基于OpenAI的Whisper构建的高效语音识别模型:faster-whisper
1 faster-whisper介绍 faster-whisper是基于OpenAI的Whisper模型的高效实现,它利用CTranslate2,一个专为Transformer模型设计的快速推理引擎。这种实现不仅提高了语音识别的速度,还优化了内存使用效率...
-
深入浅出解析Stable Diffusion完整核心基础知识 | 【算法兵器谱】
Rocky Ding 公众号:WeThinkIn 最新更新: Rocky也一直在更新Stable Diffusion系列的文章内容,包括最新发布的Stable Diffusion XL。Rocky都进行...
-
文生图Stable-diffusion-webui环境搭建
想自己生成AI美女吗?跟我一起下来搭建Stable-diffusion-v1-5进行文生图、图生图吧。 该webui支持Mac/Linux/Windows环境,这里以windows环境为例。前提是你已经在本机搭建好了GPU运行环境,建议6G以上GPU,...
-
【AIGC】IP-Adapter:文本兼容图像提示适配器,用于文本到图像扩散模型
前言 IPAdapter能够通过图像给Stable Diffusion模型以内容提示,让其生成参考该图像画风,可以免去Lora的训练,达到参考画风人物的生成效果。 摘要 通过文本提示词生成的图像,往往需要设置复杂的提示...
-
Stable Diffusion云服务器部署完整版教程
Stable Diffusion云服务器部署完整版教程 2023年07月04日 22:30 3607浏览 · 18喜欢 · 22评论...
-
Stable Diffusion/Win/本地部署
一、本地部署 Stable Diffusion 前言 目前市面上比较权威,并能用于工作中的AI绘画软件其实就两款。一个叫Midjourney(简称MJ),另一个叫Stable-Diffusion(简称SD)。MJ需要付费使用,而SD开源免费,但是上手难...
-
【stable diffusion原理解读通俗易懂,史诗级万字爆肝长文,喂到你嘴里】
文章目录 一、前言(可跳过) 二、stable diffusion 1.clip 2.diffusion model forward diffusion (前向扩散) 逆向扩散(reverse diffusion) 采样图 阶段小结 3....
-
【AIGC】Midjourney的使用技巧
Midjourney介绍 《Midjourney》是一款2022年3月面世的AI绘画工具,创始人是David Holz。只要输入想到的文字,就能通过人工智能产出相对应的图片,耗时只有大约一分钟。 Midjourney依托于Discord社区平台对外提...
-
stable diffusion实践操作-writing
文章目录 前言 一、优点 1.1、免费开源 1.2、拥有强大的外接模型 二、组成要素 2.1 底模 2.2 风格 2.3 提示词 2.4 参数配置 三、生图原理 四、下载链接 实践正文 一、安装 1.1 电脑硬件配置查看 1.2...
-
本地部署github上的stable diffuion,轻松玩转ai绘画(新手小白也能懂)
你也想自己生成上面这样好看的图片吗?废话不多说,跟着博主,按步骤来,做完你也就可以了,而且无任何限制,懂得都懂!😎 目录 第一步:准备VPN 第二步:安装Python 第三步:安装Pycharm 第四步:安装Git 第五步:注册GitHub账...
-
本地搭建【文档助手】大模型版(LangChain+llama+Streamlit)
概述 本文的文档助手就是:我们上传一个文档,然后在对话框中输入问题,大模型会把问题的答案返回。 安装步骤 先下载代码到本地 LangChain调用llama模型的示例代码:https://github.com/afaqueumer/DocQA(代...
-
AIGC内容分享(十八):AIGC在天猫商品海报生成上的探索
目录 项目背景 目标拆解 方案调研 ▐ 方案一 SD + Outpainting ▐ 方案二 SD Inpainting + Reference Only ▐ 方案三 基于Reference的Diffusion算法 ▐ ...
-
超越BEVFusion!又快又好的极简BEV融合部署方案
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 在算法开发中,激光雷达-相机3D目标检测遇到了过度拟合问题,这是由于违反了一些基本规则。在数据集构建的数据标注方面,本文参考了理论补充,并认为回归任务预测不应涉及来自...
-
使用Gradio搭建Stable Diffusion模型生成图像:简单快捷的图像生成体验
目录 0 开发环境 1 介绍 1.1 Gradio简介 1.2 Stable Diffusion模型简介 2 使用Gradio搭建基本界面 2.1 安装依赖库 2.2 加载预训练模型 2.3 解析返回的数据 2.4 构建图像字幕应用程序...
-
LLaMA的解读与其微调:Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2
前言 近期,除了研究ChatGPT背后的各种技术细节 不断看论文(至少100篇,100篇目录见此:ChatGPT相关技术必读论文100篇 ,还开始研究一系列开源模型(包括各自对应的模型架构、训练方法、训练数据、本地私有化部署、硬件配置要求、微调等细节 ...
-
使用OpenVINO™在算力魔方上加速stable diffusion模型
作者:武卓博士 英特尔AI布道师 刘力 英特尔物联网行业创新大使 什么是stable diffusion模型? Stable Diffusion是stability.ai开源的AI图像生成模型,实现输入文字,生成图像...