gpu 第29页 - AIGC资讯

Jetson Orin安装riva以及llamaspeak，使用 Riva ASR/TTS 与 Llama 进行实时交谈，大语言模型成功运行笔记

NVIDIA 的综合语音 AI 工具包 RIVA 可以处理这种情况。此外，RIVA 可以构建应用程序，在本地设备（如 NVIDIA Jetson）上处理所有这些内容。 RIVA 是一个综合性库，包括：自动语音识别（ASR）文本转语音合成（TT...

生成式AI 2024-01-08 人工智能

1263阅读

Colossal-AI团队开源了SwiftInfer 大模型无限流式输入推理飙升46%

近日，国产开源项目SwiftInfer实现了无限流式输入推理，成功提升了大模型推理性能46%。这是一个重大突破，可以为多轮对话场景提供高效可靠的落地方案。它采用了attention sink注意力机制、窗口注意力优化、KV Cache机制优化等方法，Sw...

生成式AI 2024-01-08 人工智能

868阅读

古风修仙美少女-InsCode Stable Diffusion 美图活动一期

Stable Diffusion 模型在线使用地址： https://inscode.csdn.net/@inscode/Stable-Diffusion点我直接前往大家直接点击上面链接就是，如果自己主页打开，还容易找不到这个模型哦...

生成式AI 2024-01-08 人工智能

1118阅读

Stable Diffusion web UI 安装、启动脚本、常见问题、插件（linux）

Stable Diffusion本身是一个模型，对于大多数想试试的人来说，使用这个web ui版本最合适建议先看完再动手，虽然不难但是有门槛（主要要解决网络问题），如果深入需要会python如果只是想试试的，建议直接下载别人打好的包，自己搭建确实很麻烦20...

人工智能 2024-01-08 人工智能

1548阅读

Stable Diffusion 文生图技术原理

图像生成模型简介图片生成领域来说，有四大主流生成模型：生成对抗模型（GAN）、变分自动编码器（VAE）、流模型（Flow based Model）、扩散模型（Diffusion Model）。从2022年开始，主要爆火的图片生成模型是Diffusi...

人工智能 2024-01-08 人工智能

1964阅读

13个优秀开源语音识别引擎

语音识别（ASR）在人机交互方面发挥着重要的作用，可用于：转录、翻译、听写、语音合成、关键字定位、语音日记、语言增强等场景。语音识别基本过程一般包括：分析音频、音频分解、格式转换、文本匹配，但实际的语音识别系统可能会更复杂，并且可能包括其他步骤和功能组件...

人工智能 2024-01-08 人工智能

1270阅读

在灾难推文分析场景上比较用 LoRA 微调 Roberta、Llama 2 和 Mistral 的过程及表现

引言自然语言处理 (NLP 领域的进展日新月异，你方唱罢我登场。因此，在实际场景中，针对特定的任务，我们经常需要对不同的语言模型进行比较，以寻找最适合的模型。本文主要比较 3 个模型: RoBERTa、Mistral-7B 及 Llama-2...

人工智能 2024-01-08 人工智能

1107阅读

400万token上下文、推理再加速46%！最新开源方案升级MIT成果，推理成本再降低

22倍加速还不够，再来提升46%，而且方法直接开源！这就是开源社区改进MIT爆火项目StreamingLLM的最新成果。 StreamingLLM可以在不牺牲生成效果、推理速度的前提下，实现多轮对话共400万个token，22.2倍推理速度提升。该项...

大数据 2024-01-08 人工智能

946阅读

大模型无限流式输入推理飙升46%！国产开源加速「全家桶」，打破多轮对话长度限制

在大型语言模型（LLM）的世界中，处理多轮对话一直是一个挑战。前不久麻省理工Guangxuan Xiao等人推出的StreamingLLM，能够在不牺牲推理速度和生成效果的前提下，可实现多轮对话总共400万个token的流式输入，22.2倍的推理速度提升...

人工智能 2024-01-08 人工智能

1137阅读

一文速览扩散模型优化过程：从DDPM到条件生成模型Stable Diffusion

文章目录 1、扩散模型简介 - Diffusion Model 2、最简单的扩散模型 - DDPM 前向加噪过程逆向去噪过程训练与推理流程模型优缺点 3、减少扩散模型的采样步骤 - DiffusionGAN 分析高斯分布、采样步长...

人工智能 2024-01-08 人工智能

2498阅读

LLMs之RAG：LangChain-Chatchat(一款中文友好的全流程本地知识库问答应用)的简介(支持 FastChat 接入的ChatGLM-2/LLaMA-2等多款主流LLMs+多款embe

LLMs之RAG：LangChain-Chatchat(一款中文友好的全流程本地知识库问答应用的简介(支持 FastChat 接入的ChatGLM-2/LLaMA-2等多款主流LLMs+多款embedding模型m3e等+多种TextSplitter分词...

人工智能 2024-01-08 人工智能

1583阅读

轻量级模型，重量级性能，TinyLlama、LiteLlama小模型火起来了

当大家都在研究大模型（LLM）参数规模达到百亿甚至千亿级别的同时，小巧且兼具高性能的小模型开始受到研究者的关注。小模型在边缘设备上有着广泛的应用，如智能手机、物联网设备和嵌入式系统，这些边缘设备通常具有有限的计算能力和存储空间，它们无法有效地运行大型语...

AIGC 2024-01-08 人工智能

870阅读

回顾精彩瞬间！IEEE Spectrum盘点2023年度热门AI故事

又是冬日，又到结尾，气温回升了一点，苍茫天地间仍有一些尚未消融的洁白。「雪霁银装素，桔高映琼枝」。不知大家这一年过得怎么样呢？ 2023很可能成为人工智能历史上最狂野、最戏剧性的年份之一。 Spectrum总结了本年度关于AI的最受欢迎的文章，...

AIGC 2024-01-08 人工智能

897阅读

如何在你的电脑上完成whisper的简单部署

如何在你的电脑上完成whisper的简单部署（超详细教程）前言一、显卡驱动、CUDA ToolKit、cuDNN的下载 1. 显卡驱动 2. CUDA ToolKit 3. cuDNN的安装二、windows下安装conda 三、使...

大数据 2024-01-08 人工智能

1665阅读

使用PyTorch实现去噪扩散模型

在深入研究去噪扩散概率模型(DDPM 如何工作的细节之前，让我们先看看生成式人工智能的一些发展，也就是DDPM的一些基础研究。 VAE VAE 采用了编码器、概率潜在空间和解码器。在训练过程中，编码器预测每个图像的均值和方差。然后从高斯分布中对这些值进...

人工智能 2024-01-08 人工智能

857阅读

Stable-Diffusion和ControlNet插件安装全过程,以及使用心得汇总.

Stable-Diffusion的安装我采用的是YouTuBe视频的 <<How to Install & Use Stable Diffusion on Windows>> 需要魔法上网...

人工智能 2024-01-08 人工智能

973阅读

本地部署Stable Diffusion教程，亲测可以安装成功

系列文章目录 Stable Diffusion界面参数及模型使用谷歌Colab云端部署Stable Diffusion 进行绘图文章目录系列文章目录前言一、Stable Diffusion是什么？二、安装前的准备 1...

人工智能 2024-01-08 人工智能

1567阅读

深入浅出讲解Stable Diffusion原理，新手也能看明白

说明最近一段时间对多模态很感兴趣，尤其是Stable Diffusion，安装了环境，圆了自己艺术家的梦想。看了这方面的一些论文，也给人讲过一些这方面的原理，写了一些文章，具体可以参考我的文章：北方的郎：图文匹配：Clip模型介绍北方的郎：VQ...

人工智能 2024-01-08 人工智能

862阅读

Meta最新模型LLaMA详解（含部署+论文）

来源：投稿作者：毛华庆编辑：学姐前言本课程来自深度之眼《大模型——前沿论文带读训练营》公开课，部分截图来自课程视频。文章标题：LLaMA: Open and Efficient Foundation Language Mode...

大数据 2024-01-08 人工智能

1020阅读

持续进化，快速转录，Faster-Whisper对视频进行双语字幕转录实践(Python3.10)

Faster-Whisper是Whisper开源后的第三方进化版本，它对原始的 Whisper 模型结构进行了改进和优化。这包括减少模型的层数、减少参数量、简化模型结构等，从而减少了计算量和内存消耗，提高了推理速度，与此同时，Faster-Whisper也...

人工智能 2024-01-08 人工智能

921阅读

【AI实战】llama.cpp量化cuBLAS编译；nvcc fatal:Value ‘native‘ is not defined for option ‘gpu-architecture‘

【AI实战】llama.cpp量化cuBLAS编译；nvcc fatal:Value 'native' is not defined for option 'gpu-architecture' llama.cpp量化介绍 llama.cpp 编...

人工智能 2024-01-08 人工智能

1077阅读

【stable diffusion LORA训练】改进lora-scripts，命令行方式训练LORA，支持SDXL训练

分享下自己改进的一个lora训练脚本，在ubuntu下如果SD-WEBUI的环境已经搭好的话，只需要下载lora-script就可以支持训练了，直接命令行方式训练。首先，我们需要克隆下项目： git clone https://github.com/...

生成式AI 2024-01-08 人工智能

2387阅读

十个值得收藏的AI人工智能网站（AI绘画、AI插件）

1、伯乐 AI 伯乐 AI（https://ai.bleai.cn）是一种基于文心大模型的知识增强大语言模型，专注于自然语言处理（NLP）领域的技术研发。它具备强大的语义理解和生成能力，能够处理各种复杂的自然语言任务。伯乐 AI在NLP领域有着广泛的应用...

大数据 2024-01-08 人工智能

1661阅读

【AI工具】-Stable Diffusion本地化部署教程

前言今天我们要介绍的是时下最流行的AI绘图软件Stable Diffusion，虽然Diffusion.ai已经开放api，但是长时间的商业化调用我们需要购买很多的金币。所以我们需要找一个平替的AI绘图平台，现在主流市场中AI绘图软件主要就是Open...

人工智能 2024-01-08 人工智能

1256阅读

使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion

使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion 0. 前言 1. Amazon SageMaker 与机器学习 1.1 机器学习流程 1.2 Amazon SageMaker 简介 1.3 Amaz...

生成式AI 2024-01-07 人工智能

1086阅读

AI绘画：Lora模型训练完整流程！

关于AI绘画(基于Stable Diffusion Webui ，我之前已经写过三篇文章，分别是软件安装，基本的使用方法，微调模型LoRA的使用。整体来说还是比简单的，搞个别人的模型，搞个提示词就出图了。今天来一个有些难度的，自己训练一个LoRA微...

AIGC 2024-01-07 人工智能

2039阅读

[玩转AIGC]如何训练LLaMA2（模型训练、推理、代码讲解，并附可直接运行的kaggle连接）

目录一、clone仓库二、数据集下载与处理 1、数据集下载 2、数据集标记化（耗时较长）三、修改配置四、开始训练五、模型推理六、train.py训练代码讲解 1、导包 2、定义模型训练参数与相关设置 3、加载模型配置 4、迭代...

AIGC 2024-01-07 人工智能

1164阅读

20分钟，使用Amazon SageMaker快速搭建属于自己的AIGC应用

真火！作为最近一段时间人工智能领域内的顶流之一，AIGC（AI-Generated Content）早已火爆出圈，频登各大互联网平台热搜。 cite: 微软亚洲研究院官方微博这段时间以来，基于深度学习的内容生成在图像、视频、语音、音乐、...

大数据 2024-01-07 人工智能

825阅读

万字长文谈自动驾驶BEV感知

本文经自动驾驶之心公众号授权转载，转载请联系出处。 prologue 这有可能是更的最长的文章系列了，先说为什么，一方面是看到分割大模型对小模型的提升效果需要时间，另一方面是之前对自动驾驶的BEV算法做了很长时间的预研，自己也应该好好梳理一下了。（很...

生成式AI 2024-01-07 人工智能

1132阅读

如何在亚马逊 SageMaker 进行 Stable Diffusion 模型在线服务部署

文章目录前言 - 浅谈 AIGC AIGC - 引领人工智能走向春天春天里盛开的 AI 绘画 AI 绘画之Stable Diffusion 2.0 登场人人都有机会成为前沿的技术探索者基于Amazon SageMaker进行Stab...

大数据 2024-01-06 人工智能

986阅读

AIGC（生成式AI）试用 6 -- 从简单到复杂

从简单到复杂，这样的一个用例该如何设计？之前浅尝试用，每次尝试也都是由浅至深、由简单到复杂。一点点的“喂”给生成式AI主题，以测试和验证生成式AI的反馈。 AIGC（生成式AI）试用 1 -- 基本文本_Rolei_...

AIGC 2024-01-06 人工智能

943阅读

AI 作画火了，如何用 Serverless 函数计算部署 Stable Diffusion?

作者：寒斜立即体验基于函数计算部署 Stable Diffusion： https://developer.aliyun.com/topic/aigc AIGC 领域目前大火，除了 Chatgpt，在文生图领域 Stable Diffusion...

AIGC 2024-01-06 人工智能

840阅读

一个评测模型+10个问题，摸清盘古、通义千问、文心一言、ChatGPT的“家底”！...

‍数据智能产业创新服务媒体 ——聚焦数智 · 改变商业毫无疑问，全球已经在进行大模型的军备竞赛了，“有头有脸”的科技巨头都不会缺席。昨天阿里巴巴内测了通义千问，今天华为公布了盘古大模型的最新进展。不久前百度公布了文心一言...

生成式AI 2024-01-06 人工智能

965阅读

精调训练中文LLaMA模型实战教程，民间羊驼模型

羊驼实战系列索引博文1：本地部署中文LLaMA模型实战教程，民间羊驼模型博文2：本地训练中文LLaMA模型实战教程，民间羊驼模型博文3：精调训练中文LLaMA模型实战教程，民间羊驼模型（本博客）简介在学习完上篇【博文2：本地训练中文LLaM...

大数据 2024-01-06 人工智能

861阅读

stable diffusion硬件要求

硬件要求# 内存# 建议使用不少于 16 GB 内存。在一些情况下，可能需要调高虚拟内存，以容纳模型文件。存储# 建议准备 40 GB 以上的可用硬盘空间。显卡# WARNING 注意显卡温度，有报道称显卡太热炸了。显卡型号#...

AIGC 2024-01-06 人工智能

1852阅读

AI绘画部署-Stable Diffusion（huggingface API图片生成初体验）

引言最近，在很多地方都看到了各个大佬用AI生成的神图，索性从网上搜集资料部署一下体验一下AI绘画的魅力。本文基于huggingface API在colab上构建AI绘画。使用步骤 1.huggingface原始环境地址 https://c...

生成式AI 2024-01-06 人工智能

1248阅读

使用 OpenLLM 构建和部署大模型应用

本次分享主题为：使用 OpenLLM 快速构建和部署大语言模型的应用。OpenLLM 是一个开源的大语言模型（LLM）开发框架。它支持多种开源的 LLM 模型，并且具有内建的两个关键的 LLM 优化，能够优化内存使用。此外，它与 LangChain 和...

生成式AI 2024-01-05 人工智能

1313阅读

高通发布XR2 Gen 2芯片：支持单眼4.3K AI性能提升8倍

快科技1月4日消息，高通发布应用于混合现实（MR）头戴设备的第二代骁龙XR2 平台高通XR2 Gen 2。据了解，该平台采用单芯片架构，支持90FPS的4.3K显示分辨率的空间计算，远超此前XR2 Gen 2的单眼3K分辨率。可渲染媲美苹果Visio...

生成式AI 2024-01-05 人工智能

898阅读

开源语音识别faster-whisper部署教程

1. 资源下载源码地址模型下载地址： large-v3模型：https://huggingface.co/Systran/faster-whisper-large-v3/tree/main large-v2模型：https://huggingf...

生成式AI 2024-01-05 人工智能

1885阅读

腾讯云 Serverless Stable Diffusion 应用免费名额限量放送，试用申请开启！

近半年，AIGC 领域惊喜接踵而至。除了 Chatgpt，在AI绘图方面 Stable Diffusion 也大放异彩。网上的教程五花八门，有很多小伙伴根本不知如何下手，苦不堪言。现在腾讯云 Serverless Stable Diffusion 应用...

生成式AI 2024-01-04 人工智能

857阅读

[论文笔记] 大模型gpu机器推理测速踩坑 (llama/gpt类)

cpu没报错，换gpu就报错。以下是一些踩坑：坑1：要指定gpu，可以在import torch之前指定gpu。 model = LlamaForCausalLM.from_pretrained(model_path, trust_remote_co...

大数据 2024-01-04 人工智能

1669阅读

斯坦福炒虾机器人爆火全网！华人团队成本22万元，能做满汉全席还会洗碗

今天，会做一大桌子菜的斯坦福机器人Mobile ALOHA刷屏全网。滑蛋虾仁、干贝烧鸡、蚝油生菜，色香味俱全，看着很诱人。就拿滑蛋虾仁这道菜来说，Mobile ALOHA在烧水的过程中先打上3颗鸡蛋，然后把虾仁放到水中焯熟，平底锅倒入鸡蛋液再加入...

AIGC 2024-01-04 人工智能

857阅读

【2024版】最新保姆级stable diffusion安装教程，小白直接点！一键安装，永久使用，stable diffusion下载安装教程！

关于现在非常红火的AI绘画，很多感兴趣的人不知道如何入手，如果你的电脑配置足够好，那么不要犹豫，让我来教你如何在本地电脑全免费运行当下最强大的AI绘画工具——Stable Diffusion 吧！所以本期给大家带来了全新Stable Diffusion 保...

生成式AI 2024-01-04 人工智能

1087阅读

Stable Diffusion 安装教程(详细)

引言如果你只想简单尝试一下，仅仅图一乐，可以通过网页在线体验Stable Diffusion，可以今日免费的网站进行使用（https://stablediffusionweb.com/），只是功能不如本地的多。本地部署安装Stable Diffus...

大数据 2024-01-04 人工智能

1372阅读

[linux-sd-webui]api化之训练lora

lora的训练使用的文件是https://github.com/Akegarasu/lora-scripts lora训练是需要成对的文本图像对的，需要准备相应的训练数据。 1.训练数据准备使用deepbooru/blip生成训练数据，建筑类建议使...

AIGC 2024-01-04 人工智能

1036阅读

文心一言: 中国科技 “元实力” 的一次喷发

它没有摧毁，它改变了一切，它制造了一些新的东西。目录勇气与厚积薄发的信心 “元实力”的一次喷发为创新加油，让未来可期获取源码？私信？关注？点赞？收藏？用“不完美小孩”，形容目前的百度文心一言，...

AIGC 2024-01-04 人工智能

861阅读

量子计算如何改变人工智能

量子计算和人工智能是当今时代最具颠覆性的两项技术。这两种技术开始以有趣的方式融合。例如，量子计算机可以比传统计算机更快、更有效地训练人工智能模型，从而开发出更强大、更智能的人工智能系统。量子算法对图形处理单元(GPU 硬件表现出天然的亲和力，因为它们能...

AIGC 2024-01-03 人工智能

857阅读

AI声音克隆软件app免费使用地址 Clone-Voice体验入口

Clone-Voice 是一款具有Web界面的先进声音克隆工具，它可以使用任何人类音色，将文字转换为使用该音色的声音，或者将一个声音转换成另一个声音。Clone-Voice支持中文、英语、日语、韩语、法语、德语、意大利语等 16 种语言，且用户可以在线从麦...

AIGC 2024-01-03 人工智能

1579阅读

基于whisper和whisperx的语音视频和字幕对齐

环境的安装创建py310虚拟环境，需要安装Anaconda的Python环境。 Python初学者在不同系统上安装Python的保姆级指引 Win10+Python3.9+GPU版pytorch环境搭建最简流程 Python虚拟环境的安装和使用...

大数据 2024-01-03 人工智能

836阅读

保姆级教程：从0到1使用Stable Diffusion XL训练LoRA模型 |【人人都是算法专家】

Rocky Ding 公众号：WeThinkIn 写在前面【人人都是算法专家】栏目专注于分享Rocky在AI行业中对业务/竞赛/研究/产品维度的思考与感悟。欢迎大家一起交流学习? 大家好...

生成式AI 2024-01-03 人工智能

1280阅读