-
Stable Diffusion ComfyUI 基础教程 ComfyUI安装与常用插件
前言: 相信大家玩 Stable Diffusion(以下简称SD)都是用的 web UI 操作界面吧,不知道有没有小伙伴听说过 ComfyUI。 ComfyUI 是 一个基于节点流程的 Stable Diffusion 操作界面,可以通过流程,...
-
pipeline-stable-diffusion.py文件逐行解释
本文是对stabled-diffusion的pipeline文件的代码逐行解释。 60-71行 该函数对经过cfg重组出来的noise_pred,再重组。 def rescale_noise_cfg(noise_cfg, noise_pred_t...
-
2024 年 WWDC 上苹果 AI 驱动的 iOS 18 有哪些值得期待的?
苹果全球开发者大会将于下周开幕,这一活动有望成为iPhone制造商历史上的关键时刻。尽管去年的大会上首次亮相了Vision Pro,但今年的WWDC2024主要关注点将不在硬件上,而是集中在软件方面,特别是iOS18的发布。大会将于周一太平洋时间上午10点...
-
AI绘画Stable Diffusion神级插件!sd-forge-layerdiffuse
大家好,我是程序员晓晓 今天给大家介绍一个插件,全名是 sd-forge-layerdiffuse。它的功能很简单,就是可以让 Stable Diffusion 生成带透明通道的PNG图片。 比如一个水瓶。 一只猫。 二次元。 简而言...
-
Llama模型家族训练奖励模型Reward Model技术及代码实战(一)
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
在本地跑一个AI模型(5) - Stable Diffusion
在之前的文章中,我们使用ollama在本地运行了大语言模型,它可以与你聊天,帮助你理解和生成文本内容。使用coqui-tts在本地运行了文本转语音模型,它可以将大语言模型生成的文字转换成语音,让你的应用更有趣。今天我们将要介绍Stable Diffusio...
-
llama-cpp-python安装bug:error: subprocess-exited-。scikit-build-core 0.8.2 using CMake 3.28.3 (wheel)
– llama-cpp-python安装bug:error: subprocess-exited-。scikit-build-core 0.8.2 using CMake 3.28.3 (wheel 环境 系统 linux python 3.1...
-
无需搭建环境,零门槛带你体验Open-Sora文生视频应用
案例体验 ?* 本案例需使用 Pytorch-2.0.1 GPU-V100 及以上规格运行 ?* 点击Run in ModelArts,将会进入到ModelArts CodeLab中,这时需要你登录华为云账号,如果没有账号,则需要...
-
使用Python实现深度学习模型:序列到序列模型(Seq2Seq)
本文分享自华为云社区《使用Python实现深度学习模型:序列到序列模型(Seq2Seq)》,作者: Echo_Wish。 序列到序列(Seq2Seq)模型是一种深度学习模型,广泛应用于机器翻译、文本生成和对话系统等自然语言处理任务。它的核心思想是将一个序...
-
简单4步,带你用华为云MetaStudio制作数字人短片
本文分享自华为云社区《使用MetaStudio生产线四步制作数字人视频》,作者: yd_298097624。 随着AIGC新技术尤其是大模型技术的发展,音视频行业、数字内容生产行业正在经历这从生产方式和生产效率上的一个巨大变化。预测到2030年有AI大模...
-
与AI结对:一位高级开发人员构建插件的历程
作者分享了他使用 ChatGPT 学习 Go、浏览 Kolide API 以及构建一个复杂的 Steampipe 插件的经验。 译自Pairing With AI: A Senior Developer's Journey Building a Plug...
-
清华大学与智谱AI重磅开源 GLM-4:掀起自然语言处理新革命
自 2023 年 3 月 14 日开源 ChatGLM-6B 以来,GLM 系列模型受到了广泛的关注和认可。特别是在 ChatGLM3-6B 开源之后,开发者对智谱 AI 推出的第四代模型充满了期待。而这一期待,随着 GLM-4-9B 的发布,终于得到了...
-
推荐:Lightning Whisper MLX —— 专为Apple Silicon优化的闪电般快速的Whisper实现
推荐:Lightning Whisper MLX —— 专为Apple Silicon优化的闪电般快速的Whisper实现 项目地址:https://gitcode.com/mustafaaljadery/lightning-whisper-mlx 在...
-
LLM | Yuan 2.0-M32:带注意力路由的专家混合模型
图片 一、结论写在前面 Yuan 2.0-M32,其基础架构与Yuan-2.0 2B相似,采用了一个包含32位专家的专家混合架构,其中2位专家处于活跃状态。提出并采用了一种新的路由网络——注意力路由器,以更高效地选择专家,相比采用经典路由网络的模型,其准...
-
利用 NVIDIA Riva 快速部署企业级中文语音 AI 服务并进行优化加速
一、Riva 概览 1. Overview Riva 是 NVIDIA 推出的一款 SDK,用于实时的 Speech AI 服务。它是一个高度可定制的工具,并且使用 GPU 进行加速。NGC 上提供了很多预训练好的模型,这些模型开箱即用,可以直接使用...
-
盘点GPT-4o十大创意玩法!挑水果、看牙片、全自动化炒股,看完格局瞬间打开
自从OpenAI发布GPT-4o以来,“头号AI玩家”每天的状态be like:新语音模式上线了吗? 是的,还没有,但应该快了。 不过,毕竟GPT-4o已经上线半个月多,虽然新语音模式迟迟未来,但这不影响网友们用它整活儿。本期,“头号AI玩家”全方位盘点...
-
LLMs之llama3-from-scratch:llama3-from-scratch(从头开始利用pytorch来实现并解读LLaMA-3模型的每层代码)的简介、核心思路梳理
LLMs之llama3-from-scratch:llama3-from-scratch(从头开始利用pytorch来实现并解读LLaMA-3模型的每层代码 的简介、核心思路梳理 导读:这篇论文实现了transformer网络的llama3模型...
-
【完整指南】如何在Visual Studio Code中轻松运行Llama 3模型?
Meta 发布了最新的开源语言模型Llama 3。因为它是开源的,你可以下载这个模型,并在自己的电脑上运行。 我清楚,你可能会想,在个人笔记本上运行一个拥有80亿参数的AI模型似乎只有技术高手才能做到。但别担心!这篇文章会提供一个简单的步骤指导,帮助每个...
-
Stable Diffusion教程:额外功能/后期处理/高清化
"额外功能"对应的英文单词是Extras,算是直译。但是部分版本中的翻译是“后期处理”或者“高清化”,这都是意译,因为它的主要功能是放大图片、去噪、修脸等对图片的后期处理。注意这里边对图片的处理不是 Stable Diffusion 本身的能力,都是额外扩...
-
Stable Diffusion支持多人排队使用
如果我们想要自己在云服务器上部署Stable Diffusion模型,但是又不想自动扩容造成成本激增,我们可以设计排队使用的模式。stable-diffusion-webui已经很好用了,支持了自定义模型及Lora模型的加载、排队生成、完善的UI和各种插件...
-
ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了
如果说现在什么事能引发全球打工人们同时间大暴走,那应该就是昨夜经历的:AI聊天机器人集体宕机。 美西时间午夜 12 点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。 本以为像平时一样多刷几次就能恢复...
-
大模型到底有没有智能?一篇文章给你讲明明白白
生成式人工智能 (GenAI[1] 和大语言模型 (LLM[2] ,这两个词汇想必已在大家的耳边萦绕多时。它们如惊涛骇浪般席卷了整个科技界,登上了各大新闻头条。ChatGPT,这个神奇的对话助手,也许已成为你形影不离的良师益友。 然而,在这场方兴未艾的...
-
部署基于内存存储的 Elasticsearch - 一亿+条数据,全文检索 100ms 响应
1. 在主机上挂载内存存储目录 创建目录用于挂载 mkdir /mnt/memory_storage 挂载 tmpfs 文件系统 mount -t tmpfs -o size=800G tmpfs /mnt/memory_storage 存储空间会按需使...
-
本地使用Groq Llama 3 70B的逐步指南
译者 | 布加迪 审校 | 重楼 本文介绍了如何使用Groq LPU推理引擎在Jan AI和VSCode中生成超快速响应。 每个人都致力于构建更好的大语言模型(LLM ,而Groq专注于AI的基础设施方面,旨在确保这些大模型更快速响应。 本教程将介绍...
-
儿童节变身小小音乐家,用ModelArts制作一张AIGC音乐专辑
本文分享自华为云社区《儿童节变身小小音乐家,用ModelArts制作一张AIGC音乐专辑》,作者: 华为云社区精选。 儿童节,如何给小朋友准备一份特别的礼物? 这份AIGC音乐专辑制作攻略一定要收下 一段文字灵感就能编织出一曲悠扬悦耳的旋律 童话、...
-
在VS中使用Github Copilot心得
环境 周末在家里尝试了在Visual Studio 2022中按装了Github Copilot.首先我将VS 升级到了最新版本,然后在插件市场按装了Copilot.然后关联了GITHUB的账户,同时激活了Copilot. 这个是收费的。 使用心得...
-
写代码神器!48个主流代码生成LLM大模型盘点,包含专用、微调等4大类Code llama
写代码神器!48个主流代码生成LLM大模型盘点,包含专用、微调等4大类 学姐带你玩AI 2023-12-06 18:20 代码大模型具有强大的表达能力和复杂性,可以处理各种自然语言任务,包括文本分类、问答、对话等。这些模型通常基于深度学习架构,如Tra...
-
Fitten Code插件安装——又一款AI代码插件火了,比Copilot更快!
Fitten Code插件 最近又新出了一款国产AI写代码神器,直接秒杀GitHub Copilot!速度更快、准确度还高,并且在功能上基本和GitHub Copilot差不多。 重要是的是,免费,免费,完全免费! Fitten Code介绍...
-
Midjourney可以通过接口调用啦
在数字艺术创作领域,Midjourney一直以其出色的图片生成效果受到广泛关注。然而,由于需要通过discord界面操作等一系列限制,也给很多用户带来了不便。现在,通过日月摘星接口,用户可以直接访问和调用midjourney,大大简化了操作...
-
LlamaFactory源码解析 PPO
class CustomPPOTrainer(PPOTrainer, Trainer : r""" Inherits PPOTrainer. """ def __init__( self,...
-
什么是LLM大模型训练,详解Transformer结构模型
本文分享自华为云社区《LLM 大模型学习必知必会系列(四 :LLM训练理论篇以及Transformer结构模型详解》,作者:汀丶。 1.模型/训练/推理知识介绍 深度学习领域所谓的“模型”,是一个复杂的数学公式构成的计算步骤。为了便于理解,我们以一...
-
Stable Diffusion 安装教程(附安装包) 【SD三种安装方式,Win+Mac一篇文章讲明白】
“Stable Diffusion的门槛过高、不会安装?没关系,这篇文章教会你如何安装!”(文末扫码可直接获取免费安装包~) Stable Diffusion的安装部署其实并不困难,只需简单点击几下,几分钟就能安装好,不管是windows还是苹果mac电...
-
土耳其,怎么就在AI应用赛道“遥遥领先”了?
在 a16z 给出的按照 MAU 排名的全球 Top50AI App 榜单中,来自土耳其的 Codeway 和 HubX 两个公司各有三款产品进入了 Top50当中,除了这6款产品,还有 Genie 和 Lisa AI 两款产品也是由土耳其开发者推出的。单...
-
实时局部建图的深入思考 | MapTR继往开来的18篇论文剖析!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 实时局部建图领域自从端到端方案MapTR(2023.1 [1]问世后已经又涌现出非常多优秀的工作,基本是在MapTR基本框架的基础上进行一系列改进,包括原班人马的升级作品MapTRv2(2023.8 ...
-
Stable Diffusion 老照片修复+高清化+一键抠图教程
大家有没有一些老旧,珍藏的照片因为岁月的侵蚀变得模糊而感到惋惜?有没有在做SD的时候生成的图片清晰度不够,过于模糊?但是不知道如何把它变得更清晰呢? 如果有,那你就来对了,本期课程就是教大家如何用SD的功能把照片放大变得超清,同时还教大家如何把破旧的老照...
-
AlphaFold 3引不满!服务器被黑,全世界科学家竞相破解
不久前,AlphaFold3横空出世,直接登上了Nature头版。 新的架构、前所未有的预测精度和准确率,再次震撼了整个学术界。 然而,与AlphaFold2不同,这个新一代的超强模型却没有开源。 取而代之的是,谷歌DeepMind推出了一个免费研究平...
-
llama.cpp 转化 huggingface 模型失败 解决路径
问题: ./main -m ./models/book_q4_K_M -n 128 报错: terminate called after throwing an instance of 'std::out_of_range' what( :...
-
开源模型进展盘点:最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好?
深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察,也会经常把一些观察的结果写成博客。在一篇 5 月中发布的博客中,他盘点分析了 4 月份发布的四个主要新模型:Mix...
-
LMDeploy高效部署Llama-3-8B,1.8倍vLLM推理效率
Llama 3 近期重磅发布,发布了 8B 和 70B 参数量的模型,LMDeploy 对 Llama 3 部署进行了光速支持,同时对 LMDeploy 推理 Llama 3 进行了测试,在公平比较的条件下推理效率是 vLLM 的 1.8 倍。 书生...
-
Defog发布Llama-3-SQLCoder-8B,文本转SQL模型,性能比肩GPT-4,准确率超90%,消费级硬件可运行
前言 在计算语言学领域,将自然语言转化为可执行的SQL查询是一个重要的研究方向。这对于让那些没有编程或SQL语法知识的用户也能轻松访问数据库信息至关重要。Defog团队近日发布了基于Llama-3的SQLCoder-8B模型,它在文本转SQL模型领域取得...
-
超越Devin!姚班带队,他们创大模型编程新世界纪录
超越Devin!SWEBench排行榜上迎来了新玩家—— StarShip CodeGen Agent,姚班带队初创公司OpenCSG出品,以23.67%的成绩获得全球第二名的成绩。 同时创造了非GPT-4o基模的最高纪录(SOTA)。 我们都知道,SW...
-
多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」
最近的一系列研究表明,纯解码器生成模型可以通过训练利用下一个 token 预测生成有用的表征,从而成功地生成多种模态(如音频、图像或状态 - 动作序列)的新序列,从文本、蛋白质、音频到图像,甚至是状态序列。 能够同时生成多种模态输出的多模态模型一般是通过某...
-
AI绘画Stable Diffusion画全身图总是人脸扭曲?ADetailer插件实现一键解决!
大家好,我是程序员晓晓 你是否遇到过SD生成的人物脸部扭曲、甚至令人恶心的情况?也曾感到束手无策?别担心,这份教程专为你而来。 在使用SD生成人物全身照时,你可能经常发现人物的脸部会出现扭曲问题。这是因为人物面部像素占比过少,导致无法充分还原面部信息。...
-
时间序列模型:lag-Llama
项目地址:GitHub - time-series-foundation-models/lag-llama: Lag-Llama: Towards Foundation Models for Probabilistic Time Series Foreca...
-
GitHub Copilot 简单使用
因为公司安全原因,并不允许在工作中使用GitHub Copilot,所以,一直没怎么使用。最近因为有一些其它任务,所以,试用了一下,感觉还是很不错的。(主要是C++和Python编程) 一:常用功能 1.1:代码的智能提示和代码补全。 也就是Copi...
-
Llama 3 Web Demo 部署 && XTuner 小助手认知微调 && LMDeploy 部署 Llama 3 模型 && 五一作业 && 机智流
Llama 3 Web Demo 部署 && XTuner 小助手认知微调 && LMDeploy 部署 Llama 3 模型 && 五一作业 && 机智流 1、 Llama 3...
-
安装部署Stable Diffusion WebUI实现AI绘画
Stable Diffusion WebUI 安装部署 环境准备 下载代码 启动webu.sh 访问WebUI 其他异常 其他设置 开启VAE和CLIP 部分参数说明 安装插件 中文汉化插件 安装civitai插件 提示词插件 ol...
-
基于百度语音识别、文心一言大模型、百度语音合成的一套完整的语音交互(利用Python实现)
本人小白,因为毕设项目需要用的语音交互,便查网上的资料利用百度api实现,比较简单的过程,供大家借鉴批判。 项目框架大致分为3步:(1)百度语音识别可以将我们输入的语音转化为文本输入到文心一言大模型;(2)文心一言大模型根据输入以输出响应文...
-
如何在Linux服务器上安装Stable Diffusion WebUI
如何在Linux服务器上安装Stable Diffusion WebUI 一、前提条件 1、硬件条件 2、软件条件 二、安装步骤 1、创建Python虚拟环境 2、安装必要的软件和库 3、克隆Stable Diffusion WebUI仓...
-
百度文心一言api Python调用ERNIE-Lite-8K-0922具体教程
ERNIE Lite是百度自研的轻量级大语言模型,兼顾优异的模型效果与推理性能,适合低算力AI加速卡推理使用。ERNIE-Lite-8K-0922(原ERNIE-Bot-turbo-0922)是模型的一个模版,本文介绍了相关API及应用。 创建chat...