-
【大语言模型】5分钟快速认识ChatGPT、Whisper、Transformer、GAN
5分钟快速认识ChatGPT、Whisper、Transformer、GAN 什么是ChatGPT? 什么是Whisper? 什么是Generative Pre-trained Transformer架构? 什么是自然处理语言 NLP 的 Tr...
-
【思路合集】talking head generation+stable diffusion
1 以DiffusionVideoEditing为baseline: 改进方向 针对于自回归训练方式可能导致的漂移问题: 训练时,在前一帧上引入小量的面部扭曲,模拟在生成过程中自然发生的扭曲。促使模型查看身份帧以进行修正。 在像VoxCeleb或L...
-
百万粉科普博主GenJi:未来AIGC可能占据90%内容
从AI绘画开始,AIGC逐渐影响到设计、广告、影视等各行各业。GenJi是一名拥有百万粉丝的科普创作者,也是一名AI科技创业者,他从Photoshop、Premiere等教程起步,将账号“GenJi是真想教会你”做到了B站设计教学区综合影响力第一名,之后加...
-
【深度学习】AIGC ,ControlNet 论文,原理,训练,部署,实战,教程(一)
论文:https://arxiv.53yu.com/pdf/2302.05543 代码:https://github.com/lllyasviel/ControlNet 得分几个博客完成这个事情的记录了,此篇是第一篇,摘录了一些论文内容。ControlN...
-
【AI】D2000 arm64 aarch64 22.04.3 LTS (Jammy Jellyfish) 编译llama.cpp 使用chinese-alpaca-2-7b模型 CPU版本
下载编译llama.cpp cd ~/Downloads/ai/ git clone --depth=1 https://gh.api.99988866.xyz/https://github.com/ggerganov/llama.cpp cd llma...
-
Stable Diffusion(SD)核心基础知识——(文生图、图生图)
文章目录 一、Stable Diffusion核心基础原理 (一)Stable Diffusion模型工作流程 (二)Stable Diffusion模型核心基础原理 (三)Stable Diffusion的训练过程 (四)其他主流生成式模型...
-
AIGC内容分享(四十):生成式人工智能(AIGC)应用进展浅析
目录 0 引言 1 以ChatGPT为代表的AIGC发展现状 1.1 国外AIGC应用发展现状 1.2 国内AIGC应用发展现状 2 AIGC的技术架构 (1)数据层 (2)算力基础设施层 (3)算法及大模型层 (4)AI...
-
大模型笔记【3】 gem5 运行模型框架LLama
一 LLama.cpp LLama.cpp 支持x86,arm,gpu的编译。 1. github 下载llama.cpp https://github.com/ggerganov/lla...
-
【AI绘图 丨 Stable_diffusion 系列教程三】— 无需配置环境 | Colab直接运行Stable Diffusion web UI并从civitai中导入lora模型
目录 一、Google Colab的基本介绍 二、Google Colab 的使用 2.1 利用Google 浏览器搜索Google drive 2.2 注册一个Google 账号,点击转至账号登录 2.3 进入Google drive...
-
深入浅出完整解析Stable Diffusion(SD)核心基础知识
2022年,Stable Diffusion模型横空出世,其成为AI行业从传统深度学习时代走向AIGC时代的标志性模型之一,并为工业界,投资界,学术界以及竞赛界都注入了新的AI想象空间,让AI再次性感。 Stable Diffusion是计算机视觉领域的...
-
谷歌DeepMind核心大佬被曝离职创业,瞄准AI智能体!曾是Gemini关键负责人
谷歌又被曝出有核心员工离职了! 这次跑路的竟是DeepMind的核心技术大佬,Gemini项目的四位主要开发者之一,Ioannis Antonoglou。 上图左半部分列出了Gemini项目的36位领导者,自去年九月以来,包括Ioannis Anton...
-
Stable Diffusion学习
参考 Stable Diffusion原理详解_stable diffusion csdn-CSDN博客 Stable Diffusion是stability.ai开源的图像生成模型,可以说Stable Diffusion的发布将AI图像生成提高到了全新...
-
纯文本模型训出「视觉」表征!MIT最新研究:语言模型用代码就能作画
只会「看书」的大语言模型,有现实世界的视觉感知力吗?通过对字符串之间的关系进行建模,关于视觉世界,语言模型到底能学会什么? 最近,麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)的研究人员对语言模型的视觉能力进行了系统的评估,从简单形状、物体...
-
人工智能范式从模型为中心转向数据为中心
面向数据的人工智能可以有助于减少生成式AI系统中的幻觉和偏见,从而提高其输出质量。 译自The Paradigm Shift from Model-Centric to Data-Centric AI,作者 Rahul Pradhan 拥有16年以上的经...
-
AIGC内容分享(三):AIGC应用:基于RAG构建个人知识库
目录 前言 Collect (收集 收集是什么? Organize (组织 组织信息 Distill (提炼 提炼信息 Express (表达 表达见解 Finetune调优 调整输出内容 总结一下 前言 在信息爆炸的...
-
ChatGPT和Midjourney王炸组合,开启AI新时代
目录 序言 一:使用ChatGPT进行对话 二:调用newbies robot 三:举例说明 四:付费和使用限制 序言 随着人工智能技术的不断发展,越来越多的人开始使用人工智能工具来创作图画。在这里,我将分享如何结合ChatGPT和...
-
GPT-4不服被Bard反超:最新模型已入场
“大模型排位赛”权威榜单Chatbot Arena刷新: 谷歌Bard超越GPT-4,排名位居第二,仅次于GPT-4 Turbo。 然鹅,众多网友对此却表示“不服”、“不公平”。 原来,谷歌AI掌门人Jeff Dean透露,Bard性能大幅提升,是因为...
-
Stable Diffusion 安装与使用
ai绘画原理简介 Stable Diffusion是一种在计算机科学和数据分析领域广泛使用的算法,主要用于图像处理、信号处理、计算机视觉和机器学习等方面。其主要思想是将数据进行扩散处理,以达到数据平滑的效果,同时可以消除一些噪音和不必要的细节。 在图像...
-
【AIGC-文本/图片生成视频系列-9】MagicVideo-V2: 多阶段高美感视频生成
目录 一. 项目概述与贡献 二. 方法详解编辑 三. 文本生成视频相关结果 四. 与其他方法对比结果 五. 个人感悟 最近得益于扩散模型的快速发展,文本到视频(T2V)模型的激增。 今天要介绍的是字节的MagicVideo-V2,一个新颖...
-
【AI】Chinese-LLaMA-Alpaca-2 7B llama.cpp 量化方法选择及推理速度测试 x86_64 RTX 2060 6G 显存太小了
环境 操作系统 CPU 内存 生成量化版本模型 转换出q4_0 q4_k q6_k q8_0模型 cd ~/Downloads/ai/llama.cpp sourvce venv/bin/activate ~/Downloads/...
-
diffusion model(五)stable diffusion底层原理(latent diffusion model, LDM)
LDM: 在隐空间用diffusion model合成高质量的图片! [论文地址] High-Resolution Image Synthesis with Latent Diffusion Models [github] https://githu...
-
第三十二章:ChatGPT与AIGC在物联网领域的应用
1.背景介绍 物联网(Internet of Things,IoT 是指通过互联网将物体和设备连接起来,实现数据的传输和共享。物联网技术已经广泛应用于各个领域,如智能家居、智能城市、智能制造、智能农业等。随着数据量的增加和计算能力的提高,人工智能...
-
Stable Diffusion XL总结
Stable Diffusion XL是一个二阶段的级联扩散模型,包括Base模型和Refiner模型。其中Base模型的主要工作和Stable Diffusion一致,具备文生图,图生图,图像inpainting等能力。在Base模型之后,级联了Refi...
-
探索【Stable-Diffusion WEBUI】的图片超分辨插件:StableSR
文章目录 (零)前言 (一)图片放大 (二)图片超分辨率放大脚本插件(StableSR) (2.1)下载组件 (2.2)使用 (2.3)实例对比(放大) (2.4)实例对比(修复) (三)总结 (零)前言 本篇主要介绍W...
-
AIGC笔记总结(一):扩散模型简介
?个人主页: GoAI |? 公众号: GoAI的学习小屋 | ?交流群: 704932595 |?个人简介 : 掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉方向导师等,专注大数...
-
大语言模型部署:基于llama.cpp在Ubuntu 22.04及CUDA环境中部署Llama-2 7B
llama.cpp是近期非常流行的一款专注于Llama/Llama-2部署的C/C++工具。本文利用llama.cpp来部署Llama 2 7B大语言模型,所采用的环境为Ubuntu 22.04及NVIDIA CUDA。文中假设Linux的用户目录(一般为...
-
电商:如何使用ChatGPT和AIGC提高电商体验
1.背景介绍 1. 背景介绍 随着互联网的普及和人们对在线购物的需求不断增长,电商已经成为了一个非常热门的行业。为了提高电商体验,提高客户满意度,降低客户流失率,企业需要不断创新和优化自己的在线购物体验。在这里,人工智能(AI 和机器学习(M...
-
webassembly003 whisper.cpp的项目结构CMakeLists.txt
注:带星号的为非重要部分 基础配置 cmake_minimum_required (VERSION 3.5 project(whisper.cpp VERSION 1.5.0 # Add path to modules list(APPEND...
-
Windows下使用Anaconda本地部署Stable-Diffusion
前言: 一、电脑配置要求 二、安装Anaconda 三、cuda和cudnn安装 四、Stable-Diffusion开源代码下载和依赖安装 五、启动服务 前言: 为什么本地部署?Stable-Diffusion是完全开源的,...
-
Stable-Diffusion环境搭建
硬件可以采用DELL R7525 搭配L4 或者T4 等等企业级显卡 环境如下: 可以看到有相应的GPU卡信息 esxi 7.u3 信息 设置GPU穿透方式 查看相应的虚拟机参数信息 PCI 设备加载穿透GPU信息...
-
Stable Diffusion 生成高清图片
Stable Diffusion 生成 8K 高清图片 0. 简介 1. 安装 ultimate-upscale-for-automatic1111 插件 2. 安装 4x-UltraSharp 模型 3. 生成 1 张普通图片 4. 生成 1...
-
stable diffusion webui 使用
参考各文章以及个人操作后的记录文章,也希望能帮助有需要的人~ 首先进去大概是这样的,介绍下下图几个区域(主要是文生图)。 一、模型区域 Stable Diffusion checkpoint下拉选择框是用来切换ckpt模型,不清楚的可以看下这篇St...
-
Stable Diffusion 硬核生存指南:WebUI 中的 CodeFormer
本篇文章聊聊 Stable Diffusion WebUI 中的核心组件,强壮的人脸图像面部画面修复模型 CodeFormer 相关的事情。 写在前面 在 Stable Diffusion WebUI 项目中,源码 modules 目录中,有一个有趣...
-
使用 Transformers 为多语种语音识别任务微调 Whisper 模型
本文提供了一个使用 Hugging Face ? Transformers 在任意多语种语音识别 (ASR 数据集上微调 Whisper 的分步指南。同时,我们还深入解释了 Whisper 模型、Common Voice 数据集以及微调等理论知识,并提供...
-
如何使用AIGC进行语音识别和合成
1.背景介绍 语音识别和合成是人工智能领域的重要技术,它们有助于实现自然语言与计算机之间的有效沟通。在这篇文章中,我们将探讨如何使用人工智能生成模型(AIGC 进行语音识别和合成。 1. 背景介绍 语音识别是将声音转换为文本的过程,而语音...
-
使用推测解码 (Speculative Decoding) 使 Whisper 实现 2 倍的推理加速
Open AI 推出的 Whisper 是一个通用语音转录模型,在各种基准和音频条件下都取得了非常棒的结果。最新的 large-v3 模型登顶了 OpenASR 排行榜,被评为最佳的开源英语语音转录模型。该模型在 Common Voice 15 数据...
-
Nightcafe Creator:AI绘画艺术图片生成器
【产品介绍】 NightCafe Creator是一个在线AI绘画艺术图片生成器,它可以让你在几秒钟内用人工智能的力量创造出惊人的艺术作品。无论你是想用神经风格将你的照片变成一幅杰作,还是想用文本到图像的AI从一个提示中创造出一幅艺术品...
-
stable diffusion 百宝书
文章目录 0. 环境搭建 0.1 Windows 0.1.1 git环境安装 0.1.2 python 环境搭建 0.1.2.1 配置pip国内镜像源 0.1.3 stable diffusion环境搭建 0.1.3.1 远程访问Stab...
-
Stable-Diffusion-WebUI 搭建使用教程
Stable-Diffusion-Webui 是一个基于Gradio库的Stable Diffusion的浏览器界面,可以说是AI绘画集合体,支持目前主流的开源AI绘画模型,例如 NovelAi/Stable Diffusion,有了它,我们就可以很方便地...
-
AIGC人才趋势洞察: AIGC时代属于跨界复合型人才,⼈才和创新机制是成功的关键
目录 一、行业背景 (一)从Chat GPT到AIGC:ChatGPT现象级出圈,AIGC关注度爆发性增⻓ (二)AIGC定义:广义与狭义 (三)AIGC应用图谱 二、AIGC招聘需求 (一)供需情况 1. 岗位供需再创新高(猎聘) 2....
-
一文读懂Stable Diffusion 论文原理+代码超详细解读
背景 Stable diffusion是一个基于Latent Diffusion Models(LDMs)实现的的文图生成(text-to-image)模型。 2022年8月,游戏设计师Jason Allen凭借AI绘画作品《太空歌剧院(Théâtre...
-
stable diffusion webui的代码结构解析
stable-diffusion-webui源码分析(1)-Gradio - 知乎AUTOMATIC1111的webui是近期很流行的stable-diffusion应用,它集合stable-diffusion各项常用功能,还通过扩展的形式支持contro...
-
【刻削生千变,丹青图“万相”】阿里云AI绘画创作模型 “通义万相”测评
刻削生千变,丹青图“万相 4月7日,阿里大模型“通义千问”开始邀请用户测试体验。现阶段该模型主要定向邀请企业用户进行体验测试,用户可通过官网申请(tongyi.aliyun.com),符合条件的用户可参与体验。 随后,在2023云峰会上,阿里巴巴集团董事...
-
AIGC-文生视频-学习之路
CFG AIGC神功_SD采样方法与CFG_大猫404-站酷ZCOOLAIGC神功_SD采样方法与CFG,成都设计爱好者,站酷网,中国设计师互动平台.爱卿们好!本喵又出现了~熟悉的封面有没有把你吸引进来呢?这次让我们继续来讲AIGC的内容哟,这是篇硬核科...
-
Lumiere文生视频模型怎么使用 AI生成视频Lumiere官网地址入口
Lumiere是一个文本到视频扩散模型,旨在合成展现真实、多样和连贯运动的视频,解决视频合成中的关键挑战。我们引入了一种空时U-Net架构,可以一次性生成整个视频的时间持续,通过模型的单次传递。这与现有的视频模型形成对比,后者合成远距离的关键帧,然后进行时...
-
Stable Diffusion系列(三):网络分类与选择
文章目录 网络分类 模型 基座模型 衍生模型 二次元模型 2.5D模型 写实风格模型 名称解读 VAE Lora 嵌入 文件放置 界面使用 网络分类 当使用SD webui绘图时,为了提升绘图质量,可以多种网络混合使用,可...
-
AIGC学习手册
AIGC工作流 在经过大量实验后得出一些经验 如果没有足够的审美和设计功底来驾驭AI,那它只是一个壁纸连连看生成器。 Al未来应该会细分为很多方向,但稳定可控、可预见效果的Al才能真正的不再局限,加入工作流之中。 对参数和数据敏感的设计...
-
stable diffusion实践操作-提示词-人物属性
系列文章目录 stable diffusion实践操作-提示词 文章目录 系列文章目录 前言 一、提示词汇总 1.1 人物属性1 1.2 人物属性2 前言 本文主要收纳总结了提示词-人物属性。 一、提示词汇...
-
Stable Diffusion WebUI中COMMANDLINE_ARGS参数配置说明
Windows用户: 在webui-user.bat文件的set COMMANDLINE_ARGS=后面配置 Linux用户: 在webui-user.sh文件的export COMMANDLINE_ARGS=""引号中配置 COMMANDL...
-
GitHub 数据库 15 年进化史:幕后英雄如何成就 Copilot 传奇
自 2008 年成立以来,GitHub 的数据库系统经历了多次重大的演变,以适应不断增长的用户基础和不断变化的技术需求。GitHub 一直使用 MySQL 数据库,其中保存了除了 git 代码仓库以外的其他所有元数据,诸如用户,issue,PR, Gist...