-
【AI绘画--七夕篇】使用Stable Diffusion的艺术二维码完全生成攻略
文章目录 前言 Stable Diffusion 简介 什么是云端平台? 优势 灵活性和可扩展性 成本效益 高可用性和容错性 管理简便性 选择适合的云端平台 平台优势 平台操作 购买算力并创建工作空间 启动工作空间 应用市场一键安装...
-
【AIGC】大模型协作系统 HuggingGPT 深度解析
欢迎关注【youcans的 AIGC 学习笔记】原创作品 【AIGC】大模型协作系统 HuggingGPT 深度解析 1. 摘要 2. 前言 3. HugginGPT 大模型协作系统 3.1 任务规划 3.2 模型选择 3.3 任务执行...
-
AI数字绘画 stable-diffusion 保姆级教程
简介 近段时间来,你可能在不少地方都看到了非常多这样的好看的画。 比如这样的赛博朋克风 prompt: Cyberpunk, 8k resolution, castle, the rose sea, dream 水墨画风格 prompt:...
-
LLMs之LLaMA-2:LLaMA-2的简介(技术细节)、安装、使用方法(开源-免费用于研究和商业用途)之详细攻略
LLMs之LLaMA-2:LLaMA-2的简介(技术细节 、安装、使用方法(开源-免费用于研究和商业用途 之详细攻略 导读:2023年7月18日,Meta重磅发布Llama 2!这是一组预训练和微调的大型语言模型(LLM),规模从70亿到700亿个...
-
Stable Diffusion的入门介绍和使用教程
Stable Diffusion是一个文本到图像的潜在扩散模型,由CompVis、Stability AI和LAION的研究人员和工程师创建。它使用来自LAION-5B数据库子集的512x512图像进行训练。使用这个模型,可以生成包括人脸在内的任何图...
-
大模型恋爱神器!16种MBTI自由定制,北大ChatLaw团队出品
北大团队新作,让大模型拥有个性! 而且还是自定义那种,16种MBTI都能选。 图源备注:图片由AI生成,图片授权服务商Midjourney 这样一来,即便是同一个大模型,不同性格下的回答都不一样。 比如提问:你周末喜欢干什么? 这样能干啥呢?北大的童...
-
手把手教你在云环境炼丹:Stable Diffusion LoRA 模型保姆级炼制教程
很多同学都想要自己的专属AI模型,但是大模型的训练比较费时费力,不太适合普通用户玩。AI开发者们也意识到了这个问题,所以就产生了微调模型,LoRA就是其中的一种。在AI绘画领域,只需要少量的一些图片,就可以训练出一个专属风格的LoRA模型,比如某人的脸、...
-
【AI绘画】万字长文——(超详细)ControlNet的详细介绍&使用Stable Diffusion的艺术二维码完全生成攻略
目录 前言 一、名词解释 1-1、Stable Diffusion介绍 1-2、ControlNet介绍 1-2-1、ControlNet介绍&工作原理 1-2-2、ControlNet控制方法介绍 1-3、案例分析 1-3-1...
-
【AI绘画】本地部署Stable Diffusion Web UI
近几年AI发展迅猛,今年更是大爆发,除了爆火的大模型ChatGPT以外,AI绘画也有很大的进步,目前,Stable Diffusion图像生成效果相当惊人,可以生成逼真的人像、风景、物品图片,还可以将图片转换为不同风格。Stable Diffusion W...
-
AIGC:阿里开源大模型通义千问部署与实战
1 引言 通义千问-7B(Qwen-7B)是阿里云研发的通义千问大模型系列的70亿参数规模的模型。Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代...
-
为大模型恶补数学,上交开源MathPile语料库,95亿tokens,还可商用
在当前智能对话模型的发展中,强大的底层模型起着至关重要的作用。这些先进模型的预训练往往依赖于高质量且多样化的语料库,而如何构建这样的语料库,已成为行业中的一大挑战。 在备受瞩目的 AI for Math 领域,由于高质量的数学语料相对稀缺,这限制了生成式...
-
Stable Diffusion - 超分辨率插件 StableSR v2 (768x768) 配置与使用
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131582734 论文:Exploiting Diffusion...
-
再薅!Pika全球开放使用;字节版GPTs免费不限量;大模型应用知识地图;MoE深度好文;2024年AIGC发展轨迹;李飞飞最新自传 | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 终于!AI视频生成平台 Pika 面向所有用户开放网页端 https://twitter.com/pika_labs Pika...
-
AIGC:【LLM(七)】——Baichuan2:真开源可商用的中文大模型
文章目录 一.模型介绍 二.模型部署 2.1 CPU部署 2.2 GPU部署 三.模型推理 3.1 Chat 模型推理 3.2 Base 模型推理 四.模型量化 4.1 量化方法 4.2 在线量化 4.3 离线量化 4.4 量化效果...
-
Whisper OpenAI开源语音识别模型
介绍 Whisper 是一个自动语音识别(ASR,Automatic Speech Recognition)系统,OpenAI 通过从网络上收集了 68 万小时的多语言(98 种语言)和多任务(multitask)监督数据对 Whisper 进行了训练...
-
whisper深入-语者分离
文章目录 学习目标:如何使用whisper 学习内容一:whisper 转文字 1.1 使用whisper.load_model( 方法下载,加载 1.2 使用实例对文件进行转录 1.3 实战 学习内容二:语者分离(pyannote.aud...
-
四行代码让大模型上下文暴增3倍,羊驼Mistral都适用
无需微调,只要四行代码就能让大模型窗口长度暴增,最高可增加3倍! 而且是“即插即用”,理论上可以适配任意大模型,目前已在Mistral和Llama2上试验成功。 有了这项技术,大模型(LargeLM)就能摇身一变,成为LongLM。 近日,来自得克萨斯农...
-
Stable Diffusion教程(5) - 文生图教程
配套视频教程: https://v.douyin.com/UyHNfYG/ 文生图界面标注如下 1 提示词和反向提示词 提示词内输入的东西就是你想要画的东西,反向提示词内输入的就是你不想要画的东西 提示框内只能输入英文,所有符号都要使用英...
-
轻量级模型,重量级性能,TinyLlama、LiteLlama小模型火起来了
当大家都在研究大模型(LLM)参数规模达到百亿甚至千亿级别的同时,小巧且兼具高性能的小模型开始受到研究者的关注。 小模型在边缘设备上有着广泛的应用,如智能手机、物联网设备和嵌入式系统,这些边缘设备通常具有有限的计算能力和存储空间,它们无法有效地运行大型语...
-
英伟达推新AI语音识别模型Parakeet 号称优于Whisper
领先的开源对话 AI 工具包 NVIDIA NeMo宣布推出 Parakeet ASR 模型系列,这是一系列最先进的自动语音识别(ASR)模型,能够以出色的准确性转录英语口语。Parakeet ASR 模型与 Suno.ai 合作开发,是语音识别领域的一大...
-
Stable-Diffusion和ControlNet插件安装全过程,以及使用心得汇总.
Stable-Diffusion的安装我采用的是YouTuBe视频的 <<How to Install & Use Stable Diffusion on Windows>> 需要魔法上网...
-
Mac本地部署Stable Diffusion,超详细,含踩坑点(AI 绘画保姆级教程)
一、 引言 相继在两个云平台 Kaggle 和 AutoDL 上部署了 Stable Diffusion 后,这周决定再在 Mac 本地部署一下 Stable Diffusion! 其实看 Stable Diffusion WebUI 的 Githu...
-
持续进化,快速转录,Faster-Whisper对视频进行双语字幕转录实践(Python3.10)
Faster-Whisper是Whisper开源后的第三方进化版本,它对原始的 Whisper 模型结构进行了改进和优化。这包括减少模型的层数、减少参数量、简化模型结构等,从而减少了计算量和内存消耗,提高了推理速度,与此同时,Faster-Whisper也...
-
【stable diffusion LORA训练】改进lora-scripts,命令行方式训练LORA,支持SDXL训练
分享下自己改进的一个lora训练脚本,在ubuntu下如果SD-WEBUI的环境已经搭好的话,只需要下载lora-script就可以支持训练了,直接命令行方式训练。 首先,我们需要克隆下项目: git clone https://github.com/...
-
【AI工具】-Stable Diffusion本地化部署教程
前言 今天我们要介绍的是时下最流行的AI绘图软件Stable Diffusion,虽然Diffusion.ai已经开放api,但是长时间的商业化调用我们需要购买很多的金币。所以我们需要找一个平替的AI绘图平台,现在主流市场中AI绘图软件主要就是Open...
-
顺着网线爬过来成真了,Audio2Photoreal通过对话就能生成逼真表情与动作
当你和朋友隔着冷冰冰的手机屏幕聊天时,你得猜猜对方的语气。当 Ta 发语音时,你的脑海中还能浮现出 Ta 的表情甚至动作。如果能视频通话显然是最好的,但在实际情况下并不能随时拨打视频。 如果你正在与一个远程朋友聊天,不是通过冰冷的屏幕文字,也不是缺乏表情...
-
使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion
使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion 0. 前言 1. Amazon SageMaker 与机器学习 1.1 机器学习流程 1.2 Amazon SageMaker 简介 1.3 Amaz...
-
Stable Diffusion - 图像反推 (Interrogate) 提示词算法 (BLIP 和 DeepBooru)
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131817599 图像反推 (Interrogate 功能,是指...
-
分享38个AI绘画网站
本文是参考AI沉思录「1000AI」栏目的第十二期,「1000AI」栏目专注研究有哪些AI产品,目标研究1000+AI产品(进度:532/1000 。 AI沉思录 aichensilu.com/ 1、Midjourney 网址:https://www....
-
一张图500元是目前AIGC最高“回报”?小冰李笛:调用API的商业模式不适用于未来 | MEET 2024
AIGC在商业界中,最大的一笔回报是多少? 答案可能是:一张图片,500元。 而且这就是发生在最近、号称人工智能著作权第一案的真实案例: 这个案子出来之后,引发了很多人都会讨论,认为它会不会对法学界、对人工智能的著作权、版权等问题的实践具有一些新的指导意...
-
Stable Diffusion实现之 Huggingface
Stable Diffusion 以及Huggingface的安装实现 介绍: Stable Diffusion AI是指将Stable Diffusion模型应用于人工智能领域的相关技术和方法。通常情况下,Stable Diffusion AI主...
-
[NLP] 使用Llama.cpp和LangChain在CPU上使用大模型-RAG
一 准备工作 下面是构建这个应用程序时将使用的软件工具: 1.Llama-cpp-python 下载llama-cpp, llama-cpp-python [NLP] Llama2模型运行在Mac机器-CSDN博客 2、LangChain L...
-
20分钟,使用Amazon SageMaker快速搭建属于自己的AIGC应用
真火! 作为最近一段时间人工智能领域内的顶流之一,AIGC(AI-Generated Content)早已火爆出圈,频登各大互联网平台热搜。 cite: 微软亚洲研究院官方微博 这段时间以来,基于深度学习的内容生成在图像、视频、语音、音乐、...
-
攻克图像「文本生成」难题,碾压同级扩散模型!两代TextDiffuser架构深度解析
近年来,文本生成图像领域取得了显著进展,尤其是基于扩散(Diffusion)的图像生成模型在细节层面上展现出逼真的效果。 然而,一个挑战仍然存在:如何将文本准确地融入图像。 生活中存在大量的「含文本图像」,从广告海报到书籍封面,再到路牌指示,都包含了重要...
-
当LLM学会左右互搏,基础模型或将迎来集体进化
金庸武侠小说中有一门武学绝技:左右互搏;乃是周伯通在桃花岛的地洞里苦练十余年所创武功,初期想法在于左手与右手打架,以自娱自乐。而这种想法不仅能用来练武功,也能用来训练机器学习模型,比如前些年风靡一时的生成对抗网络(GAN)。 进入现今的大模型 (LLM ...
-
【强烈推荐】 十多款2023年必备国内外王炸级AI工具 (免费 精品 好用) 让你秒变神一样的装逼佬感受10倍生产力 (3) AI绘画 我的天,淘汰原画师的神器来了,赶紧闪!
? 个人主页 极客小俊 ✍? 作者简介:web开发者、设计师、技术分享博主 ? 希望大家多多支持一下, 我们一起进步!? ? 如果文章对你有帮助的话,欢迎评论 ?点赞?? 收藏 ?加关注 AI 绘画 AI人工智能不仅可以处理图片和声音,在绘画...
-
AI绘画部署-Stable Diffusion(huggingface API图片生成初体验)
引言 最近,在很多地方都看到了各个大佬用AI生成的神图,索性从网上搜集资料部署一下体验一下AI绘画的魅力。本文基于huggingface API在colab上构建AI绘画。 使用步骤 1.huggingface原始环境地址 https://c...
-
Github爆火AI语音克隆项目OpenVoice,精准进行声音复刻
最近,Github上的一个名为OpenVoice的AI语音克隆项目爆火,该项目由myshell-ai开源,仅开源了不到三周,就有了6.1k的star。 OpenVoice仅需参考说话者的短音频片段,即可复制其声音并生成多种语言的语音。这一技术不仅实现了对音...
-
多模态运动语言模型MotionGPT 可将语言指令转换为3D人体运动
MotionGPT是一款令人惊叹的技术创新,它统一了语言和运动,将语言指令转换为引人入胜的3D人体运动。这一模型的设计灵感源于即时学习,通过混合运动语言数据进行预训练,并通过基于提示的问答任务进行微调,使其具备卓越的性能。 项目地址:https://hu...
-
开源语音识别faster-whisper部署教程
1. 资源下载 源码地址 模型下载地址: large-v3模型:https://huggingface.co/Systran/faster-whisper-large-v3/tree/main large-v2模型:https://huggingf...
-
大模型在cpu上使用llama_cpp部署无法加载模型的问题
from llama_cpp import Llama model = Llama(model_path="llama-2-7b-chat.ggmlv3.q4_0.bin" 错误:gguf_init_from_file: invalid magi...
-
[linux-sd-webui]api化之训练lora
lora的训练使用的文件是https://github.com/Akegarasu/lora-scripts lora训练是需要成对的文本图像对的,需要准备相应的训练数据。 1.训练数据准备 使用deepbooru/blip生成训练数据,建筑类建议使...
-
HandRefiner:解决AI生图手部畸形难题
HandRefiner是一种可以修正形状不正常的手部图像的方法。在生成图像方面,目前的图像生成模型已经非常出色,但是在生成人类手部的图像时常常会出现问题,例如手指数量不对或者手形怪异。 为了解决这个问题,HandRefiner提出了一种条件修补方法,可以在...
-
【AI图像生成】Python初学者能够以爆炸性的速度上手主题StableDiffusion
? 这应该是本站最好的人工智能资料库 ? 本文由 EasyAI 原创,首发于 CSDN? ⌚️ 欢迎点赞 ? 收藏 ⭐留言 ? 如有错误敬请指正! ?未来很长,值得我们全力奔赴更美好的生活✋ 介绍 我能够使用 GoogleColabo...
-
版权过期后,米老鼠SD模型上线 以后可以放心用AI画米老鼠了
日前,迪士尼旧版米老鼠的版权正式过期,这意味着任何人都可以自由使用旧版米老鼠形象。 AI圈的开发者们手速也不可小觑,这不,才刚宣布过期没多久,他们就已经推出了米老鼠的SD模型Mickey-1928。 Mickey-1928是一个基于Stable-Diff...
-
stable diffusion(安装以及模型的初步使用)
本机的配置 能跑模型,本地也跑过一点Lora训练的脚本,看看几个效果: 以上的都是配合huggingface有的模型结合civitai上的Lora模型在本地跑出来的图片,自己本地训练的Lora太拉闸了,就不放上来了…… 1....
-
阿里AI项目DreamTalk开源 可让人物头像说话
阿里巴巴宣布其项目DreamTalk已经开源。这个项目可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配。 模型下载地址:https://huggingface.co/damo-vilab/dreamtalk 项目地址:htt...
-
[AI绘画] 即插即用!SDXL+T2I-Adapters 高效可控的生成图片
标题:T2I-Adapter: Learning Adapters to Dig out More Controllable Ability for Text-to-Image Diffusion Models 论文:https://arxiv....
-
MyShell发布开源AI语音克隆工具OpenVoice,瞄准语音模仿领域
MyShell最新推出的开源语音克隆工具OpenVoice引起了广泛关注。这一创新产品由麻省理工学院(MIT)、清华大学以及加拿大人工智能初创公司MyShell合作开发。OpenVoice采用了一种概念简单但高效的方法,可几乎即时克隆用户的语音,并使用明显...
-
利用Lama Cleaner本地实现AIGC试玩:擦除对象、替换对象、更换风格等等
目录 一、安装 二、擦除功能 1. LaMa模型 实操实例一:去除路人 实操实例二:去水印 实操实例三:老照片修复 2. LDM模型 3. ZITS模型 4. MAT模型 5. FcF模型 6. Manga模型 三、替换对象功能 1....