huggingface 第16页

【AI绘画--七夕篇】使用Stable Diffusion的艺术二维码完全生成攻略

文章目录前言 Stable Diffusion 简介什么是云端平台？优势灵活性和可扩展性成本效益高可用性和容错性管理简便性选择适合的云端平台平台优势平台操作购买算力并创建工作空间启动工作空间应用市场一键安装...

AIGC 2024-01-15 人工智能

964阅读

【AIGC】大模型协作系统 HuggingGPT 深度解析

欢迎关注【youcans的 AIGC 学习笔记】原创作品【AIGC】大模型协作系统 HuggingGPT 深度解析 1. 摘要 2. 前言 3. HugginGPT 大模型协作系统 3.1 任务规划 3.2 模型选择 3.3 任务执行...

人工智能 2024-01-15 人工智能

1056阅读

AI数字绘画 stable-diffusion 保姆级教程

简介近段时间来，你可能在不少地方都看到了非常多这样的好看的画。比如这样的赛博朋克风 prompt: Cyberpunk, 8k resolution, castle, the rose sea, dream 水墨画风格 prompt:...

大数据 2024-01-14 人工智能

861阅读

LLMs之LLaMA-2：LLaMA-2的简介(技术细节)、安装、使用方法(开源-免费用于研究和商业用途)之详细攻略

LLMs之LLaMA-2：LLaMA-2的简介(技术细节、安装、使用方法(开源-免费用于研究和商业用途之详细攻略导读：2023年7月18日，Meta重磅发布Llama 2！这是一组预训练和微调的大型语言模型（LLM），规模从70亿到700亿个...

AIGC 2024-01-14 人工智能

1220阅读

Stable Diffusion的入门介绍和使用教程

Stable Diffusion是一个文本到图像的潜在扩散模型，由CompVis、Stability AI和LAION的研究人员和工程师创建。它使用来自LAION-5B数据库子集的512x512图像进行训练。使用这个模型，可以生成包括人脸在内的任何图...

AIGC 2024-01-14 人工智能

1071阅读

大模型恋爱神器！16种MBTI自由定制，北大ChatLaw团队出品

北大团队新作，让大模型拥有个性! 而且还是自定义那种，16种MBTI都能选。图源备注：图片由AI生成，图片授权服务商Midjourney 这样一来，即便是同一个大模型，不同性格下的回答都不一样。比如提问:你周末喜欢干什么? 这样能干啥呢?北大的童...

大数据 2024-01-14 人工智能

921阅读

手把手教你在云环境炼丹：Stable Diffusion LoRA 模型保姆级炼制教程

很多同学都想要自己的专属AI模型，但是大模型的训练比较费时费力，不太适合普通用户玩。AI开发者们也意识到了这个问题，所以就产生了微调模型，LoRA就是其中的一种。在AI绘画领域，只需要少量的一些图片，就可以训练出一个专属风格的LoRA模型，比如某人的脸、...

人工智能 2024-01-14 人工智能

1289阅读

【AI绘画】万字长文——（超详细）ControlNet的详细介绍&使用Stable Diffusion的艺术二维码完全生成攻略

目录前言一、名词解释 1-1、Stable Diffusion介绍 1-2、ControlNet介绍 1-2-1、ControlNet介绍&工作原理 1-2-2、ControlNet控制方法介绍 1-3、案例分析 1-3-1...

AIGC 2024-01-14 人工智能

1175阅读

【AI绘画】本地部署Stable Diffusion Web UI

近几年AI发展迅猛，今年更是大爆发，除了爆火的大模型ChatGPT以外，AI绘画也有很大的进步，目前，Stable Diffusion图像生成效果相当惊人，可以生成逼真的人像、风景、物品图片，还可以将图片转换为不同风格。Stable Diffusion W...

大数据 2024-01-13 人工智能

895阅读

AIGC：阿里开源大模型通义千问部署与实战

1 引言通义千问-7B（Qwen-7B）是阿里云研发的通义千问大模型系列的70亿参数规模的模型。Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代...

AIGC 2024-01-13 人工智能

1521阅读

为大模型恶补数学，上交开源MathPile语料库，95亿tokens，还可商用

在当前智能对话模型的发展中，强大的底层模型起着至关重要的作用。这些先进模型的预训练往往依赖于高质量且多样化的语料库，而如何构建这样的语料库，已成为行业中的一大挑战。在备受瞩目的 AI for Math 领域，由于高质量的数学语料相对稀缺，这限制了生成式...

AIGC 2024-01-13 人工智能

881阅读

Stable Diffusion - 超分辨率插件 StableSR v2 (768x768) 配置与使用

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/131582734 论文：Exploiting Diffusion...

AIGC 2024-01-13 人工智能

1241阅读

再薅！Pika全球开放使用；字节版GPTs免费不限量；大模型应用知识地图；MoE深度好文；2024年AIGC发展轨迹；李飞飞最新自传 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 终于！AI视频生成平台 Pika 面向所有用户开放网页端 https://twitter.com/pika_labs Pika...

大数据 2024-01-13 人工智能

1022阅读

AIGC：【LLM（七）】——Baichuan2：真开源可商用的中文大模型

文章目录一.模型介绍二.模型部署 2.1 CPU部署 2.2 GPU部署三.模型推理 3.1 Chat 模型推理 3.2 Base 模型推理四.模型量化 4.1 量化方法 4.2 在线量化 4.3 离线量化 4.4 量化效果...

生成式AI 2024-01-09 人工智能

1058阅读

Whisper OpenAI开源语音识别模型

介绍 Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）和多任务（multitask）监督数据对 Whisper 进行了训练...

大数据 2024-01-09 人工智能

2019阅读

whisper深入-语者分离

文章目录学习目标：如何使用whisper 学习内容一：whisper 转文字 1.1 使用whisper.load_model( 方法下载，加载 1.2 使用实例对文件进行转录 1.3 实战学习内容二：语者分离（pyannote.aud...

生成式AI 2024-01-09 人工智能

999阅读

四行代码让大模型上下文暴增3倍，羊驼Mistral都适用

无需微调，只要四行代码就能让大模型窗口长度暴增，最高可增加3倍! 而且是“即插即用”，理论上可以适配任意大模型，目前已在Mistral和Llama2上试验成功。有了这项技术，大模型（LargeLM）就能摇身一变，成为LongLM。近日，来自得克萨斯农...

人工智能 2024-01-08 人工智能

812阅读

Stable Diffusion教程(5) - 文生图教程

配套视频教程： https://v.douyin.com/UyHNfYG/ 文生图界面标注如下 1 提示词和反向提示词提示词内输入的东西就是你想要画的东西，反向提示词内输入的就是你不想要画的东西提示框内只能输入英文，所有符号都要使用英...

大数据 2024-01-08 人工智能

1136阅读

轻量级模型，重量级性能，TinyLlama、LiteLlama小模型火起来了

当大家都在研究大模型（LLM）参数规模达到百亿甚至千亿级别的同时，小巧且兼具高性能的小模型开始受到研究者的关注。小模型在边缘设备上有着广泛的应用，如智能手机、物联网设备和嵌入式系统，这些边缘设备通常具有有限的计算能力和存储空间，它们无法有效地运行大型语...

AIGC 2024-01-08 人工智能

871阅读

英伟达推新AI语音识别模型Parakeet 号称优于Whisper

领先的开源对话 AI 工具包 NVIDIA NeMo宣布推出 Parakeet ASR 模型系列，这是一系列最先进的自动语音识别（ASR）模型，能够以出色的准确性转录英语口语。Parakeet ASR 模型与 Suno.ai 合作开发，是语音识别领域的一大...

人工智能 2024-01-08 人工智能

1012阅读

Stable-Diffusion和ControlNet插件安装全过程,以及使用心得汇总.

Stable-Diffusion的安装我采用的是YouTuBe视频的 <<How to Install & Use Stable Diffusion on Windows>> 需要魔法上网...

人工智能 2024-01-08 人工智能

975阅读

Mac本地部署Stable Diffusion，超详细，含踩坑点（AI 绘画保姆级教程）

一、引言相继在两个云平台 Kaggle 和 AutoDL 上部署了 Stable Diffusion 后，这周决定再在 Mac 本地部署一下 Stable Diffusion！其实看 Stable Diffusion WebUI 的 Githu...

人工智能 2024-01-08 人工智能

2017阅读

持续进化，快速转录，Faster-Whisper对视频进行双语字幕转录实践(Python3.10)

Faster-Whisper是Whisper开源后的第三方进化版本，它对原始的 Whisper 模型结构进行了改进和优化。这包括减少模型的层数、减少参数量、简化模型结构等，从而减少了计算量和内存消耗，提高了推理速度，与此同时，Faster-Whisper也...

人工智能 2024-01-08 人工智能

922阅读

【stable diffusion LORA训练】改进lora-scripts，命令行方式训练LORA，支持SDXL训练

分享下自己改进的一个lora训练脚本，在ubuntu下如果SD-WEBUI的环境已经搭好的话，只需要下载lora-script就可以支持训练了，直接命令行方式训练。首先，我们需要克隆下项目： git clone https://github.com/...

生成式AI 2024-01-08 人工智能

2388阅读

【AI工具】-Stable Diffusion本地化部署教程

前言今天我们要介绍的是时下最流行的AI绘图软件Stable Diffusion，虽然Diffusion.ai已经开放api，但是长时间的商业化调用我们需要购买很多的金币。所以我们需要找一个平替的AI绘图平台，现在主流市场中AI绘图软件主要就是Open...

人工智能 2024-01-08 人工智能

1256阅读

顺着网线爬过来成真了，Audio2Photoreal通过对话就能生成逼真表情与动作

当你和朋友隔着冷冰冰的手机屏幕聊天时，你得猜猜对方的语气。当 Ta 发语音时，你的脑海中还能浮现出 Ta 的表情甚至动作。如果能视频通话显然是最好的，但在实际情况下并不能随时拨打视频。如果你正在与一个远程朋友聊天，不是通过冰冷的屏幕文字，也不是缺乏表情...

生成式AI 2024-01-07 人工智能

825阅读

使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion

使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion 0. 前言 1. Amazon SageMaker 与机器学习 1.1 机器学习流程 1.2 Amazon SageMaker 简介 1.3 Amaz...

生成式AI 2024-01-07 人工智能

1087阅读

Stable Diffusion - 图像反推 (Interrogate) 提示词算法 (BLIP 和 DeepBooru)

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/131817599 图像反推 (Interrogate 功能，是指...

AIGC 2024-01-07 人工智能

1710阅读

分享38个AI绘画网站

本文是参考AI沉思录「1000AI」栏目的第十二期，「1000AI」栏目专注研究有哪些AI产品，目标研究1000+AI产品(进度:532/1000 。 AI沉思录 aichensilu.com/ 1、Midjourney 网址：https://www....

AIGC 2024-01-07 人工智能

2649阅读

一张图500元是目前AIGC最高“回报”？小冰李笛：调用API的商业模式不适用于未来 | MEET 2024

AIGC在商业界中，最大的一笔回报是多少? 答案可能是:一张图片，500元。而且这就是发生在最近、号称人工智能著作权第一案的真实案例: 这个案子出来之后，引发了很多人都会讨论，认为它会不会对法学界、对人工智能的著作权、版权等问题的实践具有一些新的指导意...

大数据 2024-01-07 人工智能

878阅读

Stable Diffusion实现之 Huggingface

Stable Diffusion 以及Huggingface的安装实现介绍： Stable Diffusion AI是指将Stable Diffusion模型应用于人工智能领域的相关技术和方法。通常情况下，Stable Diffusion AI主...

大数据 2024-01-07 人工智能

1171阅读

[NLP] 使用Llama.cpp和LangChain在CPU上使用大模型-RAG

一准备工作下面是构建这个应用程序时将使用的软件工具: 1.Llama-cpp-python 下载llama-cpp, llama-cpp-python [NLP] Llama2模型运行在Mac机器-CSDN博客 2、LangChain L...

大数据 2024-01-07 人工智能

976阅读

20分钟，使用Amazon SageMaker快速搭建属于自己的AIGC应用

真火！作为最近一段时间人工智能领域内的顶流之一，AIGC（AI-Generated Content）早已火爆出圈，频登各大互联网平台热搜。 cite: 微软亚洲研究院官方微博这段时间以来，基于深度学习的内容生成在图像、视频、语音、音乐、...

大数据 2024-01-07 人工智能

826阅读

攻克图像「文本生成」难题，碾压同级扩散模型！两代TextDiffuser架构深度解析

近年来，文本生成图像领域取得了显著进展，尤其是基于扩散（Diffusion）的图像生成模型在细节层面上展现出逼真的效果。然而，一个挑战仍然存在：如何将文本准确地融入图像。生活中存在大量的「含文本图像」，从广告海报到书籍封面，再到路牌指示，都包含了重要...

生成式AI 2024-01-06 人工智能

912阅读

当LLM学会左右互搏，基础模型或将迎来集体进化

金庸武侠小说中有一门武学绝技：左右互搏；乃是周伯通在桃花岛的地洞里苦练十余年所创武功，初期想法在于左手与右手打架，以自娱自乐。而这种想法不仅能用来练武功，也能用来训练机器学习模型，比如前些年风靡一时的生成对抗网络（GAN）。进入现今的大模型 (LLM ...

大数据 2024-01-06 人工智能

904阅读

【强烈推荐】十多款2023年必备国内外王炸级AI工具 (免费精品好用) 让你秒变神一样的装逼佬感受10倍生产力 (3) AI绘画我的天,淘汰原画师的神器来了，赶紧闪!

? 个人主页极客小俊 ✍? 作者简介：web开发者、设计师、技术分享博主 ? 希望大家多多支持一下, 我们一起进步！? ? 如果文章对你有帮助的话，欢迎评论 ?点赞?? 收藏 ?加关注 AI 绘画 AI人工智能不仅可以处理图片和声音，在绘画...

人工智能 2024-01-06 人工智能

891阅读

AI绘画部署-Stable Diffusion（huggingface API图片生成初体验）

引言最近，在很多地方都看到了各个大佬用AI生成的神图，索性从网上搜集资料部署一下体验一下AI绘画的魅力。本文基于huggingface API在colab上构建AI绘画。使用步骤 1.huggingface原始环境地址 https://c...

生成式AI 2024-01-06 人工智能

1249阅读

Github爆火AI语音克隆项目OpenVoice，精准进行声音复刻

最近，Github上的一个名为OpenVoice的AI语音克隆项目爆火，该项目由myshell-ai开源，仅开源了不到三周，就有了6.1k的star。 OpenVoice仅需参考说话者的短音频片段，即可复制其声音并生成多种语言的语音。这一技术不仅实现了对音...

人工智能 2024-01-05 人工智能

1337阅读

多模态运动语言模型MotionGPT 可将语言指令转换为3D人体运动

MotionGPT是一款令人惊叹的技术创新，它统一了语言和运动，将语言指令转换为引人入胜的3D人体运动。这一模型的设计灵感源于即时学习，通过混合运动语言数据进行预训练，并通过基于提示的问答任务进行微调，使其具备卓越的性能。项目地址:https://hu...

生成式AI 2024-01-05 人工智能

855阅读

开源语音识别faster-whisper部署教程

1. 资源下载源码地址模型下载地址： large-v3模型：https://huggingface.co/Systran/faster-whisper-large-v3/tree/main large-v2模型：https://huggingf...

生成式AI 2024-01-05 人工智能

1885阅读

大模型在cpu上使用llama_cpp部署无法加载模型的问题

from llama_cpp import Llama model = Llama(model_path="llama-2-7b-chat.ggmlv3.q4_0.bin" 错误：gguf_init_from_file: invalid magi...

AIGC 2024-01-05 人工智能

2444阅读

[linux-sd-webui]api化之训练lora

lora的训练使用的文件是https://github.com/Akegarasu/lora-scripts lora训练是需要成对的文本图像对的，需要准备相应的训练数据。 1.训练数据准备使用deepbooru/blip生成训练数据，建筑类建议使...

AIGC 2024-01-04 人工智能

1036阅读

HandRefiner：解决AI生图手部畸形难题

HandRefiner是一种可以修正形状不正常的手部图像的方法。在生成图像方面，目前的图像生成模型已经非常出色，但是在生成人类手部的图像时常常会出现问题，例如手指数量不对或者手形怪异。为了解决这个问题，HandRefiner提出了一种条件修补方法，可以在...

生成式AI 2024-01-04 人工智能

945阅读

【AI图像生成】Python初学者能够以爆炸性的速度上手主题StableDiffusion

? 这应该是本站最好的人工智能资料库 ? 本文由 EasyAI 原创，首发于 CSDN? ⌚️ 欢迎点赞 ? 收藏 ⭐留言 ? 如有错误敬请指正！ ?未来很长，值得我们全力奔赴更美好的生活✋ 介绍我能够使用 GoogleColabo...

生成式AI 2024-01-04 人工智能

793阅读

版权过期后，米老鼠SD模型上线以后可以放心用AI画米老鼠了

日前，迪士尼旧版米老鼠的版权正式过期，这意味着任何人都可以自由使用旧版米老鼠形象。 AI圈的开发者们手速也不可小觑，这不，才刚宣布过期没多久，他们就已经推出了米老鼠的SD模型Mickey-1928。 Mickey-1928是一个基于Stable-Diff...

人工智能 2024-01-03 人工智能

886阅读

stable diffusion（安装以及模型的初步使用）

本机的配置能跑模型，本地也跑过一点Lora训练的脚本，看看几个效果：以上的都是配合huggingface有的模型结合civitai上的Lora模型在本地跑出来的图片，自己本地训练的Lora太拉闸了，就不放上来了…… 1....

生成式AI 2024-01-03 人工智能

967阅读

阿里AI项目DreamTalk开源可让人物头像说话

阿里巴巴宣布其项目DreamTalk已经开源。这个项目可以让人物照片说话，支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配。模型下载地址:https://huggingface.co/damo-vilab/dreamtalk 项目地址:htt...

大数据 2024-01-03 人工智能

786阅读

[AI绘画] 即插即用！SDXL+T2I-Adapters 高效可控的生成图片

标题：T2I-Adapter: Learning Adapters to Dig out More Controllable Ability for Text-to-Image Diffusion Models 论文：https://arxiv....

人工智能 2024-01-03 人工智能

1100阅读

MyShell发布开源AI语音克隆工具OpenVoice，瞄准语音模仿领域

MyShell最新推出的开源语音克隆工具OpenVoice引起了广泛关注。这一创新产品由麻省理工学院（MIT）、清华大学以及加拿大人工智能初创公司MyShell合作开发。OpenVoice采用了一种概念简单但高效的方法，可几乎即时克隆用户的语音，并使用明显...

大数据 2024-01-03 人工智能

1087阅读

利用Lama Cleaner本地实现AIGC试玩：擦除对象、替换对象、更换风格等等

目录一、安装二、擦除功能 1. LaMa模型实操实例一：去除路人实操实例二：去水印实操实例三：老照片修复 2. LDM模型 3. ZITS模型 4. MAT模型 5. FcF模型 6. Manga模型三、替换对象功能 1....

生成式AI 2024-01-03 人工智能

2504阅读