medium 第2页 - AIGC资讯

【AIGC绘画】Midjourney关键词分享（三）：构图/视角关键词

前言 Midjourney构图和视角关键词的作用在于帮助我们在创作过程中更好地规划和实现视觉作品。一、Midjourney构图和视角关键词的作用 1. 构图技巧 (Composition Techniques 引导视觉焦...

AIGC 2024-07-18 人工智能

1628阅读

Stable Diffusion 3 ComfyUI基础工作流保姆级详解 | 全网最全SD3解析

引言 Stable Diffusion 3 已经发布！就在 6 月 12 日，Stable Diffusion 3 的媒体模型终于开放下载。虽然在 Web UI 上还没有提供体验可以体验的方式，但我们已经可以通过Comfy UI来尝试最新的 Stable...

人工智能 2024-07-15 人工智能

1518阅读

零代码教你安装部署Stable Diffusion 3，一键生成高质量图像

本文分享自华为云社区《重磅！【支持中文】stable-diffusion-3安装部署教程-SD3 来了》，作者：码上开花_Lancer。正如承诺的那样，Stability AI在6月12日正式开源了Stable Diffusion 3（Medium版本...

大数据 2024-07-15 人工智能

923阅读

搭建本地whisper语音识别

目录代码仓库编辑选择模型环境配置语音识别测试 Whisper是一个通用的语音识别模型。它是在不同音频的大型数据集上训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。代码仓库 GitHub - ope...

AIGC 2024-07-13 人工智能

3084阅读

Meta Llama 3 来啦！性能算力究竟如何？

新一代大语言模型 Meta Llama 3 横空出世！前言就在4月19日，Meta公司推出了他们最新开源的大型语言模型(LLM Llama 3！这次的Llama 3包含了8B和70B两种不同参数规模的模型。那么作为Llama的第三代模型它...

大数据 2024-07-09 人工智能

892阅读

好像也没那么失望！SD3玩起来，Stable Diffusion 3工作流商业及广告设计（附安装包）

今天基于SD3 base 工作流来尝试进行下广告设计，这要是一配上设计文案，视觉感就出来了。下面来看看一些效果展示~ SD3 Medium模型及ComfyUI工作流下载地址：文末领取！ 1.清凉夏日——西瓜音乐会提示词： a guitar with...

大数据 2024-07-07 人工智能

920阅读

最强开源模型来了！一文详解 Stable Diffusion 3 Medium 特点及用法

前言最强开源模型来了！一文详解 Stable Diffusion 3 Medium 特点及用法（附模型资源包）大家好，我是AI绘画小33~ 备受期待的 Stable Diffusion 3（以下简称 “SD3”）终于向公众开放了，作为 Stab...

人工智能 2024-07-07 人工智能

1425阅读

whisper.cpp 学习笔记

whisper.cpp whisper.cpp 学习笔记 whisper 介绍源码下载源码编译支持的模型优化/加速生成库文件使用 whispe.cpp 的 demo 参考文献 whisper.cpp 学习笔记...

大数据 2024-07-07 人工智能

1431阅读

[AI里程碑]StableDiffusion3今日开源 | 首个开源超越Midjourney

⚡[AI里程碑]StableDiffusion3今日开源 | 首个开源超越Midjourney 2024年6月12日，Stable Diffusion 3 Medium的开源代表了生成式 AI 发展的一个重要里程碑。 StableDiffu...

生成式AI 2024-07-07 人工智能

989阅读

Stable-Diffusion 3 详细安装教程

文章目录 1、下载 ComfyUI 控制面板 1.1 如何打开ComfyUI 2、下载大模型 2.1 下载Stable-Diffusion 3 大模型 2.2 下载其它模型 3、下载 ComfyUI 汉化包 3.1 如何设置使用 4、亲身示...

生成式AI 2024-07-06 人工智能

1141阅读

2024最新Stable Diffusion【插件篇】：SD提示词智能生成插件教程!

前言今天我们介绍几款可以自动生成提示词的插件。所谓智能生成提示词，就是我们只需要输入非常少量的关键字，插件就会根据关键词提示信息帮助我们生成一系列关键字或者句子作为提示词。下面来和我一起看看吧。一. SD智能提示词工具之前的文章中和大家分享过...

大数据 2024-07-06 人工智能

2823阅读

[AI Stability] 开源AI新利器：Stable Diffusion 3 Medium震撼发布！文本到图像再升级！

Stable Diffusion 3 Medium(SD3 开源了，我们来看下。关键要点 Stable Diffusion 3 Medium 是 Stability AI 迄今为止最先进的文本到图像开源模型。该模型的体积小巧，非常适合在消费级...

人工智能 2024-07-06 人工智能

836阅读

Stable Diffusion 3 开源发布可下载体验

本文来自huggingface翻译 Stable Diffusion 3 Medium是一种多模态扩散变换器 (MMDiT 文本到图像模型，其在图像质量、排版、复杂提示理解和资源效率方面的性能有极大提升。有关更多技术细节，请参阅研究论文。请注意：此...

人工智能 2024-07-06 人工智能

979阅读

AI绘画Stable Diffusion到底有几个版本？超全SD历史发布版本优缺点解析

大家好，我是设计师阿威 Stable Diffusion 在推出短短两年间已经发布了多个版本，最为人熟悉的就是 Stability AI 推出的 1.5 和 SDXL。那么除此之外，还有哪些版本呢？让我们从最初 Stable Diffusion 的起源开...

AIGC 2024-07-05 人工智能

6099阅读

文生图王者登场：Stable Diffusion 3 Medium正式开源

今年2月，Stability.ai发布了Stable Diffusion 3预览版，在多主题提示、图像质量和拼写能力方面具有显著的性能提升。Stable Diffusion 3是一个系列模型，参数量从800M到8B不等。 6月12日，Sta...

大数据 2024-07-04 人工智能

849阅读

Stable Diffusion 3 文本生成图像在线体验原理分析

前言本文分享使用Stable Diffusion 3实现文本生成图像，可以通过在线网页中免费使用的，也有API等方式访问。同时结合论文和开源代码进行分析，理解其原理。 Stable Diffusion 3是Stability AI开发的最新、最先...

大数据 2024-07-04 人工智能

1331阅读

【AIGC半月报】AIGC大模型启元：2024.06（上）

AIGC大模型启元：2024.06（上） (1 ChatTTS（语音合成项目） (2 Mamba-2（大模型新架构Mamba升级） (3 GLM-4 9B（智谱开源LLM） (4 Seed-TTS（字节语音合成） (5 QWen2（阿...

大数据 2024-07-04 人工智能

1206阅读

欢迎 Stable Diffusion 3 加入 Diffusers

作为 Stability AI 的 Stable Diffusion 家族最新的模型，Stable Diffusion 3(SD3 现已登陆 Hugging Face Hub，并且可用在 ? Diffusers 中使用了。 Stable Dif...

大数据 2024-07-04 人工智能

874阅读

Stable Diffusion 3 大模型文生图“开源英雄”笔记本部署和使用教程，轻松实现AI绘图自由

备受期待的Stable Diffusion 3（以下亦简称SD3）如期向公众开源了（Stable Diffusion 3 Medium），作为Stability AI迄今为止最先进的文本生成图像的开源大模型，SD3在图像质量、文本内容生成、复杂提示理解和资...

人工智能 2024-07-04 人工智能

1167阅读

【ComfyUI】Stable Diffusion 3 加Controlnet

基于 instantX-research/diffusers_sd3_control: ? Diffusers: State-of-the-art diffusion models for image and audio generation in PyT...

生成式AI 2024-07-02 人工智能

981阅读

AI绘画Stable Diffusion SDXL 最新万能大模型更新！高质量“万能”大模型筑梦工业XLV5.0来啦！！

大家好，我是向阳关于“筑梦工业”模型，相信了解AI绘画的家人们应该并不陌生，我个人觉得是一款不错的“万能”类型的大模型。今天就给大家带来了该模型的最新版本——**Dream Tech XL | 筑梦工业XL v5.0 - 与光同尘。**该模型于5月27...

大数据 2024-07-02 人工智能

2078阅读

【小沐学AI】Python实现语音识别（faster-whisper）

文章目录 1、简介 1.1 CTranslate2 1.2 Intel MKL 1.3 cuDNN 1.4 Transformer 2、下载和安装 2.1 命令行 2.2 代码 3、模型下载 3.1 在线测试 3.1.1 tiny...

生成式AI 2024-07-02 人工智能

2338阅读

【机器学习】FFmpeg+Whisper：二阶段法视频理解（video-to-text）大模型实战

目录一、引言二、FFmpeg工具介绍 2.1 什么是FFmpeg 2.2 FFmpeg核心原理 2.3 FFmpeg使用示例三、FFmpeg+Whisper二阶段法视频理解实战 3.1 FFmpeg安装 3.2 Whisper模型下载...

人工智能 2024-07-02 人工智能

1148阅读

掌握Midjourney视觉艺术的关键提示词指南

在数字艺术的海洋中，Midjourney以其独特的图像生成能力脱颖而出，为艺术家和创意工作者提供了前所未有的创造自由。要真正掌握这一工具，理解并有效使用各种提示词至关重要。本文将深入探索Midjourney中的“风格关键词”、“场景关键词”、“视觉关键词”...

AIGC 2024-07-02 人工智能

1379阅读

Stable Diffusion 3上线：登顶最强开源AI绘画模型，笔电手机都能跑丨大量实测

万众瞩目的Stable Diffusion 3终于正式开源了！目前开源的是20亿参数的版本，据悉之后还会开源40亿和80亿的“大杯”与“超大杯”。最近母公司Stability AI的坏消息连连，据传账面现金都不够支付算力服务器的租赁费。欠债一亿...

人工智能 2024-07-02 人工智能

880阅读

AI绘画人物（头像）设计提示词大全

1、年龄性别 age sex 中文英文中文英文幼年，男 Childhood, male 少年，女 Adolescence, female 幼年，女 Childhood, female 青年，男 Youth, male 少年，男...

AIGC 2024-07-01 人工智能

4389阅读

Whisper.cpp 0基础搭建音频文件转文字(Windows下C++)

介绍 whisper.cpp是一个开源项目，它是对OpenAI的Whisper模型的C/C++移植实现。 OpenAI的Whisper是一个自动语音识别（ASR）系统，经过大量多语言和多任务的监督数据训练，能够进行多语言语音识别、语音翻译和语言识别等任...

人工智能 2024-07-01 人工智能

1548阅读

Stable Diffusion 3 大模型文生图实践

windows教程2024年最新Stable Diffusion本地化部署详细攻略，手把手教程（建议收藏!! _stable diffusion 本地部署-CSDN博客 linux本地安装教程 1.前期准备工作 1）创建conda环境 cond...

大数据 2024-06-30 人工智能

933阅读

【机器学习】Whisper：开源语音转文本（speech-to-text）大模型实战

目录一、引言二、Whisper 模型原理 2.1 模型架构 2.2 语音处理 2.3 文本处理三、Whisper 模型实战 3.1 环境安装 3.2 模型下载 3.3 模型推理 3.4 完整代码 3.5 模型部署四、总结...

AIGC 2024-06-29 人工智能

1482阅读

AI绘画SD3已来，本地首发实测体验，含本地部署说明（内附网盘模型及ComfyUI工作流下载）

大家好，我是画画的小强 SD3已来，Stability AI 此前宣布SD3将于6月12开源20 亿参数的SD3 模型SD3 Medium，昨天它已如期而至了。根据官方内容所了解，SD3 Medium 可以说是目前很先进的文本到图像开放模型，包含 2...

AIGC 2024-06-29 人工智能

1200阅读

Stable Diffusion 3 使用指南：安装与实例详解

Stable Diffusion 3 使用指南：安装与实例详解 Stable Diffusion 3（SD 3）终于来了！作为最新版本的图像生成模型，SD 3 在功能和性能上都有了显著提升。本文将带你深入了解 SD 3 的用法和安装指导，帮助你快速上手...

生成式AI 2024-06-27 人工智能

1052阅读

python AI应用之win10本地部署Whisper AI(视频/语音文件自动转字幕)

首先在win10上安装配置python,参考我这个帖子，点此进入去git官网下载windows 版，安装git！点此进入然后安装whisper和openai-whisper : python -m pip install --upgrad...

AIGC 2024-06-27 人工智能

906阅读

喜大普奔，AI绘画SD3终于开源了，AI绘画又添新利器！【附模型下载和安装包】

sd3终于开源了！没错就是stablediffusion 3.0版本！这是stability迄今为止最先进最复杂图像生成模型。这次开源的是medium版本，总共有三个型号的模型，下面我们来详细的说下sd3的功能特点以及不同型号区别、安装方法！首...

生成式AI 2024-06-27 人工智能

1534阅读

Stable diffusion 3 正式开源

6月12日晚，著名开源大模型平台Stability AI正式开源了，文生图片模型Stable Diffusion 3 Medium（以下简称“SD3-M”）权重。 SD3-M有20亿参数，平均生成图片时间在2—10秒左右推理效率非常高，同时对硬件的需求...

生成式AI 2024-06-26 人工智能

988阅读

重磅发布！Stable Diffusion 3 Medium 终于开源，革新图像生成技术新时代

重磅发布！Stable Diffusion 3 Medium 终于开源，革新图像生成技术新时代关键词：Stable Diffusion 3 Medium, MMDiT, 文本到图像模型, 图像质量, 排版, 复杂提示理解, 资源效率原...

AIGC 2024-06-26 人工智能

911阅读

微软发布Phi-3 Mini，性能媲美GPT-3.5、Llama-3，可在手机端运行

前言微软发布了最新版的Phi系列小型语言模型(SLM - Phi-3。这个系列包括3个不同参数规模的版本：Phi-3 Mini (38亿参数、Phi-3 Small (70亿参数和Phi-3 Medium (140亿参数。 Phi系列模型是微...

大数据 2024-06-26 人工智能

1089阅读

Stable Diffusion提示词篇

【视觉描述】正面面对 straight - on 侧边视角 from side 高位视角 from above 背后视角 from behind 背后焦点 back focus 低位视角 from below 侧下 from the Side below...

AIGC 2024-06-25 人工智能

1452阅读

微软大模型phi-3速览-3.7B比llama-3 8B更好？

背景模型发布者：Microsoft 模型发布时间：2024年4月23日发布内容：介绍了phi-3系列语言模型，包括phi-3-mini、phi-3-small和phi-3-medium。重点关注：整体性能可与 Mixtral 8x7B...

AIGC 2024-06-25 人工智能

1212阅读

Midjourney + SD 做场景图太香了

Midjourney V6 生成的图片细节逼真，堪比真实摄影。它可以解决绝大多数商业上的场景图需求。从此再也不必专门为了场景而去拍摄照片了。资料在文末获取。可是，光有场景很难实现商业上的落地。如何把产品很自然地融入其中才是关键！这时候 Stable D...

大数据 2024-06-24 人工智能

1289阅读

Stable Diffusion 3 如何下载安装使用及性能优化

Stable Diffusion 3 Stable Diffusion 3（SD3），Stability AI最新推出的Stable Diffusion模型系列，现在可以在Hugging Face Hub上使用，并且可以与Diffusers一起使用。...

AIGC 2024-06-24 人工智能

1319阅读

Stable Diffusion 3 Medium 正式开源，用户对此产品评价如何？

前两天 Stability.AI 终于开源了 Stable Diffusion 3，虽然只是中杯的 Medium 版本，没有放出当初宣布的 8B 版本[1]，但也在很多方面取得了进步。本想第一时间尝鲜测试，但这几天出差在外，使用颇不方便。正好老朋友揽睿...

AIGC 2024-06-24 人工智能

1277阅读

SD3开源：AI绘画的新纪元，出图效果巨好，不容错过！（附教程）

大家好，我是画画的小强。这两天，Stability AI 将史上最牛的AI绘画模型SD3开源了，真是有格局！虽说只是中杯的20亿参数版本，但我已经很满足了，再高的版本，我这普通的16G 4070Ti Super 显卡也跑不起来… 话不多说，这...

生成式AI 2024-06-23 人工智能

1317阅读

老电脑焕发第二春，玩转 Stable Diffusion 3

几年前，我头脑一热，配置了一台顶配级消费 PC（RTX 2080 Ti GPU + i9 CPU），打算用来学习 AI。然而，起初我并没有找到合适的切入点。深度学习早期阶段，消费级显卡根本无法承担训练大模型、微调大模型，甚至连运行大模型都很吃力。结果...

人工智能 2024-06-23 人工智能

1036阅读

Stable Diffusion 字体和场景结合【把四季藏在海里】

把四季藏在海里，话不多说，上教程。一、花瓣找字打开花瓣找下字，也可以自己做，我不会，谢谢。本文用到的字，版权归原作者所有。白底黑字：那么就是浪花占主要部分，字就是海的效果，但是黑字会导致海很暗。蓝底蓝字：白色浪花占主要部分，字是...

人工智能 2024-06-23 人工智能

857阅读

Whisper开源免费的语音识别：OpenAI如何用AI改变字幕制作与语音理解的未来！

OpenAI的Whisper语音识别系统的用途广泛且强大，主要包括但不限于以下几点：会议和讲座记录转写：Whisper可以帮助学生和职场人士快速将会议、讲座或课堂的录音转换成文字稿，便于复习、整理笔记或分享内容。视频字幕生成：对于电影和电视节...

生成式AI 2024-06-22 人工智能

1434阅读

ChatGPT开源的whisper音频生成字幕

1、前言好了，那接下来看一下whisper开源库的介绍有五种模型大小，其中四种仅支持英语，提供速度和准确性的权衡。上面便是可用模型的名称、大致的内存需求和相对速度。如果是英文版的语音，直接想转换为英文。本来我是想直接在我...

生成式AI 2024-06-22 人工智能

917阅读

Stable Diffusion的本地部署教程

以下是在Windows 10电脑上的操作步骤：一、下载安装包从以下夸克网盘下载地址下载安装包到本地，地址如下：链接：https://pan.quark.cn/s/7c51556d27eb 提取码：cFdx 输入提取码之后，界面如下图：...

大数据 2024-06-22 人工智能

1230阅读

Stable Diffusion 3 真正来了

在人工智能应用领域，文生图（Text-to-Image）一直是一个重要的研究领域。通过将文本描述转换为对应的图像，广泛应用在艺术创作、广告设计、游戏开发等工作中。在众多的文生图模型中，Stable Diffusion 因其高质量的图像生成能力、...

人工智能 2024-06-21 人工智能

859阅读

CSDN首发！Stable Diffusion 3 Medium 开源，AI 生图格局迎来巨变

就在刚刚，Stable Diffusion 3 Medium 如约而至。几天前，Stability AI 在社交平台 X 上官宣，SD3 Medium 将在 6 月 12 日正式开源。这一次，没有跳票，它是真的来了。 20 亿参数大小，笔记本...

生成式AI 2024-06-20 人工智能

879阅读

Midjourney绘画风格关键词总结

我们初次使用AI绘图时，可能会对如何使用关键词营造画面感到迷茫，很多参数需要在提示词中设置，尤其多小白来说不是很好友。所以，掌握一些简单的语法和技巧很重要，下面我们将根据不同的风格列举常用的高质量关键词。 1. 风格关键词 Ink style ...

AIGC 2024-06-20 人工智能

1731阅读