-
Stable Diffusion本地化部署详细攻略
一、硬件要求 内存:至少16GB 硬盘:至少60GB以上的磁盘空间,推荐SSD固态硬盘 显卡:推荐NVIDIA显卡 显存:至少4GB Stabl Diffusion因为是在本地部署,对显卡的要求比较高,如果经济能力可以的话,建议购买一块性能较好...
-
AIGC 007-E4T基于编码器的域调优用于文本到图像模型的快速个性化!
AIGC 007-E4T基于编码器的域调优用于文本到图像模型的快速个性化! 文章目录 0 论文工作 1 论文方法 2 效果 0 论文工作 这篇论文提出了一种使用领域特定编码器来快速将文本到图像模型适配到新领域的方案...
-
2024最新Stable Diffusion【插件篇】:SD提示词智能生成插件教程!
前言 今天我们介绍几款可以自动生成提示词的插件。所谓智能生成提示词,就是我们只需要输入非常少量的关键字,插件就会根据关键词提示信息帮助我们生成一系列关键字或者句子作为提示词。下面来和我一起看看吧。 一. SD智能提示词工具 之前的文章中和大家分享过...
-
Llama 3 超级课堂 作业
1.web demo部署 环境配置 conda create -n llama3 python=3.10 conda activate llama3 conda install pytorch==2.1.2 torchvision==0.16.2...
-
[AI Stability] 开源AI新利器:Stable Diffusion 3 Medium震撼发布!文本到图像再升级!
Stable Diffusion 3 Medium(SD3 开源了,我们来看下。 关键要点 Stable Diffusion 3 Medium 是 Stability AI 迄今为止最先进的文本到图像开源模型。 该模型的体积小巧,非常适合在消费级...
-
Stable Diffusion 3 开源发布可下载体验
本文来自huggingface翻译 Stable Diffusion 3 Medium是一种多模态扩散变换器 (MMDiT 文本到图像模型,其在图像质量、排版、复杂提示理解和资源效率方面的性能有极大提升。 有关更多技术细节,请参阅研究论文。 请注意:此...
-
LLaMA 2-原理&模型&训练-你懂了吗?
LLaMA 2的原理 LLaMA 2是Meta AI开发的大型语言模型,它基于Transformer架构,采用了自注意力机制来处理输入序列中的长期依赖关系。LLaMA 2的核心原理包括自注意力机制、多头注意力、层归一化和残差连接等,这些技术共同使得模型...
-
AI绘画入门基础之描述关键词(提示词)需要遵循什么逻辑?
简单来说总结为一句话:就是告诉AI,你要画什么东西,东西长什么样,用什么画法绘画。 1. 概念性与详细性: 使用这么多AI绘画工具创作图片以来,其实有时候根据一些中文概念词语也能生成一些不错的画风图片,例如形容词,四字成语,当然这只是针对风景画...
-
全球最轻薄AIPC!荣耀MagicBook Art 14将首发鲁班架构
快科技7月5日消息,荣耀将在7月12日召开新品发布会,除了Magic V3折叠屏旗舰之外,还将推出一款极致轻薄的笔记本MagicBook Art 14。 在今天下午的沟通会上,荣耀介绍MagicBook Art 14将首次搭载荣耀鲁班架构,首次将折叠手机领...
-
语音识别教程:Whisper
语音识别教程:Whisper 一、前言 最近看国外教学视频的需求,有些不是很适应,找了找AI字幕效果也不是很好,遂打算基于Whisper和GPT做一个AI字幕给自己。 二、具体步骤 1、安装FFmpeg Windows: 进入 ht...
-
专家:即使国产AI芯片单个算力不强 也能通过综合手段提升算力
快科技7月6日消息,世界人工智能大会(WAIC)在上海盛大举行,会议主题为智造数字劳动力,打造新质生产力”。 壁仞科技副总裁兼AI软件首席架构师丁云帆在论坛中发表演讲,提出当前解决算力瓶颈问题需要综合考虑硬件集群算力、软件有效算力以及异构聚合算力三个维度。...
-
Stable Diffusion图像的脸部细节控制——采样器全解析
文章目录 艺术地掌控人物形象 好易智算 原因分析 为什么在使用Stable Diffusion生成全身图像时,脸部细节往往不够精细? 解决策略 局部重绘 采样器 总结 艺术地掌控人物形象 在运用Stable Diffusion...
-
保姆级Midjourney入门教程,快速上手: 从注册到出图
话不多说,赶紧帮大家快速了解并用上 AI 绘图里的实用性最强的 Midjourney(简称 MJ)。 文章大纲 00 - Midjourney团队简介 01 - Midjourney团队简介 02 - Midjourney注册大法 03 - Mi...
-
【全开源】Java AI绘画MJ绘画源码小程序APP公众号源码AI绘图
🎨 探索AI绘画的奥秘 一、引言:AI绘画的魅力 🌈 在这个数字化飞速发展的时代,AI绘画已经不再是遥不可及的梦想。通过源码小程序,我们可以轻松探索AI绘画的奥秘,感受科技与艺术的完美结合。今天,就让我们一起走进AI绘画的世界,探索其中的无限可能!...
-
10款AI绘画工具介绍,让你的绘画变得更简单
AI绘画工具是利用人工智能技术进行绘画创作的工具,近年来随着人工智能技术的发展,AI绘画已经成为一个独立的领域,并且在艺术、设计等多个领域得到了广泛应用。以下是一些常见的AI绘画工具介绍: 1:Stable-Diffusion(SD)/ SDXL1.0...
-
Stable Diffusion【真人模型】:人像光影摄影极限写实真实感大模型
大家好,我是极客菌 今天和大家分享一个基于SD1.5的真人大模型:人像光影摄影极限写实真实感大模型。 该模型具有以下特点: 真实肤感(在面部肌理和皮肤肌理上均有加强学习,拒绝ai出图假的问题) 永不脱妆(在不写正面妆容关键词的情况下,永远自带...
-
【Stable Diffusion 3】本地部署SD3详细教程
👋 Hi, I’m @Beast Cheng 👀 I’m interested in photography, hiking, landscape… 🌱 I’m currently learning python, javascript, kotlin…...
-
Faster-whisper+silero-vad 实时语音转录
环境搭建 需要使用cuda 在 cmd 控制台里输入 nvidia-smi.exe 以查看显卡驱动版本和对应的 cuda 版本 前往 NVIDIA-CUDA 官网下载与系统对应的 Cuda 版本 以 Cuda-11.7 版本为例,根据自己的...
-
AIGC:生成式模型简介
AIGC:生成式模型简介 变分自编码器(VAE) 生成对抗网络(GAN) 自回归模型(Autoregressive Model) 流模型(Flow Model) 扩散模型(Diffusion Model) 此博客将从原理、优点和缺点几...
-
推荐大模型书籍|《从ChatGPT到AIGC:智能创作与应用赋能》
自2023年以来,AI聊天机器人ChatGPT火爆互联网,其颠覆性的使用体验重塑了人们对于AI的认知。而ChatGPT背后的技术―AIGC也引起了互联网圈的关注,打开了人们对AI应用的想象空间。本书从ChatGPT入手,以AIGC为中心,对AIGC的理论知...
-
全网都在找的Stable Diffusion本地部署教程(小白100%成功)
1、Stable Difussion是完全免费的,部署在自己本地电脑上使用即可,软件完全免费,但是算力不免费,这就主要牵扯到显卡GPU上,当然cpu也有关系,但是关系比较小。 2、查看自己电脑相关配置信息,在电脑底部搜索栏搜索“任务管理器” 显卡(N卡)...
-
使用LLaMA-Factory微调Llama3大模型
一、基础模型下载 本文的背景是微调一个基于Llama3的中文版模型Llama3-8B-Chinese-Chat,用于中文指定领域的问答下游任务 1、HuggingFace官网直接下载 官网地址:https://huggingface.co/mo...
-
最新AI大模型系统源码,ChatGPT商业运营版系统源(详细图文搭建部署教程)+AI绘画系统,DALL-E3文生图, Whisper & TTS 语音识别,文档分析
一、前言 人工智能语言模型和AI绘画在多个领域都有广泛的应用..... SparkAi创作系统是一款基于ChatGPT和Midjourney开发的智能问答和绘画系统,提供一站式 AI B/C 端解决方案,涵盖AI大模型提问、AI绘画、文档分析、图...
-
从0到1,为ASP.NET Core项目添加redis支持(全程使用copilot编码)
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、需求背景 二、询问copilot工作流 1.简单询问 2.细节询问 3.代码定制化 三、最终验证 总结 前言 最近做需求需要用到...
-
低代码与AIGC实战:引领软件开发的新风潮
随着信息技术的迅猛发展,软件开发已成为各行各业不可或缺的一环。近年来,低代码平台与人工智能生成代码(AIGC)技术的崛起,为软件开发带来了革命性的变革。本文将深入探讨低代码与AIGC实战的应用,分析它们如何助力软件开发更高效、便捷,并推动整个行业向前发展。...
-
小狗伪原创在哪,小狗AI仿写智能写作词典
在数字时代,内容创作已成为我们生活中不可或缺的一部分。然而,对于许多创作者来说,创意枯竭和重复内容的问题常常令人困扰。这时,一款名为“小狗伪原创”的智能写作工具应运而生,为创作者们带来了全新的写作体验。 小狗伪原创基于百度智能大脑和NLP自然语言处理...
-
金山WPS AI 2.0正式发布!新增AI写作等4个办公助手
快科技7月5日消息,今天,在2024世界人工智能大会上,金山办公WPS AI 2.0正式发布,同时还首次公开了金山政务办公模型1.0,一个13B级别的政务自研模型。 WPS AI 2.0为个人用户新增了四个AI办公助手,包括AI写作助手、AI阅读助手、AI...
-
大模型的实践应用24-LLaMA-Factory微调通义千问qwen1.5-1.8B模型的实例
大家好,我是微学AI,今天给大家介绍一下大模型的实践应用24-LLaMA-Factory微调通义千问qwen1.5-1.8B模型的实例, LLaMA-Factory是一个专门用于大语言模型微调的框架,它支持多种微调方法,如LoRA、QLoRA等,并提供了丰...
-
蚂蚁集团WAIC发布大模型密算平台,助力大模型破解数据供给挑战
大模型向下扎根深入行业,必须要破解高质量数据供给的挑战。7月5日,2024年世界人工智能大会进入第二天,作为数据要素领域的主要技术服务商,蚂蚁集团发布“隐语Cloud”大模型密算平台,通过软硬件结合的可信隐私计算技术,在大模型托管和大模型推理等环节实现数据...
-
AI绘画Stable Diffusion最强控制插件ControlNet 附模型下载
大家好,我是程序员晓晓 Stable Diffusion一直在致力于更精确地控制出图结果,而在这众多的功能中,最突出的要属ControlNet了。 无论是文生图还是图生图,我们更多的是对内容的一个描述,但是如果我们想要更细化一些,比如构图、轮廓、形象姿...
-
腾讯混元文生图开源模型推出小显存版本,仅需6G显存即可运行
7月4日,腾讯混元文生图大模型(混元DiT)宣布开源小显存版本,仅需6G显存即可运行,对使用个人电脑本地部署的开发者十分友好,该版本与LoRA、ControlNet等插件,都已适配至Diffusers库;并新增对Kohya图形化界面的支持,让开发者可以低门...
-
Stable-Diffusion的WebUI部署
1、环境准备及安装 1.1、linux环境 # 首先,已经预先安装好了anaconda,在这里新建一个环境 conda create -n sdwebui python=3.10 # 安装完毕后,激活该环境 conda activate sdweb...
-
AI视频创作一条龙!达摩院“寻光”平台炸场WAIC,突破可控编辑难题
AIGC时代,视频创作这事儿真的不一样了。 就像这样,轻轻一圈,选定目标立刻变身单独图层,再丝滑嵌入不同的背景视频,场景变换so easy~ 想要调整一下镜头角度,交给AI,同样能一键完成: 还能一键消除、修改目标: 后期再也不用加班加到手抽筋(d...
-
[AI视频-suno-V3音乐-AI绘画-AI文本生成-配音]
文章目录 前言 一、SUNO_V3 二、AI 图像生成 工作流 Stable Diffusion 的工作原理 Stable Diffusion 的应用场景 注意事项 三、AI 图像生成--Freeloading 下面这个是我的小号:大家感兴趣...
-
中国版GPT-4o炸场:国内首个流式多模态交互模型,现场实时且丝滑
没等到GPT-4o,商汤先把《Her》给发布出来了! 就在刚刚,商汤直接在现场来了个炸裂的Live Show,话不多说,直接看效果: 不仅声音非常拟人(观众直呼好磁性),而且还是实时、随时可以打断的那种! 它宛如被安上了一对儿眼睛,可以做到精准无误的所见...
-
AI绘图开源工具Stable Diffusion WebUI前端API调用
背景 本文主要介绍 AI 绘图开源工具 Stable Diffusion WebUI 的 API 开启和基本调用方法,通过本文的阅读,你将了解到 stable-diffusion-webui 的基本介绍、安装及 API 环境配置;文生图、图生图、局部重...
-
GaussDB(DWS)性能调优,解决DM区大内存占用问题
本文分享自华为云社区《GaussDB(DWS 性能调优:DM区优化案例——维度表关联条件存在会计期》,作者: O泡果奶~。 当前DM(P1、P3、CBGDM)存在维度表与主表关联时使用会计期作为关联条件,会导致出现大内存占用或未识别数据倾斜的问题...
-
结合RNN与Transformer双重优点,深度解析大语言模型RWKV
本文分享自华为云社区《【云驻共创】昇思MindSpore技术公开课 RWKV 模型架构深度解析》,作者:Freedom123。 一、前言 Transformer模型作为一种革命性的神经网络架构,于2017年由Vaswani等人 提出,并在诸多任务中...
-
AI绘画Stable Diffusion到底有几个版本?超全SD历史发布版本优缺点解析
大家好,我是设计师阿威 Stable Diffusion 在推出短短两年间已经发布了多个版本,最为人熟悉的就是 Stability AI 推出的 1.5 和 SDXL。那么除此之外,还有哪些版本呢?让我们从最初 Stable Diffusion 的起源开...
-
AI日报:百度文心4.0免费开放;AI lab开源超强多模态大模型;对标GPT-4o!商汤发布日日新5o
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、百度文心智能体平台免费开放文心...
-
一文看懂LLaMA 2:大型多模态模型的新里程碑
一文看懂LLaMA 2:大型多模态模型的新里程碑 LLaMA 2是OpenAI继GPT-3之后推出的又一重磅模型,它不仅在文本生成方面有所突破,而且在图像处理和语音识别等领域也展现出了令人印象深刻的能力。本文将全面介绍LLaMA 2的背景、技术细节、应用...
-
ai让照片动起来!爆火的AI“复活”40年前老照片手机就能做!附可灵保姆级教程
最近,AI视频技术在各大平台上又火了一把,特别是那种让老照片动起来的视频,不仅打起了情感牌,还让许多经典电视剧焕发了新生。这种技术把原本静静躺在相册里的照片,通过AI的魔力,变得栩栩如生,仿佛又回到了那个年代。...
-
国产动漫视频AI火了!二次元老婆随意捏,哥特、梦幻、机甲一键get
【新智元导读】视频生成赛道又起新秀,而且还是二次元定制版!稳定产出电影级画面,一键文/图生成视频,即使是「手残党」也能复刻自己喜欢的动漫作品了。 现在,各位二次元萌新们,不用再等「太太」出图啦! 我们不仅可以自己产粮,而且还是会动的那种。 如今,AI视频生...
-
AIGC行业现在适合进入吗?最新AI系统ChatGPT网站源码(SparkAi创作系统)
AIGC行业现在适合进入吗? 在这个信息爆炸的时代,人工智能生成内容(AIGC,Artificial Intelligence Generated Content)正在成为越来越多领域的焦点。从生成文本、图片到音乐和视频,AIGC技术的进步正在重...
-
ChatGPT Web Midjourney一键集成最新版
准备工具 服务器一台 推荐使用浪浪云服务器 稳定 安全 有保障 chatgpt api 推荐好用白嫖的api 项目演示 项目部署 浏览器访问casaos...
-
百度李彦宏称AI跑分刷榜乱象不止:今天震撼发布、明天史诗级更新
快科技7月5日消息,在2024年世界人工智能大会上,百度创始人李彦宏发表了演讲,认为业界过分关注模型的评测分数和规模,而忽视了AI技术真正的价值应用。 李彦宏指出,当前AI领域存在一种不良风气,即各个公司竞相发布新一代大语言模型,宣称自己的模型参数规模和训...
-
有手就行,轻松本地部署 Llama、Qwen 大模型,无需 GPU
用 CPU 也能部署私有化大模型? 对,没错,只要你的电脑有个 8G 内存,你就可以轻松部署 Llama、Gemma、Qwen 等多种开源大模型。 非技术人员,安装 Docker、Docker-compose 很费劲? 不用,这些都不需要安装,就一个...
-
“第三者”苹果插足:微软与OpenAI蜜月期结束
快科技7月5日消息,据媒体报道,微软与OpenAI之间的紧密合作关系,可能因苹果的加入而出现裂痕。 苹果公司将获得OpenAI董事会的一个观察员席位,与微软平起平坐,而微软曾向OpenAI投入130亿美元,以确保在OpenAI董事会中拥有无投票权的观察员席...
-
拥抱 AGI:PieDataCS 引领云原生数据计算系统新范式
自2023年后,人工智能技术进入了一个更为成熟和广泛应用的阶段,人工通用智能(AGI)这一概念也成为了科技界和产业界热议的焦点。本文将结合 AGI 时代背景,从架构设计到落地实践,详细介绍拓数派云原生数据计算系统 PieDataCS。 1 中国...
-
AI老照片视频生成器完全指南:怀旧体验与免费试用入口
探索AI老照片视频生成器能为你带来哪些改变 为什么选择AI老照片视频生成器? AI老照片视频生成器不仅仅是一款产品——它是一项革命性的技术,致力于利用人工智能将用户上传的老照片转换成动态视频。通过先进的图像处理算法,照片中的人物或场景呈现出动态效果,为用...