-
只需3步,使用Stable Diffusion无限生成AI数字人视频(附安装包)
基本方法 搞一张照片,搞一段语音,合成照片和语音,同时让照片中的人物动起来,特别是头、眼睛和嘴。 语音合成 语音合成的方法很多,也比较成熟了,大家可以选择自己方便的,直接录音也可以,只要能生成一个语音文件就行了。 如下图所示 :输入你的文字,选...
-
AI作画算法原理
1.概述 AI作画算法的原理相当复杂,涉及多个领域的知识,包括计算机视觉、机器学习和神经网络等。我们从以下几个方面来描述AI作画算法的基本原理。 2. 数据准备 在数据准备方面,AI作画算法通常需要大量的图像数据作为训练样本。可以是各种各样的艺术...
-
stable diffusion的从安装到使用
stable-diffusion,一个免费开源的文生图软件,文章主要讲怎么从源码开始安装,以及使用的方式 git地址:https://github.com/AUTOMATIC1111/stable-diffusion-webui 本人电脑环境win10...
-
AI绘画SD【写实模型】:LEOSAM HelloWorld 真实感大模型极速版
大家好,我是程序员晓晓。 在中国风格的大模型方面,个人比较喜欢LEOSAM系列。自从字节跳动推出了SDXL-Lightning模型之后,LEOSAM也在第一时间推出了基于HelloWorld SDXL原版结合SDXL-Lightning模型的运行加速版本...
-
x-cmd mod | x whisper - 使用 whisper.cpp 进行本地 AI 语音识别
介绍 Whisper 模块通过 whisper.cpp 帮助用户快速将音频转换为文字。 INFO: whisper.cpp 是一个用 C/C++ 编写的轻量级智能语音识别库,是基于 OpenAI 的 Whisper 模型的移植版本,旨在通过深度...
-
降低AIGC检测的策略与方法
随着人工智能技术的飞速发展,AIGC(Artificial Intelligence Generated Content,人工智能生成内容)已经广泛应用于各个领域。然而,随之而来的是AIGC检测技术的挑战。如何降低AIGC检测成为了一个备受关注的研究课题。...
-
详解AI作画原理:从生成对抗网络到卷积神经网络
人工智能(AI)作画是近年来备受瞩目的领域之一,它不仅为艺术创作带来了全新的可能性,也推动了计算机视觉和深度学习技术的发展。本文将深入探讨AI作画的原理,重点介绍生成对抗网络(GAN)和卷积神经网络(CNN)在作画中的应用,并探讨它们的工作原理以及在实际应...
-
Midjourney从入门到实战:Midjourney制作电影级镜头体验(附prompts)_ai绘画制作的电影视觉特效
?Midjourney是目前主流的一款AI生成图像工具,它风格多样,细节丰富,创作自由,涵盖文生图、图生图、图图结合等模式。对于艺术创作者来说,它可以扩展能力、提高效率,增加创意;对于大众爱好者来说,没有任何美术基础也可以进行艺术创作!本专栏详细介绍了Mi...
-
【ollama】(2):在linux搭建环境,编译ollama代码,测试qwen大模型,本地运行速度飞快,本质上是对llama.cpp 项目封装
关于 ollama 项目 https://github.com/ollama/ollama/tree/main/docs https://www.bilibili.com/video/BV1oS421w7aM/ 【ollama】(2...
-
AI丨部署SadTalker并添加到Stable Diffusion
前言 Stable Diffusion是一种潜在扩散模型(Latent Diffusion Model),能够从文本描述中生成详细的图像。它还可以用于图像修复、图像绘制、文本到图像和图像到图像等任务。 如何配置Stable Diffusion部署本地A...
-
现在适合进入AIGC行业吗?
现在适合进入AIGC行业吗? 随着人工智能生成内容(AIGC)技术的快速发展,越来越多的人开始关注这个行业。那么,现在是否是进入AIGC行业的好时机呢?本文将从行业前景、市场需求以及个人选择与规划三个方向进行探讨。 行业前景 发展前景 AI...
-
llama-factory SFT系列教程 (三),chatglm3-6B 大模型命名实体识别实战
文章目录 文章列表: 简介 装包 数据集 lora 微调 API 部署 大模型预测 评估 缺少数据集 文章列表: llama-factory SFT系列教程 (一 ,大模型 API 部署与使用 llama-factory SFT...
-
图像生成模型浅析(Stable Diffusion、DALL-E、Imagen)
目录 前言 1. 速览图像生成模型 1.1 VAE 1.2 Flow-based Model 1.3 Diffusion Model 1.4 GAN 1.5 对比速览 2. Diffusion Model 3. Stable Diffusi...
-
国产开源Sora上新:全面支持国产AI算力,可用ReVideo视频编辑,北大-兔展团队出品
北大-兔展联合发起的Sora开源复现计划Open-Sora-Plan,今起可以生成最长约21秒的视频了! 生成的视频水平,如下展示。先看这个长一点的,9.2s: 当然了,老规矩,这一次的所有数据、代码和模型,继续开源。 目前,Open-Sora-Plan在...
-
【机器学习结合AI绘画工具】——开启艺术创作的新纪元
目录 一、AI绘画工具的发展历程 二、AI绘画工具的技术原理 实例说明 三、AI绘画工具在艺术创作中的应用 实例网站 四、AI绘画工具的影响与未来展望 结论 机器学习和人工智能(AI)在过去的十年里取得了显著的进展。特别是在艺术创作领...
-
AI绘画Stable Diffusion 高清放大,多种方法详解,建议收藏!
? 本章概述 在Stable Diffusion我们想要得到一张高分辨率且具有细节特征的图片时,我们就需要使用一些图片放大算法来帮助我们实现。 本文主要概述在sd中常常使用的高清修复方法以及不同方法的区别和应用场景。同时也给出一些推荐的工作流,你可以根...
-
llama_factory微调踩坑(自用)
环境配置 torch>=1.13.0已经不在支持CUDA11.3以下的版本了,CUDA版本必须升级,可以查看 nvidia-smi 在conda虚拟环境中安装的cuda版本必须<=CUDA Version 多GPU跑 c...
-
关于AIGC发展历程的研究报告(原创文章)
摘要: 2022年,Chat GPT和Stable Diffusion展现了AIGC强大的技术实力,拉开了AIGC时代的帷幕。2023年,GPT-4、Midjourney V5等又掀起了人工智能的热潮,2024年2月15日(美国当地时间)正...
-
10分钟Window本地部署stable diffusion AI绘图【入门教程(1)
2、下载模型 下载AI模型,用于生成图片的模型,该官网需要注册才能下载,大家自行注册下载就行,我这边下载的1.4版本的。此模型有4G,下载比较慢。 下载后把名字改为:model.ckpt,并放入文件夹stable-diffusion-main/mode...
-
Stable Diffusion:从入门到精通
从最初的安装与配置,细至界面功能的详解,再至实战案例的制作,乃至高品质模型的下载,每一步骤皆有细致的指导,且以一个个生动的例子予以演示,不仅令诸位不再只是枯燥地观摩,更能让你们阅后即行,轻松创作出相似的绘画之作。 AI免费学习基地https://xmgt...
-
Llama模型下载
最近llama模型下载的方式又又变了,所以今天简单更新一篇文章,关于下载的,首先上官网,不管在哪里下载你都要去官网登记一下信息:https://llama.meta.com/llama2 然后会出现下面的信息登记网页: 我这里因为待业所以or...
-
Midjourney与Stable Diffusion大比拼:AI绘画技术的未来
在当今快速发展的人工智能技术浪潮中,AI绘画软件成为了艺术和技术交汇的新领域。两大巨头——Midjourney和Stable Diffusion,在这一领域中引领风骚,它们以其独特的功能和强大的生成能力,让创作者能够将想象力化为现实。本文将深入比较这两种软...
-
探索 Obsidian Copilot:智能笔记的新里程碑
探索 Obsidian Copilot:智能笔记的新里程碑 项目地址:https://gitcode.com/logancyang/obsidian-copilot 项目简介 Obsidian Copilot 是一个创新的插件,为流行的 markdo...
-
CVPR 2024 | 图像超分、图像恢复汇总!用AIGC扩散模型diffusion来解决图像low-level任务的思路...
1、Arbitrary-Scale Image Generation and Upsampling using Latent Diffusion Model and Implicit Neural Decoder 超分辨率(SR)和图像生成是计算...
-
CVPR 2024 | 图像检测类(目标、deepfake、异常)!AIGC扩散模型diffusion解决detection任务...
目标跟踪 1、Delving into the Trajectory Long-tail Distribution for Muti-object Tracking 多目标跟踪(Multiple Object Tracking,MOT)是计算...
-
CVPR 2024 | 风格迁移和人像生成汇总!扩散模型diffusion用于经典AIGC方向
风格迁移 1、DEADiff: An Efficient Stylization Diffusion Model with Disentangled Representations 基于文本到图像扩散模型在迁移参考风格方面具有巨大潜力。然而,...
-
AIGC技术带给我们什么?基于AIGC原理及其技术更迭的思考
AIGC技术带给我们什么?基于AIGC原理以及技术更迭的思考 前言 AI,这个词在如今人们的视野中出现频率几乎超过了所有一切其他的事物,更有意思的是,出现频率仅次于这个词的,几乎都会加上一个修饰亦或是前缀——AI,没错,还是它。 正值五一假期,我们...
-
AIGC实战——VQ-GAN(Vector Quantized Generative Adversarial Network)
AIGC实战——VQ-GAN 0. 前言 1. VQ-GAN 2. ViT VQ-GAN 小结 系列链接 0. 前言 本节中,我们将介绍 VQ-GAN (Vector Quan...
-
51-37 由浅入深理解 Stable Diffusion 3
2024年3月5日,Stability AI公开Stable Diffusion 3论文,Scaling Rectified Flow Transformers for High-Resolution Image Synthesis。公司像往常一样承诺后续...
-
定制自己的 AI 角色CustomChar;AI知识点和面试题;提高llama 3 的微调速度Unsloth
✨ 1: CustomChar 允许你创建和定制自己的 AI 角色 CustomChar 是一个开源项目,它允许你创建和定制自己的 AI 角色。无论是游戏中的角色,还是个人的虚拟助手(比如电脑上的 JARVIS),甚至是在线教育体验中的虚拟...
-
第一篇【AI与传奇开心果系列】Python的AI相关库技术点案例示例:详解AI作画原理
AI与传奇开心果博文系列 系列博文目录 Python的AI相关库技术点案例示例系列 博文目录 前言 一、AI作画算法原理介绍 二、深度学习的神经网络AI作画算法原理应用示例代码 三、特征学习AI作画算法原理应用示例代码 四、风格迁移AI作画算...
-
AIGC实战——MuseGAN详解与实现
AIGC实战——MuseGAN详解与实现 0. 前言 1. MuseGAN 1.1 Bach Chorale 数据集 1.2 MuseGAN 生成器 1.3 MuseGAN 判别器 2. MuseGAN 分析 小结 系列链接 0...
-
抓住AIGC行业的未来:现在正是进入的最佳时机
目录 引言 一、AIGC行业前景 1、技术成熟与应用普及 1.1深度学习 1.2自然语言处理 1.3生成对抗网络 2、商业机会与创新平台 2.1内容创作 2.2个性化推荐 3、未来展望与个人发展 3.1技术人员的发展机会 3.2非技...
-
【热门话题】AI作画算法原理解析
?个人主页: 鑫宝Code?热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ?个人格言: "如无必要,勿增实体" 文章目录 AI作画算法原理解析 AI作画算法概述 基础原理:机器学习与深度学习 卷积...
-
【活动】AIGC 技术的发展现状与未来趋势
?个人主页: 鑫宝Code?热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ?个人格言: "如无必要,勿增实体" 文章目录 AIGC 技术的发展现状与未来趋势 引言 AIGC技术的发展现状 文本生成...
-
【Stable Diffusion】用AI给老照片上色,岁月不改它模样
在最近新上线的controlnet模型中,除了我们之前测试过的一众适配sdxl的模型以外,还增加了一款名为Recolor的新模型,它的作用是可以将黑白的图片进行重新上色。 看到这个功能,我首先想到的就是可以用它来修复那些已经年代久远的老照片。毕竟在以前那...
-
我们该如何看待AIGC(人工智能)
目录 AIGC的概述: AIGC的发展经历: AIGC的发展带来的机遇: 我们该如何去看待AIGC: AIGC的概述: @[TOC]( ?文章目录 ---AIGC全称为AI-Generated Content,指基于生成对抗网...
-
复旦团队重大突破登Cell,破纪录复活「冰封」18个月人脑!三体云天明计划成真?
就在刚刚,科学家们成功地复活了冷冻的人类大脑! 这项技术,是低温技术领域的重大突破,为改进神经系统疾病的研究方法铺平了道路。 本月,复旦大学邵志成博士团队的这篇工作,也正式登上了Cell子刊。 论文地址:https://www.cell.com/cel...
-
美国媒体公司 Gannett 开始在文章中添加 AI 生成的摘要
美国媒体公司 Gannett 拥有数百家报纸,在其内部备忘录中透露,他们正在推出一个新的项目,将 AI 生成的要点添加到记者的文章开头。 根据 The Verge 所见的内部备忘录,这一 AI 功能被标注为 “要点”,用自动化技术生成了在标题下方的摘要。文...
-
摩托罗拉AI 手机 moto X50 Ultra 将于 5 月 16 日发布
站长之家(ChinaZ.com)5月9日 消息:摩托罗拉手机官方近日宣布,将在5月16日举办一场盛大的联想AI PC & AI手机发售体验会。届时,备受瞩目的“moto X50Ultra”AI手机将正式与公众见面,其独特的slogan“百倍热AI,...
-
清华首个AI医院小镇来了!AI医生自进化击败人类专家,数天诊完1万名患者
斯坦福AI小镇曾火遍了全网,25个智能体生活交友,堪称现实版的「西部世界」。 而现在,AI「医院小镇」也来了! 最近,来自清华团队的研究人员开发了一个名为「Agent Hospital」的模拟医院。 论文地址:https://arxiv.org/pdf...
-
联发科天玑 9300+ 处理器发布 支持Llama27B端侧大模型运行
在今日上午的MediaTek天玑开发者大会MDDC2024上,备受瞩目的天玑9300++旗舰处理器终于揭开了神秘的面纱。这款处理器的CPU架构精心布局,融合了1个高达3.40GHz的Cortex-X4核心,3个2.85GHz的核心,以及4个2.00GHz的...
-
12年前上手深度学习,Karpathy掀起一波AlexNet时代回忆杀,LeCun、Goodfellow等都下场
没想到,自 2012 年 AlexNet 开启的深度学习革命已经过去了 12 年。 而如今,我们也进入了大模型的时代。 近日,知名 AI 研究科学家 Andrej Karpathy 的一条帖子,让参与这波深度学习变革的许多大佬们陷入了回忆杀。从图灵奖得主...
-
苹果计划与 OpenAI 合作,加强 iPhone 人工智能功能
据报道,苹果正与 OpenAI 合作,旨在为 iPhone 开发生成式人工智能产品,以提升其人工智能功能。苹果近年来在人工智能领域的野心似乎有所减退。原本苹果封闭式的人工智能开发曾让人们猜测其或许掌握了一些神秘的技巧,但到了2024年,公司的旗舰产品 iP...
-
Adobe推出全新AI技术VideoGigaGAN:视频清晰度提升8倍
快科技4月26日消息,Adobe公司宣布了一项革命性的新技术VideoGigaGAN,这是一项基于人工智能的视频超分辨率技术,能够将视频清晰度提高8倍。 VideoGigaGAN技术的发布,标志着视频放大技术的又一重要进步,为视频编辑、增强和修复等领域带来...
-
华人持续炸场!8倍于SOTA模型发布,超分辨率细节还原度逆天,终于可以看清楚蜘蛛网丝了!网友:质量真不错!电影时长9秒才够用!
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) Sora带火了“视频一致性”的研究,但单纯在时间一致性已经不能满足业内对于高逼真视频的渴望。这不,华人又出来炸场了! 近日,一个名为VideoGigaGAN的视频模型在业界走红。...
-
部署本地的大语言模型,只需几分钟!
2023 年是 AI 高速发展的一年,除了功能强大的商用大语言模型之外,也出现了很多不错的开源大语言模型。比如,Llama2、Codellama、Mistral 和 Vicuna 等。虽然商用的大语言模型 ChatGPT、Bard 和 Claude 功...
-
自回归超越扩散!北大、字节 VAR 范式解锁视觉生成 Scaling Law
新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了!使 GPT 风格的自回归模型在图像生成首次超越扩散模型,并观察到与大语言模型相似的 Scaling Laws 缩放定律、Zero-shot Task General...
-
人工智能和物联网如何颠覆关键行业
人工智能(AI 和物联网(IoT 已经分别推动了制造业和银行业等行业的重大发展,但这两种技术结合起来,在广泛的行业中提供了强大的机会。 物联网创造了一个由相互连接的设备组成的实时通信网络,已经成为一个价值数万亿美元的产业;据Statista估计,到20...
-
【探索AI】人人都在讲AIGC,什么是AIGC?
AIGC 概述 示例展示 我们日常用到的一些工具/应用 核心技术介绍 核心技术的算法解析 案例及部分代码实现 1. 艺术作品 2. 设计项目 3. 影视特效 4. 广告创意 总结 一张图先了解下: 概述 "人工智能生成创造...