-
【Stable Diffusion】图片高清化+面部修复+一键抠图,一些你不知道的事儿
说到后期处理板块,大家第一印象就是图像放大,快速且高效。但是今天要讲的后期处理当中,肯定还有一些是你不知道的事儿。 # 放大算法 首先是关于放大算法,如果大家用的都是秋叶大佬的整合包的话,算法总共应该就是这些。常用的就是“R-ESRGAN 4x+”...
-
社交媒体与AIGC:如何改变内容创作与推荐
1.背景介绍 社交媒体平台已经成为现代人们交流、分享和获取信息的重要来源。随着人工智能(AI 和机器学习技术的发展,社交媒体平台也开始广泛地采用这些技术来改善内容创作和推荐。这篇文章将探讨如何将人工智能生成式(AIGC 技术与社交媒体平台结合,从...
-
DALL·E 2(内含扩散模型介绍)【论文精读】Hierarchical Text-ConditionalImage Generation with CLIP Latents
1官方对模型的介绍 大家好,今天我们就一起来看一下两个月之前 OpenAI 刚放出来的一篇力作。DALL·E 2是 OpenAI 一系列文本图像生成工作的最新一篇。去年 1 月份他们先推出了Dolly,然后在年底的时候又推出了glide。...
-
文心一言指令词宝典之创作篇
作者:哈哥撩编程(视频号、抖音、公众号同名) 新星计划·全栈领域优秀创作者 博客专家·全国博客之星第四名 超级个体·COC上海社区主理人 特约讲师·谷歌亚马逊演讲嘉宾 科技博主·极星会首批签约作者 ? 推荐专栏: ? 程序员:...
-
文生图大模型三部曲:DDPM、LDM、SD 详细讲解!
1、引言 跨模态大模型是指能够在不同感官模态(如视觉、语言、音频等 之间进行信息转换的大规模语言模型。当前图文跨模态大模型主要有: 文生图大模型:如 Stable Diffusion系列、DALL-E系列、Imagen等 图文匹配大模型:如CLI...
-
AIGC——ComfyUI 安装与基础使用
简介 ComfyUI是一个基于节点流程的稳定扩散操作界面,通过流程实现了更加精准的工作流定制和完善的可复现性。每个模块都有特定的功能,我们可以通过调整模块连接来实现不同的出图效果。然而,节点式的工作流也提高了一定的使用门槛。同时,由于内部生成流程经过优...
-
whisper、whisper.cpp、faster-whisper的比较
让我们比较一下当前的whisper、whisper.cpp和faster-whisper。 OpenAI / Whisper 自发布以来,似乎在各个方面都发生了变化,例如在 2022 年 12 月增加了 large-v2 模型和各种版本升级。 whis...
-
谷歌挖走OpenAI的大将!前开发者关系负责人官宣加盟
整整一个月,OpenAI前开发者关系负责人Logan Kilpatrick正式官宣加入谷歌。 他将负责AI Studio产品,并为Gemini API提供支持。 Logan表示,未来还有很多工作要做,让谷歌成为开发人员使用AI进行开发的最佳场所。 L...
-
Postsmrt官网体验入口 LinkedIn内容创作AI生成软件使用地址
Postsmrt是一款利用AI自动创建LinkedIn内容的工具,旨在帮助用户在LinkedIn上实现organic增长。它的主要功能包括:利用AI生成与目标受众相关、高参与度的LinkedIn帖子内容;根据用户设定的目标(如获取销售线索、预约会议等)生成...
-
AI绘画 | 如何利用SD垫图实现照片风格转换
“ 小红书上有很多用AI做卡通头像的,大概思路是你拍一张个人照片发给博主,博主利用midjourney的垫图功能转换成卡通形象,一张收取一定费用……” 看过之前文章的人都应该知道,midjourney是付费的软件,而且需要一定魔法上网能力。 今天给大家...
-
扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径
「扩散模型」也能攻克算法难题? 图片 一位博士研究人员做了一个有趣的实验,用「离散扩散」寻找用图像表示的迷宫中的最短路径。 图片 作者介绍,每个迷宫都是通过反复添加水平和垂直墙生成的。 其中,起始点和目标点随机选取。 从起点到目标点的最短路径中,随机采样...
-
免费论文写作生成器(ai写作生成器免费)
完成论文初稿后,通常需要寻求专家评审以获取专业的反馈和建议。然而,即便是对于经验丰富的教师来说,这也是一项颇具挑战性的任务。 同学们,幸运的是,我们生活在有AI的世界,可以借助ChatGPT这样的人工智能工具来模拟专家评审的过程。 通过分批次将...
-
stable-diffusion.cpp 一个文件解决stable diffusion所有环境,不需要python,stable-diffusion.dll动态库C#调用Demo
stable-diffusion.cpp 一个文件解决stable-diffusion所有环境,不需要python,stable-diffusion.dll动态库C#调用Demo 目录 介绍 效果 Text To Image Image To...
-
stable diffusion学习笔记——高清修复
ai画图中通常存在以下痛点: 受限于本地设备的性能(主要是显卡显存),无法跑出分辨率较高的图片。生图的时候分辨率一调大就爆显存。 即便显存足够。目前主流的模型大多基于SD1.0和SD1.5,这些模型在训练的时候通常使用小分辨率图片训练,在生成高分辨率图...
-
Whisper.cpp: 一个轻量级、高效的C++事件系统
Whisper.cpp: 一个轻量级、高效的C++事件系统 项目地址:https://gitcode.com/ggerganov/whisper.cpp 在当今的软件开发中,事件驱动模型已经成为构建复杂应用程序的核心部分。Whisper.cpp是一...
-
Stable Diffusion之核心基础知识和网络结构解析
Stable Diffusion核心基础知识和网络结构解析 一. Stable Diffusion核心基础知识 1.1 Stable Diffusion模型工作流程 1. 文生图(txt2img 2. 图生图 3. 图像优化模块 1.2...
-
llama.cpp部署多模态视觉模型到应用实践
一、安装cmake https://cmake.org/ 因为我使用是win10系统cmake版本是3.26.4,请根据自己系统选择版本。 二、下载源码 git clone https://github.com/ggerganov/llam...
-
AI绘画 | stable-diffusion-web-ui的基本操作
前言 我们下载安装完成stable-diffusion-web-ui以后,下载对应风格的模型,就可以开始我们的绘画操作了。进行Ai绘画操作前,我们最好先弄清楚web ui界面上的参数按钮的含义。这样我们就能更轻松的绘画出我们想要stable-diffu...
-
Stable Diffusion Webui 本地部署【踩坑记录】
1、安装python Python Release Python 3.10.6 | Python.org 2、安装git git是一个代码管理工具,通过它可以将开源项目仓库克隆到本地 下载地址:Git - Downloading Package...
-
Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文
之前引爆了AI圈的Mamba架构,今天又推出了一版超强变体! 人工智能独角兽AI21 Labs刚刚开源了Jamba,世界上第一个生产级的Mamba大模型! Jamba在多项基准测试中表现亮眼,与目前最强的几个开源Transformer平起平坐。 特别是...
-
(给自己挖坑中)一些还比较有趣的AIGC开源项目和部署教程
文章目录 一、开源项目 二、部署情况 三、问题总结 一、开源项目 https://www.naviai.cn/ AI 导航站 | 收录了国内外2000+优质AI工具,人工智能工具和模型的介绍及链接 https://zhuanla...
-
元象大模型开源30款量化版本 可更低成本部署
元象大模型开源了30款量化版本,支持 vLLM 和 llama.cpp 等主流框架的量化推理,无条件免费商用。 对量化前后的模型能力、推理性能进行评估,以 XVERSE-13B-GPTQ-Int4量化版本为例,量化后模型权重压缩了72%,总吞吐提高了1.5...
-
SORA 2.1 ——Stable diffusion技术解析+基于diffusion的视频生成技术介绍
本文是DataWhale开源项目Sora原理与技术实战的第二次打卡任务的第一节,主要是简单试用Stable diffusion技术在魔塔社区进行文生图实践。同一打卡任务的其他小节请参见个人主页。 目录 一.【AIGC简介——以文生图为例】 1.基于生...
-
【AI绘画】没有大显存?新人上手SD1.5模型推荐
SDXL有千般好,但是大显存却绕不开。更何况很多优秀的模型目前只有SD1.5版本的,今天就来介绍一些不同领域内好用的代表性的SD1.5模型,足够新人探索一段时间喽。(相关模型去C站搜标题找或者直接文末扫马领取 目录 好看到不真实的写实风:maj...
-
AIGC实战——Transformer模型
AIGC实战——Transformer模型 0. 前言 1. T5 2. GPT-3 和 GPT-4 3. ChatGPT 小结 系列链接 0. 前言 我们在 GPT (Generative Pre-trained Transfo...
-
突破性的百万级视频和语言世界模型:Large World Model~
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在探索如何让AI更好地理解世界方面,最近的一项突破性研究引起了广泛关注。来自加州大学伯克利分校的研究团队发布了“Large World Model, LWM”,能够同时处理百万级长度的视频和语言序列,...
-
stable diffusion webui升级bug问题解决思路(纯干货)
个人网站:https://tianfeng.space/ 文章目录 一、前言 二、个人方案 1.扼杀在萌芽中 A.解压后点击启动器运行依赖,然后点击A启动器 B.更新本体和扩展(全部到最新版本) C.把controlnet1.1放入sta...
-
AI换脸视频制作app有哪些 免费AI换脸软件在线下载使用地址入口
什么是AI换脸视频制作? AI换脸视频制作是利用人工智能算法实现视频人脸替换的创新技术。通过先进的人脸识别和图像处理技术,用户可以将任意一个人的面部换到另一个视频中,生成逼真的换脸视频效果。 AI换脸技术原理 AI换脸视频制作主要基于深度学习技术中的生成...
-
CMU朱俊彦、Adobe新作:512x512图像推理,A100只用0.11秒
简笔素描一键变身多风格画作,还能添加额外的描述,这在 CMU、Adobe 联合推出的一项研究中实现了。 作者之一为 CMU 助理教授朱俊彦,其团队在 ICCV 2021 会议上发表过一项类似的研究:仅仅使用一个或数个手绘草图,即可以自定义一个现成的 GA...
-
一个开源免费的实时AI绘画软件Krita
Krita是由Krita插件+ComfyUI+LCM插件结合的一个实时可预览的AI绘画工具,是一款自由开源、免费的专业级绘画软件,Krita采用的是GNU GPL许可证确保它将一直保持自由开源的本色。 一:搭建Krita创作平台 1、Krita客户...
-
旗舰同款!小米Civi 4 Pro升级影像大脑3.0:搭载Xiaomi AISP
快科技3月21日消息,小米Civi 4 Pro今日正式发布,搭载原汁原味的徕卡专业三摄,配备光影猎人800定制专业传感器。 据介绍,小米Civi 4 Pro还继承了旗舰机型的实力,搭载Xiaomi AISP。 通过小米澎湃OS深入硬件层,重构技术管线,深入...
-
AIGC:让生成式AI成为自己的外脑
前言 在数字化浪潮席卷全球的今天,人工智能(AI)已经渗透到了我们生活的方方面面。其中,生成式AI以其独特的魅力,正逐渐改变我们与世界的交互方式。AIGC(人工智能生成内容)作为生成式AI的重要应用之一,正成为越来越多人的“外脑”,助力我们更高效...
-
Diffusion Transformer Family:关于Sora和Stable Diffusion 3你需要知道的一切
转自知乎:叫我Alonzo就好了 前言 背景——Sora和Stable Diffusion 3 近期,OpenAI和Stability两大AI巨头公司在同期分别发布了它们的新作品——Sora和Stable Diffusion 3。神奇的是,这...
-
为自动驾驶而生,Lightning NeRF:速度提升10倍
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 最近的研究强调了NeRF在自动驾驶环境中的应用前景。然而室外环境的复杂性,加上驾驶场景中的视点受限,使精确重建场景几何体的任务变得复杂。这些挑战往往会导致重建质量下降...
-
【AIGC】如何提高Prompt准确度
前言 随着人工智能的迅猛进展,AIGC(通用人工智能聊天工具)已成为多个行业中不可或缺的自然语言处理技术。Prompt作为AIGC系统的一项关键功能,在工具的有效运作中发挥了举足轻重的作用。本篇文章将深入探讨Prompt与AIGC之间的紧密联系以及它们是...
-
小红书多模态团队建立新「扩散模型」:解码脑电波,高清还原人眼所见
近些年,研究人员们对探索大脑如何解读视觉信息,并试图还原出原始图像一直孜孜不倦。去年一篇被 CVPR 录用的论文,通过扩散模型重建视觉影像,给出了非常炸裂的效果—— AI 不光通过脑电波知道你看到了什么,并且帮你画了出来。 第一行:人眼所见画面,第二...
-
不只是高清放大!Magnific AI照片风格化功能上线
Magnific AI的照片风格化功能已经正式上线。这项全新的功能可以将你的任何照片转换成你所期望的任何风格。无论你想变换任何图像,都可以控制传输的样式数量和结构完整性,这为3D、视频游戏、室内设计、娱乐等领域提供了无限的用例。 产品入口:https:/...
-
iniucloud采集插件的应用解析
在当前的数据驱动时代,企业和个人对信息的需求越发精细与个性化。“niocloud采集插件”便是在这种背景下诞生的、为用户提供全方位数据抓取服务的重要工具。它不只解放了大量重复劳作的劳动力,同时为用户解决了在众多散乱网页和程序中定位和抓取信息时所遇的问题,特...
-
拖拽P图技术又升级了:StableDrag更稳、更准,南大、腾讯联合打造
去年 5 月,动动鼠标就能让图片变「活」得研究 DragGAN 吸引了 AI 圈的关注。通过拖拽,我们可以改变并合成自己想要的图像,比如下图中让一头狮子转头并张嘴。 实现这一效果的研究出自华人一作领衔的「Drag Your GAN」论文,于上个月放出并已...
-
【Datawhale组队学习:Sora原理与技术实战】AIGC技术基础知识
AIGC是什么 AIGC全称叫做AI generated content,AlGC (Al-Generated Content,人工智能生产内容 ,是利用AlI自动生产内容的生产方式。 在传统的内容创作领域中,PGC(Professionally-g...
-
PHP爬虫验证码网站解决方案的探索与实施
在当今的数据信息时代,网页爬虫的运用对于信息整合有着非常重要的作用,它通过预设好的程序在网络中对既定目标自动地进行数据的抓取,以供进一步的筛选或应用。在这个过程中,“PHP”这门老而弥坚的服务端语言凭借其处理Web应用的独特优势经常被运用到。而当面对某些引...
-
AI 绘画Stable Diffusion 研究(十二)SD数字人制作工具SadTlaker插件安装教程
免责声明: 本案例所用安装包免费提供,无任何盈利目的。 大家好,我是风雨无阻。 想必大家经常看到,无论是在产品营销还是品牌推广时,很多人经常以数字人的方式来为自己创造财富。而市面上的数字人收费都比较昂贵,少则几千,多则上万。 那么如何才能拥有一个免费...
-
=高效适配与各采集场景下展现更优性——详细探讨格尺CMS采集插件的精妙所在
==在我们切入任何一个新技术的实践问题时,数据来源有着应运而生灵的结果构成网络的鼻血打分手速 Corona风的Hat exemplifiedgetS支持公诉 oli organisations]]˃...
-
今日AI:苹果大模型MM1入场;Sora训练数据来源竟来自这;全球最快AI芯片WSE-3发布;阿里邀请AI参加数学竞赛
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI新鲜事 苹果大模型MM1...
-
==深度探索"usesmall采集插件"在网页数据提取中的实战应用
==随着信息化技术的日新月异和互联网应用的深度融合,各行各业都纷纷迈向了数据化时代,采集与分析互联网上公开的数据对于个人知识获取乃至企业战略部署与决策的协助重要性越来越高。"usemall采集插件"正是这样一种数据采集器工具。这篇文章以细致的视角从其使用流...
-
【深度学习】风格迁移,转换,Stable Diffusion,FreeStyle : Free Lunch for Text-guided Style Transfer using Diffusion
论文:https://arxiv.org/abs/2401.15636 代码:https://github.com/FreeStyleFreeLunch/FreeStyle 介绍 生成扩散模型的快速发展极大地推进了风格迁移领域的发展。然而,大多数当...
-
超强!深度学习Top10算法!
自2006年深度学习概念被提出以来,20年快过去了,深度学习作为人工智能领域的一场革命,已经催生了许多具有影响力的算法。那么,你所认为深度学习的top10算法有哪些呢? 以下是花哥我心目中的深度学习top10算法,它们在创新性、应用价值和影响力方面都具...
-
Stable Diffusion ———LDM、SD 1.0, 1.5, 2.0、SDXL、SDXL-Turbo等版本之间关系现原理详解
一、简介 2021年5月,OpenAI发表了《扩散模型超越GANs》的文章,标志着扩散模型(Diffusion Models,DM)在图像生成领域开始超越传统的GAN模型,进一步推动了DM的应用。 然而,早期的DM直接作用于像素空间,这意味着要优化一...
-
马斯克:到 2029 年,人工智能可能会比所有人类都更聪明
3 月 13 日消息,人工智能 (AI 超越人类智能的可能性几十年来一直备受科技专家、科学家和未来学家们的热烈讨论和争辩。然而,自生成式人工智能聊天机器人 ChatGPT 发布以来,关于人工智能将取代人类的争论愈演愈烈。生成式人工智能的出现使得谷歌...
-
webassembly002 whisper.wasm wasm_eval 与js代码交互 EMSCRIPTEN_BINDINGS,Module
# build using Emscripten git clone https://github.com/ggerganov/whisper.cpp cd whisper.cpp mkdir build-em && cd build-em...