-
腾讯又整活!一句话让图片变动漫主角!
撰稿 | 清竹 出品 | 51CTO技术栈(微信号:blog51cto) 2023年底,AI圈似乎已经被“文生视频”模型攻占了! 11月底 AI 文生视频工具 Pika 1.0 横空出世、风头一时无两,日前斯坦福大学 AI 科学家李飞飞团队联合谷歌推...
-
随意指定CLIP关注区域!上交复旦等发布Alpha-CLIP:同时保持全图+局部检测能力
CLIP是目前最流行的视觉基座模型,其应用场景包括但不限于: 与LLM大语言模型结合成为视觉多模态大模型; 作为图像生成(Stable Diffusion 、点云生成(Point-E 的condition model,实现image-to-3D; 用于...
-
AIGC快速入门体验之虚拟对象
AIGC快速入门体验之虚拟对象 一、什么是AIGC 二、AIGC应用场景 2.1 代码生成 2.2 图片生成 2.3 对象生成 三、AIGC虚拟对象 3.1 AIGC完全免费工具 3.2 快速获取对象 3.3 给对象取名 3.4 为对象写...
-
面向 Stable Diffusion 的自动 Prompt 工程算法 BeautifulPrompt
近日,阿里云人工智能平台PAI与华南理工大学朱金辉教授团队合作在自然语言处理顶级会议EMNLP2023上发表了BeautifulPrompt的深度生成模型,可以从简单的图片描述中生成高质量的提示词,从而使文生图模型能够生成更美观的图像。BeautifulP...
-
AI视野:Midjourney正式上线Alpha网页版;OpenAI恢复会员注册;腾讯发布视频生成模型AnimateZero;微软发布小语言模型AI Phi-2
???AI应用 Midjourney正式上线Alpha网页版!支持已生成图片设置参数回填 Midjourney Alpha全新升级,生成用户界面更便捷,成功生成1万张图片即可获得权限,可视化图像参数支持点击回填到提示词输入框,提升生成体验。 截图自归藏...
-
Stable-Diffusion深度学习文本到图像生成模型
1. Stable Diffusion 1.1 用法和争议 1.2 许可证 1.3 不可控性 1.4 一点想法 1.5 用途 1.6 教程链接 2. Setup 2.1 Draw Things 2.2 diffusionbee 2.3 AUTOMATI...
-
Diffusion Model (扩散生成模型)的基本原理详解(三)Stochastic Differential Equation(SDE)
本篇是《Diffusion Model (扩散生成模型 的基本原理详解(二)Score-Based Generative Modeling(SGM 》的续写,继续介绍有关diffusion的另一个相关模型,同理,参考文献和详细内容与上一篇相同,读者可自行查...
-
AI视野:Pika1.0首批用户资格揭晓;Runway官宣下场通用世界模型;妙鸭相机推出AI修图;抖音正式上线AI创作功能
???AI新鲜事 Pika1.0首批用户资格揭晓 Pika Labs最新视频生成产品Pika1.0引起轰动,已开始向候补名单用户发放使用资格。Pika1.0以文生成视频为特色,提供3秒视频快速生成、背景修改等功能。用户可在推特或邮箱确认是否成为首批体验者。...
-
467亿参数MoE追平GPT-3.5!爆火开源Mixtral模型细节首公开,中杯逼近GPT-4
今天,Mistral AI正式放出了Mixtral 8x7B的技术细节—— 在大多数基准测试中,Mixtral的表现不仅优于Llama 2 70B,而且推理速度提高了整整6倍! 尤其是,它在大多数标准基准测试上与GPT-3.5打平,甚至略胜一筹。 新开源...
-
AIGC专栏4——Stable Diffusion原理解析-inpaint修复图片为例
AIGC专栏4——Stable Diffusion原理解析-inpaint修复图片为例 学习前言 源码下载地址 原理解析 一、先验知识 二、什么是inpaint 三、Stable Diffusion中的inpaint 1、开源的inpain...
-
Stability AI推出Stable Diffusion XL 1.0,文本到图像模型
Stability AI宣布推出Stable Diffusion XL 1.0,这是一个文本到图像的模型,该公司将其描述为迄今为止“最先进的”版本。 Stability AI表示,SDXL 1.0能生成更加鲜明准确的色彩,在对比度、光线和阴影方面做了增强...
-
如何利用生成式人工智能进行精确编码
生成式人工智能(GenAI 对技术领域产生了重大影响,其变革潜力正在扩展到软件工程领域。随着生成式人工智能的应用,特别是在提示的帮助下,“编码员”的概念已成为现实。该技术通过利用其在自然语言处理、意图识别和代码生成方面的功能,为增强软件开发过程提供了一...
-
尴尬!马斯克的Grok因用ChatGPT的数据回答出现幻觉
近日,伊隆·马斯克推出了xAI公司开发的新人工智能聊天机器人Grok。然而,令人惊讶的是,Grok被曝光使用了OpenAI的ChatGPT的数据,这让其开发人员感到十分意外。 Grok是针对美国Premium+ X订阅用户推出的,据官方声明,这款新的聊天机...
-
使边缘人工智能真正实现变革
边缘人工智能的采用在众多行业中呈上升趋势。随着这种趋势的持续下去,其将不仅为企业而且为社会带来变革。 边缘计算的去中心化方法减轻了数据拥塞、连接故障和传输成本等限制。这极大地提高了人工智能应用程序的性能,从而可以更快、更可靠地做出决策。 边缘人工智能的...
-
杭州一公司开出20万月薪/320万年薪抢人!ChatGPT掀起AI热潮,AIGC人才被爆抢
5年工作经历,博士学位,最高月薪20万。 最近,位于杭州未来科技城一家公司,开出了最高320万年薪,招聘AIGC方向算法工程师一名。 ChatGPT在全球掀起了AI热潮,国内互联网大厂纷纷加入战局打造国内版ChatGPT。很多人在担心失业的同时,AI人...
-
设计师解放双手之作!3秒生成风景园林效果图,AIGC赋能景观设计
项目简介 在过去几十年,风景园林经历了从“刀耕火种”的完全手绘设计时代到当下比较流行的参数化设计时代,过去的每一轮技术革新都让风景园林作品的表现形式产生了巨大的改变。随着计算机图像技术的发展,我们有更多的建模和渲染软件辅助提升图纸表现效果,...
-
Stable Diffusion 的玩耍方式
Stable Diffusion 是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像,尽管它也可以应用于其他任务,如内补绘制、外补绘制,以及在提示词(英语)指导下产生图生图的翻译。 下面是几种体验方式的介绍: 方式一...
-
HumanGaussian开源:基于Gaussian Splatting,高质量 3D 人体生成新框架
在 3D 生成领域,根据文本提示创建高质量的 3D 人体外观和几何形状对虚拟试穿、沉浸式远程呈现等应用有深远的意义。传统方法需要经历一系列人工制作的过程,如 3D 人体模型回归、绑定、蒙皮、纹理贴图和驱动等。为了自动化 3D 内容生成,此前的一些典型工作...
-
使用Midjourney与ChatGPT组合会怎么样?
Midjourney 和 ChatGPT 都是目前比较先进的自然语言处理技术,Midjourney是一种基于深度学习的文本生成模型,而ChatGPT是一种基于自注意力机制的大规模预训练语言模型。 使用Midjourney+ChatGPT可以结合两种技术的...
-
【多模态】5、BLIP | 统一理解与生成任务 为图像生成更高质量的文本描述
文章目录 一、背景 二、方法 2.1 模型结构 2.2 Pre-training Objectives 2.3 CapFilt 三、效果 3.1 训练细节 3.2 CapFilt 的效果 3.3 样本多样性是文本合成器的关键 3.4 参数...
-
AIGC实战——WGAN(Wasserstein GAN)
AIGC实战——WGAN 0. 前言 1. WGAN-GP 1.1 Wasserstein 损失 1.2 Lipschitz 约束 1.3 强制 Lipschitz 约束 1.4 梯度惩罚损失 1.5 训练 WGAN-GP 2. GAN 与...
-
人均6万美元:2024英伟达奖学金名单公布,五位华人入选
本周五,备受期待的英伟达奖学金公布了入选者名单。 二十多年来,英伟达研究生奖学金计划(NVIDIA Graduate Fellowship Program)一直为研究生提供与英伟达技术相关的杰出工作支持。英伟达迄今为止已向近 200 名学生提供了 600...
-
弥合化学反应预训练和条件分子生成之间的差距,北大&望石智慧提出「统一」模型
化学反应是药物设计和有机化学研究的基础。研究界越来越需要一种能够有效捕获化学反应基本规则的大规模深度学习框架。 近日,来自北京大学和望石智慧的研究团队提出了一种新方法来弥合基于反应的分子预训练和生成任务之间的差距。 受有机化学机制的启发,研究人员开发了一...
-
【AIGC】提示词 Prompt 分享
提示词工程是什么? Prompt engineering(提示词工程)是指在使用语言模型进行生成性任务时,设计和调整输入提示(prompts)以改善模型生成结果的过程。它是一种优化技术,旨在引导模型产生更加准确、相关和符合预期的输出。 在生成性任务中...
-
更强的Llama 2开源,可直接商用:一夜之间,大模型格局变了
已上微软 Azure,即将要上 AWS、Hugging Face。 一夜之间,大模型格局再次发生巨变。 一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题,一直不可免费商用。 今日,Meta 终于发布了大家期待...
-
GTA6预告片播放过亿,AI三巨头也能秒变GTA匪帮
GTA 新出的游戏预告片看了吗?据说,这个预告片已经破了三项吉尼斯世界纪录,观看次数已经破亿。 但如果告诉你,AI 三巨头也可以成为 GTA 里的人物,你还能认出他们吗? AI 三巨头:Yann LeCun、Geoffrey Hinton 和 Yos...
-
JetBrains 推出新 AI 编码助手,结合多个大型语言模型以实现供应商中立
JetBrains 于当地时间周三发布了一款新的 AI 编码助手,这款助手能够从开发者的集成开发环境(IDE)获取信息,并将其反馈给 AI 软件,以提供编码建议、代码重构和文档支持。这家开发工具公司声称,其 AI 助手是第一个供应商中立的此类产品,因为它使...
-
Stability AI发布30亿参数语言模型StableLM Zephyr 3B 更小更快更节省资源
Stability AI以其stable diffusion文本到图像的生成人工智能模型而闻名,但这已不再是该公司的全部业务。 最新发布的StableLM Zephyr3B是一款30亿参数的大语言模型,专为聊天应用场景进行了优化,包括文本生成、摘要和内容个...
-
2023,AIGC能赚到钱吗?
2022年,AIGC(生成式AI)是当之无愧的网红。 AI作画在各大社交平台刷屏,ChatGPT火爆国内外出尽了风头,依靠AI生成语音和表情、动作的数字人也频频露脸。2022年12月,Science杂志发布了2022年度科学十大突破,果不其...
-
视觉CV-AIGC一周最新技术精选(2023-11)
PG-Video-LLaVA: Pixel Grounding Large Video-Language Models https://github.com/mbzuai-oryx/Video-LLaVA 将基于图像的大型多模态模型(LMM)扩...
-
AI生成新春祝福海报,AIGC从“炫技”走向日常
在ChatGPT的带动下,AIGC可以说是过去一年里最火的概念。 就在临近春节的日子里,一款名为“写作蛙”的微信小程序正在悄然流行。简单输入几句祝福语,就能自动生成图文并茂的祝福海报,包括一段应景的祝福语和一张节日氛围满满的照片,让AIGC和普通网民来了...
-
Stable Diffusion 2.0 相比 1.5 是倒退吗?Prompt 实验给你真相
Stability.ai 一周多前发布了 Stable Diffusion 2.0 模型。这是继 8 月 Stable Diffusion 1.4 版本以来最大的更新。但在 AI 图像生成模型激烈的竞争局面下,看起来社区并不买账。SD 2.0 在 R...
-
强大到离谱!硬核解读Stable Diffusion(完整版)
原文链接: 硬核解读Stable Diffusion(完整版) 2022年可谓是AIGC(AI Generated Content)元年,上半年有文生图大模型DALL-E2和Stable Diffusion,下半年有OpenAI的文本对话大模型Ch...
-
Meta 推出独立的 AI 图像生成器,目前免费但只支持英文提示词
IT之家 12 月 7 日消息,Meta 公司日前推出全新的、独立的 AI 图像生成器 ——Imagine with Meta,允许用户通过自然语言描述来创建图像。 据介绍,新的人工图像生成器由 Meta 现有的 Emu 图像生成模型提供支持,可根据文...
-
AIGC技术研究与应用 ---- 下一代人工智能:新范式!新生产力!(2.3-大模型发展历程 之 图像、视频生成与视觉大模型)
文章大纲 GAN 模型与强化学习 强化学习 生成式对抗网络 ( Generative Adversarial Nets, GAN VAE 扩散模型 扩散 逆扩散 参考...
-
腾讯与悉尼大学联手打造GPT4Video:显著提升大语言模型视频生成能力
在多模态大型语言模型(MLLMs)领域取得显著进展的同时,尽管在输入端多模态理解方面取得了显著进展,但在多模态内容生成领域仍存在明显的空白。为填补这一空白,腾讯人工智能实验室与悉尼大学联手推出了GPT4Video,这是一个统一的多模态框架,赋予大型语言模型...
-
由浅入深理解Latent Diffusion/Stable Diffusion(5):利用预训练模型快速开始自己的科研任务
本系列博客导航 由浅入深理解latent diffusion/stable diffusion(1 :写给初学者的图像生成入门课 由浅入深理解latent diffusion/stable diffusion(2 :扩散生成模型的工作原理...
-
AIGC产业研究报告 2023——图像生成篇
易观:今年以来,随着人工智能技术不断实现突破迭代,生成式AI的话题多次成为热门,而人工智能内容生成(AIGC)的产业发展、市场反应与相应监管要求也受到了广泛关注。为了更好地探寻其在各行业落地应用的可行性和发展趋势,易观对AIGC产业进行了探索并将发布AIG...
-
Stable-Diffusion 在线部署
Stable-Diffusion 在线部署 1. 注册 链接:https://aistudio.baidu.com/aistudio/newbie?invitation=1&sharedUserId=4982053&sharedUs...
-
AI绘图软件Stable Diffusion 安装和使用之二controlnet插件
本期说一下Stable Diffusion非常有名的插件controlnet。同上一篇一样,我们安装b站大佬秋葉aaaki(有的网友戏称他/她是赛博佛祖)的stable diffusion4.2整合包。解压缩以后,打开启动器,见下图,界面比早期版本更好看了...
-
Stable Diffusion的原理
CSDN-markdown语法之怎样使用LaTeX语法编写数学公式 参考视频:【diffusion】扩散模型详解!原理+代码! 用一颗桃树为你讲清楚 知识点:AI绘图原理 Diffusion扩散模型 Windows深度学习环境搭建:Windows深度学...
-
手机上0.2秒出图、当前速度之最,谷歌打造超快扩散模型MobileDiffusion
在手机等移动端侧运行 Stable Diffusion 等文生图生成式 AI 大模型已经成为业界追逐的热点之一,其中生成速度是主要的制约因素。 近日,来自谷歌的一篇论文「MobileDiffusion: Subsecond Text-to-Image G...
-
驶向未来,首个多视图预测+规划自动驾驶世界模型来了
近期,世界模型的概念引发了火热浪潮,而自动驾驶领域岂能隔岸观「火」。来自中科院自动化所的团队,首次提出了一种名为 Drive-WM 的全新多视图世界模型,旨在增强端到端自动驾驶规划的安全性。 网站:https://drive-wm.github.io...
-
英伟达支持的初创公司 Together AI 融资 1.025 亿美元
开源云 AI 初创公司 Together 在日益增长的人工智能投资潮中成为最新一家获得巨额融资的开发商,该公司日前宣布,它已在 A 轮投资中筹集了 1.025 亿美元,包括来自技术巨头 NVIDIA (英伟达)的投资。 Together 的一位发言人表示...
-
AIGC玩转卡通化技术实践
FaceChain写真开源项目插播: 最新 FaceChain支持多人合照写真、上百种单人写真风格,项目信息汇总:ModelScope 魔搭社区 。 github开源直达(觉得有趣的点个star哈。):https://gith...
-
[玩转AIGC]sentencepiece训练一个Tokenizer(标记器)
目录 一、前言 二、安装 三、自己训练一个tokenizer 四、模型运行 五、拓展 六、补充 一、前言 前面我们介绍了一种字符编码方式【如何训练一个中英翻译模型】LSTM机器翻译seq2seq字符编码(一) 这种方式是对一个一个...
-
文本生成图像工作简述4--扩散模型、自回归模型、生成对抗网络的对比调研
基于近年来图像处理和语言理解方面的技术突破,融合图像和文本处理的多模态任务获得了广泛的关注并取得了显著成功。 文本生成图像(text-to-image)是图像和文本处理的多模态任务的一项子任务,其根据给定文本生成符合描述的真实图像,具有巨大的应用潜力,如...
-
研究称:生成一张AI图像所消耗能源相当于给手机充满电
根据 AI 初创公司 Hugging Face 和卡内基梅隆大学的研究人员进行的一项新研究,每次使用 AI 生成图像、撰写电子邮件或向聊天机器人提问,都会对地球造成一定的负担。 实际上,使用强大的 AI 模型生成一张图像所消耗的能源相当于给手机充满电,该研...
-
突然!这家AI当红公司,面临破产!创始人被要求下台!
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) Stability AI 这艘船,也许就要沉了! 据外媒彭博消息,这家公司的商业模式正处于危机之中,正挣扎着试图找到在市场上维持生存的方法。 1、华尔街投资王施压,创始人快下台!...
-
Meta AI实验室推三项新AI项目庆祝成立十周年:Ego-Exo4D、Audiobox等
为庆祝Meta基础人工智能研究(FAIR)团队成立十周年,公司隆重推出三个创新的人工智能项目,展示了引人注目的演示。 Ego-Exo4D: 官方项目介绍网址:https://ai.meta.com/blog/ego-exo4d-video-learni...