-
使边缘人工智能真正实现变革
边缘人工智能的采用在众多行业中呈上升趋势。随着这种趋势的持续下去,其将不仅为企业而且为社会带来变革。 边缘计算的去中心化方法减轻了数据拥塞、连接故障和传输成本等限制。这极大地提高了人工智能应用程序的性能,从而可以更快、更可靠地做出决策。 边缘人工智能的...
-
杭州一公司开出20万月薪/320万年薪抢人!ChatGPT掀起AI热潮,AIGC人才被爆抢
5年工作经历,博士学位,最高月薪20万。 最近,位于杭州未来科技城一家公司,开出了最高320万年薪,招聘AIGC方向算法工程师一名。 ChatGPT在全球掀起了AI热潮,国内互联网大厂纷纷加入战局打造国内版ChatGPT。很多人在担心失业的同时,AI人...
-
设计师解放双手之作!3秒生成风景园林效果图,AIGC赋能景观设计
项目简介 在过去几十年,风景园林经历了从“刀耕火种”的完全手绘设计时代到当下比较流行的参数化设计时代,过去的每一轮技术革新都让风景园林作品的表现形式产生了巨大的改变。随着计算机图像技术的发展,我们有更多的建模和渲染软件辅助提升图纸表现效果,...
-
Stable Diffusion 的玩耍方式
Stable Diffusion 是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像,尽管它也可以应用于其他任务,如内补绘制、外补绘制,以及在提示词(英语)指导下产生图生图的翻译。 下面是几种体验方式的介绍: 方式一...
-
HumanGaussian开源:基于Gaussian Splatting,高质量 3D 人体生成新框架
在 3D 生成领域,根据文本提示创建高质量的 3D 人体外观和几何形状对虚拟试穿、沉浸式远程呈现等应用有深远的意义。传统方法需要经历一系列人工制作的过程,如 3D 人体模型回归、绑定、蒙皮、纹理贴图和驱动等。为了自动化 3D 内容生成,此前的一些典型工作...
-
使用Midjourney与ChatGPT组合会怎么样?
Midjourney 和 ChatGPT 都是目前比较先进的自然语言处理技术,Midjourney是一种基于深度学习的文本生成模型,而ChatGPT是一种基于自注意力机制的大规模预训练语言模型。 使用Midjourney+ChatGPT可以结合两种技术的...
-
【多模态】5、BLIP | 统一理解与生成任务 为图像生成更高质量的文本描述
文章目录 一、背景 二、方法 2.1 模型结构 2.2 Pre-training Objectives 2.3 CapFilt 三、效果 3.1 训练细节 3.2 CapFilt 的效果 3.3 样本多样性是文本合成器的关键 3.4 参数...
-
AIGC实战——WGAN(Wasserstein GAN)
AIGC实战——WGAN 0. 前言 1. WGAN-GP 1.1 Wasserstein 损失 1.2 Lipschitz 约束 1.3 强制 Lipschitz 约束 1.4 梯度惩罚损失 1.5 训练 WGAN-GP 2. GAN 与...
-
人均6万美元:2024英伟达奖学金名单公布,五位华人入选
本周五,备受期待的英伟达奖学金公布了入选者名单。 二十多年来,英伟达研究生奖学金计划(NVIDIA Graduate Fellowship Program)一直为研究生提供与英伟达技术相关的杰出工作支持。英伟达迄今为止已向近 200 名学生提供了 600...
-
弥合化学反应预训练和条件分子生成之间的差距,北大&望石智慧提出「统一」模型
化学反应是药物设计和有机化学研究的基础。研究界越来越需要一种能够有效捕获化学反应基本规则的大规模深度学习框架。 近日,来自北京大学和望石智慧的研究团队提出了一种新方法来弥合基于反应的分子预训练和生成任务之间的差距。 受有机化学机制的启发,研究人员开发了一...
-
【AIGC】提示词 Prompt 分享
提示词工程是什么? Prompt engineering(提示词工程)是指在使用语言模型进行生成性任务时,设计和调整输入提示(prompts)以改善模型生成结果的过程。它是一种优化技术,旨在引导模型产生更加准确、相关和符合预期的输出。 在生成性任务中...
-
更强的Llama 2开源,可直接商用:一夜之间,大模型格局变了
已上微软 Azure,即将要上 AWS、Hugging Face。 一夜之间,大模型格局再次发生巨变。 一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题,一直不可免费商用。 今日,Meta 终于发布了大家期待...
-
GTA6预告片播放过亿,AI三巨头也能秒变GTA匪帮
GTA 新出的游戏预告片看了吗?据说,这个预告片已经破了三项吉尼斯世界纪录,观看次数已经破亿。 但如果告诉你,AI 三巨头也可以成为 GTA 里的人物,你还能认出他们吗? AI 三巨头:Yann LeCun、Geoffrey Hinton 和 Yos...
-
JetBrains 推出新 AI 编码助手,结合多个大型语言模型以实现供应商中立
JetBrains 于当地时间周三发布了一款新的 AI 编码助手,这款助手能够从开发者的集成开发环境(IDE)获取信息,并将其反馈给 AI 软件,以提供编码建议、代码重构和文档支持。这家开发工具公司声称,其 AI 助手是第一个供应商中立的此类产品,因为它使...
-
Stability AI发布30亿参数语言模型StableLM Zephyr 3B 更小更快更节省资源
Stability AI以其stable diffusion文本到图像的生成人工智能模型而闻名,但这已不再是该公司的全部业务。 最新发布的StableLM Zephyr3B是一款30亿参数的大语言模型,专为聊天应用场景进行了优化,包括文本生成、摘要和内容个...
-
2023,AIGC能赚到钱吗?
2022年,AIGC(生成式AI)是当之无愧的网红。 AI作画在各大社交平台刷屏,ChatGPT火爆国内外出尽了风头,依靠AI生成语音和表情、动作的数字人也频频露脸。2022年12月,Science杂志发布了2022年度科学十大突破,果不其...
-
视觉CV-AIGC一周最新技术精选(2023-11)
PG-Video-LLaVA: Pixel Grounding Large Video-Language Models https://github.com/mbzuai-oryx/Video-LLaVA 将基于图像的大型多模态模型(LMM)扩...
-
AI生成新春祝福海报,AIGC从“炫技”走向日常
在ChatGPT的带动下,AIGC可以说是过去一年里最火的概念。 就在临近春节的日子里,一款名为“写作蛙”的微信小程序正在悄然流行。简单输入几句祝福语,就能自动生成图文并茂的祝福海报,包括一段应景的祝福语和一张节日氛围满满的照片,让AIGC和普通网民来了...
-
Stable Diffusion 2.0 相比 1.5 是倒退吗?Prompt 实验给你真相
Stability.ai 一周多前发布了 Stable Diffusion 2.0 模型。这是继 8 月 Stable Diffusion 1.4 版本以来最大的更新。但在 AI 图像生成模型激烈的竞争局面下,看起来社区并不买账。SD 2.0 在 R...
-
强大到离谱!硬核解读Stable Diffusion(完整版)
原文链接: 硬核解读Stable Diffusion(完整版) 2022年可谓是AIGC(AI Generated Content)元年,上半年有文生图大模型DALL-E2和Stable Diffusion,下半年有OpenAI的文本对话大模型Ch...
-
Meta 推出独立的 AI 图像生成器,目前免费但只支持英文提示词
IT之家 12 月 7 日消息,Meta 公司日前推出全新的、独立的 AI 图像生成器 ——Imagine with Meta,允许用户通过自然语言描述来创建图像。 据介绍,新的人工图像生成器由 Meta 现有的 Emu 图像生成模型提供支持,可根据文...
-
AIGC技术研究与应用 ---- 下一代人工智能:新范式!新生产力!(2.3-大模型发展历程 之 图像、视频生成与视觉大模型)
文章大纲 GAN 模型与强化学习 强化学习 生成式对抗网络 ( Generative Adversarial Nets, GAN VAE 扩散模型 扩散 逆扩散 参考...
-
腾讯与悉尼大学联手打造GPT4Video:显著提升大语言模型视频生成能力
在多模态大型语言模型(MLLMs)领域取得显著进展的同时,尽管在输入端多模态理解方面取得了显著进展,但在多模态内容生成领域仍存在明显的空白。为填补这一空白,腾讯人工智能实验室与悉尼大学联手推出了GPT4Video,这是一个统一的多模态框架,赋予大型语言模型...
-
由浅入深理解Latent Diffusion/Stable Diffusion(5):利用预训练模型快速开始自己的科研任务
本系列博客导航 由浅入深理解latent diffusion/stable diffusion(1 :写给初学者的图像生成入门课 由浅入深理解latent diffusion/stable diffusion(2 :扩散生成模型的工作原理...
-
AIGC产业研究报告 2023——图像生成篇
易观:今年以来,随着人工智能技术不断实现突破迭代,生成式AI的话题多次成为热门,而人工智能内容生成(AIGC)的产业发展、市场反应与相应监管要求也受到了广泛关注。为了更好地探寻其在各行业落地应用的可行性和发展趋势,易观对AIGC产业进行了探索并将发布AIG...
-
Stable-Diffusion 在线部署
Stable-Diffusion 在线部署 1. 注册 链接:https://aistudio.baidu.com/aistudio/newbie?invitation=1&sharedUserId=4982053&sharedUs...
-
AI绘图软件Stable Diffusion 安装和使用之二controlnet插件
本期说一下Stable Diffusion非常有名的插件controlnet。同上一篇一样,我们安装b站大佬秋葉aaaki(有的网友戏称他/她是赛博佛祖)的stable diffusion4.2整合包。解压缩以后,打开启动器,见下图,界面比早期版本更好看了...
-
Stable Diffusion的原理
CSDN-markdown语法之怎样使用LaTeX语法编写数学公式 参考视频:【diffusion】扩散模型详解!原理+代码! 用一颗桃树为你讲清楚 知识点:AI绘图原理 Diffusion扩散模型 Windows深度学习环境搭建:Windows深度学...
-
手机上0.2秒出图、当前速度之最,谷歌打造超快扩散模型MobileDiffusion
在手机等移动端侧运行 Stable Diffusion 等文生图生成式 AI 大模型已经成为业界追逐的热点之一,其中生成速度是主要的制约因素。 近日,来自谷歌的一篇论文「MobileDiffusion: Subsecond Text-to-Image G...
-
驶向未来,首个多视图预测+规划自动驾驶世界模型来了
近期,世界模型的概念引发了火热浪潮,而自动驾驶领域岂能隔岸观「火」。来自中科院自动化所的团队,首次提出了一种名为 Drive-WM 的全新多视图世界模型,旨在增强端到端自动驾驶规划的安全性。 网站:https://drive-wm.github.io...
-
英伟达支持的初创公司 Together AI 融资 1.025 亿美元
开源云 AI 初创公司 Together 在日益增长的人工智能投资潮中成为最新一家获得巨额融资的开发商,该公司日前宣布,它已在 A 轮投资中筹集了 1.025 亿美元,包括来自技术巨头 NVIDIA (英伟达)的投资。 Together 的一位发言人表示...
-
AIGC玩转卡通化技术实践
FaceChain写真开源项目插播: 最新 FaceChain支持多人合照写真、上百种单人写真风格,项目信息汇总:ModelScope 魔搭社区 。 github开源直达(觉得有趣的点个star哈。):https://gith...
-
[玩转AIGC]sentencepiece训练一个Tokenizer(标记器)
目录 一、前言 二、安装 三、自己训练一个tokenizer 四、模型运行 五、拓展 六、补充 一、前言 前面我们介绍了一种字符编码方式【如何训练一个中英翻译模型】LSTM机器翻译seq2seq字符编码(一) 这种方式是对一个一个...
-
文本生成图像工作简述4--扩散模型、自回归模型、生成对抗网络的对比调研
基于近年来图像处理和语言理解方面的技术突破,融合图像和文本处理的多模态任务获得了广泛的关注并取得了显著成功。 文本生成图像(text-to-image)是图像和文本处理的多模态任务的一项子任务,其根据给定文本生成符合描述的真实图像,具有巨大的应用潜力,如...
-
研究称:生成一张AI图像所消耗能源相当于给手机充满电
根据 AI 初创公司 Hugging Face 和卡内基梅隆大学的研究人员进行的一项新研究,每次使用 AI 生成图像、撰写电子邮件或向聊天机器人提问,都会对地球造成一定的负担。 实际上,使用强大的 AI 模型生成一张图像所消耗的能源相当于给手机充满电,该研...
-
突然!这家AI当红公司,面临破产!创始人被要求下台!
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) Stability AI 这艘船,也许就要沉了! 据外媒彭博消息,这家公司的商业模式正处于危机之中,正挣扎着试图找到在市场上维持生存的方法。 1、华尔街投资王施压,创始人快下台!...
-
Meta AI实验室推三项新AI项目庆祝成立十周年:Ego-Exo4D、Audiobox等
为庆祝Meta基础人工智能研究(FAIR)团队成立十周年,公司隆重推出三个创新的人工智能项目,展示了引人注目的演示。 Ego-Exo4D: 官方项目介绍网址:https://ai.meta.com/blog/ego-exo4d-video-learni...
-
aigc是什么
一、AIGC的基本概念 AI生成内容(AIGC),是指运用人工智能技术,尤其是深度学习技术,创建各类数字内容的新型内容创作模式。AIGC继承了专业生成内容(PGC)的高质量特点,再结合用户生成内容(UGC)的分布式、互动的特点,打造了全新的数字内容生成与...
-
Stable Diffusion的使用以及各种资源
Stable Diffsuion资源目录 SD简述 sd安装 模型下载 关键词,描述语句 插件管理 controlNet 自己训练模型 SD简述 Stable Diffusion是2022年发布的深度学习文本到图像生成模型。它主要...
-
ChatGPT狂吐训练数据,还带个人信息:DeepMind发现大bug引争议
如果我不停地让 ChatGPT 干一件事,直到把它「逼疯」会发生什么? 它会直接口吐训练数据出来,有时候还带点个人信息,职位手机号什么的: 本周三,Google DeepMind 发布的一篇论文,介绍了一项让人颇感意外的研究成果:使用大约 200 美元...
-
MacOS-use-Stable-Diffusion
导航 (返回顶部 1. Stable Diffusion 1.1 用法和争议 1.2 许可证 1.3 不可控性 1.4 一点想法 1.5 用途 1.6 教程链接 2. Setup 2.1...
-
SDXL Turbo、LCM相继发布,AI画图进入实时生成时代:字打多快,出图就有多快
本周二,Stability AI 推出了新一代图像合成模型 Stable Diffusion XL Turbo,引发了一片叫好。人们纷纷表示,图像到文本生成从来没有这么轻松。 你可以不需要其他操作,只用在文本框中输入你的想法,SDXL Turbo 就能够...
-
机器学习 - 似然函数:概念、应用与代码实例
本文深入探讨了似然函数的基础概念、与概率密度函数的关系、在最大似然估计以及机器学习中的应用。通过详尽的定义、举例和Python/PyTorch代码示例,文章旨在提供一个全面而深入的理解。 关注TechLead,分享AI全维度知识。作者拥有10+...
-
调教 文心一言 生成 AI绘画 提示词(Midjourney)
文章目录 第一步 第二步 第三步 第四步 第五步 第六步 第七步 第八步 文心一言支持连续对话 我瞎玩的非专业哈哈 第一步 你好,今天我们要用扩散模型创建图像。我会给你提供一些信息。行吗? 第二步...
-
斯坦福美女博士创业项目爆火!AI视频生成出道即顶流
斯坦福华人博士休学搞创业,直接火爆AI圈! 新产品瞄准AI视频生成,刚出道就成行业顶流,引来一众大佬围观评价。 OpenAI大牛Andrej Karpathy转发,并激情附上长文一段: 每个人都能成为多模态梦境的导演,就像《盗梦空间》里的筑梦师一样。...
-
原神盲盒风格:AI绘画Stable Diffusion原神人物公仔实操:核心tag+lora模型汇总
本教程收集于:AIGC从入门到精通教程汇总 在这篇文章中,我们将深入探讨原神盲盒的艺术风格,以及如何运用AI绘画技术(Stable Diffusion)——来创造原神角色公仔。我们将通过实践操作让读者更好地理解这种技术,以及如何利用关键标签和Lora模型...
-
当下最强的 AI art 生成模型 Stable Diffusion 最全面介绍
目录 模型生成效果展示(prompt 全公开) 如何注册 Stable Diffusion 使用 SD(dreamstudio.ai )的收费标注如何 SD 提供哪些参数可以设置 如何使用种子来改进一张作品 我用 SD 创作的图片著作权如何归属...
-
Emu Video官网体验入口 AI视频生成免费软件app下载
《Emu Video》是一种基于扩散模型的文本到视频生成工具,它可以将文本提示转化为图像,然后再将这些图像转化为视频。这一分步生成方法提高了视频生成模型的训练效率。《Emu Video》在哪里可以体验呢?下面就给大家带来《Emu Video》官网体验入口和...
-
大模型之Bloom&LLAMA----RHLF(强化学习)
0. 简介 随着chatgpt的爆火,最近也有很多大模型在不断地出现,比如说Bloom系列以及以LLAMA为基础的ziya和baichuan。这些模型相较于chatglm来说,更加具有发展前景,因为其是完全可商用,并可以不断迭代更新的。最近作者在跟着h...
-
3D AIGC领域的Midjourney?Meshy可一句话生成3D游戏资产
随着游戏、电影和XR行业对3D模型需求的不断增加,Meshy作为一款由胡渊鸣创立的在线生成AI工具,迎合了市场对3D内容快速生成的需求。 Meshy的创始人兼CEO胡渊鸣是计算机图形学知名学者,Meshy是他创立的独立新品牌。团队成员来自全球知名机构,包括...