-
AIGC 加持 Cocos,游戏开发需要几步?
近日,游戏行业知名的 B2B 大会 WN 2023 大会于土耳其首都伊斯坦布尔顺利举办。本次大会邀请了来自全球的游戏开发商、媒体、发行商、分发平台等行业决策者,共同探讨游戏行业未来发展态势,进一步拓展业务,并在世界范围内寻找新的合作伙伴,Coc...
-
Gartner:可持续发展和数字主权将作为选择公有云生成式AI服务的首要标准
Gartner公司预测,到2027年,70%采用生成式人工智能(生成式AI)的企业将把可持续发展和数字主权作为选择公有云生成式AI服务的首要标准。 Gartner研究副总裁Sid Nag表示:“云技术因其规模和共享服务模式而成为大规模提供生成式AI应用...
-
Stable Diffusion 光影艺术字
微缩成小图的时候能看到文字,放大图片之后文字消失,这种图片最适合发朋友圈了。实现这种效果的方式有很多种,有的是和衣服上的颜色和款式结合,有的是通过光影结合。今天给大家介绍如何生成光影效果,一种类似光透过特殊窗户打到物体上的效果,先看成图: 这种效果主...
-
Stable Diffusion——基础模型、VAE、LORA、Embedding各个模型的介绍与使用方法
前言 Stable Diffusion(稳定扩散)是一种生成模型,基于扩散过程来生成高质量的图像。它通过一个渐进过程,从一个简单的噪声开始,逐步转变成目标图像,生成高保真度的图像。这个模型的基础版本是基于扩散过程的,但也有一些改进版本,包括基于变分自动...
-
Stable Diffusion 模型的概念、类型、下载、安装、使用
本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里。 大家好,我是水滴~~ 我们在《Stable Diffusion WebUI 界面介绍》 时,第一个就讲到了 Stable Diffusion 模型,那么这个模型是什么?该从哪儿下载?下载...
-
DeepMind CEO:LLM+树搜索就是AGI技术线路,AI科研依赖工程能力,闭源模型就是比开源安全
谷歌在2月之后突然切换到了996模式,不到一个月的时间抛出了5个模型。 而DeepMind CEO Hassabis本人也是四处为自家的产品站台,曝出了很多幕后的开发内幕。 在他看来,虽然还需要技术突破,但是现在人类通往AGI之路已经出现。 而DeepM...
-
李飞飞,最火AI女王
黄仁勋又出手了。 最近,英伟达宣布成立一个新研究部门——通用具身智能体研究实验室GEAR。令人意外的是,该实验室的领导者是两位华人90后博士——范麟熙(Jim Fan)和朱玉可(Yuke Zhu 。 范麟熙和朱玉可身上标签很多,但最为鲜明还是一点:李飞飞的...
-
windows安装stable-diffusion-webui教程
整合包对非技术出身的同学比较友好,因为秋叶大佬把相关的东西已经都整合好了,只需要点点点就行了。当然懂编程的同学就更没有问题了。 准备 为了保证AI绘画的效率,建议在本机安装Nvidia独立显卡,也就是俗称的N卡,并且显存要达到6G以...
-
ControlNet作者又出新作:百万数据训练,AI图像生成迎来图层设计
尽管用于生成图像的大模型已经成为计算机视觉和图形学的基础,但令人惊讶的是,分层内容生成或透明图像(是指图像的某些部分是透明的,允许背景或者其他图层的图像通过这些透明部分显示出来)生成领域获得的关注极少。这与市场的实际需求形成了鲜明对比。大多数视觉内容编辑...
-
用code去探索理解Llama架构的简单又实用的方法
除了白月光我们也需要朱砂痣 我最近也在反思,可能有时候算法和论文也不是每个读者都爱看,我也会在今后的文章中加点code或者debug模型的内容,也许还有一些好玩的应用demo,会提升这部分在文章类型中的比例 今天带着大家通过代码...
-
Stable Diffusion 训练
文章目录 前言 一、主要训练方式 二、kohya_ss安装(Linux 1.打开终端并切换到所需的安装目录 2.通过运行以下命令克隆存储库 3.切换到kohya_ss目录 4.通过执行命令来运行安装脚本 5.安装完成后,在kohya_ss目...
-
如何使用小型自动生成的数据集训练编码LLM
译者 | 李睿 审校 | 重楼 虽然像GPT-4这样的大型语言模型(LLM 在编写软件代码方面非常精通,但是这些模型的成本和不透明性激发了人们对更加经济、规模更小的编码LLM的兴趣。 这些替代方案可以针对特定任务进行微调,并且成本很低。开发这些LLM的...
-
Stable Diffusion教程:4000字说清楚图生图
原文:Stable Diffusion教程:4000字说清楚图生图 - 知乎 目录 收起 基本使用 涂鸦绘制 局部绘制 局部绘制(涂鸦蒙版) 局部绘制(上传蒙版) 批量处理 总结 资源下载 “图生图”是 Stable Diffusio...
-
百度2023年净利润大涨39%至287亿元!李彦宏:将坚定对AI的投入
快科技2月28日消息,今天,百度公布了截至2023年12月31日的2023第四季度和全年财务报告,全年共营收1345.98亿元,非公认会计准则下净利润287亿元,同比增长了39%。 财报显示,百度2023年第四季度总收入350亿元,同比增长6%;非公认会计...
-
苹果取消电动车计划,转向聚焦生成式AI
在近期的一份内部声明中,苹果首席运营官Jeff Williams和电动车项目负责人Kevin Lynch宣布取消自动驾驶电动车计划,将大部分从事该项目的2,000名员工调往生成式AI项目。这一决定意味着苹果将把重心转向生成式人工智能领域。 据悉,苹果的AI...
-
百度发布2023年第四季度财报 李彦宏:继续坚定对生成式AI投入
百度公布了其2023年第四季度及全年的财务报告,全年总营收高达1345.98亿元,同比增速达39%,归属百度的净利润(non-GAAP)为287亿元,同样实现了显著增长。 在第四季度,百度的营收达到了349.51亿元,同比增长44%,净利润(non-GAA...
-
【AIGC】Stable Diffusion的模型微调
为什么要做模型微调 模型微调可以在现有模型的基础上,让AI懂得如何更精确生成/生成特定的风格、概念、角色、姿势、对象。Stable Diffusion 模型的微调方法通常依赖于您要微调的具体任务和数据。 下面是一个通用的微调过程的概述: 准备数据集:...
-
CVPR'24发榜,华人博士生连中三篇凡尔赛!官方下场发梗图玩坏网友
千呼万唤,就在今天,CVPR 2024的接收结果终于出来了。 官方已邮件发送通知,已经有不少人晒出好消息: 当然,目前刚刚公布的是初步结果,具体中标的是oral还是highlight还要再等等。 以及详细统计数据也还没出。 但无论是中了还是“缘分未...
-
亚马逊云宣布Mistral AI 模型即将登陆 Amazon Bedrock
Mistral AI 是一家总部位于法国的人工智能公司,专注于将公开可用的模型提升至最先进的性能水平。他们主要致力于构建快速而安全的大型语言模型(LLM),可用于各种任务,如聊天机器人和代码生成。 亚马逊云科技很高兴地宣布,Mistral AI 的两种高性...
-
当"狂飙"的大模型撞上推荐系统
随着以 ChatGPT 为代表的大模型技术的迅速发展,推荐系统正经历着一场革命性的变革。传统的推荐系统主要基于用户和物品的历史行为数据进行预测,大模型技术的出现,为推荐系统带来了更强的泛化能力和更高的效率,解决了传统推荐系统中的一些难题,如用户和物品...
-
微软牵手OpenAI劲敌!Mistral最新顶级大模型不再开源
撰稿丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 近日,微软宣布与估值约20亿美元的法国AI独角兽Mistral达成合作伙伴关系。 众所周知,成立于去年5月的Mistral凭借其首个模型Mistral 7B就引起了全球AI界的瞩目...
-
高质量论文中文翻译:Lag-Llama: 朝向基础模型的概率时间序列预测 Lag-Llama: Towards Foundation Models for Probabilistic Time S
Lag-Llama: 朝向基础模型的概率时间序列预测Lag-Llama: Towards Foundation Models for Probabilistic Time Series Forecasting 文章目录 摘要 介绍 我们的贡献...
-
Llama中文大模型
关于Llama中文大模型 欢迎来到Llama中文大模型:已经基于大规模中文数据,从预训练开始对Llama2模型进行中文能力的持续迭代升级。 Llama中文大模型 :https://github.com/LlamaFamily/Llama-Chine...
-
谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA
AI视频模型Sora爆火之后,Meta、谷歌等大厂纷纷下场做研究,追赶OpenAI的步伐。 最近,来自谷歌团队的研究人员提出了一种通用视频编码器——VideoPrism。 它能够通过单一冻结模型,处理各种视频理解任务。 图片 论文地址:https://a...
-
模型融合、混合专家、更小的LLM,几篇论文看懂2024年LLM发展方向
在过去的 2023 年中,大型语言模型(LLM)在潜力和复杂性方面都获得了飞速的发展。展望 2024 年的开源和研究进展,似乎我们即将进入一个可喜的新阶段:在不增大模型规模的前提下让模型变得更好,甚至让模型变得更小。 现在,2024 年的第一个月已经过去...
-
都在搞端到端,试问端到端自动驾驶的基石到底是什么?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 基础模型的出现彻底改变了自然语言处理和计算机视觉领域,为其在自动驾驶(AD)中的应用铺平了道路。这项调查对40多篇研究论文进行了全面回顾,展示了基础模型在增强AD中的...
-
单GPU就能压缩模型,性能不变参数少25%!微软提出模型稀疏化新方法
众所周知,对于大语言模型来说,规模越大,所需的算力越大,自然占用的资源也就越多。 研究人员于是乎把目光转到了这片领域,即模型的稀疏化(Sparsification)。 今天要介绍的SliceGPT,则可以实现模型的事后稀疏。也就是说,在一个模型训练完了以...
-
在OpenAI引领的多模态时代,专注语音的ElevenLabs如何生存?
2024年2月,OpenAI的视觉大模型Sora横空出世,这是一个历史性的里程碑,视觉生成领域将有一次大的技术和商业革命。 在Sora发布几天后,AI语音创业公司ElevenLabs为Sora的演示视频完成了精准匹配的配音,AI视频“以假乱真”的制作链条实...
-
被字节辟谣的中文版Sora,究竟厉害在哪里?
撰稿 | 云昭 出品 | 51CTO技术栈(微信号:blog51cto) 近日,市场有消息称,在Sora引爆文生视频赛道之前,国内的字节跳动也推出了一款新型视频模型Boximator,与Gen-2、Pink1.0等既有模型相比,Boximator的独特...
-
深度学习在时间序列预测的总结和未来方向分析
2023年是大语言模型和稳定扩散的一年,时间序列领域虽然没有那么大的成就,但是却有缓慢而稳定的进展。Neurips、ICML和AAAI等会议都有transformer 结构(BasisFormer、Crossformer、Inverted transf...
-
Sora新视频只发TikTok:OpenAI 4天涨粉10万
Sora新视频,变成“抖音独占”了。 悄无声息,OpenAI正式杀入TikTok,加上洗脑配乐直接让人刷到停不下来,疯狂引流吸粉中: 短短4天,涨粉10万,50万赞——这还是不打枪不宣传的情况下。 这以后,人类创作者还怎么玩? Sora新视频,只发Tik...
-
未来十年AI的最大发展趋势
穆斯塔法·苏莱曼在他的优秀著作《即将到来的浪潮》中指出,从内燃机到互联网,每一波由技术驱动的变革都在更短的时间内给社会带来了革命性的变化。因此,我认为我们不需要等待30年或者20年,AI就会应用于生活的方方面面。 在接下来的十年中,很多事情都会发生变化...
-
全网最全Stable Diffusion原理快速上手,模型结构、关键组件、训练预测方式!!!!
手把手教你入门绘图超强的AI绘画程序,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包(文末可获取) 【AIGC】Stable Diffusion的建模思想、训练预测方式快速 在这篇博客中,将会用机器学习入门级描...
-
算力成本迅速飙升,AI创企想挑战谷歌微软等巨头更难了
2月20日消息,随着计算成本飙升,人工智能行业的初创公司难以承担运营费用。大科技公司如谷歌、微软将主导这一领域。 萨姆·奥特曼(Sam Altman 计划筹集约7万亿美元用于开发人工智能芯片,这不仅是一个野心勃勃的故事。首先,构建人工智能所需的基础设施...
-
Sora给中国AI带来的真实变化
OpenAI的最新技术成果——文生视频模型Sora,在春节假期炸裂登场,令海内外的AI从业者、投资人彻夜难眠。 如果你还没有关注到这个新闻,简单介绍一下:Sora是OpenAI使用超大规模视频数据,训练出的一个通用视觉模型,可以理解和模拟运动中的物理世界,...
-
Stable Diffusion插件:EasyPhoto之Lora训练、AI写真、AI视频、AI换装
大家好,我是程序员晓晓 今天给大家分享一个特别强大的Stable Diffusion插件:EasyPhoto,这个插件一直在迭代,从最开始的AI写真,然后是AI视频,到最近的AI换装,能力一直在持续增强。 这个插件的基础能力是Lora训练,只需要5-2...
-
loading stable diffusion model: FileNotFoundError解决方案
本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里。 大家好,我是水滴~~ 本文主要介绍在安装 stable-diffusion-webui 时出现的 loading stable diffusion model: FileNotFound...
-
扩展说明: 指令微调 Llama 2
这篇博客是一篇来自 Meta AI,关于指令微调 Llama 2 的扩展说明。旨在聚焦构建指令数据集,有了它,我们则可以使用自己的指令来微调 Llama 2 基础模型。 目标是构建一个能够基于输入内容来生成指令的模型。这么做背后的逻辑是,模型如此...
-
使用Kohya_ss训练Stable Diffusion Lora
Stable Diffusion模型微调方法 Stable Diffusion主要有 4 种方式:Dreambooth, LoRA, Textual Inversion, Hypernetworks。 Textual Inversion (也称为 Em...
-
Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试
2023年10月,我们发表了一篇关于TimeGPT的文章,TimeGPT是时间序列预测的第一个基础模型之一,具有零样本推理、异常检测和共形预测能力。 虽然TimeGPT是一个专有模型,只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了...
-
本地部署 Stable Diffusion(Mac 系统)
在 Mac 系统本地部署 Stable Diffusion 与在 Windows 系统下本地部署的方法本质上是差不多的。 一、安装 Homebrew Homebrew 是一个流行的 macOS (或 Linux)软件包管理器,用于自动下载、编...
-
如何探索和可视化用于图像中物体检测的 ML 数据
近年来,人们越来越认识到深入理解机器学习数据(ML-data)的必要性。不过,鉴于检测大型数据集往往需要耗费大量人力物力,它在计算机视觉(computer vision)领域的广泛应用,尚有待进一步开发。 通常,在物体检测(Object Detectio...
-
ChatGPT和Whisper的API基本看点
ChatGPT Official API Learning 今天 OpenAI 开放了 ChatGPT 背后的 GPT-3.5 的模型 API,模型代号为 Turbo,其定价甚至比此前的 Davinci 都要便宜,1000 tokens 仅为 0.2...
-
Stable Diffusion XL简介
Stable Diffusion XL的是一个文生图模型,是原来Stable Diffusion的升级版。相比旧版的Stable Diffusion模型,Stable Diffusion XL主要的不同有三点: 有一个精化模型(下图的Refiner),...
-
Midjourney V6超深度评测;开源人工智能:创新的前沿
? AI新闻 ? Midjourney V6超深度评测:超现实主义细节爆表 摘要:国外网友Andre Kovalev对Midjourney V6进行了超深度评测,发现V6相较于V5.2在图片真实感、细节表现方面有较大提升。V6拥有超现实主义的特点,...
-
【ScienceAI Weekly】AI+生物凝聚物初创公司宣布裁员15%;科技部明确科研中的AIGC红线;讯飞医疗递表港交所
AI for Science 的新成果、新动态、新视角—— 全球首家将生物分子凝聚体应用于药物发现的公司,宣布裁减 18 个职位 谷歌 DeepMind 发布 AlphaGeometry Evaxion Biotech 宣布用 AI 开发定制癌症疫苗...
-
端到端纯视觉!OpenAI押注的人形机器人献艺拜年了
大过年的,OpenAI投资的人形机器人,通过最新视频拜年了(doge) 有俩人上来就表演了一个从货架取包裹,转身放进筐里: 镜头继续推进,旁边靠墙的两个机器人,在不停地将俄罗斯方块积木举起-丢下-再举起。 另一边,充好电的机器人,温柔地拔掉插销,微微半...
-
用通俗易懂的方式讲解:十分钟读懂 Stable Diffusion 运行原理
AIGC 热潮正猛烈地席卷开来,可以说 Stable Diffusion 开源发布把 AI 图像生成提高了全新高度,特别是 ControlNet 和 T2I-Adapter 控制模块的提出进一步提高生成可控性,也在逐渐改变一部分行业的生产模式。惊艳其出色表...
-
AIGC内容分享(五十七):AIGC:合规引领探索之路
目录 引言 01 资质合规 02 内部合规管理体系及制度 03 互联网应用关键条款完善 04 外部商业合作 结语 引言 从GPT 3.5的问世、GPT4.0的革新到Google最近推出的Gemini系列原生多模态AI基础模型,生成式人...
-
闲谈【Stable-Diffusion WEBUI】的插件:模型工具箱:省空间利器
文章目录 (零)前言 (一)模型工具箱(Model Toolbox) (1.1)基本使用界面 (1.2)高阶使用界面 (1.3)自动修剪模型 (零)前言 本篇主要提到WEBUI的一个新插件,模型工具箱,可以修剪模型,提取...