-
后期狂喜!一张照片丝滑替换视频主角,动作幅度再大也OK|Meta&新加坡国立大学
后期狂喜了家人们~ 现在,只需一张图片就能替换视频主角,效果还是如此的丝滑! 且看这个叫做“VideoSwap”的新视频编辑模型—— 小猫一键变小狗,基操~ 如果原物体本身扭动幅度大一些?也完全没问题: 细看俩者之间的运动轨迹,给你保持得是一毛一样:...
-
成立不到一年 生成式AI初创公司 Mistral AI 估值接近 20 亿美元
据知情人士透露,法国生成式人工智能初创公司 Mistral AI 即将完成约4.5亿欧元的融资。 与刚刚筹集了类似资金的德国 Aleph Alpha 不同,大多数投资者来自非洲大陆以外的地区。此轮融资由硅谷风险投资公司 Andreessen Horowit...
-
打造AI虚拟数字人,Stable Diffusion+Sadtalker教程
站长笔记 2 个月前 1 1k 如何使用Stable Diffusion整合Sadtalker Stable Diffusion是一个能够根据文本描述生成高质量图片的深度学习模型,它使用了一种叫做潜在扩散模型的生成网络架构,可以在普通的GPU...
-
DMP技术开源,可提升AI图像预测精度
Diffusion Models as Prior (DMP)是一种新的方法,它在AI生成的图像中提高了语义预测的准确性。该创新性方法巧妙地将预先训练的文本到图像模型应用于各种任务,例如3D属性估计和语义分割,在有限的训练数据下表现优于现有技术。 项目地...
-
使用 LoRA 进行 Stable Diffusion 的高效参数微调
LoRA: Low-Rank Adaptation of Large Language Models 是微软研究员引入的一项新技术,主要用于处理大模型微调的问题。目前超过数十亿以上参数的具有强能力的大模型 (例如 GPT-3 通常在为了适应其下游任...
-
宋紫薇将主讲理想汽车智能软件发布会 涉及大模型等内容
理想汽车发布预告,宣布将于12月10日召开智能软件发布会,带来品牌史上最强的OTA更新。这次发布会的主讲人将是今年才入职的宋紫薇,她曾担任过iQOO的产品经理。 宋紫薇在今年9月份离职后加入了理想汽车,她曾通过微博回应离职一事,并透露了自己下一步计划。她表...
-
开源大模型LLaMA 2会扮演类似Android的角色么?
在AI大模型没有商业模式?等文章中,我多次表达过这样一个观点:不要把大模型的未来应用方式比喻成公有云,大模型最终会是云端操作系统的核心(新通用计算平台),而它的落地形式会很像过去的沃森,以系统型超级应用的形态落地。假如真的这样,那无疑的就需要一个开源的、便...
-
OpenAI CEO山姆·奥特曼被时代杂志评为2023年度CEO
《时代》杂志今日评选出2023年度CEO,OpenAI CEO山姆·奥特曼荣膺此殊荣。这标志着在充满挑战和胜利的一年里,奥特曼以其富有科技远见和卓越领导力受到了巨大的赞誉。 奥特曼表示,今年的感恩节对他来说格外特别。他回顾了OpenAI经历的一年,其中包括...
-
Stable Diffusion模型无法自动下载问题处理
我们在打开Stable Diffusion时,往往需要先关掉VPN才能正常加载底模等模型。 但是关闭VPN后,使用ControlNet等需要自动加载模型文件时,又会报连接失败。及时这时再开启VPN也没有效果。 前后矛盾,让人非常头疼。 造成这个现象的...
-
RangePerception:Range View3D检测新思路!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:RangePerception: Taming LiDAR Range View for Efficient and Accurate 3D Object Detection 论文链接:htt...
-
DeepMind最新Nature论文被爆重大缺陷 AI没弄出新化合物还弄错成分
近日,谷歌DeepMind团队与其他团队联合发表的一篇论文声称AI可以自主创造合成物,引发了广泛讨论。然而,伦敦大学的一位化学教授发现了这篇论文中严重的缺陷,指出其材料表征存在问题,并建议撤回该论文。 论文中介绍了AI在短短17天内合成了41种新材料的成果...
-
使用chatGPT生成提示词,在文心一言生成装修概念图
介绍 家是情感的港湾,而家居装修则是将情感融入空间的艺术。如何在有限的空间里展现个性与美感,成为了现代人关注的焦点。而今,随着人工智能的发展,我们发现了一个新的创意助手——ChatGPT,它不仅为我们带来了更多可能性,还能为家居装修提供独特的文心一言提示...
-
田渊栋团队最新论文解决大模型部署难题 推理系统吞吐量提高近30倍!
田渊栋团队最新发表的论文解决了大型语言模型在实际部署中遇到的内存和输入长度限制的问题,将推理系统的吞吐量提高了近30倍。论文提出了一种实现KV缓存的新方法,通过识别和保留重要的tokens,显著减少了内存占用,并在长输入序列的任务中表现良好。 这篇论文的研...
-
【大模型AIGC系列课程 2-2】大语言模型的“第二大脑”
1. 大型语言模型的不足之处 很多人使用OpenAI提供的GPT系列模型时都反馈效果不佳。其中一个主要问题是它无法回答一些简单的问题。 ● 可控性:当我们用中文问AI一些关于事实的问题时,它很容易编造虚假答案。 ● 实时性:而当你询问它最近发生的新闻事...
-
谷歌将 Gemini AI 工具视为「有益的协作者」,而不是一个智能软件
谷歌于当地时间周三(12 月 6 日)发布了备受期待的 Gemini,并称其为「规模最大、功能最强的 AI 模型」。 在产品发布前的活动中,谷歌表示,Gemini 是其创建的最灵活的人工智能(AI)模型,因为它有不同大小的版本,从可以在智能手机上运行的版...
-
如何用 Midjourney 绘制你自己的拟人头像?
在元宇宙时代,许多人都使用各种AI应用程序来生成他们自己的头像,其中Midjourney是一个非常流行的选择。然而,成功的先行者可能不愿意透露具体的prompt(提示语),因为他们可能担心自己的创意被其他人抄袭。此外,prompt的选择也取决于每个人的具体...
-
思维链提出者Jason Wei:关于大模型的6个直觉
还记得 Jason Wei 吗?这位思维链的提出者还曾共同领导了指令调优的早期工作,并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 参与 ChatGPT 的开发工作。机器之心曾经报道过他为年轻 AI 研...
-
一种平价的chatgpt实现方案,基于清华的 ChatGLM-6B + LoRA 进行finetune.(aigc大模型风口,校招找工作必备)
** 清华大学的chatglm-6b开源模型对话能力虽然能基本满足对话需求,但是针对专业领域和垂直领域回答显得智商捉急,这个时候就需要进行微调来提升效果,但是但是同学们显卡的显存更捉急,这时候一种新的微调方式诞生了,现在大火的ai作画里面的lora训练方式...
-
思维链提出者Jason Wei:关于大模型的六个直觉
还记得 Jason Wei 吗?这位思维链的提出者还曾共同领导了指令调优的早期工作,并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 参与 ChatGPT 的开发工作。机器之心曾经报道过他为年轻 AI...
-
数字人直播热度未减,真人模仿AI也火了!
近年来,AI技术高速发展,以数字人直播为代表的AIGC相关话题热度一直高居不下。 而另一边,真人模仿AI的视频和直播近期也在短视频平台上刷屏,悄悄走红。 达人@Barbin.ili芭比是一位舞蹈博主,11月25日,她发布了一条在西湖边模仿芭比娃娃跳舞的视频...
-
Stable Diffusion web UI之X/Y/Z plot使用
一、安装环境配置 PASSCFG Scale配置的越高,SD生成的图会更贴用户提供的prompt来进行生成,AI的自由度会下降,生成人物的时候特别需要注意,对于手脚脸部,过高的值更容易造成过拟合还有画面崩坏。 二、X/Y/Z plot 使用 X/...
-
Gemini vs ChatGPT:谷歌最新的AI和ChatGPT相比,谁更强?
谷歌刚刚在其AI之旅中迈出了新的一步,推出了其最新和最强大的AI模型Gemini 1.0。 谷歌最优秀、最聪明的AI能否击败其最知名的竞争对手——AI聊天机器人ChatGPT?以下是关于机器人之战中的最新参赛者的信息。 在本文中,你将了解Gemini和...
-
春晚回应吉祥物被质疑是AI合成:确实是设计师一笔一划画出来的
关于2024龙年春晚吉祥物“龙辰辰”的形象,有网友怀疑是AI合成的,12月7日凌晨,@春晚 微博发出声明,说“‘龙辰辰’虽然不完美,但是确实是设计师一笔一划画出来的”,“从龙的纹饰、色彩、面部等等,每个细节都经过了无数次的修改,设计师的头发都掉了一把又一把...
-
必收藏!105页SD提示词手册;百度 Prompt 官方课程;7场 AIGC 免费线下活动;不懂代码的我,利用GPT做了一个微信小程序 | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 『Stable Diffusion Prompt Book』105页超详细,必收藏的AI绘画实用手册 ShowMeAI知识星球资料编号...
-
首超人类专家!OpenAI“混乱”之际,谷歌多模态大模型Gemini“大杀四方”
在OpenAI“混乱”之际,Google准备“大杀四方”。 就在昨日晚间,Google 和 Alphabet CEO Sundar宣布Gemini上线,并称之为“我们规模最大、能力最强的 AI 模型”,语惊四座。 Gemini的关键词是“多模态”,Go...
-
Google Gemini官方体验入口在哪 谷歌AI模型介绍
Google Gemini是一个由Google开发的下一代人工智能(AI)项目,它旨在创建一个强大的多模态AI模型,能够处理不同类型的内容,如文本、图像、代码等,并具有高级的语言、对话、创造和分析能力。Gemini软件的体验入口在哪呢,这里我们来看下Gem...
-
ChatGPT AIGC 一个指令总结Python所有知识点
在ChatGPT中,直接输入一个指令就可以生成Python的所有知识点大纲。 非常实用的ChatGPT功能。 AIGC ChatGPT 职场案例 AI 绘画 与 短视频制作, Power BI 商业智能 68集, 数据库Mysql8.0 54集...
-
Meta 推出独立的 AI 图像生成器,目前免费但只支持英文提示词
IT之家 12 月 7 日消息,Meta 公司日前推出全新的、独立的 AI 图像生成器 ——Imagine with Meta,允许用户通过自然语言描述来创建图像。 据介绍,新的人工图像生成器由 Meta 现有的 Emu 图像生成模型提供支持,可根据文...
-
什么是 Gemini?关于谷歌新AI模型你应该知道的一切
什么是 Gemini? Google Gemini是谷歌最新发布的强大人工智能模型,不仅可以理解文本,还能处理图像、视频和音频。作为一种多模态模型,Gemini被描述为能够在数学、物理等领域完成复杂任务,同时能够理解并生成各种编程语言中的高质量代码。 Ge...
-
数据资产入表在即,企业如何把握机遇,进行数据资产管理?
数据作为新时代重要的生产要素之一,数据资产化的相关工作正在提速。自今年10月1日起,中国资产评估协会制定的《数据资产评估指导意见》正式施行。同时,《企业数据资源相关会计处理暂行规定》近期转为正式稿,也将于明年1月1日起施行。 《暂行规定》规定:企业使用的...
-
AIGC技术研究与应用 ---- 下一代人工智能:新范式!新生产力!(2.3-大模型发展历程 之 图像、视频生成与视觉大模型)
文章大纲 GAN 模型与强化学习 强化学习 生成式对抗网络 ( Generative Adversarial Nets, GAN VAE 扩散模型 扩散 逆扩散 参考...
-
Meta、微软表示将购买 AMD 的最新 AI 芯片 MI300X,作为英伟达芯片的替代品
在 AMD 周三的投资者活动上,最新的人工智能芯片——Instinct MI300X">Meta、OpenAI 和微软宣布,他们将使用 AMD 最新的人工智能芯片——Instinct MI300X。这是迄今为止科技公司寻找替代 Nvidia 昂贵图形...
-
《安富莱嵌入式周报》第307期:开源智能制冷板,Keil MDK6发布时间,编程助手Github Copilot X,Matlab2023,高品质电容式麦DIY
周报汇总地址:嵌入式周报 - uCOS & uCGUI & emWin & embOS & TouchGFX & ThreadX - 硬汉嵌入式论坛 - Powered by Discuz! 视频版:...
-
谷歌CEO皮查伊深度解析谷歌史上最强大模型Gemini及即将到来的人工智能时代
12月7日消息,美国当地时间周三,谷歌发布了其新一代人工智能模型Gemini。Gemini反映了谷歌内部多年来在首席执行官桑达尔·皮查伊(Sundar Pichai)的监督和推动下所做的努力。 此前负责Chrome和安卓业务的皮查伊是出了名的产品迷。2...
-
MIT新创公司Liquid AI融资近4千万美元,希望构建新型液态神经网络人工智能
Liquid AI,一家由MIT孵化的新兴公司,近日成功完成了一轮接近4千万美元的种子轮融资,其目标是构建一种全新类型的人工智能,被称为液态神经网络。这一创新性的技术基于液态神经网络架构,旨在提供更为精简、可解释且动态适应的人工智能系统。 Liquid A...
-
ai智能写作如何快速写文?
ai智能写作对于那些长期写文的朋友来说应该都不陌生,特别是那些有写文工作需求的朋友,在遇到没有写作灵感的时候,ai智能写作立刻就能缓解问题,ai智能写作近几年在互联网上的兴起也正是因为可以解决大多数编辑人员,以及小说写手、文案人员的写作问题,而随...
-
盘点AWS re:Invent 2023大会值得关注的十大亮点
译者 | 晶颜 审校 | 重楼 “AWS re:Invent 2023”于11月27日至12月1日在拉斯维加斯举行,展示了亚马逊保持其领先云提供商地位的承诺。通过一系列战略公告,该公司展示了其在行业中树立新标准的不懈追求。以下是今年活动的十大亮点: A...
-
腾讯与悉尼大学联手打造GPT4Video:显著提升大语言模型视频生成能力
在多模态大型语言模型(MLLMs)领域取得显著进展的同时,尽管在输入端多模态理解方面取得了显著进展,但在多模态内容生成领域仍存在明显的空白。为填补这一空白,腾讯人工智能实验室与悉尼大学联手推出了GPT4Video,这是一个统一的多模态框架,赋予大型语言模型...
-
从零开始训练 Stable Diffusion 的成本 < 16 万美元
我们想知道使用我们的流数据集、Composer 和 MosaicML 云平台从头开始训练稳定扩散模型需要多少时间(和金钱)。我们的结果:13 天内我们将花费 79,000 个 A100 小时,总培训成本不到 160,000 美元。我们的工具不仅将时间和成本...
-
亚马逊云科技推出新型生成式 AI 助手 Amazon Q
亚马逊云科技宣布推出一种新型生成式 AI 助手 Amazon Q,专为满足办公场景的需求而设计。 Amazon Q 可以根据客户的业务进行定制,帮助员工快速获得复杂问题的答案、生成内容并采取行动。它可以根据企业的人员、角色和权限进行个性化定制,并确保客户的...
-
AIGC: 关于ChatGPT抽象Prompt提问模板的设计
为什么需要Prompt模板 基于前文我们具备了Prompt构建的基础能力,但是我们在实际编写Prompt的过程当中,可能还会存在一些的问题 比如对于背景和细节的描述还是不够 或者为了描述的清楚堆砌了大量的文字, 导致整个Prompt的结构化和...
-
谷歌发布多模态大模型Gemini 1.0 预计明年初向开发者推出
Gemini 是 Google 推出的最新一代 AI 模型,Gemini 具有多模态的能力,可以处理和结合文本、代码、音频、图像和视频等不同类型的信息。 Gemini 分为三种规模:Ultra、Pro 和 Nano,分别针对不同的复杂任务和设备。 Ge...
-
揭秘AI魔法绘画:Stable Diffusion引领无限创意新纪元
文章目录 1. 无限的创意空间 2. 高效的创作过程 3. 个性化的艺术表达 4. 跨界合作的可能性 5. 艺术教育的革新 6. 艺术市场的拓展 《AI魔法绘画:用Stable Diffusion挑战无限可能》 编辑推荐 内容简介 作者简...
-
Meta、微软承诺购买AMD新型人工智能芯片 作为英伟达GPU替代品
12月7日消息,当地时间周三Meta、OpenAI和微软在AMD投资者活动上表示,他们都将使用AMD最新开发的人工智能芯片Instinct MI300X。这表明,虽然英伟达的GPU芯片对于开发和部署ChatGPT等人工智能程序至关重要,但很多科技公司都...
-
锐龙8040官宣!AMD首创的AI PC性能飙升60% 明年再涨3倍
AMD 2023年初发布的锐龙7040系列处理器,不但为笔记本带来了迄今最先进的4nm制造工艺、Zen4 CPU架构、RDNA3 GPU架构,还第一次为x86处理器加入了独立的NPU AI引擎硬件单元。 这就是Ryzen AI,也创造了AI P...
-
2023年新课标I卷作文,5位人工智能考生(ChatGPT,文心一言,GPT4, ChatGLM-6b, ChatT5)来写作,看谁写得最好
大家好,我是微学AI,今天是2023年6月7日,一年一度的高考又来了,今年的高考作文题也新鲜出炉。今年是特殊的一年,有人说2023是AI的元年,这一年里有大语言模型的爆发,每天都有大模型的公布,在2023年有文心一言,GPT4, ChatGLM等语言模型的...
-
吞吐量提升近30倍!田渊栋团队最新论文解决大模型部署难题
大型语言模型 (LLM) 在今年可谓是风光无限。不过惊艳的效果背后是一个巨大的模型以及夸张的硬件资源。 LLM在现实中部署时通常会面临两个难题:昂贵的KV缓存成本,以及对长序列的泛化能力差。 近日,田渊栋团队发表了一篇论文,成功解决以上两个难题,并将推理...
-
遥遥领先GPT-4!谷歌最强AI大模型Gemini 1.0发布
快科技12月7日消息,在5月举行的开发者大会上,谷歌首次透露其正在开发的AI大模型Gemini,时隔7个月,Gemini终于来了。 据谷歌官方公众号消息,谷歌日前正式发布Gemini 1.0,这是谷歌迄今为止构建的最强大、最通用、最灵活的模型。 据介绍,...
-
大语言模型分布式训练的量化分析与优秀实践,以 GPT-175B 为例
一、Transformer 大语言模型的 SOTA 训练技术 1、大语言模型的发展背景与挑战 首先和大家分享下大语言模型的发展背景。过去的几年内,无论从数据量的维度还是从模型规模的维度,语言模型规模都扩大了非常多的数量级。随着数据量和模型规模的扩大,也...
-
Stable Diffusion:开启AI魔法绘画的无限可能
? 个人网站:【 海拥】【神级代码资源网站】【办公神器】 ? 基于Web端打造的:?轻量化工具创作平台 ? 想寻找共同学习交流的小伙伴,请点击【全栈技术交流群】 随着人工智能技术的蓬勃发展,图像生成和艺术创作领域掀起了一股新的浪潮。在这股浪潮中,St...