-
真实、可控、可拓展,自动驾驶光照仿真平台LightSim上新了
最近,来自 Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究者们在 NeurIPS 2023 上提出了一种全新的自动驾驶光照仿真平台 LightSim。研究者们提出了从真实数据中生成配对的光照训练数据的方法,解决了数据缺失和模型迁移损失的问题。L...
-
QTNet:最新时序融合新方案!点云、图像、多模态检测器全适用(NeurIPS 2023)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 & 个人理解 时序融合能够有效提升自动驾驶3D目标检测的感知能力,然而目前的时序融合方法由于成本开销等问题难以在实际自动驾驶场景中应用。NeurIPS 2023的最新研究文章 《Qu...
-
AI绘画-Midjourney基础1-突破想象的界限:掌握文本引导的图像生成技巧
Midjourney是一款 AI 绘画工具,可以根据你的提示(本文中称为 prompt)创作出各种图像。你只需要在Discord上和一个机器人聊天,就可以用简单的命令来控制它。目前已不支持免费试用,可以选择付费计划来获得更多功能和优势。 目前 Midjo...
-
北京大学发布EAGLE 大模型推理效率无损提升3倍
近年来,大语言模型在各领域应用广泛,但其文本生成过程昂贵且缓慢。为解决这一问题,滑铁卢大学、加拿大向量研究院、北京大学等机构联合发布了EAGLE。EAGLE的目标是提升大语言模型的推理速度,同时确保输出文本的分布一致性。通过外推大语言模型的第二顶层特征向量...
-
六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革
两千年前的古人穿越到一千年前后,需要适应的东西可能不多。而一千前的古人穿越到一百年前,变化也不至于大到难以适应。但如果一百年前的古人穿越到现在,甚至只是有人“冬眠”10年、20年,面对的现实世界的变化,恐怕会是天翻地覆。日新月异的技术进步,正不断带来颠覆...
-
数字图像处理的图像操作
图像操作在计算机视觉和图像处理中发挥着至关重要的作用。这些操作对于诸如预处理、增强图像质量和启用高级算法等任务至关重要。在计算机视觉中,诸如调整大小、裁剪、调整亮度/对比度/伽玛和几何变换等操作是基础的。它们允许进行高效的计算、提取感兴趣区域、规范化图像...
-
AI视野:谷歌Gemini Pro开放;文心一言插件商城上线;谷歌图像生成模型Imagen2发布;阿里推虚拟试穿技术Outfit Anyone
???AI新鲜事 谷歌Gemini Pro开放 谷歌Gemini Pro大模型在研究基准测试中表现优异,支持32K上下文窗口的文本输入和生成功能,向Vertex AI云计算客户和AI Studio开发人员开放,提供多种功能和SDK,为构建AI应用程序提供更...
-
LLM生成3D场景,无限延伸!斯坦福华人提出3D动画生成框架,一句话一幅图创造无限3D世界
斯坦福华人退学博士开发的Pika,让AI技术和艺术迸发出了绚丽的火花。 最近,又有斯坦福的华人研究人员提出的新的框架——WonderJourney, 可以用一句话或者一张图,自动生成一系列3D场景的连续画面,效果炫酷! 图片 用一张爱丽丝奇境漫游的图片,...
-
首个「创造式任务」基准来了!北大清华联手发布Creative Agents:专为想象力而生!
近年来,许多研究通过训练服从自然语言指令的智能体,让智能体具有了解决各种开放式任务的能力。 例如,SayCan[1]利用语言模型实现了根据语言描述解决各种室内机器人任务的智能体,Steve-1[2]训练端到端的策略实现了能够在《我的世界》(Minecra...
-
大模型推理效率无损提升3倍,滑铁卢大学、北京大学等机构发布EAGLE
大语言模型(LLM)被越来越多应用于各种领域。然而,它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则:每个词(token)的生成都需要进行一次前向传播,需要访问数十亿至数千亿参数的 LLM。这导致传统自回归解码的速度较慢。 近日,滑铁...
-
南洋理工发布提高AI视频生成内容一致性方法FreeInit
南洋理工大学发布了一项名为FreeInit的方法,该方法可以大幅提高人工智能视频生成的内容一致性。演示显示这一方法非常流畅,并且可以与现有的SD生态结合。此外,他们还发表了与Animatediff结合的方法,只需等待一些专业人士制作插件,就可以使用这一方法...
-
四大AI视频工具“斗法” 一文教你怎么玩
AI视频工具赛道越来越卷,各种升级令人应接不暇,尤其是Gen-2、Pika1.0、Stable Video Diffusion、和Magic Animate,它们正在成为用户最常用的视频生成产品,背后有强大的AI大模型支撑。 尽管目前的视频类大模型还达不到...
-
stable diffusion webui mov2mov
手把手教你用stable diffusion绘画ai插件mov2mov生成动画_哔哩哔哩_bilibili手把手教你用stable diffusion绘画ai插件mov2mov生成动画, 视频播放量 14552、弹幕量 3、点赞数 275、投硬币枚数 11...
-
腾讯又整活!一句话让图片变动漫主角!
撰稿 | 清竹 出品 | 51CTO技术栈(微信号:blog51cto) 2023年底,AI圈似乎已经被“文生视频”模型攻占了! 11月底 AI 文生视频工具 Pika 1.0 横空出世、风头一时无两,日前斯坦福大学 AI 科学家李飞飞团队联合谷歌推...
-
随意指定CLIP关注区域!上交复旦等发布Alpha-CLIP:同时保持全图+局部检测能力
CLIP是目前最流行的视觉基座模型,其应用场景包括但不限于: 与LLM大语言模型结合成为视觉多模态大模型; 作为图像生成(Stable Diffusion 、点云生成(Point-E 的condition model,实现image-to-3D; 用于...
-
RayDF:实时渲染!基于射线的三维重建新方法
本文经自动驾驶之心公众号授权转载,转载请联系出处。 图片 论文链接:https://arxiv.org/pdf/2310.19629 代码链接:https://github.com/vLAR-group/RayDF 主页:https://vlar-gro...
-
智谱AI发布中文 LLM 对齐评测基准AlignBench
智谱AI发布了专为中文大语言模型(LLM)而生的对齐评测基准AlignBench,这是目前第一个针对中文大模型的评测基准,能够在多维度上细致评测模型和人类意图的对齐水平。 AlignBench 的数据集来自于真实的使用场景,经过初步构造、敏感性筛查、参考答...
-
阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!
继AnimateAnyone之后,阿里又一项“舞蹈整活儿”论文火了—— 这一次,只需一张脸部照片、一句话描述,就能让你在任何地方跳舞! 例如下面这段《擦玻璃》的舞蹈视频: 图片 你所需要做的就是“投喂”一张人像,以及一段prompt: 一个女孩,微笑着,...
-
Meta AI开源T2V模型AVID 可修复视频改变纹理
Meta AI最近开源了AVID,这是一项具有先进修复和扩展能力的 T2V 模型。AVID 不仅支持通过文本编辑视频,还可以修复视频、更改视频对象、改变纹理和颜色,甚至删除视频内容或更换视频环境。 项目地址:https://zhang-zx.github...
-
只需三小时,用ChatGPT就可写出高质量的论文!
1、确定论文主题和研究方向 讨论和阐述:与ChatGPT讨论你的论文主题,探讨不同的视角和研究方向。这有助于你确定具体的研究问题。 2、收集和整理信息 信息检索:利用ChatGPT来帮你找到相关的学术资源和资料。虽然我不能直接浏览互联网,但可以根据你的...
-
Animate Anyone使用入口地址 AI视频生成器分享
Animate Anyone 是一个由阿里巴巴智能计算研究院开发的软件,它可以从静态图像生成动态视频,可将任意图像角色动画化。Animate Anyone软件的体验入口在哪呢,这里我们来看下Animate Anyone的官方体验入口。 >>&...
-
Stable Diffusion入门笔记(自用)
学习视频:20分钟搞懂Prompt与参数设置,你的AI绘画“咒语”学明白了吗? | 零基础入门Stable Diffusion·保姆级新手教程 | Prompt关键词教学_哔哩哔哩_bilibili 1.图片提示词模板 2.权重(提示词)...
-
零一万物Yi-34B-Chat微调模型上线,登陆多个权威榜单
最近,业内众多大模型基准又迎来了一轮 “实力值” 更新。 继 11 月初零一万物发布 Yi-34B 基座模型后,Yi-34B-Chat 微调模型在 11 月 24 日开源上线 ,短时间登陆了全球多个英文、中文大模型权威榜单,再度获得了全球开发者的关注。...
-
MagicAnimate官方入口地址 AI动画制作软件分享
MagicAnimate 是一个使用扩散模型实现时间一致的人像动画的软件。它可以让你用不同的动作序列为参考图像制作动画,包括跨ID动画和未见领域如油画和电影角色。如果你想了解MagicAnimate软件的体验入口在哪里,我们可以一起来看一下MagicAni...
-
直追GPT-4!李开复Yi-34B新成绩公布:94.08%的胜率超越LLaMA2等主流大模型
仅次于GPT-4,李开复零一万物Yi-34B-Chat最新成绩公布—— 在Alpaca经认证的模型类别中,以94.08%的胜率,超越LLaMA2 Chat 70B、Claude 2、ChatGPT! 图片 不仅如此,在加州大学伯克利分校主导的LMSYS...
-
外包数据注释服务如何增强人工智能模型?
在人工智能(AI 和机器学习(ML 领域,基础在于数据,数据的质量、准确性和深度直接影响人工智能系统的学习和决策能力。数据有助于丰富机器学习算法数据集的数据注释服务,对于教导AI系统识别模式、做出预测和提高整体性能至关重要。 通过高质量数据注释为ML模...
-
开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件
大模型长期以来一直存在一个致命的问题,即生成幻觉。由于数据集的复杂性,难免会包含过时和错误的信息,这使得输出质量面临着极大的挑战。过多的重复信息还可能导致大型模型产生偏见,这也算是一种形式的幻觉。如何检测和有效缓解大模型的生成幻觉问题一直是学术界的热门课...
-
HumanGaussian开源:基于Gaussian Splatting,高质量 3D 人体生成新框架
在 3D 生成领域,根据文本提示创建高质量的 3D 人体外观和几何形状对虚拟试穿、沉浸式远程呈现等应用有深远的意义。传统方法需要经历一系列人工制作的过程,如 3D 人体模型回归、绑定、蒙皮、纹理贴图和驱动等。为了自动化 3D 内容生成,此前的一些典型工作...
-
大模型就是「造梦机」,Karpathy一语惊人!人类才是「幻觉问题」根本原因
幻觉,早已成为LLM老生常谈的问题。 然而,OpenAI科学家Andrej Karpathy今早关于大模型幻觉的解释,观点惊人,掀起非常激烈的讨论。 在Karpathy看来: 另外,Karpathy的另一句话,更是被许多人奉为经典。他认为,与大模型相对的...
-
如何让Midjourney角色保持一致的5个核心技巧
hi,同学们,我是赤辰,本期是赤辰第2期AI教程或推荐实用AI工具,文章底部准备了粉丝福利,看完可以领取! 今天给大家介绍Midjourney5个控制AI绘画角色一致性的技巧。 近期整理了学员在使用Midjourney生图时遇到的一些问题,看看你是否曾...
-
Learn Prompt-Midjourney 图片生成
简介 随着 ChatGPT 的爆火,越来越多的人开始关注并尝试 AI 相关的应用。而图片生成就是其中一个备受瞩目的领域。目前已经有许多图像生成工具,如 Midjourney,Stable Diffusion,DALL-E,Firefly等。本课程主要是以...
-
Koala:加州大学BAIR团队使用ChatGPT蒸馏数据和公开数据集微调LLaMA模型得到
自从Meta发布LLaMA以来,围绕它开发的模型与日俱增,比如Alpaca、llama.cpp、ChatLLaMA以及Vicuna等等,相关的博客可以参考如下: 【Alpaca】斯坦福发布了一个由LLaMA 7B微调的模型Alpaca(羊驼),训练3小时...
-
Pika 1.0首测秒杀Gen-2!网友抢先体验电影级炸裂效果,背后技术细节首公开
Pika 1.0正式上线后,拿到内测资格的网友们已经玩疯了! 有人用它生成了一个姜黄色头发女孩和她的姜黄色猫的短片。 以往,因为一致性的难题,用AI视频很难做出优秀的动漫作品。但是Pika 1.0,实在是太给人惊喜了! 更令人震惊的是,作者表示,这是10...
-
GPT3.5 VS GPT-4写领导讲话稿,谁是最强笔杆子?
正文共 1240 字,阅读大约需要 5 分钟 文秘/公务员必备技巧,您将在5分钟后获得以下超能力: 快速生成领导讲话稿 Beezy评级 :B级 *经过简单的寻找, 大部分人能立刻掌握。主要节省时间。 推荐人 | Kim 编...
-
北大等发布最新AI智能体Jarvis-1,制霸「我的世界」
智能体研究又取得了新成绩! 最近,来自北大、北邮、UCLA和BIGAI的研究团队联合发表了一篇论文,介绍了一个叫做Jarvis-1的智能体。 论文地址:https://arxiv.org/pdf/2311.05997.pdf 从论文标题来看,Jarvi...
-
AIGC-AI内容生成深度产业报告
研报地址:AIGC-AI内容生成深度产业报告 随着人工智能技术的不断发展和进步,AI内容生成已经成为了一个热门的应用领域。其中,AIGC(AI Generated Content)是最为典型的应用之一。AIGC是指通过人工智能技术生成的各...
-
【AIGC实习急招!】联想数字化转型 GenAI 实习生
题解 | #字符串最后一个单词的长度# #include <iostream>#include <string>#include <algorithm>using 题解 | 利用with as拆解题目 ---...
-
后期狂喜!一张照片丝滑替换视频主角,动作幅度再大也OK|Meta&新加坡国立大学
后期狂喜了家人们~ 现在,只需一张图片就能替换视频主角,效果还是如此的丝滑! 且看这个叫做“VideoSwap”的新视频编辑模型—— 小猫一键变小狗,基操~ 如果原物体本身扭动幅度大一些?也完全没问题: 细看俩者之间的运动轨迹,给你保持得是一毛一样:...
-
DMP技术开源,可提升AI图像预测精度
Diffusion Models as Prior (DMP)是一种新的方法,它在AI生成的图像中提高了语义预测的准确性。该创新性方法巧妙地将预先训练的文本到图像模型应用于各种任务,例如3D属性估计和语义分割,在有限的训练数据下表现优于现有技术。 项目地...
-
云上使用 Stable Diffusion ,模型数据如何共享和存储
随着人工智能技术的爆发,内容生成式人工智能(AIGC)成为了当下热门领域。除了 ChatGPT 之外,文本生成图像技术更令人惊艳。 Stable Diffusion,是一款开源的深度学习模型。与 Midjourney 提供的直接将文本转化为图像的服务不同...
-
如何在Midjourney使用种子(指南)
想知道如何在旅途中使用种子吗? 许多Midjourney初学者都在努力保持他们的提示在Midjourney的结果非常一致。如果您正在寻找特定的结果,您可能会发现Midjourney的默认随机性水平是一个障碍,因为它为图像增加了很多内容。 在这篇文章中,...
-
MagicAnimate官网体验入口 AI文生动画工具软件app免费下载
《MagicAnimate》是一款使用扩散模型实现的时域一致的人体图像动画工具。它可以通过对人体图像进行扩散模型的运算,实现高质量、自然流畅的人体动画效果。《MagicAnimate》具有高度的可控性和灵活性,可以通过微调参数来实现不同的动画效果。它适用于...
-
抖音跳舞不用真人出镜,一张照片就能生成高质量视频!字节新技术连抱抱脸CTO都下场体验了
看!现在正有四位小姐姐在你面前大秀热舞: 以为是某些主播在短视频平台发布的作品? No,No,No。 真实答案是:假的,生成的,而且还是只靠了一张图的那种! 真实的打开方式是这样的: 这就是来自新加坡国立大学和字节跳动最新的一项研究,名叫Magic...
-
Mozilla 让人们将 AI LLM 变成单文件可执行文件,简化大型语言模型的分发和运行
供本地使用的 LLM(大型语言模型)通常作为一组权重分布在数 GB 文件中。这些软件不能直接单独使用,这通常使得它们比其他软件更难分发和运行。给定的模型也可能经历了更改和调整,如果使用不同的版本,则会导致不同的结果。 Mozilla 的创新团队最近发布了...
-
AI大模型,如何破圈而出?
一年即将过去,回望整个2023,我们会觉得这是一个毫无疑问的“AI大模型之年”。这一年里,全球兴起了数百个大模型。根据相关报道,仅仅在中国就有超过200个大模型,形成了名副其实的“百模大战”。 但有个问题不知道大家注意到没有?大模型虽多,但真正用到大模型的...
-
Llama 2 云端部署与API调用【AWS SageMaker】
Meta 刚刚发布了 Llama 2 大模型。如果你和我们一样,你一定会迫不及待地想要亲自动手并用它来构建。 推荐:用 NSDT设计器 快速搭建可编程3D场景。 使用任何类型的 LLM 进行构建的第一步是将其托管在某处并通过 API 使用...
-
一篇学会AI与Go语言无缝对接
在当今应用开发领域,类似OpenAI API等生成式AI技术的蓬勃发展正在彻底改变着应用开发的格局。Python和JavaScript等语言已经拥有丰富的资源来支持这些技术,其中LangChain就是一个显著的例子。然而,Go语言开发者面临的选择却相对有...
-
chartgpt+midjourney
chatGPT程序化生成故事 英文版脚本步骤 步骤一:在chatgpt中输入以下脚本,,标红为可变的文字,输入你想要的,目前是科幻,即科幻故事,你可以改为 fairy-tale,则写的是童话故事,等待回应 You are a {Genre} au...
-
不是大模型全局微调不起,只是LoRA更有性价比,教程已经准备好了
增加数据量和模型的参数量是公认的提升神经网络性能最直接的方法。目前主流的大模型的参数量已扩展至千亿级别,「大模型」越来越大的趋势还将愈演愈烈。 这种趋势带来了多方面的算力挑战。想要微调参数量达千亿级别的大语言模型,不仅训练时间长,还需占用大量高性能的内存资...
-
21Dak攻击:计算机顶会PLDI‘23 针对语义依附代码模型的对抗攻击方法:Destroyer篡改输入程序,Finder寻找关键特征,Merger关键特征注入【网安AIGC专题11.22】
Discrete Adversarial Attack to Models of Code 写在最前面 一些对关系抽取和事件抽取相关的启发和思考 摘要 总结与展望 课堂讨论 研究背景与意义 对抗攻击 针对代码模型的对抗攻击 Semanti...