-
AI日报:谷歌Gemini将发五个新功能;百度推文小言AI数字人社交APP;OpenAI草莓计划揭秘;亚马逊上线Rufus AI购物助手
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、谷歌Gemini即将发布五个新...
-
模糊图像重建重大进展!DeblurGS:相机位姿不准也能极致渲染!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 尽管在从运动模糊图像中重建清晰的3D场景方面取得了重大进展,但向现实世界应用的过渡仍然具有挑战性。主要障碍源于严重的模糊,这导致通过“Structure-from-M...
-
基于stable diffusion的IP海报生成
【AIGC】只要10秒,AI生成IP海报,解放双手!!!在AIGC市场发展的趋势下,如何帮助设计工作者解放双手。本文将从图像生成方向切入,帮助大家体系化的学习Stable diffusion的使用,完成自有IP的训练以及生成,主要从部署、训练、生成3大核心...
-
Sora落入电影人之手!首批专业AI微短片火了,实现创意再无阻碍
首批获得Sora访问权限的艺术家们创作的视频来了~ OpenAI一口气发布了7个,每个视频都隐隐透露出了四个字:脑 洞 大 开。 就比如下面这个视频,奇奇怪怪,没有脑袋。 通过画外音,我们可以得知: 他的体内充满了“热空气”,这让他在生活上有了一些特别的...
-
DualBEV:大幅超越BEVFormer、BEVDet4D,开卷!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 这篇论文探讨了在自动驾驶中,从不同视角(如透视图和鸟瞰图)准确检测物体的问题,特别是如何有效地从透视图(PV)到鸟瞰图(BEV)空间转换特征,这一转换是通过视觉转换(VT)模块实施的。现有的方法大致...
-
AR/VR如何推动自动化和机器人制造业发展
AR/VR技术如何为机器人提供动力以及它们如何使工厂和工业受益,本文对此进行探讨。 由于新冠疫情持续蔓延行,以及供应链中断、劳动力短缺和通货膨胀挑战等衍生问题,导致2022年商业环境发生变化,迫使许多企业和制造业高管为其生产、分销和履行设施实施自动化和...
-
MWC 2024丨生成式AIGC成为最大亮点—美格智能携手阿加犀推出多感知融合VSLAM解决方案
2024世界移动通信大会盛况空前,AI成为最大亮点。2月28日,美格智能携手阿加犀,将算力模组的硬件优势与AI优化部署技术相结合,在MWC展会现场展示了基于高算力AI模组的多感知融合VSLAM解决方案。这一创新性方案可应用于智能机器人与低速无人驾驶场景,助...
-
两张图2秒钟3D重建!这款AI工具火爆GitHub,网友:忘掉Sora
只需2张图片,无需测量任何额外数据—— 当当,一个完整的3D小熊就有了: 这个名为DUSt3R的新工具,火得一塌糊涂,才上线没多久就登上GitHub热榜第二。 有网友实测,拍两张照片,真的就重建出了他家的厨房,整个过程耗时不到2秒钟! (除了3D图,...
-
挖掘BEV潜力的边界!DA-BEV:无监督BEV SOTA新方案!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 今天和大家探讨3D视觉感知领域中的一个特定问题:针对纯视觉的鸟瞰图(BEV)的无监督领Domain Adaptation(Unsupervised Domain Ad...
-
扩散模型更懂复杂提示词!Pika北大斯坦福开源新框架,利用LLM提升理解力
Pika北大斯坦福联手,开源最新文本-图像生成/编辑框架! 无需额外训练,即可让扩散模型拥有更强提示词理解能力。 面对超长、超复杂提示词,准确性更高、细节把控更强,而且生成图片更加自然。 效果超越最强图像生成模型Dall·E 3和SDXL。 比如要求图片...
-
DDPM详解 AI绘画
话说DDPM DDPM模型,全称Denoising Diffusion Probabilistic Model,可以说是现阶段diffusion模型的开山鼻祖。不同于前辈GAN、VAE和flow等模型,diffusion模型的整体思路是通过一种偏...
-
斯坦福美女博士创业项目爆火!AI视频生成出道即顶流
斯坦福华人博士休学搞创业,直接火爆AI圈! 新产品瞄准AI视频生成,刚出道就成行业顶流,引来一众大佬围观评价。 OpenAI大牛Andrej Karpathy转发,并激情附上长文一段: 每个人都能成为多模态梦境的导演,就像《盗梦空间》里的筑梦师一样。...
-
C#开源项目:私有化部署LLama推理大模型
推荐一个C#大模型推理开源项目,让你轻松驾驭私有化部署! 01 项目简介 LLama是Meta发布的一个免费开源的大模型,是一个有着上百亿数量级参数的大语言模型,支持CPU和GPU两种方式。 而LLamaSharp就是针对llama.cpp封装的C#...
-
2024年工业机器人十大趋势与创新
在工业机器人领域,创新步伐不断加快,每年都会带来新的进步,有望改变我们的制造、自动化和工作方式。展望2024年,人工智能(AI 显然将在塑造工业机器人的未来方面发挥核心作用。本文将探讨在人工智能的推动下,2024年工业机器人的十大趋势与创新。 1.人工...