-
了解AIGC在图像识别和生成中的应用
1.背景介绍 在过去的几年里,人工智能(AI 已经成为了我们生活中的一部分,它在图像识别和生成方面的应用也非常广泛。在这篇文章中,我们将探讨一下AI生成式图像识别(AIGC 在图像识别和生成中的应用,以及其背后的核心概念和算法原理。 1. 背...
-
抛弃编码器-解码器架构,用扩散模型做边缘检测效果更好,国防科大提出DiffusionEdge
现有的深度边缘检测网络通常基于包含了上下采样模块的编码器 - 解码器架构,以更好的提取多层次的特征,但这也限制了网络输出既准又细的边缘检测结果。 针对这一问题,一篇 AAAI 2024 上的论文给出了新的解决方案。 论文题目:DiffusionEd...
-
【读点论文】A Survey on Generative Diffusion Model,AIGC时代的新宠儿,从原理推导到工程应用,在视觉,自然语言,语音等领域大展拳脚
A Survey on Generative Diffusion Model Abstract 由于深度潜在表示,深度学习在生成任务中显示出良好的潜力。生成模型是一类可以根据某些隐含参数随机生成观测值的模型。近年来,扩散模型以其强大的生成能力成...
-
AI破译2000年前「上古卷轴」登Nature头版!21岁计算机天才,谷歌华人工程师共获大奖
2000年前碳化的古卷轴,如今成功被AI破译!背后三人团队还拿下70万美元大奖! AI在考古领域的重大进步,甚至登上了今天Nature的头版。 要说这件事的起源,还得追溯到公元79年一次火山爆发, 直接将一座珍藏古老的纸莎草卷轴——Herculaneu...
-
AI读心术再升级!一副眼镜直接控制波士顿机器狗,脑控机器人成真
还记得之前的AI读心术吗?最近,「心想事成」的能力再次进化, ——人类可以通过自己的想法直接控制机器人了! 来自麻省理工的研究人员发表了Ddog项目,通过自己开发的脑机接口(BCI)设备,控制波士顿动力的机器狗Spot。 狗狗可以按照人类的想法,移动到特...
-
AIGC在物联网与智能制造中的实践
1.背景介绍 1. 背景介绍 物联网和智能制造是当今最热门的技术领域之一,它们在各种行业中发挥着重要作用。随着计算机视觉、自然语言处理和机器学习等技术的发展,人工智能(AIGC 在物联网和智能制造领域的应用也日益增多。本文将探讨AIGC在物联...
-
挖掘BEV潜力的边界!DA-BEV:无监督BEV SOTA新方案!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 今天和大家探讨3D视觉感知领域中的一个特定问题:针对纯视觉的鸟瞰图(BEV)的无监督领Domain Adaptation(Unsupervised Domain Ad...
-
Segment Anything论文翻译,SAM模型,SAM论文,SAM论文翻译;一个用于图像分割的新任务、模型和数据集;SA-1B数据集
【论文翻译】- Segment Anything / Model / SAM论文 论文链接: https://arxiv.org/pdf/2304.02643.pdf https://ai.facebook.com/research/publica...
-
超简单,不用GPU,3步教你轻松在笔记本上部署聊天大模型 LLaMA
大家好啊,我是董董灿。 今天带大家在自己的电脑(笔记本 上部署一个类似于 chatGPT 的 AI 聊天大模型。 部署完之后,你就拥有了一个私人 AI 聊天机器人,无需联网,随时进行实时对话。 0. 简单说下背景 大模型我们都不陌生了,但是以...
-
Stable Diffusion AI绘画系列【13】:毛茸茸的可爱动物们
《博主简介》 小伙伴们好,我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源,可关注公-仲-hao:【阿旭算法与机器学习】,共同学习交流~ ?感谢小伙伴们点赞、关注! 《------往期经典推荐----...
-
在Meteor Lake上测试基于Stable Diffusion的AI应用
上个月刚刚推出的英特尔新一代Meteor Lake CPU,预示着AI PC的新时代到来。AI PC可以不依赖服务器直接在PC端处理AI推理工作负载,例如生成图像或转录音频。这些芯片的正式名称为Intel Core Ultra处理器,是首款配备专门用于处理...
-
数据为王!如何通过数据一步步构建高效的自动驾驶算法?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 下一代自动驾驶技术期望依赖于智能感知、预测、规划和低级别控制之间的专门集成和交互。自动驾驶算法性能的上限一直存在巨大的瓶颈,学术界和业界一致认为,克服瓶颈的关键在于以...
-
AI绘画探索人工智能的未来
?个人主页: Aileen_0v0?热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 ?个人格言:“没有罗马,那就自己创造罗马~” #mermaid-svg-8fL64RHWVzwpzR6m {font-family:"trebuchet...
-
Stable Diffusion(SD)核心基础知识——(文生图、图生图)
文章目录 一、Stable Diffusion核心基础原理 (一)Stable Diffusion模型工作流程 (二)Stable Diffusion模型核心基础原理 (三)Stable Diffusion的训练过程 (四)其他主流生成式模型...
-
极新AIGC行业峰会 | 圆桌对话:探索中国AGI迭代之路
“AGI正处在一个巨大的研发范式革命的起点。” 整理 | 周梦婕 编辑 | 小白 出品|极新 2023年11月28日,极新AIGC行业峰会在北京东升国际科学院拉开帷幕,峰会上午的圆桌环节由凡卓资本合伙人王梦菲主持,深势科技战略副总裁何雯、Zil...
-
德克萨斯州大学将建立学术界最大之一的生成式AI中心
德克萨斯州奥斯汀 - 德克萨斯大学奥斯汀分校(UT)正在建立一个学术界最强大的人工智能中心,以引领研究并为广泛的合作伙伴提供世界一流的人工智能基础设施。 图源备注:图片由AI生成,图片授权服务商Midjourney UT正在启动生成式人工智能中心,该中心...
-
Stable Diffusion 安装与使用
ai绘画原理简介 Stable Diffusion是一种在计算机科学和数据分析领域广泛使用的算法,主要用于图像处理、信号处理、计算机视觉和机器学习等方面。其主要思想是将数据进行扩散处理,以达到数据平滑的效果,同时可以消除一些噪音和不必要的细节。 在图像...
-
无缝衔接Stable Diffusion,一张照片几秒钟就能生成个性化图片-InstantID
最近一段时间基于扩散模型的图像处理方法遍地开花,接下来为大家介绍一种风格化图像的方法InstantID,可以通过仅有一张人脸照片,几秒钟内生成不同风格的人物照片。与传统方法需要多张参考图像和复杂的微调过程不同,InstantID只需一张图像...
-
云端车端MapNeXt全搞定!面向下一代在线高精地图构建
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 在协作、互联和自动化移动(CCAM)中,智能驾驶车辆对周围环境的感知、建模和分析能力越强,它们就越能意识到并能够理解、做出决策,以及安全高效地执行复杂的驾驶场景。高精...
-
CMU华人18万打造高能机器人,完爆斯坦福炒虾机器人!全自主操作,1小时学会开12种门
比斯坦福炒虾机器人还厉害的机器人来了! 最近,CMU的研究者只花费2.5万美元,就打造出一个在开放世界中可以自适应移动操作铰接对象的机器人。 论文地址:https://arxiv.org/abs/2401.14403 厉害之处就在于,它是完全自主完成操作...
-
十分钟读懂Stable Diffusion运行原理
AIGC 热潮正猛烈地席卷开来,可以说 Stable Diffusion 开源发布把 AI 图像生成提高了全新高度,特别是 ControlNet 和 T2I-Adapter 控制模块的提出进一步提高生成可控性,也在逐渐改变一部分行业的生产模式。惊...
-
检测路在何方?YOLOv8终极指南
本文经自动驾驶之心公众号授权转载,转载请联系出处。 YOLOv8是计算机视觉领域的最新发展,它是一种用于目标检测、实例分割和分类的最新先进模型。除了对模型架构本身的改进之外,YOLOv8通过一个用于使用YOLO模型的PIP包为开发者提供了一个新的友好界...
-
AIGC笔记总结(一):扩散模型简介
?个人主页: GoAI |? 公众号: GoAI的学习小屋 | ?交流群: 704932595 |?个人简介 : 掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉方向导师等,专注大数...
-
推翻Transformer奠基之作疑被拒收,ICLR评审遭质疑!网友大呼黑幕,LeCun自曝类似经历
去年12月,CMU和普林斯顿的2位研究者发布了Mamba架构,瞬间引起AI社区震动! 结果,这篇被众人看好有望「颠覆Transformer霸权」的论文,今天竟曝出疑似被顶会拒收?! 今早,康奈尔大学副教授Sasha Rush最先发现,这篇有望成为奠基之作...
-
研究: AI代替打工人成本太高,只有23% 视觉工作可替代
根据 MIT 计算机科学与人工智能实验室的研究,人工智能对打工人的淘汰速度可能比人们想象中的要慢得多。这是因为对于企业来说,视觉 AI 实在是太贵了。在绝大多数情况下,人力成本要比采用自动化更便宜。 图源备注:图片由AI生成,图片授权服务商Midjour...
-
一周AIGC丨Meta 发布新一代开源大模型 Llama 2,大模型裁员潮不远了?
人们把Meta发布免费可商用版本 Llama 2比作“安卓时刻”,OpenAI护城河似乎一下子荡然无存,整个大模型市场格局面临巨变。据媒体报道,在以往,中国大模型公司可以靠商业授权赚钱利润,随着Llama 2开始允许商用,中国大模型公司的这一优...
-
2023 ACM Fellow颁给图灵三巨头!清华马维英、微软高剑峰、上交大陈海波等14位华人当选
2023 ACM Fellow揭榜了! 刚刚,美国计算机协会(Association for Computing Machinery)正式宣布了,2023年当选ACM Fellow的68位成员。 值得一提的是,今年图灵奖三巨头、万维网之父纷纷入选。 新晋...
-
MIT新研究:打工人不用担心被AI淘汰!成本巨贵,视觉工作只有23%可替代
人工智能会抢走我们的工作吗?如果你每天都看硅谷高管谈论着当今尖端的AI技术,可能会觉得答案是肯定的,并且会很快发生。 不过,刚刚MIT计算机科学与人工智能实验室(CSAIL)最近的一项研究,可以让我们可以松一口气了:至少视觉AI还无法替代太多人类。 论...
-
英伟达Jim Fan最新TED演讲上线:AI下一个前沿是「基础智能体」!
「AI的下一个前沿将是『基础智能体』(Foundation Agent)——一个掌握广泛技能,控制许多身体,并能够泛化到多个环境中的单一算法」。 等了三个月,英伟达高级科学家Jim Fan在TED AI 2023上的演讲视频终于上线了。 视频中,Jim...
-
首个通用双向Adapter多模态目标追踪方法BAT,入选AAAI 2024
目标跟踪是计算机视觉的一项基础视觉任务,由于计算机视觉的快速发展,单模态 (RGB 目标跟踪近年来取得了重大进展。考虑到单一成像传感器的局限性,我们需要引入多模态图像 (RGB、红外等 来弥补这一缺陷,以实现复杂环境下全天候目标跟踪。 然而,现有的多...
-
人工智能数学基础 - 线性代数之矩阵篇
本文将从矩阵的本质、矩阵的原理、矩阵的应用三个方面,带您一文搞懂人工智能数学基础-线性代数之矩阵。 一、矩阵的本质 点积(Dot Product):点积作为向量间的一种基本运算,通过对应元素相乘后求和来刻画两向量的相似度和方向关系。 点积(Dot Pr...
-
扩散模型更懂复杂提示词!Pika北大斯坦福开源新框架,利用LLM提升理解力
Pika北大斯坦福联手,开源最新文本-图像生成/编辑框架! 无需额外训练,即可让扩散模型拥有更强提示词理解能力。 面对超长、超复杂提示词,准确性更高、细节把控更强,而且生成图片更加自然。 效果超越最强图像生成模型Dall·E 3和SDXL。 比如要求图片...
-
MIT研究:AI尚不会取代你的工作,因为它还是太昂贵了
随着人工智能技术的飞速发展,人们对工作安全性的担忧也逐渐升温。然而,麻省理工学院(MIT)的一项新研究表明,目前部署这项技术的成本可能使得雇主更倾向于保留现有员工,至少在当前情况下是这样。 通常人们考虑到AI替代工作时,更多关注技术在执行人类任务方面的表现...
-
[论文精读] 自条件图像生成 - 【恺明大神新作,AIGC 新基准】
论文导读: 论文背景: 2023年8月,AI大神何恺明在个人网站宣布,2024年将加入MIT担任教职,回归学术界。这篇论文是其官宣加盟MIT后首度与MIT师生合著的公开论文,论文一作本科毕业于清华姚班,二作为MIT电气工程与计算机科学系教授,今年的斯...
-
网络安全人士必知的AI专业术语
随着人工智能的迅猛发展,我们正置身于第四次工业革命的浪潮中。在这个数字化的时代,网络安全成为各行业至关重要的议题。作为网络安全从业人员,不仅需要熟练掌握传统安全领域的知识,更需要深刻理解和运用人工智能,以在风云变幻的网络战场中保护信息资产。人工智能不仅为...
-
人工智能如何应用于机器人?
由于人工智能(AI ,机器人现在可以自己学习、适应和做出决策,而不需要人类或预先编程的指令。已启用AI的机器人配备了算法,使其能够分析和了解来自其环境的数据,并采取适当的行动。这些算法可能被认为类似于人类大脑,其从感官上解释信息,寻找模式,并产生结果。...
-
设备巡检,谁还用人工?用AI
作者 | 涂承烨 审校 | 重楼 前文《不是人才用不起,而是人工智能更有性价比!》简要介绍了AI巡检的概念、重要性、技术架构等,那么具体场景如何应用AI巡检呢? 以电力行业为例,我们先看看传统巡检存在哪些问题? 一、电力行业传统巡检存在问题 电力行...
-
【多模态】14、Segment Anything | Meta 推出超强悍可分割一切的模型 SAM
文章目录 一、Intruduction 二、Segment Anything Task 三、Segment Anything Model 四、Segment Anything Data Engine 五、Segment Anything Dat...
-
AIGC原理:扩散模型diffusion综述一:面向视觉计算的扩散模型研究进展
论文地址:State of the Art on Diffusion Models for Visual Computing ? 贴一幅SGM(Score-based Generative Model)的原因是宋飏博士将他2019年提出的SMLD模型和20...
-
【扩散模型】1、扩散模型 | 到底什么是扩散模型?
文章目录 一、什么是扩散模型 1.1 现有生成模型简介 1.2 扩散模型的理论来源 1.3 扩散模型的使用场景 1.4 扩散模型的基本结构 1.5 马尔可夫过程 二、扩散模型相关定义 2.1 符号和定义 2.2 问题规范化 三、可以提升...
-
视觉Mamba来了:速度提升2.8倍,内存能省87%
号称「全面包围 Transformer」的 Mamba,推出不到两个月就有了高性能的视觉版。 本周四,来自华中科技大学、地平线、智源人工智能研究院等机构的研究者提出了 Vision Mamba(Vim)。 论文地址:https://arxiv.or...
-
AIGC必备知识点:你不可不知的CNN(卷积神经网络)-知识全解析!
Look!?我们的大模型商业化落地产品 ?更多AI资讯请??关注 Free三天集训营助教在线为您火热答疑??? 大家在谈论的卷积神经网络究竟是什么?(Convolutional Neural Network,CNN 是一类主要用于计算机视觉领域的...
-
腾讯云AI绘画:探究AI创意与技术的新边界
目录 一、2023的“网红词汇”——AI绘画 二、智能文生图 1、智能文生图的应用场景 2、风格和配置的多样性 3、输入一段话,腾讯云AI绘画给你生成一张图 4、文本描述生成图像,惊艳全场 三、智能图生图:重新定义图像美学 1、智能图生图...
-
奥数能力金牌级:DeepMind几何推理模型登上Nature,代码开源,菲尔兹奖得主点赞
这一次,人工智能算法在数学奥林匹克竞赛(IMO)上取得了重大成绩突破。 在今天发表的国际权威期刊《自然》杂志最新一期上,论文《Solving olympiad geometry without human demonstrations》向世人介绍了 A...
-
SIFU官网体验入口 AI图像3D虚拟人物服装重建在线使用地址
SIFU是一种先进的计算机视觉技术,专门用于通过侧视图像重建高质量的3D服装虚拟人物模型。这种方法的核心创新在于提出了一种新型基于侧视图像的隐式函数,能够有效增强特征提取和提高几何精度。SIFU不仅在处理复杂姿势和宽松衣物方面表现出色,还通过引入一种3D一...
-
AIGC:使用生成对抗网络GAN实现MINST手写数字图像生成
1 生成对抗网络 生成对抗网络(Generative Adversarial Networks, GAN)是一种非常经典的生成式模型,它受到双人零和博弈的启发,让两个神经网络在相互博弈中进行学习,开创了生成式模型的新范式。从 2017 年以后,GAN相...
-
ConvNet与Transformer谁更强?Meta评测4个领先视觉模型,LeCun转赞
如何根据特定需求选择视觉模型? ConvNet/ViT、supervised/CLIP模型,在ImageNet之外的指标上如何相互比较? 来自MABZUAI和Meta的研究人员发表的最新研究,在「非标准」指标上全面比较了常见的视觉模型。 论文地址:ht...
-
大模型时代下AIGC新浪潮
大模型时代下AIGC新浪潮 文章目录 大模型时代下AIGC新浪潮 1. **相关概念** 2. **迎接大模型时代** 3. **ChatGPT引爆AIGC产业** 4. **从产业链宏观看AIGC** 1. **上游:基础层**...
-
自动泊车全面调研!汇集行业标准趋势、评测指标、系统介绍各个方面!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 自动泊车系统是指在没有人工干预的情况下,车辆本身可以自主的实现停车位的寻找并完成准确的泊车,同时该系统也可以根据用户的需求准确移动到用户指定的位置上。如果自动泊车技术成熟后,可以极大缓解人们...
-
人工智能 | ChatGPT 和文心一言哪个更好用?
===================================================== github:https://github.com/MichaelBeechan CSDN:https://blog.csdn.net/u01134...