目标检测第2页 - AIGC资讯

VPR 2024 满分论文！Meta提出EfficientSAM：快速分割一切！

本文经自动驾驶之心公众号授权转载，转载请联系出处。 EfficientSAM 这篇工作以5/5/5满分收录于CVPR 2024！作者在某社交媒体上分享了该结果，如下图所示： LeCun 图灵奖得主也强烈推荐了该工作！在最近的一项研究中，Meta...

生成式AI 2024-03-02 人工智能

894阅读

动手实践丨轻量级目标检测与分割算法开发和部署(RK3568)

本文分享自华为云社区《自动驾驶(AIOT - 轻量级目标检测与分割算法开发和部署(RK3568 【玩转华为云】》，作者：HouYanSong。本文将在ModelArts平台上开发轻量级目标检测与分割算法，并使用ModelBox框架在RK3568开发板...

人工智能 2024-02-26 人工智能

1014阅读

YOLOv9官网体验入口 AI目标检测深度学习工具下载地址

YOLOv9是一款目标检测深度学习模型实现工具，通过使用可编程梯度信息来学习用户想要学习的内容。这个开源项目具有高效和准确的优势，主要用于目标检测任务。点击前往YOLOv9 官网体验入口谁可以从YOLOv9中受益？ YOLOv9适合需要进行图像识别、...

人工智能 2024-02-26 人工智能

1077阅读

YOLO不死！YOLOv9出炉：性能速度SOTA~

本文经自动驾驶之心公众号授权转载，转载请联系出处。如今的深度学习方法专注于设计最适合的目标函数，以使模型的预测结果与实际情况最接近。同时，必须设计一个合适的架构，以便为预测获取足够的信息。现有方法忽略了一个事实，即当输入数据经过逐层特征提取和空间变换...

人工智能 2024-02-26 人工智能

915阅读

目标检测新SOTA：YOLOv9问世，新架构让传统卷积重焕生机

继 2023 年 1 月 YOLOv8 正式发布一年多以后，YOLOv9 终于来了！我们知道，YOLO 是一种基于图像全局信息进行预测的目标检测系统。自 2015 年 Joseph Redmon、Ali Farhadi 等人提出初代模型以来，领域内的研...

生成式AI 2024-02-23 人工智能

933阅读

EfficientViT-SAM：精度不变原地起飞！

作者提出了EfficientViT-SAM，这是一系列加速的SAM模型。在保留SAM轻量级的提示编码器和 Mask 解码器的同时，作者用EfficientViT替换了沉重的图像编码器。在训练方面，首先从SAM-ViT-H图像编码器向EfficientV...

大数据 2024-02-23 人工智能

1089阅读

都在搞端到端，试问端到端自动驾驶的基石到底是什么？

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解基础模型的出现彻底改变了自然语言处理和计算机视觉领域，为其在自动驾驶（AD）中的应用铺平了道路。这项调查对40多篇研究论文进行了全面回顾，展示了基础模型在增强AD中的...

人工智能 2024-02-22 人工智能

904阅读

AI视野：英伟达推文生图模型ConsiStory；高度可控AI试衣OOTDiffusion；开发者推SoraWebui开源项目；Groq最快AI推理芯片成本推算高得离谱

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用英伟达推出免训练，...

大数据 2024-02-21 人工智能

792阅读

YOLOv8官网体验入口 AI计算机视觉目标检测模型免费在线使用地址

YOLOv8是YOLO系列目标检测模型的最新版本。它能够在图像或视频中准确快速地识别和定位多个对象，并实时跟踪它们的移动。相比之前版本，YOLOv8在检测速度和精确度上都有很大提升，同时支持多种额外的计算机视觉任务，如实例分割、姿态估计等。YOLOv8可通...

生成式AI 2024-02-21 人工智能

921阅读

逆天了！UniVision：BEV检测和Occ联合统一框架，双任务SOTA！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&个人理解最近这几年以视觉为中心的3D感知在自动驾驶中得到了快速发展。尽管3D感知模型在结构和概念上有许多相似之处，但在特征表示、数据格式和目标方面仍存在差距，这对统一高效的3D感知...

AIGC 2024-02-21 人工智能

925阅读

精炼爆炸性新闻！OpenAI发布革命性AI视频生成模型Sora：实现长达60秒的高清视频创作「附AIGC行业系统搭建」

在人工智能领域，每一次技术革新都引领着未来的发展方向。OpenAI，作为全球领先的人工智能研究机构，再次证明了其在推动AI技术革新方面的领导地位。近日，OpenAI宣布推出了一款革命性的AI视频生成模型——Sora，这一大胆的创新举措，无疑将AI视频生成技...

人工智能 2024-02-20 人工智能

814阅读

Stable Diffusion AI绘画系列【16】:霸气侧漏的二次元武侠风

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

AIGC 2024-02-15 人工智能

939阅读

抛弃编码器-解码器架构，用扩散模型做边缘检测效果更好，国防科大提出DiffusionEdge

现有的深度边缘检测网络通常基于包含了上下采样模块的编码器 - 解码器架构，以更好的提取多层次的特征，但这也限制了网络输出既准又细的边缘检测结果。针对这一问题，一篇 AAAI 2024 上的论文给出了新的解决方案。论文题目：DiffusionEd...

AIGC 2024-02-07 人工智能

965阅读

OccNeRF：完全无需激光雷达数据监督

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人总结近年来，3D 占据预测（3D Occupancy Prediction）任务因其独特的优势获得了学界及业界的广泛关注。3D 占据预测通过重建周围环境的 3D 结构为自...

AIGC 2024-02-07 人工智能

995阅读

AIGC在物联网与智能制造中的实践

1.背景介绍 1. 背景介绍物联网和智能制造是当今最热门的技术领域之一，它们在各种行业中发挥着重要作用。随着计算机视觉、自然语言处理和机器学习等技术的发展，人工智能(AIGC 在物联网和智能制造领域的应用也日益增多。本文将探讨AIGC在物联...

AIGC 2024-02-06 人工智能

1244阅读

分享AIGC场景应用及泰迪AIGC大模型师资培训内容

什么是AIGC? AIGC是内容生产方式的进阶，实现内容和资产的再创造。AIGC（AI-Generated Content）本质上是一种内容生产方式，即人工智能自动生产内容，是基于深度学习技术，输入数据后由人工智能通过寻找规律并适当泛化从而生成内...

人工智能 2024-02-06 人工智能

872阅读

大模型真能解决一切吗？关于知识驱动自动驾驶的一些思考

本文经自动驾驶之心公众号授权转载，转载请联系出处。上个星期受邀在外面做了一次关于「知识驱动自动驾驶」的讲座，刚好借这个机会把之前我和团队的一些学术上的思考整理凝练了一下。感觉里面一些内容还是挺值得拿出来分享&讨论的，所以开这么个帖子把其中一些关...

AIGC 2024-02-05 人工智能

961阅读

【多模态】13、Vision-Language 模型在视觉任务中的调研

文章目录一、简介二、基础知识 2.1 视觉任务的训练策略 2.2 VLM 基础 2.2.1 网络结构 2.2.2 预训练目标函数 2.2.3 评估和下游任务 2.3 数据集三、迁移学习 3.1 使用 prompt tunin...

生成式AI 2024-02-05 人工智能

1182阅读

Stable Diffusion AI绘画系列【13】:毛茸茸的可爱动物们

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

生成式AI 2024-02-04 人工智能

960阅读

Warning！远距离LiDAR感知

本文经自动驾驶之心公众号授权转载，转载请联系出处。一、引言去年开了图森ai day之后，一直想以文字形式总结一下这几年在远距离感知方面所做的工作，正好最近有时间了，就想写一篇文章记录一下这几年的研究历程。本文所提到的内容都在图森ai day视频[0]...

人工智能 2024-02-02 人工智能

943阅读

近200+自动驾驶数据集全面调研！一览如何数据闭环全流程

写在前面&个人理解自动驾驶技术在硬件和深度学习方法的最新进展中迅速发展，并展现出令人期待的性能。高质量的数据集对于开发可靠的自动驾驶算法至关重要。先前的数据集调研试图回顾这些数据集，但要么集中在有限数量的数据集上，要么缺乏对数据集特征的详细调查...

生成式AI 2024-01-31 人工智能

1343阅读

大家都在用的AI作画Python几行代码就可实现

一、通过openai实现的作品：要想快速实现功能，咱们先了解一下OpenAI,OpenAI是一家人工智能公司，专注于开发强化学习、机器学习、自然语言处理等技术。OpenAI的主要目标是创造一套安全的人工智能系统，以帮助人们在各行各业中利用这项技术.接...

AIGC 2024-01-31 人工智能

1325阅读

云端车端MapNeXt全搞定！面向下一代在线高精地图构建

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解在协作、互联和自动化移动（CCAM）中，智能驾驶车辆对周围环境的感知、建模和分析能力越强，它们就越能意识到并能够理解、做出决策，以及安全高效地执行复杂的驾驶场景。高精...

大数据 2024-01-30 人工智能

1020阅读

年轻人的第一个多模态大模型：1080Ti轻松运行，已开源在线可玩

一款名为Vary-toy的“年轻人的第一个多模态大模型”来了！模型大小不到2B，消费级显卡可训练，GTX1080ti 8G的老显卡轻松运行。想将一份文档图片转换成Markdown格式？以往需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤...

生成式AI 2024-01-29 人工智能

902阅读

检测路在何方？YOLOv8终极指南

本文经自动驾驶之心公众号授权转载，转载请联系出处。 YOLOv8是计算机视觉领域的最新发展，它是一种用于目标检测、实例分割和分类的最新先进模型。除了对模型架构本身的改进之外，YOLOv8通过一个用于使用YOLO模型的PIP包为开发者提供了一个新的友好界...

大数据 2024-01-29 人工智能

1187阅读

多模态大模型，阿里通义千问能和GPT-4V掰手腕了

通义千问的图像推理能力，最近有了大幅提升。 2024年，大模型领域要卷什么? 如果没有思路的话，不妨看看各家大厂都在押注什么方向。最近一段时间，先是 OpenAI 推出 GPT-4V，让大模型拥有了前所未有的图像语义理解能力。谷歌随后跟上，发布的 G...

大数据 2024-01-26 人工智能

858阅读

Camera or Lidar？如何实现鲁棒的3D目标检测？最新综述！

本文经自动驾驶之心公众号授权转载，转载请联系出处。 0. 写在前面&&个人理解自动驾驶系统依赖于先进的感知、决策和控制技术，通过使用各种传感器（如相机、激光雷达、雷达等）来感知周围环境，并利用算法和模型进行实时分析和决策。这使得车辆...

大数据 2024-01-26 人工智能

1024阅读

RadOcc：通过渲染辅助蒸馏学习跨模态Occupancy知识

原标题：Radocc: Learning Cross-Modality Occupancy Knowledge through Rendering Assisted Distillation 论文链接：https://arxiv.org/pdf/2312...

大数据 2024-01-25 人工智能

855阅读

Stable Diffusion - 扩展 SegmentAnything 和 GroundingDINO 实例分割算法插件的配置与使用

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://blog.csdn.net/caroline_wendy/article/details/131918652 Paper and GitHub：...

生成式AI 2024-01-24 人工智能

1789阅读

人工智能数学基础 - 线性代数之矩阵篇

本文将从矩阵的本质、矩阵的原理、矩阵的应用三个方面，带您一文搞懂人工智能数学基础-线性代数之矩阵。一、矩阵的本质点积（Dot Product）：点积作为向量间的一种基本运算，通过对应元素相乘后求和来刻画两向量的相似度和方向关系。点积（Dot Pr...

大数据 2024-01-24 人工智能

1046阅读

迈向端到端自动驾驶，地平线正式开源Sparse4D算法

1月22日，地平线将纯视觉自动驾驶算法——Sparse4D系列算法开源，推动行业更多开发者共同参与到端到端自动驾驶、稀疏感知等前沿技术方向的探索中。目前，Sparse4D算法已在GitHub平台上线，开发者可关注地平线GitHub官方账号“Horizon...

人工智能 2024-01-23 人工智能

903阅读

逆天了！UniVision：BEV检测和Occupancy联合统一框架，双任务SOTA！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&个人理解最近这几年以视觉为中心的3D感知在自动驾驶中得到了快速发展。尽管3D感知模型在结构和概念上有许多相似之处，但在特征表示、数据格式和目标方面仍存在差距，这对统一高效的3D感知...

AIGC 2024-01-22 人工智能

900阅读

视觉Mamba模型的Swin时刻，中国科学院、华为等推出VMamba

Transformer 在大模型领域的地位可谓是难以撼动。不过，这个AI 大模型的主流架构在模型规模的扩展和需要处理的序列变长后，局限性也愈发凸显了。Mamba的出现，正在强力改变着这一切。它优秀的性能立刻引爆了AI圈。上周四， Vision Mamb...

人工智能 2024-01-22 人工智能

966阅读

AIGC中的视觉生成文献整理

文章目录文件夹文献总览图像生成技术视频生成技术 Video Generation with Text Condition Video Generation with other Conditions Video Editing 生成模...

大数据 2024-01-21 人工智能

1216阅读

【AI接口】语音版、文心一言大模型和AI绘图、图片检测API

文章目录一、语音版大模型AI 1、接口 2、请求参数 3、请求参数示例 4、接口返回示例二、AI图片鉴黄合规检测API 1、接口 2、请求参数 3、请求参数示例 4、接口返回示例 5、报错说明 6、代码开源三、人工智能AI绘画AP...

大数据 2024-01-20 人工智能

1069阅读

【多模态】14、Segment Anything | Meta 推出超强悍可分割一切的模型 SAM

文章目录一、Intruduction 二、Segment Anything Task 三、Segment Anything Model 四、Segment Anything Data Engine 五、Segment Anything Dat...

大数据 2024-01-20 人工智能

2155阅读

视觉Mamba来了：速度提升2.8倍，内存能省87%

号称「全面包围 Transformer」的 Mamba，推出不到两个月就有了高性能的视觉版。本周四，来自华中科技大学、地平线、智源人工智能研究院等机构的研究者提出了 Vision Mamba（Vim）。论文地址：https://arxiv.or...

AIGC 2024-01-19 人工智能

839阅读

ICLR'24无图新思路！LaneSegNet：基于车道分段感知的地图学习

写在前面&笔者的个人理解地图作为自动驾驶系统下游应用的关键信息，通常以车道或中心线表示。然而，现有的地图学习文献主要集中在检测基于几何的车道或感知中心线的拓扑关系。这两种方法都忽略了车道线与中心线的内在关系，即车道线绑定中心线。虽然在一个模型中...

人工智能 2024-01-19 人工智能

1158阅读

WidthFormer：实时自动驾驶！助力基于Transformer的BEV方案量产

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&行业理解基于BEV的transformer方案今年量产的主要方案，transformer结构和CNN相比，特征提取能力更强，但需要较多的算力，这也是为什么许多车上都是1~2颗orin...

人工智能 2024-01-19 人工智能

1212阅读

Stable Diffusion AI绘画系列【24】:古代名家水墨画鉴赏

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

大数据 2024-01-17 人工智能

975阅读

超越BEVFusion！又快又好的极简BEV融合部署方案

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解在算法开发中，激光雷达-相机3D目标检测遇到了过度拟合问题，这是由于违反了一些基本规则。在数据集构建的数据标注方面，本文参考了理论补充，并认为回归任务预测不应涉及来自...

大数据 2024-01-16 人工智能

1084阅读

RoboFusion：通过SAM实现稳健的多模态3D检测

本文经自动驾驶之心公众号授权转载，转载请联系出处。论文链接：https://arxiv.org/pdf/2401.03907.pdf 多模态3D检测器致力于探索安全可靠的自动驾驶感知系统。然而，尽管在干净的基准数据集上实现了最先进的（SOTA）性能，...

大数据 2024-01-15 人工智能

953阅读

百度最强中文AI作画大模型

前言最近文生图领域的发展可谓是分生水起，这主要是得益于最近大火的扩散模型，之前笔者也写过一篇关于文本生产3D模型的文章，大家感兴趣的可以穿梭： https://zhuanlan.zhihu.com/p/570332906 今天要给大家介绍...

人工智能 2024-01-14 人工智能

1022阅读

Stable Diffusion AI绘画系列【19】:呆萌可爱的12生肖风【Q版，3D】

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

人工智能 2024-01-14 人工智能

977阅读

实战AI大模型：AIGC及经典模型

今天，人工智能技术的快速发展和广泛应用已经引起了大众的关注和兴趣，它不仅成为技术发展的核心驱动力，更是推动着社会生活的全方位变革。特别是作为AI重要分支的深度学习，通过不断刷新的表现力已引领并定义了一场科技革命。大型深度学习模型（简称AI大模型）以其强大的...

大数据 2024-01-14 人工智能

1206阅读

视觉高精地图构建的全面回顾！一起看看无图感知都有哪些落地方案（清华&滴滴）

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解近年来，自动驾驶受到越来越多的关注，高精地图成为自动驾驶技术的关键组成部分。这些地图提供了道路网络的复杂细节，并作为车辆定位、导航和决策等关键任务的基本输入。鉴于视觉...

生成式AI 2024-01-14 人工智能

1340阅读

【Stable Diffusion应用案例系列】【1】一键抠图--rembg插件安装与使用

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

大数据 2024-01-09 人工智能

931阅读

AI平台：OpenXLab浦源

OpenXLab浦源开放项目应用中心模型中心数据集中心文档中心搜索中文EN创建登录注册人工智能开源开放体系浦源内容平台应用中心探索多领域应用，体验丰富的社区生态AIGC语音计算机视觉自然语言处理多模态技术更多在这里...

生成式AI 2024-01-06 人工智能

1353阅读

《Cocos Creator游戏实战》AIGC之将草稿内容转为真实内容

目录前言训练AI 从识别结果中提取必要数据发送图片并生成最终代码总结与提高资源下载前言当创作灵感来的时候，我们可能会先把灵感记录在草稿上，之后再去实现它。比方说有一天，我突然来了游戏创作灵感，想着那可以先把一些简单的组件...

大数据 2024-01-06 人工智能

924阅读

Stable Diffusion AI绘画系列【23】:赛博朋克-机甲美女系列

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

AIGC 2024-01-05 人工智能

898阅读