目标检测第3页 - AIGC资讯

人工智能利用深度学习技术增强高级驾驶辅助系统(ADAS)

译者 | 李睿审校 | 重楼人工智能和机器学习利用深度学习技术的优势，使高级驾驶辅助系统(ADAS 发生了重大变革。ADAS在很大程度上依赖深度学习来分析和解释从各种传感器获得的大量数据。摄像头、激光雷达(光探测和测距、雷达和超声波传感器都是传感器...

大数据 2024-01-04 人工智能

974阅读

突破Pytorch核心点，CNN ！！！

哈喽，我是小壮！创建卷积神经网络（CNN），很多初学者不太熟悉，今儿咱们来大概说说，给一个完整的案例进行说明。 CNN 用于图像分类、目标检测、图像生成等任务。它的关键思想是通过卷积层和池化层来自动提取图像的特征，并通过全连接层进行分类。原理 1.卷...

大数据 2024-01-03 人工智能

807阅读

MonoLSS：用于视觉3D检测训练中的样本选择

本文经自动驾驶之心公众号授权转载，转载请联系出处。 MonoLSS: Learnable Sample Selection For Monocular 3D Detection 论文链接：https://arxiv.org/pdf/2312.14474...

生成式AI 2023-12-29 人工智能

812阅读

大模型被偷家！CNN搞多模态不弱于Transfromer（腾讯&港中文）

本文经自动驾驶之心公众号授权转载，转载请联系出处。腾讯AI实验室与港中文联合团队提出了一种新的CNN架构，图像识别精度和速度都超过了Transformer架构模型。切换到点云、音频、视频等其他模态，也无需改变模型结构，简单预处理即可接近甚至超越SO...

生成式AI 2023-12-28 人工智能

893阅读

大模型+机器人，详尽的综述报告来了，多位华人学者参与

大模型的出色能力有目共睹，而如果将它们整合进机器人，则有望让机器人拥有一个更加智能的大脑，为机器人领域带来新的可能性，比如自动驾驶、家用机器人、工业机器人、辅助机器人、医疗机器人、现场机器人和多机器人系统。预训练的大型语言模型（LLM）、大型视觉 -...

AIGC 2023-12-27 人工智能

901阅读

什么？NeRF还能提升BEV泛化性能！首个BEV跨域开源代码并首次完成Sim2Real！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人总结鸟瞰图(Bird eye's view, BEV 检测是一种通过融合多个环视摄像头来进行检测的方法。目前算法大部分算法都是在相同数据集训练并且评测，这导致了这些算法过...

AIGC 2023-12-27 人工智能

1058阅读

超越BEVFusion！Lift-Attend-Splat：最新BEV LV融合方案

本文经自动驾驶之心公众号授权转载，转载请联系出处。论文：Lift-Attend-Splat: Bird’s-eye-view camera-lidar fusion using transformers 链接：https://arxiv.org/pd...

AIGC 2023-12-27 人工智能

854阅读

大模型被偷家！腾讯港中文新研究修正认知：CNN搞多模态不弱于Transfromer

在Transformer占据多模态工具半壁江山的时代，大核CNN又“杀了回来”，成为了一匹新的黑马。腾讯AI实验室与港中文联合团队提出了一种新的CNN架构，图像识别精度和速度都超过了Transformer架构模型。切换到点云、音频、视频等其他模态，也无...

生成式AI 2023-12-25 人工智能

905阅读

Stable Diffusion AI绘画系列【20】:美丽动人的雀羽婚纱风，你心动了吗？

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

大数据 2023-12-23 人工智能

808阅读

Stable Diffusion AI绘画系列【11】:超萌的Q版手办萌宠系列

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

AIGC 2023-12-23 人工智能

945阅读

Stable Diffusion AI绘画系列【17】:绘本童话风格场景

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

生成式AI 2023-12-21 人工智能

932阅读

Stable Diffusion AI绘画系列【25】:3D可爱风格系列图片

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

人工智能 2023-12-20 人工智能

792阅读

PillarNeSt：如何进一步提升基于Pillar的3D目标检测性能？

写在前面 && 笔者的个人理解目前在自动驾驶领域中，一辆自驾汽车会配备多种传感器，如：激光雷达传感器采集点云数据、相机传感器采集图像数据等。由于激光雷达传感器可以更加准确的获取待检测物体的几何和位置信息，所以基于点云的感知算法模型在快速...

AIGC 2023-12-20 人工智能

882阅读

深度学习之目标检测中的常用算法

随着深度学习的不断发展，深度卷积神经网络在目标检测领域中的应用愈加广泛，现已被应用于农业、交通和医学等众多领域。与基于特征的传统手工方法相比，基于深度学习的目标检测方法可以学习低级和高级图像特征，有更好的检测精度和泛化能力。什么是目标检测？目标检测...

AIGC 2023-12-19 人工智能

1514阅读

Stable Diffusion AI绘画系列【22】:国风美女写实系列

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

人工智能 2023-12-18 人工智能

944阅读

AIGC系列之：CLIP和OpenCLIP

目录模型背景 CLIP模型介绍相关资料原理和方法 Image Encoder Text Encoder 对比学习预训练 Zero Shot预测优势和劣势总结 OpenClip模型介绍相关资料原理结果用法...

人工智能 2023-12-17 人工智能

3158阅读

QTNet：最新时序融合新方案！点云、图像、多模态检测器全适用（NeurIPS 2023）

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面 & 个人理解时序融合能够有效提升自动驾驶3D目标检测的感知能力，然而目前的时序融合方法由于成本开销等问题难以在实际自动驾驶场景中应用。NeurIPS 2023的最新研究文章《Qu...

大数据 2023-12-15 人工智能

1126阅读

Stable Diffusion AI绘画系列【12】:国风美女剑客系列

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

AIGC 2023-12-14 人工智能

988阅读

Stable Diffusion AI绘画系列【21】:写实女孩--圣诞主题风

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

生成式AI 2023-12-14 人工智能

875阅读

数字图像处理的图像操作

图像操作在计算机视觉和图像处理中发挥着至关重要的作用。这些操作对于诸如预处理、增强图像质量和启用高级算法等任务至关重要。在计算机视觉中，诸如调整大小、裁剪、调整亮度/对比度/伽玛和几何变换等操作是基础的。它们允许进行高效的计算、提取感兴趣区域、规范化图像...

大数据 2023-12-14 人工智能

994阅读

Stable Diffusion AI绘画系列【18】:东方巨龙，威武霸气

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

人工智能 2023-12-14 人工智能

955阅读

把检测器加进来，YOLOv8部署实战！

本文经自动驾驶之心公众号授权转载，转载请联系出处。 0 把检测器加进来本文是我在学习韩博《CUDA与TensorRT部署实战课程》第六章的课程部分输出的个人学习笔记，欢迎大家一起讨论学习！ 1 导出onnx需要注意的地方不要pip instal...

大数据 2023-12-11 人工智能

868阅读

RangePerception：Range View3D检测新思路！

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：RangePerception: Taming LiDAR Range View for Efficient and Accurate 3D Object Detection 论文链接：htt...

大数据 2023-12-07 人工智能

816阅读

AI文生视频，会在明年迎来“GPT时刻”

在当下的AI赛道上，AI生文、生图的应用，早已层出不穷，相关的技术，也在不断日新月异。而与之相比，AI文生视频，却是一个迟迟未被“攻下”的阵地。抖动、闪现、时长太短，这一系列缺陷，让AI生成的视频只能停留在“图一乐”的层面，很难拿来使用，更不要说提供商...

AIGC 2023-12-06 人工智能

832阅读

Stable Diffusion AI绘画系列【10】:AI眼中的美丽清晨

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

生成式AI 2023-12-06 人工智能

865阅读

R-CNN作者Ross Girshick离职，何恺明、谢赛宁回归学界，Meta CV走出了多少大神

FAIR 又一位大佬级研究科学家「出走了」，这次是 R-CNN 作者 Ross Girshick。近日，Meta 首席科学家 Yann LeCun 发推宣布，Ross Girshick 将离开 FAIR，加入艾伦人工智能研究所（AI2）。此前离职的还...

大数据 2023-12-04 人工智能

824阅读

DetZero：Waymo 3D检测榜单第一，媲美人工标注！

本文经自动驾驶之心公众号授权转载，转载请联系出处。本文提出了一套离线3D物体检测算法框架DetZero，通过在 Waymo 公开数据集上进行全面的研究和评估，DetZero可生成连续且完整的物体轨迹序列，并充分利用长时序点云特征显着提升感知结果的质...

大数据 2023-12-04 人工智能

879阅读

Window下部署使用Stable Diffusion AI开源项目绘图

Window下部署使用Stable Diffusion AI开源项目绘图前言前提条件相关介绍 Stable Diffusion AI绘图下载项目环境要求环境下载运行项目打开网址，即可体验文字生成图像（txt2img）庐山瀑...

生成式AI 2023-12-01 人工智能

913阅读

微软推出ML.NET 3.0版本，扩展了深度学习功能

11月29日消息，据外媒报道，微软日前发布了ML.NET 3.0，这是该公司开源、跨平台机器学习框架的最新版本，可以将机器学习模型集成到.NET应用程序中。 ML.NET 3.0在对象检测、命名实体识别和问题回答方面包含了新的深度学习功能。通过与Tor...

大数据 2023-11-29 人工智能

839阅读

人工智能十大基础术语

这里有10个关键的术语，每个人工智能爱好者都应该知道并了解。人工智能(AI 已经成为各行各业的变革力量，塑造了我们与技术和周围世界互动的方式。对于那些深入人工智能领域的人而言，理解基础术语至关重要。 1、人工智能(AI ：人工智能的核心是指开发能够执...

大数据 2023-11-29 人工智能

863阅读

FlashOcc：占用预测新思路，精度、效率和内存占用新SOTA！

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugin 论文链接：https...

大数据 2023-11-28 人工智能

895阅读

大火的4D Radar开源数据汇总

本文经自动驾驶之心公众号授权转载，转载请联系出处。 4D Radar在自动驾驶领域中越来越受关注，在价格和功能上都有比较大的竞争力，相关研究也逐渐open，今天为大家盘点下开源的4D Radar数据，为相关科学研究提供保障！ 1Astyx 数据集链接：h...

人工智能 2023-11-27 人工智能

1135阅读

Open Vocabulary Detection 开放世界目标检测竞赛 2023获胜团队方案分享

OVD技术简介目标检测是计算机视觉领域中的一项核心任务，其主要目标是让计算机能够自动识别图片中目标的类别，并准确标示每个目标的位置。目前，主流的目标检测方法主要针对闭集目标的开发，即在任务开始之前需要对待检测目标进行类别定义，并进行人工数据标注，通...

大数据 2023-11-27 人工智能

1521阅读

Stable Diffusion：使用自己的数据集微调训练LoRA模型

Stable Diffusion：使用自己的数据集微调训练LoRA模型前言前提条件相关介绍微调训练LoRA模型下载kohya_ss项目安装kohya_ss项目运行kohya_ss项目准备数据集生成关键词模型参数设置预训...

生成式AI 2023-11-25 人工智能

1280阅读

计算机视觉中目标检测的数据预处理

本文涵盖了在解决计算机视觉中的目标检测问题时，对图像数据执行的预处理步骤。首先，让我们从计算机视觉中为目标检测选择正确的数据开始。在选择计算机视觉中的目标检测最佳图像时，您需要选择那些在训练强大且准确的模型方面提供最大价值的图像。在选择最佳图像时，考...

人工智能 2023-11-22 人工智能

796阅读

Grounding dino + segment anything + stable diffusion 实现图片编辑

目录总体介绍总体流程模块介绍目标检测： grounding dino 目标分割：Segment Anything Model (SAM 整体思路模型结构：数据引擎图片绘制集成样例其他问题附录总体介绍...

生成式AI 2023-11-21 人工智能

2039阅读

重磅！清华最新报告：文心一言超越ChatGPT 3.5

点击下方卡片，关注“CVer”公众号 AI/CV重磅干货，第一时间送达今年国内厂商已发布很多大语言模型，其中最具代表性的产品有：百度的文心一言、阿里巴巴的通义千问、科大讯飞的星火等，最具代表性的开源工作有：ChatGLM、MOSS、Ba...

AIGC 2023-11-18 人工智能

1284阅读

一文盘点2023人工智能进展，不止大模型而已

2023年大模型千帆竞发，除此外AI领域还有哪些新突破？来来来，畅销书《Python机器学习》作者Sebastian Raschka的年末总结已经准备好了。看完才知道： RLHF今年虽然爆火，但实打实用到的模型并不多，现在还出现了替代方案，有望从开...

AIGC 2023-11-16 人工智能

926阅读

Yolo V8：深入探讨其高级功能和新特性

Yolo是一种计算机视觉模型，被广泛认为是目前最强大和最知名的模型之一。这一突破性技术被称为Yolo，它是“You Only Look Once”的缩写，是一种以几乎瞬间处理速度检测物体的方法。Yolo V8技术是这一技术的最新版本，也是对之前版本的一种...

生成式AI 2023-11-15 人工智能

2192阅读

【stable diffusion】保姆级入门课程04-Stable diffusion（SD）图生图-局部重绘的用法

目录 0.本章素材 1.什么是局部重绘 2.局部重绘和涂鸦有什么不同 3.操作界面讲解 3.1.蒙版模糊 3.2.蒙版模式 3.3.蒙版蒙住的内容 3.4.重绘区域 4.局部重绘的应用（面部修复） 5.课后训练 0.本章素材...

人工智能 2023-11-15 人工智能

1381阅读

AIGC实战——卷积神经网络(Convolutional Neural Network, CNN)

AIGC实战——卷积神经网络 0. 前言 1. 卷积神经网络 1.1 卷积层 1.2 叠加卷积层 1.3 检查模型 2. 批归一化 2.1 协变量漂移 2.2 使用批归一化进行训练 2.3 使用批归一化进行预测 3. Dropout 4...

AIGC 2023-11-11 人工智能

935阅读

UniPAD：通用自动驾驶预训练模式！各类感知任务都可支持

本文经自动驾驶之心公众号授权转载，转载请联系出处。最近，新论文推陈出新的速度着实太快有点读不过来的感觉。可以看到的是，语言视觉多模态大模型融合已经是业界共识了，UniPad 这篇文章就比较有代表性，多模态的输入，类世界模型的预训练基座模型，同时又方便扩...

人工智能 2023-11-10 人工智能

886阅读

使用百度EasyDL实现电动车进电梯自动预警

项目说明业务背景近年来，电动车进楼入户发生火灾的事故屡见不鲜，针对该问题，社区物业已明令禁止电动车入户，但是依然有住户忽视这个问题的严重性。业务难点由于小区电梯多，人工监控很难及时发现电瓶车入户违规，最终造成严重的人员伤亡事故。同...

AIGC 2023-11-08 大数据

992阅读

场景采集感知测评软件 INTEWORK-ARS

概述工欲善其事，必先利其器。在“软件定义汽车”的新时代下，开发者们总结了一条适用于自动驾驶的开发流程，这条开发线路大致包括实车数据采集->数据存储->数据处理->数据分析->数据标注->模型训练->仿真测试->...

AIGC 2023-11-08 大数据

817阅读

目标检测标注的时代已经过去了？

在快速发展的机器学习领域，有一个方面一直保持不变：繁琐和耗时的数据标注任务。无论是用于图像分类、目标检测还是语义分割，长期以来人工标记的数据集一直是监督学习的基础。然而，由于一个创新性的工具 AutoDistill，这种情况可能很快会发生改变。 G...

人工智能 2023-11-07 人工智能

931阅读

多模态大模型幻觉降低30%！中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

视觉幻觉是常见于多模态大语言模型（Multimodal Large Language Models, MLLMs）的一个典型问题。简单来说就是：模型输出的描述与图片内容不相符。下图中体现了两种幻觉，红色部分错误地描述了狗的颜色（属性幻觉），蓝色部分描...

AIGC 2023-10-30 人工智能

1118阅读

多模态LLM幻觉问题降低30%！业内首个“啄木鸟”免重训方法诞生

还在用指令微调解决多模态大模型的“幻觉”问题吗？比如下图中模型将橙色柯基错认为“红狗”，还指出周围还有几条。图片现在，中科大的一项研究想到了一个全新办法：一个免重训、即插即用的通用架构，直接从模型给出的错误文本下手，“倒推”出可能出现“幻觉”之处...

人工智能 2023-10-29 人工智能

976阅读

GraphAlign：通过图匹配增强多模态3D目标检测的准确特征对齐

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：GraphAlign: Enhancing Accurate Feature Alignment by Graph matching for Multi-Modal 3D Object Det...

AIGC 2023-10-27 人工智能

952阅读

UniPAD：自动驾驶通用预训练范式来了！

本文经自动驾驶之心公众号授权转载，转载请联系出处。 UNIPAD：自动驾驶通用预训练范式原标题：UNIPAD: A UNIVERSAL PRE-TRAINING PARADIGM FOR AUTONOMOUS DRIVING 论文链接：https:/...

AIGC 2023-10-25 人工智能

904阅读