计算机视觉第3页

离谱！AI超市「无人」收款，1000个印度人藏在背后……

就离谱，都2024了，人工智能靠人工的戏码还在上演。而且是类似ATM机背后坐真·柜员给你递钱的那种！当你走进一家超市，挑选完商品，无需人工、自助结账，直接拿好东西走人，等待一段时间，AI就能基于视频识别出你选了哪些东西，然后把账单发送过来，你只需点...

AIGC 2024-04-10 人工智能

847阅读

社交网络:利用AIGC进行社交网络分析

1.背景介绍 1. 背景介绍社交网络是现代互联网的重要组成部分，它们连接了数亿个用户，为信息传播、人际交流和商业活动提供了一个平台。社交网络分析是研究这些网络结构和行为的科学，它涉及到许多领域，包括计算机科学、社会学、心理学和经济学。...

大数据 2024-04-10 人工智能

1151阅读

如何为制造业和自动化应用选择现人工智能技术

在工业自动化领域的生产和实验室之外的日常生活中，人工智能(AI 的定义差异很大。 “人工智能”指的是一门包含了几种不同技术和工程学科的科学，包括机器视觉、计算机视觉、机器学习和深度学习。当一个基于这些技术组合的系统设计得当时(从应用分析到最终验证，它...

人工智能 2024-04-08 人工智能

871阅读

智能百科 | 多模态人工智能及其应用

多模态人工智能概述多模态人工智能是一种人工智能技术，其能够处理和理解多种类型的输入数据，例如文本、图像、语音和视频等。与传统的单一模态人工智能相比，多模态人工智能能够更全面地理解和处理信息，因为其能够同时考虑多种输入源的信息。多模态人工智能通常利用...

大数据 2024-04-08 人工智能

1250阅读

马斯克造大模型，从特斯拉连挖高管

当全球首富埃隆・马斯克（Elon Musk）建立 xAI，准备与 OpenAI、谷歌竞争大模型时，他必须与众多科技巨头、初创公司争夺人才。不过，他使用了一些取巧的办法：从自家的特斯拉挖来了几名优秀工程师。该初创公司的网站显示，上个月，机器学习...

生成式AI 2024-04-07 人工智能

890阅读

AI无人商店背后，是上千个印度人通过摄像头看美国人买西蓝花？

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 人们常说，有多少智能，就有多少人工。但是，亚马逊的这个项目，人工含量似乎有点高。这个项目名叫「Just Walk Out」。就像它的...

AIGC 2024-04-07 人工智能

817阅读

马斯克为建立 xAI 从特斯拉挖来优秀工程师

全球首富埃隆・马斯克（Elon Musk）近期在建立 xAI 的过程中不仅与科技巨头、初创公司展开激烈竞争，还采取了从自家特斯拉挖来优秀工程师的策略。特斯拉的工程师 Ethan Knight 等一众人才转投 xAI，使得 xAI 在人才储备上得到强化。马...

AIGC 2024-04-05 人工智能

791阅读

Transformer引领AI百花齐放：从算法创新到产业应用，一文读懂人工智能的未来

一、引言近年来，人工智能技术取得了举世瞩目的成果，其中，自然语言处理（NLP）和计算机视觉等领域的研究尤为突出。在这些领域，一种名为Transformer的模型逐渐成为研究热点，以其为核心的创新成果层出不穷。本文将从Transformer的原理、应用和...

大数据 2024-04-03 人工智能

903阅读

还得是抖音，字节推出竖屏视频理解数据集，入选CVPR2024

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 短视频在当下社交媒体逐渐成为主导的视频格式。传统视频处理技术和研究一般都专注于横屏视频的理解和解析，而竖屏视频因其拍摄手法和内容重点不同...

人工智能 2024-04-03 人工智能

839阅读

探索使用对比损失的孪生网络进行图像相似性比较

简介在计算机视觉领域，准确地测量图像相似性是一项关键任务，具有广泛的实际应用。从图像搜索引擎到人脸识别系统和基于内容的推荐系统，有效比较和查找相似图像的能力非常重要。Siamese网络与对比损失结合，为以数据驱动方式学习图像相似性提供了强大的框架。在...

大数据 2024-04-02 人工智能

939阅读

比LoRA还快50%的微调方法来了！一张3090性能超越全参调优，UIUC联合LMFlow团队提出LISA

2022 年底，随着 ChatGPT 的爆火，人类正式进入了大模型时代。然而，训练大模型需要的时空消耗依然居高不下，给大模型的普及和发展带来了巨大困难。面对这一挑战，原先在计算机视觉领域流行的 LoRA 技术成功转型大模型 [1][2]，带来了接近 2...

大数据 2024-04-01 人工智能

855阅读

15个推荐开源免费图像标注工具

图像标注是向图像添加标签或注释的元数据，使图像上的内容具有上下文含义。这个过程在机器学习中具有重要意义，助于在训练视觉模型过程中准确地识别图像中的元素。视觉模型最终的用途也非常广泛，例如，帮助车辆识别道路上的不同物体或障碍物、通过对医学图像的识别帮助疾...

AIGC 2024-03-27 人工智能

3114阅读

DifFlow3D：场景流估计新SOTA，扩散模型又下一城！

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：DifFlow3D: Toward Robust Uncertainty-Aware Scene Flow Estimation with Iterative Diffusion-Based...

大数据 2024-03-27 人工智能

869阅读

计算机视觉正在改变零售行业

零售企业主经常面临库存管理问题，这阻碍了长期客户关系的发展。在零售库存管理中采用计算机视觉是一种开创性的解决方案，可以构建满足业务目标的稳健运营。计算机视觉正在改变零售行业零售业受到客户需求的显著影响，这就需要在改善消费者体验方面进...

AIGC 2024-03-26 人工智能

902阅读

2024 CSRankings全美计算机科学排名发布！CMU霸榜，MIT跌出前5

2024 CSRankings全美计算机科学专业排名，刚刚发布了！今年，全美全美CS最佳大学排名中，卡耐基梅隆大学（CMU）位列全美第一，同时是CS世界第一。与此同时，伊利诺伊大学香槟分校（UIUC），连续6年稳居榜单第二。佐治亚理工学院位列第三。...

AIGC 2024-03-25 人工智能

852阅读

Domo AI上线新功能只需一张照片和视频即可让人物动起来

Domo AI 最近推出了一项令人兴奋的新功能，能够将静态人像变得栩栩如生。这项创新技术只需要一张静态照片和一个参考的动态视频，就能够将静态照片中的人物替换成动态视频中的人物，使其动起来。这项技术的工作原理类似于人物替换，但更加先进。通过使用深度学习和计...

生成式AI 2024-03-25 人工智能

963阅读

Stable Diffusion中的UNet是什么？

UNet的论文 U-Net: Convolutional Networks for Biomedical Image Segmentation | SpringerLink 首先，U-Net的卷积神经网络架构，最早它被用于生物医学图像分割任务。U-Ne...

大数据 2024-03-25 人工智能

1112阅读

文心一言率先向全社会开放7：引领人工智能新纪元

大家好，小发猫降ai今天来聊聊文心一言率先向全社会开放7：引领人工智能新纪元，希望能给大家提供一点参考。降ai辅写以下是针对论文AI辅写率高的情况，提供一些修改建议和技巧，可以借助此类工具：还有：文心一言率先向全社会开放7：引领人工智能...

AIGC 2024-03-24 人工智能

1018阅读

数据本地性如何助力企业在云上实现高效机器学习

2.2 训练前将数据从远端拷贝到本地另一种方案是在训练开始之前手动将数据集从远端云存储拷贝到本地磁盘/存储中。这样可以让数据位于本地，从而具备数据本地性的所有性能和成本优势。该方案的挑战主要在于数据管理。用户必须在作业完成后手动删除已拷贝的数据，为下一...

人工智能 2024-03-22 人工智能

991阅读

到2030年，电子商务领域的人工智能市场将达到226亿美元

在技术进步的推动下，电子商务市场中的人工智能(AI 正在经历显著增长，以及对个性化和高效购物体验的需求不断增加。根据最近的数据，2023年市场规模为58.1亿美元，预计到2030年将达到226亿美元，2024-2030年预测期间的复合年增长率...

人工智能 2024-03-21 人工智能

898阅读

AIGC在农业领域的创新应用

AIGC是人工智能生成内容的简称，指的是利用人工智能技术，如自然语言处理、计算机视觉、机器学习等，自动或半自动地生成各种类型的内容，如文本、图像、音频、视频等。典型应用如ChatGPT，Midjourney等。AIGC在农业领域有着广泛的应用场景，可以为农...

大数据 2024-03-20 人工智能

1271阅读

华为天才少年谢凌曦：关于视觉识别领域发展的个人观点！

本文经自动驾驶之心公众号授权转载，转载请联系出处。最近，我参加了几个高强度的学术活动，包括CCF计算机视觉专委会的闭门研讨会和VALSE线下大会。经过与其他学者的交流，我产生了许多想法，千头万绪，便希望把它们整理下来，供自己和同行们参考。当然，受限于...

AIGC 2024-03-20 人工智能

778阅读

小红书多模态团队建立新「扩散模型」：解码脑电波，高清还原人眼所见

近些年，研究人员们对探索大脑如何解读视觉信息，并试图还原出原始图像一直孜孜不倦。去年一篇被 CVPR 录用的论文，通过扩散模型重建视觉影像，给出了非常炸裂的效果—— AI 不光通过脑电波知道你看到了什么，并且帮你画了出来。第一行：人眼所见画面，第二...

人工智能 2024-03-19 人工智能

1294阅读

【AIGC调研系列】embeding模型有哪些，各有什么优势

在AIGC中，Embedding模型是一种将文本数据转换为多维向量数组的技术，这些向量可以代表任何事物，如文本、音乐、视频等[2]。有几种不同的Embedding模型，它们各有其优势和应用领域。 Word2vec：这是一种经典的嵌入模型，通过学习单词...

AIGC 2024-03-18 人工智能

3029阅读

小妙招：Copilot 当跳板免费调用 GPT4

GPT4 每月 20 刀，Github Copilot 每月 10 刀首先叠个甲：免费不是 0 成本。由于我在日常开发过程中，Copilot 对我来说是必需品，我会用它检查代码、写工具函数、写注释、干苦力。所以这钱是我的必要支出。而这篇文章是介...

人工智能 2024-03-18 人工智能

1193阅读

端到端没有数据怎么办？ActiveAD：面向规划的端到端自动驾驶主动学习！

本文经自动驾驶之心公众号授权转载，转载请联系出处。自动驾驶的端到端可微学习最近已成为一种突出的范式。一个主要瓶颈在于其对高质量标记数据的巨大需求，例如3D框和语义分割，这些数据的手动注释成本是出了名的昂贵。由于AD中样本内的行为往往存在长尾分布这一...

人工智能 2024-03-13 人工智能

917阅读

爱诗科技完成亿级A1轮融资并发布爱诗视频大模型

爱诗科技是一家专注于解决 AI 视频大模型及应用的公司，最近完成了亿级人民币 A1轮融资。本轮融资由国内一线投资机构达晨财智领投，光源资本担任独家财务顾问。爱诗科技团队成员来自清华、北大、中科院等顶级学府，曾在字节、快手、腾讯、微软研究院等核心技术团队工...

大数据 2024-03-12 人工智能

922阅读

如何只用两个Python函数在几分钟内创建完整的计算机视觉应用程序

译者 | 李睿审校 | 重楼本文首先概述典型的计算机视觉应用程序的要求。然后，介绍Pipeless这一为嵌入式计算机视觉提供无服务器开发体验的开源框架。最后，提供一个详细的步骤指南，介绍如何创建和执行一个简单的对象检测应用程序，该应用程序只需采用几...

大数据 2024-03-12 人工智能

909阅读

相册系统采集插件的应用与发展

在数字化飞速发展的时代，图像和视频数据无疑已经成为了我们日常生活中最为常见的信息载体之一。特别是在社交网络、电子商务平台以及各类媒体网站中，相册系统扮演了不可或缺的角色。而在这背后默默支撑的，往往是一个高效稳定的相册系统采集插件。本文旨在探讨相册系统采集插...

人工智能 2024-03-11 大数据

808阅读

华人CV宗师黄煦涛高徒离职特斯拉，加入OpenAI！专攻多模态模型研究

OpenAI又迎来一位AI大将。最近，华人科学家程博文官宣离职特斯拉，即将加入OpenAI专攻多模态模型的研究。图片今天是我在特斯拉自动驾驶部门的最后一天，这一年半的经历真的很棒：有机会与才华横溢的同事们共事，学习了如何开发出色的产品等等。但我向通...

AIGC 2024-03-11 人工智能

800阅读

【ICCV】AIGC时代下的SOTA人脸表征提取器TransFace，FaceChain团队出品

一、论文本文介绍被计算机视觉顶级国际会议ICCV 2023接收的论文 "TransFace: Calibrating Transformer Training for Face Recognition from a Data-Centric Persp...

大数据 2024-03-09 人工智能

1152阅读

「AI透视眼」，三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题

遮挡是计算机视觉很基础但依旧未解决的问题之一，因为遮挡意味着视觉信息的缺失，而机器视觉系统却依靠着视觉信息进行感知和理解，并且在现实世界中，物体之间的相互遮挡无处不在。牛津大学 VGG 实验室 Andrew Zisserman 团队最新工作系统性解决了任...

AIGC 2024-03-08 人工智能

857阅读

CLRNet：一种用于自动驾驶车道检测的分层细化网络算法

车道是具有高级语义的交通标志，特别是在视觉导航系统中尤其重要。检测车道可以使许多应用受益，例如自动驾驶和高级驾驶员辅助系统（ADAS）中的视觉导航就是一个典型的应用，它可以帮助智能车辆更好地进行自车定位并更安全地行驶。然而，车道检测拥有特定的局部模式，...

生成式AI 2024-03-08 人工智能

1052阅读

AIGC专题：生成式AI机遇和颠覆：演变中的万亿美元市场

今天分享的是AI大模型系列深度研究报告：《AIGC专题：生成式AI机遇和颠覆：演变中的万亿美元市场》。（报告出品方：彭博专业服务）报告共计：52页来源：人工智能学派生成式人工智能(AI 和大型语言模型(LLM 的采用将给科技行业的每一个领域...

AIGC 2024-03-07 人工智能

866阅读

DUSt3R官网体验入口 3D重建工具AI应用免费使用下载地址

DUSt3R是一种新颖的密集和无约束立体3D重建方法，适用于任意图像集合。它不需要事先了解相机校准或视点姿态信息，通过将成对重建问题视为点图的回归，放宽了传统投影相机模型的严格约束。DUSt3R提供了一种统一的单目和双目重建方法，并在多图像情况下提出了一种...

生成式AI 2024-03-05 人工智能

967阅读

大视频模型是世界模型？DeepMind/UC伯克利华人一作：预测下一帧就能改变世界

没人怀疑，OpenAI开年推出的史诗巨作Sora，将改变视频相关领域的内容生态。但Google DeepMind、UC伯克利和MIT的研究人员更进一步，在他们眼里，「大视频模型」也许能够像世界模型一样，真正的做到理解我们身处的这个世界。论文地址：h...

生成式AI 2024-03-05 人工智能

898阅读

李飞飞，最火AI女王

黄仁勋又出手了。最近，英伟达宣布成立一个新研究部门——通用具身智能体研究实验室GEAR。令人意外的是，该实验室的领导者是两位华人90后博士——范麟熙（Jim Fan）和朱玉可(Yuke Zhu 。范麟熙和朱玉可身上标签很多，但最为鲜明还是一点:李飞飞的...

大数据 2024-03-04 人工智能

823阅读

AIGC 为何能火爆全网，赋能智能时代？

Hi，大家好，我是半亩花海。2023年，人工智能新浪潮涌起，AIGC 火爆全网，不断赋能各大行业。从短视频平台上火爆的“AI 绘画”，到智能聊天软件 ChatGPT，都引起了大家的广泛关注。那么 AIGC 到底是什么？为什么如此引人关注？AIGC 能产生什...

人工智能 2024-03-04 人工智能

972阅读

Stable Diffusion官网体验入口 AI图像生成工具网页版免费使用地址

Stable Diffusion是一个深度学习模型，可根据用户输入的文本描述生成高质量的逼真图像。用户可以免费在线使用 Stable Diffusion，生成各种类型的艺术图像。点击前往Stable Diffusion官网体验入口谁可以从Stable...

AIGC 2024-03-02 人工智能

1607阅读

一文搞懂：AI、机器学习与深度学习的联系与区别

在当今科技日新月异的浪潮中，人工智能（Artificial Intelligence, AI）、机器学习（Machine Learning, ML）与深度学习（Deep Learning, DL）如同璀璨星辰，引领着信息技术的新浪潮。这三个词汇频繁出现在...

AIGC 2024-03-01 人工智能

1052阅读

Github Copilot 程序员效率提升工具

AI时代到来，Github Copilot问世以下是GitHub的首席执行官 Thomas 在2022年6月21日，首次将Github Copilot面向个人开发者全面开放的公告。什么是 Github Copilot 简单来说就是能帮助程...

AIGC 2024-02-29 人工智能

1070阅读

你的下一个办公室助理会是机器人吗？

...

生成式AI 2024-02-27 人工智能

816阅读

重要的医学AI应用：使用多模态 CNN-DDI预测药物间相互作用事件

生病时，医生往往给我们开了多种药物，这些药物在同时服下时是否因为药物间相互作用产生对身体不良的效果，这引起我们的怀疑和担心。其实医生所开的药方的药品已经经过了药物间相互作用的实验和临床测试，我们不应对此产生疑虑。药物间相互作用（DDI）是指当一个患者同...

人工智能 2024-02-27 人工智能

886阅读

技术精英求职必备：AIGC(图像生成)研发工程师简历指南

核心原则撰写针对AIGC(图像生成研发工程师职位的简历时，关键在于准确展现您在深度学习、计算机视觉和图像生成算法方面的综合技能、项目经验和技术成就。简历应作为您展示跨多个技术栈的编程能力、构建完整的图像生成解决方案和有效解决AIGC技术问题的能力的窗...

大数据 2024-02-26 人工智能

1271阅读

【AIGC】基于深度学习的图像生成与增强技术

摘要：本论文探讨基于深度学习的图像生成与增强技术在图像处理和计算机视觉领域的应用。我们综合分析了主流的深度学习模型，特别是生成对抗网络（GAN）和变分自编码器（VAE）等，并就它们在实际应用中的效果和局限性展开讨论。通过比较实验和案例研究，我们评估了不...

生成式AI 2024-02-25 人工智能

1237阅读

Differential Diffusion官网体验入口 AI图像生成编辑平台免费在线使用地址

Differential Diffusion是一个图像生成和编辑的平台，可以根据文本提示以及指定每个区域变化量的地图来修改图片。它能够为每个像素或图像区域提供定制化的变化量控制。这种细粒度的变化量控制为各种新的编辑能力打开了大门，例如控制个别对象被修改的程...

生成式AI 2024-02-23 人工智能

834阅读

OpenAI员工自曝“996”加班实锤 ChatGPT热潮下工作生活失衡

近日，OpenAI员工过劳问题再次浮出水面。该公司思维链项目团队员工、前谷歌工程师Jason Wei日前在社交平台上晒出自己一天的详细作息时间表，从早上9点工作至次日凌晨1点15分，几乎没休息。图中这位员工的一天被安排得满满当当，工作与生活之间鲜有间隙...

大数据 2024-02-21 人工智能

805阅读

世界模拟器才是AGI终局，12态势预测！首席专家万字长文专业解读Sora里程碑

这几天反复看Sora的技术报告，以及各方对Sora的技术分析。基本三个角度：惊呼强大功能，分析Sora（实现）大法，评估巨大冲击。冲击方面，主要关注点在于对影视、短视频、娱乐等领域的影响。但是，Sora改变AI认知方式，开启走向「世界模拟器」的史诗...

生成式AI 2024-02-21 人工智能

770阅读

YOLOv8官网体验入口 AI计算机视觉目标检测模型免费在线使用地址

YOLOv8是YOLO系列目标检测模型的最新版本。它能够在图像或视频中准确快速地识别和定位多个对象，并实时跟踪它们的移动。相比之前版本，YOLOv8在检测速度和精确度上都有很大提升，同时支持多种额外的计算机视觉任务，如实例分割、姿态估计等。YOLOv8可通...

生成式AI 2024-02-21 人工智能

917阅读

网络安全人士必知的AI框架

一、AI框架的重要性 AI框架是人工智能的操作系统，是基础软件，是算法和应用的根基。AI江湖传言：得框架者得天下，可见AI框架的重要性，它通过框架性思维整合了人工智能的三驾马车(算法、算力、数据，如果想成为头部AI企业，AI框架就是其中一项核心竞争力...

AIGC 2024-02-21 人工智能

909阅读