-
人工智能实战:Stable Diffusion技术分享
背景 Stable Diffusion是计算机图形学和可视化领域中的一项重要技术。在这篇分 享中 ,我们将深入探讨稳定扩散的原理、关键要素和实施步骤 ,通过了解Stable Diffusion的流程化 ,我们可以提升自身的设计能力和创造力 ,为公司 和个...
-
人工智能如何重塑五大制造业?让AI项目顺利部署的五个步骤
如今,数字化转型已成为企业生存的基石。从自动化工厂到人工智能(AI)质量控制,数字化转型的主要目标是通过技术打造竞争优势,从而增强客户体验并降低运营成本。 制造业利用大数据分析、AI和机器人等技术,走在了数字化转型的前沿。据麦肯锡的相关调查显示,数字化...
-
数字人唇形同步技术:AIGC多元化应用的关键
数字人是指利用计算机技术生成的虚拟人物形象,通过深度学习算法和模型来实现高度逼真的外貌特征和自然动作表现。在数字人领域中,唇形同步(Lip Sync)是非常重要的一环,直接影响数字人的逼真程度。现有的数字人唇形同步技术包括Wav2Lip、DeepFake、...
-
几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型
在AR、VR、3D打印、场景搭建以及电影制作等多个领域中,高质量的穿着衣服的人体3D模型非常重要。 传统的方法创建这些模型不仅需要大量时间,还需要能够捕捉多视角照片的专业设备,此外还依赖于技术熟练的专业人员。 与此相反,在日常生活中,我们最常见...
-
GLM-4体验入口 智谱AI多模态大模型在线使用地址
GLM-4是由智谱AI在首届技术开放日上发布的一款新型大模型。GLM- 4 在性能上全面提升近60%,支持更长的上下文、更强的多模态支持和更快速的推理。产品定位为下一代基座大模型,旨在为文本处理、数据分析、图像生成等领域提供高效的AI解决方案。 点击前往...
-
AI人像生成零成本图像处理软件下载地址 FaceChain-FACT官网体验入口
FaceChain-FACT是一个创新的零成本人像生成工具,为用户提供了一种简便、高效的方式来生成定制化的人像。这款工具的特点是用户无需训练LoRA模型,只需提供一张照片,FaceChain-FACT就能迅速生成定制人像。它集成了基于Transformer...
-
TimePillars:提升200米以上小目标的检测能力
本文经自动驾驶之心公众号授权转载,转载请联系出处。 基于LiDAR点云点3D Object Detection一直是一个很经典的问题,学术界和工业界都提出了各种各样的模型来提高精度、速度和鲁棒性。但因为室外的复杂环境,所以室外点云的Object Det...
-
视觉高精地图构建的全面回顾!一起看看无图感知都有哪些落地方案(清华&滴滴)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 近年来,自动驾驶受到越来越多的关注,高精地图成为自动驾驶技术的关键组成部分。这些地图提供了道路网络的复杂细节,并作为车辆定位、导航和决策等关键任务的基本输入。鉴于视觉...
-
【AI实战】llama.cpp 量化部署 llama-33B
【AI实战】llama.cpp 量化部署 llama-33B llama.cpp 量化介绍 环境配置 安装 llama.cpp 拉取 llama.cpp 仓库代码 编译llama.cpp 生成量化版本模型 模型准备 将上述.pth模型权重...
-
天猫与50大超级品牌携手,通过AIGC设计超现实主义风格海报|经验总结
天猫与50大超级品牌携手,为今年双11打造了一场别开生面的联合营销盛宴。通过汇聚这些超级品牌的力量,他们创造了一个超现实、沉浸式的创新营销场所,旨在重构品牌与年轻人之间的双11对话。 在这场充满新潮气息的联合营销活动中,超级品牌与天猫共同推出的联合海报淋...
-
腾讯云AI绘画体验入口 AI图像生成API服务在线使用地址入口
腾讯云AI绘画是一款高端的AI图像生成与编辑技术API服务,专为满足多样化的中文内容创作需求而设计。它具备强大的中文理解能力,能够根据输入的文本或图片智能创作出相关图像内容。无论是建筑风景生成、古诗词理解、水墨剪纸等中国元素风格,还是动漫、游戏风格的高精度...
-
【Stable Diffusion应用案例系列】【1】一键抠图--rembg插件安装与使用
《博主简介》 小伙伴们好,我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源,可关注公-仲-hao:【阿旭算法与机器学习】,共同学习交流~ ?感谢小伙伴们点赞、关注! 《------往期经典推荐----...
-
文心一言没有体验上,看看讯飞星火认知大模型
目录 前言 正文 1.简单对话环节 1.1什么是讯飞星火认知大模型 1.2你都可以干一些什么 1.3你的训练数据库还在持续更新么 1.4今天是哪一天 1.5宇宙中有哪些目前认为可能存在生命的星球 2.辅助学习对话 2.1我想完成一篇...
-
万字长文谈自动驾驶BEV感知
本文经自动驾驶之心公众号授权转载,转载请联系出处。 prologue 这有可能是更的最长的文章系列了,先说为什么,一方面是看到分割大模型对小模型的提升效果需要时间,另一方面是之前对自动驾驶的BEV算法做了很长时间的预研,自己也应该好好梳理一下了。 (很...
-
超逼真!实时高质量渲染,用于动态城市场景建模的Street Gaussians
本文经自动驾驶之心公众号授权转载,转载请联系出处。 不得不说,技术更新太快了,Nerf在学术界慢慢被替换下去了。Gaussians登场了,浙江大学的工作 论文:Street Gaussians for Modeling Dynamic Urban Sc...
-
怎么使用midjourney?9个步骤教你学会AI创作
人工智能生成艺术作品的时代已经来临,互联网上到处都是试图创造完美提示的用户,以引导人工智能创造出正确的图像——有时甚至是错误的图像。听起来很有趣?Midjourney 是一种更常见的 AI 工具,人们用它只用几句话就能创造出梦幻般的风景和主题。 如果您想...
-
图解tinyBERT模型——BERT模型压缩精华
译者 | 朱先忠 审校 | 重楼 简介 近年来,大型语言模型的发展突飞猛进。BERT成为最受欢迎和最有效的模型之一,可以高精度地解决各种自然语言处理(NLP)任务。继BERT模型之后,一组其他的模型也先后出现并各自展示出优秀的性能。 不难看到一个明显趋势...
-
从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述
大规模语言模型(LLMs)在很多关键任务中展现出显著的能力,比如自然语言理解、语言生成和复杂推理,并对社会产生深远的影响。然而,这些卓越的能力伴随着对庞大训练资源的需求(如下图左)和较长推理时延(如下图右)。因此,研究者们需要开发出有效的技术手段去解决其...
-
还不知道?近20+自动驾驶数据集、榜单和Benchmark汇总
本文经自动驾驶之心公众号授权转载,转载请联系出处。 1.Nuscenes 数据集链接:nuScenes nuscenes数据集下有多个任务,涉及Detection(2D/3D)、Tracking、prediction、激光雷达分割、全景任务、规划控制等...
-
大模型应用探索——企业知识管家
一、传统知识管理的背景与挑战 1、企业知识管理的必要性 知识管理是每个企业都面临的一个非常重要的环节,借助知识管家可以全面提升企业的效率。 一方面,随着互联网应用的发展,知识爆炸,如何实现企业知识的共享称成为企业面临的一个问题。企业通过知识共享不仅...
-
论文笔记--Goat: Fine-tuned LLaMA Outperforms GPT-4 on Arithmetic Tasks
论文笔记--Goat: Fine-tuned LLaMA Outperforms GPT-4 on Arithmetic Tasks 1. 文章简介 2. 文章概括 3 文章重点技术 3.1 LLM的选择 3.2 算数任务的可学习性(lear...
-
模型量化和边缘人工智能如何定义交互方式
人工智能与边缘计算的融合承诺为许多行业带来变革。模型量化的快速创新在这方面发挥着关键作用,模型量化是一种通过提高可移植性和减小模型大小来加快计算速度的技术。 模型量化弥补了边缘设备的计算限制与部署高精度模型的需求之间的差距,以实现更快、更高效、更具成本效...
-
印度正测试通过 AI 改善天气预报精度,应对极端气候
12 月 24 日消息,据路透社当地时间周五报道,印度正在测试使用 AI 构建气候模型,从而改善天气预报精度。当地的一名高级气象官员表示,在印度这个幅员辽阔的国家,暴雨、洪水和干旱等极端气候出现频次越来越多,正不断蔓延。 据报道,印度气象局正使用超级计...
-
推理性能超H100十倍!21岁华裔小哥哈佛辍学开发AI加速芯片「Sohu」,2人公司估值3400万刀
像Pika一样的神级创业故事又要再次上演了? 两位哈佛退学的年轻人,想要制造一款专用于大语言模型加速的AI加速器芯片,将于2024年第三季度交付,推理性能达H100的10倍。 在今年6月份,两位创始人Gavin Uberti和Chris Zhu创立了E...
-
论文笔记--Llama 2: Open Foundation and Fine-Tuned Chat Models
论文笔记--Llama 2: Open Foundation and Fine-Tuned Chat Models 1. 文章简介 2. 文章概括 3 文章重点技术 3.1 预训练Pretraining 3.1.1 预训练细节 3.1.2...
-
夸张!EMNLP投稿近5000篇,奖项出炉:北大、腾讯摘最佳长论文
EMNLP 是自然语言处理领域的顶级会议之一,EMNLP 2023 于 12 月 6 日 - 10 日在新加坡举行。 因为今年 ChatGPT 的爆火带动大模型、NLP 概念,EMNLP 2023 的投稿论文数量也达到近 5000 篇,甚至略高于 AC...
-
AI生成新春祝福海报,AIGC从“炫技”走向日常
在ChatGPT的带动下,AIGC可以说是过去一年里最火的概念。 就在临近春节的日子里,一款名为“写作蛙”的微信小程序正在悄然流行。简单输入几句祝福语,就能自动生成图文并茂的祝福海报,包括一段应景的祝福语和一张节日氛围满满的照片,让AIGC和普通网民来了...
-
ARC图片增强官方体验入口 AI图片修复APP推荐
ARC图片增强是一款由腾讯AI产品提供的图像处理工具,包括人像修复、人像抠图、动漫增强等,可有效提升图片的品质和美观度,可用于修复老照片或者照片去背景等场景。那么ARC图片增强在哪里可以体验呢?这里就给大家带来ARC图片增强官方体验入口。 >>...
-
秘塔写作猫官方体验入口 AI写作软件哪个好用
秘塔写作猫是一款基于人工智能的写作辅助平台,可以帮助用户生成、校对、改写、翻译、配图等各种类型的文章。它拥有强大的语言生成能力,可以根据用户的输入和指令自动完成高质量的写作任务。它还提供了浏览器插件和Word插件,方便用户在不同的场景下使用它的功能。 &...
-
AI抠图使用指南:Stable Diffusion WebUI Rembg实用技巧
抠图是图像处理工具的一项必备能力,可以用在重绘、重组、更换背景等场景。最近我一直在探索 Stable Diffusion WebUI 的各项能力,那么 SD WebUI 的抠图能力表现如何呢?这篇文章就给大家分享一下。 安装插件 作为一个生成式AI,S...
-
用ChatGPT+Copilot一小时开发一套监控系统
套娃:我把下面的内容全部复制给了ChatGPT,让它帮我总结本文内容,它的回答如下: 本文介绍了人工智能ChatGPT在快速生成代码方面的应用,以及当前AI从专业客户走向大众、从特定领域走向通用领域、从后台走向前台和人的直接交互等趋势。文中展示了一...
-
人工智能整合对金融领域的影响
随着我们进入“人工智能时代”,人工智能(AI 在许多不同领域的广泛使用使金融业正在发生变化。金融机构越来越频繁地使用人工智能(AI 作为获得竞争优势的工具。 人工智能(AI 与算法交易的结合加速了模式识别、数据分析和决策的进步。具有人工智能增强功能的算...
-
FlashOcc:占用预测新思路,精度、效率和内存占用新SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugin 论文链接:https...
-
【Stable Diffusion】基本概念之hypernetwork
1.基本概念 hypernetwork,中文名为超网络,是一种神经网络架构,它允许动态生成神经网络的参数(权重 。简而言之,hypernetwork可以生成其他神经网络。 在Stable Diffusion中,hypernetwork被用于动态生成分类器的...
-
景联文科技:一文读懂火爆全网的AIGC和背后的数据标注技术!
“在过去的几个月中,AIGC发展速度惊人,DALL-E、Midjourney和Stable Diffusion等技术的快速发展,创作出了许多由AI生成的艺术品。本文中,我们将为您阐述AIGC技术和背后所涉及的数据标注技术。" 今年八月,美国的一位39...
-
如何使用GPTQ量化使LLM更轻
译者 | 李睿 审校 | 重楼 大型语言模型(LLM 应用的一大挑战是其耗费巨大的内存和计算需求,通常需要数十GB的GPU内存。这使得它们不仅昂贵而且难以运行。 为了缓解这些问题,研究人员开发了几种LLM压缩技术,其中包括“量化”。量化通过改变参数的存...
-
stable diffusion实践操作-宽高设置以及高清修复
系列文章目录 stable diffusion实践操作 文章目录 系列文章目录 前言 一、SD宽高怎么设置? 1.1 宽高历史 二、高清修复 1. 文生图中的高清修复 1.按钮Hires.fix 2.不同放大算法对比 1.第一...
-
材质界的ImageNet,大规模6维材质实拍数据库OpenSVBRDF发布
在计算图形学领域,材质外观刻画了真实物体与光线之间的复杂物理交互,通常可表达为随空间位置变化的双向反射分布函数(Spatially-Varying Bidirectional Reflectance Distribution Function,缩写为 S...
-
今日思考(2) — 训练机器学习模型用GPU还是NUP更有优势(基于文心一言的回答)
前言 深度学习用GPU,强化学习用NPU。 1.训练深度学习模型,强化学习模型用NPU还是GPU更有优势 在训练深度学习模型时,GPU相比NPU有优势。GPU拥有更高的访存速度和更高的浮点运算能力,因此更适合深度学...
-
赵明:荣耀AI服务最智能 MagicOS 7.2表现惊艳
荣耀日前正式发布了新一代数字系列旗舰荣耀100系列,在发布会后的专访中,赵明强调,荣耀的屏幕最护眼、AI服务最智能,折叠屏做得最轻薄、续航能力还最强,这些都没有任何一家能与荣耀相比。 荣耀100系列通过MagicOS7.2系统实现了AI内容创作、语义搜索功...
-
荣耀100系列搭载MagicOS 7.2:支持AI内容创作
快科技11月23日消息,荣耀100系列正式发布。 该机预装MagicOS 7.2,支持AI内容创作,实现了语义搜索功能,有着更强的AI实力。 与此同时,MagicOS 7.2还有智慧感知、流畅性能、YOYO建议、智慧办公、隐私保护、云服务在内的多项功能,为...
-
智慧城市的发展:废物管理和空气质量监测
通过废物管理和空气质量监测方面的智慧城市进步,探索城市生活的未来。 “智慧城市”的概念已经成为城市规划和发展的一种创新方法,体现了一系列旨在提高生活质量、服务效率和可持续性的战略。这些战略包括智能废物管理和空气质量监测系统,它们采用先进技术优化资源利用...
-
聊一聊高精地图的数据问题,无图感知还有哪些坑要踩?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在自动驾驶领域,高精地图在定位、规划和避碰等方面发挥着至关重要的作用,实现行车安全和高质量路线预测。然而高精地图的构建都是昂贵、复杂的,而且专业性很强,无论是在硬件组成还是软件及其所使用的算法方面。...
-
stable diffusion基础
整合包下载:秋叶大佬 【AI绘画·8月最新】Stable Diffusion整合包v4.2发布! 参照:基础04】目前全网最贴心的Lora基础知识教程! VAE 作用:滤镜+微调 VAE下载地址:C站(https://civitai.com/mode...
-
NeRF与自动驾驶的前世今生,近10篇论文汇总!
神经辐射场(Neural Radiance Fields)自2020年被提出以来,相关论文数量呈指数增长,不但成为了三维重建的重要分支方向,也逐渐作为自动驾驶重要工具活跃在研究前沿。 NeRF这两年异军突起,主要因为它跳过了传统CV重建pipeline的...
-
老黄深夜炸场,世界最强AI芯片H200震撼发布!性能飙升90%,Llama 2推理速度翻倍,大批超算中心来袭
英伟达的节奏,越来越可怕了。 就在刚刚,老黄又一次在深夜炸场——发布目前世界最强的AI芯片H200! 较前任霸主H100,H200的性能直接提升了60%到90%。 不仅如此,这两款芯片还是互相兼容的。这意味着,使用H100训练/推理模型的企业,可以无缝更...
-
刚刚,出行行业首个!百亿估值玩家联合国有运营商开卷大模型
首个落地的交通出行大模型,它来了! 这两年的出行行业,有的卷补贴、规模,有的卷自动驾驶、卷定制车,终于有人开始卷大模型了! 名为“阡陌”,背后是国家队级别的选手:T3出行和中国电信。 T3出行,出行领域快速崛起的明星玩家,曾创造77亿元融资业内纪录,估值早...
-
详解超强ResNet变体NFNet:抛弃归一化后,性能却达到了最强!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 从上古时期一直到今天,Batch Norm (BN 一直都是视觉骨干架构里面很重要的一个环节。BN 使得研究人员可以训练更深的网络,并在训练集和测试集上实现更高的精度。Batch Norm 还可以平...
-
Meta 推出的 LLaMA 大语言模型部署教程
Facebo推出的LLaMA模型 简介: LLaMA(Lager Language Model From Meta),这是一个从7B到65B参数的基础语言模型的集合。它在数万亿的文本tokens上训练的模型,并表明在不求助于专有和不可访问的数据集,而仅...
-
AI检测器又活了?成功率高达98%,吊打OpenAI
现在AI文本检测器,几乎没有办法有效地区分AI生成的文字和人类的文字。 就连OpenAI开发的检测工具,也因为检测准确率太低,在上线半年后悄悄下线了。 但是最近,Nature报导了堪萨斯大学的一个团队的研究成果,他们开发的学术AI检测系统,能有效分辨论...