-
深度估计SOTA!自动驾驶单目与环视深度的自适应融合
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&个人理解 多视图深度估计在各种基准测试中都取得了较高性能。然而,目前几乎所有的多视图系统都依赖于给定的理想相机姿态,而这在许多现实世界的场景中是不可用的,例如自动驾驶。本工作提出了一...
-
MIT研究员推新AI图片生成框架DMD:AI 单步生成高质量图像 速度快30倍
在当今人工智能时代,计算机可以通过扩散模型生成自己的 “艺术”,逐步向嘈杂的初始状态添加结构,直到清晰的图像或视频出现。 扩散模型突然变得异常受欢迎:输入几个词,即可体验现实与幻想交汇的梦幻景象。在幕后,这涉及一个复杂、耗时的过程,需要算法多次迭代才能完美...
-
符尧大佬一作发文,仅改训练数据,就让LLaMa-2上下文长度扩展20倍!
引言:探索语言模型的长上下文能力 近日,谷歌推出了Gemini Pro 1.5,将上下文窗口长度扩展到100万个tokens,目前领先世界。而其他语言模型也正在不断探索长上下文能力,也就是模型处理和理解超出其训练时所见上下文长度的能力。例如,一个模型可能...
-
AtomoVideo:AIGC赋能下的电商视频动效生成
✍? 本文作者:凌潼、依竹、桅桔、逾溪 1. 概述 当今电商领域,内容营销的形式正日趋多样化,视频内容以其生动鲜明的视觉体验和迅捷高效的信息传播能力,为商家创造了新的机遇。消费者对视频内容的偏好驱动了视频创意供给的持续增长,视觉内容...
-
CMU朱俊彦、Adobe新作:512x512图像推理,A100只用0.11秒
简笔素描一键变身多风格画作,还能添加额外的描述,这在 CMU、Adobe 联合推出的一项研究中实现了。 作者之一为 CMU 助理教授朱俊彦,其团队在 ICCV 2021 会议上发表过一项类似的研究:仅仅使用一个或数个手绘草图,即可以自定义一个现成的 GA...
-
实施稳健的AI治理以实现数据民主化
根据Gartner的数据,到2026年,超过80%的企业将使用GenAI API和模型,或在生产中部署启用GenAI的应用程序,而去年这一比例不到5%。GenAI的自然语言界面允许非技术用户,从部门负责人到一线工作人员,更轻松地访问和使用数据。这...
-
人工智能与数据分类和治理的重要作用
在人工智能(AI 重塑各行各业格局的时代,公共部门的实施因其提高效率、决策能力和服务交付的潜力而脱颖而出。然而,任何有效的人工智能系统的基础在于其准确处理和分析数据的能力。这就是数据分类变得至关重要的地方。数据分类不仅仅是一个技术程序;它是一项战略要务...
-
ai论文写作靠谱吗?博士论文ai智能写作
一篇优秀的学位论文不仅需要有创新性的论证角度和恰当的研究方法,更需要构建一个逻辑清晰、均衡的论证体系,并结合有力的数据分析来支撑观点。通过这样的方式,我们可以确保论文具备严密的论证过程。 今天,小编将通过Excel表格数据集为大家演示。 "ChatGP...
-
使用 QLoRA 进行微调Llama 2 和 Mistral的初学者指南
本指南适用于任何想要为自己的项目定制强大的语言模型(如 Llama 2 和 Mistral)的人。使用 QLoRA,我们将逐步完成...
-
一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE
近年来,LLM 已经一统所有文本任务,展现了基础模型的强大潜力。一些视觉基础模型如 CLIP 在多模态理解任务上同样展现出了强大的泛化能力,其统一的视觉语言空间带动了一系列多模态理解、生成、开放词表等任务的发展。然而针对更细粒度的目标级别的感知任务,目前...
-
GenAI:重新定义数据驱动的转型
规范的数据工程方法是有效的GenAI策略的基础,这是实现数据驱动转型的必要条件。 每年,世界经济论坛都是各领域思想领袖的聚集地,他们在这里探讨当今世界及其未来的最受关注问题。今年,人工智能成为每个论坛的焦点,并吸引了全球所有决策者的注意力。 过去的一年...
-
英伟达推出NeMo,极大简化自定义生成式AI开发
为了帮助全球开发者、企业更好的开发定制大模型和生成式AI产品,例如,聊天机器人、编程代码助手等。 NVIDIA宣布推出了NeMo Curator、NeMo Customizer和NeMo Evaluator等微服务的早期访问计划。这些微服务涵盖了从数据整理...
-
【AIGC】2023年生成式AI发展综述
文章目录 一、文本生成 & 智能问答 二、AI绘画 三、音频生成 四、视频生成 五、三维生成 & 数字人 5.1 通用三维生成 5.2 数字人 展望:通用人工智能趋势 2023年是人工智能内容生成(AIGC)...
-
无需提示词,Stability AI 演示 MindEye:目标想什么就能生成什么
3 月 21 日消息,AI 浪潮席卷而来,此前不少人认为“提示词工程师”会成为新兴工种,而 MindEye 的问世表明,这个岗位或许没有存在的价值了。 此前不少人认为,未来 AI 时代并不在于某个模型是否强大,而是在于人类是否能够更高效利用这些 AI...
-
chatGPT的耳朵!OpenAI的开源语音识别AI:Whisper !
语音识别是通用人工智能的重要一环!可以说是AI的耳朵! 它可以让机器理解人类的语音,并将其转换为文本或其他形式的输出。 语音识别的应用场景非常广泛,比如智能助理、语音搜索、语音翻译、语音输入等等。 然而,语音识别也面临着很多挑战,比如不同的语言、口音...
-
为什么AI小模型才是最好的答案
作者 | 涂承烨 审校 | 重楼 一、AI大模型介绍与局限 AI大模型,特别是基于深度学习的模型,在许多领域都有着广泛的应用前景。这些领域包括但不限于医疗、金融、工业、教育、智慧城市等。随着技术的不断进步和应用的深入,AI大模型将在更多领域发挥重要作...
-
端到端大一统前夕?GenAD:LLM和轨迹规划全搞定
今天汽车人和大家分享一篇自动驾驶领域中第一个大规模视频预测模型。为了消除高成本数据收集的限制,并增强模型的泛化能力,从网络获取了大量数据,并将其与多样化和高质量的文本描述配对。由此产生的数据集累积了超过2000小时的驾驶视频,涵盖了世界各地具有多样化天气...
-
谷歌发布“Vlogger”模型:单张图片生成10秒视频
谷歌发布了一个新的视频框架: 只需要一张你的头像、一段讲话录音,就能得到一个本人栩栩如生的演讲视频。 视频时长可变,目前看到的示例最高为10s。 可以看到,无论是口型还是面部表情,它都非常自然。 如果输入图像囊括整个上半身,它也能配合丰富的手势: 网友...
-
Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放
Stability AI 的大模型家族来了一位新成员。 昨日,Stability AI 继推出文生图 Stable Diffusion、文生视频 Stable Video Diffusion 之后,又为社区带来了 3D 视频生成大模型「Stable Vi...
-
人工智能改变全球医疗保健
人工智能(AI 正在重新定义全球医疗保健格局。从电子病历、图片存档和通信系统、医院管理信息系统、索赔记录和患者调查中收集的不断扩大的医疗数据,正在帮助快速制定有效的人工智能模型。 来自电子健康记录、物联网设备和医学文献的文本数据,为人工智能辅助诊断、决...
-
如何从头开始编写LoRA代码,这有一份教程
LoRA(Low-Rank Adaptation)作为一种用于微调 LLM(大语言模型)的流行技术,最初由来自微软的研究人员在论文《 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 》中提出。不同于其...
-
一文读懂大型语言模型微调技术挑战与优化策略
Hello folks,我是 Luga,今天我们继续来聊一下人工智能(AI 生态领域相关的技术 - LLM Fine-Tuning ,本文将继续聚焦在针对 LLM Fine-Tuning 技术进行剖析,使得大家能够了解 LLM Fine-Tuning...
-
华为天才少年谢凌曦:关于视觉识别领域发展的个人观点!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 最近,我参加了几个高强度的学术活动,包括CCF计算机视觉专委会的闭门研讨会和VALSE线下大会。经过与其他学者的交流,我产生了许多想法,千头万绪,便希望把它们整理下来,供自己和同行们参考。当然,受限于...
-
降低AIGC总体疑似率的七大策略
随着人工智能技术的飞速发展,AIGC(人工智能生成内容)的应用越来越广泛。然而,随之而来的问题是AIGC的疑似率居高不下,这给人们带来了不少困惑和疑虑。为了解决这个问题,本文将探讨降低AIGC总体疑似率的七大策略。 提高数据质量 数据是训练人工智能模...
-
ai写作论文会被抄袭吗为什么
大家好,小发猫降重今天来聊聊ai写作论文会被抄袭吗为什么,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 标题:AI写作论文会被抄袭吗?背后原因深度解析 近年来,随着人工智能技术的飞速发展,A...
-
学好线性代数,玩转推荐系统
作者 | 汪昊 审校 | 重楼 说到21 世纪互联网的技术,除了 Python / Rust / Go 等一系列新型编程语言的诞生,信息检索技术的蓬勃发展也是一大亮点。互联网上第一个纯技术商业模式就是以谷歌和百度为代表的搜索引擎技术。然而让大家臆想不到的...
-
连续学习不怕丢西瓜捡芝麻,神经形态方法保护旧知识
以脉冲神经网络(SNN)为代表的脑启发神经形态计算(neuromorphic computing)由于计算上的节能性质在最近几年受到了越来越多的关注 [1]。受启发于人脑中的生物神经元,神经形态计算通过模拟并行的存内计算、基于脉冲信号的事件驱动计算等生物...
-
全球首个AI程序员当老板!IOI金牌得主全部工作AI掌盘,技术细节报告公开
AI程序员Devin竟可以做老板的工作了?! 最近,Cognition AI的首席执行官Steven Hao给了Devin访问自己帐户的权限,然后Devin便开始为他工作了... 比如,「他」向初创公司Modal支持团队写了一封邮件,是询问关于其产品S...
-
为自动驾驶而生,Lightning NeRF:速度提升10倍
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 最近的研究强调了NeRF在自动驾驶环境中的应用前景。然而室外环境的复杂性,加上驾驶场景中的视点受限,使精确重建场景几何体的任务变得复杂。这些挑战往往会导致重建质量下降...
-
谷歌AI推出新型评分器Cappy 助力多任务语言模型性能提升
在最新的研究论文中,谷歌研究人员引入了一种名为Cappy的预训练评分器模型,旨在增强和超越大型多任务语言模型的性能。这项研究旨在解决大型语言模型(LLM)所面临的挑战,其中包括高昂的计算资源成本和效率低下的训练和推理过程。 目前,多任务法学硕士如T0、F...
-
小红书多模态团队建立新「扩散模型」:解码脑电波,高清还原人眼所见
近些年,研究人员们对探索大脑如何解读视觉信息,并试图还原出原始图像一直孜孜不倦。去年一篇被 CVPR 录用的论文,通过扩散模型重建视觉影像,给出了非常炸裂的效果—— AI 不光通过脑电波知道你看到了什么,并且帮你画了出来。 第一行:人眼所见画面,第二...
-
[Datawhale]使用趋动云的stable-diffusion项目实践
目录 0 写在前面 1 内容简介 2 任务二,用免费GPU部署自己的stable-diffusion 2.1 创建项目 2.2 初始化开发环境实例 2.3 部署模型 1 解压代码及模型 2 解压配置文件到隐藏目录/root/.cache...
-
全球首个基于大语言模型的自动驾驶语言控制模型
Arxiv论文链接:https://arxiv.org/abs/2312.03543项目主页:https://github.com/Petrichor625/Talk2car_CAVG 近年来,工业界和学术界都争先恐后地研发全自动驾驶汽车(AVs)。尽...
-
优于所有方法!HIMap:端到端矢量化HD地图构建
本文经自动驾驶之心公众号授权转载,转载请联系出处。 矢量化高清(HD)地图构建需要预测地图元素的类别和点坐标(例如道路边界、车道分隔带、人行横道等)。现有技术的方法主要基于点级表示学习,用于回归精确的点坐标。然而,这种pipeline在获得elemen...
-
NVIDIA大语言模型落地的全流程解析
包括三部分内容: 第一部分是关于 NeMo Framework。NeMo Framework 是 NVIDIA 大语言模型的全栈解决方案,它通过不同组件完成生成式 AI 各个环节的任务,包括数据预处理、分布式训练、模型微调、模型推理加速及部署(Ten...
-
智能邮件防护:ML.NET 3.0助力垃圾邮件过滤,让你告别烦扰
概述:ML.NET3.0等机器学习工具,我们可以利用这一数据集训练模型,实现自动分类邮件为垃圾或正常,提高电子邮件过滤效果。 ML.NET是Microsoft推出的开源机器学习框架,可用于在.NET应用程序中集成机器学习功能。ML.NET提供了基础用法...
-
无需训练,Fast-DetectGPT让文本检测速度提升340倍
大语言模型如 ChatGPT 和 GPT-4 在各个领域对人们的生产和生活带来便利,但其误用也引发了关于虚假新闻、恶意产品评论和剽窃等问题的担忧。本文提出了一种新的文本检测方法 ——Fast-DetectGPT,无需训练,直接使用开源小语言模型检测各种大...
-
大模型增速远超摩尔定律!MIT最新研究:人类快要喂不饱AI了
我们人类可能要养不起AI了! 近日,来自MIT FutureTech的研究人员发表了一项关于大模型能力增长速度的研究, 结果表明:LLM的能力大约每8个月就会翻一倍,速度远超摩尔定律! 论文地址:https://arxiv.org/pdf/2403.0...
-
巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数
传统的时空预测模型通常需要大量数据支持才能取得良好效果。 然而,由于城市发展水平不均衡和数据收集政策的差异,许多城市和地区的时空数据(如交通和人群流动数据)受到了限制。在这种情况下,模型在数据稀缺情况下的可迁移性变得尤为重要。 现有研究主要利用数据丰富的...
-
AI大模型控制红绿灯,港科大(广州)智慧交通新成果已开源
大模型“上路”,干起了交通信号控制(TSC)的活~ 模型名为LightGPT,以排队及不同区段快要接近信号灯的车辆对路口交通状况分析,进而确定最好的信号灯配置。 该模型由香港科技大学(广州)的研究团队提出,其背后关键是一个名为LLMLight的框架。...
-
硬刚“CloseAI”,马斯克如期开源Grok,最大开源大语言模型一夜易主!
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 开源了! 3月11日,马斯克曾发表了一篇“字少事大”的推文,并且设为了置顶。就一句话:xAI要在本周开源自家聊天机器人 Grok了。 消息一出,关注着Musk VS. Ope...
-
全球首个类Sora开源复现方案来了!全面公开所有训练细节和模型权重
全球首个开源的类Sora架构视频生成模型,来了! 整个训练流程,包括数据处理、所有训练细节和模型权重,全部开放。 这就是刚刚发布的Open-Sora 1.0。 它带来的实际效果如下,能生成繁华都市夜景中的车水马龙。 还能用航拍视角,展现悬崖海岸边,海水...
-
人工智能在设施管理中的八好处
在不断发展的设施管理领域,决策者不断寻求优化运营、提高效率和降低成本的方法。 人工智能 (AI 已成为该行业的游戏规则改变者,彻底改变了设施经理的决策和运营流程方式。 以下是人工智能影响设施管理行业的八种方式。 数据驱动的见解:人工智能在设施管理中...
-
纯AI研发新药登Nature,效率提升3倍,临床实验疗效拔群
完全由AI研发的药物马上将要上市了?! 由AI制药公司Insilico Medicine开发的治疗肺部纤维化的药物TNIK已经进入二期临床试验。 研究团队的在Nature子刊上发表了最新的研究成果。 论文地址:https://www.nature.c...
-
马斯克开源Grok-1:3140亿参数迄今最大,权重架构全开放,磁力下载
说到做到,马斯克承诺的开源版大模型 Grok 终于来了! 今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型「Grok-1」,以及该模型的权重和网络架构。 这也使得Grok-1成为当前参数量最大的开源大语言...
-
时间序列预测+NLP大模型新作:为时序预测自动生成隐式Prompt
今天给大家介绍一篇最新的大模型+时间序列预测工作,由康涅狄格大学发表,提出了一种将时间序列在隐空间和NLP大模型对齐,并利用隐空间prompt提升时间序列预测效果的方法。 论文标题:S2IP-LLM: Semantic Space Informed P...
-
stable diffusion 1.5大模型炼制详细教程,几块钱即可炼制大模型
前言 之前已经讲过SDXL_LORA,SD1.5_LORA训练过程,基本说的比较清楚了,有兴趣可以去看看,下面我将讲解一下SD1.5大模型的炼制。 SDXL_LORA:https://tian-feng.blog.csdn.net/article/d...
-
掌握这七点,轻松降低AIGC总体疑似度
大家好,小发猫降ai今天来聊聊掌握这七点,轻松降低AIGC总体疑似度,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 掌握这七点,轻松降低AIGC总体疑似度 在自媒...
-
tscms采集插件:功能、应用与未来发展
在数字化时代,数据采集已经成为许多行业不可或缺的一部分。无论是电商、金融、医疗还是教育,高效、准确地采集数据都是确保业务顺利运行的关键。在这一背景下,“tscms采集插件”应运而生,以其强大的功能和灵活的定制性,在众多数据采集工具中脱颖而出。本文将详细介绍...
-
AI写作的深度探索:困惑度、爆发度与内容质量的角力
大家好,小发猫降重今天来聊聊AI写作的深度探索:困惑度、爆发度与内容质量的角力,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: AI写作的深度探索:困惑度、爆发度与内容质量的角力 在当今的数字...