预训练第41页 - AIGC资讯

Nuscenes最新SOTA | DynamicBEV超越PETRv2/BEVDepth！

1. 论文信息 2. 引言这篇论文介绍了一种新的3D object detection方法，这对于自动驾驶、机器人技术和监控等应用至关重要。传统的3D object detection方法使用鸟瞰视角（BEV）方法，将3D场景简化为2D表示。然而，常...

人工智能 2023-11-02 人工智能

1088阅读

腾讯云向量数据库全量开放公测提供高效接入大模型解决方案

腾讯云向量数据库全量开放公测，提供了高效接入大模型的解决方案。该数据库将数据向量化，提升存储和查询效率，并解决了大模型预训练成本高、幻觉、缺乏长期记忆和知识更新不及时等问题。目前已经服务腾讯内部40多个业务和数百家公有云外部客户，帮助企业快速落地应用。...

人工智能 2023-11-01 人工智能

954阅读

英伟达发布430亿参数大模型ChipNeMo

英伟达最新发布的430亿参数大语言模型ChipNeMo专注于辅助芯片设计，旨在提高工程师的工作效率。这一大语言模型的应用范围广泛，包括问答、EDA脚本生成和Bug总结等任务，使芯片设计变得更加便捷。英伟达首席科学家Bill Dally强调，即使提高生产率...

人工智能 2023-11-01 人工智能

884阅读

AI自动生成创意视频：如何让大模型助你一臂之力

作者 | 崔皓审校 | 重楼摘要本文探讨了如何利用大语言模型和AI视频生成模型来创建高度个性化和创意丰富的视频内容。文章详细介绍了从构思到实现的全过程，包括问题分析、目标设定、工具和模型选择，以及实际操作步骤。使用的技术和工具包括OpenAI的G...

人工智能 2023-11-01 人工智能

1633阅读

阿里云全面升级AI基础设施，中国大模型公司一半跑在阿里云上！

10月31日，在2023云栖大会上，阿里云CTO周靖人表示，面向智能时代，阿里云将通过从底层算力到AI平台再到模型服务的全栈技术创新，升级云计算体系，打造一朵AI时代最开放的云。在现场，周靖人公布了云计算基础能力的最新进展，升级了人工智能平台，并发布千亿...

人工智能 2023-10-31 人工智能

877阅读

独家 | GPT-4、Midjourney之外，谭平创业团队要造一个3D基础模型

前段时间，OpenAI 发布了文生图模型 DALL・E3，生成效果非常惊艳。比如，你可以让它一次画出几十个物体，然后再要求它把这些物体全部放到一个冲浪者的背上: 可以看到，DALL・E3不仅画出了足量的物体，就连冲浪者面对重压时的神情都刻画了出来。但细心...

AIGC 2023-10-31 人工智能

960阅读

AI圈巨震！微软论文曝光GPT-3.5参数量仅有200亿

最近，微软的一篇论文引发了广泛讨论，揭示了GPT-3.5的真实参数量可能只有20B，远远小于之前官方宣布的1750亿。这一曝料在AI圈内引起了巨大的震动，让人们开始重新评估这一庞大模型的性能和潜力。此论文还介绍了一个小型扩散模型CodeFusion，它只有...

人工智能 2023-10-31 人工智能

1083阅读

通义千问APP下载官网入口通义千问手机版下载地址

在 2023 年的云栖大会上，阿里云CTO周靖人宣布，阿里云将升级其云计算体系，以适应智能时代的需要，从底层的算力到AI平台再到模型服务，阿里云将提供全栈技术创新。周靖人还宣布了阿里云通义千问2. 0 的发布，这是一款千亿级参数规模的大模型，以及阿里云百炼...

人工智能 2023-10-31 人工智能

936阅读

GPT-4、Midjourney之外，谭平创业团队要造一个3D基础模型

前段时间，OpenAI 发布了文生图模型 DALL・E 3，生成效果非常惊艳。比如，你可以让它一次画出几十个物体，然后再要求它把这些物体全部放到一个冲浪者的背上：可以看到，DALL・E 3 不仅画出了足量的物体，就连冲浪者面对重压时的神情都刻画了...

AIGC 2023-10-31 人工智能

886阅读

图模型也要大？清华朱文武团队有这样一些观点

在大模型时代，图机器学习面临什么样的机遇和挑战？是否存在，并该如何发展图的大模型？针对这一问题，清华大学朱文武教授团队首次提出图大模型（Large Graph Model）概念，系统总结并梳理了图大模型相关的概念、挑战和应用；进一步围绕动态性和可解释性，...

AIGC 2023-10-31 人工智能

990阅读

使用 Go-OpenAI 轻松调用 ChatGPT：释放无限创造力！

我今天要和大家分享一个令人兴奋的话题——使用 go-openai 调用 chatGPT。如果你是一个技术爱好者，对人工智能和自然语言处理感兴趣，那么你一定不能错过这篇文章！ chatGPT：打破创造力的边界首先，让我们来了解一下 ChatGPT 是什么...

AIGC 2023-10-31 人工智能

893阅读

如何应对人工智能幻觉？

人工智能现在可以对看似怪异的人类问题做出回应。但有时，人工智能会给出答案。这些虚构的反应是真实的幻觉，还是别的什么? 要点：研究发现，93%的受访者认为，人工智能幻觉可能会以某种方式导致实际伤害。虽然ChatGPT可能是一种快捷工作方式，但更多人与...

人工智能 2023-10-30 人工智能

1202阅读

元乘象Chatimg3.0来了，赶超GPT-4V，还给出产业升级新打法

最近，AI 领域都在思考一件事:多模态大模型落地产业，好的打法应该是什么? 通用人工智能时代正在到来，AI 大模型技术已成为数字经济下基础设施建设的重要支撑，也成为产业智能化转型的核心「引擎」，AI 大模型 + 产业应用迎来了前所未有的发展机遇。在10月...

AIGC 2023-10-30 人工智能

959阅读

百度王海峰：文心大模型4.0推理性能提升50倍

在近日的第二十届中国计算机大会上，百度首席技术官王海峰表示，百度在3月16日发布知识增强大语言模型文心一言，目前文心一言的基础模型已迭代到文心大模型4.0版本。知识增强大语言模型从数万亿数据和数千亿知识中融合学习，得到预训练大模型，在此基础上采用有监督精调...

人工智能 2023-10-30 人工智能

825阅读

比Transformer更好，无Attention、MLPs的BERT、GPT反而更强了

从 BERT、GPT 和 Flan-T5 等语言模型到 SAM 和 Stable Diffusion 等图像模型，Transformer 正以锐不可当之势席卷这个世界，但人们也不禁会问：Transformer 是唯一选择吗？斯坦福大学和纽约州立大学布法...

AIGC 2023-10-30 人工智能

867阅读

首个人体动捕基模型面世！SMPLer-X：横扫七大榜单

人体全身姿态与体型估计（EHPS, Expressive Human Pose and Shape estimation）虽然目前已经取得了非常大研究进展，但当下最先进的方法仍然受限于有限的训练数据集。最近，来自南洋理工大学S-Lab、商汤科技、上海人...

AIGC 2023-10-29 人工智能

878阅读

最好7B模型再易主！打败700亿LLaMA2，苹果电脑就能跑

花500刀“调教”的70亿参数模型，打败700亿参数的Llama 2！且笔记本就能轻松跑，效果媲美ChatGPT。重点：免费、不要钱。 HuggingFace H4团队打造的开源模型Zephyr-7B，鲨疯了。其底层模型是前段时间爆火、由有着“欧...

AIGC 2023-10-29 人工智能

1170阅读

小模型如何比肩大模型，北理工发布明德大模型MindLLM，小模型潜力巨大

大型语言模型 (LLMs 在各种自然语言任务中展现出了卓越的性能，但是由于训练和推理大参数量模型需要大量的计算资源，导致高昂的成本，将大语言模型应用在专业领域中仍存在诸多现实问题。因此，北理团队先从轻量级别模型入手，最大程度发挥数据和模型的优势，立足更...

AIGC 2023-10-28 人工智能

1074阅读

生成的分子几乎 100% 有效，用于逆向分子设计的引导扩散模型

「从头分子设计」是材料科学的「圣杯」。生成深度学习的引入极大地推进了这一方向，但分子发现仍然具有挑战性，而且往往效率低下。以色列理工学院（Technion-Israel Institute of Technology）和意大利威尼斯大学（Univers...

人工智能 2023-10-28 人工智能

903阅读

港大等发布GraphGPT：1/50微调参数，准确率提升10倍！无需超长token，LLM也能读懂图结构

图神经网络（Graph Neural Networks）已经成为分析和学习图结构数据的强大框架，推动了社交网络分析、推荐系统和生物网络分析等多个领域的进步。图神经网络的主要优势在于它们能够捕获图数据中固有的结构信息和依赖关系。利用消息传递和聚合机制，图...

AIGC 2023-10-28 人工智能

977阅读

智谱AI推出第三代基座大模型上线新一代「智谱清言」

智谱AI宣布于2023中国计算机大会（CNCC）上，推出了全自研的第三代基座大模型 ChatGLM3及相关系列产品。据介绍，今年以来，这是智谱AI第三次对ChatGLM基座模型进行了深度优化，拥有了更强大的功能。智谱AI采用了独创的多阶段增强预训练方法，...

人工智能 2023-10-27 人工智能

1287阅读

实测腾讯AI文生图！王者荣耀画风一键直出，小程序就能玩

鹅厂大模型，又有新玩法! 发布不到两个月，腾讯混元大模型就速通了一个新版本，除了语言模型升级以外，还悄悄上线了AIGC最火热?的功能—— 文生图。和语言模型一样，文生图同样可以通过微信小程序直接体验。不过与Midjourney独立出图不同，混元的文生...

AIGC 2023-10-27 人工智能

1495阅读

DeepMind：谁说卷积网络不如ViT？

深度学习的早期成功可归功于卷积神经网络（ConvNets）的发展。近十年来，ConvNets 主导了计算机视觉基准测试。然而近年来，它们越来越多地被 ViTs（Vision Transformers）所取代。很多人认为，ConvNets 在小型或中等规...

人工智能 2023-10-27 人工智能

888阅读

AI基础软件：如何自主构建大+小模型？

一、公司介绍九章云极DataCanvas以创造智能探索平台为使命，怀揣着助力全球企业智能升级的愿景，是中国人工智能基础软件领域的佼佼者。公司专注于自主研发的人工智能基础软件产品系列和解决方案，为用户提供全面的人工智能基础服务，旨在帮助用户在数智化转...

人工智能 2023-10-27 人工智能

1190阅读

生成式人工智能如何重新定义图像搜索

译者 | 李睿审校 | 重楼近几个月来，生成式人工智能凭借其创造独特的文本、声音和图像的能力引起了人们的极大兴趣。但生成式人工智能的力量并不局限于创造新的数据。生成式人工智能的底层技术（例如Transformer和扩散模型）可以为许多其他应用提供...

人工智能 2023-10-26 人工智能

950阅读

Stability AI发布两款日语语言模型

Stability AI Japan最近发布了两款令人瞩目的日语语言模型，分别命名为“Japanese Stable LM3B-4E1T”和“Japanese Stable LM Gamma7B”。前者具有大约30亿参数，而后者则拥有高达70亿参数的庞大...

AIGC 2023-10-25 人工智能

841阅读

LLM一句话瞬间生成3D世界，未公布代码已获141星！或将引发3D建模行业革命

继火爆全网的AI文生图，文生视频之后，文生3D场景的技术也来了！只要不到30个字的提示词，瞬间就能生成这样的3D场景。场景效果和文字的要求几乎分毫不差——「平静如玻璃的湖面，倒映出无云的天空，周围的山和水鸟的倒影呈现在湖中。」「烈日照耀在无垠...

AIGC 2023-10-25 人工智能

898阅读

苹果“套娃”式扩散模型，训练步数减少七成！

苹果的一项最新研究，大幅提高了扩散模型在高分辨率图像上性能。利用这种方法，同样分辨率的图像，训练步数减少了超过七成。在1024×1024的分辨率下，图片画质直接拉满，细节都清晰可见。苹果把这项成果命名为MDM，DM就是扩散模型（Diffusion...

人工智能 2023-10-25 人工智能

846阅读

UniPAD：自动驾驶通用预训练范式来了！

本文经自动驾驶之心公众号授权转载，转载请联系出处。 UNIPAD：自动驾驶通用预训练范式原标题：UNIPAD: A UNIVERSAL PRE-TRAINING PARADIGM FOR AUTONOMOUS DRIVING 论文链接：https:/...

AIGC 2023-10-25 人工智能

908阅读

让大模型看图比打字管用！NeurIPS 2023新研究提出多模态查询方法，准确率提升7.8%

大模型“识图”能力都这么强了，为啥还老找错东西？例如，把长得不太像的蝙蝠和拍子搞混，又或是认不出一些数据集中的稀有鱼类…… 这是因为，我们让大模型“找东西”时，往往输入的是文本。如果描述有歧义或太偏门，像是“bat”（蝙蝠还是拍子？）或“魔鳉”（Cy...

AIGC 2023-10-25 人工智能

1051阅读

明年IT投资前景看好：增速比GDP高三倍！75%的CIO要为AI多花钱

如今全球复苏依旧缓慢，根据国际货币基金组织（IMF）最近发布的《世界经济展望报告》，预计全球经济增速将从2022年的3.5%放缓至2023年的3.0%和2024年的2.9%。然而，Gartner的IT支出数据却与此呈现出鲜明的对比：2024年全球IT支...

人工智能 2023-10-24 人工智能

1025阅读

AIGC时代的视频扩散模型，复旦等团队发布领域首篇综述

AI 生成内容已经成为当前人工智能领域的最热门话题之一，也代表着该领域的前沿技术。近年来，随着 Stable Diffusion、DALL-E3、ControlNet 等新技术的发布，AI 图像生成和编辑领域实现了令人惊艳的视觉效果，并且在学术界和工业界...

人工智能 2023-10-24 人工智能

1005阅读

AI视野：星火大模型V3.0发布；B站测试推出“AI视频总结”功能；高通发布骁龙8Gen3；苹果计划每年砸10亿美元搞AI

????大模型动态科大讯飞星火认知大模型V3.0正式发布在今日的2023科大讯飞全球1024开发者节上，科大讯飞宣布，讯飞星火认知大模型V3.0正式发布，目前星火大模型已整体超越ChatGPT。 ???AI应用 B站测试推出“AI视频总结”功能近日...

人工智能 2023-10-24 人工智能

1216阅读

GPT-4教会机器手转笔、玩魔方！RL社区震惊：LLM设计奖励竟能超越人类？

GPT-4，竟然教会机器人转笔了！图片英伟达、宾大、加州理工、德州奥斯汀等机构的专家提出一个开放式Agent——Eureka，它是一个开放式Agent，为超人类水平的机器人灵巧性设计了奖励功能。图片论文链接：https://arxiv.org/p...

AIGC 2023-10-24 人工智能

1032阅读

HiLM-D：自动驾驶多模态大语言模型玩出花了

本文经自动驾驶之心公众号授权转载，转载请联系出处。笔者个人的一些思考不得不说，最近大模型在学术界火起来了，基于图文匹配的CLIP预训练模型成为近年来在多模态研究领域的经典之作。除此之外，大语言模型的蓬勃发展也进一步为多模态带来了性能提升。自动驾驶领...

人工智能 2023-10-24 人工智能

1052阅读

一文读懂全新深度学习库Rust Burn

一、什么是Rust Burn？ Rust Burn是一个全新的深度学习框架，完全使用Rust编程语言编写。创建这个新框架而不是使用现有框架（如PyTorch或TensorFlow）的动机是为了构建一个适应多种用户需求的通用框架，包括研究人员、机器学习工程...

AIGC 2023-10-24 人工智能

1938阅读

4年百亿估值，国产大模型创业TOP 1，清华造

大模型公司智谱AI，一举宣布了年内融资额:25亿元人民币。如此数额，什么概念?刷新了国内大模型创业公司的累计融资额，估值超过百亿。这家成立4年的公司，已经成为国产大模型最具吸金力、最具价值认可的公司。在百模大战来到见真章的“生成式AI第二阶段”，领头...

AIGC 2023-10-23 人工智能

900阅读

百川VS智谱，谁是中国的OpenAI？

6月初，外媒曾发出了“谁是中国的OpenAI”的拷问，经历了大模型创业潮之后，大浪淘沙，最终留下的不过寥寥数人。清华大学几个十字路口外的赛尔大厦，是明星创业者王小川的百川智能，搜狐网络大厦是学院派出身的智谱AI。二者在经历了市场的检验后，成为了最有希望的...

AIGC 2023-10-23 人工智能

951阅读

在视觉提示中加入「标记」，微软等让GPT-4V看的更准、分的更细

最近一段时间，我们见证了大型语言模型（LLM）的显著进步。特别是，生成式预训练 Transformer 或 GPT 的发布引领了业界和学术界的多项突破。自 GPT-4发布以来，大型多模态模型 (LMM 引起了研究界越来越多的兴趣，许多工作致力于构建多模态...

AIGC 2023-10-23 人工智能

990阅读

智谱 AI“超 25 亿融资”的背后

这几天，“大模型”圈里最令人津津乐道的可能就是两家大模型创业公司分别宣布自己今年的融资额度——百川智能获得3亿美元的融资，估值跃升成为独角兽企业;智谱 AI 获得超过25亿人民币的融资，百亿人民币估值令人瞩目。百川与小米的联手得到了业界内的广泛关注，而雷...

人工智能 2023-10-23 人工智能

927阅读

有了GPT-4之后，机器人把转笔、盘核桃都学会了

在学习方面，GPT-4 是一个厉害的学生。在消化了大量人类数据后，它掌握了各门知识，甚至在聊天中能给数学家陶哲轩带来启发。与此同时，它也成为了一名优秀的老师，而且不光是教书本知识，还能教机器人转笔。这个机器人名叫 Eureka，是来自英伟达、宾夕法...

人工智能 2023-10-23 人工智能

971阅读

LLaMA2上下文长度暴涨至100万tokens，只需调整1个超参数

只需微调一下，大模型支持上下文大小就能从1.6万tokens延长至100万？！还是在只有70亿参数的LLaMA 2上。要知道，即使是当前最火的Claude 2和GPT-4，支持上下文长度也不过10万和3.2万，超出这个范围大模型就会开始胡言乱语、记不...

AIGC 2023-10-23 人工智能

1064阅读

参数少近一半，性能逼近谷歌Minerva，又一个数学大模型开源了

如今，在各种文本混合数据上训练出来的语言模型会显示出非常通用的语言理解和生成能力，可以作为基础模型适应各种应用。开放式对话或指令跟踪等应用要求在整个自然文本分布中实现均衡的性能，因此更倾向于通用模型。不过如果想要在某一领域（如医学、金融或科学）内最大限...

AIGC 2023-10-23 人工智能

942阅读

“大模型+”应用落地时，大模型微调如何兼顾效果、成本和可控性？

10月17日，老牌科技巨头百度“文心大模型4.0”的发布，让原本暗潮汹涌的百模大战再次白热化。伴随着越来越多基础大模型迭代速度的日益加快，“大模型+”的应用拐点正在到来。纵观全球市场，预计到2030年，AIGC市场规模将超过万亿人民币，巨大的市场潜力，吸...

人工智能 2023-10-23 人工智能

1092阅读