github 第71页 - AIGC资讯

字节“开盒”OpenAI所有大模型，揭秘GPT-3到GPT-4进化路径！把李沐都炸出来了

GPT-3究竟是如何进化到GPT-4的？字节给OpenAI所有大模型来了个“开盒”操作。结果还真摸清了GPT-4进化路上一些关键技术的具体作用和影响。比如： SFT是早期GPT进化的推动者帮助GPT提升编码能力的最大功臣是SFT和RLHF 在...

AIGC 2023-11-05 人工智能

843阅读

GPT-4V学会用键鼠上网，人类眼睁睁看着它发帖玩游戏

GPT-4V学会自动操纵电脑，这一天终于还是到来了。只需要给GPT-4V接入鼠标和键盘，它就能根据浏览器界面上网：图片甚至还能快速摸清楚“播放音乐”的播放器网站和按钮，给自己来一段music：图片是不是有点细思极恐了？这是一个MIT本科生小哥...

人工智能 2023-11-04 人工智能

924阅读

蚂蚁集团发布DevOps领域大模型评测基准DevOps-Eval

蚂蚁集团联合北京大学发布了面向 DevOps 领域的大语言模型评测基准 ——DevOps-Eval。该评测基准包含了计划、编码、构建、测试、发布、部署、运维和监控等8个类别的选择题，共计4850道题目。此外，还针对 AIOps 任务做了细分，并添加了日...

人工智能 2023-11-02 人工智能

886阅读

AI视野：Stability AI推出Stable3D；阿里云发布通义灵码；OpenAI称ChatGPT意识已觉醒；全球AI网络安全协议签署

???AI应用 Stability AI推出Stable3D以及一键替换图片天空功能 Stability AI宣布推出Stable3D，一款支持文本生成高质量3D模型的新工具。用户可以使用文本、图片或插图来轻松生成3D模型，并在多个3D开发平台上进行编辑。...

AIGC 2023-11-02 人工智能

984阅读

目前CIO们仍在谨慎地探索GenAI在企业中的应用价值

多数CIO已经开始探索GenAI，以确保企业跟上技术发展的趋势，但许多人发现，市场上的技术还没有达到理想的水平。米其林全球CIO Yves Caseau表示：“在对GitHub Copilot和ChatGPT进行了六个多月的试验后，GenAI的发展速度令...

AIGC 2023-11-02 人工智能

874阅读

AI视野：英伟达发布大模型ChipNeMo；百度推出文心一言会员；OpenAI潜入黑客群聊；微软AI助手Copilot上线

????大模型动态英伟达发布430亿参数大模型ChipNeMo 英伟达发布了拥有430亿参数的大语言模型ChipNeMo，专注于辅助芯片设计，提高工程师的工作效率，支持问答、EDA脚本生成和Bug总结等任务。 vivo发布AI蓝心大模型并宣布开源7B...

AIGC 2023-11-01 人工智能

1050阅读

GPT-4V连小学生都不如？最新基准测试错误率竟高达90%：红绿灯认错、勾股定理也不会

GPT-4被吹的神乎其神，作为具备视觉能力的GPT-4版本——GPT-4V，也被大众寄于了厚望。但如果告诉你，初中生都知道的勾股定理，只适用于直角三角形。然而GPT-4V却自信将其用于钝角三角形中计算斜边长度。还有更离谱的，GPT-4V直接犯了致命的...

人工智能 2023-10-31 人工智能

959阅读

AI编程，详细比较GitHub Copilot对比Amazon CodeWhisperer

1、简介 GitHub Copilot和Amazon CodeWhisperer是采用人工智能技术驱动的编码助手，它们将自动完成编码功能提升到一个全新的水平。在最佳状态下，它们可以根据开发者提供的简短描述性文本编写功能完整、可运行的代码块。这可以让开发者...

AIGC 2023-10-31 人工智能

1592阅读

八张3090，1天压缩万亿参数大模型！3.2TB骤降至160GB，压缩率高达20倍

随着GPT-4的架构被知名业内大佬「开源」，混合专家架构（MoE）再次成为了研究的重点。 GPT-4拥有16个专家模型，总共包含1.8万亿个参数。每生成一个token需要使用大约2800亿参数和560TFLOPs 然而，模型更快、更准确的代价，则是巨大...

人工智能 2023-10-31 人工智能

991阅读

Meta AI研究负责人倡导开源许可制度变革

Meta公司最近发布的大型语言模型Llama2备受争议，因其并未完全满足开源倡议的要求。尽管Llama2相对较为开放和免费，但在开源软件领域，一些人仍对该公司的开放性持有异议。具体来说，Meta公司的许可协议使Llama2对许多人免费，但它仍然是有限的，...

人工智能 2023-10-31 人工智能

929阅读

从单机到多机的无人机与机器人集群的SLAM综述

本文经自动驾驶之心公众号授权转载，转载请联系出处。前言在本系列，我将会更新我的博士毕业论文“Decentralized and Distributed Collaborative Simultaneous Localization and Mapp...

人工智能 2023-10-31 人工智能

1298阅读

使用 Go-OpenAI 轻松调用 ChatGPT：释放无限创造力！

我今天要和大家分享一个令人兴奋的话题——使用 go-openai 调用 chatGPT。如果你是一个技术爱好者，对人工智能和自然语言处理感兴趣，那么你一定不能错过这篇文章！ chatGPT：打破创造力的边界首先，让我们来了解一下 ChatGPT 是什么...

AIGC 2023-10-31 人工智能

893阅读

像搭乐高一样做数学定理证明题，GPT-3.5证明成功率达新SOTA

背景作为长链条严格推理的典范，数学推理被认为是衡量语言模型推理能力的重要基准，GSM8K 和 MATH 等数学文字问题（math word problem）数据集被广泛应用于语言模型的测评和比较中。事实上，数学作为一项科学研究并不仅仅包括计算具体实例，...

人工智能 2023-10-30 人工智能

919阅读

2023斯坦福大学AI指数报告:印度在AI技能渗透率方面全球领先

2023斯坦福大学的AI指数报告揭示了印度在全球人工智能（AI）领域的重要角色。该报告显示，印度在AI技能渗透率方面名列全球前茅，具有最高的AI技能渗透率。图源备注：图片由AI生成，图片授权服务商Midjourney 此外，2022年，印度软件开发人员...

AIGC 2023-10-30 人工智能

947阅读

AI视野：百川发布Baichuan2-192K大模型；DALL·E3新增种子功能；ChatGPT Plus会员可上传和分析文件；谷歌Bard支持实时生成回复

????大模型动态百川智能发布Baichuan2-192K大模型，可处理35万汉字百川智能发布了Baichuan2-192K大模型，拥有全球最长的上下文窗口，处理约35万个汉字，超越了Claude2。百川大模型官网:https://top.aibas...

AIGC 2023-10-30 人工智能

958阅读

多模态大模型幻觉降低30%！中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

视觉幻觉是常见于多模态大语言模型（Multimodal Large Language Models, MLLMs）的一个典型问题。简单来说就是：模型输出的描述与图片内容不相符。下图中体现了两种幻觉，红色部分错误地描述了狗的颜色（属性幻觉），蓝色部分描...

AIGC 2023-10-30 人工智能

1125阅读

GPT Pilot：AI驱动的开发工具，可从零开始编写可扩展的应用程序

GPT Pilot是一种AI驱动的创新工具，旨在开发可扩展的应用程序，它能从头开始编写这些应用程序。开发人员只需提供所需应用程序的描述，GPT Pilot就会根据这些描述逐步生成应用程序代码。当遇到复杂难题时，GPT Pilot会向开发人员询问以获得更多...

人工智能 2023-10-30 人工智能

865阅读

北大团队：诱导大模型“幻觉”只需一串乱码！大小羊驼全中招

北大团队最新研究发现：随机token都能诱发大模型出现幻觉！比如喂给大模型（Vicuna-7B）一段“乱码”，它就莫名其妙弄错了历史常识。或者是简单修改提示词，大模型也会掉入陷阱。 Baichuan2-7B、InternLM-7B、ChatGL...

AIGC 2023-10-30 人工智能

994阅读

比Transformer更好，无Attention、MLPs的BERT、GPT反而更强了

从 BERT、GPT 和 Flan-T5 等语言模型到 SAM 和 Stable Diffusion 等图像模型，Transformer 正以锐不可当之势席卷这个世界，但人们也不禁会问：Transformer 是唯一选择吗？斯坦福大学和纽约州立大学布法...

AIGC 2023-10-30 人工智能

867阅读

更高清写实的人体生成模型HyperHuman来了，基于隐式结构扩散，刷新多项SOTA

论文地址: https://arxiv.org/pdf/2310.08579.pdf Github 地址: https://github.com/snap-research/HyperHuman 1. 研究背景与动机随着扩散模型的兴起，一些典型...

AIGC 2023-10-30 人工智能

966阅读

首个人体动捕基模型面世！SMPLer-X：横扫七大榜单

人体全身姿态与体型估计（EHPS, Expressive Human Pose and Shape estimation）虽然目前已经取得了非常大研究进展，但当下最先进的方法仍然受限于有限的训练数据集。最近，来自南洋理工大学S-Lab、商汤科技、上海人...

AIGC 2023-10-29 人工智能

878阅读

GPT4教机器人盘转笔，那叫一个丝滑！

那个在聊天中给数学家陶哲轩带来启发的GPT-4，最近又开始教机器人转笔了。项目叫Agent Eureka，是由英伟达、宾州大学、加州理工学院和得克萨斯大学奥斯汀分校联手研发的。他们的研究结合了 GPT-4 结构的能力和强化学习的优势，让 Eureka...

人工智能 2023-10-29 人工智能

875阅读

多模态LLM幻觉问题降低30%！业内首个“啄木鸟”免重训方法诞生

还在用指令微调解决多模态大模型的“幻觉”问题吗？比如下图中模型将橙色柯基错认为“红狗”，还指出周围还有几条。图片现在，中科大的一项研究想到了一个全新办法：一个免重训、即插即用的通用架构，直接从模型给出的错误文本下手，“倒推”出可能出现“幻觉”之处...

人工智能 2023-10-29 人工智能

984阅读

港大等发布GraphGPT：1/50微调参数，准确率提升10倍！无需超长token，LLM也能读懂图结构

图神经网络（Graph Neural Networks）已经成为分析和学习图结构数据的强大框架，推动了社交网络分析、推荐系统和生物网络分析等多个领域的进步。图神经网络的主要优势在于它们能够捕获图数据中固有的结构信息和依赖关系。利用消息传递和聚合机制，图...

AIGC 2023-10-28 人工智能

977阅读

陶哲轩论文漏洞竟被AI发现，，看定理名猜出研究方向，大神直呼AI能力惊人

最近，热衷于用GPT-4、Copilot做研究的数学大神陶哲轩，又在AI的帮助下发现了自己论文中的一处隐藏bug！陶哲轩表示，自己在用Lean4形式化第6页论点的过程中发现，表达式在n=3,k=2时，实际上是发散的。这个不太容易看出的bug能被及时...

AIGC 2023-10-28 人工智能

919阅读

AI视野：百度开放文心4.0开发权限申请；腾讯混元大模型开放文生图功能；谷歌AI应用禁止生成受限内容；Midjourney新网站上线测试版

????大模型动态百度开放文心4.0开发权限申请在2023年百度世界大会上，百度发布了文心大模型4.0，提升了理解、生成、逻辑、记忆等四个方面，现在开发者可以申请使用 ERNIE Bot SDK 开发与接入该模型的应用。申请地址:https://a...

AIGC 2023-10-26 人工智能

1060阅读

五个优秀开源RPA框架

这两年，RPA+AI（智能自动化流程）经常被提及，在企业/机构数字化转型过程中，自动化和智能化是提升效能的重要方式，而迈向自动化和智能化的第一步则是机器人流程自动化（RPA）。什么是RPA？什么是RPA+AI？如果把RPA比作人的躯干神经，那么AI...

AIGC 2023-10-26 人工智能

1937阅读

数字人+AI换脸简单实现虚拟制片

概述本文将从零开始介绍如何创造并驱动数字人，最后通过AI换脸实现虚拟制片。效果如下：数字人驱动换脸憨豆先生数字人简介数字人（Digital Human / Meta Human），是运用数字技术创造出来的、与人类形象接近的数字化人物形象。数字人...

AIGC 2023-10-26 人工智能

960阅读

微软AI战略在使得云收入方面显著增长

微软AI战略在云收入增长方面取得了显著成就。最新的财季报告显示，微软的AI战略提前实现了预期的收入增长，为公司带来了稳健的云业务收入。财报显示，微软的第一财季收入同比增长了13%，达到565亿美元，较去年的501亿美元有所增长。净收入同比增长了27%，从...

人工智能 2023-10-26 人工智能

943阅读

用于自动驾驶赛车的多模态传感器融合和目标跟踪

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：Multi-Modal Sensor Fusion and Object Tracking for Autonomous Racing 论文链接：https://arxiv.org/pdf/23...

AIGC 2023-10-26 人工智能

1117阅读

AI视野：高通发布骁龙X Elite芯片；AutoGPT获1200万美元融资；AI社交产品Airchat火了；百度Comate智能代码助手上线SaaS版本

???AI新鲜事高通发布骁龙X Elite芯片电脑可运行130亿参数大模型高通发布骁龙X Elite芯片，成为全球性能最强的CPU，能在PC上运行130亿参数的大模型，实现离线AI应用。爆火智能体项目AutoGPT获1200万美元融资 Auto...

人工智能 2023-10-25 人工智能

979阅读

超1. 8万家公司使用Azure OpenAI服务，Copilot付费用户达100万

微软董事长兼首席执行官Satya Nadella日前表示，超过18，000家组织正在使用Azure OpenAI服务，其中包括新客户，微软正通过OpenAI API扩展其数字化首选公司的服务。这一消息是在公司2023财年第一季度业绩电话会议上宣布的。图...

人工智能 2023-10-25 人工智能

1166阅读

LLM一句话瞬间生成3D世界，未公布代码已获141星！或将引发3D建模行业革命

继火爆全网的AI文生图，文生视频之后，文生3D场景的技术也来了！只要不到30个字的提示词，瞬间就能生成这样的3D场景。场景效果和文字的要求几乎分毫不差——「平静如玻璃的湖面，倒映出无云的天空，周围的山和水鸟的倒影呈现在湖中。」「烈日照耀在无垠...

AIGC 2023-10-25 人工智能

898阅读

UniPAD：自动驾驶通用预训练范式来了！

本文经自动驾驶之心公众号授权转载，转载请联系出处。 UNIPAD：自动驾驶通用预训练范式原标题：UNIPAD: A UNIVERSAL PRE-TRAINING PARADIGM FOR AUTONOMOUS DRIVING 论文链接：https:/...

AIGC 2023-10-25 人工智能

908阅读

最高20倍！压缩ChatGPT等模型文本提示，极大节省AI算力

在长文本场景中，ChatGPT等大语言模型经常面临更高算力成本、更长的延迟以及更差的性能。为了解决这三大难题，微软开源了LongLLMLingua。据悉，LongLLMLingua的核心技术原理是将“文本提示”实现最高20倍的极限压缩，同时又可以准确评估...

AIGC 2023-10-25 人工智能

1053阅读

陶哲轩疯狂安利Copilot：它帮我完成了一页纸证明，甚至能猜出我后面的过程

继给GPT-4“代言”之后，Copilot也被陶哲轩疯狂安利。他直言，在编程时，Copilot能直接预测出他下一步要做什么。有了Copilot之后，研究做起来也更方便了，陶哲轩也用它辅助自己完成了最新的研究成果。陶哲轩说，这次的论文中，有关这一部...

人工智能 2023-10-25 人工智能

843阅读

让大模型看图比打字管用！NeurIPS 2023新研究提出多模态查询方法，准确率提升7.8%

大模型“识图”能力都这么强了，为啥还老找错东西？例如，把长得不太像的蝙蝠和拍子搞混，又或是认不出一些数据集中的稀有鱼类…… 这是因为，我们让大模型“找东西”时，往往输入的是文本。如果描述有歧义或太偏门，像是“bat”（蝙蝠还是拍子？）或“魔鳉”（Cy...

AIGC 2023-10-25 人工智能

1051阅读

首个多视角自动驾驶场景视频生成世界模型 | DrivingDiffusion: BEV数据和仿真新思路

笔者的一些个人思考在自动驾驶领域，随着BEV-based子任务/端到端方案的发展，高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点，“高质量”可以解耦成三个方面：不同维度上的长尾场景：如障碍物数据中近距离的车辆以及切车过程中...

人工智能 2023-10-24 人工智能

1486阅读

深度学习科研，如何高效进行代码和实验管理？

回答一作者：叶小飞链接：https://www.zhihu.com/question/269707221/answer/2281374258 我之前在北美奔驰落地时，曾有段时间为了测试不同的结构和参数，一周能训练一百来个不同的模型，为此我结合公司前...

人工智能 2023-10-24 人工智能

1048阅读

「解释一切」图像概念解释器来了，港科大团队出品

你是否好奇当一个黑盒深度神经网络 (DNN 预测下图的时候，图中哪个部分对于输出预测为「击球手」的帮助最大？香港科技大学团队最新的 NeurIPS2023 研究成果给出了他们的答案。论文：https://arxiv.org/abs/2305....

AIGC 2023-10-24 人工智能

952阅读

清华新研究解密信息茧房！全新信息动力学理论，登Nature子刊

新一代信息与智能技术的迅猛发展推动着人类逐步迈入智能社会。在数字技术和智能推荐算法的加持下，媒体和平台越来越贴心，总是能最快最准的地契合人们的个性化偏好和需求。然而，与此同时，智能精准推荐致使「信息茧房」现象不断发酵，观点相似的人群在网络空间组成团体，...

AIGC 2023-10-24 人工智能

1042阅读

你的GPU能跑Llama 2等大模型吗？用这个开源项目上手测一测

在算力为王的时代，你的 GPU 可以顺畅的运行大模型（LLM）吗？对于这一问题，很多人都难以给出确切的回答，不知该如何计算 GPU 内存。因为查看 GPU 可以处理哪些 LLM 并不像查看模型大小那么容易，在推理期间（KV 缓存）模型会占用大量内存，例...

人工智能 2023-10-24 人工智能

1161阅读

仅五个字符的新绘图语言火了，ChatGPT都学会了

只用五个字符，就能完成一幅像素画的绘制了。这是一种新的绘图语言，一共支持8种颜色，画幅可达256*256。它包含了“CFR[]”这五个符号，因此名字也就叫CFR[]了，主打的就是一个直观。而且CFR[]免费开源，无需部署安装，在线就能体验。虽然...

AIGC 2023-10-24 人工智能

853阅读

AIGC时代的视频扩散模型，复旦等团队发布领域首篇综述

AI 生成内容已经成为当前人工智能领域的最热门话题之一，也代表着该领域的前沿技术。近年来，随着 Stable Diffusion、DALL-E3、ControlNet 等新技术的发布，AI 图像生成和编辑领域实现了令人惊艳的视觉效果，并且在学术界和工业界...

人工智能 2023-10-24 人工智能

1005阅读

免费开源AI视频工具VideoCrafter:输入文本轻松生成高质量视频

VideoCrafter是一款全新的开源视频创建和编辑套件，采用了扩散模型，能够从文本描述生成照片和视频逼真的输出。尽管尚未正式发布，但VideoCrafter有望显著改变视频制作流程。使用VideoCrafter，即使没有视频编辑或动画经验的人也可以轻...

AIGC 2023-10-24 人工智能

1225阅读

AI视野：星火大模型V3.0发布；B站测试推出“AI视频总结”功能；高通发布骁龙8Gen3；苹果计划每年砸10亿美元搞AI

????大模型动态科大讯飞星火认知大模型V3.0正式发布在今日的2023科大讯飞全球1024开发者节上，科大讯飞宣布，讯飞星火认知大模型V3.0正式发布，目前星火大模型已整体超越ChatGPT。 ???AI应用 B站测试推出“AI视频总结”功能近日...

人工智能 2023-10-24 人工智能

1216阅读

GPT-4教会机器手转笔、玩魔方！RL社区震惊：LLM设计奖励竟能超越人类？

GPT-4，竟然教会机器人转笔了！图片英伟达、宾大、加州理工、德州奥斯汀等机构的专家提出一个开放式Agent——Eureka，它是一个开放式Agent，为超人类水平的机器人灵巧性设计了奖励功能。图片论文链接：https://arxiv.org/p...

AIGC 2023-10-24 人工智能

1032阅读

AI视频后期制作神器ProPainter 一键即可完成视频抠图

最近，出现了一种新的视频修复技术，叫做ProPainter，它可以用画家风格的笔触来填补视频中的缺失区域。 ProPainter是一个基于深度学习的端到端的网络，它由两个模块组成:Recurrent Flow Completion Network和Pain...

AIGC 2023-10-24 人工智能

935阅读

SolidGPT：基于GitHub的AI工具让代码仓库更智能

在软件开发领域，代码仓库是存储和管理代码的重要工具。然而，随着代码库的增长和复杂性的增加，理解和学习代码变得越来越困难。为了解决这个问题，一款名为SolidGPT的基于GitHub的人工智能工具应运而生。 SolidGPT利用了OpenAI的GPT技术，可...

AIGC 2023-10-24 人工智能

875阅读

从基础到实践，回顾 Elasticsearch 向量检索发展史

1.引言向量检索已经成为现代搜索和推荐系统的核心组件。通过将复杂的对象（例如文本、图像或声音）转换为数值向量，并在多维空间中进行相似性搜索，它能够实现高效的查询匹配和推荐。 Elasticsearch 作为一款流行的开源搜索引擎，其在向量检索方面...

人工智能 2023-10-24 人工智能

1021阅读