-
报道称Stability AI成功融资5000万美元
Stability AI,一家以其Stable Diffusion图像生成软件而闻名的人工智能(AI)初创公司,据报道成功融资5000万美元,资金来自可转换债券。这一现金注入是通过可转换债券获得的,具体细节未透露。 图源备注:图片由AI生成,图片授权服务...
-
UniPAD:通用自动驾驶预训练模式!各类感知任务都可支持
本文经自动驾驶之心公众号授权转载,转载请联系出处。 最近,新论文推陈出新的速度着实太快有点读不过来的感觉。可以看到的是,语言视觉多模态大模型融合已经是业界共识了,UniPad 这篇文章就比较有代表性,多模态的输入,类世界模型的预训练基座模型,同时又方便扩...
-
百度文心一言对标 ChatGPT,你怎么看?
文心一言 VS ChatGPT 接受不完美 期待进步 里程碑意义 文心一言初体验 ✔ 文学创作 ✔ 商业文案创作 ✔ 数理逻辑推算 ✔ 中文理解 ✔ 多模态生成 写在最后 何为文心?“文”就是我们中华语言文字中的文,“...
-
AI视野:ChatGPT和API发生重大中断;GPTs分阶段推出计划延迟;中国第二批11个大模型备案获批;阿里将开源720亿参数大模型
???AI新鲜事 ChatGPT和API发生重大中断! 11月9日凌晨,OpenAI在官网发布,ChatGPT和API发生重大中断,导致全球所有用户无法正常使用,宕机时间超过2小时。OpenAI已经找到问题所在并进行了修复,但仍然不稳定,会继续进行安全监控...
-
【AIGC】1、爆火的 AIGC 到底是什么 | 全面介绍
文章目录 一、AIGC 的简要介绍 二、AIGC 的发展历程 三、AIGC 的基石 3.1 基本模型 3.2 基于人类反馈的强化学习 3.3 算力支持 四、生成式 AI(Generative AI) 4.1 单模态 4.1.1 生成式语...
-
【原创】用 VisualGLM 进行AIGC多模识别和内容生成
最近几个月,整个AI行业的LLM(大语言模型)蓬勃发展,除了过去传统的纯文字的多模态能力的视觉语言模型,如 GPT-4,ImageBind等表现令人印象深刻。 ChatGLM-6B是中文用户使用非常舒服的一个开源中文LLM。2023年5月17日,智谱...
-
大语言模型的七大网络安全热门应用
在这个网络威胁攻防日益失衡的时代,飞速发展的人工智能和大型语言模型(LLM 正成为推动网络安全变革的颠覆性力量。 面对新兴威胁,人工智能正推动网络安全转向主动、智能防御。人工智能与人类专业知识的结合才是打造下一代网络安全防御的最佳方式。 今天,人工智能...
-
用语言对齐多模态信息,北大腾讯等提出LanguageBind,刷新多个榜单
在现代社会,信息传递和交流不再局限于单一模态。我们生活在一个多模态的世界里,声音、视频、文字和深度图等模态信息相互交织,共同构成了我们丰富的感知体验。这种多模态的信息交互不仅存在于人类社会的沟通中,同样也是机器理解世界所必须面对的挑战。 如何让机器像人类...
-
GPT-5明年降临?爆料人泄露多模态Gobi就是GPT-5,已初现自我意识
【新智元导读】首届开发者大会余温还在,GPT-5突然被爆2024年初就来。OpenAI首秀可谓是赚足了眼球,一系列新品更新,直接让ChatGPT和API同时崩溃。 OpenAI首届开发者大会,就是一场AI盛宴。 GPT-4Turbo、大幅降价、面向开发者新...
-
vivo开源蓝心大模型BlueLM-7B系列 后续还将开源13B以及多模态7B-vl模型
近日,vivo AI正式开源了BlueLM-7B 基础 (base) 模型和7B 对话 (chat 模型,同时开源了支持32K 的长文本基础 (base 模型和对话 (chat 模型。 具体特性如下: vivo表示,后续还将开源13B 模型和支持...
-
大模型勇闯洛圣都,加封「GTA五星好市民」!南洋理工、清华等发布视觉可编程智能体Octopus:打游戏、做家务全能干
随着游戏制作技术的不断发展,电子游戏已然成为现实世界的模拟舞台。 以游戏《侠盗猎车手》(GTA)为例,在GTA的世界里,玩家可以以第一人称视角,在洛圣都(游戏虚拟城市)当中经历丰富多彩的生活。 然而,既然人类玩家能够在洛圣都里尽情遨游完成若干任务,我们...
-
在等GPT-5多模态?试试Genmo!Adobe AI首轮内测报告;ChatGPT三条使用哲学与实践;论文追更与阅读神器 | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 『微软 New Bing 引入广告』日活跃用户超1亿,探索广告投放的未来 微软正在尝试在 New Bing 的聊天回复中投放广告。虽然广告被明确标...
-
文心一言 vs GPT-4 —— 全面横向比较
文心一言 vs GPT-4 —— 全面横向比较 3月15日凌晨,OpenAI发布“迄今为止功能最强大的模型”——GPT-4。我第一时间为大家奉上了体验报告《OpenAI 发布GPT-4——全网抢先体验》。 时隔一日,3月16日下午百度发布大语言模型—...
-
解说梅西球赛、英雄联盟,OpenAI GPT-4视觉API被开发者玩出新花样
文章开始,我们先来看一段球赛解说视频: 是不是感觉听起来不太对劲? 你的感觉没错,因为这段解说是用 AI 生成的,这个大喊「梅西!梅西!」的声音居然来自 AI。 这是 X 平台(原推特)博主 @Gonzalo Espinoza Graham 发布的一段视...
-
10分钟定制一个「陈天奇GPT」,OpenAI新品大波实测来袭!Sam Altman降维打击,千家AI初创公司入土
OpenAI首届春晚,创业公司屠杀夜。 正如Sam Altman所言:「我们正在孕育新物种,它们正在迅速增殖。」 图片 可以说,基于OpenAI接口构建创业公司,产品忽然就失去了意义。许多初创公司的产品,已经没有了护城河。 杜克大学教授陈怡然表示,照这个...
-
GPT商店已至,AI的爆款应用还有多远?
什么,还必须要关注“技术”想要什么。 昨天凌晨,整个AI界发生了一场地震,在被视为“首届AI春晚”的OpenA开发者大会上,GPT-4进行了史诗版本的更新。 128K的超长上下文、成本更低的tokens、全新的Assistants API、新增的多模态功能...
-
全网最全ChatGPT/AIGC报告分析(365份)
本星球整理了365份ChatGPT/AIGC重磅专业报告(更新中…),部分目录如下,请读者搜索关键字,获取报告,学习参阅。 https://mp.weixin.qq.com/s/hvI2Hupjx_mnPh3YGyobww 1、计算机研究报告:Chat...
-
带你认识一下多模态对比语言图像预训练CLIP
本文分享自华为云社区《多模态对比语言图像预训练CLIP:打破语言与视觉的界限》,作者:汀丶。 一种基于多模态(图像、文本)对比训练的神经网络。它可以在给定图像的情况下,使用自然语言来预测最相关的文本片段,而无需为特定任务进行优化。CLIP的设计类似于GP...
-
教育大数据采集机制与关键技术研究
点击上方蓝字关注我们 教育大数据采集机制与关键技术研究 柴唤友1, 刘三女牙1,2, 康令云1, 张雅娴1, 李卿2, 刘智2 1 华中师范大学国家数字化学习工程技术研究中心,湖北 武汉 430079 2 华中师范大...
-
多模态音乐AI框架Video2Music 为视频生成情感相符的音乐
近日,一款创新的人工智能多模态音乐生成框架Video2Music引起了广泛关注。该框架利用独特的数据集和经过用户研究验证的转换器模型,能够为视频生成情感上相符的音乐,填补了这一领域的空白。据悉,Video2Music的GitHub Repo已经发布,为研究...
-
思谋科技发布全球首个工业多模态大模型 IndustryGPT V1.0
思谋科技在第六届中国国际进口博览会上发布了全球首个工业多模态大模型 IndustryGPT V1.0。 这个大模型通过深度的行业洞察和海量的精炼数据,能够准确回答制造业的问题、识别工业缺陷,并提供决策支持。 与此同时,思谋科技还与松下、江森自控等跨国企业...
-
北大推出首个多轮多模态PPT任务完成基准PPTC GPT-4完成正确率仅6%
北大和微软亚洲研究院的研究人员提出了一项新的评估基准PPTC,旨在评估大型语言模型在复杂多轮多模态PPT任务中的表现。 他们通过创建包含数百个多模态指令的数据集,挑战大模型在多轮人机对话中生成PPT文档的能力。结果显示,GPT-4在创建新PPT文档任务中表...
-
百度网盘首页全新改版:个人文档feed流推荐、大模型加持2步内完成所有操作
10月17日在2023百度世界大会上,百度创始人、董事长兼首席执行官李彦宏表示,重构后的百度网盘,不但实现了从图形界面交互到自然语言交互的转变,还增强了多模态信息理解。据了解,自2012年上线至今,百度网盘已积累8亿用户,文件量级达4万亿,每天用户会上传...
-
OpenAI推出GPT-4升级版GPT-4 Turbo:功能更强大且更便宜
11月7日消息,据外媒报道,当地时间周一,美国人工智能研究公司OpenAI推出了GPT-4 Turbo,这是其大语言模型GPT-4的升级版本。 据悉,OpenAI在今年3月14日推出了第一个版本的GPT-4。它是一个多模态大型语言模型,支持图像和文本输入,...
-
GPT-4完成正确率仅6%!北大等提出首个「多轮、多模态」PPT任务完成基准PPTC
【新智元导读】为了填补LLM在复杂多模态环境中利用复杂工具完成多轮、多模态指令的评估空白,研究人员引入了PowerPoint任务完成(PPTC)基准测试,以评估LLM创建和编辑PPT文档的能力。 最近对大型语言模型(例如ChatGPT和GPT-4)进行的评...
-
深夜炸场,ChatGPT一周年:无需编程,全民定义GPT的时代,来了!
撰稿 | 云昭 深夜又是一场王炸!在ChatGPT发布一周年之际,OpenAI 创始人Altman 在首届开发者大会上全场放大招,台下掌声不断。 无需编程,甚至无需敲键盘,单纯通过语音聊天就能构建一个专属自定义的GPT!这个消息实在太燃了!以至于推特...
-
GPT-4重磅升级!OpenAI发布GPT-4 Turbo:更强大还更便宜
快科技11月7日消息,当地时间周一,OpenAI首届开发者大会如期召开,在大会上OpenAI正式推出了GPT-4 Turbo。 据OpenAI介绍,相比于GPT-4,GPT-4 Turbo主要有6方面的提升: 第一,上下文对话长度,GPT4最大只能支持8k...
-
联发科发布天玑9300生成式AI移动芯片 支持运行330亿参数大模型
昨日晚间,联发科技发布了天玑9300旗舰5G 生成式 AI 移动芯片,采用台积电第三代4nm 制程。该芯片预计于2023年底上市。 这款芯片采用全大核架构设计,提供高智能、高性能、高能效、低功耗的特性,为用户带来卓越的生成式 AI 体验。 天玑9300采...
-
加量降价!OpenAI推出史上最强ChatGPT,人人可自定义GPT,GPT商店本月上线
很快,GPT系列都将可以通过GPT商店访问。 是的,这是在OpenAI首次举办的首次开发者大会DevDay上,官方亲自宣布的消息。 在旧金山的开发者大会上,除了官宣GPT商店外,OpenAI还表示会有一款更便宜的GPT-4,为开发者在应用程序中的使用...
-
ChatGPT王炸升级!更强版GPT-4上线,API定价打骨折,发布现场掌声没停过
ChatGPT,今天裂变成无数个GPT。 OpenAI在首届开发者日上,正式公布自定义GPT。 还将上线“GPT商店”,与创作者分享收入。 CEO山姆·奥特曼现场登台演示,3分钟不到,只凭几步操作做好一个“创业导师GPT”。 接下来,“创业导师GPT...
-
天玑9300 AI能力飙升:最高支持330亿参数的AI大语言模型
快科技11月6日消息,联发科今晚正式发布天玑9300旗舰5G生成式AI移动芯片,支持在端侧生成式AI、游戏、影像等方面定义旗舰新体验。 据介绍,天玑9300集成MediaTek第七代AI处理器APU 790,为生成式AI而设计,其性能和能效得到显著提升,整...
-
AI视野:xAI首个大模型Grok炸场;李开复官宣开源大模型Yi-34B;ChatGPT原型Gizmo新功能曝光;百度网盘引入大模型智能助理
????大模型动态 李开复官宣全球最强开源大模型Yi-34B 一次可处理40万汉字 零一万物发布全球最强的开源大模型Yi-34B,具备超强的语言理解和处理能力,支持处理40万汉字,在中文指标上表现卓越,标志着中国在大模型领域的重大突破。 项目地址:htt...
-
大型语言模型(LLM)技术精要,不看亏了
哈喽,大家好。 今天分享一篇知乎高赞文章,作者是张俊林老师。 图片 读完收获很多,能帮大家更好地理解、学习大模型。原文有2.8w字,我提炼了核心要点,阅读需要10min。 ChatGPT的出现给很多人带来了惊喜和醒悟。有人惊喜地发现大型语言模型(LLM)...
-
李开复领队开源大模型 Yi,40万字上下文窗口破纪录
由李开复博士亲自下场创办的零一万物(01.ai),自3月底官宣成立后,于近日发布并开源了两个版本的中英文大模型 Yi-6B 和 Yi-34B。 在线上发布环节,李开复博士重点介绍了 Yi 系列大模型的三处性能亮点: 全球最长200K 上下文窗口,免费开...
-
北大具身智能新成果:无需训练,听指令就能灵活走位
北京大学董豪团队具身导航最新成果来了: 无需额外建图和训练,只需说出导航指令,如: Walk forward across the room and walk through the panty followed by the kitchen. Stan...
-
马斯克版ChatGPT爆火来袭!不用Python,11人爆肝两个月
马斯克突然出手截胡,抢在OpenAI开发者大会前发布大模型Grok。 与其他ChatGPT类产品不同,Grok可以实时从?推文中获取最新知识,比如马斯克刚刚与Joe Rogan的最新访谈。 图片 巨量、实时且独特的?数据构成了Grok的最大护城河,早在7...
-
全球首发!总结七十余种开源数据集,一览自动驾驶开源数据体系
本文经自动驾驶之心公众号授权转载,转载请联系出处。 基于数据驱动的各类深度学习模型任务,近年来随着数据集规模的不断扩大,性能逐渐被提升,国内外各大自动驾驶公司都在不断建立自己的数据库,以及数据闭环系统,期待数据的丰富能够解决下半场自动驾驶问题,那么如何...
-
知乎“知海图AI”大模型开放服务 相关产品将择机上线
知乎宣布,旗下的“知海图AI”大模型即将面向社会公众开放服务。该大模型具备千亿级参数和更强的逻辑推理能力,旨在持续赋能创作者、讨论场、信息获取、内容运营等各项业务场景。 知乎在2023年4月推出了首个中文大模型“知海图AI”,该大模型在成熟大模型CPM-B...
-
AI能理解自己生成的东西吗? 在GPT-4、Midjourney上实验后,有人破案了
从 ChatGPT 到 GPT4,从 DALL・E 2/3 到 Midjourney,生成式 AI 引发了前所未有的全球关注。强大的潜力让人们对 AI 产生了许多期待,但是强大的智能也会引发人们的恐惧和担忧。近期大牛们针对该问题还上演了一场激烈的论战。先...
-
360大模型“奇元大模型”通过备案落地
近日,360智脑官方宣布,其自主研发的“奇元大模型”已通过备案并成功落地。值得一提的是,今年9月,该模型已获批面向公众开放,使得360成为国内首家两个大模型均通过备案的科技企业。 据了解,360智脑大模型具备生成创作、多轮对话、逻辑推理等十大核心能力,覆盖...
-
字节“开盒”OpenAI所有大模型,揭秘GPT-3到GPT-4进化路径!把李沐都炸出来了
GPT-3究竟是如何进化到GPT-4的? 字节给OpenAI所有大模型来了个“开盒”操作。 结果还真摸清了GPT-4进化路上一些关键技术的具体作用和影响。 比如: SFT是早期GPT进化的推动者 帮助GPT提升编码能力的最大功臣是SFT和RLHF 在...
-
GPT-4V学会用键鼠上网,人类眼睁睁看着它发帖玩游戏
GPT-4V学会自动操纵电脑,这一天终于还是到来了。 只需要给GPT-4V接入鼠标和键盘,它就能根据浏览器界面上网: 图片 甚至还能快速摸清楚“播放音乐”的播放器网站和按钮,给自己来一段music: 图片 是不是有点细思极恐了? 这是一个MIT本科生小哥...
-
科普神文,一次性讲透AI大模型的核心概念
图片 令牌,向量,嵌入,注意力,这些AI大模型名词是否一直让你感觉熟悉又陌生,如果答案肯定的话,那么朋友,今天这篇科普神文不容错过。我将结合大量示例及可视化的图形手段,为你由浅入深一次性讲透AI大模型的核心概念。 引言 随着科技公司及国际竞争的不断推进,...
-
打造更智能的移动端平台,蚂蚁mPaaS5.0亮相云栖大会
11月2日,在云栖大会上,蚂蚁数科宣布mPaaS正式升级至5.0版本。mPaaS5.0融合了蚂蚁大模型框架下的多种算法能力,以AI智能引擎驱动移动端平台的运营、服务和体验管理实现全链路升级,助力金融机构及企业打造更加智能、更懂用户的移动端平台,驱动业务高...
-
AI大模型的风过去了?不,是离我们越来越近了
OpenAI摊牌了。不再掩藏锋芒,拿年初预测的2亿美元收入做挡箭牌,“我们的年营收达到了13亿美元。”10月中旬Sam Altman终于透露出来。13亿美元,同比增长4500%。 国内。资本和公众的视线越来越多地放在局势变幻、芯片和造车上。 △三季度融资...
-
GPT-4V连小学生都不如?最新基准测试错误率竟高达90%:红绿灯认错、勾股定理也不会
GPT-4被吹的神乎其神,作为具备视觉能力的GPT-4版本——GPT-4V,也被大众寄于了厚望。 但如果告诉你,初中生都知道的勾股定理,只适用于直角三角形。 然而GPT-4V却自信将其用于钝角三角形中计算斜边长度。还有更离谱的,GPT-4V直接犯了致命的...
-
通义千问2.0将带来重磅升级 通义千问app怎么注册下载安装
通义千问2.0将带来重磅升级,正式超越GPT-3.5,正在加速追赶GPT-4,成为业界的佼佼者。此次升级的核心在于其在性能上的巨大飞跃,不仅在复杂指令理解、文学创作、通用数学、知识记忆等方面有显著提升,还在幻觉抵御等能力上表现出色。 通义千问2.0将带来...
-
通义千问app下载官网 阿里通义千问app特色介绍
通义千问app是一款适用于多个垂直领域的AI助手,无论您是需要解决工作中的问题,还是在学习中寻求帮助,通义千问都能为您提供精准的答案和协助。通过通义千问app,用户可以更加便捷地体验最新的模型能力,更好地应对生活中的各种挑战。 通义千问app下载官网 首...
-
阿里云发布通义千问2.0,性能超GPT-3.5,加速追赶GPT-4
10月31日,阿里云正式发布千亿级参数大模型通义千问2.0。在10个权威测评中,通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4。当天,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。 过去6个月,通义...
-
GPT-4 又进化了,画图、插件、代码等能力被整合,网友:“更像是 AI Agent 了”
近日,OpenAI 再次闷声放大招! 用灰度测试的方式,向不少用户暗戳戳的「剧透」了最新进化版的 GPT-4。 据悉,新版本能使用户无需切换即可访问所有 GPT-4工具,包括浏览和 DALL·E3。为此,该功能被许多用户称之为 “ALL TOOLS 模式”...