-
九章云极DataCanvas公司与生态伙伴强强联手,构建人工智能强生态!
11月21日,在「筑基赋能 智向未来」九章云极DataCanvas大模型系列成果发布会上,九章云极DataCanvas公司与人工智能产业链上下游合作伙伴广东民营投资股份有限公司(以下简称“粤民投”)、西藏赛富合银投资有限公司(以下简称“西藏赛富”)、广...
-
研究表明:GPT-4在图形推理任务上表现不佳,准确率仅33%
最近的研究表明,GPT-4在图形推理任务上表现不佳,仅有33%的准确率,引发了对大型语言模型图形处理能力的关注。 通过使用ConceptARC数据集,研究者对451名人类受试者进行了图形推理任务测试,结果显示人类在这方面表现卓越,平均准确率达到91%。...
-
GPT-4V医学执照考试成绩超过大部分医学生,AI加入临床还有多远?
人工智能(AI)在医学影像诊断方面的应用已经有了长足的进步。然而,在未经严格测试的情况下,医生往往难以采信人工智能的诊断结果。对于他们来说,理解人工智能根据医学影像给出的判别,需要增加额外的认知成本。 为了增强医生对辅助医疗的人工智能之间的信任,让 AI...
-
Grounding dino + segment anything + stable diffusion 实现图片编辑
目录 总体介绍 总体流程 模块介绍 目标检测: grounding dino 目标分割:Segment Anything Model (SAM 整体思路 模型结构: 数据引擎 图片绘制 集成 样例 其他问题 附录 总体介绍...
-
【OpenAI】DALL·E 2,让我来带你认识一下这位来自AI界的艺术家
个人主页:【?个人主页】 文章目录 前言 什么是DALL-E 2 ? 介绍的怎么厉害,它又能干啥呢? 基本功能 新功能 编辑 变体功能 总结 前言 DALL-E 2 是一种基于语言的人工智能图像生...
-
GPT-4不会图形推理?“放水”后准确率依然只有33%
GPT-4的图形推理能力,竟然连人类的一半都不到? 美国圣塔菲研究所的一项研究显示,GPT-4做图形推理题的准确率仅有33%。 而具有多模态能力的GPT-4v表现更糟糕,只能做对25%的题目。 △虚线表示16项任务的平均表现 这项实验结果发表后,迅速在...
-
谷歌为什么输给了OpenAI?科技公司创始人兼谷歌前员工带你一探究竟
在当今的人工智能浪潮中,OpenAI这样的新兴公司引领了革命。 ——而GPT的一些关键部分:Transformer、强化学习(AlphaGo ) 和 多模态(Flamingo)却都是由Google发明的。 那么为什么,作为科技领域巨无霸的Google,却...
-
自动驾驶中基于深度学习的预测和规划融合方法综述
本文经自动驾驶之心公众号授权转载,转载请联系出处。 Rethinking Integration of Prediction and Planning in Deep Learning-Based Automated Driving Systems: A...
-
「无需配对数据」就能学习!浙大等提出连接多模态对比表征C-MCR
多模态对比表示(multi-modal contrastive representation, MCR)的目标是将不同模态的输入编码到一个语义对齐的共享空间中。 随着视觉-语言领域中CLIP模型的巨大成功,更多模态上的对比表征开始涌现出来,并在诸多下游任...
-
探寻人工智能前沿 迎接AIGC时代——CSIG企业行(附一些好玩的创新点)
上周我有幸参加了由中国图像图形学会和合合信息共同举办的CSIG企业行活动。 这次活动邀请了多位来自图像描述与视觉问答、图文公式识别、自然语言处理、生成式视觉等领域的学者,他们分享了各自的研究成果和经验,并与现场观众进行了深入的交流和探讨。干货多多...
-
【CVHub】《万字长文带你解读AIGC》系列之入门篇
本文来源“CVHub”公众号,侵权删,干货满满。 作者丨派派星 来源丨CVHub 原文链接:《万字长文带你解读AIGC》系列之入门篇 0. 导读 图0 随着ChatGPT的病毒式传播,生成式人工智能(AIGC, a.k.a AI-gener...
-
AI视野:ChatGPT测试新功能“从聊天中学习”;Kimi Chat全面开放服务;文心生物计算大模型宣布升级;Meta发布AI视频编辑工具Emu Video;贾跃亭也开始搞AI了
???AI新鲜事 ChatGPT测试新功能“从聊天中学习” ChatGPT测试新功能,能学习用户历史聊天、理解偏好,还支持重置记忆和阅后即焚功能,使其更像个性化的朋友。 【AiBase提要:】 ? 学习历史聊天: ChatGPT将能够在一个新的“My C...
-
微软战略大转变:拥抱小模型!
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 微软的生成式AI战略似乎出现了180度大转变:相比大模型,小模型才是微软的真爱。 在Ignite 2023上,微软董事长兼首席执行官Nadella在主题演讲中表示:“微软喜欢小模型...
-
让Ai帮你工作(4)--锁定图片生成角色
背景: Gpt4多模态模型上来后,MJ也是紧接着发布了V5,微软发布自己Ai作图工具,Abode、unity这些传统老牌作图软件工具也是紧跟着发布自己的AI作图插件工具。这已经标志着Ai作图已经成为计算成像的另一条生成链。 各大厂都已经发布了...
-
谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频
11 月 16 日消息,谷歌公司近日发布新闻稿,介绍了小型人工智能模型 Mirasol,可以回答有关视频的问题并创造新的记录。 AI 模型目前很难处理不同的数据流,如果要让 AI 理解视频,需要整合视频、音频和文本等不同模态的信息,这大大增加了难度。...
-
李彦宏:AI原生时代的“冷”思考和“热”驱动
11月15日,由科学技术部、深圳市人民政府联合主办的“2023西丽湖论坛”在深圳大学城国际会议中心开幕。论坛聚焦战略性新兴产业和未来产业前沿领域,设置了人工智能等主题平行论坛,李彦宏出席论坛做了题为《AI原生时代:“冷”思考和“热”驱动》的演讲,引发热...
-
Altman首次自曝GPT-5加急训练中!暗示比GPT-4更复杂,无法预测真实能力
「OpenAI正在开发下一代大模型GPT-5。我们的意义所在,就是打造超凡脱俗的神奇AI智能」。 这是Sam Altman最近接受FT的一次采访中,首次对外透露了更多OpenAI的计划。 这篇文章信息量巨大! 他不仅谈到了OpenAI的融资想法,英伟达...
-
全球首个!电视拥抱AI大模型 颠覆式革新
快科技11月15日消息,长虹电视官方宣布,将于11月20日发布全球首个基于大模型的智慧家电AI平台。 早在2016年,长虹就发布了全球首台人工智能电视,第一家将”人工智能深度学习神经网络算法”应用于电视,让家电行业正式迈入人工智能新时代。 如今,长虹再一次...
-
百度文心一言4.0抢先体验教程!
? 展望:关注我, AI学习之旅上,我与您一同成长! 一、 引言 想快速体验文心一言4.0,但又觉得技术难度太高?别担心,我来手把手教你! ? 10月17日,文心一言4.0震撼亮相,带着一系列闪亮的AI原生应用与服务。这包括了 百度新搜索、百度...
-
【文心一言】文心一言最近这么火,它到底是什么
前言 文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言是知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大...
-
文心一言官网地址入口 文心一言4.0网页版使用链接
文心一言是百度打造出来的人工智能大语言模型,具备跨模态、跨语言的深度语义理解与生成能力,文心一言有五大能力,文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成,其在搜索问答、内容创作生成、智能办公等众多领域都有更广阔的想象空间。 文心一言企业服务...
-
实时文生图速度提升5-10倍,清华LCM/LCM-LoRA爆火,浏览超百万
文生图、图生图已经不是什么新鲜事。但在使用这些工具的过程中,我们发现它们通常运行缓慢,导致我们要等一段时间才能拿到生成结果。 但最近,一种名叫「LCM」的模型改变了这种情况,它甚至能做到实时的连续生图。 图源:https://twitter.com/...
-
微软用GPT-4V解读长视频 MM-Vid能看懂电影还能讲给盲人听
近期,微软Azure AI发布了MM-Vid,这是一项结合GPT-4V与专用工具的创新,致力于解读长视频并为视障人士提供更好的体验。 目前,人工智能在长视频理解领域所面临的复杂挑战,包括分析多个片段、提取不同信息源、实时处理动态环境等。而MM-Vid的工作...
-
比ChatGPT早发两周,被喷下线的Galactica成了LeCun最大的意难平
今天我们提到大型语言模型(LLM),第一个想到的就是 OpenAI 的 ChatGPT。一年来,ChatGPT 因其强大的性能,广泛的应用前景而爆火出圈。但谈到大型语言模型,ChatGPT 并不是第一个。 一年前,也就是 OpenAI 发布 ChatGP...
-
微软用GPT-4V解读视频,看懂电影还能讲给盲人听,1小时不是问题
世界各地的人们每天都会创造大量视频,包括用户直播的内容、短视频、电影、体育比赛、广告等等。 视频是一种多功能媒介,可以通过文本、视觉和音频等多种模态传递信息和内容。如果可以开发出能学习多模态数据的方法,就能帮助人们设计出具备强大能力的认知机器 —— 它不...
-
文心一言怎么清除记录 文心一言4.0版本收费标准
文心一言具备广泛的应用能力,涵盖了文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成等。这些能力使其在搜索问答、内容创作生成、智能办公等领域展现出广阔的应用前景。 例如,在企业服务领域,文心一言可以帮助企业进行内容创作、客服问答优化、数据分析等,极...
-
深势科技推出多模态科学文献大模型Uni-Finder
深势科技推出了 Uni-Finder,一个革命性的智能文献数据库平台,通过多模态检索功能和自然语言交互技术,提高科学文献的阅读和分析效率。 Uni-Finder 基于科学多模态大模 Uni-SMT,综合考虑文献中的多模态元素,如图表、数学方程、分子结构等...
-
阿里发布自研夸克大模型:整体能力已超GPT-3.5
快科技11月14日消息,阿里巴巴智能信息事业群今日正式发布全栈自研、千亿级参数夸克大模型。 据介绍,在CMMLU权威大模型性能评测中,夸克大模型成绩位列榜首,根据评测显示,夸克大模型整体能力已经超过GPT-3.5,在写作、考试等部分场景中优于GPT-4。...
-
Meta 工程师:明年全球 AI 推理用电量仅需新增两座核电站即可满足
11 月 14 日消息,Meta 生成式人工智能工程总监谢尔盖・埃杜诺夫近日在硅谷数字工人论坛上分享了他对人工智能推理需求的预测。他认为,明年全球新增的人工智能应用推理需求,如果使用合理规模的语言模型,仅需两座核电站的发电量就可以满足。 人工智能推理是...
-
令人惊艳的ChatGPT项目,AIGC也太猛了
自从 ChatGPT、Stable Diffusion 发布以来,各种相关开源项目百花齐放,着实让人应接不暇。 今天,我将着重挑选几个优质的开源项目,对我们的日常工作、学习生活,都会有很大的帮助。 今天整理分享给大家,希望对你有所帮助。...
-
Meta工程师称全球AI推理用电仅需新增两座核电站即可满足
近日,Meta公司的生成式人工智能工程总监谢尔盖·埃杜诺夫在硅谷数字工人论坛上透露,为满足明年全球不断增长的人工智能应用推理需求,仅需新增两座核电站的发电量即可。 埃杜诺夫表示,他仅通过简单的数学计算得出这个结果。他专门分析了人工智能“推理”阶段的用电量。...
-
OpenAI新功能揭秘:多模态时代的到来
作者 | 崔皓 审校 | 重楼 摘要 本文介绍了OpenAI的最新进展,重点关注其在多模态技术领域的突破。文章首先探讨了GPT-4 Turbo模型的优化和多模态功能的融合,如图像生成和文本到语音转换。随后,作者深入解析多模态技术的工作原理,特别是文本到图...
-
刚刚,出行行业首个!百亿估值玩家联合国有运营商开卷大模型
首个落地的交通出行大模型,它来了! 这两年的出行行业,有的卷补贴、规模,有的卷自动驾驶、卷定制车,终于有人开始卷大模型了! 名为“阡陌”,背后是国家队级别的选手:T3出行和中国电信。 T3出行,出行领域快速崛起的明星玩家,曾创造77亿元融资业内纪录,估值早...
-
网易云音乐推荐系统的冷启动技术
一、问题背景:冷启动建模的必要性和重要性 作为一个内容平台,云音乐每天都会有大量的新内容上线,虽然相较于短视频等其它平台,云音乐平台的新内容数量相对较少,但实际数量可能远远超出大家的想象。同时,音乐内容与短视频、新闻、商品推荐又有着显著的不同,音乐的...
-
【PaLM2】PaLM2 大语言模型与 Bard 使用体验
欢迎关注【youcans的学习笔记】原创作品,火热更新中 【Google I/O 2023】PaLM2 大语言模型与 Bard 使用体验 1. PaLM2 大型语言模型 1.1 谷歌发布 PaLM2 1.2 PaLM2 的功能与性能...
-
中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
可以说,AI 初创公司 LinkSoul.Al 的这些开源项目让海外开源大模型在国内的普及和推广速度与国际几乎保持了一致。 7 月 19 日,Meta 终于发布了免费可商用版本 Llama 2,让开源大模型领域的格局发生了巨大变化。 Llama 2 模...
-
UNC斯坦福等曝光GPT-4V意外漏洞,被人类哄骗数出8个葫芦娃!LeCun和Jim Fan震惊了
GPT-4V诞生后,惊艳的多模态能力让网友惊呼连连,连OpenAI总裁Greg Brockman都不断在X上安利。 不过,最近大家发现,只要打乱布局,GPT-4V就会被曾经解决的著名计算机视觉难题——「吉娃娃还是松饼」,再次难倒…… UCSC教授Xin...
-
AI视野:Runway推新功能运动笔刷;iPhone16将引入生成式AI;百度AI编程工具限时免费;元象大模型向全社会开放
???AI新鲜事 Runway推新功能运动笔刷 随手一涂静图变动图 Runway推出的新功能「运动笔刷」让Gen-2视频生成工具再次颠覆AI圈,摆脱文字依赖,手势操作即可赋予静态图片动感,创造可控制生成内容的新方法。 苹果计划在iPhone16上推出i...
-
文心一言4.0内测入口 文心一言新版本有哪些功能
百度文心一言4.0版本现在已经可以申请测试,4.0版本效果全面升级,能更好地帮助您的工作和生活,同时每3小时内畅享100次问答,这里我们来看下文心一言4.0版本的申请入口。 文心一言4.0(点击进入)是百度最新推出的一款人工智能大模型,它可以在多个场景和...
-
2028年人类将迎来AGI:DeepMind联合创始人长文预测未来AI发展
10月26日,在X上有三万订阅的Dwarkesh Podcast(矮人播客)主持人Dwarkesh Patel采访了谷歌DeepMind的创始人兼首席AGI科学家Shane Legg。 他们讨论了AGI出现的时间节点、可能的AGI新架构、作为下一个行业标...
-
语言作“纽带”,拳打脚踢各模态,超越Imagebind
北大联合腾讯打造了一个多模态15边形战士! 以语言为中心,“拳打脚踢”视频、音频、深度、红外理解等各模态。 具体来说,研究人员提出了一个叫做LanguageBind的多模态预训练框架。 用语言作为与其它模态之间的纽带,冻结语言编码器,然后用对比学习方法...
-
通用异常检测新曙光:华科大等揭秘GPT-4V的全方位异常检测表现
异常检测任务旨在识别明显偏离正常数据分布的异常值,在工业检验、医学诊断、视频监控和欺诈检测等多个领域都发挥了重要作用。传统的异常检测方法主要依赖于描述正常数据分布以进行正异常样本的区分。然而,对于实际的应用而言,异常检测也需要理解数据的高层语义,从而深入...
-
AIGC 爆火,浪潮信息要做大模型的数据存储大底座
AIGC 在 2023 年爆火,各类大模型层出不穷,参数动辄达到千亿数量级。这些背后,数据的类型和形式也走向复杂多样。例如大模型会采用到我们真实物理世界中的文字、视觉、音频、3D、雷达、多谱等复杂多样的不同模态信号和数据,数据则又存在结构化、半结构化、非结...
-
【AI】文心一言的使用
一、获得内测资格: 1、点击网页链接申请:https://yiyan.baidu.com/ 2、点击加入体验,等待通过 二、获得AI伙伴内测名额 1、收到短信通知,点击链接 网页Link:https://chat.baidu.com/page/l...
-
摸着OpenAI过河,百度文心一言能否“重拳出击”?
“文心一言”对标ChatGPT,饱含争议。文心一言作为一款语言大模型,并提出了自己在技术对就业的影响方面的理解,现阶段正处于摸着OpenAI过河的时候,路该如何走? GPT-4太惊艳,压力给到文心一言 这段时间,GPT-4和文心一言前后脚和大家...
-
大语言模型汇总(ChatGPT、盘古、通义、文心一言、混元)
首先就是OpenAI所提出的GPT相关模型,也是目前最火的大语言模型,发布版本已经到了4.0 1.ChatGPT 官网:https://chat.openai.com/chat 如下图是自然语言功能的使用示例 2.华为的盘古模型 盘古模型是华为开发...
-
文心一言(中国版ChatGPT)
百度十年,汇成一言 文心一言 文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言是知识增强的大语言模型,基于飞桨深...
-
OpenAI遭黑客攻击,定制版GPT虽迟但到:今日全量上线
让全球网友崩溃的ChatGPT宕机事件,有了最新消息。 OpenAI通告称,这次事件中发现了服务器遭受黑客攻击的记录。 开发者大会后本已经高涨的流量,加上黑客攻击,导致服务器不堪重负,原本周一全量上线GPTs的计划也被迫推迟。 不过好消息是,就在刚刚,...
-
让AI模型成为GTA五星玩家,基于视觉的可编程智能体Octopus来了
电子游戏已经成为如今现实世界的模拟舞台,展现出无限可能。以游戏《侠盗猎车手》(GTA)为例,在 GTA 的世界里,玩家可以以第一人称视角,在洛圣都(游戏虚拟城市 当中经历丰富多彩的生活。然而,既然人类玩家能够在洛圣都里尽情遨游完成若干任务,我们是否也能有一...
-
太疯狂,GPTs上线:奥特曼表演手搓马斯克大模型,还有人已搞出第三方市场
前几天开发者大会上 OpenAI 说过,只要买会员,你就可以基于新版 GPT-4 大模型开发自己的应用,大家都跃跃欲试。 今天凌晨,这个叫 GPTs 的功能正式开放了。 所有的 ChatGPT Plus 订阅用户都可以从头到脚自定义 GPT,无需任何编...