-
蚂蚁多模态团队在视频多模态方向的技术探索
一、概述 视频多模态检索在蚂蚁内部有着广泛的应用。视频多模态检索具体包括两个方向,一个是视频-文本的语义检索,另外一个是视频-视频的同源检索。 视频-文本的语义检索方向旨在通过文本检索与其语义相近的视频,其检索文本未必在检索到的视频描述中直接出现,但检...
-
小鹏汽车国内首发落地端到端大模型:2025实现类似L4级智驾
快科技5月20日消息,在今日举办的小鹏汽车AI DAY上,小鹏汽车CEO何小鹏官宣端到端大模型上车。 其称:小鹏是国内首个量产上车的端到端大模型,多个网络联合训练、协调一致,解决泛化问题,提升大模型的可解释性及可诊断性,让AI模型成长及迭代更迅速。” 同...
-
AI代驾、AI泊车上线 小鹏汽车再进化:窄小车位大救星
快科技5月20日消息,小鹏汽车AI DAY发布会正在进行中,基于端到端大模型的上车,小鹏汽车首发了AI代驾和AI泊车功能。 据介绍,AI代驾能够主动洞察并且学习司机的驾驶习惯, 能够一键开启通勤智驾, 并且AI代驾也会洞察你的选路偏好,同时AI代驾也会学...
-
Ilya离开OpenAI内幕曝光:奥特曼砍他团队算力,优先搞产品赚钱,离职吐槽就要失去股权
连发13条推文! OpenAI超级对齐负责人Jan Leike,也就是刚刚追随Ilya离开公司的那位,自曝离职的真正原因,以及更多内幕。 一来算力不够用,承诺给超级对齐团队的20%缺斤少两,导致团队逆流而行,但也越来越困难。 二来安全不重视,对AGI的安...
-
谷歌Gemini 1.5技术报告:轻松证明奥数题,Flash版比GPT-4 Turbo快5倍
今年 2 月,谷歌上线了多模态大模型 Gemini1.5,通过工程和基础设施优化、MoE 架构等策略大幅提升了性能和速度。拥有更长的上下文,更强推理能力,可以更好地处理跨模态内容。 本周五,Google DeepMind 正式发布了 Gemini 1.5...
-
高德将落地首个时空智能城市:开放云睿大模型
快科技5月20日消息,据媒体报道,高德地图旗下高德云图宣布将逐步开放云睿时空融合大模型和云境AI三维重建平台,打造时空智能体应用生态。 据悉,高德云睿时空大模型是业界首个以地图点、线、面、体等时空类数据为训练基础的大模型。它能够融合交通、零售等多行业的时空...
-
从“天价”到“骨折价”,大模型要变天了
十年后,国内云厂商又打起来了! 近一个月,国内云厂商掀起了新一轮的大模型降价潮。这意味着AI竞争已经不仅仅是一场军备技术竞赛这么简单,各头部厂商也在考虑如何赚钱了。 在这场价格战中,包括火山引擎、阿里,还有智谱AI、面壁智能这样的明星创业团队都卷了进来。各...
-
众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸
大模型排行榜哪家强?还看LLM竞技场~ 截至此刻,已有共计90名LLM加入战斗,用户总投票数超过了77万。 图片 然而,在网友们吃瓜调侃新模型冲榜、老模型丧失尊严的同时, 人家竞技场背后的组织LMSYS,已经悄悄完成了成果转化:从实战中诞生的最有说服力的...
-
GPT-4通过图灵测试,胜率高达54%!UCSD新作:人类无法认出GPT-4
GPT-4可以通过图灵测试吗? 当一个足以强大的模型诞生之后,人们往往会用图灵测试去衡量这一LLM的智能程度。 最近,来自UCSD的认知科学系研究人员发现: 在图灵测试中,人们根本无法区分GPT-4与人类! 论文地址:https://arxiv.org...
-
国产大模型的价格已经卷出网约车大战和百亿补贴的味儿了
登录就送500w tokens! 1 块钱 100w tokens!一降再降!!仅需0. 0008 元/千tokens! 没错,互联网价格战熟悉的“味”,已经悄无声息的打到了大模型的战场。 技术狂飙了一年,大模型公司们早就按捺不住要搅弄商业风云的心, 5...
-
GPT-4o团队引发OpenAI组织创新热议,应届生领衔Sora,本科生带队GPT-1,经验职级都是浮云
GPT-4o亮相没两天,背后Omni团队就被扒了个底朝天: 领衔者,是DALL·E2/3研究团队成员、Scaling Law共同提出者。 更深层次的,团队组成和Sora有着类似的规律:不怕启用新人,并且狠狠重任新人。 这里的“新人”,可能是本科or硕博刚毕...
-
GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4
OpenAI在发布会上官宣GPT-4o之后,各路大神也开始了对这个新模型的测评,结果就是,GPT-4o在多项基准测试上都展现了SOTA的实力。 别家发布会都在画饼,OpanAI却总能开出一种「欲扬先抑」的效果,惊喜全在发布会之后。 基准测试结果 首先...
-
周鸿祎:大模型不会摧毁每一个行业 将打造大模型工厂
快科技5月20日消息,周鸿祎最近回到家乡武汉,参加第六届全国青年企业家大会”,分享了自己对AI的思考。 周鸿祎认为,新质生产力的核心是科技创新。在数字化领域,人工智能和大模型无疑是当前最热门的话题。 有人担忧大模型会摧毁每一个行业,但我却认为它会重塑每个行...
-
腾讯 PCG 搜广推机器学习框架GPU 性能优化实践
一、为什么 GPU 推荐模型训练框架是刚需 1. PCG 算力集群缺点 最开始的时候,腾讯 PCG 所有的推荐模型训练都是使用 CPU。但随着业务的深入,以及深度学习模型的发展,PCG 算力集群在做下一代推荐模型时会遇到各种问题: 首先,系统网络带宽...
-
GPT-4o团队引发OpenAI组织创新热议!应届生领衔Sora,本科生带队GPT-1,经验职级都是浮云
GPT-4o亮相没两天,背后Omni团队就被扒了个底朝天: 领衔者,是DALL·E2/3研究团队成员、Scaling Law共同提出者。 更深层次的,团队组成和Sora有着类似的规律:不怕启用新人,并且狠狠重任新人。 这里的“新人”,可能是本科or硕博刚毕...
-
微博已接入阿里云通义大模型 覆盖AI评论、明星陪聊等功能
站长之家(ChinaZ.com)5月18日 消息:据阿里云官方消息,微博宣布已成功将阿里云的大模型技术融入其核心业务,开启了一个全新的智能互动时代。这一融合不仅覆盖了AI评论、AI明星陪聊、虚拟角色帐号、星座大模型,更在信息流广告创意生成等领域展现出了显著...
-
突发!OpenAI再失一名高管,安全主管辞职
5月18日凌晨,OpenAI安全主管、超级对齐负责人Jan Leike在社交平台宣布,离开OpenAI。 这也是本周三OpenAI联合创始人兼首席科学家Ilya Sutskever辞职之后,又有一名高管辞职。 相信随着二人的离开,后续还会有不少人离开Ope...
-
阿里云:微博已接入通义大模型 应用于AI评论、AI明星陪聊等
快科技5月17日消息,根据阿里云”官方消息,微博已成功将大模型技术融入其业务中,包括AI评论、AI明星陪聊、虚拟角色帐号、星座大模型以及信息流广告创意生成等多个方面,且已初显成效。 据悉,微博是阿里云的长期合作伙伴,双方的合作历史已近十年。在面对突发的热点...
-
HuggingFace教你怎样做出SOTA视觉模型
前有OpenAI的GPT-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。 其他从业者在震撼之余,也再次开始思考怎么追赶这些超级模型了。 刚好在这时,HuggingFace和法国索邦大学的一篇论文,总结出了构建视觉大模型的关键经验,给开发者指明了一...
-
恒生电子首席科学家白硕:长文本和多模态是生成式AI落地金融的两大利器
嘉宾丨白硕 采访/撰稿丨张洁 编辑丨千山 出品 | 51CTO技术栈(微信号:blog51cto) 在千行百业中,金融业一贯是新技术的早期采用者。无论是在数字化水平,还是在关于产业AI化的探索上,都走在了前列。因此,金融业也被视为生成式AI应用落地的潜力...
-
Ilya离职后第一个动作:点赞了这篇论文,网友抢着传看
自Ilya Sutskever官宣离职OpenAI后,他的下一步动作成了大家关注焦点。 甚至有人密切关注着他的一举一动。 这不,Ilya前脚刚刚点赞❤️了一篇新论文—— ——网友们后脚就抢着都看上了: 论文来自MIT,作者提出了一个假说,用一句话总结...
-
70B模型秒出1000token,代码重写超越GPT-4o,来自OpenAI投资的代码神器Cursor团队
70B模型,秒出1000token,换算成字符接近4000! 研究人员将Llama3进行了微调并引入加速算法,和原生版本相比,速度足足快出了快了13倍! 不仅是快,在代码重写任务上的表现甚至超越了GPT-4o。 这项成果,来自爆火的AI编程神器Curso...
-
AI日报:百度搜索11%结果由AI生成;腾讯混元支持生成16s视频;谷歌发布开源视觉语言模型PaliGemma;Hugging Face承诺免费提供1000万美元GPU计算资源
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、李彦宏:百度搜索已有11%结果...
-
腾讯汤道生:打破AI“落地玻璃”,让可见变为可用
(图:腾讯集团高级执行副总裁、云与智慧产业事业群CEO 汤道生) 5月17日,“腾讯云生成式AI产业应用峰会”在北京举办,大会披露了腾讯混元大模型、行业大模型的最新能力升级,并推出知识引擎等多个智能工具和场景应用。 会上,基于混元大模型的一站式AI智...
-
腾讯混元升级模型矩阵,云上推出256k长文模型
大模型落地加速,“产业实用”成为发展共识。 2024年5月17日,腾讯云生成式AI产业应用峰会在北京召开,公布大模型研发、应用产品的系列进展。 腾讯混元大模型能力持续升级,多个版本模型hunyuan-pro、hunyuan-standard、hunyua...
-
腾讯混元大模型支持生成16s视频 并推出AI智能体平台腾讯元器
在腾讯云生成式AI产业应用峰会上,腾讯公司展示了其最新的AI创新成果——腾讯元器。这是一个一站式的AI智能体创作与分发平台,它基于腾讯的混元大模型构建,为企业提供了一个全新的解决方案。 通过腾讯元器,企业和开发者现在可以直接创建智能体,并利用腾讯官方提供的...
-
单次支持38万字输入!腾讯混元推出256k长文模型,通过腾讯云向企业和个人开发者开放
AI大模型技术正成为推动高质生产力发展的关键力量,在与千行百业的融合中发挥着重要作用。腾讯混元大模型通过采用混合专家模型 (MoE 结构,已将模型扩展至万亿级参数规模,增加“脑”容量提升预测性能的同时,推动了推理成本下降。作为通用模型,腾讯混元在中文表...
-
腾讯混元将发布大模型C端App腾讯元宝:超万亿参数规模
在腾讯云生成式AI产业应用峰会上,腾讯表示,将于5月30日正式发布面向C端的全新App——“腾讯元宝”。这款应用的背后,是腾讯全链路自研的通用大语言模型——混元大模型,它以其超过万亿的参数规模,展现了卓越的中文理解与创作能力、逻辑推理能力以及可靠的任务执行...
-
多模态GPT-4o来了,最先嗨起来的是一波女性用户
整场发布会最为重磅的发布之一,莫过于 OpenAI 团队成员对于新模型语音能力的演示,搭载了 GPT-4o 的 ChatGPT,不仅真正实现了实时响应,可以任意打断,更重要的是,ChatGPT 第一次拥有了“察言观色”的能力,它能看到用户表情,理解用户语气...
-
李彦宏:百度搜索已有11%结果由AI生成
站长之家(ChinaZ.com)5月17日 消息:在百度2024年第一季度财报电话会上,公司创始人、董事长兼首席执行官李彦宏深入探讨了百度当前的业务表现和未来发展方向。他强调,尽管面临宏观经济疲软的挑战,百度仍致力于通过人工智能技术推动用户体验的创新。 李...
-
李彦宏:百度11%的搜索结果都由AI生成
快科技5月17日消息,百度创始人、董事长兼首席执行官李彦宏在2024年第一季度财报电话会议上透露,目前百度搜索结果中已有11%由AI生成。 李彦宏认为,尽管百度搜索的AI重构工作仍处于早期阶段,但搜索服务最有可能成为AI时代的杀手级应用”。 百度在AI领...
-
GPT-4o:实现跨越文本与视觉的智能交互 原创
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 摘要 OpenAI最新发布的GPT-4o模型及其在多模态处理上的卓越能力,标志着人机交互迈向新的高度。GPT-4o能够处理文本、音频、...
-
GPT-4o 17人Omni金牌团队首揭秘!清北上交中科大6位华人领衔
几天前的发布会上,OpenAI再次向全世界证明,它永远走在AI领域的最前沿。 眼看着《Her》中的Samantha在自己眼前成真,那一刻,全世界为之振奋。 就在刚刚,GPT-4o的关键团队信息,也被公布了出来。 就是这个名为「omni」的团队,发挥出了不可...
-
OpenAI CEO:GPT-5会很特别 可能类似于一个 “虚拟大脑”
OpenAI 首席执行官 Sam Altman 在接受采访时透露了 GPT-4o 和 GPT5的一些信息。GPT-4o 是一款多模态大模型,可以跨文本、视频和音频进行推理。Sam Altman表示,他早就有用语音控制计算机的想法,而 GPT-4o 的综合推...
-
周鸿祎称留给谷歌的时间不多了 建议所有产品开源对抗OpenAI
在本周的谷歌I/O204开发者大会上,谷歌发布了Gemini1.5Flash、文生图工具Imagen3以及视频生成模型Veo等一系列创新产品。然而,这场技术盛宴并未得到360集团创始人周鸿祎的完全认可。近日,周鸿祎通过微博发表长文,对谷歌I/O大会进行了深...
-
百度李彦宏:小米、联想、蔚来接入文心大模型
快科技5月16日消息,今日,百度发布2024年第一季度财报,总营收315亿元,同比增长1%,归属百度的净利润70.11亿元,同比增长22%。 据媒体报道,在财报电话会上,百度创始人李彦宏透露,继上季度与中国三星、荣耀合作后,本季度,小米、OPPO、vivo...
-
粘土特效带火AI修图 美图距离Remini还差一「手」
上传一张图片,点击黏土特效,你将收获一张“小羊肖恩”风格的全新卡通照,无论是图片里的人、物、景,每个细节都如同黏土捏得一样立体。 黏土特效在社交平台风靡,拥有该功能的AI修图应用程序Remini也随即收获了下载量。各种黏土照被产出后,有人嫌丑“不懂为何流行...
-
生成式AI时代下的企业,该如何充分挖掘数据价值?
在数字经济迅猛发展的时代背景下,数据已经上升为核心生产要素,不仅有力促进了各行各业的创新转型升级,更成为推动经济增长的重要力量。 特别是近年来生成式AI快速发展,极大地改变了企业决策的方式和效率。而在这一过程中,数据作为智能的“燃料”,其质量和数量直接...
-
AI日报:抖音测试AI购物小助手;GPT-4o再秀神操作惊呆网友;华为“天生会画”App发布;小米大模型通过备案
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 1、抖音试水AI电商 测试AI购物小助手 抖音电商正在测试首款面向C端的AI电商服务“AI购物小助手”,...
-
通义千问 2.5 “客串” ChatGPT4,你分的清吗?
作者:张添翼、董艺荃 引子 OpenAI 发布了最新的 GPT-4o 模型,通义千问也在前不久刚发布通义千问 2.5,已经和 GPT-4-Turbo 不分伯仲: 既然目前还没有和 GPT-4o 文本生成能力的对比数据,就让我们来和大模型一起做个游...
-
GPT-4o再秀神操作,“复现”OpenAI总裁讲课,网友当真了
OpenAI总裁兼联合创始人Greg再次大秀GPT-4o操作,结果网友直接缅怀DALL-E。 图片 直接看效果。 图片 文本拼写达到惊人的一致!手部细节、光照全都有,甚至后背上的Logo也完全正确。 有网友表示:恍惚间还以为真的是本人在讲课。 图片 也有...
-
百度第一季度营收315亿元 李彦宏:文心大模型将更加实惠和高效
百度公司今日公布了截至2024年3月31日的2024年第一季度财务报告,本季度,百度总营收达到315亿元,同比增长1%。 在净利润方面,百度也取得了亮眼的成绩。归属于百度的净利润为54亿元,而按非美国通用会计准则(Non-GAAP)计算,净利润更是高达70...
-
花1块钱就有上万篇内容,新晋AI顶流把价格打下来了
过去几天,AI行业大事件高度密集。 先是OpenAI贴脸开大发布GPT-4o,而后谷歌I/O大会原地回击掏出华丽升级Gemini全家桶。放眼国内AI赛道,备受关注的则是字节终于高调发布豆包大模型家族。 昨天上午,当火山引擎总裁谭待宣布豆包通用模型推理输入价...
-
小米大语言模型MiLM正式通过大模型备案:将应用于汽车、手机、智能家居等产品
快科技5月16日消息,小米官方宣布,小米大语言模型MiLM正式通过大模型备案。 据了解,通过备案后,小米大模型将逐步应用于小米公司的汽车、手机、智能家居等产品中,通过端云结合,既带来单个设备的智能提升,也实现场景内和场景间多设备的协同,为人车家全生态战略赋...
-
WOT大会日程上线:我们找来数十位大模型实践企业现身说法
这两天的技术圈里,估计大家都在摩拳擦掌等待体验OpenAI的GPT-4o(o为Omni缩写,意为“全能”)有多“全能”吧。 我们无意给市场泼冷水,只是要提醒大家,想要让大模型真正落地,市场的热,并不意味着应用实践的成熟。尤其在企业级场景中,为什么大模型落...
-
识别细胞也能用大模型了!清华系团队出品,已入选ICML 2024 | 开源
大模型带来的生命科学领域突破,刚刚再传新进展。 来自清华系,使用大模型实现了单细胞身份识别,同时模型LangCell也正式对外开源。 它不仅可以准确识别细胞身份,还具有很强的零样本分析能力,论文已被ICML 2024录⽤。 LangCell的数据集中包...
-
字节内部AI“赛马”结束,大模型全跟豆包姓,一出手就点名阿里百度
过去一年,围绕着字节AI的几个谜团,终于都在今天被揭开了。 5 月 15 日火山引擎Force原动力大会上,字节大模型进行了全系列更名,从云雀大模型升级为豆包大模型家族,一口气发布了 9 个豆包模型,其中包括通用模型pro版、通用模型lite版以及各个领域...
-
GPT-4o被全球网友玩坏了 谷歌:终究是错付了!
在社交软件上,OpenAI的GPT-4o成为了热议的焦点。这款最新旗舰产品以其全能的特性——接受文字、音频、图像的任意组合输入,并生成相应的文字、音频、图像输出——迅速吸引了全球网友的关注。GPT-4o的免费特性更是让其成为了互联网上的新宠。 在5月14日...
-
小米AI大模型MiLM通过备案 将应用于手机、汽车产品中
5月16日,小米公司宣布,小米大语言模型MiLM正式通过大模型备案,小米大模型将逐步应用于小米汽车、手机、智能家居等产品中。 5月15日,北京市生成式人工智能服务新增已备案信息正式公布。此次19家企业新增备案,包括了北京小米科技有限责任公司“小米”、腾讯...
-
UIUC发布StarCoder2-15B-Instruct代码大模型 无需OpenAI数据登上性能榜单
UIUC与BigCode组织的研究者们最近发布了StarCoder2-15B-Instruct代码大模型,这一创新成果在代码生成任务方面取得了显著突破。这款模型成功超越了CodeLlama-70B-Instruct,登上了代码生成性能榜单之巅。 StarC...