-
腾讯问卷推出AI功能 已接入腾讯混元大模型
腾讯问卷宣布推出全流程 AI 解决方案,基于腾讯混元大模型,帮助企业提升调研的质量与效率。 腾讯问卷是腾讯旗下在线问卷调查平台,服务覆盖问卷调查、信息上报、在线测评等工作场景,帮助用户回收34亿份问卷。通过腾讯混元大模型的接入,腾讯问卷在问卷设计、投放、回...
-
一文读懂 GPT-4o vs GPT-4 Turbo
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - GPT-4o 模型 。 在 2024 年 5 月 13 日,OpenAI 创新性地推出了其最先进、最前沿的模型 GPT-4o,这是标志着人工智能聊天机器人...
-
AI日报:骨折价!通义千问模型费用下降97%;豆包大模型也拼性价比;从零复现Llama3代码库爆火;智谱开源大模型CogVLM2
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、阿里云宣布GPT-4级主力模型...
-
探秘采集翻译插件:打破语言壁垒的利器
在当今全球化的时代,跨语言交流变得愈发重要。为满足这一需求,各种翻译工具层出不穷,其中,采集翻译插件凭借其便捷性和实用性,受到越来越多人的青睐。本文将从多个方面详细探讨采集翻译插件的功能、应用场景及未来发展,带领读者一起领略这一技术的魅力。一、采集翻译插件...
-
蚂蚁多模态团队在视频多模态方向的技术探索
一、概述 视频多模态检索在蚂蚁内部有着广泛的应用。视频多模态检索具体包括两个方向,一个是视频-文本的语义检索,另外一个是视频-视频的同源检索。 视频-文本的语义检索方向旨在通过文本检索与其语义相近的视频,其检索文本未必在检索到的视频描述中直接出现,但检...
-
谷歌Gemini 1.5技术报告:轻松证明奥数题,Flash版比GPT-4 Turbo快5倍
今年 2 月,谷歌上线了多模态大模型 Gemini1.5,通过工程和基础设施优化、MoE 架构等策略大幅提升了性能和速度。拥有更长的上下文,更强推理能力,可以更好地处理跨模态内容。 本周五,Google DeepMind 正式发布了 Gemini 1.5...
-
OpenAI“杀疯了”,GPT–4o模型保姆级使用教程!一遍就会!
5月14日凌晨1点,OpenAI发布了名为GPT-4o 最新的大语言模型,再次引领了人工智能领域的又一创新浪潮,让整个行业都为之震动。 据OpenAI首席技术官穆里-穆拉提(Muri Murati)表示,GPT-4o是在继承GPT-4智能的基础上,对文本...
-
谷歌数学版Gemini解开奥赛难题,堪比人类数学家!
四个月的迭代,让Gemini 1.5 Pro成为了全球最强的LLM(几乎)。 谷歌I/O发布会上,劈柴宣布了Gemini 1.5 Pro一系列升级,包括支持更长上下文200k,超过35种语言。 与此同时,新成员Gemini 1.5 Flash推出,设计...
-
时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3
这几天,全世界的目光仿佛都被OpenAI发布的GPT-4o所吸引,与此同时,OpenAI的挑战者们也在同步创造历史。 就在5月14日,阿布扎比先进技术研究委员会(ATRC)下属的技术创新研究所(TII),发布了新一代的Falcon 2模型。 Falco...
-
我们一起聊聊AI模型组合指南
实施需要周密的计划、资源管理以及采用现代部署实践和工具。 译自A Guide to Model Composition,作者 Sherlock Xu。 考虑一款旨在识别和分类野生动物照片的 AI 驱动的图像识别应用程序。您上传一张远足时拍摄的照片,几分钟...
-
AI如何使机器人更具自主性和适应性?
在工业自动化技术领域,最近有两个热点很难被忽视:人工智能(AI 和英伟达(Nvidia 。 毫不意外,这两者密切相关,因为英伟达现在不仅仅局限于其最开始的图形处理单元(GPU ,正在将其GPU技术扩展到数字孪生领域,同时紧密连接着新兴的AI技术。 最近...
-
加州大学最新!CarDreamer:全面、灵活的自动驾驶算法测试开源平台
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 为了在复杂的真实世界场景中安全导航,自动驾驶汽车必须能够适应各种道路条件并预测未来事件。基于世界模型的强化学习(RL)已经成为一种有前景的方法,通过学习和预测各种环境...
-
Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA
GPT-4o的横空出世,再次创立了一个多模态模型发展的新范式! 为什么这么说? OpenAI将其称为「首个『原生』多模态」模型,意味着GPT-4o与以往所有的模型,都不尽相同。 传统的多模态基础模型,通常为每种模态采用特定的「编码器」或「解码器」,将不...
-
GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4
OpenAI在发布会上官宣GPT-4o之后,各路大神也开始了对这个新模型的测评,结果就是,GPT-4o在多项基准测试上都展现了SOTA的实力。 别家发布会都在画饼,OpanAI却总能开出一种「欲扬先抑」的效果,惊喜全在发布会之后。 基准测试结果 首先...
-
OpenAI CEO下场回应「封口协议」,争议还是到了股权利益上,奥特曼:我的锅
自从 Ilya 和 超级对齐负责人 Jan 离职后,OpenAI 内部还是心散了,后续也有越来越多的人离职,同时也引发了更多的矛盾。 昨天,争议的焦点来到了一份严格的「封口协议」。 OpenAI 前员工 Kelsey Piper 爆料,任何员工的入职文...
-
探秘ThinkCMF爬虫:技术原理、应用与未来趋势
在数字化信息时代,网络爬虫作为一种自动化数据采集工具,正日益受到人们的关注。ThinkCMF作为一款基于ThinkPHP+MYSQL的内容管理框架(CMF),其灵活性和扩展性使得针对它的爬虫技术也颇具研究价值。本文将深入探讨ThinkCMF爬虫的技术原理、...
-
突发!OpenAI再失一名高管,安全主管辞职
5月18日凌晨,OpenAI安全主管、超级对齐负责人Jan Leike在社交平台宣布,离开OpenAI。 这也是本周三OpenAI联合创始人兼首席科学家Ilya Sutskever辞职之后,又有一名高管辞职。 相信随着二人的离开,后续还会有不少人离开Ope...
-
恒生电子首席科学家白硕:长文本和多模态是生成式AI落地金融的两大利器
嘉宾丨白硕 采访/撰稿丨张洁 编辑丨千山 出品 | 51CTO技术栈(微信号:blog51cto) 在千行百业中,金融业一贯是新技术的早期采用者。无论是在数字化水平,还是在关于产业AI化的探索上,都走在了前列。因此,金融业也被视为生成式AI应用落地的潜力...
-
腾讯汤道生:打破AI“落地玻璃”,让可见变为可用
(图:腾讯集团高级执行副总裁、云与智慧产业事业群CEO 汤道生) 5月17日,“腾讯云生成式AI产业应用峰会”在北京举办,大会披露了腾讯混元大模型、行业大模型的最新能力升级,并推出知识引擎等多个智能工具和场景应用。 会上,基于混元大模型的一站式AI智...
-
腾讯混元升级模型矩阵,云上推出256k长文模型
大模型落地加速,“产业实用”成为发展共识。 2024年5月17日,腾讯云生成式AI产业应用峰会在北京召开,公布大模型研发、应用产品的系列进展。 腾讯混元大模型能力持续升级,多个版本模型hunyuan-pro、hunyuan-standard、hunyua...
-
GPT-4o 17人Omni金牌团队首揭秘!清北上交中科大6位华人领衔
几天前的发布会上,OpenAI再次向全世界证明,它永远走在AI领域的最前沿。 眼看着《Her》中的Samantha在自己眼前成真,那一刻,全世界为之振奋。 就在刚刚,GPT-4o的关键团队信息,也被公布了出来。 就是这个名为「omni」的团队,发挥出了不可...
-
OpenAI CEO:GPT-5会很特别 可能类似于一个 “虚拟大脑”
OpenAI 首席执行官 Sam Altman 在接受采访时透露了 GPT-4o 和 GPT5的一些信息。GPT-4o 是一款多模态大模型,可以跨文本、视频和音频进行推理。Sam Altman表示,他早就有用语音控制计算机的想法,而 GPT-4o 的综合推...
-
GPT-4o 17人Omni金牌团队首揭秘!清北上交中科大六位华人领衔
几天前的发布会上,OpenAI再次向全世界证明,它永远走在AI领域的最前沿。 眼看着《Her》中的Samantha在自己眼前成真,那一刻,全世界为之振奋。 就在刚刚,GPT-4o的关键团队信息,也被公布了出来。 就是这个名为「omni」的团队,发挥出了不...
-
GPT-4o手写板书以假乱真惊呆网友!杀死谷歌翻译,代码建模无所不能
GPT-4o到底有多强?只有用过才能知道。这两天,网友们不仅探索出了很多全新ChatGPT的炫酷用法,也逐渐开始意识到,这标志这OpenAI将逐渐替代谷歌曾经的地位,全面接管AGI时代。 随着越来越多人开始试用GPT-4o,大家发现发布会上的demo真的...
-
识别细胞也能用大模型了!清华系团队出品,已入选ICML 2024 | 开源
大模型带来的生命科学领域突破,刚刚再传新进展。 来自清华系,使用大模型实现了单细胞身份识别,同时模型LangCell也正式对外开源。 它不仅可以准确识别细胞身份,还具有很强的零样本分析能力,论文已被ICML 2024录⽤。 LangCell的数据集中包...
-
GPT-4o被全球网友玩坏了 谷歌:终究是错付了!
在社交软件上,OpenAI的GPT-4o成为了热议的焦点。这款最新旗舰产品以其全能的特性——接受文字、音频、图像的任意组合输入,并生成相应的文字、音频、图像输出——迅速吸引了全球网友的关注。GPT-4o的免费特性更是让其成为了互联网上的新宠。 在5月14日...
-
字节发布豆包大模型,以普惠AI推动企业业务创新
根据麦肯锡的报告显示,到2030年,大模型推动的全球经济增量将达到49万亿人民币,其中中国部分的经济增量将达到14万亿人民币。这里面既包括大模型对现有工作效率的提升,也包括新技术所带来的新场景和新业态。 虽然我们看到更多的企业和开发者在积极拥抱大模型,甚...
-
GPT-4o成全球网友新玩具,秒秒钟纸质原型转录初始HTML,网友:谷歌你是一点流量摊不上啊
好啊,不愧是OpenAI最新旗舰,打开各个社交软件,GPT-4o的上手测试都唰唰唰往我首页推。 请!看! 这,就是用上GPT-4o,花不到30s时间,通过单个prompt把一个电子表格中的内容生成了完整的图表和统计分析。 在过去,在Excel里做这玩意儿...
-
MiniMax推出人生搭子「海螺 AI」 已接入自研多模态大模型
MiniMax 公司推出了一款人生搭子产品,名为「海螺 AI」,也可以称为「小海螺」。 这款产品可以帮助学生、职场新人、自由工作者、创作者等各类人群,作为一个外挂大脑和人生搭子,帮助化解信息过载和高速运转带来的压力。产品背后接入了 MiniMax 自研的多...
-
字节跳动豆包大模型发布,火山引擎全栈 AI 服务助力企业智能化转型
火山引擎总裁 谭待 企业要做好大模型落地,面临模型效果、推理成本、落地难度的三大关键挑战:既要有好的基础大模型做支撑,解决复杂难题,也要有低成本的推理服务让大模型被广泛应用,还要更多工具、平台和应用帮助企业做好场景落地。 ——谭待 火山引擎总裁...
-
AI日报:谷歌终极杀器硬刚GPT-4o、Sora;字节推出豆包大模型“全家桶”;阿里再推AI虚拟试衣神器;腾讯开源混元文生图大模型
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 1、谷歌急了,终极杀器对打GPT-4o 视频模型Veo硬刚Sora 谷歌近日发布了一系列强大的AI工具,...
-
OpenAI和Google接连两天的大动作,都想让AI助手成“精”
看过昨天OpenAI的春季发布后,不难猜到,在今天的谷歌I/O大会上,必然会有关于AI助手的介绍。 毕竟,抢在谷歌I/O大会前发布GPT-4o的Altman,已经显示出了十足的针对性,凭借Altman的手段,自然也有着十足的把握做到精准打击,将这场“红蓝...
-
GPT-4o干掉初创全网实测,马斯克Karpathy等大佬纷表不服:OpenAI不过如此
OpenAI一夜之间,又干掉了一大批初创公司。 官方公布的全能模型GPT-4o的炸裂演示,即便过去了一天,依旧让全网深陷其中,无法自拔。 凭借实时语音视频对话,GPT-4o已经深入教育、翻译、视频会议等领域的变革。 OpenAI科学家Lilian W...
-
为什么腾讯认为DiT架构是未来的主流?做了哪些改进?
OpenAI迭代ChatGPT的过程,发现随着参数量的提升,基于Transformer 架构的大语言模型出现了涌现现象。因此,在文生图领域,很可能参数量更大的模型,也会更“聪明”。 而此前文生图领域大火的Unet 模型容易陷入性能瓶颈与可扩展性的问题,且...
-
两小时“吼出”121次AI,谷歌背后埋伏着Open AI的幽灵
谷歌和Open AI的又一次对阵,刚刚落幕了。 北京时间5月14日凌晨,OpenAI发布端到端多模态AI大模型GPT-4o,酷似科幻电影《Her》的AI语音对话迅速成为关注焦点。 24小时后,携新版Gemini AI大模型等产品,谷歌在北京时间5月15日凌...
-
谷歌反击:Project Astra正面硬刚GPT-4o、Veo对抗Sora、新版Gemini变革搜索
通用的 AI,能够真正日常用的 AI,不做成这样现在都不好意思开发布会了。 5 月 15 日凌晨,一年一度的「科技界春晚」Google I/O 开发者大会正式开幕。长达 110 分钟的主 Keynote 提到了几次人工智能?谷歌自己统计了一下: 是的,...
-
遥遥领先的GPT-4o,为什么要免费开放?
5月14日凌晨,OpenAI2024年春季发布会上线。 这场发布会,表面看有点简陋(全程只有26分钟,现场只有几十名观众),却是科技圈公认的魔法时刻。因为OpenAI上线了一款可以跟人“谈恋爱”的大模型——GPT-4o。 GPT-4o是GPT-4的升级版,...
-
微软宣布 GPT-4o 模型在 Azure OpenAI 上使用
日前,微软宣布OpenAI 最新发布的多模态模型 GPT-4o 现已可以在 Azure OpenAI 云服务中使用。 GPT-4o 是一款支持跨文本、视频、音频多模态推理的先进模型,其强大多模态解读和输出能力使其在各个领域都展现出巨大的潜力。例如,在教育...
-
谷歌正式发布Gemini 1.5 Flash大模型:轻量化、响应速度极快
快科技5月15日消息,今天凌晨,谷歌正式召开了I/O大会,宣布谷歌已全面进入Gemini时代。 在一年前的I/O大会上,谷歌才首次发布Gemini大模型,而今年大模型、AI等已经成为了绝对的主角,甚至连新版安卓都没提。 除了专业的Gemini 1.5 Pr...
-
谷歌硬刚GPT-4o!60秒视频生成模型虽迟但到,上下文窗口达200万
OpenAI出手再次惊艳世界,谷歌果然坐不住了。 GPT-4o掀起的一片“AGI已至”的惊呼声中,刚刚,Google DeepMind首席执行官哈萨比斯亲自携谷歌版《Her》登场。 同样能会还有,不仅能几乎没有延迟地和人类流畅交流,通过摄像头,这个名为P...
-
Android 15即将推出:融入谷歌Gemini大模型
快科技5月15日消息,谷歌在I/O大会上宣布,Android 15已融入谷歌Gemini大模型,支持诸如AI语音助理防诈骗、画圈图片搜索、理解图片给出更符合用户需求的答案等功能,Android 15 Beta 2将在明天正式推出。 据悉,全新升级后的谷歌G...
-
腾讯混元文生图大模型宣布开源:首个中文原生DiT架构
今日,腾讯旗下引人注目的混元文生图大模型(混元DiT)宣布全面开源,这一重要举措标志着人工智能领域的又一里程碑。该模型已在Hugging Face和Github平台上发布,包含完整的模型权重、推理代码和算法,面向全球的企业与个人开发者免费开放商用。 腾讯混...
-
微软让MoE长出多个头,大幅提升专家激活率
混合专家(MoE)是个好方法,支持着现在一些非常优秀的大模型,比如谷歌家的 Gemini 1.5 以及备受关注的 Mixtral 8x7B。 稀疏混合专家(SMoE)可在不显著增加训练和推理成本的前提下提升模型的能力。比如 Mixtral 8×7B 就是...
-
西浦、利物浦大学提出:点云数据增强首个全面综述
本论文的第一作者朱钦峰是西交利物浦大学和利物浦大学联合培养的一年级在读博士,其导师为范磊副教授。他的主要研究方向为语义分割、多模态信息融合、3D视觉、高光谱图像和数据增强。 本文是对发表于模式识别领域顶刊Pattern Recognition 2024的...
-
OpenAI模型终于更新!强大视听能力的GPT-4o将面向所有用户,其前身正是神秘的gpt2!
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 春季终于如约而至!GPT系列的模型终于等到了久违的更新——GPT-4o浮出水面。 而且此前颇具神秘气息的“im-also-a-good-gpt2-chatbot”,正是其测试版...
-
人工客服要被取代?用GPT-4o模拟处理客服事务,100%流畅毫无AI味
OpenAI于2024年5月13日推出了GPT-4o模型,其中的“O”代表全能(Omni),在人机互动的自然度上取得了显著进步。GPT-4o支持多模态输入和输出,包括语音、视频、图像和代码,能够实时与用户进行无缝交流,理解情感,并展现出幽默个性。 该模型的...
-
OpenAI春季发布会:这是“Moss”的诞生,我们人类究竟该何去何从
今天,OpenAI又又又又开发布会了。 在大众心里,现在也基本上都知道,奥特曼是一个贼能PR的人。 每一次的PR的时间点,都拿捏的极其到位,精准的狙击其他厂商。比如说上一次Sora,其实你会发现从头到尾就是一个PR的举动,2月16号发的,特么的快3个月了,...
-
OpenAI发布最新旗舰大模型GPT-4o:免费试用 价格五折速度提高一倍
GPT-4o具体特性一览: 站长之家(ChinaZ.com)5月14日 消息:今日凌晨,OpenAI发布了最新旗舰大模型GPT-4o。这款全能AI不仅免费可用,而且具备横跨听图片、看图片、说图片的多项能力,为用户带来如视频电话般丝滑流畅的交流体验。 O...
-
vivo连续三年拿下国产第一,蓝心大模型全面升级
5月13日19:00,影像新蓝图 暨X系列新品发布会正式开始。 首先,vivo产品副总裁黄韬宣布,vivo连续三年拿下国产手机市场份额第一,也是今年一季度国内市场第一。另外vivo X Fold3 系列首销月的销量是上一代的 432%。 同时黄韬宣布,vi...
-
美国教授用2岁女儿训AI模型登Science!人类幼崽头戴相机训练全新AI
【新智元导读】为训练AI模型,纽约州立大学的一名教授Brenden Lake,竟让自己不到2岁女儿头戴相机收集数据!要知道,Meta训Llama3直接用了15万亿个token,如果Lake真能让AI模型学习人类幼崽,从有限的输入中学习,那LLM的全球数据荒...