多模态第9页 - AIGC资讯

京东宣布五大方面升级保障618！首次应用大模型、员工倒班调休

快科技5月24日消息，京东618将于5月31日20:00开启，京东物流今日宣布五大方面”全线升级保障618。据了解，这五大方面包括技术升级，电商仓、保税仓升级，揽派、以旧换新等服务升级，物流升级，员工关怀升级。京东表示，今年618期间，京东物流首次深度...

AIGC 2024-05-24 人工智能

763阅读

【活动】AIGC 技术的发展现状与未来趋势

?个人主页: 鑫宝Code?热门专栏: 闲话杂谈｜炫酷HTML | JavaScript基础 ?个人格言: "如无必要，勿增实体" 文章目录 AIGC 技术的发展现状与未来趋势引言 AIGC技术的发展现状文本生成...

大数据 2024-05-24 人工智能

905阅读

字节携港大南大升级 LLaVA-NeXT：借 LLaMA-3 和 Qwen-1.5 脱胎换骨，轻松追平 GPT-4V

文 | 王启隆出品 | 《新程序员》编辑部 2023 年，威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学的研究人员共同开发的 LLaVA 首次亮相，彼时它被视为一个端到端训练的大型多模态模型，展现了在视觉与语言融合领域的潜力。今年...

生成式AI 2024-05-24 人工智能

1307阅读

ambientGPT：开源多模态MacOS基础模型操作界面可调用GPT-4o API

最近，一款名为 ambientGPT 的开源项目备受关注。这款工具是一款多模态 MacOS 基础模型操作界面，可以调用 GPT-4o API 或者本地开源模型进行问答，并能直接访问屏幕内容而不需要截图。它的本地模型是基于 Apple 的 MLX 库，技术栈...

人工智能 2024-05-23 人工智能

835阅读

CVPR 2024｜多模态场景感知，小红书高保真人体运动预测方法来了！

设想一下，你在家中准备起身，前往橱柜取东西。一个集成 SIF3D 技术的智能家居系统，已经预测出你的行动路线（路线通畅，避开桌椅障碍物）。当你接近橱柜时，系统已经理解了你的意图，柜门在你达到之前就已自动打开，无需手动操作。视频中，左边为 3D 场景...

AIGC 2024-05-22 人工智能

997阅读

AI日报：讯飞星火Lite API永久免费；李开复称大模型疯狂降价是双输；AI特效末日滤镜抖音爆火；AI音乐Suno 融资1.25亿美元

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、科大讯飞：讯飞星火Lite A...

大数据 2024-05-22 人工智能

1023阅读

Hinton万字访谈：用更大模型「预测下一个词」值得全力以赴

「这份访谈的每一秒都是精华。」最近，图灵奖得主 Geoffrey Hinton 的一个访谈视频得到了网友的高度评价。视频链接：https://www.youtube.com/watch?v=tP-4njhyGvo&t=660s 在访谈中，Hi...

生成式AI 2024-05-22 人工智能

956阅读

马斯克的xAI正努力实现Grok多模态化将支持上传照片获得文本回复

埃隆・马斯克的人工智能公司 xAI 正在努力为其 Grok 聊天机器人增加多模态输入功能。根据公开的开发者文件，埃隆·马斯克（Elon Musk）的人工智能公司xAI在向其Grok聊天机器人添加多模态输入方面取得了进展。这意味着，很快，用户就可以将照片上...

大数据 2024-05-22 人工智能

811阅读

微软颠覆生产力：Copilot推自定义版，AI PC原生支持PyTorch，奥特曼预告新模型

AI 生产力的未来会是什么样子？全世界都在等待微软的答案。 5 月 22 日凌晨，微软 Build 2024 开发者大会在美国西雅图召开，今天的发布有关 AI 技术，更有关 AI 带来的新工具。「三十多年来，微软对于计算机一直有两个梦想 —— 首先是...

生成式AI 2024-05-22 人工智能

877阅读

微软Copilot+PC之后还有大招！牵手GPT-4o后能力简直王炸！奥特曼也来build现场了！

编辑|伊风出品 | 51CTO技术栈（微信号：blog51cto）昨天，微软震撼发布的Copilot+PC，被大赞终于是真正的AI PC了！今天，在AI领域里拳打谷歌，脚踢苹果的微软又在build大会中狠狠地秀了一把肌肉。宣布要将Windows打造...

AIGC 2024-05-22 人工智能

801阅读

Meta发布类GPT-4o多模态模型Chameleon

Meta最近发布了一个名为Chameleon的多模态模型，它在多模态模型发展中设立了新的标杆。Chameleon是一个早期融合的基于token的混合模态模型家族，能够理解并生成任意顺序的图像和文本。它通过一个统一的Transformer架构，使用文本、图像...

人工智能 2024-05-21 人工智能

805阅读

腾讯问卷推出AI功能已接入腾讯混元大模型

腾讯问卷宣布推出全流程 AI 解决方案，基于腾讯混元大模型，帮助企业提升调研的质量与效率。腾讯问卷是腾讯旗下在线问卷调查平台，服务覆盖问卷调查、信息上报、在线测评等工作场景，帮助用户回收34亿份问卷。通过腾讯混元大模型的接入，腾讯问卷在问卷设计、投放、回...

生成式AI 2024-05-21 人工智能

833阅读

一文读懂 GPT-4o vs GPT-4 Turbo

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - GPT-4o 模型。在 2024 年 5 月 13 日，OpenAI 创新性地推出了其最先进、最前沿的模型 GPT-4o，这是标志着人工智能聊天机器人...

人工智能 2024-05-21 人工智能

1125阅读

AI日报：骨折价！通义千问模型费用下降97%；豆包大模型也拼性价比；从零复现Llama3代码库爆火；智谱开源大模型CogVLM2

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、阿里云宣布GPT-4级主力模型...

人工智能 2024-05-21 人工智能

936阅读

探秘采集翻译插件：打破语言壁垒的利器

在当今全球化的时代，跨语言交流变得愈发重要。为满足这一需求，各种翻译工具层出不穷，其中，采集翻译插件凭借其便捷性和实用性，受到越来越多人的青睐。本文将从多个方面详细探讨采集翻译插件的功能、应用场景及未来发展，带领读者一起领略这一技术的魅力。一、采集翻译插件...

生成式AI 2024-05-21 大数据

853阅读

蚂蚁多模态团队在视频多模态方向的技术探索

一、概述视频多模态检索在蚂蚁内部有着广泛的应用。视频多模态检索具体包括两个方向，一个是视频-文本的语义检索，另外一个是视频-视频的同源检索。视频-文本的语义检索方向旨在通过文本检索与其语义相近的视频，其检索文本未必在检索到的视频描述中直接出现，但检...

大数据 2024-05-21 人工智能

899阅读

谷歌Gemini 1.5技术报告：轻松证明奥数题，Flash版比GPT-4 Turbo快5倍

今年 2 月，谷歌上线了多模态大模型 Gemini1.5，通过工程和基础设施优化、MoE 架构等策略大幅提升了性能和速度。拥有更长的上下文，更强推理能力，可以更好地处理跨模态内容。本周五，Google DeepMind 正式发布了 Gemini 1.5...

人工智能 2024-05-20 人工智能

827阅读

OpenAI“杀疯了”，GPT–4o模型保姆级使用教程！一遍就会！

5月14日凌晨1点，OpenAI发布了名为GPT-4o 最新的大语言模型，再次引领了人工智能领域的又一创新浪潮，让整个行业都为之震动。据OpenAI首席技术官穆里-穆拉提（Muri Murati）表示，GPT-4o是在继承GPT-4智能的基础上，对文本...

人工智能 2024-05-20 人工智能

1034阅读

谷歌数学版Gemini解开奥赛难题，堪比人类数学家！

四个月的迭代，让Gemini 1.5 Pro成为了全球最强的LLM（几乎）。谷歌I/O发布会上，劈柴宣布了Gemini 1.5 Pro一系列升级，包括支持更长上下文200k，超过35种语言。与此同时，新成员Gemini 1.5 Flash推出，设计...

AIGC 2024-05-20 人工智能

901阅读

时隔一年Falcon回归！110亿参数5.5万亿token，性能超越Llama 3

这几天，全世界的目光仿佛都被OpenAI发布的GPT-4o所吸引，与此同时，OpenAI的挑战者们也在同步创造历史。就在5月14日，阿布扎比先进技术研究委员会（ATRC）下属的技术创新研究所（TII），发布了新一代的Falcon 2模型。 Falco...

人工智能 2024-05-20 人工智能

821阅读

我们一起聊聊AI模型组合指南

实施需要周密的计划、资源管理以及采用现代部署实践和工具。译自A Guide to Model Composition，作者 Sherlock Xu。考虑一款旨在识别和分类野生动物照片的 AI 驱动的图像识别应用程序。您上传一张远足时拍摄的照片，几分钟...

大数据 2024-05-20 人工智能

893阅读

AI如何使机器人更具自主性和适应性？

在工业自动化技术领域，最近有两个热点很难被忽视：人工智能(AI 和英伟达(Nvidia 。毫不意外，这两者密切相关，因为英伟达现在不仅仅局限于其最开始的图形处理单元(GPU ，正在将其GPU技术扩展到数字孪生领域，同时紧密连接着新兴的AI技术。最近...

AIGC 2024-05-20 人工智能

782阅读

加州大学最新！CarDreamer：全面、灵活的自动驾驶算法测试开源平台

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解为了在复杂的真实世界场景中安全导航，自动驾驶汽车必须能够适应各种道路条件并预测未来事件。基于世界模型的强化学习（RL）已经成为一种有前景的方法，通过学习和预测各种环境...

人工智能 2024-05-20 人工智能

945阅读

Meta首发「变色龙」挑战GPT-4o，34B参数引领多模态革命！10万亿token训练刷新SOTA

GPT-4o的横空出世，再次创立了一个多模态模型发展的新范式！为什么这么说？ OpenAI将其称为「首个『原生』多模态」模型，意味着GPT-4o与以往所有的模型，都不尽相同。传统的多模态基础模型，通常为每种模态采用特定的「编码器」或「解码器」，将不...

大数据 2024-05-20 人工智能

877阅读

GPT-4o成为全领域SOTA！基准测试远超Gemini和Claude，多模态功能远超GPT-4

OpenAI在发布会上官宣GPT-4o之后，各路大神也开始了对这个新模型的测评，结果就是，GPT-4o在多项基准测试上都展现了SOTA的实力。别家发布会都在画饼，OpanAI却总能开出一种「欲扬先抑」的效果，惊喜全在发布会之后。基准测试结果首先...

生成式AI 2024-05-20 人工智能

883阅读

OpenAI CEO下场回应「封口协议」，争议还是到了股权利益上，奥特曼：我的锅

自从 Ilya 和超级对齐负责人 Jan 离职后，OpenAI 内部还是心散了，后续也有越来越多的人离职，同时也引发了更多的矛盾。昨天，争议的焦点来到了一份严格的「封口协议」。 OpenAI 前员工 Kelsey Piper 爆料，任何员工的入职文...

人工智能 2024-05-20 人工智能

840阅读

探秘ThinkCMF爬虫：技术原理、应用与未来趋势

在数字化信息时代，网络爬虫作为一种自动化数据采集工具，正日益受到人们的关注。ThinkCMF作为一款基于ThinkPHP+MYSQL的内容管理框架（CMF），其灵活性和扩展性使得针对它的爬虫技术也颇具研究价值。本文将深入探讨ThinkCMF爬虫的技术原理、...

人工智能 2024-05-18 大数据

856阅读

突发！OpenAI再失一名高管，安全主管辞职

5月18日凌晨，OpenAI安全主管、超级对齐负责人Jan Leike在社交平台宣布，离开OpenAI。这也是本周三OpenAI联合创始人兼首席科学家Ilya Sutskever辞职之后，又有一名高管辞职。相信随着二人的离开，后续还会有不少人离开Ope...

大数据 2024-05-18 人工智能

850阅读

恒生电子首席科学家白硕：长文本和多模态是生成式AI落地金融的两大利器

嘉宾丨白硕采访/撰稿丨张洁编辑丨千山出品 | 51CTO技术栈（微信号：blog51cto）在千行百业中，金融业一贯是新技术的早期采用者。无论是在数字化水平，还是在关于产业AI化的探索上，都走在了前列。因此，金融业也被视为生成式AI应用落地的潜力...

人工智能 2024-05-17 人工智能

853阅读

腾讯汤道生：打破AI“落地玻璃”，让可见变为可用

（图：腾讯集团高级执行副总裁、云与智慧产业事业群CEO 汤道生） 5月17日，“腾讯云生成式AI产业应用峰会”在北京举办，大会披露了腾讯混元大模型、行业大模型的最新能力升级，并推出知识引擎等多个智能工具和场景应用。会上，基于混元大模型的一站式AI智...

AIGC 2024-05-17 人工智能

761阅读

腾讯混元升级模型矩阵，云上推出256k长文模型

大模型落地加速，“产业实用”成为发展共识。 2024年5月17日，腾讯云生成式AI产业应用峰会在北京召开，公布大模型研发、应用产品的系列进展。腾讯混元大模型能力持续升级，多个版本模型hunyuan-pro、hunyuan-standard、hunyua...

大数据 2024-05-17 人工智能

845阅读

GPT-4o 17人Omni金牌团队首揭秘！清北上交中科大6位华人领衔

几天前的发布会上，OpenAI再次向全世界证明，它永远走在AI领域的最前沿。眼看着《Her》中的Samantha在自己眼前成真，那一刻，全世界为之振奋。就在刚刚，GPT-4o的关键团队信息，也被公布了出来。就是这个名为「omni」的团队，发挥出了不可...

人工智能 2024-05-17 人工智能

873阅读

OpenAI CEO：GPT-5会很特别可能类似于一个 “虚拟大脑”

OpenAI 首席执行官 Sam Altman 在接受采访时透露了 GPT-4o 和 GPT5的一些信息。GPT-4o 是一款多模态大模型，可以跨文本、视频和音频进行推理。Sam Altman表示，他早就有用语音控制计算机的想法，而 GPT-4o 的综合推...

AIGC 2024-05-17 人工智能

909阅读

GPT-4o 17人Omni金牌团队首揭秘！清北上交中科大六位华人领衔

几天前的发布会上，OpenAI再次向全世界证明，它永远走在AI领域的最前沿。眼看着《Her》中的Samantha在自己眼前成真，那一刻，全世界为之振奋。就在刚刚，GPT-4o的关键团队信息，也被公布了出来。就是这个名为「omni」的团队，发挥出了不...

人工智能 2024-05-16 人工智能

853阅读

GPT-4o手写板书以假乱真惊呆网友！杀死谷歌翻译，代码建模无所不能

GPT-4o到底有多强？只有用过才能知道。这两天，网友们不仅探索出了很多全新ChatGPT的炫酷用法，也逐渐开始意识到，这标志这OpenAI将逐渐替代谷歌曾经的地位，全面接管AGI时代。随着越来越多人开始试用GPT-4o，大家发现发布会上的demo真的...

AIGC 2024-05-16 人工智能

939阅读

识别细胞也能用大模型了！清华系团队出品，已入选ICML 2024 | 开源

大模型带来的生命科学领域突破，刚刚再传新进展。来自清华系，使用大模型实现了单细胞身份识别，同时模型LangCell也正式对外开源。它不仅可以准确识别细胞身份，还具有很强的零样本分析能力，论文已被ICML 2024录⽤。 LangCell的数据集中包...

生成式AI 2024-05-16 人工智能

934阅读

GPT-4o被全球网友玩坏了谷歌：终究是错付了！

在社交软件上，OpenAI的GPT-4o成为了热议的焦点。这款最新旗舰产品以其全能的特性——接受文字、音频、图像的任意组合输入，并生成相应的文字、音频、图像输出——迅速吸引了全球网友的关注。GPT-4o的免费特性更是让其成为了互联网上的新宠。在5月14日...

AIGC 2024-05-16 人工智能

786阅读

字节发布豆包大模型，以普惠AI推动企业业务创新

根据麦肯锡的报告显示，到2030年，大模型推动的全球经济增量将达到49万亿人民币，其中中国部分的经济增量将达到14万亿人民币。这里面既包括大模型对现有工作效率的提升，也包括新技术所带来的新场景和新业态。虽然我们看到更多的企业和开发者在积极拥抱大模型，甚...

生成式AI 2024-05-16 人工智能

1690阅读

GPT-4o成全球网友新玩具，秒秒钟纸质原型转录初始HTML，网友：谷歌你是一点流量摊不上啊

好啊，不愧是OpenAI最新旗舰，打开各个社交软件，GPT-4o的上手测试都唰唰唰往我首页推。请！看！这，就是用上GPT-4o，花不到30s时间，通过单个prompt把一个电子表格中的内容生成了完整的图表和统计分析。在过去，在Excel里做这玩意儿...

大数据 2024-05-15 人工智能

823阅读

MiniMax推出人生搭子「海螺 AI」已接入自研多模态大模型

MiniMax 公司推出了一款人生搭子产品，名为「海螺 AI」，也可以称为「小海螺」。这款产品可以帮助学生、职场新人、自由工作者、创作者等各类人群，作为一个外挂大脑和人生搭子，帮助化解信息过载和高速运转带来的压力。产品背后接入了 MiniMax 自研的多...

生成式AI 2024-05-15 人工智能

1048阅读

字节跳动豆包大模型发布，火山引擎全栈 AI 服务助力企业智能化转型

火山引擎总裁谭待企业要做好大模型落地，面临模型效果、推理成本、落地难度的三大关键挑战：既要有好的基础大模型做支撑，解决复杂难题，也要有低成本的推理服务让大模型被广泛应用，还要更多工具、平台和应用帮助企业做好场景落地。 ——谭待火山引擎总裁...

人工智能 2024-05-15 人工智能

1690阅读

AI日报：谷歌终极杀器硬刚GPT-4o、Sora；字节推出豆包大模型“全家桶”；阿里再推AI虚拟试衣神器；腾讯开源混元文生图大模型

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。 1、谷歌急了，终极杀器对打GPT-4o 视频模型Veo硬刚Sora 谷歌近日发布了一系列强大的AI工具，...

AIGC 2024-05-15 人工智能

870阅读

OpenAI和Google接连两天的大动作，都想让AI助手成“精”

看过昨天OpenAI的春季发布后，不难猜到，在今天的谷歌I/O大会上，必然会有关于AI助手的介绍。毕竟，抢在谷歌I/O大会前发布GPT-4o的Altman，已经显示出了十足的针对性，凭借Altman的手段，自然也有着十足的把握做到精准打击，将这场“红蓝...

大数据 2024-05-15 人工智能

847阅读

GPT-4o干掉初创全网实测，马斯克Karpathy等大佬纷表不服：OpenAI不过如此

OpenAI一夜之间，又干掉了一大批初创公司。官方公布的全能模型GPT-4o的炸裂演示，即便过去了一天，依旧让全网深陷其中，无法自拔。凭借实时语音视频对话，GPT-4o已经深入教育、翻译、视频会议等领域的变革。 OpenAI科学家Lilian W...

生成式AI 2024-05-15 人工智能

869阅读

为什么腾讯认为DiT架构是未来的主流？做了哪些改进？

OpenAI迭代ChatGPT的过程，发现随着参数量的提升，基于Transformer 架构的大语言模型出现了涌现现象。因此，在文生图领域，很可能参数量更大的模型，也会更“聪明”。而此前文生图领域大火的Unet 模型容易陷入性能瓶颈与可扩展性的问题，且...

生成式AI 2024-05-15 人工智能

980阅读

两小时“吼出”121次AI，谷歌背后埋伏着Open AI的幽灵

谷歌和Open AI的又一次对阵，刚刚落幕了。北京时间5月14日凌晨，OpenAI发布端到端多模态AI大模型GPT-4o，酷似科幻电影《Her》的AI语音对话迅速成为关注焦点。 24小时后，携新版Gemini AI大模型等产品，谷歌在北京时间5月15日凌...

大数据 2024-05-15 人工智能

903阅读

谷歌反击：Project Astra正面硬刚GPT-4o、Veo对抗Sora、新版Gemini变革搜索

通用的 AI，能够真正日常用的 AI，不做成这样现在都不好意思开发布会了。 5 月 15 日凌晨，一年一度的「科技界春晚」Google I/O 开发者大会正式开幕。长达 110 分钟的主 Keynote 提到了几次人工智能？谷歌自己统计了一下：是的，...

AIGC 2024-05-15 人工智能

787阅读

遥遥领先的GPT-4o，为什么要免费开放？

5月14日凌晨，OpenAI2024年春季发布会上线。这场发布会，表面看有点简陋（全程只有26分钟，现场只有几十名观众），却是科技圈公认的魔法时刻。因为OpenAI上线了一款可以跟人“谈恋爱”的大模型——GPT-4o。 GPT-4o是GPT-4的升级版，...

人工智能 2024-05-15 人工智能

852阅读

微软宣布 GPT-4o 模型在 Azure OpenAI 上使用

日前，微软宣布OpenAI 最新发布的多模态模型 GPT-4o 现已可以在 Azure OpenAI 云服务中使用。 GPT-4o 是一款支持跨文本、视频、音频多模态推理的先进模型，其强大多模态解读和输出能力使其在各个领域都展现出巨大的潜力。例如，在教育...

AIGC 2024-05-15 人工智能

847阅读

谷歌正式发布Gemini 1.5 Flash大模型：轻量化、响应速度极快

快科技5月15日消息，今天凌晨，谷歌正式召开了I/O大会，宣布谷歌已全面进入Gemini时代。在一年前的I/O大会上，谷歌才首次发布Gemini大模型，而今年大模型、AI等已经成为了绝对的主角，甚至连新版安卓都没提。除了专业的Gemini 1.5 Pr...

大数据 2024-05-15 人工智能

888阅读