-
微软发布Phi-3 Vision等最新大模型系列
微软发布了其最新的大型语言模型系列,Phi-3,包括Phi-3Vision、Phi-3Small7B和Phi-3Medium14B型号。这些模型在性能上与当前领先的大型模型相媲美,同时在特定领域提供了一些独特的优势。 Phi-3Medium14B 型号的...
-
微软发布Copilot智能体 还带来了本机小语言模型
5月22日消息,当地时间周二,微软在Build开发者大会上发布Copilot新智能体,它就像虚拟员工一样,能自动执行任务。微软认为,这种人工智能将消除枯燥乏味的工作内容,而不是完全取代员工工作。 此外,微软还针对Copilot+ PC推出了本机小语言模...
-
从Claude 3中提取数百万特征,首次详细理解大模型的「思维」
刚刚,Anthropic 宣布在理解人工智能模型内部运作机制方面取得重大进展。 Anthropic 已经确定了如何在 Claude Sonnet 中表征数百万个概念。这是对现代生产级大型语言模型的首次详细理解。这种可解释性将帮助我们提高人工智能模型的安全...
-
拯救被「掰弯」的GPT-4!西交微软北大联合提出IN2训练治疗LLM「中间迷失」
【新智元导读】近日,西交微软北大联合提出信息密集型训练大法,使用纯数据驱动的方式,矫正LLM训练过程产生的偏见,在一定程度上治疗了大语言模型丢失中间信息的问题。 辛辛苦苦给大语言模型输入了一大堆提示,它却只记住了开头和结尾? 这个现象叫做LLM的中间迷失(...
-
微软Copilot+PC之后还有大招!牵手GPT-4o后能力简直王炸!奥特曼也来build现场了!
编辑|伊风 出品 | 51CTO技术栈(微信号:blog51cto) 昨天,微软震撼发布的Copilot+PC,被大赞终于是真正的AI PC了! 今天,在AI领域里拳打谷歌,脚踢苹果的微软又在build大会中狠狠地秀了一把肌肉。宣布要将Windows打造...
-
中国大模型头名易主:全球盲测榜单上,Yi-Large与GPT-4o中文并列第一
上周,一个名为 “im-also-a-good-gpt2-chatbot” 的神秘模型突然现身大模型竞技场 Chatbot Arena,排名直接超过 GPT-4-Turbo、Gemini 1 .5 Pro、Claude 3 0pus、Llama-3-70...
-
一文读懂 GPT-4o vs GPT-4 Turbo
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - GPT-4o 模型 。 在 2024 年 5 月 13 日,OpenAI 创新性地推出了其最先进、最前沿的模型 GPT-4o,这是标志着人工智能聊天机器人...
-
大模型进入免费时代!百度文心大模型宣布两大主力模型免费用
快科技5月21日消息,今日,百度智能云宣布文心大模型的两款主力模型ENIRE Speed、ENIRE Lite全面免费,即刻生效。 这两款大模型今年3月发布,均支持8K和128k上下文长度。 据了解,ERNIE Lite是百度自研的轻量级大语言模型,兼顾优...
-
KubeAI大模型推理加速实践|得物技术
除了上面提到的技术外,提高大模型推理速度的还有大模型的量化技术等,这里先不探讨,后面有机会,我们会单独发文章来介绍。 二、大模型发展面临的挑战 未来大模型的参数量肯定会越来越大,这也是大模型的发展趋势,对推理加速的要求会越来越高。 OpenAI在其论...
-
拒绝AI生成代码!开源操作系统陆续举起“禁令”,Debian尚无行动
整理丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 当下,AI的崛起已成大势。但是,当AI的触角伸向开源操作系统时,一些社区陆续亮起了“红灯”。 先是Linux发行版Gentoo 在四月中旬发布了一项理事会政策,禁止使用AI工具生成...
-
百度宣布文心大模型ERNIE Speed、ERNIE Lite全面免费
刚刚,百度智能云宣布,文心大模型两大主力模型ERNIE Speed、ERNIE Lite全面免费,立即生效。 据悉,ERNlE Speed是百度2024年最新发布的自研高性能大语言模型,通用能力优异,适合作为基座模型进行精调,更好地处理特定场景问题。 而...
-
携手亚马逊云科技,北京灵奥科技助力企业无缝结合大模型与数据
随着生成式AI时代不断发展,越来越多的企业开始关注、应用甚至训练大模型,想要以此创造更大的业务价值。这一想法固然没错,大模型的出现必能为企业带来创新和突破。不过,基础模型依赖于大规模高质量数据集,想要借助生成式AI带来企业差异化优势的关键是企业的专有数据...
-
牛津大学最新 | 近400篇总结!畅谈大语言模型与三维世界最新综述
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 随着大型语言模型(LLM)的发展,它们与3D空间数据(3D LLM)之间的集成取得了快速进展,为理解物理空间和与物理空间交互提供了前所未有的能力。本文全面概述了LLM...
-
150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory
不同于大多数模型使用字母缩略起名,论文作者在脚注中解释道,Lory是一种羽毛有彩虹颜色的鹦鹉,和「软MoE」的精神非常相似。 论文的作者团队也可以称之为「明星阵容」。 论文地址:https://arxiv.org/abs/2405.03133 主要作者...
-
OpenAI 领导者表示:我们非常重视安全
OpenAI近期面临重大人事变动,引发业界对其AI安全承诺的关注。上周,公司联合创始人兼首席科学家Ilya Sutskever宣布辞职,以追求其他项目。与此同时,“超级对齐团队”负责人Jan Leike也宣布离职,并在公开信中表达了对公司领导层的失望,特别...
-
时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3
这几天,全世界的目光仿佛都被OpenAI发布的GPT-4o所吸引,与此同时,OpenAI的挑战者们也在同步创造历史。 就在5月14日,阿布扎比先进技术研究委员会(ATRC)下属的技术创新研究所(TII),发布了新一代的Falcon 2模型。 Falco...
-
AI在软件开发中的角色:辅助而非替代
事实表明,AI无法替代开发者,但更适用于优秀的开发者。而识别大型语言模型(LLM)生成的代码什么时候会出错,需要开发人员具有丰富的知识和经验。 软件工程师David Showalter在谈到AI编程时表示:“目前,AI模型在帮助编程人员提高工作效率方面...
-
谷歌推出开源工具Model Explorer,助力AI透明度和问责制
随着人工智能模型日益复杂化,理解其内部工作机制的挑战也日益凸显,这对研究人员和工程师来说是一个紧迫的问题。谷歌最新推出的开源工具Model Explorer承诺为这些系统的不透明性带来曙光,有望开启AI透明度和问责制的新时代。 Model Explore...
-
欧盟警告微软可能面临数十亿美元罚款,因未提供生成式AI风险信息
欧洲联盟(EU)警告微软,根据该联盟的数字服务法案(Digital Services Act,DSA ,微软可能面临高达全球年收入的1% 的罚款,因为该公司未能回应关于其生成式人工智能工具的信息请求。 今年3月,欧盟要求微软和其他一些科技巨头提供关于生成式...
-
GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4
OpenAI在发布会上官宣GPT-4o之后,各路大神也开始了对这个新模型的测评,结果就是,GPT-4o在多项基准测试上都展现了SOTA的实力。 别家发布会都在画饼,OpanAI却总能开出一种「欲扬先抑」的效果,惊喜全在发布会之后。 基准测试结果 首先...
-
HuggingFace教你怎样做出SOTA视觉模型
前有OpenAI的GPT-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。 其他从业者在震撼之余,也再次开始思考怎么追赶这些超级模型了。 刚好在这时,HuggingFace和法国索邦大学的一篇论文,总结出了构建视觉大模型的关键经验,给开发者指明了一...
-
ChatGPT现在允许用户直接从 Google Drive、Microsoft OneDrive 导入文件
OpenAI 本周宣布,其标志性大型语言模型(LL)ChatGPT 已更新,用户现可直接从外部云盘 Google Drive 和 Microsoft OneDrive 导入文件。该功能适用于 ChatG Plus、Team 和 Enterprise 用户,...
-
Ilya离职后第一个动作:点赞了这篇论文,网友抢着传看
自Ilya Sutskever官宣离职OpenAI后,他的下一步动作成了大家关注焦点。 甚至有人密切关注着他的一举一动。 这不,Ilya前脚刚刚点赞❤️了一篇新论文—— ——网友们后脚就抢着都看上了: 论文来自MIT,作者提出了一个假说,用一句话总结...
-
AI日报:百度搜索11%结果由AI生成;腾讯混元支持生成16s视频;谷歌发布开源视觉语言模型PaliGemma;Hugging Face承诺免费提供1000万美元GPU计算资源
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、李彦宏:百度搜索已有11%结果...
-
李彦宏:百度11%的搜索结果都由AI生成
快科技5月17日消息,百度创始人、董事长兼首席执行官李彦宏在2024年第一季度财报电话会议上透露,目前百度搜索结果中已有11%由AI生成。 李彦宏认为,尽管百度搜索的AI重构工作仍处于早期阶段,但搜索服务最有可能成为AI时代的杀手级应用”。 百度在AI领...
-
又被 OpenAI 截胡,Google推出开源视觉语言模型:PaliGemma
前言 该模型结合了 SigLIP 视觉模型和 Gemma 语言模型,这两种模型都是开放组件,使得PaliGemma在处理视觉与语言结合的任务上表现出色。 PaliGemma的使用场景包括图像字幕、图像标签和视觉问答等。这些应用场景利用了PaliGemm...
-
AI日报:抖音测试AI购物小助手;GPT-4o再秀神操作惊呆网友;华为“天生会画”App发布;小米大模型通过备案
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 1、抖音试水AI电商 测试AI购物小助手 抖音电商正在测试首款面向C端的AI电商服务“AI购物小助手”,...
-
红帽用RHEL AI和OpenShift AI塑造开源AI的未来
发展至今,AI技术对工作方式、决策过程乃至商业模式的重塑已经逐渐具象化。 红帽,作为开源解决方案的领军企业,在近日的在Red Hat Summit上,红帽展示了从RHEL AI的推出到InstructLab模型对齐工具的集成,再到OpenShift AI...
-
知识图与大型语言模型的协同作用
从非结构化文本中提取有价值的见解是金融行业的关键应用。然而,这项任务往往超出了简单的数据提取,需要高级推理能力。 一个典型的例子是确定信贷协议中的到期日,这通常涉及破译一个复杂的指令,如“到期日应在生效日期三周年之前的最后一个工作日”。这种级别的复杂推...
-
小米大语言模型MiLM正式通过大模型备案:将应用于汽车、手机、智能家居等产品
快科技5月16日消息,小米官方宣布,小米大语言模型MiLM正式通过大模型备案。 据了解,通过备案后,小米大模型将逐步应用于小米公司的汽车、手机、智能家居等产品中,通过端云结合,既带来单个设备的智能提升,也实现场景内和场景间多设备的协同,为人车家全生态战略赋...
-
WOT大会日程上线:我们找来数十位大模型实践企业现身说法
这两天的技术圈里,估计大家都在摩拳擦掌等待体验OpenAI的GPT-4o(o为Omni缩写,意为“全能”)有多“全能”吧。 我们无意给市场泼冷水,只是要提醒大家,想要让大模型真正落地,市场的热,并不意味着应用实践的成熟。尤其在企业级场景中,为什么大模型落...
-
一文读懂主流领先的 SLM(小型语言模型)
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - SLM(小型语言模型 。 在 AI 狂卷的浪潮中,LLM(大型语言模型 无疑成为了整个互联网乃至科技界的焦点所在。以 GPT-3、BERT 等为代表的 LL...
-
小米AI大模型MiLM通过备案 将应用于手机、汽车产品中
5月16日,小米公司宣布,小米大语言模型MiLM正式通过大模型备案,小米大模型将逐步应用于小米汽车、手机、智能家居等产品中。 5月15日,北京市生成式人工智能服务新增已备案信息正式公布。此次19家企业新增备案,包括了北京小米科技有限责任公司“小米”、腾讯...
-
Ollama如何构建自己的Llama3中文模型
Ollama Ollama 是一个开源的大型语言模型(LLM)服务工具,它允许用户在本地机器上运行和部署大型语言模型。Ollama 设计为一个框架,旨在简化在 Docker 容器中部署和管理大型语言模型的过程,使得这一过程变得简单快捷。用户可以通过简单的...
-
「大模型」之所短,「知识图谱」之所长
最近一年以来,大语言模型技术突飞猛进,被广泛地认为开启了人工智能研究的新阶段。大语言模型时代的到来,给知识图谱技术也带来了新的机遇与挑战。我们在 5 月份的时候曾经发布过知识图谱与 AIGC 大模型的知识地图,其中包括了文本生成、图像生成等技术。本次分享...
-
思维链被推翻!纽约大学新研究:大模型推理步骤或可省略
纽约大学的最新研究对当前流行的思维链(Chain-of-Thought,CoT)技术提出了挑战,该技术原本被认为能够提升大模型的推理能力。研究显示,使用省略号代替具体的推理步骤,模型的推理结果并没有显著差异,这意味着增加计算量而非推理步骤本身可能是提升性能...
-
Android即将推出基于AI的诈骗电话检测功能
在 Google 的 I/O 开发者大会上,Google 宣布正在测试一项新的通话监测功能,以提醒用户正在与可能试图欺诈他们的人进行通话,并鼓励他们结束此通话。Google 表示,该功能利用了 Gemini Nano 技术,这是公司为 Android 设备...
-
MIT最新!多模态LLM真的无所不能吗?大模型能解决一切难题吗?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文对自动驾驶领域内多模态大型语言模型(MLLMs)的应用进行了审慎的审视,并对一些常见的假设提出了质疑/验证,重点关注它们通过闭环控制环境中的图像/帧序列推理和解释...
-
HPE Aruba Networking的前瞻视角:构建AI赋能的安全融合网络
数字化时代,网络不仅是连接世界的纽带,更是推动商业和社会进步的关键力量。随着移动设备、物联网(IoT 和云服务的爆炸性增长,用户对网络的依赖达到了前所未有的水平。一个能够随时随地提供安全、高效接入的网络环境,无论对个人还是企业,都已成为刚需。然而,这一需...
-
为什么腾讯认为DiT架构是未来的主流?做了哪些改进?
OpenAI迭代ChatGPT的过程,发现随着参数量的提升,基于Transformer 架构的大语言模型出现了涌现现象。因此,在文生图领域,很可能参数量更大的模型,也会更“聪明”。 而此前文生图领域大火的Unet 模型容易陷入性能瓶颈与可扩展性的问题,且...
-
刚刚,Ilya官宣离职OpenAI,“下一个项目意义重大”
刚刚,久未露面的Ilya Sutskever突然发声! 官宣离开OpenAI,已经有了下一个计划,但目前还不能透露细节。 近十年后,我决定离开OpenAI。 公司的发展轨迹堪称奇迹,我相信,在Sam Altman、Greg Brockman、Mira...
-
突发!OpenAI首席科学家Ilya官宣离职,GPT-4负责人接任
今天,OpenAI 联合创始人、首席科学家 Ilya Sutskever 发推宣告离职。 在 OpenAI 工作近 10 年后,我做出了离开的决定。OpenAI 的发展轨迹可以称得上是奇迹,我相信 OpenAI 会在 Sam Altman、G...
-
OpenAI 推出 Mac 版 ChatGPT 应用,今年晚些时候推出 Windows 版
IT之家 5 月 14 日消息,OpenAI 终于推出了 ChatGPT 桌面版应用程序,该公司在官方公告中表示:“从今天开始,我们将首先向 Plus 用户推出 macOS 应用,并在未来几周内向更广泛的用户开放。我们还计划在今年晚些时候推出 Wind...
-
分析师警告,AI 热潮将导致高端内存芯片供应紧张
根据分析师的预测,由于爆炸性的人工智能需求推动了高端内存芯片的短缺,高性能内存芯片在今年很可能仍然供不应求。全球两大内存芯片供应商 SK Hynix 和 Micron 表示,他们的高带宽内存芯片已经售罄,2025年的库存也几乎售罄。晨星的股权研究主管 Ka...
-
保护生成式人工智能前沿:人工智能防火墙的专用工具和框架
在本文将介绍用于提示检查和保护或人工智能防火墙的专用工具和框架。 生成式人工智能的崛起和新兴的安全挑战 生成式人工智能(AI 的飞速发展带来了一个前所未有的创造力和创新时代。与此同时,这种变革性的技术也带来了一系列新的安全挑战,需要迫切关注。随着人工智...
-
思维链不存在了?纽约大学最新研究:推理步骤可省略
红极一时的思维链技术,可能要被推翻了! 还在惊讶于大模型居然能够利用思维链分步骤思考? 还在苦于不会写思维链提示词? 来自纽约大学的研究人员表示:「没关系的,都一样」, 推理步骤不重要,不想写提示词也可以不写,用省略号代替就行了。 论文地址:https...
-
OPPO 下一代大数据 AI 一体架构实践
一、技术架构 OPPO 大数据场景丰富,拥有海外的 AWS 功能云,国内自建机房,机器规模超过万台,在印度则是使用混合云模式。 首先来介绍一下 AWS 上功能云 EMR 的实践。 1. 云原生计算架构 OPPO 早期全部采用 EMR,其存在以下一些问题...
-
Refuel AI 推出专为数据标注和清洗设计的开源语言模型 RefuelLLM-2
Refuel AI 最近宣布推出两个新版本的大型语言模型(LLM),RefuelLLM-2和 RefuelLLM-2-small,这两个模型专为数据标注、清洗和丰富任务而设计,旨在提高处理大规模数据集的效率。 RefuelLLM-2的主要特点包括: 自...
-
看红帽如何在RHEL与OpenShift中玩转生成式AI
市场上有很多生成式AI平台的选择,为什么要选择红帽? 红帽总裁兼CEO Matt Hicks直言红帽的不同之处在于运行位置的核心灵活性。企业既可以对小型开源模型进行混合部署,也可以在公有云或自有数据中心训练模型,同时支持主要的GPU供应商。 最近在R...
-
GPT搜索引擎原型曝光!新模型GPT4-Lite驱动,虽然鸽了发布会但代码已上传
OpenAI发布会前一天,员工集体发疯中……上演大型套娃行为艺术。 与此同时还有小动作不断,比如现在GPT-4的文字描述已不再是“最先进的模型”,而仅仅是“先进的”。 以及被鸽掉的GPT搜索引擎,原型代码上传到ChatGPT了。 黑客“光头哥”Tib...