-
HPE Aruba Networking的前瞻视角:构建AI赋能的安全融合网络
数字化时代,网络不仅是连接世界的纽带,更是推动商业和社会进步的关键力量。随着移动设备、物联网(IoT 和云服务的爆炸性增长,用户对网络的依赖达到了前所未有的水平。一个能够随时随地提供安全、高效接入的网络环境,无论对个人还是企业,都已成为刚需。然而,这一需...
-
为什么腾讯认为DiT架构是未来的主流?做了哪些改进?
OpenAI迭代ChatGPT的过程,发现随着参数量的提升,基于Transformer 架构的大语言模型出现了涌现现象。因此,在文生图领域,很可能参数量更大的模型,也会更“聪明”。 而此前文生图领域大火的Unet 模型容易陷入性能瓶颈与可扩展性的问题,且...
-
刚刚,Ilya官宣离职OpenAI,“下一个项目意义重大”
刚刚,久未露面的Ilya Sutskever突然发声! 官宣离开OpenAI,已经有了下一个计划,但目前还不能透露细节。 近十年后,我决定离开OpenAI。 公司的发展轨迹堪称奇迹,我相信,在Sam Altman、Greg Brockman、Mira...
-
突发!OpenAI首席科学家Ilya官宣离职,GPT-4负责人接任
今天,OpenAI 联合创始人、首席科学家 Ilya Sutskever 发推宣告离职。 在 OpenAI 工作近 10 年后,我做出了离开的决定。OpenAI 的发展轨迹可以称得上是奇迹,我相信 OpenAI 会在 Sam Altman、G...
-
OpenAI 推出 Mac 版 ChatGPT 应用,今年晚些时候推出 Windows 版
IT之家 5 月 14 日消息,OpenAI 终于推出了 ChatGPT 桌面版应用程序,该公司在官方公告中表示:“从今天开始,我们将首先向 Plus 用户推出 macOS 应用,并在未来几周内向更广泛的用户开放。我们还计划在今年晚些时候推出 Wind...
-
分析师警告,AI 热潮将导致高端内存芯片供应紧张
根据分析师的预测,由于爆炸性的人工智能需求推动了高端内存芯片的短缺,高性能内存芯片在今年很可能仍然供不应求。全球两大内存芯片供应商 SK Hynix 和 Micron 表示,他们的高带宽内存芯片已经售罄,2025年的库存也几乎售罄。晨星的股权研究主管 Ka...
-
保护生成式人工智能前沿:人工智能防火墙的专用工具和框架
在本文将介绍用于提示检查和保护或人工智能防火墙的专用工具和框架。 生成式人工智能的崛起和新兴的安全挑战 生成式人工智能(AI 的飞速发展带来了一个前所未有的创造力和创新时代。与此同时,这种变革性的技术也带来了一系列新的安全挑战,需要迫切关注。随着人工智...
-
思维链不存在了?纽约大学最新研究:推理步骤可省略
红极一时的思维链技术,可能要被推翻了! 还在惊讶于大模型居然能够利用思维链分步骤思考? 还在苦于不会写思维链提示词? 来自纽约大学的研究人员表示:「没关系的,都一样」, 推理步骤不重要,不想写提示词也可以不写,用省略号代替就行了。 论文地址:https...
-
OPPO 下一代大数据 AI 一体架构实践
一、技术架构 OPPO 大数据场景丰富,拥有海外的 AWS 功能云,国内自建机房,机器规模超过万台,在印度则是使用混合云模式。 首先来介绍一下 AWS 上功能云 EMR 的实践。 1. 云原生计算架构 OPPO 早期全部采用 EMR,其存在以下一些问题...
-
Refuel AI 推出专为数据标注和清洗设计的开源语言模型 RefuelLLM-2
Refuel AI 最近宣布推出两个新版本的大型语言模型(LLM),RefuelLLM-2和 RefuelLLM-2-small,这两个模型专为数据标注、清洗和丰富任务而设计,旨在提高处理大规模数据集的效率。 RefuelLLM-2的主要特点包括: 自...
-
看红帽如何在RHEL与OpenShift中玩转生成式AI
市场上有很多生成式AI平台的选择,为什么要选择红帽? 红帽总裁兼CEO Matt Hicks直言红帽的不同之处在于运行位置的核心灵活性。企业既可以对小型开源模型进行混合部署,也可以在公有云或自有数据中心训练模型,同时支持主要的GPU供应商。 最近在R...
-
GPT搜索引擎原型曝光!新模型GPT4-Lite驱动,虽然鸽了发布会但代码已上传
OpenAI发布会前一天,员工集体发疯中……上演大型套娃行为艺术。 与此同时还有小动作不断,比如现在GPT-4的文字描述已不再是“最先进的模型”,而仅仅是“先进的”。 以及被鸽掉的GPT搜索引擎,原型代码上传到ChatGPT了。 黑客“光头哥”Tib...
-
Fine-Tuning Vs RAG ,该如何选择?
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 构建块:向量、令牌和嵌入 。 随着技术的不断进步,LLM 带来了前所未有的机遇,吸引了开发者和组织纷纷尝试利用其强大的能力构建应用程序。然而,当预训...
-
大神Karpathy强推,分词领域必读:自动钓鱼让大模型“发疯”的token,来自Transformer作者创业公司
关于大模型分词(tokenization),大神Karpathy刚刚推荐了一篇必读新论文。 主题是:自动检测大模型中那些会导致“故障”的token。 图片 简单来说,由于大模型tokenizer的创建和模型训练是分开的,可能导致某些token在训练中很少...
-
小心!最新AI看一眼照片就定位你在哪里,精确到经纬度
有点恐怖。 现在,AI只需随意一张照片,就能知道你在哪里,而且是可以精确到经纬度的那种! 例如下面这张随便到不能再随便的自拍,你能猜到小姐姐在哪里吗? 这事交给现在的AI来处理,它只需要“看”一眼,就能把照片里的“底裤都给扒出来”: 美国,加利福尼亚...
-
Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动
Meta FAIR 联合哈佛优化大规模机器学习时产生的数据偏差,提供了新的研究框架。 众所周知,大语言模型的训练常常需要数月的时间,使用数百乃至上千个 GPU。以 LLaMA2 70B 模型为例,其训练总共需要 1,720,320 GPU hours。由...
-
OpenAI 部署新功能,ChatGPT 将具备电话通话能力
OpenAI 正在为其流行的语言模型 ChatGPT 部署一项特别的新功能,该功能将使其能够进行类似电话通话的交互。这一更新预计将在周一的某个活动中公布。 为了实现这一功能,OpenAI 已经部署了必要的 WebRTC(Web Real-Time Com...
-
70亿LLaMA媲美5400亿PaLM!MIT惊人研究用「博弈论」改进大模型|ICLR 2024
遇到一个问题用不同表达方式prompt时,大模型往往会给出两种不同的答案。 比如,「秘鲁的首都是什么」,「利马是秘鲁的首都吗」。 对于这种回答不一致的问题,科学家们纷纷为大模型的「智商」担忧起来。 正如了LeCun所言: LLM确实比狗积累了更多的事实知...
-
生成式AI模型大PK——GPT-4、Claude 2.1和Claude 3.0 Opus
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 简介 当前,RAG(检索增强生成 系统的新评估似乎每天都在发布,其中许多都集中在有关框架的检索阶段。然而,生成方面——模型如何合成和表...
-
ChatGPT之父OpenAI CEO:iPhone是最伟大的技术产品
快科技5月12日消息,据国外媒体报道,ChatGPT之父、OpenAI首席执行官山姆奥特曼日前参加了播客节目All-inPodcast”。 在访谈中奥特曼表示,iPhone是人类历史上制造出的最伟大的技术产品之一。 当被问及语言模型在设备端的情况如何呢”时...
-
Siri Ultra:快捷命令激活iPhone上的大模型进行对话与搜索
Siri Ultra是一款由大型语言模型(LLMs)支持的智能助手,它能够与iPhone上的快捷命令集成,实现包括Llama3、GPT等模型在内的对话功能。用户现在可以享受实时语音交互和联网搜索的便利。 Siri Ultra利用Cloudflare Wo...
-
奥特曼"剧透"OpenAI发布会:不是GPT-5,也不是搜索引擎 媒体爆料:是语音助手
5月11日消息,美国时间周五,人工智能初创公司OpenAI CEO萨姆·奥特曼(Sam Altman)在社交媒体X上发布了一条推文,调侃称将在本周一揭晓的“新产品”“感觉像魔法一样”。 【图注】 萨姆·奥特曼: 不是GPT-5,也不是搜索引擎,但我...
-
图灵巨头现身ICLR,顶会现场疯狂追星LeCun、Bengio!中国团队三大技术趋势引爆AGI新想象
这几天,AI届的盛会——ICLR在维也纳举办。 OpenAI、Meta、谷歌、智谱AI等世界前沿AI科技企业齐聚一堂。 现场名流云集,星光耀眼,走几步就能偶遇一位发过颠覆性paper的大咖。 毫无意外地,ICLR 2024展厅也变成了追星现场。热闹的气氛...
-
14 项任务测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力?
2023-2024年,以 GPT-4V、Gemini、Claude、LLaVA 为代表的多模态大模型(Multimodal LLMs)已经在文本和图像等多模态内容处理方面表现出了空前的能力,成为技术新浪潮。 然而,对于这些模型的评测多集中于语言上的任务,...
-
AI游戏“换你来当爹”在哪玩 “换你来当爹”网页入口地址
在人工智能技术的推动下,游戏行业正在经历一场革命。最近,一款名为《换你来当爹》的AI游戏引起了广泛关注。这款游戏利用了最新的大型语言模型(LLM)技术,通过AI实时生成剧情和对应图片,为玩家提供了一种全新的游戏体...
-
扩散模型与文生视频
一、快速发展的文生视频 在当前的人工智能领域,文生视频技术有着引人注目的进展。该技术的核心任务非常明确,就是利用文本指令来控制视频内容的生成。具体而言,用户可以输入特定文本,系统则根据这段文本生成相应的视觉画面。这一过程并不局限于单一的输出,相同的文本可...
-
研究人员发现了针对云托管AI模型的“LLM劫持”计划
据网络安全研究人员透露,他们发现了一种新颖的攻击方式,利用窃取的云凭证针对云托管的大型语言模型(LLM)服务,目的是向其他威胁行为者出售访问权限。该攻击技术被 Sysdig 威胁研究团队命名为 LLMjacking。 研究人员 Alessandro Br...
-
人工智能正在摧毁互联网内容生态系统
苹果公司的新iPadPro的广告展示了一台巨型工业液压机如何将人类文化艺术的标志性器具(乐器、书籍、绘画材料等 无情碾压成粉末。该广告一经播出引发了全球文化界的广泛声讨。 美国电影制片人贾斯汀·贝特曼在X上写道:“为什么苹果要做一则碾压艺术的广告?科技...
-
LLM 评估新纪元:Arthur Bench 全方位解读
一、传统文本评估面临的挑战 近年来,随着大型语言模型(LLM)的快速发展和改进,传统的文本评估方法在某些方面可能已经不再适用。在文本评估领域,我们可能已经听说过一些方法,例如基于“单词出现”的评估方法,比如 BLEU,以及基于“预训练的自然语言处理模型”...
-
研究称 AI、ChatGPT 和社交媒体可能加剧气候危机
一项发表在《全球环境政治》期刊上的论坛文章指出,生成式人工智能(AI)包括像 OpenAI 的 ChatGPT 这样的大型语言模型,以及社交体可能会削弱应对气候变化的努力。 来自英属哥伦比亚大学(UBC)的研究人员出,人们普遍认为 AI、社交媒体和其他技术...
-
太酷了!手机上部署最新AI大模型!只需两步!
在当前的AI革命中,大模型扮演着至关重要的角色,而这背后的基础便是Scaling Law。简而言之,随着数据、参数和计算能力的不断提升,大模型的能力也随之增强,展现出小规模模型所无法比拟的“涌现能力”。越来越多的AI企业纷纷推出开源大模型,按照扩展定律实...
-
法国AI初创公司 Mistral AI 估值 60 亿美元
法国初创公司 Mistral 致力于开源大型语言模型的研发,已在本轮融资中估值达到60亿美元,这一消息吸了投资界的广泛关注。据悉,DST、General Catalyst 和 Lightspeed Venture Partners 等投资机构均有意参与本轮...
-
如何借助假设文档嵌入改进语义搜索?
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 本文介绍了如何使用简单的大语言模型(LLM 调用来显著改善语义搜索结果的质量。 找到合适的AI模型来构建工作流程很困难。由于不同平台上...
-
原作者带队,LSTM真杀回来了!
20 世纪 90 年代,长短时记忆(LSTM)方法引入了恒定误差选择轮盘和门控的核心思想。三十多年来,LSTM 经受住了时间的考验,并为众多深度学习的成功案例做出了贡献。然而,以可并行自注意力为核心 Transformer 横空出世之后,LSTM 自身所...
-
AI游戏《换你来当爹》上线 结果,我把逆子室友养废了...
在人工智能技术的推动下,游戏行业正经历着一场革命。最近,一款名为《换你来当爹》的AI游戏引起了广泛关注。这款游戏利用了最新的LLM(大型语言模型)技术,通过AI实时生成剧情和对应图片,为玩家提供了一种全新的游戏体验。 《换你来当爹》的核心魅力在于其高度的...
-
谷歌CEO皮查伊最新专访:AI浪潮尚处早期 已准备好打持久战
快科技5月9日消息,据国外媒体报道,近日谷歌CEO桑达尔皮查伊接受了《The Circuit With Emily Chang》主持人的独家专访。 皮查伊在访谈中指出,自2016年起,人工智能就已成为谷歌的核心焦点,尽管谷歌在聊天机器人领域的起步较晚,但他...
-
跟这些头部厂商交流后,终于知道AIGC、大模型持续火爆的原因 | WOT技术大会
2024年,是AIGC出现的第三年,也是其应用落地的元年!站在2024年的当下,有人会产生这样的疑问:为什么AIGC、大模型持续火爆? 一个新兴概念之所以持续火爆,无外乎两个原因:往上看,技术本身还有着无穷无尽的发展潜力,远未触顶,国外的OpenAI、...
-
AlphaGo核心算法增强,7B模型数学能力直逼GPT-4,阿里大模型新研究火了
把AlphaGo的核心算法用在大模型上,“高考”成绩直接提升了20多分。 在MATH数据集上,甚至让7B模型得分超过了GPT-4。 一项来自阿里的新研究引发关注: 研究人员用蒙特卡洛树搜索(MCTS)给大语言模型来了把性能增强,无需人工标注解题步骤,也能...
-
LangGraph实战:从零分阶打造人工智能航空客服助手
客服助手机器人能够帮助团队更高效地处理日常咨询,但要打造一个能够稳定应对各种任务且不会让用户感到烦恼的机器人并非易事。 完成本教程后,你不仅会拥有一个功能完备的机器人,还将深入理解LangGraph的核心理念和架构设计。这些知识将帮助你在其他人工智能项目...
-
研究发现 AI 生成的同情心存在局限性
人工智能生成的对话代理(CAs)如 Alexa 和 Siri 旨在回答问题、提供建议,甚至展现同情心。然而,最新研究发现,在解释和探索用户体验方面,它们与人类相比表现不佳。 CAs 由大型语言模型(LLMs)驱动,这些模型摄入大量人类产生的数据,因此可能存...
-
理论+实践,带你了解分布式训练
本文分享自华为云社区《大模型LLM之分布式训练》,作者: 码上开花_Lancer。 随着语言模型参数量和所需训练数据量的急速增长,单个机器上有限的资源已无法满足大语言模型训练的要求。需要设计分布式训练(Distributed Training)系统来解决...
-
LLM全搞定!OmniDrive:集3D感知、推理规划于一体(英伟达最新)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 这篇论文致力于解决当前多模态大语言模型 (MLLMs 在自动驾驶应用中存在的关键挑战,尤其是将MLLMs从2D理解扩展到3D空间的问题。由于自动驾驶车辆 (AVs ...
-
港大开源图基础大模型OpenGraph 增强图学习泛化能力
香港大学数据智能实验室主任黄超团队开发了一款名为 OpenGraph 的图基础大模型,专注于在多种图数据集上进行零样本预测。该模型通过学习通用的图结构模式,仅通过前向传播即可对全新数据进行预测,有效缓解了图学习领域的数据饥荒问题。 关键特点: 强泛化能...
-
港大开源图基础大模型OpenGraph: 强泛化能力,前向传播预测全新数据
图学习领域的数据饥荒问题,又有能缓解的新花活了! OpenGraph,一个基于图的基础模型,专门用于在多种图数据集上进行零样本预测。 背后是港大数据智能实验室的主任Chao Huang团队,他们还针对图模型提出了提示调整技术,以提高模型对新任务的适应性。...
-
红帽发布 RHEL AI,助力企业开发、运行开源生成式AI模型
红帽在最近举办的峰会上宣布推出了 Red Hat Enterprise Linux AI(RHEL AI)开发者预览版。 该产品被定位为基础模型平台,用于无缝开发、测试和运行同类最佳的开源 Granite 生成式人工智能模型,为企业应用提供动力。RHEL...
-
据报道,微软正在开发拥有5000亿个参数的MAI-1人工智能模型
据The Information近日报道,微软公司正在开发一个拥有约5000亿个参数的大型语言模型。 据悉,这个在微软内部被称为MAI-1的大型语言模型预计最早将于本月亮相。 OpenAI在2020年中期推出 GPT-3 时,详细说明了该模型的初始版...
-
Agent Hospital:一个先进的虚拟AI医院模拟平台
Agent Hospital是一个创新的虚拟AI医院平台,它通过模拟医院中的所有真实医疗流程,为医疗教育和临床决策提供了一个高效的训练和研究环境。该平台涵盖了从疾病发生到治疗与康复的整个医疗过程,包括分诊、挂号、咨询、检查、诊断、治疗和随访等关键环节。...
-
7262篇提交,ICLR 2024爆火,两篇国内论文获杰出论文提名
ICLR 全称为国际学习表征会议(International Conference on Learning Representations),今年举办的是第十二届,于 5 月 7 日至 11 日在奥地利维也纳展览会议中心举办。 在机器学习社区中,ICLR...
-
使用LLMLingua-2压缩GPT-4和Claude提示
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 缩短发送给大型语言模型(LLM 的提示的长度可以减少推理时间并降低成本。这是提示压缩成为LLM研究的一个热门领域的原因。 清华大学和微...
-
马斯克:SpaceX不使用AI 在太空探索领域几乎没用
快科技5月7日消息,据媒体报道,在一次访谈中,SpaceX CEO埃隆马斯克被问及人工智能是否会加速他在太空探索方面的努力,他表示:还没看到它有什么用。” 马斯克称:奇怪的是,太空探索几乎没有使用人工智能。所以SpaceX基本上没有使用人工智能,Starl...