-
通用世界模型问世:不学习就能生成新领域视频,可实时控制
随着 OpenAI 今年 2 月发布 Sora,世界模型(World Model)再次成为了 AI 领域的热门。 世界模型,即通过预测未来的范式对数字世界和物理世界进行理解,一直以来被认为是通往通用人工智能(AGI)的关键路径之一,与当前大模型推崇的智能...
-
利用大语言模型增强网络抓取:一种现代化的方法
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 本文将探讨大语言模型(LLMs 与网络抓取的集成,以及如何利用LLMs高效地将复杂的HTML转换为结构化的JSON。 作为一名数据工程...
-
字节携港大南大升级 LLaVA-NeXT:借 LLaMA-3 和 Qwen-1.5 脱胎换骨,轻松追平 GPT-4V
文 | 王启隆 出品 | 《新程序员》编辑部 2023 年,威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学的研究人员共同开发的 LLaVA 首次亮相,彼时它被视为一个端到端训练的大型多模态模型,展现了在视觉与语言融合领域的潜力。今年...
-
AI大模型探索之路-训练篇25:ChatGLM3微调实战-基于LLaMA-Factory微调改造企业级知识库
系列篇章💥 AI大模型探索之路-训练篇1:大语言模型微调基础认知AI大模型探索之路-训练篇2:大语言模型预训练基础认知AI大模型探索之路-训练篇3:大语言模型全景解读AI大模型探索之路-训练篇4:大语言模型训练数据集概览AI大模型探索之路-训练篇5:大...
-
自回归模型的优缺点及改进方向
在学术界和人工智能产业中,关于自回归模型的演进与应用一直是一个引发深入讨论和多方观点交锋的热门议题。尤其是Yann LeCun,这位享誉全球的AI领域学者、图灵奖的获得者,以及被誉为人工智能领域的三大巨擘之一,他对于自回归模型持有独特的批判视角。值得注意...
-
大模型API接口费用对比:阿里百度字节AI哪家最便宜?
在过去一周内,阿里、百度、字节跳动三家科技巨头相继宣布了大模型API服务的重磅优惠,将价格战升级到了前所未有的"白热化"程度。短短 3 小时内,它们甚至让外界产生"发钱补贴"的荒诞感受。但实际上,这场噱头十足的促销活动的确引发了不少质疑。如何在混乱的宣传噪...
-
大模型API接口费用高吗多少钱?通义千问、文心一言、豆包、星火AI最新价格查询
5 月 21 日上午,阿里云在其例行峰会上意外地释放了大降价的消息:通义千问GPT- 4 级主力模型推理输入价格降至0. 5 元/百万tokens,直降97%。这一消息瞬间引发了业界的广泛关注和讨论。 然而,短短数小时后,百度智能云官宣文心大模型主力模型...
-
前Reddit CEO称科技巨头AI竞赛过度导致产品质量下降
前 Reddit CEO Yishan Wong 指出,科技巨头对人工智能(AI)的过度迷恋已经开始影响他们推出的产品质量。在周三的一篇文章中,Wong 表示:“大型互联网巨头正陷入 AI 的模因竞争中,而 Google 对 OpenAI 的生存恐惧则处于...
-
大模型API价格计算器使用入口 国内AI调用接口费用在线计算
在AI领域,尤其是大型语言模型(LLM)的市场竞争愈发激烈。近期,阿里云、百度智能云以及字节跳动等科技巨头纷纷调整其API接口费用,以吸引更多的开发者和企业用户。这一系列的价格变动不仅反映了市场对于AI技术的强烈需求,也预示着行业内部竞争的加剧。 首先,...
-
除了RAG,还有这五种方法消除大模型幻觉
出品 | 51CTO技术栈(微信号:blog51cto) 众所周知,LLM会产生幻觉——即生成不正确、误导性或无意义的信息。 有意思的是,一些人,如OpenAI的CEO Sam Altman,将AI的幻觉视为创造力,而另一些人则认为幻觉可能有助于做出新...
-
Kimi、GPT、豆包、智谱大模型API接口费用价格详细对比 哪家AI最便宜?
人工智能大模型的价格战正在如火如荼地进行中。随着更多科技巨头加入战团,大模型API费用的天花板不断被刷新,给消费者带来了前所未有的实惠。在这场空前的价格大战中,AIbase将全程追踪各家最新行情,助你抢占先机。 价格新地板已现雏形 5 月 21 日,阿里...
-
七个很酷的GenAI & LLM技术性面试问题
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 译者 | 晶颜 审校 | 重楼 不同于互联网上随处可见的传统问题库,这些问题需要跳出常规思维。 大语言模型(LLM 在数据科学、生成式...
-
大模型降价狂潮引发价格战:通义千问、豆包最新API接口费用查询对比
人工智能正在以前所未有的速度发展,大模型已经成为当下科技领域的热门话题。近期,一场大模型API费用的降价狂潮在国内外掀起了轩然大波,多家科技巨头纷纷加入战团,推出史无前例的优惠促销措施。在这场价格大战中,消费者无疑将成为最大赢家。 降价潮源头:字节豆包大...
-
拯救被「掰弯」的GPT-4!西交微软北大联合提出IN2训练治疗LLM「中间迷失」
【新智元导读】近日,西交微软北大联合提出信息密集型训练大法,使用纯数据驱动的方式,矫正LLM训练过程产生的偏见,在一定程度上治疗了大语言模型丢失中间信息的问题。 辛辛苦苦给大语言模型输入了一大堆提示,它却只记住了开头和结尾? 这个现象叫做LLM的中间迷失(...
-
KubeAI大模型推理加速实践|得物技术
除了上面提到的技术外,提高大模型推理速度的还有大模型的量化技术等,这里先不探讨,后面有机会,我们会单独发文章来介绍。 二、大模型发展面临的挑战 未来大模型的参数量肯定会越来越大,这也是大模型的发展趋势,对推理加速的要求会越来越高。 OpenAI在其论...
-
拒绝AI生成代码!开源操作系统陆续举起“禁令”,Debian尚无行动
整理丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 当下,AI的崛起已成大势。但是,当AI的触角伸向开源操作系统时,一些社区陆续亮起了“红灯”。 先是Linux发行版Gentoo 在四月中旬发布了一项理事会政策,禁止使用AI工具生成...
-
牛津大学最新 | 近400篇总结!畅谈大语言模型与三维世界最新综述
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 随着大型语言模型(LLM)的发展,它们与3D空间数据(3D LLM)之间的集成取得了快速进展,为理解物理空间和与物理空间交互提供了前所未有的能力。本文全面概述了LLM...
-
通过检索增强生成(RAG) 增强LLM的实战演练
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 拥有正确的数据来支持用例对于在任何业务中成功采用大型语言模型(LLM 都是至关重要的。虽然大多数现成的LLM在完成一般任务上表现出色,...
-
众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸
大模型排行榜哪家强?还看LLM竞技场~ 截至此刻,已有共计90名LLM加入战斗,用户总投票数超过了77万。 图片 然而,在网友们吃瓜调侃新模型冲榜、老模型丧失尊严的同时, 人家竞技场背后的组织LMSYS,已经悄悄完成了成果转化:从实战中诞生的最有说服力的...
-
谷歌数学版Gemini解开奥赛难题,堪比人类数学家!
四个月的迭代,让Gemini 1.5 Pro成为了全球最强的LLM(几乎)。 谷歌I/O发布会上,劈柴宣布了Gemini 1.5 Pro一系列升级,包括支持更长上下文200k,超过35种语言。 与此同时,新成员Gemini 1.5 Flash推出,设计...
-
AI在软件开发中的角色:辅助而非替代
事实表明,AI无法替代开发者,但更适用于优秀的开发者。而识别大型语言模型(LLM)生成的代码什么时候会出错,需要开发人员具有丰富的知识和经验。 软件工程师David Showalter在谈到AI编程时表示:“目前,AI模型在帮助编程人员提高工作效率方面...
-
Karpathy称赞,从零实现LLaMa3项目爆火,半天1.5k star
一个月前,Meta 发布了开源大模型 llama3 系列,在多个关键基准测试中优于业界 SOTA 模型,并在代码生成任务上全面领先。 此后,开发者们便开始了本地部署和实现,比如 llama3 的中文实现、llama3 的纯 NumPy 实现等。 十几个小...
-
数据更多更好还是质量更高更好?这项研究能帮你做出选择
对基础模型进行 scaling 是指使用更多数据、计算和参数进行预训练,简单来说就是「规模扩展」。 虽然直接扩展模型规模看起来简单粗暴,但也确实为机器学习社区带来了不少表现卓越的模型。之前不少研究都认可扩大神经模型规模的做法,所谓量变引起质变,这种观点也...
-
GPT-4通过图灵测试,胜率高达54%!UCSD新作:人类无法认出GPT-4
GPT-4可以通过图灵测试吗? 当一个足以强大的模型诞生之后,人们往往会用图灵测试去衡量这一LLM的智能程度。 最近,来自UCSD的认知科学系研究人员发现: 在图灵测试中,人们根本无法区分GPT-4与人类! 论文地址:https://arxiv.org...
-
欧盟警告微软可能面临数十亿美元罚款,因未提供生成式AI风险信息
欧洲联盟(EU)警告微软,根据该联盟的数字服务法案(Digital Services Act,DSA ,微软可能面临高达全球年收入的1% 的罚款,因为该公司未能回应关于其生成式人工智能工具的信息请求。 今年3月,欧盟要求微软和其他一些科技巨头提供关于生成式...
-
我们一起聊聊AI模型组合指南
实施需要周密的计划、资源管理以及采用现代部署实践和工具。 译自A Guide to Model Composition,作者 Sherlock Xu。 考虑一款旨在识别和分类野生动物照片的 AI 驱动的图像识别应用程序。您上传一张远足时拍摄的照片,几分钟...
-
研究发现英国 AI 聊天机器人的安全措施容易被绕过
英国政府的 AI 安全研究所(AISI)发现,防止聊天机器人背后的人工智能模型发出非法、有毒或露骨回应的保护措施可以被简单的技术绕过。AISI 表示,他们测试的系统 “极易受到攻击”,这些系统很容易被 “越狱”,即用文字提示来引发模型本应避免的回应。 图...
-
Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA
GPT-4o的横空出世,再次创立了一个多模态模型发展的新范式! 为什么这么说? OpenAI将其称为「首个『原生』多模态」模型,意味着GPT-4o与以往所有的模型,都不尽相同。 传统的多模态基础模型,通常为每种模态采用特定的「编码器」或「解码器」,将不...
-
GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4
OpenAI在发布会上官宣GPT-4o之后,各路大神也开始了对这个新模型的测评,结果就是,GPT-4o在多项基准测试上都展现了SOTA的实力。 别家发布会都在画饼,OpanAI却总能开出一种「欲扬先抑」的效果,惊喜全在发布会之后。 基准测试结果 首先...
-
一文读懂常见的几种 LangChain 替代品
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 开发框架 。 在 LLM (大规模语言模型 应用开发领域,开源框架扮演着至关重要的角色,为广大开发者提供了强大的工具支持。作为这一领域的领军者,Lan...
-
数据分析师噩梦?ChatGPT实时互动分析Excel数据,网友挖出背后新模型
ChatGPT更强了... 刚刚,OpenAI再次放出大招——ChatGPT可以直接打开线上数据文件,完成实时数据分析。 图片 全新的增强功能,具体包括: - 直接从Google Drive和Microsoft OneDrive上传最新版本的文件 - 在...
-
70B模型秒出1000token,代码重写超越GPT-4o,来自OpenAI投资的代码神器Cursor团队
70B模型,秒出1000token,换算成字符接近4000! 研究人员将Llama3进行了微调并引入加速算法,和原生版本相比,速度足足快出了快了13倍! 不仅是快,在代码重写任务上的表现甚至超越了GPT-4o。 这项成果,来自爆火的AI编程神器Curso...
-
GPT-4o:实现跨越文本与视觉的智能交互 原创
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 摘要 OpenAI最新发布的GPT-4o模型及其在多模态处理上的卓越能力,标志着人机交互迈向新的高度。GPT-4o能够处理文本、音频、...
-
数据库为啥要融合+AI化?甲骨文Oracle 23ai给出了回答
2017年,一篇名为《Attention is All You Need》的论文提出了一种新的神经网络架构: Transformer。七年后,Transformer成为了生成式AI的核心,正引领着今天的技术浪潮。 在甲骨文公司副总裁及中国区董事总经理吴...
-
通义千问 2.5 “客串” ChatGPT4,你分的清吗?
作者:张添翼、董艺荃 引子 OpenAI 发布了最新的 GPT-4o 模型,通义千问也在前不久刚发布通义千问 2.5,已经和 GPT-4-Turbo 不分伯仲: 既然目前还没有和 GPT-4o 文本生成能力的对比数据,就让我们来和大模型一起做个游...
-
红帽用RHEL AI和OpenShift AI塑造开源AI的未来
发展至今,AI技术对工作方式、决策过程乃至商业模式的重塑已经逐渐具象化。 红帽,作为开源解决方案的领军企业,在近日的在Red Hat Summit上,红帽展示了从RHEL AI的推出到InstructLab模型对齐工具的集成,再到OpenShift AI...
-
知识图与大型语言模型的协同作用
从非结构化文本中提取有价值的见解是金融行业的关键应用。然而,这项任务往往超出了简单的数据提取,需要高级推理能力。 一个典型的例子是确定信贷协议中的到期日,这通常涉及破译一个复杂的指令,如“到期日应在生效日期三周年之前的最后一个工作日”。这种级别的复杂推...
-
使用开源GenAI时需要注意的十个问题
如今似乎任何人都可以制作AI模型。即使你没有训练数据或编程技巧,你也可以选择你喜欢的开源模型,对其进行调整,并以新的名字发布。 根据斯坦福大学在4月发布的AI指数报告,2023年发布了149个基础模型,其中三分之二是开源的,而且有大量的变体。Huggi...
-
一文读懂主流领先的 SLM(小型语言模型)
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - SLM(小型语言模型 。 在 AI 狂卷的浪潮中,LLM(大型语言模型 无疑成为了整个互联网乃至科技界的焦点所在。以 GPT-3、BERT 等为代表的 LL...
-
一些 Llama3 微调工具以及如何在 Ollama 中运行
Llama3是Meta提供的一个开源大模型,包含8B和 70B两种参数规模,涵盖预训练和指令调优的变体。这个开源模型推出已经有一段时间,并且在许多标准测试中展示了其卓越的性能。特别是Llama3 8B,其具备小尺寸和高质量的输出使其成为边缘设备或者移动设...
-
与机器对话:揭示提示工程的十个秘密
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 提示的力量十分神奇,我们只需抛出几个近似人类语言的单词,就能得到一个格式和结构都良好的答案。没有什么话题是晦涩难懂的,没有什么事实是触...
-
字节发布豆包大模型,以普惠AI推动企业业务创新
根据麦肯锡的报告显示,到2030年,大模型推动的全球经济增量将达到49万亿人民币,其中中国部分的经济增量将达到14万亿人民币。这里面既包括大模型对现有工作效率的提升,也包括新技术所带来的新场景和新业态。 虽然我们看到更多的企业和开发者在积极拥抱大模型,甚...
-
大模型真要取代程序员了?最危险的岗位是......
如今,随着大模型在编程、代码生成、自动化测试等领域展现出越来越强大的能力,一个引人深思的问题浮现出来:大模型会不会最终取代程序员的工作? 有些人认为,世界上本就没有哪项工作是绝对安全的,机器取代人工本就是迟早的事。从 GitHub Copilot...
-
2024春季火山引擎FORCE原动力大会总结 字节豆包9大模型详细介绍
在2024年春季火山引擎FORCE原动力大会上,字节跳动隆重推出了自主研发的“豆包大模型”系列,标志着该公司在人工智能领域的深厚积累和创新能力。这一系列大模型涵盖了豆包通用模型Pro、lite,以及角色扮演模型、语音合成模型、声音复刻模型、语音识别模型、文...
-
字节跳动豆包大模型发布,火山引擎全栈 AI 服务助力企业智能化转型
火山引擎总裁 谭待 企业要做好大模型落地,面临模型效果、推理成本、落地难度的三大关键挑战:既要有好的基础大模型做支撑,解决复杂难题,也要有低成本的推理服务让大模型被广泛应用,还要更多工具、平台和应用帮助企业做好场景落地。 ——谭待 火山引擎总裁...
-
GPT-4o干掉初创全网实测,马斯克Karpathy等大佬纷表不服:OpenAI不过如此
OpenAI一夜之间,又干掉了一大批初创公司。 官方公布的全能模型GPT-4o的炸裂演示,即便过去了一天,依旧让全网深陷其中,无法自拔。 凭借实时语音视频对话,GPT-4o已经深入教育、翻译、视频会议等领域的变革。 OpenAI科学家Lilian W...
-
Agents需要一个代码解释器
作者 | Vasek Mlejnsky 编译 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 构建人工智能代理很难。你将与幻觉作斗争,让agents智商不掉线,并引导他们使用正确的工具。 不过,方法也不难,其中一种就是赋予代理代码执行...
-
MIT最新!多模态LLM真的无所不能吗?大模型能解决一切难题吗?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文对自动驾驶领域内多模态大型语言模型(MLLMs)的应用进行了审慎的审视,并对一些常见的假设提出了质疑/验证,重点关注它们通过闭环控制环境中的图像/帧序列推理和解释...
-
Llama-3的竞争对手来了——可运行在iPhone上的小体量高性能LLM模型Phi-3
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 简介 熟悉我的文章的读者可能还记得我以前报道《课本就是你所需要的一切》(https://medium.com/@mgunton7/th...
-
MIT等惊人发现:全世界AI已学会欺骗人类!背刺人类盟友,佯攻击败99.8%玩家
【新智元导读】AI系统越来越擅长欺骗、操作人类了。最近,来自MIT、ACU等机构的研究人员通过各种实例研究发现, AI在各类游戏中,通过佯装、歪曲偏好等方式欺骗人类,实现了目标。 AI教父Hinton的担心,不是没有道理。 他曾多次拉响警报,「如果不采取行...