-
击穿全球底价!阿里云通义千问GPT-4级主力模型降价97%:约为GPT-4价格的1/400
快科技5月21日消息,今日阿里云宣布,通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。 这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。...
-
To C大模型,将是字节跳动新“王牌”?
字节跳动,“放大招”了! 5月15日,火山引擎发布会上,字节正式对外发布豆包大模型,并宣布了0.0008元/千Tokens的超低定价。 火山引擎还做了个类比:一元钱就能买到豆包主力模型的125万Tokens,大约200万个汉字,相当于三本《三国演义》。 豆...
-
微软重新定义AI PC:与GPT-4o共享屏幕,看过的一切再也不会忘
今天,微软重新定义了个人电脑。 刚刚发布新一代Copilot+PC,让上市还没几天的第一批AI PC直接过时了。 在新一代PC里,打游戏时可与AI实时对话,提供吐槽陪玩或攻略指导,由GPT-4o提供支持。 任何文件或网页浏览记录都可以用自然语言搜索,轻...
-
大模型“价格战”开打,给刚入商业化“佳境”的智谱AI提出了新挑战
1块钱买100万个tokens,为跟上Open AI,这家公司先给自己打个“骨折价”。 1 一比一复刻Open AI AI大模型在商业化路途中还在摸索,便已开打“价格战”。 5月15日,字节跳动宣布,豆包通用模型pro在企业市场的定价为0.0008元/千T...
-
蚂蚁多模态团队在视频多模态方向的技术探索
一、概述 视频多模态检索在蚂蚁内部有着广泛的应用。视频多模态检索具体包括两个方向,一个是视频-文本的语义检索,另外一个是视频-视频的同源检索。 视频-文本的语义检索方向旨在通过文本检索与其语义相近的视频,其检索文本未必在检索到的视频描述中直接出现,但检...
-
谷歌Gemini 1.5技术报告:轻松证明奥数题,Flash版比GPT-4 Turbo快5倍
今年 2 月,谷歌上线了多模态大模型 Gemini1.5,通过工程和基础设施优化、MoE 架构等策略大幅提升了性能和速度。拥有更长的上下文,更强推理能力,可以更好地处理跨模态内容。 本周五,Google DeepMind 正式发布了 Gemini 1.5...
-
150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory
不同于大多数模型使用字母缩略起名,论文作者在脚注中解释道,Lory是一种羽毛有彩虹颜色的鹦鹉,和「软MoE」的精神非常相似。 论文的作者团队也可以称之为「明星阵容」。 论文地址:https://arxiv.org/abs/2405.03133 主要作者...
-
从“天价”到“骨折价”,大模型要变天了
十年后,国内云厂商又打起来了! 近一个月,国内云厂商掀起了新一轮的大模型降价潮。这意味着AI竞争已经不仅仅是一场军备技术竞赛这么简单,各头部厂商也在考虑如何赚钱了。 在这场价格战中,包括火山引擎、阿里,还有智谱AI、面壁智能这样的明星创业团队都卷了进来。各...
-
众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸
大模型排行榜哪家强?还看LLM竞技场~ 截至此刻,已有共计90名LLM加入战斗,用户总投票数超过了77万。 图片 然而,在网友们吃瓜调侃新模型冲榜、老模型丧失尊严的同时, 人家竞技场背后的组织LMSYS,已经悄悄完成了成果转化:从实战中诞生的最有说服力的...
-
时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3
这几天,全世界的目光仿佛都被OpenAI发布的GPT-4o所吸引,与此同时,OpenAI的挑战者们也在同步创造历史。 就在5月14日,阿布扎比先进技术研究委员会(ATRC)下属的技术创新研究所(TII),发布了新一代的Falcon 2模型。 Falco...
-
Karpathy称赞,从零实现LLaMa3项目爆火,半天1.5k star
一个月前,Meta 发布了开源大模型 llama3 系列,在多个关键基准测试中优于业界 SOTA 模型,并在代码生成任务上全面领先。 此后,开发者们便开始了本地部署和实现,比如 llama3 的中文实现、llama3 的纯 NumPy 实现等。 十几个小...
-
国产大模型的价格已经卷出网约车大战和百亿补贴的味儿了
登录就送500w tokens! 1 块钱 100w tokens!一降再降!!仅需0. 0008 元/千tokens! 没错,互联网价格战熟悉的“味”,已经悄无声息的打到了大模型的战场。 技术狂飙了一年,大模型公司们早就按捺不住要搅弄商业风云的心, 5...
-
Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA
GPT-4o的横空出世,再次创立了一个多模态模型发展的新范式! 为什么这么说? OpenAI将其称为「首个『原生』多模态」模型,意味着GPT-4o与以往所有的模型,都不尽相同。 传统的多模态基础模型,通常为每种模态采用特定的「编码器」或「解码器」,将不...
-
探究防采集IP技术的重要性及实施方法
在当今数字化信息时代,网络安全问题显得愈发重要。随着互联网技术的迅猛发展,数据资源的价值日益凸显,而网络数据采集作为一种常见手段,时常被用于信息获取与分析。然而,未经授权的数据采集行为不仅侵犯了个人隐私与商业机密,更可能导致严重后果。因此,防采集IP技术应...
-
HuggingFace教你怎样做出SOTA视觉模型
前有OpenAI的GPT-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。 其他从业者在震撼之余,也再次开始思考怎么追赶这些超级模型了。 刚好在这时,HuggingFace和法国索邦大学的一篇论文,总结出了构建视觉大模型的关键经验,给开发者指明了一...
-
70B模型秒出1000token,代码重写超越GPT-4o,来自OpenAI投资的代码神器Cursor团队
70B模型,秒出1000token,换算成字符接近4000! 研究人员将Llama3进行了微调并引入加速算法,和原生版本相比,速度足足快出了快了13倍! 不仅是快,在代码重写任务上的表现甚至超越了GPT-4o。 这项成果,来自爆火的AI编程神器Curso...
-
生成式AI时代下的企业,该如何充分挖掘数据价值?
在数字经济迅猛发展的时代背景下,数据已经上升为核心生产要素,不仅有力促进了各行各业的创新转型升级,更成为推动经济增长的重要力量。 特别是近年来生成式AI快速发展,极大地改变了企业决策的方式和效率。而在这一过程中,数据作为智能的“燃料”,其质量和数量直接...
-
AI论文系统:助你称霸学术论文市场!(论文高客单价+快速变现)
解放你的学术困扰,AI论文生成系统为你赋能! 毕业季来临!你是否还在为写论文而深夜焦虑?是否为了找到一个恰当的论点而翻阅了无数资料?是否为了语言的流畅性和逻辑的严谨性而反复修改、苦思冥想?今天,我们要介绍的AI论文生成系统,正是为你解决这些学术烦恼的利器!...
-
花1块钱就有上万篇内容,新晋AI顶流把价格打下来了
过去几天,AI行业大事件高度密集。 先是OpenAI贴脸开大发布GPT-4o,而后谷歌I/O大会原地回击掏出华丽升级Gemini全家桶。放眼国内AI赛道,备受关注的则是字节终于高调发布豆包大模型家族。 昨天上午,当火山引擎总裁谭待宣布豆包通用模型推理输入价...
-
GPT-4o手写板书以假乱真惊呆网友!杀死谷歌翻译,代码建模无所不能
GPT-4o到底有多强?只有用过才能知道。这两天,网友们不仅探索出了很多全新ChatGPT的炫酷用法,也逐渐开始意识到,这标志这OpenAI将逐渐替代谷歌曾经的地位,全面接管AGI时代。 随着越来越多人开始试用GPT-4o,大家发现发布会上的demo真的...
-
字节内部AI“赛马”结束,大模型全跟豆包姓,一出手就点名阿里百度
过去一年,围绕着字节AI的几个谜团,终于都在今天被揭开了。 5 月 15 日火山引擎Force原动力大会上,字节大模型进行了全系列更名,从云雀大模型升级为豆包大模型家族,一口气发布了 9 个豆包模型,其中包括通用模型pro版、通用模型lite版以及各个领域...
-
一些 Llama3 微调工具以及如何在 Ollama 中运行
Llama3是Meta提供的一个开源大模型,包含8B和 70B两种参数规模,涵盖预训练和指令调优的变体。这个开源模型推出已经有一段时间,并且在许多标准测试中展示了其卓越的性能。特别是Llama3 8B,其具备小尺寸和高质量的输出使其成为边缘设备或者移动设...
-
字节发布豆包大模型,以普惠AI推动企业业务创新
根据麦肯锡的报告显示,到2030年,大模型推动的全球经济增量将达到49万亿人民币,其中中国部分的经济增量将达到14万亿人民币。这里面既包括大模型对现有工作效率的提升,也包括新技术所带来的新场景和新业态。 虽然我们看到更多的企业和开发者在积极拥抱大模型,甚...
-
字节与荣耀、小米、OPPO、vivo等共同宣布:成立智能终端大模型联盟
快科技5月15日消息,在今天的字节跳动2024春季火山引擎Force原动力大会上,火山引擎携手OPPO、vivo、荣耀、小米、三星、华硕等,共同宣布成立了智能终端大模型联盟。 联盟的成立旨在推动大模型技术在智能终端设备上的应用,通过整合各方资源,共同探索A...
-
百度:文心大模型日均处理Tokens文本达2490亿
快科技5月15日消息,今日,百度发布公告表示,文心大模型日均处理Tokens文本已达2490亿。 百度认为,使用大模型不应该只看价格,更要看综合效果,只有让AI应用效果更好、响应速度更快、分发渠道更广,才能让人们切实感受AI为社会生产带来的便利。 近日,国...
-
2024春季火山引擎FORCE原动力大会总结 字节豆包9大模型详细介绍
在2024年春季火山引擎FORCE原动力大会上,字节跳动隆重推出了自主研发的“豆包大模型”系列,标志着该公司在人工智能领域的深厚积累和创新能力。这一系列大模型涵盖了豆包通用模型Pro、lite,以及角色扮演模型、语音合成模型、声音复刻模型、语音识别模型、文...
-
字节跳动豆包大模型发布,火山引擎全栈 AI 服务助力企业智能化转型
火山引擎总裁 谭待 企业要做好大模型落地,面临模型效果、推理成本、落地难度的三大关键挑战:既要有好的基础大模型做支撑,解决复杂难题,也要有低成本的推理服务让大模型被广泛应用,还要更多工具、平台和应用帮助企业做好场景落地。 ——谭待 火山引擎总裁...
-
思维链被推翻!纽约大学新研究:大模型推理步骤或可省略
纽约大学的最新研究对当前流行的思维链(Chain-of-Thought,CoT)技术提出了挑战,该技术原本被认为能够提升大模型的推理能力。研究显示,使用省略号代替具体的推理步骤,模型的推理结果并没有显著差异,这意味着增加计算量而非推理步骤本身可能是提升性能...
-
GPT-4o干掉初创全网实测,马斯克Karpathy等大佬纷表不服:OpenAI不过如此
OpenAI一夜之间,又干掉了一大批初创公司。 官方公布的全能模型GPT-4o的炸裂演示,即便过去了一天,依旧让全网深陷其中,无法自拔。 凭借实时语音视频对话,GPT-4o已经深入教育、翻译、视频会议等领域的变革。 OpenAI科学家Lilian W...
-
字节跳动发布豆包大模型,主力模型比行业价格低99.3%
5月15日,字节跳动豆包大模型在火山引擎原动力大会上正式发布。火山引擎是字节跳动旗下云服务平台,据火山引擎总裁谭待介绍,经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿Tokens文本,生成...
-
两小时“吼出”121次AI,谷歌背后埋伏着Open AI的幽灵
谷歌和Open AI的又一次对阵,刚刚落幕了。 北京时间5月14日凌晨,OpenAI发布端到端多模态AI大模型GPT-4o,酷似科幻电影《Her》的AI语音对话迅速成为关注焦点。 24小时后,携新版Gemini AI大模型等产品,谷歌在北京时间5月15日凌...
-
谷歌反击:Project Astra正面硬刚GPT-4o、Veo对抗Sora、新版Gemini变革搜索
通用的 AI,能够真正日常用的 AI,不做成这样现在都不好意思开发布会了。 5 月 15 日凌晨,一年一度的「科技界春晚」Google I/O 开发者大会正式开幕。长达 110 分钟的主 Keynote 提到了几次人工智能?谷歌自己统计了一下: 是的,...
-
Llama-3的竞争对手来了——可运行在iPhone上的小体量高性能LLM模型Phi-3
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 简介 熟悉我的文章的读者可能还记得我以前报道《课本就是你所需要的一切》(https://medium.com/@mgunton7/th...
-
谷歌硬刚GPT-4o!60秒视频生成模型虽迟但到,上下文窗口达200万
OpenAI出手再次惊艳世界,谷歌果然坐不住了。 GPT-4o掀起的一片“AGI已至”的惊呼声中,刚刚,Google DeepMind首席执行官哈萨比斯亲自携谷歌版《Her》登场。 同样能会还有,不仅能几乎没有延迟地和人类流畅交流,通过摄像头,这个名为P...
-
微软让MoE长出多个头,大幅提升专家激活率
混合专家(MoE)是个好方法,支持着现在一些非常优秀的大模型,比如谷歌家的 Gemini 1.5 以及备受关注的 Mixtral 8x7B。 稀疏混合专家(SMoE)可在不显著增加训练和推理成本的前提下提升模型的能力。比如 Mixtral 8×7B 就是...
-
思维链不存在了?纽约大学最新研究:推理步骤可省略
红极一时的思维链技术,可能要被推翻了! 还在惊讶于大模型居然能够利用思维链分步骤思考? 还在苦于不会写思维链提示词? 来自纽约大学的研究人员表示:「没关系的,都一样」, 推理步骤不重要,不想写提示词也可以不写,用省略号代替就行了。 论文地址:https...
-
美国教授用2岁女儿训AI模型登Science!人类幼崽头戴相机训练全新AI
【新智元导读】为训练AI模型,纽约州立大学的一名教授Brenden Lake,竟让自己不到2岁女儿头戴相机收集数据!要知道,Meta训Llama3直接用了15万亿个token,如果Lake真能让AI模型学习人类幼崽,从有限的输入中学习,那LLM的全球数据荒...
-
大神Karpathy强推,分词领域必读:自动钓鱼让大模型“发疯”的token,来自Transformer作者创业公司
关于大模型分词(tokenization),大神Karpathy刚刚推荐了一篇必读新论文。 主题是:自动检测大模型中那些会导致“故障”的token。 图片 简单来说,由于大模型tokenizer的创建和模型训练是分开的,可能导致某些token在训练中很少...
-
百万tokens低至1元!大模型越来越卷了
在刚刚举行的 ICLR 2024 大会上,智谱AI的大模型技术团队公布了面向激动人心的AGI通用人工智能前景的三大技术趋势,同时预告了GLM的后续升级版本。 前天,智谱大模型开放平台(bigmodel.cn)上线了新的价格体系。入门级产品 GLM-3 T...
-
智谱 AI 上线大模型开放平台 bigmodel.cn
智谱 AI 上线大模型开放平台 bigmodel.cn ,该平台是一个集成了 GLM 系列大模型的平台。这些大模型包括企业版 GLM-4/4V、个人版 GLM-3Turbo、文本描述创作图像的 CogView-3、角色定制模型 CharacterGLM、中...
-
国产大模型:今天起,我们100万tokens只需1元!
昨天刚刚在顶会ICLR作为特邀演讲(Invited Talk)中“国内唯一”的大模型玩家智谱AI,今天又放出了一个好消息: 之前:0.005元 / 千tokens 现在:0.001元 / 千tokens 换算一下,就是1元=1000000tokens...
-
AI手机,活成产业“摇钱树”
早几年出现的折叠屏没能拯救颓势的手机市场,直接证据就是去年全球出货量依旧拉胯,同比下滑3.2%至11.7亿部,为近十年来最低。 好在Q4出现了些许回暖,全球和中国市场分别有8.5%和1.2%的同比增幅,尤其是后者,在连续同比下降10个季度后首次转正。 很难...
-
如何借助假设文档嵌入改进语义搜索?
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 本文介绍了如何使用简单的大语言模型(LLM 调用来显著改善语义搜索结果的质量。 找到合适的AI模型来构建工作流程很困难。由于不同平台上...
-
原作者带队,LSTM真杀回来了!
20 世纪 90 年代,长短时记忆(LSTM)方法引入了恒定误差选择轮盘和门控的核心思想。三十多年来,LSTM 经受住了时间的考验,并为众多深度学习的成功案例做出了贡献。然而,以可并行自注意力为核心 Transformer 横空出世之后,LSTM 自身所...
-
法国AI公司Mistral AI即将完成新融资 估值飙升至60亿美元
站长之家(ChinaZ.com)5月9日 消息:法国人工智能初创公司Mistral AI近日宣布即将达成一项新的融资协议,其估值高达60亿美元,较半年前翻了近三倍。这一成就不仅彰显了公司在人工智能领域的强大实力,也反映了市场对其未来发展潜力的高度认可。 回...
-
Deepseek-V2技术报告解读!全网最细!
深度求索Deepseek近日发布了v2版本的模型,沿袭了1月发布的 Deepseek-MoE(混合专家模型)的技术路线,采用大量的小参数专家进行建模,同时在训练和推理上加入了更多的优化。沿袭了一贯的作风,Deepseek对模型(基座和对话对齐版本)进行了...
-
港大开源图基础大模型OpenGraph 增强图学习泛化能力
香港大学数据智能实验室主任黄超团队开发了一款名为 OpenGraph 的图基础大模型,专注于在多种图数据集上进行零样本预测。该模型通过学习通用的图结构模式,仅通过前向传播即可对全新数据进行预测,有效缓解了图学习领域的数据饥荒问题。 关键特点: 强泛化能...
-
港大开源图基础大模型OpenGraph: 强泛化能力,前向传播预测全新数据
图学习领域的数据饥荒问题,又有能缓解的新花活了! OpenGraph,一个基于图的基础模型,专门用于在多种图数据集上进行零样本预测。 背后是港大数据智能实验室的主任Chao Huang团队,他们还针对图模型提出了提示调整技术,以提高模型对新任务的适应性。...
-
DeepSeek Chat:AI对话助手 - 使用教程与免费体验入口
DeepSeek Chat是什么? DeepSeek Chat,基于DeepSeek-V2 模型,是一款集成了 2 千亿参数量的MoE(Mixture of Experts)模型的AI技术产品。它在中文综合能力(AlignBench)和英文综合能力(MT-...
-
7262篇提交,ICLR 2024爆火,两篇国内论文获杰出论文提名
ICLR 全称为国际学习表征会议(International Conference on Learning Representations),今年举办的是第十二届,于 5 月 7 日至 11 日在奥地利维也纳展览会议中心举办。 在机器学习社区中,ICLR...