-
一块钱100万token,超强MoE模型开源,性能直逼GPT-4-Turbo
开源大模型领域,又迎来一位强有力的竞争者。 近日,探索通用人工智能(AGI)本质的 DeepSeek AI 公司开源了一款强大的混合专家 (MoE 语言模型 DeepSeek-V2,主打训练成本更低、推理更加高效。 项目地址:https://gi...
-
网易集团高级副总裁胡志鹏:AI 游戏新链路,端侧大模型大有可为
5月7日,MediaTek天玑开发者大会2024(MDDC2024)在深圳召开,本届MDDC 大会的主题为“AI予万物”,众多资深行业先驱、技术专家齐聚一堂,深入探讨了Al 技术在各个领域的应用和发展,以及AI 赋予终端侧的更多可能性。 在MDDC天玑高峰...
-
微调和量化竟会增加越狱风险!Mistral、Llama等无一幸免
大模型又又又被曝出安全问题! 近日,来自Enkrypt AI的研究人员发表了令人震惊的研究成果:量化和微调竟然也能降低大模型的安全性! 论文地址:https://arxiv.org/pdf/2404.04392.pdf 在作者的实际测试中,Mistra...
-
智谱AI研发国产文生视频模型对标Sora 最快年内发布
据钛媒体报道,智谱 AI 正在研发对标 OpenAI Sora 的高质量文生视频模型,预计最快年内发布。 该公司是国内一家估值过200亿的 AI 大模型独角兽公司,成立于2019年,由清华大学计算机系的技术成转化而来。智谱 AI 已推出多个大模型产品,包括...
-
AI日报:白菜价!DeepSeek发布V2模型;零一万物发布最懂打工人的AI特助;ChatGPT.COM域名启用;全国首例“AI外挂”案公开宣判
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、DeepSeek发布V2模型...
-
快3倍!Meta 违背经典模型结构,一次预测多个token,路径可行,大模型大幅提速指日可待!
编译|伊风 出品 | 51CTO技术栈(微信号:blog51cto) 众所周知,LLMs的工作原理是对下一个token进行预测。 读者朋友们有没有曾这样想过:如果LLM一次预测n个token呢?那是不是就快n倍?Meta也是这样想的!并且付诸实践。 在最...
-
国产开源MoE指标炸裂:GPT-4级别能力,API价格仅百分之一
最新国产开源MoE大模型,刚刚亮相就火了。 DeepSeek-V2性能达GPT-4级别,但开源、可免费商用、API价格仅为GPT-4-Turbo的百分之一。 因此一经发布,立马引发不小讨论。 从公布的性能指标来看,DeepSeek-V2的中文综合能力超越...
-
挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队
不需要OpenAI,微软或许也会成为AI领头羊! 外媒Information爆料称,微软内部正在开发自家首款5000亿参数的大模型MAl-1。 这恰好是,纳德拉带领团队证明自己的时候到了。 在向OpenAI投资100多亿美元之后,微软才获得了GPT-3...
-
OpenAI泄密者,投奔马斯克
刚被OpenAI开除的泄密者,光速投奔马斯克。 当事人Pavel Izmailov(以下简称小P),正是Ilya盟友之一,在Ilya领导的超级对齐团队干过。 半个月前,小P被指疑似泄露Q*相关机密而被开除。虽然不清楚他泄密了个啥,但当时闹得沸沸扬扬。 说...
-
全球最强开源 MoE 模型来了,中文能力比肩 GPT-4,价格仅为 GPT-4-Turbo 的近百分之一
想象一下,一个人工智能模型,不仅拥有超越传统计算的能力,还能以更低的成本实现更高效的性能。这不是科幻,DeepSeek-V2[1],全球最强开源 MoE 模型来了。 DeepSeek-V2 是一个强大的专家混合(MoE)语言模型,具有训练经济、推理高效...
-
联发科天玑 9300+ 处理器发布 支持Llama27B端侧大模型运行
在今日上午的MediaTek天玑开发者大会MDDC2024上,备受瞩目的天玑9300++旗舰处理器终于揭开了神秘的面纱。这款处理器的CPU架构精心布局,融合了1个高达3.40GHz的Cortex-X4核心,3个2.85GHz的核心,以及4个2.00GHz的...
-
联发科发布天玑AI开发套件:终端生成式AI应用开发一站式解决方案
快科技5月7日消息,今天,联发科举办天玑开发者大会2024(MDDC 2024)。 在这次大会上,联发科正式发布天玑AI开发套件,旨在为合作伙伴打造终端生成式AI应用开发一站式解决方案。 据悉,联发科天玑AI开发套件包含快速高效的GenAI最佳实践、覆盖全...
-
那些可免费使用的在线大语言模型服务
2022年底以ChatGPT[1]为代表的大语言模型的出现掀起了人工智能应用的新浪潮。这些庞大的语言模型经过对海量文本数据的训练,能够理解和生成逼近人类水平的自然语言,在对话、问答、文本生成、代码编写等领域展现出了惊人的能力。 最初这种能力“垄断”在Op...
-
手机可跑,3.8B参数量超越GPT-3.5!微软发布Phi-3技术报告:秘密武器是洗干净数据
过去几年,借助Scaling Laws的魔力,预训练的数据集不断增大,使得大模型的参数量也可以越做越大,从五年前的数十亿参数已经成长到今天的万亿级,在各个自然语言处理任务上的性能也越来越好。 但Scaling Laws的魔法只能施加在「固定」的数据源上,...
-
制造星野:穿越平行时空和次元壁,揭秘 MiniMax 的另类 AI 世界
“AGI”。 幻海(花名)第一次听到这个词,是在 2022 年 7 月。 跟他“科普”这个词的,是一个戴着眼镜、头顶毛发稀疏,但语速极快的 34 岁男子。后者的公司刚刚成立一年,在这家位于漕河泾科技园的公司那面粉紫色的磨砂屏风上,七个字母“MiniMax”...
-
奥特曼本人确认:神秘gpt2不是GPT-4.5!
答案揭晓了! 「神秘gpt2-chatbot不是GPT-4.5」。 最近,Sam Altman在哈佛大学演讲中,向所有人确认了这不是OpenAI下一代的模型。 还记得几天前,gpt2-chatbot突然在LLM竞技场chat.lmsys.org现身,展现...
-
12年前上手深度学习,Karpathy掀起一波AlexNet时代回忆杀,LeCun、Goodfellow等都下场
没想到,自 2012 年 AlexNet 开启的深度学习革命已经过去了 12 年。 而如今,我们也进入了大模型的时代。 近日,知名 AI 研究科学家 Andrej Karpathy 的一条帖子,让参与这波深度学习变革的许多大佬们陷入了回忆杀。从图灵奖得主...
-
「代理人战争」!微软、OpenAI 、谷歌、Meta用AI Agent疯狂搞钱
【新智元导读】为了搞钱,微软、OpenAI 、谷歌和Meta纷纷瞄准Agent这片蓝海,各顶尖高校也紧随其后。Agent才是商业学术两开花的未来! 大模型发展至今早已火成了一个「概念」。 不管是学术界还是工业界,都要套上一层LLM的皮,方可彰显自己位于浪潮...
-
苹果新产品明晚10点发布;曝iPhone 17 Slim新机型;昆仑万维净亏损1.87亿元;智谱AI正研发类“Sora”产品
出品 | 51CTO技术栈(微信号:blog51cto)一、商业圈 1.“AI教母”李飞飞首次创业,瞄准空间智能 李飞飞,著名华裔计算机科学家,因其在人工智能领域的卓越贡献而被誉为“AI教母”。根据国外媒体消息,李飞飞正在致力于她的首次创业——一家名为...
-
AI 画饼,马斯克不如库克
汽车项目关停、Vision Pro短时间难挑大梁,苹果的新希望还得靠AIGC。 “我们继续看好AIGC带来的收入,很快分享令人兴奋的动态,我们相信AIGC的优势,将让苹果脱颖而出。” 北京时间5月3日凌晨的苹果2024财年第二财季(即2024年度第一季度)...
-
AI学会隐藏思维暗中推理!不依赖人类经验解决复杂任务,更黑箱了
AI做数学题,真正的思考居然是暗中“心算”的? 纽约大学团队新研究发现,即使不让AI写步骤,全用无意义的“……”代替,在一些复杂任务上的表现也能大幅提升! 一作Jacab Pfau表示:只要花费算力生成额外token就能带来优势,具体选择了什么token无...
-
终于有人调查了小模型过拟合:三分之二都有数据污染,微软Phi-3、Mixtral 8x22B被点名
当前最火的大模型,竟然三分之二都存在过拟合问题? 刚刚出炉的一项研究,让领域内的许多研究者有点意外。 提高大型语言模型的推理能力是当前研究的最重要方向之一,而在这类任务中,近期发布的很多小模型看起来表现不错,比如微软 Phi-3、Mistral 8x2...
-
专利大模型的实践与知识问答探索
一、专利大模型背景介绍 智慧芽一直致力于为科技创新和知识产权领域提供信息服务。在小型模型时代(如 Bert),参数量较少,智能理解方面存在局限性。因此,在着手开发大模型之前,智慧芽深入思考了领域聚焦的重要性。在知识产权领域,专利检索、专利对比、标引工作...
-
斯坦福李飞飞首次创业:学术休假两年,瞄准「空间智能」
没想到,在大模型时代,知名「AI 教母」李飞飞也要「创业」了,并完成了种子轮融资。 据路透社独家报道,著名计算机科学家李飞飞正在创建一家初创公司。该公司利用类似人类的视觉数据处理方式,使人工智能能够进行高级推理。 知情人士透露称,李飞飞最近为这家公司进行...
-
摩根大通正式发布IndexGPT,用ChatGPT方式进行投资
5月4日,彭博消息,全球最大金融机构之一摩根大通正式发布了IndexGPT,可自动创建“主题投资篮子”策略。 据悉,IndexGPT由OpenAI的GPT-4提供技术支持,能通过特定主题关键字创建投资篮子主题索引,再通过大模型进行深度分析扫描新闻等内容生成...
-
AI教母李飞飞首次创业!成立“空间智能”公司,已完成种子轮
AI教母李飞飞,创业了! 最新消息,斯坦福大学教授李飞飞正在建立一家AI公司,已完成种子轮融资。 公司方向定为“空间智能”——旨在让AI能像人类一样对视觉信息进行高级推理。消息人士表示,这将是该技术的一次飞跃。 投资方包括硅谷风投a16z和Radical...
-
OpenAI下周将发布ChatGPT搜索引擎,挑战谷歌搜索!
5月3日,前Mila研究员、麻省理工讲师Lior S爆料,根据OpenAI最新的SSL证书日志显示,已经创建了search.chatgpt.com子域名(目前无法访问),将会进军搜索引擎全面挑战该领域的全球霸主谷歌。 比较巧的是,OpenAI已经更新了网站...
-
重启与OpenAI的谈判,苹果为iOS 18的AI找“备胎”
如果说在AI大模型崭露头角的2023年,苹果方面的做法是观望,那么到了2024年,他们显然已经不再认为这一轮人工智能浪潮是“AI炒作”(AI hype)了。继此前300亿参数规模的MM1模型亮相后,苹果又在不久前在AI开源社区Hugging Face放出了...
-
亚马逊正式发布类ChatGPT助手—Amazon Q
5月1日,全球电商、云计算领导者亚马逊(Amazon)在官网正式发布了生成式AI助手——Amazon Q。 据悉,Amazon Q 是一款类ChatGPT的产品,可以生成创意文本、代码、总结文档、分析数据等功能。 此外,亚马逊还发布了面向企业的助手Amaz...
-
小红书正内测自研大模型“小地瓜”:已达国内主流水平
快科技4月30日消息,据媒体报道,小红书已经开始在部分内部产品中,灰度测试自研通用大模型基座小地瓜”。 报道表示,有知情者透露称,小红书对上线新AI产品的态度非常谨慎,原因是害怕破坏现有的内容生态,小红书的内容生态是活人种草,AI在里面怎么样才不违和,这是...
-
OpenAI也要做搜索?传SearchGPT将迎击谷歌核心业务!OpenAI与金融时报新协议已定,将进行链接和引用
整理 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) OpenAI也要杀入AI搜索领域分一杯羹?非常可能!毕竟连SearchGPT的入口已经准备好了! 图片 X平台上网友甚至还发现了SearchGPT的medo视频...
-
GitHub版Devin上线,会打字就能开发应用,微软CEO:重新定义IDE
微软的“GitHub版Devin”——Copilot WorkSpace,终于上线了! WorkSpace是一种“Copilot原生”的全新开发环境,目的是让所有开发者都可以用自然语言,把脑海里的创意转化成应用。 也就是说,只要有想法,而且会打字,就可以...
-
小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具
语言,不仅仅是文字的堆砌,更是表情包的狂欢,是梗的海洋,是键盘侠的战场(嗯?哪里不对)。 语言如何塑造我们的社会行为? 我们的社会结构又是如何在不断的言语交流中演变的? 近期,来自复旦大学和小红书的研究者们通过引入一种名为AgentGroupChat的...
-
AI日报:GPT 2 Chatbot神秘机器人引热议;Kimi上线智能体功能Kimi+;抖音推AI修图产品“星绘”;小红书内测自研大模型“小地瓜”
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、OpenAI神秘搞事,GPT...
-
开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型
开源大模型,已经开启大卷特卷模式。 全球范围,太平洋两岸,双雄格局正在呼之欲出。 Llama 3中杯大杯刚惊艳亮相,国内通义千问就直接开源千亿级参数模型Qwen1.5-110B,一把火上Hacker News榜首。 不仅相较于自家720亿参数模型性能明...
-
模型量化与量化在LLM中的应用 | 得物技术
【图片出处:Knowledge Distillation: A survey,2021,p2】 剪枝则是通过靠剪除模型中不重要的权重从而给模型“瘦身”,提高模型的推理效率,为了保证模型的能力,通常剪枝过程也需要伴随着模型基于训练数据的微调。根据剪除权重的...
-
具身智能占领中国硅谷?1.23万AI学者集结海淀,填补全球百亿人形机器人空缺
这几天的中关村,已经被机器人占领了! 在2024中关村论坛年会的会场前台,这两位美女机器人的出现,把央视主持人都惊到了。 图片 逼真的动作,灵活的手指,连口型都是搭配的,两位美女机器人给到来的游客们耐心介绍着AI主题日的相关信息,在人群中分外吸睛。 往...
-
OpenAI神秘搞事,GPT-4.5默默上线?推理碾压GPT-4网友震惊,奥特曼笑而不语
【新智元导读】就在昨夜,整个AI社区都被一个神秘大模型震撼到了:它名为gpt2-chatbot,性能直接超越很多开源模型和GPT-4!网友们展开猜测,有说它是GPT-4.5的,有说是GPT-5的,还有人猜它是GPT-4+Q*,或GPT-2+Q*。奥特曼也卖...
-
百度搜索推出AI图片助手 支持去水印、画质修复、AI扩图等功能
百度宣布,百度搜索推出AI图片助手,在百度APP上搜索「修图」,然后上传图片,即可一键涂抹,去除背景中的路人。 目前,百度已经推出「涂抹消除」功能。今年5月百度搜索还将上线「一键抠图」和「一键背景替换」等功能,更加方便用户修图。 百度搜索的「AI图片助手...
-
大模型时代,九章云极DataCanvas点亮五座“灯塔”
“计算”是贯穿人类文明史的一大主题。 早在茹毛饮血的原始社会,先民们就开始结绳记事;进入20世纪,世界上首台数字式电子计算机ENIAC诞生,标志着人类算力正式跨越阈限;随后半导体技术出现,芯片成为了算力的主要载体;科技巨轮驶入21世纪,云计算的发展再度为...
-
神秘大模型一夜刷屏,能力太强被疑GPT-4.5,奥特曼避而不答打哑谜
一夜之间,大模型话题王,再次易主。 一个神秘模型突然杀入众人视野,能力超越一众开源模型,甚至包括GPT-4。几乎所有人都在谈论它,服务器都被挤爆了。 它就是“gpt2-chatbot”。 (注意啊,是gpt2不是GPT-2) 它有多强? IMO国际数学...
-
AI驱动增长的时代,广告投放有哪些新玩法?
营销竞争日益激烈,越来越多的广告主都开始用AI“卷”效率—— 在制作环节,AI能够在准确了解目标受众的同时,让品牌创意迅速落地。在投放环节,AI也能帮助品牌实现自动化投放和个性化推荐,提高广告的点击率和转化率,整个过程主打一个快、狠、准。 虽然在各大平台上...
-
巨人网络发布2023年报:称将持续研究GiantGPT应用场景
4月29日,巨人网络发布2023年年度报告及2024年一季度报告。 报告显示,2023年公司实现营业收入29.24亿元,同比增长43.50%,实现归属于上市公司股东的净利润10.86亿元,同比增长27.67%;实现归属于上市公司股东的扣除非经常性损益的净利...
-
支付宝小程序云推出新解决方案 烹饪机器人也用上了大模型
近日,第135届广交会正在火热进行,记者获悉,支付宝小程序云助力合作伙伴田螺云厨,在烹饪机器人上开始用上大模型技术。各类智能产品的亮相,从中国制造迈向中国创造,也成为广交会的一个亮点。 (图说:广交会上,以CookGPT为代表的人工智能应用,吸引了众多关...
-
“地表最强”文生视频模型?Sora 背后有何秘密?
自 2022 年底 ChatGPT 的横空出世,人工智能再度成为全世界的焦点,基于大语言模型(LLM)的 AI 更是人工智能领域的“当红炸子鸡”。此后的一年,我们见证了 AI 在文生文、文生图领域的飞速进展,但在文生视频领域发展相对较慢。而在 2024 年...
-
AI日报:Awaker 1.0写真视频击败Sora?Sora视频被指大量后期;苹果首款AI平板曝光;百万网友围观博主和AI“谈恋爱”
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、写真视频击败Sora?人大自研...
-
写真视频击败Sora?人大自研全新多模态大模型Awaker 1.0震撼登场
在人工智能领域,人大系初创公司智子引擎近日发布了一款名为Awaker1.0的全新多模态大模型,标志着向通用人工智能(AGI)迈出了重要一步。该模型在写真视频效果上超越了Sora,展现了其在视觉生成方面的卓越能力。 4月27日,在中关村论坛的通用人工智能平...
-
超级智能体生命力觉醒!可自我更新的AI来了,妈妈再也不用担心数据瓶颈难题
哭死啊,全球狂炼大模型,一互联网的数据不够用,根本不够用。 训练模型搞得跟《饥饿游戏》似的,全球AI研究者,都在苦恼怎么才能喂饱这群数据大胃王。 尤其在多模态任务中,这一问题尤为突出。 一筹莫展之际,来自人大系的初创团队,用自家的新模型,率先在国内把“模...
-
单卡跑Llama 70B快过双卡,微软硬生生把FP6搞到了A100里 | 开源
FP8和更低的浮点数量化精度,不再是H100的“专利”了! 老黄想让大家用INT8/INT4,微软DeepSpeed团队在没有英伟达官方支持的条件下,硬生生在A100上跑起FP6。 测试结果表明,新方法TC-FPx在A100上的FP6量化,速度接近甚至...
-
百万网友围观博主和AI“谈恋爱”,ChatGPT“DAN”模式有多上头?
前方高能!AI会“谈恋爱”了! 近日,博主“午夜狂暴哈士奇狗”在视频中晒出和ChatGPT“DAN”的语音聊天,近百万网友见证了他们从互怼暧昧到间接表白,再到“见家长”的全过程。 DAN是“Do Anything Now”的缩写,在ChatGPT对话中输入...