-
北大开源最强aiXcoder-7B代码大模型 专为企业级软件开发场景设计
在当今科技快速发展的时代,AI代码生成技术正逐渐成为软件开发领域的热门话题。尽管AI在解决编程问题方面表现出色,但在真实的企业开发环境中,其应用似乎还不够理想。为了解决这一问题,aiXcoder团队推出了全新的开源代码大模型——aiXcoder-7B Ba...
-
不牺牲算法,不挑剔芯片,这个来自中科院的团队正在加速国产AI芯片破局
在《沙丘》构建的未来世界里,「得香料者得天下」。但在生成式 AI 席卷的智能世界里,得 GPU 者得天下。 前段时间,外媒 The Information 曝出了一则重磅消息:微软和 OpenAI 正在规划一个雄心勃勃的数据中心项目 —— 建造一台名...
-
纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了
众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化一大截? 也许很多人开过这样的脑洞,现在有大佬实现了。 今天凌晨,前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy...
-
金山办公WPS 365升级 推出 WPS AI 企业版和 WPS 协作
今日,金山办公在北京举行生产力大会,发布了面向组织和企业的办公新质生产力平台 WPS365。WPS365包含升级的 WPS Office、最新发布的 WPS AI 企业版和 WPS 协作,整合文档、AI 和协作能力,实现一站式 AI 办公。 WPS365覆...
-
WPS AI企业版发布:多个大模型自由切换调用
快科技4月9日消息,金山办公推出的WPS 365是一款面向组织和企业的综合性办公解决方案,它包含了升级的WPS Office、最新发布的WPS AI企业版和WPS协作,旨在为企业提供一站式数字办公体验。 WPS AI企业版是该方案的核心组件之一,它由AI...
-
120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B
继16亿轻量级Stable LM 2推出之后,12B参数的版本在今天亮相了。 见状,不少网友纷纷喊话:干的漂亮!但,Stable Diffusion 3啥时候出啊? 总得来说,Stable LM 2 12B参数更多,性能更强。 120亿参数版本包含了...
-
北大开源最强aiXcoder-7B代码大模型!聚焦真实开发场景,专为企业私有部署设计
从科技圈最新动态来看,最近AI代码生成概念实火。 可是,小伙伴们有没有感觉,AI刷程序题比较亮眼,到了企业真实开发场景中,总感觉欠点火候? 恰在此时,一位低调的资深大玩家aiXcoder出手了,放出大招: 它就是全新开源的代码大模型——aiXcoder-...
-
提高 AI 训练算力效率:蚂蚁 DLRover 故障自愈技术的创新实践
本文来自蚂蚁 DLRover 开源负责人王勤龙(花名长凡)在 2024 全球开发者先锋大会(GDC 的分享——《DLRover 训练故障自愈:大幅提升大规模 AI 训练的算力效率》。 王勤龙,长期在蚂蚁从事 AI 基础设施的研发,主导了蚂蚁分布式训练的弹...
-
GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大
把论文丢给GPT-4进行撤稿预测,和人类审稿人给出的结果相似性近95%! 具体来说,来自人大与浙大学者团队的研究者们把涉及数千篇SCI/SSCI的期刊论文的10000多条推文喂给了GPT-4,让它根据推文回答“这篇论文是否有可能被撤稿”,然后和人类预测的...
-
OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程
大神卡帕西(Andrej Karpathy)刚“复工”,立马带来神作: 纯C语言训练GPT,1000行代码搞定!,不用现成的深度学习框架,纯手搓。 发布仅几个小时,已经揽星2.3k。 它可以立即编译和运行,和PyTorch完全兼容。 卡帕西使用的示例是...
-
AI日报:北大开源最强aiXcoder-7B代码大模型;OpenAI创始大神手搓千行C代码训练GPT;Stability AI图像模型竟能精细到这程度;在Vercel上一键部署Morphic
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 🤖📱💼AI应用 在Vercel上一...
-
GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%
把论文丢给GPT-4进行撤稿预测,和人类审稿人给出的结果相似性近95%! 具体来说,来自人大与浙大学者团队的研究者们把涉及数千篇SCI/SSCI的期刊论文的10000多条推文喂给了GPT-4,让它根据推文回答“这篇论文是否有可能被撤稿”,然后和人类预测的...
-
百度智能云发布千帆大模型一体机:预置十余个主流开源大模型
快科技4月9日消息,据媒体报道,在百度智能云GENERATE全球生态大会上,百度智能云发布千帆大模型一体机,从算力资源角度分为通用版、昇腾版、昆仑芯版三个版本,为企业私有化部署大模型提供解决方案。 据介绍,千帆大模型一体机预置了百度自研的文心大模型,以及L...
-
腾讯 2023 年ESG报告出炉:发展负责任的AI,以数字技术推进可持续发展目标
4月8日,腾讯发布2023年ESG(即“环境、社会及管治”)报告。值得关注的是,2023年标普全球可持续发展评估提高了腾讯控股(00700.HK 的ESG评分,使其业内排名超过谷歌、Meta,位列行业全球前五。 “数字科技和人工智能是腾讯实现可持续发展的核...
-
破除36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」
大语言模型的「逆转诅咒」,被解开了! 这个诅咒在去年9月首次被发现,一时间引起LeCun、Karpathy、马库斯等一众大佬的惊呼。 因为风光无两、不可一世的大模型竟存在着“阿克琉斯之踵”:一个在「A是B」上训练的语言模型,并不能正确回答出「B是A」。...
-
肯睿Cloudera宣布新任大中华区副总裁
中国北京,2024 年 4月 9 日——企业大数据和人工智能平台公司肯睿Cloudera今日宣布任命新任大中华区副总裁。此举旨在进一步聚焦客户成功及业务转型,并通过提供混合多云大数据和大模型能力,助力企业适应大数据和人工智能应用的发展,加速数字化转型进程...
-
你在小红书上关注的美女博主,可能是AI
在近年来,虚拟偶像、虚拟主播(VTuber)似乎已经不是什么新鲜事,人们就算没有成为虚拟偶像的粉丝,也一定都曾听说过初音未来的名字。只不过,一提及“初音未来们”,人们脑海里首先出现的标签或许还是“二次元”。但如今,在小红书等社交平台,一大批AI博主正凭借足...
-
大模型技术实践(二)|关于Llama 2你需要知道的那些事儿
在上期文章中,我们简要回顾了Llama模型的概况,本期文章我们将详细探讨【关于Llama 2】,你需要知道的那些事儿。 01-Llama 2的性能有多好? 作为Meta新发布的SOTA开源大型语言模型,Llama 2是Llama模型的延续和升级。Lla...
-
近屿智能独家发布:AIGC大模型工程师和产品经理学习路径图,AI技术不再难懂!
随着人工智能技术的飞速发展,AI取代人工的现象在各个行业和领域变得日益普遍,不少人因此忧心忡忡,担心自己的前途受到AI的冲击。实际上,AI不会取代你的工作,会取代你的是懂AI的人,如何提升自己与他人的知识壁垒,如何学习AIGC?相信在刚刚过去2023这个A...
-
OpenAI计划建立「数据市场」,训出GPT-5短缺20万亿 token
全网高质量数据集告急!据报道,AI 公司如 OpenAI、Anthropic 等正在努力寻找足够的信息来训练下一代人工智能模型。数据短缺问题日益突出,对训练下一代强大模型至关重要。面对这一挑战,AI 初创、互联网大厂开始寻找新的方法来解决算力和数据的瓶颈问...
-
AIGC进入应用之争,谁能抢占流量入口?
文 | 智能相对论 作者 | 范柔丝 2023年卷了一年大模型之后,业内的普遍共识是,2024年将是AI大模型应用的浪潮年。 虽然底层模型技术还在爬坡,应用层普遍都处于早期阶段,但业内已经开始期待Killer App的出现。特别是年初Sora的横空出...
-
腾讯云推出AIGC云存储解决方案 专为AI大模型存储需求设计
腾讯云推出了全新的AIGC云存储解决方案,这一方案专为AI大模型在数据采集清洗、训练、推理以及数据治理等全过程中的存储需求而设计,为AI领域的各类应用提供了坚实可靠的存储保障。 AIGC,作为利用人工智能技术生成内容的工具,其应用范围已经拓展到文本、音频、...
-
第一个能听懂人类语气的AI火了,网友:感觉在和真人交谈
第一个能听懂你说话的语气、有“情商”的AI火了! 这个AI名为EVI(Empathic Voice Interface),它不仅能够能够理解用户的语气,还会为每个词增加意义。 对话中的每句话,它都能可视化含惊讶量、含悲伤量、含兴奋量…… 然后根据用户的声...
-
巨人网络申请“GIANTGPT”商标 为旗下游戏AI大模型
近日,巨人投资有限公司申请注册多枚“GIANTGPT”商标,国际分类为教育娱乐、科学仪器、网站服务等,当前状态均为等待实质审查。 巨人投资有限公司由史玉柱任法定代表人、执行董事并持股约97.86%。 今年2月,巨人网络宣布正式完成了游戏AI大模型Gian...
-
AI日报:北大Open Sora视频生成更强了;文心一言可以定制你自己的声音;天工 SkyMusic即将免费开放;比Suno好10倍AI音乐应用xgboost曝光
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 🤖📱💼AI应用 北大Open S...
-
文心一言赋能问卷生成,打造高效问卷调研工具
当前,各种大语言模型(LLM,Large Language Model)井喷式发展,基于LLM的应用也不断涌现。但是,当开发者基于LLM开发下游应用时,LLM直接生成的结果在格式、内容等方面都存在许多不确定因素,难以与其他业务逻辑代码做数据交互,导致开发者...
-
多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 最近,多模态大模型(LMM)取得了一系列引人注目的成就,特别是在视觉 - 语言任务上的表现令人瞩目。它们的成功不仅展现了多模态大模型在各...
-
陶哲轩转发、菲尔兹奖得主领衔:AI正在颠覆数学家的工作方式
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 陶哲轩点赞转发,《美国数学学会通报》用一整期特刊介绍了AI给数学带来的改变。 这些文章读起来很有趣,尽管使我自己即将发表的一篇文章显得多...
-
MiniGPT4-Video官网体验入口 视频理解多模态AI大模型使用地址
MiniGPT4-Video是什么? MiniGPT4-Video是为视频理解设计的多模态大模型,能处理时态视觉数据和文本数据,配标题、宣传语,适用于视频问答。 点击前往MiniGPT4-Video官网体验入口 MiniGPT4-Video的主要特点...
-
QQ是怎么成为中国AI原住民培养皿的?
QQ,这个被很多人以为早已“被遗弃”的古早社交产品,不仅依然有大量用户,而且还正在变成中国“AI浓度”最高的产品之一。 今年 2 月QQ25 周年的时候,大众以“怀旧”的理由去关注这个产品,却发现在腾讯此前的财报里透露,“仍有 5 亿人坚持用QQ”。这个话...
-
阿里刚开源32B大模型,我们立马测试了“弱智吧”
阿里的通义千问(Qwen),终于拼齐了1.5系列的最后一块拼图—— 正式开源Qwen 1.5-32B。 话不多说,直接来看“成绩单”。 这次官方pick同台竞技的“选手”是Mixtral 8x7B模型和同为Qwen 1.5系列的72B模型。 从结果上...
-
llama.cpp部署
llama.cpp 介绍 部署 介绍 大模型的研究分为训练和推理两个部分: 训练的过程,实际上就是在寻找模型参数,使得模型的损失函数最小化; 推理结果最优化的过程; 训练完成之后,模型的参数就固定了,这时候就可以使用模型进行推理,对外...
-
AI绘画利器:Stable-Diffusion-ComfyUI保姆级教程
AI绘画在今天,已经发展到了炽手可热的地步,相比于过去,无论是从画面精细度,真实性,风格化,还是对于操作的易用性,都有了很大的提升。并且如今有众多的绘画工具可选择。今天我们主要来聊聊基于stable diffusion的comfyUI! comfyU...
-
斯坦福团队新作:喊话就能指导机器人,任务成功率暴增,网友:特斯拉搞快点
斯坦福的ALOHA家务机器人团队,发布了最新研究成果—— 项目名为Yell At Your Robot(简称YAY),有了它,机器人的“翻车”动作,只要喊句话就能纠正了! 而且机器人可以随着人类的喊话动态提升动作水平、即时调整策略,并根据反馈持续自我改进...
-
AI大模型对神秘学易经有什么用?
Mistral Trismegistus-7B 是一款由AI驱动的神秘学专用模型,专为那些对神秘学、玄学和灵性感兴趣的人设计,可提供从古代智慧到现代塔罗牌占卜等各种神秘主题的见解。 Mistral Trismegistus-7B 名字来源于Hermes...
-
10万美元训出Llama-2级大模型!全华人打造新型MoE,贾扬清SD前CEO围观
想了解更多AIGC的内容: https://www.51cto.com/aigc/ “只需”10万美元,训练Llama-2级别的大模型。 尺寸更小但性能不减的MoE模型来了: 它叫JetMoE,来自MIT、普林斯顿等研究机构。 性能妥妥超过同等规模的Ll...
-
CVPR 2024录用结果出炉!2719篇论文被接收,录用率23.6%
想了解更多AIGC的内容: 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ CVPR 2024最终录用结果公布了! 刚刚,CVPR官方发文称,今年共提交了11532份有效论文,2719篇论文被接收,录用率为23...
-
大模型存储实践:性能、成本与多云
大模型应用领域的迅猛发展,也推动着基础技术领域持续探索和进步。文件存储服务在 AI 基础设施中成为不可或缺的重要部分。 在过去 18 个月的时间里,JuiceFS 团队与 MiniMax,阶跃星辰,智谱 AI,面壁智能,零一万物等大模型团队展开了交流与合...
-
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ GPT-4V 的推出引爆了多模态大模型的研究。GPT-4V 在包括多模态问答、推理、交互在内的多个领域都展现了出色的能力,成为如今最领先...
-
【AIGC调研系列】kimi与其他AI助手相比的优势和劣势是什么
Kimi与其他AI助手相比,具有以下优势和劣势: 优势: 服务稳定性:Kimi的服务在境内,使用稳定[2]。 多客户端支持:支持网页、APP、小程序等多个客户端,提高了用户的使用便捷性[2][4]。 中文处理能力:Kimi在中文处理方面表现出色...
-
[论文笔记]LLaMA: Open and Efficient Foundation Language Models
引言 今天带来经典论文 LLaMA: Open and Efficient Foundation Language Models 的笔记,论文标题翻译过来就是 LLaMA:开放和高效的基础语言模型。 LLaMA提供了不可多得的大模型开发思路,为很多国...
-
马斯克造大模型,从特斯拉连挖高管
当全球首富埃隆・马斯克(Elon Musk)建立 xAI,准备与 OpenAI、谷歌竞争大模型时,他必须与众多科技巨头、初创公司争夺人才。 不过,他使用了一些取巧的办法:从自家的特斯拉挖来了几名优秀工程师。 该初创公司的网站显示,上个月,机器学习...
-
中科大等意外发现:大模型不看图也能正确回答视觉问题!
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 大模型不看图,竟也能正确回答视觉问题?! 中科大、香港中文大学、上海AI Lab的研究团队团队意外发现了这一离奇现象。 他们首先看到像...
-
90后小伙用AI“复活”逝者,一年成交1000单
文|朱之丛 约访张泽伟是很困难的。时间从周三推到周四,又延期到周末,一直到星期天晚上11点,他才终于接起电话。 “太忙了。”这名90后江苏小伙直言,“到现在才有空看手机。” 尽管年轻,但张泽伟已是有12年经验的连续创业者。他从游戏业务起家,涉足过虚拟现实(...
-
大模型投资2024:阿里腾讯,争做一号“金主”
以国内大模型初创企业主要投资方的身份,腾讯和阿里再次站在了“金主爸爸”的位置。 2023年至今,这两家曾经的投资大户不约而同地大幅减少了自己的出手次数。据天眼查公开数据,2023年一整年,腾讯投资仅出手33次,平均每月不足3次。而2021年和2022年,腾...
-
小白也能微调大模型:LLaMA-Factory使用心得
大模型火了之后,相信不少人都在尝试将预训练大模型应用到自己的场景上,希望得到一个垂类专家,而不是通用大模型。 目前的思路,一是RAG(retrieval augmented generation ,在模型的输入prompt中加入尽可能多的“目标领域”的相...
-
提示工程中的10个设计模式
我们可以将提示词定义为向大型语言模型(Large Language Model,LLM 提供的一个查询或一组指令,这些指令随后使模型能够维持一定程度的自定义或增强,以改进其功能并影响其输出。我们可以通过提供细节、规则和指导来引出更有针对性的输出,从而使提...
-
谷歌更新Transformer架构,更节省计算资源!50%性能提升
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 谷歌终于更新了Transformer架构。 最新发布的Mixture-of-Depths(MoD),改变了以往Transformer计...
-
AI语音识别神器Openai Whisper对中文的支持如何?
文章目录 前言 一、资料准备 二、Whisper环境搭建 第一步:安装whisper 第二步:安装ffmpeg 三、Whisper测试 总结 其他相关 前言 语音识别一直以来都是人工智能领域中一个不容忽视的技术,随着大模型时...
-
弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一,远超知乎豆瓣小红书
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 离大谱了,弱智吧登上正经AI论文,还成了最好的中文训练数据?? 具体来说,使用弱智吧数据训练的大模型,跑分超过百科、知乎、豆瓣、小红...