-
250行代码从头搭建Llama 3,GitHub一天4.6k星!Karpathy大赞
Llama系列作为为数不多的优质开源LLM,一直受到开发者们的追捧。在Hugging Face社区的文本生成模型中,几乎是「霸榜」的存在。 就在520这天,一位名叫Nishant Aklecha的开发者在推特上宣布了自己的一个开源项目,名为「从头开始实...
-
KubeAI大模型推理加速实践|得物技术
除了上面提到的技术外,提高大模型推理速度的还有大模型的量化技术等,这里先不探讨,后面有机会,我们会单独发文章来介绍。 二、大模型发展面临的挑战 未来大模型的参数量肯定会越来越大,这也是大模型的发展趋势,对推理加速的要求会越来越高。 OpenAI在其论...
-
大模型“价格战”开打,给刚入商业化“佳境”的智谱AI提出了新挑战
1块钱买100万个tokens,为跟上Open AI,这家公司先给自己打个“骨折价”。 1 一比一复刻Open AI AI大模型在商业化路途中还在摸索,便已开打“价格战”。 5月15日,字节跳动宣布,豆包通用模型pro在企业市场的定价为0.0008元/千T...
-
AI在软件开发中的角色:辅助而非替代
事实表明,AI无法替代开发者,但更适用于优秀的开发者。而识别大型语言模型(LLM)生成的代码什么时候会出错,需要开发人员具有丰富的知识和经验。 软件工程师David Showalter在谈到AI编程时表示:“目前,AI模型在帮助编程人员提高工作效率方面...
-
Karpathy称赞,从零实现LLaMa3项目爆火,半天1.5k star
一个月前,Meta 发布了开源大模型 llama3 系列,在多个关键基准测试中优于业界 SOTA 模型,并在代码生成任务上全面领先。 此后,开发者们便开始了本地部署和实现,比如 llama3 的中文实现、llama3 的纯 NumPy 实现等。 十几个小...
-
Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA
GPT-4o的横空出世,再次创立了一个多模态模型发展的新范式! 为什么这么说? OpenAI将其称为「首个『原生』多模态」模型,意味着GPT-4o与以往所有的模型,都不尽相同。 传统的多模态基础模型,通常为每种模态采用特定的「编码器」或「解码器」,将不...
-
基于深度学习的实时视频处理 | 入门指南
近来,整个机器学习领域似乎被大型语言模型(LLM)和检索增强生成(RAG)所掩盖。虽然许多用例可以从这些新的基础模型中受益,但在非文本数据方面仍存在差距。我常把当前的机器学习阶段比作汽车工业中从燃油车向电动车的转变。燃油车已经有完善的基础设施(如汽车服务...
-
CVPR'24 Oral | 一览纯稀疏点云检测器SAFDNet的前世今生!
写在前面&笔者的个人理解 3D点云物体检测对自动驾驶感知至关重要,如何高效地从稀疏点云数据中学习特征表示是3D点云物体检测面临的一个关键挑战。我们在本文中将会介绍团队发表在NeurIPS 2023的HEDNet和CVPR 2024的SAFDNet...
-
识别细胞也能用大模型了!清华系团队出品,已入选ICML 2024 | 开源
大模型带来的生命科学领域突破,刚刚再传新进展。 来自清华系,使用大模型实现了单细胞身份识别,同时模型LangCell也正式对外开源。 它不仅可以准确识别细胞身份,还具有很强的零样本分析能力,论文已被ICML 2024录⽤。 LangCell的数据集中包...
-
一些 Llama3 微调工具以及如何在 Ollama 中运行
Llama3是Meta提供的一个开源大模型,包含8B和 70B两种参数规模,涵盖预训练和指令调优的变体。这个开源模型推出已经有一段时间,并且在许多标准测试中展示了其卓越的性能。特别是Llama3 8B,其具备小尺寸和高质量的输出使其成为边缘设备或者移动设...
-
UIUC发布StarCoder2-15B-Instruct代码大模型 无需OpenAI数据登上性能榜单
UIUC与BigCode组织的研究者们最近发布了StarCoder2-15B-Instruct代码大模型,这一创新成果在代码生成任务方面取得了显著突破。这款模型成功超越了CodeLlama-70B-Instruct,登上了代码生成性能榜单之巅。 StarC...
-
无需OpenAI数据,跻身代码大模型榜单!UIUC发布StarCoder-15B-Instruct
在软件技术的前沿,UIUC张令明组携手BigCode组织的研究者,近日公布了StarCoder2-15B-Instruct代码大模型。 这一创新成果在代码生成任务取得了显著突破,成功超越CodeLlama-70B-Instruct,登上代码生成性能榜单之...
-
华为云引领首个代码大模型国际标准立项
本文分享自华为云社区《华为云引领首个代码大模型国际标准立项》,作者: 华为云头条。 近日,国际电信联盟电信标准分局第十六研究组(ITU-T SG16)于法国雷恩召开全体会议,《基于人工智能的代码生成技术要求和评估方法》国际标准项目成功获得立项通过。...
-
IBM向开源社区发布Granite AI模型
IBM研究院最近宣布对其Granite编码基础模型开源,目标是实现高级AI工具大众化,进而推动跨行业间代码编写、维护与开发方式的全面变革。 IBM的Granite编码模型是什么水平? Granite源自IBM简化编码流程的勃勃雄心。在意识到软件开发中所...
-
智谱 AI 上线大模型开放平台 bigmodel.cn
智谱 AI 上线大模型开放平台 bigmodel.cn ,该平台是一个集成了 GLM 系列大模型的平台。这些大模型包括企业版 GLM-4/4V、个人版 GLM-3Turbo、文本描述创作图像的 CogView-3、角色定制模型 CharacterGLM、中...
-
国产大模型:今天起,我们100万tokens只需1元!
昨天刚刚在顶会ICLR作为特邀演讲(Invited Talk)中“国内唯一”的大模型玩家智谱AI,今天又放出了一个好消息: 之前:0.005元 / 千tokens 现在:0.001元 / 千tokens 换算一下,就是1元=1000000tokens...
-
实测ChatGPT的Go能力!资深老鸟干货分享:使用ChatGPT学习Go语言容易得多
编译 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 编者按:资深开发者詹姆斯·拉米雷兹长文分享,讲述了他使用ChatGPT学习Go语言,导航Kolide API并构建复杂的Steampipe插件的经验。在这个过程中,他深化了对AI辅...
-
四款值得推荐的AI辅助编程工具(支持C#语言)
前言 在这个AI迅速发展的阶段,涌现出了一大批好用的AI辅助编程工具。AI辅助编程工具能够提高开发效率、改善代码质量、降低bug率,是现代软件开发过程中的重要助手。今天大姚给大家分享4款AI辅助编程工具(并且都支持C#语言),希望对大家有所帮助。 AI辅...
-
多模态大模型在前端开发领域的应用探索
一、大模型生成前端代码 1.GPT4自动生成前端网页 GPT4展示了一个功能,画一张草图,并把它拍照发给GPT-4,GPT-4可以从图片中提取文字信息并输出HTML,自动生成网站的原型图。 输入草图: 图片 输出页面代码: 图片 2.微调的必要性 一些开...
-
扩散模型与文生视频
一、快速发展的文生视频 在当前的人工智能领域,文生视频技术有着引人注目的进展。该技术的核心任务非常明确,就是利用文本指令来控制视频内容的生成。具体而言,用户可以输入特定文本,系统则根据这段文本生成相应的视觉画面。这一过程并不局限于单一的输出,相同的文本可...
-
程序员的饭碗被AI惦记?这不很正常吗!但Coding行业不会消失
“程序员的饭碗被AI惦记”,这并非危言耸听。从阿里到百度,一众技术大厂以自身“血淋淋”的事实佐证着AI对“码农们”的“蚕食”。 4月2日,阿里云宣布全面推行AI编程,使用通义灵码辅助程序员写代码、读代码、查BUG、优化代码等。根据官方信息,通义灵码已在...
-
闭源赶超GPT-4 Turbo、开源击败Llama-3-70B,歪果仁:这中国大模型真香
国内的开发者们或许没有想到,有朝一日,他们开发的 AI 大模型会像出海的网文、短剧一样,让世界各地的网友坐等更新。甚至,来自韩国的网友已经开始反思:为什么我们就没有这样的模型? 这个「别人家的孩子」就是阿里云的通义千问(英文名为 Qwen)。在过去的一...
-
阿里云发布通义千问2.5版 性能赶超GPT-4 Turbo
阿里云今日正式发布通义千问2.5版本,该版本在模型性能上全面赶超了GPT-4Turbo,展现了其强大的技术实力。与此同时,通义千问最新开源的1100亿参数模型Qwen1.5-110B在多个基准测评中取得了卓越成绩,超越了Meta的Llama-3-70B模型...
-
开源领域最强大模型!阿里云发布通义千问2.5:全面赶超GPT-4 Turbo
快科技5月9日消息,阿里云正式发布了通义千问2.5,模型性能全面赶超GPT-4 Turbo,声称地表最强中文大模型。 据了解,通义千问2.5最新开源的1100亿参数模型在多个基准测评中均取得了最佳成绩,成功超越了Meta的Llama-3-70B模型,成为开...
-
AlphaGo核心算法增强,7B模型数学能力直逼GPT-4,阿里大模型新研究火了
把AlphaGo的核心算法用在大模型上,“高考”成绩直接提升了20多分。 在MATH数据集上,甚至让7B模型得分超过了GPT-4。 一项来自阿里的新研究引发关注: 研究人员用蒙特卡洛树搜索(MCTS)给大语言模型来了把性能增强,无需人工标注解题步骤,也能...
-
Deepseek-V2技术报告解读!全网最细!
深度求索Deepseek近日发布了v2版本的模型,沿袭了1月发布的 Deepseek-MoE(混合专家模型)的技术路线,采用大量的小参数专家进行建模,同时在训练和推理上加入了更多的优化。沿袭了一贯的作风,Deepseek对模型(基座和对话对齐版本)进行了...
-
AI编程创业公司为何接连获得大额融资?
AI编程是生成式AI崛起以来最热门的赛道之一,不仅海内外大厂均有布局,而且已经诞生了数家融资额过亿,估值过10亿美元的头部创业公司。 无论对于程序员还是企业客户,AI编程的本质价值是降本增效,而且它带来的效果是直接的,目前已有44%的程序员使用过AI编程软...
-
阿里巴巴推出通义千问2.5 号称性能超越GPT-4 Turbo
在人工智能领域,阿里巴巴再次取得重大进展,于5月9日正式发布了通义千问2.5版本。该版本在模型性能上全面超越了GPT-4Turbo,标志着阿里巴巴在AI技术发展上的又一重要里程碑。 通义千问2.5的主要提升包括: 理解能力提升9%:在文本理解方面,相较...
-
前特斯拉Optimus科学家跳槽HF,直接开源了一个机器人代码库
今年 3 月,以构建大型开源社区而闻名的 AI 初创公司 Hugging Face,挖角前特斯拉科学家 Remi Cadene 来领导一个新的开源机器人项目 ——LeRobot,引起了轰动。 Remi Cadene 在今年三月宣布结束其三年的 Tesl...
-
微调和量化竟会增加越狱风险!Mistral、Llama等无一幸免
大模型又又又被曝出安全问题! 近日,来自Enkrypt AI的研究人员发表了令人震惊的研究成果:量化和微调竟然也能降低大模型的安全性! 论文地址:https://arxiv.org/pdf/2404.04392.pdf 在作者的实际测试中,Mistra...
-
开发者的LlamaIndex入门指南
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ LlamaIndex是一个专注于检索增强生成(RAG 的工具,可以协助您丰富大模型的数据提示。本文将用实例向您展示和介绍。 众所周知,...
-
12年前上手深度学习,Karpathy掀起一波AlexNet时代回忆杀,LeCun、Goodfellow等都下场
没想到,自 2012 年 AlexNet 开启的深度学习革命已经过去了 12 年。 而如今,我们也进入了大模型的时代。 近日,知名 AI 研究科学家 Andrej Karpathy 的一条帖子,让参与这波深度学习变革的许多大佬们陷入了回忆杀。从图灵奖得主...
-
开发者福音!GitHub 推出AI原生开发环境Copilot Workspace,4大核心功能,预览版已发布!
编译 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) AI编程界又有新神器了?GitHub 推出了人工智能原生开发环境 Copilot Workspace。 旨在让“任何开发者都可以用自然语言从想法开始,创建代码,再...
-
捋一捋目前的前端编辑器
在帮一些同学远程修改代码的时候,我发现大家使用的编辑器是多种多样的:VSCode、WebStorm 甚至是 Sublime... 这不禁让我回忆起:【我最初学习前端的时候,还真是在编辑器的上尝试过很多不同的选择】。 时至如今,我已经变成了 VSCode...
-
Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统
除了计算资源和训练数据这些硬实力外,Llama3模型开源的训练思路覆盖了LLM模型的全部生命周期,提供了各种开源生态系统下的工具。 Llama3的开源,再次掀起了一场大模型的热战,各家争相测评、对比模型的能力,也有团队在进行微调,开发衍生模型。 最近,M...
-
LLM和RAG技术的比较探索
作者 | Ashok Gorantla 整理 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 在人工智能(AI)的动态环境中,两种开创性的技术——大型语言模型(LLM)和检索增强生成(RAG)——在理解和生成类人文本方面脱颖而出。本...
-
“地表最强”文生视频模型?Sora 背后有何秘密?
自 2022 年底 ChatGPT 的横空出世,人工智能再度成为全世界的焦点,基于大语言模型(LLM)的 AI 更是人工智能领域的“当红炸子鸡”。此后的一年,我们见证了 AI 在文生文、文生图领域的飞速进展,但在文生视频领域发展相对较慢。而在 2024 年...
-
闭环永动机!NeuroNCAP:彻底打通端到端闭环仿真链路,已开源!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文提出了一种用于测试自动驾驶(AD)软件系统的多功能基于NeRF的仿真器,其设计重点是传感器真实闭环评估和安全关键场景的创建。仿真器从真实世界的驾驶传感器数据序列中...
-
通过学习曲线识别过拟合和欠拟合
本文将介绍如何通过学习曲线来有效识别机器学习模型中的过拟合和欠拟合。 欠拟合和过拟合 1、过拟合 如果一个模型对数据进行了过度训练,以至于它从中学习了噪声,那么这个模型就被称为过拟合。过拟合模型非常完美地学习了每一个例子,所以它会错误地分类一个看不见的...
-
前谷歌CEO盛赞!GitHub Copilot 神秘竞争对手浮出水面,市值直逼独角兽!
各种编程Copilot彻底卷起来了,不止国外的微软、谷歌、Meta,国内的百度、阿里、商汤等AI巨头盯上了编程这块肥肉,不少初创公司也毅然决然的选择了这条赛道。 最近,那位曾经把Java带成Sun巅峰的CTO、前谷歌CEO 施密特(Eric Schmid...
-
大语言模型对汽车行业的影响和实践探索
汽车行业作为技术创新的重要领域,正迅速采纳大语言模型,如 GPT 系列,以推动行业的数字化转型。这些模型在提升车载智能系统的交互体验、优化客户服务、加速产品开发及市场营销策略方面展现出巨大潜力。通过具体应用案例分析,接下来我们一起揭示大语言模型如何为汽...
-
一文读懂 LLM 的构建模块:向量、令牌和嵌入
在当今信息爆炸的时代,我们不断面临着海量文本数据的挑战。为了有效地处理和理解这些数据,自然语言处理(NLP)领域的研究者们一直在不断探索和创新。而其中一个重要的研究方向就是语言模型(Language Model)。 在这篇文章中,我们将一起探索和理解...
-
比较三种优秀 AI 编码工具
GitHub Copilot、Amazon CodeWhisperer 和 Tabnine 是人工智能编码助手新时代的领先选择,优点包括提高开发人员效率和代码质量。 与任何新技术一样,将人工智能编码工具引入开发流程也有缺点。人工智能编码工具目前在代码许...
-
对话蚂蚁李建国:当前AI写代码相当于L2.5,实现L3后替代50%人类编程
蚂蚁集团代码大模型CodeFuse负责人李建国说道。 当下,AI代码生成领域正在野蛮式生长,巨头涌入,AI员工频频上线企业;首个AI程序员Devin被曝造假…… 面对风起云涌的代码生成变革,李建国给出了这样一个明确论断。 李建国是谁? 清华大学博士,机器...
-
发布几小时,微软秒删媲美GPT-4开源大模型!竟因忘记投毒测试
上周,微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。 却没想到发布几小时之后,立马被删除了。 有网友突然发现,WizardLM的模型权重、公告帖子全部被删除,并且不再微软集合中,除了提到站点之外,却找不到任何证据证明这个微软的官方项目。...
-
一文了解大语言模型(LLM)
人工智能的发展给我们的生活带来很多不一样的体验。面部识别可以解锁设备,激光雷达可以实现自动驾驶。当2023年,OpenApi的chatGPT可以“理解”人类的语言并与我们进行沟通时,大语言模型的概念出现在我们面前。 在自然语言处理领域的大语言模型(La...
-
五个免费使用ChatGPT API的开源项目
今天给大家介绍Github上5个比较火的免费获取GPT key的项目,希望大家能用到。真正来讲并不是GPT key,而是转发key和转发api接口,但是不管什么原理,最终只要可以实现AI问答的效果,就算完美。我们不讲过程,只要结果。以上都是白嫖的信息差果...
-
四款值得推荐的AI辅助编程工具
在这个AI迅速发展的阶段,涌现出了一大批好用的AI辅助编程工具。AI辅助编程工具能够提高开发效率、改善代码质量、降低bug率,是现代软件开发过程中的重要助手。今天大姚给大家分享4款AI辅助编程工具(并且都支持C#语言),希望对大家有所帮助。 http...
-
揭开大型语言模型(LLM)的力量:初创企业如何通过精简集成彻底改变运营方式
大型语言模型(LLM 已成为各种规模企业的游戏规则改变者,但它们对初创企业的影响尤其具有变革性。为了理解其中的原因,让我们来看看初创企业相对于老牌企业有哪些优势,以及为什么AI是它们的重要推动力。 初创企业往往面临预算有限、时间紧迫的局面,即便它们争夺...
-
五个简单好用的本地运行大模型的方法
出品 | 51CTO技术栈(微信号:blog51cto) 像ChatGPT、Claude.ai和phind这样的聊天机器人非常有用,但可能并不总是希望的问题或敏感数据由外部应用程序处理。在平台上尤其如此,在这些平台上,你的互动可能会被人类审查,并以其他方...