codellama - AIGC资讯

AMD发布首个AI小语言模型：6900亿token、推测解码提速3.88倍

快科技10月1日消息，AMD发布了自己的首个小语言模型(SLM ，名为AMD-135M”。相比于越来越庞大的大语言模型(LLM ，它体积小巧，更加灵活，更有针对性，非常适合私密性、专业性很强的企业部署。 AMD-135小模型隶属于Llama家族，有两个版...

大数据 2024-10-01 人工智能

1338阅读

ollama本地部署大语言模型记录

目录安装Ollama 更改模型存放位置拉取模型 Gemma Mistral Qwen1.5(通义千问 codellama 部署Open webui 测试性能知识广度问题1 问题2 代码能力总结最近突然对大语言...

生成式AI 2024-09-25 人工智能

1155阅读

本地服务器部署Text generation并添加code llama实现远程多人协作

文章目录前言 1. 本地部署Text generation Web UI 2. 安装CodeLlama大模型 3. 实现公网远程使用Code Llama 4. 固定Text generation Web UI公网地址前言本篇...

人工智能 2024-09-13 人工智能

1233阅读

Code Llama使用手册

Code Llama 是 Llama 2 的一系列最先进的开放访问版本，专门用于代码任务，我们很高兴发布与 Hugging Face 生态系统的集成！ Code Llama 已使用与 Llama 2 相同的宽松社区许可证发布，并且可用于商业用途。今天，...

人工智能 2024-08-27 人工智能

1388阅读

推荐使用：Llama Coder - 自主托管的高效代码补全工具

推荐使用：Llama Coder - 自主托管的高效代码补全工具 llama-coderReplace Copilot with a more powerful and local AI项目地址:https://gitcode.com/gh_mirro...

人工智能 2024-08-26 人工智能

1212阅读

LLMs之Llama Coder：llama-coder的简介、安装和使用方法、案例应用之详细攻略

LLMs之Llama Coder：llama-coder的简介、安装和使用方法、案例应用之详细攻略目录 llama-coder的简介 1、特点 llama-coder的安装和使用方法 1、安装推荐硬件本地安装远程安装模型...

大数据 2024-08-23 人工智能

1542阅读

引领编程效率革命：Llama Coder深度解读

引领编程效率革命：Llama Coder深度解读 llama-coderReplace Copilot with a more powerful and local AI项目地址:https://gitcode.com/gh_mirrors/ll/ll...

AIGC 2024-08-15 人工智能

1308阅读

本地部署Code Llama大模型结合Text generation Web UI远程运行LLM

???欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan 的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越...

大数据 2024-08-13 人工智能

1006阅读

如何有效地使用Code Llama：AI编程助手的实用指南

在当今快速发展的人工智能时代，编程领域也迎来了革命性的变革。Meta公司最近发布的Code Llama模型就是这一趋势的代表作。本文将深入探讨如何充分利用Code Llama的各种功能，为开发者提供一个全面的指南，帮助您更好地理解和应用这一强大的AI编程工...

人工智能 2024-07-31 人工智能

1378阅读

Llama 3 实践教程（InternStudio 版）

文章目录 Llama3本地 Web Demo部署初始环境配置下载模型 Web Demo 部署 XTuner 微调 Llama3 个人小助手自我认知训练数据集准备 XTuner配置文件准备训练模型推理验证 XTuner微调Lla...

人工智能 2024-05-28 人工智能

1289阅读

使用 ollama 部署最新的Llama 3 70B本地模型

一、ollama是什么? 在本地启动并运行大型语言模型。运行Llama 3，Mistral, Gemma, Code Llama和其他模型。自定义并创建您自己的。综合优点：快速下载+容器自动运行大模型，现在下载，马上上手。...

大数据 2024-05-24 人工智能

2457阅读

UIUC发布StarCoder2-15B-Instruct代码大模型无需OpenAI数据登上性能榜单

UIUC与BigCode组织的研究者们最近发布了StarCoder2-15B-Instruct代码大模型，这一创新成果在代码生成任务方面取得了显著突破。这款模型成功超越了CodeLlama-70B-Instruct，登上了代码生成性能榜单之巅。 StarC...

AIGC 2024-05-16 人工智能

928阅读

无需OpenAI数据，跻身代码大模型榜单！UIUC发布StarCoder-15B-Instruct

在软件技术的前沿，UIUC张令明组携手BigCode组织的研究者，近日公布了StarCoder2-15B-Instruct代码大模型。这一创新成果在代码生成任务取得了显著突破，成功超越CodeLlama-70B-Instruct，登上代码生成性能榜单之...

生成式AI 2024-05-15 人工智能

1145阅读

终于有人调查了小模型过拟合：三分之二都有数据污染，微软Phi-3、Mixtral 8x22B被点名

当前最火的大模型，竟然三分之二都存在过拟合问题？刚刚出炉的一项研究，让领域内的许多研究者有点意外。提高大型语言模型的推理能力是当前研究的最重要方向之一，而在这类任务中，近期发布的很多小模型看起来表现不错，比如微软 Phi-3、Mistral 8x2...

人工智能 2024-05-06 人工智能

877阅读

aiXcoder-7B官网体验入口 AI代码大模型使用地址

aiXcoder-7B是一个拥有 70 亿参数的代码大模型，专为企业级软件开发设计。其性能超越 340 亿参数的Codellama模型，在真实开发场景下表现卓越。支持算法题和多文件复杂代码场景，生成完整代码块、偏好短小代码，提升维护成本、代码质量。开源且可...

人工智能 2024-04-11 人工智能

970阅读

北大开源最强aiXcoder-7B代码大模型专为企业级软件开发场景设计

在当今科技快速发展的时代，AI代码生成技术正逐渐成为软件开发领域的热门话题。尽管AI在解决编程问题方面表现出色，但在真实的企业开发环境中，其应用似乎还不够理想。为了解决这一问题，aiXcoder团队推出了全新的开源代码大模型——aiXcoder-7B Ba...

AIGC 2024-04-09 人工智能

925阅读

集体出走的Stability AI 发布全新代码大模型，3B以下性能最优，超越Code Llama和DeepSeek-Coder

Stability AI又有新动作！程序员又有危机了？ 3月26日，Stability AI推出了先进的代码语言模型Stable Code Instruct 3B，该模型是在Stable Code 3B的基础上进行指令调优的Code LM。 Stab...

AIGC 2024-04-02 人工智能

953阅读

Mistral 7B 比Llama 2更好的开源大模型（一）

Mistral 7B 简介 Mistral 7B Mistral 7B 是一个 7.3B 参数模型：在所有基准测试中优于 Llama 2 13B 在许多基准测试中优于 Llama 1 34B 接近 CodeLlama 7B 的代码性能，同时...

AIGC 2024-04-01 人工智能

859阅读

大佬出走后首个发布！Stability官宣代码模型Stable Code Instruct 3B

大佬出走后，第一个模型来了！就在今天，Stability AI官宣了新的代码模型Stable Code Instruct 3B。图片要说Stability也是真的很神奇，首席执行官辞职了，Stable Diffusion其中几位作者也离开了，投资公...

大数据 2024-03-29 人工智能

900阅读

Stability AI开源3B代码生成模型：可补全，还能Debug

本周一，Stability AI 开源了小体量预训练模型 Stable Code Instruct 3B。 Stable Code Instruct 3B 是一个基于 Stable Code 3B 的指令调整编码语言模型（Code LM）。给出自然语言...

AIGC 2024-03-27 人工智能

891阅读

Stability AI发布最新代码模型升级版本Stable Code Instruct 3B

Stability AI 在昨晚发布了其最新的代码模型升级版本——Stable Code Instruct3B。这一开源项目是继之前工作的延续，暗示着SD3模型的开源发布应该能够顺利进行，尽管后续模型的发展情况还不太明朗。这个模型以3B的规模提供了业界领...

大数据 2024-03-26 人工智能

834阅读

对大型语言模型的安全性能进行基准测试，谁更胜一筹？

大型语言模型（LLM）机器学习技术正在迅速发展，催生了多个相互竞争的开源和专有架构。除了与ChatGPT等平台相关的生成式文本任务外，LLM还被证实在许多文本处理应用程序中具有实用价值，可以协助编写代码以及对内容进行分类。 SophosAI研究了许多在网...

生成式AI 2024-03-22 人工智能

953阅读

【AIGC调研系列】StarCoder2模型与其他模型对比的优势和劣势

StarCoder2模型的优势主要包括：性能：StarCoder2模型具备性能优势，旨在为代码生成、编辑和推理任务提供强大的支持[6]。透明度：该系列模型希望成为代码生成领域的新标准，提高了模型的透明度和可访问性[1][4][11]。成本效...

大数据 2024-03-14 人工智能

1358阅读

消费级显卡可用！李开复零一万物发布并开源90亿参数Yi模型，代码数学能力史上最强

李开复旗下AI公司零一万物，又一位大模型选手登场： 90亿参数Yi-9B。它号称Yi系列中的“理科状元”，“恶补”了代码数学，同时综合能力也没落下。在一系列类似规模的开源模型（包括Mistral-7B、SOLAR-10.7B、Gemma-7B、De...

生成式AI 2024-03-07 人工智能

834阅读

【llm 微调code-llama 训练自己的数据集一个小案例】

这也是一个通用的方案，使用peft微调LLM。准备自己的数据集根据情况改就行了，jsonl格式，三个字段：context, answer, question import pandas as pd import random import...

AIGC 2024-02-27 人工智能

882阅读

Llama中文大模型

关于Llama中文大模型欢迎来到Llama中文大模型：已经基于大规模中文数据，从预训练开始对Llama2模型进行中文能力的持续迭代升级。 Llama中文大模型：https://github.com/LlamaFamily/Llama-Chine...

人工智能 2024-02-27 人工智能

1380阅读

Groq大模型推理芯片每秒500tokens超越GPU，喊话三年超过英伟达

Groq公司推出的大模型推理芯片以每秒500tokens的速度引起轰动，超越了传统GPU和谷歌TPU。该芯片由初创公司Groq研发，其团队成员来自谷歌TPU，包括创始人兼CEO Jonathan Ross，曾设计实现第一代TPU芯片的核心元件。 Groq采...

生成式AI 2024-02-20 人工智能

903阅读

NLP国内外大模型汇总列表[文心一言、智谱、百川、星火、通义千问、盘古等等]

国内外大模型汇总列表中国大模型列表大全，全面收集有明确来源的大模型情况，包括机构、来源信息和分类等，随时更新。 Awesome family related to LLMS includes: https://github.com/wgwang...

大数据 2024-02-04 人工智能

1508阅读

Code Llama 70B霸榜3连发，练习5个月击败GPT-4！小扎LeCun亲自官宣上新

今天，Meta正式发布了Code Llama 70B，作为Code Llama系列中规模最大，性能最强的版本，一举击败了GPT-4！目前，模型共有三个版本，均可免费用于研究和商业目的： CodeLlama - 70B：基础代码模型； CodeLlama...

AIGC 2024-01-31 人工智能

877阅读

【随手记录】Llama Tutorial 大语言模型实践手把手系列带实践源码

这个tutorial的契机是yy突然看到了一个workshop 所以类似于一周大作业的形式，输入command输出使用了自动驾驶哪些模块，代码在这里所以就干一干，顺便写一个tutorial给大家参考和教程引申更多的应用参考资料： https:...

生成式AI 2024-01-28 人工智能

997阅读

Code Llama: Open Foundation Models for Code

本文是LLM系列文章，针对《Code Llama: Open Foundation Models for Code》的翻译。 Code Llama：代码的开放基础模型摘要 1 引言 2 Code Llama：专业化Llama2用于代码 3...

人工智能 2024-01-23 人工智能

1056阅读

LLaMA Pro: Progressive LLaMA with Block Expansion

Q: 这篇论文试图解决什么问题？ A: 这篇论文试图解决大型语言模型（LLMs）在特定领域（如编程、数学、生物医学或金融）能力不足的问题。尽管LLMs在多种现实世界任务中表现出色，但在某些特定领域仍然存在局限性，这阻碍了开发通用语言代理以应用于更广泛场景...

生成式AI 2024-01-18 人工智能

1081阅读

Stability AI开年首个大模型：专写代码，支持18种编程语言，上下文100K，苹果笔记本离线就能跑

Stability AI开年第一个大模型来了！名为Stable Code 3B，参数27亿，专为写代码而生。 Stable Code 3B可理解处理18种不同的编程语言，上下文长度100K token。且它对硬件要求也不高，用MacBook Air...

人工智能 2024-01-17 人工智能

815阅读

Stability AI发布Stable Code3B填补AI代码生成的空白

在AI领域，Stability AI公司于2024年推出了其首个新型人工智能模型:商业许可的（通过会员资格）Stable Code3B。该模型仅拥有30亿参数，专注于软件开发的代码完成能力，可在没有专用GPU的笔记本上本地运行，并在性能上具有竞争力，可与M...

人工智能 2024-01-17 人工智能

940阅读

Stability AI发布Stable Code 3B模型，没有GPU也能本地运行

在文生图领域大火的 Stability AI，今天宣布了其 2024 年的第一个新 AI 模型：Stable Code 3B。顾名思义，Stable Code 3B 是一个拥有 30 亿参数的模型，专注于辅助代码任务。无需专用 GPU 即可在笔记本电...

大数据 2024-01-17 人工智能

839阅读

LLM系列 | 22 : Code Llama实战(下篇)：本地部署、量化及GPT-4对比

引言模型简介依赖安装模型inference 代码补全 4-bit版模型代码填充指令编码 Code Llama vs ChatGPT vs GPT4 小结引言青山隐隐水迢迢，秋尽江南草未凋。...

人工智能 2024-01-16 人工智能

1137阅读

微软祭出代码大模型WaveCoder！四项代码任务两万个实例数据集，让LLM泛化能力飙升

用高质量数据集进行指令调优，能让大模型性能快速提升。对此，微软研究团队训练了一个CodeOcean数据集，包含了2万个指令实例的数据集，以及4个通用代码相关任务。与此同时，研究人员微调了一个代码大模型WaveCoder。论文地址：https://...

大数据 2024-01-08 人工智能

916阅读

nodejs文心一言API接入

需求在nodejs里面接入文心一言API，官方调用步骤API介绍 - 千帆大模型平台 | 百度智能云文档大致流程创建应用——>API授权——>获取访问凭证——>调用接口创建应用注册账号创建应用首先注册百度云智能账号...

人工智能 2023-12-31 人工智能

1187阅读

这次重生，AI要夺回网文界的一切

重生了，这辈子我重生成了 MidReal。一个可以帮别人写「网文」的 AI 机器人。这段时间里，我看到很多选题，偶尔也会吐槽一下。竟然有人让我写写 Harry Potter。拜托，难道我还能写的比 J・K・Rowling 更好不成？不过，...

生成式AI 2023-12-29 人工智能

845阅读

人工智能 | Llama大模型：与AI伙伴合二为一，共创趣味交流体验

Llama 大模型介绍我们介绍 LLaMA，这是一个基础语言模型的集合，参数范围从 7B 到 65B。我们在数万亿个Token上训练我们的模型，并表明可以专门使用公开可用的数据集来训练最先进的模型，而无需诉诸专有的和无法访问的数据集。特别是，LL...

AIGC 2023-12-28 人工智能

926阅读

清华特奖焦剑涛大模型创业：突破GPT-4工具使用能力，搞开源种子轮融资七千万

两位清华校友打造，在GPT-4核心优势之一使用工具上实现超越。连HuggingFace CEO都来帮它造势：它的名字叫“NexusRaven”，参数只有130亿。出色的函数调用能力连网友都忍不住称赞，既可以并行也可以嵌套。背后团队则更令人瞩目...

AIGC 2023-12-24 人工智能

846阅读

编码碾压ChatGPT！UIUC清华联手发布7B参数Magicoder，代码数据权重全开源

开源「代码大模型」来了！ UIUC清华团队的研究人员发布了Magicoder，不到7B参数，就能在代码生成领域与顶级代码模型不相上下。值得一提的是，Magicoder的代码、权重和数据，毫无保留完全开源。论文地址：https://arxiv.org...

人工智能 2023-12-19 人工智能

798阅读

源代码is all you need！7B代码小模型同尺寸无敌，性能媲美ChatGPT和谷歌Gemini

Hugging Face 技术负责人 Philipp Schmid 表示：“代码自动补全工具，如 GitHub Copilot，已被超过一百万开发者使用，帮助他们的编码速度提高了 55%。看到像 Magicoder 和 OSS-INSTRUCT 这样的开...

AIGC 2023-12-17 人工智能

1016阅读

2023.12.12最新源码及资源：使用Python构建与百度大模型(包括文心一言在内的18个语言模型)的交互式界面！！

#ps:12.12修复bug，部分模型不能回应的问题，资源已更新！在当前人工智能领域，通过与机器进行智能对话的能力变得越来越重要。本文将介绍如何使用Python编程语言和Tkinter库构建一个交互式界面，使用户能够与百度大模型进行智能对话，展...

生成式AI 2023-12-15 人工智能

875阅读

Nexusflow发布开源生成式AI模型NexusRaven-V2 处理软件工具方面超越 GPT-4

在针对网络安全领域的生成AI领导者Nexusflow宣布推出NexusRaven-V2后，该公司日前发布了一个13亿参数的开源生成AI模型，该模型在处理软件工具方面超越了OpenAI GPT-4。 NexusRaven-V2拥有强大的功能调用能力，能够理...

生成式AI 2023-12-08 人工智能

925阅读

使用PyTorch加速生成式 AI模型

PyTorch 团队发布了一篇名为《Accelerating Generative AI with PyTorch II: GPT， Fast》的博文，重点介绍如何使用纯原生 PyTorch 加速生成式 AI 模型。正如最近在PyTorch 开发者大会上...

生成式AI 2023-12-01 人工智能

1218阅读

Code Llama系列教程之微调 CodeLlama 34B 以进行聊天（打造自己的代码AI）

虽然 Meta 的 Llama2 在 AI 领域引起了广泛关注，但 34b 模型却缺席了相当长一段时间。对于许多人来说，这个 34b 模型是运行本地 LLM 的理想选择，因为它与使用 4 位量化的单个 4090 GPU 兼容。我一直在热切地等待 Meta...

人工智能 2023-11-29 人工智能

1006阅读

AIGC生成式代码——Code Llama 简介、部署、测试、应用、本地化

导读：本文介绍了CodeLlama的简介、本地化部署、测试和应用实战方案，帮助学习大语言模型的同学们更好地应用CodeLlama。我们详细讲解了如何将CodeLlama部署到实际应用场景中，并通过实例演示了如何使用CodeLlam...

AIGC 2023-11-23 人工智能

864阅读

微调 Code Llama 完整指南

一、前言今天这篇文章将向大家详细介绍如何对 Code Llama 进行微调，让它变成适合 SQL 开发的有利工具。对于编程开发任务，经过适当微调后的 Code Llama 的性能通常都会比普通的 Llama 强很多，特别是当我们针对具体任务进行优化时:...

生成式AI 2023-11-23 人工智能

1089阅读

英伟达 nvidia 官方code llama在线使用

新一代编程语言模型Code Llama面世：重新定义编程的未来随着人工智能和机器学习技术的迅速发展，我们现在迎来了一款革命性的大型编程语言模型——Code Llama。该模型是基于Llama 2研发的，为开放模型中的佼佼者，其性能达到了行业领先水平。...

大数据 2023-11-21 人工智能

977阅读