当前位置:AIGC资讯 > AIGC > 正文

轻松掌握 Llama 3.1:轻松本地部署与远程使用的全攻略

前言:

Llama 3.1 是 Meta(Facebook 的母公司)发布的一系列最先进的开源大语言模型。Llama 3.1 系列包括 8B(80 亿参数)、70B(700 亿参数)和 405B(4050 亿参数)模型。其中,405B 是 Meta 迄今为止最大的模型。

本地部署的硬件要求,请确认您的硬件是否能够正常运行,以免浪费时间

Windows:3060以上显卡+8G以上显存+16G内存,硬盘空间至少20G

Mac:M1或M2芯片 16G内存,20G以上硬盘空间

具体模型的显卡需求:

llama3.1-8b,至少需要8G的显存 llama3.1-70b,至少需要大约 70-75 GB 显存 llama3.1-405b,运行需要非常高的显存和硬件资源,至少需要大约 400-450 GB 显存,请谨慎选择。

如果确定没问题,请继续往下看。

一、下载Ollama

Ollama 是一个开源的大模型管理工具,它提供了丰富的功能,包括模型的训练、部署、监控等。通过Ollama,你可以轻松地管理本地的大模型,提高模型的训练速度和部署效率。此外,Ollama还支持多种机器学习框架,如TensorFlow、PyTorch等,使得你可以根据自己的需求选择合适的框架进行模型的训练。【官网下载地址需要的请留言】请根据您的系统下载对应的版本

二、安装使用Ollama

双击安装,默认安装在C盘。安装完成后打开 windows powershell 或 CMD 命令行终端,输入 ollama 命令,回车,即可显示 ollama 命令的使用帮助

三、下载llama 3.1模型文件

运行CMD命令,输入

ollama run llama3.1:8b

如果你的硬件强悍,显卡非常好,也下载更大的llama 3.1的模型70B和405B

ollama run llama3.1:70b 
ollama run llama3.1:405b

耐心等待下载加载完成后就可以对话测试看看有没有问题。

四、配置远程访问

Ollama 启动的默认地址为http://127.0.0.1:11434,我们需要远程调用,可以通过设置环境变量 OLLAMA_HOST来修改默认监听地址和端口

三个变量的用途

变量名 值 说明 OLLAMA_HOST 0.0.0.0:8888 用于配置监听的 IP 和端口 OLLAMA_ORIGINS * 支持跨域访问,也可以指定特定域名,如:”baidu.com,hello.com” OLLAMA_MODELS C:\Users\Administrator.ollama 模型文件较大,建议调整到数据盘目录下。
windows 修改环境变量的方法:

1、停止和退出ollama 服务

2、右键”此电脑 > 属性 > 高级系统设置 > 环境变量 > Administrator 的用户变量 > 新建用户变量”,把3个变量依次添加进去

3、然后重新启动 ollama 服务并加载模型

4、接下来我们就可以使用可视化的Web UI来远程使用了,这类UI有很多,推荐2款,之前有过介绍和官方都有详尽的文档,就不多说了,请参照官方文档。

Open WebUI

Github: https://github.com/open-webui/open-webui 官方文档:https://docs.openwebui.com/

LobeChat

Github: https://github.com/lobehub/lobe-chat 官方文档:https://lobehub.com/zh/docs/self-hosting/start

如何系统的去学习大模型LLM ?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

事实上,抢你饭碗的不是AI,而是会利用AI的人。

科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!超高年薪,挖掘AI大模型人才! 如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?

与其焦虑……

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。

针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点,那以下这些大模型书籍就是非常不错的学习资源。

二、640套LLM大模型报告合集

这套包含640份报告的合集,涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

三、LLM大模型系列视频教程

四、LLM大模型开源教程(LLaLA/Meta/chatglm/chatgpt)

LLM大模型学习路线 ↓

阶段1:AI大模型时代的基础理解

目标:了解AI大模型的基本概念、发展历程和核心原理。

内容:

L1.1 人工智能简述与大模型起源 L1.2 大模型与通用人工智能 L1.3 GPT模型的发展历程 L1.4 模型工程 L1.4.1 知识大模型 L1.4.2 生产大模型 L1.4.3 模型工程方法论 L1.4.4 模型工程实践 L1.5 GPT应用案例

阶段2:AI大模型API应用开发工程

目标:掌握AI大模型API的使用和开发,以及相关的编程技能。

内容:

L2.1 API接口 L2.1.1 OpenAI API接口 L2.1.2 Python接口接入 L2.1.3 BOT工具类框架 L2.1.4 代码示例 L2.2 Prompt框架 L2.3 流水线工程 L2.4 总结与展望

阶段3:AI大模型应用架构实践

目标:深入理解AI大模型的应用架构,并能够进行私有化部署。

内容:

L3.1 Agent模型框架 L3.2 MetaGPT L3.3 ChatGLM L3.4 LLAMA L3.5 其他大模型介绍

阶段4:AI大模型私有化部署

目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。

内容:

L4.1 模型私有化部署概述 L4.2 模型私有化部署的关键技术 L4.3 模型私有化部署的实施步骤 L4.4 模型私有化部署的应用场景

这份 LLM大模型资料 包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

总结

### 文章总结
Meta(Facebook母公司)发布了Llama 3.1系列开源大语言模型,涵盖8B(80亿参数)、70B(700亿参数)及405B(4050亿参数)版本,其中405B为迄今最大模型。使用这些模型需确保硬件满足要求:Windows需3060以上显卡+8G以上显存+16G内存+至少20G硬盘空间;Mac需M1或M2芯片+16G内存+20G以上硬盘空间。显存需求随模型增大显著提升,405B模型需大约400-450GB显存。
**操作指南**:
1. **下载Ollama**:开源大模型管理工具,支持模型训练、部署及监控,兼容TensorFlow、PyTorch等。
2. **安装使用Ollama**:通过PowerShell或CMD输入`ollama`查看使用帮助。
3. **下载Llama 3.1模型**:使用`ollama run llama3.1:x`(x为模型大小如8b、70b、405b)下载所需模型文件。
4. **配置远程访问**:通过修改环境变量调整Ollama监听地址及端口,支持跨域访问及模型文件优化配置到数据盘目录。
**学习资源推荐**:
- **书籍**:涵盖LLM大模型经典理论书籍。
- **报告**:640套大模型行业报告,全面覆盖理论研究、技术实现及应用案例。
- **视频教程**:系列视频教程助力学习。
- **学习路线**:
- **基础理解**:了解大模型基本概念、发展历程及核心原理。
- **API应用开发**:掌握OpenAI等API接口调用、Python编程及BOT工具框架使用。
- **应用架构实践**:深入理解并实践AI大模型应用架构及私有化部署。
**总结**:本文详细介绍了Llama 3.1模型的部署、使用以及配套学习资源的获取方式,帮助读者从零开始深入学习大模型技术,为AI时代的职业发展打下坚实基础。同时,推荐了全面的学习资源,包括书籍、报告、视频教程及详细学习路线,助力小白快速入门并进阶成为AI技术人。

更新时间 2024-09-25