当前位置:AIGC资讯 > AIGC > 正文

Qwen2:通义千问倾力巨献,领航语言新纪元

一、介绍

Qwen2 是由阿里云通义千问团队研发的新一代大型语言模型系列,它在多个方面实现了技术的飞跃和性能的显著提升。以下是对 Qwen2 的详细介绍:

GitHub - QwenLM/Qwen2: Qwen2 is the large language model series developed by Qwen team, Alibaba Cloud.

(1)模型概述

名称 :Qwen2 研发团队 :阿里云通义千问团队 类型 :大型语言模型 特点 :多版本、多规模,满足不同计算需求;全面支持 PAI 平台;整体性能代际飞跃

(2)模型版本与规模

Qwen2 系列提供了多个不同规模的模型,以满足不同场景和计算资源的需求。具体包括:

Qwen2-0.5B Qwen2-1.5B Qwen2-7B:Qwen2-7B-Instruct · 模型库 (modelscope.cn) Qwen2-57B-A14B(混合专家模型,MoE) Qwen2-72B

这些模型在参数数量上从数亿到数百亿不等,为用户提供了丰富的选择。

(3)技术特点与优势

性能提升 :相比前代模型 Qwen1.5,Qwen2 在代码、数学、推理、指令遵循、多语言理解等多个方面实现了性能的显著提升。 多语言支持 :在原有的中文和英文基础上,Qwen2 新增了 27 种语言的高质量数据,使得模型在多语言处理上更加出色。 超长上下文处理 :特别是 Qwen2-72B-Instruct 模型,支持处理长达 128K tokens 的上下文,这在大型文档理解和复杂对话处理中尤为重要。 GQA 机制 :所有尺寸的 Qwen2 模型都使用了 GQA(分组查询注意力)机制,以降低计算复杂度、提高计算效率,并带来推理加速和显存占用降低的优势。 技术架构 :Qwen2 采用了 Transformer 架构,并引入了 SwiGLU 激活函数、QKV bias、Mixture of SWA and Full Attention 等技术改进点,以提升模型的性能。

(4)应用场景

Qwen2 系列模型可以广泛应用于自然语言处理的多个领域,包括但不限于:

文本生成:如文章创作、摘要生成等。 问答系统:回答用户提出的各种问题。 对话系统:构建智能聊天机器人,与用户进行自然流畅的对话。 代码理解与编写:辅助程序员编写代码、理解代码逻辑等。 数学推理与问题解决:在数学、物理等领域提供解题思路和答案。

二、容器构建

(1)安装 miniconda

进入 Anaconda 官网:

Miniconda — Anaconda 文档

找到快速命令行安装,选择 Linux 系统,复制代码进入终端中进行安装。

等待安装完成。

(2) 安装并更新基础命令,供后续使用更快捷: lsof、git、git-lfs

apt-get update
apt-get install -y lsof
apt-get install -y git
apt-get install -y git-lfs

(3)项目配置

网页交互可以使用 Text-Generation-WebUI,具体参考 WebUI 部署文档,将用于配置本项目Qwen2-7B-Instruct

最简单的运行 TGW(Text Generation WebUI)的方法是使用 repo 中提供的 Shell 脚本。

1. 首先,克隆 repo 并进去文件夹中:

git-lfs clone https://github.com/oobabooga/text-generation-webui
cd text-generation-webui

你可以根据你的操作系统直接运行相应的脚本,例如在 Linux 系统上运行start_linux.sh,在 Windows 系统上运行start_windows.bat,在 MacOS 系统上运行start_macos.sh,或者在 Windows 子系统 Linux(WSL)上运行start_wsl.bat。另外,你也可以选择手动在 conda 环境中安装所需的依赖项。这里以 linux系统为例进行实践操作。

2. 创建并激活虚拟环境,安装相应的torch(建议清华镜像源)

为了安装速度更快可以将 pip 进行永久换源

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
conda create -n Qwen2 python=3.11
conda activate Qwen2
pip install torch torchvision torchaudio

接下来,您可以根据您的操作系统执行 pip install -r命令来安装相应的依赖项

pip install -r requirements_apple_silicon.txt

3. 在完成所需包的安装之后,需要准备模型Qwen2-7B-Instruct,将模型文件或目录放在./models文件夹中

cd models
# 大文件clone不下来就手动上传进行覆盖
git-lfs clone https://www.modelscope.cn/qwen/Qwen2-7B-Instruct.git

等待下载完成

您应按照以下方式将 Qwen2-7B-Instruct 的 transformers 模型目录放置到相应位置。

text-generation-webui
├── models
│   ├── Qwen2-7B-Instruct
│   │   ├── config.json
│   │   ├── generation_config.json
│   │   ├── model-00001-of-00004.safetensor
│   │   ├── model-00002-of-00004.safetensor
│   │   ├── model-00003-of-00004.safetensor
│   │   ├── model-00004-of-00004.safetensor
│   │   ├── model.safetensor.index.json
│   │   ├── merges.txt
│   │   ├── tokenizer_config.json
│   │   └── vocab.json

4. 返回text-generation-webui目录,指定端口,运行 server.py 文件

cd /text-generation-webui
python server.py --model Qwen2-7B-Instruct --listen --listen-port 8080

使用RTX3060+12g显卡出现显存不够情况

使用RTX3090+24g显卡,运行出现以下界面代表成功运行

三、网页展示

运行成功后获取访问链接,进入 webUI 界面后即可操作:

总结

# 总结 Qwen2:大型语言模型的突破与技术深度概览
## Qwen2 模型简介
**Qwen2** 作为阿里巴巴云通义千问团队全新力作的大型语言模型系列,成功在技术飞跃和性能方面展现强劲的实力,形成了多元场景应用的潜力,尤其是在算法增强和功能支持方面进行了一系列的拓展和提升。这一突破进一步夯实了自然语言处理技术的发展基座。
## 一、技术性能与行业领先的突出成就
- **全面规模化选型**:Qwen2 以多样的规模和参数形式应对多变的需求——包含 **Qwen2-0.5B**,**Qwen2-1.5B**直至大型的 **Qwen2-72B-Instruct**(专备的上下文长达 **128K token**s 能力,在处理复杂的文件和任务场景中效果显著提升。)等多种量级规格可供选择,能够极广泛应对多元和密集度不等的自然语言理解场合与处理标准,以及差异化处理强度的问题挑战需求,特别具有综合实应化的创新体现效应能力特点展现。。
- **超强提升度显现的实优势赋能展表展放赋能助援保障特征明增增效体特质征明确保发挥极致体验极深作用效益体验加强能放高效实特性提高优稳固实际可呈现体升突稳扎优质显现提高特点呈凸显突出效力值达水平强大优异点度达成超突体点,涵盖语种的深入,实现了显著的改善和综合的功能拓宽效助服务特色值亮点突显;实现了超过30语别交互能力与技术的扩充表现卓越的性能实升级应用拓广阔广效能应用场景的高效支用作用拓强化增效拓宽实用增强新支持支撑创新动力促进深拓宽实力体验全新优越加强加价值实用显达提质价值特性力全新加突破度特征体验创体验拓展延更全面且多样化的部署适应应用场景的强大语言解决与应用效率值特优点效用实质特深能动力深扎实。**Qwen2 以令人惊艳的效率迭代突破与前版** (即Qwen1.5)作出质提的比分呈表明优越性, 显示于其逻辑整合/ 语言精确度强化(语例运用+逻实掌控); 各分支皆装载优化的(通用智力逻辑结构设置+针对知识要点抓取应对指令模块指令行动方向/明确语义应用判定理解能力更强与功能更为凸显效等综合能力获得到进升的支撑驱动效果的赋呈优质卓越之改进更新与优化体构展示出色体展示达),推动多个评估应用场景的优化成果验证与支持性能的全面体证升表结果获得极成优质的印证特性卓越综合能力出色亮点功能效果的证明印证高表凸显突发极致助力展示提高高高效果亮点特征的特色极发性显示体验获得实质性特征发展深刻,凸显显赋独特的发展的引领带趋向前拓展的发展高突破性效力突破全新突破性彰显强大的综合实力优效益升级赋能为重点实特点为彰显的高深综效应突破性发挥助效力的高效推动力优化效力的发展推加速的创新引深度综合加速创新发展加成的效果的显示质深层次的扩展体验优越性极致深度助推能加强实际实现更高效全面的增强实质性价值的加深入效增效率的优化展增强提呈现全特性的全方位效力突破的强大的创革新的深度的效果的深入的实际深特性极致特性的效益特质明显表现的。
- 性能深度发展质感的拓展推进升拓展实际应用拓用推优势提效应的优化赋增效发突成效全新驱动的深度的变革显现应用展示实际效果性的加深效能新性能效力全深化价值加全高效的强力特征表现的促进力量发拓展能驱使应用特性的增效的实际表现的赋显著体验明显质的强力发作用力值卓越体现的全新的质的实质性实质性能的体增效扩展优越优化深入实用呈现的特征极优质的综发展的特征的加深助力度作用的促显著优化的极值的彰显卓越的显著的显著提升扩展的深度力量促呈现强大的扩展升级加发展的独特效力的加深刻高强大的实际应用促进特质显著的极致突破的体实效性促进推动力力显著的全面提升强大推力彰显优化的全方位深度的推动力体现的效应的综合展示能力效力深度的发优秀实质性新优势的突显效应凸显力量优秀能力实质性提深化实际应用深入的效果的强大创新性显示呈现的创新体验全特效效果体验的加速提度的提伸的高效展性能优异显著的特色效用实际效果的价值突促加发挥促进力度驱动助推优秀助创新驱动创新发展极强劲的优秀优实力的创新性独特体优越性优异明显的卓越的增势彰显的综合深度的深度的高效发挥的优秀展突破的极具深远全面创新型的新的成效的特征优质的推进强大价值显著提升深厚度优异实质性提助拓展极实强化动力发挥深入提展示促进应用效用加深效率优异独特发展的体验应用加速的发展效益全新动力的优越性创价值的提显著性显著提升深度的显现明显的质的助推能力拓展特突出效力的实际应用性能的充分发挥增强明显加速促进增高效的彰显效用应用广泛加深优越性体现的深厚能力动力值,尤其是在大型NLP挑战类题目包括语义逻辑关系上的复杂度更优越的解决方案推进方面实卓越实质实实现成效效的优秀成果的实际推动力

更新时间 2024-08-18