微调训练第2页 - AIGC资讯

LLaMA模型泄露 Meta成最大受益者

一份被意外泄露的谷歌内部文件，将Meta的LLaMA大模型“非故意开源”事件再次推到大众面前。“泄密文件”的作者据悉是谷歌内部的一位研究员，他大胆指出，开源力量正在填平OpenAI与谷歌等大模型巨头们数年来筑起的护城河，而最大的受益者是Meta，因为该公司...

人工智能 2024-01-20 人工智能

795阅读

最佳开源模型刷新多项SOTA，首次超越Mixtral Instruct！「开源版GPT-4」家族迎来大爆发

Mixtral 8x7B开源模型的诞生，正如Llama一样，为开源社区了带来曙光。前段时间，Mixtral刚刚发布了8x7B模型的论文。在基准测试结果中，其性能达到或超过 Llama 2-70B和GPT-3.5。甚至，Mixtral在数学、代码生成和...

大数据 2024-01-19 人工智能

885阅读

四种通过LLM进行文本知识图谱的构建方法对比介绍

我们在以前的文章中已经介绍了使用大语言模型将非结构化文本转换为知识图谱。但是对于知识图谱的创建是一个很复杂的过程，比如需要对属性增加限制，创建符合特定主题/模式的图谱，并且有时文档非常大，无法作为单个提示处理，所以在切分后的提示中创建的图谱需要前后一致。...

生成式AI 2024-01-19 人工智能

997阅读

基于 PAI-EAS 一键部署 Stable Diffusion AIGC 绘画

人工智能平台PAI完成云上Stable Diffusion以文生图应用搭建，支持两种方式：使用交互式建模 PAI-DSW 使用模型在线服务 PAI-EAS 两种部署适用人群： 1.使用交互式建模 PAI-DSW 部署Stable Diffus...

AIGC 2024-01-18 人工智能

954阅读

保姆级教程：从0到1使用Stable Diffusion XL训练LoRA模型 |【人人都是算法专家】

Rocky Ding 公众号：WeThinkIn 写在前面【人人都是算法专家】栏目专注于分享Rocky在AI行业中对业务/竞赛/研究/产品维度的思考与感悟。欢迎大家一起交流学习? 大家好...

生成式AI 2024-01-03 人工智能

1276阅读

得物大模型平台，业务效果提升实践

一、背景得物大模型训练与推理平台上线几个月后，我们与公司内部超过 10 个业务领域展开了全面的合作。在一些关键业务指标方面，取得了显著的成效，例如：效率相关部门的合作，多维度打标总正确率取得 2 倍以上提升。利用大模型开辟了新的业务，提升了效...

大数据 2023-12-27 人工智能

840阅读

【AIGC】Chatglm2-lora微调

ChatGLM2介绍 ChatGLM2-6B源码地址：https://github.com/THUDM/ChatGLM2-6B ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本，在保留了初代模型对话流畅、部署门槛较低...

AIGC 2023-12-24 人工智能

971阅读

基于MindSpore的llama微调在OpenI平台上运行

基于MindSpore的llama微调在OpenI平台上运行克隆预训练模型克隆chatglm-6b代码仓，下载分布式的模型文件 git lfs install git clone https://huggingface.co/openlm-...

人工智能 2023-12-23 人工智能

921阅读

开发者笑疯了！ LLaMa惊天泄露引爆ChatGPT平替狂潮，开源LLM领域变天

来源: 新智源微信号：AI-era Meta的LLaMA模型开源，让文本大模型迎来了Stable Diffustion时刻。谁都没想谁能想到，一次意外的LLaMA泄漏，竟点燃了开源LLM领域最大的创新火花。一系列表现出色的Chat...

大数据 2023-12-21 人工智能

963阅读

LLM-项目详解-Chinese-LLaMA-AIpaca（一）：LLM+LoRa微调加速技术原理及基于PEFT的动手实践：一些思考和mt0-large+lora完整案例

如何花费较少的算力成本来进行微调训练，十分重要，当前关于LLaMA、Alpaca、Instruct微调、LoRa微调等多个概念大家讲的很多，最近也在学习，也看到几个有趣的话题（主要参考于（https://github.com/ymcui/Chinese-L...

大数据 2023-12-21 人工智能

973阅读

保姆级教程教你快速搭建属于自己的AI绘画系统！（收藏）

Midjourney收费高、无法支付，且生成想要的图片受限，风格固定，如果能够10分钟快速搭建属于自己的AI绘画系统，并且对电脑配置无要求，你心动了吗？先来看看AI系统构建完成后的画面，只需要输入自定义的prompt，就能生...

人工智能 2023-12-15 人工智能

1841阅读

Stable diffusion ai图像生成本地部署教程

前言本文将用最干最简单的方式告诉你怎么将Stable Diffusion AI图像生成软件部署到你的本地环境关于Stable Diffusion的实现原理和训练微调请看我其他文章部署Stable Diffusion主要分为三个部分下载模型...

人工智能 2023-12-13 人工智能

875阅读

InsCode Stable Diffusion使用教程【InsCode Stable Diffusion美图活动一期】

记录一下如何使用 InsCode Stable Diffusion 进行 AI 绘图以及使用感受。一、背景介绍目前市面上比较权威，并能用于工作中的 AI 绘画软件其实就两款。一个叫 Midjourney（简称 MJ），另一个叫 Stable Di...

AIGC 2023-12-13 人工智能

1096阅读

基于LoRA微调部署Stable Diffusion【免费试用阿里云】

文章目录 Stable Diffusion介绍环境及资源准备过程交互式建模（PAI-DSW）的试用在创建的工作空间中创建实例 Stable Diffusion的Web-UI部署下载stable-diffusion-webui开源库...

AIGC 2023-12-13 人工智能

953阅读

大语言模型之十六-基于LongLoRA的长文本上下文微调Llama-2

增加LLM上下文长度可以提升大语言模型在一些任务上的表现，这包括多轮长对话、长文本摘要、视觉-语言Transformer模型的高分辨4k模型的理解力以及代码生成、图像以及音频生成等。对长上下文场景，在解码阶段，缓存先前token的Key和Value（K...

AIGC 2023-12-09 人工智能

1328阅读

首个精通3D任务的具身通才智能体：感知、推理、规划、行动统统拿下

想要迈向通用人工智能，必须要构建一个能够理解人类生活的真实世界，并掌握丰富技能的具身通用智能体。今年以来，以 GPT-4 (V [1]、LLaVA [2]、PALM-E [3] 等为代表的多模态大语言模型（Multi-modal Large Langu...

AIGC 2023-12-08 人工智能

918阅读

云上使用 Stable Diffusion ，模型数据如何共享和存储

随着人工智能技术的爆发，内容生成式人工智能（AIGC）成为了当下热门领域。除了 ChatGPT 之外，文本生成图像技术更令人惊艳。 Stable Diffusion，是一款开源的深度学习模型。与 Midjourney 提供的直接将文本转化为图像的服务不同...

AIGC 2023-12-07 人工智能

803阅读

大模型LLaMA和微调LLaMA

1.LLaMA LLaMA的模型架构:RMSNorm/SwiGLU/RoPE/Transformer/1-1.4T tokens，和GPT一样都是基于Transformer这个架构。 1.1对transformer子层的输入归一化与Transf...

大数据 2023-12-06 人工智能

1418阅读

AIGC专栏5——EasyPhoto AI写真照片生成器 sd-webui插件介绍、安装与使用

AIGC专栏5——EasyPhoto AI写真照片生成器插件安装与使用学习前言源码下载地址技术原理储备（SD/Control/Lora） StableDiffusion ControlNet Lora EasyPhoto插件简介 E...

大数据 2023-12-04 人工智能

2308阅读

灵雀云Alauda MLOps 现已支持 Meta LLaMA 2 全系列模型

在人工智能和机器学习领域，语言模型的发展一直是企业关注的焦点。然而，由于硬件成本和资源需求的挑战，许多企业在应用大模型时仍然面临着一定的困难。为了帮助企业更好地应对上述挑战，灵雀云于近日宣布，企业可通过Alauda MLOps（以下简称AML）使用由 Me...

大数据 2023-12-04 人工智能

805阅读

本地部署中文LLaMA模型实战教程，民间羊驼模型

羊驼实战系列索引博文1：本地部署中文LLaMA模型实战教程，民间羊驼模型（本博客）博文2：本地训练中文LLaMA模型实战教程，民间羊驼模型博文3：精调训练中文LLaMA模型实战教程，民间羊驼模型简介 LLaMA大部分是英文语料训练的，讲中文能...

大数据 2023-12-04 人工智能

828阅读

通义千问720亿参数模型开源，率先实现“全尺寸全模态”开源

12月1日，阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练，在10个权威基准测评中夺得开源模型最优成绩，在部分测评中超越闭源的GPT-3.5和GPT-4。在英语任务上，Qwen-72B在MMLU基准测...

AIGC 2023-12-01 人工智能

993阅读

Llama-Factory的baichuan2微调

Llama-Factory：https://github.com/hiyouga/LLaMA-Factory/tree/main 请使用 --quantization_bit 4/8 来启用 QLoRA 训练。默认模块应作...

人工智能 2023-11-28 人工智能

1256阅读

LLaMA-Factory可视化界面微调chatglm2；LoRA训练微调模型简单案例

参考：https://github.com/huggingface/peft https://github.com/hiyouga/LLaMA-Factory 1、LLaMA-Factory可视化界面微调chatglm2 类似工具还有流萤，注意是做中...

人工智能 2023-11-27 人工智能

872阅读

本地免费GPT4？Llama 2开源大模型，一键部署且无需硬件要求教程

目前扎克布格带来了最新的Llama 2开源NLP大模型，目前有三个版本分别是70亿参数量，130亿参数量和700亿参数量，庞大的数据集和参数量保证了模型的强大，官网宣称性能与gpt4相比不落下风，又因为开源使得我们可以实现本地化gpt4的梦...

AIGC 2023-11-27 人工智能

884阅读

Stable Diffusion：使用自己的数据集微调训练LoRA模型

Stable Diffusion：使用自己的数据集微调训练LoRA模型前言前提条件相关介绍微调训练LoRA模型下载kohya_ss项目安装kohya_ss项目运行kohya_ss项目准备数据集生成关键词模型参数设置预训...

生成式AI 2023-11-25 人工智能

1275阅读

大模型微调踩坑记录 - 基于Alpaca-LLaMa+Lora

前言为了使用开放权重的LLM(大语言模型，基于自己的训练集，微调模型，会涉及到如下一些技术要点：配置运行环境下载、加载基础模型收集语料、微调训练检验训练效果在实施过程中，遇到不少困难，因此写下这篇文档，做为记录。环境配置...

生成式AI 2023-11-22 人工智能

976阅读

大语言模型之七- Llama-2单GPU微调SFT

（T4 16G）模型预训练colab脚本在github主页面。详见Finetuning_LLama_2_0_on_Colab_with_1_GPU.ipynb 在上一篇博客提到两种改进预训练模型性能的方法Retrieval-Augmented Gener...

人工智能 2023-11-21 人工智能

1028阅读

Stable Diffusion XL训练LoRA

主要包括SDXL模型结构，从0到1训练SDXL以及LoRA教程，从0到1搭建SDXL推理流程。【一】SDXL训练初识 Stable Diffusion系列模型的训练主要分成一下几个步骤，Stable Diffusion XL也不例外：训练集...

AIGC 2023-11-20 人工智能

1308阅读

openai开源的whisper在huggingface中使用例子（语音转文字中文）

openai开源的语音转文字支持多语言在huggingface中使用例子。目前发现多语言模型large-v2支持中文是繁体，因此需要繁体转简体。后续编写微调训练例子 GitHub地址： https://github.com/openai/whispe...

AIGC 2023-11-14 人工智能

857阅读

[大模型] LLaMA系列大模型调研与整理-llama/alpaca/lora（部分）

文章目录 LLaMA大模型及其衍生模型 1. LLaMA 2. stanford_alpaca 3. ChatDoctor 4. alpaca-lora 5. Chinese-LLaMA-Alpaca 6. BELLE 大模型综述 A Su...

生成式AI 2023-11-12 人工智能

1351阅读

在亚马逊云科技Amazon SageMaker上进行Stable Diffusion模型训练和推理

Stable Diffusion Quick Kit是一个基于亚马逊云科技Amazon SageMaker进行Stable Diffusion模型快速部署的工具包，包括了一组示例代码、服务部署脚本、前端UI，可以帮助可以快速部署一套Stable Diff...

生成式AI 2023-11-10 人工智能

984阅读

UniPAD：通用自动驾驶预训练模式！各类感知任务都可支持

本文经自动驾驶之心公众号授权转载，转载请联系出处。最近，新论文推陈出新的速度着实太快有点读不过来的感觉。可以看到的是，语言视觉多模态大模型融合已经是业界共识了，UniPad 这篇文章就比较有代表性，多模态的输入，类世界模型的预训练基座模型，同时又方便扩...

人工智能 2023-11-10 人工智能

880阅读

开启想象翅膀：轻松实现文本生成模型的创作应用，支持LLaMA、ChatGLM、UDA、GPT2、Seq2Seq、BART、T5、SongNet等模型，开箱即用

开启想象翅膀：轻松实现文本生成模型的创作应用，支持LLaMA、ChatGLM、UDA、GPT2、Seq2Seq、BART、T5、SongNet等模型，开箱即用 TextGen: Implementation of Text Generation...

生成式AI 2023-11-09 人工智能

852阅读

中科院物理研究所等发布材料合成AI大语言模型MatChat

近期，中国科学院计算机网络信息中心人工智能部和物理研究所SF10组合作，通过使用来自400多万篇论文中提取的35675个无机材料固相反应合成过程，将数据处理为13878条高可信度的合成路径描述数据，并对开源大语言模型LLaMA2-7B进行微调训练，研发了专...

AIGC 2023-11-06 人工智能

790阅读

阿里云发布通义星尘、通义灵码等产品推出大模型应用开发平台阿里云百炼

在昨日的2023云栖大会上，阿里云发布了多个重要的产品和技术。首先是通义大模型家族的更新。阿里云发布了千亿级参数规模的大模型通义千问2.0，综合性能超过了 GPT-3.5，正在追赶 GPT-4。此外，通义千问 APP 也在各大手机应用市场上线，用户可以直...

AIGC 2023-11-02 人工智能

913阅读

阿里云全面升级AI基础设施，中国大模型公司一半跑在阿里云上！

10月31日，在2023云栖大会上，阿里云CTO周靖人表示，面向智能时代，阿里云将通过从底层算力到AI平台再到模型服务的全栈技术创新，升级云计算体系，打造一朵AI时代最开放的云。在现场，周靖人公布了云计算基础能力的最新进展，升级了人工智能平台，并发布千亿...

人工智能 2023-10-31 人工智能

866阅读

通义千问有没有app？通义千问api接口文档在哪里找

在 10 月 31 日的 2023 云栖大会上，阿里云CTO周靖人宣布阿里云将全面升级云计算体系，打造一个面向AI时代最开放的云，涵盖从底层算力到AI平台再到模型服务的全栈技术创新。目前，中国有一半的大模型企业运行在阿里云上， 280 万AI开发者活跃在阿...

AIGC 2023-10-31 人工智能

958阅读

通义千问APP下载官网入口通义千问手机版下载地址

在 2023 年的云栖大会上，阿里云CTO周靖人宣布，阿里云将升级其云计算体系，以适应智能时代的需要，从底层的算力到AI平台再到模型服务，阿里云将提供全栈技术创新。周靖人还宣布了阿里云通义千问2. 0 的发布，这是一款千亿级参数规模的大模型，以及阿里云百炼...

人工智能 2023-10-31 人工智能

934阅读