数据集第16页 - AIGC资讯

在阿里云上用LLaMA-Factory微调大模型

相信很多小伙伴都想自己手搓大模型，所以有大佬做了LLaMA-Factory，但是有工具还不行，还得有环境，说实话，我现在每天除了上班就是带孩子，连游戏都没得打，所以自己连个有GPU的电脑都没[苦笑]。基于以上前提条件，唯一方法只得通过云服务来帮我们微调...

生成式AI 2024-07-01 人工智能

762阅读

【产品经理修炼之道】-AI 产品经理和 AIGC 产品经理有什么区别

AI 和 AIGC 行业两个行业带动了产品经理的的能力提升，那AI产品经理与AIGC产品经理两者中间有什么区别的呢？下面一起来看一下，之间的不同之处吧！目前很火的 AI 和 AIGC 行业，也带动了产品经理能力的升级和迭代。我们可以从各大招聘平台看到，...

人工智能 2024-07-01 人工智能

588阅读

Stable Diffusion文生图模型训练入门实战（完整代码）

Stable Diffusion 1.5（SD1.5）是由Stability AI在2022年8月22日开源的文生图模型，是SD最经典也是社区最活跃的模型之一。以SD1.5作为预训练模型，在火影忍者数据集上微调一个火影风格的文生图模型（非Lora方式）...

人工智能 2024-07-01 人工智能

848阅读

AIGC涉及到的算法（一）

目录 1. 生成对抗网络(GAN 2. 变分自编码器(VAE 3. 扩散模型(Diffusion Model 4. Transformer 模型 5. 自然语言处理算法(NLP 6. 计算机视觉算法(CV 7. 神经网络算法...

人工智能 2024-06-30 人工智能

613阅读

通过ORPO技术微调 llama3大模型(Fine-tune Llama 3 with ORPO)

通过ORPO对llama进行微调前言 ORPO是一种新颖的微调技术，它将传统的监督微调和偏好对齐阶段整合到一个过程中。这减少了训练所需的计算资源和时间。此外，经验结果表明，ORPO在各种模型大小和基准测试中都超过了其他对齐方法。在本文中，我们将...

生成式AI 2024-06-30 人工智能

461阅读

Llama 3大模型学习

基础部分学习： 1、 Llama 3 Web Demo 部署 streamlit run ***.py(网页演示py文件路径） ***(下载好的大模型参数路径注意点：在vscode中要对上面命令产生的External URL的最后四位端口号，在...

大数据 2024-06-30 人工智能

513阅读

白嫖 Kaggle 部署 stable-diffusion

本文首发于我的个人博客 blog.csun.site Kaggle 每周有 30 个小时的免费 GPU 资源，可以使用 Kaggle 来部署 stable-diffusion 免费享受 AI 绘画服务。部署代码注册 Kaggle 后，打开这...

人工智能 2024-06-29 人工智能

640阅读

文生图算法原理：从扩散模型到Stable Diffusion

导读 Stable Diffusion是扩散模型的一种实现。传统的扩散模型（如DDPM）的做法是在像素空间预测预测噪声图noise_t，输入是每一步的图片image_t和代表step的Time embedding，然后在图片image_t上减去模型预测...

人工智能 2024-06-29 人工智能

808阅读

Llama-Code Shield解读：大模型代码安全护盾解析

引言大模型目前被广泛用于生成代码数据，能有效地提高研发效率。但LLM生成的代码中潜藏的安全漏洞，也成了悬在头顶的达摩克利斯之剑。最近，Llama-3的问世，不仅带来了新的代码生成能力，更配备了Code Shield这一安全检测利器，为LL...

生成式AI 2024-06-29 人工智能

525阅读

Llama3-Tutorial（Llama 3 超级课堂）学习笔记

课程资料五一 Llama 3 超级课堂 | 第二节 Llama 3 微调个人小助手认知（XTuner版）_哔哩哔哩_bilibili SmartFlowAI/Llama3-Tutorial: Llama3-Tutorial（XT...

AIGC 2024-06-29 人工智能

518阅读

DataWorks Copilot：大模型时代数据开发的新范式

导读 DataWorks 是阿里云一站式智能化数据开发与治理平台，支持搭配MaxCompute/Hologres/AnalyticDB/StarRocks/EMR/CDH 等大数据引擎，为企业构建数据仓库、数据湖以及湖仓一体（Lakehouse）现代数据...

人工智能 2024-06-28 人工智能

468阅读

大模型应用实战4——开源大模型微调（基于LLaMA-Factory）

所谓微调，通俗理解就是围绕大模型进行参数修改，从而永久性的改变模型的某些性能。而大模型微调又分为全量微调和高效微调两种，所谓全量微调，指的是调整大模型的全部参数，而高效微调，则指的是调整大模型的部分参数，目前常用的高效微调方法包括LoRA、QLoRA、p-...

AIGC 2024-06-28 人工智能

734阅读

2024年AIGC行业研究：多模态大模型与商业应用_

2024年2月，OpenAI发布其首款视频生成模型Sora，用户仅需输入一段文字即可生成长达一分钟场景切换流畅、细节呈现清晰、情感表达准确的高清视频，与一年前的AI生成视频相比，在各维度均实现了质的提升。这一突破再次将AIGC推向大众视野。AIGC即通过大...

AIGC 2024-06-28 人工智能

466阅读

AIGC的图像生成技术【从卷积神经网络到风格迁移】

本文收录于专栏：精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践...

生成式AI 2024-06-28 人工智能

616阅读

AIGC教程：Stable Diffusion精进，如何训练特定画风LoRA模型？

（全套教程文末领取哈）文生图只是AI生成能力的起步，如今，随着同行们的探索增加，很多人已经开始通过Stable Diffusion训练风格化的模型，即将AI变成一个特定画风的画师。最近，就有一位开发者分享了自己训练风格化LoRA模型的经验和技巧，并且...

大数据 2024-06-28 人工智能

642阅读

天才程序员周弈帆 | Stable Diffusion 解读（二）：论文精读

本文来源公众号“天才程序员周弈帆”，仅用于学术分享，侵权删，干货满满。原文链接：Stable Diffusion 解读（二）：论文精读【小小题外话】端午安康！在上一篇文章天才程序员周弈帆 | Stable Diffusion 解读（一）：回顾早...

大数据 2024-06-27 人工智能

746阅读

MCT Self-Refine：创新集成蒙特卡洛树搜索（MCTS）提高复杂数学推理任务的性能，超GPT4，使用 LLaMa-3 8B 进行自我优化

? 文献卡题目： Accessing GPT-4 level Mathematical Olympiad Solutions via Monte Carlo Tree Self-refine with LLaMa-3 8B 作者: Di Zh...

人工智能 2024-06-27 人工智能

588阅读

Llama模型家族训练奖励模型Reward Model技术及代码实战（二）从用户反馈构建比较数据集

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

人工智能 2024-06-27 人工智能

564阅读

半年估值数亿，1000亿美元超级赛道跑出“AI猛兽”

去年，谷歌发布了一份忧心忡忡的内部文件:“虽然谷歌与OpenAI（在大模型上）你追我赶，但双方都没有真正的护城河，因为第三股力量正在崛起——开源社区才是谷歌和OpenAI最大的敌人。” 谷歌的担忧正逐渐变成了现实。马斯克的开源大模型公司xAI近期完成60...

AIGC 2024-06-27 人工智能

467阅读

AIGC专栏11——EasyAnimateV2结构详解与Lora训练最大支持768x768 144帧视频生成

AIGC专栏11——EasyAnimateV2结构详解与Lora训练最大支持768x768 144帧视频生成学习前言源码下载地址 EasyAnimate V2简介技术储备 Diffusion Transformer (DiT Mo...

AIGC 2024-06-27 人工智能

605阅读

使用 LLaMA-Factory 实现对大模型函数调用功能

节前，我们星球组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学。针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。合集：《大模型面试...

AIGC 2024-06-26 人工智能

790阅读

llama factory 是如何加载数据集通过对数据集加载的代码的理解编写自定义数据集训练代码

第一层从训练代码追踪到以下代码 def get_dataset( tokenizer: "PreTrainedTokenizer", model_args: "ModelArguments", data_args: "DataAr...

生成式AI 2024-06-26 人工智能

1115阅读

通义千问2(Qwen2)大语言模型在PAI-QuickStart的微调、评测与部署实践

Qwen2（通义千问2）是阿里云最近推出的开源大型语言模型系列，相比2月推出的Qwen1.5，Qwen2实现了整体性能的代际飞跃，大幅提升了代码、数学、推理、指令遵循、多语言理解等能力。其中，Qwen2系列包含5个尺寸的预训练和指令微调模型，Qwen2-0...

生成式AI 2024-06-26 人工智能

595阅读

增强大型语言模型（LLM）可访问性：深入探究在单块AMD GPU上通过QLoRA微调Llama 2的过程

Enhancing LLM Accessibility: A Deep Dive into QLoRA Through Fine-tuning Llama 2 on a single AMD GPU — ROCm Blogs 基于之前的博客《使用Lo...

人工智能 2024-06-26 人工智能

747阅读

⌈ 传知代码 ⌋ LLaMA 开放高效基础语言模型

?前情提要? 本文是传知代码平台中的相关前沿知识与技术的分享~ 接下来我们即将进入一个全新的空间，对技术有一个全新的视角~ 本文所涉及所有资源均在传知代码平台可获取以下的内容一定会让你对AI 赋能时代有一个颠覆性的认识哦！！！以下内容干货满满...

AIGC 2024-06-26 人工智能

471阅读

微软发布Phi-3 Mini，性能媲美GPT-3.5、Llama-3，可在手机端运行

前言微软发布了最新版的Phi系列小型语言模型(SLM - Phi-3。这个系列包括3个不同参数规模的版本：Phi-3 Mini (38亿参数、Phi-3 Small (70亿参数和Phi-3 Medium (140亿参数。 Phi系列模型是微...

大数据 2024-06-26 人工智能

566阅读

【AIGC】通义千问生成问答数据集

好久没有更新跟实际应用相关的内容了（主要是因为公司知识产权问题未能立即公开，目前只能挑选一些脱敏内容与各位分享），如标题所示本期将跟大家讲一下如何通过通义千问生成问答数据集的。在之前使用 Autokeras 的 RNN 训练时提到，数据是人工智能训练的...

大数据 2024-06-26 人工智能

544阅读

LlamaFactory-Ollama-Langchain大模型训练-部署一条龙

前言近些日子，大模型火的一塌糊涂，那么现在就有义务要学习一套好用的、从 dataset --> train --> deploy 的一整套流程，好拿来装逼。话不多说，进入正题 Train 框架目前好用的框架太多，如BELLE, C...

AIGC 2024-06-26 人工智能

785阅读

【AIGC】HF-Mirror 使用说明（MacOS 版）

今天这篇文章主要是记录 HF-Mirror 的使用过程，官网上提供了 Linux 和 Windows 的使用方式。本人作为 MacOS 用户也将自己的使用办法记录一下，希望能够帮助到其他人。 HF-Mirror 是什么？ HF-Mirror 是大神...

人工智能 2024-06-25 人工智能

576阅读

一文看懂Llama 2：原理、模型与训练

一文看懂Llama 2：原理、模型与训练 Llama 2是一种大规模语言模型（LLM），由Meta（原Facebook）研发，旨在推动自然语言处理（NLP）领域的发展。本文将详细介绍Llama 2的原理、模型架构及其训练方法，以帮助读者深入理解这一技术...

生成式AI 2024-06-25 人工智能

821阅读

每日AIGC最新进展(29)：复旦大学提出通过人类反馈来优化语音生成模型SpeechAlign、浙江大学提出跟踪3D空间中的任何2D像素SpatialTracker、西安交大提出动态场景的语义流

Diffusion Models专栏文章汇总：入门与实战 SpeechAlign: Aligning Speech Generation to Human Preferences 本文介绍了一种名为SpeechAlign的方法，旨在通过人类反馈...

AIGC 2024-06-25 人工智能

480阅读

微软大模型phi-3速览-3.7B比llama-3 8B更好？

背景模型发布者：Microsoft 模型发布时间：2024年4月23日发布内容：介绍了phi-3系列语言模型，包括phi-3-mini、phi-3-small和phi-3-medium。重点关注：整体性能可与 Mixtral 8x7B...

AIGC 2024-06-25 人工智能

597阅读

腾讯混元文生图大模型开源训练代码，发布LoRA与ControlNet插件

6月21日，腾讯混元文生图大模型（以下简称为混元 DiT 模型）宣布全面开源训练代码，同时对外开源混元 DiT LoRA 小规模数据集训练方案与可控制插件 ControlNet。这意味着，全球的企业与个人开发者、创作者们，都可以基于混元 DiT 训练代...

生成式AI 2024-06-24 人工智能

434阅读

重磅！Meta 发布 Llama 3，前所未有的强大功能和多模态能力｜TodayAI

Meta今日宣布推出其最新一代尖端开源大型语言模型Llama 3。该模型预计很快将在多个领先的云服务平台上线，包括AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft A...

生成式AI 2024-06-24 人工智能

595阅读

（5-5-02）金融市场情绪分析：使用Llama 2 大模型实现财经信息的情感分析微调（2）

5.5.4 Llama-2语言模型操作编写下面的代码，功能是加载、配置 Llama-2 语言模型以及其对应的分词器，准备好模型为后续的对话生成任务做好准备。 model_name = "../input/llama-2/pytorch/7b-h...

AIGC 2024-06-24 人工智能

894阅读

Stable Diffusion模型训练 — 前菜

图像生成模型原理简析你有没有好奇过，AI图像生成模型是怎么学会“绘画”的吗？人工智能（Artificial Iitelligence）这个概念是在1956年的达特矛斯会议上提出来的认为机器可以模仿人类的学习以及其他方面的智能，后世也将实现人工智能的方式...

AIGC 2024-06-24 人工智能

480阅读

原来Stable Diffusion是这样工作的

stable diffusion是一种潜在扩散模型，可以从文本生成人工智能图像。为什么叫做潜在扩散模型呢？这是因为与在高维图像空间中操作不同，它首先将图像压缩到潜在空间中，然后再进行操作。在这篇文章中，我们将深入了解它到底是如何工作的,还能够知道文生图...

生成式AI 2024-06-24 人工智能

561阅读

Llama模型家族之Stanford NLP ReFT源代码探索（一）数据预干预

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

AIGC 2024-06-24 人工智能

496阅读

AIGC安全与伦理问题【技术挑战与解决方案】

本文收录于专栏：精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践...

AIGC 2024-06-24 人工智能

793阅读

llama 3 震撼来袭 8B 150k 词元 8Ktoken长度 4T token 参与预训练与对齐训练使用GQA

Meta开发了并发布了Meta Llama 3系列大型语言模型(LLMs ，这是一组在8亿和70亿参数规模下预训练和指令调整的生成文本模型。Llama 3的指令调整模型针对对话用例进行了优化，并在常见的行业基准测试中超越了众多开源聊天模型。在开发这些模型时...

人工智能 2024-06-23 人工智能

553阅读

AI根据文本语义实现AI绘画出图

引言当谈到人工智能（AI）和艺术的结合时，我们经常会想到生成对抗网络（GANs）和图像生成。然而，很少有人了解到AI也可以通过文本语义生成绘画作品。在本文中，我将详细介绍如何使用深度学习和自然语言处理技术，使AI能够根据给定的文本语义生成绘画作品。...

生成式AI 2024-06-23 人工智能

434阅读

每日AIGC最新进展(24)：用于图像质量和审美评估的统一视觉-语言预训练模型UniQA、可控生成图像压缩框架Control-GIC、3D感知扩散模型Ouroboros3D

Diffusion Models专栏文章汇总：入门与实战 UniQA: Unified Vision-Language Pre-training for Image Quality and Aesthetic Assessment 本文提出了一...

人工智能 2024-06-23 人工智能

575阅读

为ChatGLM-6B模型的训练纪实：从数据集准备到LLamA-Factory的高效应用(一)

文章目录前言一、数据来源的选择 (一、开源数据集 1. 存在的问题 2. 解决方案 (二、自定义数据集网络爬虫用户生成内容法律咨询阶段成果展示前言在人工智能和自然语言处理领域，生成式预训练模型（如G...

AIGC 2024-06-22 人工智能

567阅读

华为云盘古大模型5.0发布：可控时空生成技术重塑自动驾驶开发

快科技6月21日消息，在今日召开的华为开发者大会(HDC 2024 上，华为云发布了盘古大模型5.0，其创新的多模态生成能力，可以为自动驾驶领域提供更高质量的数据支持。华为常务董事、华为云CEO张平安表示，盘古5.0通过创新的可控时空生成，大规模的生成和...

生成式AI 2024-06-22 人工智能

425阅读

重磅！Llama-3，最强开源大模型正式发布！

4月19日，全球科技、社交巨头Meta在官网，正式发布了开源大模型——Llama-3。据悉，Llama-3共有80亿、700亿两种参数，分为基础预训练和指令微调两种模型（还有一个超4000亿参数正在训练中）。与Llama-2相比，Llama-3使用...

AIGC 2024-06-22 人工智能

483阅读

LLaMA-Factory微调多模态大语言模型教程

本文旨在结合笔者自身的实践经历，详细介绍如何使用 LLaMA-Factory 来微调多模态大语言模型。目前仓库已支持若干流行的MLLM比如LLaVA-1.5，Yi-VL，Paligemma等。 2024.5.29 注：本文后续不再更新，如果想了解更新的特...

AIGC 2024-06-21 人工智能

700阅读

Kimi创始人套现4000万美元疑云|「商汤」大模型一体机可节约80%推理成本，完成云端边全栈布局|中国AI活化石，熬成AIGC第一股| 谁在制造小米汽车？

Kimi创始人套现4000万美元疑云「商汤」大模型一体机可节约80%推理成本，完成云端边全栈布局苹果卷开源大模型，公开代码、权重、数据集、训练全过程，OpenELM亮相特斯拉的反围剿战术还剩下啥？腾讯出手，投了家创新药公司谁在制造小米汽车？估值...

生成式AI 2024-06-21 人工智能

503阅读

LLaMA 羊驼系大语言模型的前世今生

关于 LLaMA LLaMA是由Meta AI发布的大语言系列模型，完整的名字是Large Language Model Meta AI，直译：大语言模型元AI。Llama这个单词本身是指美洲大羊驼，所以社区也将这个系列的模型昵称为羊驼系模型。 Ll...

人工智能 2024-06-21 人工智能

726阅读

在Windows上用Llama Factory微调Llama 3的基本操作

这篇博客参考了一些文章，例如：教程：利用LLaMA_Factory微调llama3:8b大模型_llama3模型微调保存-CSDN博客也可以参考Llama Factory的Readme：GitHub - hiyouga/LLaMA-Factory: U...

生成式AI 2024-06-21 人工智能

663阅读

AIGC从入门到实战：AIGC 在工业领域的创新场景—合成数据集，助力机器人产品研发

1. 背景介绍随着人工智能技术的不断发展，越来越多的企业开始将其应用于工业领域，以提高生产效率和产品质量。在机器人产品研发中，数据集是非常重要的资源，但是获取真实的数据集往往需要耗费大量的时间和成本。因此，合成数据集成为了一种备受关注的解决方案。合...

生成式AI 2024-06-21 人工智能

618阅读