模型训练第6页 - AIGC资讯

LLMs：Chinese-LLaMA-Alpaca的简介(扩充中文词表+增量预训练+指令精调)、安装、案例实战应用之详细攻略

LLMs：Chinese-LLaMA-Alpaca的简介(扩充中文词表+增量预训练+指令精调、安装、案例实战应用之详细攻略导读：2023年4月17日，哈工大讯飞联合实验室，本项目开源了中文LLaMA模型和指令精调的Alpaca大模型，以进一步...

人工智能 2024-06-21 人工智能

880阅读

AIGC从入门到实战：AIGC 在工业领域的创新场景—合成数据集，助力机器人产品研发

1. 背景介绍随着人工智能技术的不断发展，越来越多的企业开始将其应用于工业领域，以提高生产效率和产品质量。在机器人产品研发中，数据集是非常重要的资源，但是获取真实的数据集往往需要耗费大量的时间和成本。因此，合成数据集成为了一种备受关注的解决方案。合...

生成式AI 2024-06-21 人工智能

729阅读

【推理优化】超详细！AIGC面试系列大模型推理系列(2)

本期问题聚焦于大模型的推理优化技术本期问题快览有哪些常见的大模型推理优化技术介绍下通过流水线处理技术来加速大模型推理方案介绍下并行计算技术来加速大模型推理的方案有哪些通过硬件来加速大模型推理的方式？模型量化是如何加速大模型推理的？...

生成式AI 2024-06-20 人工智能

2222阅读

双排组到一个刀硬嘴甜的小姐姐，打完发现她竟是AI大模型。

永劫无间手游，终于在今天开启二测。这意味着，在本次测试结束后，正式公测就真离我们不远了。不知道差友里面多少人运气好，今天能顺利进入服务器。反正官方的各种评论区下面，那些没抽到资格的玩家，已经有点走火入魔了。而官方（24工作室和网易伏羲实验室）...

AIGC 2024-06-20 人工智能

530阅读

八大中文AI大模型超级评测：表现最佳不是文心一言？

国内第一批通过审核的AI大模型正式上线，首批上线的AI大模型来自八家不同的公司：百度（文心一言）、抖音（云雀大模型）、智谱 AI（GLM 大模型）、中科院（紫东太初大模型）、百川智能（百川大模型）、商汤（日日新大模型）、MiniMax（ABAB 大模型）、...

生成式AI 2024-06-19 人工智能

861阅读

stable diffusion无限贴近真人的调教方法，助力AI变现（下）

对于人像，我的研究重点主要是如何让脸更贴近原图。这篇文章就通过一些专题的实践，讲讲我对还原人脸的一些出图思路、技巧和心得，会从出图思路、优化方向出发，逐步拆解，希望能给大家带来启发。本篇的重点内容有：如何根据一张图像还原人脸？如何使用 stab...

生成式AI 2024-06-19 人工智能

1162阅读

【学习笔记】文生图模型——Stable diffusion3.0

2.0原理才看到VAE，sd3.0就发布了，虽然还没看到源码和详解，但原来的那个小方向估计得弃。人已经麻了。 1.LDMs模型（stable diffusion≈LDMs+CLIP） 2.stable diffusion3.0模型架构图...

生成式AI 2024-06-19 人工智能

923阅读

AI日报：Hedra图转说话视频免费开放；Deepmind发布超牛自动视频配音技术V2A；美图WHEE V2正式上线；开源版Sora可一键生成720p高清视频

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、Hedra的 Characte...

生成式AI 2024-06-19 人工智能

715阅读

ChatGPT等模型疯狂训练，最快2026年消耗尽公开文本数据

AI发展科研机构Epochai在官网发布了一项，关于大模型消耗训练数据的研究报告。目前，人类公开的高质量文本训练数据集大约有300万亿tokens。但随着ChatGPT等模大型的参数、功能越来越强以及过度训练，对训练数据的需求呈指数级增长，预计将在202...

AIGC 2024-06-19 人工智能

871阅读

大模型之路3：趟到了Llama-Factory，大神们请指点

各种AI工具和框架层出不穷，为开发者和研究者提供了前所未有的便利。当然了，也有困扰。尤其是对于动手能力越来越弱的中年油腻老程序员来说，更是难上加难。据说，嗯，据师弟说，说LlamaFactory凭借其独特的功能和优势，在AI领域（他所下载的代码和工具里），...

生成式AI 2024-06-19 人工智能

774阅读

深入浅出完整解析Stable Diffusion XL（SDXL）核心基础知识

原文：深入浅出完整解析Stable Diffusion XL（SDXL）核心基础知识 Rocky的公众号：WeThinkIn Rocky的知乎：Rocky Ding 更多AI行业干货内容欢迎关注Rocky的CSDN、知乎、公众号～码字不易，希望大家...

大数据 2024-06-18 人工智能

3969阅读

机器学习正在突破摩尔定律，Epoch 最新AI发展趋势预测

近日，Epoch AI更新了他们对机器学习远期趋势的研究报告，在计算、数据、硬件、算法、成本等多个维度对人工智能模型趋势进行了深入研究。 Epoch AI是一家研究机构，致力于研究影响人工智能发展轨迹和治理的关键趋势和问题，以造福社会。其报告中的研究结论联...

大数据 2024-06-18 人工智能

684阅读

stable diffusion基本原理

stable diffusion基本原理 ChatGPT Stable Diffusion是一种用于图像生成和编辑的深度学习模型，其基本原理基于扩散模型（diffusion models）。扩散模型是一种生成模型，通过模拟数据从噪声到目标分布的过程...

AIGC 2024-06-18 人工智能

818阅读

Python - 深度学习系列30 - 使用LLaMA-Factory微调模型

说明最实用的一种利用大语言模型的方式是进行微调。预训练模型与我们的使用场景一定会存在一些差异，而我们又不可能重头训练。微调的原理并不复杂，载入模型，灌新的数据，然后运行再训练，保留checkpoints。但是不同项目的代码真的不太一样，每一个都要...

AIGC 2024-06-17 人工智能

1182阅读

手把手教你微调Stable Diffusion

温馨提示关于本文：本文你可以学习到完整的不使用webui借助lora和dreambooth微调Stable Diffusion的全过程。手把手教你微调Stable Diffusion生成优弧，但是半失败版? 关于训练：单卡32GV...

生成式AI 2024-06-17 人工智能

951阅读

【LLM第二篇】stable diffusion扩散模型、名词解释

最近在整理大模型的相关资料，发现了几个名词，不是很懂，这里整理一下： stable diffusion（SD 模型：扩散模型（Diffusion model）的一种，主要用于生成高质量的图像，GAN的替代者，扩散模型通过一些列学习步骤生成数据，逐渐从...

人工智能 2024-06-17 人工智能

947阅读

一文实现Llama 3 图片理解能力微调（XTuner+LLaVA 版）

本次实验基于 Llama3-8B-Instruct 和 XTuner 团队预训练好的 Image Projector 微调自己的多模态图文理解模型 LLaVA。实验平台为InternStudio，实验所用的显存为24G。 =============目录=...

人工智能 2024-06-16 人工智能

1344阅读

【全网瞩目】你想知道的Llama3都在这里

Meta发布了开放式生成人工智能模型 Llama 系列的最新产品： Llama 3。或者更准确地说，该公司首次发布了其新的 Llama 3 系列中的两个模型，其余模型将在未来某个不确定的日期发布。 Meta 称，与上一代 Llama 型号 Llama 2...

人工智能 2024-06-14 人工智能

626阅读

规格拉满！Llama和Sora作者都来刷脸的中国AI春晚，还开源了一大堆大模型成果

本周国内最受关注的AI盛事，今日启幕。活动规格之高，没有哪个关心AI技术发展的人能不为之吸引—— Sora团队负责人Aditya Ramesh与DiT作者谢赛宁同台交流，李开复与张亚勤炉边对话，Llama2/3作者Thomas Scialom，王小川、杨...

AIGC 2024-06-14 人工智能

579阅读

FP6精度单卡运行Llama 70B模型，性能飞跃引领大模型时代

在深度学习领域，模型的运行效率和精度一直是研究者们追求的目标。最近，微软DeepSpeed团队在这一领域取得了突破性进展，他们在没有英伟达官方支持的情况下，成功在NVIDIA A100 GPU上实现了FP6精度的运行，这一成就不仅提升了计算速度，还保持了计...

AIGC 2024-06-12 人工智能

746阅读

一文解读：Stable Diffusion 3究竟厉害在哪里？

知乎原文：叫我Alonzo就好了前言最近一段时间，正当所有人都在为OpenAI发布Sora狂欢时，Stability AI更是推出了Stable Diffusion 3的技术报告。**这两项技术不约而同都采用了Diffusion Transf...

AIGC 2024-06-12 人工智能

996阅读

超详细！AI 绘画神器 Stable Diffusion 基础教程_stable diffusion ai怎么用

HED 边缘检测跟 Canny 类似，但自由发挥程度更高。HED 边界保留了输入图像中的细节，绘制的人物明暗对比明显，轮廓感更强，适合在保持原来构图的基础上对画面风格进行改变时使用。 Scribble 黑白稿提取涂鸦成图，比 HED 和 Ca...

大数据 2024-06-12 人工智能

728阅读

大模型算法(一)：从Transformer到ViT再到LLaMA

单任务/单领域模型深度学习最早的研究集中在针对单个领域或者单个任务设计相应的模型。对于CV计算机视觉领域，最常用的模型是CNN卷积模型。其中针对计算机视觉中的不同具体任务例如分类任务，目标检测任务，图像分割任务，以CNN作为骨干backbone，加...

AIGC 2024-06-11 人工智能

912阅读

对国内AI算力紧缺问题的若干看法

今天凌晨的苹果WWDC证实了一点:AI推理算力将长期处于“云端为主”的状态，这个“长期”至少是三到五年。是的，苹果与OpenAI建立了战略合作，计划将下一代iOS系统与ChatGPT深度融合;但是绝大部分生成式AI推理，包括文字和图片生成任务，仍将上传到C...

AIGC 2024-06-11 人工智能

605阅读

使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion_sagemaker ai绘图(1)

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的...

大数据 2024-06-11 人工智能

582阅读

30岁失业的我，选择职场转型，进入AIGC工程师领域，重新开始

去年，刚满30岁的我又一次被公司辞退了，由于学历不高，简历也不出彩，尽管半个月来投了一份又一份的简历，但仍然是石沉大海，我终于不得不开始思考一个以前被我一直刻意压制的想法——职场转型。尽管知道这条路艰难，几乎是要从零重新开始，但比耗死在之前那几乎看不到...

AIGC 2024-06-11 人工智能

616阅读

Stable Diffusion 之 IP模型训练小白篇——只需4步就可上手

在我们的日常设计工作中，设计师会经常接到3D的设计需求，根据以往的工作模式来看，我们需要在3D软件里面进行建模，渲染再进行输出。这样复杂的工作，会让工作时间变长，影响我们的工作效率。结合如今的AI工具，我们采用AIGC的能力，也许会有不同的解决方案，减少总...

AIGC 2024-06-11 人工智能

585阅读

大模型系列：LLaMA大模型简述和本地部署实践

内容摘要 LLaMA大模型背景介绍 LLaMA网络结构相比Transformer的改进 LLaMA中文化Atom大模型简述在Python中调用HuggingFace LLaMA模型基于text-generation-webui部署LLaMA问答平...

生成式AI 2024-06-10 人工智能

861阅读

AIGC未来展望：AI将如何改变内容创作

AIGC未来展望：AI将如何改变内容创作 1.背景介绍 1.1 内容创作的重要性在当今时代,内容创作无疑已成为一项关键的生产力。无论是营销、教育、娱乐还是其他领域,高质量的内容都是吸引受众、传播信息、实现价值的关键。然而,创作优秀内容需要大量的时间...

大数据 2024-06-10 人工智能

635阅读

20K star！搞定 LLM 微调的开源利器LLaMA Factory

20K star！搞定 LLM 微调的开源利器LLaMA Factory 关于LLM 微调优化型技术计算型技术 LLaMA Factory 是什么使用 LLaMA Factory 模型导出 LLaMA-Factory 结构总结项目...

AIGC 2024-06-10 人工智能

927阅读

【AIGC调研系列】llama3微调具体案例

Llama3的微调可以通过多种方式进行，具体案例包括：使用XTuner进行微调，尝试让Llama3具有"它是SmartFlowAI打造的人工智能助手"的自我认知。这涉及到准备自我认知训练数据集，并通过脚本生成数据[2][8]。利用Unsloth和G...

人工智能 2024-06-09 人工智能

854阅读

AIGC简介：如何利用人工智能进行内容生成

目录一、引言二、AIGC的定义与技术原理 1. 定义说明 2. 关键技术 3. 技术原理三、AIGC的主要应用领域 1. 文本内容生成 2. 图像和视频生成 3. 音频内容的创建 4. 数据分析与报告四、实施AIGC的步骤和方法...

人工智能 2024-06-08 人工智能

625阅读

Stable Diffusion XL之使用Stable Diffusion XL训练自己的AI绘画模型

文章目录一 SDXL训练基本步骤二从0到1上手使用Stable Diffusion XL训练自己的AI绘画模型 2.1 配置训练环境与训练文件 2.2 SDXL训练数据集制作 (1 数据筛选与清洗 (2 使用BLIP自动标注cap...

生成式AI 2024-06-07 人工智能

2127阅读

AI绘画的算法原理：从生成模型到Diffusion

近年来，AI绘画技术引起了广泛关注，让我们深入探讨其背后的技术原理和发展历程。本文将以通俗易懂的方式，介绍AI绘画的核心算法，从生成模型到Diffusion。 1. 计算机如何生成图画？ AI绘画的核心在于生成模型（ge...

AIGC 2024-06-07 人工智能

1084阅读

想要成为AIGC工程师, 却不知从哪里开始学习？近屿全新推出一图看懂！

在这个AI技术飞速发展的时代，在人们常常警惕AI将取代自己的工作的时候，一个另类的说法却悄然流行：“AI不会取代你的工作，会取代你的是掌握了AI技能的人。”这不仅仅是一个警示，更是一个机遇。随着AI工具如ChatGPT、Midjourney、Stable...

人工智能 2024-06-07 人工智能

656阅读

ChatGPT 隐私提示：限制与 OpenAI 共享的数据的两种重要方法

您与ChatGPT的对话有多私密?这是一个很难回答的问题。 OpenAI 表示，除非你明确选择分享，否则没有人可以查看你的聊天记录。不过，该公司确实会存储和维护你的对话历史记录，并承认其内容可用于训练。如果您在使用 ChatGPT 时担心隐私问题，可以采...

大数据 2024-06-07 人工智能

746阅读

RWKV state：享傻瓜式文学大师人生

state 是 RWKV 这类 RNN 大模型特有的状态。微调 RWKV 的初始 state，就相当于最彻底的 prompt tuning 。通过挂载不同的 state 文件，又可以使 RWKV 模型遵循特定的风格进行回答。目前 RWKV 发布了中英文...

生成式AI 2024-06-06 人工智能

579阅读

腾讯混元、北大发现Scaling law「浪涌现象」，解决学习率调参难题

过去十年间，基于随机梯度下降（SGD）的深度学习模型在许多领域都取得了极大的成功。与此同时各式各样的 SGD 替代品也如雨后春笋般涌现。在这些众多替代品中，Adam 及其变种最受追捧。无论是 SGD，还是 Adam，亦或是其他优化器，最核心的超参数非 L...

大数据 2024-06-05 人工智能

575阅读

大模型到底有没有智能？一篇文章给你讲明明白白

生成式人工智能 (GenAI[1] 和大语言模型 (LLM[2] ，这两个词汇想必已在大家的耳边萦绕多时。它们如惊涛骇浪般席卷了整个科技界，登上了各大新闻头条。ChatGPT，这个神奇的对话助手，也许已成为你形影不离的良师益友。然而，在这场方兴未艾的...

人工智能 2024-06-05 人工智能

602阅读

AI训练数据的版权保护：公地的悲剧还是合作的繁荣?

GPT-4o内置声音模仿「寡姐」一案闹的沸沸扬扬，虽然以OpenAI发布声明暂停使用疑似寡姐声音的「SKY」的语音、否认曾侵权声音为阶段性结束。但是，一时间「即便是AI，也得保护人类版权」这一话题甚嚣尘上，更刺激起了人们本来就对AI是否可控这一现代迷思的...

大数据 2024-06-04 人工智能

597阅读

训练Stable Diffusion(XL) Lora的图片是否需要caption？

intro 目前很多风格lora模型的训练都会对图片进行caption，训练风格lora时使用image caption步骤是否能带来正向的效果? 在sdxl的代码实现中，lora插入的位置为unet中cross attention的QKV的线性投影部...

生成式AI 2024-06-04 人工智能

576阅读

昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE 性能强劲成本更低

在大模型技术迅速发展的背景下，昆仑万维公司开源了一个具有里程碑意义的稀疏大型语言模型Skywork-MoE。这个模型不仅在性能上表现出色，而且还大幅降低了推理成本，为应对大规模密集型LLM带来的挑战提供了有效的解决方案。 Skywork-MoE模型特点:...

AIGC 2024-06-04 人工智能

631阅读

一年一款大更新，英伟达AI芯片能打破摩尔定律？

是的，正如黄仁勋在台北电脑展2024展前演讲中所说，生成式AI技术正在不知不觉中影响着我们的生活与工作。而早在2014年就提出CUDA（通用计算平台）概念的英伟达，已经尝到人工智能带给它的甜头。市值从1万亿美元到2.7万亿美元，英伟达仅仅用了一年左右的时...

AIGC 2024-06-04 人工智能

564阅读

大语言模型原理与工程实践：LLaMA 系列

1. 背景介绍 1.1 大型语言模型的兴起近年来，随着深度学习技术的飞速发展，大型语言模型（LLM）逐渐成为人工智能领域的研究热点。LLM 是一种基于深度学习的自然语言处理模型，能够学习大量的文本数据，并根据这些数据生成自然流畅的文本、回答问题、进行...

生成式AI 2024-06-04 人工智能

548阅读

Stable-DiffusionLoRA模型训练教程(新手篇)｜LoRA训练个人经验总结与复盘

上周初次尝试了训练LoRA模型，周末两天的时间一直在遇到问题摸索解决问题，修改完善模型，测试模型当中度过，好在问题都一一解决，也在LiblibAI上首发了我的处女作。??? 本篇文章仅整理归纳我的LoRA训练思路及步骤，以及自己遇到的问题和解决方案的复盘...

人工智能 2024-06-04 人工智能

1293阅读

让大模型发挥更大作用，离不开知识库这个关键要素

在大模型的世界里，有一些黑话，比如“抽卡”和“炼丹”。这些术语听起来轻松有趣，但要让“仙丹”真正发挥作用，背后离不开一个关键要素——知识库。从自然语言处理（NLP）、内容生成到图像识别，大模型在各个领域都展现出了惊人的能力。然而大模型在处理特定领域问...

大数据 2024-06-03 人工智能

559阅读

昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE

2024年6月3日，昆仑万维宣布开源了一个性能强劲的2千亿稀疏大模型，名为 Skywork-MoE。这个模型是在之前开源的 Skywork-13B 模型的基础上扩展而来的，是首个完整应用并落地 MoE Upcycling 技术的开源千亿级 MoE 大模型。...

大数据 2024-06-03 人工智能

543阅读

7B？13B？175B？解读大模型的参数

大模型也是有大有小的，它们的大小靠参数数量来度量。GPT-3就有1750亿个参数，而Grok-1更是不得了，有3140亿个参数。当然，也有像Llama这样身材苗条一点的，参数数量在70亿到700亿之间。这里说的70B可不是指训练数据的数量，而是指模型中...

生成式AI 2024-06-03 人工智能

1160阅读

生成式人工智能(AIGC)，到底对企业、对商业有何影响，我们个体未来如何把握发展机会?

一、中国生成式人工智能行业整体发展现状中国生成式人工智能行业进入爆发式增长阶段，2023年以来各类入局企业近500家，整体产业热度上呈现出“应用层 > 模型层 > 数据层 > 算力层”的发展轨迹。其中，应用层直面下游用户，有望...

大数据 2024-06-03 人工智能

582阅读

时间序列分析的表示学习时代来了？

表示学习作为深度学习中的核心，近期越来越多的被应用到了时间序列领域中，时间序列分析的表示学习时代已经来了。本文为大家带来了2020年以来顶会的5篇时间序列表示学习相关的核心工作梳理。 1.Unsupervised Scalable Representa...

大数据 2024-06-03 人工智能

529阅读