预训练第6页 - AIGC资讯

【AIGC学习】一文带你了解AIGC基础知识（适用于AI入门/小白）

▌导读写关于AI的文章内容已有一段时间，不少同学问博主怎么学习AI？有没有系统性学习AI知识及教程？在这里，锅头整理了AIGC的基础知识和本文学习思维导图，方便提炼重点和学习总结。在过去的几十年中，人工智能（AI）从科幻小说中的异想...

人工智能 2024-08-12 人工智能

1629阅读

怎么使用Stable diffusion中的models

Stable diffusion中的models Stable diffusion model也可以叫做checkpoint model，是预先训练好的Stable diffusion权重，用于生成特定风格的图像。模型生成的图像类型取决于训练图像。...

大数据 2024-08-11 人工智能

646阅读

Datawhale X 魔搭 AI夏令营第四期魔搭-AIGC文生图方向Task1笔记

（赛题链接：可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛）（学习链接：‌‍‍‬⁠‍‬‌‌‌⁠‌‍‬‬‬‬‍⁠‍从零入门AI生图原理&实践）速通指南 ...

AIGC 2024-08-11 人工智能

535阅读

【AIGC】文心一言大模型使用教程：从入门到精通

引言文心一言，作为百度强大的自然语言处理大模型，凭借其深厚的语言理解和生成能力，在文本创作、问答系统、智能客服等多个领域展现出巨大的潜力。本教程旨在帮助初学者及进阶用户全面了解文心一言大模型，掌握其调用方法、使用技巧，并通过实际案例提升使用效率。一...

AIGC 2024-08-10 人工智能

1013阅读

Datawhale AI夏令营第四期魔搭-AIGC方向 task01笔记

目录赛题内容可图Kolors-LoRA风格故事挑战赛 baseline要点讲解(请配合Datawhale速通教程食用 Step1 设置算例及比赛账号的报名和授权 Step2 进行赛事报名并创建PAI实例 Step3 执行basel...

大数据 2024-08-10 人工智能

521阅读

阿里开源新语音模型，比OpenAI的Whisper更好！

阿里巴巴在Qwen-Audio基础之上，开源了最新语音模型Qwen2-Audio。 Qwen2-Audio一共有基础和指令微调两个版本，支持使用语音向音频模型进行提问并识别内容以及语音分析。例如，让一位女生说一段话，然后识别她的年纪或解读她的心情;发布一...

人工智能 2024-08-10 人工智能

1000阅读

LLaMA-Factory

文章目录一、关于 LLaMA-Factory 项目特色性能指标二、如何使用 1、安装 LLaMA Factory 2、数据准备 3、快速开始 4、LLaMA Board 可视化微调 5、构建 Docker CUDA 用户：昇腾...

人工智能 2024-08-10 人工智能

1536阅读

GPT-4o模仿人类声音，诡异尖叫引OpenAI研究员恐慌！32页技术报告出炉

【新智元导读】五颗草莓到底指什么?盼了一天一夜，OpenAI只发来一份32页安全报告。报告揭露:在少数情况下，GPT-4o会模仿你的声音说话，或者忽然大叫起来……事情变得有趣了。昨天奥特曼率众人搞了一波「草莓暗示」的大阵仗，全网都在翘首以盼OpenAI的...

AIGC 2024-08-09 人工智能

576阅读

从LLaMa 3 技术报告，再看LLM构建过程 ——《带你自学大语言模型》系列（番外）

本系列目录《带你自学大语言模型》系列部分目录及计划，完整版目录见：带你自学大语言模型系列 —— 前言第一部分走进大语言模型（科普向）第一章走进大语言模型 1.1 从图灵机到GPT，人工智能经历了什么？——《带你自学大语言模型...

人工智能 2024-08-09 人工智能

947阅读

阿里开源新模型：超GPT-4o，数学能力全球第一！

阿里巴巴开源了最新数学模型Qwen2-Math，一共有基础和指令微调两种版本，包括1.5B、7B和72B三种参数。根据阿里在主流数学基准测试显示，Qwen2-Math-72B指令微调版本的性能超过了GPT-4o、Cloude-3.5-Sonnet、Gem...

AIGC 2024-08-09 人工智能

571阅读

【人工智能AIGC技术开发】3.浅谈大话人工智能AIGC：几种AIGC底层技术的代码详解

为了更好地理解AIGC（AI Generated Content，人工智能生成内容）的底层技术，我们将详细介绍几种关键技术。这些技术包括深度学习、生成对抗网络（GANs）、变分自编码器（VAEs）和自回归模型（如Transformer和GPT）。 1....

人工智能 2024-08-09 人工智能

692阅读

谷歌发布大模型数据筛选方法：效率提升13倍，算力降低10倍

随着GPT-4o、Gemini等多模态大模型的出现，对训练数据的需求呈指数级上升。无论是自然语言文本理解、计算机视觉还是语音识别，使用精心标注的数据集能带来显著的性能提升，同时大幅减少所需的训练数据量。但目前多数模型的数据处理流程严重依赖于人工筛选，不仅...

AIGC 2024-08-08 人工智能

699阅读

阿里国际推出首个专业版AI Search，为什么它会是下一个B2B谷歌？

经历过「千模大战」的喧嚣，一年半之后，生成式 AI 的应用层创新终于步入爆发期。年初的 Sora 激起一阵 AI + 视频生成的浪潮。涟漪未散，OpenAI 新的 SearchGPT 又燃起了 AI + 搜索的战火。 AI + 搜索，这其实是生成式 AI...

人工智能 2024-08-07 人工智能

614阅读

揭秘LoRA：利用深度学习原理在Stable Diffusion中打造完美图像生成的秘密武器

文章目录引言 LoRA的原理 LoRA在角色生成中的应用 LoRA在风格生成中的应用 LoRA在概念生成中的应用 LoRA在服装生成中的应用 LoRA在物体生成中的应用结论引言在生成式人工智能领域，图像生成模型如Sta...

大数据 2024-08-07 人工智能

677阅读

AIGC核心剖析：NLP与生成模型的协同作用

目录 AIGC核心剖析：NLP与生成模型的协同作用 NLP的基础与挑战生成模型的强大能力 NLP与生成模型的协同作用 1. 机器翻译 2. 文本摘要 3. 对话系统结论 AIGC核心剖析：NLP与生成模型的协同作用在人工智能...

大数据 2024-08-07 人工智能

578阅读

AI绘画；（Stable Diffusion进阶篇：模型训练）

前言在上一篇笔记中学习了解了一部分关于Stable Diffusion的运行原理，今天就来接着学习下Stable Diffusion关于微调训练方面的知识点。今天没多少废话，因为我下午要去玩PTCG！让我们冲冲冲整理和输出教程属实不易，觉得这...

大数据 2024-08-06 人工智能

692阅读

最强大模型 Llama 3.1-405B 架构设计剖析

—1— 最强大模型 Llama 3.1-405B 简介在历经了两天的提前“泄露风波”后，Llama 3.1 终于正式揭开面纱，由官方对外公布。新版 Llama 3.1 将其上下文处理能力扩展至 128K，推出了 8B、70B 及 405B 三个不...

人工智能 2024-08-05 人工智能

946阅读

李沐团队发布Higgs-Llama-3-70B，角色扮演专用模型

前言近年来，大语言模型（LLM）在各个领域都展现出强大的能力，尤其是其在对话、写作、代码生成等方面的应用越来越广泛。然而，想要让 LLM 真正地融入人类社会，扮演各种角色，还需要具备更强大的角色扮演能力。为了解决这一问题，李沐团队（Boson AI...

AIGC 2024-08-05 人工智能

775阅读

The Llama 3 Herd of Models.Llama 3 模型第1,2,3部分全文

现代人工智能(AI 系统是由基础模型驱动的。本文提出了一套新的基础模型，称为Llama 3。它是一组语言模型，支持多语言、编码、推理和工具使用。我们最大的模型是一个密集的Transformer，具有405B个参数和多达128K个tokens...

大数据 2024-08-04 人工智能

613阅读

Llama 3.1超大405B！AI巨浪再掀新高潮

前沿科技速递? Meta公司宣布开放的Llama 3.1系列模型，以其惊人的128K上下文长度、对八种语言的支持以及业界领先的405B开放式最前沿AI模型，瞬间吸引了全球科技界的目光。该系列模型不仅在通用知识、可控性、数学、工具使用和多语言翻译等方面表...

人工智能 2024-08-04 人工智能

529阅读

AIGC Kolors可图IP-Adapter-Plus风格参考模型使用案例

参考： https://huggingface.co/Kwai-Kolors/Kolors-IP-Adapter-Plus 代码环境安装： git clone https://github.com/Kwai-Kolors/Kolors cd Kolor...

人工智能 2024-08-04 人工智能

751阅读

LLM大语言模型-ChatGPT、LLaMA、ChatGLM、文心一言、通义千问

LLM大语言模型-ChatGPT、LLaMA、ChatGLM、文心一言、通义千问一、LLM与PLM主要区别： LLM表现出PLM所没有的Emergent Abilities（涌现能力）,这些能力是LLM在复杂任务上表现惊人的关键，使得得人工智能算...

人工智能 2024-08-03 人工智能

951阅读

Gaussian Splatting+Stable Diffusion进行3D场景编辑！腾讯提出TIP-Editor新框架！

Gaussian Splatting+Stable Diffusion进行3D场景编辑！腾讯提出TIP-Editor新框架！原创小源数源AI 2024-01-29 20:19 浙江数源AI 知识星球数源AI论文推荐知识星球（每日最新论文及资...

大数据 2024-08-03 人工智能

683阅读

LLaMA-Factory：手把手教你从零微调大模型！

引言随着人工智能技术的飞速发展，大型语言模型（LLM）在自然语言处理（NLP）领域扮演着越来越重要的角色。然而，预训练的模型往往需要针对特定任务进行微调，以提高其在特定领域的性能。LLaMA-Factory作为一个高效、易用的微调工具，为广大开发者提...

生成式AI 2024-08-02 人工智能

812阅读

AIGC——ControlNet模型的原理

简介 ControlNet旨在控制预训练的大型扩散模型，以支持额外的输入条件。ControlNet能够以端到端的方式学习特定任务的条件，即使在训练数据集很小的情况下（<50k），也能保持稳健性。此外，训练ControlNet的速度与微调扩散模型一...

人工智能 2024-08-02 人工智能

764阅读

Stable Diffusion的常用命令行介绍及示例

Stable Diffusion是一种基于扩散模型的深度学习技术，它特别适用于生成高质量的图像。通过命令行操作，用户可以灵活配置Stable Diffusion模型，以满足不同的图像生成需求。本文将详细介绍Stable Diffusion的常用命令行参数，...

AIGC 2024-08-02 人工智能

955阅读

【AI学习】LLaMA 系列模型的进化（二）

在前面LLaMA 系列模型的进化（一）中学习了LLama模型的总体进化发展，再来看看其中涉及的一些重要技术。 PreLayerNorm Layer Norm有Pre-LN和Post-LN两种。Layer Normalization（LN）在Trans...

大数据 2024-08-01 人工智能

1020阅读

大模型行业，根本没有什么“真”开源？

最近一段时间开源大模型市场非常热闹，先是苹果开源了 70 亿参数小模型DCLM，然后是重量级的Meta的Llama 3.1 和Mistral Large2 相继开源，在多项基准测试中Llama 3. 1 超过了闭源SOTA模型。不过开源派和闭源派之间的争...

人工智能 2024-08-01 人工智能

572阅读

Llama 3.1要来啦？！测试性能战胜GPT-4o

哎呀，Meta声称将于今晚发布的Llama 3.1，数小时前就在Hugging Face上泄露出来了？泄露的人很有可能是Meta员工？还是先来看泄露出来的llama3.1吧。新的Llama 3.1模型包括8B、70B、405B三个版本。而经...

人工智能 2024-08-01 人工智能

546阅读

击败GPT-4o的开源模型如何炼成？关于Llama 3.1 405B，Meta都写在这篇论文里了

经历了提前两天的「意外泄露」之后，Llama 3.1 终于在昨夜由官方正式发布了。 Llama 3.1 将上下文长度扩展到了 128K，拥有 8B、70B 和 405B 三个版本，再次以一已之力抬高了大模型赛道的竞争标准。对 AI 社区来说，...

大数据 2024-08-01 人工智能

481阅读

【扩散模型】LCM LoRA:一个通用的Stable Diffusion加速模块

潜在一致性模型：[2310.04378] Latent Consistency Models: Synthesizing High-Resolution Images with Few-Step Inference (arxiv.org 原文：Pape...

生成式AI 2024-08-01 人工智能

1220阅读

【07】LLaMA-Factory微调大模型——微调模型导出与微调参数分析

上文介绍了如何对微调后的模型进行使用与简单评估。本文将介绍对微调后的模型进行导出的过程。一、llama-3微调后的模型导出首先进入虚拟环境，打开LLaMA-Factory的webui页面 conda activate GLM cd LLaMA-F...

生成式AI 2024-07-31 人工智能

1309阅读

AIGC助力ResNet分类任务：跃升10个百分点

目录 AIGC?缓解数据稀缺问题❓ 论文研究的动机✏️ 作者是怎么做的❓ 实验配置? 实验结果? 结论✅ 实践? 要增强的裂缝图片按照论文中的参数在stable-diffusionv1-5上进行textual inversion微调...

生成式AI 2024-07-31 人工智能

550阅读

苹果AI震撼上线iPhone，进化版Siri却没有ChatGPT！47页技术报告揭秘自研模型

【新智元导读】今早，所有开发者们被突如其来iOS18.1测试版砸晕了!没想到，苹果AI这就可以上手尝鲜了，一大波测评刷屏全网。更惊喜的是，苹果AI背后的基础模型47页技术报告，也一并上线了。一大早，人们期待已久的「苹果AI」首个预览版，正式向开发者们推送...

人工智能 2024-07-30 人工智能

643阅读

不是NVIDIA！苹果官宣AI模型训练用的谷歌芯片

快科技7月30日消息，苹果公司在其技术论文中透露，其人工智能系统Apple Intelligence所依赖的模型并非基于NVIDIA芯片，而是在谷歌设计的云端芯片上进行预训练的。 NVIDIA的GPU一直以高价位和高需求著称，是许多大型科技公司AI训练的首...

人工智能 2024-07-30 人工智能

512阅读

我国发布首个亿级参数量地震波大模型：名为“谛听”

快科技7月29日消息，据成都科技局官方公众号介绍，日前谛听”地震波大模型在四川成都发布。谛听”由国家超级计算成都中心、中国地震局地球物理研究所以及清华大学联合开发，是首个亿级参数量的地震波大模型。同时，谛听”也是目前国内外最大规模、样本类型和标注最为全...

大数据 2024-07-30 人工智能

561阅读

LLaMA-MoE：基于参数复用的混合专家模型构建方法探索

自Mixtral以来，大家对混合专家模型（Mixture-of-Experts，MoE）的关注越来越高。然而从零训练MoE模型的成本极大，需要耗费海量的计算资源。为此，我们探索了一种基于参数复用的MoE快速构建方法。该方法首先将LLaMA...

人工智能 2024-07-30 人工智能

537阅读

常见的文心一言的指令

文心一言，作为百度研发的预训练语言模型“ERNIE 3.0”的一项功能，能够与人对话互动，回答问题，协助创作，高效便捷地帮助人们获取信息、知识和灵感。以下是一些常见的文心一言指令类型及其具体示例： 1. 查询类指令知识问答：用于获取特定领域的知...

AIGC 2024-07-30 人工智能

769阅读

一文速览Llama 3.1——对其92页paper的全面细致解读：涵盖语言、视觉、语音的架构、原理

前言按我原本的计划，我是依次写这些文章：解读mamba2、解读open-television、我司7方面review微调gemma2，再接下来是TTT、nature审稿微调、序列并行、Flash Attention3.. 然TTT还没写完，7.23日...

人工智能 2024-07-29 人工智能

822阅读

AIGC生成式人工智能

AIGC生成式人工智能什么是生成式AI，什么是AIGC？今天我们来详细的认识一下：生成式人工智能AIGC（Artificial Intelligence Generated Content）是人工智能1.0时代进入2.0时代的重要标志。...

人工智能 2024-07-29 人工智能

762阅读

Llama 对决 GPT：AI 开源拐点已至?｜智者访谈

Meta 发布 Llama3.1405B，开放权重大模型的性能表现首次与业内顶级封闭大模型比肩，AI 行业似乎正走向一个关键的分叉点。扎克伯格亲自撰文，坚定表明「开源 AI 即未来」，再次将开源与封闭的争论推向舞台中央。回望过去，OpenAI 从开源到封...

AIGC 2024-07-29 人工智能

562阅读

【AIGC】Llama-3 官方技术报告

Llama-3 技术报告（中文翻译）欢迎关注【youcans的AGI学习笔记】原创作品 0. 简介现代人工智能（AI）系统的核心驱动力来自于基础模型。本文介绍了一组新的基础模型，称为 Llama 3。它是一个语言模型系列，原生支持多语言...

大数据 2024-07-29 人工智能

1026阅读

Stable Diffusion系列（六）：原理剖析——从文字到图片的神奇魔法（潜空间篇）

文章目录 LDM 概述原理模型架构自编码器模型扩散模型条件引导模型图像生成过程实验结果指标定义 IS（越大越好） FID（越小越好）训练成本与采样质量分析不带条件的图片生成基于文本的图片生成基于语义框的图片生...

生成式AI 2024-07-29 人工智能

1054阅读

AIGC学习笔记—LLM（前言）

大语言模型本身我不是很了解，但是掌握一些基础的知识点，由于要准备某个公司的二面，所以浅学一下这个技术，也是边摸索边学习...... 首先，我先简单的解释一下大模型，大模型是指具有大规模参数和复杂计算结构的机器学习模型，通常由深度神经网络构建而成，拥有数十...

生成式AI 2024-07-28 人工智能

522阅读

hunyuandit_pytorch AIGC 以文生图模型

HunyuanDiT 论文 Hunyuan-DiT : A Powerful Multi-Resolution Diffusion Transformer with Fine-Grained Chinese Understanding https:/...

AIGC 2024-07-28 人工智能

633阅读

AI绘画软件Stable Diffusion的Lora模型详解与使用教程

一、引言在AI绘画领域，Stable Diffusion作为一种强大的文本到图像的生成模型，已经吸引了众多艺术家和爱好者的关注。而Lora（Low-Rank Adaptation）模型作为Stable Diffusion的一个重要扩展，进一步提升了模...

大数据 2024-07-27 人工智能

1339阅读

LLama 405B 技术报告解读

LLama 405B 技术报告解读果然传的消息都是真的，meta在24号凌晨发布了llama 3的405B版本，这次还是做一个技术报告解读。值得一提的是，在技术报告的开头，meta特意强调了一个 Managing complexity，大意是管控...

生成式AI 2024-07-27 人工智能

672阅读

开源语音转文本 Speech-to-Text 大模型实战之Whisper篇

前言随着深度学习技术的不断发展，语音转文本（Speech-to-Text，STT）技术取得了显著的进步。开源社区涌现了许多高效的STT大模型，为开发者提供了强大的工具。本文将以OpenAI推出的Whisper模型为例，详细介绍如何使用该模型进行语音转文...

人工智能 2024-07-27 人工智能

1330阅读

每日AIGC最新进展(36)：以色列Lightricks提出视频中眼镜擦除技术V-LASIK、史蒂文斯理工学院提出实时交互式数字头像框架RITA、清华大学提出神经残差扩散模型Neural-RDM

Diffusion Models专栏文章汇总：入门与实战 V-LASIK: Consistent Glasses-Removal from Videos Using Synthetic Data 本文介绍了一种名为V-LASIK的视频编辑技术，...

大数据 2024-07-27 人工智能

569阅读

LoRA6~Stable Diffusion

这里说LoRA 在 Stable Diffusion 中的三种应用 LoRA 是当今深度学习领域中常见的技术。对于 SD，LoRA 则是能够编辑单幅图片、调整整体画风，或者是通过修改训练目标来实现更强大的功能。LoRA 的原理非常简单，它其实就是用两个参...

人工智能 2024-07-26 人工智能

623阅读