预训练第9页 - AIGC资讯

Llama模型家族之RLAIF 基于 AI 反馈的强化学习（三） RLAIF 的工作原理

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

大数据 2024-07-02 人工智能

756阅读

文心一言发展历史

文心一言（英文名：ERNIE Bot）的发展历史可以清晰地分为几个阶段，以下将结合参考文章中的相关数字和信息，以分点表示和归纳的形式呈现：一、早期研发历程 ERNIE 1.0的发布：时间：2019年3月16日内容：百度正式发布知识增强...

人工智能 2024-07-01 人工智能

2154阅读

#10 解决Stable Diffusion常见问题和错误

文章目录前言 1. 环境配置错误问题描述解决方案 2. 模型加载失败问题描述解决方案 3. 图像生成质量差问题描述解决方案 4. 生成速度慢问题描述解决方案 5. 内存不足错误问题描述解决方案结论...

人工智能 2024-07-01 人工智能

1512阅读

【Stable Diffusion本地部署简易教程】从入门到实践

Stable Diffusion 本地部署指南：简单易懂的图文教程引言 Stable Diffusion是一种深度学习模型，用于生成高质量的图像。本地部署意味着你可以在自己的计算机上运行这个模型，从而无需依赖于在线服务。本教程将循序渐进地指导你如...

AIGC 2024-07-01 人工智能

2211阅读

详解各种LLM系列｜（5）LLaMA 3模型解析（Meta重磅发布！）

一、引言 Blog链接：https://ai.meta.com/blog/meta-llama-3/ MODEL CARD: https://github.com/meta-llama/llama3/blob/main/MODEL_CARD.md 体...

AIGC 2024-07-01 人工智能

1210阅读

【AI 大模型】大模型应用架构 ( 业务架构 - AI Embedded、AI Copilot、AI Agent | 技术架构 - 提示词、代理 + 函数调用、RAG、Fine-tuning )

文章目录一、大模型技术方向 - 大模型训练 / 大模型应用二、大模型应用 - 业务架构 1、AI Embedded 模式 2、AI Copilot 模式 3、AI Agent 模式三、大模型应用 - 技术架构 1、提示词技术架构...

人工智能 2024-06-30 人工智能

1239阅读

Llama 3大模型学习

基础部分学习： 1、 Llama 3 Web Demo 部署 streamlit run ***.py(网页演示py文件路径） ***(下载好的大模型参数路径注意点：在vscode中要对上面命令产生的External URL的最后四位端口号，在...

大数据 2024-06-30 人工智能

805阅读

AIGC从入门到实战：远近高低各不同：Transformer 和预训练模型是什么？

1. 背景介绍近年来，随着人工智能技术的快速发展，AIGC（人工智能生成内容）已经成为了一个热门的话题。Transformer 和预训练模型是 AIGC 中的两个重要概念，它们对于理解和应用 AIGC 技术具有重要意义。本文将介绍 Transforme...

生成式AI 2024-06-29 人工智能

773阅读

AIGC技术深度剖析：底层原理及其应用

AIGC技术深度剖析：底层原理及其应用引言人工智能生成对话技术（AIGC）是一种能够模拟人类语言表达和生成自然语言响应的技术。它是由AI对话大师调用的聊天生成语言大模型所提供的。本文将深入剖析AIGC技术的底层原理，并探讨它在各个领域的应用。...

大数据 2024-06-28 人工智能

1419阅读

2024年AIGC行业研究：多模态大模型与商业应用_

2024年2月，OpenAI发布其首款视频生成模型Sora，用户仅需输入一段文字即可生成长达一分钟场景切换流畅、细节呈现清晰、情感表达准确的高清视频，与一年前的AI生成视频相比，在各维度均实现了质的提升。这一突破再次将AIGC推向大众视野。AIGC即通过大...

AIGC 2024-06-28 人工智能

770阅读

Meta Llama 3 模型与亚马逊 Bedrock 完美融合，释放无限潜能。如何通过SageMaker来部署和运行推理

文章目录 Meta Llama 3模型现在在亚马逊Bedrock上可用 Llama 3 模型 Llama 3 模型的实际应用什么是 Meta Llama 3 什么是 SageMaker JumpStart 探索型号部署模型运行推理 7...

生成式AI 2024-06-28 人工智能

776阅读

AIGC：开启内容创作新纪元，我们如何看待它的影响与前景？

AIGC的概念 AIGC（Artificial Intelligence Generated Content）的概念主要是指人工智能生成内容。这是一种新的人工智能技术，它利用人工智能模型，根据给定的主题、关键词、格式、风格等条件，自动生成...

人工智能 2024-06-28 人工智能

721阅读

Llama模型家族之拒绝抽样(Rejection Sampling)（二）均匀分布简介

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

人工智能 2024-06-28 人工智能

788阅读

天才程序员周弈帆 | Stable Diffusion 解读（二）：论文精读

本文来源公众号“天才程序员周弈帆”，仅用于学术分享，侵权删，干货满满。原文链接：Stable Diffusion 解读（二）：论文精读【小小题外话】端午安康！在上一篇文章天才程序员周弈帆 | Stable Diffusion 解读（一）：回顾早...

大数据 2024-06-27 人工智能

1040阅读

Llama模型家族训练奖励模型Reward Model技术及代码实战（二）从用户反馈构建比较数据集

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

人工智能 2024-06-27 人工智能

938阅读

半年估值数亿，1000亿美元超级赛道跑出“AI猛兽”

去年，谷歌发布了一份忧心忡忡的内部文件:“虽然谷歌与OpenAI（在大模型上）你追我赶，但双方都没有真正的护城河，因为第三股力量正在崛起——开源社区才是谷歌和OpenAI最大的敌人。” 谷歌的担忧正逐渐变成了现实。马斯克的开源大模型公司xAI近期完成60...

AIGC 2024-06-27 人工智能

776阅读

AIGC专栏11——EasyAnimateV2结构详解与Lora训练最大支持768x768 144帧视频生成

AIGC专栏11——EasyAnimateV2结构详解与Lora训练最大支持768x768 144帧视频生成学习前言源码下载地址 EasyAnimate V2简介技术储备 Diffusion Transformer (DiT Mo...

AIGC 2024-06-27 人工智能

1124阅读

011篇 - AIGC提示词工程 - 提示词生成策略（Prompt Engineering - Prompt Generation Strategies）

大家好，我是元壤教育的张涛，一名知识博主，专注于生成式人工智能（AIGC）各领域的研究与实践。我喜欢用简单的方法，帮助大家轻松掌握AIGC应用技术。我的愿景是通过我的文章和教程，帮助1000万人学好AIGC，用好AIGC。小伙伴们！今天我们要来聊一聊提...

人工智能 2024-06-26 人工智能

817阅读

Stable diffusion 3 正式开源

6月12日晚，著名开源大模型平台Stability AI正式开源了，文生图片模型Stable Diffusion 3 Medium（以下简称“SD3-M”）权重。 SD3-M有20亿参数，平均生成图片时间在2—10秒左右推理效率非常高，同时对硬件的需求...

生成式AI 2024-06-26 人工智能

812阅读

llama factory 是如何加载数据集通过对数据集加载的代码的理解编写自定义数据集训练代码

第一层从训练代码追踪到以下代码 def get_dataset( tokenizer: "PreTrainedTokenizer", model_args: "ModelArguments", data_args: "DataAr...

生成式AI 2024-06-26 人工智能

1848阅读

通义千问2(Qwen2)大语言模型在PAI-QuickStart的微调、评测与部署实践

Qwen2（通义千问2）是阿里云最近推出的开源大型语言模型系列，相比2月推出的Qwen1.5，Qwen2实现了整体性能的代际飞跃，大幅提升了代码、数学、推理、指令遵循、多语言理解等能力。其中，Qwen2系列包含5个尺寸的预训练和指令微调模型，Qwen2-0...

生成式AI 2024-06-26 人工智能

891阅读

Llama模型家族之RLAIF 基于 AI 反馈的强化学习（一）

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

大数据 2024-06-26 人工智能

987阅读

本地运行 Llama 3，可以中文，但不强

Llama 3 简介大家好，上个月 Meta 发布 Llama 3，大模型开源世界又热闹起来了。 Llama 3 提供两个版本（8B 和 70B）： **8B 版本适合在消费级 GPU 上高效部署和开发； 70B 版本则专为大规模 AI...

人工智能 2024-06-26 人工智能

804阅读

重磅发布！Stable Diffusion 3 Medium 终于开源，革新图像生成技术新时代

重磅发布！Stable Diffusion 3 Medium 终于开源，革新图像生成技术新时代关键词：Stable Diffusion 3 Medium, MMDiT, 文本到图像模型, 图像质量, 排版, 复杂提示理解, 资源效率原...

AIGC 2024-06-26 人工智能

755阅读

AIGC从入门到实战：自然语言处理和大语言模型简介

AIGC从入门到实战：自然语言处理和大语言模型简介 1.背景介绍 1.1 人工智能生成内容（AIGC）的兴起人工智能生成内容（AIGC，Artificial Intelligence Generated Content）是近年来人工智能领域的一个重...

人工智能 2024-06-26 人工智能

743阅读

探索和构建 LLaMA 3 架构：深入探讨组件、编码和推理技术（一）

探索和构建 LLaMA 3 架构：深入探讨组件、编码和推理技术（一） Meta 通过推出新的开源 AI 模型 Llama 3 以及新版本的 Meta AI，正在加强其在人工智能 (AI 竞赛中的竞争力。该虚拟助手由 Llama 3 提供支持，现已可在所...

人工智能 2024-06-25 人工智能

919阅读

stable diffusion 1.x 模型训练概述

本文主要介绍sd发展的第一阶段版本的模型架构和一些微调训练方法，后续版本SDXL，LCM 版本再写文章继续介绍 SD 1.x 版本模型结构 autoencoder(VAE ：encoder将图像压缩到latent空间，而decoder将latent解码...

生成式AI 2024-06-25 人工智能

964阅读

Meta Llama 3 文本编码为 token

Meta Llama 3 文本编码为 token flyfish tiktoken 是一个用于 OpenAI 模型的快速 BPE 分词器，这里用在Meta Llama 3上。主要功能包括将文本编码为token，以及将token解码回文本。这个过程通常使...

AIGC 2024-06-25 人工智能

924阅读

一文看懂Llama 2：原理、模型与训练

一文看懂Llama 2：原理、模型与训练 Llama 2是一种大规模语言模型（LLM），由Meta（原Facebook）研发，旨在推动自然语言处理（NLP）领域的发展。本文将详细介绍Llama 2的原理、模型架构及其训练方法，以帮助读者深入理解这一技术...

生成式AI 2024-06-25 人工智能

1127阅读

Llama 3-V：以100倍小的模型和500美元匹敌GPT4-V视觉模型

概述 Llama3 的横空出世震惊了世界，它在几乎所有基准测试中都超越了 GPT-3.5，并在一些方面超越了 GPT-4。随后，GPT-4o 的出现凭借其多模态能力再次夺回了王座。今天，我们发布了一个改变现状的产品：Llama3-V，这是首个基于 Ll...

AIGC 2024-06-25 人工智能

1097阅读

【AI学习】LLaMA 系列模型的进化（一）

一直对LLaMA 名下的各个模型关系搞不清楚，什么羊驼、考拉的，不知所以。幸好看到两篇综述，有个大致了解，以及SEBASTIAN RASCHKA对LLaMa 3的介绍。做一个记录。一、文章《Large Language Models: A Surve...

大数据 2024-06-25 人工智能

940阅读

Llama 3-V: 比GPT4-V小100倍的SOTA

大模型技术论文不断，每个月总会新增上千篇。本专栏精选论文重点解读，主题还是围绕着行业实践和工程量产。若在某个环节出现卡点，可以回到大模型必备腔调重新阅读。而最新科技（Mamba，xLSTM,KAN）则提供了大模型领域最新技术跟踪。若对于如果构建生成级别的A...

人工智能 2024-06-25 人工智能

994阅读

llama系列模型学习

一、目录 llama1 模型与transformer decoder的区别 llama2 模型架构 llama2 相比llama1 不同之处 llama3 相比llama2 不同之处 llama、llama2、llama3 分词器词表大小以及优缺点...

人工智能 2024-06-25 人工智能

1263阅读

重磅！Meta 发布 Llama 3，前所未有的强大功能和多模态能力｜TodayAI

Meta今日宣布推出其最新一代尖端开源大型语言模型Llama 3。该模型预计很快将在多个领先的云服务平台上线，包括AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft A...

生成式AI 2024-06-24 人工智能

911阅读

Stable Diffusion模型训练 — 前菜

图像生成模型原理简析你有没有好奇过，AI图像生成模型是怎么学会“绘画”的吗？人工智能（Artificial Iitelligence）这个概念是在1956年的达特矛斯会议上提出来的认为机器可以模仿人类的学习以及其他方面的智能，后世也将实现人工智能的方式...

AIGC 2024-06-24 人工智能

721阅读

阿里Qwen2正式开源，性能全方位包围Llama-3 | 最新快讯

Qwen 系列会是众多大学实验室新的默认基础模型吗？斯坦福团队套壳清华大模型的事件不断发酵后，中国模型在世界上开始得到了更多关注。不少人发现，原来中国已经有不少成熟的大模型正在赶超国外。 HuggingFace 平台和社区负责人 Omar San...

人工智能 2024-06-24 人工智能

723阅读

LLaMa系列模型详解（原理介绍、代码解读）：LLaMA 2

LLaMA 2 大型语言模型（LLMs）作为高度能力的人工智能助手，在需要跨多个领域专家知识的复杂推理任务中表现出巨大潜力，包括编程和创意写作等专业领域。它们通过直观的聊天界面与人类互动，这导致了快速和广泛的公众采用。考虑到训练方法的看似简单性，LLM...

AIGC 2024-06-24 人工智能

1176阅读

AIGC从入门到实战：基于大模型的人工智能应用的涌现和爆发

1. 背景介绍 1.1 人工智能的新纪元：AIGC 的崛起近年来，人工智能（AI）领域经历了前所未有的发展，其中 AIGC（AI Generated Content，人工智能生成内容）的崛起尤为引人注目。AIGC 借助深度学习模型，能够生成逼真的图像...

生成式AI 2024-06-23 人工智能

862阅读

大模型学习路线（9）——AIGC其它相关技术

前言：博主没力气写了，快被csdn榨干了，这个章节就推几篇系统化的还不错的文章吧......AIGC技术相关的demo可以在HuggingFace、Modelscope、PaddlePaddle等各大社区找到。 AIGC技术和应...

AIGC 2024-06-23 人工智能

922阅读

李宏毅【生成式AI导论 2024】第7讲：大型语言模型修练史 — 第二阶段: 名师指点，发挥潜力 (兼谈对 ChatGPT 做逆向工程与 LLaMA 时代的开始)

如果只有指令微调… 人类老师需要给语言模型准备的教材是长这个样子的。要先想出人类可能会去问语言模型的问题，为每一个问题想一个正确的答案。有问题有答案之后，就可以把这些资料转成语言模型，可以拿来做训练文字接龙的格式。这种使用人类老师准备的资料来学习...

AIGC 2024-06-23 人工智能

733阅读

llama 3 震撼来袭 8B 150k 词元 8Ktoken长度 4T token 参与预训练与对齐训练使用GQA

Meta开发了并发布了Meta Llama 3系列大型语言模型(LLMs ，这是一组在8亿和70亿参数规模下预训练和指令调整的生成文本模型。Llama 3的指令调整模型针对对话用例进行了优化，并在常见的行业基准测试中超越了众多开源聊天模型。在开发这些模型时...

人工智能 2024-06-23 人工智能

928阅读

AI根据文本语义实现AI绘画出图

引言当谈到人工智能（AI）和艺术的结合时，我们经常会想到生成对抗网络（GANs）和图像生成。然而，很少有人了解到AI也可以通过文本语义生成绘画作品。在本文中，我将详细介绍如何使用深度学习和自然语言处理技术，使AI能够根据给定的文本语义生成绘画作品。...

生成式AI 2024-06-23 人工智能

715阅读

每日AIGC最新进展(24)：用于图像质量和审美评估的统一视觉-语言预训练模型UniQA、可控生成图像压缩框架Control-GIC、3D感知扩散模型Ouroboros3D

Diffusion Models专栏文章汇总：入门与实战 UniQA: Unified Vision-Language Pre-training for Image Quality and Aesthetic Assessment 本文提出了一...

人工智能 2024-06-23 人工智能

877阅读

SiliconCloud上新：GLM-4-9B，通用能力超越Llama 3

今天，智谱发布了第四代 GLM 系列开源模型：GLM-4-9B。 GLM-4-9B 系列模型包括：基础版本 GLM-4-9B（8K）、对话版本 GLM-4-9B-Chat（128K）、超长上下文版本 GLM-4-9B-Chat-1M（1M）和多...

AIGC 2024-06-23 人工智能

850阅读

AIGC工具使用心得：提升开发效率的利器

目录 AIGC工具使用心得：提升开发效率的利器引言 AIGC工具是什么？ AIGC工具的功能和优势我的使用心得结论 AIGC工具使用心得：提升开发效率的利器引言随着人工智能的不断发展，我们正在面对越来越多的复杂任务和数据。...

生成式AI 2024-06-22 人工智能

802阅读

重磅！Llama-3，最强开源大模型正式发布！

4月19日，全球科技、社交巨头Meta在官网，正式发布了开源大模型——Llama-3。据悉，Llama-3共有80亿、700亿两种参数，分为基础预训练和指令微调两种模型（还有一个超4000亿参数正在训练中）。与Llama-2相比，Llama-3使用...

AIGC 2024-06-22 人工智能

762阅读

LLaMA-Factory微调多模态大语言模型教程

本文旨在结合笔者自身的实践经历，详细介绍如何使用 LLaMA-Factory 来微调多模态大语言模型。目前仓库已支持若干流行的MLLM比如LLaVA-1.5，Yi-VL，Paligemma等。 2024.5.29 注：本文后续不再更新，如果想了解更新的特...

AIGC 2024-06-21 人工智能

1033阅读

每日AIGC最新进展(27)：用于视频生成的ControlNets Ctrl-Adapter、无缝循环视频生成LoopAnimate、高分辨率大型视觉-语言模型InternLM-XComposer2

Diffusion Models专栏文章汇总：入门与实战 Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusio...

生成式AI 2024-06-21 人工智能

686阅读

【AIGC调研系列】Qwen2与llama3对比的优势

Qwen2与Llama3的对比中，Qwen2展现出了多方面的优势。首先，从性能角度来看，Qwen2在多个基准测试中表现出色，尤其是在代码和数学能力上有显著提升[1][9]。此外，Qwen2还在自然语言理解、知识、多语言等多项能力上均显著超越了Llama3[...

大数据 2024-06-21 人工智能

1769阅读

LLMs：Chinese-LLaMA-Alpaca的简介(扩充中文词表+增量预训练+指令精调)、安装、案例实战应用之详细攻略

LLMs：Chinese-LLaMA-Alpaca的简介(扩充中文词表+增量预训练+指令精调、安装、案例实战应用之详细攻略导读：2023年4月17日，哈工大讯飞联合实验室，本项目开源了中文LLaMA模型和指令精调的Alpaca大模型，以进一步...

人工智能 2024-06-21 人工智能

1052阅读