预训练第11页 - AIGC资讯

大模型系列：LLaMA大模型简述和本地部署实践

内容摘要 LLaMA大模型背景介绍 LLaMA网络结构相比Transformer的改进 LLaMA中文化Atom大模型简述在Python中调用HuggingFace LLaMA模型基于text-generation-webui部署LLaMA问答平...

生成式AI 2024-06-10 人工智能

1198阅读

AIGC你了解多少呢？

AIGC全面介绍一、引言随着人工智能技术的飞速发展，AIGC（Artificial Intelligence Generated Content）作为生成式人工智能的重要分支，正在逐渐改变我们的生产、生活和工作方式。AIGC是人工智能1.0时代进入...

大数据 2024-06-10 人工智能

804阅读

【大模型】LLaMA-1 模型介绍

文章目录一、背景介绍二、模型介绍 2.1 模型结构 2.2 模型超参数 2.3 SwiGLU 三、代码分析 3.1 模型结构代码 3.2 FairScale库介绍四、LLaMA家族模型 4.1 Alpaca 4.2 Vicuna...

AIGC 2024-06-10 人工智能

1110阅读

Stable Diffusion教程：从入门到精通

Stable Diffusion是一种基于深度学习的图像生成技术，能够生成高质量的图像，广泛应用于艺术创作、广告设计和游戏开发等领域。本教程将详细介绍Stable Diffusion的基础知识、安装和配置方法，以及如何使用它进行图像生成。 1. 什么...

生成式AI 2024-06-10 人工智能

1730阅读

20K star！搞定 LLM 微调的开源利器LLaMA Factory

20K star！搞定 LLM 微调的开源利器LLaMA Factory 关于LLM 微调优化型技术计算型技术 LLaMA Factory 是什么使用 LLaMA Factory 模型导出 LLaMA-Factory 结构总结项目...

AIGC 2024-06-10 人工智能

1173阅读

Stable Diffusion本地部署教程：搭建你的AI图像生成环境

引言 Stable Diffusion作为一种先进的AI图像生成技术，近年来受到了广泛关注。它可以根据用户输入的文本描述，生成与之相符的详细图像。本文将指导你如何在本地环境中部署Stable Diffusion，让你能够亲自体验这一技术的强大功能。环...

AIGC 2024-06-10 人工智能

2469阅读

自然语言处理（NLP）技术在AIGC中的突破

本文收录于专栏：精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践...

生成式AI 2024-06-10 人工智能

1014阅读

RAFT：引领 Llama 在 RAG 中发展

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同...

生成式AI 2024-06-10 人工智能

870阅读

Stable Diffusion详细教程

目录 ?引言 ?Stable Diffusion基本概念 ?潜在扩散模型 ?图像生成原理 ?Stable Diffusion安装部署 ?环境要求 ?安装步骤 ?Stable Diffusion阶段 ?准备阶段 ?训练阶段 ?评估阶...

人工智能 2024-06-10 人工智能

755阅读

快速入门大模型技术与应用，推荐你从Stable Diffusion开始学起

ChatGPT狂飙160天，世界已经不是之前的样子。新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站https://ai.hzytsoft.cn/ 更多资源欢迎关注世界是变化的，分子是...

大数据 2024-06-09 人工智能

987阅读

Llama 3“智商”测试：英文提示表现亮眼，中文不完美但差强人意！

大家好，我是木易，一个持续关注AI领域的互联网技术产品经理，国内Top2本科，美国Top10 CS研究生，MBA。我坚信AI是普通人变强的“外挂”，所以创建了“AI信息Gap”这个公众号，专注于分享AI全维度知识，包括但不限于AI科普，AI工具测评，AI效...

AIGC 2024-06-09 人工智能

1170阅读

Llama模型家族训练奖励模型Reward Model技术及代码实战（三）使用 TRL 训练奖励模型

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

生成式AI 2024-06-09 人工智能

1331阅读

Stable Diffusion EDM Sampler详细解释

EDM (Euler Discretization with Momentum ： EDM代表了欧拉离散化并带有动量的方法，它通常是对连续时间扩散过程进行数值积分的一种变体，通过引入动量项来改进收敛性和稳定性。在 EDMSam...

生成式AI 2024-06-09 人工智能

1423阅读

有趣的大模型之我见 | Llama AI Model

Llama 开源吗？我在写《有趣的大模型之我见 | Mistral 7B 和 Mixtral 8x7B》时曾犹豫，在开源这个事儿上，到底哪个大模型算鼻祖？2023 年 7 月 18 日，Meta 推出了最受欢迎的大型语言模型（LLM）的第二个版本-Ll...

大数据 2024-06-09 人工智能

1104阅读

Llama模型家族之使用 Supervised Fine-Tuning（SFT）微调预训练Llama 3 语言模型（十）使用 LoRA 微调常见问题答疑

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

生成式AI 2024-06-09 人工智能

1087阅读

Stable Diffusion中的embedding

Stable Diffusion中的embedding 嵌入，也称为文本反转，是在 Stable Diffusion 中控制图像样式的另一种方法。在这篇文章中，我们将学习什么是嵌入，在哪里可以找到它们，以及如何使用它们。什么是嵌入embeddin...

人工智能 2024-06-08 人工智能

797阅读

Stable Diffusion使用ControlNet:IP-Adapter实现图片风格迁移

IP-Adapter 全称是 Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models（文本到图像扩散模型的文本兼容图像提示适配器），是腾讯研究院出品的一个新的Contr...

大数据 2024-06-08 人工智能

1241阅读

最强开源大模型Llama 3发布！最大版本是4000亿参数规模！性能直逼GPT-4！

最强开源大模型Llama 3发布！最大版本是4000亿参数规模！性能直逼GPT-4！当地时间4月18日，Meta 官宣发布其最新开源大模型 Llama 3。目前，Llama 3 已经开放了 80亿和 700亿两个小参数版本，上下文窗口为8K。未来...

大数据 2024-06-08 人工智能

1239阅读

Stable Diffusion 模型演进：LDM、SD 1.0, 1.5, 2.0、SDXL、SDXL-Turbo 等

节前，我们星球组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学。针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。合集：持续火爆！！...

生成式AI 2024-06-08 人工智能

1212阅读

想要成为AIGC工程师, 却不知从哪里开始学习？近屿全新推出一图看懂！

在这个AI技术飞速发展的时代，在人们常常警惕AI将取代自己的工作的时候，一个另类的说法却悄然流行：“AI不会取代你的工作，会取代你的是掌握了AI技能的人。”这不仅仅是一个警示，更是一个机遇。随着AI工具如ChatGPT、Midjourney、Stable...

人工智能 2024-06-07 人工智能

881阅读

深度学习突破：LLaMA-MoE模型的高效训练策略

在人工智能领域，大模型（LLM）的崛起带来了前所未有的进步，但随之而来的是巨大的计算资源需求。为了解决这一问题，Mixture-of-Expert（MoE）模型架构应运而生，而LLaMA-MoE正是这一架构下的重要代表。 LLaMA-MoE是一种基于...

人工智能 2024-06-07 人工智能

856阅读

Stable Diffusion的本地部署、训练和使用

1.环境信息显卡：NVIDIA GeForce RTX 3060 Laptop GPU 系统：Windows 11 CUDA版本：11.6 Python.exe版本：3.10.6 GPU挂载运行 2.实验内容 2.1 本地部署...

大数据 2024-06-07 人工智能

966阅读

一文讲清楚，AI、AGI、AIGC与AIGC、NLP、LLM，ChatGPT等概念

前言随着chatgpt3.5的横空出试，大模型爆火，这个风暴传递到了各行各业。各类公众号、帖子，也涌现出了各种概念，AI、大模型、LLM、AI、AIGC、AGI、GPT、ChatGPT等等。总觉得被这些概念搞得头晕。我花了点时间，梳理了下...

大数据 2024-06-07 人工智能

1199阅读

Llama模型家族训练奖励模型Reward Model技术及代码实战（一）

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

AIGC 2024-06-07 人工智能

942阅读

AIGC-常见图像质量评估MSE、PSNR、SSIM、LPIPS、FID、CSFD，余弦相似度----理论＋代码

持续更新和补充中…多多交流！参考:图像评价指标PNSR和SSIM函数 structural_similarity图片相似度计算方法总结 MSE和PSNR MSE:...

大数据 2024-06-07 人工智能

2000阅读

首次证实白盒Transformer可扩展性！马毅教授CRATE-α：鲸吞14亿数据，性能稳步提升

在过去的几年里，Transformer架构在自然语言处理（NLP）、图像处理和视觉计算领域的深度表征学习中取得了显著的成就，几乎成为了AI领域的主导技术。然而，虽然Transformer架构及其众多变体在实践中取得了巨大成功，但其设计大多是基于经验的，...

人工智能 2024-06-06 人工智能

745阅读

Github万星！北航发布零代码大模型微调平台LlamaFactory

在人工智能领域，大语言模型（LLMs）已成为推动技术进步的关键力量。它们在理解和生成自然语言方面展现出了卓越的能力，从而在问答系统、机器翻译、信息提取等多样化任务中发挥着重要作用。然而，要将这些模型适配到特定的下游任务中，通常需要进行微调（fine-tun...

人工智能 2024-06-06 人工智能

1117阅读

清华大学与智谱AI重磅开源 GLM-4：掀起自然语言处理新革命

自 2023 年 3 月 14 日开源 ChatGLM-6B 以来，GLM 系列模型受到了广泛的关注和认可。特别是在 ChatGLM3-6B 开源之后，开发者对智谱 AI 推出的第四代模型充满了期待。而这一期待，随着 GLM-4-9B 的发布，终于得到了...

大数据 2024-06-06 人工智能

1083阅读

LightGBM实战+随机搜索调参：准确率96.67%

大家好，我是Peter~ 今天给大家分享一下树模型的经典算法：LightGBM，介绍算法产生的背景、原理和特点，最后提供一个基于LightGBM和随机搜索调优的案例。 LightGBM算法在机器学习领域，梯度提升机（Gradient Boosting...

大数据 2024-06-06 人工智能

1074阅读

LLM | Yuan 2.0-M32：带注意力路由的专家混合模型

图片一、结论写在前面 Yuan 2.0-M32，其基础架构与Yuan-2.0 2B相似，采用了一个包含32位专家的专家混合架构，其中2位专家处于活跃状态。提出并采用了一种新的路由网络——注意力路由器，以更高效地选择专家，相比采用经典路由网络的模型，其准...

人工智能 2024-06-06 人工智能

922阅读

别再说国产大模型技术突破要靠 Llama 3 开源了

近日，千呼万唤之下，Meta终于发布了开源大模型Llama 3的 8B 和 70B 版本，再次震动 AI 圈。 Meta 表示，Llama 3 已经在多种行业基准测试上展现了最先进的性能，提供了包括改进的推理能力在内的新功能，是目前市场上最好的开源大模型...

生成式AI 2024-06-06 人工智能

807阅读

智谱AI Open Day：升级清言App、发布GLM-4开源模型、新一代MaaS平台，大模型商业化迎来“下一站”

“描绘宏大未来愿景的同时让更多人切身体会到大模型的强大能力，让大模型技术从炫酷的天空当中真正落到地面上、落到实处，是每一个大模型公司必须思考的问题。”——智谱 AI CEO 张鹏 6月5日，智谱AI Open Day在UCCA Lab北京艺术空间举办。...

生成式AI 2024-06-06 人工智能

901阅读

重磅 Llama-3最强开源大模型惊艳亮相

重磅！Llama-3，最强开源大模型正式发布！     202年4 月 19 日，Meta 发布开源大模型 Llama-3，助力研究人员和开发者推进语言 AI 的界限。强大的语言模型Llama-3推出，拥有80亿...

人工智能 2024-06-05 人工智能

1192阅读

CLIP当RNN用入选CVPR：无需训练即可分割无数概念｜牛津大学&谷歌研究院

循环调用CLIP，无需额外训练就有效分割无数概念。包括电影动漫人物，地标，品牌，和普通类别在内的任意短语。牛津大学与谷歌研究院联合团队的这项新成果，已被CVPR 2024接收，并开源了代码。团队提出名为CLIP as RNN（简称CaR）的新技...

大数据 2024-06-05 人工智能

859阅读

利用 NVIDIA Riva 快速部署企业级中文语音 AI 服务并进行优化加速

一、Riva 概览 1. Overview Riva 是 NVIDIA 推出的一款 SDK，用于实时的 Speech AI 服务。它是一个高度可定制的工具，并且使用 GPU 进行加速。NGC 上提供了很多预训练好的模型，这些模型开箱即用，可以直接使用...

大数据 2024-06-05 人工智能

1000阅读

LLMs之llama3-from-scratch：llama3-from-scratch(从头开始利用pytorch来实现并解读LLaMA-3模型的每层代码)的简介、核心思路梳理

LLMs之llama3-from-scratch：llama3-from-scratch(从头开始利用pytorch来实现并解读LLaMA-3模型的每层代码的简介、核心思路梳理导读：这篇论文实现了transformer网络的llama3模型...

AIGC 2024-06-05 人工智能

2174阅读

RAG 架构如何克服 LLM 的局限性

检索增强生成促进了 LLM 和实时 AI 环境的彻底改造，以产生更好、更准确的搜索结果。译自How RAG Architecture Overcomes LLM Limitations，作者 Naren Narendran。在本系列的第一部分中，我重...

生成式AI 2024-06-05 人工智能

847阅读

文心一言：百度AI大语言模型的崛起

文心一言：百度AI大语言模型的崛起 1. 背景介绍 1.1 人工智能的发展历程人工智能(Artificial Intelligence, AI 是当代科技发展的重要领域,自20世纪50年代诞生以来,已经经历了几个重要的发展阶段。早期的人工智能系统主...

生成式AI 2024-06-05 人工智能

899阅读

智谱AI宣布开源 GLM 第四代模型 GLM-4-9B

GLM 技术团队于2023年3月14日开源了 ChatGLM-6B，引起了广泛的关注和认可。随后又开源了 ChatGLM3-6B，开发者对 GLM 第四代模型的开源充满期待。经过近半年的探索工作，GLM 技术团队推出了第四代 GLM 系列开源模型:GLM-...

人工智能 2024-06-05 人工智能

917阅读

AIGC论文阅读——[Visual Speech-Aware Perceptual 3D Facial Expression Reconstruction from Videos]

AIGC论文阅读——[Visual Speech-Aware Perceptual 3D Facial Expression Reconstruction from Videos] 论文地址：https://arxiv.org/abs/2207.110...

大数据 2024-06-05 人工智能

1015阅读

LLM | 偏好学习算法并不学习偏好排序

图片一、结论写在前面偏好学习算法（Preference learning algorithms，如RLHF和DPO）常用于引导大型语言模型（LLMs）生成更符合人类偏好的内容，但论文对其内部机制的理解仍有限。论文探讨了传统观点，即偏好学习训练模型通过...

人工智能 2024-06-05 人工智能

895阅读

多语言模型微调统一框架 LlAMAFACTORY: 统一高效微调100多种语言模型

文章目录摘要 1 引言 2 高效微调技术 2.1 高效优化 2.2 高效计算 3 LlAMAFACtORY框架 3.1 模型加载器 3.2 数据处理工作者 3.3 训练器 3.4 实用工具 3.5 LLAMABOARD：LLAMAFAC...

人工智能 2024-06-05 人工智能

997阅读

CVPR 2024 | 前沿而相对小众！几个AIGC扩散模型diffusion应用一览

1、机器人规划/智能决策 SkillDiffuser: Interpretable Hierarchical Planning via Skill Abstractions in Diffusion-Based Task Execution 扩散...

生成式AI 2024-06-05 人工智能

1064阅读

写代码神器！48个主流代码生成LLM大模型盘点，包含专用、微调等4大类Code llama

写代码神器！48个主流代码生成LLM大模型盘点，包含专用、微调等4大类学姐带你玩AI 2023-12-06 18:20 代码大模型具有强大的表达能力和复杂性，可以处理各种自然语言任务，包括文本分类、问答、对话等。这些模型通常基于深度学习架构，如Tra...

AIGC 2024-06-05 人工智能

2084阅读

Stable Diffusion模型基于 TensorFlow 或 PyTorch 训练

安装必要的软件和库：安装 Python（建议使用 Python 3.x 版本）。安装 TensorFlow 或 PyTorch，具体版本取决于你的模型是基于哪个框架训练的。安装其他可能需要的依赖，如 NumPy、Matplotlib 等。...

AIGC 2024-06-05 人工智能

832阅读

AI产品经理与AIGC产品经理：我该怎么选

前言在AI和AIGC行业的浪潮下，产品经理们面临着新的机遇和挑战。那么，AI产品经理和AIGC产品经理之间到底有什么区别呢？让我们一起来了解一下。 AI产品经理 AI产品经理的工作更为复杂，需要了解AI技术，如机器学习、自然语言处理等。他们...

AIGC 2024-06-04 人工智能

1028阅读

AI预测极端天气提速5000倍！微软发布Aurora，借AI之眼预测全球风暴

自人类有历史以来，就一直执着于预测天气，以各种方式破解「天空之语」，我们慢慢发现，草木、云层似乎都与天气有关，这不仅仅是因为人类从事生产的需要，也是人类想要对着大风歌唱、在月光下吟诗的需要。《冰与火之歌》中的风雨歌师，就是通过歌声和吟唱来预测天气和风暴...

人工智能 2024-06-04 人工智能

790阅读

被作者删库的Llama 3-V原文再现！效果匹敌GPT4-V，训练费用暴降，区区不到500 美元，尺寸小100 倍，如何做到的

编译 | 言征作者 | Aksh Garg 备注：发稿前作者已经删掉原文出品 | 51CTO技术栈（微信号：blog51cto）近日，一款Llama3V最近被“先红后黑”的出了圈。作为全球顶尖研究学府的团队，身陷“抄袭”中国大模型的泥潭后，火速删稿...

生成式AI 2024-06-04 人工智能

903阅读

微软发布大规模大气基础模型Aurora，用AI预测全球极端天气

微软近日发布了首个大规模大气基础模型 Aurora，这一模型利用人工智能技术，能够预测全球范围内的极端天气事件。与当前数值预报系统相比，Aurora 的计算速度提高了约5000倍，拥有超高的准确率和效率。这一模型的发布标志着天气预测领域迎来了重大突破。...

人工智能 2024-06-04 人工智能

718阅读

我用LLaMA大模型开发了一个聪明又温柔的智能客服机器人——她的名字叫“云云”

1、非常现实的问题像绝大多数小型科技公司一样，作为一家中关村里的软件企业，我们的产品定位清晰、目标客户明确，在自己擅长的领域持续研发和耕耘，拥有了一定规模的用户群。在公司发展的近10年时间里，我和我的同事共接待了近万名客户，这些客户有的购买了我们的...

生成式AI 2024-06-04 人工智能

902阅读