预训练第10页 - AIGC资讯

CSDN首发！Stable Diffusion 3 Medium 开源，AI 生图格局迎来巨变

就在刚刚，Stable Diffusion 3 Medium 如约而至。几天前，Stability AI 在社交平台 X 上官宣，SD3 Medium 将在 6 月 12 日正式开源。这一次，没有跳票，它是真的来了。 20 亿参数大小，笔记本...

生成式AI 2024-06-20 人工智能

885阅读

用 LLama-Factory 训练和微调 LLama3，打造你的专属 AI 模型！

用 LLama-Factory 训练和微调 LLama3，打造你的专属 AI 模型！文章目录用 LLama-Factory 训练和微调 LLama3，打造你的专属 AI 模型！什么是模型微调？为什么使用 LLama-Fact...

人工智能 2024-06-20 人工智能

1347阅读

InsCode Stable Diffusion使用教程（非常详细）从零基础入门到精通，看完这一篇就够了_outpainting 模型下载

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7 深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新HarmonyOS鸿蒙...

人工智能 2024-06-20 人工智能

1030阅读

【机器学习】智能创意工厂：机器学习驱动的AIGC，打造未来内容新生态

?时空传送门 ?机器学习在AIGC中的核心技术 ?深度学习 ?生成对抗网络（GANs） ?机器学习在AIGC中的具体应用 ?图像生成与编辑 ⭐文本生成与对话系统 ?音频生成与语音合成 ?机器学习在AIGC中的作用与挑战随着...

人工智能 2024-06-19 人工智能

876阅读

meta-llama/Meta-Llama-3-8B

https://huggingface.co/meta-llama/Meta-Llama-3-8B 型号细节 Meta开发并发布了Meta Llama 3家族大型语言模型(LLM ,这是一组预训练和指令微调的生成性文本模型,大小为8B和70B参数。L...

人工智能 2024-06-19 人工智能

998阅读

【AIGC】大型语言模型在人工智能规划领域模型生成中的探索

大型语言模型在人工智能规划领域模型生成中的新应用一、引言二、LLM在规划领域模型生成中的潜力三、实证分析：LLM在规划领域模型生成中的表现四、代码实例：LLM在规划领域模型生成中的应用五、结论与展望一、引言随着...

人工智能 2024-06-19 人工智能

954阅读

大模型之路3：趟到了Llama-Factory，大神们请指点

各种AI工具和框架层出不穷，为开发者和研究者提供了前所未有的便利。当然了，也有困扰。尤其是对于动手能力越来越弱的中年油腻老程序员来说，更是难上加难。据说，嗯，据师弟说，说LlamaFactory凭借其独特的功能和优势，在AI领域（他所下载的代码和工具里），...

生成式AI 2024-06-19 人工智能

1056阅读

【机器学习】机器的登神长阶——AIGC

目录什么是AIGC 普通用户接触AIGC网站推荐通义千问白马普通用户如何用好AIGC 关键提示词的作用 AIGC的影响就业市场：教育领域：创意产业：经济活动：社交媒体与信息传播： AIGC面临的挑战...

AIGC 2024-06-18 人工智能

979阅读

华为盘古大模型5.0、全新小艺将于6月21日发布

华为官方今日宣布，盘古大模型5.0和全新小艺将于6月21日开幕的华为开发者大会上正式亮相。此次大会不仅将迎来这两款创新产品的登场，还将有纯血鸿蒙系统同台竞艳，共同展现华为在人工智能和操作系统领域的最新成果。自2021年发布以来，华为盘古系列基础大模型以...

AIGC 2024-06-18 人工智能

815阅读

DeepSeek-Coder-V2代码语言模型免费吗？AI编程辅导代码生成使用方法详细教程指南

DeepSeek-Coder-V2 是一个开源的Mixture-of-Experts (MoE 代码语言模型，性能与GPT4-Turbo相当，在代码特定任务上表现卓越。它在DeepSeek-Coder-V2-Base的基础上，通过 6 万亿token的高...

AIGC 2024-06-18 人工智能

2173阅读

从论文中看AI绘画

个人博客:Sekyoro的博客小屋个人网站:Proanimer的个人网站主要看是看Diffusion Models,CLIP,ControlNet,IP-Adapter这种经典论文,尝试总结论文写作的一些方式以及图像生成模型的一些内在思想. 对于其中的数...

AIGC 2024-06-18 人工智能

1019阅读

一周SOTA：Meta 发布 Llama 3；Mistral AI 开源 Mixtral 8x22B；阿里开源代码模型CodeQwen1.5；面壁 MiniCPM 2.0 发布

文章目录一周SOTA：Meta 发布 Llama 3；Mistral AI 开源 Mixtral 8x22B；阿里开源代码模型CodeQwen1.5；面壁 MiniCPM 2.0 发布 1.Meta 震撼发布 Llama 3，8B、70B模...

大数据 2024-06-18 人工智能

1165阅读

Python - 深度学习系列30 - 使用LLaMA-Factory微调模型

说明最实用的一种利用大语言模型的方式是进行微调。预训练模型与我们的使用场景一定会存在一些差异，而我们又不可能重头训练。微调的原理并不复杂，载入模型，灌新的数据，然后运行再训练，保留checkpoints。但是不同项目的代码真的不太一样，每一个都要...

AIGC 2024-06-17 人工智能

1506阅读

硬核解读KubeEdge基于大模型边云协同的机器人语义分割算法

本文分享自华为云社区《KubeEdge：基于大模型边云协同的机器人语义分割算法》，作者：云容器大未来。近年来快速发展的视觉大模型(例如 SAM 在促进高精度的智能感知方面具有很大的潜力。然而，边缘环境中的资源限制往往会限制这种视觉大模型在本地部署，从...

AIGC 2024-06-17 人工智能

1054阅读

大模型论文解读|| 数学新巅峰，微软&清华联合研究发现：7B级LLaMA-2模型数学能力惊人，准确率高达97.7%

开篇：数学能力在常规语言模型中的崭露头角数学能力长期以来被认为是语言模型中难以攻克的领域，只有在模型规模极大或经过大量数学相关预训练的情况下才可能显现。然而，最新的研究表明，即使是规模较小的常规语言模型，如LLaMA-2 7B，也已经展现出了强大的数学...

AIGC 2024-06-17 人工智能

1002阅读

手把手教你微调Stable Diffusion

温馨提示关于本文：本文你可以学习到完整的不使用webui借助lora和dreambooth微调Stable Diffusion的全过程。手把手教你微调Stable Diffusion生成优弧，但是半失败版? 关于训练：单卡32GV...

生成式AI 2024-06-17 人工智能

1291阅读

新手教程之使用LLaMa-Factory微调LLaMa3

文章目录为什么要用LLaMa-Factory 什么是LLaMa-Factory LLaMa-Factory环境搭建微调LLaMA3 参考博文为什么要用LLaMa-Factory 如果你尝试过微调大模型，你就会知道，大模型的环...

AIGC 2024-06-17 人工智能

1852阅读

AIGC从入门到实战：落霞与孤鹜齐飞：AIGC 汹涌而来

作者：禅与计算机程序设计艺术 Generative Capacity (AIGC has taken the technology world by storm in recent years, bringing forth innovative so...

人工智能 2024-06-17 人工智能

980阅读

AI绘画Stable Diffusion 3 正式开源，AI生图格局迎来巨变！（附模型下载）

大家好，我是向阳就在刚刚，Stable Diffusion 3 Medium 如约而至。几天前，Stability AI 在社交平台 X 上官宣，SD3 Medium 将在 6 月 12 日正式开源。这一次，没有跳票，它是真的来了。 20...

人工智能 2024-06-16 人工智能

1011阅读

Llama模型家族之Stanford NLP ReFT源代码探索（三）reft_model.py代码解析

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

AIGC 2024-06-16 人工智能

1037阅读

聊聊大模型：开源LLaMA背后的底层逻辑与赚钱之道？大模型的发展瓶颈？如何一键部署LLaMA3？

如果我们相信未来比今天更好，坚信自己生活在一个好地方，所要做的便是认识到未来时代的特征和规律。把握住一些不变的道理，使用正确的方法，做那些能够不断让自己获得可叠加式进步的事情，这样便能立于不败之地。—吴军最近关注两个方向，也是公司重点发展和投资的两个方...

生成式AI 2024-06-16 人工智能

1707阅读

智谱AI 发布最新开源模型GLM-4-9B，通用能力超Llama-3-8B，多模态版本比肩GPT-4V

自 2023 年 3 月 14 日开源 ChatGLM-6B 以来，GLM 系列模型受到广泛关注和认可。特别是 ChatGLM3-6B 开源以后，开发者对智谱AI 第四代模型的开源充满期待。为了使小模型（10B 以下）具备更加强大的能力，GLM 技术团...

AIGC 2024-06-16 人工智能

1354阅读

大规模语言模型从理论到实践 LLaMA的模型结构

1.背景介绍随着人工智能技术的不断发展，大规模语言模型（Large Language Models, LLMs）已经成为自然语言处理领域的热点。这些模型通过在大规模数据集上进行训练，能够生成连贯、相关且有趣的文本输出。LLaMA 是 Meta AI 开...

AIGC 2024-06-16 人工智能

1003阅读

论文笔记：Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization

CVPR2024 论文代码：yangxy/PASD (github.com 论文地址：[2308.14469v3] Pixel-Aware Stable Diffusion for Realistic Image Super-resolution a...

大数据 2024-06-16 人工智能

1295阅读

英伟达开源3400亿巨兽，98%合成数据训出最强开源通用模型！性能对标GPT-4o

【新智元导读】刚刚，英伟达全新发布的开源模型Nemotron-4 340B，有可能彻底改变训练LLM的方式！从此，或许各行各业都不再需要昂贵的真实世界数据集了。而且，Nemotron-4 340B直接超越了Mixtral 8x22B、Claude sonn...

生成式AI 2024-06-16 人工智能

944阅读

一文实现Llama 3 图片理解能力微调（XTuner+LLaVA 版）

本次实验基于 Llama3-8B-Instruct 和 XTuner 团队预训练好的 Image Projector 微调自己的多模态图文理解模型 LLaVA。实验平台为InternStudio，实验所用的显存为24G。 =============目录=...

人工智能 2024-06-16 人工智能

1875阅读

用ControlNet+Inpaint实现stable diffusion模特换衣

用ControlNet+Inpaint实现stable diffusion模特换衣 ControlNet 训练与架构详解 ControlNet 的架构用于文本到图像扩散的 ControlNet 训练过程...

人工智能 2024-06-15 人工智能

1181阅读

文心一言指令

文心一言文心一言（ERNIE Bot）是百度公司研发的知识增强大语言模型，它可以根据用户的指令和输入，生成相应的回答或文本。以下是一些可能的指令示例，用于指导文心一言完成不同的任务：知识问答：指令：“请问什么是人工智能？” 文心一言将...

AIGC 2024-06-15 人工智能

1312阅读

探秘Whisper Diarization：语音转文字与对话分割的新锐工具

探秘Whisper Diarization：语音转文字与对话分割的新锐工具项目地址:https://gitcode.com/MahmoudAshraf97/whisper-diarization 项目简介 Whisper Diarization 是...

生成式AI 2024-06-15 人工智能

1394阅读

每日AIGC最新进展(23)：魁北克人工智能研究所提出扩展注意力机制视频编辑、浙江大学提出video-to-Audio生成算法Frieren、清华大学提出扩散模型参数高效迁移学习Diff-Tuning

Diffusion Models专栏文章汇总：入门与实战 Temporally Consistent Object Editing in Videos using Extended Attention 本文提出了一种用于视频编辑的新方法，旨在通过...

人工智能 2024-06-15 人工智能

881阅读

大模型理解复杂表格，字节&中科大出手了

只要一个大模型，就能解决打工人遇到的表格难题! 字节联手中科大推出了一款统一表格理解大模型，可以以用户友好的方式解决多种表格理解任务。同时提出的还有一套开源测试基准，可以更好地评估模型在表格理解任务上的表现。该模型名为TabPedia，利用多模态大模...

人工智能 2024-06-15 人工智能

953阅读

详细解析AI作画原理及相关理论

先来欣赏AI作画人物方面：欣赏AI作画自然意境：目录引言一、AI作画原理二、相关理论 1. 风格迁移理论 2. 生成对抗网络（GAN）三、代码示例进一步的优化和改进可能包括：总结：引言...

生成式AI 2024-06-15 人工智能

1544阅读

区分LLaMA、llama.cpp和Ollama

大模型本地部署和运行中，经常遇到这三个概念，llama，ollama，llama.cpp。刚开始接触时，的确有些傻傻分不清楚。这里简单区分理解下，方便快速上手。简单来讲，llama 是一个Meta公司开源的预训练大型语言模型，llama.cpp用于加...

AIGC 2024-06-15 人工智能

2754阅读

AIGC-风格迁移-style Injection in Diffusion-CVPR2024HighLight-论文精度

Style Injection in Diffusion: A Training-free Approach for Adapting Large-scale Diffusion Models for Style Transfer-CVPR2024High...

人工智能 2024-06-14 人工智能

1875阅读

每日AIGC最新进展(22)：中国科学院大学提出Zoro-shot视频插帧算法、Adobe研究院提出高效视频扩散模型的叠加网络搜索架构SNED、蚂蚁集团提出视频深度估计算法ChronoDepth

Diffusion Models专栏文章汇总：入门与实战 ZeroSmooth: Training-free Diffuser Adaptation for High Frame Rate Video Generation 本文提出了一种名为Z...

生成式AI 2024-06-14 人工智能

974阅读

AI绘画专栏之换脸在SDXL中使用保持人脸一致性INSTANTID FACEID XADAPTER，comfyui

大家都知道腾讯AILab出的ipadapter系列带来的faceid，photomaker非常火，顺便分享一下instantid，跟faceid一样用来保持人脸一致性，孰强孰弱不好说，我只能说我觉得faceid更强，但现在又出来了一个Xadapter是什么...

人工智能 2024-06-14 人工智能

1374阅读

Stable Diffusion原理

一、Diffusion扩散理论 1.1、 Diffusion Model（扩散模型） Diffusion扩散模型分为两个阶段：前向过程 + 反向过程前向过程：不断往输入图片中添加高斯噪声来破坏图像反向过程：使用一系列马尔可夫链逐步将噪声还原...

AIGC 2024-06-14 人工智能

1096阅读

LLaMa大模型微调

1. 模型的微调 1.1 大模型LLaMa下载先下载一个完整版本的LLaMa模型，官网的或别人下载微调过的中文版本的。 1.2 指令微调执行run_clm_sft_with_peft 1.3 合并LORA 大模型的原始参数和微调后的参数...

AIGC 2024-06-14 人工智能

1455阅读

终于来啦！Stable Diffusion 3将在6月12日正式开源

6月3日晚，著名开源大模型平台Stability AI的联合首席执行官Christian Laforte，在AMD的产品发布会上宣布，文生图模型 Stable Diffusion 3将于6月12日在Hugging Face开源权重。本次开源的是Stab...

大数据 2024-06-13 人工智能

843阅读

[从0开始AIGC][Transformer相关]：一文看懂Transformer中的位置编码：绝对位置、相对位置、旋转位置编码

[从0开始AIGC][Transformer相关]：一文看懂Transformer中的位置编码文章目录 [从0开始AIGC][Transformer相关]：一文看懂Transformer中的位置编码 1. 位置编码 1.1 绝对位...

生成式AI 2024-06-13 人工智能

1298阅读

Karpathy 4小时AI大课上线，小白看了都会从零构建GPT-2

距上次Karpathy AI大课更新之后，又有了1个多月的时间。这次他带了超详细的4小时课程——从零开始实现1.24亿参数规模的GPT-2模型。大神Karpathy新一期AI大课又上线了。这一次，他讲的内容是——从头开始实现124M大小的GPT-2模型...

生成式AI 2024-06-12 人工智能

838阅读

手机流畅运行470亿大模型：上交大发布LLM手机推理框架PowerInfer-2，提速29倍

苹果一出手，在手机等移动设备上部署大模型不可避免地成为行业关注焦点。然而，目前在移动设备上运行的模型相对较小（苹果的是3B，谷歌的是2B），并且消耗大量内存，这在很大程度上限制了其应用场景。即使是苹果，目前也需要与OpenAI合作，通过将云端GPT-4...

AIGC 2024-06-12 人工智能

898阅读

探索深度学习艺术：Stable Diffusion的ONNX & FP16革命

探索深度学习艺术：Stable Diffusion的ONNX & FP16革命项目地址:https://gitcode.com/Amblyopius/Stable-Diffusion-ONNX-FP16 在当今的艺术与技术交汇处，一个令人兴奋...

人工智能 2024-06-12 人工智能

1015阅读

LLaMA详细解读

LLaMA 是目前为止，效果最好的开源 LLM 之一。精读 LLaMA 的论文及代码，可以很好的了解 LLM 的内部原理。本文对 LLaMA 论文进行了介绍，同时附上了关键部分的代码，并对代码做了注释。摘要 LLaMA是一个系列模型，模型参数量从7B...

人工智能 2024-06-11 人工智能

1522阅读

AIGC学习（SD、LoRA和ControlNet）

目录 Stable Diffusion（稳定扩散模型）为什么叫扩散模型？网络结构 VAE（Variational Auto-Encoder） UNet模型 CLIP Text Encoder LoRA(低秩适应矩阵什么是LoRA？...

人工智能 2024-06-11 人工智能

2111阅读

五一 Llama 3 超级课堂 | XTuner 微调 Llama3 图片理解多模态实践笔记

基于 Llama3-8B-Instruct 和 XTuner 团队预训练好的 Image Projector 微调自己的多模态图文理解模型 LLaVA。课程文档：Llama3-Tutorial/docs/llava.md at main · Smart...

生成式AI 2024-06-11 人工智能

852阅读

30岁失业的我，选择职场转型，进入AIGC工程师领域，重新开始

去年，刚满30岁的我又一次被公司辞退了，由于学历不高，简历也不出彩，尽管半个月来投了一份又一份的简历，但仍然是石沉大海，我终于不得不开始思考一个以前被我一直刻意压制的想法——职场转型。尽管知道这条路艰难，几乎是要从零重新开始，但比耗死在之前那几乎看不到...

AIGC 2024-06-11 人工智能

945阅读

聊聊各种“GC”：UGC、PGC、PUGC、OGC、MGC、BGC、AIGC有什么区别？

01. UGC UGC(User Generated Content ，指用户原创内容。 UGC的概念最早起源于互联网领域，即用户将自己原创的内容通过互联网平台进行展示。内容生产的主体是非专业人士，即一般公众；内容的制作渠道是非专业化的；内容...

人工智能 2024-06-11 人工智能

2208阅读

AI-windows下使用llama.cpp部署本地Chinese-LLaMA-Alpaca-2模型

文章目录 Llamp.cpp环境配置 Chinese-LLaMA-Alpaca-2模型介绍模型下载转换生成量化模型 Anaconda环境安装运行 Llamp.cpp环境配置 git clone git@...

生成式AI 2024-06-10 人工智能

915阅读

文心一言 vs GPT-4 -- 全面横向比较

文心一言和GPT-4都是当前非常先进的自然语言处理模型，它们在语言理解、生成和翻译等方面都展现出了出色的能力。以下是对这两个模型的全面横向比较：核心技术基础：文心一言：是基于BERT（Bidirectional Encoder Represen...

AIGC 2024-06-10 人工智能

930阅读