git 第15页 - AIGC资讯

用Conda配置 Stable Diffusion WebUI 1.9.4

用Conda配置 Stable Diffusion WebUI 1.9.4 本文主要讲解: 如何用Conda搭建Stable Diffusion WebUI 1.9.4环境，用Conda的方式安装，不需要单独去安装Cuda了。 1. 安装minic...

人工智能 2024-08-01 人工智能

967阅读

LLama-Factory使用教程

本文是github项目llama-factory的使用教程注意，最新的llama-factory的github中训练模型中，涉及到本文中的操作全部使用了.yaml配置。新的.yaml的方式很简洁但不太直观，本质上是一样的。新的readme中的.yam...

人工智能 2024-08-01 人工智能

2610阅读

AI多模态实战教程：面壁智能MiniCPM-V多模态大模型问答交互、llama.cpp模型量化和推理

一、项目简介 MiniCPM-V 系列是专为视觉-语⾔理解设计的多模态⼤型语⾔模型（MLLMs），提供⾼质量的⽂本输出，已发布4个版本。 1.1 主要模型及特性（1）MiniCPM-Llama3-V 2.5：参数规模: 8B 性能: 超越...

人工智能 2024-08-01 人工智能

1361阅读

AI绘画工具Stable Diffusion webui进行汉化的精简说明

工具汉化说明不废话，汉化以插件形式安装，安装方式是一样的，但是启用的方式以2022年为界，分为旧版方式和新版方式两种。汉化插件为 stable-diffusion-webui-localization-zh_CN 新版主分支目前为Anne，此分支由...

AIGC 2024-07-31 人工智能

1161阅读

Linux系统上部署Whisper。

Whisper是一个开源的自动语音识别（ASR）模型，最初由OpenAI发布。要在本地Linux系统上部署Whisper，你可以按照以下步骤进行： 1. 创建虚拟环境为了避免依赖冲突，建议在虚拟环境中进行部署。创建并激活一个新的虚拟环境：如果不...

生成式AI 2024-07-31 人工智能

2129阅读

从炒菜到缝针！斯坦福炒虾团队打造自主「AI达芬奇」，苦练神指当外科医生

【新智元导读】斯坦福炒虾机器人作者，又出新作了!通过模仿学习，达芬奇机器人学会了自己做「手术」——提起组织、拾取针头、缝合打结。最重要的是，以上动作全部都是它自主完成的。斯坦福炒虾机器人作者，又出新作了。这次，机器人不是给我们炒饭了，而是给我们做外科手...

大数据 2024-07-31 人工智能

938阅读

使用LLaMA-Factory对Llama3-8B-Chinese-Chat进行微调

文章目录模型及数据：模型下载数据 LLaMA-Factory启动拉取代码启动webui 模型训练数据导入数据预览设置模型路径配置参数及参数的保存开始训练过程观察加载模型、对话模型导出、再次加载...

人工智能 2024-07-31 人工智能

1353阅读

政安晨【零基础玩转各类开源AI项目】基于Ubuntu系统部署ComfyUI：功能最强大、模块化程度最高的Stable Diffusion图形用户界面和后台

目录 ComfyUI的特性介绍开始安装做点准备工作在Conda虚拟环境中进行依赖项的安装运行政安晨的个人主页：政安晨欢迎 ?点赞✍评论⭐收藏收录专栏: 零基础玩转各类开源AI项目希望政安晨的博客能够对...

人工智能 2024-07-31 人工智能

1502阅读

秋叶大佬24年最新的Stable Diffusion整合包V4.8来了～

要说今年绘画圈最大的新秀那妥妥的就Stable Diffution V4升级版无需安装**，直接解压就能用** *（在此要感谢秋葉aaaki大佬的分享！*）比之前推送的更加智能、快速和简单有多简单呢？这么说吧之前的版本需要初中生级别...

生成式AI 2024-07-31 人工智能

1302阅读

AIGC实战：LLaMA2打造中文写作利器——数据准备与模型训练全攻略

目录一、下载并加载中文数据集二、中文数据集处理 1、数据格式 2、数据集处理之tokenizer训练格式 1）先将一篇篇文本拼凑到一起（只是简单的拼凑一起，用于训练tokenizer） 2...

人工智能 2024-07-30 人工智能

1035阅读

生成式人工智能（AIGC）在软件开发领域的变革与挑战

AI是在帮助开发者还是取代他们？在软件开发领域，生成式人工智能（AIGC）正在显著改变开发者的工作方式。无论是代码生成、错误检测还是自动化测试，AI工具正在成为开发者的得力助手。然而，这也引发了对开发者职业前景和技能需求变化的讨论。AI究竟是在帮助...

AIGC 2024-07-30 人工智能

1250阅读

AI绘图赚钱，普通人用Stable diffusion 还是Midjourney，他们有什么区别？

给大家用2000字说一下Stable Diffusion 和Midjourney 从前期部署→到操作生成→再到效果及应用，为你分析两者之间的区别。 SD控制性极强，可高度自定义，难度大，完全免费。 MJ对小白非常友好，图片质量高，模型有限，插件少，控制...

人工智能 2024-07-30 人工智能

1077阅读

Unsloth 微调 Llama 3

本文参考：https://colab.research.google.com/drive/135ced7oHytdxu3N2DNe1Z0kqjyYIkDXp 改编自：https://blog.csdn.net/qq_38628046/article/det...

AIGC 2024-07-30 人工智能

1232阅读

LLaMA-MoE：基于参数复用的混合专家模型构建方法探索

自Mixtral以来，大家对混合专家模型（Mixture-of-Experts，MoE）的关注越来越高。然而从零训练MoE模型的成本极大，需要耗费海量的计算资源。为此，我们探索了一种基于参数复用的MoE快速构建方法。该方法首先将LLaMA...

人工智能 2024-07-30 人工智能

877阅读

llama_index，一个超强的 Python 库！

更多资料获取 ? 个人网站：ipengtao.com 大家好，今天为大家分享一个超强的 Python 库 - llama_index。 Github地址：https://github.com/run-llama/llama_index 在信息...

生成式AI 2024-07-29 人工智能

1369阅读

llama 2 改进之 RMSNorm

RMSNorm 论文：https://openreview.net/pdf?id=SygkZ3MTJE Github：https://github.com/bzhangGo/rmsnorm?tab=readme-ov-file 论文假设LayerNorm...

人工智能 2024-07-29 人工智能

888阅读

AI绘画Stable Diffusion【人物三视图】：角色三视图的制作教程

大家好，我是程序员晓晓关于三视图的制作，很早之前就有些小伙伴留言如何实现，当时只是给了大家制作的实现思路，最近又有些小伙伴提到了这个问题，今天我们就详细讨论一下这个问题，看一下最常见三视图的制作有哪些实现方式。话不多说，我们开整。一. 实现方式一：...

AIGC 2024-07-29 人工智能

1950阅读

阿里大模型元老杨红霞去向官宣：入职香港高校！被曝创业项目也在推进

最新消息，阿里大模型元老杨红霞入职香港理工大学，任电子计算机系教授。杨红霞是AI领域知名科学家。她曾在IBM T.J.沃森研究中心担任研究人员，并在雅虎担任首席科学家。2016年加入阿里巴巴，就职于达摩院智能计算实验室;2023年3月入职字节跳动。她在...

人工智能 2024-07-29 人工智能

994阅读

音频转文字哪家强？faster-whisper还是paddlespeech,我的折腾吐槽记录

前言作为一个魔武双修的python程序员，面对产品小姐姐提出的需求。我只能迎难而上。目前开源的音频转文字都有哪些？效果如何？速度怎么样？带着这一连串的问题，我在github的海洋里畅游良久。接下来我把我的发现都记录如下。 1. paddles...

人工智能 2024-07-29 人工智能

1471阅读

AI大模型原理（通俗易懂版）——AIGC

传送门：AI大模型原理（通俗易懂版）-CSDN博客 AIGC 说起近期的热门科技词汇，AIGC当之无愧位列其中。从某一天开始，我们突然发现AI可以帮忙生成文字图片音频视频等等内容了。而且让人难以分清背后的创作者到底是人类还是AI。这些AI生...

人工智能 2024-07-29 人工智能

1571阅读

搜集了18个宝藏技术周刊，涵盖前端、产品、UX、AIGC、独立开发、科技（偷偷收藏）

前端技术迭代速度很快，并不是每个人都有时间跟进社区的变化，但是了解下前端最新趋势、前沿知识对技能成长是很有帮助的，只有持续输入，才能更好输出。因此松桑打算搜集有价值的前端周刊，希望大家能从周刊中能够扩展视野、获取灵感。但是在搜集过程中发现了很多宝藏周刊...

AIGC 2024-07-28 人工智能

1313阅读

hunyuandit_pytorch AIGC 以文生图模型

HunyuanDiT 论文 Hunyuan-DiT : A Powerful Multi-Resolution Diffusion Transformer with Fine-Grained Chinese Understanding https:/...

AIGC 2024-07-28 人工智能

1015阅读

【奶奶看了都会了】AI绘画 Mac安装stable-diffusion-webui绘制AI妹子保姆级教程

1.作品图 2.准备工作目前网上能搜到的stable-diffusion-webui的安装教程都是Window和Mac M1芯片的，而对于因特尔芯片的文章少之又少，这就导致我们还在用老Intel 芯片的Mac本，看着别人生成美女图片只能眼...

人工智能 2024-07-28 人工智能

962阅读

项目实训：python whisper安装运行实现语音识别技术

1.最好用python3.9以上的版本 2.安装whisper库 pip install -U openai-whisper 输入whisper查看是否安装成功 3.下载ffmpeg并添加环境变量 Releases · BtbN/FFmpeg...

大数据 2024-07-28 人工智能

1310阅读

【SD教程】超详细AI绘画提示词语法讲解！

AI绘画提示词如何写？对于入门的小伙伴来说这是一个大问题，提示词写的好，才能有高质量的作品，那今天小元老师给大家详细讲解一下，建议点赞收藏！一、SD提示词基础 AI绘画提示词基本规则 1、提示词（prompt）由多个词缀构成。提示词分为正向提示...

生成式AI 2024-07-28 人工智能

1682阅读

在modelscope（魔塔）部署自己的Stable-Diffusion-WebUI并实现网络穿透，可外部调用

一、注册并登陆modelscope平台 modelscope账号的注册这里就不做过多的介绍，大家可以自行搜索完成账号注册及实名认证，领取免费GPU算力；登陆后按下图指示依次点击选择对应配置，最后点击‘启动’开启并进入服务器...

人工智能 2024-07-27 人工智能

1741阅读

天才程序员周弈帆 | Stable Diffusion 解读（三）：原版实现源码解读(篇幅略长，建议收藏！)

本文来源公众号“天才程序员周弈帆”，仅用于学术分享，侵权删，干货满满。原文链接：Stable Diffusion 解读（三）：原版实现源码解读天才程序员周弈帆 | Stable Diffusion 解读（一）：回顾早期工作-CSDN博客天才程序...

生成式AI 2024-07-27 人工智能

1910阅读

【AI绘画教程】Stable Diffusion 1.5 vs 2

在本文中，我们将总结稳定扩散 1 与稳定扩散 2 辩论中的所有要点。我们将在第一部分中查看这些差异存在的实际原因，但如果您想直接了解实际差异，您可以跳下否定提示部分。让我们开始吧！ Stable Diffusion 2.1 发布与1.5相比，2.1旨...

生成式AI 2024-07-27 人工智能

2954阅读

Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization

香港理工大学&bytedance&alibaba https://github.com/yangxy/PASD/ https://arxiv.org/pdf/2308.14469 问题引入当前的基于SD的方法缺乏对图片结构的保持，所以本...

生成式AI 2024-07-27 人工智能

950阅读

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

编者注：之前一直用firefly做微调，最近切换到LLaMA-Factory，发现不但简单易用，而且非常全面，有点相见恨晚的感觉。使用过程中我主要参考2个文档，一个是github上的官方中文文档： https://github.com/hiyouga/L...

AIGC 2024-07-27 人工智能

1459阅读

Stable Diffusion【真人模型】：人脸特美的人像摄影大模型wuhaXL_realisticMixV3.0

今天和大家分享一个基于SDXL的真人大模型：wuhaXL_realisticMix。该模型无需使用LORA**就能生成的特别漂亮的人脸，虽然有时候人脸有些假，但是生成的人脸确实非常漂亮。该模型底模融合了WhiteXL_realisticMix，训练素材...

人工智能 2024-07-26 人工智能

1271阅读

stable diffusion中dreambooth模型训练

stable diffusion中dreambooth模型训练简介一、参考材料二、运行备注模型训练步骤一、连接服务器二、虚拟环境配置简介一、参考材料 1、Github项目网址 2、huggingface...

AIGC 2024-07-26 人工智能

1187阅读

测试：ollama加载羊驼版本llama-3中文大模型

找了一个晚上各种模型，像极了当初找各种操作系统的镜像，雨林木风，深蓝、老毛桃…… 主要是官方的默认7B版本回答好多英文，而且回复的很慢，所以我是在ollama上搜索"chinese"找到了这个羊驼版本的， ollama run lgkt/llama3-...

生成式AI 2024-07-26 人工智能

1093阅读

LoRA6~Stable Diffusion

这里说LoRA 在 Stable Diffusion 中的三种应用 LoRA 是当今深度学习领域中常见的技术。对于 SD，LoRA 则是能够编辑单幅图片、调整整体画风，或者是通过修改训练目标来实现更强大的功能。LoRA 的原理非常简单，它其实就是用两个参...

人工智能 2024-07-26 人工智能

977阅读

图生视频，Stable Diffusion WebUI Forge内置SVD了！

在 Stable Diffusion WebUI Forge 版本中内置了一个SVD插件，也就是 Stable Video Diffusion（稳定视频扩散），之前我介绍过这个工具的使用方法：图片生成视频（独立部署SVD 但是当时还不能集成到Stabl...

AIGC 2024-07-26 人工智能

2017阅读

【AIGC】AI-Agents最新成果-斯坦福AI小镇源码解读

写在前面的话：今年年初斯坦福和谷歌的研究人员创建了一个类似于《模拟人生》的微型 RPG 虚拟世界，其中 25 个角色由 GPT 和自定义代码控制，并在arxiv上提交了论文版本，引起了对AIGC+游戏的广泛讨论； 8月，该项目在GitHub上正式开源...

AIGC 2024-07-25 人工智能

1251阅读

手把手教你在autodl上部署llama模型

文章目录一、注册AutoDL账号、租用GPU 二、创建conda环境三、下载llama模型四、启动模型一、注册AutoDL账号、租用GPU 进入 AutoDL官网链接注册账号，需要先充点钱，如下创建新实例。随便选...

生成式AI 2024-07-25 人工智能

2561阅读

Stable Diffusion【Pony模型】：C站广受欢迎的底层大模型

大家好，我是安琪 Stable Diffusion，一款基于深度学习的图像生成模型，以其强大的图像生成能力和个性化风格迁移能力，在艺术创作领域掀起了一场革命。而Pony模型，作为Stable Diffusion的底层大模型，更是备受C站用户的喜爱。本文将...

大数据 2024-07-25 人工智能

2920阅读

大模型智障检测+1：Strawberry有几个r纷纷数不清，最新最强Llama3.1也傻了

继分不清9.11和9.9哪个大以后，大模型又“集体失智”了! 数不对单词“Strawberry”中有几个“r”，再次引起一片讨论。 GPT-4o不仅错了还很自信。刚出炉的Llama-3.1405B，倒是能在验证中发现问题并改正。比较离谱的是Clau...

AIGC 2024-07-25 人工智能

967阅读

【真人模型】Stable Diffusion：人脸特美的人像摄影大模型

大家好我是安琪！ AI绘画的出现，将会带来新一轮的历史变革，具有无限的能力和潜力。如同200年前摄影技术发明时的情景一样，我们再度面临“绘画是什么”这样的问题。今天和大家分享一个基于SDXL的真人大模型：wuhaXL_realisticMix。该模型...

生成式AI 2024-07-25 人工智能

1215阅读

AI绘画教程：Stable Diffusion中如何安装使用不同的模型？

Stable Diffusion是开源的，有点像安卓；midjourney则是封闭的，有点像苹果。两者功能都很强大。但是对于Stable Diffusion来说，要发挥强大的功能，首先得像安卓那样做好配置，安装好各种功能的app。Stable Diffus...

人工智能 2024-07-24 人工智能

1036阅读

【AI绘画系列】分享5个让你艺术细胞炸裂的SD资源

大家好，最近我疯狂研究AI绘画，AI绘画有一种魔力，一坐下就完全不知道时间的流逝（饭都不知道按时吃了），修仙走火入魔了？目前AI绘画领域最火的就是MJ和SD，社群众说纷纭。各有所长。建议两者都学习一下，然后找到最适合自己的用法。 AI绘画系列将是一系...

人工智能 2024-07-24 人工智能

1285阅读

【一文开启StableDiffusion】最火AIGC绘画工具SD阿里云部署指南（含踩坑经验）

Midjonery使用简单，效果出色，不过需要付费。本文将介绍完全开源的另一款产品StableDiffusion，它的社区目前非常活跃，各种插件和微调模型都非常多，而且它无需付费注册，没有速度、网络限制，非常推荐一试。目前主流AI绘画产品：产...

人工智能 2024-07-23 人工智能

1280阅读

使用LLaMA-Factory微调大模型

使用LLaMA-Factory微调大模型 github 地址https://github.com/hiyouga/LLaMA-Factory 搭建环境 git clone --depth 1 https://github.com/hiyouga/...

人工智能 2024-07-23 人工智能

1078阅读

Stable Diffusion模型越大越好吗？快来拯救你的内存和磁盘

如果你经常使用 Stable Diffusion 绘图，是否注意到很多大模型文件的大小各有不同，有2G的、4G的、还有8G的，这些模型占用了大量的磁盘空间，特别是租用云服务器的有限免费空间；有些模型的作者或者使用者会说模型文件越大越好，越大出图越精细，真的...

AIGC 2024-07-23 人工智能

1093阅读

Meta的Llama-3.1-405B遭泄漏，可下载，性能超GPT-4o！

7月23日凌晨，有人爆料，Meta的Llama3.1-405B评测数据遭遇泄漏，明天可能会发布Llama3系列中最大的参数模型，同时还会发布一个Llama3.1-70B版本。这也是在3.0版本基础之上进行了功能迭代，即便是70B的基础模型的性能也超过了G...

人工智能 2024-07-23 人工智能

943阅读

python系列&deep_study系列：找不到字幕？Whisper 让不懂外语的你也能看懂日剧，支持99种语言

找不到字幕？Whisper 让不懂外语的你也能看懂日剧，支持99种语言找不到字幕？Whisper 让不懂外语的你也能看懂日剧，支持99种语言音视频转录字幕翻译 Whisper 进阶命令 task language model 幻听参数...

生成式AI 2024-07-23 人工智能

888阅读

苹果开源7B大模型，训练过程数据集一口气全给了，网友：开放得不像苹果

苹果最新杀入开源大模型战场，而且比其他公司更开放。推出7B模型，不仅效果与Llama38B相当，而且一次性开源了全部训练过程和资源。要知道，不久前Nature杂志编辑Elizabeth Gibney还撰文批评: 而苹果这次竟然来真的!! 就连NLP...

生成式AI 2024-07-23 人工智能

875阅读

【05】LLaMA-Factory微调大模型——初尝微调模型

上文【04】LLaMA-Factory微调大模型——数据准备介绍了如何准备指令监督微调数据，为后续的微调模型提供高质量、格式规范的数据支撑。本文将正式进入模型微调阶段，构建法律垂直应用大模型。一、硬件依赖 LLaMA-Factory框架对硬件和软件的...

AIGC 2024-07-23 人工智能

1626阅读

Llama也能做图像生成？文生图模型已开源

导读基于next-token prediction的图像生成方法首次在ImageNet benchmark超越了LDM, DiT等扩散模型，证明了最原始的自回归模型架构同样可以实现极具竞争力的图像生成性能。 Llama也能做图像生成？文生图模型已开源...

生成式AI 2024-07-23 人工智能

1426阅读