gui 第4页 - AIGC资讯

Stable Diffusion使用样例实践（二）

其中采用Stable Diffusion webui项目，模型为C站模型。需要模型的可以私我。细节上可以多训练几次，得到满意的为准。 SD用例实践二、人物类 1.现实人物（女性）（训练库： realisticVisionV60B1_v51VA...

大数据 2024-06-08 人工智能

815阅读

探索GGUF：利用llama.cpp高效运行大型语言模型

探索GGUF：利用llama.cpp高效运行大型语言模型在人工智能领域，大型语言模型（LLM）的应用越来越广泛，但运行这些模型常常需要大量计算资源和复杂的配置。最近，一个名为llama.cpp的开源项目引起了广泛关注，它通过C/C++实现了一个高效的...

AIGC 2024-06-08 人工智能

1201阅读

【Diffusion实战】基于Stable Diffusion实现文本到图像的生成（Pytorch代码详解）

来试试强大的Stable Diffusion吧，基于Stable Diffusion的pipeline，进一步了解Stable Diffusion的结构~ Diffusion实战篇：【Diffusion实战】训练一个diffusion模型生成...

大数据 2024-06-07 人工智能

1078阅读

pipeline-stable-diffusion.py文件逐行解释

本文是对stabled-diffusion的pipeline文件的代码逐行解释。 60-71行该函数对经过cfg重组出来的noise_pred，再重组。 def rescale_noise_cfg(noise_cfg, noise_pred_t...

生成式AI 2024-06-07 人工智能

1614阅读

AI绘画之Midjourney——提示词结构揭秘

大家好今天分享的内容：Midjourney（以下简称MJ）提示词结构。还没有注册MJ的，如果不能用MJ可以用国内的MEWX AI。 MJ的提示词不像直接跟大模型对话的提示词，结构需要那么复杂，主要是分清需要的各个部分，一般是由句子和短语组成，然后...

AIGC 2024-06-07 人工智能

1242阅读

在本地跑一个AI模型(5) - Stable Diffusion

在之前的文章中，我们使用ollama在本地运行了大语言模型，它可以与你聊天，帮助你理解和生成文本内容。使用coqui-tts在本地运行了文本转语音模型，它可以将大语言模型生成的文字转换成语音，让你的应用更有趣。今天我们将要介绍Stable Diffusio...

生成式AI 2024-06-06 人工智能

979阅读

ChatGPT、Perplexity、Claude同时大崩溃，AI集体罢工让全网都慌了

如果说现在什么事能引发全球打工人们同时间大暴走，那应该就是昨夜经历的：AI聊天机器人集体宕机。美西时间午夜 12 点开始，陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载，忽然无法正常工作了。本以为像平时一样多刷几次就能恢复...

大数据 2024-06-05 人工智能

842阅读

Stable Diffusion高级教程 - 图生图(img2img)模式

前言现在终于可以介绍 Stable Diffusion 除了文生图 (txt2img 之外最重要的功能：图生图 (img2img 。顾名思义，除了根据正向和反向提示词之外，还需要基于一张图片生成图。这个模式下功能很多我们挨个说 img2img 图...

生成式AI 2024-06-04 人工智能

886阅读

真实对比kimi、通义千问、文心一言的写代码能力，到底谁强？

?AI改变生活：最近都在说月之暗面的kimi的各项能力吊打国内其他大模型，今天我们真实感受下 kimi、通义千问、文心一言的根据需求写代码的能力。测评结果让人震惊！ kimi kimi编程过程我们先看一下热捧的月之暗面的kimi模型。...

生成式AI 2024-06-01 人工智能

2451阅读

DreamPose: Fashion Image-to-Video Synthesis via Stable Diffusion

UW&UCB&Google&NVIDIA ICCV23 https://github.com/johannakarras/DreamPose?tab=readme-ov-file 问题引入输入参考图片...

AIGC 2024-06-01 人工智能

900阅读

Stable Diffusion简单食用方法

1.下载 1.1打开B站哔哩哔哩 (゜-゜つロ干杯~-bilibili哔哩哔哩（bilibili.com 是国内知名的视频弹幕网站，这里有及时的动漫新番，活跃的ACG氛围，有创意的Up主。大家可以在这里找到许多欢乐。https://www.bil...

生成式AI 2024-05-31 人工智能

1708阅读

肝了三天，完成了AIGC工具网站大全，建议收藏再看

说是肝了三天，其实远远不止，前前后后，从资料搜集到最后整理成文，有近一个月了，大家看在整理不易的份上，给点个赞吧，不要光顾着收藏呀！国内网站 AIGC 导航 https://www.aigc.cn 网站很全面，而且可以看出商业化也比...

生成式AI 2024-05-31 人工智能

984阅读

速度秒掉GPT-4o、22B击败Llama 3 70B，Mistral AI开放首个代码模型

对标 OpenAI 的法国 AI 独角兽 Mistral AI 有了新动作：首个代码大模型 Codestral 诞生了。作为一个专为代码生成任务设计的开放式生成 AI 模型，Codestral 通过共享指令和补全 API 端点帮助开发人员编写并与代码...

大数据 2024-05-30 人工智能

790阅读

Kohya 训练器 Stable Diffusion工作流中训练LoRA模型方法

本文档是关于Stable Diffusion工作流中训练LoRA模型方法的文档一.前置训练集准备第一步：准备训练集：准备训练模型时使用的训练集。注意：训练集应当能尽量涵盖训练对象的“多样化样本”。如角色立绘图，各个角度不同的图片。...

人工智能 2024-05-30 人工智能

2655阅读

苹果青睐独立开发者：ChatGPT无缘年度设计奖入围名单

近日，苹果公司公布了其年度设计奖的入围名单，明确表彰独立应用程序和初创公司，而非大型科技公司，包括那些提供人工智能聊天机器人的公司。在当前AppStore模式受到立法者和监管机构质疑之际，苹果将目光投向了那些在其平台上表现突出的中小型应用程序制造商。在今...

AIGC 2024-05-29 人工智能

886阅读

【AIGC调研系列】CogVLM2:第二代视觉大模型

CogVLM2是智谱AI推出的新一代多模态大模型，继承并优化了上一代模型的经典架构。CogVLM2采用了一个拥有50亿参数的强大视觉编码器，并创新性地在大语言模型中整合了一个70亿参数的视觉专家模块[1]。这一设计使得CogVLM2在视觉和语言理解方面实现...

人工智能 2024-05-28 人工智能

1667阅读

AIGC系列之：DDPM原理解读（简单易懂版）

目录 DDPM基本原理 DDPM中的Unet模块 Unet模块介绍 Unet流程示意图 DownBlock和UpBlock MiddleBlock 文生图模型的一般公式总结本文部分内容参考文章：https://ju...

AIGC 2024-05-28 人工智能

1279阅读

手把手教你用LoRA训练自己的Stable Diffusion模型

目录写在前面一、准备数据二、数据打标签三、执行训练四、执行推理 1.LoRA推理 2.全参数推理写在前面 Stable Diffusion大家已经很熟悉了，那么如何训练自己的sd模型呢，今天我就介绍一下用L...

AIGC 2024-05-27 人工智能

1454阅读

CVPR 2024 | 图像超分、图像恢复汇总！用AIGC扩散模型diffusion来解决图像low-level任务的思路...

1、Arbitrary-Scale Image Generation and Upsampling using Latent Diffusion Model and Implicit Neural Decoder 超分辨率（SR）和图像生成是计算...

生成式AI 2024-05-26 人工智能

1640阅读

实战whisper第二天：直播语音转字幕（全部代码和详细部署步骤）

直播语音实时转字幕：基于Whisper的实时直播语音转录或翻译是一项使用OpenAI的Whisper模型实现的技术，它能够实时将直播中的语音内容转录成文本，甚至翻译成另一种语言。这一过程大致分为三个步骤：捕获直播音频流、语音识别（转录）以及翻译（如...

人工智能 2024-05-25 人工智能

1670阅读

AI绘画Stable Diffusion【Forge】：速度更快更好用的新Web UI工具Forge

大家好，我是程序员晓晓。 Stable Diffusion WebUI Forge 是一个基于 Stable Diffusion WebUI的平台，相当于是一个升级版本。“Forge”这个名字的灵感来自于“Minecraft Forge”。其旨在成为 S...

AIGC 2024-05-25 人工智能

1541阅读

CVPR 2024 | 风格迁移和人像生成汇总！扩散模型diffusion用于经典AIGC方向

风格迁移 1、DEADiff: An Efficient Stylization Diffusion Model with Disentangled Representations 基于文本到图像扩散模型在迁移参考风格方面具有巨大潜力。然而，...

生成式AI 2024-05-25 人工智能

1278阅读

全网最全stable diffusion webui API调用示例，包含controlneth和segment anything的API（附json示例）

全网最全stable diffusion webui API调用示例，包含controlneth和segment anything的API（附json示例）交流群 100419879 欢迎合作?? V ： 864399407 GitHub：https...

人工智能 2024-05-24 人工智能

808阅读

LLMs之Llama3：Llama-3的简介、安装和使用方法、案例应用之详细攻略

LLMs之Llama3：Llama-3的简介、安装和使用方法、案例应用之详细攻略导读：2024年4月18日，Meta 重磅推出了Meta Llama 3，本文章主要介绍了Meta推出的新的开源大语言模型Meta Llama 3。模型架构 Llam...

AIGC 2024-05-24 人工智能

2518阅读

桌面版ChatGPT登台演讲，能视频通话还会实时读屏，GPT-4o demo再次惊艳：“能力还是被低估了”

GPT-4o桌面端最新Demo，与Sora的新作品一同亮相“欧洲AI春晚”VivaTech。现场，OpenAI工作人员不仅展示了观众期待已久的“视频通话”，还试着让ChatGPT发表了演讲。在视频聊天当中，即使给它的只有一幅抽象的简笔画，它也能立马...

生成式AI 2024-05-24 人工智能

979阅读

马斯克谈AI未来：不工作也有高收入但活着无聊

5月24日消息，当地时间周四，特斯拉首席执行官埃隆·马斯克（Elon Musk）通过视频连线参加在法国巴黎举行的VivaTech技术大会，分享了他对未来的一种反乌托邦观点。当一位观众询问人工智能是否终将取代马斯克，并表达对人工智能夺走工作岗位的担...

人工智能 2024-05-24 人工智能

805阅读

AIGC-controlnet代码详细解读

hugging face 社区diffusers官方代码：stable_diffusion/controlnetcontrolnet.ipynb 原始代码的解读可以看看这个博主的：万字长文解读Stable Diffusion的核心插件—ControlNet...

大数据 2024-05-24 人工智能

1720阅读

Gabby World V2:融合AI和区块链技术的全新龙与地下城风格游戏问世

站长之家（ChinaZ.com）5月22日消息:在全新的Gabby World V2游戏中，玩家将迎来一个融合了人工智能和区块链技术的独特体验。这款创新游戏以Dungeons & Dragons为灵感，为玩家提供了创建和探索故事的机会，打造了完全...

大数据 2024-05-22 人工智能

864阅读

路径规划概述：基于采样、搜索、优化全搞定！

本文经自动驾驶之心公众号授权转载，转载请联系出处。 1 决策控制与运动规划概述目前决策控制方法可以分为三类：sequential planning、behavior-aware planning、和end-to-end planning。 seq...

大数据 2024-05-17 人工智能

1155阅读

首席信息官必须了解的关于人工智能基础设施的五件事

生成式人工智能有潜力改变行业并产生难以估量的投资回报率，但前提是首席信息官和其他IT领导者了解一些基本要素。生成式人工智能吸引了所有人的注意力，这有着充分理由。但是，从潜力到盈利并非没有风险，例如，假设部署主流企业IT基础设施的既定流程将在复杂的人工...

人工智能 2024-05-10 人工智能

867阅读

开发者的LlamaIndex入门指南

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ LlamaIndex是一个专注于检索增强生成(RAG 的工具，可以协助您丰富大模型的数据提示。本文将用实例向您展示和介绍。众所周知，...

AIGC 2024-05-07 人工智能

1270阅读

瑜伽球上遛「狗」！入选英伟达十大项目之一的Eureka有了新突破

机器狗在瑜伽球上稳稳当当的行走，平衡力那是相当的好：各种场景都能拿捏，不管是平坦的人行道、还是充满挑战的草坪都能 hold 住：甚至是研究人员踢了一脚瑜伽球，机器狗也不会歪倒：给气球放气机器狗也能保持平衡：上述展示都是 1 倍速，没有经过...

生成式AI 2024-05-06 人工智能

814阅读

Sora大片真相：人工特效参与，被指误导大众

啊？Sora火爆短片《气球人》，也“造假”了？？？背后艺术家团队的最新揭秘，可谓一石激起千层浪：原来，视频画面并非完全由AI生成，其中有大量视觉效果需要人类后期实现。 be like：这下网友不干了，合着大家伙儿跟OpenAI玩真心，OpenAI...

生成式AI 2024-04-29 人工智能

794阅读

AI 计算创业公司FlexAI 获得3000万美元种子资金

AI 计算创业公司 FlexAI 近日宣布获得3000万美元的种子资金，正式走出隐形模式。该公司成立于去年，团队成员包括来自苹果、英特尔、英伟达和特斯拉的前员工。总部位于巴黎的 FlexAI 试图通过其按需云服务来颠覆基础设施市场。图源备注：图片由AI...

AIGC 2024-04-26 人工智能

804阅读

量化、剪枝、蒸馏，这些大模型黑话到底说了些啥？

量化、剪枝、蒸馏，如果你经常关注大语言模型，一定会看到这几个词，单看这几个字，我们很难理解它们都干了些什么，但是这几个词对于现阶段的大语言模型发展特别重要。这篇文章就带大家来认识认识它们，理解其中的原理。模型压缩量化、剪枝、蒸馏，其实是通用的神经网络...

大数据 2024-04-26 人工智能

903阅读

2023年AAAS Fellow名单出炉！信息计算领域：浙大教授、中科大校友当选

4月18日，世界上最大的综合性科学学会之一，同时也是Science期刊出版商的美国科学促进会（AAAS），官宣了2023年的AAAS Fellow名单。来自24个领域的502名科学家、工程师和创新者，将获得这一科学界的终身荣誉。新当选的Fellow绝...

大数据 2024-04-22 人工智能

914阅读

如何利用Transformer有效关联激光雷达-毫米波雷达-视觉特征？

本文经自动驾驶之心公众号授权转载，转载请联系出处。笔者个人理解自动驾驶的基础任务之一是三维目标检测，而现在许多方法都是基于多传感器融合的方法实现的。那为什么要进行多传感器融合?无论是激光雷达和相机融合，又或者是毫米波雷达和相机融合，其最主要的目的就是...

大数据 2024-04-20 人工智能

944阅读

Parler-TTS官网体验入口 AI语音生成工具免费使用地址

Parler-TTS是一个由 Hugging Face 开发的轻量级文本转语音（TTS）模型，能够以给定说话者的风格（性别、音调、说话风格等）生成高质量、自然 sounding 的语音。它是基于 Dan Lyth 和 Simon King 发表的论文《Na...

生成式AI 2024-04-11 人工智能

828阅读

AIGC之gradio系列学习教程（二）Components

简述：让我们继续了解一下 Gradio 的一些主要功能。本指南旨在对构建演示时应注意的各种事项进行高级概述。 Components Gradio 包含 30 多个预构建组件（以及许多用户构建的自定义组件），只需一行代码即可在演示中用...

人工智能 2024-04-08 人工智能

1712阅读

stable-diffusion-webui踩坑指南

过年刷资讯AI的信息铺天盖地，准备研究研究。最后选择从AI绘画的stable diffusion入手。本地安装了最新的Python（13.12.2）然后直接克隆GitHub - Stability-AI/stablediffusion: High-Reso...

生成式AI 2024-04-08 人工智能

958阅读

ICCV 2023 | 最全AIGC梳理，5w字30个diffusion扩散模型方向，近百篇论文！

30个方向130篇！CVPR 2023最全AIGC论文 25个方向！CVPR 2022 GAN论文汇总 35个方向！ICCV 2021 最全GAN论文汇总超110篇！CVPR 2021 最全GAN论文梳理超100篇！CVPR 2...

大数据 2024-04-07 人工智能

1661阅读

马斯克造大模型，从特斯拉连挖高管

当全球首富埃隆・马斯克（Elon Musk）建立 xAI，准备与 OpenAI、谷歌竞争大模型时，他必须与众多科技巨头、初创公司争夺人才。不过，他使用了一些取巧的办法：从自家的特斯拉挖来了几名优秀工程师。该初创公司的网站显示，上个月，机器学习...

生成式AI 2024-04-07 人工智能

890阅读

AIGC知识库一周精华

元宇宙、大语言模型和智能设计是当前人工智能领域的重要发展趋势。元宇宙将虚拟和现实世界融合，开启了新的数字化交互时代。大语言模型的应用和研究不断推进，提示工程和函数调用等工具不断涌现，为人们提供更高效的文本生成和处理能力。智能设计领域...

AIGC 2024-04-07 人工智能

946阅读

GPT-5红队测试邮件曝光，最早6月发布？网友在线逼问Altman，数十亿美元超算26年启动

GPT-5已经开始红队测试了? 就在这几天，网上已经有多人晒出了OpenAI发给自己的红队录取通知书。此前有传闻说，GPT-5将于今年6月发布。看起来，红队测试与模型发布的时间线十分吻合。有网友直接晒出了自己收到OpenAI邮件邀请的截图。这...

生成式AI 2024-04-06 人工智能

861阅读

DALL·E 2（内含扩散模型介绍）【论文精读】Hierarchical Text-ConditionalImage Generation with CLIP Latents

1官方对模型的介绍大家好，今天我们就一起来看一下两个月之前 OpenAI 刚放出来的一篇力作。DALL·E 2是 OpenAI 一系列文本图像生成工作的最新一篇。去年 1 月份他们先推出了Dolly，然后在年底的时候又推出了glide。...

大数据 2024-04-05 人工智能

1263阅读

开源！超越ZoeDepth！ DepthFM：快速且精确的单目深度估计！

本文经自动驾驶之心公众号授权转载，转载请联系出处。 0. 这篇文章干了啥？提出了DepthFM：一个多功能且快速的最先进的生成式单目深度估计模型。除了传统的深度估计任务外，DepthFM还展示了在深度修复等下游任务中的最先进能力。DepthFM效率高...

AIGC 2024-04-03 人工智能

877阅读

Stable Diffusion下载安装，保姆级教程指南！

一、了解Stable Diffusion 1、Stable Diffusion（简称SD）是一种图像生成模型，主要用于生成以文本生成图像，图片生成图片，图片修复等，由慕尼黑路德维希马克西米利安大学CompVis 小组和Runway的研究人员提出，由...

大数据 2024-04-02 人工智能

1416阅读

全网最全Stable Diffusion原理说明！！简单明了容易理解！！！

手把手教你入门绘图超强的AI绘画程序Stable Diffusion，用户只需要输入一段图片的文字描述，即可生成精美的绘画。下面是Stable Diffusion注册和使用的方法。给大家带来了全新Stable Diffusion保姆级教程资料包（文末可获取...

大数据 2024-04-01 人工智能

1388阅读

【Stable Diffusion初学者指南】模型指南

文章目录微调模型什么是微调？人们为什么要制作Stable Diffusion模型？模型是如何创建的？流行的Stable Diffusion模型 Stable diffusion v1.4 Stable diffusion v1....

生成式AI 2024-04-01 人工智能

1998阅读

增强包容性：如何利用Edge ML支持具有特殊需求的个人

译者 | 李睿审校 | 重楼科技进步为具有特殊需要的人带来了新的解决方案。边缘机器学习(Edge ML 是一项开创性技术，它使机器学习算法更接近数据源，从而减少延迟，并提高实时处理能力。本文讨论了Edge ML在解决具有特殊需求的个人所面临的独特...

生成式AI 2024-04-01 人工智能

947阅读