clip 第22页 - AIGC资讯

stable-diffusion 预训练模型汇总

目前各个github上各个库比较杂乱，故此做些整理方便查询 Stable UnCLIP 2.1 New stable diffusion finetune (Stable unCLIP 2.1, Hugging Face at 768x768 re...

大数据 2023-11-11 人工智能

925阅读

stable-diffusion官方版本地复现手册（2023年4月10日）

stable diffusion v1.4官方版（CompVis）本地复现手册主页：https://github.com/wjxpro 邮箱：804359553@qq.com 文章目录 **stable diffusion v1...

人工智能 2023-11-11 人工智能

1396阅读

midjournery AI绘画使用指南

midjournery AI绘画使用指南基于Discord的Midjournery配置： https://www.bilibili.com/video/BV16d4y1A7Zq/?spm_id_from=333.337.search-card.a...

大数据 2023-11-11 人工智能

1209阅读

AI专业教您保姆级在暗影精灵8Windows11上本地部署实现AI绘画：Stable Diffusion（万字教程，多图预警）

目录一、Stable Diffusion介绍二、Stable Diffusion环境搭建 1.Anaconda下载与安装 2.Pycharm（IDE）下载与安装 3.CUDA、CuDNN下载与安装三、Stable Diffusion...

生成式AI 2023-11-10 人工智能

1696阅读

华人团队获最佳论文、最佳系统论文，CoRL获奖论文出炉

自 2017 年首次举办以来，CoRL 已经成为了机器人学与机器学习交叉领域的全球顶级学术会议之一。CoRL 是面向机器人学习研究的 single-track 会议，涵盖机器人学、机器学习和控制等多个主题，包括理论与应用。 2023 年的 CoRL 大会...

人工智能 2023-11-10 人工智能

811阅读

LoRa模型训练教程（炼丹，Stable Diffusion）

1. lora介绍（Low Rank Adaption）何为LoRA？LoRA并不是扩散模型专有的技术，而是从隔壁语言模型（LLM）迁移过来的，旨在解决避免将整个模型参数拷贝下来才能对模型进行调校的问题。因为大型语言模型的参数量过于恐怖，比如最近新出...

AIGC 2023-11-10 人工智能

1392阅读

Stable Diffusion 本地部署教程

1.前言：最近看Stable Diffusion开源了，据说比Disco Diffusion更快，于是从git上拉取了项目尝试本地部署了，记录分享一下过程~ 这里是官网介绍：https://stability.ai/blog/stable-diffu...

生成式AI 2023-11-09 人工智能

1154阅读

各种文字生成图片的AIGC模型（openAI、谷歌、stable、Midjourney等）

1 前言 AIGC，全名“AI generated content”，又称生成式AI，意为人工智能生成内容。例如AI文本续写，文字转图像的AI图、视频等。本文主要描述文字生成图片的模型。而且目前扩散模型（Diffusion Models）流行，所以下...

生成式AI 2023-11-09 人工智能

1623阅读

【原创】用 VisualGLM 进行AIGC多模识别和内容生成

最近几个月，整个AI行业的LLM（大语言模型）蓬勃发展，除了过去传统的纯文字的多模态能力的视觉语言模型，如 GPT-4，ImageBind等表现令人印象深刻。 ChatGLM-6B是中文用户使用非常舒服的一个开源中文LLM。2023年5月17日，智谱...

人工智能 2023-11-09 人工智能

1035阅读

Stable-diffusion安装时Can‘t load tokenizer for ‘openai/clip-vit-large-patch14‘问题解决

Can’t load tokenizer for 'openai/clip-vit-large-patch14’问题解决. 如果你在安装stable-diffusion的时候遇到了这个问题，可以下载本博客的绑定资源，然后修改项目中的文件地址就可以了。...

大数据 2023-11-09 人工智能

964阅读

【AIGC】Baichuan2-13B-Chat模型微调

环境微调框架：LLaMA-Efficient-Tuning 训练机器：4*RTX3090TI (24G显存 python环境：python3.8, 安装requirements.txt依赖包一、Lora微调 1、准备数据集 2、训...

大数据 2023-11-09 人工智能

924阅读

ai图片合成要如何操作？看完这篇就知道ai绘画怎么弄了

看看这些图片，是不是很想拿去当头像啊！你们知道这些照片是怎么做的吗？想自己创作出这么好看的头像吗？你听说过ai绘画技术吗？今天我就为大家介绍ai绘画技术是什么，ai图片合成怎么做。话不多说，直接进入正题吧！合成方法一：利用starryai合...

大数据 2023-11-09 人工智能

1079阅读

用语言对齐多模态信息，北大腾讯等提出LanguageBind，刷新多个榜单

在现代社会，信息传递和交流不再局限于单一模态。我们生活在一个多模态的世界里，声音、视频、文字和深度图等模态信息相互交织，共同构成了我们丰富的感知体验。这种多模态的信息交互不仅存在于人类社会的沟通中，同样也是机器理解世界所必须面对的挑战。如何让机器像人类...

人工智能 2023-11-09 人工智能

903阅读

stable diffusion API 调用，超级详细代码示例和说明

本文主要介绍 stable diffusion API 调用，准确来说是对 stable diffusion webui 的 API 调用。接口文档可以查看： http://sd-webui.test.cn/docs 这里的 sd-webui...

人工智能 2023-11-09 人工智能

1005阅读

AI绘图风格对照表/画风样稿详细研究记录及经验总结（分析Midjourney和Stable Diffusion风格提示词实际使用情况）不断更新中...

作为AI绘图头牌的Midjourney和Stable Diffusion，其风格提示词都相同 Midjourney是收费的在线服务，通过discord对话形式来生图，局限较大，但由于官方模型做得好，因此效果非常完美； Stable Diffusion...

大数据 2023-11-09 人工智能

1726阅读

来聊聊近期火爆的几个大模型和自动驾驶概念

本文经自动驾驶之心公众号授权转载，转载请联系出处。近期大模型各种应用依然火爆，10月初前后出现了一系列颇有噱头的文章，试图把大模型应用于自动驾驶。和很多朋友最近也聊了很多相关的话题，写这篇文章，一方面是发现其实包括我在内，在过去其实都混淆了一些很相关...

生成式AI 2023-11-09 人工智能

832阅读

【AI绘画】《超入门级教程：训练自己的LORA模型》，MM超爱的萌宠图片实战

目录前言一、SD-Trainer webui使用介绍二、准备工作 2-1、登录在线训练平台 2-2、购买算力并创建工作空间 2-3、启动工作空间三、开始训练 3-1、打开终端 3-2、准备训练数据 3-3、准备模型文件 3-3-...

生成式AI 2023-11-09 人工智能

2013阅读

〔021〕Stable Diffusion 之提示词反推、自动补全、中文输入篇

✨ 目录 ▷ 反推提示词 / Tagger ▷ 反推提示词 Tagger 使用 ▷ 英文提示词自动补全 / Booru tag ▷ 英文提示词自动补全 Booru tag 使用 ▷ 中文提...

生成式AI 2023-11-09 人工智能

1039阅读

打开stable diffusion webui时，提示缺少clip或clip安装不上的解决方案（windows下的操作）

1.问题描述打开stable diffusion webui时，提示缺少clip或clip安装不上 2.解决方案原因：stable diffusion webui环境中的clip其实是open_clip，不能用pip install clip...

生成式AI 2023-11-09 人工智能

1944阅读

【AI画画教程】无整合包使用LoRA和Dreambooth训练全流程详解（Linux）

前言本教程遵循简单原则，不使用任何民间整合包。目前很多AI画画训练整合包臃肿复杂，教程也是名词乱炖，容易对初学者造成理解误差和使用困难。因为许多整合包都依赖于sd-scripts库，它自身就能支持绝大多数的训练场景，学会这个后，自己也可以根据自己...

人工智能 2023-11-09 人工智能

2661阅读

北大具身智能团队提出需求驱动导航，对齐人类需求，让机器人更高效

如果想让机器人帮助你，你通常需要下达一个较为精准的指令，但指令在实际中的实现效果不一定理想。如果考虑真实环境，当要求机器人找某个特定的物品时，这个物品不一定真的存在当前的环境内，机器人无论如何也找不到；但是环境当中是不是可能存在一个其他物品，它和用户要求...

生成式AI 2023-11-09 人工智能

835阅读

AIGC专栏7——EasyPhoto 人像训练与生成原理详解

AIGC专栏7——EasyPhoto 人像训练与生成原理详解学习前言源码下载地址为什么是Lora EasyPhoto的训练流程 1、数据的预处理 a、人像排序 i、人脸特征向量提取过程 ii、人脸偏移角度计算 iii、人像排序 b...

AIGC 2023-11-08 人工智能

1128阅读

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM-2/LLaMA-2/Baichuan等】的高效工具【预训练+指令监督微

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM-2/LLaMA-2/Baichuan等】的高效工具【预训练+指令监督微调+奖励模型训练+PPO 训练+DPO 训练】的简介、...

人工智能 2023-11-08 人工智能

1161阅读

Stable Diffusion WebUI linux部署问题

当我部署好环境后，准备大张旗鼓开搞时，进入项目地址运行python launch.py后发现下面连接着的报错是 OSError: Can't load tokenizer for 'openai/clip-vit-large-patch14'....

AIGC 2023-11-08 人工智能

2017阅读

【AI绘画--七夕篇】：如何训练Lora模型打造令人惊叹的AI绘画

目录前言一、? 选择合适的云端平台 1-1、云端平台的优势 1-2、选择适合的云端平台二、? 账号注册三、? 开始炼丹 3-1、购买算力并创建工作空间 3-2、启动工作空间 3-3、应用市场一键安装四、? 使用Stable-D...

大数据 2023-11-08 人工智能

1059阅读

万字长文解读Stable Diffusion的核心插件—ControlNet

目录一、介绍二、使用方法三、ControlNet结构 1.整体结构 2.ControlLDM 3.Timestep Embedding 4.HintBlock 5.ResBlock 6.SpatialTransformer 7.S...

人工智能 2023-11-08 人工智能

2101阅读

带你认识一下多模态对比语言图像预训练CLIP

本文分享自华为云社区《多模态对比语言图像预训练CLIP：打破语言与视觉的界限》，作者：汀丶。一种基于多模态（图像、文本）对比训练的神经网络。它可以在给定图像的情况下，使用自然语言来预测最相关的文本片段，而无需为特定任务进行优化。CLIP的设计类似于GP...

生成式AI 2023-11-08 人工智能

890阅读

Stable Diffusion Lora模型训练详细教程

1. 介绍通过Lora小模型可以控制很多特定场景的内容生成。但是那些模型是别人训练好的，你肯定很好奇，我也想训练一个自己的专属模型（也叫炼丹～_～）。甚至可以训练一个专属家庭版的模型（family model），非常有意思。将自己的训练好...

人工智能 2023-11-08 人工智能

2293阅读

大数据项目实战——基于某招聘网站进行数据采集及数据分析（一）

大数据项目实战第一章项目概述文章目录大数据项目实战第一章项目概述学习目标一、项目需求和目标二、预备知识三、项目架构设计及技术选取四、开发环境和开发工具介绍五、项目开发流程总结学习目标掌...

人工智能 2023-11-08 大数据

1298阅读

How To Debug PHP Code And Useful PHP Debugging ...

PHP does not have an internal debugging facility. You can use only external tools to debug PHP code. Here i tried to list down P...

AIGC 2023-11-08 大数据

824阅读

初识PHP(1)：PHP是什么

PHP，Hypertext Preprocessor，翻译过来就是超文本预处理器，是一种在服务器上执行的脚本语言。 PHP可以做什么？那么为什么在HTML，CSS的基础上，还需要PHP呢？前2者在为我们提供静态页面内容的时候，PHP可以为我们...

大数据 2023-11-08 大数据

827阅读

SpringCloud 分布式日志采集方案

前言由于微服务架构中每个服务可能分散在不同的服务器上，因此需要一套分布式日志的解决方案。spring-cloud提供了一个用来trace服务的组件sleuth。它可以通过日志获得服务的依赖关系。基于sleuth，通过使用ELK(elasti...

AIGC 2023-11-08 大数据

889阅读

python爬虫代码运行_怎么运行python爬虫程序

python爬虫程序运行有两种方式：1、在python交互式命令行下直接输入python代码回车运行；2、在命令行中使用“python 文件名.py”。 python运行有两种方式，一种是在python交互式命令行下运行；另一种是使用文本编...

生成式AI 2023-11-08 大数据

921阅读

Windows上的音频采集技术(转)

转自：http://shanewfx.github.io/blog/2013/08/14/caprure-audio-on-windows/ 前一段时间接到一个任务，需要采集到声卡的输出信号，以便与麦克风的输入信号进行混音。之前一直没有研究过音频的相关...

AIGC 2023-11-08 大数据

830阅读

python爬虫：爬取某网站视频

把获取到的下载视频的url存放在数组中（也可写入文件中），通过调用迅雷接口，进行自动下载。（请先下载迅雷，并在其设置中心的下载管理中设置为一键下载）实现代码如下： from bs4 import BeautifulSoup import reques...

AIGC 2023-11-08 大数据

714阅读

ELK日志采集

ELK 即 Elasticsearch、Logstash、Kibana,组合起来可以搭建线上日志系统，在目前这种分布式微服务系统中，通过 ELK 会非常方便的查询和统计日志情况. 本文以 pigx 的 upms 模块为例 ELK 中各个服务的作用...

生成式AI 2023-11-08 大数据

974阅读

AI水印能解决生成式AI的信任问题吗?

随着生成AI技术的飞速发展，人们越来越难以区分AI生成的内容和人工生成的内容。这一挑战引发了一个重要问题:数字水印技术是否能帮助人类重新获得对内容的控制? 数字水印是一种类似于纸币上的水印，它被认为是不可改变的内容附加物，用来指示其来源或出处。最近，美国总...

人工智能 2023-11-07 人工智能

896阅读

AI能理解自己生成的东西吗? 在GPT-4、Midjourney上实验后，有人破案了

从 ChatGPT 到 GPT4，从 DALL・E 2/3 到 Midjourney，生成式 AI 引发了前所未有的全球关注。强大的潜力让人们对 AI 产生了许多期待，但是强大的智能也会引发人们的恐惧和担忧。近期大牛们针对该问题还上演了一场激烈的论战。先...

AIGC 2023-11-05 人工智能

869阅读

AI生图太诡异？马里兰&NYU合力解剖神经网络，CLIP模型神经元形似骷髅头

AI黑盒如何才能解？神经网络模型在训练的时，会有些ReLU节点「死亡」，也就是永远输出0，不再有用。它们往往会被被删除或者忽略。恰好赶上了模糊了生与死的界限的节日——万圣节，所以这是探索那些「死节点」的好时机。对于大多数图像生成模型来说，会输出正...

人工智能 2023-11-03 人工智能

887阅读

Luma AI发布Discord机器人Genie，实现文本生成3D模型

硅谷初创公司 Luma AI 专注于将 AI 技术与3D 内容相结合，例如从智能手机视频中生成 NeRF 或其他3D 格式。现在，该公司发布了一个名为 Genie 的 Discord 机器人，用于生成文本到3D。它可以从文本提示中生成3D内容，并在约20...

人工智能 2023-11-03 人工智能

1049阅读

微软发布Windows 11重大更新人工智能助手Copilot来了

11月1日消息，美国时间周二，软件巨头微软发布了个人电脑操作系统Windows 11的重大更新版本。其中包含了名为Copilot AI的人工智能助手，与人工智能研究公司OpenAI的热门聊天机器人ChatGPT有许多相似之处。据了解，微软Copilo...

AIGC 2023-11-01 人工智能

983阅读

使用Panda-Gym的机器臂模拟进行Deep Q-learning强化学习

强化学习(RL 是一种机器学习方法，它允许代理通过试错来学习如何在环境中表现。行为主体因采取行动导致预期结果而获得奖励，因采取行动导致预期结果而受到惩罚。随着时间的推移，代理学会采取行动，使其预期回报最大化。 RL代理通常使用马尔可夫决策过程(MDP ...

AIGC 2023-10-31 人工智能

1053阅读

图模型也要大？清华朱文武团队有这样一些观点

在大模型时代，图机器学习面临什么样的机遇和挑战？是否存在，并该如何发展图的大模型？针对这一问题，清华大学朱文武教授团队首次提出图大模型（Large Graph Model）概念，系统总结并梳理了图大模型相关的概念、挑战和应用；进一步围绕动态性和可解释性，...

AIGC 2023-10-31 人工智能

990阅读

更高清写实的人体生成模型HyperHuman来了，基于隐式结构扩散，刷新多项SOTA

论文地址: https://arxiv.org/pdf/2310.08579.pdf Github 地址: https://github.com/snap-research/HyperHuman 1. 研究背景与动机随着扩散模型的兴起，一些典型...

AIGC 2023-10-30 人工智能

966阅读

实测腾讯AI文生图！王者荣耀画风一键直出，小程序就能玩

鹅厂大模型，又有新玩法! 发布不到两个月，腾讯混元大模型就速通了一个新版本，除了语言模型升级以外，还悄悄上线了AIGC最火热?的功能—— 文生图。和语言模型一样，文生图同样可以通过微信小程序直接体验。不过与Midjourney独立出图不同，混元的文生...

AIGC 2023-10-27 人工智能

1495阅读

生成式人工智能如何重新定义图像搜索

译者 | 李睿审校 | 重楼近几个月来，生成式人工智能凭借其创造独特的文本、声音和图像的能力引起了人们的极大兴趣。但生成式人工智能的力量并不局限于创造新的数据。生成式人工智能的底层技术（例如Transformer和扩散模型）可以为许多其他应用提供...

人工智能 2023-10-26 人工智能

950阅读

苹果“套娃”式扩散模型，训练步数减少七成！

苹果的一项最新研究，大幅提高了扩散模型在高分辨率图像上性能。利用这种方法，同样分辨率的图像，训练步数减少了超过七成。在1024×1024的分辨率下，图片画质直接拉满，细节都清晰可见。苹果把这项成果命名为MDM，DM就是扩散模型（Diffusion...

人工智能 2023-10-25 人工智能

846阅读

解读OpenAI最强文生图模型—DALL·E 3

Midjourney、Stable Difusion在商业变现和场景化落地方面获得了巨大成功，这让OpenAI看到了全新的商机，也是推出DALL·E3的重要原因之一。上周，OpenAI宣布在ChatGPT Plus和企业版用户中，全面开放文生图模型DAL...

AIGC 2023-10-24 人工智能

1281阅读

HiLM-D：自动驾驶多模态大语言模型玩出花了

本文经自动驾驶之心公众号授权转载，转载请联系出处。笔者个人的一些思考不得不说，最近大模型在学术界火起来了，基于图文匹配的CLIP预训练模型成为近年来在多模态研究领域的经典之作。除此之外，大语言模型的蓬勃发展也进一步为多模态带来了性能提升。自动驾驶领...

人工智能 2023-10-24 人工智能

1052阅读