cli 第24页 - AIGC资讯

用扩散模型监督NeRF，清华文生3D新方法成新SOTA

用文字合成3D图形的AI模型，又有了新的SOTA！近日，清华大学刘永进教授课题组提出了一种基于扩散模型的文生3D新方式。无论是不同视角间的一致性，还是与提示词的匹配度，都比此前大幅提升。图片文生3D是3D AIGC的热点研究内容，得到了学术界和工...

生成式AI 2023-12-29 人工智能

826阅读

ubuntu16.04安装语音识别whisper及whisper-ctranslate2工具（填坑篇）

环境：系统ubuntu16.04，显卡是NVIDIA Quadro RTX5000 目标：安装语音识别工具whipser/whipser-ctranslate2 因之前有过几次在linux和windows上有过部署whisper经验和...

大数据 2023-12-29 人工智能

1245阅读

字节具身智能新成果：用大规模视频数据训练GR-1，复杂任务轻松应对

最近 GPT 模型在 NLP 领域取得了巨大成功。GPT 模型首先在大规模的数据上预训练，然后在特定的下游任务的数据上微调。大规模的预训练能够帮助模型学习可泛化的特征，进而让其轻松迁移到下游的任务上。但相比自然语言数据，机器人数据是十分稀缺的。而且机器...

人工智能 2023-12-29 人工智能

823阅读

堪比Midjourney！上百种风格AI写真丝滑生成，这个开源项目能颠覆照相馆吗？

概览简介 FaceChain 是一个可以用来打造个人数字形象的深度学习模型工具平台。用户仅需要提供最低一张照片即可获得属于自己的个人形象数字替身。结合不同的风格模型和写真模版，可以生成超乎想象空间的个人写真作品。更有意思的...

人工智能 2023-12-29 人工智能

997阅读

AI作画工具 stable-diffusion-webui 本地部署多种模型可生成NSFW

最近，人工智能绘画非常受欢迎。在本文中，我使用了一台带有N卡的电脑，安装了stable-diffusion-webui前端并替换了默认的模型。这样就可以生成高质量的二次元图像，并且可以不受限制地生成图片（在线版通常会阻止NSFW内容的生成）。所需资...

人工智能 2023-12-29 人工智能

2380阅读

一份保姆级的Stable Diffusion部署教程，开启你的炼丹之路 | 京东云技术团队

市面上有很多可以被用于AI绘画的应用，例如DALL-E、Midjourney、NovelAI等，他们的大部分都依托云端服务器运行，一部分还需要支付会员费用来购买更多出图的额度。在2022年8月，一款叫做Stable Diffusion的应用，通过算法迭代将...

人工智能 2023-12-29 人工智能

1030阅读

国产AI绘画海克斯科技——爱作画AIGC开放平台

继AI写作之后，AI绘画技术在今年彻底火了。去年年底，CLIP模型和 Diffusion模型的完美结合，很好地跨过了AI绘画的技术门槛，让AI绘画效果实现质的飞跃，直接达到可商业落地的效果，这一重大技术突破也让AI绘图火出了圈。国外，谷歌、微软...

人工智能 2023-12-28 人工智能

902阅读

【AIGC】图片生成的原理与应用

前言近两年 AI 发展非常迅速，其中的 AI 绘画也越来越火爆，AI 绘画在很多应用领域有巨大的潜力，AI 甚至能模仿各种著名艺术家的风格进行绘画。目前比较有名商业化的 AI 绘画软件有 Midjourney、DALL·E2、以及百度出品...

大数据 2023-12-28 人工智能

1285阅读

stable diffusion安装踩坑之clip安装、git报错

clip本地安装环境链接问题本节主要记录一下在windows安装stable diffusion时，clip脚本安装不上，本地安装时如何链接到当前库的问题首先，在脚本安装clip不成功时，脚本会输出一个commend指令，复制到浏览器就可以很快...

AIGC 2023-12-28 人工智能

1174阅读

在autodl算力云上部署Stable Diffusion

这里写自定义目录标题如何在算力云上部署Stable Diffusion 零、基础环境一、初始准备，用户权限的设置 1.创建非root管理员用户并改主目录为数据盘 2.删除lock锁 3.更改这两个目录权限 4.改python的用户权限...

生成式AI 2023-12-28 人工智能

1621阅读

【Lora模型训练过程报错】Error no kernel image is available for execution on the device at line

错误现象在使用 sd-script训练自己的Lora模型时，可能会出现“Error no kernel image is available for execution on the device at line 167 ”的错误： steps:...

人工智能 2023-12-28 人工智能

1210阅读

【 Bard vs. GPT-4 】ClickHouse 是一款优秀的OLAP大数据引擎，针对 ClickHouse 提出5个问题，并给出参考答案。

【 Bard vs. GPT-4 】ClickHouse 是一款优秀的OLAP大数据引擎，针对 ClickHouse 提出5个问题，并给出参考答案。 3000字。目录...

大数据 2023-12-27 人工智能

718阅读

AI绘画SD插件ControlNet模型解析

ControlNet控制网功能型： IP2P : 环境背景天气修改, 以及单独修改人物， make it xxx 。 Tile分块重采样：忽略细节，并添加新的细节。 Inpaint局部重绘：修改局部时，更能懂得输入的提示词元素。...

大数据 2023-12-26 人工智能

1177阅读

谷歌推出 Google AI SDK，简化在安卓应用中集成高性能模型 Gemini Pro

12 月 26 日消息，谷歌近日推出了全新的 Google AI SDK，旨在简化 Android 应用集成其高性能的 Gemini Pro 模型。借助该 SDK，开发人员无需构建和管理自己的后端基础架构。据谷歌介绍，Gemini Pro 是其功能...

大数据 2023-12-26 人工智能

873阅读

AIGC - 入门向量空间模型

文章目录向量和向量空间向量的运算什么是向量空间？向量空间的几个重要概念向量之间的距离曼哈顿距离（Manhattan Distance）欧氏距离（Euclidean Distance）切比雪夫距离（Chebyshev Dist...

AIGC 2023-12-26 人工智能

852阅读

AI绘画：SDXL1.0正式版+2款软件+多种在线体验方式！

万众期待的最强开源AI模型SDXL1.0终于开源了！ SDXL1.0 是什么？简单来说，它是目前最强大的开源AI绘画模型，开源当然也意味着免费。单纯从模型的角度来看，肯定比SD1.5，SD2.x这种强很多。如果你要寻找...

AIGC 2023-12-26 人工智能

1720阅读

基于whisper模型的在线添加视频字幕网站（持续更新）

1.什么是whisper Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）和多任务（multitask）监督数据对 Whi...

大数据 2023-12-26 人工智能

1425阅读

安装stable-diffusion-webui踩坑经历

软件下载在b站up秋葉aaaki up很贴心有一个整合包可以直接运行。在github下载的原始版本sd-webui ，下载过程遇到clip包安装失败，参考了这两个文章可以解决打开stable diffusion webui时，提示缺少cl...

AIGC 2023-12-26 人工智能

1017阅读

maui 调用文心一言开发的聊天APP 3

主要是对代码进行了优化上一个版本写死了帐号跟密码，这一个帐本有户可以直接设置对相关的key以及secret如果设置错时，在聊天中也会返回提示。注册帐号时同时也设置了key及secrete 升级到了net.8.0 导出APK，上一个版本是导出a...

人工智能 2023-12-25 人工智能

1136阅读

OCR终结了？旷视提出支持文档级OCR的多模态大模型，支持中英文，已开源！

想将一份文档图片转换成Markdown格式？以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤—— 这一次，只需一句话命令，多模态大模型Vary直接端到端输出结果：图片无论是中英文的大段文字：图片还是包含了公式的文档图片...

AIGC 2023-12-25 人工智能

1004阅读

LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention

Paper name LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention Paper Reading Note Paper URL: htt...

人工智能 2023-12-25 人工智能

912阅读

LLama Factory 安装部署实操记录（二）

1. 项目地址 GitHub - hiyouga/LLaMA-Factory: Easy-to-use LLM fine-tuning framework (LLaMA, BLOOM, Mistral, Baichuan, Qwen, ChatGLM E...

人工智能 2023-12-25 人工智能

1770阅读

“私密离线聊天新体验！llama-gpt聊天机器人：极速、安全、搭载Llama 2，尽享Code Llama支持！”

“私密离线聊天新体验！llama-gpt聊天机器人：极速、安全、搭载Llama 2，尽享Code Llama支持！” 一个自托管的、离线的、类似chatgpt的聊天机器人。由美洲驼提供动力。100%私密，没有数据离开您的设备。 Demo http...

AIGC 2023-12-25 人工智能

916阅读

大火的AIGC是什么？能用到工作中哪些地方？

一.AIGC是什么？ AIGC（即Artificial Intelligence Generated Content），中文译为人工智能生成内容。简单来说，就是以前本来需要人类用思考和创造力才能完成的工作，现在可以利用人工智能技术来替代我们完成。在...

生成式AI 2023-12-24 人工智能

1323阅读

AI绘画中CLIP文本-图像预训练模型

介绍 OpenAI 在 2021 年提出了 CLIP（Contrastive Language–Image Pretraining）算法，这是一个先进的机器学习模型，旨在理解和解释图像和文本之间的关系。CLIP 的核心思想是通过大规模的图像和文本对进行...

AIGC 2023-12-24 人工智能

1044阅读

Ubuntu 22.04安装英特尔显卡驱动玩转AIGC

作者：英特尔网路与边缘计算事业部开发者关系经理李翊玮本文将介绍如何使用EIV 用5行指令在快速搭建含英特尔显卡及OpenVINO的AI开发环境, 并简洁说明如何使用OpenVINO 及英特尔显卡优化文生图模型Stable Diffusion 的速度。...

AIGC 2023-12-24 人工智能

1194阅读

昆仑万维或将引领国内 AIGC 技术发展

AIGC 发展历程如果说 2021 年是元宇宙元年，那么 2022 年绝对可以称作 AIGC 元年。自从 Accomplice 于 2021 年 10 月推出 Disco Diffusion 以来，AIGC 受到了前所未有的关注，相关产品和技术更是以...

大数据 2023-12-24 人工智能

917阅读

stable-diffusion安装和简单测试

参考：https://github.com/CompVis/stable-diffusion理解DALL·E 2， Stable Diffusion和 Midjourney的工作原理Latent Diffusion Models论文解读【生成式AI】淺談圖...

人工智能 2023-12-24 人工智能

954阅读

window安装Stable-Diffusion-WebUI详细教程

直接上效果图，这是通过stable diffusion webui 利用古风模型生成的图片，实在是太好看了！！！看了这些图，有没有心痒痒的？今天就来带大家入个门！先把软件搞起来！【前言】 Stable Diffusion是2022年发布的深度学...

生成式AI 2023-12-24 人工智能

1091阅读

【stable-diffusion使用扩展+插件和模型资源（下）】

插件模型魔法图片等资源：https://tianfeng.space/1240.html 书接上文：（上）插件推荐 1.lobe theme lobe theme是一款主题插件，直接可以在扩展安装界面进行了重新布局，做了一些优化，...

AIGC 2023-12-24 人工智能

1030阅读

Install Stable Diffusion WebUI on Ubuntu 22.04.2 LTS

1. Environment OS：Ubuntu 22.04 LTS Kernel：5.15.0-60-generic CPU: Intel(R Xeon(R Gold 6278C CPU @ 2.60GHz, 8vCPUs GPU: 1 * N...

人工智能 2023-12-24 人工智能

920阅读

Llama中文社区开源预训练Atom-7B-chat大模型体验与本地化部署实测(基于CPU，适配无GPU的场景)

一、模型简介原子大模型Atom由Llama中文社区和原子回声联合打造，在中文大模型评测榜单C-Eval中位居前十（8月21日评测提交时间）。 Atom系列模型包含Atom-7B和Atom-...

大数据 2023-12-24 人工智能

1105阅读

LLMs-入门二：基于google云端Colab部署Llama 2

LLMs-入门二：基于google云端Colab部署Llama 2 1、访问网址 2、基础概念 3、选择最适合您的 Colab 方案 4、基于Colab部署开源模型Llama 2 1）在Colab上安装huggingface套件 2）申请调用...

AIGC 2023-12-23 人工智能

991阅读

StableDiffusion产生随机种子(seed)并复制到剪贴板中

随着人工智能AI的兴起，现在AI画图已经风靡全球，其中StableDiffusion以开源、可以本地部署（免费白嫖）引起了包括本人在内的打工人的兴趣。但是每次文生图时，种子（seed）都是随机的，如果手气好，遇见个满意...

AIGC 2023-12-23 人工智能

1166阅读

Stable Diffusion攻略集（Stable Diffusion官方文档、kaggle notebook、webui资源帖）

文章目录第一部分一、 Features：Textual Inversion（文本反转） 1.1 Textual Inversion 简介 1.1.1 摘要 1.1.2 算法 1.1.3 模型效果 1.2 Textual Invers...

AIGC 2023-12-23 人工智能

1364阅读

简单的NovelAI绘画方法

玩法很简单，有电脑就行，但是比较吃配置。我小白都能画出来，你也可以。文章目录需求界面参数排除词 tag tag排序图片生成基本tag 人物形象tag 人物细节tag 按以上tag生成的图片更多tag排序与使用技巧...

人工智能 2023-12-23 人工智能

973阅读

【Stable Diffusion/NovelAI Diffusion的AMD GPU加速推理探索】

测试机子配置： 1：AMD RX6600(显存8g +i5 12600KF 16g内存 (台式机 2：RTX 3070 laptop(显存8g +i7 10870H 32g内存 (HP暗夜精灵笔记本两台电脑平均性能差不多，当然N卡肯定更好一点这边...

人工智能 2023-12-23 人工智能

978阅读

基于MindSpore的llama微调在OpenI平台上运行

基于MindSpore的llama微调在OpenI平台上运行克隆预训练模型克隆chatglm-6b代码仓，下载分布式的模型文件 git lfs install git clone https://huggingface.co/openlm-...

人工智能 2023-12-23 人工智能

926阅读

百度文心一言文心千帆大模型 ERNIE-Bot-turbo调用示例（golang版本）

百度的文心一言推出来也有一段时间了，但是接口部分一直没有公开，需要进行申请最近，有朋友提供了文心千帆大模型的api权限，拿到了必须的参数，现在就来测试一下下面是使用golang封装的文心千帆 ERNIE-Bot-turbo模型的调用示例...

人工智能 2023-12-23 人工智能

991阅读

2023-12-17 AIGC-AnimateDiff详细安装和使用教程

AnimateDiff专用模型下载 AnimateDiff有其自身专门的运动模型mm_sd_v15_v2.ckpt 和专属的镜头运动lora，需要放置在对应的位置。 stablediffusion位置：运动模型放在stable-diffusio...

AIGC 2023-12-23 人工智能

1391阅读

controlnet1.1模型和预处理器功能详解（各预处理器出稿对比及对应模型说明）

ControlNet 1.1 与 ControlNet 1.0 具有完全相同的体系结构,ControlNet 1.1 包括所有以前的模型，具有改进的稳健性和结果质量，且增加并细化了多个模型。命名规范项目名+版本号+标识+基础模型版本+功能...

人工智能 2023-12-23 人工智能

1152阅读

只需一张图片、一句动作指令，Animate124轻松生成3D视频

近一年来，DreamFusion 引领了一个新潮流，即 3D 静态物体与场景的生成，这在生成技术领域引发了广泛关注。回顾过去一年，我们见证了 3D 静态生成技术在质量和控制性方面的显著进步。技术发展从基于文本的生成起步，逐渐融入单视角图像，进而发展到整合...

人工智能 2023-12-22 人工智能

897阅读

Github Copilot 开始收费了, 帮你列出些替代的插件

今天打开 VSCode，弹出了Github Copilot 开始收费的通知可以免费用到 8 月 22 日，每月 70 元还是有些小贵。这里给大家推荐一些替代品： Kite https://www.kite.com/ TabNinehttp...

人工智能 2023-12-22 人工智能

1632阅读

我的大模型观：我眼中的LLM

文章目录大模型是有智能的。也许，大模型是一场骗局？从头训练or微调我想象中的大模型架构大厂的大模型中小厂和个人开发该何去何从？今年，大模型火的一塌糊涂。最近几个月paper with code上，前几名的论文几乎都是生成模...

人工智能 2023-12-22 人工智能

877阅读

【AI大模型】Google Bard (PaLM2) 大模型写代码能力实测: LSM Tree, DAG Scheduler, AI大模型加持自然语言零代码平台设计（福利O：文末附PaLM2访问链接）

禅与计算机程序设计艺术评测结论：当前AI大模型写代码能力当之无愧的 No.1. Google Bard (PaLM2 文章目录禅与计算机程序设计艺术评测结论：当前AI大模型写代码能力当之无愧的 No.1. Google Bard...

生成式AI 2023-12-22 人工智能

961阅读

《ai绘画》最全stable diffusion安装教程所有软件+所有指令

安装cuda，win键搜索nvidia Control Panel，打开软件点击软件左下角系统信息查看自己的cuda版本打开网站，根据自己的版本选择cuda下载网站 https://developer.n...

人工智能 2023-12-21 人工智能

951阅读

Video-LLaMA An Instruction-tuned Audio-Visual Language Model for Video Understanding 用于视频理解的指令调谐视听语言

1.摘要我们提出了一个多模态框架Video-LLaMA1，它使大型语言模型(LLM 能够理解视频中的视觉和听觉内容。视频-来自冻结的预训练视频和音频编码器和冻结的LLM的美洲驼引导跨模式训练。不像以前的工作，补充线性最小二乘法只处理视觉或听觉信号...

人工智能 2023-12-21 人工智能

1140阅读

【黄啊码】StableDiffusion教程从入门到搬砖

上节课教大家怎么免费使用GPU资源，今天就正式带大家进入stable diffusion的教程，废话不多说，开干：目录正面提示词：我们来学习关于权重的知识点：权重语法：分割符组合符连接符分布交替渲染负面提示词：最后在提供一部分常用的提...

人工智能 2023-12-21 人工智能

894阅读

Midjourney之logo设计（建议收藏）

目录宠物诊所的logo设计常见的Logo类型图形logo: 字母LOGO APP LOGO 进阶技巧设置艺术家风格去掉不需要的元素 ChatGPT + Midjourney设计logo 聊天（国产）：文心一言通义千问绘图（...

生成式AI 2023-12-21 人工智能

942阅读

【踩坑笔记】从零开始部署安装Stable Diffusion 2 WebUI

一、材料准备一台带GPU的电脑，系统Ubuntu20.2 Xshell和Xftp，用于连接云主机，传输文件我用的是阿里云ECS，型号ecs.gn6i-c4g1.xlarge（4 vCPU 15 GiB 1 * NVIDIA T4）。推荐挂一个N...

大数据 2023-12-21 人工智能

1196阅读