-
AI绘画Stable Diffusion到底有几个版本?超全SD历史发布版本优缺点解析
大家好,我是设计师阿威 Stable Diffusion 在推出短短两年间已经发布了多个版本,最为人熟悉的就是 Stability AI 推出的 1.5 和 SDXL。那么除此之外,还有哪些版本呢?让我们从最初 Stable Diffusion 的起源开...
-
国产动漫视频AI火了!二次元老婆随意捏,哥特、梦幻、机甲一键get
【新智元导读】视频生成赛道又起新秀,而且还是二次元定制版!稳定产出电影级画面,一键文/图生成视频,即使是「手残党」也能复刻自己喜欢的动漫作品了。 现在,各位二次元萌新们,不用再等「太太」出图啦! 我们不仅可以自己产粮,而且还是会动的那种。 如今,AI视频生...
-
视频多模态模型: VideoChat、Video-LLaMA、Video-ChatGPT、Video-LLaVA等
VideoChat VideoChat?: 基于视频指令数据微调的聊天机器人 https://arxiv.org/pdf/2305.06355.pdf https://github.com/OpenGVLab/Ask-Anything/tr...
-
Amuse .NET application for stable diffusion
Amuse github地址:https://github.com/tianleiwu/Amuse .NET application for stable diffusion, Leveraging OnnxStack, Amuse seamlessl...
-
AI日报:对标GPT-4o!开源大模型Moshi登场;Google Pixel 9新增多个AI功能;ElevenLabs发布消音神器VOICE ISOLATOR
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、对标GPT-4o!开源大模型M...
-
AI 技术创新可以有多硬核? GOTC 2024 论坛议程抢先看
8 月 15 日至 16 日,GOTC 2024 将在上海张江科学会堂盛大开启。GOTC 2024 与上海浦东软件园联合举办,并结合 “GOTC(全球开源技术峰会)” 与 “GOGC(全球开源极客嘉年华)”,旨在打造一场全新的开源盛会。2024 全球开源极...
-
【AIGC半月报】AIGC大模型启元:2024.06(上)
AIGC大模型启元:2024.06(上) (1 ChatTTS(语音合成项目) (2 Mamba-2(大模型新架构Mamba升级) (3 GLM-4 9B(智谱开源LLM) (4 Seed-TTS(字节语音合成) (5 QWen2(阿...
-
AMD 7000系列显卡部署Stable Diffusion(Ubuntu 22.04)
OS Ubuntu 22.04.4 LTS 64-bit GPU AMD® Radeon rx 7600 前言 Ubuntu 22.04 安装 ROCm6.0教程+踩坑http://t.csdnimg.cn/d9vLb 由于之前已经安装了ROCm6...
-
Python爬虫教程,从入门到成神
文章目录 文末有福利 前言 一、为什么使用Python进行网络爬虫? 二、判断网站数据是否支持爬取 三、requests 库抓取网站数据 1.如何安装 requests 库 四、爬虫的基本原理 五、使用 GET 方式抓取数据 六、使用 P...
-
AI绘画Stable Diffusion SDXL高质量强大的动漫大模型AnimagineXL V3.1
模型简介 Animagine XL 3.1可以说是一个比较强大的动漫主题模型,Animagine XL 3.1是 Animagine XL V3 系列的更新, 较Animagine XL 3.0版本有了很大的增强。Animagine XL 3.1版本从文...
-
springboot集成文心一言做一款聊天服务
使用Spring Boot集成文心一言(ERNIE Bot)进行毕业设计是一个有趣且实用的项目。文心一言是百度推出的大语言模型,能够提供自然语言理解和生成能力。在Spring Boot项目中集成文心一言,可以构建一个智能对话系统,应用于多种场景,如客户服务...
-
不会写英文提示词?Stable Diffusion提示词大全+插件推荐,快来看看吧!
提示词: 在使用 Stable difussion 这类 AI 绘画大模型,英文不好的朋友遇到最大的难题应该就是提示词该怎么写?如果是使用 Stable Diffusion Web UI,其实有很多插件可以解决这个问题,今天小编就给大家分享一些常用的提...
-
AI绘画Stable Diffusion SDXL 最新万能大模型更新!高质量“万能”大模型筑梦工业XLV5.0来啦!!
大家好,我是向阳 关于“筑梦工业”模型,相信了解AI绘画的家人们应该并不陌生,我个人觉得是一款不错的“万能”类型的大模型。今天就给大家带来了该模型的最新版本——**Dream Tech XL | 筑梦工业XL v5.0 - 与光同尘。**该模型于5月27...
-
【小沐学AI】Python实现语音识别(faster-whisper)
文章目录 1、简介 1.1 CTranslate2 1.2 Intel MKL 1.3 cuDNN 1.4 Transformer 2、下载和安装 2.1 命令行 2.2 代码 3、模型下载 3.1 在线测试 3.1.1 tiny...
-
【机器学习】FFmpeg+Whisper:二阶段法视频理解(video-to-text)大模型实战
目录 一、引言 二、FFmpeg工具介绍 2.1 什么是FFmpeg 2.2 FFmpeg核心原理 2.3 FFmpeg使用示例 三、FFmpeg+Whisper二阶段法视频理解实战 3.1 FFmpeg安装 3.2 Whisper模型下载...
-
掌握Midjourney视觉艺术的关键提示词指南
在数字艺术的海洋中,Midjourney以其独特的图像生成能力脱颖而出,为艺术家和创意工作者提供了前所未有的创造自由。要真正掌握这一工具,理解并有效使用各种提示词至关重要。本文将深入探索Midjourney中的“风格关键词”、“场景关键词”、“视觉关键词”...
-
Stable Diffusion 3上线:登顶最强开源AI绘画模型,笔电手机都能跑丨大量实测
万众瞩目的Stable Diffusion 3终于正式开源了! 目前开源的是20亿参数的版本,据悉之后还会开源40亿和80亿的“大杯”与“超大杯”。 最近母公司Stability AI的坏消息连连,据传账面现金都不够支付算力服务器的租赁费。 欠债一亿...
-
Stable Diffusion涂鸦生建筑效果图教程
一、演示内容: 1、SD的photopea插件涂鸦发送之controlnet, 2、用scribble+shuffle预处理, 3、zaha的lora, 4、提示词描述 所有的AI设计工具,模型和插件,都已经整理好了,文末扫码即可免费获取噢~...
-
AI绘画人物(头像)设计提示词大全
1、 年龄性别 age sex 中文 英文 中文 英文 幼年,男 Childhood, male 少年,女 Adolescence, female 幼年,女 Childhood, female 青年,男 Youth, male 少年,男...
-
Whisper.cpp 0基础搭建音频文件转文字(Windows下C++)
介绍 whisper.cpp是一个开源项目,它是对OpenAI的Whisper模型的C/C++移植实现。 OpenAI的Whisper是一个自动语音识别(ASR)系统,经过大量多语言和多任务的监督数据训练,能够进行多语言语音识别、语音翻译和语言识别等任...
-
在阿里云上用LLaMA-Factory微调大模型
相信很多小伙伴都想自己手搓大模型,所以有大佬做了LLaMA-Factory,但是有工具还不行,还得有环境,说实话,我现在每天除了上班就是带孩子,连游戏都没得打,所以自己连个有GPU的电脑都没[苦笑]。 基于以上前提条件,唯一方法只得通过云服务来帮我们微调...
-
vscode激活GitHub Copilot报错,登录不了github
Timed out waiting for authentication provider to register 是github身份验证被禁用了 打开文件-->首选项-->配置文件(默认)--显示配置内容 启用之后重新登录就...
-
AET生态新纪元:数字人AIGC平台发布会在香港成功举办
香港,3月28日——在人工智能技术与数字经济迅速发展的今天,AET生态系统迎来了历史性的一刻,成功举办了AET数字人AIGC平台的发布会。这一重要事件不仅吸引了来自科技、金融、教育等多个领域的精英人士,更展示了AET对推动全球数字经济发展的坚定承诺和远见。...
-
stable diffusion超详细局部重绘教程!
【小新课堂:什么是蒙版?】 *蒙版:重绘区域,相当于蒙在原图上的一张新画纸。 在SD中,与蒙版有关的参数主要有: ①蒙版(边缘)模糊:设置重绘区域和原图的融合程度,类似PS中的选区羽化,数值较小,边缘越锐利,数值一般默认即可 【图像较大的话,也...
-
android集成百度文心一言实现对话功能,实战项目讲解,人人都能拥有一款ai应用
大家好,今天给大家讲解下如何实现一个基于百度文心一言的app功能,app内部同时集成了讯飞的语音识别。本文适用于有android基础的小伙伴阅读,文章末尾放上本项目用到的全部实例代码,在使用前请务必看完本文章。 先来给大家看看效果。 百度文心一...
-
【AIGC】基于大模型+知识库的Code Review实践
目录 一、背景描述 二、技术原理 三、基于大模型与知识库的Code Review实践 1、选择合适的大模型与知识库 2、集成大模型与知识库到Code Review流程 3、结合人工审查 4、持续优化与改进 四、技术细节 1、gitlab配...
-
掌握 GitHub Copilot:6个代码自动补全的必备技巧前言
GitHub Copilot 是一款由人工智能驱动的编码助手,它能够根据上下文提供代码建议,极大地加快了开发过程。在之前介绍如何激活 Copilot 的文章之后,本文将深入探讨六个关键技巧,以高效利用 GitHub Copilot。 1. 快捷键使用...
-
AI厂商拿Robots协议当草纸,互联网秩序“礼乐崩坏”
就在一众AI大模型厂商还在为盈利发愁时,英伟达靠卖算力已成功登顶全球市值第一公司的宝座,再次证明了当淘金热汹涌时候、只有卖铁铲的最赚钱。但训练大模型不仅要算力、还要有数据,以至于Reddit、X等内容平台纷纷做起了数据买卖这个生意。只不过,如今这个生意也越...
-
Llama3-Tutorial(Llama 3 超级课堂) 学习笔记
课程资料 五一 Llama 3 超级课堂 | 第二节 Llama 3 微调个人小助手认知(XTuner版)_哔哩哔哩_bilibili SmartFlowAI/Llama3-Tutorial: Llama3-Tutorial(XT...
-
每日AIGC最新进展(20):基于树的长视频理解VideoTree、IBM研究院提出AI生成图片生成检测、蚂蚁集团提出AI生成视频检测工具、CMU提出大型视频-语言模型
Diffusion Models专栏文章汇总:入门与实战 VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos 本文介绍了一种名...
-
Figma也开始卷AI了,设计师又要完蛋了?
作为一个曾经干了快10年的老设计狗,现在听到最多的就是: 设计师要完蛋啦~ 今天是视觉完蛋了,明天是原画完蛋了,后天是平面完蛋了。 反正听那意思,管你是个啥,但凡粘个设计两字,在AI时代,那你就都得完蛋。 不过在这反反复复听了一年多的完蛋的历史中,啥设计分...
-
百度文心一言 java 支持流式输出,Springboot+ sse的demo
参考:GitHub - mmciel/wenxin-api-java: 百度文心一言Java库,支持问答和对话,支持流式输出和同步输出。提供SpringBoot调用样例。提供拓展能力。 1、依赖 <dependency> <group...
-
让AI听话的一种办法(Stable Diffusion进阶篇:SVD 3)
动态内容在上一篇笔记里学会了参数以及文生图生视频的操作,可能还是会有小伙伴觉得进行一些参数的改动或者就目前的产出结果还不到自己的预期。 例如像是动作幅度太小,眼睛不够有神等,而也是SVD的一个缺点,它所产出的动态内容某种程度上是不可控的。 就现阶段...
-
这可能是最强AI文生图工具:Stable Diffusion 3 超详细测试
最近文生图领域最重要的消息,就是Stable Diffusion 3的推出。 目前,有两种使用Stable Diffusion 3的方法,一种是通过API调用,这需要在Stability AI开发者平台申请API Keys: Stability AI开...
-
stable-diffusion-webui出现NansException: A tensor with all NaNs was produced in Unet
环境:秋叶大佬的stable-diffusion-webui启动器 操作系统:windows11 问题描述,当我更新了webui的版本以及更新了一些插件后跑xl或者批量处理图生图时出现如下错误: NansException: A tensor with...
-
【CS.AI】AI引领编程新时代:深度探索GitHub Copilot
文章目录 引言 0. TOP TAKEAWAYS 重要要点 1. Copilot的基本功能 2. 技术原理 3. 优势与局限 优势 局限 4. 使用体验 4.1 初次使用 4.2 在 JetBrains 全家桶中使用 GitHub C...
-
Stable Diffusion 3: Research Paper
Stable Diffusion 3: Research Paper 1. 核心理念 扩展模型 (Stable Diffusion 在與 DALL·E 3、Midjourney v6 和 Ideogram v1这些图像生成系统相比,在书写效果以及...
-
Midjourney如何集成到自己(个人/企业)的平台(三-完结)
前两篇文章写如何注册和配置 Midjourney如何集成到自己(个人/企业 的平台(一) Midjourney如何集成到自己(个人/企业 的平台(二) 这篇文章是完结篇,也是代码篇,本文章内容描述开发语言为Java,使用框架为SpringBoot,废...
-
GitHub Copilot 登录账号激活,已经在IntellJ IDEA使用
GitHub Copilot 想必大家都是熟悉的,一款AI代码辅助神器,相信对编程界的诸位并不陌生。 今日特此分享一项便捷的工具,助您轻松激活GitHub Copilot,尽享智能编码之便利! GitHub Copilot 是由 GitHub 和 Op...
-
Apache Flink类型及序列化研读&生产应用|得物技术
一、背景 序列化是指将数据从内存中的对象序列化为字节流,以便在网络中传输或持久化存储。序列化在Apache Flink中非常重要,因为它涉及到数据传输和状态管理等关键部分。Apache Flink以其独特的方式来处理数据类型以及序列化,这种方式包括它自身...
-
[Stable Diffusion/LDM] High-Resolution Image Synthesis with Latent Diffusion Models
这篇讲解很详细,可以参考:https://zhuanlan.zhihu.com/p/634573765 附上苏神的讲解:生成扩散模型漫谈(二十二):信噪比与大图生成(上) - 科学空间|Scientific Spaces...
-
AIGC专栏11——EasyAnimateV2结构详解与Lora训练 最大支持768x768 144帧视频生成
AIGC专栏11——EasyAnimateV2结构详解与Lora训练 最大支持768x768 144帧视频生成 学习前言 源码下载地址 EasyAnimate V2简介 技术储备 Diffusion Transformer (DiT Mo...
-
llama factory 是如何加载数据集 通过对数据集加载的代码的理解编写自定义数据集训练代码
第一层从训练代码追踪到以下代码 def get_dataset( tokenizer: "PreTrainedTokenizer", model_args: "ModelArguments", data_args: "DataAr...
-
增强大型语言模型(LLM)可访问性:深入探究在单块AMD GPU上通过QLoRA微调Llama 2的过程
Enhancing LLM Accessibility: A Deep Dive into QLoRA Through Fine-tuning Llama 2 on a single AMD GPU — ROCm Blogs 基于之前的博客《使用Lo...
-
Midjourney保姆级注册教程
先看一下Midjourney社区图库中展示的作品。 可以看到不管是设计质量还是设计风格的多样性,AI绘画作品都让人惊叹。 而这些高质量的作品输出,你只要掌握一些关键词的描述方法,就能做到不错的AIGC绘画输出了。 接下来,我们开始Midj...
-
深入浅出解析Stable Diffusion中U-Net的核心知识与价值 | 【算法兵器谱】
Rocky Ding 公众号:WeThinkIn 写在前面 【算法兵器谱】栏目专注分享AI行业中的前沿/经典/必备的模型&论文,并对具备划时代意义的模型&论文进行全方位系统的解析...
-
AI写代码! 神器copilot在线安装(IDEA)
!!!正在学编程、算法的请千万不要依赖此插件,否则你可能甚至无法手写出一个for循环 GitHub Copilot 插件对IDEA最低版本要求是2021.2,建议直接用2023.3,一次到位反正后续要升级的。 打开 IntelliJ IDEA扩展商店,...
-
LlamaFactory-Ollama-Langchain大模型训练-部署一条龙
前言 近些日子,大模型火的一塌糊涂,那么现在就有义务要学习一套好用的、从 dataset --> train --> deploy 的一整套流程,好拿来装逼。话不多说,进入正题 Train 框架 目前好用的框架太多,如BELLE, C...
-
挑战Midjourney,融合近百个SD大模型的通用模型AlbedoBase XL
在SDXL的通用模型中,DreamShaperXL和juggernautXL这2款大模型一直都深受广大AI绘画者的喜爱,不可否认,这2款通用模型在很多方面表现都相当出色。 今天再给大家介绍一款基于SDXL的通用大模型:AlbedoBase XL,作者的目...
-
【进阶篇】Midjourney如何最大限度精准控图,做到收放自如?
和朋友们一起玩MJ也已经快两个月了,从一开始的惊喜,到现在的平淡,大家都开始思考这个到底我们应该怎么用?而不是仅仅是为了满足自己对MJ本身的好奇心,以及生出一张美图时的那种喜悦感。 目前大家最多的疑问就是,怎样更精准的控制图片输出,然后又怎样让图片更富有...