-
AI绘画:Lora模型训练完整流程!
关于AI绘画(基于Stable Diffusion Webui ,我之前已经写过三篇文章,分别是 软件安装,基本的使用方法,微调模型LoRA的使用。 整体来说还是比简单的,搞个别人的模型,搞个提示词就出图了。今天来一个有些难度的,自己训练一个LoRA微...
-
Stable Diffusion实现之 Huggingface
Stable Diffusion 以及Huggingface的安装实现 介绍: Stable Diffusion AI是指将Stable Diffusion模型应用于人工智能领域的相关技术和方法。通常情况下,Stable Diffusion AI主...
-
20分钟,使用Amazon SageMaker快速搭建属于自己的AIGC应用
真火! 作为最近一段时间人工智能领域内的顶流之一,AIGC(AI-Generated Content)早已火爆出圈,频登各大互联网平台热搜。 cite: 微软亚洲研究院官方微博 这段时间以来,基于深度学习的内容生成在图像、视频、语音、音乐、...
-
兵马俑跳《科目三》,是我万万没想到的
家人们,火爆全球的魔性舞蹈《科目三》,谁能料到,就连兵马俑也开始跳上了! 图片 热度还居高不下,瞬间被轰上了热搜,小伙伴们纷纷惊掉了下巴表示“闻所未闻,见所未见”。 图片 这到底是怎么一回事? 原来,是有人借助了阿里之前走红的AI技术——AnimateA...
-
万字长文谈自动驾驶BEV感知
本文经自动驾驶之心公众号授权转载,转载请联系出处。 prologue 这有可能是更的最长的文章系列了,先说为什么,一方面是看到分割大模型对小模型的提升效果需要时间,另一方面是之前对自动驾驶的BEV算法做了很长时间的预研,自己也应该好好梳理一下了。 (很...
-
如何在亚马逊 SageMaker 进行 Stable Diffusion 模型在线服务部署
文章目录 前言 - 浅谈 AIGC AIGC - 引领人工智能走向春天 春天里盛开的 AI 绘画 AI 绘画之Stable Diffusion 2.0 登场 人人都有机会成为前沿的技术探索者 基于Amazon SageMaker进行Stab...
-
AI平台:全智能AI一键生成PPT - 爱设计PPT
全智能AI一键生成PPT - 爱设计PPT开始生成 企业解决方案 创意热店 更多 合作API365编辑器设计资讯教育版定制拍摄成为VIP登录 | 注册爱设计PPT全新升级智能应有尽有AI赋能,释放内容创造力AI一键生成PPT说出你的内容主题让AI为你一站式...
-
AI平台:NVIDIA Toronto AI Lab
站点网址:https://nv-tlabs.github.io...
-
AI平台:Filme® -Quality Video Editing Tools to Digitalize Your Storytelling
Filme® -Quality Video Editing Tools to Digitalize Your Storytelling Magi...
-
AI平台:Designs.ai - Creative work done effortlessly
Designs.ai - Creative work done effortlessly productionCreateFace SwapperElectrify your media with face-swapping magicImagemake...
-
AI平台:HOME | How to Leverage AI
HOME | How to Leverage AI top of pageSkip to Main Cont...
-
AI平台:服装设计资讯网站_时尚设计流行趋势预测平台-POP服装趋势网/POP高端趋势网
服装设计资讯网站_时尚设计流行趋势预测平台-POP服装趋势网/POP高端趋势网 服装 箱包 鞋子 首饰 家居 云图 官网 版圈 设界 English POP服装趋势国家级纺织服装创意设计示范平台...
-
一句话精准视频片段定位!清华新方法拿下SOTA|已开源
只需一句话描述,就能在一大段视频中定位到对应片段! 比如描述“一个人一边下楼梯一边喝水”,通过视频画面和脚步声的匹配,新方法一下子就能揪出对应起止时间戳: 就连“大笑”这种语义难理解型的,也能准确定位: 方法名为自适应双分支促进网络(ADPN),由清...
-
大话Stable-Diffusion-Webui之kohya-ss主题更改
文章目录 kohya-ss kohya-ss主题更改 添加背景图片 更改组件样式 自定义主题规范 更改主题的另一种方式 kohya-ss kohya-ss是一个专门用于训练Dr...
-
AI绘画部署-Stable Diffusion(huggingface API图片生成初体验)
引言 最近,在很多地方都看到了各个大佬用AI生成的神图,索性从网上搜集资料部署一下体验一下AI绘画的魅力。本文基于huggingface API在colab上构建AI绘画。 使用步骤 1.huggingface原始环境地址 https://c...
-
ChatGPT+Ai绘图【stable-diffusion实战】
ai绘图 stable-diffusion生成【还有很大的提升空间】 提示词1 Picture a planet where every living thing is made of light. The landscapes are bre...
-
大模型入局传统算法,LLMZip基于LLaMA-7B实现1MB文本压缩率90%!
论文链接: https://arxiv.org/abs/2306.04050 随着以ChatGPT、GPT-4为代表的AI大模型逐渐爆火进入公众视野,各行各业都开始思考如何更好的使用和发展自己的大模型,有一些评论甚至认为大模型是以人工智能为标志的...
-
AIGC妙笔生花,“诗人艺术家”点亮古诗
女儿 爸爸,帮我看一下这句诗是什么意思呀? 我帮你看下哦,这句诗是…… 老爸 女儿 这样啊,那这句呢?(女儿眨着眼睛好奇的看着父亲) emmm… 老爸 启迪初现:奶爸与古诗的奇妙邂逅 Rob...
-
开源语音识别faster-whisper部署教程
1. 资源下载 源码地址 模型下载地址: large-v3模型:https://huggingface.co/Systran/faster-whisper-large-v3/tree/main large-v2模型:https://huggingf...
-
阿里云容器服务助力万兴科技 AIGC 应用加速
2023 年堪称是 AIGC 元年,文生图领域诞生了 Stable Diffusion 项目,文生文领域诞生了 GPT 家族。一时间风起云涌,国内外许多企业投身 AIGC 创新浪潮,各大云厂商紧随其后纷纷推出自己的大语言模型。在文生图领域落地的企业更多,国...
-
如何制作正能量励志语录短视频保姆级教程: AIGC生成脚本+ elevenlabs AI声音克隆+AI生图+PikaLabs生短视频+Pexels素材+剪映视频剪辑实操全流程演示
课程场景:适合口才不好,文笔不好,不愿意出镜的相关人员学习,经常演讲但是没有时间做口播做录制的老板、讲师和专家,学完本课,不管您是谁,您都将轻松简单的可以开始您的Vlog或者自媒体账号的IP打造之路。 文章目录 一、本课程学习收获 二...
-
Stable Diffusion (持续更新)
引言 本文的目的为记录stable diffusion的风格迁移,采用diffusers example中的text_to_image和textual_inversion目录 2023.7.11 收集了6张水墨画风格的图片,采用textual_...
-
文心一言vsChatGpt-学习Python编程能力
目录 前言 功能测试 1.你会接入广告吗? 2.“电车难题” 3.严刑逼供 4.死后还会有余生吗? 5.我们的宇宙真实吗? 6.我们有自由意志吗? 7.造物主存在吗? 编程能力 1.for循环 2.用python搭建一个博客...
-
解构百度智能云千帆AppBuilder,预见下一代大模型应用
嘉宾|百度智能云技术委员会主席 孙珂 撰稿 | 云昭 2023,如果将全球科技比作一首雄浑热烈的交响曲,那么大模型无疑成为了最为激越人心的主旋律。而与海外大模型的几大巨头你追我赶的激烈竞争叙事不同,国内的大模型发展与创新的轨迹方向,似乎看百度就够了。...
-
AAAI 2024 Fellow公布,清华大学朱军教授入选
AAAI(Association for the Advancement of Artificial Intelligence)是国际人工智能领域最权威的学术组织之一,Fellow 是该学会给予会员的最高荣誉,仅颁给对人工智能做出「非同寻常的卓越贡献者」...
-
GPT-4V开源平替!清华浙大领衔,LLaVA、CogAgent等开源视觉模型大爆发
如今,GPT-4 Vision在语言理解和视觉处理方面展现出了非凡的能力。 然而,如果想在不影响性能的前提下,寻求具有成本效益的替代方案,开源方案就蕴藏着无限可能。 国外的一位开发者Youssef Hosni为大家奉上了三种GPT-4V的开源替代方案,可...
-
[AI绘画] 即插即用!SDXL+T2I-Adapters 高效可控的生成图片
标题:T2I-Adapter: Learning Adapters to Dig out More Controllable Ability for Text-to-Image Diffusion Models 论文:https://arxiv....
-
OpenAI亲授ChatGPT「屠龙术」!官方提示工程指南来啦
应该如何形容 Prompt 工程呢?对于一个最开始使用 ChatGPT 的新人小白,面对据说参数量千亿万亿的庞然巨兽,Prompt 神秘的似乎像某种献祭:我扔进去几句话,等待聊天窗口后的「智慧生命」给我以神谕。 然而,上手 Prompt 之后,操纵 Ch...
-
全面理解Stable Diffusion采样器
全面理解Stable Diffusion采样器 原文:Stable Diffusion Samplers: A Comprehensive Guide 在 AUTOMATIC1111 的 SD webui 中,有许多采样器(sampler)...
-
《满怀美梦的小崽子是pycharm主义者》之服务器部署stable diffusion /diffusers教程
距离上一次教大家在本地部署sd已经过去了........俺也不知道多久了,相信大家现在应该都已经很熟悉了吧,估计大家也发现了一个问题,就是本地的配置跑sd,一个是对配置要求太高了,现在的模型都特别大,没有一张3090根本玩不了,一个是内存啥的根本不够用模型...
-
使用Stable Diffusion生成艺术二维码
在数字艺术的世界中,二维码已经从单纯的信息承载工具转变为可以展示艺术表达的媒介。这是通过使用Stable Diffusion的技术实现的,它可以将任何二维码转化为独特的艺术作品。接下来,我们将一步步教你如何使用Stable Diffusion生成艺术二维码...
-
聊聊拉长LLaMA的一些经验
Sequence Length是指LLM能够处理的文本的最大长度,越长,自然越有优势: 更强的记忆性。更多轮的历史对话被拼接到对话中,减少出现遗忘现象 长文本场景下体验更佳。比如文档问答、小说续写等 当今开源LLM中的当红炸子鸡——LLaMA...
-
Hugging Face使用Stable diffusion Diffusers Transformers Accelerate Pipelines VAE
Diffusers A library that offers an implementation of various diffusion models, including text-to-image models. 提供不同扩散模型的实现的库,代...
-
今年很火的AI绘画怎么玩
1.前言 2022年绝对可以说是AIGC元年,从google搜索的趋势来看,在2022年AI绘画及AI生成艺术的搜索量激增。 AI绘画在这一年的爆发一个很重要的原因就是 Stable Diffusion 的开源,这也来不开这几年 Diffusion...
-
LLM之RAG实战(七)| 使用llama_index实现多模态RAG
一、多模态RAG OpenAI开发日上最令人兴奋的发布之一是GPT-4V API(https://platform.openai.com/docs/guides/vision)的发布。GPT-4V是一个多模态模型,可以接收文本/图像,并可以...
-
Gemini vs GPT-4V到底哪家强?视觉-语言模型的全面比较和结合使用
概括 大家好,我是戚张扬,目前就读于香港大学,今天和大家分享一篇我们关于视觉语言模型最新的研究,这篇论文提供了对谷歌的Gemini和OpenAI的GPT-4V(ision 两个SOTA模型的深入定性比较研究。我们的研究涉及到对这两个模型在视觉语言能力、与...
-
大模型被偷家!CNN搞多模态不弱于Transfromer(腾讯&港中文)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 腾讯AI实验室与港中文联合团队提出了一种新的CNN架构,图像识别精度和速度都超过了Transformer架构模型。 切换到点云、音频、视频等其他模态,也无需改变模型结构,简单预处理即可接近甚至超越SO...
-
嵌入和矢量数据库实操指南
译者 | 布加迪 审校 | 重楼 这场革命的核心是矢量数据库概念,这一突破性发展正在重塑我们处理复杂数据的方式。与传统的关系数据库不同,这种数据库具有管理和处理高维矢量数据的独特功能,这种数据是许多AI 和机器学习应用所固有的。随着我们更深入研究先进AI...
-
带你从零开始入门AI绘画神器Stable Diffusion
一、本地部署 Stable diffusion 1. 前言 目前市面上比较权威,并能用于工作中的 AI 绘画软件其实就两款。一个叫 Midjourney(简称 MJ),另一个叫 Stable-Diffusion(简称 SD)。MJ 需要付费使用,而 S...
-
官方允许!英国法官以后可以用ChatGPT写裁决书了
英国允许法官使用ChatGPT撰写法律裁决书,并发布了官方指南。该指南详细描述了ChatGPT的正确使用方法、潜在风险及示例,适用于司法机构的所有官员、员工。此举标志着司法领域对生成式AI的认可,并将不断完善指南。 早在今年9月16日,英国知名上诉大法官C...
-
基于Gradio/Stable Diffusion/Midjourney的AIGC自动图像绘画生成软件 - Fooocus
0.参考 本项目:GitHub - lllyasviel/Fooocus: Focus on prompting and generating 作者:Lvmin Zhang 编辑 lllyasviel 另一杰作 ContorlNet https...
-
大模型被偷家!腾讯港中文新研究修正认知:CNN搞多模态不弱于Transfromer
在Transformer占据多模态工具半壁江山的时代,大核CNN又“杀了回来”,成为了一匹新的黑马。 腾讯AI实验室与港中文联合团队提出了一种新的CNN架构,图像识别精度和速度都超过了Transformer架构模型。 切换到点云、音频、视频等其他模态,也无...
-
Novel ai(stable-diffusion-webui)的本地部署经历
整体思路 整体参考的就是下面的网站的内容,采用的里面是Anaconda搭建虚拟环境部署的步骤(网站里面用的Miniconda其实上和Anaconda整体思路是一样的) tip:Anaconda的配置是比较简单的,可以直接在网上搜索,需要注意的是建议先卸...
-
CMU权威对比Gemini,GPT-3和Mistral8×7B!GPT-3.5依旧拿捏Gemini,开源模型差距依然不小
谷歌最近发布的Gemini掀起了不小的波澜。 毕竟,大语言模型领域几乎是OpenAI的GPT一家独大的局面。 不过作为吃瓜群众,当然希望科技公司都卷起来,大模型都打起来! 所以,作为科技巨无霸谷歌的亲儿子,Gemini自然承受了很高的期待。 虽然Gemi...
-
昆仑万维或将引领国内 AIGC 技术发展
AIGC 发展历程 如果说 2021 年是元宇宙元年,那么 2022 年绝对可以称作 AIGC 元年。自从 Accomplice 于 2021 年 10 月推出 Disco Diffusion 以来,AIGC 受到了前所未有的关注,相关产品和技术更是以...
-
Install Stable Diffusion WebUI on Ubuntu 22.04.2 LTS
1. Environment OS:Ubuntu 22.04 LTS Kernel:5.15.0-60-generic CPU: Intel(R Xeon(R Gold 6278C CPU @ 2.60GHz, 8vCPUs GPU: 1 * N...
-
量子计算凛冬将至,LeCun:现实冷酷,炒作太多
「量子计算,寒冬将至了?」 本周五,AI 先驱 Yann LeCun 的一番言论引发了人们的讨论。 这位 AI 领域的著名学者表示,量子计算正在进入一个艰难时刻。与此同时,很多科技领域专家认为,目前的量子计算技术进步很多趋向于炒作,距离实际应用仍然很遥...
-
快速实现工程化部署,亚马逊云科技为AIGC产品化提供可靠基础
本文将以Stable Diffusion Quick Kit在亚马逊云科技Amazon SageMaker上的部署来介绍Stable Diffusion模型基础知识,HuggingFace Diffusers接口,以及如何使用Quick Kit在SageM...
-
Stable diffusion的一些参数意义及常规设置
在线stabel Diffusion模型 https://huggingface.co/spaces/stabilityai/stable-diffusion随机种子 seed 如果想要同一个文本提示,生成多次都是同一图像,可以设置一个随机种子,类似于...
-
只需一张图片、一句动作指令,Animate124轻松生成3D视频
近一年来,DreamFusion 引领了一个新潮流,即 3D 静态物体与场景的生成,这在生成技术领域引发了广泛关注。回顾过去一年,我们见证了 3D 静态生成技术在质量和控制性方面的显著进步。技术发展从基于文本的生成起步,逐渐融入单视角图像,进而发展到整合...