-
使用 Stable Diffusion Img2Img 生成、放大、模糊和增强
在线工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 3D数字孪生场景编辑器 Stable Diffusion...
-
Text2Immersion官网体验入口 文本到3D沉浸式场景生成AI工具免费下载地址
Text2Immersion是一个创新的工具,专门用于从文本提示生成高质量的3D沉浸场景。该方法首先使用预训练的2D扩散和深度估计模型逐步生成高斯云,然后通过精炼和插值处理来增强生成场景的细节。与传统方法相比,Text2Immersion能够创建包含多种物...
-
MyShell发布开源AI语音克隆工具OpenVoice,瞄准语音模仿领域
MyShell最新推出的开源语音克隆工具OpenVoice引起了广泛关注。这一创新产品由麻省理工学院(MIT)、清华大学以及加拿大人工智能初创公司MyShell合作开发。OpenVoice采用了一种概念简单但高效的方法,可几乎即时克隆用户的语音,并使用明显...
-
ComfyUI实用插件Plush-for-ComfyUI 可在ComfyUI中调用GPT-4和DALL-E3
Plush-for-ComfyUI插件是一个非常有趣的工具,它可以在ComfyUI平台中调用GPT-4和DALL-E3,实现从图片提取提示词并使用DALL-E3在ComfyUI中生成图片。 项目地址:https://top.aibase.com/tool...
-
kaggle竞赛-Stable Diffusion数据分析与baseline
你的目的是来预测我们生成图像的提示词 1.比赛目标 这个竞赛的目标不是从文本提示生成图像,而是创建一个模型,可以在给定生成图像的情况下预测文本提示(你有一堆提示词,你预测是否该提示词参与了图像的生成)?您将在包含由Stable Diffusion 2....
-
AI 绘图:MidJourney 的提示语句(Prompt)怎么写?
这篇文章主要总结了在 AI 绘画中,使用 MidJourney 时提示语句 Prompt 的写法。 1、基本 Prompt 写法 完整的 Prompt 可以分为三个部分:[Image Prompts][Text Prompt][Parameters]...
-
Gemini vs GPT-4V到底哪家强?视觉-语言模型的全面比较和结合使用
概括 大家好,我是戚张扬,目前就读于香港大学,今天和大家分享一篇我们关于视觉语言模型最新的研究,这篇论文提供了对谷歌的Gemini和OpenAI的GPT-4V(ision 两个SOTA模型的深入定性比较研究。我们的研究涉及到对这两个模型在视觉语言能力、与...
-
带你从零开始入门AI绘画神器Stable Diffusion
一、本地部署 Stable diffusion 1. 前言 目前市面上比较权威,并能用于工作中的 AI 绘画软件其实就两款。一个叫 Midjourney(简称 MJ),另一个叫 Stable-Diffusion(简称 SD)。MJ 需要付费使用,而 S...
-
数栈UI5.0设计实战|B端表单这样设计,不仅美观还提效
表单是B端产品中最常见的组件之一,主要⽤于数据收集、校验和提交。比如登陆流程的账号密码填写,注册流程的邮箱、用户名等信息填写,都是表单应用的常见案例,在数栈产品中也是出现频率⾮常⾼的组件。 尽管表单应用十分普遍,但在我们对旧版数栈产品进行调研时,发现许多...
-
Google 推出新 AI SDK,简化在安卓应用中集成最高性能模型 Gemini Pro
Google 近日发布了其新的 Google AI SDK,旨在简化在安卓应用中集成其迄今为止表现最佳的模型Gemini Pro。使用此 SDK,开发者无需构建和管理自己的后端基础设施。 据 Google 介绍,Gemini Pro 是他们最佳的模型,具...
-
Pika 1.0 网页版现已向所有用户开放访问权限 PikaAI体验地址入口
Pika 是一个创意视频制作平台,让用户能够将他们的创意想法转化为高质量的视频。这个平台特别适合需要快速制作推广视频的个人和中小企业,以及有视频创意但缺乏制作能力的创意者。Pika 的主要功能包括支持多种创意想法转视频,视频效果专业,操作简单易用。 Pi...
-
Chat、GPT-4 加上 Midjourney = 一个完美的团队?我可以使用这两种工具创建更好的 AI 图像吗?
每个使用 AI 的人都听说过 Chat GPT,我也听说过。当然,您可以将它用于不同的目的,但我立即想到将它用作 Midjourney 的文本提示编写器。 我在 openai 网站上用我的电子邮件和电话号码注册了一个新帐户,然后开始玩。 什么是“聊天...
-
进行Stable Diffusion的ai训练怎么选择显卡?
Stable Diffusion主要用于从文本生成图像,是人工智能技术在内容创作行业中不断发展的应用。要在本地计算机上运行Stable Diffusion,您需要一个强大的 GPU 来满足其繁重的要求。强大的 GPU 可以让您更快地生成图像,而具有大量 V...
-
14秒就能重建视频,还能变换角色,Meta让视频合成提速44倍
就今天的人工智能发展水平来说,文生图、图生视频、图像/视频风格迁移都已经不算什么难事。 生成式 AI 天赋异禀,能够毫不费力地创建或修改内容。尤其是图像编辑,在以十亿规模数据集为基础预训练的文本到图像扩散模型的推动下,经历了重大发展。这股浪潮催生了大量图...
-
入驻QQ一天就爆满,Midjourney中文版来了
目录 官方中文版上线,名额有限 官方教程,详细可查 社区内的优秀作品 花式鼓励优秀创作者 为你的创作保驾护航 国内模式:当然少不了付费 国内用户实现快速访问 快去体验吧,「折腾没有消失,只是转移到了你的身上…」 国内用户终于可以...
-
6个AI绘画网站,可生成海报
目录 1、Midjourney 2、Stable Diffusion Omline 3、Microsoft Designer 4、Craiyon 5、NightCafe S 6、Wombo 1、Midjourney 特...
-
Stable diffusion的一些参数意义及常规设置
在线stabel Diffusion模型 https://huggingface.co/spaces/stabilityai/stable-diffusion随机种子 seed 如果想要同一个文本提示,生成多次都是同一图像,可以设置一个随机种子,类似于...
-
2023 年最重要的 3 项人工智能创新:多模态 AI、宪法 AI 和文本转视频技术
2023 年,人工智能(AI)领域见证了重大进展,不仅公众对 AI 有了更深的理解,政府也开始认真对待 AI 风险。本年度的发展不仅是新技术和理念的出现,更是长期孕育后的集中爆发。 以下是过去一年中人工智能领域最重要的三项创新: 多模态 AI(Mul...
-
AI创作之如何使用Stable Diffusion AI 将自己变成皮克斯动画角色 (教程含完整操作步骤)
无论您想成为下一个伍迪、下一个巴斯光年,还是将您的鱼变成下一个尼莫,Stable Diffusion都能实现。使用这种潜在的文本到图像扩散模型,您只需一个简单的文本提示,就可以将自己变成任何皮克斯角色的样子。 在本文中,我将向您展示如何在本地 PC 上运...
-
阿里追影官方体验入口在哪 AI视频生成软件推荐
阿里追影是一款基于扩散模型的可控视频生成框架,用于生成高质量的定制化人类舞蹈视频。追影软件的体验入口在哪呢,这里我们来看下追影的官方体验入口。 >>>点击前往 追影 官方体验入口<<< 它的功能主要有以下三个: 身份控...
-
【AIGC】Photoshop AI Beta版本安装使用(永久免费)
AIGC 大爆发 Adobe近日宣布,Photoshop(测试版)应用程序发布了生成式AI绘图,这是世界上第一个创意和设计工作流程的副驾驶,为用户提供了一种神奇的新工作方式。生成式AI绘图由Adobe Firefly提供支持,Adobe的创意生成AI模型...
-
IP-Adapter-FaceID官网体验入口 AI人脸图像软件app免费下载地址
IP-Adapter-FaceID是一款基于人脸识别模型的实验性图像生成工具。该模型使用LoRA技术提高面部ID的一致性,能够仅通过文本提示生成各种风格的人脸图像。那么,IP-Adapter-FaceID在哪里可以体验呢?下面就给大家带来IP-Adapte...
-
11 位作家加入针对 OpenAI 和微软的诉讼
11位非虚构作家,包括普利策奖得主泰勒·布兰奇(Taylor Branch)、斯泰西·舍夫(Stacy Schiff 和凯·伯德(Kai Bird 等人,已加入了一起针对OpenAI和微软的侵权诉讼。 图源备注:图片由AI生成,图片授权服务商Midjou...
-
文心一言AI大模型,前端接入
文心一言AI大模型,前端接入 一、参考接口资料 模型广场:https://console.bce.baidu.com/qianfan/modelcenter/model/buildIn/list 我的应用:https://console.bce.bai...
-
CVPR 2023 | 可控文生图/定制化文生图领域论文详解 AI作画增强版
可控文生图/定制化文生图 1、DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation DreamBooth是一种新的文本到图像扩散模型...
-
Copilot 用户现可通过Suno AI插件创作自己的 AI 歌曲
微软的 AI 聊天机器人 Copilot 现在可以随时创作 AI 歌曲,这要归功于与 Suno 的新插件合作。Suno 是一家位于剑桥的 AI 音乐初创公司,在 Discord 上提供了一个工具,可以根据文本提示创作一首原创歌曲,包括歌词。 现在,Copi...
-
StableVideo:使用Stable Diffusion生成连续无闪烁的视频
使用Stable Diffusion生成视频一直是人们的研究目标,但是我们遇到的最大问题是视频帧和帧之间的闪烁,但是最新的论文则着力解决这个问题。 本文总结了Chai等人的论文《StableVideo: Text-driven consistency -...
-
谷歌AI提出视觉语言模型PixelLLM:能够进行细粒度定位和视觉语言对齐
谷歌AI研究团队与加州大学圣迭戈分校的研究人员合作,提出了一种名为PixelLLM的智能模型,旨在解决大型语言模型在细粒度定位和视觉-语言对齐方面的挑战。这一模型的提出受到了人类自然行为的启发,尤其是婴儿描述其视觉环境的方式,包括手势、指向和命名。 Pix...
-
AI 绘画 | Stable Diffusion 提示词
Prompts提示词简介 在Stable Diffusion中,Prompts是控制模型生成图像的关键输入参数。它们是一种文本提示,告诉模型应该生成什么样的图像。 Prompts可以是任何文本输入,包括描述图像的文本,如“一只橘色的短毛猫,坐在草地上...
-
【Midjourney】Midjourney 基本操作 ③ ( 提示词模板 : 主要内容 / 次要细节 / 标签 / 指令参数 | Explore 搜索并查看提示词 )
文章目录 一、Midjourney 提示词模板 - 主要内容 / 次要细节 / 标签 / 指令参数 二、Midjourney 查看别人的提示词 一、Midjourney 提示词模板 - 主要内容 / 次要细节 / 标签 / 指令参数...
-
AI绘画软件DALL-E3上线,功能强大且免费使用
AI绘画软件DALL-E3上线,功能强大且免费使用 Bing 与 OpenAI 的 DALL-E 3 的合作证明了搜索引擎和人工智能的创造力之间不断发展的协同作用。DALL-E 3 的功能不再局限于技术爱好者和专业人士的领域,现在所有人都可以通过...
-
AI作画升级!一键帮你用Stable Diffusion 生成无限缩放效果视频
在这一篇文章中,我们介绍了利用OpenVINO™优化和加速Stable Diffusion模型的推理,在英特尔®独立显卡上能够根据我们输入的指令(prompt),快速生成我们喜爱的AI画作。今天,我们对这一应用场景再次升级,除了能够作画,利用OpenVIN...
-
Imagen2官网体验入口 谷歌AI文生图软件app免费下载地址
Imagen2 是Google DeepMind开发的最先进的文本到图像扩散技术产品,可生成高品质、逼真的图像,与用户的文字提示紧密对齐。这款技术利用其训练数据的自然分布生成更逼真的图像,而不是采用预设的风格。开发者和Cloud客户可以通过Google C...
-
视频重绘工具DomoAI 不用SD视频一键就能转动漫
DomoAI是一款AI艺术生成器,用户可以通过简单的操作,充分发挥他们的创造力,产生高质量、具有风格的视觉效果。不仅如此,DomoAI提供多种预设人工智能模型,使用户能够轻松地在各种项目中保持一致的绘画风格。这种设计使得用户能够更有效地掌握工具,快速创建令...
-
AI绘画-Midjourney基础1-突破想象的界限:掌握文本引导的图像生成技巧
Midjourney是一款 AI 绘画工具,可以根据你的提示(本文中称为 prompt)创作出各种图像。你只需要在Discord上和一个机器人聊天,就可以用简单的命令来控制它。目前已不支持免费试用,可以选择付费计划来获得更多功能和优势。 目前 Midjo...
-
谷歌文生图巅峰之作Imagen 2登场,实测暴打DALL·E 3和Midjourney!
提问:下面这张图,是AI生图还是照片? 如果不是这么问,绝大多数人大概都不会想到,这居然不是一张照片。 是的,只要在谷歌最新AI生图神器Imagen 2中输入这样的提示词—— A shot of a 32-year-old female, up an...
-
AI工具分享第二期:11款国内外AI绘画提示词工具整理
工具整理自未来百科AI工具箱,更多提示词工具可自行寻找 Midjourney中文教程 Midjourney 学习导航 PromptHero 描述 通过 DALL-E、Stable Diffusion、Midjourney 等...
-
Pika官网体验入口 AI视频编辑软件app免费下载地址
《Pika》是一个革命性的AI视频编辑平台,它使得将创意想法转化为视频变得简单有趣。这个平台正在改变AI视频生成的游戏规则。那么,《Pika》在哪里可以体验呢?下面就给大家带来《Pika》官网体验入口和免费app下载地址。 点击前往《Pika》官网体验入...
-
Snapchat推出AI生成照片功能,Plus会员可定制分享
Snapchat近日宣布为其Plus会员推出了一系列新的人工智能功能,其中包括一种通过AI生成并发送图像的方法。 订阅Snapchat的$3.99计划的用户可以通过在相机界面右侧的工具栏上点击“AI”按钮来使用此功能。这将打开一个窗口,用户可以在其中输入文...
-
Output 推出 Co-Producer:AI 驱动的 Pack Generator 为音乐制作人提供探索灵感的新途径
音乐创作软件公司 Output 今天宣布推出 Co-Producer,这是一项生成式 AI 技术,旨在增强音乐制作中的人类创造力,而非取代它。Co-Producer 的首个工具是 Pack Generator,它允许任何人通过简单的文本提示创建独特的免版税...
-
阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!
继AnimateAnyone之后,阿里又一项“舞蹈整活儿”论文火了—— 这一次,只需一张脸部照片、一句话描述,就能让你在任何地方跳舞! 例如下面这段《擦玻璃》的舞蹈视频: 图片 你所需要做的就是“投喂”一张人像,以及一段prompt: 一个女孩,微笑着,...
-
谷歌副总裁 Sissie Hsiao:Gemini AI 演示视频「完全真实」,尽管谷歌「为了简洁而缩短了部分内容」
在日益激烈的生成型 AI 市场竞争中,谷歌近期推出了其大型语言模型 Gemini 的预告视频。然而,有关该视频真实性的争议随后引发了广泛关注。 谷歌发布的演示视频展示了 Gemini 模型的多模态能力,能够巧妙地解读并处理来自实时视频和音频的信息。这对谷...
-
视频字幕处理+AI绘画,Runway 全功能超详细使用教程(4)
runway的视频字幕处理、AI绘图功能介绍,感觉完全就是为了做电影而布局,一整套功能都上线了!想系统学习的必收藏! 在深度研究Runway各个功能后,无论是AI视频生成及后期处理技术,还是AI图像生成技术,Runway都很能打,AI视频领域大有可为...
-
Ubuntu 本地部署 Stable Diffusion web UI
Ubuntu 本地部署 Stable Diffusion web UI 0. 什么是 Stable Diffusion 1. 什么是 Stable Diffusion web UI 2. Github 地址 3. 安装 Miniconda3 4...
-
HumanGaussian开源:基于Gaussian Splatting,高质量 3D 人体生成新框架
在 3D 生成领域,根据文本提示创建高质量的 3D 人体外观和几何形状对虚拟试穿、沉浸式远程呈现等应用有深远的意义。传统方法需要经历一系列人工制作的过程,如 3D 人体模型回归、绑定、蒙皮、纹理贴图和驱动等。为了自动化 3D 内容生成,此前的一些典型工作...
-
使用stable diffusion webui在本地搭建中文的AI绘图模型
❤️觉得内容不错的话,欢迎点赞收藏加关注???,后续会继续输入更多优质内容❤️ ?有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博相关......)? 博主个人网站原文链接:https://ww...
-
Pika 1.0首测秒杀Gen-2!网友抢先体验电影级炸裂效果,背后技术细节首公开
Pika 1.0正式上线后,拿到内测资格的网友们已经玩疯了! 有人用它生成了一个姜黄色头发女孩和她的姜黄色猫的短片。 以往,因为一致性的难题,用AI视频很难做出优秀的动漫作品。但是Pika 1.0,实在是太给人惊喜了! 更令人震惊的是,作者表示,这是10...
-
专用于手机、笔记本,Stability.ai开源ChatGPT基因的大模型
12月8日,著名开源生成式AI平台stability.ai在官网开源了,30亿参数的大语言模型StableLM Zephyr3B。 Zephyr3B专用于手机、笔记本等移动设备,主打参数小、性能强、算力消耗低的特点,可自动生成文本、总结摘要等,可与70亿、...
-
AI绘图MidJourney提示词详解——美女画法(1)
AI绘图MidJourney提示词详解——美女画法(1) 前言 提示词基本公式 1.1 公式参数说明 编写提示词(Prompt) 2.1 题目 2.2 提示词描述 2.3 生成提示词 获取更多信息 前言 Midjourney...
-
最强人工智能翻车!谷歌承认大模型Gemini造假:视频有剪辑成分
快科技12月8日消息,据国外媒体报道称,号称目前人类最强的人工智能大模型Gemini 1.0才发布一天,就被质疑作假,而谷歌也承认此事了。 为了证实自家人工大模型有多强大,谷歌在昨天上线了展示Gemini的多模态功能视频,随后就取得了百万的观看,不...