-
Lightricks推出AI电影制作工具LTX Studio 可自动生成脚本和分镜头
Lightricks宣布推出全新的AI制作影视工具LTX Studio,旨在帮助创作者更好地可视化故事。这一网络工具将AI技术融入到影视创作的各个环节中,从构思阶段到最终成片,为用户提供了全方位的辅助。 用户只需输入想法,LTX Studio便会根据提示生...
-
copilot和chatGPT的区别
区别: Copilot和ChatGPT是由OpenAI开发的两个不同的工具,用于不同的任务和场景。以下是它们的主要区别: 用途: ChatGPT: ChatGPT是一个生成式语言模型,设计用于与用户进行自然语言交互。它被训练用于回答用户提...
-
【EMNLP 2023】面向Stable Diffusion的自动Prompt工程算法
近日,阿里云人工智能平台PAI与华南理工大学朱金辉教授团队合作在自然语言处理顶级会议EMNLP2023上发表了BeautifulPrompt的深度生成模型,可以从简单的图片描述中生成高质量的提示词,从而使文生图模型能够生成更美观的图像。BeautifulP...
-
Midjourney是什么东西?Midjourney用法详细相关介绍
Midjourney是一个惊人的人工智能(AI 绘画工具,它以超凡的灵活性和创造力使艺术创作变得轻而易举。用户们并不需要具备复杂的绘画技能,只需使用简单的文字提示,就可以引导AI生成独特且充满视觉吸引力的艺术作品。现在,让我们更详细地了解一下Midjour...
-
2月26日央视开播!中国首部文生视频AI动画片发布:AI还原古诗词
快科技2月23日消息,据央视一套”官微,中国首部文生视频AI系列动画片《千秋诗颂》将于2月26日起在CCTV-1综合频道播出。 据介绍,《千秋诗颂》面向小学生,是小学语文课本诗词动画故事系列片,由CCTV-1与人教社合作制作。 栏目结合人教社提供的诗词内容...
-
谷歌暂停AI图像生成功能:承认存在技术缺陷
谷歌周五承认,其人工智能工具Gemini在生成历史人物图像时出现错误,导致图像显示出明显的种族偏差。 本周早些时候,媒体发现Gemini生成了不同种族的纳粹分子和美国开国元勋的图像。例如,当提示生成“1800年代美国参议员”的图像时,Gemini生成了一名...
-
OpenAI推出文本到视频AI生成器Sora
OpenAI推出了Sora,加入了文本到视频的人工智能内容生成竞赛。Sora可以根据用户的提示生成长达一分钟的视频。 该公司展示了几段用Sora制作的令人印象深刻的视频,包括一名女子走在东京的街道上,以及淘金热时代加利福尼亚的历史镜头。 目前推出的是面...
-
llama.cpp中main函数参数
使模型类gpt式交互: ./main -m .\models\llama-2-7b-chat\ggml-model-q4_0.gguf -n 256 --repeat_penalty 1.0 --color -i -r "User:" -f prompt...
-
Sora模型体验入口 OpenAI文生视频软件工具app免费下载地址
Sora是一个基于大规模训练的文本控制视频生成扩散模型。它能够生成长达 1 分钟的高清视频,涵盖广泛的视觉数据类型和分辨率。Sora通过在视频和图像的压缩潜在空间中训练,将其分解为时空位置补丁,实现了可扩展的视频生成。Sora还展现出一些模拟物理世界和数字...
-
Sora官网体验入口 OpenAI最新文生视频模型免费在线使用地址
Sora是一个基于大规模训练的文本控制视频生成扩散模型。它能够生成长达 1 分钟的高清视频,涵盖广泛的视觉数据类型和分辨率。Sora通过在视频和图像的压缩潜在空间中训练,将其分解为时空位置补丁,实现了可扩展的视频生成。Sora还展现出一些模拟物理世界和数字...
-
OpenAI首个视频生成模型发布 一句话生成1分钟高清视频
快科技2月16日消息,OpenAI日前发布首款文生视频模型Sora模型,完美继承DALLE 3的画质和遵循指令能力其支持用户输入文本描述,生成一段长达1分钟的高清流畅视频。 该模型可以深度模拟真实物理世界,标志着人工智能在理解真实世界场景,并与之互动的能力...
-
【AIGC】Stable Diffusion的插件入门
一、上文中作者使用插件包的方式下安装插件,用户也可以从Stable Diffusion的界面安装插件,如下图所示,在相应的插件后面点安装按钮。 二、介绍一些比较好用的插件 “adetailer” 插件是 Stable Diffusion 中的一个增强...
-
最简单粗暴的Stable Diffusion Webui本地部署教程!让每个人都能自己实现AI画图!
先放两张自己画的图片镇楼。 什么是Stable Diffusion Webui Stable Diffusion WebUI是 Stable Diffusion 的浏览器界面,Stable Diffusion...
-
在Meteor Lake上测试基于Stable Diffusion的AI应用
上个月刚刚推出的英特尔新一代Meteor Lake CPU,预示着AI PC的新时代到来。AI PC可以不依赖服务器直接在PC端处理AI推理工作负载,例如生成图像或转录音频。这些芯片的正式名称为Intel Core Ultra处理器,是首款配备专门用于处理...
-
Phoncent博客,AI写作助手,助力文学创作
在当今信息爆炸的时代,写作已经成为了人们生活中不可或缺的一部分。然而,对于许多人来说,写作并不是一件轻松的事情。有时候,我们可能会遇到写作灵感枯竭、构思困难、内容不连贯等问题。但是,现在有了AI写作助手,这些问题将迎刃而解。 AI写作助手是一种创新的技...
-
Taiyi-Diffusion-XL体验入口 中英文双语文生图AI模型开源工具在线使用地址
Taiyi-Diffusion-XL是一款开源的基于 Stable Diffusion 训练的双语文生图生成模型。该模型支持英文和中文的文本到图像生成,相比之前的中文文生图模型有了显著提升。Taiyi-Diffusion-XL 能够根据文本描述生成照片般逼...
-
把图像视为外语,快手、北大多模态大模型媲美DALLE-3
当前的大型语言模型如 GPT、LLaMA 等在自然语言处理领域取得了显著进展,能够理解和生成复杂的文本内容。但你是否想过,如果能够将大语言模型这强大的理解和生成能力迁移到多模态数据上,就可以轻松理解海量的图像与视频,并辅助创作图文并茂的内容。近期,来自快...
-
菜鸟初进stable diffusion
不知道是不是玩novelai被boss看到了,推荐了我学stable diffusion 扩散模型 DALL E Midjourney stable diffusion latent diffusion 说是改进点在于“给输入图片压缩降低维度,...
-
Midjourney使用教程:三 图片风格提示
这里我根据现在的官方文档来继续我们的Midjourney的教程,看到这里如果你去实践的话,估计你已经有了好多张属于自己的图片。 这时候你不在满足简单的提示生成的Midjourney的默认风格图片,实际上你可以通过一些关键词做提示,来改变输出的图片风格,像...
-
Midjourney 提示词工具(10 个国内外最好最推荐的)
Midjourney,是一个革命性的基于人工智能的艺术生成器,可以从被称为提示的简单文本描述中生成令人惊叹的图像。Midjourney已经迅速成为艺术家、设计师和营销人员的首选工具(包括像我这样根本不会设计任何东西的无能之辈)。 为了帮助你开始使用这个强...
-
扩散模型更懂复杂提示词!Pika北大斯坦福开源新框架,利用LLM提升理解力
Pika北大斯坦福联手,开源最新文本-图像生成/编辑框架! 无需额外训练,即可让扩散模型拥有更强提示词理解能力。 面对超长、超复杂提示词,准确性更高、细节把控更强,而且生成图片更加自然。 效果超越最强图像生成模型Dall·E 3和SDXL。 比如要求图片...
-
Artisse AI融资670万美元,打造更逼真的AI摄影应用
近日,AI摄影应用Artisse宣布成功融资670万美元,该公司专注于提升其AI生成照片的逼真度。与其他市场上的竞争对手一样,用户通过上传自己的照片,训练Artisse的AI模型,然后使用文本或图像提示生成各种不同场景、姿势和风格的新照片。 不同于竞争对手...
-
SoulGen官网体验入口 AI生成动漫女孩图像使用方法教程
SoulGen是一款强大的AI艺术生成器,可以根据文字描述或提示生成逼真的真实/动漫女孩图像。如果您想了解如何使用SoulGen以及其主要特点,请继续阅读。 SoulGen官网地址入口 SoulGen的用途 SoulGen主要适用于以下人群: 需要生成真...
-
AIGC内容分享(二十):「AI视频生成」技术核心基础知识和模型应用
目录 何为AI视频? 一、技术发展概况 二、代表模型及应用 三、仍存在许多技术难点 何为AI视频? 「AI视频」通常指的是由人工智能(AI)技术生成或处理的视频。这可能包括使用深度学习、计算机视觉和其他相关技术来改善视频的质...
-
大模型自我奖励:Meta让Llama2自己给自己微调,性能超越了GPT-4
大模型领域中,微调是改进模型性能的重要一步。随着开源大模型逐渐变多,人们总结出了很多种微调方式,其中一些取得了很好的效果。 最近,来自 Meta、纽约大学的研究者用「自我奖励方法」,让大模型自己生成自己的微调数据,给人带来了一点新的震撼。 在新方法中,作者...
-
Github Copilot 的使用方法和快捷键*
GitHub Copilot是一款由GitHub开发的人工智能代码助手,它可以根据上下文和提示生成代码片段和建议。以下是使用GitHub Copilot的基本方法和一些常用的快捷键: 安装和启用:在支持的编辑器(如Visual Studio Code...
-
图像提示词攻略--基于 stable diffusion v2
Stable Diffusion 是一种潜在的文本到图像扩散模型,能够在给定任何文本输入(称为提示)的情况下生成逼真的图像。 在本文中,我将讨论和探索一些提高提示有效性的方法。从在提示中添加某些关键字和组合词、从更改单词顺序及其标点符号开始到更改画面,颜...
-
TikTok测试一项AI歌曲创作功能“AI Song”
正文: TikTok 推出了许多多年来广为流传的歌曲,但现在它正在测试一项功能,让更多人在人工智能的帮助下锻炼歌曲创作技能。 AI Song 在大型语言模型 Bloom 的帮助下根据文本提示生成歌曲。用户发帖时可以在文本字段上写下歌词。然后,TikTok...
-
如何使用ChatGPT + Midjourney批量生成图片
我们都知道,视觉内容对于一个内容创作者来说非常重要。但是,对于没有设计技能的人来说,制作视觉内容可能是一项很困难的任务。不过,随着人工智能技术的不断进步,我们可以使用一些AI工具来帮助我们创建视觉内容,例如使用ChatGPT和Midjourney批量生成图...
-
Microsoft Copilot Android App已经发布
我的新书《Android App开发入门与实战》已于2020年8月由人民邮电出版社出版,欢迎购买。点击进入详情 微软Copilot Android APP发布 介绍 微软最近为其 Copilot Assistanton...
-
亚马逊APP测试新AI功能,不仅能解答产品问题还能逗你笑
亚马逊正在其适用于 iOS 和 Android 的移动应用程序中测试一项新的 AI 功能,让客户可以询问有关产品的具体问题。人工智能工具可以帮助准确计算出新货架有多大,确定电池可以使用多长时间,甚至......给你写一首关于雪地靴的圣诞颂歌。 新功能旨在用...
-
如何优雅的使用ChatGPT指令,指令大全
充当 Linux 终端 我希望你充当Linux终端。我将键入命令,您将回复终端应显示的内容。我希望你只回复一个唯一代码块中的终端输出,没有别的。不要写解释。除非我指示你这样做,否则不要键入命令。当我需要用英语告诉你一些事情时,我会把文本放在大括...
-
OpenAI组建新团队:收集公众意见以确保AI大模型"与人类价值观保持一致"
1月17日消息,美国当地时间周二,人工智能领域的佼佼者OpenAI在其博客上宣布,他们正在组建一个名为“集体对齐”(Collective Alignment)的全新团队。 这个团队主要由研究人员和工程师构成,将专注于设计和实施收集公众意见的流程,以帮助...
-
【AIGC】IP-Adapter:文本兼容图像提示适配器,用于文本到图像扩散模型
前言 IPAdapter能够通过图像给Stable Diffusion模型以内容提示,让其生成参考该图像画风,可以免去Lora的训练,达到参考画风人物的生成效果。 摘要 通过文本提示词生成的图像,往往需要设置复杂的提示...
-
Stable Diffusion/Win/本地部署
一、本地部署 Stable Diffusion 前言 目前市面上比较权威,并能用于工作中的AI绘画软件其实就两款。一个叫Midjourney(简称MJ),另一个叫Stable-Diffusion(简称SD)。MJ需要付费使用,而SD开源免费,但是上手难...
-
「文生图」再升级!学习个性化参照,无限生成多样图片,轻松设计玩具建筑
最近,来自南加州大学、哈佛大学等机构的研究团队提出了一种全新的基于提示学习的方法——DreamDistribution。 这种方法可以让任何基于文字提示的生成模型(比如文生图、文生3D等),通过一组参照图片来学习对应的视觉属性共性和变化的文本提示分布。...
-
AI绘画权益纠纷:你的创作是否触碰了版权底线?
最近,北京互联网法院就一起人工智能生成图片(AI绘画图片)的著作权侵权案进行了首次审理并做出了判决。这是中国首例牵涉到“AI文生图”著作权的案件,庭审过程在多个平台进行直播,吸引了众多网友,同时引发了对于AI生成内容与著作权之间关系的广泛讨论。 那么近年...
-
ChatGPT 为 Midjourney 或 DALL-E 等 AI 艺术生成提示
人工智能为创意产业开辟了一个充满可能性的全新世界。人工智能最令人兴奋的应用之一是生成独特的原创艺术作品。Midjourney 和 DALL-E 是人工智能生成艺术的两个突出例子,它们已经引起了艺术家和艺术爱好者的关注。在本文中,将探索如何使用 ChatGP...
-
LLaMA-v2-Chat vs. Alpaca:应该在什么时候使用不同的人工智能模型?
译者 | 李睿 审校 | 重楼 如今,大型语言模型(LLM)正在彻底改变人们的工作和生活,从语言生成到图像字幕软件,再到友好的聊天机器人。这些人工智能模型为解决现实世界的问题提供了强大的工具,例如生成聊天响应或遵循复杂的指令。在这篇关于LLaMA v2的...
-
谷歌MIT最新研究证明:高质量数据获取不难,大模型就是归途
获取高质量数据,已经成为当前大模型训练的一大瓶颈。 前几天,OpenAI被《纽约时报》起诉,并要求索赔数十亿美元。诉状中,列举了GPT-4抄袭的多项罪证。 甚至,《纽约时报》还呼吁摧毁几乎所有的GPT等大模型。 一直以来,AI界多位大佬认为「合成数据」...
-
AI视野:ComfyUI Lora训练节点来了;“ChatGPT之父”结婚;Topazlabs推视频高清放大工具Topaz Video AI4;阿里云推出第八代企业级实例g8i
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI新鲜事 ComfyUI...
-
GPT-4 Turbo现在为Microsoft Copilot提供动力 —— 这里有如何检查你是否有访问权限的方法
如果你是一名开发人员、作家,或者仅仅是一名AI爱好者,到目前为止,你可能已经听说过GPT-4,这是来自OpenAI的最新和最强大的语言模型,OpenAI是ChatGPT背后的公司。GPT-4可以从单个提示生成自然语言文本或代码,在研究人员对摘要任务、写...
-
创新的AI图像生成:Midjourney与Photorealistic插件
引言 在人工智能的众多应用中,图像生成已经成为了一个热门的领域。其中,Midjourney图像创建工具和它的配套插件"photorealistic",以其独特的功能和优秀的性能,吸引了大量的用户。在这篇文章中,我们将详细介绍这两个工具,并通过实例展示它们...
-
Stable Diffusion 超详细讲解
Stable Diffusion 超详细讲解 这篇文章是 《Stable Diffusion原理详解》的后续,在《Stable Diffusion原理详解》中我更多的是以全局视角讲解了 Stable Diffusion 的原理和工作流程,并未深入步骤细...
-
AI视野:阿里开源AnyText;Pika推出付费计划;阿里推文生3D数字人项目;Magnific AI图片分辨率扩大至10K*10K
????大模型动态 阿里开源AnyText 阿里开源多语言视觉文字生成与编辑模型——AnyText,AnyText对生成文字的把控可媲美专业PS,用户可自定义规划文字出现的位置,图片的强度、力度、种子数等,目前在Github超2,400颗星非常受欢迎。...
-
Neuroid:输入文本提示就能快速创建复杂的AI 3D动画
近日,一家名为Nation A的初创公司以其创新性的生成式人工智能技术Neuroid。动画制作一直是一个繁琐、复杂且昂贵的过程,而现在,Nation A的人工智能技术有望彻底改变这一局面。该公司的人工智能可以根据类似GPT的文本提示生成人形角色和四条腿的动...
-
AI绘画部署-Stable Diffusion(huggingface API图片生成初体验)
引言 最近,在很多地方都看到了各个大佬用AI生成的神图,索性从网上搜集资料部署一下体验一下AI绘画的魅力。本文基于huggingface API在colab上构建AI绘画。 使用步骤 1.huggingface原始环境地址 https://c...
-
ChatGPT+Ai绘图【stable-diffusion实战】
ai绘图 stable-diffusion生成【还有很大的提升空间】 提示词1 Picture a planet where every living thing is made of light. The landscapes are bre...
-
大模型中幻觉缓解技术的综合调查
大型语言模型(LLMs)是具有大量参数和数据的深度神经网络,能够在自然语言处理(NLP)领域实现多种任务,如文本理解和生成。近年来,随着计算能力和数据规模的提升,LLMs取得了令人瞩目的进展,如GPT-4、BART、T5等,展现了强大的泛化能力和创造力。...
-
Text2Immersion官网体验入口 文本到3D沉浸式场景生成AI工具免费下载地址
Text2Immersion是一个创新的工具,专门用于从文本提示生成高质量的3D沉浸场景。该方法首先使用预训练的2D扩散和深度估计模型逐步生成高斯云,然后通过精炼和插值处理来增强生成场景的细节。与传统方法相比,Text2Immersion能够创建包含多种物...