-
Pimento 利用生成式AI将创意简报转化为视觉情绪板
Pimento 是一家新的法国初创公司,利用生成式人工智能(AI)以一种有趣的方式进行创意过程的第一步,包括构思、头脑风暴和制作情绪板(mood boards 。最近,该公司从一系列有趣的投资者那里筹集了320万美元(300万欧元 的资金。 Piment...
-
细数【SD-WEBUI】的模型:谁是最适合的模型&从哪里找到它们
文章目录 (零)前言 (一)基础模型(Stable-Diffusion模型) (1.1)ChilloutMix(仿真) (1.2)BasilMix(仿真) (1.3)BeautyProMix(仿真) (1.4)ChikMix(仿真) (1.5...
-
打造AI虚拟数字人,Stable Diffusion+Sadtalker教程
站长笔记 2 个月前 1 1k 如何使用Stable Diffusion整合Sadtalker Stable Diffusion是一个能够根据文本描述生成高质量图片的深度学习模型,它使用了一种叫做潜在扩散模型的生成网络架构,可以在普通的GPU...
-
【大模型AIGC系列课程 2-2】大语言模型的“第二大脑”
1. 大型语言模型的不足之处 很多人使用OpenAI提供的GPT系列模型时都反馈效果不佳。其中一个主要问题是它无法回答一些简单的问题。 ● 可控性:当我们用中文问AI一些关于事实的问题时,它很容易编造虚假答案。 ● 实时性:而当你询问它最近发生的新闻事...
-
什么是 Gemini?关于谷歌新AI模型你应该知道的一切
什么是 Gemini? Google Gemini是谷歌最新发布的强大人工智能模型,不仅可以理解文本,还能处理图像、视频和音频。作为一种多模态模型,Gemini被描述为能够在数学、物理等领域完成复杂任务,同时能够理解并生成各种编程语言中的高质量代码。 Ge...
-
谷歌发布多模态大模型Gemini 1.0 预计明年初向开发者推出
Gemini 是 Google 推出的最新一代 AI 模型,Gemini 具有多模态的能力,可以处理和结合文本、代码、音频、图像和视频等不同类型的信息。 Gemini 分为三种规模:Ultra、Pro 和 Nano,分别针对不同的复杂任务和设备。 Ge...
-
遥遥领先GPT-4!谷歌最强AI大模型Gemini 1.0发布
快科技12月7日消息,在5月举行的开发者大会上,谷歌首次透露其正在开发的AI大模型Gemini,时隔7个月,Gemini终于来了。 据谷歌官方公众号消息,谷歌日前正式发布Gemini 1.0,这是谷歌迄今为止构建的最强大、最通用、最灵活的模型。 据介绍,...
-
Midjourney:一步一步教你如何使用 AI 绘画 MJ
一步一步如何使用 Midjourney 教程:教学怎么用 MJ? 一、Midjourney(MJ)是什么? Midjourney是一款使用文字描述来生成高质量图像的AI绘画工具。这篇文章主要介绍了Midjourney及其用途,并针对Midjour...
-
使用 Diffusers 通过 DreamBooth来训练 Stable Diffusion
邀请参与我们的 DreamBooth 微调编程马拉松活动! DreamBooth 是一种使用专门的微调形式来训练 Stable Diffusion 的新概念技术。一些人用他仅仅使用很少的他们的照片训练出了一个很棒的照片,有一些人用他去尝试新的风格。?...
-
ControlNet多重控制功能推出,AI绘画进入导演时代!
目录 一、“不会开发游戏的AI工具制作者不是好博士” 二、ControlNet出现的背景 三、什么是ControlNet? 四、「神采 Prome AI」的诞生 五、总结 去年DALLE2,Stable Diffusion等文-图底层大模型发...
-
Meta语音达LLaMA级里程碑!开源MMS模型可识别1100+语言
【新智元导读】Meta的大规模多语言语音 (MMS) 项目将彻底改变语音技术,使用wav2vec 2.0的自监督学习,MMS将语音技术扩展到1100到4000种语言。 在语音方面,Meta又达到了另一个LLaMA级的里程碑。 今天,Me...
-
Stable Diffusion - Stable Diffusion WebUI 图像生成工具的环境配置
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131528224 Stable Diffusion WebUI 是...
-
OpenAI COO最新访谈:明年ChatGPT的推理能力会更强,目标惠及所有人
ChatGPT推出已满一周年,目前每周活跃用户约1亿,超过92%的财富500强公司都在使用ChatGPT。但最近几周,OpenAI经历了过山车式的人事变动,首席执行官Sam Altman被董事会罢免后又回归,宣布组建了新的董事会。 美国媒体CNBC在Ope...
-
WeShop官网体验入口 AI商拍一键换衣免费软件app下载地址
《WeShop》是国内首款AI商拍工具,专注于电商产品图片的智能生成。它打破了传统摄影中对模特、经纪、摄影、后期制作、场地租赁和设备等多方面的依赖,实现了在高效产出优质商品图的同时,大幅节约拍摄成本。那么,《WeShop》在哪里可以体验呢?下面就给大家带来...
-
inchat官网体验入口 AI绘画写作助手软件app免费下载地址
《inchat》是一款基于人工智能的绘画与写作助手APP,它集成了图片生成、文章撰写、智能聊天等多种功能,能够显著提高用户的工作效率。它采用先进的深度学习算法,能够根据用户需求自动生成各类高质量图片,并快速撰写出语义流畅、结构清晰的长短文。那么,《inch...
-
MagicAnimate官网体验入口 AI文生动画工具软件app免费下载
《MagicAnimate》是一款使用扩散模型实现的时域一致的人体图像动画工具。它可以通过对人体图像进行扩散模型的运算,实现高质量、自然流畅的人体动画效果。《MagicAnimate》具有高度的可控性和灵活性,可以通过微调参数来实现不同的动画效果。它适用于...
-
MagicAnimate官网体验入口 AI文生视频软件app免费下载地址
《MagicAnimate》是一款利用扩散模型来实现时域一致的人体图像动画工具。这款工具能够通过对人体图像运用扩散模型的计算,创造出高质量且自然流畅的人体动画效果。《MagicAnimate》在哪里可以体验呢?下面就给大家带来《MagicAnimate》官...
-
关于数字孪生的制造业应用,我们需要了解的一切
在智能制造领域,AI驱动的数字孪生已然成为一项关键技术。作为现实世界系统的数字模型/副本,数字孪生使用来自传感器和物联网(IoT)设备的数据提供数字表示,从而实时模拟物理对象或系统。 但在实际应用中,人们对于数字孪生的理解往往参差不齐。下面是一些常见的...
-
微软Copilot史诗级更新!GPT-4 Turbo免费用,必应深度搜索30秒精准解答
刚刚过去的Ignite 2023大会上,纳德拉曾宣布Bing Chat全线更名Copilot,并表示: Copilot无处不在。 今天,微软再次推出Copilot一系列重磅级更新。 它将集成OpenAI最新模型GPT-4 Turbo、DALL-E 3、...
-
必看![文心一言] 中国版ChatGPT“狂飙,傲视诛仙
最近,有一个叫作ChatGPT的技术产品在社交媒体上引起了热议,这是一种基于人工智能的聊天机器人,能够像人类一样进行对话。目前,它在国外的应用已经非常广泛,而中国地区也在迅速跟进。现在,中国版的文心一言来了!这是一款由百度开发的AI,采用了中国文化和语言素...
-
亚马逊AI工具Q被“锤爆”:不够精准、侵犯隐私、存在幻觉、泄露数据
不久前亚马逊推出AI工具“亚马逊Q”,它的竞争对手是微软Copilot。业界本来以为亚马逊来势汹汹,Q应该很不错,但最新报告显示,这款AI工具并不成熟,可能还没有准备好。 Q到底有什么问题呢?The Platformer在报道中说,Q不够精准,侵犯隐私,...
-
国内免费版ChatGPT和AI绘画
一.前言 最近人工智能技术很火热,特别是AI对话和AI绘画这两个领域,可以对用户提出的问题进行分析和理解并给出相应的答案或解决方案,生成高质量、具有艺术价值的绘画作品,功能非常强大。 然而国内使用存在限制,大多数普通用户体验不了,提供一个国内在线网页,...
-
3张照片打造专属形象!酷蛙FaceChain解密个人写真开源项目,人人AIGC!
一、背景说明 各类AI写真软件由于其精准的个人形象+精美的生成效果引爆了朋友圈传播,证件照满足了用户刚需,古装照等风格照满足了用户“美照”的需求。 酷蛙FaceChain开源项目团队推出了开源版本,希望结合开源社区开发者的力量,可以让图片应用更有趣、更...
-
如何用ai写文章?ai写作的三个步骤分享给你
近年来,随着人工智能技术的飞速发展和应用,越来越多的领域开始尝试使用ai来解决问题。其中,ai写作技术就是一个新兴的领域,它利用机器学习、自然语言处理等技术,通过算法自动生成文章内容。在这个背景下,越来越多的ai写作免费网站开始陆续上线,目的是帮助...
-
教你文本生成图片——stablediffusion
今天来点轻松的话题,带大家玩一个用文字生成图片的模型。 相信大家如果关注AIGC领域,对文本生成图片,对Stablefiffusion、DEALL.E应该不陌生。今天给大家介绍的就是基于SD2 finetune出来的一个模型() 这篇文章不会...
-
ai写作软件哪个好?这三个软件很好用
随着人工智能的不断发展,ai写作软件正逐渐成为现代写作者的得力助手。这些智能工具结合了自然语言处理和机器学习技术,能够生成高质量的文本内容,为我们提供了前所未有的写作支持。然而,在市场上存在着众多ai写作软件,使得选择一个适合自己需求的工具变得有些...
-
秘塔写作猫官方体验入口 AI写作软件哪个好用
秘塔写作猫是一款基于人工智能的写作辅助平台,可以帮助用户生成、校对、改写、翻译、配图等各种类型的文章。它拥有强大的语言生成能力,可以根据用户的输入和指令自动完成高质量的写作任务。它还提供了浏览器插件和Word插件,方便用户在不同的场景下使用它的功能。 &...
-
加拿大工程院院士宋梁:未来的人工智能系统将会以网络形式存在
12月5日消息 经国务院批准,由科技部和河南省政府共同主办,以“5G变革 共绘未来”为主题的2023世界5G大会将于12月6日至8日在河南省郑州市郑州国际会展中心举行。 围绕“强基韧链与引领带动”、“赋能产业高质量发展”,2023世界5G大会设置12个平...
-
抖音即创官网体验入口 AI视频图文生成软件app免费下载地址
《抖音即创》是一个一站式的智能创意生产与管理平台,集成了视频创作、图文创作、直播创作等多种创意工具,借助 AI 的力量大大提升创作效率。这个平台特别适合新兴创业公司、创意工作室、自媒体等需要大量创意内容的团体或个人。《抖音即创》在哪里可以体验呢?下面就给大...
-
OpenAI的首席运营官谈论ChatGPT的发布、开发人员日和奥特曼的想法
OpenAI的首席运营官Brad Lightcap在接受记者采访时表示:“如果你知道奥特曼,他喜欢在一个话题上快速切换,所以我们在一个话题上花了这么多时间意味着这件事很重要。这是一场辩论——人们并不100%确定这是正确的事情,或者是值得我们花时间...
-
“离谱的AI扩图”火了!张张那叫一个出其不意
家人们,真的是要被抖音AI扩图给笑死了—— 主打一个看完让人“意想不到”、“一肚子气”~ 例如一对恩爱情侣的照片在AI扩图前是非常有信仰感的: △素材来源:抖音@快乐野人 但在AI扩图一通“神操作”之下,画风简直是180度大反转: △素材来源:抖音...
-
性能直追GPT-4,5000个H100训成!DeepMind联创发全新一代大模型
最近,InflectionAI发布了全新的一款AI模型。 更炸裂的是InfectionAI对这款模型的评价——性能直超谷歌和Meta开发的两款模型,紧随OpenAI的GPT-4之后。 到底是什么样的表现让InflectionAI能夸下如此海口呢? 在介绍...
-
【极客技术】真假GPT-4?微调 Llama 2 以替代 GPT-3.5/4 已然可行!
近日小编在使用最新版GPT-4-Turbo模型(主要特点是支持128k输入和知识库截止日期是2023年4月)时,发现不同商家提供的模型回复出现不一致的情况,尤其是模型均承认自己知识库达到2023年4月,但当我们细问时,Fake GPT4-Turbo(暂且这...
-
亚马逊面向企业的 AI 聊天机器人 Amazon Q 或存在严重幻觉和数据泄露问题引发质疑
在发布不到一周后,Amazon Q —— 亚马逊对抗 Copilot 的生成式 AI 助手——已面临生存威胁,一份新报告显示这款 AI 助手可能产生「严重幻觉」。 据 The Platformer援引泄露文件报道,Q 正面临准确性和隐私问题,包括幻觉和数...
-
开源语言大模型演进史:向LLaMA 2看齐
本文是开源 LLM 发展史系列文章的第三部分。此前,第一部分《开源语言大模型演进史:早期革新》回顾了创建开源 LLM 的最初尝试。第二部分《开源语言大模型演进史:高质量基础模型竞赛》研究了目前可用的最受欢迎的开源基础模型(即已进行预训练但尚未微...
-
如何搭建自己的AI绘画平台
官方地址:https://github.com/AUTOMATIC1111/stable-diffusion-webui MacBookPro 14 M1 芯片:Apple M1 Pro 内存:16G 安装虚拟环境,我用的anaconda安装,注...
-
vivo蓝心大模型内测资格获取方法 手机AI大模型哪个好
vivo蓝心大模型是vivo自研的通用大模型矩阵,它包含了十亿、百亿、千亿三个参数量级的模型,可以用于文本、语音、图像等多种模态的场景。vivo蓝心大模型具有以下五个特点:大而全、算法强、真安全、自进化、广开源。vivo蓝心大模型已经应用于vivo的自然语...
-
Pika1.0官网体验入口 AI视频生成编辑工具免费软件app下载地址
《Pika》是一个由Pika Labs开发的AI视频生成和编辑平台。这个初创公司最近宣布,它在由Lightspeed Venture Partners领投的一轮融资中筹集了 5500 万美元,用于进一步开发其平台。《Pika》在哪里可以体验呢?下面就给大家...
-
大模型应用设计的十个思考
技术不是万能的,但没有技术却可能是万万不能的,对于大模型可能也是如此。基于大模型的应用设计需要聚焦于所解决的问题,在自然语言处理领域,大模型本身在一定程度上只是将各种NLP任务统一成了sequence 到 sequence 的模型。利用大模型, 我们是在...
-
国产开源大模型,起风了
科技的浪潮几十年一个轮回,不同的剧本却总是响起相似的鼓点。 如果说,一年前ChatGPT的惊艳现身,是属于大模型时代的「iPhone时刻」;那么,7月间Meta将Llama2开源,则被认为是拉开了大模型时代的IOS与安卓之争。 但区别于移动互联网时代,大模...
-
OpenAI宣布定制化GPT商店推出时间推迟至2024年初
OpenAI近期宣布,将发布定制化GPT Store(GPT商店)的时间推迟至2024年年初。 据路透社援引内部备忘录的消息,OpenAI决定延迟原定于11月份首次开发者大会上介绍的定制化GPT商店推出时间。公司目前正致力于根据用户反馈不断改进GPT,这一...
-
Stable Diffusion在线体验
各位网友观看美图的时候是否想过,如果你也能给自己绘制专属AI美女,是不是很有成就感? 可能你曾经觉得绘画创作一般人很难做到,但AI绘画的出现让一切变得简单。 接触过AI绘画的朋友都知道,用stable diffusion进行绘图一般需要比较高的门槛,对...
-
DetZero:Waymo 3D检测榜单第一,媲美人工标注!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 本文提出了一套离线3D物体检测算法框架DetZero,通过在 Waymo 公开数据集上进行全面的研究和评估,DetZero可生成连续且完整的物体轨迹序列,并充分利用长时序点云特征显着提升感知结果的质...
-
通过Whisper模型将YouTube播放列表中的视频转换成高质量文字稿的项目
项目简介 一个通过Whisper模型将YouTube播放列表中的视频转换成高质量文字稿的项目。 这个基于 Python 的工具旨在将 YouTube 视频和播放列表转录为文本。它集成了多种技术,例如用于转录的 Fast-Whisper、用于自然语言处理...
-
【GitHub Copilot X】基于GPT-4的全新智能编程助手
文章目录 一、前言 1.1 编程助手的重要性和历史背景 1.2 Copilot X 的背景和概览 1.3 Copilot X 的核心技术 二、自然语言处理技术的发展和现状 2.1 GPT-4 技术的基本原理和应用场景 2.2 Copilo...
-
能耗比达到GPT-4 10倍!黄学东亲自解密Zoom AI的成功之道,AI伴侣直接替你开会
近日,AI大佬,现任Zoom CTO的黄学东,在自家的官网上发表了一篇博客。 其中隆重介绍了自己加入Zoom六个月之后创新的成果——Zoom AI Companion,以及驱动Zoom AI Companion的Zoom联邦(federated app...
-
驶向未来,首个多视图预测+规划自动驾驶世界模型来了
近期,世界模型的概念引发了火热浪潮,而自动驾驶领域岂能隔岸观「火」。来自中科院自动化所的团队,首次提出了一种名为 Drive-WM 的全新多视图世界模型,旨在增强端到端自动驾驶规划的安全性。 网站:https://drive-wm.github.io...
-
stable diffusion 描述关键通用词语
负面 paintings, sketches, (worst quality:2 , (low quality:2 , (normal quality:2 , lowres, ((monochrome , ((grayscale , skin sp...
-
Stable Diffusion - SDXL 模型测试与全身图像参数配置
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/132085757 图像来源于 SDXL 模型,艺术风格是赛博...
-
“懒人”设计师必备的AI绘画软件,轻松实现建筑设计闭环
最近这两个月AI设计席卷整个设计圈 现如今手头上没一两个AI工具 你都不好意思说自己是新时代设计师 目前主流的AI绘画软件有midjourney、Stable Diffusion 基本上都能自动打造超高质量的渲染图纸 但即便如此,仍有不少“懒人”...