-
AI绘画利器:Stable-Diffusion-ComfyUI保姆级教程
AI绘画在今天,已经发展到了炽手可热的地步,相比于过去,无论是从画面精细度,真实性,风格化,还是对于操作的易用性,都有了很大的提升。并且如今有众多的绘画工具可选择。今天我们主要来聊聊基于stable diffusion的comfyUI! comfyU...
-
CVPR 2024满分论文,英伟达开源BOP排行榜6D物体姿态第一名方法
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 物体姿态估计对于各种应用至关重要,例如机器人操纵和混合现实。实例级方法通常需要纹理 CAD 模型来生成训练数据,并且不能应用于测试时未...
-
【AIGC】如何在Windows/Linux上部署stable diffusion
文章目录 整体安装步骤 windows10安装stable diffusion 环境要求 安装步骤 注意事项 参考博客 其他事项 安装显卡驱动 安装cuda 卸载cuda 安装对应版本pytorch 安装git上的python包 Q&...
-
到2028年,移动控制机器人市场将达到190亿美元
在机器人技术的动态格局中,移动控制机器人将重新定义跨行业的效率、多功能性和创新。移动控制机器人市场规模预计将从2023年的101.7亿美元增长到2028年的198.1亿美元,预测期内复合年增长率为14.26%。这种快速增长轨迹是由推动移动控制机器人的采用...
-
国内如何购买midjourney?midjourney购买教程?midjourney注册方式
2. Midjourney介绍 Midjourney 是AI 生图工具,输入文字就可以生成精美的图像,从风景到人物,从抽象到具象,应有尽有。你也可以对生成的图片进行放大、变形或重新生成,创造出更多的可能性。 它可以通过输入文字描述,自动生成精美的图像...
-
值得你花时间看的扩散模型教程,来自普渡大学
想了解更多AIGC的内容: 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 扩散模型(Diffusion Model)是图像生成模型的一种。有别于此前 AI 领域大名鼎鼎的 GAN、VAE 等算法,扩散模型另辟...
-
ICLR 2024 | 联邦学习后门攻击的模型关键层
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 联邦学习使多个参与方可以在数据隐私得到保护的情况下训练机器学习模型。但是由于服务器无法监控参与者在本地进行的训练过程,参与者可以篡改本...
-
消息称谷歌考虑对基于 AI 的搜索引擎收费,将部分功能添至高级订阅服务
4 月 4 日消息,据英国《金融时报》援引三位熟悉谷歌的知情人士消息称,谷歌考虑对基于人工智能的搜索收费,这对其商业模式来说是一次重大变化。因为自 2000 年以来,谷歌的搜索产品一直都是依靠广告盈利的。 据报道,谷歌正在考虑保持标准搜索(不含 AI...
-
CVPR 2024录用结果出炉!2719篇论文被接收,录用率23.6%
想了解更多AIGC的内容: 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ CVPR 2024最终录用结果公布了! 刚刚,CVPR官方发文称,今年共提交了11532份有效论文,2719篇论文被接收,录用率为23...
-
第一批掌握AI绘画的人,已经赚到钱了
随着ChatGPT爆火全网 令所有插画、建筑、平面等等 一切跟艺术创作相关岗位为之一震的 智能AI绘画也爆火网络! 超高效率 50s 即出图 秒杀人工作画 超低成本 1美元出图1千张 甚至免费 风格全面 不受风格局限 全风格all in...
-
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 谁能想到,我们多年前的聊天记录、社交媒体上的陈年照片,忽然变得价值连城,被大科技公司争相疯抢。 现在,硅谷大厂们已经纷纷出动,买下所有能...
-
OpenAI 为训练 GPT-4模型转录了超过一百万小时的 YouTube 视频
AI 公司在获取高质量训练数据方面遇到的挑战,OpenAI 为了训练其最先进的大型语言模型 GPT-4,使用了超过一百万小时的 YouTube 视频副本。 据了解,该公司通过其 Whisper 音频转录模型转录这些视频,尽管这一做法在法律上具有争议性,Op...
-
论文怎么降AIGC:六个实用技巧助你优化学术写作
大家好,小发猫降ai今天来聊聊论文怎么降AIGC:六个实用技巧助你优化学术写作,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 论文怎么降AIGC:六个实用技巧助你优...
-
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ GPT-4V 的推出引爆了多模态大模型的研究。GPT-4V 在包括多模态问答、推理、交互在内的多个领域都展现了出色的能力,成为如今最领先...
-
文心一言APP:免费、安全与可靠性深度解析
大家好,小发猫降ai今天来聊聊文心一言APP:免费、安全与可靠性深度解析,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 文心一言APP:免费、安全与可靠性深度解析...
-
ICCV 2023 | 最全AIGC梳理,5w字30个diffusion扩散模型方向,近百篇论文!
30个方向130篇!CVPR 2023最全AIGC论文 25个方向!CVPR 2022 GAN论文汇总 35个方向!ICCV 2021 最全GAN论文汇总 超110篇!CVPR 2021 最全GAN论文梳理 超100篇!CVPR 2...
-
文心一言APP上线定制专属声音功能 只需2秒即可
近日,文心一言APP上线新功能,让用户能够在短短两秒内打造出专属的定制声音。 想要体验这一神奇功能,只需打开文心一言APP,点击下方“+”,然后选择创建智能体。在声音选项里,你会发现一个名为“创建我的声音”的有趣功能。 操作起来非常简单,你只需按照系统提...
-
【AIGC调研系列】kimi与其他AI助手相比的优势和劣势是什么
Kimi与其他AI助手相比,具有以下优势和劣势: 优势: 服务稳定性:Kimi的服务在境内,使用稳定[2]。 多客户端支持:支持网页、APP、小程序等多个客户端,提高了用户的使用便捷性[2][4]。 中文处理能力:Kimi在中文处理方面表现出色...
-
家纺也AI 世纪华通生态成员已量产验布机器人
在一块面料上自动找出各种疵点;每分钟“审视”60米,是人工的3倍,漏报在100米3个以内;灵活配置不同的企业检测标准;结果可生成二维码,按需自动生成详实的报表……具备这些能力的智能验布机器人,已由世纪华通(SZ.002602)生态体系成员艾豚科技自主研发...
-
小白也能微调大模型:LLaMA-Factory使用心得
大模型火了之后,相信不少人都在尝试将预训练大模型应用到自己的场景上,希望得到一个垂类专家,而不是通用大模型。 目前的思路,一是RAG(retrieval augmented generation ,在模型的输入prompt中加入尽可能多的“目标领域”的相...
-
谷歌更新Transformer架构,更节省计算资源!50%性能提升
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 谷歌终于更新了Transformer架构。 最新发布的Mixture-of-Depths(MoD),改变了以往Transformer计...
-
报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
IT之家 4 月 7 日消息,本周早些时候,《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了 AI 公司处理此问题的一些方法,其中涉及到属于 AI 版权法模糊灰色区域的内容。 报道称,OpenAI 迫切需...
-
AI语音识别神器Openai Whisper对中文的支持如何?
文章目录 前言 一、资料准备 二、Whisper环境搭建 第一步:安装whisper 第二步:安装ffmpeg 三、Whisper测试 总结 其他相关 前言 语音识别一直以来都是人工智能领域中一个不容忽视的技术,随着大模型时...
-
AI绘画24年最新的Stable Diffusion整合包安装教程,建议收藏!
1、背景信息 ▍Stable Diffusion 是什么? Stable Diffusion(简称SD)是一种生成式人工智能,于2022年发布,主要用于根据文本描述生成详细图像,也可用于其他任务,如图像的修补、扩展和通过文本提示指导图像到图像的...
-
几款AI写作工具,让写作变得轻松的利器!
一个帮助快速产出高效质量写作的得力助手,能让枯竭的文思得到拯救,不再为任何文案感到苦恼。但是市面上的AI写作工具琳琅满目,质量参差不齐! 我从市面体验了很多AI写作工具,从中挑选出几款神器,希望这些AI写作神器能助你一臂之力! 一、笔灵AI写作...
-
2024-03-21 AIGC-FastGPT-本地知识库问答系统
相关文档: 接入 ChatGLM2-6B | FastGPT (fastai.site 相关步骤: FastGPT配置文件及OneAPI程序:百度网盘 请输入提取码 提取码:wuhe 创建fastgpt目录:mkdir fastgpt...
-
ChatGPT现在能帮你P图了,只需简单说几个字
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 现在,不论是网页、iOS 还是安卓版的 ChatGPT,都可以用上 DALL-E 3 强大的编辑图像功能了。 OpenAI 的 DA...
-
让智能体像孩子一样观察别人学习动作,跨视角技能学习数据集EgoExoLearn来了
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 在探索人工智能边界时,我们时常惊叹于人类孩童的学习能力 —— 可以轻易地将他人的动作映射到自己的视角,进而模仿并创新。当我们追求更高阶...
-
AI写作的困惑与挑战:我们如何应对?
大家好,小发猫降重今天来聊聊AI写作的困惑与挑战:我们如何应对?,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: AI写作的困惑与挑战:我们如何应对? 随着AI技术的飞速发展,AI写作助手正在...
-
百度文库AI智能写作教程:解锁论文写作新境界
大家好,小发猫降ai今天来聊聊百度文库AI智能写作教程:解锁论文写作新境界,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 红薯伪原创官网 - http://hs.k...
-
AI智能写作:巧用AI大模型让新媒体变现插上翅膀【文末送书】
文章目录 一、AI智能写作的崛起 二、AI智能写作与新媒体变现 AI智能写作的挑战与应对策略 AI智能写作:巧用AI大模型让新媒体变现插上翅膀【文末送书】 近年来,人工智能(AI)技术的发展日新月异,逐渐渗透到了各行各业,其中包括新媒体...
-
惊喜!4G显卡也能用Stable Diffusion啦
上周六 Stable Diffusion WebUI 发布了 1.8.0 版本。 新版本主要特点如下: 将touch2.1.2更新到版本 2.1.2,提高了稳定性 FP8 支持,新增了对八位精度模型的支持,降低了硬件门槛 支持 SDXL-I...
-
爬虫原理及反爬虫技术
对于大数据行业,数据的价值不言而喻,在这个信息爆炸的年代,互联网上有太多的信息数据,对于中小微公司,合理利用爬虫爬取有价值的数据,是弥补自身先天数据短板的不二选择,本文主要从爬虫原理、架构、分类以及反爬虫技术来对爬虫技术进行了总结。 1、爬虫技术概述...
-
【AIGC调研系列】苹果MM1大模型与其他模型相比的优势和劣势
苹果MM1大模型与其他模型相比,具有以下优势和劣势: 优势: 多模态能力:MM1是基于大规模多模态预训练的,这意味着它能够处理和理解多种类型的数据(如文本、图像等),在上下文预测、多图像和思维链推理等方面表现出色[7][10]。 少样本学习能力:...
-
[AIGC] 主流工作流引擎对比与适用场景介绍
主流工作流引擎对比与适用场景介绍 工作流引擎在业务流程管理中扮演着重要的角色,它可以帮助组织将复杂的工作流程自动化,降低错误率,提高工作效率。目前市面上有许多优秀的工作流引擎,各自都有着独特的优点和适用的场景。本文将介绍几款主流的工作流引擎,包括它...
-
【Stable Diffusion】图片高清化+面部修复+一键抠图,一些你不知道的事儿
说到后期处理板块,大家第一印象就是图像放大,快速且高效。但是今天要讲的后期处理当中,肯定还有一些是你不知道的事儿。 # 放大算法 首先是关于放大算法,如果大家用的都是秋叶大佬的整合包的话,算法总共应该就是这些。常用的就是“R-ESRGAN 4x+”...
-
千古绝句的意境,用AI来传承 | 通过 AIGC 作画,生成古诗名词的场景
前言 中华上下五千年,那些在这漫漫历史长河里沉淀但又熠熠生辉的诗词,是中华文明的瑰宝。纵观历代诗词市集,满是千古绝唱的诗句: 或气势惊人的 “君不见黄河之水天上来,奔流到海不复回” 或淡妆浅细的 “疏影横斜水清浅,暗香浮动月黄昏” 或意境空悠的...
-
Stable Diffusion 模型下载:Animagine XL(漫画、二次元)
本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里。 文章目录 模型介绍 生成案例 案例一 案例二 案例三 案例四 案例五 案例六 案例七 案例八...
-
DALL·E 2(内含扩散模型介绍)【论文精读】Hierarchical Text-ConditionalImage Generation with CLIP Latents
1官方对模型的介绍 大家好,今天我们就一起来看一下两个月之前 OpenAI 刚放出来的一篇力作。DALL·E 2是 OpenAI 一系列文本图像生成工作的最新一篇。去年 1 月份他们先推出了Dolly,然后在年底的时候又推出了glide。...
-
Ai绘画 | Stable Diffusion常用大模型介绍
哈喽,大家好。 今天给大家分享一下Stable Diffusion中我常用的大模型,主要内容包含它们的流行程度和绘画风格。 还没安装Stable Diffusion的小伙伴可以看一下我往期发布的Stable DIffusion安装教程 注意:大模型存...
-
Win11更新系统后Copilot在任务栏上消失
问题描述 win11系统更新KB5035942后,任务栏的copilot消失了 2024-适用于 Windows 11 Version 23H2 的 03 累积更新,适合基于 x64 的系统 (KB5035942 解决办法 1. 修改注册列表...
-
马斯克透露:将提高特斯拉 AI 工程师薪酬
特斯拉首席执行官马斯克在社交媒体平台上透露,特斯拉将根据进展里程碑逐步提升人工智能工程团队的薪酬待遇。 图源备注:图片由AI生成,图片授权服务商Midjourney 马斯克指出,特斯拉的工程师受到 OpenAI 的挖角,对方开出的高薪诱人,但他将加强防范...
-
音乐ChatGPT 2.0来了!AI作曲家被踢馆,亲测周杰伦爆款大翻车
【新智元导读】200名音乐人联名信抗议的消息刚出,Stability AI的新音乐工具就来了!刚刚发布的Stable Audio2.0,可以创作长达3分钟的音乐,哼哼几句就能给你创作出一段音乐了!不过广大网友和音乐人试用后表示:有点失望…… 200多名音乐...
-
LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调
LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调 文章原始地址:https://onlyar.site/2024/01/14/NLP-LLaMA-Factory-web-tuning/ 引言 大语...
-
马斯克:将提高特斯拉AI工程师薪酬 防止OpenAI挖角
快科技4月5日消息,据媒体报道,特斯拉首席执行官马斯克在面临激烈的人才争夺战中,果断采取行动,不断提高人工智能工程师的薪酬水平。 他在自己的社交媒体平台X(前身为推特)上发帖透露:特斯拉正根据进展里程碑,逐步提升人工智能工程团队的薪酬待遇。” 马斯克指出,...
-
【Python实用API】语音转文本-whisper
Whisper安装及使用教程 0.Whisper介绍 1.Whisper安装 1.1 依赖库安装 1.2 Whisper安装 2.Whisper使用 2.1 Whisper基本使用(语音识别) 2.2 Whisper进阶使用 2.2.1...
-
居然才发现!字节跳动旗下国产AI绘画工具Dreamina,这么好用居然还免费!(强烈推荐)
昨天看到群里说,剪映旗下类似 Sora 的 AI 视频生成工具 Dreamina 开放内测申请了,于是申请了下,顺道发现 Dreamina 还是一个宝藏的 AI 绘画工具。 Dreamina 是剪映旗下的一个 AI 创作平台,目前支持「图片生成」功能,也...
-
华人开源最强「AI 程序员」炸场,让 GPT-4 自己修 Bug!
自从“AI 程序员”Devin问世之后,近期的一大趋势就是程序员们争先恐后地要让自己失业,试图抢先造出比自己更强大的程序员。 普林斯顿大学为软件工程界迎来了一位新星——SWE-agent,论文将在4月10日正式发布,目前项目已在 GitHub 上开源。...
-
探索未来编程利器:Code GeeX、Copilot、通义灵码
各位小伙伴们,大家好!小米今天给大家带来的是一篇关于未来编程利器的探索文章。近年来,随着人工智能技术的不断发展,我们看到了越来越多的智能编程辅助工具的出现,其中包括了Code GeeX、Copilot和通义灵码。那么,究竟这三种工具各自是什么,又有什么样的...
-
群晖NAS使用Docker部署大语言模型Llama 2结合内网穿透实现公网访问本地GPT聊天服务
文章目录 1. 拉取相关的Docker镜像 2. 运行Ollama 镜像 3. 运行Chatbot Ollama镜像 4. 本地访问 5. 群晖安装Cpolar 6. 配置公网地址 7. 公网访问 8. 固定公网地址 随着ChatGPT...