-
[Stable Diffusion进阶篇]使用Roop插件一键换脸
AI领域大神s0md3v,开源了一个用单图就可以进行视频换脸的项目Roop。你只需要一张所需脸部的图像,没有数据集,无需训练,10秒钟一键换脸。本文介绍ROOP本地部署的安装说明 1.安装ROOP插件 方法1:在SD--扩展--从网址安...
-
谷歌研究团队推新AI方法SynCLR:从合成图像和字幕中学习视觉表征
近期,Google Research和MIT CSAIL共同推出了一项名为SynCLR的新型人工智能方法,该方法旨在通过使用合成图像和字幕,实现对视觉表征的学习,摆脱对真实数据的依赖。 SynCLR的工作原理 研究团队首先提出了一个三阶段的方法。首先,在...
-
体验 Google Bard
环境 windows 10 64bit Google Bard python 3.8 简介 本篇介绍一个开源的 Google 聊天机器人Bard 的 API 逆向工程,使用它,可以免费的使用 Bard 服务,项目地址:https://gi...
-
Github爆火AI语音克隆项目OpenVoice,精准进行声音复刻
最近,Github上的一个名为OpenVoice的AI语音克隆项目爆火,该项目由myshell-ai开源,仅开源了不到三周,就有了6.1k的star。 OpenVoice仅需参考说话者的短音频片段,即可复制其声音并生成多种语言的语音。这一技术不仅实现了对音...
-
东京大学开发仿人机器人Alter3 能执行ChatGPT指令
Alter3是由日本东京大学开发的一种仿人机器人。研究人员通过将Alter3与GPT-4相连接,成功实现了让机器人模仿人类行为的目标。为了让机器人执行各种动作,研究人员向Alter3发送了一系列的指令。 通过使用大型语言模型,这些书面指令被转化为机器人可以...
-
使用 OpenLLM 构建和部署大模型应用
本次分享主题为:使用 OpenLLM 快速构建和部署大语言模型的应用。OpenLLM 是一个开源的大语言模型(LLM)开发框架。它支持多种开源的 LLM 模型,并且具有内建的两个关键的 LLM 优化,能够优化内存使用。此外,它与 LangChain 和...
-
OpenAI推出GPT-3.5Turbo微调功能并更新API;Midjourney更新局部绘制功能
? AI新闻 ? OpenAI推出GPT-3.5Turbo微调功能并更新API,将提供GPT-4微调功能 摘要:OpenAI宣布推出GPT-3.5Turbo微调功能,并更新API,使企业和开发者能够定制ChatGPT,达到或超过GPT-4的能力。通...
-
图解tinyBERT模型——BERT模型压缩精华
译者 | 朱先忠 审校 | 重楼 简介 近年来,大型语言模型的发展突飞猛进。BERT成为最受欢迎和最有效的模型之一,可以高精度地解决各种自然语言处理(NLP)任务。继BERT模型之后,一组其他的模型也先后出现并各自展示出优秀的性能。 不难看到一个明显趋势...
-
开源语音识别faster-whisper部署教程
1. 资源下载 源码地址 模型下载地址: large-v3模型:https://huggingface.co/Systran/faster-whisper-large-v3/tree/main large-v2模型:https://huggingf...
-
人工智能生成内容(AIGC)总览记录(认知篇)!!!
文章目录 一、AIGC 引入 1.1 AIGC 定义 1.2 AIGC 历史沿革(了解) 1.3 AIGC 技术演进 二、AIGC 大模型 2.1 视觉大模型提升 AIGC 感知能力 2.2 语言大模型增强 AIGC 认知能力 2.3 多...
-
终端上的GitHub Copilot以及IDE上的GitHub Copilot
GitHub Copilot Github Copilot文档地址:Github Copilot文档 IDE上的 GithubCopilot VSCode 安装VSCode:如果您还没有安装VSCode,请前往VSCode官方网站下载并安装...
-
解决JetBrains IDE中使用GitHub Copilot报错(code:-32603)问题(已挂代理)
简介 在JetBrains IDE中使用GitHub Copilot遇到-32603报错。 本文重点介绍挂了tz开全局代理后依然遇到该问题的解决方法。 报错详情 GitHub Copilot Sign in failed.Reason:Re...
-
whisper使用方法
看这个 github https://github.com/Purfview/whisper-standalone-win/tags 下载 视频提取音频 ffmpeg -i 222.mp4 -vn -b:a 128k -c:a mp3 outpu...
-
OpenAI的ChatGPT、微软的New Bing、百度的文心一言、Google的Bard、阿里云的通义千问
随着 ChatGPT 热潮卷起来,微软发布New Bing、百度发布了文心一言、Google 发布了 Bard,阿里云官方终于也宣布了,旗下的 AI 大模型“通义千问”也正式开启测试! ChatGPT ChatGPT是一种由OpenAI训练的大...
-
斯坦福炒虾机器人爆火全网!华人团队成本22万元,能做满汉全席还会洗碗
今天,会做一大桌子菜的斯坦福机器人Mobile ALOHA刷屏全网。 滑蛋虾仁、干贝烧鸡、蚝油生菜,色香味俱全,看着很诱人。 就拿滑蛋虾仁这道菜来说,Mobile ALOHA在烧水的过程中先打上3颗鸡蛋,然后把虾仁放到水中焯熟,平底锅倒入鸡蛋液再加入...
-
【2024版】最新保姆级stable diffusion安装教程,小白直接点!一键安装,永久使用,stable diffusion下载安装教程!
关于现在非常红火的AI绘画,很多感兴趣的人不知道如何入手,如果你的电脑配置足够好,那么不要犹豫,让我来教你如何在本地电脑全免费运行当下最强大的AI绘画工具——Stable Diffusion 吧!所以本期给大家带来了全新Stable Diffusion 保...
-
AI视野:通义千问上线通义舞王;斯坦福炒虾机器人爆火;Midjourney艺术家数据库泄露;Meta发布AI调试工具HawkEye;小冰大模型获备案
新鲜AI产品点击了解:https://top.aibase.com/ ???AI应用 通义千问上线通义舞王 阿里云通义千问APP近日上线了一项名为“通义舞王”的免费功能,用户只需在APP内输入相应口令并上传照片,系统即可生成个性化的舞蹈视频。 Meta发...
-
开发速率飙升20倍!GPT Pilot明星项目登Github热榜,从0开始构建AI
又一个明星项目诞生了! GPT Pilot,一个AI开发者伴侣,可以从0开始构建应用程序,可以自己编写代码、配置开发环境、管理开发任务、调试代码。 甚至,你可以随时和它聊天提问,帮你解决开发难题。 图片 项目地址:https://github.com/P...
-
Stable Diffusion 安装教程(详细)
引言 如果你只想简单尝试一下,仅仅图一乐,可以通过网页在线体验Stable Diffusion,可以今日免费的网站进行使用(https://stablediffusionweb.com/),只是功能不如本地的多。 本地部署安装Stable Diffus...
-
让机器人感知你的「Here you are」,清华团队使用百万场景打造通用人机交接
来自清华大学交叉信息研究院的研究者提出了「GenH2R」框架,让机器人学习通用的基于视觉的人机交接策略(generalizable vision-based human-to-robot handover policies)。这种可泛化策略使得机器人能更...
-
[linux-sd-webui]api化之训练lora
lora的训练使用的文件是https://github.com/Akegarasu/lora-scripts lora训练是需要成对的文本图像对的,需要准备相应的训练数据。 1.训练数据准备 使用deepbooru/blip生成训练数据,建筑类建议使...
-
Copilot概述:AI助手引领编程新纪元
前言: 随着人工智能(AI)技术的不断进步,编程领域也在逐渐迎来一场革命。GitHub Copilot,作为一款由 OpenAI 和 GitHub 合作开发的编程助手,引发了广泛的关注和讨论。本篇博客将全面概述 Copilot 的背景、功能和影响,探索它...
-
Github Copilot 是什么
GitHub Copilot 是一个由 GitHub 和 OpenAI 合作开发的人工智能代码协助工具。它使用机器学习模型训练,可以为开发者提供实时的代码补全和自动完成功能。Copilot 可以根据上下文和代码语境,为开发者生成代码片段、函数、类等,并提供...
-
维基百科+大模型打败幻觉!斯坦福WikiChat性能领先GPT-4
斯坦福大学的研究人员利用维基百科数据训练了一个大模型,命名为WikiChat,通过优化和改进,成功解决了大模型的幻觉问题,并在事实准确性和其他指标上表现优秀。他们的最佳模型在新的基准测试中获得了97.3%的事实准确性,远远超过了GPT-4的66.1%。此外...
-
端到端的自动驾驶会取代Apollo、autoware这类框架吗?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 Rethinking the Open-Loop Evaluation of End-to-End Autonomous Driving in nuScenes 作者单位:百度 作者:共一 Jian...
-
llama.cpp LLM模型 windows cpu安装部署踩坑记录
一直想在自己的笔记本上部署一个大模型验证,早就听说了llama.cpp,可是一直没时间弄。 今天终于有时间验证了。首先本机安装好g++,cmake.我下载的cmake版本是cmake-3.27.0-rc4-windows-x86_64.msi。安装时选择...
-
不用魔法,快速、手摸手上线Midjourney!【附源码】【示例】
首先来一波感谢: 感谢laf提供赞助,目前可以免费使用Midjourney进行开发和测试。 感谢白夜、米开朗基杨@sealos.io的耐心解答,让我对laf有了更多的使用与了解。 什么是laf?来了解下。 文末有【示例】 开始 废话不多说,进入正题。...
-
stable diffusion 本地化部署安装踩坑指南---纯小白首次安装编辑
stable diffusion 本地化部署安装踩坑指南提示:这里简述项目相关背景: AI画图最近流行,小白也要尝试本地部署,压榨N卡性能。 版本为github上的:AUTOMATIC1111/stable-diffusion-webui 官方安装说明如下...
-
stable diffusion(安装以及模型的初步使用)
本机的配置 能跑模型,本地也跑过一点Lora训练的脚本,看看几个效果: 以上的都是配合huggingface有的模型结合civitai上的Lora模型在本地跑出来的图片,自己本地训练的Lora太拉闸了,就不放上来了…… 1....
-
微软官方 Copilot AI 编程训练营第一天精华总结
阿七参加的微软官方组织的 Copilot AI 编程训练营开始了,这是第一天。 GitHub Copilot 官方统计,使用 GitHub Copilot 的开发者基本上能极大的提升编码效率、减少重复性代码编码时间且能更加专注于主线任务。 不管这个...
-
高情商的NPC来了,刚伸出手,它就做好了要配合下一步动作的准备
在虚拟现实、增强现实、游戏和人机交互等领域,经常需要让虚拟人物和屏幕外的玩家互动。这种互动是即时的,要求虚拟人物根据操作者的动作进行动态调整。有些互动还涉及物体,比如和和虚拟人物一起搬动一把椅子,这就需要特别关注操作者手部的精确动作。智能、可交互的虚拟人...
-
保姆级教程:从0到1使用Stable Diffusion XL训练LoRA模型 |【人人都是算法专家】
Rocky Ding 公众号:WeThinkIn 写在前面 【人人都是算法专家】栏目专注于分享Rocky在AI行业中对业务/竞赛/研究/产品维度的思考与感悟。欢迎大家一起交流学习? 大家好...
-
[AI绘画] 即插即用!SDXL+T2I-Adapters 高效可控的生成图片
标题:T2I-Adapter: Learning Adapters to Dig out More Controllable Ability for Text-to-Image Diffusion Models 论文:https://arxiv....
-
配置 Stable Diffusion WebUI 纯 CPU 或核显绘画
(如有更新,见原文:https://blog.iyatt.com/?p=12345 1 前言 我笔记本电脑的独显上半年的时候烧掉了,所以只能用 CPU,折腾了一下午总算给配置出来了。我这里用的官方 Python,网上很多教程用 Anaconda(...
-
要参加微软官方 Copilot 智能编程训练营了
GitHub Copilot 是由 GitHub、OpenAI 和 Microsoft 联合开发的生成式 AI 模型驱动的。 GitHub Copilot 分析用户正在编辑的文件及相关文件的上下文,并在编写代码时提供自动补全式的建议。 刚好下周要参加微...
-
利用Lama Cleaner本地实现AIGC试玩:擦除对象、替换对象、更换风格等等
目录 一、安装 二、擦除功能 1. LaMa模型 实操实例一:去除路人 实操实例二:去水印 实操实例三:老照片修复 2. LDM模型 3. ZITS模型 4. MAT模型 5. FcF模型 6. Manga模型 三、替换对象功能 1....
-
Meta与微软联手推出开源大型语言模型Llama 2;程序员如何优雅地做副业
? AI新闻 ? Meta与微软联手推出开源大型语言模型Llama 2 摘要:Meta和微软近期合作发布了名为Llama 2的开源大型语言模型。该模型旨在帮助开发者和组织构建生成式人工智能工具和体验。Azure客户可以更轻松、安全地在Azure平台...
-
Copilot AI 编程训练营第二天:1 小时 0 手写开发一个购物车系统
经过训练营第一天的学习,大家都已经能基本熟练的使用 GitHub Copilot 进行辅助编程啦。 第二天,是考验学习成果的一天,我们需要在 2 小时内,通过 GitHub Copilot 完全 0 代码开发一个购物车系统。 熟练使用的同学,大概 1...
-
从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述
大规模语言模型(LLMs)在很多关键任务中展现出显著的能力,比如自然语言理解、语言生成和复杂推理,并对社会产生深远的影响。然而,这些卓越的能力伴随着对庞大训练资源的需求(如下图左)和较长推理时延(如下图右)。因此,研究者们需要开发出有效的技术手段去解决其...
-
AI研究也能借鉴印象派?这些栩栩如生的人竟然是3D模型
在 19 世纪,印象主义的艺术运动在绘画、雕塑、版画等艺术领域盛行,其特点是以「短小的、断断续续的笔触,几乎不传达形式」为特征,就是后来的印象派。简单来说印象派笔触未经修饰而显见,不追求形式的精准,模糊的也合理,其将光与色的科学观念引入到绘画之中,革新...
-
ChatGPT、New Bing、文心一言、通义千问等 AI 工具到底哪个更AI? - 第二期
文章目录 前言 选手介绍 ChatGPT New Bing 文心一言 钉钉的文档AI 通义千问 文心一格 通义万相 测试开始 文案编写 ChatGPT New Bing 文心一言 钉钉的文档AI 通义千问 代码解读 ChatGPT...
-
将 GitHub Copilot 与 ChatGPT 进行较量
最紧迫的问题是:哪种人工智能辅助代码生成最适合当今的开发人员?与以代码为中心的王牌 Copilot 一起工作是否会更好?还是 ChatGPT 的灵活性和多才多艺的方法使其占据了上风?这是专家与全能选手的对决,我们即将投入其中! 让我们深入探讨这场人工智能...
-
AI绘画美女:StableDiffusion实操教程-完美世界-国漫女神云曦(附高清图下载)
前段时间分享过StableDiffusion的入门到精通教程:AI绘画:Stable Diffusion 终极宝典:从入门到精通 但是还有人就问:安装是安装好了,可是为什么生成的图片和你生成的图片差距那么远呢? 怎么真实感和质感一个天一个地呢? 其实...
-
文生视频下一站,Meta已经开始视频生视频了
文本指导的视频到视频(V2V)合成在各个领域具有广泛的应用,例如短视频创作以及更广泛的电影行业。扩散模型已经改变了图像到图像(I2I)的合成方式,但在视频到视频(V2V)合成方面面临维持视频帧间时间一致性的挑战。在视频上应用 I2I 模型通常会在帧之间...
-
从新手到专家,两天全面掌握GitHub Copilot
随着大型AI模型性能的爆炸式提升,AI辅助编程工具真正从根本上改变了开发者的生产力,并对开发工作整个生命周期产生了深远的影响,这种影响不仅仅体现在开发编码效率的提升,更体现在对团队产研工作流程、开发思路、编码方式的重塑上。而在众多AI辅助编程工具中,微软G...
-
Hyena成下一代Transformer?StripedHyena-7B开源:最高128k输入,训练速度提升50%
最近几年发布的AI模型,如语言、视觉、音频、生物等各种领域的大模型都离不开Transformer架构,但其核心模块「注意力机制」的计算复杂度与「输入序列长度」呈二次方增长趋势,这一特性严重限制了Transformer在长序列下的应用,例如无法一次性处理一...
-
《我的世界》化身AI小镇,NPC居民角色扮演如同真人
注意看,这个方块人正在快速思考面前几位“不速之客”的身份。 原来她是遇到了危险,意识到这一点之后,她马上开始在脑海中搜索策略。 最终,她的方案是先逃跑然后寻求帮助,并马上付诸行动。 与此同时,对面的人也在进行着和她一样的思考…… 这样的一幅场景出现...
-
【AI绘画】如何使用Google Colab安装Stable Diffusion
【AI绘画】如何在Colab安装的Stable Diffusion 背景 准备 安装 查看资源仓库 跳转到Colab 运行`Stable Diffusion` 基础设置 启动运行 访问Stable Diffusion WebUI界面 模...
-
ComfyUI实用插件Plush-for-ComfyUI 可在ComfyUI中调用GPT-4和DALL-E3
Plush-for-ComfyUI插件是一个非常有趣的工具,它可以在ComfyUI平台中调用GPT-4和DALL-E3,实现从图片提取提示词并使用DALL-E3在ComfyUI中生成图片。 项目地址:https://top.aibase.com/tool...
-
还不知道?近20+自动驾驶数据集、榜单和Benchmark汇总
本文经自动驾驶之心公众号授权转载,转载请联系出处。 1.Nuscenes 数据集链接:nuScenes nuscenes数据集下有多个任务,涉及Detection(2D/3D)、Tracking、prediction、激光雷达分割、全景任务、规划控制等...