-
win11下部署stable diffusion docker版遇到的问题和解决方案
背景 为了在本地愉快流畅地体验stable diffsion,且不希望直接在windows中安装过多复杂的环境,顺便体验容器的部署和发布的便利,决定选择stable diffusion的docker版(AbdBarho版)。 网上已经有很多stabl...
-
新AI框架 AboutMe:用网页中自我描述来记录英语预训练数据过滤器的效果
随着自然语言处理和自然语言生成的进步,大型语言模型(LLMs)在实际应用中得到了广泛使用。由于它们能够模仿人类行为,并具有通用性,这些模型已经涉足各个领域。 虽然这些模型引起了相当大的关注,但它们代表了一组受限和偏向的人类观点和知识。预训练数据的组成是造成...
-
AI视野:百度推视频生成模型UniVG;下一代大模型Llama3正在训练;腾讯推视频模型VideoCrafter2;TikTok测试AI作曲功能
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 🤖📱💼AI应用 1、百度推出视频生...
-
【扩散模型】1、扩散模型 | 到底什么是扩散模型?
文章目录 一、什么是扩散模型 1.1 现有生成模型简介 1.2 扩散模型的理论来源 1.3 扩散模型的使用场景 1.4 扩散模型的基本结构 1.5 马尔可夫过程 二、扩散模型相关定义 2.1 符号和定义 2.2 问题规范化 三、可以提升...
-
GPU+生成式人工智能助力提升时空数据分析
译者 | 朱先忠 审校 | 重楼 摘要:通过实战案例介绍,本文指出随着基于GPU加速的数据库技术为时间序列和空间数据带来更好的性能和精度水平,生成式人工智能技术将使得非领域专家也能够进行复杂的时空数据处理。 引言 时空数据来自手机、气候传感器、金融市场交...
-
探索【Stable-Diffusion WEBUI】的插件:界面主题与中文翻译
文章目录 (零)前言 (一)界面主题 (1.1)自带主题 (1.2)kitchen Theme (1.3)Catppuccin theme (1.4)Cozy-Nest (二)翻译 (2.1)对照翻译(Bilingual Localiza...
-
AI写的代码比“手工代码”安全性差很多
类似Github Copilot这样的人工智能代码助手能大大提高开发人员的开发效率和生产力,并降低开发技术门槛(不熟悉语言或概念的程序员的进入)。然而,缺乏经验的开发人员可能会轻易相信人工智能助手的输出内容,从而引入安全漏洞风险。 近日,斯坦福大学的一...
-
GitHub Copilot的最佳免费平替:通义灵码
在如今这个人工智能高速发展的时代,每个行业都在被AI技术影响而改变。层出不穷的AI辅助工具,让我们看到了机器正在取代一部分基础的日常工作。对于我们开发者而言,当前最炙手可热的就是GitHub Copilot,市面上最好的开发者辅助工具。GitHub Cop...
-
视觉Mamba来了:速度提升2.8倍,内存能省87%
号称「全面包围 Transformer」的 Mamba,推出不到两个月就有了高性能的视觉版。 本周四,来自华中科技大学、地平线、智源人工智能研究院等机构的研究者提出了 Vision Mamba(Vim)。 论文地址:https://arxiv.or...
-
stable-diffusion-webui-colab部署记录
stable-diffusion-webui-colab 该模型可以在网上云端部署stable-diffusion,减少本地部署的繁琐步骤降低配置要求的依赖。 一、进入stable-diffusion-webui-colab 1.网址:https...
-
StableDiffusion 换脸实现
先看效果: 想要换的脸: 想要把脸放到的目标图片: 实现方案: StableDiffusion+roop(本次实验基于roopV0.02版本) 1/安装SD,模型选择 DreamShaper,Sampler使用 Euler a 2/安装roop插件...
-
ICLR'24无图新思路!LaneSegNet:基于车道分段感知的地图学习
写在前面&笔者的个人理解 地图作为自动驾驶系统下游应用的关键信息,通常以车道或中心线表示。然而,现有的地图学习文献主要集中在检测基于几何的车道或感知中心线的拓扑关系。这两种方法都忽略了车道线与中心线的内在关系,即车道线绑定中心线。虽然在一个模型中...
-
20%的杨幂+80%的泰勒长什么样?小红书风格化AI来了,可兼容SD和ControlNet
不得不说,现在拍写真真是“简单到放肆”了。 真人不用出镜,不用费心凹姿势、搞发型,只需一张本人图像,等待几秒钟,就能获得7种完全不同风格: 仔细看,造型/pose全都给你整得明明白白,并且原图直出修也不用修了。 这搁以前,不得在写真馆耗上至少整整一天,把...
-
WidthFormer:实时自动驾驶!助力基于Transformer的BEV方案量产
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&行业理解 基于BEV的transformer方案今年量产的主要方案,transformer结构和CNN相比,特征提取能力更强,但需要较多的算力,这也是为什么许多车上都是1~2颗orin...
-
Data-Copilot: 大语言模型做你最贴心省事的数据助手
Data-Copilot: Bridging Billions of Data and Humans with Autonomous Workflow 无需繁琐操作,只需要输入一句话, Data-Copilot自动帮你完成查数据,分析数据,管理数据,预测趋...
-
AI绘画与多模态原理解析:从CLIP到DALLE1/2、DALLE 3、Stable Diffusion、SDXL Turbo、LCM
前言 终于开写本CV多模态系列的核心主题:stable diffusion相关的了,为何执着于想写这个stable diffusion呢,源于三点 去年stable diffusion和midjourney很火的时候,就想写,因为经常被刷屏,但那会时...
-
文心一言,通营销之学,成一家之言,百度人工智能AI大数据模型文心一言Python3.10接入
“文心”取自《文心雕龙》一书的开篇,作者刘勰在书中引述了一个古代典故:春秋时期,鲁国有一位名叫孔文子的大夫,他在学问上非常有造诣,但是他的儿子却不学无术,孔文子非常痛心。 一天,孔文子在山上遇到了一位神仙,神仙告诉他:“你的儿子之所以不学无术,是因为你没...
-
发现【Stable-Diffusion WEBUI】的插件:不健康内容过滤器
文章目录 (零)前言 (一)不健康内容过滤器(NSFW Sensor) (零)前言 本篇主要提到了WEBUI的不健康内容过滤插件,它宁可错杀一千也不放过一个。可以有效避免有害内容。 更多不断丰富的内容参考:🔗《继续Stabl...
-
LLaMA在Windows环境下的安装部署教程
LLaMA的安装过程其实非常简单,只需要几条CMD命令行即可完成。其实个人感觉效果不如ChatGPT,而且对硬件要求较高,本站并不推荐个人部署。 介绍 关于什么是LLaMa,详细情况可以看下面这篇文章。 Git安装 该软件的作用是拉取远程Git...
-
我用 midjourney 创作的那些好看的图片
下面这些是个人的midjourney v5的关键词,各种类型都有 抽象画 One piece of original artwork from 1998 , in the style of confucian ideology, pop art-in...
-
生成式 AI 带给软件开发的三个幻觉:速度快、质量高、人更少
作者 | 张凯峰 软件行业苦降本增效久已。蔓延开去的开发周期,遥遥无望的上线时间,以及不断冒起的缺陷,怎么看都配不上这支精兵强将的队伍。生成式AI 似乎带来了曙光,它的表现让人耳目一新,不少人会这么想。它能自动生成代码,成本低,可重复,即抛的能力像云上的...
-
Copilot在Pycharm的应用和示例
Copilot 是 Github 在 2021 年发布的 AI 代码助手工具,它可以根据你提供的上下文信息,自动生成代码建议,帮助提高代码编写效率和准确性。在 Pycharm 中使用 Copilot,可以进一步提升 Python 开发效率,本文将分享如何在...
-
AIGC系列之:ControlNet原理及论文解读
《Adding Conditional Control to Text-to-Image Diffusion Models》 目录 1.背景介绍 2.原理详解 2.1 Controlnet 2.2 用于Stable Diffusion的Contr...
-
奥数能力金牌级:DeepMind几何推理模型登上Nature,代码开源,菲尔兹奖得主点赞
这一次,人工智能算法在数学奥林匹克竞赛(IMO)上取得了重大成绩突破。 在今天发表的国际权威期刊《自然》杂志最新一期上,论文《Solving olympiad geometry without human demonstrations》向世人介绍了 A...
-
GitHub Copilot 功能介绍和使用场景
原文 : https://openaigptguide.com/github-copilot/ GitHub Copilot是一款由GitHub、OpenAI和Microsoft联合开发的AI辅助开发工具,它以人工智能的方式提供语法结构、表达式、变量名等...
-
GPT-4,大增长时代的序幕
作者|成诚 虽然我们早在 2017 年就预测了超大模型的到来,因此才搞了分布式深度学习框架 OneFlow(github.com/Oneflow-Inc/oneflow/),且 2020 年的 GPT-3 也掀起了大模型热潮(OneFlow...
-
推荐一家GPU平台部署Stable Diffusion
最近一年,扩散模型太火了,已经成为重要的生产力工具,在AI研究领域也不断有新的工作出现,成为产业界和学术界的热点。 本文将在趋动云平台部署扩散模型中广受关注的stable-diffusion-webui项目,手把手教程! 有需要算力跑模型的小伙伴,可以...
-
Stable Diffusion WebUI 本地部署
前言 系统windows10,显卡NVIDIA RTX 2060s,分享一下stable diffusion webui 本地部署过程以及遇到的问题。其中一些环境已搭建或者软件已安装过的,可以直接跳过。 步骤 1. 安装git git下载地址...
-
AI图形设计工具Recraft完成1200万美元A轮融资,将构建自有基础模型
AI生成图像在世界各地引发争议,即便AI生成图像在选举中的使用在本周世界经济论坛上引起了关注,初创公司仍在推动为创作者提供的AI工具领域不断前行。 Recraft作为一款面向专业人士的AI图形设计生成器,已完成由硅谷Khosla Ventures领投的12...
-
昆仑天工SkyWork:更懂中文的AIGC开源模型
昆仑天工SkyWork系列AIGC开源模型,由奇点智源公司研发,在2022年12月发布,覆盖图像、文本、编程等多模态内容生成能力,包括绘画、文章续写、对话、中英翻译、推理、诗词对联、菜谱撰写、合同起草、代码补全等。 昆仑天工SkyWork系列模型...
-
马毅LeCun谢赛宁曝出多模态LLM重大缺陷!开创性研究显著增强视觉理解能力
Sam Altman在各种场合都提到,大语言模型的多模态能力,是未来AI技术能够造福人类的最亟待突破的领域。 那么现在在多模态大模型的视觉功能能否达到与语言功能匹配的水平? 当前多模态模型取得的进步很大程度上归功于大语言模型(LLM)的推理能力。但在视...
-
几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型
在AR、VR、3D打印、场景搭建以及电影制作等多个领域中,高质量的穿着衣服的人体3D模型非常重要。 传统的方法创建这些模型不仅需要大量时间,还需要能够捕捉多视角照片的专业设备,此外还依赖于技术熟练的专业人员。 与此相反,在日常生活中,我们最常见...
-
[算法前沿]--005-和chatgpt一样的大模型LLaMA可以运行在pc上?
未来已来,大模型依据压缩模型的方式,可以在普通的PC上运行. LLaMA Facebook的LLaMA 模型和Georgi Gerganov 的llama.cpp的结合。 LLaMA,这是一组包含 7B 到 65B 参数的基础语言模型。我们在数万亿个令...
-
Stable-diffusion-webui 本地部署及使用
Stable-diffusion-webui 本地部署及使用 本地部署stable-diffusion-webui(windows 1.安装conda; 2.创建conda env 和python 3.10.6; 3.更新pip; 4.安装...
-
新一代注意力机制Lightning Attention-2:无限序列长度、恒定算力开销、更高建模精度
大语言模型序列长度的限制,极大地制约了其在人工智能领域的应用,比如多轮对话、长文本理解、多模态数据的处理与生成等。造成这一限制的根本原因在于当前大语言模型均采用的 Transformer 架构有着相对于序列长度的二次计算复杂度。这意味着随着序列长度的增加...
-
AI无代码网页组件开发工具免费下载地址 Compo官网体验入口
Compo Chrome Extension是一个基于AI组件驱动技术的开源工具,旨在通过简单的文本输入帮助用户快速创建、设计和开发网页组件。它通过集成到应用程序中或使用Vallmore的企业AI集成到应用、工具或平台中,提供了多样化的使用场景。Compo...
-
谷歌推几何AI系统AlphaGeometry,实力达奥林匹克金牌得主
Google DeepMind 发布了一个名为AlphaGeometry 的人工智能系统,它可以解决复杂的几何问题,其水平接近人类奥林匹克金牌得主——这是人工智能性能的突破。在对30道奥数几何题的基准测试中,AlphaGeometry 在标准奥数时限内解决...
-
Android Studio安装AI编程助手Github Copilot
csdn原创谢绝转载 简介 文档链接 https://docs.github.com/en/copilot/getting-started-with-github-copilot 它是个很牛B的编程辅助工具,装它,快装它. 支持以下IDE: In...
-
2023年的深度学习入门指南(24) - 处理音频的大模型 OpenAI Whisper
2023年的深度学习入门指南(24 - 处理音频的大模型 OpenAI Whisper 在这一讲之前,我们所用的大模型都是针对文本的。这一讲我们增加一个新的领域,即音频。我们将介绍OpenAI的Whisper模型,它是一个处理音频的大模型。 Wh...
-
人工智能 | ChatGPT 和文心一言哪个更好用?
===================================================== github:https://github.com/MichaelBeechan CSDN:https://blog.csdn.net/u01134...
-
AIGC内容分享(十二):AIGC探索之旅AIGC探索之旅
目录 前言 引言:AI时代,未来已来 AIGC简介与发展历程 早期萌芽阶段(1950s-1990s) 沉淀积累阶段(1990s-2010s) 快速发展阶段(2010s至今) 大模型与AIGC的关联 大模型概述 大模型的定义和特点 典型大...
-
【Stable diffusion inpaiting】训练自己数据集
https://github.com/advimman/lama/tree/7dee0e4a3cf5f73f86a820674bf471454f52b74f prepare your data: 1 Create masks named as `[...
-
如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!
目录 一.前言 二.本机环境 三.安装步骤: 步骤1:下载Git并添加环境变量 步骤2:下载ffmpeg并添加环境变量 步骤3:安装pytorch 步骤4:安装whisper 四.whisper的应用 应用1:识别mp3歌曲中的歌词 应用...
-
七个值得关注的优秀大语言模型(LLM)
在LLM领域我们了解最多的很可能是OpenAI的ChatGPT,以及最近在多模态表现非常出色的Google Gemini,这些都是AI大模型的领头羊,代表着AI大模型发展的先进成果。然而,在大模型的实际应用中必须要综合考虑成本、信息安全等内容,因此,开源...
-
【Stable Diffusion XL】huggingface diffusers 官方教程解读
文章目录 01 Tutorial Deconstruct a basic pipeline Deconstruct the Stable Diffusion pipeline Autopipeline Train a diffusion mo...
-
VsCode 配置Copilot的详细步骤与示例
目录 一、 GitHub Copilot Chat 账号申请 1.1 前往 GitHub 网站(https://github.com/)并点击 "Sign up" 进行注册。 1.2 申请 GitHub Copilot Chat 二、VsCode...
-
SDXL 1.0出图效果直逼Midjourney!手把手教你快速体验!
介绍 最近,Stability AI正式推出了全新的SDXL 1.0版本。经过我的实际测试,与之前的1.5版本相比,XL的效果有了巨大的提升,可以说是全方位的超越。不仅在理解提示词方面表现出色,而且图片的构图、颜色渲染和画面细腻程度都有了很大的进步,实际...
-
在VS Code中安装Copilot与安装其他扩展的方法一样,只需简单几步
GitHub Copilot是由OpenAI和GitHub开发的人工智能工具。它的目的是通过自动完成代码来帮助开发人员使用集成开发环境(IDE),如Visual Studio Code。它目前仅作为技术预览版提供,因此只有在候补名单上被认可的用户才能访问它...
-
【论文简介】Stable Diffusion的基础论文:2112.High-Resolution Image Synthesis with Latent Diffusion Models
稳定扩散生成模型(Stable Diffusion 是一种潜在的文本到图像扩散模型,能够在给定任何文本输入的情况下生成照片般逼真的图像 Stable Diffusion 是基于latent-diffusion 并与 Stability AI and Run...
-
用大模型帮程序员找Bug,中科院剖析102篇论文总结出这些方案
中科院对“找Bug”下手了,一口气总结了N种方案! 法宝就是大模型。 大模型由于其卓越的自然语言理解、推理等能力,已经被应用于各种场景,取得了前所未有的效果。 类似的,软件测试领域也受益于其强大的能力,能够帮助生成逼真且多样化测试输入,模拟各种异常,加...