-
Stable Diffusion|Ai赋能电商 Inpaint Anything
在电商领域中,产品展示对消费者购买决策的影响至关重要。以电商服装行业为例,商家在推出新品时,需要经历摄影拍摄、模特选择、场景布置、道具搭配、后期修图等一系列繁琐环节,以制作出吸引人的产品图片。然而,这些步骤不仅耗费大量时间和人力,而且要求商家拥有专业的技能...
-
【本地化部署Stable Diffusion WebUI(MACOS安装)】
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、Stable Diffusion WebUI适配三类芯片 二、安装 1.安装git、conda等 2.选定目录及下载Github远程仓库文件 3....
-
C# RAM Stable Diffusion 提示词反推 Onnx Demo
目录 介绍 效果 模型信息 项目 代码 下载 C# RAM Stable Diffusion 提示词反推 Onnx Demo 介绍 github地址:GitHub - xinyu1205/recognize-anything: Open...
-
谷歌发布“Vlogger”模型:单张图片生成10秒视频
谷歌发布了一个新的视频框架: 只需要一张你的头像、一段讲话录音,就能得到一个本人栩栩如生的演讲视频。 视频时长可变,目前看到的示例最高为10s。 可以看到,无论是口型还是面部表情,它都非常自然。 如果输入图像囊括整个上半身,它也能配合丰富的手势: 网友...
-
20年编程,AI编程6个月,关于Copliot辅助编码工具,你想知道的都在这里
最初我认为不会有太多地方用得上它们。因为大厂都有一套自己的技术体系和技术架构。外部的工具不可能学会,也不会让他们去训练自家的技术。所以我的定位是解决重复性编码的工作。经过六个月的使用后,发现我使用AI的方式随着时间的推移在不断变化和改进。 首先在选择工具...
-
Ai绘画工具,Stable Diffusion Lora使用攻略
一、Lora是什么 LoRA,英文全称Low-Rank Adaptation of Large Language Models,直译为大语言模型的低阶适应,这是微软的研究人员为了解决大语言模型微调而开发的一项技术。 可以理解为Stable-Diffus...
-
在VSCode中使用GitHub Copilot Chat
GitHub Copilot Chat 是一个扩展,可以在你的代码编辑器或IDE(目前是VS Code或Visual Studio 中工作,允许你从编辑器中与 GitHub Copilot 进行对话。 开始 要开始使用 GitHub Copilot C...
-
在Win11上部署Stable Diffusion WebUI Forge
Stable Diffusion WebUI Forge 是 Stable Diffusion WebUI(基于 Gradio)之上的平台,可简化开发、优化资源管理并加快推理速度。“Forge”这个名字的灵感来自“Minecraft Forge”。这个项目...
-
AI新工具(20240312) Midjourney官方发布角色一致性功能;免费且开源的简历制作工具;精确克隆语调、控制声音风格
1: Midjourney角色一致性功能 使人物画像在多方面高度一致成为可能。 Midjourney的角色一致性功能的使用方法如下: ⭐在你的输入指令后面加上 --cref URL,其中URL是你选择的角色图像的链接。 ⭐你可以通...
-
如何扩展大模型的上下文长度
一、背景 大模型的上下文长度是指我们在使用大模型的时候,给大模型的输入加上输出的字符(Token)总数,这个数字会被限制,如果超过这个长度的字符会被大模型丢弃。目前开源的大模型上下文长度一般不长,比如 Llama 2 只有 4K,Code-Llama 系...
-
连续学习不怕丢西瓜捡芝麻,神经形态方法保护旧知识
以脉冲神经网络(SNN)为代表的脑启发神经形态计算(neuromorphic computing)由于计算上的节能性质在最近几年受到了越来越多的关注 [1]。受启发于人脑中的生物神经元,神经形态计算通过模拟并行的存内计算、基于脉冲信号的事件驱动计算等生物...
-
全球首个AI程序员当老板!IOI金牌得主全部工作AI掌盘,技术细节报告公开
AI程序员Devin竟可以做老板的工作了?! 最近,Cognition AI的首席执行官Steven Hao给了Devin访问自己帐户的权限,然后Devin便开始为他工作了... 比如,「他」向初创公司Modal支持团队写了一封邮件,是询问关于其产品S...
-
DarkGPT:基于ChatGPT-4的AI工具 用于检测泄露的数据库
近日,一位在GitHub上使用“luijait”别名的西班牙渗透测试人员发布了一个名为“DarkGPT”的AI OSINT工具,旨在帮助检测泄露的数据库。 DarkGPT是一款由ChatGPT-4-200K驱动的OSINT(开源情报)助手,在这个数字化时...
-
为自动驾驶而生,Lightning NeRF:速度提升10倍
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 最近的研究强调了NeRF在自动驾驶环境中的应用前景。然而室外环境的复杂性,加上驾驶场景中的视点受限,使精确重建场景几何体的任务变得复杂。这些挑战往往会导致重建质量下降...
-
马斯克兑现承诺,Grok模型携3140亿参数强势开源,商业用途全免费!
马斯克确实以其高效率和大胆的行动著称,最近他旗下的AI初创企业xAI宣布了一项引人注目的举措:开源了一个名为Grok-1[1]的混合专家模型。 这个模型拥有3140亿个参数,是目前参数量最大的开源大型语言模型之一,而允许商用、可修改和分发,对各种自研...
-
DECO: 纯卷积Query-Based检测器超越DETR!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 标题:DECO: Query-Based End-to-End Object Detection with ConvNets 论文:https://arxiv.org/pdf/2312.13735...
-
AIGC: 2 语音转换新纪元-Whisper技术在全球客服领域的创新运用
背景 现实世界,人跟人的沟通相当一部分是语音沟通,比如打电话,聊天中发送语音消息。 而在程序的世界,大部分以处理字符串为主。 所以,把语音转换成文字就成为了编程世界非常普遍的需求。 Whisper 是由 OpenAI 开发的一种高效的语音识别(AS...
-
Mac电脑本地安装Stable Diffusion小白教程避开所有坑教程
CPU可为intel或M芯片。特别说明github拉取代码时需要魔法上网,所以尽量全程开启魔法上网。本教程所用系统为macOs venture 13.6.4。 启动“终端” 按下“command+空格”按钮,输入终端,如...
-
huggingface的diffusers训练stable diffusion记录
代码:https://github.com/huggingface/diffusers/tree/main/examples/text_to_image 2006.11239.pdf (arxiv.org 论文 2006.11239.pdf (ar...
-
机器学习:Github上排名前19个强化学习 (RL)项目
强化学习 (RL 是一种机器学习,使代理能够通过反复试验来学习。强化学习算法用于各种应用,包括游戏、机器人和金融。 RL 的目标是找到一种最大化预期长期回报的策略。强化学习算法通常分为两类:基于模型的算法和无模型的算法。基于模型的强化学习算法构建环境模...
-
拖拽P图技术又升级了:StableDrag更稳、更准,南大、腾讯联合打造
去年 5 月,动动鼠标就能让图片变「活」得研究 DragGAN 吸引了 AI 圈的关注。通过拖拽,我们可以改变并合成自己想要的图像,比如下图中让一头狮子转头并张嘴。 实现这一效果的研究出自华人一作领衔的「Drag Your GAN」论文,于上个月放出并已...
-
探索编程新纪元:Code GeeX、Copilot与通义灵码的智能辅助之旅
在人工智能技术日新月异的今天,编程领域的革新也正以前所未有的速度推进。新一代的编程辅助工具,如Code GeeX、Copilot和通义灵码,正在重塑开发者的工作流程,提升编程效率,并推动编程教育的普及。本文将深入探讨这三款工具的特点、优势与局限,为开发者提...
-
微软AI程序员登场,10倍AI工程师真来了?996自主生成代码,性能超GPT-4 30%
全球首个AI程序员Devin的横空出世,可能成为软件和AI发展史上一个重要的节点。 它掌握了全栈的技能,不仅可以写代码debug,训模型,还可以去美国最大求职网站Upwork上抢单。 一时间,网友们惊呼,「程序员不存在了」? 甚至连刚开始攻读计算机学位...
-
一键点、万物动! 腾讯混元联合清华、港科大推出图生视频大模型“Follow Your Click”
编辑 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 3月15日,腾讯混元和清华大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Click“,基于输入模型的图片,只需点击对应区域,加上少量提示词,就可以让图片中原...
-
巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数
传统的时空预测模型通常需要大量数据支持才能取得良好效果。 然而,由于城市发展水平不均衡和数据收集政策的差异,许多城市和地区的时空数据(如交通和人群流动数据)受到了限制。在这种情况下,模型在数据稀缺情况下的可迁移性变得尤为重要。 现有研究主要利用数据丰富的...
-
AI大模型控制红绿灯,港科大(广州)智慧交通新成果已开源
大模型“上路”,干起了交通信号控制(TSC)的活~ 模型名为LightGPT,以排队及不同区段快要接近信号灯的车辆对路口交通状况分析,进而确定最好的信号灯配置。 该模型由香港科技大学(广州)的研究团队提出,其背后关键是一个名为LLMLight的框架。...
-
别等OpenAI了,全球首个类Sora抢先开源!所有训练细节/模型权重全公开,成本仅1万美元
不久前OpenAI Sora以其惊人的视频生成效果迅速走红,在一众文生视频模型中突出重围,成为全球瞩目的焦点。 继2周前推出成本直降46%的Sora训练推理复现流程后,Colossal-AI团队全面开源全球首个类Sora架构视频生成模型「Open-Sor...
-
Stable Diffusion——常用插件安装与测试(一)
前言 随着Stable Diffusion不断演进,越来越多的开发者开始涉足插件开发。尽管网络上存在大量教程,但它们通常零散分布,逐个学习和查找非常耗时,使人感觉每天都在劳累思考。这里总结了Stable Diffusion常用的插件安装与测试方法。 感...
-
马斯克突然开源Grok:3140亿参数巨无霸,免费可商用
马斯克说到做到: 旗下大模型Grok现已开源! 代码和模型权重已上线GitHub。官方信息显示,此次开源的Grok-1是一个3140亿参数的混合专家模型—— 就是说,这是当前开源模型中参数量最大的一个。 消息一出,Grok-1的GitHub仓库已揽获4...
-
全球首个类Sora开源复现方案来了!全面公开所有训练细节和模型权重
全球首个开源的类Sora架构视频生成模型,来了! 整个训练流程,包括数据处理、所有训练细节和模型权重,全部开放。 这就是刚刚发布的Open-Sora 1.0。 它带来的实际效果如下,能生成繁华都市夜景中的车水马龙。 还能用航拍视角,展现悬崖海岸边,海水...
-
Stable Diffusion WebUI 笔记本低显存无魔法本地安装使用(五)--- 插件安装
一、 查找插件 1. 启动webui,在打开的页面上,点击 extensions,点击 Available 2. 点击“Load from”黄色按钮,会列出所有的可用插件,查找你的插件,如果是汉化的插件,请去掉localization的选择 3....
-
马斯克打脸OpenAI,全球最大巨无霸模型Grok-1开源!3140亿参数8个MoE,GitHub狂揽6k星
说到做到,马斯克xAI的Grok,果然如期开源了! 就在刚刚,xAI正式发布3140亿参数混合专家模型Grok-1的权重和架构。 3140亿的参数,让Grok-1成为迄今参数量最大的开源LLM,是Llama 2的4倍。 目前,xAI关于Grok-1...
-
淘宝人生2的AIGC技术应用——虚拟人写真算法技术方案
近几个月,随着基于Stable Diffusion的相关技术发展,基于参考图的角色定制化技术[1,2, 3, 4, 7]受到相关行业以及学者的广泛关注。其中,人像定制化是指:给定任务角色(参考图),通过提示词控制生成多样新的图像,并且图像...
-
stable diffusion采样详解
采样:模型会在Latent Space中生成一个完全随机的图像,然后噪声预测器会从图像中减去预测的噪声。随着这个步骤的不断重复,最终得到一个清晰的图像。 Stable Diffusion在每个步骤中都会生成一张新的采样后的图像,整个去噪...
-
自适应剪枝让多模态大模型加速2-3倍,哈工大等推出SmartTrim
基于 Transformer 结构的视觉语言大模型(VLM)在各种下游的视觉语言任务上取得了巨大成功,但由于其较长的输入序列和较多的参数,导致其相应的计算开销地提升,阻碍了在实际环境中进一步部署。为了追求更为高效的推理速度,前人提出了一些针对 VLM 的...
-
马斯克旗下xAI宣布开源Grok-1 包含3140亿参数
今日,马斯克旗下xAI宣布开源Grok-1。据悉,Grok-1基础模型基于大量文本数据训练,共有3140亿参数。该模型使用基于 JAX 和 Rust 的自定义训练堆栈进行训练。 而xAI 是埃隆・马斯克成立的人工智能公司,于2023年7月12日宣布成立。...
-
手把手教你搭建更节省显存的AI绘画工具ComfyUI
前言 相信大家玩 Stable Diffusion(以下简称 SD)都是用的 web UI 操作界面吧,不知道有没有小伙伴听说过**ComfyUI(**最强大、模块化的稳定扩散 GUI 。 // ComfyUI示例 https://comfyanon...
-
没等来OpenAI,等来了Open-Sora全面开源
不久前 OpenAI Sora 以其惊人的视频生成效果迅速走红,在一众文生视频模型中突出重围,成为全球瞩目的焦点。继 2 周前推出成本直降 46% 的 Sora 训练推理复现流程后,Colossal-AI 团队全面开源全球首个类 Sora 架构视频生成模...
-
ChatGPT的前辈GPT-2被塞入Excel表格:体积达1.25GB之巨!
快科技3月17日消息,Excel真是无所不能,酷爱它的软件开发者Ishan Anand居然将OpenAI GPT-2大模型硬生生放到了Excel之中,体积达到1.2GB,关键是还能正常运行! 我们熟悉的ChatGPT,其实支持GPT系列大模型的一种呈现形式...
-
AI程序员Devin卧底工作群修bug!和CTO聊技术,网友:顶级码农水平
首个AI程序员Devin,现身明星创业公司内部群。 为解决一个技术问题,Devin借用了其创造者的账号,与客户公司的CTO交流,并根据回复调整了代码方案。 对话之专业,围观者看了直呼这个世界太疯狂。 事情发生在办公软件Slack,截图中的akshat是...
-
小妙招:Copilot 当跳板免费调用 GPT4
GPT4 每月 20 刀,Github Copilot 每月 10 刀 首先叠个甲:免费不是 0 成本。 由于我在日常开发过程中,Copilot 对我来说是必需品,我会用它检查代码、写工具函数、写注释、干苦力。所以这钱是我的必要支出。而这篇文章是介...
-
利用学生认证部署 copilot-gpt4-service 白嫖 gpt-4.0
过年期间在公众号 HelloGitHub 上看到了一个项目 copilot-gpt4-service,可以将 GitHub Copilot 转成 ChatGPT 的服务。 这么一个转换的好处是, GitHub 可以通过学生认证免费试用,转换成 ChatGP...
-
Stable Diffusion 跑通总结
记录了自己跑通Stable Diffusion的过程和踩过的坑,目前只是初步跑了一下,没有很深入的使用代码,希望能有一些参考价值。 在Windows系统运行,需要提前装好Conda 一、下载代码和模型 1、下载代码: 代码下载:代码地址 或者...
-
20240203在WIN10下配置stable-diffusion-webui.git
20240203在WIN10下配置stable-diffusion-webui.git 2024/2/3 11:55 【结论:在WIN10下,生成512x512分辨率的图像,大概需要9秒钟!】 【结论:在Ubuntu20.04.6下,生成512x512...
-
【AIGC调研系列】Github Copilot进行pytest自动化测试的实践经验
GitHub Copilot可以用于pytest自动化测试的实践和使用方法。此外,Copilot可以在很多情况下仅通过注释或函数名就能实例化出完整的代码,这表明它也可以用于补充测试用例[5]。 具体到pytest框架,它是一个非常容易上手的自动化测试框架...
-
人工智能让 GitHub 首席法务官忙于应对欧盟的 AI 法案以及开发者对 Copilot 和所有权的担忧
GitHub 的首席法务官 Shelley McKinley 一周以来日程繁忙。除了处理与其 Copilot 配对编程工具的相关法律问题外,欧盟新近通过的人工智能法案也为其带来了额外的工作负担。这项被誉为「全球首个全面覆盖的人工智能法律」,经过三年的酝酿,...
-
Copilot 插件的使用介绍:让你的开发效率翻倍
摘要:Copilot 是一款强大的代码自动完成插件,能够帮助开发者提高开发效率,减少重复性劳动。本文将详细介绍 Copilot 插件的使用方法,让你轻松上手,开启编程新篇章。 一、Copilot 插件简介 Copilot 是由 GitHub 开发的一款代...
-
Stable diffusion安装以及汉化
安装参考:https://blog.csdn.net/weixin_72959097/article/details/136261658 (1)下载miniconda Miniconda是一个轻量级的包管理系统,用于管理和部署Python环境和软件包。...
-
Stable Diffusion XL on diffusers
Stable Diffusion XL on diffusers 翻译自:https://huggingface.co/docs/diffusers/using-diffusers/sdxl v0.24.0 非逐字翻译 Stable Dif...
-
Stable Diffusion WebUI安装报错解决
本人是一个AI新手,最近在研究文生图方面相关内容时看到Stable Diffusion WebUI这个项目,想在本地部署安装试用看下效果,安装过程中遇到了一些问题,此处记录一下 问题1:Python 3.12.1 (tags/v3.12.1:2305ca...