-
Stable diffusion 简介
Stable diffusion 是 CompVis、Stability AI、LAION、Runway 等公司研发的一个文生图模型,将 AI 图像生成提高到了全新高度,其效果和影响不亚于 Open AI 发布 ChatGPT。Stable diffusi...
-
Yann LeCun发来肯定:腾讯人像照片生成可以随便玩了
这一次,Yann LeCun 首次跻身「百变大咖」。身穿钢铁侠的衣服、戴着酷酷的墨镜面无表情地注视着你,一身古装在故宫门前打卡留念…… 就连本人也出来转发并喊话,「左下角这幅文艺复兴时期的画,是我的最爱。」 性感女神寡姐身穿紫色巫师服注视着远方,还可...
-
「文生图」再升级!学习个性化参照,无限生成多样图片,轻松设计玩具建筑
最近,来自南加州大学、哈佛大学等机构的研究团队提出了一种全新的基于提示学习的方法——DreamDistribution。 这种方法可以让任何基于文字提示的生成模型(比如文生图、文生3D等),通过一组参照图片来学习对应的视觉属性共性和变化的文本提示分布。...
-
OpenAI开源全新解码器和语音识别模型Whisper-v3
在11月7日OpenAI的首届开发者大会上,除了推出一系列重磅产品之外,还开源了两款产品,全新解码器Consistency Decoder(一致性解码器)和最新语音识别模型Whisper v3。 据悉,Consistency Decoder可以替代Sta...
-
本地部署github上的stable diffuion,轻松玩转ai绘画(新手小白也能懂)
你也想自己生成上面这样好看的图片吗?废话不多说,跟着博主,按步骤来,做完你也就可以了,而且无任何限制,懂得都懂!? 目录 第一步:准备VPN 第二步:安装Python 第三步:安装Pycharm 第四步:安装Git 第五步:注册GitHub账...
-
开源语音超分辨率AI模型Resemble Enhance 可有效去除噪音杂音
Resemble Enhance是一款令人印象深刻的语音处理技术,专为将嘈杂的音频转换为清晰有力的语音而设计。该模型不仅能够去除音频中的各种噪声和杂音,还能够恢复音频失真并扩展音频带宽,使得原本的声音听起来更加清晰和自然。 项目地址:https://gi...
-
Linux云端部署stable diffusion保姆级教程——基于腾讯云,ubuntu系统
#本教程也参考了其他教程,这个是整合版,带#的是注释,不带#的就是命令,需要一行一行复制,然后按回车执行 #最好选择境外Linux,网络环境好,境内需要魔法,下面开始—— #从控制台登录,最好是OrcaTerm登录,复制比较方便 #第一步下载mini...
-
本地搭建【文档助手】大模型版(LangChain+llama+Streamlit)
概述 本文的文档助手就是:我们上传一个文档,然后在对话框中输入问题,大模型会把问题的答案返回。 安装步骤 先下载代码到本地 LangChain调用llama模型的示例代码:https://github.com/afaqueumer/DocQA(代...
-
鹅厂最新AI工具刷屏!杨幂寡姐多风格写真秒秒钟生成,LeCun点赞
大厂们在整活方面开始卷起来了! 前脚字节阿里的工具火了,现在腾讯这个新照片生成应用PhotoMaker直接刷屏,瞧这阵仗…… 只需上传一张或以上照片,无需额外LoRA训练,就能快速可定制。任何人、任何风格,高保真那种。 于是秒秒钟,LeCun化身钢铁侠...
-
AIGC内容分享(十八):AIGC在天猫商品海报生成上的探索
目录 项目背景 目标拆解 方案调研 ▐ 方案一 SD + Outpainting ▐ 方案二 SD Inpainting + Reference Only ▐ 方案三 基于Reference的Diffusion算法 ▐ ...
-
微软TaskWeaver开源框架:携手数据分析与行业定制,打造顶级Agent解决方案
数据分析一直是现代社会中的重要工具,它帮助我们洞察本质、发现规律并指导决策。然而,数据分析过程往往复杂且费时,因此我们期望存在一个智能助手助力用户直接 “与数据对话 “。得益于大语言模型(LLM)的发展,虚拟助手和 Copilot 等智能 Agent 纷...
-
开源项目Open Interpreter:让AI在操作系统中自我复制
近日,一篇关于AI在操作系统中复制自己的文章引起了广泛关注。通过开源项目Open Interpreter,AI实现了在操作系统级别启动自身副本的雏形。这一创新基于多模态大模型,通过截图分析屏幕内容,生成操作计划,并调用系统接口执行任务。这不仅是对任务执行能...
-
超越BEVFusion!又快又好的极简BEV融合部署方案
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 在算法开发中,激光雷达-相机3D目标检测遇到了过度拟合问题,这是由于违反了一些基本规则。在数据集构建的数据标注方面,本文参考了理论补充,并认为回归任务预测不应涉及来自...
-
LLaMA的解读与其微调:Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2
前言 近期,除了研究ChatGPT背后的各种技术细节 不断看论文(至少100篇,100篇目录见此:ChatGPT相关技术必读论文100篇 ,还开始研究一系列开源模型(包括各自对应的模型架构、训练方法、训练数据、本地私有化部署、硬件配置要求、微调等细节 ...
-
Window本地化部署stable diffusion AI绘图+问题汇总
目录 一、前言 1. 为什么要本地部署 2. 本地化部署要求 3. Stable diffusion WebUI项目简介 二、电脑环境配置 1. 安装anaconda3 2. 在anaconda3中创建虚拟环境 3. 激活环境 4. 安装...
-
使用OpenVINO™在算力魔方上加速stable diffusion模型
作者:武卓博士 英特尔AI布道师 刘力 英特尔物联网行业创新大使 什么是stable diffusion模型? Stable Diffusion是stability.ai开源的AI图像生成模型,实现输入文字,生成图像...
-
[玩转AIGC]LLaMA2训练中文文章撰写神器(数据准备,数据处理,模型训练,模型推理)
目录 一、下载并加载中文数据集 二、中文数据集处理 1、数据格式 2、数据集处理之tokenizer训练格式 1)先将一篇篇文本拼凑到一起(只是简单的拼凑一起,用于训练tokenizer) 2)将数据集进行合并 3、数据集处理之模型(ll...
-
腾讯云GPU服务器部署Ai绘画Stable Diffusion 小白可用
一、服务器购买 本人本地是个win10的PC 安装了 显示GPU 算力不够,升级配置也需要钱 云服务商的选择上,很普通,大家随意选择腾讯云/阿里云/移动云/华为云…都可以。我是之前用的腾讯云,在腾讯云上抢的GPU云服务器(https://cloud...
-
2024最新发布:GitHub Copilot快速激活指南!无需账号/认证,30秒完成激活 | 1分钟简易教程,立刻启用,成功率达100%!
2024最新发布:GitHub Copilot快速激活指南!无需账号/认证,30秒完成激活 | 1分钟简易教程,立刻启用,成功率达100%! 快速开始:视频教程 安装Copilot:首先,在你的集成开发环境(IDE)中安装Copilot和C...
-
LLM系列 | 22 : Code Llama实战(下篇):本地部署、量化及GPT-4对比
引言 模型简介 依赖安装 模型inference 代码补全 4-bit版模型 代码填充 指令编码 Code Llama vs ChatGPT vs GPT4 小结 引言 青山隐隐水迢迢,秋尽江南草未凋。...
-
你的 VSCode 上 还没有 GitHub Copilot ?看这里
GitHub Copilot 是由 OpenAI 和 GitHub 开发的 AI 工具。其目的是通过自动完成代码来帮助开发人员使用集成开发环境 (IDE),如 Visual Studio Code。它目前仅作为技术预览版提供,因此只有已加入候补名单的用户才...
-
最新开源!更擅长推理的LLaMA大模型,支持中文
©PaperWeekly 原创 · 作者 | 李忠利 研究方向 | 自然语言处理 跟大家介绍一下自己最近训练的 LLaMA 模型——BiLLa: A Bilingual LLaMA with Enhanced Reasoning Abi...
-
AIGC for code(text-to-codeAIGC/AI生成代码/生成式AI之代码生成/AI编程工具/自动编程/自动生成代码/智能编程工具/智能编程系统)
AIGC,Artificial Intelligence Generated Content,人工智能生成内容 AIGC for code,AI生成代码 1 Github Copilot 1.1 简介 Copilot是由微软的子公司Github与o...
-
OpenAI Whisper论文笔记
OpenAI Whisper论文笔记 OpenAI 收集了 68 万小时的有标签的语音数据,通过多任务、多语言的方式训练了一个 seq2seq (语音到文本)的 Transformer 模型,自动语音识别(ASR)能力达到商用水准。本文为李沐老师论文精...
-
全新免费编程神器!比Copilot快两倍,准确率高20% | 非十科技发布
一款国产编程神器,秒杀了微软GitHub Copilot。 有多快? 比GitHub Copilot快两倍的同时,准确度还提高了约20%。 不仅如此,在做到“快”、“准”的情况下,功能上也是比较全面,包括: 代码自动补全、自然语言生成代码、自动添加注释、...
-
北大ChatLaw团队推出大模型恋爱神器Machine_Mindset 支持MBTI 16种人格
北大 ChatLaw 团队与 FarReel AI Lab 合作开发了一款大模型恋爱神器,可以让大模型具备 MBTI16种人格,实现自由定制。 用户可以选择不同的性格类型,使大模型在回答问题时展现出不同的个性化回应。 这项工作通过构建十万条 MBTI 数...
-
AnimateDiff论文解读-基于Stable Diffusion文生图模型生成动画
文章目录 1. 摘要 2. 引言 3. 算法 3.1 Preliminaries 3.2. Personalized Animation 3.3 Motion Modeling Module 4. 实验 5.限制 6. 结论 论文:...
-
AI在操作系统里复制自己,这一天还是来了
这一天还是来了,AI在操作系统里启动了一个自己的副本。 往小了说,不过是多模态大模型通过操纵鼠标键盘的API执行任务。 往大了说,也可以算是“AI复制自己”的雏形了。 (别被作者的蓝天白云壁纸骗到了,这其实是MacOS) 从AI这一顿眼花缭乱的操作中...
-
性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max
强化学习算法(Reinforcement Learning, RL)的训练过程往往需要大量与环境交互的样本数据作为支撑。然而,现实世界中收集大量的交互样本通常成本高昂或者难以保证样本采集过程的安全性,例如无人机空战训练和自动驾驶训练。 为了提升强化学习算...
-
stable-diffusion-webui 启动服务,卡在浏览器loading中, 重定向解决
最新的code,按步骤安装,趟完pip和github的坑,终于启动服务 然后悲催的卡在浏览器这一步,一直在loading,折腾一下午,尝试可能有效的步骤,也许最后一步才有用: 1. 启动IIS服务 2. 配置localhost 指向 127.0...
-
Stable Diffusion 硬核生存指南:WebUI 中的 GFPGAN
本篇文章聊聊 Stable Diffusion WebUI 中的核心组件,强壮的人脸图像面部画面修复模型 GFPGAN 相关的事情。 写在前面 本篇文章的主角是开源项目 TencentARC/GFPGAN,和上一篇文章《Stable Diffusio...
-
AI:你总要高清视频,它来了
Magnific 图像超分 & 增强工具还正在火热体验中,它强大的图像升频与再创能力收获一致好评。现在,视频领域也有了自己的 Magnific。 拍摄的街道视频一片模糊,仿佛高度近视没戴眼镜一样: 与之相比,下面的视频清晰度高了很多: 视频画...
-
AI视野:阿里推ReplaceAnything框架;OpenAI取消军用禁令;Pika推视频画面扩充功能;SD推图生视频插件I2V-Adapter
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ????聚焦开发者 阿里推Rep...
-
大模型部署手记(13)LLaMa2+Chinese-LLaMA-Plus-2-7B+Windows+LangChain+摘要问答
1.简介: 组织机构:Meta(Facebook) 代码仓:GitHub - facebookresearch/llama: Inference code for LLaMA models 模型:chinese-alpaca-2-7b-hf、text...
-
阿里ReplaceAnything框架火了:照片中万物皆可AI替换
在近期,人工智能图像处理技术(AIGC技术)备受瞩目,其在图像编辑、生成等领域展现出强大的能力。然而,一个备受挑战的问题是在生成新内容的同时,严格保持指定对象的身份不变。正是为了解决这一难题,ReplaceAnything框架应运而生。 由阿里巴巴集团智能...
-
LLM AutoEval:AI平台自动评估Google Colab中的LLM
在自然语言处理领域,语言模型的评估对于开发人员推动语言理解和生成的边界至关重要。LLM AutoEval是一款旨在简化和加速语言模型(LLMs)评估过程的工具,专为寻求快速高效评估LLM性能的开发者定制。 LLM AutoEval具有以下关键特点: 1....
-
探索学习和入门使用GitHub Copilot:提升代码开发的新利器
目录 引言 1. 什么是GitHub Copilot? 2. 入门使用GitHub Copilot 3. GitHub Copilot的基础知识 4. GitHub Copilot的应用场景 结论 在最近的开发工作中,发现了一个比较实用...
-
Mistral AI推出Mixtral 8x7B:一种改变机器学习的SMoE语言模型 效果堪比GPT-3.5
## 划重点: 1. ? **创新模型介绍:** Mistral AI 的研究团队推出了基于 Sparse Mixture of Experts(SMoE)模型的 Mixtral8x7B 语言模型,采用开放权重。 2. ? **性能突出:** Mixtra...
-
安装stable diffusion时git clone总..errorCApath: none;更新出错:fatal: unable to access Connection was reset
安装stable diffusion的出错 https://cgexe.com/39458/ 对于安装stable diffusion来说这个视频很好,但是我在本机的c盘照着做,还是报错,所以就自己整理一下自己的错误 我下载git...
-
AIGC之Image2Video(一)| Animate Anyone:从静态图像生成动态视频,可将任意图像角色动画化
近日,阿里发布了Animate Anyone,只需一张人物照片,结合骨骼动画,就能生成人体动画视频。 项目地址:https://humanaigc.github.io/animate-anyone/ 论文地址:https://ar...
-
即插即用,完美兼容:SD社区的图生视频插件I2V-Adapter来了
图像到视频生成(I2V)任务旨在将静态图像转化为动态视频,这是计算机视觉领域的一大挑战。其难点在于从单张图像中提取并生成时间维度的动态信息,同时确保图像内容的真实性和视觉上的连贯性。大多数现有的 I2V 方法依赖于复杂的模型架构和大量的训练数据来实现这一...
-
GitHub Copilot实战 Leetcode和Alpha Vantage API获取股票数据
GitHub Copilot 可以提升编码速度25%。 需要在 visual studio code 添加插件 GitHub Copilot 1. Base Python 创建数组和Person class # Create a li...
-
【AIGC】大模型协作系统 HuggingGPT 深度解析
欢迎关注【youcans的 AIGC 学习笔记】原创作品 【AIGC】大模型协作系统 HuggingGPT 深度解析 1. 摘要 2. 前言 3. HugginGPT 大模型协作系统 3.1 任务规划 3.2 模型选择 3.3 任务执行...
-
百度最强中文AI作画大模型
前言 最近文生图领域的发展可谓是分生水起,这主要是得益于最近大火的扩散模型,之前笔者也写过一篇关于文本生产3D模型的文章,大家感兴趣的可以穿梭: https://zhuanlan.zhihu.com/p/570332906 今天要给大家介绍...
-
软件测试/人工智能|GitHub Copilot:开发者新利器
简介 在软件开发领域,GitHub Copilot 是一项引人注目的创新,它是由 GitHub 推出的人工智能编程助手,旨在提高开发者的生产力和代码质量。本文将介绍 GitHub Copilot 的基本概念和使用方法。 什么是 GitHub Cop...
-
LLMs之LLaMA-2:LLaMA-2的简介(技术细节)、安装、使用方法(开源-免费用于研究和商业用途)之详细攻略
LLMs之LLaMA-2:LLaMA-2的简介(技术细节 、安装、使用方法(开源-免费用于研究和商业用途 之详细攻略 导读:2023年7月18日,Meta重磅发布Llama 2!这是一组预训练和微调的大型语言模型(LLM),规模从70亿到700亿个...
-
可以参考Copilot的官方文档和社区,了解更多关于Copilot的使用技巧和常见问题
在PyCharm中使用Copilot的步骤如下: 获取Copilot的使用权限:首先,确保你拥有一个GitHub的账号。然后,进入Copilot首页,登录你的GitHub账号,并申请使用。几天后,你会收到一封回复邮件,点击邮件中的链接,登录到GitHu...
-
2024年AIGC趋势展望:视频生成的“百模大战”
2023年底发布的svd(stabilityai/stable-video-diffusion-img2vid · Hugging Face 、EMU(https://ai.meta.com/blog/emu-text-to-video-generatio...
-
GitHub Copilot 替代品?
应该没人不知道代码补全这个东西了吧,第一次使用 GitHub Copilot 之后,只觉得真香,现在居然还有一点离不了了。后面因为收费原因,就没再用了,找了一个 tabnine 替代,用了几天,体验是真的比不上 GitHub Copilot。 现在市面上...
-
大模型应用实践:AIGC探索之旅
随着OpenAI推出ChatGPT,AIGC迎来了前所未有的发展机遇。大模型技术已经不仅仅是技术趋势,而是深刻地塑造着我们交流、工作和思考的方式。 本文介绍了笔者理解的大模型和AIGC的密切联系,从历史沿革到实际应用案例,再到面临的技术挑战和伦理监管问题...