-
抛弃编码器-解码器架构,用扩散模型做边缘检测效果更好,国防科大提出DiffusionEdge
现有的深度边缘检测网络通常基于包含了上下采样模块的编码器 - 解码器架构,以更好的提取多层次的特征,但这也限制了网络输出既准又细的边缘检测结果。 针对这一问题,一篇 AAAI 2024 上的论文给出了新的解决方案。 论文题目:DiffusionEd...
-
吉他摇滚、电子音乐都能搞定,Meta开源音频生成新模型MAGNeT,非自回归7倍提速
在文本生成音频(或音乐)这个 AIGC 赛道,Meta 最近又有了新研究成果,而且开源了。 前几日,在论文《Masked Audio Generation using a Single Non-Autoregressive Transformer》中,...
-
GitHub Copilot的快速入门
GitHub Copilot 是一个由 OpenAI 和 GitHub 合作开发的人工智能编程助手,它可以帮助你更快地编写代码。要开始使用 GitHub Copilot,请按照以下步骤操作: 安装 GitHub Copilot: 首先,确保你...
-
【AI绘画】Stable Diffusion 本地部署教程!小白必收藏!!
******手把手教你入门绘图超强的AI绘画,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包 (文末可获取) ** **** 1.前言: 最近看Stable Diffusion开源了,据说比Disco Diff...
-
OccNeRF:完全无需激光雷达数据监督
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人总结 近年来,3D 占据预测(3D Occupancy Prediction)任务因其独特的优势获得了学界及业界的广泛关注。3D 占据预测通过重建周围环境的 3D 结构为自...
-
StableDiffusion入门教程
目录 介绍 模型的后缀 ckpt模型: safetensors模型 文件夹 VAE 模型在哪下载 Hugging face:<https://huggingface.co/models> 下载SD官方模型 文生图模型 标签介...
-
AIGC-Stable Diffusion Webui-AI作画初体验
一、项目地址:传送门:github:stable-diffusion-webui 二、安装方式:本地安装 or Google Colab.(下文介绍中关于安装的部分均以本地安装为例 本地安装: 1、git 2、python(推荐3.10.8 ...
-
如何使用OpenAI的whisper
文章目录 一、安装ffmpeg 二、安装torch等相关组件 三、安装Whisper 四、下载模型 五、测试效果 六、cpu与gpu解码的耗时对比 参考文献 一、安装ffmpeg yum localinstall --nogpgc...
-
最简单粗暴的Stable Diffusion Webui本地部署教程!让每个人都能自己实现AI画图!
先放两张自己画的图片镇楼。 什么是Stable Diffusion Webui Stable Diffusion WebUI是 Stable Diffusion 的浏览器界面,Stable Diffusion...
-
使用人工智能助手 Github Copilot 进行编程 02
本章涵盖了 在您的系统上设置 Python、VS Code 和 Copilot 引⼊ Copilot 设计流程 Copilot 的价值在于基本的数据处理任务 本章将帮助您在自己的计算机上开始使用 Copilot,并熟悉与其的交互方式。在设置好Copi...
-
【深度学习】SDXL tensorRT 推理,Stable Diffusion 转onnx,转TensorRT
文章目录 1 sdxl 转 diffusers 2 转onnx 3 转TensorRT 1 sdxl 转 diffusers juggernautXL_version6Rundiffusion.safetensors文件...
-
马斯克点赞SpaceX天才实习生:课余用AI破解上古卷轴,获Nature头版关注
Nature官网头版,最新刊发的是最新考古成果,轰动全球的成果—— 时隔2000年,上古卷轴(赫库兰尼姆卷轴)的神秘面纱,终于被揭开! 而且,这项研究还是AI完成的,背后的背后则是一名年仅21岁的天才少年,马斯克点赞的SpaceX实习生。 不同于一般的...
-
Copilot在PyCharm中可能遇到的问题及其解决方案
尽管GitHub Copilot为PyCharm用户带来了诸多便利,但在实际使用过程中,部分开发者可能会遇到一些问题。下面是一个典型的场景及相应的解决方法: 问题描述: 在启用GitHub Copilot后,在编写Python代码时发现,虽然Copi...
-
aigc修复美颜学习笔记
目录 GFPGAN进行图像人脸修复 美颜 修复畸形手势 GFPGAN进行图像人脸修复 原文:本地使用GFPGAN进行图像人脸修复_人相修复处理网页 csdn-CSDN博客 人脸修复 1.下载项目和权重文件 2.部署环境 3.下载权重文件...
-
如何在IDEA里面使用GitHub Copilot
GitHub配置 首先需要在GitHub Copilot学生认证或者购买使用产品,然后在GitHub里面的设置有一个Copilot选项,点进去就会发现有一个有效的订阅,此时就可以在idea里使用了,由于我是学生就可以理所当然的白嫖了(狗头 。 ps:学...
-
MedicalGPT:基于LLaMA-13B的中英医疗问答模型(LoRA)、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya-LLaMA]。
项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用 CSDN 平台,自主完成项目设计升级,提升自身...
-
AI破译2000年前「上古卷轴」登Nature头版!21岁计算机天才,谷歌华人工程师共获大奖
2000年前碳化的古卷轴,如今成功被AI破译!背后三人团队还拿下70万美元大奖! AI在考古领域的重大进步,甚至登上了今天Nature的头版。 要说这件事的起源,还得追溯到公元79年一次火山爆发, 直接将一座珍藏古老的纸莎草卷轴——Herculaneu...
-
GPT-4/Gemini大翻车,做旅行攻略成功率≈0%!复旦OSU等华人团队:Agent不会复杂任务规划
AI智能体,是目前学界炙手可热的前沿话题,被众多专家视为大模型发展的下一个方向。 然而,最近复旦、俄亥俄州立大学、宾夕法尼亚州立大学、Meta AI的研究者们发现,AI智能体在现实世界的规划能力还很差。 他们对GPT-4 Turbo、Gemini Pro...
-
三篇论文解决「语义分割的优化和评估」难题!鲁汶/清华/牛津等联合提出全新方法
优化语义分割模型常用的损失有Soft Jaccard损失,Soft Dice损失和Soft Tversky损失,但它们都和软标签不兼容,所以无法支持一些重要的训练技术(例如标签平滑,知识蒸馏,半监督学习,多标注员等)。 另一方面,语义分割常用的评价指标...
-
从0开始用 PyTorch 构建完整的 NeRF
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在解释代码之前,首先对NeRF(神经辐射场)的原理与含义进行简单回顾。而NeRF论文中是这样解释NeRF算法流程的: “我们提出了一个当前最优的方法,应用于复杂场景下合成新视图的任务,具体的实现原理是...
-
LLaVA:GPT-4V(ision) 的开源替代品
LLaVA(大型语言和视觉助理)(链接::https://llava-vl.github.io/)是一个很有前途的开源生成式人工智能模型,它复制了OpenAI GPT-4在图像转换方面的一些功能。用户可以将图像添加到LLaVA聊天对话中,允许讨论这些图像...
-
Copilot在IDEA中的应用:提升编码效率的得力助手
Copilot在IDEA中的应用:提升编码效率的得力助手 前言: 欢迎来到本篇博客,今天我们将深入探讨 GitHub Copilot 在 IntelliJ IDEA 中的应用。GitHub Copilot 是一款由 GitHub 与 OpenAI...
-
stable diffusion如何确保每张图的面部一致?
可以使用roop插件,确定好脸部图片后,使用roop固定,然后生成的所有图片都使用同一张脸。 这款插件的功能简单粗暴:一键换脸。 如图所示: 任意上传一张脸部清晰的图片,点击启用。 在其他提示词不变的情况下,Stable Diffu...
-
AIGC智能编程如何适应并推动开源项目的发展?
AIGC智能编程如何适应并推动开源项目的发展? 开源项目在软件行业中具有重要的地位,它们为开发人员提供了协作和共享代码的机会。AIGC智能编程作为一种创新的编程方法,能够适应和推动开源项目的发展,为开发人员提供更高效、更智能的编程体验。 1. AI...
-
秒速出图!体验 TensorRT 加速 Stable Diffusion 图像创作
TensorRT 如何加速 Stable Diffusion? 生成式 AI 图像内容生成技术近年来发展迅速,可以根据人类语言描述生成图片,在时尚、建筑、动漫、广告、游戏等领域有着广泛应用。 Stable Diffusion WebUI 是 Githu...
-
罕见!苹果开源图片编辑神器MGIE,要上iPhone?
拍张照片,输入文字指令,手机就开始自动修图? 这一神奇功能,来自苹果刚刚开源的图片编辑神器「MGIE」。 把背景中的人移除 在桌子上添加披萨 最近一段时间,AI 在图片编辑这一应用上取得了不小的进展。一方面,在 LLM 的基础上,多模态大模型(MLL...
-
无需GPU,手机芯片也能运行多模态模型!面壁智能发布MiniCPM,性能超过Mistral-7B!
2月1日,面壁智能发布了旗舰端侧模型 MiniCPM,它以小博大的性能超越了 Mistral-7B,并在 MT-Bench 等榜单上表现出色。 MiniCPM 是一款能说会看、具备编程能力、拥有多模态能力的端侧模型。它不仅在性能上优秀,而且具有极低的成本...
-
打脸奥特曼,GPT-4今年比去年还懒!网友在线实测出炉
GPT-4变懒的问题,又有新进展。 就在今天凌晨,奥特曼发推称,GPT-4这个毛病在新的一年应该好多了! 图片 关于GPT-4变懒,网友的吐槽已是不计其数,其中最多的就是与代码相关的任务: 完成度不高不说,还会被分割成一个一个小块,使用时需要逐一复制。...
-
大模型系列——解读RAG
RAG 是2023年最流行的基于 LLM 的应用系统架构。有许多产品几乎完全建立在 RAG 之上,覆盖了结合网络搜索引擎和 LLM 的问答服务,到成千上万个数据聊天的应用程序。很多人将RAG和Agent 作为大模型应用的两种主流架构,但什么是RAG呢?R...
-
GPT-4懒癌爆发!代码比较任务中完成率降低近1/4
近期,GPT-4的“懒惰”现象再度成为热议话题。网友们通过实际测试发现,GPT-4在代码比较任务中的表现下降显著,完成率降低了近四分之一。一些用户反馈称,完成度不仅不高,而且生成的文本还会被分割成小块,使用时需要逐一复制,给用户带来不便。 尽管有博主表示...
-
AI对联/春联在网络上走红 打工人又被狠狠共情了
最近,智能春联生成器AI 对联/春联在网络上走红,不少网友纷纷以“A股”“打工人”等为题让AI生成对应的春联。还别说,就从“程序维护忙像狗”“千股跌停迎新春”这些对联来看,AI已经拿捏了普通人的心理。 项目地址:https://github.com/Y...
-
比OpenAI官方提示词指南更全,这26条黄金准则让LLM性能飙升50%以上
论文地址: https://arxiv.org/abs/2312.16171 Github地址: https://github.com/VILA-Lab/ATLAS 论文标题:Principled Instructions Are All You...
-
ChatLaw:基于LLaMA微调的法律大模型
文章目录 动机 数据组成 模型框架 模型评估 北大团队发布首个的中文法律大模型落地产品ChatLaw,为大众提供普惠法律服务。模型支持文件、语音输出,同时支持法律文书写作、法律建议、法律援助推荐。 github地址:https://g...
-
如何使用单个指令微调GPT-3.5或Llama 2
由于在各种任务中的通用性,像ChatGPT和Llama 2这样的大型语言模型(LLM 广受欢迎。然而,有些应用程序需要使用自定义数据对这些模型进行微调,以获得更好的性能。 不幸的是,针对特定应用程序对大型语言模型(LLM 进行微调通常是复杂和令人沮丧的...
-
首个环视世界模型DrivingDiffusion: BEV数据和仿真新思路!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 笔者的一些个人思考 在自动驾驶领域,随着BEV-based子任务/端到端方案的发展,高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点,“高质量”可以解耦成三个方面: 不同维度...
-
“要嫁中国男人”,你被AI数字美女骗了吗?
大家好,我是轩辕。 不知道大家最近刷短视频的时候有没有刷到过这种视频: 一个漂亮的外国美女,自称来自俄罗斯,说着带口音的中国话,一个劲的夸中国这好那好,然后还要嫁给中国男人。 偶尔刷到也就罢了,然而最近发现了不对劲,这女的出现的频率越来越高,而且还是在不...
-
流量工程将代码生成的准确率提高一倍:由19%提高至44%
一篇新论文的作者提出了一种“强化”代码生成的方法。 代码生成是人工智能中一项越来越重要的能力。它指训练机器学习模型,基于对所需程序功能的自然语言描述自动生成计算机代码,并有许多潜在的应用,从将软件规格转换成实用代码、自动化后端开发到协助人类程序员,不一...
-
AIGC内容分享(五十三):AIGC|深入浅出一个完整的视频生成系统「VGen」核心基础知识
目录 一、VGen整体架构 二、VGen核心基础内容 三、快速上手使用VGen进行视频生成 四、VGen与SVD的比较 一、VGen整体架构 「VGen」是一个基于扩散模型的视频生成系统,提供以视频生成扩散模型为中心的强大代码库,具有先进...
-
RocketMQ Copilot GA 版本全新发布!
RocketMQ Copilot 1.0.0 经过一段时间的开发迭代,终于和大家见面了!1.0.0 相比较于之前提供了更多新特性,同时也在之前版本的基础上做了不少功能增强,是 RocketMQ Copilot 的第一个 GA 版本。在新版本中,Rocket...
-
超简单,不用GPU,3步教你轻松在笔记本上部署聊天大模型 LLaMA
大家好啊,我是董董灿。 今天带大家在自己的电脑(笔记本 上部署一个类似于 chatGPT 的 AI 聊天大模型。 部署完之后,你就拥有了一个私人 AI 聊天机器人,无需联网,随时进行实时对话。 0. 简单说下背景 大模型我们都不陌生了,但是以...
-
Stable diffusion本地环境搭建
1.硬件要求 我的硬件是win10 处理器:英特尔 Core i7-10750H 内存:32G 显卡:显卡:NVIDIA GeForce RTX 3060 Laptop GPU 显存 12 GB 具体性能待测试 2. 系统环境搭建...
-
图感知对比学习提升多变量时间序列分类效果
今天给大家介绍一篇AAAI 2024中,由新加坡科技研究局(A*STAR)和新加坡南洋理工大学联合发表的时间序列分类工作,通过图感知对比学习改善多变量时间序列分类,取得了非常显著的效果提升。 图片 论文标题:Graph-Aware Contrasting...
-
NLP国内外大模型汇总列表[文心一言、智谱、百川、星火、通义千问、盘古等等]
国内外大模型汇总列表 中国大模型列表大全,全面收集有明确来源的大模型情况,包括机构、来源信息和分类等,随时更新。 Awesome family related to LLMS includes: https://github.com/wgwang...
-
AI绘画stability工具大全
Stability AI 公司的关于AI绘画工具集合,这家公司从Stable Diffusion商业出来,具有能浓厚社区文化,凡事研究AI绘画都会关注这家公司! Stability AI 的使命是让AI对所有人开放和有益。 本文基于Stable Dif...
-
【部署LLaMa到自己的Linux服务器】
部署LLaMa到自己的Linux服务器 一、官方方法(知道就好,具体操作用不上这个) 1、Llama2 项目获取 方法1:有git可以直接克隆到本地 方法2:直接下载 2、LLama2 项目部署 3、申请Llama2许可 4、下载模型权重...
-
AI 如何精准生成令人惊叹的代码流程图
大家好,我是木川 没有 AI 的时候,我们阅读完代码,然后根据自己的理解,手动通过 XMind 绘制思维导图,或者通过 draw.io 绘制流程图,至少需要 60 分钟 有了 AI,其实可以直接将代码转换为比较准确的代码可视化图形,省掉自己阅读代码的时...
-
如何使用Stable Diffusion的ReActor换脸插件
ReActor插件是从roop插件分叉而来的一个更轻便、安装更简单的换脸插件。操作简单,非常容易上手,下面我们就介绍一下,如何将ReActor作为stable diffusion的插件进行安装和使用。 一:安装ReActor插件 项目地址:https:...
-
一文搞懂使用 Arthur Bench 进行 LLM 评估
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估 。 一、传统文本评估面临的挑战 近年来,随着大型语言模型(LLM 的快速发展和改进,传统的文本评估方法在某些方面可能已经不再适用。在文本评估领...
-
【每周AI简讯】微软Copilot上线安卓和iOS应用
微软Copilot上线安卓和iOS应用 微软在其 Google Play 商店列表中将 Copilot 描述为:“Copilot 是微软的一款开创性聊天助手,由最新的 OpenAI 模型、GPT-4 和 DALL·E 3 提供支持。这些先进的人工智能技术...
-
Agent像人一样分工协作,还能“群聊”交换信息
智能体也要有“规范手册”! 一项名为MetaGPT的研究,通过对智能体角色进行明确分工,并要求多个智能体在协作中采用统一规范的“交流格式”等方法,让智能体性能大增。 目前,这项研究在GitHub上已狂揽33.6k星,并在深度学习顶会ICLR 2024上被...