-
在Kubernetes上部署生成式人工智能应用程序的分步指南
译者 | 李睿 审校 | 重楼 在当今快节奏的技术和市场环境中,高效地部署人工智能(AI)/机器学习(ML)应用程序至关重要。Kubernetes是一个强大的开源平台,已经成为管理和扩展容器化应用程序的领先解决方案,确保它们在各种环境中无缝运行。 在本...
-
CVPR2024|AIGC(图像生成,视频生成等)相关论文汇总(附论文链接/开源代码/解析)【持续更新】
CVPR2024|AIGC相关论文汇总(如果觉得有帮助,欢迎点赞和收藏) Awesome-CVPR2024-AIGC 1.图像生成(Image Generation/Image Synthesis ECLIPSE: A Resource-E...
-
Llama.cpp工具main使用手册
Llama.cpp提供的 main工具允许你以简单有效的方式使用各种 LLaMA 语言模型。 它专门设计用于与 llama.cpp 项目配合使用。 推荐:用 NSDT编辑器 快速搭建可编程3D场景 Llama.cpp的工具 main提供简...
-
Stable Diffusion web UI 安装教程
Stable Diffusion web UI 安装教程 欢迎来到猫说AI,wx搜索,猫说AI接入了最新版Chatgpt供大家免费使用。 注意:这是ubuntu20.04安装步骤! conda创建python虚拟环境 conda create -n...
-
两张图2秒钟3D重建!这款AI工具火爆GitHub,网友:忘掉Sora
只需2张图片,无需测量任何额外数据—— 当当,一个完整的3D小熊就有了: 这个名为DUSt3R的新工具,火得一塌糊涂,才上线没多久就登上GitHub热榜第二。 有网友实测,拍两张照片,真的就重建出了他家的厨房,整个过程耗时不到2秒钟! (除了3D图,...
-
【MacOS】openai 语音识别模型 whisper 本地部署教程(cpu+mps方案)
目录 1. whisper 安装 openai-whisper 参考视频链接与安装过程 安装homebrew 安装Python (不要超过3.10) 安装Pytorch 安装ffmpeg 安装rust 安装whisper 注意事项 可...
-
Mac专属大模型框架来了!两行代码部署,能聊本地数据,还支持中文
Mac用户,终于不用羡慕N卡玩家有专属大模型Chat with RTX了! 大神推出的新框架,让苹果电脑也跑起了本地大模型,而且只要两行代码就能完成部署。 仿照Chat with RTX,框架的名字就叫Chat with MLX(MLX是苹果机器学习框...
-
【AI绘画 Stable Diffution】解决下载安装“mixlab-nodes”节点插件,ComfyUI中不显示问题。
前言 1)如果用ComfyUI Manager插件下载mixlab插件的时候,中途可能会出错,一直无法下载完成。 2)下载好官方的项目直接放在custom_nodes目录下,ComfyUI中不显示 3)插件放置目录是ComfyUI_windows_p...
-
今日AI:阿里欲推AI电商产品“绘蛙”;北大团队发起复现Sora计划;ComfyUI LayerDiffusion正式上线;AI工具DUSt3R GitHub爆火
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI应用 阿里正在打造一款...
-
Nas搭建ai绘画 将Midjourney集成到微信机器人
ChatGPT狂飙160天,世界已经不是之前的样子。 新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 1.前言 之前,我们在微信上为ChatGPT构建了一个聊天机器人,还在网络上开发...
-
AI新工具(20240205) AI 对联/春联 - 输入描述,自动生成春联图片;AI写作引擎;满分简历
AI 对联/春联 - 输入描述,自动生成春联图片 AI 对联/春联 AI 对联/春联是一个由YunYouJun开发的开源项目,用于生成春节对联。 https://github.com/YunYouJun/ai-sfc 满分简历 - HR...
-
OpenAI与开源多语言嵌入模型,你选择哪一家?
译者 | 朱先忠 审校 | 重楼 出品 | 51CTO技术栈(微信号:blog51cto) 本文对OpenAI的多个嵌入模型与多家开源的多语言嵌入模型进行了综合比较,帮助你最终选择最适合自己的大数据开发模型。 1.引言 OpenAI最近发布了他们的...
-
Stable-Diffusion ubuntu服务器部署,报错解决方法(小白教程)
Stable Diffusion是一个深度学习模型,专注于生成高质量的图像。它由CompVis团队与Stability AI合作开发,并在2022年公开发布。这个模型使用文本提示(text prompts)生成详细、逼真的图像,是目前人工智能图像生成领域的...
-
7B模型超越GPT4-V!港科大等发布「图推理问答」数据集GITQA:视觉图可提升推理能力
图神经网络(GNNs)擅长利用图的结构信息进行推理,但它们通常需要特定于领域的调优才能达到峰值性能,这阻碍了它们在不同任务之间的泛化性。 相比之下,基于大型语言模型(LLM)的图推理具有更强的跨任务和泛化能力,但它们在特定任务上的性能往往逊色于专用的图...
-
复旦等发布AnyGPT:任意模态输入输出,图像、音乐、文本、语音都支持
最近,OpenAI 的视频生成模型 Sora 爆火,生成式 AI 模型在多模态方面的能力再次引起广泛关注。 现实世界本质上是多模态的,生物体通过不同的渠道感知和交换信息,包括视觉、语言、声音和触觉。开发多模态系统的一个有望方向是增强 LLM 的多模态感知...
-
从AI推理性能优化角度看LLaMA的模型结构和源码
本篇文章讲讲LLaMA的结构,已经有很多文章已经对LLaMA在一些结构上任务表现上做了一些解析,本文主要从优化的角度、实现kernel的角度解析一下LLaMA,读者事先对transformer的结构有基本认识最好。本文首发于我的公众号“AI不止算法”,文章...
-
只需少量计算和内存资源即可运行的小型 Llama 大模型
背景介绍 在当今这个数据爆炸的时代,语言模型的训练变得越来越复杂和困难。我们需要巨大的计算资源和时间来训练一个高效的语言模型。然而,这对许多人来说并不现实。与此同时,我们也遇到了如何在有限的内存和计算资源中使用大型语言模型的挑战,特别是在边缘设备上。 今...
-
港大开发V-IRL平台:将真实世界地图纳入虚拟环境 给AI Agent完整的一生!
近日,港大和NYU的研究团队合作开发了一个名为V-IRL的平台,该平台将真实世界的地图、街景等丰富信息融入到虚拟环境中,为AI Agent提供了更真实和完整的生活体验。 这项研究的核心在于构建一个可扩展的平台,利用地理信息和街景图像等API将AI智能体嵌入...
-
北大发起复现Sora,框架已搭!袁粒田永鸿领衔,AnimateDiff大神响应
重磅: 北大团队联合兔展发起了一项Sora复现计划——Open Sora。 框架、实现细节已出: 初始团队一共13人: 带队的是北大信息工程学院助理教授、博导袁粒和北大计算机学院教授、博导田永鸿等人。 为什么发起这项计划? 因为资源有限,团队希望集结...
-
CodeWhisperer安装教导--一步到位!以及本人使用Whisperer的初体验。
CodeWhisperer是亚马逊出品的一款基于机器学习的通用代码生成器,可实时提供代码建议。类似 Cursor 和Github AWS CodeWhisperer 亚马逊科技的CodeWhisperer是A...
-
如何基于 Arthur Bench 进行 LLM 评估 ?
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估 。 一、传统文本评估面临的挑战 近年来,随着大型语言模型(LLM 的快速发展和改进,传统的文本评估方法在某些方面可能已经不再适用。在文本评估...
-
模型偏好只与大小有关?上交大全面解析人类与32种大模型偏好的定量组分
在目前的模型训练范式中,偏好数据的的获取与使用已经成为了不可或缺的一环。在训练中,偏好数据通常被用作对齐(alignment)时的训练优化目标,如基于人类或 AI 反馈的强化学习(RLHF/RLAIF)或者直接偏好优化(DPO),而在模型评估中,由于任务...
-
【视觉AIGC识别】误差特征、人脸伪造检测、其他类型假图检测
视觉AIGC识别——人脸伪造检测、误差特征 + 不可见水印 前言 视觉AIGC识别 【误差特征】DIRE for Diffusion-Generated Image Detection 方法 扩散模型的角色 DIRE作为检测指标 实验结果...
-
每日AI:Stable Diffusion3发布;剪映海外版CapCut推文生视频;微软win10、win11照片应用增加AI橡皮擦功能;OpenAI更新GPT商店
欢迎来到【每日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 ???AI应用 Stable Diffusion3发布 文字渲染能力超强,图像生成质量超越Midjo...
-
Stable diffusion 安裝使用
GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusib UI**github:stable-diffusion-webui下載,**全程最好科學上網 1.無需下載git 可直接 Cod...
-
给AI Agent完整的一生!港大NYU谢赛宁等最新智能体研究:虚拟即现实
【新智元导读】近日,来自香港大学的Jihan Yang和纽约大学的谢赛宁等人发表了新的成果,将真实世界的地图、街景等各种信息融入Agent所在的虚拟世界,为智能体的未来赋予了无限可能。 怎样能构建更强大的AI Agent? 答案是给他们一个完整而真实的世界...
-
数字时氪 | 深度解析对比中国和硅谷的AIGC赛道——数智前瞻
本文来源网站“数字时氪”,仅用于学术分享,侵权删,干货满满。 原文链接:深度解析对比中国和硅谷的AIGC赛道 | 数智前瞻-36氪 (36kr.com 跟互联网和移动手机时代一样,中国的AIGC生态必定和西方不一样。 编者按:本文作者为硅谷Leon...
-
AI测试|Windows下跑起大模型(Llama)操作笔记
2024软件测试面试刷题,这个小程序(永久刷题),靠它快速找到工作了!(刷题APP的天花板)_软件测试刷题小程序-CSDN博客文章浏览阅读2.5k次,点赞85次,收藏11次。你知不知道有这么一个软件测试面试的刷题小程序。里面包含了面试常问的软件测试基础题,...
-
过年这些天② | 字节老矣,尚能饭AIGC?魅族与OPPO梭哈AI手机;AIGC红包封面花活儿大赏;Sam寻求7万亿芯片融资所图甚大;史上AI含量最高的春晚
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 春节:史上AI含量最高的春晚;把AIGC红包封面玩出花;支付宝集五福的AI元素;决战拜年之巅AI应用火了一把…… 龙年春晚看了吗?是不是感...
-
【AI】Stable Diffusion懒人包部署常见问题/解决(持续收录)
Stable Diffusion懒人包部署常见问题/解决(持续收录) 问题及解决 问题1:`Failed to initialize: Bad git executable.` 问题及解决 收录启动Stable Diffusion...
-
LLaMA-Factory 基于docker的大模型多卡分布式微调
LLaMA-Factory是一个相当优秀的微调工具。这里提供一个dockerfile和一个train脚本,用于多卡微调,供大家参考。 Dockerfile FROM nvidia/cuda:12.1.0-cudnn8-devel-ubuntu22.0...
-
Stable diffusion webui部署及简单使用
文章目录 前言 一、Stable Diffusion WebUI部署 1.Stable diffusion 2.Linux 上的自动安装步骤如下: 1.安装依赖项: 2.切换到想要安装 WebUI 的目录并执行以下命令: 3.运行 webu...
-
Copilot for Microsoft 365 office手把手使用指南
本文介绍Microsoft365商业版+copilot应用的使用说明。本文的相关说明基于Microsoft365商业版软件和网页,只有尊贵的商业版用户才能够完全享有,而个人版/家庭版copilot Pro(名字带着Pro的阉割版,恐怕只有MS敢这么玩)无法...
-
OpenAI ChatGPT-4开发笔记2024-08:windows本地环境下载Llama 2
Step 1: Ask for permission on Meta’s website To be able to download the model, you first need to agree to some terms and condi...
-
一些安装AUTOMATIC1111的Stable Diffusion WebUI常遇到的错误消息的解决方式
确保电脑符合Stable Diffusion的系统需求 1. 电脑硬件需求 最低配备 建议配备 注解 显卡(GPU GTX1050Ti RTX3060Ti 支持的显卡芯片有Nvidia/AMD/Intel Arc/Apple M。 显...
-
ControlNet作者新作:AI绘画能分图层了,项目未开源就斩获660 Star
“绝不是简单的抠图。” ControlNet作者最新推出的一项研究受到了一波高度关注—— 给一句prompt,用Stable Diffusion可以直接生成单个或多个透明图层(PNG)! 例如来一句: 可以看到,AI不仅生成了符合prompt的完整图像...
-
VPR 2024 满分论文!Meta提出EfficientSAM:快速分割一切!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 EfficientSAM 这篇工作以5/5/5满分收录于CVPR 2024!作者在某社交媒体上分享了该结果,如下图所示: LeCun 图灵奖得主也强烈推荐了该工作! 在最近的一项研究中,Meta...
-
Stable Diffusion 训练
文章目录 前言 一、主要训练方式 二、kohya_ss安装(Linux 1.打开终端并切换到所需的安装目录 2.通过运行以下命令克隆存储库 3.切换到kohya_ss目录 4.通过执行命令来运行安装脚本 5.安装完成后,在kohya_ss目...
-
60行代码,从头开始构建GPT!最全实践指南来了
60行代码,从头开始构建GPT? 最近,一位开发者做了一个实践指南,用Numpy代码从头开始实现GPT。 你还可以将 OpenAI发布的GPT-2模型权重加载到构建的GPT中,并生成一些文本。 话不多说,直接开始构建GPT。 什么是GPT? GPT代...
-
【AIGC】AutoKeras 进行 RNN 循环神经网络训练
由于最近这些天都在人工审查之前的哪些问答数据,所以迟迟都没有更新 AutoKeras 的训练结果。现在那部分数据都已经整理好了,20w+ 的数据最后能够使用的高质量数据只剩下 2k+。这 2k+ 的数据已经经过数据校验并且对部分问题的提问方式和答案内容进行...
-
AI生成视频还有王炸?阿里EMO惊艳登场,让小李子rap、高启强普法
撰稿 | 伊风 整个2月,Sora 可谓是当之无愧的 AI 明星,公布的两波 AI 视频吸睛无数。没想到在2月末尾,还能有另一位视频生成“选手”让我们感到惊喜! 那就是阿里新推出的视频生成框架——EMO (Emote Portrait Alive...
-
Stable Diffusion——见识一下正在兴起的AIGC产业!
今天再水一天,转发一篇分享文 明后天我会发布关于个人靶场搭建和内网穿透的内容,大家可以关注一下 原文地址:Stable Diffusion——见识一下正在兴起的AIGC产业! – Pleasure的博客 下面是正文部分: 前言 你或许曾在...
-
【AI绘画】Stable Diffusion 提示词——时尚日志封面
今天来给大家分享,如何用sd简单的咒语输出好看的图片的教程,今天做的是时尚杂志专题,话不多说直入主题。 一、基本设置: 正向提示词: 画质:Highest quality, ultra-high definition, masterpieces,...
-
GitHub宣布GitHub Copilot Enterprise的全面发布;使用Python与Gemma和MongoDB构建RAG系统的全过程
? AI新闻 ? GitHub宣布GitHub Copilot Enterprise的全面发布 摘要:GitHub Copilot Enterprise是一款基于OpenAI的GPT-4模型的代码助手,它结合了十多年的真实、安全可靠的代码数据进行开...
-
如何在 MacBook Pro 上安装 LLama.cpp + LLM Model 运行环境
如何在 MacBook Pro 上安装 LLama.cpp + LLM Model 运行环境 1. 问题与需求 近段时间想学习一下大语言模型的本地化部署与应用。首先遇到的就是部署硬件环境的问题。我自己的笔记本是一台 MacBook Pro M3,没...
-
Stable Diffusion ComfyUI 速度更快,控制更精准
一、前言 大家在使用Stable Diffusion(简称SD)时,通常是通过网页界面进行操作的。但你们有没有听说过ComfyUI呢? ComfyUI是一个建立在节点流程上的SD操作界面。它通过流程节点来实现更细致的工作流定制以及更好的可复现性。 每...
-
Stable Diffusion系列课程上:安装、提示词入门、常用模型(checkpoint、embedding、LORA)、放大算法、局部重绘、常用插件
文章目录 一、Stable Diffusion安装与源码解析 1.1 Stable Diffusion安装 1.2 webui启动代码分析 1.2.1 加载webui-user.sh 1.2.2 执行launch.py 1.2.3 执行we...
-
在autodl搭建stable-diffusion-webui+sadTalker
本文介绍在autodl.com搭建gpu服务器,实现stable-diffusion-webui+sadTalker功能,图片+音频 可生成视频。 autodl租GPU 自己本地部署SD环境会遇到各种问题,网络问题(比如...
-
Stable diffusion不同模型变量的work pipeline:checkpoint、lora、vae等等到底是怎么work together的?
SD里面有很多不同种类的模型参数,比如embedding、vae、checkpoint、hypernetwork、controlNet、clip还有lora,我看了很多博客,发现它们都是言语寥寥几句说什么改变风格,用于调整和改善生成图片的色彩之类的有点废话...
-
基于神经网络的偏微分方程求解器新突破:北大&字节研究成果入选Nature子刊
近年来,基于神经网络的偏微分方程求解器在各领域均得到了广泛关注。其中,量子变分蒙特卡洛方法(NNVMC)在量子化学领域异军突起,对于一系列问题的解决展现出超越传统方法的精确度 [1, 2, 3, 4]。北京大学与字节跳动研究部门 ByteDance Re...