-
【Python】科研代码学习:十五 configuration,tokenization 的代码细节:Llama 为例
【Python】科研代码学习:十五 tokenizer的代码细节:Llama_Tokenization 为例 前言 `LlamaConfig`:网络参数配置 `LlamaTokenizer`:分词工具 前言 对于 HF 的 Tr...
-
云原生技术赋能AI绘图:Stable Diffusion在腾讯云的部署与应用新篇章
摘要 随着信息技术的飞速发展和数字化转型的深入推进,云原生架构已成为企业数字化转型的重要基石。Docker容器、Serverless和微服务等技术作为云原生的核心组成部分,正在不断推动着企业应用架构的革新与升级。本文旨在总结近期在云原生实践、容器技术、...
-
开源版AI程序员来了:GPT-4加持,能力比肩Devin,一天1.4k Star
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 最近,有很多人在为 AI 代替自己的工作而担忧。 上个月火遍 AI 圈的「首位 AI 程序员」Devin,利用大模型能力已经掌握了全栈技...
-
华人又来炸场!一个命令工具让GPT-4干掉Devin和RAG!Jim Fan:提示工程2.0没必要了!
出品 | 51CTO技术栈(微信号:blog51cto) 华人又来炸场了!昨天,普林斯顿的CS/NLP硕士生John Yang在Github上开源了一款堪比Devin的利器。不到一天,就在Github上斩获了1.3k 星,异常生猛。据悉,4月10日,详细...
-
元象发布 XVERSE-MoE-A4.2B 大模型 可免费商用
元象发布了 XVERSE-MoE-A4.2B 大模型,采用混合专家模型架构,激活参数为4.2B,效果媲美13B 模型。该模型全开源,免费商用,可用于海量中小企业、研究者和开发者,推动低成本部署。 该模型具有极致压缩和超凡性能两大优势,采用稀疏激活技术,效果...
-
OS-Copilot:实现具有自我完善能力的通用计算机智能体
? CSDN 叶庭云:https://yetingyun.blog.csdn.net/ AI 缩小了人类间的知识和技术差距 论文标题:OS-Copilot: Towards Generalist Computer Agents with S...
-
Ubuntu 22.04 LTS AIGC GPU环境搭建(NVIDIA 550.67+CUDA 12.4+cuDNN)
Ubuntu 22.04 LTS AIGC GPU环境搭建(NVIDIA+CUDA+cuDNN) 一、服务器信息 1.1 硬件配置 服务器名称 CPU(Intel® Xeon® W-2245) 显卡(NVIDIA Quadro RTX 60...
-
开源大模型AI代理操作系统:像Windos一样,操控AI代理
本文经AIGC开放社区 授权转载,转载请联系出处。 想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 去年,AutoGPT的出现让我们见识到了AI代理强大的自动化能力,并开创了一个全新...
-
SWE-agent官网体验入口 开源AI程序员使用地址
SWE-agent是什么? SWE-agent是普林斯顿大学推出的首个开源AI程序员,基于GPT- 4 技术,能够自动修复GitHub仓库中的bug。其表现优异,开源性质受到开源社区高度认可。 点击前往SWE-agent官网体验入口 SWE-agent的...
-
普林斯顿首个「开源」AI程序员进场 基于GPT-4,可自动修复bug
普林斯顿大学最近推出了一款名为SWE-agent的AI程序员,这是世界上首个开源的AI程序员,它基于GPT-4技术,能够在GitHub仓库中自动修复bug。这个智能体-计算机接口(ACI)的诞生,标志着AI在软件工程领域的应用迈出了重要一步。 SWE-ag...
-
【保姆级讲解如何Stable Diffusion本地部署】
?个人主页:程序员不想敲代码啊? ?CSDN优质创作者,CSDN实力新星,CSDN博客专家? ?点赞⭐评论⭐收藏 ?希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共同学习、交流进步! Stable Diffusion本地部...
-
大模型中常用的注意力机制GQA详解以及Pytorch代码实现
分组查询注意力 (Grouped Query Attention 是一种在大型语言模型中的多查询注意力 (MQA 和多头注意力 (MHA 之间进行插值的方法,它的目标是在保持 MQA 速度的同时实现 MHA 的质量。 这篇文章中,我们将解释GQA的...
-
推荐:优秀JS开源人脸检测识别项目
人脸检测识别技术已经是一个比较成熟且应用广泛的技术。而目前最为广泛的互联网应用语言非JS莫属,在Web前端实现人脸检测识别相比后端的人脸识别有优势也有弱势,优势包括:减少网络交互、实时识别,大大缩短了用户等待时间,提高了用户体验;弱势是:受到模型大小限制...
-
Stable Diffusion WebUI 1.8.0来了
上周 Stable Diffusion WebUI 发布了 1.8.0 版本,更新内容比较多,据说显存使用有了大幅的下降,这几天我也找时间把 AutoDL 镜像的版本做了个升级,有兴趣的同学可以去体验下新版本了。 这里分享下其中几个我认为比较重要的更新。...
-
RWKV模型启动工具RWKV Runner新手教程(上)
大家好,今天我们带来了 RWKV Runner 的新手教程。 RWKV Runner 是 RWKV 模型的管理和启动工具,由 RWKV 开源社区成员 josStorer 开发,它本身也是一个开源软件,且体积仅 10MB 左右(不含依赖项)。 RWKV...
-
Perplexity要搞竞价排名了,大模型的尽头……就还是广告?
还记得曾经从英伟达和贝索斯们手里融了 7360 万美元,誓要以AI驱动的透明搜索体验挑战谷歌,俘获大批社区支持者的Perplexity吗? 如今,这家一直鄙视广告业务的硅谷明星AI公司,也准备开始卖广告了。 作为一款会话式答案引擎,Perplexity将聊...
-
AIGC 副业实战工具包
文章末尾领取2024年最新500个搞钱玩法合集 所有跟AI相关的插件合集 AI相关插件 AI Plugins清单@黄小刀 插件搜索框:https://github.com/banbri/AI-Plugins-Searchable/blob/main...
-
开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 0. 这篇文章干了啥? 提出了DepthFM:一个多功能且快速的最先进的生成式单目深度估计模型。除了传统的深度估计任务外,DepthFM还展示了在深度修复等下游任务中的最先进能力。DepthFM效率高...
-
【Ubuntu中VS Code GitHub Copilot的使用】
Ubuntu中VS Code GitHub Copilot的使用 前言 GitHub Copilot学生认证请参考文章github申请学生认证 vscode 中已安装GitHub Copilot插件 文章所述问题 使用GitHub...
-
Meta LLaMA 2实操:从零到一搭建顶尖开源大语言模型【超详篇】
前言 本文章由 [jfj] 编写,所有内容均为原创。涉及的软件环境是在nvidia-docker环境进行的,如对docker未了解如何使用的,可以移步上一篇文章nvidia-docker安装详解。 在 nvidia-docker 容器中运行时,Dock...
-
Paper Digest | GPT-RE:基于大语言模型针对关系抽取的上下文学习
笔记整理:张廉臣,东南大学硕士,研究方向为自然语言处理、信息抽取 链接:https://arxiv.org/pdf/2305.02105.pdf 持...
-
MidJourney制作缩略图的几种方式
背景 使用MidJourney生成图片,如果在prompt上不设置特殊的指令参数,官方默认返回的图片清晰度比较高,尺寸也很大。项目中我们自己会把MidJourney生成的原图保存一份,这样就会存在一个问题,因为MidJourney分辨率很高,占用的空间...
-
“大海捞针”out!“数星星”成测长文本能力更精准方法,来自鹅厂
大模型长文本能力测试,又有新方法了! 腾讯MLPD实验室,用全新开源的“数星星”方法替代了传统的“大海捞针”测试。 相比之下,新方法更注重对模型处理长依赖关系能力的考察,对模型的评估更加全面精准。 利用这种方法,研究人员对GPT-4和国内知名的Kimi...
-
性能强,成本低,运行快!最强开源大模型出现,超越ChatGPT和Llama!
大数据人工智能公司 Databricks放大招了! 3月27日,该公司开源了通用大模型 DBRX,并声称该模型是迄今为止全球最强大的开源大型语言模型,比 Meta 的 Llama 2 更为强大。 GPT-3.5研究测试: https://huj...
-
Stable Diffusion插件安装的3种方法,附4个插件下载地址!
目录 1. 前言 2. Stable Diffusion插件安装 2.1. 扩展库安装 2.2. URL安装 2.2. 源码安装 3. Stable Diffusion插件推荐 3.1. prompt-all-in-one 提示词翻译 ...
-
【没有哪个港口是永远的停留~论文解读】stable diffusion 总结 代码&推导&网络结构
了解整个流程: 【第一部分】输入图像 x (W*H*3的RGB图像) 【第一部分】x 经过编码器 生成 (latent 空间的表示 h*w*c (具体设置多少有实验 【第二部分】 逐步加噪得到 ,和噪声标签 【第二部分】由 Unet( )...
-
马斯克开源 Grok:参数量近 Llama 四倍,成全球最大开源模型
本周一,马斯克在他的社交媒体平台 X 上宣布 xAI 开源 Grok,这也兑现了他上周的开源承诺。截至目前,Grok 已经在 GitHub 上获得了 4.3k 颗 Star。 开源地址:https://github.com/xai-org/grok-1...
-
GPT-4单项仅得7.1分,揭露大模型代码能力三大短板,最新基准测试来了
首个AI软件工程师Devin正式亮相,立即引爆了整个技术界。 Devin不仅能够轻松解决编码任务,更可以自主完成软件开发的整个周期——从项目规划到部署,涵盖但不限于构建网站、自主寻找并修复 BUG、训练以及微调AI模型等。 这种 “强到逆天” 的软件开发...
-
孟子3-13B大模型正式开源
澜舟科技近日宣布,其研发的孟子3-13B大模型正式开源,并向学术研究领域全面开放,同时支持免费商用。这一轻量化大模型在多项基准测试中展现了优异的性能,特别是在参数量20B以内的模型中,其中英文语言能力尤为突出,数学和编程能力也位于行业前列。 孟子3-13B...
-
让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT
目前,Video Pose Transformer(VPT)在基于视频的三维人体姿态估计领域取得了最领先的性能。近年来,这些 VPT 的计算量变得越来越大,这些巨大的计算量同时也限制了这个领域的进一步发展,对那些计算资源不足的研究者十分不友好。例如,训练...
-
XZ恶意代码潜伏三年,差点引发核末日?后门投毒黑客身份成谜
整个周末,开源软件xz被植入后门事件,引发了安全界的轩然大波。 研究人员惊恐地发现,在包括Red Hat和Debian在内的多个广泛使用的Linux版本中,一款压缩工具被悄悄植入了恶意代码! 微软的安全研究员Andres Freund首次报告了这件事。...
-
大模型实时打《街霸》捉对PK,GPT-4居然不敌3.5,新型Benchmark火了
让大模型直接操纵格斗游戏《街霸》里的角色,捉对PK,谁更能打? GitHub上一种你没有见过的船新Benchmark火了。 与llmsys大模型竞技场中,两个大模型分别输出答案,再由人类评分不同——街霸Bench引入了两个AI之间的交互,且由游戏引擎中确...
-
0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练
澜舟科技官宣:孟子3-13B大模型正式开源! 这一主打高性价比的轻量化大模型,面向学术研究完全开放,并支持免费商用。 在MMLU、GSM8K、HUMAN-EVAL等各项基准测评估中,孟子3-13B都表现出了不错的性能。 尤其在参数量20B以内的轻量化大模...
-
比LoRA还快50%的微调方法来了!一张3090性能超越全参调优,UIUC联合LMFlow团队提出LISA
2022 年底,随着 ChatGPT 的爆火,人类正式进入了大模型时代。然而,训练大模型需要的时空消耗依然居高不下,给大模型的普及和发展带来了巨大困难。面对这一挑战,原先在计算机视觉领域流行的 LoRA 技术成功转型大模型 [1][2],带来了接近 2...
-
比人类便宜20倍!谷歌DeepMind推出「超人」AI系统
AI的同行评审来了! 一直以来,大语言模型胡说八道(幻觉)的问题最让人头疼,而近日,来自谷歌DeepMind的一项研究引发网友热议: 大模型的幻觉问题,好像被终结了? 论文地址:https://arxiv.org/pdf/2403.18802.pdf...
-
爆火的Ai绘画到底怎么用?Disco Diffusion(免费)入门
前段时间,一幅用AI绘制的作品获得绘画大奖的新闻又一次让AI绘画的话题热了起来,作为有一定美术基础的我看来,仅仅通过修改一些参数,通过文字描述,就可以获得一幅超过许多专业人士的画作,的确是让大部分公众兴奋,让少部分专业人士担忧的事。 不过,关于未来画家会...
-
HOW - Copilot 使用技巧
目录 一、介绍 二、定位:开发者的高水平结对编程助手 三、使用场景 四、常见使用方式 运维团队 数据与算法团队 开发和测试团队 五、对效率的提升 六、常见问题 一、介绍...
-
如何修改大模型的位置编码 --以LLama为例
最近在看RoPE相关内容,一些方法通过简单修改位置编码就可以无需训练支持更长的文本内容。由于一些模型,已经训练好了,但是怎么修改已经训练好的模型位置编码。查了以下相关代码,记录一下。原理这里就不细讲了,贴几个相关博客。十分钟读懂旋转编码(RoPE)Tran...
-
52个AIGC视频生成算法模型介绍
基于Diffusion模型的AIGC生成算法日益火热,其中文生图,图生图等图像生成技术普遍成熟,很多算法从业者开始从事视频生成算法的研究和开发,原因是视频生成领域相对空白。 AIGC视频算法发展现状 从2023年开始,AIG...
-
llama.cpp部署多模态视觉模型到应用实践
一、安装cmake https://cmake.org/ 因为我使用是win10系统cmake版本是3.26.4,请根据自己系统选择版本。 二、下载源码 git clone https://github.com/ggerganov/llam...
-
AIGC工具系列之——基于OpenAI的GPT大模型搭建自己的AIGC工具
今天我们来讲讲目前非常火的人工智能话题“AIGC”,以及怎么使用目前的AI技术来开发,构建自己的AIGC工具什么是AIGC? AIGC它的英文全称为(Artificial Intelligence Generated Content ,中文翻译过来就是“人...
-
Stable Diffusion Webui 本地部署【踩坑记录】
1、安装python Python Release Python 3.10.6 | Python.org 2、安装git git是一个代码管理工具,通过它可以将开源项目仓库克隆到本地 下载地址:Git - Downloading Package...
-
优秀自媒体工作者常用的8款ai写作工具! #人工智能#AI写作
在当今互联网时代,AI(人工智能)技术的快速发展使得许多传统工作都得到了极大的改进和提高效率。其中,AI写作软件在快速撰写高质量内容方面发挥了重要作用。本文将介绍备受赞誉的AI写作软件,并为您详细分析它们的特点和优势。 1.写作兔 这是一个微信公众号...
-
超快的 AI 实时语音转文字,比 OpenAI 的 Whisper 快4倍 -- 开源项目 Faster Whisper
faster-whisper 这个项目是基于 OpenAI whisper 的模型,在上面的一个重写。 使用的是 CTranslate2 的这样的一个库,CTranslate2 是用于 Transformer 模型的一个快速推理引擎。 在相同精度的情况...
-
DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源
DeepMind 这篇论文一出,人类标注者的饭碗也要被砸了吗? 大模型的幻觉终于要终结了? 今日,社媒平台 reddit 上的一则帖子引起网友热议。帖子讨论的是谷歌 DeepMind 昨日提交的一篇论文《Long-form factuality in la...
-
笔记本电脑上部署LLaMA-2中文模型
尝试在macbook上部署LLaMA-2的中文模型的详细过程。 (1)环境准备 MacBook Pro(M2 Max/32G ; VMware Fusion Player 版本 13.5.1 (23298085 ; Ubuntu 22.04.2 L...
-
Champ首发开源:人体视频生成新SOTA,5天斩获1k星,demo可玩
近日,由阿里、复旦大学、南京大学联合发布的可控人体视频生成工作 Champ 火爆全网。该模型仅开源 5 天 GitHub 即收获 1k 星,在 Twitter 更是「火出圈」,吸引了大量博主二创,浏览量总量达到 300K。 目前 Champ 已经开源...
-
ChatGPT 提示词:2024最新AIGC提示词大全(文末名片获取电子书)
博主猫头虎的技术世界 ? 欢迎来到猫头虎的博客 — 探索技术的无限可能! 专栏链接: ? 精选专栏: 《面试题大全》 — 面试准备的宝典! 《IDEA开发秘籍》 — 提升你的IDEA技能! 《100天精通鸿蒙》 — 从Web/...
-
Copilot 编程助手的介绍及使用
介绍 Copilot 是2021年由 GitHub 与 OpenAI 合作研发的一款编程助手,同时也是全球首款使用OpenAI Codex模型(GPT-3后代)打造的大规模生成式AI开发工具。 Copilot 底层模型目前经过了数十亿行公开代码的训...
-
蚂蚁集团异常检测和归因诊断分析实践
分享嘉宾|丁雷雷 蚂蚁集团算法专家 硕士毕业于北京邮电大学自动化学院,曾在阿里妈妈搜索直通车做广告算法。目前在蚂蚁机器智能部,从事异常检测、时序预测、归因分析、因果推断算法工作。 本文将分享异常检测与归因诊断在蚂蚁集团的实践。主要围绕归因诊断、异常检测...