github 第22页 - AIGC资讯

LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调

LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调文章原始地址：https://onlyar.site/2024/01/14/NLP-LLaMA-Factory-web-tuning/ 引言大语...

大数据 2024-04-05 人工智能

970阅读

【小白】一文读懂AIGC模型之Stable Diffusion模型

目录模型简介模型结构 VAE变分编码器 VAE结构 VAE模型训练与损失函数 U-Net结构 CLIP Text Encoder 模型工作流程参考模型简介 Stable Diffusion（SD）模型是一种基于...

AIGC 2024-04-05 人工智能

1392阅读

llama-factory简介

llamafactory是什么，能干什么 LLaMA-Factory 是一个易于使用的大规模语言模型（Large Language Model, LLM）微调框架，它支持多种模型，包括 LLaMA、BLOOM、Mistral、Baichuan、Qwen ...

人工智能 2024-04-05 人工智能

1504阅读

WebCopilot：一款功能强大的子域名枚举和安全漏洞扫描工具

关于WebCopilot WebCopilot是一款功能强大的子域名枚举和安全漏洞扫描工具，该工具能够枚举目标域名下的子域名，并使用不同的开源工具检测目标存在的安全漏洞。工具运行机制 WebCopilot首先会使用assetsfind...

AIGC 2024-04-04 人工智能

971阅读

『SD』零基础快速搭建Stable Diffusion（Windows版）

theme: smartblue 点赞 + 关注 + 收藏 = 学会了本文简介本文介绍如何在 Windows 安装 Stable Diffusion WebUI，不需要懂代码，只要跟着本文一步步操作就能在你电脑用AI绘画了。只...

生成式AI 2024-04-04 人工智能

911阅读

whisper、whisper.cpp、faster-whisper的比较

让我们比较一下当前的whisper、whisper.cpp和faster-whisper。 OpenAI / Whisper 自发布以来，似乎在各个方面都发生了变化，例如在 2022 年 12 月增加了 large-v2 模型和各种版本升级。 whis...

人工智能 2024-04-04 人工智能

1399阅读

首个开源世界模型LWM ：百万级上下文，长视频理解超GPT-4

来自加州大学伯克利分校的研究人员最近发布并开源了首个世界模型，被称为 LWM（LargeWorldModel）系列模型。这一模型采用了大量视频和书籍数据集，通过 RingAttention 技术实现了长序列的可扩展训练，使得模型的上下文长度达到了1M to...

生成式AI 2024-04-04 人工智能

942阅读

华人开源最强「AI 程序员」炸场，让 GPT-4 自己修 Bug！

自从“AI 程序员”Devin问世之后，近期的一大趋势就是程序员们争先恐后地要让自己失业，试图抢先造出比自己更强大的程序员。普林斯顿大学为软件工程界迎来了一位新星——SWE-agent，论文将在4月10日正式发布，目前项目已在 GitHub 上开源。...

大数据 2024-04-04 人工智能

876阅读

【Python】科研代码学习：十五 configuration，tokenization 的代码细节：Llama 为例

【Python】科研代码学习：十五 tokenizer的代码细节：Llama_Tokenization 为例前言 `LlamaConfig`：网络参数配置 `LlamaTokenizer`：分词工具前言对于 HF 的 Tr...

生成式AI 2024-04-04 人工智能

1169阅读

云原生技术赋能AI绘图：Stable Diffusion在腾讯云的部署与应用新篇章

摘要随着信息技术的飞速发展和数字化转型的深入推进，云原生架构已成为企业数字化转型的重要基石。Docker容器、Serverless和微服务等技术作为云原生的核心组成部分，正在不断推动着企业应用架构的革新与升级。本文旨在总结近期在云原生实践、容器技术、...

人工智能 2024-04-04 人工智能

767阅读

开源版AI程序员来了：GPT-4加持，能力比肩Devin，一天1.4k Star

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 最近，有很多人在为 AI 代替自己的工作而担忧。上个月火遍 AI 圈的「首位 AI 程序员」Devin，利用大模型能力已经掌握了全栈技...

大数据 2024-04-03 人工智能

843阅读

华人又来炸场！一个命令工具让GPT-4干掉Devin和RAG！Jim Fan：提示工程2.0没必要了！

出品 | 51CTO技术栈（微信号：blog51cto）华人又来炸场了！昨天，普林斯顿的CS/NLP硕士生John Yang在Github上开源了一款堪比Devin的利器。不到一天，就在Github上斩获了1.3k 星，异常生猛。据悉，4月10日，详细...

生成式AI 2024-04-03 人工智能

848阅读

元象发布 XVERSE-MoE-A4.2B 大模型可免费商用

元象发布了 XVERSE-MoE-A4.2B 大模型，采用混合专家模型架构，激活参数为4.2B，效果媲美13B 模型。该模型全开源，免费商用，可用于海量中小企业、研究者和开发者，推动低成本部署。该模型具有极致压缩和超凡性能两大优势，采用稀疏激活技术，效果...

生成式AI 2024-04-03 人工智能

935阅读

OS-Copilot：实现具有自我完善能力的通用计算机智能体

? CSDN 叶庭云：https://yetingyun.blog.csdn.net/ AI 缩小了人类间的知识和技术差距论文标题：OS-Copilot: Towards Generalist Computer Agents with S...

人工智能 2024-04-03 人工智能

975阅读

Ubuntu 22.04 LTS AIGC GPU环境搭建（NVIDIA 550.67+CUDA 12.4+cuDNN）

Ubuntu 22.04 LTS AIGC GPU环境搭建（NVIDIA+CUDA+cuDNN）一、服务器信息 1.1 硬件配置服务器名称 CPU（Intel® Xeon® W-2245）显卡（NVIDIA Quadro RTX 60...

人工智能 2024-04-03 人工智能

1557阅读

开源大模型AI代理操作系统：像Windos一样，操控AI代理

本文经AIGC开放社区授权转载，转载请联系出处。想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 去年，AutoGPT的出现让我们见识到了AI代理强大的自动化能力，并开创了一个全新...

生成式AI 2024-04-03 人工智能

930阅读

SWE-agent官网体验入口开源AI程序员使用地址

SWE-agent是什么？ SWE-agent是普林斯顿大学推出的首个开源AI程序员，基于GPT- 4 技术，能够自动修复GitHub仓库中的bug。其表现优异，开源性质受到开源社区高度认可。点击前往SWE-agent官网体验入口 SWE-agent的...

AIGC 2024-04-03 人工智能

1024阅读

普林斯顿首个「开源」AI程序员进场基于GPT-4，可自动修复bug

普林斯顿大学最近推出了一款名为SWE-agent的AI程序员，这是世界上首个开源的AI程序员，它基于GPT-4技术，能够在GitHub仓库中自动修复bug。这个智能体-计算机接口（ACI）的诞生，标志着AI在软件工程领域的应用迈出了重要一步。 SWE-ag...

大数据 2024-04-03 人工智能

1011阅读

【保姆级讲解如何Stable Diffusion本地部署】

?个人主页:程序员不想敲代码啊? ?CSDN优质创作者，CSDN实力新星，CSDN博客专家? ?点赞⭐评论⭐收藏 ?希望本文对您有所裨益，如有不足之处，欢迎在评论区提出指正，让我们共同学习、交流进步！ Stable Diffusion本地部...

AIGC 2024-04-03 人工智能

1281阅读

大模型中常用的注意力机制GQA详解以及Pytorch代码实现

分组查询注意力 (Grouped Query Attention 是一种在大型语言模型中的多查询注意力 (MQA 和多头注意力 (MHA 之间进行插值的方法，它的目标是在保持 MQA 速度的同时实现 MHA 的质量。这篇文章中，我们将解释GQA的...

AIGC 2024-04-03 人工智能

842阅读

推荐：优秀JS开源人脸检测识别项目

人脸检测识别技术已经是一个比较成熟且应用广泛的技术。而目前最为广泛的互联网应用语言非JS莫属，在Web前端实现人脸检测识别相比后端的人脸识别有优势也有弱势，优势包括：减少网络交互、实时识别，大大缩短了用户等待时间，提高了用户体验；弱势是：受到模型大小限制...

人工智能 2024-04-03 人工智能

983阅读

Stable Diffusion WebUI 1.8.0来了

上周 Stable Diffusion WebUI 发布了 1.8.0 版本，更新内容比较多，据说显存使用有了大幅的下降，这几天我也找时间把 AutoDL 镜像的版本做了个升级，有兴趣的同学可以去体验下新版本了。这里分享下其中几个我认为比较重要的更新。...

生成式AI 2024-04-03 人工智能

945阅读

RWKV模型启动工具RWKV Runner新手教程（上）

大家好，今天我们带来了 RWKV Runner 的新手教程。 RWKV Runner 是 RWKV 模型的管理和启动工具，由 RWKV 开源社区成员 josStorer 开发，它本身也是一个开源软件，且体积仅 10MB 左右（不含依赖项）。 RWKV...

人工智能 2024-04-03 人工智能

1130阅读

Perplexity要搞竞价排名了，大模型的尽头……就还是广告？

还记得曾经从英伟达和贝索斯们手里融了 7360 万美元，誓要以AI驱动的透明搜索体验挑战谷歌，俘获大批社区支持者的Perplexity吗？如今，这家一直鄙视广告业务的硅谷明星AI公司，也准备开始卖广告了。作为一款会话式答案引擎，Perplexity将聊...

生成式AI 2024-04-03 人工智能

818阅读

AIGC 副业实战工具包

文章末尾领取2024年最新500个搞钱玩法合集所有跟AI相关的插件合集 AI相关插件 AI Plugins清单@黄小刀插件搜索框：https://github.com/banbri/AI-Plugins-Searchable/blob/main...

生成式AI 2024-04-03 人工智能

1004阅读

开源！超越ZoeDepth！ DepthFM：快速且精确的单目深度估计！

本文经自动驾驶之心公众号授权转载，转载请联系出处。 0. 这篇文章干了啥？提出了DepthFM：一个多功能且快速的最先进的生成式单目深度估计模型。除了传统的深度估计任务外，DepthFM还展示了在深度修复等下游任务中的最先进能力。DepthFM效率高...

AIGC 2024-04-03 人工智能

884阅读

【Ubuntu中VS Code GitHub Copilot的使用】

Ubuntu中VS Code GitHub Copilot的使用前言 GitHub Copilot学生认证请参考文章github申请学生认证 vscode 中已安装GitHub Copilot插件文章所述问题使用GitHub...

生成式AI 2024-04-03 人工智能

1277阅读

Meta LLaMA 2实操：从零到一搭建顶尖开源大语言模型【超详篇】

前言本文章由 [jfj] 编写，所有内容均为原创。涉及的软件环境是在nvidia-docker环境进行的，如对docker未了解如何使用的，可以移步上一篇文章nvidia-docker安装详解。在 nvidia-docker 容器中运行时，Dock...

大数据 2024-04-02 人工智能

1579阅读

Paper Digest | GPT-RE：基于大语言模型针对关系抽取的上下文学习

笔记整理：张廉臣，东南大学硕士，研究方向为自然语言处理、信息抽取链接：https://arxiv.org/pdf/2305.02105.pdf 持...

大数据 2024-04-02 人工智能

1026阅读

MidJourney制作缩略图的几种方式

背景使用MidJourney生成图片，如果在prompt上不设置特殊的指令参数，官方默认返回的图片清晰度比较高，尺寸也很大。项目中我们自己会把MidJourney生成的原图保存一份，这样就会存在一个问题，因为MidJourney分辨率很高，占用的空间...

人工智能 2024-04-02 人工智能

1115阅读

“大海捞针”out！“数星星”成测长文本能力更精准方法，来自鹅厂

大模型长文本能力测试，又有新方法了！腾讯MLPD实验室，用全新开源的“数星星”方法替代了传统的“大海捞针”测试。相比之下，新方法更注重对模型处理长依赖关系能力的考察，对模型的评估更加全面精准。利用这种方法，研究人员对GPT-4和国内知名的Kimi...

AIGC 2024-04-02 人工智能

783阅读

性能强，成本低，运行快！最强开源大模型出现，超越ChatGPT和Llama！

大数据人工智能公司 Databricks放大招了！ 3月27日，该公司开源了通用大模型 DBRX，并声称该模型是迄今为止全球最强大的开源大型语言模型，比 Meta 的 Llama 2 更为强大。 GPT-3.5研究测试： https://huj...

大数据 2024-04-02 人工智能

914阅读

Stable Diffusion插件安装的3种方法，附4个插件下载地址！

目录 1. 前言 2. Stable Diffusion插件安装 2.1. 扩展库安装 2.2. URL安装 2.2. 源码安装 3. Stable Diffusion插件推荐 3.1. prompt-all-in-one 提示词翻译 ...

人工智能 2024-04-02 人工智能

1176阅读

【没有哪个港口是永远的停留~论文解读】stable diffusion 总结代码&推导&网络结构

了解整个流程：【第一部分】输入图像 x （W*H*3的RGB图像）【第一部分】x 经过编码器生成 (latent 空间的表示 h*w*c (具体设置多少有实验【第二部分】逐步加噪得到，和噪声标签【第二部分】由 Unet（）...

大数据 2024-04-01 人工智能

1266阅读

马斯克开源 Grok：参数量近 Llama 四倍，成全球最大开源模型

本周一，马斯克在他的社交媒体平台 X 上宣布 xAI 开源 Grok，这也兑现了他上周的开源承诺。截至目前，Grok 已经在 GitHub 上获得了 4.3k 颗 Star。开源地址：https://github.com/xai-org/grok-1...

生成式AI 2024-04-01 人工智能

948阅读

GPT-4单项仅得7.1分，揭露大模型代码能力三大短板，最新基准测试来了

首个AI软件工程师Devin正式亮相，立即引爆了整个技术界。 Devin不仅能够轻松解决编码任务，更可以自主完成软件开发的整个周期——从项目规划到部署，涵盖但不限于构建网站、自主寻找并修复 BUG、训练以及微调AI模型等。这种 “强到逆天” 的软件开发...

大数据 2024-04-01 人工智能

962阅读

孟子3-13B大模型正式开源

澜舟科技近日宣布，其研发的孟子3-13B大模型正式开源，并向学术研究领域全面开放，同时支持免费商用。这一轻量化大模型在多项基准测试中展现了优异的性能，特别是在参数量20B以内的模型中，其中英文语言能力尤为突出，数学和编程能力也位于行业前列。孟子3-13B...

生成式AI 2024-04-01 人工智能

867阅读

让视频姿态Transformer变得飞速，北大提出高效三维人体姿态估计框架HoT

目前，Video Pose Transformer（VPT）在基于视频的三维人体姿态估计领域取得了最领先的性能。近年来，这些 VPT 的计算量变得越来越大，这些巨大的计算量同时也限制了这个领域的进一步发展，对那些计算资源不足的研究者十分不友好。例如，训练...

人工智能 2024-04-01 人工智能

890阅读

XZ恶意代码潜伏三年，差点引发核末日？后门投毒黑客身份成谜

整个周末，开源软件xz被植入后门事件，引发了安全界的轩然大波。研究人员惊恐地发现，在包括Red Hat和Debian在内的多个广泛使用的Linux版本中，一款压缩工具被悄悄植入了恶意代码！微软的安全研究员Andres Freund首次报告了这件事。...

生成式AI 2024-04-01 人工智能

961阅读

大模型实时打《街霸》捉对PK，GPT-4居然不敌3.5，新型Benchmark火了

让大模型直接操纵格斗游戏《街霸》里的角色，捉对PK，谁更能打? GitHub上一种你没有见过的船新Benchmark火了。与llmsys大模型竞技场中，两个大模型分别输出答案，再由人类评分不同——街霸Bench引入了两个AI之间的交互，且由游戏引擎中确...

生成式AI 2024-04-01 人工智能

942阅读

0门槛免费商用！孟子3-13B大模型正式开源，万亿token数据训练

澜舟科技官宣：孟子3-13B大模型正式开源！这一主打高性价比的轻量化大模型，面向学术研究完全开放，并支持免费商用。在MMLU、GSM8K、HUMAN-EVAL等各项基准测评估中，孟子3-13B都表现出了不错的性能。尤其在参数量20B以内的轻量化大模...

生成式AI 2024-04-01 人工智能

754阅读

比LoRA还快50%的微调方法来了！一张3090性能超越全参调优，UIUC联合LMFlow团队提出LISA

2022 年底，随着 ChatGPT 的爆火，人类正式进入了大模型时代。然而，训练大模型需要的时空消耗依然居高不下，给大模型的普及和发展带来了巨大困难。面对这一挑战，原先在计算机视觉领域流行的 LoRA 技术成功转型大模型 [1][2]，带来了接近 2...

大数据 2024-04-01 人工智能

869阅读

比人类便宜20倍！谷歌DeepMind推出「超人」AI系统

AI的同行评审来了！一直以来，大语言模型胡说八道（幻觉）的问题最让人头疼，而近日，来自谷歌DeepMind的一项研究引发网友热议：大模型的幻觉问题，好像被终结了？论文地址：https://arxiv.org/pdf/2403.18802.pdf...

人工智能 2024-04-01 人工智能

782阅读

爆火的Ai绘画到底怎么用？Disco Diffusion（免费）入门

前段时间，一幅用AI绘制的作品获得绘画大奖的新闻又一次让AI绘画的话题热了起来，作为有一定美术基础的我看来，仅仅通过修改一些参数，通过文字描述，就可以获得一幅超过许多专业人士的画作，的确是让大部分公众兴奋，让少部分专业人士担忧的事。不过，关于未来画家会...

生成式AI 2024-04-01 人工智能

898阅读

HOW - Copilot 使用技巧

目录一、介绍二、定位：开发者的高水平结对编程助手三、使用场景四、常见使用方式运维团队数据与算法团队开发和测试团队五、对效率的提升六、常见问题一、介绍...

生成式AI 2024-04-01 人工智能

957阅读

如何修改大模型的位置编码 --以LLama为例

最近在看RoPE相关内容，一些方法通过简单修改位置编码就可以无需训练支持更长的文本内容。由于一些模型，已经训练好了，但是怎么修改已经训练好的模型位置编码。查了以下相关代码，记录一下。原理这里就不细讲了，贴几个相关博客。十分钟读懂旋转编码（RoPE）Tran...

AIGC 2024-03-31 人工智能

1093阅读

52个AIGC视频生成算法模型介绍

基于Diffusion模型的AIGC生成算法日益火热，其中文生图，图生图等图像生成技术普遍成熟，很多算法从业者开始从事视频生成算法的研究和开发，原因是视频生成领域相对空白。 AIGC视频算法发展现状从2023年开始，AIG...

AIGC 2024-03-30 人工智能

1164阅读

llama.cpp部署多模态视觉模型到应用实践

一、安装cmake https://cmake.org/ 因为我使用是win10系统cmake版本是3.26.4，请根据自己系统选择版本。二、下载源码 git clone https://github.com/ggerganov/llam...

人工智能 2024-03-30 人工智能

2319阅读

AIGC工具系列之——基于OpenAI的GPT大模型搭建自己的AIGC工具

今天我们来讲讲目前非常火的人工智能话题“AIGC”，以及怎么使用目前的AI技术来开发，构建自己的AIGC工具什么是AIGC？ AIGC它的英文全称为(Artificial Intelligence Generated Content ，中文翻译过来就是“人...

AIGC 2024-03-30 人工智能

1274阅读

Stable Diffusion Webui 本地部署【踩坑记录】

1、安装python Python Release Python 3.10.6 | Python.org 2、安装git git是一个代码管理工具，通过它可以将开源项目仓库克隆到本地下载地址：Git - Downloading Package...

人工智能 2024-03-29 人工智能

943阅读