-
腾讯开源视频生成新工具,论文还没发先上代码的那种
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 先上代码再发论文,腾讯新开源文生视频工具火了。 名为MuseV,主打基于视觉条件并行去噪的无限长度和高保真虚拟人视频生成。 老规矩,先看...
-
抱歉,70%的音乐人真要被AI替代了
“这个AI太厉害了,它的创作水平已经超越了我们公司十多年的专业作曲水平。”小旭音乐创始人卢小旭在使用完Suno V3后感慨道。 虽然“AI颠覆影视”“AI颠覆音乐”等论断早已层出不穷,但当这一刻真正到来的时候,从业者仍然感到惊讶。 就在最近,音乐人杨樾用S...
-
推荐:优秀JS开源人脸检测识别项目
人脸检测识别技术已经是一个比较成熟且应用广泛的技术。而目前最为广泛的互联网应用语言非JS莫属,在Web前端实现人脸检测识别相比后端的人脸识别有优势也有弱势,优势包括:减少网络交互、实时识别,大大缩短了用户等待时间,提高了用户体验;弱势是:受到模型大小限制...
-
Stable Diffusion WebUI 1.8.0来了
上周 Stable Diffusion WebUI 发布了 1.8.0 版本,更新内容比较多,据说显存使用有了大幅的下降,这几天我也找时间把 AutoDL 镜像的版本做了个升级,有兴趣的同学可以去体验下新版本了。 这里分享下其中几个我认为比较重要的更新。...
-
RWKV模型启动工具RWKV Runner新手教程(上)
大家好,今天我们带来了 RWKV Runner 的新手教程。 RWKV Runner 是 RWKV 模型的管理和启动工具,由 RWKV 开源社区成员 josStorer 开发,它本身也是一个开源软件,且体积仅 10MB 左右(不含依赖项)。 RWKV...
-
Perplexity要搞竞价排名了,大模型的尽头……就还是广告?
还记得曾经从英伟达和贝索斯们手里融了 7360 万美元,誓要以AI驱动的透明搜索体验挑战谷歌,俘获大批社区支持者的Perplexity吗? 如今,这家一直鄙视广告业务的硅谷明星AI公司,也准备开始卖广告了。 作为一款会话式答案引擎,Perplexity将聊...
-
AIGC 副业实战工具包
文章末尾领取2024年最新500个搞钱玩法合集 所有跟AI相关的插件合集 AI相关插件 AI Plugins清单@黄小刀 插件搜索框:https://github.com/banbri/AI-Plugins-Searchable/blob/main...
-
在线建图与轨迹预测如何紧密结合?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:Producing and Leveraging Online Map Uncertainty in Trajectory Prediction 论文链接:https://arxiv.org/...
-
开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 0. 这篇文章干了啥? 提出了DepthFM:一个多功能且快速的最先进的生成式单目深度估计模型。除了传统的深度估计任务外,DepthFM还展示了在深度修复等下游任务中的最先进能力。DepthFM效率高...
-
神经矩阵:数字进化的新生命形式
译者 | 李睿 审校 | 重楼 随着人工智能技术的快速发展,有些人害怕机器人的崛起,有些人担心人工智能将会接管世界。但是人们需要了解人工智能的未来发展,以及电子生命形式将会如何诞生。 本文不仅介绍电子生命形式将如何诞生,而且还将详细描述神经矩阵的关键元...
-
AI绘图:Stable Diffusion WEB UI 详细操作介绍:基础篇
接上一篇《AI绘图体验:Stable Diffusion本地化部署详细步骤》本地部署完了SD后,大家肯定想知道怎么用,接下来补一篇Stable Diffusion WEB UI 详细操作,如果大家还没有完成SD的部署,请参考上一篇文章进行本地化的部署。...
-
【Ubuntu中VS Code GitHub Copilot的使用】
Ubuntu中VS Code GitHub Copilot的使用 前言 GitHub Copilot学生认证请参考文章github申请学生认证 vscode 中已安装GitHub Copilot插件 文章所述问题 使用GitHub...
-
Meta LLaMA 2实操:从零到一搭建顶尖开源大语言模型【超详篇】
前言 本文章由 [jfj] 编写,所有内容均为原创。涉及的软件环境是在nvidia-docker环境进行的,如对docker未了解如何使用的,可以移步上一篇文章nvidia-docker安装详解。 在 nvidia-docker 容器中运行时,Dock...
-
秋叶大佬24年最新的Stable Diffusion整合包V4.6.7来了~
! 「 无套路!文末提供下载方式 」 要说今年绘画圈最大的新秀 那妥妥的就Stable Diffution V4升级版无需安装**,直接解压就能用 (在此要感谢秋葉aaaki大佬的分享!) 比之前推送的更加智能、快速和简单 有多简单呢?这么说...
-
Paper Digest | GPT-RE:基于大语言模型针对关系抽取的上下文学习
笔记整理:张廉臣,东南大学硕士,研究方向为自然语言处理、信息抽取 链接:https://arxiv.org/pdf/2305.02105.pdf 持...
-
MidJourney制作缩略图的几种方式
背景 使用MidJourney生成图片,如果在prompt上不设置特殊的指令参数,官方默认返回的图片清晰度比较高,尺寸也很大。项目中我们自己会把MidJourney生成的原图保存一份,这样就会存在一个问题,因为MidJourney分辨率很高,占用的空间...
-
“大海捞针”out!“数星星”成测长文本能力更精准方法,来自鹅厂
大模型长文本能力测试,又有新方法了! 腾讯MLPD实验室,用全新开源的“数星星”方法替代了传统的“大海捞针”测试。 相比之下,新方法更注重对模型处理长依赖关系能力的考察,对模型的评估更加全面精准。 利用这种方法,研究人员对GPT-4和国内知名的Kimi...
-
性能强,成本低,运行快!最强开源大模型出现,超越ChatGPT和Llama!
大数据人工智能公司 Databricks放大招了! 3月27日,该公司开源了通用大模型 DBRX,并声称该模型是迄今为止全球最强大的开源大型语言模型,比 Meta 的 Llama 2 更为强大。 GPT-3.5研究测试: https://huj...
-
【Stable Diffusion】SD迎来动画革命,AnimateDiff快速出图
如果放在几年前,你告诉我说只需一分钟就能做出一段这样的动画,我是万万不相信的,但是当AI时代来临之后,一切都有了可能。 今天给大家介绍一个可以快速在sd中生成动画的方法,就是一个叫做AnimateDiff的免费开源项目。现在已经整合到了webUI上面,使...
-
4G显存玩转AI绘画!Stable Diffusion WebUI Forge来了!
经常使用Stable Diffusion WebUI的同学可能都被显存的问题困扰过,其运行时需要巨大的显存空间,跑着跑着显存可能就爆了,不得不重新启动。不过现在这个问题解决了,因为Stable Diffusion WebUI Forge来了。 Forge...
-
Stable Diffusion插件安装的3种方法,附4个插件下载地址!
目录 1. 前言 2. Stable Diffusion插件安装 2.1. 扩展库安装 2.2. URL安装 2.2. 源码安装 3. Stable Diffusion插件推荐 3.1. prompt-all-in-one 提示词翻译 ...
-
【没有哪个港口是永远的停留~论文解读】stable diffusion 总结 代码&推导&网络结构
了解整个流程: 【第一部分】输入图像 x (W*H*3的RGB图像) 【第一部分】x 经过编码器 生成 (latent 空间的表示 h*w*c (具体设置多少有实验 【第二部分】 逐步加噪得到 ,和噪声标签 【第二部分】由 Unet( )...
-
马斯克开源 Grok:参数量近 Llama 四倍,成全球最大开源模型
本周一,马斯克在他的社交媒体平台 X 上宣布 xAI 开源 Grok,这也兑现了他上周的开源承诺。截至目前,Grok 已经在 GitHub 上获得了 4.3k 颗 Star。 开源地址:https://github.com/xai-org/grok-1...
-
OpenAI和微软将投资1000亿美元建设全球最大的数据中心
ChatGPT 的背后开发者OpenAI ,计划与微软公司合作投资100亿美元建设全球最大数据中心。这个计划旨在开发人工通用智能(AGI)技术,并将配备一个超级计算机。 根据《The Information》的消息,两家公司的管理层正在进行一个名为 “St...
-
GPT-4单项仅得7.1分,揭露大模型代码能力三大短板,最新基准测试来了
首个AI软件工程师Devin正式亮相,立即引爆了整个技术界。 Devin不仅能够轻松解决编码任务,更可以自主完成软件开发的整个周期——从项目规划到部署,涵盖但不限于构建网站、自主寻找并修复 BUG、训练以及微调AI模型等。 这种 “强到逆天” 的软件开发...
-
孟子3-13B大模型正式开源
澜舟科技近日宣布,其研发的孟子3-13B大模型正式开源,并向学术研究领域全面开放,同时支持免费商用。这一轻量化大模型在多项基准测试中展现了优异的性能,特别是在参数量20B以内的模型中,其中英文语言能力尤为突出,数学和编程能力也位于行业前列。 孟子3-13B...
-
让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT
目前,Video Pose Transformer(VPT)在基于视频的三维人体姿态估计领域取得了最领先的性能。近年来,这些 VPT 的计算量变得越来越大,这些巨大的计算量同时也限制了这个领域的进一步发展,对那些计算资源不足的研究者十分不友好。例如,训练...
-
XZ恶意代码潜伏三年,差点引发核末日?后门投毒黑客身份成谜
整个周末,开源软件xz被植入后门事件,引发了安全界的轩然大波。 研究人员惊恐地发现,在包括Red Hat和Debian在内的多个广泛使用的Linux版本中,一款压缩工具被悄悄植入了恶意代码! 微软的安全研究员Andres Freund首次报告了这件事。...
-
大模型实时打《街霸》捉对PK,GPT-4居然不敌3.5,新型Benchmark火了
让大模型直接操纵格斗游戏《街霸》里的角色,捉对PK,谁更能打? GitHub上一种你没有见过的船新Benchmark火了。 与llmsys大模型竞技场中,两个大模型分别输出答案,再由人类评分不同——街霸Bench引入了两个AI之间的交互,且由游戏引擎中确...
-
0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练
澜舟科技官宣:孟子3-13B大模型正式开源! 这一主打高性价比的轻量化大模型,面向学术研究完全开放,并支持免费商用。 在MMLU、GSM8K、HUMAN-EVAL等各项基准测评估中,孟子3-13B都表现出了不错的性能。 尤其在参数量20B以内的轻量化大模...
-
比LoRA还快50%的微调方法来了!一张3090性能超越全参调优,UIUC联合LMFlow团队提出LISA
2022 年底,随着 ChatGPT 的爆火,人类正式进入了大模型时代。然而,训练大模型需要的时空消耗依然居高不下,给大模型的普及和发展带来了巨大困难。面对这一挑战,原先在计算机视觉领域流行的 LoRA 技术成功转型大模型 [1][2],带来了接近 2...
-
Whisper.cpp: 一个轻量级、高效的C++事件系统
Whisper.cpp: 一个轻量级、高效的C++事件系统 项目地址:https://gitcode.com/ggerganov/whisper.cpp 在当今的软件开发中,事件驱动模型已经成为构建复杂应用程序的核心部分。Whisper.cpp是一...
-
比人类便宜20倍!谷歌DeepMind推出「超人」AI系统
AI的同行评审来了! 一直以来,大语言模型胡说八道(幻觉)的问题最让人头疼,而近日,来自谷歌DeepMind的一项研究引发网友热议: 大模型的幻觉问题,好像被终结了? 论文地址:https://arxiv.org/pdf/2403.18802.pdf...
-
爆火的Ai绘画到底怎么用?Disco Diffusion(免费)入门
前段时间,一幅用AI绘制的作品获得绘画大奖的新闻又一次让AI绘画的话题热了起来,作为有一定美术基础的我看来,仅仅通过修改一些参数,通过文字描述,就可以获得一幅超过许多专业人士的画作,的确是让大部分公众兴奋,让少部分专业人士担忧的事。 不过,关于未来画家会...
-
1000亿美元宇宙级豪赌!微软OpenAI打造星际之门AI超算,电力能耗惊人
就在刚刚,又有大消息曝出。 据外媒The Information报道,微软和OpenAI正计划建设一个名为「星际之门」(Stargate)的特殊数据中心,为后者提供强大的计算支持。 具体来说: 微软高层计划最快在2028年启动该项目 这台超算对电力的需...
-
HOW - Copilot 使用技巧
目录 一、介绍 二、定位:开发者的高水平结对编程助手 三、使用场景 四、常见使用方式 运维团队 数据与算法团队 开发和测试团队 五、对效率的提升 六、常见问题 一、介绍...
-
如何修改大模型的位置编码 --以LLama为例
最近在看RoPE相关内容,一些方法通过简单修改位置编码就可以无需训练支持更长的文本内容。由于一些模型,已经训练好了,但是怎么修改已经训练好的模型位置编码。查了以下相关代码,记录一下。原理这里就不细讲了,贴几个相关博客。十分钟读懂旋转编码(RoPE)Tran...
-
Code Llama 简介,一种最先进的大型编码语言模型
Code Llama 简介,一种最先进的大型编码语言模型 2023 年 8 月 24 日...
-
AIGC时代的数字化转型核心 Springboot集成数据治理神器
大数据Hadoop 生态的三大部件的目录 往期热门专栏回顾 前言 1、HDFS 2、Yarn 3、Hive 4、HBase 4.1.特点 4.2.存储 5、Spark及Spark Streaming 关于作者 往期热门专栏回顾...
-
52个AIGC视频生成算法模型介绍
基于Diffusion模型的AIGC生成算法日益火热,其中文生图,图生图等图像生成技术普遍成熟,很多算法从业者开始从事视频生成算法的研究和开发,原因是视频生成领域相对空白。 AIGC视频算法发展现状 从2023年开始,AIG...
-
llama.cpp部署多模态视觉模型到应用实践
一、安装cmake https://cmake.org/ 因为我使用是win10系统cmake版本是3.26.4,请根据自己系统选择版本。 二、下载源码 git clone https://github.com/ggerganov/llam...
-
CodeWhisperer插件
一、前言 产品官网地址:What is CodeWhisperer? - CodeWhisperer Amazon CodeWhisperer 是一个通用的、由机器学习驱动的代码生成器,可实时为您提供代码建议。在您编写代码时,CodeWhisperer...
-
AIGC工具系列之——基于OpenAI的GPT大模型搭建自己的AIGC工具
今天我们来讲讲目前非常火的人工智能话题“AIGC”,以及怎么使用目前的AI技术来开发,构建自己的AIGC工具什么是AIGC? AIGC它的英文全称为(Artificial Intelligence Generated Content ,中文翻译过来就是“人...
-
stable diffusion webui 搭建和初步使用
官方repo: GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI 关于stable-diffusion的介绍:Stable Diffusion|图解稳定扩散原理...
-
Stable Diffusion Webui 本地部署【踩坑记录】
1、安装python Python Release Python 3.10.6 | Python.org 2、安装git git是一个代码管理工具,通过它可以将开源项目仓库克隆到本地 下载地址:Git - Downloading Package...
-
优秀自媒体工作者常用的8款ai写作工具! #人工智能#AI写作
在当今互联网时代,AI(人工智能)技术的快速发展使得许多传统工作都得到了极大的改进和提高效率。其中,AI写作软件在快速撰写高质量内容方面发挥了重要作用。本文将介绍备受赞誉的AI写作软件,并为您详细分析它们的特点和优势。 1.写作兔 这是一个微信公众号...
-
超快的 AI 实时语音转文字,比 OpenAI 的 Whisper 快4倍 -- 开源项目 Faster Whisper
faster-whisper 这个项目是基于 OpenAI whisper 的模型,在上面的一个重写。 使用的是 CTranslate2 的这样的一个库,CTranslate2 是用于 Transformer 模型的一个快速推理引擎。 在相同精度的情况...
-
DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源
DeepMind 这篇论文一出,人类标注者的饭碗也要被砸了吗? 大模型的幻觉终于要终结了? 今日,社媒平台 reddit 上的一则帖子引起网友热议。帖子讨论的是谷歌 DeepMind 昨日提交的一篇论文《Long-form factuality in la...
-
笔记本电脑上部署LLaMA-2中文模型
尝试在macbook上部署LLaMA-2的中文模型的详细过程。 (1)环境准备 MacBook Pro(M2 Max/32G ; VMware Fusion Player 版本 13.5.1 (23298085 ; Ubuntu 22.04.2 L...
-
Champ首发开源:人体视频生成新SOTA,5天斩获1k星,demo可玩
近日,由阿里、复旦大学、南京大学联合发布的可控人体视频生成工作 Champ 火爆全网。该模型仅开源 5 天 GitHub 即收获 1k 星,在 Twitter 更是「火出圈」,吸引了大量博主二创,浏览量总量达到 300K。 目前 Champ 已经开源...