-
whisper、whisper.cpp、faster-whisper的比较
让我们比较一下当前的whisper、whisper.cpp和faster-whisper。 OpenAI / Whisper 自发布以来,似乎在各个方面都发生了变化,例如在 2022 年 12 月增加了 large-v2 模型和各种版本升级。 whis...
-
【AI】在本地 Docker 环境中搭建使用 Hugging Face 托管的 Llama 模型
目录 Hugging Face 和 LLMs 简介 利用 Docker 进行 ML 格式的类型 请求 Llama 模型访问 创建 Hugging Face 令牌 设...
-
云原生技术赋能AI绘图:Stable Diffusion在腾讯云的部署与应用新篇章
摘要 随着信息技术的飞速发展和数字化转型的深入推进,云原生架构已成为企业数字化转型的重要基石。Docker容器、Serverless和微服务等技术作为云原生的核心组成部分,正在不断推动着企业应用架构的革新与升级。本文旨在总结近期在云原生实践、容器技术、...
-
AI日报:音乐圈巨震!Sora发布首支MV;百度推出AI视频模型;抖音提醒清明节慎用“AI复活”技术;PS2风格AI滤镜风靡网络
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI新鲜事 音乐圈巨震!S...
-
Ubuntu 22.04 LTS AIGC GPU环境搭建(NVIDIA 550.67+CUDA 12.4+cuDNN)
Ubuntu 22.04 LTS AIGC GPU环境搭建(NVIDIA+CUDA+cuDNN) 一、服务器信息 1.1 硬件配置 服务器名称 CPU(Intel® Xeon® W-2245) 显卡(NVIDIA Quadro RTX 60...
-
【保姆级讲解如何Stable Diffusion本地部署】
?个人主页:程序员不想敲代码啊? ?CSDN优质创作者,CSDN实力新星,CSDN博客专家? ?点赞⭐评论⭐收藏 ?希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共同学习、交流进步! Stable Diffusion本地部...
-
AIxBlock官网体验入口 AI平台去中心化服务产品使用方法教程攻略
AIxBlock是一个综合性的链上AI平台,集成了去中心化超级计算机。主要功能包括:数据引擎进行数据采集、整理和标注;低代码MLOps平台轻松构建和部署AI模型;通过链上共识机制实时验证AI模型质量;提供去中心化计算力交易市场,节省90%计算成本;基于P2...
-
华为诺亚频域LLM「帝江」:仅需1/50训练成本,7B模型媲美LLaMA,推理加速5倍
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 基于 Transformer 架构的大语言模型在 NLP 领域取得了令人惊艳的效果,然而,Transformer 中自注意力带来的二次复...
-
Stable Diffusion WebUI 1.8.0来了
上周 Stable Diffusion WebUI 发布了 1.8.0 版本,更新内容比较多,据说显存使用有了大幅的下降,这几天我也找时间把 AutoDL 镜像的版本做了个升级,有兴趣的同学可以去体验下新版本了。 这里分享下其中几个我认为比较重要的更新。...
-
RWKV模型启动工具RWKV Runner新手教程(上)
大家好,今天我们带来了 RWKV Runner 的新手教程。 RWKV Runner 是 RWKV 模型的管理和启动工具,由 RWKV 开源社区成员 josStorer 开发,它本身也是一个开源软件,且体积仅 10MB 左右(不含依赖项)。 RWKV...
-
AI绘画:Stable Diffussion本地部署新手教程(免费分享安装包+教程)无需网络
Stable Diffusion,是一个功能强大的开源工具,可帮助实现图像的生成与编辑,并提供极高的可控性。 Stable Diffusion 是一种先进的人工智能技术,可以用于生成逼真的艺术作品和图像。它的开源部署使得使用这个工具变得非常方便,而且免费...
-
Meta LLaMA 2实操:从零到一搭建顶尖开源大语言模型【超详篇】
前言 本文章由 [jfj] 编写,所有内容均为原创。涉及的软件环境是在nvidia-docker环境进行的,如对docker未了解如何使用的,可以移步上一篇文章nvidia-docker安装详解。 在 nvidia-docker 容器中运行时,Dock...
-
探索使用对比损失的孪生网络进行图像相似性比较
简介 在计算机视觉领域,准确地测量图像相似性是一项关键任务,具有广泛的实际应用。从图像搜索引擎到人脸识别系统和基于内容的推荐系统,有效比较和查找相似图像的能力非常重要。Siamese网络与对比损失结合,为以数据驱动方式学习图像相似性提供了强大的框架。在...
-
大模型创业淘汰潮开始了:这是第一个估值 10 亿美元的祭品
风雨飘摇中的Stability AI还能走多远? 近期,AI 绘画神器 Stable Diffusion 背后的开发公司 Stability AI 发生一系列变动,包括 CEO Emad Mostaque 在内的多名核心高管、技术人员离职,公司面临现金流危...
-
英伟达开卷价格!最新Blackwell GPU架构/成本揭秘,彰显老黄的「仁慈」
老黄的新GPU又在深夜炸场,震撼了所有的观众。 除了硬件参数上的震撼之外,大家伙最想知道的还是新GPU的售价会不会同样震撼。 下面就让我们从规格参数、工艺节点、封装设计等方面来深入分析一下新一代Blackwell GPU的系统、定价、利润,以及Jense...
-
Android 手机部署whisper 模型
Whisper 是什么? “Whisper” 是一个由OpenAI开发的开源深度学习模型,专门用于语音识别任务。这个模型能够将语音转换成文本,支持多种语言,并且在处理不同的口音、环境噪音以及跨语言的语音识别方面表现出色。Whisper模型的目标是提供一...
-
LLaMA 模型中的Transformer架构变化
目录 1. 前置层归一化(Pre-normalization) 2. RMSNorm 归一化函数 3. SwiGLU 激活函数 4. 旋转位置嵌入(RoPE) 5. 注意力机制优化 6. Group Query Attention 7. 模型...
-
4G显存玩转AI绘画!Stable Diffusion WebUI Forge来了!
经常使用Stable Diffusion WebUI的同学可能都被显存的问题困扰过,其运行时需要巨大的显存空间,跑着跑着显存可能就爆了,不得不重新启动。不过现在这个问题解决了,因为Stable Diffusion WebUI Forge来了。 Forge...
-
OpenAI和微软将投资1000亿美元建设全球最大的数据中心
ChatGPT 的背后开发者OpenAI ,计划与微软公司合作投资100亿美元建设全球最大数据中心。这个计划旨在开发人工通用智能(AGI)技术,并将配备一个超级计算机。 根据《The Information》的消息,两家公司的管理层正在进行一个名为 “St...
-
AI明星创业公司买英伟达GPU ,几周估值翻倍,但花的钱比赚的多17倍
在AI行业,尤其是生成式AI领域,技术的快速发展和应用的广泛前景吸引了大量的投资和关注。然而,这一领域的高昂成本也引起了业界的广泛讨论。最近,《华尔街日报》的一篇报道指出,AI行业的公司在购买英伟达GPU上的投入是其收入的17倍,这一数字令人震惊,同时也引...
-
谷歌狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理训练最快选择
谷歌力推的JAX在最近的基准测试中性能已经超过Pytorch和TensorFlow,7项指标排名第一。 而且测试并不是在JAX性能表现最好的TPU上完成的。 虽然现在在开发者中,Pytorch依然比Tensorflow更受欢迎。 但未来,也许有更多...
-
AI行业买英伟达GPU,花的钱比赚的多17倍
有人却表示「很合理」。 搞 AI 大模型,实在太烧钱了。 我们知道,如今的生成式 AI 有很大一部分是资本游戏,科技巨头利用自身强大的算力和数据占据领先位置,并正在使用先进 GPU 的并行算力将其推广落地。这么做的代价是什么? 最近《华尔街日报》一篇有关明...
-
今日AI:AI视频神器PixVerse被玩出花;抖音封杀李一舟等“割韭菜”内容;最神秘国产大模型团队冒泡;剪映Dreamina一键整合mj+sd+PS工作流
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI应用 AI视频生成神器...
-
全面综述!大模型到底微调个啥?或者说技术含量到底有多大?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 大型模型代表了多个应用领域的突破性进展,能够在各种任务中取得显著成就。然而,它们前所未有的规模带来了巨大的计算成本。这些模型通常由数十亿个参数组成,需要大量的计算资源才...
-
1000亿美元宇宙级豪赌!微软OpenAI打造星际之门AI超算,电力能耗惊人
就在刚刚,又有大消息曝出。 据外媒The Information报道,微软和OpenAI正计划建设一个名为「星际之门」(Stargate)的特殊数据中心,为后者提供强大的计算支持。 具体来说: 微软高层计划最快在2028年启动该项目 这台超算对电力的需...
-
我的领导马斯克:痛恨开会,不要非技术中层,推崇裁员
马斯克称得上是个“魔鬼老板”这事儿,已经出了名了。 现在,他的老部下卡帕西(Andrej Karpathy)又在最新访谈中“锤”了他一把(doge): 我不得不恳求他允许我招人。 他(马斯克)总是默认要裁掉员工。 喜欢裁人之外,在这场红杉组织的AI A...
-
微软、OpenAI又搞大动作:斥资1000亿美元开发AI超算「星际之门」
根据 Information 消息,微软和 OpenAI 正在计划一个数据中心项目,该项目将包含一个拥有数百万专用服务器芯片的超级计算机,以支持 OpenAI 的人工智能技术。另外,项目成本可能高达 1000 亿美元,包括一个名为 Stargate (「...
-
微软、OpenAI投资1000亿美元,打造“Stargate”超级计算机
3月30日,著名科技媒体the information独家消息,微软、OpenAI正在开发一个数据中心项目,包含一台名为“Stargate”超级计算机将配备数百万个AI专用芯片,主要为OpenAI的研发、产品提供服务。 据一位曾与OpenAI联合创始人兼首...
-
llama.cpp部署多模态视觉模型到应用实践
一、安装cmake https://cmake.org/ 因为我使用是win10系统cmake版本是3.26.4,请根据自己系统选择版本。 二、下载源码 git clone https://github.com/ggerganov/llam...
-
从零开始的LLaMA-Factory的指令增量微调
大模型相关目录 大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容从0起步,扬帆起航。 大模型应用向开发路径及一点个人思考 大模型应用开发实用开源项目汇总 大模型问答...
-
AI绘画Imagen大力出奇迹生成图像
AI绘画Imagen大力出奇迹生成图像 介绍 Imagen是一个文本到图像的扩散模型,由Google大脑团队研究所开发。 Imagen通过创新的设计,摈弃了需要预训练视觉-语言模型的繁琐步骤,直接采用了T5等大规模语言模型作为文...
-
台积电董事长预测:未来15年每瓦GPU性能提升1000倍,GPU晶体管数破万亿!
GTC 2024大会上,老黄祭出世界最强GPU——Blackwell B200 ,整整封装了超2080亿个晶体管。 比起上一代H100(800亿),B200晶体管数是其2倍多,而且训AI性能直接飙升5倍,运行速度提升30倍。 若是,将千亿级别晶体管数扩...
-
超快的 AI 实时语音转文字,比 OpenAI 的 Whisper 快4倍 -- 开源项目 Faster Whisper
faster-whisper 这个项目是基于 OpenAI whisper 的模型,在上面的一个重写。 使用的是 CTranslate2 的这样的一个库,CTranslate2 是用于 Transformer 模型的一个快速推理引擎。 在相同精度的情况...
-
阿里通义千问开源Qwen1.5-MoE-A2.7B模型
通义千问团队推出了 Qwen 系列的首个 MoE 模型,命名为 Qwen1.5-MoE-A2.7B。这个模型只有27亿个激活参数,但性能却与当前最先进的70亿参数模型相媲美。与 Qwen1.5-7B 相比,Qwen1.5-MoE-A2.7B 只有20亿个非...
-
如何开始定制你自己的大型语言模型
2023年的大型语言模型领域经历了许多快速的发展和创新,发展出了更大的模型规模并且获得了更好的性能,那么我们普通用户是否可以定制我们需要的大型语言模型呢? 首先你需要有硬件的资源,对于硬件来说有2个路径可以选。高性能和低性能,这里的区别就是是功率,因为精...
-
Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文
之前引爆了AI圈的Mamba架构,今天又推出了一版超强变体! 人工智能独角兽AI21 Labs刚刚开源了Jamba,世界上第一个生产级的Mamba大模型! Jamba在多项基准测试中表现亮眼,与目前最强的几个开源Transformer平起平坐。 特别是...
-
2024全新英特尔商用客户端AIPC产品发布会——开启AIGC的新阶段
#酷睿Ultra #AIPC #英特尔 2024年3月26日,英特尔AI PC产品发布会在北京凤凰中心成功举办,很荣幸作为受邀博主参与此次发布会。总的来说,一波新的换机热潮要开始了。 也许大家曾将Stable Di...
-
AI 和联邦储备局推动美股在2024年年初创下新高
2024年第一季度的股市交易以平静收场,然而这并不能掩盖一个充满活力的季度。道琼斯工业平均指数、标准普尔500指数和纳斯达克指数都在当日或略有涨跌。值得一提的是,这个季度的股市表现出色。 道琼斯工业平均指数、标准普尔500指数和纳斯达克指数在2024年第...
-
开源AI平台Lightning AI发布AI编译器“Thunder”以加速模型训练
开源人工智能平台Lightning AI宣布与Nvidia合作,发布了名为“Thunder”的下一代AI编译器,旨在加速人工智能模型的训练速度。据Lightning AI称,该编译器在实际场景中相比未优化的代码,可将大型语言模型(LLMs)的训练速度提高高...
-
首个基于SSM-Transformer混合架构,开源商业大模型Jamba
3月29日,知名AI研究实验室AI21在官网开源了,首个基于SSM-Transformer混合架构的商业大模型——Jamba。 目前,ChatGPT、Stable Difusion 、Lyria等产品使用的皆是Transformer架构,虽然在捕捉序列内长...
-
今日Arxiv最热NLP大模型论文:Llama-2上下文扩大48倍的方法来了,港大发布,无需训练
引言:大语言模型的长上下文理解能力 在当今的人工智能领域,大语言模型(Large Language Models,简称LLMs)的长上下文理解能力成为了一个重要的研究方向。这种能力对于模型来说至关重要,因为它使得LLMs能够有效地应对各种应用场景,例如在...
-
铁了心要打败OpenAI!坚信开源打败闭源!这家知名数据厂商4个月打造最强开源大模型!性能超越Claude3,速度是羊驼2倍
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 大模型领域,迭代的速度简直要以天计算。昨天,大家还在热议Claude3超大杯版Opus在Elo Rating榜单上取代GPT4-Turbo-1106成为了新王。今天大家又发现开源...
-
前谷歌工程师创业造AI芯片,要比英伟达好十倍!已融资2500万美元
3月28日消息,英伟达在AI芯片市场的主导地位激发了其他公司自主设计芯片的决心。尽管从头开始设计芯片充满挑战,耗时多年且成本高昂,通常以失败告终,但人工智能的巨大潜力驱使业界人士勇敢尝试。 在这一背景下,两位前谷歌工程师共同创立了MatX。他们利用在谷...
-
为什么AI工作负载可能不会改变数据中心行业
乍一看,AI的繁荣可能对数据中心行业来说是一个巨大的福音。企业在AI上投资越多,他们需要的数据中心容量就越多,对吗? 不一定。尽管AI肯定会推动对数据中心的需求,但我倾向于认为,AI对该行业的影响最终将被证明是有限的。原因如下。 AI如何影响数据中心...
-
llama factory学习笔记
模型 模型名 模型大小 默认模块 Template Baichuan2 7B/13B W_pack baichuan2 BLOOM 560M/1.1B/1.7B/3B/7.1B/176B query_key_value - BLOOM...
-
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100
GPT-6也被电力卡脖子了——部署十万个H100时,整个电网发生了崩溃! 就在刚刚,微软工程师爆料,10万个H100基建正在紧锣密鼓地建设中,目的就是训练GPT-6。 微软工程师吐槽说,团队在部署跨区域GPU间的infiniband级别链接时遇到了困难。...
-
【在线回放】NVIDIA GTC 2024 大会 | 如何降低 AI 工程成本?蚂蚁从训练到推理的全栈实践
本文内容来源于蚂蚁集团 AI Infra部门负责人张科,在 GTC 2024 大会 China AI Day 线上专场的演讲。在演讲中张科分享了 AI 工程当前的现状和主要挑战,以及蚂蚁集团在 AI 工程领域的实践经验和开源项目,也欢迎 AI 工程领域的同...
-
微软工程师爆料:OpenAI训练GPT-6把微软电网搞崩 刷爆10万张H100
近日,微软工程师的爆料引发了广泛关注,透露GPT-6的训练计划不仅已启动,还导致大规模GPU集群的部署引发了电网崩溃的尴尬局面。这一事件凸显了AI训练对能源的巨大需求,与此同时,OpenAI内部消息的曝光也揭示了GPT-5和GPT-6的训练已经在进行中。...
-
苹果M4芯片有望明年一季度发布:主打AI 新MacBook Pro首发
快科技3月27日消息,据名记马克古尔曼最新曝料,苹果已经在着手开发搭载M4芯片的全新MacBook Pro。 根据Canalys机构曝光的路线图,M4系列芯片有望2025年第1季度上线,将主打AI功能。 目前苹果已经宣布,将于美国太平洋时间6月10日-6月...
-
SDXS官网体验入口 AI快速生成高质量图像模型怎么使用
SDXS是一种新的扩散模型,通过模型微型化和减少采样步骤,大幅降低了模型延迟。它利用知识蒸馏来简化U-Net和图像解码器架构,并引入了一种创新的单步DM训练技术,使用特征匹配和分数蒸馆。SDXS-512 和 SDXS-1024 模型可在单个 GPU 上分别...