-
大模型存储选型 & JuiceFS 在关键环节性能详解
从去年开始,LLM大语言模型领域发展迅速、如 LLaMA、ChatGLM、Baichuan、Qwen 和 yi-model 等基础模型(Foundation Models)的数量显著增加。众多企业也开始基于这些基础模型做 post-training 的相关...
-
探索无限创意:基于C++的Stable Diffusion图像生成库
探索无限创意:基于C++的Stable Diffusion图像生成库 axodox-machinelearning This repository contains a C++ ONNX implementation of StableDiffus...
-
微软推送Windows 11 2024更新:新增多项AI体验 NPU终于有了用武之地
快科技10月3日消息,近日,微软开始向广大用户全面推送Windows 11 2024更新。 其实按照惯例应被成为Windows 11 24H2更新,但由于微软放弃了以往1年2次重大版本更新周期,整个2024年只更新了这一个大版本,因此被设定为Windows...
-
Whisper JAX:闪电般快速的语音识别框架
Whisper JAX:闪电般快速的语音识别框架 whisper-jaxJAX implementation of OpenAI's Whisper model for up to 70x speed-up on TPU.项目地址:https://gi...
-
Rusty Llama Webapp:用Rust打造的高效聊天机器人
Rusty Llama Webapp:用Rust打造的高效聊天机器人 rusty_llamaA simple ChatGPT clone in Rust on both the frontend and backend. Uses open sourc...
-
Ubuntu LLaMA-Factory实战
一、Ubuntu LLaMA-Factory实战安装: CUDA 安装 CUDA 是由 NVIDIA 创建的一个并行计算平台和编程模型,它让开发者可以使用 NVIDIA 的 GPU 进行高性能的并行计算。 首先,在 https://develop...
-
使用llama.cpp 在推理MiniCPM-1.2B模型
llama.cpp 是一个开源项目,它允许用户在C++中实现与LLaMA(Large Language Model Meta AI)模型的交互。LLaMA模型是由Meta Platforms开发的一种大型语言模型,虽然llama.cpp本身并不包含LLaM...
-
AI视频新战场:字节对决快手、反击Sora
字节跳动以性价比策略切入市场,掀起价格竞争,但高性能模型仍保持付费门槛。B端市场对豆包视频大模型的接纳度有待观察,其商业变现与用户场景适配性成为主要考验。 一场由Sora引发的AI视频生成竞赛,如今迎来新的竞争者! 9月24日,2024火山引擎AI创新巡展...
-
利用 FP8 量化加速 Llama-3-70B 推理
本文针对在 Amazon P5 (H100 GPU 上部署 Llama-3-70b FP8 精度模型的两种方案选型(Trion 及 LMI – Large Model Inference 容器)进行了探索,同时提供了基于 FMBench 的性能评估的最佳...
-
三星推出Galaxy Tab S10系列平板:搭载天玑9300 、优化AI性能
快科技9月27日消息,据媒体报道,三星推出了Galaxy Tab S10系列平板电脑,包括Galaxy Tab S10 Ultra和Galaxy Tab S10 两款产品,搭载联发科天玑9300 ,首次在其旗舰平板电脑中搭载联发科芯片。 据悉,天玑9300...
-
国内外大模型汇总(包括科大星火、文心一言、通义千问、智普清言、华为大模型)
国内外大模型汇总 1. 科大讯飞星火认知大模型 主要特点: 多语言能力:以中文为核心,同时支持多语言处理,能够进行跨语种的语言理解和生成。 广泛的任务能力:具备内容生成、语言理解、知识问答、推理、数学计算、代码理解与生成等多种能力,能够处理复杂的自...
-
【大模型】AutoDL部署AI绘图大模型Stable Diffusion使用详解
目录 一、前言 二、AI绘图大模型概述 2.1 AI绘图大模型介绍 2.2 AI绘图大模型特点 2.3 AI绘图大模型优势 三、主流的AI绘图大模型介绍 3.1 Midjourney 3.1.1 Midjourney介绍 3.1.2...
-
CoPilot 开源项目教程
CoPilot 开源项目教程 CoPilot SOCFortress CoPilot 项目地址: https://gitcode.com/gh_mirrors/copilot/CoPilot 项目介绍 CoPilot 是一个由 So...
-
【附精彩文章合辑】跨界对话:黄仁勋与扎克伯格的“外套交换”与未来展望
跨界对话:黄仁勋与扎克伯格的“外套交换”与未来展望 在科技界的浩瀚星空中,两位璀璨的名字如同双子星般交相辉映——NVIDIA的创始人兼CEO黄仁勋(Jensen Huang)与Facebook(现更名为Meta)的掌舵人马克·扎克伯格(Mark Zuck...
-
本地化LLM应用:Local_Llama——离线文档聊天的未来
本地化LLM应用:Local_Llama——离线文档聊天的未来 local_llama This repo is to showcase how you can run a model locally and offline, free of Op...
-
火山引擎数智平台:高性能ChatBI的技术解读和落地实践
客观而言,从 2018 年开始开发的抖音集团内部 BI 平台起步较晚。 因此其直接跳过了 BI 平台早期发展阶段,从立项之初,它的目标便是成为能够满足公司内部几乎所有数据分析需求的数据分析平台。 在抖音集团内部,BI 平台建设分为以下几个阶段...
-
【AI创作工具】Midjourney与Stable Diffusion选择攻略
如何选择适合的AI绘画工具 在数字艺术迅速发展的今天,AI绘画工具已经成为许多创作者的利器。然而,面对市场上琳琅满目的选择,如何找到最适合自己需求的AI绘画工具成了一个重要问题。本文将帮助你从个人需求、工具功能、社区资源等多方面来考虑,并重点对比Mid...
-
Llama-CPP-Python 教程
Llama-CPP-Python 教程 llama-cpp-pythonPython bindings for llama.cpp项目地址:https://gitcode.com/gh_mirrors/ll/llama-cpp-python 1....
-
新范式:AIGC推动的数据要素产业价值促进创新
引言 大模型的发展与数据要素的价值创造互为因果,LLM正推动着数据要素以“激发AGI”的全新范式创造价值。如何有效地整合规模化、高质量的数据以用于大型模型的训练,不仅是推进大模型发展的窗口,也将成为进一步发掘数据要素潜在价值的关键动力。遵循技术发展的...
-
基于whisper流式语音识别
为了实现持续监听麦克风并在检测到声音时进行转录,我们可以将流的监听时间设置为无限长。通过使用一个音量门限来检测是否有声音,然后进行转录。 安装依赖 确保安装必要的库: pip install torch torchaudio openai-whis...
-
(不用互三)AI绘画工具大比拼:Midjourney VS Stable Diffusion该如何选择?
文章目录 ?如何选择合适的AI绘画工具 根据个人需求选择 1. 您喜欢什么风格的绘画? 2. 您想要创作什么主题的内容? 3. 您对绘画工具的使用经验如何? 比较工具特点 1. 工具的易用性和功能性如何? 易用性: 功能性: 2....
-
LLama 3 跨各种 GPU 类型的基准测试
2024 年 4 月 18 日,AI 社区对 Llama 3 70B 的发布表示欢迎,这是一款最先进的大型语言模型 (LLM)。该型号是 Llama 系列的下一代产品,支持广泛的用例。该模型 istelf 在广泛的行业平台上表现良好,并提供了新功能,包括改...
-
甲骨文AI集群配备131072万块NVIDIA B200 GPU:恐怖算力24万亿亿次
快科技9月12日消息,甲骨文宣布推出多款GPU计算集群,可通过甲骨文云基础设施提供AI训练服务,其中最顶级的一款配备了超过10万块的NVIDIA Blackwell GPU。 它一共使用了多达131072万块B200 GPU加速卡,FP8浮点、INT8整数...
-
Stable diffusion 电脑配置要求+安装推荐
文章目录 前言 一、电脑配置要求-显卡显存 二、内存 三、软件安装 总结 前言 我们知道在使用Stable diffusion时,是对电脑配置有要求的。那么需要什么的配置才可以正常使用呢 一、电脑配置要求-显卡显存 1...
-
Python 爬虫入门: 常见的爬虫库及相关工具
Python 爬虫入门: 常见的爬虫库及相关工具 前言 1. 爬虫框架 1.1 Scrapy 1.2 Scrapy-Redis 2. 解析 XML 和 HTML 文档 2.1 BeautifulSoup 2.2 lxml 2.3 Par...
-
每日AIGC最新进展(57):小红书提出视频理解模型VideoLLM-MoD、香港大学提出脉冲神经扩散模型、香港大学提出使用反球面插值改进基于扩散模型的数据增强方法
Diffusion Models专栏文章汇总:入门与实战 VideoLLM-MoD: Efficient Video-Language Streaming with Mixture-of-Depths Vision Computation 随着...
-
零刻首发AMD Zen5迷你机:旗舰锐龙AI 9 HX 370核显媲美RTX 3050
快科技9月11日消息,大家望眼欲穿的Zen5架构迷你机终于来了!零刻披露,将在中秋节后少量上线新款SER9”,但定价暂未公开,只知道初期确实会比较高。 配置方面,处理器是旗舰款锐龙AI 9 HX 370,12个Zen5 CPU核心最高频率5.1GHz,16...
-
提升硬盘性能的方法
提升硬盘性能的方法多种多样,以下是一些常见的策略: 1. 选用高性能的硬件设备 固态硬盘(SSD):相比于传统的机械硬盘(HDD),SSD具有更快的读写速度和更低的延迟。将操作系统和常用应用程序安装在SSD上可以显著提高系统响应速度和运行效率。...
-
java重点学习-RabbitMQ+Kafka
六 RabbitMQ Kafka 6.1 RabbitMQ-如何保证消息不丢失 开启生产者确认机制,确保生产者的消息能到达队列 开启持久化功能,确保消息未消费前在队列中不会丢失 开启消费者确认...
-
高职院校生成式人工智能(AIGC)实训教室建设解决方案
一、引言 近年来,人工智能技术以其强大的数据处理能力和智能化决策机制,在诸多领域展现出巨大的潜力和价值。尤其是在教育领域,人工智能生成内容(Artificial Intelligence Generated Content, AIGC)技术的应用日益凸显...
-
本地部署sd的最低配置要求是什么?
本地部署Stable Diffusion(SD)的最低配置要求主要包括以下几个方面: 1. 操作系统:支持的操作系统包括主流的Linux发行版,如Ubuntu 18.04或更高版本,以及Windows 10/11。对于MacOS,由于没有独立显卡加速...
-
苹果iPhone 16系列手机配置曝光 AI性能突破性升级
据最新消息,苹果即将在下周二举办发布会,正式推出备受瞩目的iPhone16系列手机。这款新机预计将搭载Arm公司最新的V9架构的A18芯片,带来AI性能方面的显著提升。 A18芯片预计将会为iPhone16系列提供更强大的机器学习和图像处理能力,并优化用户...
-
笔记本本地部署100b以上千亿级别LLM,并在手机端接入
前言 本文将演示如何在笔记本上运行千亿级模型,后端 Koboldcpp 运行在 Ubuntu ,前端界面使用安卓手机通过 Termux 且使用 SillyTavern 进行连接,模型使用 104B 的 Command R Plus 的 Q4KM 量化,...
-
推荐5款好用的AIGC软件,AIGC电脑带不动怎么办?
在当今这个数字化迅速发展的时代,人工智能生成内容(Artificial Intelligence Generated Content, AIGC)软件已经成为内容创作领域的一股不可忽视的力量。这类软件能够通过先进的算法和机器学习模型,自动生成文本、图像、音...
-
我觉得我用于Stable Diffusion进行AI绘画的电脑选对了
选电脑用于Stable Diffusion这件事折磨了我好久,目前知乎推荐电脑都是从游戏和办公的角度去推荐的。虽然现在的SD有很多注册教程,但是注册教程里只是简单的说了硬件要求,没有一篇文章和视频教一个电脑小白怎么选个用于SD进行绘画的电脑。本文从需求背景...
-
蚂蚁数科CEO赵闻飙:大模型不是产业数字化的唯一解
“过去一年,蚂蚁数科客户数增长35%。旗下多个产品取得所属赛道市场份额第一。”9月5日下午,蚂蚁数科CEO赵闻飙在外滩大会媒体交流会上透露。这是自今年3月份蚂蚁数科独立化运营后,赵闻飙首次对外公布公司的业务进展及战略布局。 赵闻飙还透露,出海是蚂蚁数科的重...
-
猫头虎 Gemma和Gemini模型的区别是什么?
猫头虎 ? Gemma和Gemini模型的区别是什么? 摘要? 在这篇文章中,我们将深入探讨Gemma和Gemini这两个由Google开发的AI模型。我们会对比它们的参数规模、计算资源需求和集成难度,帮助大家了解这两者之间的主要区别。无论你是AI...
-
Distil-Whisper 开源项目教程
Distil-Whisper 开源项目教程 distil-whisperDistilled variant of Whisper for speech recognition. 6x faster, 50% smaller, within 1% wor...
-
刚刚,英特尔发布最强CPU,AI PC迎来最高效x86芯片
最高效的x86芯片,应当是一种怎样的“打开方式”? 就在刚刚,英特尔给出了一份答案—— 英特尔®酷睿™Ultra200V系列处理器。 话不多说,直接上亮点: 最快的CPU:E核比上一代快68%,P核则快了14% 最快的内置(built-in)GPU:首次...
-
NVIDIA GeForce RTX标志升级了!加入AI的力量
快科技9月3日消息,NVIDIA低调升级了其GeForce RTX”的标志,增加了一行小字Powering Advanced AI”,也就是打造先进AI”的意思。 未来的RTX显卡,无论是零售包装盒,还是预装台式机、笔记本,都是打上这个标志。 GeForc...
-
Distil-Whisper:高效快速的语音识别模型
Distil-Whisper:高效快速的语音识别模型 distil-whisperDistilled variant of Whisper for speech recognition. 6x faster, 50% smaller, within 1...
-
曝iPhone 17 ProMax用石墨烯散热:独享12GB内存和增强AI性能
在智能手机市场,安卓手机已经普遍采用VC均热板技术,即使是价格亲民的手机也配备了这一散热解决方案,以提供更持久的高性能表现。相较之下,苹果公司对于散热系统一直较为保守,但iPhone15Pro系列的A17Pro处理器出现过热问题后,苹果开始重视散热设计。...
-
国内最大智算中心正式投用:每秒690亿亿次浮点运算 可训练万亿参数大模型
快科技8月31日消息,日前,由中国移动承建的国内运营商最大单集群智算中心在哈尔滨正式运营。 据悉,该智算中心具有单集群算力规模最大、国产化网络设备组网规模最大等特点。 单集群智算中心把所有AI加速卡打造成1个集群,用以支持千万亿级参数的大模型进行训练。 这...
-
橙芯创想:香橙派AIPRO解锁升腾LLM与Stable Diffusion的创意密码
文章目录 引言 一. 香橙派AI PRO配置以及展示 优秀的扩展能力 实物展示 二、Ascend-LLM模型部署 开机 xshell连接香橙派 实战运行部署 运行结果分析 开发版表现 三、Stable Diffusion 文生图 性能...
-
object.defineProperty用法
Object.defineProperty 是 JavaScript 中一个用于定义对象属性的静态方法。它允许你精确控制对象的属性,包括属性的值、可写性、可枚举性和可配置性等特性。这个方法在需要定义特殊的属性行为时非常有用,例如,在 Vue.js 中,它常...
-
大模型框架汇总:大模型框架Ollama、大模型框架vLLM、大模型框架LightLLM、大模型框架llama.cpp、大模型框架LocalAI、大模型框架veGiantModel
常见的大模型框架:大模型框架Ollama、大模型框架vLLM、大模型框架LightLLM、大模型框架llama.cpp、大模型框架LocalAI、大模型框架veGiantModel: 大模型框架是指用于训练、推理和部署大型语言模型(LLMs)的软件工具和...
-
LLaMA 3 背后的大规模 GPU 集群 RoCE 网络建设
模型越来越大,需要的 GPU 越来越多;与此同时 GPU 性能也在不断增强,配套的网络带宽也不断增加到 400G(Blackwell GPU 甚至需要到 800 Gbps)。Ranking 模型还在迁移到 GPU 的早期阶段,但使用 GPU 的规模也在不断...
-
笔记本电脑本地部署ollama大模型(显存不足调用CUDA Unified Memory方法)
软硬件:win11,NVIDIA GeForce RTX 3050 显存4g 一.ollama模型最低要求 1. Llama 3.1 (8B 模型 GPU: 至少需要 1 张具有 16 GB 显存的 GPU(例如 NVIDIA Tesla V1...
-
标题:微调Whisper模型,打造超高效语音识别利器!
标题:微调Whisper模型,打造超高效语音识别利器! Whisper-FinetuneFine-tune the Whisper speech recognition model to support training without timesta...
-
Datawhale X 魔搭 AI夏令营(AIGC Task3)学习笔记
目录 认识ComfyUI 1. 什么是 ComfyUI 2. ComfyUI 核心部件 3. ComfyUI 图片生成流程 4. ComfyUI 的优势 使用ComfyUI 下载ComfyUI: 运行ComfyUI: 自我学习: LOR...