-
今日Arxiv最热NLP大模型论文:Llama-2上下文扩大48倍的方法来了,港大发布,无需训练
引言:大语言模型的长上下文理解能力 在当今的人工智能领域,大语言模型(Large Language Models,简称LLMs)的长上下文理解能力成为了一个重要的研究方向。这种能力对于模型来说至关重要,因为它使得LLMs能够有效地应对各种应用场景,例如在...
-
铁了心要打败OpenAI!坚信开源打败闭源!这家知名数据厂商4个月打造最强开源大模型!性能超越Claude3,速度是羊驼2倍
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 大模型领域,迭代的速度简直要以天计算。昨天,大家还在热议Claude3超大杯版Opus在Elo Rating榜单上取代GPT4-Turbo-1106成为了新王。今天大家又发现开源...
-
前谷歌工程师创业造AI芯片,要比英伟达好十倍!已融资2500万美元
3月28日消息,英伟达在AI芯片市场的主导地位激发了其他公司自主设计芯片的决心。尽管从头开始设计芯片充满挑战,耗时多年且成本高昂,通常以失败告终,但人工智能的巨大潜力驱使业界人士勇敢尝试。 在这一背景下,两位前谷歌工程师共同创立了MatX。他们利用在谷...
-
为什么AI工作负载可能不会改变数据中心行业
乍一看,AI的繁荣可能对数据中心行业来说是一个巨大的福音。企业在AI上投资越多,他们需要的数据中心容量就越多,对吗? 不一定。尽管AI肯定会推动对数据中心的需求,但我倾向于认为,AI对该行业的影响最终将被证明是有限的。原因如下。 AI如何影响数据中心...
-
llama factory学习笔记
模型 模型名 模型大小 默认模块 Template Baichuan2 7B/13B W_pack baichuan2 BLOOM 560M/1.1B/1.7B/3B/7.1B/176B query_key_value - BLOOM...
-
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100
GPT-6也被电力卡脖子了——部署十万个H100时,整个电网发生了崩溃! 就在刚刚,微软工程师爆料,10万个H100基建正在紧锣密鼓地建设中,目的就是训练GPT-6。 微软工程师吐槽说,团队在部署跨区域GPU间的infiniband级别链接时遇到了困难。...
-
【在线回放】NVIDIA GTC 2024 大会 | 如何降低 AI 工程成本?蚂蚁从训练到推理的全栈实践
本文内容来源于蚂蚁集团 AI Infra部门负责人张科,在 GTC 2024 大会 China AI Day 线上专场的演讲。在演讲中张科分享了 AI 工程当前的现状和主要挑战,以及蚂蚁集团在 AI 工程领域的实践经验和开源项目,也欢迎 AI 工程领域的同...
-
微软工程师爆料:OpenAI训练GPT-6把微软电网搞崩 刷爆10万张H100
近日,微软工程师的爆料引发了广泛关注,透露GPT-6的训练计划不仅已启动,还导致大规模GPU集群的部署引发了电网崩溃的尴尬局面。这一事件凸显了AI训练对能源的巨大需求,与此同时,OpenAI内部消息的曝光也揭示了GPT-5和GPT-6的训练已经在进行中。...
-
苹果M4芯片有望明年一季度发布:主打AI 新MacBook Pro首发
快科技3月27日消息,据名记马克古尔曼最新曝料,苹果已经在着手开发搭载M4芯片的全新MacBook Pro。 根据Canalys机构曝光的路线图,M4系列芯片有望2025年第1季度上线,将主打AI功能。 目前苹果已经宣布,将于美国太平洋时间6月10日-6月...
-
SDXS官网体验入口 AI快速生成高质量图像模型怎么使用
SDXS是一种新的扩散模型,通过模型微型化和减少采样步骤,大幅降低了模型延迟。它利用知识蒸馏来简化U-Net和图像解码器架构,并引入了一种创新的单步DM训练技术,使用特征匹配和分数蒸馆。SDXS-512 和 SDXS-1024 模型可在单个 GPU 上分别...
-
十秒整理搜索结果,脑图表格一键生成,网友:搜索终于有了该有的样子
最近有个AI搜索工具在小圈子里挺火。 被疯狂安利的时候打满了这么几个tag:干净清爽、无广告又智能。 只要输入一个问题,就能在全网范围内秒秒钟筛选出高质量相关资料摆在你眼前,还有对所有资料的一键整理、总结、归纳。 这么神奇的AI工具,我们量子位必须得试...
-
曝iPhone 16 Pro性能怪兽来了 AI GPU图形方面的升级可能相对有限
据业内分析师透露,苹果计划在iPhone 16 Pro机型中使用更大尺寸的A18 Pro芯片,以提升其人工智能(AI)性能。据悉,该芯片将配备6核图形处理器(GPU),与iPhone 15 Pro机型的A17 Pro芯片相当。 此前有报道称,iOS 18将...
-
等不及公开了!最新Sora模型细节揭秘:预计峰值需要72万块H100!每月至少4200块H100!缩放定律依旧有效!
作者 | Matthias·Plappert 翻译 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) OpenAI的Sora模型能够生成各种场景的极其逼真的视频,令世界惊叹不已。除了一篇公开的技术报告和TikTok上放出的酷炫视频,就...
-
OpenAI的Sora在NVIDIA H100上生成1分钟视频约需12分钟
据Factorial基金估计,OpenAI的Sora每小时在NVIDIA H100上生成5分钟的视频,相当于每天能生成120分钟的视频。报告进一步指出,为支持TikTok和YouTube的创作者社区,大约需要89,000个NVIDIA H100GPU。合并...
-
OpenAI颠覆导演!首批7个Sora超现实大片震惊好莱坞
Sora给好莱坞的震撼,就在刚刚变成了现实! 几天前,「OpenAI正在向好莱坞推销Sora」的消息才刚刚传出。 而今天一早,首批拿到Sora授权的导演、艺术家们,就已经公开自己创作的最新短片了。堪称神速! OpenAI为之配文——Sora初印象。...
-
在Raspberry Pi上运行本地LLM和VLM
译者 | 朱先忠 审校 | 重楼 在树莓派上使用Ollama的本地LLM和VLM(作者本人提供照片) 前言 有没有想过在自己的设备上运行自己的大型语言模型(LLM)或视觉语言模型(VLM)?你可能想过,但一想到从头开始设置,必须管理有关环境,还要下载正...
-
Stable Diffusion:AI绘画的革命与实践指南
在人工智能的浪潮中,Stable Diffusion作为一款开源的AI绘画软件,正逐渐成为艺术家、设计师乃至普通爱好者的新宠。它不仅能够生成令人惊叹的数字艺术作品,还能够模仿特定艺术家的风格,让创意的表达更加多元和自由。本文将为您提供Stable Diff...
-
聊聊国内如何使用ChatGPT的堂兄弟Copilot
ChatGPT狂飙160天,世界已经不是之前的样子。 新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 发布在https://it.weoknow.com 01,序言 ...
-
使用 Keras 的 Stable Diffusion 实现高性能文生图
前言 在本文中,我们将使用基于 KerasCV 实现的 Stable Diffusion 模型进行图像生成,这是由 stable.ai 开发的文本生成图像的多模态模型。 Stable Diffusion 是一种功能强大的开源的文本到图像生成模型。虽然...
-
AI时代CPU不老!Intel五代至强五大革新:340亿参数小意思
AI漫长的历史中,ChatGPT绝对是浓墨重彩的一笔。正是它引爆了AI大模型概念,也让以往高高在上的AI飞入了寻常百姓家,开始融入每个人的日常工作、生活,AI PC、AI手机、AI边缘也都在大踏步前进,变革千行百业。 有调研数据显示,预计到2026年,AI...
-
大佬谈AI|库克要让国行版iPhone装上百度AI 周鸿祎剖析库克盘算,黄仁勋、Altman语出惊人!
3月25日消息,过去一周,国内外AI圈子又有众多话题涌现。苹果公司CEO蒂姆·库克(Tim Cook)的中国之行成为观察苹果生成式AI发展动态的窗口;英伟达的2024 GTC大会CEO黄仁勋携新的超级GPU亮相,要为更大规模的生成式AI模型训练扫清算力障碍...
-
使用GaLore在本地GPU进行高效的LLM调优
训练大型语言模型(llm ,即使是那些“只有”70亿个参数的模型,也是一项计算密集型的任务。这种水平的训练需要的资源超出了大多数个人爱好者的能力范围。为了弥补这一差距,出现了低秩适应(LoRA 等参数高效方法,可以在消费级gpu上对大量模型进行微调。 G...
-
清华微软开源全新提示词压缩工具,长度骤降80%!GitHub怒砍3.1K星
在自然语言处理中,有很多信息其实是重复的。 如果能将提示词进行有效地压缩,某种程度上也相当于扩大了模型支持上下文的长度。 现有的信息熵方法是通过删除某些词或短语来减少这种冗余。 然而,作为依据的信息熵仅仅考虑了文本的单向上下文,进而可能会遗漏对于压缩至关...
-
华为云FunctionGraph引领AIGC革命,赋能智慧未来
在数字时代浪潮的推动下,人工智能正以前所未有的速度改变着我们的生活。其中,AIGC(人工智能生成内容)以其独特的魅力,引领着产业创新的潮流,为工作效率的提升和人类社会的发展注入了新的活力。而...
-
CUDA之通用矩阵乘法:从入门到熟练!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 通用矩阵乘法 (General Matrix Multiplication,GEMM 是各种模型和计算中的核心部分,同时也是评估计算硬件性能 (FLOPS 的标准技术。本文将通过对 GEMM 的实...
-
AI绘画作品的展示和变现
AI绘画作品的展示和推广技巧 如何通过AI绘画打造独特的个人IP 4.1 AI绘画作品买卖 平台一:抖音 抖音平台有「抖音图文扶持计划」,还会不定期推出图文伙伴计划、图文热点来了等,大家起号的时候更容易 当你的每篇作品阅读...
-
大数据 AI 一体化解读
一、AI 的“iPhone”时刻 在过去的一年中,大模型的发展非常迅速,算力和数据的堆叠使模型具备了一些通用的构造和回答问题的能力,引领人们进入了一直梦想的人工智能阶段。举个例子,在与大语言模型聊天时,会感觉面对的不是一个生硬的机器人,而是一个有血有肉的...
-
llama factory 参数体系EvaluationArguments、DataArguments、FinetuningArguments、FreezeArguments、LoraArgument
项目地址 https://github.com/hiyouga/LLaMA-Factory 模型层参数 这段代码是使用Python的dataclasses模块定义的一个数据类ModelArguments,用于管理和存储与模型微调相关的参数。这个类的设计是...
-
AIGC时代下阿里云视频云媒体内容生产技术实践
编者按 AIGC时代下,媒体内容生产领域随着AI的出现也涌现出更多的变化与挑战。面对AI的巨大冲击,如何优化或重构媒体内容生产技术架构?在多样的应用场景中媒体内容生产技术又有着怎样的实践效果?LiveVideoStackCon2023...
-
基于腾讯云高性能应用服务HAI,快速搭建AI绘画环境介绍
目录 1、什么是HAI服务 2、HAI服务的优势 2.1 简单易用 2.2 快速部署 2.3 灵活性高 2.4 多种使用方式 2.5 算力种类丰富 3、应用场景 3.1 AI 作画 3.2 AI 写...
-
【体验有奖】用 AI 画春天,函数计算搭建 Stable Diffusion WebUI
人工智能生成内容 AIGC(Artificial Intelligence Generated Content)是当下备受关注的概念之一,是继 PGC 和 UGC 之后的新型生产方式。AIGC 技术的核心思想是利用人工智能算法生成具有一定创意和质量的内容。...
-
AMD芯片使用Stable-Diffusion
AMD芯片使用Stable-Diffusion 由于A卡的Stable Diffusion工具的逐步完善,之前只能使用CPU跑,现在已支持AMD显卡进行AI绘图。 下载 官网链接:https://github.com/AUTOMATIC11...
-
LangChain+llama.cpp+llama-cpp-python工程学习笔记(一)
LangChain 是一个开发由语言模型驱动的应用程序的框架,有以下特性。 数据感知 : 将语言模型连接到其他数据源 具有代理性质 : 允许语言模型与其环境交互 pip install langchain 报错ERROR: Could not...
-
AI绘画|Midjourney怎么生成自定义风格?风格调谐器Style Tuner从基础到进阶全面指南
在Midjourney这款AI绘画神器中,Style Tuner是一个强大且创新的功能,它能够帮助用户探索并定制独一无二的艺术风格。下面我们将通过详尽的步骤解析如何使用Style Tuner,并揭示一些进阶技巧,助你开启艺术创作之旅。 MJ已经出了详细的...
-
英伟达AI Workbench正式发布,大幅度简化大模型开发流程
3月22日,英伟达在官网宣布,正式发布NVIDIA AI Workbench。 AI Workbench是一款面向AI大模型开发人员的工具包,可以帮助开发人员消除很多繁琐、复杂的部署、开发流程。 无论你的技术水平如何,开发人员都可以体验快速可靠的 GPU...
-
Stable diffusion,AI绘画入门,秋叶大佬整合包(附网盘链接)
第一篇:SD安装和显卡要求 最近一段时间,AI绘画很火热,是不是感到对AI绘画很好奇,那么接下来介绍一下如何安装部署。让读者也能快速上手。进入AI绘画的世界。 最简单最容易入手的便是直接使用秋叶大佬的整合包,链接如下: 我用夸克网盘分享了「sd-we...
-
大模型之Llama系列- LlaMA 2及LLaMA2_chat(上)
LlaMA 2是一个经过预训练与微调的基于自回归的transformer的LLMs,参数从7B至70B。同期推出的Llama 2-Chat是Llama 2专门为对话领域微调的模型。 在许多开放的基准测试中Llama 2-Chat优于其他开源的聊天模型,此外...
-
为什么说GPU再火,AI平台也少不了强力的CPU
AIGC的这把火,燃起来的可不只是百模大战的热度和雨后春笋般的各式AI应用。 更是由于算力与通信需求的爆发式增长,使得底层的专用加速芯片、以及配备这些芯片的AI加速服务器再次被拉到了大众的聚光灯下。 据统计,2023年全球范围内的AI服务器市场规模已经达到...
-
今天起,Windows可以一键召唤GPT-4了
把 Copilot 按钮放在 Windows 桌面的任务栏,甚至实体键盘上,用大模型提升每个人的生产效率。 美东时间 3 月 21 日周四,生成式 AI 领军的微软又为我们带来了一点小小的震撼。 如果你的 Windows 11 电脑最近更新过系统补丁,就...
-
如何开展“人工智能+”行动?
日前,我国第十四届全国人民代表大会强调要开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。那么,如何开展“人工智能+”行动呢?这是一个值得深入思考的问题。 今年全国人大强调要开展“人工智能+”行动,可被视为推动我国从“互联网时代”迭代升级为“人...
-
数据本地性如何助力企业在云上实现高效机器学习
2.2 训练前将数据从远端拷贝到本地 另一种方案是在训练开始之前手动将数据集从远端云存储拷贝到本地磁盘/存储中。这样可以让数据位于本地,从而具备数据本地性的所有性能和成本优势。该方案的挑战主要在于数据管理。用户必须在作业完成后手动删除已拷贝的数据,为下一...
-
基于LLM的Unity游戏开发利器——LLMUnity
在本文中,我们将向您展示如何在Unity引擎中使用LLM(大型语言模型)。我们将使用LLMUnity包(https://github.com/undreamai/LLMUnity)展示如何仅用几行代码即可搭建一个交互对话的实例! 免责声明:我本人是LLM...
-
Windows下安装BigDL-LLM的总结(附Whisper加速环境需求)
1. 下载安装Anaconda 2. 新建Python虚拟环境 在Windows下启动Anaconda PowerShell Prompt,输入以下命令新建名为bigdl-llm的虚拟环境 conda create -n bigdl-llm p...
-
AI国漫女神这样画!傻瓜式的云端SD(stable diffusion)部署教程 - 白嫖4090、无需代码、一键启动
一、前言:为什么要云端部署stable diffusion? 前段时间一直在用midjourney进行Ai绘画,但是发现Midjourney绘画的限制有点多很死板,很多图都不能画,懂得都懂。想使用Midjourney可以看这个:( 【推荐】Midjour...
-
AIGC狂飙对于普通人意味着什么?
AIGC 人工智能生成内容,相对更早的内容生产模式分别为专家生产内容 PGC 和用户生产内容 UGC。而随着 AIGC 出现,内容生产率变成指数级上升。那么AIGC发展对于普通人来说到底意味着什么? 先回顾一下时间轴, 2015年7月,谷歌推出 De...
-
旗舰同款!小米Civi 4 Pro升级影像大脑3.0:搭载Xiaomi AISP
快科技3月21日消息,小米Civi 4 Pro今日正式发布,搭载原汁原味的徕卡专业三摄,配备光影猎人800定制专业传感器。 据介绍,小米Civi 4 Pro还继承了旗舰机型的实力,搭载Xiaomi AISP。 通过小米澎湃OS深入硬件层,重构技术管线,深入...
-
英伟达推出6G研究云平台,致力于实现6G RAN雄伟目标
在凭借RAN加速器进军移动网络领域之后,英伟达希望依托芯片和AI技术,能够在6G领域发挥更大、更关键的作用。 在日前举办的2024年度GTC AI大会上,英伟达宣布推出新的6G研究云平台(6G Research Cloud Platform 。这是一种...
-
10分钟实现AI绘图自由!Stable-Diffusion部署教程
一、Stable Diffusion介绍 Stable Diffusion是一款基于人工智能技术的图像生成与编辑工具,它不仅支持文本到图像的生成,还能实现图像到图像的转换与编辑。通过这款工具,用户可以轻松创建出各种独特且富有创意的图像作品,为创意设计...
-
【本地化部署Stable Diffusion WebUI(MACOS安装)】
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、Stable Diffusion WebUI适配三类芯片 二、安装 1.安装git、conda等 2.选定目录及下载Github远程仓库文件 3....
-
5分钟 Stable Diffusion 本地安装-本地部署(秋叶整合包)【Stable Diffusion 实战教程】
Stable Diffusion 实战教程 Stable Diffusion 本地安装-本地部署(秋叶整合包)【Stable Diffusion 实战教程】https://blog.csdn.net/jybaby/article/details/1367...