gpu 第14页 - AIGC资讯

LLMs之Llama3：Llama-3的简介、安装和使用方法、案例应用之详细攻略

LLMs之Llama3：Llama-3的简介、安装和使用方法、案例应用之详细攻略导读：2024年4月18日，Meta 重磅推出了Meta Llama 3，本文章主要介绍了Meta推出的新的开源大语言模型Meta Llama 3。模型架构 Llam...

AIGC 2024-05-24 人工智能

2525阅读

戴尔与英伟达合作，利用 AI 解决方案推动 AI 工厂发展

戴尔正在与英伟达合作，扩展其 AI 工厂基础设施服务，增加对新软件和服务器解决方案的支持。与其他基础设施服务不同，戴尔的 AI 工厂专门设计用于支持高强度的 AI 工作负载。在今年的 GTC 大会上宣布的戴尔 AI 工厂现在已经扩展到包括对液冷散热服务器...

人工智能 2024-05-24 人工智能

906阅读

微软如何看待其“模型即服务”功能使AI普及化

如今的工具使构建AI驱动的应用程序变得容易，但一个复杂的领域是，几乎所有开发人员都希望避免处理如何托管所使用的模型，这不仅是选择OpenAI的GPT-4o、Meta的Llama 3、Google的Gemini或市场上众多开源模型的问题，更是部署它们的...

人工智能 2024-05-24 人工智能

932阅读

Altman被曝七宗罪，OpenAI竟欲加密GPU合作军方？员工大批离职团队濒临崩溃

【新智元导读】刚刚，有网友仔细总结了OpenAI的七宗罪，对Altman发出愤怒的诘问:为何计划跟踪GPU?为何合作军方?员工滚雪球式离职的消息不断曝出，整个对齐团队已经濒临崩溃，「说谎」「心口不一」的形象愈发鲜明，Altman正在失去民心。 OpenAI...

人工智能 2024-05-24 人工智能

880阅读

LLamaFactory：当下最容易上手的大模型微调工具

近日，国内的一款微调框架发布了自己的论文《LLAMAFACTORY: Unified Efficient Fine-Tuning of 100+ Language Models》，对他们的框架做了系统性的总结。该框架自推出后迅速出圈，现已斩获15.6k的s...

人工智能 2024-05-24 人工智能

1358阅读

llama3 微调教程之 llama factory 的安装部署与模型微调过程，模型量化和gguf转换。

本文记录了从环境部署到微调模型、效果测试的全过程，以及遇到几个常见问题的解决办法，亲测可用（The installed version of bitsandbytes was compiled without GPU support. NotImpleme...

生成式AI 2024-05-24 人工智能

3503阅读

[stable diffusion] 错误：RuntimeError: Found no NVIDIA driver on your system. Please check that ...

错误：RuntimeError: Found no NVIDIA driver on your system. Please check that you have an NVIDIA GPU and 因为我电脑没有英伟达显卡所以遇到这个错误，可以改用...

人工智能 2024-05-24 人工智能

821阅读

世界模型也扩散！训练出的智能体竟然不错

世界模型提供了一种以安全且样本高效的方式训练强化学习智能体的方法。近期，世界模型主要对离散潜在变量序列进行操作来模拟环境动态。然而，这种压缩为紧凑离散表征的方式可能会忽略对强化学习很重要的视觉细节。另一方面，扩散模型已成为图像生成的主要方法，对离散潜在...

AIGC 2024-05-24 人工智能

760阅读

字节携港大南大升级 LLaVA-NeXT：借 LLaMA-3 和 Qwen-1.5 脱胎换骨，轻松追平 GPT-4V

文 | 王启隆出品 | 《新程序员》编辑部 2023 年，威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学的研究人员共同开发的 LLaVA 首次亮相，彼时它被视为一个端到端训练的大型多模态模型，展现了在视觉与语言融合领域的潜力。今年...

生成式AI 2024-05-24 人工智能

1308阅读

AI大模型探索之路-训练篇25：ChatGLM3微调实战-基于LLaMA-Factory微调改造企业级知识库

系列篇章? AI大模型探索之路-训练篇1：大语言模型微调基础认知AI大模型探索之路-训练篇2：大语言模型预训练基础认知AI大模型探索之路-训练篇3：大语言模型全景解读AI大模型探索之路-训练篇4：大语言模型训练数据集概览AI大模型探索之路-训练篇5：大...

人工智能 2024-05-23 人工智能

1511阅读

通透！如何选择合适的机器学习算法

算法选择注意事项为任务选择正确的机器学习算法涉及多种因素，每个因素都会对最终决策产生重大影响。以下是决策过程中需要牢记的几个方面。 1.数据集特征数据集的特征对于算法的选择至关重要。数据集的大小、包含的数据元素的类型、数据是结构化的还是非结构化的等...

大数据 2024-05-23 人工智能

831阅读

使用自己的数据集训练DETR模型

众所周知，Transformer已经席卷深度学习领域。Transformer架构最初在NLP领域取得了突破性成果，尤其是在机器翻译和语言模型中，其自注意力机制允许模型处理序列数据的全局依赖性。随之，研究者开始探索如何将这种架构应用于计算机视觉任务，特别是...

人工智能 2024-05-23 人工智能

1810阅读

yolov部署到iPhone或终端实践全过程

本文经计算机视觉研究院公众号授权转载，转载请联系出处。期待已久的检测经典又来来了一波强袭——yolov5。其实yolov5没有完整的文件，现在最重要的应该是把yolov4弄清楚，在目标检测领域中受益匪浅，可以在某些场景得到较高的提升。今天我们还是给大...

人工智能 2024-05-23 人工智能

765阅读

简单通用：视觉基础网络最高3倍无损训练加速，清华EfficientTrain++入选TPAMI 2024

本文经计算机视觉研究院公众号授权转载，转载请联系出处。论文链接：https://arxiv.org/pdf/2405.08768 代码和预训练模型已开源：https://github.com/LeapLabTHU/EfficientTrain 会议...

生成式AI 2024-05-23 人工智能

820阅读

黄仁勋：下一场工业革命已开始 AI将成为引领者

站长之家（ChinaZ.com）5月23日消息:今日凌晨，英伟达公司公布了其截至4月28日的2025财年第一财季财务报告，各项关键数据均远超市场预期，再次证明了其在全球半导体领域的领先地位。据财报披露，英伟达在第一财季实现了260亿美元的营收，较上年同...

大数据 2024-05-23 人工智能

805阅读

IBM加倍投入企业AI，发布 Watsonx 助手、模型更新

IIBM 公布了其生成式 AI 平台 watsonx 的新更新，包括新的助手工具、第三方模型和对开源 AI 的更广泛承诺。在公司年度 Think 大会上，IBM 宣布将重点转向支持开源。该公司已经将其一系列 Granite 大型语言模型开源，这意味着企业...

生成式AI 2024-05-22 人工智能

797阅读

Hinton万字访谈：用更大模型「预测下一个词」值得全力以赴

「这份访谈的每一秒都是精华。」最近，图灵奖得主 Geoffrey Hinton 的一个访谈视频得到了网友的高度评价。视频链接：https://www.youtube.com/watch?v=tP-4njhyGvo&t=660s 在访谈中，Hi...

生成式AI 2024-05-22 人工智能

956阅读

微软发布Phi-3 Vision等最新大模型系列

微软发布了其最新的大型语言模型系列，Phi-3，包括Phi-3Vision、Phi-3Small7B和Phi-3Medium14B型号。这些模型在性能上与当前领先的大型模型相媲美，同时在特定领域提供了一些独特的优势。 Phi-3Medium14B 型号的...

AIGC 2024-05-22 人工智能

796阅读

微软发布Copilot智能体还带来了本机小语言模型

5月22日消息，当地时间周二，微软在Build开发者大会上发布Copilot新智能体，它就像虚拟员工一样，能自动执行任务。微软认为，这种人工智能将消除枯燥乏味的工作内容，而不是完全取代员工工作。此外，微软还针对Copilot+ PC推出了本机小语言模...

人工智能 2024-05-22 人工智能

855阅读

均价300万美元？英伟达GH200超级芯片落地9个超算中心，每秒两百亿亿次flop

英伟达用Grace Hopper的实力证明，它可以成为AI超算的首选硬件，未来将不再局限于GPU。 5月12日，英伟达宣布，全球有9台新型超级计算机正在使用Nvidia Grace Hopper超级芯片来加速科学研究和发现，从而推动高性能计算（HPC）产...

人工智能 2024-05-22 人工智能

991阅读

案例分享｜Alluxio在自动驾驶模型训练中的应用与部署

分享嘉宾：杨林三-辉羲智能关于辉羲智能：辉羲智能是一家做自动驾驶芯片的初创公司，成立于2022年。致力打造创新车载智能计算平台，提供高阶智能驾驶芯片、易用开放工具链及全栈自动驾驶解决方案，助力车企实现优质高效的自动驾驶量产交付，构建低成本、大规...

生成式AI 2024-05-21 人工智能

841阅读

KubeAI大模型推理加速实践｜得物技术

除了上面提到的技术外，提高大模型推理速度的还有大模型的量化技术等，这里先不探讨，后面有机会，我们会单独发文章来介绍。二、大模型发展面临的挑战未来大模型的参数量肯定会越来越大，这也是大模型的发展趋势，对推理加速的要求会越来越高。 OpenAI在其论...

生成式AI 2024-05-21 人工智能

877阅读

生成式AI能否推进私有云的复兴吗?

根据调研机构Forrester在2023年进行的一项有关云计算基础设施的调查，在接受调查的1300名企业云决策者中，79%的受访者表示他们的组织正在部署或采用私有云。另据IDC的预测，全球企业私有云基础设施(包括硬件、软件和支持服务 2024年的支...

人工智能 2024-05-21 人工智能

844阅读

微软重新定义AI PC：与GPT-4o共享屏幕，看过的一切再也不会忘

今天，微软重新定义了个人电脑。刚刚发布新一代Copilot+PC，让上市还没几天的第一批AI PC直接过时了。在新一代PC里，打游戏时可与AI实时对话，提供吐槽陪玩或攻略指导，由GPT-4o提供支持。任何文件或网页浏览记录都可以用自然语言搜索，轻...

大数据 2024-05-21 人工智能

824阅读

生成式AI是否正在让私有云“复兴”

编译丨诺亚出品 | 51CTO技术栈（微信号：blog51cto）在又一轮技术革命来袭之际，不少企业正面临着一个战略性的抉择：是继续依赖公共云的便利，还是回归私有云的怀抱？随着AI技术的飞速发展，这一决策变得更加紧迫。根据Forrester于2...

AIGC 2024-05-20 人工智能

839阅读

首个GPU高级语言，大规模并行就像写Python，已获8500 Star

经过近 10 年的不懈努力，对计算机科学核心的深入研究，人们终于实现了一个梦想：在 GPU 上运行高级语言。上周末，一种名为 Bend 的编程语言在开源社区引发了热烈的讨论，GitHub 的 Star 量已经超过了 8500。 GitHub：http...

AIGC 2024-05-20 人工智能

890阅读

我们一起聊聊AI模型组合指南

实施需要周密的计划、资源管理以及采用现代部署实践和工具。译自A Guide to Model Composition，作者 Sherlock Xu。考虑一款旨在识别和分类野生动物照片的 AI 驱动的图像识别应用程序。您上传一张远足时拍摄的照片，几分钟...

大数据 2024-05-20 人工智能

898阅读

AI如何使机器人更具自主性和适应性？

在工业自动化技术领域，最近有两个热点很难被忽视：人工智能(AI 和英伟达(Nvidia 。毫不意外，这两者密切相关，因为英伟达现在不仅仅局限于其最开始的图形处理单元(GPU ，正在将其GPU技术扩展到数字孪生领域，同时紧密连接着新兴的AI技术。最近...

AIGC 2024-05-20 人工智能

783阅读

Meta首发「变色龙」挑战GPT-4o，34B参数引领多模态革命！10万亿token训练刷新SOTA

GPT-4o的横空出世，再次创立了一个多模态模型发展的新范式！为什么这么说？ OpenAI将其称为「首个『原生』多模态」模型，意味着GPT-4o与以往所有的模型，都不尽相同。传统的多模态基础模型，通常为每种模态采用特定的「编码器」或「解码器」，将不...

大数据 2024-05-20 人工智能

878阅读

腾讯 PCG 搜广推机器学习框架GPU 性能优化实践

一、为什么 GPU 推荐模型训练框架是刚需 1. PCG 算力集群缺点最开始的时候，腾讯 PCG 所有的推荐模型训练都是使用 CPU。但随着业务的深入，以及深度学习模型的发展，PCG 算力集群在做下一代推荐模型时会遇到各种问题：首先，系统网络带宽...

AIGC 2024-05-20 人工智能

900阅读

微博已接入阿里云通义大模型覆盖AI评论、明星陪聊等功能

站长之家（ChinaZ.com）5月18日消息:据阿里云官方消息，微博宣布已成功将阿里云的大模型技术融入其核心业务，开启了一个全新的智能互动时代。这一融合不仅覆盖了AI评论、AI明星陪聊、虚拟角色帐号、星座大模型，更在信息流广告创意生成等领域展现出了显著...

AIGC 2024-05-18 人工智能

860阅读

阿里云：微博已接入通义大模型应用于AI评论、AI明星陪聊等

快科技5月17日消息，根据阿里云”官方消息，微博已成功将大模型技术融入其业务中，包括AI评论、AI明星陪聊、虚拟角色帐号、星座大模型以及信息流广告创意生成等多个方面，且已初显成效。据悉，微博是阿里云的长期合作伙伴，双方的合作历史已近十年。在面对突发的热点...

生成式AI 2024-05-17 人工智能

819阅读

微软向云计算客户提供 AMD 替代 Nvidia AI 处理器

微软于周四表示，计划为其云计算客户提供平台的人工智能芯片，以与由 Nvidia 制造的组件竞争。微软将在下周的 Build 开发者大上公布更多细节。此外，微软还将在会议上推出新 Cobalt100定制处理器的预，该处理器的性能预计比其他基于 Arm Hol...

生成式AI 2024-05-17 人工智能

746阅读

Hugging Face承诺免费提供1000万美元GPU计算资源，帮助小型开发者对抗大型AI公司

机器学习公司 Hugging Face 承诺投入1000万美元的 GPU 计算资源，帮助开发者和初创公司对抗大型人工智能公司。 Hugging Face 的首席执行官 Clem Delangue 表示:“我们很幸运能够投资社区。” 该公司最近筹集了2.35...

生成式AI 2024-05-17 人工智能

887阅读

AI日报：百度搜索11%结果由AI生成；腾讯混元支持生成16s视频；谷歌发布开源视觉语言模型PaliGemma；Hugging Face承诺免费提供1000万美元GPU计算资源

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、李彦宏：百度搜索已有11%结果...

人工智能 2024-05-17 人工智能

851阅读

马斯克旗下 xAI 与甲骨文接近达成 100 亿美元协议

马斯克旗下的 xAI 公司正与甲骨文进行谈判，计划投资100亿美元租用甲骨文的 AI 服务器。如果交易达成，xAI 将成为甲骨文最大的客户之一。此举将使 xAI 能够快速追赶竞争对手 OpenAI、谷歌和 Anthropic 等头部企业。与此同时，xA...

AIGC 2024-05-17 人工智能

773阅读

李飞飞揭秘创业方向“空间智能”：视觉化为洞察，看见成为理解，理解导致行动

斯坦福李飞飞创业后，首次揭秘新概念“空间智能”。这不仅是她的创业方向，也是指引她的“北极星”，被她认为是“解决人工智能难题的关键拼图”。视觉化为洞察；看见成为理解；理解导致行动。李飞飞最新15分钟TED演讲完整公开，从数亿年前生命进化的起源开始，...

AIGC 2024-05-16 人工智能

947阅读

告别3D高斯Splatting算法，带神经补偿的频谱剪枝高斯场SUNDAE开源了

本论文作者包括帝国理工学院硕士生杨润一、北航二年级硕士生朱贞欣、北京理工大学二年级硕士生姜洲、北京理工大学四年级本科生叶柏均、中国科学院大学本科大三学生张逸飞、中国电信人工智能研究院多媒体认知学习实验室（EVOL Lab）负责人赵健、清华大学智能产业研究...

AIGC 2024-05-15 人工智能

877阅读

GPU需求增长但费用高昂，微云服务成为企业新宠

GPU的需求如今呈现出极大的增长，它们对于运行和训练生成式人工智能（GenAI）模型来说至关重要。微云（microclouds）提供的GPU服务可能成为一种可行的替代方案。微云市场规模正在快速增长。CoreWeave、Lambda Labs、Volta...

大数据 2024-05-15 人工智能

790阅读

字节跳动豆包大模型发布，火山引擎全栈 AI 服务助力企业智能化转型

火山引擎总裁谭待企业要做好大模型落地，面临模型效果、推理成本、落地难度的三大关键挑战：既要有好的基础大模型做支撑，解决复杂难题，也要有低成本的推理服务让大模型被广泛应用，还要更多工具、平台和应用帮助企业做好场景落地。 ——谭待火山引擎总裁...

人工智能 2024-05-15 人工智能

1695阅读

OpenAI发布新AI模型GPT-4o和桌面版ChatGPT

OpenAI新的更新将GPT-4带给所有人，包括OpenAI的免费用户，技术主管Mira Murati在直播活动中表示。她补充说，新的模型GPT-4o"快得多"，并在文本、视频和音频方面有了改进的能力。OpenAI表示，最终计划使用户能够通过视频与C...

大数据 2024-05-14 人工智能

856阅读

扎克伯格警告：AI GPU 瓶颈已缓解但功耗将限制 AI 增长

在最近的一次采访中，Facebook 联合创始人兼首席执行官马克·扎克伯格表示，长期的GPU荒已经基本结束，人工智能的增长和发展短期内不会受到资本限制的影响，而是将面临能源问题的挑战。他指出，新数据中心的能耗已经达到惊人的 50 至 100 兆瓦，甚至可...

大数据 2024-05-13 人工智能

701阅读

DLRover 如何拯救算力浪费？10 分钟自动定位故障机，1 秒内保存 Checkpoint！

欢迎大家在 GitHub 上 Star 我们：分布式全链路因果学习系统 OpenASCE:https://github.com/Open-All-Scale-Causal-Engine/OpenASCE 大模型驱动的知识图谱 OpenSPG:http...

人工智能 2024-05-13 人工智能

1026阅读

看红帽如何在RHEL与OpenShift中玩转生成式AI

市场上有很多生成式AI平台的选择，为什么要选择红帽? 红帽总裁兼CEO Matt Hicks直言红帽的不同之处在于运行位置的核心灵活性。企业既可以对小型开源模型进行混合部署，也可以在公有云或自有数据中心训练模型，同时支持主要的GPU供应商。最近在R...

人工智能 2024-05-13 人工智能

812阅读

只需百行代码，让H100提速30%，斯坦福开源全新AI加速框架

AI 的快速发展，伴随而来的是大计算量。这就自然而然的引出了一个问题：如何减少 AI 对计算的需求，并提高现有 AI 计算效率。为了回答这一问题，来自斯坦福的研究者在博客《GPUs Go Brrr》中给出了答案。图片博客地址：https://haz...

大数据 2024-05-13 人工智能

801阅读

Flash Attention稳定吗？Meta、哈佛发现其模型权重偏差呈现数量级波动

Meta FAIR 联合哈佛优化大规模机器学习时产生的数据偏差，提供了新的研究框架。众所周知，大语言模型的训练常常需要数月的时间，使用数百乃至上千个 GPU。以 LLaMA2 70B 模型为例，其训练总共需要 1,720,320 GPU hours。由...

AIGC 2024-05-13 人工智能

922阅读

从零开始手搓GPU，照着英伟达CUDA来，只用两个星期

「我花两周时间零经验从头开始构建 GPU，这可比想象的要难多了。」总有人说老黄的芯片供不应求，大家恨不得去手搓 GPU，现在真的有人试了。近日，美国一家 web3 开发公司的创始工程师之一 Adam Majmudar 分享了他「手搓 GPU」成功...

AIGC 2024-05-13 人工智能

841阅读

小米13 Ultra获1.0.9.0版更新新增大师人像、AISP功能

站长之家（ChinaZ.com）5月11日消息:小米13Ultra手机迎来了澎湃HyperOS1.0.9.0的系统更新，这次更新不仅融入了2024年4月的安全补丁，加强了系统安全性，更在相机应用上实现了显著的功能升级，引入了备受期待的“大师人像”功能以及...

大数据 2024-05-11 人工智能

1135阅读

AI日报：OpenAI重磅更新定档下周一；开源版EMO项目发布；微信读书上线AI问书功能；博主调教AI男友甜晕网友

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、OpenAI预告将直播Chat...

人工智能 2024-05-11 人工智能

999阅读

AI手机，活成产业“摇钱树”

早几年出现的折叠屏没能拯救颓势的手机市场，直接证据就是去年全球出货量依旧拉胯，同比下滑3.2%至11.7亿部，为近十年来最低。好在Q4出现了些许回暖，全球和中国市场分别有8.5%和1.2%的同比增幅，尤其是后者，在连续同比下降10个季度后首次转正。很难...

生成式AI 2024-05-11 人工智能

804阅读