llm 第48页 - AIGC资讯

苹果筹备 iPhone 16 Pro 的 AI 功能应对智能手机 AI 竞赛的挑战

随着 Google、高通和三星在其旗舰智能手机中大力推广 AI 技术，苹果公司面临在即将推出的 iPhone 16 Pro 中整合 AI 技术的紧迫挑战。据 Bloomberg 的 Mark Gurman 报道，由于 iPhone 16 和 16 Pr...

人工智能 2023-11-14 人工智能

1176阅读

Silo AI面向欧洲推新开源语言模型“Poro” 涵盖欧盟24种语言

芬兰赫尔辛基的人工智能初创公司Silo AI本周发布了Poro，这是一个旨在提升欧洲语言多语言人工智能能力的新开源大型语言模型（LLM）。Poro是计划中的首个开源模型，旨在最终涵盖欧盟所有24种官方语言。这些模型由Silo AI的SiloGen生成人工智...

AIGC 2023-11-14 人工智能

960阅读

LLM系列 | 19 : Llama 2实战(上篇)-本地部署(附代码)

简介小伙伴们好，我是《小窗幽记机器学习》的小编：卖热干面的小女孩。紧接前文：万字长文细说ChatGPT的前世今生，后续会尝试以理论+实践的方式逐步对主流的各大LLM进行实测和汉化。今天这篇关于Llama2的小作文其实比较长，所以分为上下两篇，上篇...

AIGC 2023-11-14 人工智能

996阅读

企业对生成式AI的投资低得惊人在云支出中占比不到1%

2023年，生成式AI备受关注，被认为是能够在多个领域实现变革的突破性技术，甚至被寄予改变人类生活的希望。然而，Menlo Ventures报告显示，尽管生成式AI在2023年取得突破，但这主要是一场炒作。报告指出，生成式AI在企业云支出中所占比例“相对...

人工智能 2023-11-14 人工智能

802阅读

老黄深夜炸场，世界最强AI芯片H200震撼发布！性能飙升90%，Llama 2推理速度翻倍，大批超算中心来袭

英伟达的节奏，越来越可怕了。就在刚刚，老黄又一次在深夜炸场——发布目前世界最强的AI芯片H200！较前任霸主H100，H200的性能直接提升了60%到90%。不仅如此，这两款芯片还是互相兼容的。这意味着，使用H100训练/推理模型的企业，可以无缝更...

生成式AI 2023-11-14 人工智能

818阅读

中文版开源Llama 2同时有了语言、多模态大模型，完全可商用

可以说，AI 初创公司 LinkSoul.Al 的这些开源项目让海外开源大模型在国内的普及和推广速度与国际几乎保持了一致。 7 月 19 日，Meta 终于发布了免费可商用版本 Llama 2，让开源大模型领域的格局发生了巨大变化。 Llama 2 模...

大数据 2023-11-14 人工智能

839阅读

谷歌DeepMind爆火动画18秒解释LLM原理，网友蒙圈！组团求GPT-4下场分析

Google DeepMind最近在自己的视频博客上上传了一段视频，「简单明了地」演示了大语言模型的工作原理，引发了网友的激烈讨论。网友看了之后纷纷表示：「终于，他们发了点普通人能看懂的东西了」。「哦豁，这下懂了」「对，就是这么简单！」「太...

生成式AI 2023-11-13 人工智能

877阅读

ICLR 2024论文审稿结果出炉！7000+高产论文创新纪录，扩散模型占比最高

ICLR 2024审稿结果公布了！ ICLR是机器学习领域重要的学术会议之一，每年举办一次。2024年是第十二届，将在奥地利维也纳5月7日-11日召开。根据OpenReview官方放出的结果显示，今年共有7135篇投稿论文。此外，另有国内开发者魏国...

大数据 2023-11-13 人工智能

1042阅读

[大模型] 搭建llama主流大模型训练环境

关键词：大模型，LLAMA，CUDA，模型训练 1. 基础环境 OS： Ubuntu 18.04GPU： 4*A100(40G (单机4卡A100 40G CUDA：11.7cuDNN： 8.4.1 (需要登录官网后下载 nccl： 2.12.12...

人工智能 2023-11-13 人工智能

1271阅读

全球各行业公司纷纷发布GPT-4相关职位

大型语言模型（LLM）领域正在迅速增长，对深度学习、机器学习、自然语言处理(NLP 等领域的专业人才需求不断上升。随着越来越多的公司采用聊天机器人和其他LLM人工智能技术来提高客户服务和运营效率，对于开发、维护和操作这些系统的才华横溢的个体的需求也在增加。...

大数据 2023-11-13 人工智能

872阅读

LoRAShear:微软在LLM修剪和知识恢复方面的最新研究

LoRAShear是微软为优化语言模型模型(llm 和保存知识而开发的一种新方法。它可以进行结构性修剪，减少计算需求并提高效率。 LHSPG技术（ Lora Half-Space Projected Gradient）支持渐进式结构化剪枝和动态知识恢复...

大数据 2023-11-13 人工智能

864阅读

GPT Builder如何下载?创建GPTs还需要prompt吗

在上周的开发者大会DevDay上，OpenAI向所有ChatGPTPlus订阅者发布了其新的招牌工具之一GPTBuilder。正如名称所示，OpenAI的GPTBuilder允许个人构建自己的ChatGPT定制版本，ChatGPT是该公司热门的大型语言模型...

生成式AI 2023-11-13 人工智能

993阅读

丢掉 LangChain、像 Docker一样编排大模型应用程序：这支十余人的年轻创业团队如何在2个月做出一个LLMOps平台？

大模型浪潮正在重构千行百业。可以预见的是，随着技术的不断进步以及应用场景的不断扩展，基于大模型的 AI 应用将会不断涌现，并成为推动 AI 产业发展的重要力量。但在当下，大模型应⽤落地还面临诸多挑战。具体而言，不少开发团队还未适应大模型编程的需求，对大模...

大数据 2023-11-13 人工智能

1134阅读

2028年人类将迎来AGI：DeepMind联合创始人长文预测未来AI发展

10月26日，在X上有三万订阅的Dwarkesh Podcast（矮人播客）主持人Dwarkesh Patel采访了谷歌DeepMind的创始人兼首席AGI科学家Shane Legg。他们讨论了AGI出现的时间节点、可能的AGI新架构、作为下一个行业标...

人工智能 2023-11-13 人工智能

808阅读

谷歌DeepMind给AGI划等级，猜猜ChatGPT在哪个位置

我们到底该如何定义 AGI（通用人工智能）？如果你要求 100 位 AI 专家进行解答，你可能会得到 100 个相关但不同的定义。现阶段，AGI 是 AI 研究中一个重要且存在争议的概念，有研究者认为 AGI 已经出现在最新一代大语言模型（LLM）中；...

大数据 2023-11-13 人工智能

799阅读

GitHub在大会上发布的十大AI更新！

作者 | Tasmia 策划 | 言征出品 | 51CTO技术栈（微信号：blog51cto） GitHub的母公司微软在生成人工智能业务方面取得了巨大增长，该公司首席执行官萨蒂亚·纳德拉告诉华尔街，该公司9月份为其GitHub Copilot软件付...

生成式AI 2023-11-13 人工智能

869阅读

GPT-4比你更会问问题：让大模型自主复述，打破与人类对话的壁垒

在最新的人工智能领域动态中，人工生成的提示（prompt）质量对大语言模型（LLM）的响应精度有着决定性影响。OpenAI 提出的建议指出，精确、详细且具体的问题对于这些大语言模型的表现至关重要。然而，普通用户是否能够确保他们的问题对于 LLM 来说足够...

人工智能 2023-11-13 人工智能

792阅读

1分钟诞生一个新GPT！3天内定制GPT大爆发，理想型男友、科研利器全网刷屏

1分钟诞生一个新的GPT！不到一周的时间，各种定制GPT全球大爆发，增长速度已经完全超乎所有人的想象。这恰恰，印证了Altman在开发者大会所说的一句话，「我们正在孕育新物种，它们正在迅速增殖。」全网都在唱衰Agent初创公司，甚至就连开发者的...

生成式AI 2023-11-13 人工智能

860阅读

LangChain+ChatGLM整合LLaMa模型（二）

开源大模型语言LLaMa LLaMa模型GitHub地址添加LLaMa模型配置启用LLaMa模型 LangChain+ChatGLM大模型应用落地实践（一） LLaMa模型GitHub地址 git lfs clone htt...

AIGC 2023-11-13 人工智能

791阅读

Text-to-SQL小白入门（五）开源最强代码大模型Code Llama

摘要本文介绍了Code Llama大模型的基本概括，包含了论文的摘要、结果、结论以及核心方法，对于了解和实践Code Llama有一定帮助。论文概述上一篇介绍了指令进化大模型WizardLM，留了一个坑，补上Code Llama论文学习，...

大数据 2023-11-12 人工智能

1108阅读

【网安AIGC专题10.11】2 ILF利用人类编写的自然语言反馈来训练代码生成模型：自动化反馈生成+多步反馈合并+处理多错误反馈+CODEGEN -M ONO 6.1 B model

Improving Code Generation by Training with Natural Language Feedback 写在最前面主要工作启发背景介绍应用现有工作的不足 Motivation动机方法 ILF...

大数据 2023-11-12 人工智能

1062阅读

[大模型] LLaMA系列大模型调研与整理-llama/alpaca/lora（部分）

文章目录 LLaMA大模型及其衍生模型 1. LLaMA 2. stanford_alpaca 3. ChatDoctor 4. alpaca-lora 5. Chinese-LLaMA-Alpaca 6. BELLE 大模型综述 A Su...

生成式AI 2023-11-12 人工智能

1354阅读

【AIGC】BaiChuan7B开源大模型介绍、部署以及创建接口服务

模型介绍 baichuan-7B是由百川智能开发的一个开源的大规模预训练模型。基于Transformer结构，在大约1.2万亿tokens上训练的70亿参数模型，支持中英双语，上下文窗口长度为4096。在标准的中文和英文权威benchmark（C-EV...

人工智能 2023-11-12 人工智能

1031阅读

大语言模型之十五-预训练和监督微调中文LLama-2

这篇博客是继《大语言模型之十二 SentencePiece扩充LLama2中文词汇》、《大语言模型之十三 LLama2中文推理》和《大语言模型之十四-PEFT的LoRA》前面博客演示了中文词汇的扩充以及给予LoRA方法的预训练模型参数合并，并没有给出Lo...

大数据 2023-11-12 人工智能

1390阅读

[LLM+AIGC] 01.应用篇之中文ChatGPT初探及利用ChatGPT润色论文对比浅析（文心一言 | 讯飞星火）

近年来，人工智能技术火热发展，尤其是OpenAI在2022年11月30日发布ChatGPT聊天机器人程序，其使用了Transformer神经网络架构（GPT-3.5），能够基于在预训练阶段所见的模式、统计规律和知识来生成回答，还能根据聊天的上下文进行互动，...

AIGC 2023-11-11 人工智能

925阅读

使用LoRA对大语言模型LLaMA做Fine-tune

使用LoRA对大语言模型LLaMA做Fine-tune 前言下载配置环境模型的训练 Fine-tune 模型的使用 Inference 参考问题汇总前言目前有大量对LLM（大语言模型）做Fine-tune的方式，不...

AIGC 2023-11-11 人工智能

1170阅读

ChatGPT最近被微软内部禁用！GPTs新bug：数据只要两句提示词就能套走

注意！你创建GPTs时上传的数据，任何人都能轻易下载…… 只需两句提示词，就可被直接套走！而又在另一边，OpenAI最亲密盟友微软内部一度紧急禁用，网站上显示的理由正是：出于安全和数据方面的考虑，许多AI工具不再供员工使用。自定制版GPT上线以来...

生成式AI 2023-11-11 人工智能

853阅读

NLP-分词器：SentencePiece【参考Chinese-LLaMA-Alpaca在通用中文语料上训练的20K中文词表并与原版LLaMA模型的32K词表进行合并的代码】

背景随着ChatGPT迅速出圈，最近几个月开源的大模型也是遍地开花。目前，开源的大语言模型主要有三大类：ChatGLM衍生的大模型（wenda、ChatSQL等）、LLaMA衍生的大模型（Alpaca、Vicuna、BELLE、Phoenix、Chim...

生成式AI 2023-11-11 人工智能

1612阅读

LLM：LLaMA模型和微调的Alpaca模型

LLaMA模型简单了解[LeCun狂赞：600刀GPT-3.5平替！斯坦福70亿参数「羊驼」爆火，LLaMA杀疯了] 论文原文：https://arxiv.org/abs/2302.13971v1 预训练数据模型架构模型就是用的tra...

生成式AI 2023-11-10 人工智能

902阅读

LLMs之Code：Code Llama的简介(衍生模型如Phind-CodeLlama/WizardCoder)、安装、使用方法之详细攻略

LLMs之Code：Code Llama的简介(衍生模型如Phind-CodeLlama/WizardCoder 、安装、使用方法之详细攻略导读：2023年08月25日(北京时间，Meta发布了Code Llama，一个可以使用文本提示生成...

生成式AI 2023-11-10 人工智能

2003阅读

几行代码教你轻松完成超大模型推理：LLaMA-30B+TITAN RTX*4+accelerate

是不是苦于没有ChatGPT的API key或者免费的token而无法愉快地和它玩耍？想不想在有限的计算资源上部署大模型并调戏大模型？？想不想解锁大模型的除了对话之外的其它功能？？？几行代码教你搞定如何在有限的计算资源下部署超大模型并实现推理。准备...

生成式AI 2023-11-10 人工智能

1050阅读

苹果或在 WWDC 2024 上展示强化版 Siri 和 iPhone 16 的独家 AI 功能

苹果公司或将在 2024 年全球开发者大会（WWDC）上展示一款由大型语言模型（LLM）提供动力的强化版 Siri，这款新 Siri 将首次亮相于 iOS 18。但某些前沿的生成式 AI 功能可能将只适用于 iPhone 16 型号。上个月，彭博社记者...

大数据 2023-11-10 人工智能

868阅读

亚马逊AI编程助手CodeWhisperer

Amazon CodeWhisperer是一款AI编程助手，可根据开发人员使用自然语言编写的注释和IDE（集成开发环境）中的代码生成建议，帮助开发人员提高工作效率。借助CodeWhisperer，开发人员无需在IDE与文档或开发者论坛之间切换，...

生成式AI 2023-11-10 人工智能

1055阅读

老黄H100再破纪录，4分钟训完GPT-3！全新「特供版」H20、L20和L2曝光，性能史诗级缩水

H100再次在MLPerf中刷新了记录! 英伟达超算NVIDIA Eos在GPT-3模型的基准测试中，只用了3.9分钟就完成了训练。这比6月份的刷新记录的成绩——10.9分钟，提升了近3倍。 Eos使用了多达10，752个H100和NVIDIA Quan...

AIGC 2023-11-10 人工智能

827阅读

使用 LangChain 和 Pinecone 矢量数据库构建自定义问答应用程序

构建自定义聊天机器人，以使用 LangChain、OpenAI 和 PineconeDB 从任何数据源开发问答应用程序介绍大型语言模型的出现是我们这个时代最令人兴奋的技术发展之一。它为人工智能领域开辟了无限可能，为各行业的现实问题提供了解决方案。这些...

生成式AI 2023-11-10 人工智能

1188阅读

Intel研究人员提出新AI方法，更高效地在CPU上部署LLM

大型语言模型（LLM）因其在文本生成、语言理解和文本摘要等各种任务中的卓越性能而备受瞩目，但它们庞大的模型参数却需要大量内存和专用硬件，这使得部署这些模型变得相当具有挑战性。为了降低推断所需的计算功率，研究人员通常采用权重量化等方法，即减少人工神经网络的...

AIGC 2023-11-10 人工智能

850阅读

微软推出 FP8 混合精度训练框架：比 BF16 快 64%，内存占用少 42%

11 月 10 日消息，大语言模型（LLM）快速崛起，在语言生成和理解方面表现出光明的前景，影响超越了语言领域，延伸到逻辑、数学、物理学等领域。不过想要解锁这些“非凡能量”，需要付出高额的代价，例如训练 540B 模型，需要 Project PaL...

生成式AI 2023-11-10 人工智能

838阅读

AI进军体育圈？自动识别比赛场景生成“真人”解说

最近，一项新技术引起了人们的关注，它使用OpenAI多项技术，能够以令人信服的方式自动生成体育比赛的解说。这个技术可以自动识别比赛中的场景，包括球员的位置和行动、球的位置和轨迹，甚至比赛的得分等等。除此之外，它还可以根据比赛的进展和结果，实时生成解说的内...

生成式AI 2023-11-10 人工智能

844阅读

华人团队获最佳论文、最佳系统论文，CoRL获奖论文出炉

自 2017 年首次举办以来，CoRL 已经成为了机器人学与机器学习交叉领域的全球顶级学术会议之一。CoRL 是面向机器人学习研究的 single-track 会议，涵盖机器人学、机器学习和控制等多个主题，包括理论与应用。 2023 年的 CoRL 大会...

人工智能 2023-11-10 人工智能

808阅读

让AI模型成为GTA五星玩家，基于视觉的可编程智能体Octopus来了

电子游戏已经成为如今现实世界的模拟舞台，展现出无限可能。以游戏《侠盗猎车手》（GTA）为例，在 GTA 的世界里，玩家可以以第一人称视角，在洛圣都(游戏虚拟城市当中经历丰富多彩的生活。然而，既然人类玩家能够在洛圣都里尽情遨游完成若干任务，我们是否也能有一...

AIGC 2023-11-10 人工智能

851阅读

GPTs翻版来了！Opengpts支持定制聊天机器人

Opengpts是一个开源项目，LangChain通过整合LangServe和LangSmith，构建了一个旨在提供与OpenAI GPTs类似体验的平台。用户可以通过选择不同的语言模型、自定义工具以及控制提示，实现对聊天机器人的更灵活控制。功能方面，L...

AIGC 2023-11-10 人工智能

847阅读

LLama 2部署教程+私有模型分发

近日，Meta发布了LLama的最新版本——LLama2，尽管其对中文的处理能力尚有待提升，但其整体表现无疑是令人瞩目的。在发布当天，我便迫切地将其下载下来进行试用，发现相比之前的版本，LLama2在多个方面都实现了显著的进步，特别是在编程能力上的提升更为...

人工智能 2023-11-10 人工智能

1929阅读

UniPAD：通用自动驾驶预训练模式！各类感知任务都可支持

本文经自动驾驶之心公众号授权转载，转载请联系出处。最近，新论文推陈出新的速度着实太快有点读不过来的感觉。可以看到的是，语言视觉多模态大模型融合已经是业界共识了，UniPad 这篇文章就比较有代表性，多模态的输入，类世界模型的预训练基座模型，同时又方便扩...

人工智能 2023-11-10 人工智能

883阅读

微软以安全问题为由短暂限制员工访问 OpenAI 的 ChatGPT

微软已向 OpenAI 投资数十亿美元。但据 CNBC 报道，在周四的一段时间内，该软件公司的员工不被允许使用该初创公司最著名的产品 ChatGPT。在内部网站上，微软发表声明称：「由于安全和数据问题，一些 AI 工具不再向员工开放使用。」CNBC 还...

AIGC 2023-11-10 人工智能

803阅读

OpenAI 寻求合作伙伴生成用于训练 AI 模型的数据集

IT之家 11 月 10 日消息，OpenAI 发文宣布，将与组织合作生成用于训练 AI 模型的公共 / 私有数据集，数据合作伙伴关系旨在“让更多组织能够帮助引导 AI 的未来”并“从更有用的模型中受益”。 IT之家从博客获悉，OpenAI 称：“为了...

大数据 2023-11-10 人工智能

862阅读

Llama大模型运行的消费级硬件要求【CPU|GPU|RAM|SSD】

大型语言模型 (LLM 是强大的工具，可以为各种任务和领域生成自然语言文本。最先进的LLM之一是 LLaMA（大型语言模型 Meta AI），这是由 Facebook 的研究部门 Meta AI 开发的一个包含 650 亿个参数的模型要在家运行 L...

人工智能 2023-11-10 人工智能

3609阅读

LoRa模型训练教程（炼丹，Stable Diffusion）

1. lora介绍（Low Rank Adaption）何为LoRA？LoRA并不是扩散模型专有的技术，而是从隔壁语言模型（LLM）迁移过来的，旨在解决避免将整个模型参数拷贝下来才能对模型进行调校的问题。因为大型语言模型的参数量过于恐怖，比如最近新出...

AIGC 2023-11-10 人工智能

1385阅读

建立自己的ChatGPT：LLama私有化部署及测试

大语言模型（LLM）现在非常流行，可惜ChatGPT等都不开源。大家没法搭建一个自己的环境来感受以下。幸好Meta开源了LLama，这是LLama的介绍： https://ai.facebook.com/blog/large-language-model...

大数据 2023-11-10 人工智能

932阅读

使用 PAI-Blade 优化 Stable Diffusion 推理流程

背景 AIGC是人工智能计算领域里发展迅速的重要业务。Stable Diffusion 是其中最热门的开源模型，受到广泛关注。然而，随着应用场景不断扩大，Stable Diffusion所面临的推理时延和计算成本问题也越来越突出。简介 PAI-Bl...

人工智能 2023-11-10 人工智能

942阅读

Windows10上使用llama-recipes(LoRA)来对llama-2-7b做fine-tune

刚刚在Windows10上搭建环境来对llama2做finetune，里面坑还是挺多的，这里把印象中的坑整理了一下以作备忘。 llama-recipes是meta的开源项目，Github地址为：GitHub - facebookresearch/llam...

大数据 2023-11-09 人工智能

889阅读