预训练第40页 - AIGC资讯

快速训练自己的大语言模型：基于LLAMA-7B的lora指令微调

目录 1. 选用工程：lit-llama 2. 下载工程 3. 安装环境 4. 下载LLAMA-7B模型 5. 做模型转换 6. 初步测试 7. 为什么要进行指令微调？ 8. 开始进行指令微调 8.1. 数据准备 8.2 开始模型训练 8.3...

大数据 2023-11-11 人工智能

1007阅读

LLM：LLaMA模型和微调的Alpaca模型

LLaMA模型简单了解[LeCun狂赞：600刀GPT-3.5平替！斯坦福70亿参数「羊驼」爆火，LLaMA杀疯了] 论文原文：https://arxiv.org/abs/2302.13971v1 预训练数据模型架构模型就是用的tra...

生成式AI 2023-11-10 人工智能

907阅读

LLMs之Code：Code Llama的简介(衍生模型如Phind-CodeLlama/WizardCoder)、安装、使用方法之详细攻略

LLMs之Code：Code Llama的简介(衍生模型如Phind-CodeLlama/WizardCoder 、安装、使用方法之详细攻略导读：2023年08月25日(北京时间，Meta发布了Code Llama，一个可以使用文本提示生成...

生成式AI 2023-11-10 人工智能

2012阅读

大模型之Bloom&LLAMA----SFT(模型微调)

0. 简介随着chatgpt的爆火，最近也有很多大模型在不断地出现，比如说Bloom系列以及以LLAMA为基础的ziya和baichuan。这些模型相较于chatglm来说，更加具有发展前景，因为其是完全可商用，并可以不断迭代更新的。最近作者在跟着h...

大数据 2023-11-10 人工智能

900阅读

百度搜索深度学习模型业务及优化实践

作者 | Xin 导读百度搜索架构部模型架构组，致力于将最新的人工智能技术以更低的成本被百度数亿用户体验到。这个过程中会面临非常多的系统、工程层面的问题，甚至在深度学习模型领域，我们看到越来越多的工作并不拘泥于工程本身。本文主要分享模...

AIGC 2023-11-10 人工智能

884阅读

AI绘画火爆，到现在还只是冰山一角？AIGC掀起当代新艺术浪潮

前言： hello，大家好我是Dream。近日，各大社交平台掀起了一股“AI绘图”风潮，很多同学朋友纷纷在社交平台上晒出了属于自己的AI照片，一时间AI相关话题热度高涨。那对于AI绘画以及开启AI内容创作新时代的昆仑万维你究竟了解多少呢？那么今天我就带大家...

AIGC 2023-11-10 人工智能

980阅读

李飞飞团队新作：脑控机器人做家务，让脑机接口具备少样本学习能力

未来也许只需动动念头，就能让机器人帮你做好家务。斯坦福大学的吴佳俊和李飞飞团队近日提出的 NOIR 系统能让用户通过非侵入式脑电图装置控制机器人完成日常任务。 NOIR 能将你的脑电图信号解码为机器人技能库。它现在已能完成例如烹饪寿喜烧、熨衣服、磨奶酪、...

AIGC 2023-11-10 人工智能

953阅读

如何为制造业和自动化应用选择人工智能技术

在工业自动化领域的生产和实验室之外的日常生活中，人工智能(AI 的定义差异很大。 “人工智能”指的是一门包含了几种不同技术和工程学科的科学，包括机器视觉、计算机视觉、机器学习和深度学习。当一个基于这些技术组合的系统设计得当时（从应用分析到最终验证），它...

生成式AI 2023-11-10 人工智能

883阅读

UniPAD：通用自动驾驶预训练模式！各类感知任务都可支持

本文经自动驾驶之心公众号授权转载，转载请联系出处。最近，新论文推陈出新的速度着实太快有点读不过来的感觉。可以看到的是，语言视觉多模态大模型融合已经是业界共识了，UniPad 这篇文章就比较有代表性，多模态的输入，类世界模型的预训练基座模型，同时又方便扩...

人工智能 2023-11-10 人工智能

890阅读

文心一言：中国版“ChatGPT”测评

?导读：本文主要介绍chatgpt概念及相关产品，重点介绍文心一言，通过对比Chatgpt、新必应及文心一言进行测评，对比仅挑选几个例子，主要展示文心一言在各方面的能力，大家感兴趣可以去官网申请等待，欢迎关注！一、ChatGPT简介 Chat...

生成式AI 2023-11-10 人工智能

959阅读

使用 PAI-Blade 优化 Stable Diffusion 推理流程

背景 AIGC是人工智能计算领域里发展迅速的重要业务。Stable Diffusion 是其中最热门的开源模型，受到广泛关注。然而，随着应用场景不断扩大，Stable Diffusion所面临的推理时延和计算成本问题也越来越突出。简介 PAI-Bl...

人工智能 2023-11-10 人工智能

954阅读

【AIGC】1、爆火的 AIGC 到底是什么 | 全面介绍

文章目录一、AIGC 的简要介绍二、AIGC 的发展历程三、AIGC 的基石 3.1 基本模型 3.2 基于人类反馈的强化学习 3.3 算力支持四、生成式 AI（Generative AI） 4.1 单模态 4.1.1 生成式语...

AIGC 2023-11-09 人工智能

1307阅读

【原创】用 VisualGLM 进行AIGC多模识别和内容生成

最近几个月，整个AI行业的LLM（大语言模型）蓬勃发展，除了过去传统的纯文字的多模态能力的视觉语言模型，如 GPT-4，ImageBind等表现令人印象深刻。 ChatGLM-6B是中文用户使用非常舒服的一个开源中文LLM。2023年5月17日，智谱...

人工智能 2023-11-09 人工智能

1035阅读

开启想象翅膀：轻松实现文本生成模型的创作应用，支持LLaMA、ChatGLM、UDA、GPT2、Seq2Seq、BART、T5、SongNet等模型，开箱即用

开启想象翅膀：轻松实现文本生成模型的创作应用，支持LLaMA、ChatGLM、UDA、GPT2、Seq2Seq、BART、T5、SongNet等模型，开箱即用 TextGen: Implementation of Text Generation...

生成式AI 2023-11-09 人工智能

861阅读

大模型走捷径「刷榜」？数据污染问题值得重视

生成式 AI 元年，大家的工作节奏快了一大截。特别是，今年大家都在努力卷大模型：最近国内外科技巨头、创业公司都在轮番推出大模型，发布会一开，个个都是重大突破，每一家都是刷新了重要 Benchmark 榜单，要么排第一，要么第一梯队。在兴奋于技术进展速...

AIGC 2023-11-09 人工智能

805阅读

用语言对齐多模态信息，北大腾讯等提出LanguageBind，刷新多个榜单

在现代社会，信息传递和交流不再局限于单一模态。我们生活在一个多模态的世界里，声音、视频、文字和深度图等模态信息相互交织，共同构成了我们丰富的感知体验。这种多模态的信息交互不仅存在于人类社会的沟通中，同样也是机器理解世界所必须面对的挑战。如何让机器像人类...

人工智能 2023-11-09 人工智能

903阅读

谨防大模型基准评估陷阱！测试集乱入预训练，模型变傻

最新研究警告，大型模型在基准评估中可能面临潜在危害，原因是测试集中的数据可能意外进入预训练过程。这项研究由中国人民大学信息学院、高瓴人工智能学院和伊利诺伊大学厄巴纳-香槟分校的学者联合进行。研究发现，由于预训练语料包含大量公开文本，而评估基准建立在这些信...

大数据 2023-11-09 人工智能

871阅读

来聊聊近期火爆的几个大模型和自动驾驶概念

本文经自动驾驶之心公众号授权转载，转载请联系出处。近期大模型各种应用依然火爆，10月初前后出现了一系列颇有噱头的文章，试图把大模型应用于自动驾驶。和很多朋友最近也聊了很多相关的话题，写这篇文章，一方面是发现其实包括我在内，在过去其实都混淆了一些很相关...

生成式AI 2023-11-09 人工智能

832阅读

谷歌新论文称“AI即将超越人类”还不现实，其有自身局限性

11月8日消息，三名谷歌研究人员在最新提交给预印本文献库(ArXiv 的一篇论文中指出，人工智能领域的底层技术深度神经网络transformer并不擅长归纳概括。 Transformer是ChatGPT等人工智能工具背后大语言模型的基础。在11月1日提...

AIGC 2023-11-09 人工智能

872阅读

万字长文：Stable Diffusion 保姆级教程

万字长文：Stable Diffusion 保姆级教程 2022年绝对是人工智能爆发的元年，前有 stability.ai 开源 Stable Diffusion 模型，后有 Open AI 发布 ChatGPT，二者都是里程碑式的节点事件，其重要性不...

AIGC 2023-11-09 人工智能

1795阅读

2023年初学者入门 CV 指南概述

计算机视觉，是一个迅速发展的领域，将让你大开眼界。它的核心是教计算机像我们人类一样看和理解视觉信息。这份全面指南，将为我们揭示计算机视觉的基本概念，探索流行的应用程序，并瞥见计算机视觉的未来趋势。计算机视觉简介：科学和艺术的奇妙交汇好的，让我们...

大数据 2023-11-09 人工智能

856阅读

上海大模型发展11条：支持大模型人才落户

上海市经信委发布了《上海市推动人工智能大模型创新发展若干措施（2023-2025年）》，旨在推动大规模预训练模型(大模型的创新发展。措施提出了以下主要内容:支持大模型创新能力，包括实施大模型创新扶持计划和建立大模型测试评估中心;提升创新要素供给能级，包...

生成式AI 2023-11-08 人工智能

893阅读

AIGC专栏7——EasyPhoto 人像训练与生成原理详解

AIGC专栏7——EasyPhoto 人像训练与生成原理详解学习前言源码下载地址为什么是Lora EasyPhoto的训练流程 1、数据的预处理 a、人像排序 i、人脸特征向量提取过程 ii、人脸偏移角度计算 iii、人像排序 b...

AIGC 2023-11-08 人工智能

1128阅读

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM-2/LLaMA-2/Baichuan等】的高效工具【预训练+指令监督微

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM-2/LLaMA-2/Baichuan等】的高效工具【预训练+指令监督微调+奖励模型训练+PPO 训练+DPO 训练】的简介、...

人工智能 2023-11-08 人工智能

1161阅读

超强满血不收费的AI绘图教程来了（在线Stable Diffusion一键即用）

超强满血不收费的AI绘图教程来了（在线Stable Diffusion一键即用）一、简介 1.1 AI绘图 1.2 Stable Diffusion 1.2.1 原理简述 1.2.2 应用流程二、AI绘图工具 2.1 吐司Tusi...

人工智能 2023-11-08 人工智能

950阅读

知识图谱与大模型相结合的3种方法，1+1>2

本文分享自华为云社区《知识图谱与大模型结合方法概述》，作者： DevAI 。《Unifying Large Language Models and Knowledge Graphs: A Roadmap》总结了大语言模型和知识图谱融合的三种路线：1）K...

生成式AI 2023-11-08 人工智能

908阅读

深度解析 Llama 2 的资源汇总：不容错过

“ 探索 Llama 2 背后的过程，包括了模型的全面解析，在线体验，微调，部署等，这份资源汇总将带您深入了解其内涵。” 01 — 周二发布了文章《中文大模型 Chinese-LLaMA-Alpaca-2 开源且可以商用》后，不少朋...

人工智能 2023-11-08 人工智能

1017阅读

从科幻走向现实，LLM Agent 做到哪一步了？

LLM 洪流滚滚，AI 浪潮席卷全球，在这不断冲击行业认知的一年中，Agent 以冉冉新星之态引起开发者侧目。OpenAI 科学家 Andrej Karpathy 曾言“OpenAI 在大模型领域快人一步，但在 Agent 领域，却是和大家处在同一起跑线上...

AIGC 2023-11-08 人工智能

972阅读

万字长文解读Stable Diffusion的核心插件—ControlNet

目录一、介绍二、使用方法三、ControlNet结构 1.整体结构 2.ControlLDM 3.Timestep Embedding 4.HintBlock 5.ResBlock 6.SpatialTransformer 7.S...

人工智能 2023-11-08 人工智能

2101阅读

带你认识一下多模态对比语言图像预训练CLIP

本文分享自华为云社区《多模态对比语言图像预训练CLIP：打破语言与视觉的界限》，作者：汀丶。一种基于多模态（图像、文本）对比训练的神经网络。它可以在给定图像的情况下，使用自然语言来预测最相关的文本片段，而无需为特定任务进行优化。CLIP的设计类似于GP...

生成式AI 2023-11-08 人工智能

890阅读

MoE：LLM终身学习的可能性

性质说明知识记忆（knowledge retention） √ LLM预训练后，具备世界知识，小规模finetune不易对LLM造成遗忘灾难。但大规模数据续训会造成。前向迁移（forward...

大数据 2023-11-08 人工智能

958阅读

从概念到现实：ChatGPT 和 Midjourney 的设计之旅

? 个人网站:【工具大全】【游戏大全】【神级源码资源网】 ? 前端学习课程：?【28个案例趣学前端】【400个JS面试题】 ? 寻找学习交流、摸鱼划水的小伙伴，请点击【摸鱼学习交流群】在现代技术的世界中，人工智能（AI）正迅速演化，并对我们的生活产...

大数据 2023-11-08 人工智能

817阅读

马毅、沈向洋联手，首届CPAL开奖！16人获新星奖，华人学者占据半壁江山

就在昨天，首届CPAL简约学术会议，正式公布了新星奖获奖者名单！ CPAL专注于解决机器学习、信号处理、优化等领域中普遍存在的简约、低维结构问题，并探索低维结构在智能硬件与系统、交叉科学和工程等新兴方向的应用。创办这个会议的出发点，就是将其设计为一个...

人工智能 2023-11-07 人工智能

861阅读

GPT-4完成正确率仅6%！北大等提出首个「多轮、多模态」PPT任务完成基准PPTC

【新智元导读】为了填补LLM在复杂多模态环境中利用复杂工具完成多轮、多模态指令的评估空白，研究人员引入了PowerPoint任务完成（PPTC）基准测试，以评估LLM创建和编辑PPT文档的能力。最近对大型语言模型（例如ChatGPT和GPT-4）进行的评...

人工智能 2023-11-07 人工智能

911阅读

GPT-4重磅升级！OpenAI发布GPT-4 Turbo：更强大还更便宜

快科技11月7日消息，当地时间周一，OpenAI首届开发者大会如期召开，在大会上OpenAI正式推出了GPT-4 Turbo。据OpenAI介绍，相比于GPT-4，GPT-4 Turbo主要有6方面的提升：第一，上下文对话长度，GPT4最大只能支持8k...

人工智能 2023-11-07 人工智能

889阅读

让大模型自主探索开放世界，北大&智源提出训练框架LLaMA-Rider

大语言模型因其强大而通用的语言生成、理解能力，展现出了成为通用智能体的潜力。与此同时，在开放式的环境中探索、学习则是通用智能体的重要能力之一。因此，大语言模型如何适配开放世界是一个重要的研究问题。北京大学和北京智源人工智能研究院的团队针对这个问题提出了...

人工智能 2023-11-07 人工智能

1246阅读

强化学习与多任务推荐

一、短视频推荐两阶段约束强化学习算法首先介绍的一项快手自研的 WWW 2023 Research Track 工作，主要解决短视频推荐场景下的带约束多目标优化问题。在短视频推荐单列场景中，用户通过上下滑形式和系统进行交互，观看多个视频。用户对每个...

人工智能 2023-11-07 人工智能

1100阅读

AI视野：xAI首个大模型Grok炸场;李开复官宣开源大模型Yi-34B;ChatGPT原型Gizmo新功能曝光;百度网盘引入大模型智能助理

????大模型动态李开复官宣全球最强开源大模型Yi-34B 一次可处理40万汉字零一万物发布全球最强的开源大模型Yi-34B，具备超强的语言理解和处理能力，支持处理40万汉字，在中文指标上表现卓越，标志着中国在大模型领域的重大突破。项目地址:htt...

AIGC 2023-11-06 人工智能

939阅读

大型语言模型（LLM）技术精要，不看亏了

哈喽，大家好。今天分享一篇知乎高赞文章，作者是张俊林老师。图片读完收获很多，能帮大家更好地理解、学习大模型。原文有2.8w字，我提炼了核心要点，阅读需要10min。 ChatGPT的出现给很多人带来了惊喜和醒悟。有人惊喜地发现大型语言模型（LLM）...

AIGC 2023-11-06 人工智能

976阅读

李开复领队开源大模型 Yi，40万字上下文窗口破纪录

由李开复博士亲自下场创办的零一万物（01.ai），自3月底官宣成立后，于近日发布并开源了两个版本的中英文大模型 Yi-6B 和 Yi-34B。在线上发布环节，李开复博士重点介绍了 Yi 系列大模型的三处性能亮点: 全球最长200K 上下文窗口，免费开...

AIGC 2023-11-06 人工智能

992阅读

李开复带队创办！零一万物发布首款大模型Yi：号称世界最强

快科技11月6日消息，近日，创新工场董事长兼CEO李开复带队创办的AI大模型创业公司零一万物宣布，正式发布首款研发的最强开源人工智能大模型系列Yi。此次发布的首个公开版本共包括两款:Yi-6B和Yi-34B，其数据参数量分别为60亿和340亿，...

人工智能 2023-11-06 人工智能

848阅读

谷歌DeepMind力证：GPT-4终局是人类智慧总和！Transformer模型无法超越训练数据进行泛化

Transformer模型是否能够超越预训练数据范围，泛化出新的认知和能力，一直是学界争议已久的问题。最近谷歌DeepMind的3位研究研究人员认为，要求模型在超出预训练数据范围之外泛化出解决新问题的能力，几乎是不可能的。 LLM的终局就是人类智慧总和...

AIGC 2023-11-06 人工智能

795阅读

北大具身智能新成果：无需训练，听指令就能灵活走位

北京大学董豪团队具身导航最新成果来了：无需额外建图和训练，只需说出导航指令，如： Walk forward across the room and walk through the panty followed by the kitchen. Stan...

人工智能 2023-11-06 人工智能

921阅读

Together AI发布RedPajama v2：包内30万亿token数据集，用于训练大型语言模型

Together AI最近发布了RedPajama v2，这是一个庞大的在线数据集，包含了30万亿token，成为目前公开可用的最大数据集之一，专门用于学习型机器学习系统的培训。对于像Llama、Mistral、Falcon、MPT和RedPajama等...

人工智能 2023-11-06 人工智能

969阅读

李开复称其创立的AI公司零一万物估值已超10亿美元发布大模型Yi-34B

此前，李开复成立了一家初创公司，名为零一万物（01.AI），旨在为中国市场开发本土大型语言模型（LLM）。日前，李开复在接受采访时解释了创建零一万物的动机:“我认为需求是创新之母，在中国显然存在巨大的需求。与世界其他地方不同，中国无法使用OpenAI和Go...

AIGC 2023-11-06 人工智能

869阅读

ChatGPT新功能曝光！OpenAI首届开发者大会抢先看

OpenAI将于太平洋时间11月6日早上10点举办首届全球开发者大会（大约北京时间11月7日凌晨2点），与来自世界各地的开发者、企业、技术合作伙伴，分享OpenAI最新产品和技术趋势。由于OpenAI的金字招牌太响，已经有不少人迫不及待地曝光其开发者大会...

人工智能 2023-11-06 人工智能

907阅读

一篇学会大模型浪潮下的时间序列预测

今天跟大家聊一聊大模型在时间序列预测中的应用。随着大模型在NLP领域的发展，越来越多的工作尝试将大模型应用到时间序列预测领域中。这篇文章介绍了大模型应用到时间序列预测的主要方法，并汇总了近期相关的一些工作，帮助大家理解大模型时代时间序列预测的研究方法。...

人工智能 2023-11-06 人工智能

879阅读

字节“开盒”OpenAI所有大模型，揭秘GPT-3到GPT-4进化路径！把李沐都炸出来了

GPT-3究竟是如何进化到GPT-4的？字节给OpenAI所有大模型来了个“开盒”操作。结果还真摸清了GPT-4进化路上一些关键技术的具体作用和影响。比如： SFT是早期GPT进化的推动者帮助GPT提升编码能力的最大功臣是SFT和RLHF 在...

AIGC 2023-11-05 人工智能

843阅读

AI生图太诡异？马里兰&NYU合力解剖神经网络，CLIP模型神经元形似骷髅头

AI黑盒如何才能解？神经网络模型在训练的时，会有些ReLU节点「死亡」，也就是永远输出0，不再有用。它们往往会被被删除或者忽略。恰好赶上了模糊了生与死的界限的节日——万圣节，所以这是探索那些「死节点」的好时机。对于大多数图像生成模型来说，会输出正...

人工智能 2023-11-03 人工智能

887阅读

Gen-2颠覆AI生成视频！一句话秒出4K高清大片，网友：彻底改变游戏规则

这，绝对称得上是生成式AI进程中的里程碑。就在深夜，Runway家标志性的AI视频生成工具Gen-2，迎来了“iPhone时刻”般的史诗级更新—— 依旧是简单一句话输入，不过这一次，视频效果一口气拉到了4K超逼真的高度！话不多说，我们直接来看炸裂的效...

AIGC 2023-11-03 人工智能

902阅读