预训练模型第8页

【LLM】大语言模型学习之LLAMA 2：Open Foundation and Fine-Tuned Chat Model

大语言模型学习之LLAMA 2：Open Foundation and Fine-Tuned Chat Model 快速了解预训练预训练模型评估微调有监督微调（SFT）人...

大数据 2023-12-18 人工智能

934阅读

AIGC专题报告：ChatGPT纪要分享

今天分享的AIGC系列深度研究报告：《AIGC专题报告：ChatGPT纪要分享》。（报告出品方：久谦中台）报告共计：135页 OpenAI 高管解密 ChatGPT ¶ GPT-3 是一种大型语言模型，被训练用来在给定上下文中预测下...

人工智能 2023-12-17 人工智能

850阅读

用GPT-2监督GPT-4，防止AI毁灭人类? OpenAI Ilya超级对齐团队首篇论文出炉

就在刚刚，OpenAI首席科学家Ilya领衔的超级对齐团队，发布了成立以来的首篇论文！团队声称，已经发现了对超人类模型进行实证对齐的新研究方向。未来超级AI系统对齐的一个核心挑战——人类需要监督比自己更聪明人工智能系统。 OpenAI的最新研究做了...

大数据 2023-12-16 人工智能

811阅读

OpenAI开源超级对齐方法：用GPT-2，监督、微调GPT-4

12月15日，OpenAI在官网公布了最新研究论文和开源项目——如何用小模型监督大模型，实现更好的新型对齐方法。目前，大模型的主流对齐方法是RLHF（人类反馈强化学习）。但随着大模型朝着多模态、AGI发展，神经元变得庞大、复杂且难控制，RLHF便有点力...

生成式AI 2023-12-16 人工智能

877阅读

ChatGPT引爆AIGC，垂类龙头迎来“创新春天”

文|智能相对论作者|陈壹一款AI产品，到底有多神？ ChatGPT刷新了我们的认知。它用2个月时间，完成TikTok花9个月，Instagram花2年半才做到的事，成为史上用户增速最快破亿的...

AIGC 2023-12-16 人工智能

837阅读

重磅！苹果官方发布大模型框架：一个可以充分利用苹果统一内存的新的大模型框架MLX，你的MacBook可以一键运行LLaMA了

本文来自DataLearnerAI官方网站：重磅！苹果官方发布大模型框架：一个可以充分利用苹果统一内存的新的大模型框架MLX，你的MacBook可以一键运行LLaMA了 | 数据学习者官方网站(Datalearner https://www.datalea...

大数据 2023-12-15 人工智能

1201阅读

【AI绘画】Midjourney的使用及程序示例

Midjourney 1.背景 2.Midjourney的原理 3.Midjourney的使用方法 4.Midjourney的示例代码 1.背景 Midjourney 是一款基于深度学习的图像转换工具，其可以将一张图像转换成...

生成式AI 2023-12-15 人工智能

1456阅读

GPT-2能监督GPT-4，Ilya带头OpenAI超级对齐首篇论文来了：AI对齐AI取得实证结果

人类无法监督超级人工智能，但人工智能可以。过去一年，以「预测下一个 Token」为本质的大模型已经横扫人类世界的多项任务，展现了人工智能的巨大潜力。在近日的一次访谈中，OpenAI 首席科学家 Ilya Sutskever 大胆预言，如果模型能够很好地...

大数据 2023-12-15 人工智能

793阅读

你的工厂需要部署边缘AI吗？

随着更多的制造企业希望利用人工智能(AI 工具访问数据并实时响应，预计将不断推动边缘AI市场的增长。通过采用边缘AI技术，企业可以获得更高的性能，如实时数据处理、效率和准确性，减少工作时间，并实现更好的能源管理和性能优化。边缘AI市场预计将迎来强劲增...

生成式AI 2023-12-14 人工智能

808阅读

一张图or文字生成无限3D世界！斯坦福吴佳俊团队新作，让网友直呼“难以置信”

斯坦福吴佳俊团队打造AI版“爱丽丝梦游仙境”巨作！仅用一张图or一段文字就能沿相机轨迹生成无限连贯3D场景：只需输入一段古诗词，诗中场景立刻映入眼帘：而且还是来回式的，可以再倒回去的那种：同一起点可以进入不同场景：真实场景也可以，其中的...

大数据 2023-12-14 人工智能

781阅读

InsCode Stable Diffusion使用教程【InsCode Stable Diffusion美图活动一期】

记录一下如何使用 InsCode Stable Diffusion 进行 AI 绘图以及使用感受。一、背景介绍目前市面上比较权威，并能用于工作中的 AI 绘画软件其实就两款。一个叫 Midjourney（简称 MJ），另一个叫 Stable Di...

AIGC 2023-12-13 人工智能

1017阅读

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_pt_with_peft.py文件)—模型训练前置工作(参数解析+配置日志)→模型初始化(检测是否存在训练过的chec

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_pt_with_peft.py文件 —模型训练前置工作(参数解析+配置日志 →模型初始化(检测是否存在训练过的checkpoint+加载预训练模型和tokenizer →数据...

人工智能 2023-12-13 人工智能

731阅读

技术报告：Efficient and Effective Text Encoding for Chinese LLaMA AND Alpaca

技术报告：Efficient and Effective Text Encoding for Chinese LLaMA AND Alpaca Introduction Chinese LLaMA Chinese Alpaca Lora-Fin...

大数据 2023-12-12 人工智能

775阅读

stable-diffusion-webui 中 Controlnet 使用说明

文章目录 1. 安装自动安装手动安装 2. 启用 Controlnet 3. 配置 Controlnet 4. 预训练模型区别 5. 多 ControlNet 组合应用 6. 参数介绍 7. 版本对比 Reference...

AIGC 2023-12-12 人工智能

1913阅读

TTS算法笔记：MusicLM- Generating Music From Text（AI生成音乐）

1. 介绍摘要：介绍了一个以文本作为条件，生成高保真、长时间片的音乐音频。比如文本为“由扭曲的吉他重复段伴奏的平静的小提琴旋律”，MusicLM可以可以根据文本条件，生成24kHz采样率，分钟级别的连续音乐音频。从摘要中可以得知，这篇文章解决的根...

大数据 2023-12-12 人工智能

1019阅读

ChatGPT模型在神经学考试中表现出色，超越人类学生水平

近期发表在JAMA Network Open期刊的一项研究中，研究人员评估了两个ChatGPT大型语言模型（LLMs）在回答美国精神病学和神经学委员会问题库的问题时的表现。他们比较了这两个模型在低阶和高阶问题上的结果与人类神经学生的表现。研究发现，其中一个...

大数据 2023-12-11 人工智能

718阅读

Copilot 保姆级使用指南

大家好，我是木川一、介绍 GitHub Copilot是 GitHub和OpenAI合作开发的一个 AI 辅助编程工具官网地址：https://github.com/features/copilot 官方文档：https://do...

生成式AI 2023-12-11 人工智能

1408阅读

通义千问72B模型登顶Hugging Face开源大模型预训练模型榜首

开源大模型社区Hugging Face公布了最新的开源大模型排行榜，通义千问在预训练模型类别中脱颖而出，占据榜首位置。 Hugging Face开源大模型排行榜涵盖了全球上百个顶尖的开源大模型，并从阅读理解、逻辑推理、数学计算、事实问答等六个维度进行了全面...

AIGC 2023-12-11 人工智能

788阅读

StableDiffusion 学习笔记 - 训练 LoRA

最近一直在学习使用 Stable Diffusion，目前开始学习 LoRA 训练，试图使用 LoRA 微调预训练模型，实现脸型替换等常用功能最开始我跑去了 LoRA 的官方仓库，虽然找到了 lora_pti 工具，但是没有理解数据集的准备方式，翻...

人工智能 2023-12-11 人工智能

1231阅读

[算法前沿]--008- AIGC和LLM下的Prompt Tuning微调范式

文章目录 1. Prompt Tuning含义 1.1 解决问题 1.2 语言模型分类 1.3 Prompt-Tuning的研究进展 1.4 如何挑选合适的Pattern? 1.5 Prompt-T...

人工智能 2023-12-10 人工智能

705阅读

【原创】AIGC之ChatGPT工作原理

AIGC是什么 AIGC - AI Generated Content （AI生成内容），对应我们的过去的主要是 UGC（User Generated Content）和 PGC（Professional user Generated Content...

人工智能 2023-12-10 人工智能

805阅读

本地生成动漫风格 AI 绘画图像｜Stable Diffusion WebUI 的安装和局域网部署教程

Stable Diffusion WebUI 的安装和部署教程 1. 简介 2. 安装环境 2.1 Windows 2.2 Linux 3. 运行 4. 模型下载链接 5. 局域网部署 5.1 Windows 5.2 Linux 6....

大数据 2023-12-09 人工智能

1328阅读

更强的Llama 2开源，可直接商用：一夜之间，大模型格局变了

已上微软 Azure，即将要上 AWS、Hugging Face。一夜之间，大模型格局再次发生巨变。一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题，一直不可免费商用。今日，Meta 终于发布了大家期待...

生成式AI 2023-12-09 人工智能

823阅读

AI - AI绘画的精准控图(ControlNet)

一、介绍在上一篇《AI - stable-diffusion(AI 绘画的搭建与使用》中，介绍了 SD 的环境搭建与使用，搭配各种特色模型文件，SD 的文生图功能就可以根据我们输入的提示词（Prompt），绘制出各种各样的精美图片。但是，在深度...

人工智能 2023-12-08 人工智能

1207阅读

语言模型：GPT与HuggingFace的应用

本文分享自华为云社区《大语言模型底层原理你都知道吗？大语言模型底层架构之二GPT实现》，作者：码上开花_Lancer 。受到计算机视觉领域采用ImageNet对模型进行一次预训练，使得模型可以通过海量图像充分学习如何提取特征，然后再根据任务目标进行模型...

人工智能 2023-12-08 人工智能

857阅读

【AI绘画】Stable Diffusion的介绍及程序示例

Stable Diffusion 1.背景 2.StableD 的原理 3.StableD 的应用 3.1.如何使用 StableD 进行图像生成 3.2 图像生成与编辑 3.2.1 生成新图像 3.2.2 图像编辑 1.背...

AIGC 2023-12-08 人工智能

805阅读

DMP技术开源，可提升AI图像预测精度

Diffusion Models as Prior （DMP）是一种新的方法，它在AI生成的图像中提高了语义预测的准确性。该创新性方法巧妙地将预先训练的文本到图像模型应用于各种任务，例如3D属性估计和语义分割，在有限的训练数据下表现优于现有技术。项目地...

生成式AI 2023-12-07 人工智能

768阅读

使用 LoRA 进行 Stable Diffusion 的高效参数微调

LoRA: Low-Rank Adaptation of Large Language Models 是微软研究员引入的一项新技术，主要用于处理大模型微调的问题。目前超过数十亿以上参数的具有强能力的大模型 (例如 GPT-3 通常在为了适应其下游任...

生成式AI 2023-12-07 人工智能

1090阅读

云上使用 Stable Diffusion ，模型数据如何共享和存储

随着人工智能技术的爆发，内容生成式人工智能（AIGC）成为了当下热门领域。除了 ChatGPT 之外，文本生成图像技术更令人惊艳。 Stable Diffusion，是一款开源的深度学习模型。与 Midjourney 提供的直接将文本转化为图像的服务不同...

AIGC 2023-12-07 人工智能

739阅读

Transformer挑战者出现！斯坦福CMU联合团队，开源模型及代码，公司已创办

现在ChatGPT等大模型一大痛点：处理长文本算力消耗巨大，背后原因是Transformer架构中注意力机制的二次复杂度。 FlashAttention作者Tri Dao参与提出的新架构，成为有力挑战者，引起大量关注： Mamba（曼巴，一种蛇），在语...

生成式AI 2023-12-05 人工智能

764阅读

AI抠图使用指南：Stable Diffusion WebUI Rembg实用技巧

抠图是图像处理工具的一项必备能力，可以用在重绘、重组、更换背景等场景。最近我一直在探索 Stable Diffusion WebUI 的各项能力，那么 SD WebUI 的抠图能力表现如何呢？这篇文章就给大家分享一下。安装插件作为一个生成式AI，S...

人工智能 2023-12-05 人工智能

990阅读

【极客技术】真假GPT-4？微调 Llama 2 以替代 GPT-3.5/4 已然可行！

近日小编在使用最新版GPT-4-Turbo模型（主要特点是支持128k输入和知识库截止日期是2023年4月）时，发现不同商家提供的模型回复出现不一致的情况，尤其是模型均承认自己知识库达到2023年4月，但当我们细问时，Fake GPT4-Turbo（暂且这...

人工智能 2023-12-05 人工智能

830阅读

【慕伏白教程】Linux系统本地部署stable-diffusion-webui

本教程针对 Stable Diffusion 2.0 进行本地部署，系统环境为 Linux 注意：本教程不包含 anaconda/miniconda、python、git、cuda 的安装提示：由于国内网络原因，github...

大数据 2023-12-04 人工智能

985阅读

Stable Diffusion XL webui Linux服务器部署（保姆级教程）

文章目录 Stable Diffusion XL webui Linux服务器部署机器配置情况开始部署安装webui前准备手动克隆依赖git仓库下载SDXL-refiner-1.0预训练模型换pip源安装设置publi...

生成式AI 2023-12-04 人工智能

1254阅读

OpenAI宣布定制化GPT商店推出时间推迟至2024年初

OpenAI近期宣布，将发布定制化GPT Store（GPT商店）的时间推迟至2024年年初。据路透社援引内部备忘录的消息，OpenAI决定延迟原定于11月份首次开发者大会上介绍的定制化GPT商店推出时间。公司目前正致力于根据用户反馈不断改进GPT，这一...

大数据 2023-12-04 人工智能

770阅读

使用您自己的计算机训练 Stable Diffusion 和 Bloom (175B) 等模型

在我们最近的几篇文章中，我们一直在提到围绕大型语言和生成 AI 模型的炒作，以及如何减少推理和训练时间。随着我们的用户开始使用这些模型并对其进行微调，他们自然希望微调和部署包含数千亿参数的模型，以提高其特定用例的性能。通常，这是一项要求非常高的任务，需...

生成式AI 2023-12-04 人工智能

735阅读

手机上0.2秒出图、当前速度之最，谷歌打造超快扩散模型MobileDiffusion

在手机等移动端侧运行 Stable Diffusion 等文生图生成式 AI 大模型已经成为业界追逐的热点之一，其中生成速度是主要的制约因素。近日，来自谷歌的一篇论文「MobileDiffusion: Subsecond Text-to-Image G...

人工智能 2023-12-04 人工智能

737阅读

Stable Diffusion：使用Lora用二十张图片训了一个简易版薇尔莉特头像生成器（不作商用，纯纯个人兴趣，狗头保命）

目录一、系统环境二、数据准备及预处理三、使用Stable Diffusion获取图像信息四、安装训练图形化界面五、参数设置及训练过程六、效果测试七、常见报错处理一、系统环境同上一篇博客，云平台：CPU 1核，G...

AIGC 2023-12-03 人工智能

1216阅读

如何更好的使用Copilot

Copilot从诞生到现在过去了挺长时间了，大家对Copilot的评价算是褒贬不一吧。有些人觉得Copilot高效且神奇，可以对自己的工作大大提效；有些觉得也就那样，为什么要花那么多钱做这个事情，钱它不香吗？从最开始未收费的时候，我就有使用Copilo...

AIGC 2023-12-03 人工智能

1035阅读

AIGC时代，大模型微调如何发挥最大作用？

人工智能的快速发展推动了大模型的广泛应用，它们在语言、视觉、语音等领域的应用效果已经越来越好。但是，训练一个大模型需要巨大的计算资源和时间，为了减少这种资源的浪费，微调已经成为一种流行的技术。微调是指在预训练模型的基础上，通过在小数据集上的训练来适应新的任...

人工智能 2023-12-03 人工智能

988阅读

Linux 中的机器学习：Whisper——自动语音识别系统

Whisper 是一种自动语音识别 (ASR 系统，使用从网络收集的 680000 小时多语言和多任务数据进行训练，Whisper 由深度学习和神经网络提供支持，是一种基于 PyTorch 构建的自然语言处理系统，这是免费的开源软件。安装Whisp...

大数据 2023-12-02 人工智能

992阅读

LLMs之Colossal-LLaMA-2：Colossal-LLaMA-2的简介(基于LLaMA-2架构+中文优化+扩充词表+仅千美元成本)、安装、使用方法之详细攻略

LLMs之Colossal-LLaMA-2：Colossal-LLaMA-2的简介(基于LLaMA-2架构+中文优化+扩充词表+仅千美元成本、安装、使用方法之详细攻略导读：2023年9月25日，Colossal-AI团队推出了开源模型Colos...

AIGC 2023-12-02 人工智能

1006阅读

阿里云开源通义千问Qwen-72B、Qwen-1.8B、音频大模型Qwen-Audio

阿里云开源通义千问720亿参数模型Qwen-72B、18亿参数模型Qwen-1.8B 及音频大模型Qwen-Audio。据悉，阿里云本次开源的模型中除预训练模型外，还同步推出了对应的对话模型，面向72B、1.8B对话模型提供了4bit/8bit 量化版...

大数据 2023-12-01 人工智能

780阅读

LCM：大大加快生成高质量图像的新方法

作者丨Mike Young 译者 | 布加迪审校 | 重楼出品 | 51CTO技术栈（微信号：blog51cto）图片得益于一种名为潜在一致性模型（LCM）的新技术，文本转换成图像的AI即将迎来重大飞跃。潜在扩散模型（LDM）等传统方法在使用...

人工智能 2023-11-30 人工智能

978阅读

聊一聊大模型 | 京东云技术团队

事情还得从ChatGPT说起。 2022年12月OpenAI发布了自然语言生成模型ChatGPT，一个可以基于用户输入文本自动生成回答的人工智能体。它有着赶超人类的自然对话程度以及逆天的学识。一时间引爆了整个人工智能界，各大巨头也纷纷跟进发布了自家的大模...

生成式AI 2023-11-30 人工智能

753阅读

Llama 2 来袭 - 在 Hugging Face 上玩转它

? 宝子们可以戳阅读原文查看文中所有的外部链接哟！引言今天，Meta 发布了 Llama 2，其包含了一系列最先进的开放大语言模型，我们很高兴能够将其全面集成入 Hugging Face，并全力支持其发布。Llama 2...

生成式AI 2023-11-29 人工智能

824阅读

大模型部署实战（一）——Ziya-LLaMA-13B

❤️觉得内容不错的话，欢迎点赞收藏加关注???，后续会继续输入更多优质内容❤️ ?有问题欢迎大家加关注私戳或者评论（包括但不限于NLP算法相关，linux学习相关，读研读博相关......）? 博主原文链接：https://www.yo...

生成式AI 2023-11-29 人工智能

908阅读

Keras 3.0正式发布引入全新的大模型训练和部署功能

Keras3.0的发布标志着一次重大的更新迭代，经过5个月的努力，该版本在多个方面带来了显著的改进。首先，Keras3.0全面支持了TensorFlow、JAX和PyTorch框架，这意味着用户现在可以选择在不同框架上运行他们的Keras工作流。这种灵活性...

AIGC 2023-11-29 人工智能

792阅读

Keras 3.0一统江湖！大更新整合PyTorch、JAX，全球250万开发者在用了

刚刚，Keras 3.0正式发布！经过5个月的公开Beta测试，深度学习框架Keras 3.0终于面向所有开发者推出。全新的Keras 3对Keras代码库进行了完全重写，可以在JAX、TensorFlow和PyTorch上运行，能够解锁全新大模型训...

大数据 2023-11-29 人工智能

826阅读

GTX1660Ti 本地部署 Stable Diffusion踩坑记录

踩坑记录通过GitHub以及csdn开始安装安装Anaconda，编译器以及CUDA、Cudnn 编译器 CUDA与Cudnn安装，**涉及电脑显卡的版本配置问题** 本地部署踩坑实录常见问题 Pytorch版本问题显卡问...

人工智能 2023-11-29 人工智能

1277阅读