预训练第34页 - AIGC资讯

使用LLama和ChatGPT为多聊天后端构建微服务

微服务架构便于创建边界明确定义的灵活独立服务。这种可扩展的方法使开发人员能够在不影响整个应用程序的情况下单独维护和完善服务。然而，若要充分发挥微服务架构的潜力、特别是针对基于人工智能的聊天应用程序，需要与最新的大语言模型（LLM，比如Meta LLama ...

人工智能 2023-12-14 人工智能

960阅读

腾讯又整活！一句话让图片变动漫主角！

撰稿 | 清竹出品 | 51CTO技术栈（微信号：blog51cto） 2023年底，AI圈似乎已经被“文生视频”模型攻占了！ 11月底 AI 文生视频工具 Pika 1.0 横空出世、风头一时无两，日前斯坦福大学 AI 科学家李飞飞团队联合谷歌推...

人工智能 2023-12-13 人工智能

930阅读

邢波团队提出全开源倡议LLM360 让大模型实现真正的透明

开源模型在人工智能领域展现强大活力，但闭源策略限制了LLM（大型语言模型）的发展。邢波团队提出的LLM360全面开源倡议旨在解决这一问题。该框架明确了包括训练数据、代码、模型检查点和性能指标在内的各方面细节，为当前和未来的开源模型树立了透明度的样本。论...

生成式AI 2023-12-13 人工智能

805阅读

Hugging News #0814: Llama 2 学习资源大汇总

每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣...

生成式AI 2023-12-13 人工智能

854阅读

Stable diffusion ai图像生成本地部署教程

前言本文将用最干最简单的方式告诉你怎么将Stable Diffusion AI图像生成软件部署到你的本地环境关于Stable Diffusion的实现原理和训练微调请看我其他文章部署Stable Diffusion主要分为三个部分下载模型...

人工智能 2023-12-13 人工智能

887阅读

全方位、无死角的开源，邢波团队LLM360让大模型实现真正的透明

开源模型正展现着它们蓬勃的生命力，不仅数量激增，性能更是愈发优秀。图灵奖获得者 Yann LeCun 也发出了这样的感叹：「开源人工智能模型正走在超越专有模型的路上。」专有模型在技术性能和创新能力上展现了非凡的力量，但是它们不开源的性质成为 LLM 发...

人工智能 2023-12-13 人工智能

918阅读

用RLHF 2%的算力让LLM停止有害输出，字节提出LLM遗忘学习

随着大型语言模型（LLM）的发展，从业者面临更多挑战。如何避免 LLM 产生有害回复？如何快速删除训练数据中的版权保护内容？如何减少 LLM 幻觉（hallucinations，即错误事实）? 如何在数据政策更改后快速迭代 LLM？这些问题在人工智能法律...

人工智能 2023-12-13 人工智能

895阅读

赶上ChatGPT的车，百度文心一言和阿里通义千问上线

百度“文心一言”，地址：https://yiyan.baidu.com 阿里“通义千问”，地址：https://tongyi.aliyun.com 以下介绍来自官方：一、“文心一言”介绍：你好，我是文心一言 ERNIE Bot 作为一个人工...

人工智能 2023-12-13 人工智能

885阅读

LLaMA及其子孙模型概述

文章目录 LLaMA Alpaca Vicuna Koala Baize (白泽骆驼(Luotuo BELLE Guanaco LLaMA 与原始transformer的区别: 预归一化[GPT3]。为了提高训练稳定性，对...

大数据 2023-12-13 人工智能

1041阅读

LLM-LLaMA中文衍生模型：Chinese-LLaMA-Alpaca【扩充词表、Lora部分参数预训练、微调】

GitHub：GitHub - ymcui/Chinese-LLaMA-Alpaca: 中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese LLaMA & Alpaca LLMs 中文LLaMA模型...

人工智能 2023-12-13 人工智能

967阅读

【Video-LLaMA】增强LLM对视频内容的理解

Paper:《Video-LLaMA : An Instruction-tuned Audio-Visual Language Model for Video Understanding》 Authors: Hang Zhang, Xin Li, Lid...

生成式AI 2023-12-13 人工智能

1291阅读

基于LoRA微调部署Stable Diffusion【免费试用阿里云】

文章目录 Stable Diffusion介绍环境及资源准备过程交互式建模（PAI-DSW）的试用在创建的工作空间中创建实例 Stable Diffusion的Web-UI部署下载stable-diffusion-webui开源库...

AIGC 2023-12-13 人工智能

965阅读

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_pt_with_peft.py文件)—模型训练前置工作(参数解析+配置日志)→模型初始化(检测是否存在训练过的chec

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_pt_with_peft.py文件 —模型训练前置工作(参数解析+配置日志 →模型初始化(检测是否存在训练过的checkpoint+加载预训练模型和tokenizer →数据...

人工智能 2023-12-13 人工智能

804阅读

训练自己的Llama 2！大模型微调技术介绍

训练自己的Llama 2！大模型微调技术介绍趋动云趋动云是面向 AI 算法工程师的开发平台，为工程师提供模型开发、模型训练、数据和代码管理等功能。近期有不少粉丝问算力君，趋动云是否支持大模型的训练？当然支持！最近大火的Llama...

AIGC 2023-12-12 人工智能

1511阅读

Bard AI：训练过程中使用了多少数据？

近年来，人工智能取得了长足的进步，并在科技界掀起了波澜。随着谷歌最近推出新的人工智能聊天机器人 Bard，人们对这项技术的工作原理以及训练它的内容感到好奇。人工智能技术的关键组成部分之一是训练过程中使用的数据量，这有助于它更好地理解语言、...

人工智能 2023-12-12 人工智能

951阅读

467亿参数MoE追平GPT-3.5！爆火开源Mixtral模型细节首公开，中杯逼近GPT-4

今天，Mistral AI正式放出了Mixtral 8x7B的技术细节—— 在大多数基准测试中，Mixtral的表现不仅优于Llama 2 70B，而且推理速度提高了整整6倍！尤其是，它在大多数标准基准测试上与GPT-3.5打平，甚至略胜一筹。新开源...

AIGC 2023-12-12 人工智能

856阅读

阿里研究部门推出了专为东南亚量身定制的AI大模型SeaLLM

阿里巴巴集团旗下研究机构达摩院推出了专为东南亚语言量身定制的人工智能（AI）大语言模型(LLM ，凸显了该公司在更广泛地区发展市场的雄心。阿里巴巴研究部门表示，东南亚LLM（SeaLLM）在越南语、印度尼西亚语、泰语、马来语、高棉语、老挝语、他加禄语和缅...

AIGC 2023-12-12 人工智能

880阅读

技术报告：Efficient and Effective Text Encoding for Chinese LLaMA AND Alpaca

技术报告：Efficient and Effective Text Encoding for Chinese LLaMA AND Alpaca Introduction Chinese LLaMA Chinese Alpaca Lora-Fin...

大数据 2023-12-12 人工智能

844阅读

百度文心一言GPT免费入口也来了！！！

文心一言入口地址：文心一言能力全面开放文心一言是百度全新一代知识增强大语言模型，文心大模型家族的新成员，能够与人对话互动，回答问题，协助创作，高效便捷地帮助人们获取信息、知识和灵感。文心一言的技术特色：基于飞桨深度学习平台和文心知识增强大模型，...

人工智能 2023-12-12 人工智能

1035阅读

stable-diffusion-webui 中 Controlnet 使用说明

文章目录 1. 安装自动安装手动安装 2. 启用 Controlnet 3. 配置 Controlnet 4. 预训练模型区别 5. 多 ControlNet 组合应用 6. 参数介绍 7. 版本对比 Reference...

AIGC 2023-12-12 人工智能

2022阅读

TTS算法笔记：MusicLM- Generating Music From Text（AI生成音乐）

1. 介绍摘要：介绍了一个以文本作为条件，生成高保真、长时间片的音乐音频。比如文本为“由扭曲的吉他重复段伴奏的平静的小提琴旋律”，MusicLM可以可以根据文本条件，生成24kHz采样率，分钟级别的连续音乐音频。从摘要中可以得知，这篇文章解决的根...

大数据 2023-12-12 人工智能

1102阅读

ChatGPT模型在神经学考试中表现出色，超越人类学生水平

近期发表在JAMA Network Open期刊的一项研究中，研究人员评估了两个ChatGPT大型语言模型（LLMs）在回答美国精神病学和神经学委员会问题库的问题时的表现。他们比较了这两个模型在低阶和高阶问题上的结果与人类神经学生的表现。研究发现，其中一个...

大数据 2023-12-11 人工智能

792阅读

Copilot 保姆级使用指南

大家好，我是木川一、介绍 GitHub Copilot是 GitHub和OpenAI合作开发的一个 AI 辅助编程工具官网地址：https://github.com/features/copilot 官方文档：https://do...

生成式AI 2023-12-11 人工智能

1500阅读

【小聆送书第二期】人工智能时代AIGC重塑教育

?个人主页：聆风吟?系列专栏：网络奇遇记、数据结构?少年有梦不应止于心动，更要付诸行动。文章目录 ?正文 ?活动参与规则参与活动方式文末详见。 ?正文 AI正迅猛地改变着我们的生活。根据高盛发布的一...

大数据 2023-12-11 人工智能

996阅读

通义千问72B模型登顶Hugging Face开源大模型预训练模型榜首

开源大模型社区Hugging Face公布了最新的开源大模型排行榜，通义千问在预训练模型类别中脱颖而出，占据榜首位置。 Hugging Face开源大模型排行榜涵盖了全球上百个顶尖的开源大模型，并从阅读理解、逻辑推理、数学计算、事实问答等六个维度进行了全面...

AIGC 2023-12-11 人工智能

859阅读

【AIGC】Stable Diffusion原理快速上手，模型结构、关键组件、训练预测方式

【AIGC】Stable Diffusion的建模思想、训练预测方式快速在这篇博客中，将会用机器学习入门级描述，来介绍Stable Diffusion的关键原理。目前，网络上的使用教程非常多，本篇中不会介绍如何部署、使用或者微调SD模型。也会尽量精简...

AIGC 2023-12-11 人工智能

948阅读

StableDiffusion 学习笔记 - 训练 LoRA

最近一直在学习使用 Stable Diffusion，目前开始学习 LoRA 训练，试图使用 LoRA 微调预训练模型，实现脸型替换等常用功能最开始我跑去了 LoRA 的官方仓库，虽然找到了 lora_pti 工具，但是没有理解数据集的准备方式，翻...

人工智能 2023-12-11 人工智能

1323阅读

linux部署stable diffusion

模型地址：https://github.com/CompVis/stable-diffusion 下载代码库 git clone https://github.com/CompVis/stable-diffusion.git 2.创建虚拟环境 #...

AIGC 2023-12-11 人工智能

831阅读

却话文心一言（Chatgpt们），存算一体真能突破AI算力“存储墙”|“能耗墙”|“编译墙”？

文心一言折戟沉沙作为国内搜索引擎巨头玩家，百度在中文语料领域拥有大量的积累，在算力基础设施等层面也拥有优势。但是国产化AI芯片的处境其实很难。这不是危言耸听，也不是崇洋媚外。这不，百度文心一言初战吃瘪。...

人工智能 2023-12-10 人工智能

844阅读

HumanGaussian开源：基于Gaussian Splatting，高质量 3D 人体生成新框架

在 3D 生成领域，根据文本提示创建高质量的 3D 人体外观和几何形状对虚拟试穿、沉浸式远程呈现等应用有深远的意义。传统方法需要经历一系列人工制作的过程，如 3D 人体模型回归、绑定、蒙皮、纹理贴图和驱动等。为了自动化 3D 内容生成，此前的一些典型工作...

大数据 2023-12-10 人工智能

944阅读

0微调搞定160个测试集！最强多模态分割一切大模型来了，架构参数全开源

用多模态大模型来做语义分割，效果有多好？一张图+文字输入想分割的物体，大模型几秒钟就能识别并搞定！只需输入想分割的对象如“擎天柱”，单个目标立刻就能被精准识别、快速切割：多个物体也是手到擒来，像是指定天空、水、树、草、女孩、龙猫（Chinchil...

大数据 2023-12-10 人工智能

873阅读

[算法前沿]--008- AIGC和LLM下的Prompt Tuning微调范式

文章目录 1. Prompt Tuning含义 1.1 解决问题 1.2 语言模型分类 1.3 Prompt-Tuning的研究进展 1.4 如何挑选合适的Pattern? 1.5 Prompt-T...

人工智能 2023-12-10 人工智能

768阅读

使用Midjourney与ChatGPT组合会怎么样？

Midjourney 和 ChatGPT 都是目前比较先进的自然语言处理技术，Midjourney是一种基于深度学习的文本生成模型，而ChatGPT是一种基于自注意力机制的大规模预训练语言模型。使用Midjourney+ChatGPT可以结合两种技术的...

AIGC 2023-12-10 人工智能

757阅读

【原创】AIGC之ChatGPT工作原理

AIGC是什么 AIGC - AI Generated Content （AI生成内容），对应我们的过去的主要是 UGC（User Generated Content）和 PGC（Professional user Generated Content...

人工智能 2023-12-10 人工智能

889阅读

【评论送书】AIGC重塑教育：AI大模型驱动的教育变革与实践

作者：刘文勇来源：IT阅读排行榜本文摘编自《AIGC重塑教育：AI大模型驱动的教育变革与实践》，机械工业出版社出版这次，狼真的来了。 AI正迅猛地改变着我们的生活。根据高盛发布的一份报告，AI有可能取代3亿个全职工作岗位，影响全球18%的工作...

大数据 2023-12-10 人工智能

1121阅读

理解DALL·E 2， Stable Diffusion和 Midjourney工作原理

编者按：随着AIGC的兴起，各位小伙伴们对文生图工具DALL-E 2、Stable Diffusion和Midjourney一定并不陌生。本期IDP Inspiration，小白将和大家一同走进这三者背后的技术原理，一探究竟。以下是译文，Enj...

生成式AI 2023-12-10 人工智能

867阅读

使用Stable Diffusion进行Ai+艺术设计(以智慧灯杆为例)

目录一. 安装环境二. 配置模型 2.1 stable diffusion v1 2.2 运行并测试生成效果 Stable Diffusion 是一种以 CLIP ViT-L/14 文本编码器的（非池化）文本嵌入为条件的潜在扩散...

大数据 2023-12-10 人工智能

862阅读

LLaMA Adapter和LLaMA Adapter V2

LLaMA Adapter论文地址： https://arxiv.org/pdf/2303.16199.pdf LLaMA Adapter V2论文地址： https://arxiv.org/pdf/2304.15010.pdf LLaMA Ada...

人工智能 2023-12-10 人工智能

1082阅读

【多模态】5、BLIP | 统一理解与生成任务为图像生成更高质量的文本描述

文章目录一、背景二、方法 2.1 模型结构 2.2 Pre-training Objectives 2.3 CapFilt 三、效果 3.1 训练细节 3.2 CapFilt 的效果 3.3 样本多样性是文本合成器的关键 3.4 参数...

AIGC 2023-12-09 人工智能

2092阅读

本地生成动漫风格 AI 绘画图像｜Stable Diffusion WebUI 的安装和局域网部署教程

Stable Diffusion WebUI 的安装和部署教程 1. 简介 2. 安装环境 2.1 Windows 2.2 Linux 3. 运行 4. 模型下载链接 5. 局域网部署 5.1 Windows 5.2 Linux 6....

大数据 2023-12-09 人工智能

1411阅读

百度AI模型“文心一言”新鲜体验

今天收到通知可以体验百度的AI模型“文心一言”，等了一个多月迫不及待的去体验了一把，以下是体验的相关记录。 1、简单介绍通过文心一言官网链接https://yiyan.baidu.com/进入，看到如下界面：在文心一言的自我介绍中，作为人...

生成式AI 2023-12-09 人工智能

1258阅读

Koala：加州大学BAIR团队使用ChatGPT蒸馏数据和公开数据集微调LLaMA模型得到

自从Meta发布LLaMA以来，围绕它开发的模型与日俱增，比如Alpaca、llama.cpp、ChatLLaMA以及Vicuna等等，相关的博客可以参考如下：【Alpaca】斯坦福发布了一个由LLaMA 7B微调的模型Alpaca（羊驼），训练3小时...

大数据 2023-12-09 人工智能

1061阅读

弥合化学反应预训练和条件分子生成之间的差距，北大&望石智慧提出「统一」模型

化学反应是药物设计和有机化学研究的基础。研究界越来越需要一种能够有效捕获化学反应基本规则的大规模深度学习框架。近日，来自北京大学和望石智慧的研究团队提出了一种新方法来弥合基于反应的分子预训练和生成任务之间的差距。受有机化学机制的启发，研究人员开发了一...

大数据 2023-12-09 人工智能

845阅读

百度的文心一言是否可以打败ChatGPT？

这几天，ChatGPT在国内外各大媒体平台上引发了激烈讨论！它只用了两个月就积累了1亿用户，成为史上用户增长速度最快的消费应用。它让人工智能的概念持续活跃，国内外各大企业也跃跃欲试。这不百度正式对外官宣类ChatGPT项目——“文心一言”（英文名为ERNI...

人工智能 2023-12-09 人工智能

772阅读

AI作画，国风油画风随心定制~ Stable Diffusion模型使用，三步就上手

前言最近，AIGC（即AI Generated Content，是指利用人工智能技术来生成内容）真的是火出了天际。除了被挤到服务器满负荷的chatGPT，另一个也颇受瞩目的领域当属AI作画了。利用开源的一类“扩散（diffusion）”模型，你可...

生成式AI 2023-12-09 人工智能

1518阅读

更强的Llama 2开源，可直接商用：一夜之间，大模型格局变了

已上微软 Azure，即将要上 AWS、Hugging Face。一夜之间，大模型格局再次发生巨变。一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题，一直不可免费商用。今日，Meta 终于发布了大家期待...

生成式AI 2023-12-09 人工智能

896阅读

AI - AI绘画的精准控图(ControlNet)

一、介绍在上一篇《AI - stable-diffusion(AI 绘画的搭建与使用》中，介绍了 SD 的环境搭建与使用，搭配各种特色模型文件，SD 的文生图功能就可以根据我们输入的提示词（Prompt），绘制出各种各样的精美图片。但是，在深度...

人工智能 2023-12-08 人工智能

1309阅读

GTA6预告片播放过亿，AI三巨头也能秒变GTA匪帮

GTA 新出的游戏预告片看了吗？据说，这个预告片已经破了三项吉尼斯世界纪录，观看次数已经破亿。但如果告诉你，AI 三巨头也可以成为 GTA 里的人物，你还能认出他们吗？ AI 三巨头：Yann LeCun、Geoffrey Hinton 和 Yos...

生成式AI 2023-12-08 人工智能

940阅读

在 Mac M1 上运行 Llama 2 并进行训练

在 Mac M1 上运行 Llama 2 并进行训练 Llama 2 是由领先的人工智能研究公司 Meta （前Facebook）开发并发布的下一代大型语言模型 (LLM 。它基于 2 万亿个公共数据 token 进行了预训练，旨在帮助开发人员和...

AIGC 2023-12-08 人工智能

1165阅读

首个精通3D任务的具身通才智能体：感知、推理、规划、行动统统拿下

想要迈向通用人工智能，必须要构建一个能够理解人类生活的真实世界，并掌握丰富技能的具身通用智能体。今年以来，以 GPT-4 (V [1]、LLaVA [2]、PALM-E [3] 等为代表的多模态大语言模型（Multi-modal Large Langu...

AIGC 2023-12-08 人工智能

928阅读