训练数据集第4页

PAI-ChatLearn ：灵活易用、大规模 RLHF 高效训练框架（阿里云最新实践）

PAI-ChatLearn 是阿里云机器学习平台 PAI 团队自主研发的，灵活易用、大规模模型 RLHF 高效训练框架，支持大模型进行 SFT（有监督指令微调）、RM（奖励模型）、RLHF（基于人类反馈的强化学习）完整训练流程。PAI-ChatLear...

人工智能 2024-01-30 人工智能

1340阅读

使用Transformer 模型进行时间序列预测的Pytorch代码示例

时间序列预测是一个经久不衰的主题，受自然语言处理领域的成功启发，transformer模型也在时间序列预测有了很大的发展。本文可以作为学习使用Transformer 模型的时间序列预测的一个起点。数据集这里我们直接使用kaggle中的 Store...

人工智能 2024-01-30 人工智能

1031阅读

CMU华人18万打造高能机器人，完爆斯坦福炒虾机器人！全自主操作，1小时学会开12种门

比斯坦福炒虾机器人还厉害的机器人来了！最近，CMU的研究者只花费2.5万美元，就打造出一个在开放世界中可以自适应移动操作铰接对象的机器人。论文地址：https://arxiv.org/abs/2401.14403 厉害之处就在于，它是完全自主完成操作...

大数据 2024-01-29 人工智能

916阅读

谷歌AI研究提出 SpatialVLM：一种数据合成和预训练机制，以增强视觉语言模型 VLM 空间推理能力

谷歌AI研究团队最近提出了SpatialVLM，这是一种旨在增强视觉语言模型（VLMs）空间推理能力的创新系统。尽管先进的模型如GPT-4V在人工智能驱动任务中取得了显著进展，但它们在空间推理方面仍存在显著局限。空间推理涉及理解物体在三维空间中的位置以及...

生成式AI 2024-01-29 人工智能

1031阅读

谷歌云与Hugging Face签署人工智能基础设施合作协议

谷歌公司（Google LLC）云计算部门今天宣布与Hugging Face公司建立新的合作伙伴关系，后者是一个流行的共享开源人工智能模型平台运营商。根据协议，谷歌云将成为Hugging Face人工智能训练和推理工作负载的 “首选目的地”。此外，两...

AIGC 2024-01-29 人工智能

901阅读

# ext-to-speech|tts|voice-cloning|AIGC|多模态#【有图文部署】GPT-SoVits：上线一周就获得了4.1k star！效果炸裂的开源跨语言音色克隆模型！

一周前，RVC变声器创始人（GitHub昵称：RVC-Boss）发布了一款新项目，名为GPT-SoVITS。这个项目一上线就受到了互联网大佬和博主的好评推荐，仅仅在不到一周的时间里，就已经在GitHub上积累了4.1k Star。据说，该项目是RVC-...

大数据 2024-01-29 人工智能

3219阅读

AIGC：文生图模型Stable Diffusion

1 Stable Diffusion介绍 Stable Diffusion 是由CompVis、Stability AI和LAION共同开发的一个文本转图像模型，它通过LAION-5B子集大量的 512x512 图文模型进行训练，我们只要简单的输入一段文...

生成式AI 2024-01-26 人工智能

1017阅读

AIGC内容分享(三十五)：AIGC赋能的“秒鸭相机”到底有多强？

目录 01-FaceChain算法简介 02-FaceChain-FACT算法简介 03-FaceChain算法流程 04-FaceChain-FACT算法流程 05-FaceChain算法应用场景 06-FaceChain环境搭建与运...

AIGC 2024-01-25 人工智能

882阅读

大模型推理速度飙升3.6倍，「美杜莎」论文来了，贾扬清：最优雅加速推理方案之一

如你我所知，在大型语言模型（LLM）的运行逻辑中，随着规模大小的增加，语言生成的质量会随着提高。不过，这也导致了推理延迟的增加，从而对实际应用构成了重大挑战。从系统角度来看，LLM 推理主要受内存限制，主要延迟瓶颈源于加速器的内存带宽而非算术计算。这一...

人工智能 2024-01-24 人工智能

854阅读

AI对比：ChatGPT和文心一言的区别和差异

目录一、ChatGPT和文心一言大模型的对比分析 1.1 二者训练的数据情况分析 1.2 训练大模型数据规模和参数对比 1.3 二者3.5版本大模型对比总结二、ChatGPT和文心一言功能对比分析 2.1 二者产品提供的功能情况分析...

大数据 2024-01-24 人工智能

2404阅读

迈向分割的大一统！OMG-Seg：一个模型搞定所有分割任务

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者个人思考图像分割已经从单任务分割走到了语义分割、实例分割、全景分割三种分割任务的统一；大模型以及多模态的发展又带来了文本和图像统一，使得跨模态端到端成为可能；追求更高级、更全面...

生成式AI 2024-01-24 人工智能

1175阅读

Llama 2- Open Foundation and Fine-Tuned Chat Models＜3＞

3.4 RLHF 结果 3.4.1 基于模型的评估评估LLMs是一个具有挑战性的开放研究问题。人类评估虽然是黄金标准，但可能会因各种 HCI 考虑因素而变得复杂（Clark 等人，2021；Gehrmann 等人，2023），并且并不总是可扩展的...

生成式AI 2024-01-23 人工智能

1021阅读

2024 年值得关注的 6 大生成式 AI 趋势

2023年是人工智能领域长期以来最具颠覆性的一年，大量生成式人工智能产品进入主流。继续其变革之旅，生成式人工智能有望在2024年从兴奋的话题转变为现实世界的应用。随着科技公司不断开发和微调人工智能模型，生成式人工智能领域正在迅速发展，催生了一系列广泛的趋...

AIGC 2024-01-23 人工智能

1093阅读

消灭「幻觉」！谷歌全新ASPIRE方法让LLM给自己打分，效果碾压10x体量模型

大模型的「幻觉」问题马上要有解了？威斯康星麦迪逊大学和谷歌的研究人员最近开发了一个名为ASPIRE的系统，可以让大模型对自己的输出给出评分。如果用户看到模型的生成的结果评分不高，就能意识到这个回复可能是幻觉。如果系统可以进一步筛选评分的结果进行输...

人工智能 2024-01-23 人工智能

897阅读

可令 AI 自我判断输出内容正确性，谷歌公布模型训练框架 ASPIRE

IT之家 1 月 23 日消息，谷歌日前发布新闻稿，介绍了一款专为大语言模型设计的 ASPIRE 训练框架，该框架号称可以增强 AI 模型的选择性预测能力。谷歌提到，当下大语言模型在自然语言理解和生成内容方面发展迅速，已被用于构建各种创新应用，但要...

AIGC 2024-01-23 人工智能

863阅读

扩散模型 - Stable Diffusion

4 Stable Diffusion Stable Diffusion 是由 Stability AI 开发的开源扩散模型。Stable Diffusion 可以完成多模态任务，包括：文字生成图像（text2img）、图像生成图像（img2img）...

人工智能 2024-01-23 人工智能

1043阅读

数据猿预测：2024年大模型、AIGC的十个“小趋势”

大数据产业创新服务媒体 ——聚焦数据 · 改变商业随着2024年的到来，我们站在了人工智能发展的新十字路口，大模型技术不仅突破了以往的限制，更开启了未来可能性的新篇章。在这个关键时刻，我们预见到了一系列颠覆性的发展趋势，它们不...

AIGC 2024-01-23 人工智能

967阅读

人工智能实战：Stable Diffusion技术分享

背景 Stable Diffusion是计算机图形学和可视化领域中的一项重要技术。在这篇分享中，我们将深入探讨稳定扩散的原理、关键要素和实施步骤，通过了解Stable Diffusion的流程化，我们可以提升自身的设计能力和创造力，为公司和个...

生成式AI 2024-01-23 人工智能

1097阅读

aigc分享

AIGC技术分享 AIGC概述 AIGC的概念、应用场景和发展历程 https://36kr.com/p/2135547607286144 ppt https://36kr.com/p/2243237713604482 机器学习基础机器学...

人工智能 2024-01-22 人工智能

941阅读

ChatGPT和文心一言哪个更好用？

ChatGPT和文心一言都是基于深度学习技术的自然语言处理模型，它们各自具有优势和局限性，需要根据具体需求进行选择。以下是两者的比较：算力：ChatGPT由OpenAI开发，具有强大的文本生成能力和语言理解能力，其训练数据集规模和模型规模都非常大，...

人工智能 2024-01-21 人工智能

1286阅读

LLaMA模型泄露 Meta成最大受益者

一份被意外泄露的谷歌内部文件，将Meta的LLaMA大模型“非故意开源”事件再次推到大众面前。“泄密文件”的作者据悉是谷歌内部的一位研究员，他大胆指出，开源力量正在填平OpenAI与谷歌等大模型巨头们数年来筑起的护城河，而最大的受益者是Meta，因为该公司...

人工智能 2024-01-20 人工智能

795阅读

用通俗易懂的方式讲解大模型：一个强大的 LLM 微调工具 LLaMA Factory

LLM（大语言模型）微调一直都是老大难问题，不仅因为微调需要大量的计算资源，而且微调的方法也很多，要去尝试每种方法的效果，需要安装大量的第三方库和依赖，甚至要接入一些框架，可能在还没开始微调就已经因为环境配置而放弃了。今天我们来介绍一个可以帮助大家快速...

生成式AI 2024-01-20 人工智能

2515阅读

stable-diffusion打造自己的lora模型（使用lora-scripts）

1、训练图片收集比如要训练一个自己头像的模型，就可以拍一些自己的照片（20-50张，最少15张），要求画质清晰，脸部轮廓清楚，背景较为简单的照片。 2、使用stable_diffusion的预处理功能进行图片的预处理这里可以根据自己的情况设置...

人工智能 2024-01-20 人工智能

1434阅读

ChatGPT 和文心一言哪个更好用？

ChatGPT 和文心一言哪个更好用？一：ChatGPT 更长的上下文：ChatGPT 可以处理更长的对话上下文。以前的模型限制了对话历史的长度，可能导致回答不完整或不连贯。ChatGPT 增加了对更长对话历史的理解能力，从而更好地回应前...

大数据 2024-01-20 人工智能

968阅读

AIGC系列之：ControlNet原理及论文解读

《Adding Conditional Control to Text-to-Image Diffusion Models》目录 1.背景介绍 2.原理详解 2.1 Controlnet 2.2 用于Stable Diffusion的Contr...

人工智能 2024-01-18 人工智能

1474阅读

奥数能力金牌级：DeepMind几何推理模型登上Nature，代码开源，菲尔兹奖得主点赞

这一次，人工智能算法在数学奥林匹克竞赛（IMO）上取得了重大成绩突破。在今天发表的国际权威期刊《自然》杂志最新一期上，论文《Solving olympiad geometry without human demonstrations》向世人介绍了 A...

大数据 2024-01-18 人工智能

814阅读

谷歌推几何AI系统AlphaGeometry，实力达奥林匹克金牌得主

Google DeepMind 发布了一个名为AlphaGeometry 的人工智能系统，它可以解决复杂的几何问题，其水平接近人类奥林匹克金牌得主——这是人工智能性能的突破。在对30道奥数几何题的基准测试中，AlphaGeometry 在标准奥数时限内解决...

生成式AI 2024-01-18 人工智能

858阅读

GPT-SoVITS体验入口地址 AI语音克隆软件分享

GPT-SoVITS是一个强大的语音转换软件。该产品具有零样本TTS、少样本TTS、跨语言支持和WebUI工具等功能，可用于语音转换、语音合成、语音处理等场景。GPT-SoVITS的体验下载入口在哪呢，这里我们来看GPT-SoVITS的官方体验入口。 &...

大数据 2024-01-18 人工智能

2107阅读

GPT-SoVITS体验入口 AI声音克隆工具软件免费下载地址

GPT-SoVITS-WebUI是一个强大的零样本语音转换和文本到语音WebUI工具。它提供了零样本TTS、少样本TTS、跨语言支持等功能，并且支持英语、日语和中文。GPT-SoVITS-WebUI提供了一系列集成工具，包括语音伴奏分离、自动训练集分割、中...

AIGC 2024-01-18 人工智能

2772阅读

一文读懂大型语言模型参数高效微调：Prefix Tuning与LLaMA-Adapter

芝士AI吃鱼在快速发展的人工智能领域中，高效、有效地使用大型语言模型变得日益重要，参数高效微调是这一追求的前沿技术，它允许研究人员和实践者在最小化计算和资源占用的同时，重复使用预训练模型。这还使我们能够在更广泛的硬件范围内训练...

AIGC 2024-01-18 人工智能

1228阅读

大模型“藏毒”：“后门”触发，猝不及防！

撰稿 | 言征出品 | 51CTO技术栈（微信号：blog51cto）跟大模型会产生幻觉相比，更可怕的事情来了，最新的一项研究证明：在用户不知情的情况下，最初觉得很得力的大模型助手，将化身“间谍”，产生破坏性代码。具体来讲，一组研究人员对LL...

人工智能 2024-01-17 人工智能

857阅读

【论文笔记 · PFM】Lag-Llama: Towards Foundation Models for Time Series Forecasting

Lag-Llama: Towards Foundation Models for Time Series Forecasting 摘要本文提出Lag-Llama，在大量时间序列数据上训练的通用单变量概率时间序列预测模型。模型在分布外泛化能力上取...

生成式AI 2024-01-17 人工智能

1189阅读

【AIGC】Controlnet:基于扩散模型的文生图的可控性

前言 controlnet可以让stable diffusion的生图变得可控。文章连接：https://arxiv.org/pdf/2302.05543.pdf 摘要冻结了stable diffusion的预训练模型并重用它的预训练...

AIGC 2024-01-17 人工智能

1311阅读

Stability AI发布Stable Code 3B模型，没有GPU也能本地运行

在文生图领域大火的 Stability AI，今天宣布了其 2024 年的第一个新 AI 模型：Stable Code 3B。顾名思义，Stable Code 3B 是一个拥有 30 亿参数的模型，专注于辅助代码任务。无需专用 GPU 即可在笔记本电...

大数据 2024-01-17 人工智能

835阅读

五种资源类别，如何提高大语言模型的资源效率，超详细综述来了

近年来，大型语言模型（LLM）如 OpenAI 的 GPT-3 在人工智能领域取得了显著进展。这些模型，具有庞大的参数量（例如 1750 亿个参数），在复杂度和能力上实现了飞跃。随着 LLM 的发展趋势朝着不断增大的模型规模前进，这些模型在从智能聊天机器...

大数据 2024-01-15 人工智能

1181阅读

AI绘画权益纠纷：你的创作是否触碰了版权底线？

最近，北京互联网法院就一起人工智能生成图片（AI绘画图片）的著作权侵权案进行了首次审理并做出了判决。这是中国首例牵涉到“AI文生图”著作权的案件，庭审过程在多个平台进行直播，吸引了众多网友，同时引发了对于AI生成内容与著作权之间关系的广泛讨论。那么近年...

生成式AI 2024-01-15 人工智能

988阅读

AI看图猜位置，准确率超90%！斯坦福最新PIGEON模型：40%预测误差不到25公里

随手在网络上发布的一张照片，能暴露多少信息？外国的一位博主@rainbolt就长年接受这种「照片游戏」的挑战，网友提供照片，他来猜测照片的具体拍摄地，有些照片甚至还能猜到具体的航班细节。是不是细思极恐？但「照片挑战」也同样抚慰了很多人心中的遗憾，...

生成式AI 2024-01-15 人工智能

1012阅读

一文读懂 LLM 可观测性

Hello folks，我是 Luga，今天我们继续来聊一下人工智能(AI 生态领域相关的技术 - LLM (大型语言模型可观测性，本文将继续聚焦在针对 LLM 的可观测性进行解析，使得大家能够了解 LLM 的可观测性的必要性以及其核心的生态体系知...

生成式AI 2024-01-15 人工智能

1428阅读

OpenAI的人工智能语音识别模型Whisper详解及使用

1 whisper介绍拥有ChatGPT语言模型的OpenAI公司，开源了 Whisper 自动语音识别系统，OpenAI 强调 Whisper 的语音识别能力已达到人类水准。 Whisper是一个通用的语音识别模型，...

生成式AI 2024-01-14 人工智能

3372阅读

视觉高精地图构建的全面回顾！一起看看无图感知都有哪些落地方案（清华&滴滴）

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解近年来，自动驾驶受到越来越多的关注，高精地图成为自动驾驶技术的关键组成部分。这些地图提供了道路网络的复杂细节，并作为车辆定位、导航和决策等关键任务的基本输入。鉴于视觉...

生成式AI 2024-01-14 人工智能

1329阅读

大模型恋爱神器！16种MBTI自由定制，北大ChatLaw团队出品

北大团队新作，让大模型拥有个性! 而且还是自定义那种，16种MBTI都能选。图源备注：图片由AI生成，图片授权服务商Midjourney 这样一来，即便是同一个大模型，不同性格下的回答都不一样。比如提问:你周末喜欢干什么? 这样能干啥呢?北大的童...

大数据 2024-01-14 人工智能

913阅读

Stable Diffusion 母公司开源大语言模型，代号「StableLM」！

公众号关注 “GitHubDaily” 设为 “星标”，每天带你逛 GitHub！昨天晚上 11 点，Stable Diffusion 的母公司 Stability AI 重磅宣布，正式开源一款全新的大语言模型：StableLM。...

人工智能 2024-01-14 人工智能

823阅读

Llama 2- Open Foundation and Fine-Tuned Chat Models＜2＞

3.2 人类反馈强化学习（RLHF） RLHF 是一种模型训练过程，应用于微调的语言模型，以进一步使模型行为与人类偏好和指令遵循保持一致。我们收集代表根据经验采样的人类偏好的数据，人类注释者可以选择他们更喜欢的两个模型输出中的哪一个。这种人类反馈随后用...

大数据 2024-01-14 人工智能

1023阅读

手把手教你在云环境炼丹：Stable Diffusion LoRA 模型保姆级炼制教程

很多同学都想要自己的专属AI模型，但是大模型的训练比较费时费力，不太适合普通用户玩。AI开发者们也意识到了这个问题，所以就产生了微调模型，LoRA就是其中的一种。在AI绘画领域，只需要少量的一些图片，就可以训练出一个专属风格的LoRA模型，比如某人的脸、...

人工智能 2024-01-14 人工智能

1271阅读

训练Stable Diffusion(SD) Lora模型巨详细教程赛博丹炉/青龙脚本/秋叶云端使用教程主用赛博丹炉（道玄）巨小白巨啰嗦，全是干货和踩过的坑

前言试了很多的sd训练，尤其是sd的lora的训练，问题一大堆，现在写个博客汇总一下一、一些理论知识记录一些杂七杂八各种博客看到的训练经验。 1. 对于sd1.5训练出来2G左右大小就是有效模型，WebUI默认FP16。【AI绘画】模型...

大数据 2024-01-14 人工智能

5309阅读

大语言模型漏洞缓解指南

虽然大语言模型(LLM 应用正在全球快速普及，但企业对大语言模型的威胁态势仍然缺乏全面了解。面对大语言模型风险的不确定性，企业希望在保障其安全性的基础上加快应用脚步，用人工智能提升企业核心竞争力，这意味着企业的CISO面临着理解和应对新兴人工智能威胁...

大数据 2024-01-13 人工智能

931阅读

Google Bard 、Bing Copilot 、Claude、文心一言的简介及与ChatGTP异同

本文详细比较了 ChatGTP、Google Bard、Bing Copilot 、 Claude 和文心一言五种文本生成式 AI 。本文共计约 3000字，预计阅读时间为 10-15分钟。 1、ChatGTP 1.1、官网：https://chat....

AIGC 2024-01-13 人工智能

1532阅读

小红书搜索团队提出全新框架：验证负样本对大模型蒸馏的价值

大语言模型（LLMs）在各种推理任务上表现优异，但其黑盒属性和庞大参数量阻碍了它在实践中的广泛应用。特别是在处理复杂的数学问题时，LLMs 有时会产生错误的推理链。传统研究方法仅从正样本中迁移知识，而忽略了那些带有错误答案的合成数据。在 AAAI 2...

人工智能 2024-01-13 人工智能

986阅读

Textual Inversion: 一种精调Stable Diffusion模型的方法

引言最近的文本到图像Stable Diffusion （SD）模型已经证明了使用文本提示合成新颖场景的前所未有的能力。这些文本到图像的模型提供了通过自然语言指导创作的自由。然而，它们的使用受到用户描述特定或独特场景、艺术创作或新物理产品的能力的限制。...

生成式AI 2024-01-09 人工智能

1054阅读

在灾难推文分析场景上比较用 LoRA 微调 Roberta、Llama 2 和 Mistral 的过程及表现

引言自然语言处理 (NLP 领域的进展日新月异，你方唱罢我登场。因此，在实际场景中，针对特定的任务，我们经常需要对不同的语言模型进行比较，以寻找最适合的模型。本文主要比较 3 个模型: RoBERTa、Mistral-7B 及 Llama-2...

人工智能 2024-01-08 人工智能

1097阅读