训练数据第22页

小红书搜索团队提出全新框架：验证负样本对大模型蒸馏的价值

大语言模型（LLMs）在各种推理任务上表现优异，但其黑盒属性和庞大参数量阻碍了它在实践中的广泛应用。特别是在处理复杂的数学问题时，LLMs 有时会产生错误的推理链。传统研究方法仅从正样本中迁移知识，而忽略了那些带有错误答案的合成数据。在 AAAI 2...

人工智能 2024-01-13 人工智能

987阅读

LLMs模型速览（GPTs、LaMDA、GLM/ChatGLM、PaLM/Flan-PaLM、BLOOM、LLaMA、Alpaca）

文章目录一、 GPT系列 1.1 GPTs（OpenAI，2018——2020） 1.2 InstructGPT（2022-3） 1.2.1 算法 1.2.2 损失函数 1.3 ChatGPT（2022.11.30） 1.4 ChatG...

AIGC 2024-01-09 人工智能

1300阅读

蚂蚁营销推荐场景上的因果纠偏方法

一、因果纠偏的背景 1、偏差的产生推荐系统里根据收集的数据来训练推荐模型，给用户推荐一个合适的 item，当用户与这个 item 产生交互后，数据又会被收集用于继续训练模型，从而形成一个闭环。但是这个闭环当中可能会存在各种各样的影响因素，因此会产生误差...

生成式AI 2024-01-09 人工智能

852阅读

Textual Inversion: 一种精调Stable Diffusion模型的方法

引言最近的文本到图像Stable Diffusion （SD）模型已经证明了使用文本提示合成新颖场景的前所未有的能力。这些文本到图像的模型提供了通过自然语言指导创作的自由。然而，它们的使用受到用户描述特定或独特场景、艺术创作或新物理产品的能力的限制。...

生成式AI 2024-01-09 人工智能

1055阅读

AIGC：【LLM（七）】——Baichuan2：真开源可商用的中文大模型

文章目录一.模型介绍二.模型部署 2.1 CPU部署 2.2 GPU部署三.模型推理 3.1 Chat 模型推理 3.2 Base 模型推理四.模型量化 4.1 量化方法 4.2 在线量化 4.3 离线量化 4.4 量化效果...

生成式AI 2024-01-09 人工智能

1052阅读

全面带你了解AIGC的风口

前言一、AIGC的介绍二、AIGC 的几个主要作用三、实现AIGC过程的步骤四、科技新赛道AIGC开始火了五、AIGC对世界产生广泛的影响六、AIGC技术的主要风口 ?一、AIGC的介绍 AIGC (AI Generated C...

大数据 2024-01-09 人工智能

794阅读

Stable Diffusion 文生图技术原理

图像生成模型简介图片生成领域来说，有四大主流生成模型：生成对抗模型（GAN）、变分自动编码器（VAE）、流模型（Flow based Model）、扩散模型（Diffusion Model）。从2022年开始，主要爆火的图片生成模型是Diffusi...

人工智能 2024-01-08 人工智能

1961阅读

在灾难推文分析场景上比较用 LoRA 微调 Roberta、Llama 2 和 Mistral 的过程及表现

引言自然语言处理 (NLP 领域的进展日新月异，你方唱罢我登场。因此，在实际场景中，针对特定的任务，我们经常需要对不同的语言模型进行比较，以寻找最适合的模型。本文主要比较 3 个模型: RoBERTa、Mistral-7B 及 Llama-2...

人工智能 2024-01-08 人工智能

1099阅读

Stable Diffusion 超详细讲解

Stable Diffusion 超详细讲解这篇文章是《Stable Diffusion原理详解》的后续，在《Stable Diffusion原理详解》中我更多的是以全局视角讲解了 Stable Diffusion 的原理和工作流程，并未深入步骤细...

人工智能 2024-01-08 人工智能

1110阅读

微软祭出代码大模型WaveCoder！四项代码任务两万个实例数据集，让LLM泛化能力飙升

用高质量数据集进行指令调优，能让大模型性能快速提升。对此，微软研究团队训练了一个CodeOcean数据集，包含了2万个指令实例的数据集，以及4个通用代码相关任务。与此同时，研究人员微调了一个代码大模型WaveCoder。论文地址：https://...

大数据 2024-01-08 人工智能

908阅读

一文速览扩散模型优化过程：从DDPM到条件生成模型Stable Diffusion

文章目录 1、扩散模型简介 - Diffusion Model 2、最简单的扩散模型 - DDPM 前向加噪过程逆向去噪过程训练与推理流程模型优缺点 3、减少扩散模型的采样步骤 - DiffusionGAN 分析高斯分布、采样步长...

人工智能 2024-01-08 人工智能

2495阅读

文心一言没有体验上，看看讯飞星火认知大模型

目录前言正文 1.简单对话环节 1.1什么是讯飞星火认知大模型 1.2你都可以干一些什么 1.3你的训练数据库还在持续更新么 1.4今天是哪一天 1.5宇宙中有哪些目前认为可能存在生命的星球 2.辅助学习对话 2.1我想完成一篇...

大数据 2024-01-08 人工智能

1179阅读

吃了几个原作者才能生成这么逼真的效果？文生图涉嫌视觉「抄袭」

不久之前，《纽约时报》指控 OpenAI 涉嫌违规使用其内容用于人工智能开发的事件引起了社区极大的关注与讨论。 GPT-4 输出的许多回答中，几乎逐字逐句地抄袭了《纽约时报》的报道：图中红字是 GPT-4 与《纽约时报》报道重复的部分。对此，各个专...

人工智能 2024-01-08 人工智能

899阅读

【 stable diffusion LORA模型训练最全最详细教程】

个人网站：https://tianfeng.space/ 文章目录一、前言二、朱尼酱的赛博丹炉 1.介绍 2.解压配置 3.使用训练准备首页设置上传素材查看进度三、秋叶的lora训练器 1.下载 2.预处理 3.参...

人工智能 2024-01-08 人工智能

1810阅读

MongoDB携手亚马逊云科技优化Amazon CodeWhisperer建议，助力开发者在MongoDB上构建应用程序

MongoDB (NASDAQ: MDB 和亚马逊 (NASDAQ: AMZN 旗下的亚马逊云科技（AWS）今日宣布，双方正在协作优化Amazon CodeWhisperer，为在MongoDB上的应用程序开发和改进工作提供更好的建议和支持。Mongo...

人工智能 2024-01-08 人工智能

857阅读

AIGC 综述 2023：A History of Generative AI from GAN to ChatGPT

GAI：发展历史，核心技术，应用领域以及未来发展摘要 1、引言 1.1、主要贡献 1.2、组织结构 2、生成式AI的发展历史 2.1、NLP领域的发展 2.2、CV领域的发展 2.3、CV与NLP的融合 3、AIGC的核心技术基础...

人工智能 2024-01-08 人工智能

1481阅读

深入浅出讲解Stable Diffusion原理，新手也能看明白

说明最近一段时间对多模态很感兴趣，尤其是Stable Diffusion，安装了环境，圆了自己艺术家的梦想。看了这方面的一些论文，也给人讲过一些这方面的原理，写了一些文章，具体可以参考我的文章：北方的郎：图文匹配：Clip模型介绍北方的郎：VQ...

人工智能 2024-01-08 人工智能

856阅读

争议不断的AI绘画，靠啥成为了顶流？

今年以来，AIGC迅速崛起。所谓AIGC，即AI-Generated Content，指的是利用人工智能来生成内容，被认为是继专业产出内容（PGC）、用户产出内容（UGC）后的新型内容创作方式。不久前掀起热议的“AI绘画”就是AIGC的一个典例。在...

AIGC 2024-01-08 人工智能

926阅读

【stable diffusion LORA训练】改进lora-scripts，命令行方式训练LORA，支持SDXL训练

分享下自己改进的一个lora训练脚本，在ubuntu下如果SD-WEBUI的环境已经搭好的话，只需要下载lora-script就可以支持训练了，直接命令行方式训练。首先，我们需要克隆下项目： git clone https://github.com/...

生成式AI 2024-01-08 人工智能

2383阅读

使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion

使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion 0. 前言 1. Amazon SageMaker 与机器学习 1.1 机器学习流程 1.2 Amazon SageMaker 简介 1.3 Amaz...

生成式AI 2024-01-07 人工智能

1081阅读

Stable Diffusion这样的文本-图像生成模型有记忆吗？

Stable Diffusion扩散模型作为生成高质量图像的先进模型，却伴随着对训练数据的记忆化倾向，引发了隐私和安全性的担忧。AIGCer分享一篇分析该现象的文章，通过两个案例研究深入挖掘了文本复制现象，旨在为未来生成模型的改进提供重要的指导。基于扩...

AIGC 2024-01-07 人工智能

901阅读

卧剿，6万字！30个方向130篇！CVPR 2023 最全 AIGC 论文！一口气读完。

一杯奶茶，成为 AIGC+CV 视觉前沿弄潮儿！ 25个方向！CVPR 2022 GAN论文汇总 35个方向！ICCV 2021 最全GAN论文汇总超110篇！CVPR 2021 最全GAN论文梳理超100篇！CVPR 2020...

人工智能 2024-01-07 人工智能

1325阅读

stable diffusion模型讲解

AI模型最新展现出的图像生成能力远远超出人们的预期，直接根据文字描述就能创造出具有惊人视觉效果的图像，其背后的运行机制显得十分神秘与神奇，但确实影响了人类创造艺术的方式。 AI模型最新展现出的图像生成能力远远超出人们的预期，直接根据文字描述就能创造出具有...

人工智能 2024-01-07 人工智能

918阅读

AIGC实战——自回归模型(Autoregressive Model)

AIGC实战——自回归模型 0. 前言 1. 长短期记忆网络基本原理 2. Recipes 数据集 3. 处理文本数据 3.1 文本与图像数据处理的差异 3.2 文本数据处理步骤 4. 构建 LSTM 模型 4.1 模型架构 4.2 LS...

AIGC 2024-01-07 人工智能

2384阅读

首创pix2emb范式！NUS清华联合发布NExT-Chat：对话/检测/分割全能多模态大模型

随着ChatGPT的爆红，多模态领域也涌现出一大批可以处理多种模态输入的对话模型，如LLaVA, BLIP-2等等。为了进一步扩展多模态大模型的区域理解能力，近期新加坡国立大学NExT++实验室和清华大学的研究人员联手打造了一个可以同时进行对话和检测、...

人工智能 2024-01-07 人工智能

885阅读

模型A：幸亏有你，我才不得0分，模型B：俺也一样

琳琅满目的乐高积木，通过一块又一块的叠加，可以创造出各种栩栩如生的人物、景观等，不同的乐高作品相互组合，又能为爱好者带来新的创意。我们把思路打开一点，在大模型（LLM）爆发的当下，我们能不能像拼积木一样，把不同的模型搭建起来，而不会影响原来模型的功能，...

人工智能 2024-01-06 人工智能

772阅读

《Cocos Creator游戏实战》AIGC之将草稿内容转为真实内容

目录前言训练AI 从识别结果中提取必要数据发送图片并生成最终代码总结与提高资源下载前言当创作灵感来的时候，我们可能会先把灵感记录在草稿上，之后再去实现它。比方说有一天，我突然来了游戏创作灵感，想着那可以先把一些简单的组件...

大数据 2024-01-06 人工智能

919阅读

当LLM学会左右互搏，基础模型或将迎来集体进化

金庸武侠小说中有一门武学绝技：左右互搏；乃是周伯通在桃花岛的地洞里苦练十余年所创武功，初期想法在于左手与右手打架，以自娱自乐。而这种想法不仅能用来练武功，也能用来训练机器学习模型，比如前些年风靡一时的生成对抗网络（GAN）。进入现今的大模型 (LLM ...

大数据 2024-01-06 人工智能

900阅读

语言模型是如何感知时间的？「时间向量」了解一下

语言模型究竟是如何感知时间的？如何利用语言模型对时间的感知来更好地控制输出甚至了解我们的大脑？最近，来自华盛顿大学和艾伦人工智能研究所的一项研究提供了一些见解。他们的实验结果表明，时间变化在一定程度上被编码在微调模型的权重空间中，并且权重插值可以帮助自定...

人工智能 2024-01-06 人工智能

820阅读

迷你AI模型TinyLlama发布：高性能、仅637MB

经过一番期待，TinyLlama项目发布了一款引人注目的开源模型。该项目于去年9月启动，开发人员致力于在数万亿标记上训练一款小型模型。在经历了一些辛勤工作和一些挫折之后，TinyLlama团队如今发布了这个模型。这个模型有着10亿个参数，大约在训练数据上进...

生成式AI 2024-01-06 人工智能

938阅读

精调训练中文LLaMA模型实战教程，民间羊驼模型

羊驼实战系列索引博文1：本地部署中文LLaMA模型实战教程，民间羊驼模型博文2：本地训练中文LLaMA模型实战教程，民间羊驼模型博文3：精调训练中文LLaMA模型实战教程，民间羊驼模型（本博客）简介在学习完上篇【博文2：本地训练中文LLaM...

大数据 2024-01-06 人工智能

858阅读

AIGC困局与Web3破圈之道

最近一年，随着 AIGC（AI-Generated Content）技术的发展壮大，越来越多的人感受到了它的恐怖之处。AI 降低了创作门槛，使每个普通人都有机会展现自己的创造力，做出不输专业水平的作品。但是就在全民 AI 作图的进程中，艺术家好像与其站在...

大数据 2024-01-05 人工智能

844阅读

谷歌起草“机器人宪法”，以确保 AI 机器人不会伤害人类

1 月 5 日消息，谷歌旗下 DeepMind 公司近日公布了三项新进展，其中之一针对收集训练数据的系统，起草了“机器人宪法”，确保 AI 机器人不会伤害人类。谷歌的数据收集系统 AutoRT 可以同时利用视觉语言模型（VLM）和大型语言模型（LLM...

大数据 2024-01-05 人工智能

847阅读

Github爆火AI语音克隆项目OpenVoice，精准进行声音复刻

最近，Github上的一个名为OpenVoice的AI语音克隆项目爆火，该项目由myshell-ai开源，仅开源了不到三周，就有了6.1k的star。 OpenVoice仅需参考说话者的短音频片段，即可复制其声音并生成多种语言的语音。这一技术不仅实现了对音...

人工智能 2024-01-05 人工智能

1331阅读

谷歌家务机器人单挑斯坦福炒虾机器人！端茶倒水逗猫，连甩三连弹开打

火爆全网的斯坦福炒虾机器人，一天之内人气暴涨。毕竟这样能炒菜能洗碗的全能机器人，谁不想带一个回家，把自己从家务中解放出来呢！据说，这个项目是斯坦福华人团队花了三个月的时间做出来的。今天，团队直接放出了更多细节。这个机器人的技能多种多样，令人眼...

人工智能 2024-01-05 人工智能

856阅读

图解tinyBERT模型——BERT模型压缩精华

译者 | 朱先忠审校 | 重楼简介近年来，大型语言模型的发展突飞猛进。BERT成为最受欢迎和最有效的模型之一，可以高精度地解决各种自然语言处理（NLP）任务。继BERT模型之后，一组其他的模型也先后出现并各自展示出优秀的性能。不难看到一个明显趋势...

AIGC 2024-01-05 人工智能

1051阅读

Stable Diffusion 系列教程 - 3 模型下载和LORA模型的小白入门

首先，一个比较广泛的模型下载地址为：Civitai Models | Discover Free Stable Diffusion Models 黄框是一些过滤器，比如checkpoints可以理解为比如把1.5版本的SD模型拷贝一份后交叉识别新的画...

AIGC 2024-01-05 人工智能

2112阅读

pytorch快速训练ai作画模型的python代码

在 PyTorch 中训练 AI 作画模型的基本步骤如下: 准备数据集: 需要准备一个包含许多图像的数据集, 这些图像可以是手绘的或者是真实的图像. 定义模型: 选择一个适当的深度学习模型, 并使用 PyTorch 定义该模型. 例如...

人工智能 2024-01-05 人工智能

940阅读

斯坦福炒虾机器人爆火全网！华人团队成本22万元，能做满汉全席还会洗碗

今天，会做一大桌子菜的斯坦福机器人Mobile ALOHA刷屏全网。滑蛋虾仁、干贝烧鸡、蚝油生菜，色香味俱全，看着很诱人。就拿滑蛋虾仁这道菜来说，Mobile ALOHA在烧水的过程中先打上3颗鸡蛋，然后把虾仁放到水中焯熟，平底锅倒入鸡蛋液再加入...

AIGC 2024-01-04 人工智能

851阅读

AIGC入门系列1：感性的认识扩散模型

1、序言大家好，欢迎来到AI手工星的频道，我是专注AI领域的手工星。AIGC已经成为AI又一个非常爆火的领域，并且与之前的AI模型不同，AIGC更适合普通人使用，我们不仅可以与chatgpt对话，也能通过绘画模型生成想要的图片。很多朋友都想去深入的了解...

人工智能 2024-01-04 人工智能

852阅读

从零开始的AI绘画：MidJourney带你掌握AI绘画的基础和高级技巧

1 快速开始学习如何在Discord上使用MidJourney机器人，从简单的文本提示中创建自定义图像。 1.1 加入Discord 前往Midjourney.com，选择“加入Beta”，或直接进入MidJourney Discord。在加...

大数据 2024-01-04 人工智能

1077阅读

[linux-sd-webui]api化之训练lora

lora的训练使用的文件是https://github.com/Akegarasu/lora-scripts lora训练是需要成对的文本图像对的，需要准备相应的训练数据。 1.训练数据准备使用deepbooru/blip生成训练数据，建筑类建议使...

AIGC 2024-01-04 人工智能

1035阅读

在选择GenAI供应商时如何权衡风险和回报

11月中旬，OpenAI董事会解雇了公司CEO奥特曼，他让ChatGPT声名鹊起，并开启了企业AI部署的新纪元。在接下来的三天里，几乎所有的公司员工都表示要离开公司，OpenAI的命运看起来非常不确定。整个业务都建立在OpenAI及其API之上。根...

生成式AI 2024-01-04 人工智能

925阅读

HandRefiner：解决AI生图手部畸形难题

HandRefiner是一种可以修正形状不正常的手部图像的方法。在生成图像方面，目前的图像生成模型已经非常出色，但是在生成人类手部的图像时常常会出现问题，例如手指数量不对或者手形怪异。为了解决这个问题，HandRefiner提出了一种条件修补方法，可以在...

生成式AI 2024-01-04 人工智能

937阅读

人工智能利用深度学习技术增强高级驾驶辅助系统(ADAS)

译者 | 李睿审校 | 重楼人工智能和机器学习利用深度学习技术的优势，使高级驾驶辅助系统(ADAS 发生了重大变革。ADAS在很大程度上依赖深度学习来分析和解释从各种传感器获得的大量数据。摄像头、激光雷达(光探测和测距、雷达和超声波传感器都是传感器...

大数据 2024-01-04 人工智能

968阅读

黑客解锁特斯拉自动驾驶系统的“隐藏模式”

在近日举行的混沌计算大会上，来自柏林工业大学的三名网络安全研究人员演示了如何通过“电压故障攻击”成功破解特斯拉的自动驾驶系统，不但能获取系统和用户敏感数据，而且解锁了特斯拉自动驾驶的隐藏模式——“Elon模式”。特斯拉自动驾驶的隐藏模式——“Elon...

大数据 2024-01-03 人工智能

856阅读

Mickey-1928官网体验入口 AI米老鼠生成工具免费下载地址

Mickey-1928是一款基于Stable-Diffusion-xl模型微调的AI工具，专注于生成迪士尼 1928 年前的经典动画角色。这款工具使用了包含《小飞象》、《汽船威利号》和《疯狂的高卢》等动画中的 96 张静态画面作为训练数据集。Mickey-...

生成式AI 2024-01-03 人工智能

1188阅读

客观看待AI大模型在数字化转型中的地位和作用

“ AI大模型在数字化转型中的作用尚未突破《“以数据为中心的业务变革”之三种范式》中第三种范式的边界”。自从OpenAI公司研发的机器人聊天程序ChatGPT在2022年11月30日发布以来，在全世界迅速带起了热潮。ChatGPT是AI大模型驱动的自...

人工智能 2024-01-03 人工智能

813阅读

保姆级教程：从0到1使用Stable Diffusion XL训练LoRA模型 |【人人都是算法专家】

Rocky Ding 公众号：WeThinkIn 写在前面【人人都是算法专家】栏目专注于分享Rocky在AI行业中对业务/竞赛/研究/产品维度的思考与感悟。欢迎大家一起交流学习? 大家好...

生成式AI 2024-01-03 人工智能

1276阅读

肖仰华：走向千行百业的大模型

现如今，我们站在了大模型技术和产业发展的中场思考阶段。这个阶段的开启源于 ChatGPT 的诞生，它引发了广泛而深入的关注。尽管这种关注对于推动技术和产业的发展起到了至关重要的作用，但同时我们也看到了一系列问题的浮现。这些问题包括成本和价值的问题以及一些...

人工智能 2024-01-03 人工智能

929阅读