训练数据第8页 - AIGC资讯

详解AI作画算法原理

引言（1）背景介绍 AI作画，即利用人工智能技术进行艺术创作，近年来引起了广泛关注。随着计算机科学的发展，特别是深度学习和生成对抗网络（GAN）等技术的进步，AI作画从一个新颖的概念逐步走向实用化。AI作画的兴起可以追溯到早期的计算机艺术实验，如...

生成式AI 2024-06-02 人工智能

1300阅读

一键 input 苹果 OpenELM，零门槛 Llama 3 教程，40+ 优质模型/数据集/教程，建议收藏！...

现在 AI 行业什么最火？「大模型」一定仍然排在前三甲的位置。自从 2022 年底 ChatGPT 面世以来，大模型在各行各业已经带来了太多的惊喜，应用场景愈发丰富，同时也带动了相关底层技术的普及与普适化。尤其是在开源模型繁荣发展之下，无...

人工智能 2024-06-02 人工智能

1026阅读

AIGC视频生成-CameraCtrl

0. 资源链接论文: CameraCtrl: Enabling Camera Control for Text-to-Video Generation 项目: https://hehao13.github.io/projects-CameraC...

生成式AI 2024-06-02 人工智能

1127阅读

AI作画算法原理

1.概述 AI作画算法的原理相当复杂，涉及多个领域的知识，包括计算机视觉、机器学习和神经网络等。我们从以下几个方面来描述AI作画算法的基本原理。 2. 数据准备在数据准备方面，AI作画算法通常需要大量的图像数据作为训练样本。可以是各种各样的艺术...

人工智能 2024-06-01 人工智能

873阅读

Datawhale |【独家】万字长文带你梳理Llama开源家族：从Llama-1到Llama-3

本文来源公众号“Datawhale”，仅用于学术分享，侵权删，干货满满。原文链接：【独家】万字长文带你梳理Llama开源家族：从Llama-1到Llama-3 0. 引言在AI领域，大模型的发展正以前所未有的速度推进技术的边界。北京时间4月1...

人工智能 2024-06-01 人工智能

1014阅读

【史上最全之 ChatGPT 和文心一言对比】

ChatGPT 和文心一言哪个更好用？在当今的AI助手领域中，ChatGPT与文心一言无疑是备受瞩目的两位选手。两者分别由美国OpenAI公司和中国百度研发，均致力于提供卓越的人工智能对话体验。接下来，我们将从智能回复、语言准确性以及知识库丰富度等核...

人工智能 2024-05-31 人工智能

1081阅读

AIGC (AI-Generated Content) 技术深度探索：现状、挑战与未来愿景

? 个人主页：空白诗文章目录 ? AIGC技术：塑造未来的创意与内容革命 ? 引言 ? AIGC技术发展现状 ? 核心技术驱动 ? 应用领域拓展 ? 面临的挑战 ❌ 真实性与伦理考量 ? 技术局限性 ? 未来趋势 ?...

人工智能 2024-05-31 人工智能

1076阅读

稳定扩散美学梯度（Stable Diffusion Aesthetic Gradients）：一种创新的图像生成技术...

稳定扩散美学梯度（Stable Diffusion Aesthetic Gradients）：一种创新的图像生成技术项目地址:https://gitcode.com/vicgalle/stable-diffusion-aesthetic-gradien...

人工智能 2024-05-31 人工智能

933阅读

LLaMa系列模型详解（原理介绍、代码解读）：LLaMA 3

LLaMA 3 2024年4月18日，Meta 重磅推出了Meta Llama 3，Llama 3是Meta最先进开源大型语言模型的下一代，包括具有80亿和700亿参数的预训练和指令微调的语言模型，能够支持广泛的应用场景。这一代Llama在一系列行业标...

AIGC 2024-05-31 人工智能

1592阅读

如何看待AIGC技术？未来已来，请做好准备！

文章目录前言令人震撼无限可能核心优势背后力量双刃剑总结前言我正在写一篇关于人工智能对人类工作影响的文章，突然，我的电脑屏幕上弹出一条消息：“嘿，伙计，介意让我写一点吗？” 我吓了一跳，然后意识到是我自己的...

生成式AI 2024-05-31 人工智能

858阅读

腾讯云存储面向AIGC全面升级，搭载全面自研存储引擎

云厂商继续为大模型加速落地铺路架桥。 4月8日，腾讯云宣布云存储解决方案面向AIGC场景全面升级，能够针对AI大模型数据采集清洗、训练、推理、数据治理全流程提供全面、高效的云存储支持。数据显示，采用腾讯云AIGC云存储解决方案，可将大模型的数据清洗和训...

大数据 2024-05-30 人工智能

768阅读

如何将大型语言模型（LLM）转换为嵌入模型

译者 | 李睿审校 | 重楼实验证明，LLM2Vec模型在嵌入任务上具有更好的性能，它可以为组织开辟新的场所，并以非常低的成本快速创建专门的嵌入模型。嵌入模型已经成为大型语言模型(LLM 应用的重要组成部分，可以实现检测文本相似度、信息检索和聚类...

大数据 2024-05-30 人工智能

898阅读

AlphaFold 3不开源，统一生物语言大模型阿里云先开了！

把169861个生物物种数据装进大模型，大模型竟get到了生物中心法则的奥秘—— 不仅能识别DNA、RNA与相应蛋白质之间的内在联系，在基因分类、蛋白质相互作用预测、热稳定性预测等7种不同类型任务中也能比肩SOTA模型。模型名为LucaOne，由阿里云...

人工智能 2024-05-30 人工智能

907阅读

超详细！AIGC面试系列大模型进阶(2)

本期问题快览 1. 如何让大模型处理更长的文本？ 2. 如果想要在某个模型基础上做全参数微调，究竟需要多少显存？ 3. 什么是有监督微调SFT 4. SFT 指令微调数据如何构建? 5. 领域数据训练后，通用能力往往会有所下降，如何缓解模型遗忘...

人工智能 2024-05-30 人工智能

1763阅读

一文速览Llama 3及其微调：从如何把长度扩展到100万到如何微调Llama3 8B

前言 4.19日凌晨正准备睡觉时，突然审稿项目组的文弱同学说：Meta发布Llama 3系列大语言模型了，一查，还真是本文以大模型开发者的视角，基于Meta官方博客的介绍：Introducing Meta Llama 3: The most capa...

AIGC 2024-05-29 人工智能

1938阅读

Google Bard的Gemini Pro最新升级；Nomic Embed: 开源文本嵌入模型

? AI新闻 ? Google Bard的Gemini Pro最新升级摘要：Bard现在可以在超过40种语言和230多个国家和地区使用Gemini Pro，提供更强大的理解、推理、总结和编码能力。 Bard的双重检查功能将扩展到40多种语言，用户...

生成式AI 2024-05-29 人工智能

998阅读

数据驱动与 LLM 微调：打造 E2E 任务型对话 Agent

作者 | Thought Agent 社区在对话系统的设计和实现中，传统的基于 Rasa-like 框架的方法往往需要依赖于多个模块的紧密协作，例如我们在之前的文章中提到的基于大模型（LLM）构建的任务型对话 Agent，Thought Agent，其...

生成式AI 2024-05-29 人工智能

1203阅读

Karpathy新教程爆火，网友抢着送他H100：从头复现GPT-2训练

大神Karpathy已经不满足于用C语言造Llama了! 他给自己的最新挑战:复现OpenAI经典成果，从基础版GPT-2开始。挑战成功本身并不意外，但是只花费20美元、90分钟完成训练，Loss和评测还超越原版，就!有!点!过!分!了!。不仅如此，...

人工智能 2024-05-29 人工智能

821阅读

AIGC重塑金融：AI大模型驱动的金融变革与实践，2024年最新阿里面试二面

自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。深知大多数HarmonyOS鸿蒙开发工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但对于培训机构动则几千的学费，着实压力不小。自己不...

AIGC 2024-05-29 人工智能

894阅读

马斯克烧60亿美元难题，国内大厂有解？开源MoE模算效率黑马登场，3.7B参数单挑Llama 3-70B

如今，想训个SOTA的大模型，不仅缺数据和算力，甚至连电都不够用了。最近马斯克就公开表示，因为苦于买不到足够的芯片，xAI只能推迟Gork 2的训练和发布。 Grok 3及更高版本，甚至需要10万个H100，按每台H100售价3万美元来算，仅芯片就要花...

人工智能 2024-05-29 人工智能

898阅读

OpenAI正训练GPT-4的继任者，GPT-5或将带来三个重大升级

虽然 OpenAI 最近推出的模型 GPT-4o 在大型语言模型（LLM）领域有了重大突破，但该公司已经开始着手研发下一个旗舰模型 GPT-5。许多人在 GPT-4o 发布前期就期待着 OpenAI 推出备受瞩目的 GPT-5。为了澄清这种猜测，首席执行官...

人工智能 2024-05-29 人工智能

844阅读

和GPT-4这些大模型玩狼人杀，人类因太蠢被票死，真·反向图灵测试

「你看，人类一败涂地了」这是一次「反向图灵测试」，几个全球最先进的大模型坐在一起，坐着火车唱着歌，但其中混进了人类: 而 AI 的任务，是把这个人类揪出来。最近，一位昵称「Tore Knabe」的网友在 X 平台发布的一段视频引发了人们的讨论。在视频中...

生成式AI 2024-05-29 人工智能

888阅读

AI模型竟然也有偏好的数字 GPT-3.5Turbo非常喜欢47

最近，人们发现了一个有趣的现象，即AI模型在选择数字时表现出类似人类的购买和避好行为，这证明了模型在回答问题时重复训练数据中的常见内容。这种行为具有确定“人性化”的特点，虽然模型本身并不具备人类的认知能力。在实验中，一些工程师要求几个主要的LLM聊天机器...

生成式AI 2024-05-29 人工智能

785阅读

硅谷有了自己的鲁迅！AI大佬LeCun连续暴走，从马斯克到OpenAI，全被怼了个遍

当地时间 5 月 26 日，马斯克旗下的人工智能初创公司xAI宣布完成B轮 60 亿美元融资。主要的投资者包括 Valor Equity Partners、Vy Capital、Andreessen Horowitz、红杉资本等。 xAI2023 年 7...

生成式AI 2024-05-29 人工智能

864阅读

现在适合进入AIGC行业吗？

现在适合进入AIGC行业吗？随着人工智能生成内容（AIGC）技术的快速发展，越来越多的人开始关注这个行业。那么，现在是否是进入AIGC行业的好时机呢？本文将从行业前景、市场需求以及个人选择与规划三个方向进行探讨。行业前景发展前景 AI...

生成式AI 2024-05-29 人工智能

825阅读

图像生成模型浅析（Stable Diffusion、DALL-E、Imagen）

目录前言 1. 速览图像生成模型 1.1 VAE 1.2 Flow-based Model 1.3 Diffusion Model 1.4 GAN 1.5 对比速览 2. Diffusion Model 3. Stable Diffusi...

AIGC 2024-05-28 人工智能

908阅读

适应多形态多任务，最强开源机器人学习系统「八爪鱼」诞生

在机器人学习方面，一种常用方法是收集针对特定机器人和任务的数据集，然后用其来训练策略。但是，如果使用这种方法来从头开始学习，每一个任务都需要收集足够数据，并且所得策略的泛化能力通常也不佳。原理上讲，从其它机器人和任务收集的经验能提供可能的解决方案，能让...

生成式AI 2024-05-28 人工智能

880阅读

Meta被曝使用Instagram等照片训练AI模型引发隐私争议

全球社交巨头 Meta 最近因使用用户照片训练 AI 模型 Emu 引发了一场隐私争议。据报道，Meta 正在利用 Instagram 和 Facebook 上的用户照片进行训练，同时还会使用用户对图片的描述、标题等文本数据。这严重违反了数据隐私搜集条例，...

大数据 2024-05-28 人工智能

904阅读

CIO指南：采用开源生成式AI需要注意的十件事

开源生成式AI模型是可以免费下载的、大规模使用而无需增加API调用成本的，并且可以在企业防火墙后面安全运行。但你不要放松警惕，风险仍然存在，有些风险不仅被放大了，而且针对生成式AI的新风险正在出现。如今似乎任何人都可以制作AI模型，即使你没有训练数...

人工智能 2024-05-28 人工智能

932阅读

智慧建筑：基于YOLOv7的建筑外墙缺陷检测

01 前景概要现有的基于深度学习的方法在识别速度和模型复杂性方面面临一些挑战。为了保证建筑外墙缺陷检测的准确性和速度，我们研究了了一种改进的YOLOv7方法BFD-YOLO。首先，将YOLOv7中原有的ELAN模块替换为轻量级的MobileOne模块，...

生成式AI 2024-05-28 人工智能

1060阅读

用于精确目标检测的多网格冗余边界框标注

本文经计算机视觉研究院公众号授权转载，转载请联系出处。一、前言现在领先的目标检测器是从基于深度CNN的主干分类器网络重新调整用途的两级或单级网络。YOLOv3就是这样一种众所周知的最先进的单级检测器，它接收输入图像并将其划分为大小相等的网格矩阵。具...

人工智能 2024-05-28 人工智能

807阅读

AIGC系列之：DDPM原理解读（简单易懂版）

目录 DDPM基本原理 DDPM中的Unet模块 Unet模块介绍 Unet流程示意图 DownBlock和UpBlock MiddleBlock 文生图模型的一般公式总结本文部分内容参考文章：https://ju...

AIGC 2024-05-28 人工智能

1279阅读

ChatGPT如何「思考」？心理学和神经科学破解AI大模型，Nature发文

美国东北大学的计算机科学家 David Bau 非常熟悉这样一个想法：计算机系统变得如此复杂，以至于很难跟踪它们的运行方式。「我做了 20 年的软件工程师，研究非常复杂的系统。这个问题总是存在的。」Bau 说。但 Bau 说，使用传统软件，具有内部知...

人工智能 2024-05-27 人工智能

848阅读

【带文字的图像生成-附开源代码】AIGC 如何在图像中准确生成文字？字体篇（上）

文字图像生成是什么？ “文字图像生成（Text-image generation）”即生成带有指定文字的图像。如下图所示，市面常见的通用文生图很难准确地生成带有指定文字的图像。文字图像生成也被称为文本渲染（Text rendering）。为什么重要？...

AIGC 2024-05-27 人工智能

1584阅读

研究称GPT-4 选股准确率高达 60%，被质疑数据污染

最近，一篇芝大论文引发了业内的热议，研究发现 GPT-4在选股方面的准确率高达60%，超越了大部分人类股票分析师和专业模型。这一发现让人们开始怀疑人类股票分析师是否将面临下岗的风险。然而，一些 AI 大牛对这项研究提出了质疑，指出可能存在训练数据污染的问题...

AIGC 2024-05-27 人工智能

841阅读

芝大论文证明GPT-4选股准确率高达60%，人类股票分析师要下岗？AI大牛质疑数据污染

最近，各位业内大咖都被芝大的一篇论文震惊了。研究者发现，由GPT-4帮忙选择的股票，直接击败了人类！同时也pk掉了许多其他针对金融训练的机器学习模型。最让他们震惊的是，LLM可以在没有任何叙述上下文的情况下，就成功分析财务报表中的数字！图片论文地...

生成式AI 2024-05-27 人工智能

870阅读

一文深度剖析 ColBERT

近年来，向量搜索领域经历了爆炸性增长，尤其是在大型语言模型（LLMs）问世后。学术界开始重点关注如何通过扩展训练数据、采用先进的训练方法和新的架构等方法来增强 embedding 向量模型。在之前的文章中，我们已经深入探讨了各种类型的 embeddin...

大数据 2024-05-27 人工智能

896阅读

手撕Llama3第1层: 从零开始实现llama3

一、Llama3的架构在本系列文章中，我们从头开始实现llama3。 Llama3的整体架构：图片 Llama3的模型参数：让我们来看看这些参数在LlaMa 3模型中的实际数值。图片 [1] 上下文窗口（context-window）在实例化Lla...

人工智能 2024-05-27 人工智能

1914阅读

为何说小语言模型是AI界的下一大热门？

译者 | 布加迪审校 | 重楼在AI领域，科技巨头们一直在竞相构建越来越庞大的语言模型，如今出现了一个令人惊讶的新趋势：小就是大。随着大语言模型（LLM）方面的进展出现了停滞的迹象，研究人员和开发人员日益开始将注意力转向小语言模型（SLM）。这种紧凑...

生成式AI 2024-05-27 人工智能

826阅读

手把手教你用LoRA训练自己的Stable Diffusion模型

目录写在前面一、准备数据二、数据打标签三、执行训练四、执行推理 1.LoRA推理 2.全参数推理写在前面 Stable Diffusion大家已经很熟悉了，那么如何训练自己的sd模型呢，今天我就介绍一下用L...

AIGC 2024-05-27 人工智能

1454阅读

Copilot Workspace是GitHub对人工智能驱动的软件工程的诠释

软件开发的未来是人工智能驱动的集成开发环境吗？至少GitHub 是这样想的。在今年初秋于旧金山举行的 GitHub Universe 年度大会之前，GitHub 发布了 Copilot Workspace，这是一种开发环境，利用 GitHub 所称的...

大数据 2024-05-26 人工智能

879阅读

知识分享系列五：大模型与AIGC

大模型（LLM，Large Language Mode）是指通过在海量数据上依托强大算力资源进行训练后能完成大量不同下游任务的深度学习模型。大模型主要用于进行自然语言相关任务，给模型一些文本输入，它能返回相应的输出，完成的具体任务包括生成、分类、总结、改写...

人工智能 2024-05-26 人工智能

1045阅读

Llama 3 开源！手把手带你进行大模型推理，部署，微调和评估

节前，我们组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学，针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。基于大模型实践和技术交流，我...

AIGC 2024-05-25 人工智能

1215阅读

LLMs之Llama3：Llama-3的简介、安装和使用方法、案例应用之详细攻略

LLMs之Llama3：Llama-3的简介、安装和使用方法、案例应用之详细攻略导读：2024年4月18日，Meta 重磅推出了Meta Llama 3，本文章主要介绍了Meta推出的新的开源大语言模型Meta Llama 3。模型架构 Llam...

AIGC 2024-05-24 人工智能

2518阅读

LLaMA Factory多卡微调的实战教程

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机...

大数据 2024-05-24 人工智能

863阅读

一篇文章详细介绍Stable Diffusion模型原理及实现过程(附常用模型网站、下载方式)

目录前言何为Stable Diffusion模型？ Stable Diffusion工作原理： Stable Diffusion模型的应用场景 Stable Diffusion免费使用网站 stability.ai: 本地部...

人工智能 2024-05-24 人工智能

930阅读

探索AIGC技术：创新、挑战与责任

? 个人主页：Dikz12 ?格言：那些在暗处执拗生长的花，终有一日会馥郁传香欢迎大家?点赞✍评论⭐收藏 #如何看待AIGC技术？目录 AIGC简单介绍创新责任未来展望和挑战 AIGC简单介绍 AIGC是人...

大数据 2024-05-24 人工智能

801阅读

Stable Diffusion AI绘画

我们今天来了解一下最近很火的SD模型 ✨在人工智能领域，生成模型一直是研究的热点之一。随着深度学习技术的飞速发展，一种名为Stable Diffusion的新型生成模型引起了广泛关注。Stable Diffusion是一种基于概率的生成模型，它可以学...

生成式AI 2024-05-24 人工智能

800阅读

AIGC实战——基于Transformer实现音乐生成

AIGC实战——基于Transformer实现音乐生成 0. 前言 1. 音乐生成的挑战 2. MuseNet 3. 音乐数据 3.1 巴赫大提琴组曲数据集 3.2 解析 MI...

人工智能 2024-05-24 人工智能

820阅读

LLaMA Factory单机微调的实战教程

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机...

AIGC 2024-05-24 人工智能

861阅读