预训练第20页 - AIGC资讯

AIGC专题：2023生成式人工智能发展与监管白皮书-中国AI治理的独立思考

今天分享的是AIGC系列深度研究报告：《AIGC专题：2023生成式人工智能发展与监管白皮书-中国AI治理的独立思考》。（报告出品方：南方财经全媒体集团）报告共计：42页来源：人工智能学派发展：生成式 AI 治理的第一视角 2022年 1...

生成式AI 2024-03-02 人工智能

923阅读

近屿智能独家发布：AIGC大模型工程师和产品经理详细学习路径图（附完整版学习路径图）

AI不会取代你的工作，会取代你的是懂AI的人，如何提升自己与他人的知识壁垒，如何学习AIGC？相信在刚刚过去2023这个AI爆发的元年，我相信也是很多人的疑问，好像不懂使用点AI工具，例如ChatGpt、Midjourney或者SD，就好像被淘汰了一样，更...

生成式AI 2024-03-01 人工智能

794阅读

京东电商知识图谱与AIGC落地

导读本文将分享如何将知识图谱应用到电商场景下的 AIGC。文章将围绕下面五个方面进行分享： 1. 导言 2. 基于领域知识图谱的商品文案生成 3. 基于通用知识图谱的商品文案生成 4. 基于领域知识图谱的 LLM 5. 基于通用知识图谱的...

人工智能 2024-03-01 人工智能

984阅读

60行代码，从头开始构建GPT！最全实践指南来了

60行代码，从头开始构建GPT？最近，一位开发者做了一个实践指南，用Numpy代码从头开始实现GPT。你还可以将 OpenAI发布的GPT-2模型权重加载到构建的GPT中，并生成一些文本。话不多说，直接开始构建GPT。什么是GPT？ GPT代...

生成式AI 2024-03-01 人工智能

1010阅读

ControlNet作者新作：AI绘画能分图层了！项目未开源就斩获660 Star

“绝不是简单的抠图。” ControlNet作者最新推出的一项研究受到了一波高度关注—— 给一句prompt，用Stable Diffusion可以直接生成单个或多个透明图层（PNG）！例如来一句：头发凌乱的女性，在卧室里。Woman with me...

人工智能 2024-03-01 人工智能

943阅读

陈丹琦团队新作：Llama-2上下文扩展至128k，10倍吞吐量仅需1/6内存

陈丹琦团队刚刚发布了一种新的LLM上下文窗口扩展方法：它仅用8k大小的token文档进行训练，就能将Llama-2窗口扩展至128k。最重要的是，在这个过程中，只需要原来1/6的内存，模型就获得了10倍吞吐量。除此之外，它还能大大降低训练成本：...

人工智能 2024-02-29 人工智能

849阅读

AI视频又炸了！照片+声音变视频，阿里让Sora女主唱歌小李子说RAP

Sora之后，居然还有新的AI视频模型，能惊艳得大家狂转狂赞！图片有了它，《狂飙》大反派高启强化身罗翔，都能给大伙儿普法啦（狗头）。这就是阿里最新推出的基于音频驱动的肖像视频生成框架，EMO（Emote Portrait Alive）。有了它，...

AIGC 2024-02-29 人工智能

890阅读

英伟达发布Nemotron-4:150亿参数通用大模型，目标单张A100/H100可跑

英伟达最新推出的Nemotron-4语言模型引起广泛关注。这一通用大模型拥有150亿参数，经过在8T token上的训练，在英语、多语言和编码任务中表现出色。具体而言，Nemotron-4在7个评估基准上的15B模型表现优异，超越同等参数规模的模型，甚至击...

人工智能 2024-02-29 人工智能

885阅读

英伟达最强通用大模型Nemotron-4登场！15B击败62B，目标单张A100/H100可跑

最近，英伟达团队推出了全新的模型Nemotron-4，150亿参数，在8T token上完成了训练。值得一提的是，Nemotron-4在英语、多语言和编码任务方面令人印象深刻。论文地址：https://arxiv.org/abs/2402.1681...

AIGC 2024-02-29 人工智能

877阅读

理解Stable Diffusion、LoRA、Dreambooth、Hypernetworks、Textual Inversion、Checkpoint

前言在深度学习和人工智能的领域中，模型生成和调整技术的快速发展为创造性内容的自动化提供了新的可能性。本文将介绍四种重要的模型技术——Stable Diffusion、LoRA、Dreambooth、和Hypernetworks——它...

大数据 2024-02-29 人工智能

1165阅读

金融分析多模态LLM FinTral:基于Mistral-7B模型得分接近GPT-4

近日，来自不列颠哥伦比亚大学和Invertible AI的研究人员推出了一款具有突破性的大型语言模型（LLM）——FinTral，专为金融领域量身定制。FinTral采用了多模态方法，能够处理文本、数字、表格和视觉数据，以应对金融文件的复杂性。该模型引入了...

生成式AI 2024-02-29 人工智能

1065阅读

AIGC专栏9——Scalable Diffusion Models with Transformers （DiT）结构解析

AIGC专栏9——Scalable Diffusion Models with Transformers （DiT）结构解析学习前言源码下载地址网络构建一、什么是Diffusion Transformer (DiT 二、DiT的组成...

人工智能 2024-02-28 人工智能

1365阅读

【AIGC】Stable Diffusion的模型微调

为什么要做模型微调模型微调可以在现有模型的基础上，让AI懂得如何更精确生成/生成特定的风格、概念、角色、姿势、对象。Stable Diffusion 模型的微调方法通常依赖于您要微调的具体任务和数据。下面是一个通用的微调过程的概述：准备数据集：...

人工智能 2024-02-28 人工智能

1065阅读

LLaMA v1/2模型结构总览

LLaMA v1/2模型结构总览孟繁续目录收起结构 Group Query Attention(V2 only RMSNorm SwiGLU RoPE llama2 出来了，并且开源可商用，这下开源社区又要变天了。快速...

生成式AI 2024-02-28 人工智能

1341阅读

当"狂飙"的大模型撞上推荐系统

随着以 ChatGPT 为代表的大模型技术的迅速发展，推荐系统正经历着一场革命性的变革。传统的推荐系统主要基于用户和物品的历史行为数据进行预测，大模型技术的出现，为推荐系统带来了更强的泛化能力和更高的效率，解决了传统推荐系统中的一些难题，如用户和物品...

AIGC 2024-02-28 人工智能

958阅读

近屿智能发布AIGC大模型工程师和产品经理学习路径图

近日，上海近屿智能科技有限公司（下称“近屿智能”），基于其在大模型研发和产品设计领域深厚的专业积累，终于总结出AIGC大模型工程师与产品经理的学习路线图。该学习路线图不仅为追求专业发展的学习者提供了一条清晰明确的AIGC大模型学习路径，更为整个AIGC大模...

生成式AI 2024-02-28 人工智能

919阅读

一次性搞懂什么是AIGC！

你知道什么是AIGC吗？不知道？没关系，我来告诉你。AIGC就是人工智能生成内容（Artificial Intelligence Generative Content），也就是让AI自己动手创作各种各样的内容，比如图片、视频、音乐、文字等等。听起来很酷吧？...

AIGC 2024-02-27 人工智能

945阅读

ChatMusician官网体验入口 AI音乐生成语言模型在线使用地址

ChatMusician是一个开源的大型语言模型（LLM），它通过持续的预训练和微调，集成了音乐能力。该模型基于文本兼容的音乐表示法（ABC记谱法），将音乐视为第二语言。ChatMusician能够在不依赖外部多模态神经结构或分词器的情况下，理解和生成音乐...

生成式AI 2024-02-27 人工智能

863阅读

MobiLlama官网体验入口手机端小型AI语言模型免费下载地址

MobiLlama是一个为资源受限设备设计的小型语言模型（SLM），旨在提供准确且轻量级的解决方案，满足设备上的处理需求、能效、低内存占用和响应效率。MobiLlama从更大的模型出发，通过精心设计的参数共享方案来降低预训练和部署成本。点击前往Mobi...

人工智能 2024-02-27 人工智能

906阅读

端侧最强，Meta田渊栋等人卷10亿以下参数小模型，LeCun：小技巧启动

「在移动设备上运行 LLM？可能需要 Meta 的一些技巧。」刚刚，图灵奖得主 Yann LeCun 在个人社交平台表示。他所宣传的这项研究来自 Meta 最新论文《 MobileLLM: Optimizing Sub-billion Paramet...

大数据 2024-02-27 人工智能

818阅读

Mistral AI新模型对标GPT-4，不开源且与微软合作，网友：忘了初心

生成式 AI 领域，又有重量级产品出现。周一晚间，Mistral AI 正式发布了「旗舰级」大模型 Mistral Large。与此前的一系列模型不同，这次 Mistral AI 发布的版本性能更强，体量更大，直接对标 OpenAI 的 GPT-4。而...

人工智能 2024-02-27 人工智能

827阅读

跨越千年医学对话：用AI技术解锁中医古籍知识，构建能够精准问答的智能语言模型，成就专业级古籍解读助手（LLAMA）

跨越千年医学对话：用AI技术解锁中医古籍知识，构建能够精准问答的智能语言模型，成就专业级古籍解读助手（LLAMA）介绍：首先在 Ziya-LLaMA-13B-V1基线模型的基础上加入中医教材、中医各类网站数据等语料库，训练出一个具有中医知识理解力的预...

大数据 2024-02-27 人工智能

921阅读

详解各种LLM系列｜（2）LLaMA 2模型架构、预训练、SFT内容详解 (PART-1)

一、引言 Llama 2是Meta在LLaMA基础上升级的一系列从 7B到 70B 参数的大语言模型。Llama2 在各个榜单上精度全面超过 LLaMA1，Llama 2 作为开源界表现最好的模型之一，目前被广泛使用。为了更深入地理解Llama 2的...

大数据 2024-02-27 人工智能

1447阅读

高质量论文中文翻译：Lag-Llama: 朝向基础模型的概率时间序列预测 Lag-Llama: Towards Foundation Models for Probabilistic Time S

Lag-Llama: 朝向基础模型的概率时间序列预测Lag-Llama: Towards Foundation Models for Probabilistic Time Series Forecasting 文章目录摘要介绍我们的贡献...

AIGC 2024-02-27 人工智能

1102阅读

全球最强开源大模型一夜易主！谷歌Gemma 7B碾压Llama 2 13B，今夜重燃开源之战

一声炸雷深夜炸响，谷歌居然也开源LLM了？！这次，重磅开源的Gemma有2B和7B两种规模，并且采用了与Gemini相同的研究和技术构建。有了Gemini同源技术的加持，Gemma不仅在相同的规模下实现SOTA的性能。而且更令人...

AIGC 2024-02-27 人工智能

876阅读

Llama中文大模型

关于Llama中文大模型欢迎来到Llama中文大模型：已经基于大规模中文数据，从预训练开始对Llama2模型进行中文能力的持续迭代升级。 Llama中文大模型：https://github.com/LlamaFamily/Llama-Chine...

人工智能 2024-02-27 人工智能

1380阅读

【AIGC】Diffusers:扩散模型的开发手册说明1

主要组件最先进的扩散管道 diffusion pipelines，只需几行代码即可进行推理。可交替使用的各种噪声调度器 noise schedulers，用于平衡生成速度和质量。预训练模型 models，可作为构建模块，并与调度程序结合使用，来...

AIGC 2024-02-26 人工智能

1258阅读

huggingface学习|用dreambooth和lora对stable diffusion模型进行微调

目录用dreambooth对stable-diffusion-v1-5模型进行微调（一）模型下载和环境配置（二）数据集准备（三）模型微调（四）运行微调后的模型用lora对stable-diffusion-v1-5模型进行微调...

生成式AI 2024-02-26 人工智能

1313阅读

VideoPrism官网体验入口 AI视频理解编码器使用介绍

VideoPrism是一个通用的视频编码模型，可在各种视频理解任务上取得领先的性能，包括分类、定位、检索、字幕生成和问答等。其创新点在于预训练的数据集非常大且多样，包含 3600 万高质量的视频-文本对，以及5. 82 亿带有嘈杂文本的视频剪辑。预训练采用...

AIGC 2024-02-26 人工智能

873阅读

人工智能和数据中心：为什么人工智能如此需要资源

到2023年底，对生成式人工智能将需要多少能源的任何预测都是不准确的。例如，头条新闻倾向于猜测“人工智能需要5倍、10倍、30倍的电力”和“足够运行10万户家庭的电力”等。与此同时，数据中心新闻等专业出版物的报道称，每机架的功率密度将上升到50kW或1...

生成式AI 2024-02-26 人工智能

840阅读

AI绘画的工具

AI绘画的工具包括一系列利用人工智能技术来辅助或生成艺术作品的应用程序和平台。以下是一些常见的AI绘画工具： DeepDream：由谷歌开发的工具，它使用神经网络来解释和修改图像，创造出梦幻般的、抽象的艺术效果。 RunwayML：提供了一...

人工智能 2024-02-26 人工智能

1062阅读

YOLO不死！YOLOv9出炉：性能速度SOTA~

本文经自动驾驶之心公众号授权转载，转载请联系出处。如今的深度学习方法专注于设计最适合的目标函数，以使模型的预测结果与实际情况最接近。同时，必须设计一个合适的架构，以便为预测获取足够的信息。现有方法忽略了一个事实，即当输入数据经过逐层特征提取和空间变换...

人工智能 2024-02-26 人工智能

920阅读

【AIGC专题】Stable Diffusion 从入门到企业级实战0402

一、概述本章是《Stable Diffusion 从入门到企业级实战》系列的第四部分能力进阶篇《Stable Diffusion ControlNet v1.1 图像精准控制》第02节，利用Stable Diffusion Contr...

生成式AI 2024-02-26 人工智能

890阅读

谷歌AI视频再出王炸！全能通用视觉编码器VideoPrism，性能刷新30项SOTA

AI视频模型Sora爆火之后，Meta、谷歌等大厂纷纷下场做研究，追赶OpenAI的步伐。最近，来自谷歌团队的研究人员提出了一种通用视频编码器——VideoPrism。它能够通过单一冻结模型，处理各种视频理解任务。图片论文地址：https://a...

大数据 2024-02-26 人工智能

896阅读

开源的Gemma 模型：Google 的语言奇迹，让你用指令调优、低秩适应和 Switch Transformer 玩转小模型

语言是人类最重要的交流工具，也是人工智能领域最具挑战性的研究对象。如何让机器理解和生成自然语言，是人工智能的一个核心问题，也是人类智能的一个重要标志。近年来随着深度学习的发展，语言模型（Language Model，LM）作为一种基于神经网络的自然语言处...

AIGC 2024-02-26 人工智能

925阅读

AIGC项目——Meta:根据对话音频生成带动作和手势的3d逼真数字人

From Audio to Photoreal Embodiment: Synthesizing Humans in Conversations From Audio to Photoreal Embodiment:Synthesizing Humans...

人工智能 2024-02-24 人工智能

962阅读

目标检测新SOTA：YOLOv9问世，新架构让传统卷积重焕生机

继 2023 年 1 月 YOLOv8 正式发布一年多以后，YOLOv9 终于来了！我们知道，YOLO 是一种基于图像全局信息进行预测的目标检测系统。自 2015 年 Joseph Redmon、Ali Farhadi 等人提出初代模型以来，领域内的研...

生成式AI 2024-02-23 人工智能

936阅读

EfficientViT-SAM：精度不变原地起飞！

作者提出了EfficientViT-SAM，这是一系列加速的SAM模型。在保留SAM轻量级的提示编码器和 Mask 解码器的同时，作者用EfficientViT替换了沉重的图像编码器。在训练方面，首先从SAM-ViT-H图像编码器向EfficientV...

大数据 2024-02-23 人工智能

1097阅读

【AIGC】一起学习prompt提示词（4/4）【经典】【15种提示词技巧】

写的时候并没有设计好，要做多少期，还是有始有终的比较好，为了方便阅读，我把之前的3期，改下名字，放到这里。【AIGC】一起学习prompt提示词（1/4）内容摘要：提示词是什么，百度文心一言的提示词是怎么定义的，创作中心如何玩。【AIGC】一起...

人工智能 2024-02-23 人工智能

878阅读

Llama 2论文详解

摘要 Llama 2是一组经过预训练和微调的大语言模型，参数规模从70亿到700亿不等，其中，Llama 2-Chat是针对对话用例进行优化的微调模型。在大多数基准测试中优于开源chat模型，在人类评估中表现出色，特别是在有用性和安全性方面。因此，Lla...

AIGC 2024-02-23 人工智能

920阅读

开源大模型王座易主！谷歌Gemma杀入场，笔记本可跑，可商用

刚刚，谷歌杀入开源大模型。开源领域大模型，迎来了重磅新玩家。谷歌推出了全新的开源模型系列「Gemma」。相比 Gemini，Gemma 更加轻量，同时保持免费可用，模型权重也一并开源了，且允许商用。 Gemma 官方页面：https://ai.goo...

人工智能 2024-02-23 人工智能

898阅读

模型融合、混合专家、更小的LLM，几篇论文看懂2024年LLM发展方向

在过去的 2023 年中，大型语言模型（LLM）在潜力和复杂性方面都获得了飞速的发展。展望 2024 年的开源和研究进展，似乎我们即将进入一个可喜的新阶段：在不增大模型规模的前提下让模型变得更好，甚至让模型变得更小。现在，2024 年的第一个月已经过去...

AIGC 2024-02-22 人工智能

1014阅读

谷歌最新开源的 Gemma 模型，秒杀 Llma-2！

Gemma 是什么 Gemma 是一个轻量级、最先进的开放式模型系列，采用了与创建 Gemini 模型相同的研究和技术。Gemma 由 Google DeepMind 和 Google 的其他团队共同开发，其灵感来源于双子座，名字反映了拉丁语 gemm...

生成式AI 2024-02-22 人工智能

1075阅读

【AI绘画】硬核解读Stable Diffusion（完整版）小白必收藏！！！

手把手教你入门绘图超强的AI绘画，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取） 2022年可谓是AIGC（AI Generated Content）元年，上半年有文生图大模型DALL-E2和Sta...

大数据 2024-02-22 人工智能

1217阅读

LLaMA 2 和 QianWen-14B

阿里云通义千问14B模型开源！性能超越Llama2等同等尺寸模型 - 科技新闻 - EDA365电子论坛网 LLaMA 2 的硬件要求： LLaMA 2 系列模型有不同的参数量版本，如7B、13B和70B等。对于不同大小的模型，其硬件需求也有所不同。以...

生成式AI 2024-02-22 人工智能

1315阅读

谷歌杀入开源大模型，单挑Meta Llama2，凭什么问鼎王座？

撰稿丨诺亚出品 | 51CTO技术栈（微信号：blog51cto）兵贵神速。在大模型的必争之地，谷歌却总是慢人一步，因而屡屡被调侃“起了大早，赶个晚集”。但昨日，谷歌却突放大招，发布了一款开放模型——Gemma，并声称其是轻量级中“最先进的”开放模型...

生成式AI 2024-02-22 人工智能

928阅读

全球最强开源大模型一夜易主！谷歌Gemma 7B碾压Llama 2 13B，重燃开源之战

一声炸雷深夜炸响，谷歌居然也开源LLM了？！这次，重磅开源的Gemma有2B和7B两种规模，并且采用了与Gemini相同的研究和技术构建。有了Gemini同源技术的加持，Gemma不仅在相同的规模下实现SOTA的性能。而且更令人印象深刻的是，还...

生成式AI 2024-02-22 人工智能

850阅读

【AIGC】Stable Diffusion之模型微调工具

推荐一款好用的模型微调工具，cybertron furnace 是一个lora训练整合包，提供训练 lora 模型的工具集或环境。集成环境包括必要的依赖项和配置文件、预训练脚本，支持人物、二次元、画风、自定义lora的训练，以简化用户训练 lora 模型...

AIGC 2024-02-22 人工智能

1293阅读

腾讯会议AI小助手上线基于“混元”大模型打造

今天，腾讯公关总监张军激动地向公众宣布，腾讯会议AI小助手正式上线。他强调，这一创新应用代表了真正的大模型技术的力量。根据官方网站的详细介绍，这款AI小助手能够全面覆盖会议的各个环节。通过简洁自然的指令，它能够完成信息提取、内容分析、智能提醒等复杂任务...

生成式AI 2024-02-22 人工智能

998阅读

Gemma-7B官网体验入口谷歌开源人工智能AI模型免费下载地址

Gemma-7B是由谷歌开发的一个具有 70 亿参数的大型预训练语言模型，旨在提供强大的自然语言处理能力。它能够理解和生成文本，支持多种语言，适用于多种应用场景。点击前往Gemma-7B官网体验入口需求人群： ["内容创作"，"机器翻译"，"智能客服...

大数据 2024-02-22 人工智能

967阅读