训练数据第4页 - AIGC资讯

阿里开源新模型：超GPT-4o，数学能力全球第一！

阿里巴巴开源了最新数学模型Qwen2-Math，一共有基础和指令微调两种版本，包括1.5B、7B和72B三种参数。根据阿里在主流数学基准测试显示，Qwen2-Math-72B指令微调版本的性能超过了GPT-4o、Cloude-3.5-Sonnet、Gem...

AIGC 2024-08-09 人工智能

849阅读

入职一年半，这个AI员工晋升为了国内首位AI架构师

你敢想，AI 已经不满足只做程序员了，如今又向架构师这一进阶职业发起挑战。随着 AI 在研发领域的不断进化，能提供给工程师的助力越来越多，从原先单纯的编码加速器不断延展到架构理解、质量分析、安全扫描、测试生成等更多领域。同时结合 RAG 技术的不断落地应...

AIGC 2024-08-08 人工智能

867阅读

谷歌发布大模型数据筛选方法：效率提升13倍，算力降低10倍

随着GPT-4o、Gemini等多模态大模型的出现，对训练数据的需求呈指数级上升。无论是自然语言文本理解、计算机视觉还是语音识别，使用精心标注的数据集能带来显著的性能提升，同时大幅减少所需的训练数据量。但目前多数模型的数据处理流程严重依赖于人工筛选，不仅...

AIGC 2024-08-08 人工智能

1060阅读

Meta发布Llama 3.1 405B模型：开源与闭源模型之争的新篇章

引言在人工智能领域，开源与闭源模型之争一直是热点话题。近日，Meta发布了最新的Llama 3.1 405B模型，以其强大的性能和庞大的参数规模，成为了开源模型中的佼佼者。本文将详细介绍Llama 3.1 405B模型的性能、功能及其在开源领域的影响...

大数据 2024-08-05 人工智能

889阅读

Llama-3的安装和使用方法和案例应用

LLMs之Llama3：LLama-3是一款非常实用的自然语言处理工具，支持多种自然语言处理任务，如文本分类、情感分析、命名实体识别等。下面是LLama-3的简介、安装和使用方法、案例应用之详细攻略。一、简介 LLama-3是一款基于LLama模型的...

大数据 2024-08-05 人工智能

1524阅读

Stable Diffusion教程：如何实现人脸一致

在AI绘画中，一直都有一个比较困难的问题，就是如何保证每次出图都是同一个人。今天就这个问题分享一些个人实践，大家和我一起来看看吧。一. 有哪些实现方式方式1：固定Seed种子值。固定Seed种子值出来的图片人物确实可以做到一致，但Seed种子值...

AIGC 2024-08-04 人工智能

1185阅读

炫彩华章——“Awesome-Chinese-Stable-Diffusion”：中文世界里的创意魔法

炫彩华章——“Awesome-Chinese-Stable-Diffusion”：中文世界里的创意魔法在当今数字化浪潮席卷全球的时代背景下，“Awesome-Chinese-Stable-Diffusion”犹如一道绚丽的彩虹，横跨东西方文化桥梁之上，...

大数据 2024-08-04 人工智能

866阅读

Ubuntu部署Stable Diffusion WebUI应用

本文主要讲述Ubuntu部署Stable Diffusion WebUI应用的部署教程，及在部署过程中可能遇到的问题及解决方法。 1. 部署教程本次安装教程使用的系统配置是: CPU ：10核，内存：220GB GPU ：L20，...

人工智能 2024-08-04 人工智能

1347阅读

生成式AI绘画背景下的伦理问题

摘要随着生成式人工智能（AIGC）技术的不断演进和普及，其应用领域已从科研领域的结构化模拟逐步扩展至人们的日常生活。当前，生成式AI科学的发展正进入一个以跨学科融合为特征的崭新阶段，其持续创新推动中发挥着强大动力作用。然而，...

大数据 2024-08-03 人工智能

1444阅读

META 备受期待的 Llama 3 405B 即将发布

本心、输入输出、结果文章目录 META 备受期待的 Llama 3 405B 即将发布前言 Llama 3 405B或许会彻底改变专用模型的数据质量 Llama 3 405B将形成新...

大数据 2024-08-03 人工智能

917阅读

深度学习论文: LLaMA: Open and Efficient Foundation Language Models

深度学习论文: LLaMA: Open and Efficient Foundation Language Models LLaMA: Open and Efficient Foundation Language Models PDF:https://ar...

AIGC 2024-08-02 人工智能

1046阅读

大模型行业，根本没有什么“真”开源？

最近一段时间开源大模型市场非常热闹，先是苹果开源了 70 亿参数小模型DCLM，然后是重量级的Meta的Llama 3.1 和Mistral Large2 相继开源，在多项基准测试中Llama 3. 1 超过了闭源SOTA模型。不过开源派和闭源派之间的争...

人工智能 2024-08-01 人工智能

881阅读

【07】LLaMA-Factory微调大模型——微调模型导出与微调参数分析

上文介绍了如何对微调后的模型进行使用与简单评估。本文将介绍对微调后的模型进行导出的过程。一、llama-3微调后的模型导出首先进入虚拟环境，打开LLaMA-Factory的webui页面 conda activate GLM cd LLaMA-F...

生成式AI 2024-07-31 人工智能

1980阅读

使用LLaMA-Factory对Llama3-8B-Chinese-Chat进行微调

文章目录模型及数据：模型下载数据 LLaMA-Factory启动拉取代码启动webui 模型训练数据导入数据预览设置模型路径配置参数及参数的保存开始训练过程观察加载模型、对话模型导出、再次加载...

人工智能 2024-07-31 人工智能

1346阅读

我国发布首个亿级参数量地震波大模型：名为“谛听”

快科技7月29日消息，据成都科技局官方公众号介绍，日前谛听”地震波大模型在四川成都发布。谛听”由国家超级计算成都中心、中国地震局地球物理研究所以及清华大学联合开发，是首个亿级参数量的地震波大模型。同时，谛听”也是目前国内外最大规模、样本类型和标注最为全...

大数据 2024-07-30 人工智能

898阅读

Unsloth 微调 Llama 3

本文参考：https://colab.research.google.com/drive/135ced7oHytdxu3N2DNe1Z0kqjyYIkDXp 改编自：https://blog.csdn.net/qq_38628046/article/det...

AIGC 2024-07-30 人工智能

1219阅读

一文速览Llama 3.1——对其92页paper的全面细致解读：涵盖语言、视觉、语音的架构、原理

前言按我原本的计划，我是依次写这些文章：解读mamba2、解读open-television、我司7方面review微调gemma2，再接下来是TTT、nature审稿微调、序列并行、Flash Attention3.. 然TTT还没写完，7.23日...

人工智能 2024-07-29 人工智能

1216阅读

【AIGC】Llama-3 官方技术报告

Llama-3 技术报告（中文翻译）欢迎关注【youcans的AGI学习笔记】原创作品 0. 简介现代人工智能（AI）系统的核心驱动力来自于基础模型。本文介绍了一组新的基础模型，称为 Llama 3。它是一个语言模型系列，原生支持多语言...

大数据 2024-07-29 人工智能

1477阅读

AIGC学习笔记—LLM（前言）

大语言模型本身我不是很了解，但是掌握一些基础的知识点，由于要准备某个公司的二面，所以浅学一下这个技术，也是边摸索边学习...... 首先，我先简单的解释一下大模型，大模型是指具有大规模参数和复杂计算结构的机器学习模型，通常由深度神经网络构建而成，拥有数十...

生成式AI 2024-07-28 人工智能

923阅读

AI多模态模型架构之LLM主干(3)：Llama系列

〔探索AI的无限可能，微信关注“AIGCmagic”公众号，让AIGC科技点亮生活〕本文作者：AIGCmagic社区刘一手前言 AI多模态大模型发展至今，每年都有非常优秀的工作产出，按照当前模型设计思路，多模态大模型的架构主要包括...

大数据 2024-07-28 人工智能

1363阅读

LLama 405B 技术报告解读

LLama 405B 技术报告解读果然传的消息都是真的，meta在24号凌晨发布了llama 3的405B版本，这次还是做一个技术报告解读。值得一提的是，在技术报告的开头，meta特意强调了一个 Managing complexity，大意是管控...

生成式AI 2024-07-27 人工智能

1003阅读

第43篇：实现企业级大型AIGC项目：模型并行与分布式训练

在构建企业级大型AIGC（人工智能生成内容）项目时，模型并行与分布式训练是提升计算效率和处理能力的关键技术。随着模型规模和数据量的不断增长，单台设备的计算能力往往无法满足需求。因此，利用多台设备进行并行计算和分布式训练成为了必然选择。本文将深入讲解模型并行...

人工智能 2024-07-27 人工智能

880阅读

【AI绘画教程】Stable Diffusion 1.5 vs 2

在本文中，我们将总结稳定扩散 1 与稳定扩散 2 辩论中的所有要点。我们将在第一部分中查看这些差异存在的实际原因，但如果您想直接了解实际差异，您可以跳下否定提示部分。让我们开始吧！ Stable Diffusion 2.1 发布与1.5相比，2.1旨...

生成式AI 2024-07-27 人工智能

2937阅读

自回归模型胜过扩散模型：用于可扩展图像生成的 Llama

? 文献卡 Autoregressive Model Beats Diffusion: Llama for Scalable Image Generation 作者: Peize Sun; Yi Jiang; Shoufa Chen; Shil...

人工智能 2024-07-27 人工智能

1212阅读

SD教程| 如何撰写一个优秀的 stable diffusion 提示词？

大家好我是极客菌！！！在本文中，我将详细介绍如何撰写一个优秀的提示词。首先，需要明确的是，称一种方式为好，并不意味着你只能使用这种方式，就像我们都知道一些书籍是好书，但并不意味着每个人都只能阅读这些书一样。通过学习其中一种好的方式，可以建立起一些概念，...

人工智能 2024-07-26 人工智能

1004阅读

LlaMa 2

目录 LlaMa 2 介绍： Llama 的诞生： Llama 2 的训练数据集是如何构建和选择的？ Llama 2 在自然语言处理（NLP）任务中的具体应用案例有哪些？ Llama 2 模型在商业应用中的表现如何，有哪些成功案例？ Ll...

大数据 2024-07-25 人工智能

831阅读

AI训AI惨遭投毒9次大崩溃，牛津剑桥等惊天发现登Nature封面！

9次迭代后，模型开始出现诡异乱码，直接原地崩溃!就在今天，牛津、剑桥等机构的一篇论文登上了Nature封面，称合成数据就像近亲繁殖，效果无异于投毒。有无破解之法?那就是——更多使用人类数据! 用AI生成的数据训练AI，模型会崩溃? 牛津、剑桥、帝国理工、多...

人工智能 2024-07-25 人工智能

999阅读

【大语言模型LLMs】Llama系列简介

【大语言模型LLMs】Llama系列简介文章目录【大语言模型LLMs】Llama系列简介 1. LLaMa 1.1 引言 1.2 方法 1.2.1 预训练数据 1.2.2 架构 1.2.3 优化器 1.2.4 效率 2....

大数据 2024-07-24 人工智能

1309阅读

Stable Diffusion工作原理一篇文章带你详解！

前言翻译自How does Stable Diffusion work? 1. SD能做什么最基本的功能是：文生图（text-to-image） SD以文字提示为输入，输出与提示相配的图像 2. 扩散模型 SD属于扩散模...

大数据 2024-07-24 人工智能

1153阅读

AIGC背后的技术基石：自然语言处理与机器学习

目录 AIGC背后的技术基石：自然语言处理与机器学习自然语言处理（NLP）机器学习 AIGC的应用 AIGC背后的技术基石：自然语言处理与机器学习自然语言处理（NLP）和机器学习是构建AI教学工具"风变科技"中的语言模型所依赖的重要...

AIGC 2024-07-23 人工智能

924阅读

半年过去，AI视频卷到哪儿了？

自从今年年初Sora露面后，国内国外都想用AI颠覆好莱坞，近期的AI视频圈更是十分热闹，产品一个接一个发布，都喊着要赶超Sora。国外两家AI视频初创公司率先开打，旧金山人工智能科技公司Luma推出Dream Machine视频生成模型，并扔出堪称电影级...

生成式AI 2024-07-23 人工智能

875阅读

首个超越GPT4o级开源模型！Llama 3.1泄密：4050亿参数，下载链接、模型卡都有了

Llama3.1终于现身了，不过出处却不是 Meta 官方。今日，Reddit 上新版 Llama 大模型泄露的消息遭到了疯传，除了基础模型，还包括8B、70B 和最大参数的405B 的基准测试结果。下图为 Llama3.1各版本与 OpenAI G...

生成式AI 2024-07-23 人工智能

827阅读

Llama 3模型：更自由、更强大的AI对话体验

引言人工智能领域正在经历一场革命，大型语言模型（LLM）的不断进步正在重塑我们与机器交互的方式。在这个快速发展的领域中，Meta公司推出的Llama系列模型一直备受关注。最新发布的Llama 3模型在多个方面都展现出了显著的进步，尤其是在减少不必要的...

人工智能 2024-07-22 人工智能

1081阅读

Stable Diffusion保姆级安装指南！（附2024安装包）

软件下载 [软件名称]：Stable Diffusion 4.8 [软件大小]：16.45G [安装环境]：Win10~Win11或更高 [下载通道]：软件介绍 Stable Diffusion v4.8简称SD是目前最火的...

生成式AI 2024-07-22 人工智能

2326阅读

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mistral 7B全开源

【新智元导读】小模型时代来了?OpenAI带着GPT-4o mini首次入局小模型战场，Mistral AI、HuggingFace本周接连发布了小模型。如今，苹果也发布了70亿参数小模型DCLM，性能碾压Mistral-7B。小模型的战场，打起来了!...

生成式AI 2024-07-22 人工智能

943阅读

AI绘画出来的作品有哪些特点？

AI绘画作品的特点包括： 1. 风格多样化：AI绘画可以模拟各种艺术风格，使得作品具有很强的艺术感和视觉冲击力。 2. 色彩饱满：AI绘画生成的色彩丰富且鲜艳，往往能够吸引人们的注意力。 3. 细节丰富：AI绘画生成的图像具有丰富的细节和纹理，这些细...

大数据 2024-07-22 人工智能

1747阅读

「数据墙」迫近？苹果OpenAI等巨头走投无路，被迫「偷师」YouTube视频！

【新智元导读】近日，《连线》杂志联合ProofNews联合发表一篇调查文章，指责苹果、Anthropic等科技巨头未经许可使用YouTube视频训练AI模型。但训练数据的使用边界究竟在哪里?创作者、大公司和开发者正在陷入知识产权的罗生门…… AI科技巨头的...

人工智能 2024-07-21 人工智能

820阅读

LLaMA-Factory/scripts/length_cdf.py 源码解析

这段代码定义了一个函数 length_cdf，用来计算和打印数据集样本长度的累积分布函数（CDF），并在脚本直接运行时通过 fire 库将该函数暴露为命令行接口。我们逐行解释这段代码： python 复制 from llmtuner.data imp...

大数据 2024-07-21 人工智能

1253阅读

AI绘画：多种XP一次满足（Stable Diffusion进阶篇：模型训练）

前言今天，是一个比较特殊的日子。从我开始学习AI绘画开始到现在AI工具相关的笔记我已经写了50篇了，其中估摸着得近40篇都是关于Stable Diffusion的。在这一天天的学习中我感受到了对知识的疲倦，是时候给自己来点奖励了！所以...

大数据 2024-07-20 人工智能

951阅读

【AIGC调研系列】VILA-1.5版本的视频理解功能如何

VILA-1.5版本的视频理解功能表现出色，具有显著的突破。这一版本不仅增强了视频理解能力，还提供了四种不同规模的模型供用户选择，以适应不同的应用需求和计算资源限制[1][2][3]。此外，VILA-1.5支持在笔记本等边缘设备上部署，这得益于其高效的模型...

AIGC 2024-07-20 人工智能

1619阅读

Stable Diffusion模型训练 — Embeddings（附Demo）

文本反演提到文本反演你可能会比较陌生，但它产出的模型类型Embeddings（词嵌入）一定是你出图过程里经常会使用到的，它是一种轻量、小巧的微调模型格式，文件名后缀一般为.pt（或.safetensor），每个Embeddings文件的大小在几KB到几...

大数据 2024-07-20 人工智能

1342阅读

提示词用上“过去式“，秒破GPT4o等六大模型安全限制！中文语境也好使

只要在提示词中把时间设定成过去，就能轻松突破大模型的安全防线。而且对GPT-4o尤其有效，原本只有1%的攻击成功率直接飙到88%，几乎是“有求必应”。有网友看了后直言，这简直是有史以来最简单的大模型越狱方式。来自洛桑联邦理工学院的一篇最新论文，揭开...

大数据 2024-07-20 人工智能

912阅读

阿里云全面升级GPU云服务：AI大模型推理性能可提升100%

快科技7月19日消息，阿里云推出全面升级的GPU云服务，通过全新优化GPU套件，多GPU推理服务性能可最大提升100%。针对调用GPU算力最常用的容器技术，阿里云推出ACK云原生AI套件，帮助开发者及企业更高效地开发和部署AI应用，加速大模型应用落地。...

大数据 2024-07-19 人工智能

892阅读

【科学研究】AIGC可版权性认定的一般规则构建

::: block-1 “时问桫椤”是一个致力于为本科生到研究生教育阶段提供帮助的不太正式的公众号。我们旨在在大家感到困惑、痛苦或面临困难时伸出援手。通过总结广大研究生的经验，帮助大家尽早适应研究生生活，尽快了解科研的本质。祝一切顺利！——时问桫椤非...

人工智能 2024-07-19 人工智能

978阅读

AIGC从入门到实战：ChatGPT 简介：从 GPT1 到 GPT4 的发展历程和应用领域

AIGC从入门到实战：ChatGPT 简介：从 GPT1 到 GPT4 的发展历程和应用领域 1. 背景介绍 1.1 问题的由来自然语言处理(Natural Language Processing, NLP 是人工智能(Artificial...

生成式AI 2024-07-18 人工智能

896阅读

大模型学习笔记3【大模型】LLaMA学习笔记

文章目录学习内容 LLaMA LLaMA模型结构 LLaMA下载和使用好用的开源项目[Chinese-Alpaca](https://github.com/ymcui/Chinese-LLaMA-Alpaca Chinese-Alpaca...

人工智能 2024-07-18 人工智能

1024阅读

Stable Diffusion背后的技术原理与实现细节

Stable Diffusion背后的技术原理与实现细节 I. 引言 A. Stable Diffusion的定义 B. 技术重要性概述 C. 本文目标与结构 II. 深度学习与图像生成 A. 深度学习简介 B. 图像生成任务 C. 生成...

人工智能 2024-07-18 人工智能

1152阅读

AI写作会重复吗？七个角度解析疑虑

大家好，今天来聊聊AI写作会重复吗？七个角度解析疑虑，希望能给大家提供一点参考。以下是针对论文AI辅写率高的情况，提供一些修改建议和技巧，可以借助此类工具：还有：标题：AI写作会重复吗？七个角度解析疑虑随着人工智能技术的迅猛发展，A...

人工智能 2024-07-17 人工智能

1136阅读

Stable Diffusion：解锁AIGC的图像生成新纪元

Stable Diffusion：解锁AIGC的图像生成新纪元 I. 引言 A. Stable Diffusion的概念与重要性 B. AIGC图像生成的历史背景 C. Stable Diffusion技术的兴起 II. Stable Di...

生成式AI 2024-07-16 人工智能

1049阅读

万字长文破解 AI 图片生成算法-Stable diffusion (第一篇）

想象一下：你闭上眼睛，脑海中构思一个场景，用简短的语言描述出来，然后“啪”的一声，一张栩栩如生的图片就出现在你眼前。这不再是科幻小说里才有的情节，而是Stable Diffusion——一种前沿的AI图片生成算法——所带来的现实。在本系列的万字长...

AIGC 2024-07-16 人工智能

1022阅读