训练数据集 - AIGC资讯

人工智能与知识产权：算法专利的争议

标题：人工智能与知识产权：算法专利的争议探讨随着科技的飞速发展，人工智能（AI）已成为推动社会进步的关键力量，其广泛应用在医疗、教育、金融、制造业等多个领域，极大地提高了生产效率，改善了人们的生活质量。然而，AI技术的快速发展也引发了一系列法律与伦理问题，...

大数据 2025-07-07 人工智能

627阅读

ai安全：从数据投毒到对抗样本的防御策略

标题：AI安全：从数据投毒到对抗样本的防御策略随着人工智能技术的飞速发展，其在各个领域的应用日益广泛，从自动驾驶汽车到医疗诊断，从金融分析到智能客服，AI正深刻改变着我们的生活与工作方式。然而，与AI技术的广泛应用相伴而来的，是日益凸显的安全问题。其中，数...

人工智能 2025-06-30 人工智能

692阅读

数据挖掘中的分类与聚类技术

数据挖掘，作为现代信息技术的重要组成部分，旨在从海量、复杂的数据集中提取有价值的信息和知识。在这一过程中，分类与聚类技术扮演着举足轻重的角色，它们不仅是数据分析的核心手段，也是实现数据智能化应用的关键技术。本文将深入探讨数据挖掘中的分类与聚类技术，阐述其基...

人工智能 2025-06-22 大数据

404阅读

军事ai训练数据的可信管理

标题：军事AI训练数据的可信管理：挑战与策略随着人工智能技术的飞速发展，其在军事领域的应用日益广泛，从自主无人系统的控制到情报分析的自动化，AI正逐步重塑现代战争的面貌。然而，AI系统的效能与可靠性很大程度上依赖于其训练数据的质量与管理。军事AI训练数据的...

生成式AI 2025-06-22 大数据

551阅读

数据挖掘的核心思想与方法论

数据挖掘，作为信息时代的一项重要技术，旨在从海量、复杂、无序的数据中提炼出有价值的信息和知识。其核心思想与方法论构成了这一领域的基石，不仅推动了数据科学的发展，也深刻影响了商业决策、科学研究、医疗健康等多个领域。本文将探讨数据挖掘的核心思想及其方法论，以期...

人工智能 2025-06-22 大数据

354阅读

决策树在数据挖掘中的应用

标题：决策树在数据挖掘中的应用探索随着信息技术的飞速发展，数据已成为现代社会中不可或缺的资源。如何从海量数据中提取有价值的信息，成为数据挖掘领域的重要课题。决策树作为一种直观且高效的分类与预测工具，在数据挖掘中扮演着至关重要的角色。本文将深入探讨决策树的基...

生成式AI 2025-06-21 大数据

348阅读

Meta Llama 3介绍及其关键技术

随着深度学习算法的突破和发展，语言模型已经成为连接人与机器的重要桥梁。在这一领域中，Meta的Llama 3 作为最新一代的大规模预训练模型，凭借其卓越的性能和广泛的应用前景，正逐渐成为行业内的佼佼者。 Llama 3 的研发团队继承了前代模型的技术优势...

AIGC 2024-09-30 人工智能

1446阅读

AIGC提示词（3）：AI的创造力之谜：相同提示词，不同内容

引言在这个数字化的时代，人工智能生成内容（AIGC）已经变得无处不在。想象一下，只需输入几个关键词，AI就能创作出各种内容，无论是文字、图片，还是其他形式。但这里有个有趣的问题：如果我们给AI相同的提示词，它们生成的内容会一样吗？这个问题触及了AI内...

AIGC 2024-09-28 人工智能

856阅读

LLaMA 数据集

LLaMA的训练数据集来源多样，涵盖了多个不同的数据集和预处理步骤。以下是详细的描述：公开数据来源和预处理 CommonCrawl [67%]：使用CCNet管道（Wenzek等人，2020年）对2017年至2020年间的五个Comm...

生成式AI 2024-09-25 人工智能

775阅读

【AIGC】InstructPixPix:基于文本引导的图像编辑技术

github:diffusers/examples/instruct_pix2pix/train_instruct_pix2pix_sdxl.py at main · huggingface/diffusers · GitHub 论文：https://a...

生成式AI 2024-09-22 人工智能

914阅读

使用LLaMA-Factory快速训练自己的专用大模型

本文聊聊 LLama-Factory，它是一个开源框架，这里头可以找到一系列预制的组件和模板，让你不用从零开始，就能训练出自己的语言模型（微调）。不管是聊天机器人，还是文章生成器，甚至是问答系统，都能搞定。而且，LLama-Factory 还支持多种框架和...

大数据 2024-09-21 人工智能

850阅读

AIGC-初体验

线性分类提问，目的试图让AI自动线性分类 A类：(10,21 ,（3,7）,(9,20）(121,242 B类：(3,9 ,(5,11 ,(70,212 ,(11,34 根据线性关系分类请问 (100,300 ，（100，201）属于哪一类下...

大数据 2024-09-21 人工智能

827阅读

AI绘画SD中，如何保持生成人物角色脸部一致？Stable Diffusion精准控制AI人像一致性两种实用方法教程！

大家好，程序员晓晓在AI绘画StableDiffusion中，一直都有一个比较困难的问题，就是如何保证每次出图都是同一个人。今天就这个问题分享一些个人实践，大家和我一起来看看吧。一. 有哪些实现方式方式1：固定Seed种子值。固定Seed种...

生成式AI 2024-09-14 人工智能

2091阅读

一文彻底搞懂 Fine-tuning - 超参数（Hyperparameter）

最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是，当前职场环境已不再是那个双向奔赴时代了。求职者在变多，HC 在变少，岗位要求还更高了。最近，我们又陆续整理了很多大厂的面试题，帮助一些球友解惑答疑，分享技术面试中的那些弯弯绕绕。《...

大数据 2024-09-09 人工智能

964阅读

服务器部署llama3 并利用LLaMA-Factory实现微调

llama3的编译环境要求：需要的软件，硬件资源： python=3.11 pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=12.2 第一步下载需要的pytho...

生成式AI 2024-08-31 人工智能

895阅读

基于华为昇腾910B和LLaMA Factory多卡微调的实战教程

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三...

大数据 2024-08-26 人工智能

2013阅读

GOLLIE : ANNOTATION GUIDELINES IMPROVE ZERO-SHOT INFORMATION-EXTRACTION

文章目录题目摘要引言方法实验消融研究题目 Techgpt-2.0:解决知识图谱构建任务的大型语言模型项目论文地址：https://arxiv.org/abs/2310.03668 摘要大...

生成式AI 2024-08-23 人工智能

772阅读

LLaMA-Factory 大模型微调超简单，从零开始玩转大模型微调

目录 LLaMA-Factory 大模型微调超简单，从零开始开始玩转大模型微调为什么要使用LLaMA-Factory进行微调？如何使用LLaMA-Factory进行微调？安装启动数据准备 Alpaca 格式指令监督微调数据集...

生成式AI 2024-08-15 人工智能

1723阅读

使用Llama-factory微调Llama3教程

一、登录OpenBayes进行注册登录通过以下链接，新用户注册登录 OpenBayes ，即可获得四个小时 RTX 4090免费使用时长！！注册链接:https://openbayes.com/console/signup?r=zzl99_W...

大数据 2024-08-13 人工智能

1280阅读

Stable Diffusion教程：如何实现人脸一致

在AI绘画中，一直都有一个比较困难的问题，就是如何保证每次出图都是同一个人。今天就这个问题分享一些个人实践，大家和我一起来看看吧。一. 有哪些实现方式方式1：固定Seed种子值。固定Seed种子值出来的图片人物确实可以做到一致，但Seed种子值...

AIGC 2024-08-04 人工智能

923阅读

Ubuntu部署Stable Diffusion WebUI应用

本文主要讲述Ubuntu部署Stable Diffusion WebUI应用的部署教程，及在部署过程中可能遇到的问题及解决方法。 1. 部署教程本次安装教程使用的系统配置是: CPU ：10核，内存：220GB GPU ：L20，...

人工智能 2024-08-04 人工智能

1000阅读

我国发布首个亿级参数量地震波大模型：名为“谛听”

快科技7月29日消息，据成都科技局官方公众号介绍，日前谛听”地震波大模型在四川成都发布。谛听”由国家超级计算成都中心、中国地震局地球物理研究所以及清华大学联合开发，是首个亿级参数量的地震波大模型。同时，谛听”也是目前国内外最大规模、样本类型和标注最为全...

大数据 2024-07-30 人工智能

633阅读

Unsloth 微调 Llama 3

本文参考：https://colab.research.google.com/drive/135ced7oHytdxu3N2DNe1Z0kqjyYIkDXp 改编自：https://blog.csdn.net/qq_38628046/article/det...

AIGC 2024-07-30 人工智能

867阅读

LlaMa 2

目录 LlaMa 2 介绍： Llama 的诞生： Llama 2 的训练数据集是如何构建和选择的？ Llama 2 在自然语言处理（NLP）任务中的具体应用案例有哪些？ Llama 2 模型在商业应用中的表现如何，有哪些成功案例？ Ll...

大数据 2024-07-25 人工智能

592阅读

LLaMA-Factory/scripts/length_cdf.py 源码解析

这段代码定义了一个函数 length_cdf，用来计算和打印数据集样本长度的累积分布函数（CDF），并在脚本直接运行时通过 fire 库将该函数暴露为命令行接口。我们逐行解释这段代码： python 复制 from llmtuner.data imp...

大数据 2024-07-21 人工智能

911阅读

Stable Diffusion背后的技术原理与实现细节

Stable Diffusion背后的技术原理与实现细节 I. 引言 A. Stable Diffusion的定义 B. 技术重要性概述 C. 本文目标与结构 II. 深度学习与图像生成 A. 深度学习简介 B. 图像生成任务 C. 生成...

人工智能 2024-07-18 人工智能

885阅读

Stable Diffusion：解锁AIGC的图像生成新纪元

Stable Diffusion：解锁AIGC的图像生成新纪元 I. 引言 A. Stable Diffusion的概念与重要性 B. AIGC图像生成的历史背景 C. Stable Diffusion技术的兴起 II. Stable Di...

生成式AI 2024-07-16 人工智能

743阅读

【大语言模型LLM】- Meta开源推出的新一代大语言模型 Llama 3

?博客主页：西瓜WiFi ?系列专栏：《大语言模型》很多非常有趣的模型，值得收藏，满足大家的收集癖！如果觉得有用，请三连?⭐❤️，谢谢！长期不定时更新，欢迎watch和fork！❤️❤️❤️ ❤️感谢大家点赞? 收藏⭐ 评论⭐ ?大语言模...

大数据 2024-07-08 人工智能

611阅读

在昇腾服务器上使用llama-factory对baichuan2-13b模型进行lora微调

什么是lora微调 LoRA 提出在预训练模型的参数矩阵上添加低秩分解矩阵来近似每层的参数更新，从而减少适配下游任务所需要训练的参数。环境准备这次使用到的微调框架是llama-factory。这个框架集成了对多种模型进行各种训练的代码，少...

人工智能 2024-07-07 人工智能

661阅读

Llama 3 超级课堂 -笔记

课程文档： https://github.com/SmartFlowAI/Llama3-Tutorial 课程视频：https://space.bilibili.com/3546636263360696/channel/series 1 环境配置...

AIGC 2024-07-05 人工智能

604阅读

【LLM教程-llama】如何Fine Tuning大语言模型？

今天给大家带来了一篇超级详细的教程,手把手教你如何对大语言模型进行微调(Fine Tuning ！（代码和详细解释放在后文）目录大语言模型进行微调(Fine Tuning 需要哪些步骤？大语言模型进行微调(Fine Tuning 训练过程及代码...

AIGC 2024-07-04 人工智能

782阅读

AIGC-CVPR2024best paper-Rich Human Feedback for Text-to-Image Generation-论文精读

Rich Human Feedback for Text-to-Image Generation斩获CVPR2024最佳论文！受大模型中的RLHF技术启发，团队用人类反馈来改进Stable Diffusion等文生图模型。这项研究来自UCSD、谷歌等。在...

生成式AI 2024-07-04 人工智能

747阅读

外滩大会举办全球deepfake攻防挑战赛，百万奖金悬赏“AI打假”专家

近日，外滩大会·全球Deepfake攻防挑战赛正式启动报名。该赛事提供百万级的数据集，针对“AI换脸”的欺诈风险进行攻防实战演练，并设立100万元人民币的奖金池，鼓励推动AI向善的技术人才。大赛由蚂蚁集团主办、蚂蚁数科承办，ATEC前沿科技探索社区、蚂...

大数据 2024-07-01 人工智能

613阅读

详解各种LLM系列｜（5）LLaMA 3模型解析（Meta重磅发布！）

一、引言 Blog链接：https://ai.meta.com/blog/meta-llama-3/ MODEL CARD: https://github.com/meta-llama/llama3/blob/main/MODEL_CARD.md 体...

AIGC 2024-07-01 人工智能

1044阅读

Stable diffusion 3 正式开源

6月12日晚，著名开源大模型平台Stability AI正式开源了，文生图片模型Stable Diffusion 3 Medium（以下简称“SD3-M”）权重。 SD3-M有20亿参数，平均生成图片时间在2—10秒左右推理效率非常高，同时对硬件的需求...

生成式AI 2024-06-26 人工智能

716阅读

⌈ 传知代码 ⌋ LLaMA 开放高效基础语言模型

?前情提要? 本文是传知代码平台中的相关前沿知识与技术的分享~ 接下来我们即将进入一个全新的空间，对技术有一个全新的视角~ 本文所涉及所有资源均在传知代码平台可获取以下的内容一定会让你对AI 赋能时代有一个颠覆性的认识哦！！！以下内容干货满满...

AIGC 2024-06-26 人工智能

634阅读

微软发布Phi-3 Mini，性能媲美GPT-3.5、Llama-3，可在手机端运行

前言微软发布了最新版的Phi系列小型语言模型(SLM - Phi-3。这个系列包括3个不同参数规模的版本：Phi-3 Mini (38亿参数、Phi-3 Small (70亿参数和Phi-3 Medium (140亿参数。 Phi系列模型是微...

大数据 2024-06-26 人工智能

792阅读

重磅！Meta 发布 Llama 3，前所未有的强大功能和多模态能力｜TodayAI

Meta今日宣布推出其最新一代尖端开源大型语言模型Llama 3。该模型预计很快将在多个领先的云服务平台上线，包括AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft A...

生成式AI 2024-06-24 人工智能

795阅读

（5-5-02）金融市场情绪分析：使用Llama 2 大模型实现财经信息的情感分析微调（2）

5.5.4 Llama-2语言模型操作编写下面的代码，功能是加载、配置 Llama-2 语言模型以及其对应的分词器，准备好模型为后续的对话生成任务做好准备。 model_name = "../input/llama-2/pytorch/7b-h...

AIGC 2024-06-24 人工智能

1163阅读

华为云盘古大模型5.0发布：可控时空生成技术重塑自动驾驶开发

快科技6月21日消息，在今日召开的华为开发者大会(HDC 2024 上，华为云发布了盘古大模型5.0，其创新的多模态生成能力，可以为自动驾驶领域提供更高质量的数据支持。华为常务董事、华为云CEO张平安表示，盘古5.0通过创新的可控时空生成，大规模的生成和...

生成式AI 2024-06-22 人工智能

548阅读

重磅！Llama-3，最强开源大模型正式发布！

4月19日，全球科技、社交巨头Meta在官网，正式发布了开源大模型——Llama-3。据悉，Llama-3共有80亿、700亿两种参数，分为基础预训练和指令微调两种模型（还有一个超4000亿参数正在训练中）。与Llama-2相比，Llama-3使用...

AIGC 2024-06-22 人工智能

668阅读

【持续更新中！图像-文本对数据集汇总】Stable Diffusion 3 重磅开源，超全图像生成必备训练数据集、教程汇总

Stability AI 已经正式开源 Stable Diffusion 3（简称 SD3）！SD3 是一个图像生成模型，只要给定一段描述性的文字，就能够创造出与之匹配的视觉作品。下图就是由 SD3 生成的图像。 * prompt 史诗...

AIGC 2024-06-19 人工智能

1163阅读

【AI原理解析】— Meta Llama-3模型

目录一、模型架构 Transformer架构解码器（Decoder-only）设计 Group Query Attention (GQA 技术二、参数与训练参数规模训练数据集训练过程三、技术特点四、性能提升推理能力...

生成式AI 2024-06-18 人工智能

918阅读

谷歌推创新框架AGREE 可增强大模型生成内容准确性

谷歌研究院推出了一个名为AGREE的创新框架，旨在增强大型语言模型（LLM）生成内容和引用的准确性。这一框架通过检索文档中的相关段落来增强大模型生成回答的事实基础，并提供相应的引用，从而提高回答的准确性，并为用户提供验证信息真实性的途径。核心技术:...

AIGC 2024-06-11 人工智能

611阅读

【AIGC】PULID:对比对齐的ID定制化技术

论文链接：https://arxiv.org/pdf/2404.16022 github：https://github.com/ToTheBeginning/PuLID comfyui节点：GitHub - cubiq/PuLID_ComfyUI: P...

人工智能 2024-06-10 人工智能

923阅读

Meta Llama 3 使用 Hugging Face 和 PyTorch 优化 CPU 推理

原文地址：meta-llama-3-optimized-cpu-inference-with-hugging-face-and-pytorch 了解在 CPU 上部署 Meta* Llama 3 时如何减少模型延迟 2024 年 4 月 19 日万...

AIGC 2024-06-09 人工智能

605阅读

用 LLaMA-Factory 在魔搭微调千问

今天在魔搭上把千问调优跑通了，训练模型现在在 Mac 还不支持，需要用 N 卡才可以，只能弄个N 卡的机器，或者买个云服务器。魔搭可以用几十个小时，但是不太稳定，有的时候会自动停止。注册账号直接手机号注册就可以. 找到对应模型这步可能不需...

生成式AI 2024-06-08 人工智能

809阅读

首次证实白盒Transformer可扩展性！马毅教授CRATE-α：鲸吞14亿数据，性能稳步提升

在过去的几年里，Transformer架构在自然语言处理（NLP）、图像处理和视觉计算领域的深度表征学习中取得了显著的成就，几乎成为了AI领域的主导技术。然而，虽然Transformer架构及其众多变体在实践中取得了巨大成功，但其设计大多是基于经验的，...

人工智能 2024-06-06 人工智能

573阅读

重磅 Llama-3最强开源大模型惊艳亮相

重磅！Llama-3，最强开源大模型正式发布！     202年4 月 19 日，Meta 发布开源大模型 Llama-3，助力研究人员和开发者推进语言 AI 的界限。强大的语言模型Llama-3推出，拥有80亿...

人工智能 2024-06-05 人工智能

921阅读

LLM | 偏好学习算法并不学习偏好排序

图片一、结论写在前面偏好学习算法（Preference learning algorithms，如RLHF和DPO）常用于引导大型语言模型（LLMs）生成更符合人类偏好的内容，但论文对其内部机制的理解仍有限。论文探讨了传统观点，即偏好学习训练模型通过...

人工智能 2024-06-05 人工智能

698阅读