文本分类 - AIGC资讯

人工智能与语言：从nlp到通用语义理解

标题：人工智能与语言：从NLP到通用语义理解的跨越在科技的浩瀚星空中，人工智能（AI）无疑是最璀璨的星辰之一，而语言作为人类智慧的结晶与交流的基石，与AI的交汇点——自然语言处理（NLP），则成为了探索智能边界的关键领域。从最初的词汇匹配、句法分析，到如今...

生成式AI 2025-07-10 人工智能

793阅读

数据挖掘研究中的可复现性问题

数据挖掘研究中的可复现性问题：挑战、策略与展望在数据驱动的时代，数据挖掘作为从海量数据中提取有价值信息和知识的重要手段，已经广泛应用于商业分析、医疗健康、金融科技、社交媒体等多个领域。然而，数据挖掘研究中的可复现性问题日益凸显，成为制约该领域健康发展的关键...

大数据 2025-06-22 大数据

777阅读

支持向量机（svm）在数据挖掘中的应用

标题：支持向量机（SVM）在数据挖掘中的应用随着信息技术的飞速发展，数据已成为现代社会中最为宝贵的资源之一。如何从海量数据中提取有价值的信息，成为数据挖掘领域的重要课题。在众多数据挖掘技术中，支持向量机（Support Vector Machine, SV...

AIGC 2025-06-22 大数据

663阅读

文本数据的特征工程方法

标题：文本数据的特征工程方法：解锁数据背后的深层信息在大数据与人工智能日益融合的今天，文本数据作为信息的重要载体，其处理与分析能力成为了衡量技术先进性的关键指标之一。文本数据特征工程，作为连接原始文本与机器学习模型的桥梁，扮演着至关重要的角色。它不仅关乎模...

人工智能 2025-06-21 大数据

765阅读

数据挖掘中的贝叶斯方法

数据挖掘中的贝叶斯方法：探索概率与决策的智慧在数据科学领域，数据挖掘是一项至关重要的任务，旨在从海量数据中提取有价值的信息和知识。而在这个过程中，贝叶斯方法作为一种基于概率论的强大工具，发挥了举足轻重的作用。本文将深入探讨数据挖掘中的贝叶斯方法，揭示其背后...

AIGC 2025-06-21 大数据

698阅读

数据科学家学习路径：从基础到高级

数据科学家学习路径：从基础到高级在数据驱动的时代，数据科学家已成为众多企业和组织争相争夺的人才。他们不仅具备深厚的统计学和数学知识，还精通编程和数据分析工具，能够从海量数据中挖掘出有价值的信息，为企业的决策提供科学依据。那么，如何从零开始，逐步成长为一名优...

生成式AI 2025-06-14 大数据

903阅读

数据标注平台应用技巧更新：提升标注效率

标题：数据标注平台应用技巧更新：高效提升标注效率的策略与实践随着人工智能技术的飞速发展，数据标注作为机器学习模型训练不可或缺的一环，其重要性日益凸显。数据标注的质量与效率直接影响到AI模型的性能与应用效果。为了应对日益增长的数据处理需求，数据标注平台不断优...

AIGC 2025-06-08 大数据

585阅读

百度Ernie大模型是什么？

百度的Ernie模型（Enhanced Representation through kNowledge Integration）是一个基于Transformer架构的预训练语言模型。它由百度研发，旨在通过整合大规模语料和知识图谱来增强模型的语言理解和生成...

人工智能 2024-09-29 人工智能

1440阅读

欺诈文本分类检测（十一）：LLamaFactory多卡微调

1. 引言前文训练时都做了一定的编码工作，其实有一些框架可以支持我们零代码微调，LLama-Factory就是其中一个。这是一个专门针对大语言模型的微调和训练平台，有如下特性：支持常见的模型种类：LLaMA、Mixtral-MoE、Qwen、B...

生成式AI 2024-09-11 人工智能

2168阅读

技术证书认证-附考试答案-AIGC与大模型通识-英特尔大湾区科技创新中心证书认证

目录课程简介面向人群考核步骤试题答案知孤云出岫主页课程以及考试链接：AIGC与大模型通识 - 英特尔大湾区科技创新中心【英特尔大湾区科技创新中心】公益新课《AIGC与大模型通识》上线官网！首期结业认证进行中，提升...

生成式AI 2024-08-20 人工智能

1479阅读

Llama-3的安装和使用方法和案例应用

LLMs之Llama3：LLama-3是一款非常实用的自然语言处理工具，支持多种自然语言处理任务，如文本分类、情感分析、命名实体识别等。下面是LLama-3的简介、安装和使用方法、案例应用之详细攻略。一、简介 LLama-3是一款基于LLama模型的...

大数据 2024-08-05 人工智能

1524阅读

快速上手文心一言指令：从零开始的详细指南

快速上手文心一言指令：从零开始的详细指南一、引言随着人工智能技术的不断进步，自然语言处理（NLP）已成为现代计算机科学和人工智能领域中的一个重要研究方向。它不仅在学术界取得了显著成果，更在实际应用中展现出巨大的价值，如智能客服、文本生成、情感分...

大数据 2024-07-21 人工智能

1297阅读

文心一言能用来降重吗

大家好，今天来聊聊文心一言能用来降重吗，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具：文心一言能用来降重吗随着人工智能技术的不断发展，越来越多的应用开始涉足文本处理领域。其中，...

生成式AI 2024-06-09 人工智能

1155阅读

深度学习突破：LLaMA-MoE模型的高效训练策略

在人工智能领域，大模型（LLM）的崛起带来了前所未有的进步，但随之而来的是巨大的计算资源需求。为了解决这一问题，Mixture-of-Expert（MoE）模型架构应运而生，而LLaMA-MoE正是这一架构下的重要代表。 LLaMA-MoE是一种基于...

人工智能 2024-06-07 人工智能

917阅读

超强！必会的十大机器学习算法

1.线性回归线性回归是用于预测建模的最简单且使用最广泛的机器学习算法之一。它是一种监督学习算法，用于根据一个或多个自变量预测因变量的值。定义线性回归的核心是根据观察到的数据拟合线性模型。线性模型由以下方程表示：其中是因变量（我们想要预测...

生成式AI 2024-05-30 人工智能

938阅读

解读注意力机制原理，教你使用Python实现深度学习模型

本文分享自华为云社区《使用Python实现深度学习模型：注意力机制（Attention）》，作者：Echo_Wish。在深度学习的世界里，注意力机制（Attention Mechanism）是一种强大的技术，被广泛应用于自然语言处理（NLP）和计算机视...

AIGC 2024-05-28 人工智能

846阅读

150B token从头训练，普林斯顿Meta发布完全可微MoE架构Lory

不同于大多数模型使用字母缩略起名，论文作者在脚注中解释道，Lory是一种羽毛有彩虹颜色的鹦鹉，和「软MoE」的精神非常相似。论文的作者团队也可以称之为「明星阵容」。论文地址：https://arxiv.org/abs/2405.03133 主要作者...

生成式AI 2024-05-20 人工智能

915阅读

我们一起聊聊AI模型组合指南

实施需要周密的计划、资源管理以及采用现代部署实践和工具。译自A Guide to Model Composition，作者 Sherlock Xu。考虑一款旨在识别和分类野生动物照片的 AI 驱动的图像识别应用程序。您上传一张远足时拍摄的照片，几分钟...

大数据 2024-05-20 人工智能

891阅读

EMNLP 2023｜利用LLM合成数据训练模型有哪些坑？

大家好，我是HxShine 今天我们将介绍EMNLP2023的一篇大模型（LLMs）生成文本分类任务合成数据的文章，标题是《Synthetic Data Generation with Large Language Models for Text Cla...

AIGC 2024-04-21 人工智能

1026阅读

AI辅助式数据分类分级

引言在信息爆炸的时代，数据已经成为企业最宝贵的资产之一。然而，大量的数据如果不能被有效地分类和分级，就会变得无序混乱，数据安全无法得到有效保障，也无法发挥其真正的数据价值。因此，数据分类分级无论是对于数据安全还是对于数据价值都变得至关重要。本文将探讨...

人工智能 2024-04-08 人工智能

1182阅读

谷歌DeepMind发布Gecko：专攻检索，与大7倍模型相抗衡

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 文本嵌入模型在自然语言处理中扮演着重要角色，为各种文本相关任务提供了强大的语义表示和计算能力。在语义表示上，文本嵌入模型将文本转换为高...

生成式AI 2024-04-07 人工智能

771阅读

Transformer引领AI百花齐放：从算法创新到产业应用，一文读懂人工智能的未来

一、引言近年来，人工智能技术取得了举世瞩目的成果，其中，自然语言处理（NLP）和计算机视觉等领域的研究尤为突出。在这些领域，一种名为Transformer的模型逐渐成为研究热点，以其为核心的创新成果层出不穷。本文将从Transformer的原理、应用和...

大数据 2024-04-03 人工智能

903阅读

十个推荐开源免费文本标注工具

文本标注工作是将标签或标记与文本的特定部分（如短语、单词或句子）相关联的过程。其目的是提供有关文本的额外信息，用于进一步的分析或处理，特别是在人工智能领域。文本标注对于人工智能应用中的监督机器学习任务至关重要。用于训练AI模型，有助更准确地理解自然语...

生成式AI 2024-03-26 人工智能

1748阅读

如何从头开始编写LoRA代码，这有一份教程

LoRA（Low-Rank Adaptation）作为一种用于微调 LLM（大语言模型）的流行技术，最初由来自微软的研究人员在论文《 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 》中提出。不同于其...

人工智能 2024-03-20 人工智能

925阅读

用code去探索理解Llama架构的简单又实用的方法

除了白月光我们也需要朱砂痣我最近也在反思，可能有时候算法和论文也不是每个读者都爱看，我也会在今后的文章中加点code或者debug模型的内容，也许还有一些好玩的应用demo，会提升这部分在文章类型中的比例今天带着大家通过代码...

生成式AI 2024-03-03 人工智能

927阅读

八项指标对比ChatGPT和文心一言

文章目录前言特定指标对比：实际运用对比：一、算力二、训练时间三、算法复杂度四、模型结构五、应用场景六、性能指标七、可解释性八、迁移能力 ✍创作者：全栈弄潮儿 ? 个人主页：全栈弄潮儿的个人主页 ?️ 个人...

人工智能 2024-02-15 人工智能

965阅读

AI介绍——chat gpt/文心一言/claude/bard/星火大模型/bing AI

AI体验 1. AI 介绍（注册和使用） 1.1 Chat GPT 1.2 文心一言 1.3 Slack 上的 Claude 1.3.1 Claude 介绍 1.3.2 Claude 使用 1.4 Google的Bard 1.4.1 B...

生成式AI 2024-02-09 人工智能

1007阅读

Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)

阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战，但实际上，Whisper的使用者完全可以针对中文的语音做一些优化的措施，换句话说，Whisper的“默认”形态可能在中文领域斗不过FunAsr，但是经过中文特殊优化的Whisper就未必...

AIGC 2024-02-09 人工智能

917阅读

玩LLM和StableDiffusion常说的LoRA到底是什么

论文地址：LoRA: Low-Rank Adaptation of Large Language Models LoRA是一种用于adapters和大模型迁移的技术,全称为Low-Rank Adaptation of Large Language M...

生成式AI 2024-02-07 人工智能

1546阅读

文心一言使用指南

文心一言快速入门指南，只要3步第一步：不要“学”，直接拿来用刚开始一个月，尽量让自己每天玩10次文心一言。把自己工作、生活中遇到的问题，随手记录下来，扔给文心一言，看看它有什么建议。大约大半个月后，会逐渐发现文心一言的迷人之处。这个时候...

大数据 2024-02-07 人工智能

1740阅读

AIGC智能编程：编程革新还是就业陷阱？

AIGC智能编程：程序员的失业陷阱？引言随着人工智能的迅猛发展，智能编程技术也越来越受到关注。AIGC智能编程是一种利用人工智能技术自动生成代码的方法，它能够极大地提高编程效率和质量。然而，这种技术的兴起也引发了人们对程序员就业前景的忧虑。本文...

生成式AI 2024-02-03 人工智能

917阅读

【大语言模型】5分钟快速认识ChatGPT、Whisper、Transformer、GAN

5分钟快速认识ChatGPT、Whisper、Transformer、GAN 什么是ChatGPT? 什么是Whisper? 什么是Generative Pre-trained Transformer架构？什么是自然处理语言 NLP 的 Tr...

生成式AI 2024-02-02 人工智能

1069阅读

AIGC: 关于ChatGPT中进行情感分析的功能

概念 GPT是基于大模型去进行的机器学习的训练，对于机器学习相关的概念它是比较了解的比如: 文本的分类, 文本的情感分析等等相关的机器学习的功能,GPT如何支持？是否有相关接口供我们调用? 有的，文档地址: https://platfor...

人工智能 2024-01-31 人工智能

960阅读

评估AI助手的五个关键维度，ChatGPT和文心一言比较

前言在人工智能（AI）大潮中，AI助手已经渗透到了我们生活的方方面面。他们可以帮助我们获取信息、完成任务、甚至在某些情况下成为我们的朋友。今天，我们将深入探讨两个知名的AI助手：ChatGPT4和文心一言，从诸如智能回复、语言准确性、知识库丰富度、学...

AIGC 2024-01-26 人工智能

1928阅读

2024年1月11日最热AI论文Top5：开源界Stable Diffusion杀手、Prompt-tuning、零和游戏博弈

本文整理了今日发表在ArXiv上的AI论文中最热门的 TOP5。以下内容由赛博马良-「AI论文解读达人」智能体生成，人工整理排版。「AI论文解读达人」智能体可提供每日最热论文推荐、AI论文解读等功能。如需查看其他热门论文，欢迎移步saibo...

人工智能 2024-01-23 人工智能

1008阅读

ChatGPT 和文心一言两大AI助手的比较

一背景 ChatGPT是由OpenAI开发的，它可以理解自己生成的内容，并根据输入的上下文进行推理和生成回复。这种自我理解的能力使得ChatGPT在处理复杂对话和问题时具有优势。然而，ChatGPT的缺点是只能根据预先设定的规则和模板回...

大数据 2024-01-22 人工智能

2370阅读

【创作活动】ChatGPT 和文心一言哪个更好用？

文章目录文心一言优点缺点 ChatGPT 优点缺点 Java编码能力比较对人工智能的看法 ChatGPT是由OpenAI开发的交互式AI大模型，文心一言是由百度研发的知识增强大语言模型，本文从Java开发...

AIGC 2024-01-21 人工智能

904阅读

书生·浦语2.0体验入口 AI聊天InternLM2模型在线使用地址

「InternLM2」书生·浦语2.0是一款面向中文和英文的大型多语言预训练语言模型，标志着自然语言处理技术的新时代。它不仅在语言理解和生成方面有着出色的表现，还能够进行多模式推理和代码理解。这种基于Transformer架构的模型通过海量数据的预训练，在...

AIGC 2024-01-17 人工智能

979阅读

ChatGPT在亚马逊上「开网店」，一夜之间成了网红

「我们的 [产品] 可用于多种任务，例如 [任务 1]、[任务 2] 和 [任务 3]，使其成为你家庭的多功能补充。」没想到，ChatGPT 的机器人话竟然在电商网站上火了。 GPT-5 的发布还尚需时日，最近 OpenAI 正在发力大语言模型的...

人工智能 2024-01-15 人工智能

765阅读

【网安AIGC专题10.11】论文1：生成式模型GPT\CodeX填充式模型CodeT5\INCODER+大模型自动程序修复(生成整个修复函数、修复代码填充、单行代码生产、生成的修复代码排序和过滤)

论文1：Automated Program Repair in the Era of Large Pre-trained Language Models 写在最前面论文总结背景知识介绍语言模型双向语言模型单向语言模型自动程序修复（...

大数据 2024-01-15 人工智能

960阅读

【AIGC】大模型协作系统 HuggingGPT 深度解析

欢迎关注【youcans的 AIGC 学习笔记】原创作品【AIGC】大模型协作系统 HuggingGPT 深度解析 1. 摘要 2. 前言 3. HugginGPT 大模型协作系统 3.1 任务规划 3.2 模型选择 3.3 任务执行...

人工智能 2024-01-15 人工智能

1050阅读

【好书推荐-第二期】《实战AI大模型》：带你走进大模型GPTs、AIGC的世界（李开复、周鸿祎、颜水成倾力推荐）

? 作者介绍：我是程序员洲洲，一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主、前后端开发、人工智能研究生。公粽号：程序员洲洲。 ? 本文专栏：本文收录于洲洲的《送书福利》系列专栏，该专栏福利多多，只需...

生成式AI 2024-01-08 人工智能

1223阅读

Llama~transformers搭建

本例从零开始基于transformers库逐模块搭建和解读Llama模型源码(中文可以翻译成羊驼。并且训练它来实现一个有趣的实例：两数之和。输入输出类似如下：输入："12345+54321=" 输出："66666" 我们把这个任务当做一个...

AIGC 2024-01-07 人工智能

1145阅读

Llama 架构分析

从代码角度进行Llama 架构分析 Llama 架构分析前言 Llama 架构分析分词网络主干 DecoderLayer Attention MLP 下游任务因果推理文本分类 Llama 架构分析...

AIGC 2023-12-21 人工智能

855阅读

你真的会写 Prompt ? 剖析 RAG 应用中的指代消解

随着 ChatGPT 等大语言模型(LLM 的不断发展，越来越多的研究人员开始关注语言模型的应用。其中，检索增强生成（Retrieval-augmented generation，RAG）是一种针对知识密集型 NLP 任务的生成方法，它通过在生成过程中...

AIGC 2023-12-20 人工智能

830阅读

人工智能中的文本分类：技术突破与实战指导

在本文中，我们全面探讨了文本分类技术的发展历程、基本原理、关键技术、深度学习的应用，以及从RNN到Transformer的技术演进。文章详细介绍了各种模型的原理和实战应用，旨在提供对文本分类技术深入理解的全面视角。关注TechLead，分享A...

生成式AI 2023-12-15 人工智能

986阅读

百度文心一言GPT免费入口也来了！！！

文心一言入口地址：文心一言能力全面开放文心一言是百度全新一代知识增强大语言模型，文心大模型家族的新成员，能够与人对话互动，回答问题，协助创作，高效便捷地帮助人们获取信息、知识和灵感。文心一言的技术特色：基于飞桨深度学习平台和文心知识增强大模型，...

人工智能 2023-12-12 人工智能

1026阅读

开源模型「幻觉」更严重，这是三元组粒度的幻觉检测套件

大模型长期以来一直存在一个致命的问题，即生成幻觉。由于数据集的复杂性，难免会包含过时和错误的信息，这使得输出质量面临着极大的挑战。过多的重复信息还可能导致大型模型产生偏见，这也算是一种形式的幻觉。如何检测和有效缓解大模型的生成幻觉问题一直是学术界的热门课...

生成式AI 2023-12-10 人工智能

991阅读

HumanGaussian开源：基于Gaussian Splatting，高质量 3D 人体生成新框架

在 3D 生成领域，根据文本提示创建高质量的 3D 人体外观和几何形状对虚拟试穿、沉浸式远程呈现等应用有深远的意义。传统方法需要经历一系列人工制作的过程，如 3D 人体模型回归、绑定、蒙皮、纹理贴图和驱动等。为了自动化 3D 内容生成，此前的一些典型工作...

大数据 2023-12-10 人工智能

934阅读

知网推出AI生成文本检测新专利提升论文代写识别效率

近日，同方知网数字出版技术股份有限公司申请了名为“一种AI生成文本的检测方法、装置、介质及设备”的专利。该专利通过多种特征分析，可以自动判断一篇文本是否为AI生成，从而检测代写论文等学术不端行为。图源备注:图片由AI生成，图片授权服务商Midjourn...

AIGC 2023-12-05 人工智能

948阅读