长文本 - AIGC资讯

文本数据的特征工程方法

标题：文本数据的特征工程方法：解锁数据背后的深层信息在大数据与人工智能日益融合的今天，文本数据作为信息的重要载体，其处理与分析能力成为了衡量技术先进性的关键指标之一。文本数据特征工程，作为连接原始文本与机器学习模型的桥梁，扮演着至关重要的角色。它不仅关乎模...

人工智能 2025-06-21 大数据

765阅读

llama-factory实战: 基于qwen2.5-7b 手把手实战自定义数据集清洗微调

基于qwen2.5 手把手实战自定义数据集微调（llama-factory）准备工作 1.数据集准备（例:民法典.txt） 2.服务器准备（阿里云 DSW 白嫖） 3.环境配置 pip 升级模型下载微调助手 4.数据集处理脚...

生成式AI 2024-10-03 人工智能

2190阅读

Meta Llama 3介绍及其关键技术

随着深度学习算法的突破和发展，语言模型已经成为连接人与机器的重要桥梁。在这一领域中，Meta的Llama 3 作为最新一代的大规模预训练模型，凭借其卓越的性能和广泛的应用前景，正逐渐成为行业内的佼佼者。 Llama 3 的研发团队继承了前代模型的技术优势...

AIGC 2024-09-30 人工智能

1776阅读

王炸！超强FLUX 文生图重磅来袭！碾压SD，超越MJ！无需部署，安装即用！支持手部细节丨长文本丨复杂场景(附赠免费12000+AI绘画咒语)

太刺激了，AI终于会画手了，可以看到手指关节都能很好的还原。没错，这就是最近爆火的原SD核心团队研发的Flux 点 1模型。它的理解能力也是超一流，可以看到这张图，已经完美的呈现了提示词的长文本内容。而且可以看到它的质感，画面的细节度，已经可以...

生成式AI 2024-09-28 人工智能

1581阅读

基于Llama构建的语音语言模型LLaMA-Omni；增强记忆的长文本建模检索方法；全功能的AI应用AnythingLLM

✨ 1: LLaMA-Omni LLaMA-Omni是基于Llama-3.1-8B-Instruct构建的语音语言模型，支持高质量低延迟的语音互动。 LLaMA-Omni是一个基于Llama-3.1-8B-Instruct构建的语音语言模型...

大数据 2024-09-28 人工智能

1810阅读

又热闹了，OpenAI的加强版“Her”正式开放，压过了Gemini的“生产级”大升级

今天真是AI圈久违了的热闹一天啊！昨天刚被奥特曼发的那篇AI小作文搞得一头雾水，现在他这波操作的意图就呼之欲出了。奥特曼想临门狙击的正是宿敌Google，更确切地说，是Google今天刚刚更新的两款升级版Gemini模型：Gemini-1.5-Pro-...

AIGC 2024-09-25 人工智能

1152阅读

LLaMA 数据集

LLaMA的训练数据集来源多样，涵盖了多个不同的数据集和预处理步骤。以下是详细的描述：公开数据来源和预处理 CommonCrawl [67%]：使用CCNet管道（Wenzek等人，2020年）对2017年至2020年间的五个Comm...

生成式AI 2024-09-25 人工智能

1074阅读

llama网络结构及源码

目录模型初始化 config lm_head transformer wte h rms_1/rms_2 attn c_attn c_proj 线性层mlp ln_f rope_cache mask_cache kv_cac...

大数据 2024-09-24 人工智能

1625阅读

AI日报：更稳更高清！可灵AI发布1.5版本；字节推音乐生成神器；阿里通义万相视频生成模型正式上线

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、可灵AI发布1.5版本视频更...

大数据 2024-09-19 人工智能

1051阅读

阿里史上最大规模开源发布，超GPT-4o 、Llama-3.1！

今天凌晨，阿里巴巴官宣了史上最大规模的开源发布，推出了基础模型Qwen2.5、专用于编码Qwen2.5-Coder和数学的Qwen2.5-Math。这三大类模型一共有10多个版本，包括0.5B、1.5B、3B、7B、14B、32B和72B，适用于个人、企...

大数据 2024-09-19 人工智能

1024阅读

清华系公司强强联合，一张4090让安全大模型进入千亿时代｜长亭x趋境

AI大行其道的时代，网络安全正面临前所未有的威胁。化身黑客的AI学会了自动化攻击，还有相当高的成功率，伊利诺伊大学香槟分校研究团队的最新研究显示:GPT-4能够在阅读CVE漏洞描述后，学会利用漏洞攻击，成功率高达87%。既然攻击方都与时俱进，用上AI新...

人工智能 2024-09-13 人工智能

903阅读

蚂蚁的AI故事，讲到哪儿了？

没有一家互联网大厂愿意错过AI这一风口。在近期举办的2024Inclusion外滩大会上，蚂蚁集团一次性推出了三款AI产品，分别是「支小宝」、「蚂小财」、「AI健康管家」，对应衣食住行、理财、医疗三大领域。其中「支小宝」既可在支付宝内使用，也有独立APP...

AIGC 2024-09-12 人工智能

928阅读

【AIGC半月报】AIGC大模型启元：2024.09（上）

【AIGC半月报】AIGC大模型启元：2024.09（上） (1 OCR-2.0（旷视科技） (2 MiniCPM 3.0（面壁智能） (3 RAGLAB（RAG框架） (4 Reflection 70B（HyperWrite）...

AIGC 2024-09-12 人工智能

1066阅读

【大模型】llama系列模型基础

前言：llama基于transformer架构，与GPT相似，只用了transformer的解码器部分。本文主要是关于llama，llama2和llama3的结构解读。目录 1. llama 1.1 整体结构 1.2 RoPE 1...

生成式AI 2024-09-10 人工智能

1646阅读

AI终于会画手了，Flux.1一出世就直接碾压Stable Diffusion（SD）和Midjourney（MJ）

Flux.1模型一发布，AI文生图终于会画手了，Flux.1模型比Stable Diffusion（SD）和Midjourney（MJ）更能将手部和长文本生成得更好更合理。 Flux.1模型生成的图，现在手部不再有畸形了。同时，画面质感堪比Mid...

AIGC 2024-09-10 人工智能

1275阅读

ACL 2024 | CoCA：自注意力的缺陷与改进

近年来，在大语言模型（LLM）的反复刷屏过程中，作为其内核的 Transformer 始终是绝对的主角。然而，随着业务落地的诉求逐渐强烈，有些原本不被过多关注的特性，也开始成为焦点。例如：在 Transformer 诞生之初，被视为天然具备的长度外推能力，...

AIGC 2024-09-09 人工智能

1223阅读

开源大模型再迎“历史性时刻”，Meta发布Llama 3.1

7月23日晚，Meta正式推出了最新的开源大模型系列Llama 3.1，进一步缩小了开源模型与闭源模型之间的差距。Llama 3.1系列包括8B、70B和405B三个参数规模，其中Llama 3.1-405B参数的模型在多个基准测试中超越了OpenAI的G...

大数据 2024-09-08 人工智能

1166阅读

论文分析｜高效长文本生成的技术与应用

Preface 前言目前大模型公司很多在追求长文a本，对算力需求极大，如何能够现实地处理该问题很重要。特别是随着Transformer模型尺寸和复杂性的增长，它们在训练期间的内存需求呈指数级增加。语言模型训练的瓶颈在于显存占用非常大，这需要创...

生成式AI 2024-08-30 人工智能

1068阅读

全国首个上手机的AI视频通话来了！《黑神话：悟空》经文也能破译

免费的AI视频通话功能，就这么水灵灵地来了。之前B站Up主“女流姐”在直播《黑神话:悟空》的时候，科普游戏内的经文被大家津津乐道。那么这个可以打视频通话的AI，是否也能帮玩家破译经文呢? 我们这就实测了一波: 这个AI在看完经文后，表示大致意思是:...

生成式AI 2024-08-30 人工智能

1007阅读

智谱AI静悄悄的上线了一大波新模型，过年了，真的。

智谱29日下午在KDD2024上面，悄咪咪的上线了一堆的超级更新。我真的服了，我本来今天从泰国回来，准备休一天假的，结果晚上又坐在电脑面前被迫营业。他们总是每次，静悄悄的就把4个2给扔出去了。嗯，就一场演讲了，发布了一堆新模型还有新功能，个顶个都很...

人工智能 2024-08-30 人工智能

1020阅读

7 大国产大模型：KimiChat、豆包、文心一言、智谱清言、通义千问、讯飞星火、天工AI，到底哪家强？

有的朋友还不了解 AI 工具，或者跟老王一样，不知道该选哪个 AI 工具。怎么办？先看看别人都用哪个。新榜（著名三方自媒体数据平台），根据各自媒体平台的数据，统计了 AI 产品的用户使用等多个维度，分析得出了综合评分，展示如下。第 3 和...

生成式AI 2024-08-30 人工智能

4511阅读

NVIDIA把Llama-3的上下文长度扩展16倍，长上下文理解能力超越GPT-4

在 Llama-3.1 模型发布之前，开源模型与闭源模型的性能之间一直存在较大的差距，尤其是在长上下文理解能力上。大模型的上下文处理能力是指模型能够处理的输入和输出 Tokens 的总数。这个长度有一个限制，超过这个限制的内容会被模型忽略。一般而...

生成式AI 2024-08-29 人工智能

902阅读

Llama 3模型：多维度损失函数铸就大语言模型新巅峰

在人工智能领域,大型语言模型(Large Language Models, LLMs 的发展如火如荼。作为这一领域的佼佼者,Llama系列模型一直备受关注。随着Llama 3的横空出世,其在模型架构、训练方法等方面的创新再次引发业界热议。本文将深入探讨Ll...

大数据 2024-08-28 人工智能

1313阅读

五大AI平台特长揭秘：文心一言、通义千问、天工AI、讯飞星火与Kimi的差异化优势

文心一言、通义千问、天工AI、讯飞星火和Kimi是目前国内较为知名的AI平台，它们各自具有以下特点和优势：本文将对这五大 AI 平台进行深度对比，分析各自特点及适用场景，帮助您找到最合适的 AI 助手。一、五大 AI 平台实力对比平台...

AIGC 2024-08-27 人工智能

2906阅读

AIGC创新应用技术实践：成都技术生态沙龙全回顾

AIGC创新应用技术实践：成都技术生态沙龙全回顾 2024年8月17日下午，我有幸作为CSDN校园主理人参加了在成都举办的AIGC创新应用技术实践沙龙活动。此行也见到了许许多多的行业大佬，得到的收获非常之多，赶了1300公里的路，值了！这次活...

AIGC 2024-08-25 人工智能

876阅读

2024年国内版AI写作对话工具推荐

以下排名随意编排，无先后。提高工作效率的AI神器? | 国内版笔尖AI写作能写文案、读文献、互动答疑，多场景写作模板，不限于某个领域，12+种职位的 100+ 工作场景，10秒即可生成一篇专业文章。推荐指数⭐⭐⭐⭐ 豆包聊天机器人、写...

生成式AI 2024-08-25 人工智能

1586阅读

法律 | 法律人AI使用指南

原文：法律 | 法律人AI使用指南|法官|法院|文书|公司法_网易订阅 01 引言过去半年多，我一直在尝试着用AI来辅助自己的各项法律工作，将AI融入自己的日常工作之中，并试图形成自身稳定的“法律+AI”工作流。在此过程中，我时常惊讶于AI高效的工...

生成式AI 2024-08-23 人工智能

1842阅读

Meta Llama 3.1：AI领域的新里程碑

Meta最近推出了其最新的AI模型Llama 3.1，这不仅是一个技术上的飞跃，更是AI领域的一次重大突破。以下是Llama 3.1的一些关键技术亮点，值得每一位AI爱好者和开发者关注。参数规模与性能 Llama 3.1包含三种规格：8B（80亿）、...

大数据 2024-08-22 人工智能

1079阅读

史上最强开源模型Llama 3.1，媲美GPT-4o和Claude 3.5 Sonnet！

大家好，我是木易，一个持续关注AI领域的互联网技术产品经理，国内Top2本科，美国Top10 CS研究生，MBA。我坚信AI是普通人变强的“外挂”，所以专注于分享AI全维度知识，包括但不限于AI科普，AI工具测评，AI效率提升，AI行业洞察。关注我，AI之...

AIGC 2024-08-18 人工智能

1190阅读

清华唐杰团队新作：一口气生成2万字，大模型开卷长输出

一口气生成2万字，大模型输出也卷起来了! 清华&智谱AI最新研究，成功让GLM-4、Llama-3.1输出长度都暴增。相同问题下，输出结果直接从1800字增加到7800字，翻4倍。要知道，目前大模型的生成长度普遍在2k以下。这对于内容创作、问...

人工智能 2024-08-15 人工智能

933阅读

Llama 3.1用了1.6万个英伟达H100 GPU，耗费......

目录 Llama 3.1发布简介 Llama 3.1模型规模与训练大模型企业发展面临的问题与困境算力和能耗算力方面数据和资金方面技术和人才方面 Llama 3.1发布简介当地时间 2024年 7月 23号，Meta 公司发布...

人工智能 2024-08-14 人工智能

984阅读

探索中文大模型的新高度：Chinese-LLaMA-Alpaca-3

探索中文大模型的新高度：Chinese-LLaMA-Alpaca-3 Chinese-LLaMA-Alpaca-3中文羊驼大模型三期项目 (Chinese Llama-3 LLMs developed from Meta Llama 3项目地址:ht...

大数据 2024-08-12 人工智能

1071阅读

最强大模型 Llama 3.1-405B 架构设计剖析

—1— 最强大模型 Llama 3.1-405B 简介在历经了两天的提前“泄露风波”后，Llama 3.1 终于正式揭开面纱，由官方对外公布。新版 Llama 3.1 将其上下文处理能力扩展至 128K，推出了 8B、70B 及 405B 三个不...

人工智能 2024-08-05 人工智能

1386阅读

Llama 3.1超大405B！AI巨浪再掀新高潮

前沿科技速递? Meta公司宣布开放的Llama 3.1系列模型，以其惊人的128K上下文长度、对八种语言的支持以及业界领先的405B开放式最前沿AI模型，瞬间吸引了全球科技界的目光。该系列模型不仅在通用知识、可控性、数学、工具使用和多语言翻译等方面表...

人工智能 2024-08-04 人工智能

899阅读

京东云：要让大模型听见“炮火声”

业内关于如何最大限度激发大模型潜力，以及打造“新质生产力”的争论似乎将在今年落下帷幕。眼下，大模型成为 “爆改”千行百业的抓手，让一切相关技术的突破都来得热闹且快速。不过，大多数突破都只是停留在基础模型层面和浅层应用，我们能看到无数大模型的落地妙想，只是...

大数据 2024-08-03 人工智能

785阅读

媲美Midjourney-v6，Kolors最新文生图模型部署

Kolors模型是由快手团队开发的大型文本到图像生成模型，专门用于将文本描述转换成高质量的图像。 Kolors模型支持中英文双语输入，生成效果与Midjourney-v6相媲美，能够处理长达256个字符的文本输入，具备生成中英文文字的能力。 Kolor...

生成式AI 2024-08-02 人工智能

1137阅读

AI日报：GPT-4o灰测高级语音功能，ChatGPT版Her来了；Midjourney V6.1上线；360安全大模型免费开放

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、OpenAI向ChatGPT...

人工智能 2024-07-31 人工智能

1010阅读

终于来了，OpenAI测试GPT-4o高级语音模式！

OpenAI宣布开始向小部分ChatGPT Plus用户，测试GPT-4o的高级语音模式。本次测试将主要搜集安全、功能方面的反馈，OpenAI会在8月初分享一份全面的GPT-4o评估报告。随后，还会发布视频和屏幕共享新功能。获取测试权限的用户会收到O...

生成式AI 2024-07-31 人工智能

921阅读

【AIGC】Llama-3 官方技术报告

Llama-3 技术报告（中文翻译）欢迎关注【youcans的AGI学习笔记】原创作品 0. 简介现代人工智能（AI）系统的核心驱动力来自于基础模型。本文介绍了一组新的基础模型，称为 Llama 3。它是一个语言模型系列，原生支持多语言...

大数据 2024-07-29 人工智能

1479阅读

AI日报：Bing推生成式AI搜索功能；Open-Sora Plan v1.2发布；Mistral Large2突然开源；腾讯智影推智能画布功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、Bing推生成式AI搜索功能...

生成式AI 2024-07-25 人工智能

950阅读

【愚公系列】《微信小程序开发解析》006-视图容器组件

? 作者简介，愚公搬代码 ?《头衔》：华为云特约编辑，华为云云享专家，华为开发者专家，华为产品云测专家，CSDN博客专家，CSDN商业化专家，阿里云专家博主，阿里云签约作者，腾讯云优秀博主，腾讯云内容共创官，掘金优秀博主，亚马逊技领云博主，51CTO博客专...

生成式AI 2024-07-24 人工智能

993阅读

AI日报：Llama3.1重磅上线；可灵上线国际版1.0并开启付费计划；腾讯PhotoMaker V2升级

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、最强开源模型来了!Llama3...

生成式AI 2024-07-24 人工智能

1068阅读

Llama 3.1有哪些功能免费吗？Meta AI最强大新模型怎么使用方法详细教程指南

Llama 3.1 是什么？ Llama 3. 1 是Meta AI推出的最新一代大型语言模型，具有128K的上下文长度扩展、支持八种语言，并首次开源了405B参数级别的前沿AI模型。该模型在通用知识、可控性、数学、工具使用和多语言翻译方面具有最先进的能力...

人工智能 2024-07-24 人工智能

1120阅读

Llama 3.1功能介绍及免费使用指南 Meta AI最新一代模型体验地址入口

Llama 3. 1 简介 Llama 3. 1 是Meta AI推出的最新一代大型语言模型，具有128K的上下文长度扩展、支持八种语言，并首次开源了405B参数级别的前沿AI模型。它为开发者和技术研究者提供了强大的支持，无论是需要处理大量文本数据的编程助...

人工智能 2024-07-24 人工智能

1293阅读

第一批用AIGC赚到钱的人，已经开卷海外了

本文来自微信公众号“字母榜”，作者:马舒叶 4月，网文创作者木木被一款AI写作工具种草了。定好故事大纲后，AI辅助生成的2万多字小说内容，不仅做到了上下文连贯，还能在某些内容上升华主题，最终免费字数没用完，木木便成为了这款工具的付费用户。 “作为一款上线即...

生成式AI 2024-07-24 人工智能

957阅读

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开源模型不如瞎蒙

【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度，这对于模型的能力来说，意义重大。但近日的两项独立研究表明，它们可能只是在吹牛，LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数、万卡集群，——还有各大厂商一直在卷的超长上下...

大数据 2024-07-23 人工智能

954阅读

AI日报：OpenAI发布GPT-4o mini；豆包浏览器插件上线播客和视频总结功能；DeepL推翻译神器

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、OpenAI发布GPT-4o...

生成式AI 2024-07-19 人工智能

1265阅读

国产AI大模型Kolors：ComfyUI平台部署指南

在AI技术的浪潮中，快手公司推出的文生图大模型——Kolors，以其卓越的性能和开源精神，成为国产AI技术的一颗璀璨新星。Kolors不仅在图像生成效果上超越了现有的开源模型，更达到了与商业闭源模型相媲美的水平，迅速在社交媒体上引发热议。 Kolors的...

生成式AI 2024-07-16 人工智能

1317阅读

全能大模型AIGC产品的体验与未来展望

目录前言 1 使用体验分享 1.1 字节豆包 1.2 百度文心一言 1.3 阿里通义千问 1.4 腾讯元宝 2 大模型产品的对比与选择 2.1 产品功能对比 2.2 使用成本与便捷性 2.3 安全性与隐私保护 3 大模型产品的未来发展...

大数据 2024-07-11 人工智能

1533阅读

快速LLaMA：面向大型语言模型的查询感知推理加速论文摘要翻译与评论

论文摘要翻译与评论论文标题： QuickLLaMA: Query-aware Inference Acceleration for Large Language Models 提出的框架我们Q-LLM框架的示意图。来自记忆上下文的输入被...

AIGC 2024-07-11 人工智能

952阅读