-
AIGC从入门到实战:AI 辅助写作:基于 ChatGPT 的自动创作和文本扩展
1. Background Introduction In the rapidly evolving digital age, artificial intelligence (AI has become an indispensable tool i...
-
LLaMa系列模型详解(原理介绍、代码解读):LLaMa
LLaMA详解 LLaMA(Large Language Model Meta AI)是由Meta(前身为Facebook)开发的一种大规模语言模型,旨在提高自然语言处理(NLP)任务的性能。LLaMA基于变换器(Transformer)架构,并经过大...
-
AIGC从入门到实战:利用 ChatGPT 来生成前后端代码
AIGC从入门到实战:利用 ChatGPT 来生成前后端代码 作者:禅与计算机程序设计艺术 1. 背景介绍 1.1 人工智能生成内容(AIGC 的兴起 1.1.1 AIGC的定义与发展历程 1.1.2 AIGC在各领域的应用现状 1.1.3 A...
-
探索未来网页浏览的新型助手——WebLlama
探索未来网页浏览的新型助手——WebLlama 项目地址:https://gitcode.com/McGill-NLP/webllama ?? WebLlama ? 构建能遵循指令并与您对话的网络浏览代理 | ? GitHub | ?...
-
深度学习突破:LLaMA-MoE模型的高效训练策略
在人工智能领域,大模型(LLM)的崛起带来了前所未有的进步,但随之而来的是巨大的计算资源需求。为了解决这一问题,Mixture-of-Expert(MoE)模型架构应运而生,而LLaMA-MoE正是这一架构下的重要代表。 LLaMA-MoE是一种基于...
-
解锁AI写作新纪元的文心一言指令
解锁AI写作新纪元的文心一言指令 在人工智能(AI)飞速发展的今天,自然语言处理(NLP)技术取得了显著的进步。文心一言,作为NLP领域的一颗璀璨明星,以其强大的文本生成和指令理解能力,为写作领域带来了革命性的变革。本文主要讲解启动创新模型...
-
一文讲清楚,AI、AGI、AIGC与AIGC、NLP、LLM,ChatGPT等概念
前言 随着chatgpt3.5的横空出试,大模型爆火,这个风暴传递到了各行各业。 各类公众号、帖子,也涌现出了各种概念,AI、大模型、LLM、AI、AIGC、AGI、GPT、ChatGPT等等。 总觉得被这些概念搞得头晕。 我花了点时间,梳理了下...
-
首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升
在过去的几年里,Transformer架构在自然语言处理(NLP)、图像处理和视觉计算领域的深度表征学习中取得了显著的成就,几乎成为了AI领域的主导技术。 然而,虽然Transformer架构及其众多变体在实践中取得了巨大成功,但其设计大多是基于经验的,...
-
LlamaFactory源码解析 PPO
class CustomPPOTrainer(PPOTrainer, Trainer : r""" Inherits PPOTrainer. """ def __init__( self,...
-
让大模型发挥更大作用,离不开知识库这个关键要素
在大模型的世界里,有一些黑话,比如“抽卡”和“炼丹”。这些术语听起来轻松有趣,但要让“仙丹”真正发挥作用,背后离不开一个关键要素——知识库。 从自然语言处理(NLP)、内容生成到图像识别,大模型在各个领域都展现出了惊人的能力。然而大模型在处理特定领域问...
-
ICML2024高分!魔改注意力,让小模型能打两倍大的模型
改进Transformer核心机制注意力,让小模型能打两倍大的模型! ICML 2024高分论文,彩云科技团队构建DCFormer框架,替换Transformer核心组件多头注意力模块(MHA),提出可动态组合的多头注意力(DCMHA)。 DCMHA解除...
-
探索文心一言指令:AI与自然语言处理的新篇章
引言:自然语言处理与文心一言指令的探索 (1)自然语言处理的发展及其重要性 自然语言处理(NLP)是人工智能(AI)的一个关键领域,致力于使机器能够理解、解释和响应人类语言的方式。自从20世纪50年代计算机科学诞生以来,NLP已经从简单的模式识...
-
AIGC如何改变人类生活20240529
AIGC如何改变人类生活 随着人工智能技术的不断发展,人类生活正经历着前所未有的变革。在这个过程中,AIGC(人工智能生成内容)的概念应运而生,它已经在很多领域产生了深远的影响。本文将探讨AIGC如何改变人类生活,以期为读者提供更多关于这一创新技术的启...
-
AIGC 技术及应用初探
ChatGPT 相关话题近一年多来被刷爆,利用 AI 技术生成内容,引起了各行各业的关注。其实,自2022 年 4 月起,OpenAI、Google、Microsoft 相继发布了文生图模型,视觉创作就已经开始持续火热了。国内 AIGC 相关的技术和应用也...
-
AI、AGI、AIGC、AI Agent、Prompt、LLM 名词解释
啊!ChatGPT 最近很火呀,你们说的 AGI、AIGC、AI Agent、Prompt、LLM … 到底是什么意思啊?还有 Midjourney、Lensa、Sora、DALL-E、Llama … 又是什么鬼? AI(Artificial Int...
-
深入解析“TSCMS爬虫”技术与应用
在数字化信息爆炸的时代,数据获取与处理成为了各行各业不可或缺的环节。而爬虫技术,作为自动化获取网络数据的重要手段,日益受到人们的关注。今天,我们就来深入解析“TSCMS爬虫”这一特定领域的爬虫技术及其应用。一、TSCMS爬虫简介TSCMS,即某特定内容管理...
-
如何看待AIGC技术?未来已来,请做好准备!
文章目录 前言 令人震撼 无限可能 核心优势 背后力量 双刃剑 总结 前言 我正在写一篇关于人工智能对人类工作影响的文章,突然,我的电脑屏幕上弹出一条消息:“嘿,伙计,介意让我写一点吗?” 我吓了一跳,然后意识到是我自己的...
-
每天都看模型评分,但你真的了解吗?OpenAI研究员最新博客,一文读懂LLM评估
上周六,OpenAI研究院Jason Wei在个人网站上发表了一篇博客,讨论了他眼中「成功的语言模型评估」应该具备哪些因素,并总结出了阻碍好的评估在NLP社区获得关注的「七宗罪」。 Jason Wei在最近的斯坦福NLP研讨会上展示了这篇文章,Open...
-
超详细!AIGC面试系列 大模型进阶(2)
本期问题快览 1. 如何让大模型处理更长的文本? 2. 如果想要在某个模型基础上做全参数微调,究竟需要多少显存? 3. 什么是有监督微调SFT 4. SFT 指令微调数据如何构建? 5. 领域数据训练后,通用能力往往会有所下降,如何缓解模型遗忘...
-
详解各种LLM系列|LLaMA 2模型架构、 预训练、SFT内容详解 (PART1)
作者 | Sunnyyyyy 整理 | NewBeeNLP https://zhuanlan.zhihu.com/p/670002922 大家好,这里是 NewBeeNLP。之前我们分享了详解各种LLM系列|...
-
手把手教你基于华为云,实现MindSpore模型训练
本文分享自华为云社区《【昇腾开发全流程】MindSpore华为云模型训练》,作者:沉迷sk。 前言 学会如何安装配置华为云ModelArts、开发板Atlas 200I DK A2。 并打通一个Ascend910训练到Ascend310推理的全流程...
-
== **探索eyoucms爬虫:开启智能内容抓取新时代**
==在数字化信息时代,数据已经成为一种宝贵的资源,而内容的获取与管理更是每个网站运营者不可忽视的环节。eyoucms作为一款知名的内容管理系统,其强大的功能与灵活的扩展性备受用户青睐。而结合了爬虫技术的eyoucms,则为用户打开了一扇高效、智能内容抓取的...
-
探秘Faster Whisper:一款加速 Whisper 模型训练的高效工具
探秘Faster Whisper:一款加速 Whisper 模型训练的高效工具 项目地址:https://gitcode.com/SYSTRAN/faster-whisper 在自然语言处理(NLP)领域,Transformer架构的模型如Whis...
-
深入解析“boaphp爬虫”:原理、应用与未来趋势
在当今数字化时代,网络爬虫已成为数据获取与分析领域的重要工具。作为一种自动化程序,爬虫能够遍历互联网,抓取并解析网页数据,为各行各业提供丰富的数据资源。在众多爬虫框架中,“boaphp爬虫”以其高效、稳定、易用的特点,受到了广大开发者的青睐。本文将深入解析...
-
解读注意力机制原理,教你使用Python实现深度学习模型
本文分享自华为云社区《使用Python实现深度学习模型:注意力机制(Attention)》,作者:Echo_Wish。 在深度学习的世界里,注意力机制(Attention Mechanism)是一种强大的技术,被广泛应用于自然语言处理(NLP)和计算机视...
-
一文读懂 Arthur Bench LLM 评估框架
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估 。 众所周知,LLM 评估是人工智能领域的一个重要议题。随着 LLM 在各个场景中的广泛应用,评估它们的能力和局限性变得越来越重要。作为一款新兴...
-
全面超越DPO:陈丹琦团队提出简单偏好优化SimPO,还炼出最强8B开源模型
为了将大型语言模型(LLM)与人类的价值和意图对齐,学习人类反馈至关重要,这能确保它们是有用的、诚实的和无害的。在对齐 LLM 方面,一种有效的方法是根据人类反馈的强化学习(RLHF)。尽管经典 RLHF 方法的结果很出色,但其多阶段的过程依然带来了一些...
-
Llama大型语言模型原理详解
Llama大型语言模型是一种基于深度学习的自然语言处理模型,它在文本生成、问答、摘要等多种NLP任务中展现出强大的性能。本文将详细解析Llama模型的原理,包括其结构、训练过程以及工作机制,帮助读者深入理解这一先进的模型。 一、模型结构 Llama模型...
-
在Mac电脑上本地部署Llama大型语言模型
Llama大型语言模型以其出色的性能和广泛的应用场景,吸引了众多NLP研究者和开发者的关注。在Mac电脑上本地部署Llama模型,可以让我们更加便捷地利用这一强大工具进行各种NLP任务。本文将详细介绍在Mac电脑上本地部署Llama模型的步骤和注意事项。...
-
深入剖析“多多客CMS爬虫”:技术原理、应用场景与未来趋势
随着互联网技术的飞速发展,数据已经成为当今时代最宝贵的资源之一。为了获取海量数据,各种爬虫技术应运而生,其中“多多客CMS爬虫”以其高效、稳定的特点,在众多爬虫工具中脱颖而出。本文将深入探讨多多客CMS爬虫的技术原理、应用场景以及未来发展趋势,带领大家一探...
-
探索 Obsidian Copilot:智能笔记的新里程碑
探索 Obsidian Copilot:智能笔记的新里程碑 项目地址:https://gitcode.com/logancyang/obsidian-copilot 项目简介 Obsidian Copilot 是一个创新的插件,为流行的 markdo...
-
Llama 3开源!手把手带你推理,部署,微调
节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 汇总合集 《大模型面试...
-
阿里投资Kimi AI开发商月之暗面细节曝光:8亿美元换36%股权
快科技5月24日消息,日前阿里巴巴发布了2024财年年报,其中披露了一项投资细节:阿里巴巴在2024财年向AI初创公司月之暗面(Moonshot AI)投资约8亿美元,以此换取了该公司约36%的股权。 并且此次投资为优先股投资,显示了阿里巴巴对月之暗面及其...
-
Hugging Face全攻略:轻松下载Llama 3模型,探索NLP的无限可能!【实操】
Hugging Face:自然语言处理的强大开源模型库 在数字化时代,自然语言处理(NLP)技术的崛起为人工智能的发展注入了新的活力。而Hugging Face,作为这一领域的佼佼者,凭借其强大的模型仓库、易用的API以及活跃的社区支持,成为无数NL...
-
LLamaFactory:当下最容易上手的大模型微调工具
近日,国内的一款微调框架发布了自己的论文《LLAMAFACTORY: Unified Efficient Fine-Tuning of 100+ Language Models》,对他们的框架做了系统性的总结。该框架自推出后迅速出圈,现已斩获15.6k的s...
-
中国AI独角兽资本大冒险
冰火两重天。 成立不过一年多时间,月之暗面已然成为中国大模型赛道上,最炙手可热的明星公司。 5 月 21 日,华尔街见闻获悉,月之暗面将按照投前估值 30 亿美元(合217. 3 亿人民币)进行融资,完成后依然是当前中国估值最高的AI创业公司。 过去一年,...
-
250行代码从头搭建Llama 3,GitHub一天4.6k星!Karpathy大赞
Llama系列作为为数不多的优质开源LLM,一直受到开发者们的追捧。在Hugging Face社区的文本生成模型中,几乎是「霸榜」的存在。 就在520这天,一位名叫Nishant Aklecha的开发者在推特上宣布了自己的一个开源项目,名为「从头开始实...
-
150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory
不同于大多数模型使用字母缩略起名,论文作者在脚注中解释道,Lory是一种羽毛有彩虹颜色的鹦鹉,和「软MoE」的精神非常相似。 论文的作者团队也可以称之为「明星阵容」。 论文地址:https://arxiv.org/abs/2405.03133 主要作者...
-
深入解析“QueryPHP爬虫”:原理、应用与未来发展
在当今数字化信息时代,数据已经成为驱动一切的关键要素。随着互联网技术的不断进步,如何高效、准确地抓取与利用网络数据,成为了众多开发者和企业关注的焦点。在这个背景下,基于QueryPHP的爬虫技术以其独特的优势,逐渐受到业界的青睐。本文将从QueryPHP爬...
-
“蓝宝石留言本爬虫”探索与数据处理
随着互联网的蓬勃发展,网络留言本已成为人们交流信息、分享观点的重要平台。在这个信息爆炸的时代,如何从海量的留言数据中高效获取有价值的信息,成为数据分析领域的一大挑战。本文将围绕“蓝宝石留言本爬虫”的构建与应用,深入探讨爬虫技术的实现原理、留言数据的处理分析...
-
又被 OpenAI 截胡,Google推出开源视觉语言模型:PaliGemma
前言 该模型结合了 SigLIP 视觉模型和 Gemma 语言模型,这两种模型都是开放组件,使得PaliGemma在处理视觉与语言结合的任务上表现出色。 PaliGemma的使用场景包括图像字幕、图像标签和视觉问答等。这些应用场景利用了PaliGemm...
-
「大模型」之所短,「知识图谱」之所长
最近一年以来,大语言模型技术突飞猛进,被广泛地认为开启了人工智能研究的新阶段。大语言模型时代的到来,给知识图谱技术也带来了新的机遇与挑战。我们在 5 月份的时候曾经发布过知识图谱与 AIGC 大模型的知识地图,其中包括了文本生成、图像生成等技术。本次分享...
-
使用Quarkus和LangChain4j,LLM在Java中可以实现哪些功能?
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 本文试图通过一个有趣的原创项目,利用Quarkus和LangChain4j来揭开LLM在Java中使用的神秘面纱。 自从2022年11...
-
力压Transformer?首篇Mamba综述来了!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 Mamba是一种新的选择性结构状态空间模型,在长序列建模任务中表现出色。Mamba通过全局感受野和动态加权,缓解了卷积神经网络的建模约束,并提供了类似于Transfo...
-
LLM 评估新纪元:Arthur Bench 全方位解读
一、传统文本评估面临的挑战 近年来,随着大型语言模型(LLM)的快速发展和改进,传统的文本评估方法在某些方面可能已经不再适用。在文本评估领域,我们可能已经听说过一些方法,例如基于“单词出现”的评估方法,比如 BLEU,以及基于“预训练的自然语言处理模型”...
-
算法在 58 画像平台建设中的应用
一、58 画像平台建设背景 首先和大家分享下 58 画像平台的建设背景。 1. 传统的画像平台 传统的思路来看,建设用户画像平台依赖数仓建模能力,整合多业务线数据,构建准确的用户画像;还需要数据挖掘,理解用户行为、兴趣和需求,提供算法侧的能力;最后,...
-
微调大语言模型的七个步骤
译者 | 布加迪 审校 | 重楼 在最近一年半的时间里,自然语言处理(NLP)领域发生了显著的变化,这主要得益于OpenAI的GPT系列等大语言模型(LLM)的兴起。 这些功能强大的模型已彻底改变了我们处理自然语言任务的方法,在翻译、情绪分析和文本自动...
-
ChatGPT们的幕后先驱,斯坦福教授Manning的四十年NLP生涯
今年 1 月份,2024 年度 IEEE 冯诺伊曼奖项结果正式公布,斯坦福大学语言学和计算机科学教授、AI 学者克里斯托弗・曼宁(Christopher Manning)获奖。 曼宁教授是将深度学习应用于 NLP 领域的早期领军人物,在词向量 GloVe...
-
小红书正内测自研大模型“小地瓜”:已达国内主流水平
快科技4月30日消息,据媒体报道,小红书已经开始在部分内部产品中,灰度测试自研通用大模型基座小地瓜”。 报道表示,有知情者透露称,小红书对上线新AI产品的态度非常谨慎,原因是害怕破坏现有的内容生态,小红书的内容生态是活人种草,AI在里面怎么样才不违和,这是...
-
如何利用AI实现文档处理自动化
译者 | 陈峻 审校 | 重楼 文件处理在许多企业及员工看来是一项必不可少、却又耗时费力的工作。每天,他们往往需要花费无数个小时去对文件进行分类、归档、以及搜索。不过,如今人工智能(AI)正在以自动化的方式改变着这些琐碎的工作。 通过利用人工智能,企业...