-
训不动Mixtral,要不试试LLaMA-MoE?
深度学习自然语言处理 原创作者:cola 随着各种各样增强版LLaMA的出现,Mixture-of-Expert(MoE 类模型越来越受大家关注。而LLaMA-MoE正是基于LLaMA系列和SlimPajama的MoE模型。它显著的一个好处...
-
LLaMA 入门指南
LLaMA 入门指南 LLaMA 入门指南 LLaMA的简介 LLaMA模型的主要结构 Transformer架构 多层自注意力层 前馈神经网络 Layer Normalization和残差连接 LLaMA模型的变体 Base版本 La...
-
AIGC到底是个啥? AI和AIGC的区别有哪些
一、AIGC到底是个啥? 说来说去,到底什么是AIGC呢?AIGC是人工智能生成内容的缩写,是一种基于生成对抗网络(GAN)、大型预训练模型等人工智能技术的方法,通过对已有数据进行学习和模式识别,以适当的泛化能力生成相关内容的技术,AIGC的应用领域有很...
-
文心一言 ChatGPT 实测对比
期待已久之后,终于拿到了文心一言的邀请码,第一时间进行了测试。最后面会讲一下如何获取邀请码。 先说一下结论,很远,但是又不远。 很远是因为:我个人测试得出来的实际效果和ChatGPT差距还很大,下面我会放一些对比。当然也有很多正面例子,回答和Ch...
-
ChatGPT和Whisper的API基本看点
ChatGPT Official API Learning 今天 OpenAI 开放了 ChatGPT 背后的 GPT-3.5 的模型 API,模型代号为 Turbo,其定价甚至比此前的 Davinci 都要便宜,1000 tokens 仅为 0.2...
-
Whisper
文章目录 使后感 Paper Review 个人觉得有趣的 Log Mel spectrogram & STFT Training cross-atte...
-
用通俗易懂的方式讲解:使用Llama-2、PgVector和LlamaIndex,构建大模型 RAG 全流程
近年来,大型语言模型(LLM)取得了显著的进步,然而大模型缺点之一是幻觉问题,即“一本正经的胡说八道”。其中RAG(Retrieval Augmented Generation,检索增强生成)是解决幻觉比较有效的方法。 本文,我们将深入研究使用trans...
-
ChatGPT研究报告:AIGC带来新一轮范式转移
本文约4000字,目标是快速建立AIGC知识体系,含有大量的计算专业名词,建议阅读同时扩展搜索。 一、行业现状 1、概念界定 区别于PGC与UGC不同的,AIGC是利用人工智能技术自动生成内容的新型生产方式。 2、数据模...
-
上海人工智能实验室发布LLaMA-Adapter | 如何1小时训练你的多模态大模型用于下游任务
本文首发于微信公众号 CVHub,未经授权不得以任何形式售卖或私自转载到其它平台,违者必究! Title: LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-...
-
GitHub Copilot 与 ChatGPT:哪种工具更适合软件开发?
GitHub Copilot 与 ChatGPT:哪种工具更适合软件开发? 比较 ChatGPT 与 GitHub Copilot 编程语言 功能性 定制化 训练数据 上下文准确性 ChatGPT 与 GitHub Copilot:哪个更适...
-
详解各种LLM系列|LLaMA 1 模型架构、预训练、部署优化特点总结
作者 | Sunnyyyyy 整理 | NewBeeNLP https://zhuanlan.zhihu.com/p/668698204 后台留言『交流』,加入 NewBee讨论组 LLaMA 是Meta在2...
-
AIGC 语言大模型研究报告
AIGC 研究报告 这份报告可以被划分为两大部分。 第一部分集中于ChatGPT的发展和运作原理,为了增强理解,我们将先探讨自然语言处理的历史发展。 第二部分主要聚焦于由大模型引领的新的研究领域,并深入介绍在每个领域中可以进行的具体研究工作及思...
-
中文LLaMa和Alpaca大语言模型开源方案 | 扩充中文词表 & 针对中文语料进行高效编码
欢迎关注『CVHub』官方微信公众号! Title: Efficient and Effective Text Encoding for Chinese Llama and AlpacaPDF: https://arxiv.org/pdf/23...
-
AIGC:人工智能生成技术的新兴领域
1.背景介绍 1. 背景介绍 人工智能生成技术(AIGC 是一种利用机器学习和自然语言处理等技术来自动生成自然语言文本或其他形式的内容的技术。这种技术在近年来取得了显著的进展,为各种应用场景提供了强大的支持。本文将从背景、核心概念、算法原理、...
-
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语音做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过FunAsr,但是经过中文特殊优化的Whisper就未必...
-
2023年的深度学习入门指南(19) - LLaMA 2源码解析
2023年的深度学习入门指南(19 - LLaMA 2源码解析 上一节我们学习了LLaMA 2的补全和聊天两种API的使用方法。本节我们来看看LLaMA 2的源码。 补全函数text_completion源码解析 上一节我们讲了LLaMA 2的...
-
chatglm2-2b+sdxl1.0+langchain打造私有AIGC(一)
一、背景及目标 在ChatGPT爆火之后,我对AI技术也开始关注,一是出于好奇,而是出于危机。想必对于应用开发人员来说从“面面向对象编程”转成“面向AI编程”也是极好的。 最初的时候我也是抱着试一试的心态,开始魔法上网使用chatgpt,然后尝试调用o...
-
第一代AIGC硬件悄然爆发
文 | 智能相对论 作者 | 叶远风 看起来,这可能是一副正常的黑框眼镜,你戴上去彬彬有礼、斯斯文文; 实际上,它里边还装了一个“小伙伴”,你随时可以与它交流,谈天说地或者提出各种问题接受它的帮助;你化身为了科技极客,成为科幻片里带着有超能力的“...
-
AIGC知识速递——Google的Bert模型是如何fine-tuning的?
Look!👀我们的大模型商业化落地产品 📖更多AI资讯请👉🏾关注 Free三天集训营助教在线为您火热答疑👩🏼🏫 选择合适的预训练模型: 从预训练的BERT模型开始,例如Google 提供的BERT-base 或 BERT-large。这些模型已经...
-
深入探索 Stable Diffusion:AI图像创新的新纪元
深入探索 Stable Diffusion:AI图像创新的新纪元 介绍 Stable Diffusion 的核心功能和应用场景 Stable Diffusion 架构解析 深入 Stable Diffusion 的关键组件 变分自编码器(VA...
-
Pika:AIGC新秀,视频生成产业或迎来GPT时刻
今天分享的AIGC系列深度研究报告:《Pika:AIGC新秀,视频生成产业或迎来GPT时刻》。 (报告出品方:中泰证券) 报告共计:11页 Pika:专注Text to Video生成场景,支持3D和动漫 ◼ Pika成立于2023年5月,是一...
-
MedicalGPT:基于LLaMA-13B的中英医疗问答模型(LoRA)、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya-LLaMA]。
项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用 CSDN 平台,自主完成项目设计升级,提升自身...
-
2023-12-12 AIGC-AI工具的基本工作原理
摘要: 2023-12-12 AIGC-AI工具的基本工作原理 AI工具的基本工作原理 AI工具的基本工作原理涉及到一系列复杂的技术和算法。这些原理可以根据不同类型的AI工具进行概括,包括机器学习、自然语言处理、图像识别等。以下是一些关键的A...
-
两亿参数时序模型替代LLM?谷歌突破性研究被批「犯新手错误」
最近,谷歌的一篇论文在 X 等社交媒体平台上引发了一些争议。 这篇论文的标题是「A decoder-only foundation model for time-series forecasting(用于时间序列预测的仅解码器基础模型)」。 简而言之,...
-
无需GPU,手机芯片也能运行多模态模型!面壁智能发布MiniCPM,性能超过Mistral-7B!
2月1日,面壁智能发布了旗舰端侧模型 MiniCPM,它以小博大的性能超越了 Mistral-7B,并在 MT-Bench 等榜单上表现出色。 MiniCPM 是一款能说会看、具备编程能力、拥有多模态能力的端侧模型。它不仅在性能上优秀,而且具有极低的成本...
-
自然语言处理一览
自然语言处理(NLP)是一门机器学科,其主要目的是处理人类语言或类似人类语言的书面、口语和组织方式的数据。它起源于计算语言学,利用计算机科学来理解语言的原理。然而,NLP 不仅仅是开发理论框架,它还是一门工程学科,旨在创造技术来完成任务。 NLP 经常被...
-
ChatGPT与文心一言:应用示例与体验比较
ChatGPT 和文心一言哪个更好用? 为了更好地感受ChatGPT和文心一言这两款AI助手如何在实际运用中竞相辉映,我将提供一些典型的应用示例。这些示例都取自真实的用户体验,以帮助解释这两种工具如何让日常生活或工作变得更加轻松。 ChatGPT...
-
Segment Anything论文翻译,SAM模型,SAM论文,SAM论文翻译;一个用于图像分割的新任务、模型和数据集;SA-1B数据集
【论文翻译】- Segment Anything / Model / SAM论文 论文链接: https://arxiv.org/pdf/2304.02643.pdf https://ai.facebook.com/research/publica...
-
【多模态】13、Vision-Language 模型在视觉任务中的调研
文章目录 一、简介 二、基础知识 2.1 视觉任务的训练策略 2.2 VLM 基础 2.2.1 网络结构 2.2.2 预训练目标函数 2.2.3 评估和下游任务 2.3 数据集 三、迁移学习 3.1 使用 prompt tunin...
-
主导2024年就业市场的十大IT技能
随着技术持续快速发展,就业市场不断寻找具备最新IT技能的专业人士。到2024年,保持领先意味着掌握一套符合全球行业动态需求的特定能力。因此,这里综合列出了即将在来年主导就业市场的十大IT技能。 大数据:随着企业越来越重视数据分析以提高效率,大数据职位的...
-
一文搞懂使用 Arthur Bench 进行 LLM 评估
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估 。 一、传统文本评估面临的挑战 近年来,随着大型语言模型(LLM 的快速发展和改进,传统的文本评估方法在某些方面可能已经不再适用。在文本评估领...
-
打破MoE训练效率与性能瓶颈,华为盘古稀疏大模型全新架构LocMoE出炉
2023 年 12 月,首个开源 MoE 大模型 Mixtral 8×7B 发布,在多种基准测试中,其表现近乎超越了 GPT-3.5 和 LLaMA 2 70B,而推理开销仅相当于 12B 左右的稠密模型。为进一步提升模型性能,稠密 LLM 常由于其参数...
-
人工智能驱动增强现实和混合现实:沉浸式体验和运营效率的下一个前沿
人工智能(AI 、增强现实(AR 和混合现实(MR 的融合不仅仅是一种技术趋势,更是一股正在重塑行业的变革力量。随着人工智能算法变得越来越复杂,它们正在以以前难以想象的方式增强AR/MR应用。从高级对象识别到自然语言处理,人工智能正在为用户参与度和运营...
-
人工智能可以帮助改善云计算管理有哪些方式
当企业考虑云管理时,主要考虑的是运营流程,例如监控性能、维护安全性和确保合规性。这些都是成功开展业务的重要方面,但这只是云管理所需要的一部分。 一个经常被忽视的关键方面是通过提供直观的工具和集成的支持流程来改善用户体验,从而消除企业IT基础设施的一些麻...
-
史上首个100%开源大模型重磅登场!破纪录公开代码/权重/数据集/训练全过程,AMD都能训
多年来,语言模型一直是自然语言处理(NLP)技术的核心,考虑到模型背后的巨大商业价值,最大最先进的模型的技术细节都是不公开的。 现在,真·完全开源的大模型来了! 来自艾伦人工智能研究所、华盛顿大学、耶鲁大学、纽约大学和卡内基梅隆大学的研究人员,联合发表了...
-
击败OpenAI,权重、数据、代码全开源,能完美复现的嵌入模型Nomic Embed来了
一周前,OpenAI 给广大用户发放福利,在下场修复 GPT-4 变懒的问题后,还顺道上新了 5 个新模型,其中就包括更小且高效的 text-embedding-3-small 嵌入模型。 我们知道,嵌入是表示自然语言或代码等内容中概念的数字序列。嵌入使...
-
文心一言情感关怀之旅
【AGIFoundathon】文心一言情感关怀之旅,让我们一起来体验吧! 上传一张照片,用ernie-bot生成专属于你的小故事! 此项目主要使用clip_interrogator获取图片的关键信息,然后将此关键信息用百度翻译API翻译成中文后,使...
-
聊一聊AIGC
“UGC不存在了”——借鉴自《三体》 ChatGPT 的横空出世将一个全新的概念推上风口——AIGC( AI Generated Content)。 GC即创作内容(Generated Content),和传统的UGC、PGC,...
-
【CV】稳定扩散模型(Stable Diffusion)
🔎大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流🔎 📝个人主页-Sonhhxg_柒的博客_CSDN博客 📃 🎁欢迎各位→点赞👍 + 收藏⭐️ + 留言📝 📣系列专栏 - 机器学习【ML】 自...
-
快速入门ChatGPT和AIGC:底层原理、热门工具、行业现状【我们能做什么】
最近大家热议的ChatGPT和AI绘画工具的底层技术原理是什么?是如何发展到现在的?有哪些应用场景、热门工具?AIGC产业上下游有哪些公司?作为普通用户,我们还能接触哪些应用AI技术打造的商业解决方案?…… 我们查阅了AIGC相关相关的调研报告和各类资料...
-
使用人工智能的好处与挑战
人工智能(AI 已经从未来的梦想变成了全球家庭和企业的现代现实。如果利用得当,人工智能有可能极大地增强业务运营,商业通信领域已经从这项突破性技术中受益。 人工智能在商业通信中的好处是什么? 以下是人工智能增强从小型初创企业到大型企业的商业通信的一些方式...
-
【大语言模型】5分钟快速认识ChatGPT、Whisper、Transformer、GAN
5分钟快速认识ChatGPT、Whisper、Transformer、GAN 什么是ChatGPT? 什么是Whisper? 什么是Generative Pre-trained Transformer架构? 什么是自然处理语言 NLP 的 Tr...
-
如何基于文心一言NLP大模型搭建生成式智能对话服务
随着人工智能技术的不断发展,自然语言处理(NLP)在智能对话领域的应用越来越广泛。文心一言NLP大模型作为当前先进的NLP技术之一,能够为智能对话服务提供强大的支持。本文将详细介绍如何基于文心一言NLP大模型搭建生成式智能对话服务,帮助读者了解语言理解和生...
-
AIGC内容分享(四十):生成式人工智能(AIGC)应用进展浅析
目录 0 引言 1 以ChatGPT为代表的AIGC发展现状 1.1 国外AIGC应用发展现状 1.2 国内AIGC应用发展现状 2 AIGC的技术架构 (1)数据层 (2)算力基础设施层 (3)算法及大模型层 (4)AI...
-
2024三掌柜赠书活动第七期:一本书读懂AIGC:探索AI商业化新时代
目录 前言 AI商业化的背景和挑战 关于《一本书读懂AIGC:探索AI商业化新时代》 编辑推荐 内容简介 作者简介 图书目录 书中前言/序言 《一本书读懂AIGC:探索AI商业化新时代》全书速览 结束语 前言 不用多讲,想必大家也都知道,人工...
-
小米王化称小爱同学AI助手已通过大模型备案:全新跨越式智能体验
快科技1月30日消息,今日,小米公关部总经理王化发微博称,小爱同学AI助手已通过大模型备案,接下来可以有更多的朋友能体验小爱同学大模型的魅力了。 其中,王化还提到,去年8月,小爱同学升级大模型版本开始公测,在过去的数月里已经有不少米粉体验过小爱同学AI助手...
-
德克萨斯州大学将建立学术界最大之一的生成式AI中心
德克萨斯州奥斯汀 - 德克萨斯大学奥斯汀分校(UT)正在建立一个学术界最强大的人工智能中心,以引领研究并为广泛的合作伙伴提供世界一流的人工智能基础设施。 图源备注:图片由AI生成,图片授权服务商Midjourney UT正在启动生成式人工智能中心,该中心...
-
copilot和chatGPT的区别分析
Copilot是一个基于人工智能的代码提示工具,由GitHub和人工智能公司合作开发。它可以利用机器学习技术和大量训练数据生成高质量的代码,提高开发者的编码效率。Copilot的工作原理是基于自然语言处理、机器学习和深度神经网络技术,以及大规模实际编码数据...
-
2024年1月17日Arxiv最热论文推荐:清华提出多模态知识检索新框架、MIT新方法大幅提升LLMs的连贯性、浙大新模型助力视频任务新突破、Meta 革新搜索技术、Google革新AI写作
本文整理了今日发表在ArXiv上的AI论文中最热门的TOP5。 论文解读、论文热度排序、论文标签、中文标题、推荐理由和论文摘要均由赛博马良平台(saibomaliang.com)上的智能体 「AI论文解读达人」 提供。 如需查看其他热门论文,欢迎移步 ...
-
无需人工标注!LLM加持文本嵌入学习:轻松支持100种语言,适配数十万下游任务
文本嵌入(word embedding)是自然语言处理(NLP)领域发展的基础,可以将文本映射到语义空间中,并转换为稠密的矢量,已经被广泛应用于各种自然语言处理(NLP)任务中,如信息检索(IR)、问答、文本相似度计算、推荐系统等等, 比如在IR领域,第...