语言模型第29页

Sora到底是如何工作的？

译者 | 布加迪审校 | 重楼上周OpenAI团队推出了Sora这一大规模视频生成模型，展示了模拟物理世界基本方面的新功能。我关注文本生成视频这个领域已有很长一段时间，我认为这个模型代表了质量方面的突飞猛进。我在Reddit和Twitter上看到...

AIGC 2024-02-22 人工智能

814阅读

谷歌VideoPoet负责人蒋路跳槽TikTok！对标Sora，AI视频模型大战在即

离职OpenAI的技术大神karpathy，终于上线了2小时的AI大课。 ——「让我们构建GPT Tokenizer（分词器）」。图片其实，早在新课推出两天前，karpathy在更新的GitHub项目中，就预告了这件事。图片这个项目是minbpe...

人工智能 2024-02-22 人工智能

849阅读

都在搞端到端，试问端到端自动驾驶的基石到底是什么？

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解基础模型的出现彻底改变了自然语言处理和计算机视觉领域，为其在自动驾驶（AD）中的应用铺平了道路。这项调查对40多篇研究论文进行了全面回顾，展示了基础模型在增强AD中的...

人工智能 2024-02-22 人工智能

904阅读

单GPU就能压缩模型，性能不变参数少25%！微软提出模型稀疏化新方法

众所周知，对于大语言模型来说，规模越大，所需的算力越大，自然占用的资源也就越多。研究人员于是乎把目光转到了这片领域，即模型的稀疏化（Sparsification）。今天要介绍的SliceGPT，则可以实现模型的事后稀疏。也就是说，在一个模型训练完了以...

AIGC 2024-02-21 人工智能

889阅读

Karpathy新视频又火了：从头构建GPT Tokenizer

技术大神卡帕西离职OpenAI以后，营业可谓相当积极啊。这不，前脚新项目刚上线，后脚全新的教学视频又给大伙整出来了：这次，是手把手教咱构建一个GPT Tokenizer（分词器），还是熟悉的时长（足足2小时13分钟）。 Ps. 上次讲课还是俩月前的...

AIGC 2024-02-21 人工智能

768阅读

BentoML：如何使用 JuiceFS 加速大模型加载

BentoML 是一个开源的大语言模型（LLM） AI 应用的开发框架和部署工具，致力于为开发者提供最简单的构建大语言模型 AI 应用的能力，其开源产品已经支持全球数千家企业和组织的核心 AI 应用。当 BentoML 在 Serverless 环...

人工智能 2024-02-21 人工智能

849阅读

四个优秀AI Agent开源项目，谈一谈大模型、人工智能代理

什么是AI Agent？现在我们与大模型的互动，一般的过程是先输入一个提示词，之后，大模型根据输入内容进行计算并响应。每次想要得到一个新的输出，我们就必须再提供一个提示词。这个过程有点麻烦，因为总是要有人来驱动。 AI Agent（人工智能代理）则以不...

人工智能 2024-02-21 人工智能

1285阅读

谷歌AI推出ScreenAI：用于UI和信息图解读的视觉语言模型

划重点: ⭐️ Google AI 团队提出了 ScreenAI，这是一个视觉语言模型，可以全面理解 UI 和信息图。 ⭐️ ScreenAI 在多个任务上表现出色，包括图形问答（QA），元素注释，摘要生成等。 ⭐️ 该团队发布了三个新数据集，为未来研究提...

生成式AI 2024-02-21 人工智能

871阅读

Llama深入浅出

前方干货预警：这可能是你能够找到的最容易懂的最具实操性的学习开源LLM模型源码的教程。本例从零开始基于transformers库逐模块搭建和解读Llama模型源码(中文可以翻译成羊驼。并且训练它来实现一个有趣的实例：两数之和。输入...

生成式AI 2024-02-21 人工智能

817阅读

企业数据在生成人工智能中的关键作用

大量基于GenAI的工具和应用涌入市场。其中一些应用非常聪明且富有创意，但它们大多是ChatGPT等应用背后的大型语言模型(LLM 的包装器。这并不是要贬低LLM的语言、概念和单词关系知识可以提供新的效率和生产力的数千种潜在场景。但LLM和ChatGP...

AIGC 2024-02-21 人工智能

809阅读

【AIGC】大语言模型

大型语言模型，也叫大语言模型、大模型（Large Language Model，LLM；Large Language Models，LLMs）什么是大型语言模型大型语言模型（LLM）是指具有数千亿（甚至更多）参数的语言模型，它们是通过在大规模文本数...

生成式AI 2024-02-20 人工智能

1100阅读

AnyGPT:实现任意模态输入到任意模态输出

近日，复旦大学、上海人工智能实验室等机构联合推出了一款名为AnyGPT的多模态大语言模型，该模型在处理语音、文本、图像和音乐等多种模态输入时，可以生成任何模态的输出。 AnyGPT采用离散表示技术，通过在各模态输入上进行离散标记，实现了多模态信息的统一处...

大数据 2024-02-20 人工智能

923阅读

Sora给中国AI带来的真实变化

OpenAI的最新技术成果——文生视频模型Sora，在春节假期炸裂登场，令海内外的AI从业者、投资人彻夜难眠。如果你还没有关注到这个新闻，简单介绍一下:Sora是OpenAI使用超大规模视频数据，训练出的一个通用视觉模型，可以理解和模拟运动中的物理世界，...

大数据 2024-02-20 人工智能

840阅读

GPT-4可能也在用的推测解码是什么？一文综述前世今生和应用情况

众所周知，大型语言模型（LLM）的推理通常需要使用自回归采样，这个推理过程相当缓慢。为了解决这个问题，推测解码（Speculative Decoding）已经成为 LLM 推理的一种新型采样方法。这种方法在每个采样步骤中，会先预测几个可能的 token，...

AIGC 2024-02-20 人工智能

856阅读

RNN模型挑战Transformer霸权！1%成本性能比肩Mistral-7B，支持100+种语言全球最多

在大模型内卷的同时，Transformer的地位也接连受到挑战。近日，RWKV发布了Eagle 7B模型，基于最新的RWKV-v5架构。 Eagle 7B在多语言基准测试中，击败了所有的同级别模型，在单独的英语测试中，也和表现最好的模型基本打平。同时...

人工智能 2024-02-20 人工智能

843阅读

Windows、Office直接上手，大模型智能体操作电脑太6了

当我们谈到 AI 助手的未来，很难不想起《钢铁侠》系列中那个令人炫目的 AI 助手贾维斯。贾维斯不仅是托尼・斯塔克的得力助手，更是他与先进科技的沟通者。如今，大模型的出现颠覆了人类使用工具的方式，我们或许离这样的科幻场景又近了一步。想象一下，如果一个多模...

大数据 2024-02-19 人工智能

1081阅读

2024年IT行业“龙抬头”：AI和网络安全是最大热点

IDC指出，2024年的IT市场充满机遇，尽管通胀和经济等因素带来隐忧，但整体增长势头强劲。数字化的浪潮推动着对结构化数据和人工智能(AI 的需求，企业逐渐意识到数据带来的巨大价值，以及利用AI和自动化管理数据、进行高级数据处理的重要性。 IDC市场研...

大数据 2024-02-19 人工智能

931阅读

自然语言生成任务中的五种采样方法介绍和Pytorch代码实现

在自然语言生成任务(NLG 中，采样方法是指从生成模型中获取文本输出的一种技术。本文将介绍常用的5中方法并用Pytorch进行实现。 1、Greedy Decoding Greedy Decoding在每个时间步选择当前条件概率最高的词语作为输出，直到...

大数据 2024-02-19 人工智能

922阅读

政安晨：演绎在KerasCV中使用Stable Diffusion进行高性能图像生成

小伙伴们好，咱们今天演绎一个使用KerasCV的StableDiffusion模型生成新的图像的示例。考虑计算机性能的因素，这次咱们在Colab上进行，Colab您可以理解为在线版的Jupyter Notebook，还不熟悉Jupyter的的小伙伴可以...

大数据 2024-02-19 人工智能

1093阅读

生成式人工智能（AIGC）之最全详解图解

生成式人工智能（AIGC）之最全详解图解 1. AIGC的发展历程 1.1 AIGC演化重要时间节点 AIGC发展历程图 OpenAI大语言模型发展进程 1.2技术推进路线 2.AIGC技术场景 2.1 技术场景 3.1AIGC相关应用...

生成式AI 2024-02-18 人工智能

2493阅读

Nomic AI 发布首个完全开源的长文本嵌入模型，超越 OpenAI Ada-002在各项基准测试中的表现

在自然语言处理（NLP）领域不断发展的背景下，理解和处理广泛的文本内容至关重要。最近的一些进展显著提升了语言模型的能力，特别是通过文本嵌入的发展。这些嵌入成为许多应用的基础，包括大型语言模型(LLMs 的检索增强生成和语义搜索。它们将句子或文档转换为低维向...

人工智能 2024-02-18 人工智能

1313阅读

ElevenLabs官网体验入口高质量AI语音生成器免费在线使用地址

ElevenLabs是一款领先的文本转语音和语音克隆软件，可以根据需要生成任何语音、风格和语言的高质量音频。点击前往ElevenLabs官网体验入口 ElevenLabs适用于内容创作者、游戏开发者、出版商等用户。它提供了高质量的语音生成和语音克隆功...

生成式AI 2024-02-18 人工智能

1925阅读

使用LlamaIndex和ChatGPT的无代码检索增强生成（RAG）

检索增强生成(RAG 是使用大型语言模型(LLM 的关键工具。RAG使LLM能够将外部文档合并到它们的响应中，从而更紧密地与用户需求保持一致。这个功能在传统上使用LLM犹豫不决的领域尤其有益，尤其是在事实很重要的时候。自从ChatGPT和类似的LLM推...

大数据 2024-02-18 人工智能

1062阅读

训不动Mixtral，要不试试LLaMA-MoE？

深度学习自然语言处理原创作者：cola 随着各种各样增强版LLaMA的出现，Mixture-of-Expert(MoE 类模型越来越受大家关注。而LLaMA-MoE正是基于LLaMA系列和SlimPajama的MoE模型。它显著的一个好处...

人工智能 2024-02-18 人工智能

1110阅读

谷歌内部推出AI大语言模型Goose 主打代码编写、产品研发

据Business Insider报道，近日，谷歌内部秘密开发了一款名为“Goose”的人工智能大语言模型，据知情人士透露。这款AI工具被特别设计给谷歌工程师使用，融入了公司25年的技术积淀，目的是大幅度提高内部团队的工作效能，特别是在代码编写和新产品研发...

人工智能 2024-02-18 人工智能

800阅读

AIGC音视频工具分析和未来创新机会思考

编者按：相较于前两年，2023年音视频行业的使用量增长缓慢，整个音视频行业遇到瓶颈。音视频的行业从业者面临着相互竞争、不得不“卷”的状态。我们需要进行怎样的创新，才能从这种“卷”的状态中脱离出来？LiveVideoStack 2023上海站邀请到了P...

人工智能 2024-02-18 人工智能

953阅读

文心一言能降重吗 GPT改写

大家好，今天来聊聊文心一言能降重吗 GPT改写，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具：文心一言能降重吗一、引言随着人工智能技术的不断发展，越来越多的论文降重工具如小发猫伪原创、...

人工智能 2024-02-18 人工智能

1601阅读

近期关于AIGC方面的学习笔记和思路整理

LLM 对于LLM，我现在重点关注在这几个方面：开源且可私有化部署的代码生成模型：因为大部分软件企业对于安全都很重视，文档、数据、代码一般都会尽量避免被泄露。所以很难使用类似Copilot或者OpenAI的Bito这种需要连到互联网上的服务。如果...

生成式AI 2024-02-17 人工智能

983阅读

2024年对话式AI商用指南

将具有认知能力的对话式AI融入现代商业战略是必不可少的，特别是在它改变客户体验方面，普华永道对商业和技术领导者的一项调查就支持了这一观点。人工智能和认知技术正在重塑客户参与度，将客户体验从传统角色转变为客户旅程的重要组成部分，这极大地影响了忠诚度和感知...

大数据 2024-02-17 人工智能

919阅读

Copilot vs. ChatGPT: 探秘数字助手的神奇世界

欢迎来到这场Copilot和ChatGPT的奇妙对比之旅！在数字化的世界中，程序员和普通用户都受益于这两位强大的数字助手。本文将深入挖掘Copilot和ChatGPT的不同之处，解开它们神奇的工作原理，以及如何在工作和学习中最好地利用它们。 Copil...

生成式AI 2024-02-17 人工智能

1264阅读

扩展说明: 指令微调 Llama 2

这篇博客是一篇来自 Meta AI，关于指令微调 Llama 2 的扩展说明。旨在聚焦构建指令数据集，有了它，我们则可以使用自己的指令来微调 Llama 2 基础模型。目标是构建一个能够基于输入内容来生成指令的模型。这么做背后的逻辑是，模型如此...

AIGC 2024-02-17 人工智能

1060阅读

一图揽尽全球LLM崛起之路；LLM概念速查清单；DALL·E提示词红宝书·在线版；fast.ai新课带你从零实现Stable Diffusion | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? LLM 崛起之路：全球大语言模型「规模增长」可视化交互图 https://informationisbeautiful.net/visual...

人工智能 2024-02-17 人工智能

1242阅读

周鸿祎谈Sora模型：中美AI差距可能还在加大

2月17日消息，近日，OpenAI 发布了 Sora 模型，该模型可根据用户输入的文本提示词描述，生成一段60秒钟的视频内容。从OpenAI公开的演示视频来看效果非常超现实。昨日，360董事长周鸿祎在微博发文，谈到OpenAI的文字转视频模型Sora。他...

大数据 2024-02-17 人工智能

888阅读

什么是预训练Pre-training—— AIGC必备知识点，您get了吗？

Look！?我们的大模型商业化落地产品 ?更多AI资讯请??关注 Free三天集训营助教在线为您火热答疑??‍? 随着人工智能(AI 不断重塑我们的世界，其发展的一个关键方面已经成为现代机器学习模型的支柱:预训练。在本篇文章中，我们将探讨预训练的概...

人工智能 2024-02-17 人工智能

2812阅读

AIGC内容分享(二)：全球大模型技术与应用分析

目录前言人工智能技术回顾 AIGC近期动态梳理 1. 国内动态 2. 国外动态 3. OpenAI的关键动作 4. AIGC的技术变革 AIGC的关键应用 1. AIGC应用背后的驱动力 2. AIGC的三大原能力 3. AI...

生成式AI 2024-02-17 人工智能

1012阅读

ChatGPT论文：大语言模型LLM之战:Dolly、LLaMA 、Vicuna、Guanaco、Bard、ChatGPT--在自然语言转SQL(NL2SQL、Text-to-SQL)的比较（二）

3 评价结果 3.1 Spider 数据集表 2 列出了各种提示策略和模型组合的执行准确性 (EX 和测试套件 (TS 的准确性。我们的主要发现是：开源模型在 Spider 数据集上遇到了困难：尽管参数数量和模型性能之间存在正相关关系...

大数据 2024-02-17 人工智能

1075阅读

Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试

2023年10月，我们发表了一篇关于TimeGPT的文章，TimeGPT是时间序列预测的第一个基础模型之一，具有零样本推理、异常检测和共形预测能力。虽然TimeGPT是一个专有模型，只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了...

人工智能 2024-02-16 人工智能

1055阅读

【AI绘画】用张图直观理解Stable Diffusion

手把手教你入门绘图超强的AI绘画，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取）作者****｜Jay Alammar 翻译｜杨婷、徐佳渝最近，AI图像生成引人注目，它能够根据文字描述生成...

人工智能 2024-02-16 人工智能

930阅读

读懂ChatGPT、AIGC和元宇宙

参考来源：书名：一本书读懂ChatGPT、AIGC和元宇宙作者：王喜文出版社：电子工业出版社出版时间：2023年5月 ISBN：9787121453571 斯克称ChatGPT将颠覆世界；微软为ChatGPT投资数百亿美元，并计划将其整...

AIGC 2024-02-16 人工智能

823阅读

文心一言---中国版的“ChatGPT”狂飙的机会或许要出现了

⭐️我叫忆_恒心，一名喜欢书写博客的在读研究生?‍?。如果觉得本文能帮到您，麻烦点个赞?呗！近期会不断在专栏里进行更新讲解博客~~~ 有什么问题的小伙伴欢迎留言提问欧，喜欢的小伙伴给个三连支持一下呗。?⭐️❤️ 目录...

AIGC 2024-02-15 人工智能

920阅读

文心一言4.0API接入指南

概述文心一言是百度打造出来的人工智能大语言模型，具备跨模态、跨语言的深度语义理解与生成能力，文心一言有五大能力，文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成，其在搜索问答、内容创作生成、智能办公等众多领域都有更广阔的想象空间。文心一言企业...

生成式AI 2024-02-15 人工智能

2186阅读

LLaMA 入门指南

LLaMA 入门指南 LLaMA 入门指南 LLaMA的简介 LLaMA模型的主要结构 Transformer架构多层自注意力层前馈神经网络 Layer Normalization和残差连接 LLaMA模型的变体 Base版本 La...

人工智能 2024-02-15 人工智能

1570阅读

科技部出手！科研人员的 AIGC 使用手册来了，学术界开始防范 AI 枪手

篡改实验数据、实验图片造假、论文不当署名、教材编写抄袭……1 月 16 日下午，华中农业大学的 11 名学生「一纸诉状」，以一份 125 页的举报材料实名举报该校黄姓教授存在学术不端行为。一时间，舆论迅速发酵，「赌上前程捍卫学术清白」、「人人都是学术造假受...

AIGC 2024-02-15 人工智能

843阅读

基于LLaVA开源模型打造视频聊天助手

简介大型语言模型已经证明自己是一项革命性的技术。目前，人们已经开发出了许多基于大型语言模型功能的应用程序，而且预计很快还会有更多的应用程序问世。大型语言模型最有趣的应用之一是将其部署为智能助手，它们能够帮助人类用户完成各种任务。人们已经能够通过指令微...

AIGC 2024-02-15 人工智能

1013阅读

免费ai写作生成器怎么用？文章生成器在线免费

Hello，各位叨友们好，我是叨叨君~ 在当今这个信息爆炸的时代，智能写作免费网站如雨后春笋般涌现，为人们提供了全新的创作方式。这些网站运用先进的AI技术，让写作变得更加高效、便捷，让我们的创意得以充分展现。下面，让我们一起来看看这些智能写作免费...

大数据 2024-02-15 人工智能

1188阅读

文心一言降重好用吗 PaperGPT

大家好，今天来聊聊文心一言降重好用吗 PaperGPT，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具：文心一言降重好用吗文心一言是百度推出的AI语言模型，具有强大的自然语言处理...

大数据 2024-02-15 人工智能

1599阅读

八项指标对比ChatGPT和文心一言

文章目录前言特定指标对比：实际运用对比：一、算力二、训练时间三、算法复杂度四、模型结构五、应用场景六、性能指标七、可解释性八、迁移能力 ✍创作者：全栈弄潮儿 ? 个人主页：全栈弄潮儿的个人主页 ?️ 个人...

人工智能 2024-02-15 人工智能

974阅读

LLM自动进行数据分析-论文《Data-Copilot: Bridging Billions of Data and Humans with Autonomous Workflow》笔记

文章目录概要接口设计Interface Design Explore Data by Self-Request Interface definition Interface Merging Interface Implementation...

AIGC 2024-02-15 人工智能

1008阅读

扩散模型的发展过程梳理多个扩散模型理论知识总结/DDPM去噪扩散概率/IDDPM/DDIM隐式去噪/ADM/SMLD分数扩散/CGD条件扩散/Stable Diffusion稳定扩散/LM

前言 1.最近发现自己光探索SDWebUI功能搞了快两个月，但是没有理论基础后面科研路有点难走，所以在师兄的建议下，开始看b站视频学习一下扩散模型，好的一看一个不吱声，一周过去了写个博客总结一下吧，理理思路。不保证下面的内容完全正确，只能说是一个菜鸟的思...

AIGC 2024-02-15 人工智能

2151阅读

【AIGC】DreamBooth:微调文本到图像扩散模型用于主题驱动的生成

前言 DreamBooth可以让我们使用一个很小的数据集微调文生图模型，然后基于文本提示词为我们训练的的主体替换不同的场景。摘要大型文本转图像模型在人工智能的发展中实现了显著的飞跃，能够从给定的文本提示中高质量和多样化地合成图像。然而，...

AIGC 2024-02-15 人工智能

1269阅读