语言模型第14页

基于Llama 3搭建中文版（Llama3-Chinese-Chat）大模型对话聊天机器人

前面两篇博文，我们分别在个人笔记本电脑部署了Llama 3 8B参数大模型，并使用Ollama搭建了基于 Web 可视化对话聊天机器人，可以在自己电脑上愉快的与Llama大模型 Web 机器人对话聊天了。但在使用过程中，笔者发现Llama大模型经常出现中文...

大数据 2024-06-04 人工智能

1997阅读

Karpathy点赞，这份报告教你如何用 LLaMa 3创建高质量网络数据集

众所周知，对于 Llama3、GPT-4 或 Mixtral 等高性能大语言模型来说，构建高质量的网络规模数据集是非常重要的。然而，即使是最先进的开源 LLM 的预训练数据集也不公开，人们对其创建过程知之甚少。最近，AI 大牛 Andrej Karpa...

AIGC 2024-06-04 人工智能

831阅读

微软震撼发布Copilot+PC！真正意义上的AIPC时代已经到来！

5月20日，微软正式发布了 Copilot+ PC，这是全球首款专为 AI 设计的 Windows PC，也是有史以来最快、最安全、功能最强大的 Windows PC Copilot+ PC 内置了 OpenAI 的 GPT-4o...

人工智能 2024-06-04 人工智能

922阅读

3B模型新SOTA！开源AI让日常调用不同大模型更简单

大模型，大，能力强，好用！但单一大模型在算力、数据和能耗方面面临巨大的限制，且消耗大量资源。而且目前最强大的模型大多为闭源，对AI开发的速度、安全性和公平性有所限制。 AI大模型的未来发展趋势，需要怎么在单一大模型和多个专门化小模型之间做平衡和选择？...

AIGC 2024-06-04 人工智能

827阅读

大规模语言模型--LLaMA 家族

LLaMA 模型集合由 Meta AI 于 2023 年 2 月推出，包括四种尺寸(7B 、13B 、30B 和 65B 。由于 LLaMA 的开放性和有效性，自从 LLaMA 一经发布，就受到了研究界和工业界的广泛关注。LLaMA 模型在开放基准...

大数据 2024-06-04 人工智能

1470阅读

[AI Microsoft] Copilot+ PC 的介绍

我们5月20日活动的即时录音已经可以获取。 https://www.microsoft.com/event 今天，在我们新的微软园区举办的特别活动上，我们向世界介绍了一种新型的面向人工智能的Windows PC，Copilot+ PC。 Copilo...

人工智能 2024-06-04 人工智能

1062阅读

GPT Researcher：破解复杂研究的AI利器

作者 | 崔皓审校 | 重楼在现代研究环境中，处理如详尽研究工作或学术论文撰写等复杂任务对当前的大型语言模型(如ChatGPT 来说是一个挑战。这些任务通常需要长时间的手动干预和多步骤操作，现有的AI工具往往无法在没有人类帮助的情况下完成这些复杂任...

AIGC 2024-06-04 人工智能

1086阅读

OpenAI衍生公司人工智能模型让机器人像人一样思考、学习

OpenAI曾于2021年夏天宣布解散其机器人团队，原因是缺乏足够的数据来训练机器人使用人工智能进行移动和推理。但三位来自OpenAI的早期研究科学家创立的初创公司Covariant，声称已经解决了这一难题。 Covariant AI系统的特点: 结合...

生成式AI 2024-06-04 人工智能

899阅读

在Docker中部署Llama大型语言模型

Docker作为一个轻量级的容器化平台，使得应用程序的部署和扩展变得简单而高效。在Docker中部署Llama大型语言模型，可以确保模型运行环境的一致性和可移植性，同时也便于管理和扩展。本文将介绍如何在Docker中部署Llama模型的具体步骤和注意事项。...

人工智能 2024-06-04 人工智能

963阅读

具身智能的视觉-语言-动作模型：综述

本文经自动驾驶之心公众号授权转载，转载请联系出处。 24年5月论文“A Survey on Vision-Language-Action Models for Embodied AI”。深度学习已在计算机视觉、自然语言处理和强化学习等许多领域取得了显著...

人工智能 2024-06-04 人工智能

1516阅读

理解老司机，超越老司机！LeapAD：具身智能加持下的双过程自驾系统（上海AI Lab等）

本文经自动驾驶之心公众号授权转载，转载请联系出处。论文信息论文题目：Continuously Learning, Adapting, and, Improving: A Dual-Process Approach to Autonomous Dr...

AIGC 2024-06-04 人工智能

1076阅读

AI让网友“吃石头”闹得沸沸扬扬，谷歌副总裁发博回应：不是幻觉

最近一周，网上关于谷歌AI overview（AI概览）的讨论沸沸扬扬，简直快要扛起X平台科技区的流量大旗。这款在2023年5月就推出测试版的AI搜索，在正式上线前已处理了超十亿次查询，却依旧没能逃过翻车的命运，原因是它仍无法判断“人能不能吃石头、喝胶水...

生成式AI 2024-06-04 人工智能

848阅读

大语言模型原理与工程实践：LLaMA 系列

1. 背景介绍 1.1 大型语言模型的兴起近年来，随着深度学习技术的飞速发展，大型语言模型（LLM）逐渐成为人工智能领域的研究热点。LLM 是一种基于深度学习的自然语言处理模型，能够学习大量的文本数据，并根据这些数据生成自然流畅的文本、回答问题、进行...

生成式AI 2024-06-04 人工智能

865阅读

【AIGC调研系列】MiniCPM-Llama3-V2.5模型与GPT-4V对比

MiniCPM-Llama3-V2.5模型与GPT-4V的对比可以从多个方面进行分析，包括性能、应用场景和技术特点。从性能角度来看，MiniCPM-Llama3-V2.5在OCR识别、模型幻觉能力和空间理解能力方面表现出色，实现了开源模型的性能SOTA...

大数据 2024-06-04 人工智能

1377阅读

微软ML Copilot框架释放机器学习能力

摘要：大模型席卷而来，通过大量算法模型训练推理，能根据人类输入指令产生图文，其背后是大量深度神经网络模型在做运算，这一过程称之为机器学习，本文从微软语言大模型出发，详解利用大型语言模型（Large Language Models, LLMs）解决实际机器学...

人工智能 2024-06-04 人工智能

842阅读

快速学会一个算法，xLSTM

今天给大家分享一个超强的算法模型，xLSTM。 xLSTM（Extended Long Short-Term Memory）是对传统 LSTM（Long Short-Term Memory）模型的扩展和改进，旨在提升其在处理时间序列数据和序列预测任务中的...

AIGC 2024-06-03 人工智能

927阅读

不想炸薯条的Ilya和不送GPU的英伟达，Hinton最新专访：道路千万条，安全第一条

从谷歌离职一年之际，「人工智能教父」Hinton接受了采访。 ——也许是因为徒弟Ilya终于被从核设施中放了出来？（狗头）视频地址：https://www.youtube.com/watch?v=tP-4njhyGvo 当然了，采访教父的小伙子也非等...

大数据 2024-06-03 人工智能

799阅读

开源模型进展盘点：最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好？

深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察，也会经常把一些观察的结果写成博客。在一篇 5 月中发布的博客中，他盘点分析了 4 月份发布的四个主要新模型：Mix...

生成式AI 2024-06-03 人工智能

810阅读

首个智慧城市大模型UrbanGPT，全面开源开放｜港大&百度

时空预测技术，迎来ChatGPT时刻。时空预测致力于捕捉城市生活的动态变化，并预测其未来走向，它不仅关注交通和人流的流动，还涵盖了犯罪趋势等多个维度。目前，深度时空预测技术在生成精确的时空模型方面，依赖于大量训练数据的支撑，这在城市数据不足的情况下显得...

大数据 2024-06-03 人工智能

833阅读

意外！老黄剧透下一代GPU芯片，新演讲又把摩尔定律按在地上摩擦

刚刚，中国台湾大学体育场，欢呼阵阵如同演唱会，但这次“摇滚巨星”，其实是英伟达创始人黄仁勋，再次回到学校，带来Computex重磅演讲，以及英伟达的新一代GPU。是的，英伟达新架构Blackwell宣布不过3个月，老黄就把后三代路线图全公开了： 20...

人工智能 2024-06-03 人工智能

855阅读

AnythingLLM：零成本的私人ChatGPT，支持几乎所有主流大模型

用过大模型的都知道，我们不怕它不回答，就怕它乱回答，特别是一眼还看不出来的那种。即便是最先进的AI模型也会说谎，防不胜防。对企业来说，幻觉，已经成为阻碍大模型应用的严重缺陷性问题。除了幻觉，通用大模型无法满足企业实际业务需求还涉及到知识局限性、信息安全...

人工智能 2024-06-03 人工智能

952阅读

AIGC时代之 - 怎样更好的利用AI助手 - 指令工程

爆火的AIGC 2022年11月30日，OpenAI发布ChatGPT 3 2022年12月4 日，ChatGPT 3 已拥有超过一百万用户 2023年各种大语言模型开始火爆全球 GPT们，已经成为了我工作和学习的非常重要的工具。 ChatGPT...

大数据 2024-06-03 人工智能

836阅读

原来这才是生成式AI！

随着ChatGPT、文心一言等AI产品的火爆，生成式AI已经成为了大家茶余饭后热议的话题。可是，为什么要在AI前面加上“生成式”这三个字呢？难道还有别的AI吗？且听文档君慢慢道来~ 1.生成式AI究竟是个啥？如果将人工智能按照用途进行简单分类的话...

人工智能 2024-06-03 人工智能

935阅读

清洁数据，可信模型：确保您的LLM拥有良好的数据卫生

事实上，有些数据输入模型风险太大。有些可能带来重大风险，例如隐私侵犯或偏见。译自Clean Data, Trusted Model: Ensure Good Data Hygiene for Your LLMs，作者 Chase Lee。大语言模型...

人工智能 2024-06-03 人工智能

887阅读

不同数据集有不同的Scaling law？而你可用一个压缩算法来预测它

一般而言，训练神经网络耗费的计算量越大，其性能就越好。在扩大计算规模时，必须要做个决定：是增多模型参数量还是提升数据集大小 —— 必须在固定的计算预算下权衡此两项因素。 Scaling law 告诉我们：只要能适当地分配参数和数据，就能在固定计算预算下实...

大数据 2024-06-03 人工智能

868阅读

时间序列分析的表示学习时代来了？

表示学习作为深度学习中的核心，近期越来越多的被应用到了时间序列领域中，时间序列分析的表示学习时代已经来了。本文为大家带来了2020年以来顶会的5篇时间序列表示学习相关的核心工作梳理。 1.Unsupervised Scalable Representa...

大数据 2024-06-03 人工智能

865阅读

大模型“分区”部署在云和边缘更合适？

作者 | David Linthicum 出品 | 51CTO技术栈（微信号：blog51cto）众所周知，大型语言模型（LLMs）需要大量的计算资源。这意味着开发和部署主要集中在强大的集中式系统上，如公共云提供商。然而，尽管许多人认为我们需要大量的...

生成式AI 2024-06-03 人工智能

880阅读

LLM的「母语」是什么？

大语言模型的「母语」是什么？我们的第一反应很可能是：英语。但事实果真如此吗？尤其是对于能够听说读写多种语言的LLM来说。对此，来自EPFL（洛桑联邦理工学院）的研究人员发表了下面这篇工作来一探究竟：图片论文地址：https://arxiv.or...

生成式AI 2024-06-03 人工智能

844阅读

【AIGC调研系列】LLaVA++整合Phi-3和Llama-3能够实现什么

LLaVA++能够为Phi-3和Llama-3带来的主要好处包括：视觉处理能力的增强：通过整合Phi-3和Llama-3模型，创建了具备视觉处理能力的Phi-3-V和Llama-3-V版本，这意味着这些模型现在能够理解和生成与图像相关的内容[1]。...

生成式AI 2024-06-03 人工智能

1127阅读

【AIGC调研系列】XTuner、Unsloth方案对比

XTuner和Unsloth都是用于大型语言模型（LLM）训练和微调的工具，但它们在设计理念、技术实现和性能表现上存在一些差异。技术架构与支持的模型规模： XTuner支持千亿级参数的模型，并能够处理超过百万个tokens的序列。它通过序列...

人工智能 2024-06-03 人工智能

1906阅读

【独家】万字长文带你梳理Llama开源家族：从Llama-1到Llama-3

Datawhale干货作者：张帆，陈安东，Datawhale成员引言在AI领域，大模型的发展正以前所未有的速度推进技术的边界。北京时间4月19日凌晨，Meta在官网上官宣了Llama-3，作为继Llama-1、Llama-...

AIGC 2024-06-02 人工智能

1046阅读

浅说文心一言

文心一言（ERNIE Bot）是一个基于Transformer结构的知识增强大语言模型，它可以根据用户的指令和输入，生成相应的回答或文本。以下是一些常见的指令示例，你可以根据需要进行调整：问答指令： "请问什么是文心一言？" "文心一言和C...

生成式AI 2024-06-02 人工智能

889阅读

首次解密Claude 3大脑！25岁Anthropic参谋长预言3年内自己将被AI淘汰

【新智元导读】Anthropic的25岁参谋长自曝因为深感AGI，未来三年自己的工作将被AI取代。她在最近的一篇文章中预言了未来即将要被淘汰的工种。难道说，Claude3模型已经初现AGI了吗? 今天，整个AI社区被这篇文章刷屏了。来自AI明星初创公司A...

AIGC 2024-06-02 人工智能

851阅读

阿里蔡崇信最新发声！训练AI就像教育孩子三四年就能赶超博士

快科技6月2日消息，阿里巴巴集团的董事长蔡崇信，在最新一次对话中，对人工智能的快速发展和未来前景进行了深入的阐述。他将训练AI模型的过程比喻为教育孩子，大语言模型的发展竞赛，就像家长展示自己孩子的学术成就一样。尽管培养一个孩子需要22年时间，但AI在三...

AIGC 2024-06-02 人工智能

742阅读

【AIGC调研系列】Dify平台是什么

Dify平台是一个专为大型语言模型（LLM）开发和运营设计的LLMOps（Large Language Model Operations）平台。它旨在简化AI应用的创建、部署和管理过程，使开发者能够更快速、更轻松地构建和运营基于GPT等模型的AI应用。...

生成式AI 2024-06-02 人工智能

2992阅读

欢迎 Llama 3：Meta 的新一代开源大语言模型

介绍 Meta 公司的 Llama 3 是开放获取的 Llama 系列的最新版本，现已在 Hugging Face 平台发布。看到 Meta 持续致力于开放 AI 领域的发展令人振奋，我们也非常高兴地全力支持此次发布，并实现了与 Hugging Fac...

生成式AI 2024-06-02 人工智能

1063阅读

10 分钟，教你如何用 LLama-Factory 训练和微调 LLama3 模型

本文将探讨于2024年3月21日发布的LLama-Factory，并学习如何使用 DigitalOcean 旗下的 Paperspace平台对 LLama 3 进行微调。为了完成我们的任务，我们将使用 NVIDIA A4000 GPU，它被认为是功能最强大...

大数据 2024-06-02 人工智能

1468阅读

一键 input 苹果 OpenELM，零门槛 Llama 3 教程，40+ 优质模型/数据集/教程，建议收藏！...

现在 AI 行业什么最火？「大模型」一定仍然排在前三甲的位置。自从 2022 年底 ChatGPT 面世以来，大模型在各行各业已经带来了太多的惊喜，应用场景愈发丰富，同时也带动了相关底层技术的普及与普适化。尤其是在开源模型繁荣发展之下，无...

人工智能 2024-06-02 人工智能

1036阅读

“全网最全”LLM推理框架集结营 | 看似微不足道，却决定着AIGC项目的成本、效率与性能!

00-前序随着ChatGPT、GPT-4等大语言模型的出现，彻底点燃了国内外的学者们与企业家们研发LLM的热情。国内外的大语言模型如雨后春笋一般的出现，这些大语言模型有一部分是开源的，有一部分是闭源的。伴随着大语言模型的出现，国...

人工智能 2024-06-02 人工智能

2481阅读

AIGC 技术及应用初探

ChatGPT 相关话题近一年多来被刷爆，利用 AI 技术生成内容，引起了各行各业的关注。其实，自2022 年 4 月起，OpenAI、Google、Microsoft 相继发布了文生图模型，视觉创作就已经开始持续火热了。国内 AIGC 相关的技术和应用也...

人工智能 2024-06-01 人工智能

870阅读

谷歌DeepMind：GPT-4高阶心智理论彻底击败人类！第6阶推理讽刺暗示全懂了

【新智元导读】刚刚，谷歌DeepMind、JHU、牛津等发布研究，证实GPT-4的心智理论已经完全达到成年人类水平，在更复杂的第6阶推理上，更是大幅超越人类!此前已经证实，GPT-4比人类更能理解语言中的讽刺和暗示。在心智理论上，人类是彻底被LLM甩在后面...

人工智能 2024-06-01 人工智能

791阅读

Datawhale |【独家】万字长文带你梳理Llama开源家族：从Llama-1到Llama-3

本文来源公众号“Datawhale”，仅用于学术分享，侵权删，干货满满。原文链接：【独家】万字长文带你梳理Llama开源家族：从Llama-1到Llama-3 0. 引言在AI领域，大模型的发展正以前所未有的速度推进技术的边界。北京时间4月1...

人工智能 2024-06-01 人工智能

1025阅读

AI、AGI、AIGC、AI Agent、Prompt、LLM 名词解释

啊！ChatGPT 最近很火呀，你们说的 AGI、AIGC、AI Agent、Prompt、LLM … 到底是什么意思啊？还有 Midjourney、Lensa、Sora、DALL-E、Llama … 又是什么鬼？ AI（Artificial Int...

人工智能 2024-06-01 人工智能

1177阅读

GpuMall智算云：meta-llama/llama3/Llama3-8B-Instruct-WebUI

LLaMA 模型的第三代，是 LLaMA 2 的一个更大和更强的版本。LLaMA 3 拥有 35 亿个参数，训练在更大的文本数据集上GpuMall智算云 | 省钱、好用、弹性。租GPU就上GpuMall,面向AI开发者的GPU云平台 Llama 3 的推...

人工智能 2024-05-31 人工智能

1079阅读

一文读懂构建多代理的 AutoGen 开源框架

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - AutoGen -一个统一的多代理对话框架。想象一下这样一个场景：我们不再是单枪匹马独自作战，而是拥有一支高度个性化、跨领域整合的人工智能团队。每位团队成...

AIGC 2024-05-31 人工智能

1560阅读

告别手动复制！Jina AI Reader可一键从网页抓取PDF

Jina AI 宣布其 Reader 工具现在能够从任意 URL 读取 PDF 文件，并快速解析成文本，供下游的语言模型（LLM）使用。以下是关于 Jina AI Reader 工具的详细介绍: Jina AI Reader 功能亮点: 任意 URL 读...

大数据 2024-05-31 人工智能

1347阅读

大模型风起云涌，向量数据库终有“用武之地”？

每逢淘金热，最后的赢家都是卖铲人，而非淘金者。在近两年的大模型风口下，向量数据库就成了这把铲子。随着大模型快速发展，向量数据库正在成为企业便捷使用大模型、最大化发挥数据价值的关键工具。据IDC调查数据显示，全球在AI技术和服务上的支出2023年将达到...

AIGC 2024-05-31 人工智能

795阅读

武汉市民点赞无人驾驶，市交通运输局：与头部企业共创智能网联汽车产业新蓝图

“武汉市注重智能网联汽车产业发展，已陆续开放智能网联汽车开放道路超千公里，鼓励智能网联汽车头部企业入驻武汉，携手共创武汉智能网联汽车产业发展新蓝图。百度萝卜快跑作为自动驾驶行业中的领军企业，重视武汉智能网联汽车产业发展，从2022年8月落户武汉经开区以来...

生成式AI 2024-05-31 人工智能

805阅读

产品经理的AI秘籍：从AIGC到大模型，让你笑傲智能时代

文章目录 @[TOC](文章目录前言一、什么是AIGC？二、什么是大模型 2.1 大模型特点 2.2 大模型里程碑——Transformer的发布 2.2.1 Transformer通俗解释 2.2.2 基于Tran...

生成式AI 2024-05-31 人工智能

1080阅读

You.com推自定义助手功能，允许用户自行创建个性化AI助手

总部位于帕洛阿尔托的初创公司You.com今天宣布推出“自定义助手”，这是一项突破性的功能，允许用户使用GPT-4o、Llama3和Claude3等顶级语言模型（LLM）创建个性化的 AI 助手，所有功能都在一个界面内完成。对话式 AI 的这一重大飞跃...

AIGC 2024-05-31 人工智能

1042阅读