大型语言模型第4页

【推理优化】超详细！AIGC面试系列大模型推理系列(2)

本期问题聚焦于大模型的推理优化技术本期问题快览有哪些常见的大模型推理优化技术介绍下通过流水线处理技术来加速大模型推理方案介绍下并行计算技术来加速大模型推理的方案有哪些通过硬件来加速大模型推理的方式？模型量化是如何加速大模型推理的？...

生成式AI 2024-06-20 人工智能

2544阅读

开源医疗大模型Llama3-Aloe-8B-Alpha，性能超越 MedAlpaca 和 PMC-LLaMA

前言近年来，大型语言模型 (LLM 在医疗领域展现出巨大潜力，能够帮助医生和研究人员更快地获取信息、分析数据，并提高医疗服务效率。然而，目前市场上大多数医疗 LLM 都是闭源模型，限制了其在学术研究和应用领域的推广。为了打破这一现状，促进医疗 AI...

人工智能 2024-06-20 人工智能

731阅读

PromotedAI功能介绍及免费使用指南广告AI体验地址入口

Promoted简介 Promoted 是一款专注于市场搜索、推荐和原生广告排名的解决方案。通过先进的机器学习技术和大型语言模型搜索相关性AI技术，显著提升转化率和广告质量。它为市场平台提供了统一的搜索、推荐和广告服务，帮助企业实现更好的匹配和更高的收益。...

生成式AI 2024-06-19 人工智能

728阅读

meta-llama/Meta-Llama-3-8B

https://huggingface.co/meta-llama/Meta-Llama-3-8B 型号细节 Meta开发并发布了Meta Llama 3家族大型语言模型(LLM ,这是一组预训练和指令微调的生成性文本模型,大小为8B和70B参数。L...

人工智能 2024-06-19 人工智能

817阅读

【AIGC】大型语言模型在人工智能规划领域模型生成中的探索

大型语言模型在人工智能规划领域模型生成中的新应用一、引言二、LLM在规划领域模型生成中的潜力三、实证分析：LLM在规划领域模型生成中的表现四、代码实例：LLM在规划领域模型生成中的应用五、结论与展望一、引言随着...

人工智能 2024-06-19 人工智能

758阅读

大模型论文解读|| 数学新巅峰，微软&清华联合研究发现：7B级LLaMA-2模型数学能力惊人，准确率高达97.7%

开篇：数学能力在常规语言模型中的崭露头角数学能力长期以来被认为是语言模型中难以攻克的领域，只有在模型规模极大或经过大量数学相关预训练的情况下才可能显现。然而，最新的研究表明，即使是规模较小的常规语言模型，如LLaMA-2 7B，也已经展现出了强大的数学...

AIGC 2024-06-17 人工智能

821阅读

AI初识--LLM、ollama、llama都是些个啥？

LLM全称（large language model）也就是大语言模型什么是Ollama，它与Llama是什么关系？ Ollama是一个开源的 LLM（大型语言模型）服务工具，用于简化在本地运行大语言模型，降低使用大语言模型的门槛，使得大模型的开发者...

AIGC 2024-06-17 人工智能

2172阅读

【Tokenizer原理篇】超详细！AIGC面试系列大模型进阶(5)

本期问题聚焦于大模型Tokenizer相关问题本期问题快览模型中的Tokenization是指的什么常用的Tokenization方法了解有哪些吗了解什么是Byte-Pair Encoding(BPE 吗介绍下Byte-Pair E...

AIGC 2024-06-17 人工智能

1923阅读

#RAG | AIGC # RAG召回率提升的方法以及优劣势

RAG（Retrieval-Augmented Generation）是一种结合了检索（Retrieval）和生成（Generation）的模型，用于增强大型语言模型（LLMs）的性能。召回率（Recall）是衡量RAG系统性能的关键指标之一，它表示系统能...

AIGC 2024-06-17 人工智能

1175阅读

区分LLaMA、llama.cpp和Ollama

大模型本地部署和运行中，经常遇到这三个概念，llama，ollama，llama.cpp。刚开始接触时，的确有些傻傻分不清楚。这里简单区分理解下，方便快速上手。简单来讲，llama 是一个Meta公司开源的预训练大型语言模型，llama.cpp用于加...

AIGC 2024-06-15 人工智能

2513阅读

大型语言模型（LLMs）在AIGC中的核心地位

本文收录于专栏：精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践...

大数据 2024-06-14 人工智能

722阅读

用 Unsloth 微调 LLaMA 3 8B

用 Unsloth 微调 LLaMA 3 8B 今年4月份，Meta 公司发布了功能强大的大型语言模型（LLM）Llama-3，为从事各种 NLP 任务的开发人员提供了功能强大可以在普通机器上运行的开源LLM。然而，传统的 LLM 微调过程既耗时又耗费资...

生成式AI 2024-06-14 人工智能

1071阅读

LLama的激活函数SwiGLU 解释

目录 Swish激活函数 1. Swish函数公式 LLaMA模型中的激活函数 1. SwiGLU激活函数 2. SwiGLU激活函数的表达式 3. SwiGLU激活函数的优势 Swish激活函数 Swish是一种激活函数，其计算...

AIGC 2024-06-13 人工智能

1167阅读

谷歌推创新框架AGREE 可增强大模型生成内容准确性

谷歌研究院推出了一个名为AGREE的创新框架，旨在增强大型语言模型（LLM）生成内容和引用的准确性。这一框架通过检索文档中的相关段落来增强大模型生成回答的事实基础，并提供相应的引用，从而提高回答的准确性，并为用户提供验证信息真实性的途径。核心技术:...

AIGC 2024-06-11 人工智能

684阅读

AI日报：GPT-4o加持！苹果全线产品进入生成式AI时代；腾讯支持生成多人视频；ChatGPT语音功能升级

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、苹果WWDC放出深水炸弹 GP...

大数据 2024-06-11 人工智能

652阅读

谷歌Deepmind表示开放式AI是实现超级智能的关键

谷歌 Deepmind 的研究人员表示，AI 系统具备开放式的能力是发展超级智能的关键。他们认为，单纯依靠不断扩大的数据集并不足以实现超级人工智能（ASI），而现有的规模化策略往往集中在使用更多的计算资源和数据。相反，AI 系统必须能够以开放式的方式产生新...

人工智能 2024-06-11 人工智能

743阅读

《The end of Software》争议不断：AIGC下的软件行业是不是80年代的传统媒体行业？

要理解软件将如何变化，我们可以从研究技术如何改变其他行业中获益。如果你倾听，历史往往会有韵律。在互联网之前，媒体的行为方式非常不同——它很贵。你必须支付人们制作内容、编辑它和分发它。因为内容的制作成本很高，所以它必须赚钱。消费者为报纸、杂志、书籍、有线...

生成式AI 2024-06-10 人工智能

774阅读

iOS 18来了！苹果骚操作：本地AI功能至少要8GB内存劝退一众iPhone

快科技6月10日消息，据国外媒体报道称，苹果本地AI功能将至少需要8GB内存，这对于众多老iPhone而言不是好消息。报道中提到，iOS 18中的本地AI功能将需要至少8GB的内存，这意味着iPhone 15 Pro以上的设备和配备M1芯片的iPad将成...

AIGC 2024-06-10 人工智能

633阅读

20K star！搞定 LLM 微调的开源利器LLaMA Factory

20K star！搞定 LLM 微调的开源利器LLaMA Factory 关于LLM 微调优化型技术计算型技术 LLaMA Factory 是什么使用 LLaMA Factory 模型导出 LLaMA-Factory 结构总结项目...

AIGC 2024-06-10 人工智能

1069阅读

LLaMA 2语言大模型的微调策略：LoRA与全参数选择

随着自然语言处理（NLP）技术的飞速发展，大型语言模型（LLMs）在各个领域都展现出了强大的能力。LLaMA 2作为其中的佼佼者，具有巨大的潜力。然而，如何有效地对LLaMA 2进行微调，以适应特定的任务或数据集，成为了一个关键问题。本文将对LoRA技术与...

人工智能 2024-06-10 人工智能

791阅读

Llama.cpp大模型量化简明手册

大型语言模型 (LLM ，尤其是像 Mixtral 8x7b（467 亿个参数）这样的大型模型，对内存的要求非常高。当你尝试降低推理成本、提高推理速度或在边缘设备上进行推理时，这种内存需求就会变得明显。解决此问题的一个潜在方法是量化。在本文中，我们将使用易...

生成式AI 2024-06-09 人工智能

1583阅读

AI | LLaMA-Factory 一个好用的微调工具

‘’ LLama Factory，这个工具能够高效且低成本地支持对 100 多个模型进行微调。LLama Factory 简化了模型微调的过程，并且易于访问，使用体验友好。此外，它还提供了由 Hiyouga 提供的 Hugging Face 空间，可...

AIGC 2024-06-08 人工智能

1270阅读

【推理框架】超详细！AIGC面试系列大模型推理系列(1)

本期问题聚焦于大模型的推理框架本期问题快览有哪些大模型推理框架了解vllm吗介绍下vllm的核心技术了解faster transformer吗介绍下faster transformer的核心技术了解Xinference吗了解l...

大数据 2024-06-08 人工智能

1596阅读

探索GGUF：利用llama.cpp高效运行大型语言模型

探索GGUF：利用llama.cpp高效运行大型语言模型在人工智能领域，大型语言模型（LLM）的应用越来越广泛，但运行这些模型常常需要大量计算资源和复杂的配置。最近，一个名为llama.cpp的开源项目引起了广泛关注，它通过C/C++实现了一个高效的...

AIGC 2024-06-08 人工智能

1014阅读

每日AIGC最新进展(6)：视觉一致插图序列生成、阿里巴巴电商人物产品互动图生成、Text-to-Vector生成、多视图扩散模型3D重建

Diffusion Models专栏文章汇总：入门与实战 Generating Coherent Sequences of Visual Illustrations for Real-World Manual Tasks http://arxiv....

大数据 2024-06-07 人工智能

668阅读

深度学习突破：LLaMA-MoE模型的高效训练策略

在人工智能领域，大模型（LLM）的崛起带来了前所未有的进步，但随之而来的是巨大的计算资源需求。为了解决这一问题，Mixture-of-Expert（MoE）模型架构应运而生，而LLaMA-MoE正是这一架构下的重要代表。 LLaMA-MoE是一种基于...

人工智能 2024-06-07 人工智能

753阅读

这个团队做了OpenAI没Open的技术，开源OpenRLHF让对齐大模型超简单

随着大型语言模型（LLM）规模不断增大，其性能也在不断提升。尽管如此，LLM 依然面临着一个关键难题：与人类的价值和意图对齐。在解决这一难题方面，一种强大的技术是根据人类反馈的强化学习（RLHF）。但是，随着模型越来越大，RLHF 通常需要维持多个模型...

生成式AI 2024-06-06 人工智能

633阅读

LLM微调技术LoRA图解

译者 | 朱先忠审校 | 重楼简介当涉及到大型语言模型时，微调可能是人们讨论最多的技术方面的内容之一。大多数人都知道，训练这些模型是非常昂贵的，需要大量的资本投资;所以，看到我们可以通过采用现有的模型并用自己的数据对模型进行微调，从而创建一个具有...

人工智能 2024-06-06 人工智能

765阅读

照片特定风格变换Stylar AI；GPT-4V开源替代方案InternVL；纯C/C++实现的Stable Diffusion库；基于AI的数据爬取

✨ 1: AI Photo Filter Stylar AI是一款功能强大的AI图像编辑与设计工具，提供无与伦比的图片组合和风格控制。 AI Photo Filter，简言之，就是使用人工智能技术来改善或改变图片的风格、质量和元素组合的一种...

生成式AI 2024-06-06 人工智能

825阅读

LLM | Yuan 2.0-M32：带注意力路由的专家混合模型

图片一、结论写在前面 Yuan 2.0-M32，其基础架构与Yuan-2.0 2B相似，采用了一个包含32位专家的专家混合架构，其中2位专家处于活跃状态。提出并采用了一种新的路由网络——注意力路由器，以更高效地选择专家，相比采用经典路由网络的模型，其准...

人工智能 2024-06-06 人工智能

823阅读

重磅 Llama-3最强开源大模型惊艳亮相

重磅！Llama-3，最强开源大模型正式发布！     202年4 月 19 日，Meta 发布开源大模型 Llama-3，助力研究人员和开发者推进语言 AI 的界限。强大的语言模型Llama-3推出，拥有80亿...

人工智能 2024-06-05 人工智能

1044阅读

ChatGPT之父最新预测！中国将有自己的特色大模型

快科技6月5日消息，在近日的2024年人工智能向善全球峰会（AI for Good Global Summit）上，ChatGPT之父、OpenAI首席执行官奥特曼提出了对中国人工智能发展的最新预测。他认为，中国将发展出具有自身特色的大型语言模型，并在这...

大数据 2024-06-05 人工智能

709阅读

llama.cpp制作GGUF文件及使用

llama.cpp的介绍 llama.cpp是一个开源项目，由Georgi Gerganov开发，旨在提供一个高性能的推理工具，专为在各种硬件平台上运行大型语言模型（LLMs）而设计。这个项目的重点在于优化推理过程中的性能问题，特别是针对CPU环境。以...

人工智能 2024-06-05 人工智能

1262阅读

GPT-4o与SQL：大模型改变自身架构的能力有多强？

作者丨David Eastman 编译丨诺亚出品 | 51CTO技术栈（微信号：blog51cto）尽管没有任何大型语言模型（LLM）骑过自行车，但它们显然理解骑行在人类交通领域中的作用。它们似乎为软件开发者提供的是一种类似语义的现实世界知识，结合了...

AIGC 2024-06-05 人工智能

661阅读

科学家利用GenAI发现物理学新见解

在生成式人工智能（GenAI）帮助下，麻省理工和瑞士巴塞尔大学的研究人员开发了一种新的机器学习（ML）框架，可以帮助发现关于材料科学的新见解。这项研究的结果发表在《物理评论快报》上。当水从液体转变为固体时，它经历了重要的转变性质，如体积和密度。水的相...

大数据 2024-06-05 人工智能

728阅读

报道称，马斯克将数千个AI芯片从特斯拉转移到了X

根据CNBC获得的芯片制造商的电子邮件，埃隆·马斯克（Elon Musk）订购了数千个运往特斯拉的英伟达制造的AI芯片，这些芯片将被转移到他的社交媒体公司X。据该媒体报道，此举有可能将特斯拉收购价值5亿美元的处理器的时间推迟数月。图源备注：图片由AI生...

大数据 2024-06-05 人工智能

622阅读

LLM | 偏好学习算法并不学习偏好排序

图片一、结论写在前面偏好学习算法（Preference learning algorithms，如RLHF和DPO）常用于引导大型语言模型（LLMs）生成更符合人类偏好的内容，但论文对其内部机制的理解仍有限。论文探讨了传统观点，即偏好学习训练模型通过...

人工智能 2024-06-05 人工智能

791阅读

写代码神器！48个主流代码生成LLM大模型盘点，包含专用、微调等4大类Code llama

写代码神器！48个主流代码生成LLM大模型盘点，包含专用、微调等4大类学姐带你玩AI 2023-12-06 18:20 代码大模型具有强大的表达能力和复杂性，可以处理各种自然语言任务，包括文本分类、问答、对话等。这些模型通常基于深度学习架构，如Tra...

AIGC 2024-06-05 人工智能

1940阅读

昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE 性能强劲成本更低

在大模型技术迅速发展的背景下，昆仑万维公司开源了一个具有里程碑意义的稀疏大型语言模型Skywork-MoE。这个模型不仅在性能上表现出色，而且还大幅降低了推理成本，为应对大规模密集型LLM带来的挑战提供了有效的解决方案。 Skywork-MoE模型特点:...

AIGC 2024-06-04 人工智能

791阅读

GPT Researcher：破解复杂研究的AI利器

作者 | 崔皓审校 | 重楼在现代研究环境中，处理如详尽研究工作或学术论文撰写等复杂任务对当前的大型语言模型(如ChatGPT 来说是一个挑战。这些任务通常需要长时间的手动干预和多步骤操作，现有的AI工具往往无法在没有人类帮助的情况下完成这些复杂任...

AIGC 2024-06-04 人工智能

908阅读

OpenAI衍生公司人工智能模型让机器人像人一样思考、学习

OpenAI曾于2021年夏天宣布解散其机器人团队，原因是缺乏足够的数据来训练机器人使用人工智能进行移动和推理。但三位来自OpenAI的早期研究科学家创立的初创公司Covariant，声称已经解决了这一难题。 Covariant AI系统的特点: 结合...

生成式AI 2024-06-04 人工智能

727阅读

在Docker中部署Llama大型语言模型

Docker作为一个轻量级的容器化平台，使得应用程序的部署和扩展变得简单而高效。在Docker中部署Llama大型语言模型，可以确保模型运行环境的一致性和可移植性，同时也便于管理和扩展。本文将介绍如何在Docker中部署Llama模型的具体步骤和注意事项。...

人工智能 2024-06-04 人工智能

816阅读

大语言模型原理与工程实践：LLaMA 系列

1. 背景介绍 1.1 大型语言模型的兴起近年来，随着深度学习技术的飞速发展，大型语言模型（LLM）逐渐成为人工智能领域的研究热点。LLM 是一种基于深度学习的自然语言处理模型，能够学习大量的文本数据，并根据这些数据生成自然流畅的文本、回答问题、进行...

生成式AI 2024-06-04 人工智能

687阅读

【AIGC调研系列】MiniCPM-Llama3-V2.5模型与GPT-4V对比

MiniCPM-Llama3-V2.5模型与GPT-4V的对比可以从多个方面进行分析，包括性能、应用场景和技术特点。从性能角度来看，MiniCPM-Llama3-V2.5在OCR识别、模型幻觉能力和空间理解能力方面表现出色，实现了开源模型的性能SOTA...

大数据 2024-06-04 人工智能

1146阅读

微软ML Copilot框架释放机器学习能力

摘要：大模型席卷而来，通过大量算法模型训练推理，能根据人类输入指令产生图文，其背后是大量深度神经网络模型在做运算，这一过程称之为机器学习，本文从微软语言大模型出发，详解利用大型语言模型（Large Language Models, LLMs）解决实际机器学...

人工智能 2024-06-04 人工智能

664阅读

不想炸薯条的Ilya和不送GPU的英伟达，Hinton最新专访：道路千万条，安全第一条

从谷歌离职一年之际，「人工智能教父」Hinton接受了采访。 ——也许是因为徒弟Ilya终于被从核设施中放了出来？（狗头）视频地址：https://www.youtube.com/watch?v=tP-4njhyGvo 当然了，采访教父的小伙子也非等...

大数据 2024-06-03 人工智能

645阅读

首个智慧城市大模型UrbanGPT，全面开源开放｜港大&百度

时空预测技术，迎来ChatGPT时刻。时空预测致力于捕捉城市生活的动态变化，并预测其未来走向，它不仅关注交通和人流的流动，还涵盖了犯罪趋势等多个维度。目前，深度时空预测技术在生成精确的时空模型方面，依赖于大量训练数据的支撑，这在城市数据不足的情况下显得...

大数据 2024-06-03 人工智能

684阅读

大模型“分区”部署在云和边缘更合适？

作者 | David Linthicum 出品 | 51CTO技术栈（微信号：blog51cto）众所周知，大型语言模型（LLMs）需要大量的计算资源。这意味着开发和部署主要集中在强大的集中式系统上，如公共云提供商。然而，尽管许多人认为我们需要大量的...

生成式AI 2024-06-03 人工智能

726阅读

【AIGC调研系列】XTuner、Unsloth方案对比

XTuner和Unsloth都是用于大型语言模型（LLM）训练和微调的工具，但它们在设计理念、技术实现和性能表现上存在一些差异。技术架构与支持的模型规模： XTuner支持千亿级参数的模型，并能够处理超过百万个tokens的序列。它通过序列...

人工智能 2024-06-03 人工智能

1688阅读

浅说文心一言

文心一言（ERNIE Bot）是一个基于Transformer结构的知识增强大语言模型，它可以根据用户的指令和输入，生成相应的回答或文本。以下是一些常见的指令示例，你可以根据需要进行调整：问答指令： "请问什么是文心一言？" "文心一言和C...

生成式AI 2024-06-02 人工智能

744阅读