语言模型第11页

MCT Self-Refine：创新集成蒙特卡洛树搜索（MCTS）提高复杂数学推理任务的性能，超GPT4，使用 LLaMa-3 8B 进行自我优化

? 文献卡题目： Accessing GPT-4 level Mathematical Olympiad Solutions via Monte Carlo Tree Self-refine with LLaMa-3 8B 作者: Di Zh...

人工智能 2024-06-27 人工智能

1174阅读

Llama模型家族训练奖励模型Reward Model技术及代码实战（二）从用户反馈构建比较数据集

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

人工智能 2024-06-27 人工智能

1115阅读

人工智能前沿讲座——AIGC

目录前情提要一、什么是AIGC AIGC与传统的AI有何区别？二、发展历程 GAN 生成对抗网络大模型与Transformer Transformer\BERT\GPT 扩散模型和稳定扩散模型三、AIGC的发展应用新质生产力...

人工智能 2024-06-27 人工智能

869阅读

揭秘XPU架构下AIGC的推理加速艺术--AI PC 新纪元：将 AI 引入 NPU，实现快速低功耗推理...

踏入AIPC新纪元，我们似乎穿越到了一个充满魔法的新世界，生成式AI和大模型如同现代法师，而AIPC和边缘计算则成为他们施展魔法的法杖，从AI聊天机器人到智能绘画工具，再到数字化虚拟人物，魔法杖们不仅推动了新型处理器和计算架构的研发，也促...

生成式AI 2024-06-27 人工智能

935阅读

011篇 - AIGC提示词工程 - 提示词生成策略（Prompt Engineering - Prompt Generation Strategies）

大家好，我是元壤教育的张涛，一名知识博主，专注于生成式人工智能（AIGC）各领域的研究与实践。我喜欢用简单的方法，帮助大家轻松掌握AIGC应用技术。我的愿景是通过我的文章和教程，帮助1000万人学好AIGC，用好AIGC。小伙伴们！今天我们要来聊一聊提...

人工智能 2024-06-26 人工智能

1009阅读

混合专家模型和LLAMA的详细配置

文章目录混合专家模型 LLAMA的详细配置混合专家模型大语言模型能够通过扩展参数规模实现性能的提升。然而，随着模型参数规模的扩大，计算成本也随之增加。为了解决这一问题，研究人员在大语言模...

生成式AI 2024-06-26 人工智能

914阅读

通义千问2(Qwen2)大语言模型在PAI-QuickStart的微调、评测与部署实践

Qwen2（通义千问2）是阿里云最近推出的开源大型语言模型系列，相比2月推出的Qwen1.5，Qwen2实现了整体性能的代际飞跃，大幅提升了代码、数学、推理、指令遵循、多语言理解等能力。其中，Qwen2系列包含5个尺寸的预训练和指令微调模型，Qwen2-0...

生成式AI 2024-06-26 人工智能

1064阅读

Llama模型家族之RLAIF 基于 AI 反馈的强化学习（一）

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

大数据 2024-06-26 人工智能

1166阅读

⌈ 传知代码 ⌋ LLaMA 开放高效基础语言模型

?前情提要? 本文是传知代码平台中的相关前沿知识与技术的分享~ 接下来我们即将进入一个全新的空间，对技术有一个全新的视角~ 本文所涉及所有资源均在传知代码平台可获取以下的内容一定会让你对AI 赋能时代有一个颠覆性的认识哦！！！以下内容干货满满...

AIGC 2024-06-26 人工智能

866阅读

微软发布Phi-3 Mini，性能媲美GPT-3.5、Llama-3，可在手机端运行

前言微软发布了最新版的Phi系列小型语言模型(SLM - Phi-3。这个系列包括3个不同参数规模的版本：Phi-3 Mini (38亿参数、Phi-3 Small (70亿参数和Phi-3 Medium (140亿参数。 Phi系列模型是微...

大数据 2024-06-26 人工智能

1099阅读

AIGC从入门到实战：自然语言处理和大语言模型简介

AIGC从入门到实战：自然语言处理和大语言模型简介 1.背景介绍 1.1 人工智能生成内容（AIGC）的兴起人工智能生成内容（AIGC，Artificial Intelligence Generated Content）是近年来人工智能领域的一个重...

人工智能 2024-06-26 人工智能

956阅读

探索和构建 LLaMA 3 架构：深入探讨组件、编码和推理技术（一）

探索和构建 LLaMA 3 架构：深入探讨组件、编码和推理技术（一） Meta 通过推出新的开源 AI 模型 Llama 3 以及新版本的 Meta AI，正在加强其在人工智能 (AI 竞赛中的竞争力。该虚拟助手由 Llama 3 提供支持，现已可在所...

人工智能 2024-06-25 人工智能

1094阅读

一文看懂Llama 2：原理、模型与训练

一文看懂Llama 2：原理、模型与训练 Llama 2是一种大规模语言模型（LLM），由Meta（原Facebook）研发，旨在推动自然语言处理（NLP）领域的发展。本文将详细介绍Llama 2的原理、模型架构及其训练方法，以帮助读者深入理解这一技术...

生成式AI 2024-06-25 人工智能

1353阅读

苹果拒绝与Meta的AI合作：出于隐私问题考虑

快科技6月25日消息，据媒体报道，苹果公司因隐私政策方面的考量，最终决定拒绝与Facebook母公司Meta的人工智能合作。据了解，Meta与苹果在今年3月曾初步探讨过潜在的合作机会，但遗憾的是，双方并未能就合作细节达成新的进展。苹果在评估后认为，Me...

大数据 2024-06-25 人工智能

843阅读

【AI学习】LLaMA 系列模型的进化（一）

一直对LLaMA 名下的各个模型关系搞不清楚，什么羊驼、考拉的，不知所以。幸好看到两篇综述，有个大致了解，以及SEBASTIAN RASCHKA对LLaMa 3的介绍。做一个记录。一、文章《Large Language Models: A Surve...

大数据 2024-06-25 人工智能

1103阅读

每日AIGC最新进展(29)：复旦大学提出通过人类反馈来优化语音生成模型SpeechAlign、浙江大学提出跟踪3D空间中的任何2D像素SpatialTracker、西安交大提出动态场景的语义流

Diffusion Models专栏文章汇总：入门与实战 SpeechAlign: Aligning Speech Generation to Human Preferences 本文介绍了一种名为SpeechAlign的方法，旨在通过人类反馈...

AIGC 2024-06-25 人工智能

893阅读

微软大模型phi-3速览-3.7B比llama-3 8B更好？

背景模型发布者：Microsoft 模型发布时间：2024年4月23日发布内容：介绍了phi-3系列语言模型，包括phi-3-mini、phi-3-small和phi-3-medium。重点关注：整体性能可与 Mixtral 8x7B...

AIGC 2024-06-25 人工智能

1221阅读

llama系列模型学习

一、目录 llama1 模型与transformer decoder的区别 llama2 模型架构 llama2 相比llama1 不同之处 llama3 相比llama2 不同之处 llama、llama2、llama3 分词器词表大小以及优缺点...

人工智能 2024-06-25 人工智能

1463阅读

【AI】文心一言的使用分享

在数字化时代，人工智能（AI）技术的飞速发展正在改变我们的生活。文心一言，作为这一浪潮中的佼佼者，以其卓越的自然语言处理能力和广泛的应用场景，给我带来了前所未有的使用体验。在这篇分享中，我将详细阐述我对文心一言的使用体验、功能特点、应用场景以及未来展望。...

AIGC 2024-06-25 人工智能

1343阅读

字节跳动回应AI处理器传闻：消息不实

快科技6月24日消息，有传闻称，字节跳动正在与美国芯片制造商博通合作开发先进的AI处理器。据说，这款AI处理器将采用5nm工艺制造，由台积电负责生产，尽管设计工作进展顺利，但目前尚未开始流片”阶段，即设计阶段结束和制造开始的标志。对此，字节跳动回应称，...

生成式AI 2024-06-24 人工智能

789阅读

重磅！Meta 发布 Llama 3，前所未有的强大功能和多模态能力｜TodayAI

Meta今日宣布推出其最新一代尖端开源大型语言模型Llama 3。该模型预计很快将在多个领先的云服务平台上线，包括AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft A...

生成式AI 2024-06-24 人工智能

1107阅读

（5-5-02）金融市场情绪分析：使用Llama 2 大模型实现财经信息的情感分析微调（2）

5.5.4 Llama-2语言模型操作编写下面的代码，功能是加载、配置 Llama-2 语言模型以及其对应的分词器，准备好模型为后续的对话生成任务做好准备。 model_name = "../input/llama-2/pytorch/7b-h...

AIGC 2024-06-24 人工智能

1467阅读

Llama模型家族之Stanford NLP ReFT源代码探索（一）数据预干预

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

AIGC 2024-06-24 人工智能

977阅读

阿里Qwen2正式开源，性能全方位包围Llama-3 | 最新快讯

Qwen 系列会是众多大学实验室新的默认基础模型吗？斯坦福团队套壳清华大模型的事件不断发酵后，中国模型在世界上开始得到了更多关注。不少人发现，原来中国已经有不少成熟的大模型正在赶超国外。 HuggingFace 平台和社区负责人 Omar San...

人工智能 2024-06-24 人工智能

871阅读

从“乙游”到“AI恋”，这届年轻人为啥和“AI”谈恋爱了？

2013年上映的科幻电影《HER》的剧情，在十年后的现实世界有了更为具体的呈现。电影中，男主西奥多与人工智能系统的女性化身“萨曼莎”，上演了不被世俗理解的爱情故事，而现实中的Chatgpt，也已然迈入下一个level。ID为“午夜狂暴哈士奇狗”与Dan的...

人工智能 2024-06-24 人工智能

850阅读

AIGC 探究：人工智能生成内容的技术原理、广泛应用、创新应用、版权问题与未来挑战

AIGC（Artificial Intelligence Generated Content）即人工智能生成内容，其核心在于利用深度学习技术，尤其是基于神经网络的模型，来模拟人类创作过程，自主生成高质量的文本、图像、音频、视频等各类内容。神经网络是一种模仿...

大数据 2024-06-24 人工智能

1735阅读

百度文心一言API批量多线程写文章软件-key免费无限写

百度文心大模型的两款主力模型ENIRE Speed、ENIRE Lite全面免费，即刻生效。百度文心大模型的两款主力模型这意味着，大模型已进入免费时代！据了解，这两款大模型发布于今年 3 月，支持 8K 和 128k 上下文长度。 ERNIE...

大数据 2024-06-23 人工智能

1215阅读

李宏毅【生成式AI导论 2024】第7讲：大型语言模型修练史 — 第二阶段: 名师指点，发挥潜力 (兼谈对 ChatGPT 做逆向工程与 LLaMA 时代的开始)

如果只有指令微调… 人类老师需要给语言模型准备的教材是长这个样子的。要先想出人类可能会去问语言模型的问题，为每一个问题想一个正确的答案。有问题有答案之后，就可以把这些资料转成语言模型，可以拿来做训练文字接龙的格式。这种使用人类老师准备的资料来学习...

AIGC 2024-06-23 人工智能

884阅读

llama 3 震撼来袭 8B 150k 词元 8Ktoken长度 4T token 参与预训练与对齐训练使用GQA

Meta开发了并发布了Meta Llama 3系列大型语言模型(LLMs ，这是一组在8亿和70亿参数规模下预训练和指令调整的生成文本模型。Llama 3的指令调整模型针对对话用例进行了优化，并在常见的行业基准测试中超越了众多开源聊天模型。在开发这些模型时...

人工智能 2024-06-23 人工智能

1088阅读

每日AIGC最新进展(24)：用于图像质量和审美评估的统一视觉-语言预训练模型UniQA、可控生成图像压缩框架Control-GIC、3D感知扩散模型Ouroboros3D

Diffusion Models专栏文章汇总：入门与实战 UniQA: Unified Vision-Language Pre-training for Image Quality and Aesthetic Assessment 本文提出了一...

人工智能 2024-06-23 人工智能

1061阅读

文心一言和GPT-4横向对比

文心一言和GPT-4在多个方面都存在明显的差异，下面进行详细的横向对比：首先，从产品定位和发布时间来看，文心一言是百度推出的大语言模型产品，旨在提供文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等多种能力。而GPT-4则是OpenAI在GP...

人工智能 2024-06-23 人工智能

1150阅读

SiliconCloud上新：GLM-4-9B，通用能力超越Llama 3

今天，智谱发布了第四代 GLM 系列开源模型：GLM-4-9B。 GLM-4-9B 系列模型包括：基础版本 GLM-4-9B（8K）、对话版本 GLM-4-9B-Chat（128K）、超长上下文版本 GLM-4-9B-Chat-1M（1M）和多...

AIGC 2024-06-23 人工智能

1147阅读

【大模型部署】在C# Winform中使用文心一言ERNIE-3.5 4K 聊天模型

【大模型部署】在C# Winform中使用文心一言ERNIE-3.5 4K 聊天模型前言今天来写一个简单的ernie-c#的例子，主要参考了百度智能云的例子，然后自己改了改，学习了ERNIE模型的鉴权方式，数据流的格式和简单的数据解析，实现了在...

AIGC 2024-06-22 人工智能

1346阅读

提示词工程入门-使用文心一言4.0-通义千问-GPT4-Claude3通用提示技巧测试

提示词工程基础? 在了解完了大语模型的基本知识，例如API的使用多轮对话，流式输出，微调，知识向量库等知识之后，接下来需要进一步补足的一个大块就是提示词工程，学习和了解提示词工程除了基本的提示词类型之外，不同的大模型对于提示词工程润色之后...

生成式AI 2024-06-22 人工智能

1282阅读

2024年AIGC生成式AI人居领域应用趋势调研报告

今天分享的是AIGC系列深度研究报告：《AIGC专题：2024生成式AI人居领域应用趋势调研报告》。（报告出品方：腾讯研究院）序言 2022年OpenA!发布ChatGPT，拉开了大语言模型和AIGC(生成式AI 时代的帷幕。时至今日，短短一年，...

人工智能 2024-06-21 人工智能

1131阅读

LLaMA 羊驼系大语言模型的前世今生

关于 LLaMA LLaMA是由Meta AI发布的大语言系列模型，完整的名字是Large Language Model Meta AI，直译：大语言模型元AI。Llama这个单词本身是指美洲大羊驼，所以社区也将这个系列的模型昵称为羊驼系模型。 Ll...

人工智能 2024-06-21 人工智能

1668阅读

智谱AI与中国银联成立大语言模型联合实验室

6月18日，北京智谱华章科技有限公司（智谱AI）与中国银联股份有限公司大语言模型联合实验室签约仪式在上海正式举行。中国银联作为国内领先的转接清算机构，拥有丰富的金融支付数据和业务场景，智谱AI作为行业领先的大模型公司，专注于做大模型的中国创新，模型研发能...

生成式AI 2024-06-21 人工智能

1066阅读

【AIGC调研系列】Jina的Reader API是什么

Jina的Reader API是一个能够将任何网址转换成对大型语言模型（LLM）友好的输入格式的工具。用户只需在URL前添加简单的前缀"https://r.jina.ai/"，即可实现这一转换，从而为使用代理和检索生成系统的用户提供改善后的输出结果[1][...

人工智能 2024-06-21 人工智能

1194阅读

【AIGC调研系列】Qwen2与llama3对比的优势

Qwen2与Llama3的对比中，Qwen2展现出了多方面的优势。首先，从性能角度来看，Qwen2在多个基准测试中表现出色，尤其是在代码和数学能力上有显著提升[1][9]。此外，Qwen2还在自然语言理解、知识、多语言等多项能力上均显著超越了Llama3[...

大数据 2024-06-21 人工智能

1978阅读

【AIGC调研系列】MiniMax 稀宇科技的abab 6.5 系列模型与国外先进模型相比的优缺点

MiniMax稀宇科技的abab 6.5系列模型与国外先进模型相比，具有以下优缺点：优点： abab 6.5系列模型采用了MoE（Mixture of Experts）架构，这是国内首个采用此架构的大模型，标志着MiniMax在自然语言处理领域的技...

大数据 2024-06-21 人工智能

1855阅读

在 Apple Silicon Mac（M1、M2 或 M3）上运行最新 LLM 模型 Meta Llama 3 的分步指南

您是否正在寻找在基于 Apple Silicon 的 Mac 上运行最新 Meta Llama 3 的最简单方法？那么您来对地方了！在本指南中，我将向您展示如何在本地运行这个强大的语言模型，使您能够利用自己机器的资源来实现隐私和离线可用性。本教程将包括在...

AIGC 2024-06-21 人工智能

1357阅读

探索未来文本交互的利器 - Nvim-Llama：将大型语言模型引入Neovim的革命性尝试...

? 探索未来文本交互的利器 - Nvim-Llama：将大型语言模型引入Neovim的革命性尝试项目地址:https://gitcode.com/jpmcb/nvim-llama 在快速演进的人工智能领域，即时、高效的与语言模型交互已经成为开发者的梦...

人工智能 2024-06-20 人工智能

1023阅读

【推理优化】超详细！AIGC面试系列大模型推理系列(2)

本期问题聚焦于大模型的推理优化技术本期问题快览有哪些常见的大模型推理优化技术介绍下通过流水线处理技术来加速大模型推理方案介绍下并行计算技术来加速大模型推理的方案有哪些通过硬件来加速大模型推理的方式？模型量化是如何加速大模型推理的？...

生成式AI 2024-06-20 人工智能

2845阅读

用 LLama-Factory 训练和微调 LLama3，打造你的专属 AI 模型！

用 LLama-Factory 训练和微调 LLama3，打造你的专属 AI 模型！文章目录用 LLama-Factory 训练和微调 LLama3，打造你的专属 AI 模型！什么是模型微调？为什么使用 LLama-Fact...

人工智能 2024-06-20 人工智能

1343阅读

双排组到一个刀硬嘴甜的小姐姐，打完发现她竟是AI大模型。

永劫无间手游，终于在今天开启二测。这意味着，在本次测试结束后，正式公测就真离我们不远了。不知道差友里面多少人运气好，今天能顺利进入服务器。反正官方的各种评论区下面，那些没抽到资格的玩家，已经有点走火入魔了。而官方（24工作室和网易伏羲实验室）...

AIGC 2024-06-20 人工智能

862阅读

开源医疗大模型Llama3-Aloe-8B-Alpha，性能超越 MedAlpaca 和 PMC-LLaMA

前言近年来，大型语言模型 (LLM 在医疗领域展现出巨大潜力，能够帮助医生和研究人员更快地获取信息、分析数据，并提高医疗服务效率。然而，目前市场上大多数医疗 LLM 都是闭源模型，限制了其在学术研究和应用领域的推广。为了打破这一现状，促进医疗 AI...

人工智能 2024-06-20 人工智能

902阅读

PromotedAI功能介绍及免费使用指南广告AI体验地址入口

Promoted简介 Promoted 是一款专注于市场搜索、推荐和原生广告排名的解决方案。通过先进的机器学习技术和大型语言模型搜索相关性AI技术，显著提升转化率和广告质量。它为市场平台提供了统一的搜索、推荐和广告服务，帮助企业实现更好的匹配和更高的收益。...

生成式AI 2024-06-19 人工智能

890阅读

我用ChatGPT做了一下姜萍的数学竞赛题，它懵了，我也懵了。

不仅仅因为她进入了2024阿里巴巴全球数学竞赛决赛入围名单，而且，因为她是17岁、93分、全球第12名。且是前三十名里唯一的女生。更炸的一点是，是她的学校。江苏省涟水中等专业学校。嗯，中专。她的上下左右，是北大、剑桥、清华、MIT、中科院等等等等...

生成式AI 2024-06-19 人工智能

783阅读

meta-llama/Meta-Llama-3-8B

https://huggingface.co/meta-llama/Meta-Llama-3-8B 型号细节 Meta开发并发布了Meta Llama 3家族大型语言模型(LLM ,这是一组预训练和指令微调的生成性文本模型,大小为8B和70B参数。L...

人工智能 2024-06-19 人工智能

993阅读

【AIGC】大型语言模型在人工智能规划领域模型生成中的探索

大型语言模型在人工智能规划领域模型生成中的新应用一、引言二、LLM在规划领域模型生成中的潜力三、实证分析：LLM在规划领域模型生成中的表现四、代码实例：LLM在规划领域模型生成中的应用五、结论与展望一、引言随着...

人工智能 2024-06-19 人工智能

949阅读