token 第15页 - AIGC资讯

阅读llama源码笔记_1

文章目录总体逻辑 1 构造模型 2 定义数据 3 处理下游任务 1.构造模型 1.1构造分词器tokenizer 1.2构造Transformer 2.定义数据 3.处理下游任务 3.1分词（编码） 3.2 generate...

大数据 2024-05-30 人工智能

647阅读

百度文心一言api Python调用ERNIE-Speed-8K具体方法

ERNIE Speed是百度2024年最新发布的自研高性能大语言模型，通用能力优异，适合作为基座模型进行精调，更好地处理特定场景问题，同时具备极佳的推理性能。ERNIE-Speed-8K是模型的一个版本，本文介绍了相关API。创建chat 调用本接口...

人工智能 2024-05-30 人工智能

920阅读

大模型App腾讯元宝上线！混元再升级，打造可随身携带的全能AI助理

5 月 30 日，腾讯宣布旗下混元大模型全面升级，基于混元大模型的App“腾讯元宝”正式上线，苹果及安卓应用商店均可下载。相比此前测试阶段的混元小程序版本，面向工作效率场景，腾讯元宝提供了AI搜索、AI总结、AI写作等核心能力；面向日常生活场景，元宝...

AIGC 2024-05-30 人工智能

1851阅读

LLMs之LLaMA-3：Llama-3-70B-Gradient-1048k-adapter的简介、源代码解读merge_adapters.py(仅需58行代码)合并多个PEFT模型(LoRA技术)

LLMs之LLaMA-3：Llama-3-70B-Gradient-1048k-adapter的简介、源代码解读merge_adapters.py(仅需58行代码合并多个PEFT模型(LoRA技术将LLaMA-3扩展到100万/1048k上下文——解析...

AIGC 2024-05-30 人工智能

1082阅读

32专家MoE大模型免费商用！性能全面对标Llama3，单token推理消耗仅5.28%

每个token只需要5.28%的算力，精度就能全面对标Llama 3。开源大模型，再添一位重量级选手—— 来自浪潮信息的32专家MoE模型，源2.0-M32。不仅拥有极高的回报投入比，而且全面开放，训练代码和模型权重都可任意下载，商业使用也免费、无需...

生成式AI 2024-05-30 人工智能

738阅读

腾讯AI助手App元宝来了，公众号作者必备

以产品见长的腾讯，终于推出C端AI助手App:腾讯元宝。与之前测试的混元助手相比，元宝在AI搜索、AI总结、AI写作等核心能力上都有升级，大模型效果提升50%。功能听起来好像和同类AI助手也差不多?But，一试才发现—— 能精准搜到微信公众号生态优质...

大数据 2024-05-30 人工智能

789阅读

你的全能AI搭子来了，腾讯混元推出大模型App“腾讯元宝”

5月30日，腾讯宣布旗下混元大模型全面升级，基于混元大模型的App“腾讯元宝”正式上线，苹果及安卓应用商店均可下载。相比此前测试阶段的混元小程序版本，面向工作效率场景，腾讯元宝提供了AI搜索、AI总结、AI写作等核心能力;面向日常生活场景，元宝的玩法也...

人工智能 2024-05-30 人工智能

844阅读

通用大模型研究重点之五：llama family

LLAMA Family decoder-only类型 LLaMA（Large Language Model AI）在4月18日公布旗下最大模型LLAMA3，参数高达4000亿。目前meta已经开源了80亿和700亿版本模型，主要升级是多模态、长文本方...

AIGC 2024-05-30 人工智能

1011阅读

深入探索令牌桶限流的原理与实践

在当今的互联网时代，随着用户数量和请求量的不断增加，系统的性能和稳定性面临着巨大的挑战。限流算法作为保障系统稳定性的重要手段之一，被广泛应用于各种服务和应用中。限流的核心目的是对某一时间窗口内的请求数进行限制，保持系统的可用性和稳定性，防止因流量暴增而导致...

大数据 2024-05-30 人工智能

750阅读

Windows11(非WSL)安装Installing llama-cpp-python with GPU Support

直接安装，只支持CPU。想支持GPU，麻烦一些。 1. 安装CUDA Toolkit (NVIDIA CUDA Toolkit (available at https://developer.nvidia.com/cuda-downloads 2...

生成式AI 2024-05-30 人工智能

1035阅读

AIGC——ComfyUI SDXL多种风格预设提示词插件安装与使用

概述 SDXL Prompt Styler可以预先给SDXL模型提供了各种预设风格的提示词插件，相当于预先设定好了多种不同风格的词语。使用这个插件，只需从中选取所需的风格，它会自动将选定的风格词汇添加到我们的提示中。安装插件地址：https:...

人工智能 2024-05-30 人工智能

2171阅读

AI新时代——【深度学习】驱动的【AIGC大模型】与【机器学习】的创新融合

目录 1.机器学习与人工智能的基础 1.机器学习的基本原理 2.人工智能的广泛应用 2.深度学习的崛起 1.深度学习的概念和原理 2.卷积神经网络（CNN） 3.循环神经网络（RNN） 3.AIGC大模型的创新 1.AIGC的概念和应用...

AIGC 2024-05-30 人工智能

792阅读

AlphaFold 3不开源，统一生物语言大模型阿里云先开了！

把169861个生物物种数据装进大模型，大模型竟get到了生物中心法则的奥秘—— 不仅能识别DNA、RNA与相应蛋白质之间的内在联系，在基因分类、蛋白质相互作用预测、热稳定性预测等7种不同类型任务中也能比肩SOTA模型。模型名为LucaOne，由阿里云...

人工智能 2024-05-30 人工智能

744阅读

Kohya 训练器 Stable Diffusion工作流中训练LoRA模型方法

本文档是关于Stable Diffusion工作流中训练LoRA模型方法的文档一.前置训练集准备第一步：准备训练集：准备训练模型时使用的训练集。注意：训练集应当能尽量涵盖训练对象的“多样化样本”。如角色立绘图，各个角度不同的图片。...

人工智能 2024-05-30 人工智能

2315阅读

Springboot整合文心一言----非流式响应与流式响应（前后端）

所谓非流式响应就是直接等待百度把答案生成好之后直接返回给你，而后者这是一一种流的形式，百度一边生成答案，一边将答案进行返回，这样就是我们在使用ChatGPT中最常见的一种表现了，它回答问题的时候总是一个字一个字的出来。这两回答方式都有一定的...

大数据 2024-05-30 人工智能

1253阅读

百度文心一言：官方开放API开发基础

目录一、模型介绍 1.1主要预置模型介绍 1.2 计费单价二、前置条件 2.1 创建应用获取 Access Key 与 Secret Key 2.2 设置Access Key 与 Secret Key 三、基于千帆SDK开发 3.1 M...

大数据 2024-05-30 人工智能

1064阅读

Stable Diffusion教程：提示词（模型、插件、安装包可分享）

什么是提示词文章提到的模型、插件、安装包都可分享，需要的小伙伴文末领取！你可能没写过提示词，但是一定听说过“提示词”这几个字，也大概能知道它的重要性。没听说过也没关系，下面我就带你认识认识。提示词就是我们给AI模型下发的指令。提示词写对了...

大数据 2024-05-30 人工智能

806阅读

详解各种LLM系列｜LLaMA 2模型架构、预训练、SFT内容详解 (PART1)

作者 | Sunnyyyyy 整理 | NewBeeNLP https://zhuanlan.zhihu.com/p/670002922 大家好，这里是 NewBeeNLP。之前我们分享了详解各种LLM系列｜...

生成式AI 2024-05-29 人工智能

1312阅读

一文速览Llama 3及其微调：从如何把长度扩展到100万到如何微调Llama3 8B

前言 4.19日凌晨正准备睡觉时，突然审稿项目组的文弱同学说：Meta发布Llama 3系列大语言模型了，一查，还真是本文以大模型开发者的视角，基于Meta官方博客的介绍：Introducing Meta Llama 3: The most capa...

AIGC 2024-05-29 人工智能

1763阅读

Karpathy新教程爆火，网友抢着送他H100：从头复现GPT-2训练

大神Karpathy已经不满足于用C语言造Llama了! 他给自己的最新挑战:复现OpenAI经典成果，从基础版GPT-2开始。挑战成功本身并不意外，但是只花费20美元、90分钟完成训练，Loss和评测还超越原版，就!有!点!过!分!了!。不仅如此，...

人工智能 2024-05-29 人工智能

676阅读

Meta Llama 3本地部署

感谢阅读环境安装收尾环境安装项目文件下载完后在根目录进入命令终端（windows下cmd、linux下终端、conda的话activate）运行 pip install -e . 不要控制台，因为还要下载模型。这...

生成式AI 2024-05-29 人工智能

752阅读

商汤日日新大模型5.0粤语版发布定价30港元1M tokens

商汤科技正式发布了全新的“日日新大模型5.0粤语版”。这一版本不仅定价亲民，以30港元的价格提供1M tokens（输入与输出均同价）的优质服务，而且支持最大128K窗口，确保用户在使用过程中获得流畅、高效的体验。此外，“商量粤语版”还将推出网页版和Ap...

AIGC 2024-05-29 人工智能

637阅读

当前都在堆长窗口，还需要 RAG 吗？

自从谷歌的 Gemini 1.5 Pro 发布后，行业内就有不少人在背后“蛐蛐” RAG。一方面是因为，Gemini 的表现确实亮眼。根据官方发布的技术报告，Gemini 1.5 Pro 能够稳定处理高达100 token，相当于1小时的视频、11小时...

人工智能 2024-05-29 人工智能

930阅读

通俗易懂的Stable Diffusion模型结构介绍

目录 SD的发展历程 SD 模型的网络结构 ClipText 文本编码器文本向量输入Unet VAE模型总结图 SD的发展历程 Stab...

AIGC 2024-05-29 人工智能

1166阅读

马斯克烧60亿美元难题，国内大厂有解？开源MoE模算效率黑马登场，3.7B参数单挑Llama 3-70B

如今，想训个SOTA的大模型，不仅缺数据和算力，甚至连电都不够用了。最近马斯克就公开表示，因为苦于买不到足够的芯片，xAI只能推迟Gork 2的训练和发布。 Grok 3及更高版本，甚至需要10万个H100，按每台H100售价3万美元来算，仅芯片就要花...

人工智能 2024-05-29 人工智能

774阅读

AI日报｜微软推出Copilot+PC，通义主模型大幅降价，文心两大模型全面免费...

文章推荐 AI晚报｜GPT-4o最新语音交互模式即将上线，微软Build 2024开发者大会即将开幕... AI Agent深度解析：潜力与挑战并存的智能新世界 GPT-4o重磅发布，第一时间用户测评，OpenAI也存在夸张宣传？微软让Windo...

大数据 2024-05-29 人工智能

706阅读

大模型内心OS：聪明大脑如何匹配现实需求？

近两年，无论你身处什么行业，处于何种生活状态，相信大家对AIGC、大模型等热词并不陌生，从之前大火的AI作图、AI脚本、到AI恋爱，人工智能正在一步步地改变我们的生活方式。与此同时，大模型行业也在不断地进行迭代升级。近日，随着阿里云一则直降97%定价策略...

人工智能 2024-05-29 人工智能

681阅读

MIT最新力作：用GPT-3.5解决时间序列异常检测问题

今天给大家介绍一篇MIT上周发表的文章，使用GPT-3.5-turbo解决时间序列异常检测问题，初步验证了LLM在时间序列异常检测中的有效性。整个过程没有进行finetune，直接使用GPT-3.5-turbo进行异常检测，文中的核心是如何将时间序列转换...

生成式AI 2024-05-29 人工智能

844阅读

Stable Diffusion AI绘画：从提示词到模型出图的全景指南

? 个人网站:【摸鱼游戏】【神级代码资源网站】【工具大全】 ? 一站式轻松构建小程序、Web网站、移动应用：?注册地址 ? 基于Web端打造的：?轻量化工具创作平台 ? 想寻找共同学习交流，摸鱼划水的小伙伴，请点击【全栈技术交流群】 Stable...

大数据 2024-05-29 人工智能

695阅读

AI领域的新速度之王Samba-1 Turbo：每秒1084 个token

AI芯片厂商SambaNovaAI最新推出的AI芯片Samba-1Turbo表现出色，被称为AI领域的新速度之王。据外部机构Artificial Analysis独立测试结果显示，Samba-1Turbo在Llama3Instruct（8B）上的输出速度...

大数据 2024-05-29 人工智能

622阅读

【AIGC】Mac Intel 本地 LLM 部署经验汇总（CPU Only）

书接上文，在《【AIGC】本地部署 ollama(gguf 与项目整合》章节的最后，我在 ollama 中部署 qwen1_5-14b-chat-q4_k_m.gguf 预量化模型，在非 Stream 模式下需要 89 秒才完成一轮问答，响应速度实在是太...

人工智能 2024-05-29 人工智能

1468阅读

使用文心一言进行图像内容理解

接上篇文章，这期使用文心一言图像识别API，对本地图片以及在线视频图片进行内容理解。该请求用于图像内容理解，支持输入图片和提问信息，可对输入图片进行理解，输出对图片的一句话描述，同时可针对图片内的主体/文字等进行检测与识别，支持返回图片内多主体/文字的...

生成式AI 2024-05-29 人工智能

1764阅读

使用 LLaMA Factory 微调 Llama-3 中文对话模型

原文：https://colab.research.google.com/drive/1d5KQtbemerlSDSxZIfAaWXhKr30QypiK?usp=sharing#scrollTo=gf60HoT633NY 请申请一个免费 T4 GPU 来...

人工智能 2024-05-29 人工智能

1500阅读

适应多形态多任务，最强开源机器人学习系统「八爪鱼」诞生

在机器人学习方面，一种常用方法是收集针对特定机器人和任务的数据集，然后用其来训练策略。但是，如果使用这种方法来从头开始学习，每一个任务都需要收集足够数据，并且所得策略的泛化能力通常也不佳。原理上讲，从其它机器人和任务收集的经验能提供可能的解决方案，能让...

生成式AI 2024-05-28 人工智能

735阅读

仅用250美元，Hugging Face技术主管手把手教你微调Llama 3

ChatGPT狂飙160天，世界已经不是之前的样子。新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站https://ai.hzytsoft.cn/ 更多资源欢迎关注大语言模型的微...

AIGC 2024-05-28 人工智能

781阅读

Llama中文大模型-模型预训练

Atom系列模型包含Atom-7B和Atom-13B，基于Llama2做了中文能力的持续优化。Atom-7B和Atom-7B-Chat目前已完全开源，支持商用，可在Hugging Face仓库获取模型:https://huggingface.co/Flag...

人工智能 2024-05-28 人工智能

759阅读

Llama 3 安装使用方法

Llama3简介： llama3是一种自回归语言模型，采用了transformer架构，目前开源了8b和70b参数的预训练和指令微调模型，400b正在训练中，性能非常强悍，并且在15万亿个标记的公开数据进行了预训练，比llama2大了7倍，距离llam...

生成式AI 2024-05-28 人工智能

1105阅读

Llama 3 模型家族构建安全可信赖企业级AI应用之使用 Llama Guard 保护大模型对话（八）

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

大数据 2024-05-28 人工智能

742阅读

一文读懂本地运行 LLM 的优秀实践方法

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM -常见的本地运行 LLM 方法。众所周知，如今使用 ChatGPT 等大型模型工具变得异常简单，只需通过浏览器在线访问即可。然而，需要注意的是，...

大数据 2024-05-28 人工智能

694阅读

什么是Token？为什么大模型要计算Token数

本文分享自华为云社区《【技术分享】什么是Token？为什么GPT基于Token定价》，作者：开天aPaaS小助手Tracy。在使用LLM大模型时，我们经常会遇到一个关键词，叫：Token。比如：最新版 GPT-4 Turbo 模型最高支持 12...

人工智能 2024-05-28 人工智能

1001阅读

OpenBayes 教程上新｜一键 input Llama 3，70B 版本只占用 1.07 GB 存储空间

2023 年 2 月，Meta 发布 Llama，一度成为 AI 社区最强大的开源大模型，但当时因开源协议问题，无法免费商用，仅供研究使用。5 个月后，免费可商用的 Llama 2 横空出世，训练数据多 40%，上下文长度翻倍。同年 9 月的 Al N...

大数据 2024-05-28 人工智能

782阅读

安卓Discuz帖子爬虫技术解析与应用探索

在当今信息化快速发展的时代，数据已经成为各个领域不可或缺的重要资源。随着网络论坛的兴起，其中蕴藏的大量用户生成数据也引起了广泛关注。Discuz作为一款广受欢迎的论坛系统，其帖子数据具有很高的挖掘价值。本文将深入探讨安卓平台上的Discuz帖子爬虫技术，并...

生成式AI 2024-05-28 大数据

812阅读

Llama 3 实践教程（InternStudio 版）

文章目录 Llama3本地 Web Demo部署初始环境配置下载模型 Web Demo 部署 XTuner 微调 Llama3 个人小助手自我认知训练数据集准备 XTuner配置文件准备训练模型推理验证 XTuner微调Lla...

人工智能 2024-05-28 人工智能

1063阅读

众神听令，王者归位！Meta最强开源大模型 Llama 3 重磅来袭

整理 | 王轶群责编 | 唐小引出品丨AI 科技大本营（ID：rgznai100） 4月19日凌晨，Meta重磅发布了全球最大开源大模型Llama 3，一夜间重新坐稳王者之位。模型下载链接：https://llama.meta.com/lla...

AIGC 2024-05-28 人工智能

744阅读

AIGC系列之：DDPM原理解读（简单易懂版）

目录 DDPM基本原理 DDPM中的Unet模块 Unet模块介绍 Unet流程示意图 DownBlock和UpBlock MiddleBlock 文生图模型的一般公式总结本文部分内容参考文章：https://ju...

AIGC 2024-05-28 人工智能

1138阅读

LLaMA-Factory+qwen多轮对话微调测评

目录训练的时间和效果数据准备数据样例数据配置环境搭建模型微调训练模型预测运行成功的web UI LLaMA-Factory地址：https://github.com/hiyouga/LLaMA-Factory/blo...

大数据 2024-05-27 人工智能

1399阅读

Stable Diffusion XL优化终极指南

如何在自己的显卡上获得SDXL的最佳质量和性能，以及如何选择适当的优化方法和工具，这一让GenAI用户倍感困惑的问题，业内一直没有一份清晰而详尽的评测报告可供参考。直到全栈开发者Félix San出手。在本文中，Félix介绍了相关...

大数据 2024-05-27 人工智能

1265阅读

英伟达赢麻了！马斯克xAI超级算力工厂曝光，10万块H100、数十亿美元

最近几年，随着大语言模型的飞速发展与迭代，科技巨头们都竞相投入巨额财力打造超级计算机（或大规模 GPU 集群）。他们认为，更强大的计算能力是实现更强大 AI 的关键。早在 2022 年，Meta 即宣布与英伟达共同打造大型 AI 研究超级计算机「AI...

AIGC 2024-05-27 人工智能

682阅读

Hinton揭秘Ilya成长历程：Scaling Law是他学生时代就有的直觉

2003年夏天的一个周日，AI教父Hinton在多伦多大学的办公室里敲代码，突然响起略显莽撞的敲门声。门外站着一位年轻的学生，说自己整个夏天都在打工炸薯条，但更希望能加入Hinton的实验室工作。 Hinton问，你咋不预约呢？预约了我们才能好好谈谈。...

大数据 2024-05-27 人工智能

705阅读

全面超越DPO：陈丹琦团队提出简单偏好优化SimPO，还炼出最强8B开源模型

为了将大型语言模型（LLM）与人类的价值和意图对齐，学习人类反馈至关重要，这能确保它们是有用的、诚实的和无害的。在对齐 LLM 方面，一种有效的方法是根据人类反馈的强化学习（RLHF）。尽管经典 RLHF 方法的结果很出色，但其多阶段的过程依然带来了一些...

大数据 2024-05-27 人工智能

713阅读