token 第13页 - AIGC资讯

AIGC从入门到实战：AI 辅助写作：基于 ChatGPT 的自动创作和文本扩展

1. Background Introduction In the rapidly evolving digital age, artificial intelligence (AI has become an indispensable tool i...

生成式AI 2024-06-09 人工智能

874阅读

LLaMa系列模型详解（原理介绍、代码解读）：LLaMa

LLaMA详解 LLaMA（Large Language Model Meta AI）是由Meta（前身为Facebook）开发的一种大规模语言模型，旨在提高自然语言处理（NLP）任务的性能。LLaMA基于变换器（Transformer）架构，并经过大...

生成式AI 2024-06-09 人工智能

1214阅读

- 使用 LMDeploy部署Llama 3

一.环境，模型准备 # 如果你是InternStudio 可以直接使用 # studio-conda -t lmdeploy -o pytorch-2.1.2 # 初始化环境 conda create -n lmdeploy python=3.10 co...

AIGC 2024-06-09 人工智能

1292阅读

GitHub Copilot插件登录流程

GitHub OAuth应用有一套流程，用于获取用户的授权信息。这个流程是一个OAuth2的流程，主要分为以下几个步骤：用户点击登录按钮，触发登录请求。应用将用户重定向到GitHub的授权页面。用户授权应用访问其GitHub账号。 GitHub验...

人工智能 2024-06-09 人工智能

948阅读

Llama模型家族训练奖励模型Reward Model技术及代码实战（三）使用 TRL 训练奖励模型

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

生成式AI 2024-06-09 人工智能

1331阅读

llama-factory SFT 系列教程 (四)，lora sft 微调后，使用vllm加速推理

文章目录文章列表：背景简介 llama-factory vllm API 部署融合 lora 模型权重 vllm API 部署 HuggingFace API 部署推理 API 部署总结 vllm 不使用 API 部署，直接推理...

AIGC 2024-06-09 人工智能

1841阅读

Meta Llama 3 使用 Hugging Face 和 PyTorch 优化 CPU 推理

原文地址：meta-llama-3-optimized-cpu-inference-with-hugging-face-and-pytorch 了解在 CPU 上部署 Meta* Llama 3 时如何减少模型延迟 2024 年 4 月 19 日万...

AIGC 2024-06-09 人工智能

804阅读

这份 Stable diffusion 提示词攻略，记得收好了！

大家好，今天给大家分享的是关于 Stable diffusion 提示词的基础和进阶语法，为什么有必要了解这个呢？首先是提示词对出图效果影响很大，了解提示词的用法有助于我们写出更优秀的提示词；其次就是我们可能会去C站拷贝别人的提示词，虽然直接拷贝过来也能得...

人工智能 2024-06-09 人工智能

1008阅读

有趣的大模型之我见 | Llama AI Model

Llama 开源吗？我在写《有趣的大模型之我见 | Mistral 7B 和 Mixtral 8x7B》时曾犹豫，在开源这个事儿上，到底哪个大模型算鼻祖？2023 年 7 月 18 日，Meta 推出了最受欢迎的大型语言模型（LLM）的第二个版本-Ll...

大数据 2024-06-09 人工智能

1101阅读

X-D-Lab/MindChat-Qwen-7B-v2模型向量化出现llama runner process has terminated: signal: aborted (core dumpe问题

Error: llama runner process has terminated: signal: aborted (core dumped 详细错误日志： 2024-05-21T06:24:45.266916811Z time=2024-05-...

AIGC 2024-06-08 人工智能

1265阅读

开源超闭源！通义千问Qwen2发布即爆火，网友：GPT-4o危

开源大模型全球格局，一夜再变。这不，全新开源大模型亮相，性能全面超越开源标杆Llama3。王座易主了。不是“媲美”、不是“追上”，是全面超越。发布两小时，直接冲上HggingFace开源大模型榜单第一。这就是最新一代开源大模型Qwen2，来自通义千问，...

人工智能 2024-06-08 人工智能

763阅读

llama_index微调BGE模型

微调模型是为了让模型在特殊领域表现良好，帮助其学习到专业术语等。本文采用llama_index框架微调BGE模型，跑通整个流程，并学习模型微调的方法。已开源：https://github.com/stay-leave/enhance_llm 一、...

大数据 2024-06-08 人工智能

1106阅读

最强开源大模型Llama 3发布！最大版本是4000亿参数规模！性能直逼GPT-4！

最强开源大模型Llama 3发布！最大版本是4000亿参数规模！性能直逼GPT-4！当地时间4月18日，Meta 官宣发布其最新开源大模型 Llama 3。目前，Llama 3 已经开放了 80亿和 700亿两个小参数版本，上下文窗口为8K。未来...

大数据 2024-06-08 人工智能

1239阅读

Stable Diffusion 模型演进：LDM、SD 1.0, 1.5, 2.0、SDXL、SDXL-Turbo 等

节前，我们星球组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学。针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。合集：持续火爆！！...

生成式AI 2024-06-08 人工智能

1212阅读

用 LLaMA-Factory 在魔搭微调千问

今天在魔搭上把千问调优跑通了，训练模型现在在 Mac 还不支持，需要用 N 卡才可以，只能弄个N 卡的机器，或者买个云服务器。魔搭可以用几十个小时，但是不太稳定，有的时候会自动停止。注册账号直接手机号注册就可以. 找到对应模型这步可能不需...

生成式AI 2024-06-08 人工智能

972阅读

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏

快科技6月7日消息，Intel官方宣布，旗下数据中心、客户端、边缘AI解决方案均已经为阿里云通义千问2（Qwen2）的全球发布提供支持，已取得ModelScope、阿里云PAI、OpenVINO等诸多创新成果。为了最大限度地提升诸通义千问2等大模型的效率...

AIGC 2024-06-08 人工智能

855阅读

LLM之RAG之LlaMAIndex：llama-index(一块轻快构建索引来查询本地文档的数据框架神器)的简介、安装、使用方法之详细攻略

LLM之RAG之LlaMAIndex：llama-index(一块轻快构建索引来查询本地文档的数据框架神器的简介、安装、使用方法之详细攻略目录 LlamaIndex的简介 1、LlamaIndex有什么帮助? 2、核心原理 llama-i...

生成式AI 2024-06-08 人工智能

1511阅读

手把手从零搭建ChatGPT网站midjourney-AI绘画系统，附详细搭建部署教程文档

一、系统前言 SparkAi创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统，支持OpenAI-GPT全模型+国内AI全模型。本期针对源码系统整体测试下来非常完美，那么如何搭建部署AI创作ChatGPT？小编这里写一个...

生成式AI 2024-06-08 人工智能

989阅读

Diffusion Model, Stable Diffusion, Stable Diffusion XL 详解

文章目录 Diffusion Model 生成模型 DDPM概述向前扩散过程前向扩散的逐步过程前向扩散的整体过程反向去噪过程网络结构训练和推理过程训练过程推理过程优化目标详细数学推导数学基础向前扩散过程反向...

大数据 2024-06-08 人工智能

1832阅读

【Diffusion实战】基于Stable Diffusion实现文本到图像的生成（Pytorch代码详解）

来试试强大的Stable Diffusion吧，基于Stable Diffusion的pipeline，进一步了解Stable Diffusion的结构~ Diffusion实战篇：【Diffusion实战】训练一个diffusion模型生成...

大数据 2024-06-07 人工智能

1008阅读

Stable Diffusion XL之使用Stable Diffusion XL训练自己的AI绘画模型

文章目录一 SDXL训练基本步骤二从0到1上手使用Stable Diffusion XL训练自己的AI绘画模型 2.1 配置训练环境与训练文件 2.2 SDXL训练数据集制作 (1 数据筛选与清洗 (2 使用BLIP自动标注cap...

生成式AI 2024-06-07 人工智能

2845阅读

OpenAI新作署名Ilya，提取1600万个特征看透GPT-4大脑！

【新智元导读】今天，OpenAI发布了一篇GPT-4可解释性的论文，似乎是作为前两天员工联名信的回应。网友细看论文才发现，这居然是已经解散的「超级对齐」团队的「最后之作」。前两天，OpenAI的一群员工刚刚联名发表公开信，表示自主的AI系统正在失控，呼吁...

人工智能 2024-06-07 人工智能

756阅读

LLaMA3（Meta）微调SFT实战Meta-Llama-3-8B-Instruct

LlaMA3-SFT LlaMA3-SFT, Meta-Llama-3-8B/Meta-Llama-3-8B-Instruct微调(transformers /LORA(peft /推理项目地址 https://github.com/yong...

大数据 2024-06-07 人工智能

1134阅读

pipeline-stable-diffusion.py文件逐行解释

本文是对stabled-diffusion的pipeline文件的代码逐行解释。 60-71行该函数对经过cfg重组出来的noise_pred，再重组。 def rescale_noise_cfg(noise_cfg, noise_pred_t...

生成式AI 2024-06-07 人工智能

1526阅读

【AIGC调研系列】Phi-3 VS Llama3

2024-04-24日发布的Phi-3系列模型在多个方面展现出了对Llama-3的性能优势。首先，Phi-3-small（7B参数）在MMLU上的得分高于Llama-3-8B-Instruct模型，分别为75.3%和66%[1]。此外，具有3.8B参数的P...

生成式AI 2024-06-07 人工智能

855阅读

在本地跑一个AI模型(5) - Stable Diffusion

在之前的文章中，我们使用ollama在本地运行了大语言模型，它可以与你聊天，帮助你理解和生成文本内容。使用coqui-tts在本地运行了文本转语音模型，它可以将大语言模型生成的文字转换成语音，让你的应用更有趣。今天我们将要介绍Stable Diffusio...

生成式AI 2024-06-06 人工智能

915阅读

这个团队做了OpenAI没Open的技术，开源OpenRLHF让对齐大模型超简单

随着大型语言模型（LLM）规模不断增大，其性能也在不断提升。尽管如此，LLM 依然面临着一个关键难题：与人类的价值和意图对齐。在解决这一难题方面，一种强大的技术是根据人类反馈的强化学习（RLHF）。但是，随着模型越来越大，RLHF 通常需要维持多个模型...

生成式AI 2024-06-06 人工智能

726阅读

使用Python实现深度学习模型：序列到序列模型（Seq2Seq）

本文分享自华为云社区《使用Python实现深度学习模型：序列到序列模型（Seq2Seq）》，作者： Echo_Wish。序列到序列（Seq2Seq）模型是一种深度学习模型，广泛应用于机器翻译、文本生成和对话系统等自然语言处理任务。它的核心思想是将一个序...

人工智能 2024-06-06 人工智能

838阅读

一夜暴富50亿，老黄新晋「流量明星」！英伟达市值破3万亿，超越苹果成全球第二

3万亿美元，英伟达市值再次创造历史！当地时间周三，股价涨超5%。现在的英伟达，已经成为全球第二大市值最高的公司，超越苹果，仅次微软。距离世界第一，仅差一步之遥。而上一次英伟达市值首超苹果，还是2002年。当时，两家公司的市值不到100亿美元。...

人工智能 2024-06-06 人工智能

797阅读

首次证实白盒Transformer可扩展性！马毅教授CRATE-α：鲸吞14亿数据，性能稳步提升

在过去的几年里，Transformer架构在自然语言处理（NLP）、图像处理和视觉计算领域的深度表征学习中取得了显著的成就，几乎成为了AI领域的主导技术。然而，虽然Transformer架构及其众多变体在实践中取得了巨大成功，但其设计大多是基于经验的，...

人工智能 2024-06-06 人工智能

744阅读

清华大学与智谱AI重磅开源 GLM-4：掀起自然语言处理新革命

自 2023 年 3 月 14 日开源 ChatGLM-6B 以来，GLM 系列模型受到了广泛的关注和认可。特别是在 ChatGLM3-6B 开源之后，开发者对智谱 AI 推出的第四代模型充满了期待。而这一期待，随着 GLM-4-9B 的发布，终于得到了...

大数据 2024-06-06 人工智能

1083阅读

Unity接入文心一言大模型

一、百度云平台创建应用 1、创建一个自己的应用 https://console.bce.baidu.com/qianfan/ais/console/applicationConsole/application 2、获取ApiKey和Secret...

人工智能 2024-06-06 人工智能

1078阅读

LLM | Yuan 2.0-M32：带注意力路由的专家混合模型

图片一、结论写在前面 Yuan 2.0-M32，其基础架构与Yuan-2.0 2B相似，采用了一个包含32位专家的专家混合架构，其中2位专家处于活跃状态。提出并采用了一种新的路由网络——注意力路由器，以更高效地选择专家，相比采用经典路由网络的模型，其准...

人工智能 2024-06-06 人工智能

921阅读

使用llama.cpp在linux cuda环境部署llama2方法记录及遇到的问题

一、编译lllama.cpp 拉取llama.cpp库 cd llama.cpp make LLAMA_CUBLAS=1 LLAMA_CUDA_NVCC=/usr/local/cuda/bin/nvcc bug：编译问题使用make，nv...

生成式AI 2024-06-06 人工智能

2132阅读

一次copilot问题处理

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、问题描述二、解决步骤 1.询问关键词 2.询问问题 3.询问解决方案总结前言记录一次使用copilot解决问题的流程，以...

生成式AI 2024-06-06 人工智能

879阅读

手把手教你调用文心一言API，含py调用示例代码

获取API密钥打开网址：百度智能云千帆大模型 (baidu.com 注册或登录账号选择应用接入创建应用随便起个名字点击显示即可。这个API Key和Secret Key就是我们需要的。 Pyth...

人工智能 2024-06-06 人工智能

1393阅读

智谱AI Open Day：升级清言App、发布GLM-4开源模型、新一代MaaS平台，大模型商业化迎来“下一站”

“描绘宏大未来愿景的同时让更多人切身体会到大模型的强大能力，让大模型技术从炫酷的天空当中真正落到地面上、落到实处，是每一个大模型公司必须思考的问题。”——智谱 AI CEO 张鹏 6月5日，智谱AI Open Day在UCCA Lab北京艺术空间举办。...

生成式AI 2024-06-06 人工智能

901阅读

LLM并发加速部署方案（llama.cpp、vllm、lightLLM、fastLLM）

大模型并发加速部署解析当前应用较广的几种并发加速部署方案！ llama.cpp、vllm、lightllm、fastllm四种框架的对比： llama.cpp：基于C++，①请求槽，②动态批处理，③CPU/GPU混合推理 vllm：基于Pyth...

大数据 2024-06-05 人工智能

3081阅读

llama.cpp制作GGUF文件及使用

llama.cpp的介绍 llama.cpp是一个开源项目，由Georgi Gerganov开发，旨在提供一个高性能的推理工具，专为在各种硬件平台上运行大型语言模型（LLMs）而设计。这个项目的重点在于优化推理过程中的性能问题，特别是针对CPU环境。以...

人工智能 2024-06-05 人工智能

1388阅读

LLMs之llama3-from-scratch：llama3-from-scratch(从头开始利用pytorch来实现并解读LLaMA-3模型的每层代码)的简介、核心思路梳理

LLMs之llama3-from-scratch：llama3-from-scratch(从头开始利用pytorch来实现并解读LLaMA-3模型的每层代码的简介、核心思路梳理导读：这篇论文实现了transformer网络的llama3模型...

AIGC 2024-06-05 人工智能

2173阅读

智谱 AI 全模型矩阵降价清言智能体中心上线罗永浩“AI老罗”

站长之家（ChinaZ.com）6月5日消息:在今日举办的智谱AI Open Day上，智谱AI宣布，旗下GLM-4-Air和GLM-3-Turbo模型的价格已经降至0.6元/百万Tokens，而Embedding-2模型更是以0.3元/百万Tokens...

人工智能 2024-06-05 人工智能

744阅读

大模型到底有没有智能？一篇文章给你讲明明白白

生成式人工智能 (GenAI[1] 和大语言模型 (LLM[2] ，这两个词汇想必已在大家的耳边萦绕多时。它们如惊涛骇浪般席卷了整个科技界，登上了各大新闻头条。ChatGPT，这个神奇的对话助手，也许已成为你形影不离的良师益友。然而，在这场方兴未艾的...

人工智能 2024-06-05 人工智能

947阅读

迈向『闭环』| PlanAgent：基于MLLM的自动驾驶闭环规划新SOTA！

本文经自动驾驶之心公众号授权转载，转载请联系出处。中科院自动化所深度强化学习团队联合理想汽车等提出了一种新的基于多模态大语言模型MLLM的自动驾驶闭环规划框架—PlanAgent。该方法以场景的鸟瞰图和基于图的文本提示为输入，利用多模态大语言模型的多...

大数据 2024-06-05 人工智能

1116阅读

部署基于内存存储的 Elasticsearch - 一亿+条数据，全文检索 100ms 响应

1. 在主机上挂载内存存储目录创建目录用于挂载 mkdir /mnt/memory_storage 挂载 tmpfs 文件系统 mount -t tmpfs -o size=800G tmpfs /mnt/memory_storage 存储空间会按需使...

人工智能 2024-06-05 人工智能

711阅读

儿童节变身小小音乐家，用ModelArts制作一张AIGC音乐专辑

本文分享自华为云社区《儿童节变身小小音乐家，用ModelArts制作一张AIGC音乐专辑》，作者：华为云社区精选。儿童节，如何给小朋友准备一份特别的礼物？这份AIGC音乐专辑制作攻略一定要收下一段文字灵感就能编织出一曲悠扬悦耳的旋律童话、...

大数据 2024-06-05 人工智能

826阅读

Midjourney可以通过接口调用啦

在数字艺术创作领域，Midjourney一直以其出色的图片生成效果受到广泛关注。然而，由于需要通过discord界面操作等一系列限制，也给很多用户带来了不便。现在，通过日月摘星接口，用户可以直接访问和调用midjourney，大大简化了操作...

AIGC 2024-06-04 人工智能

958阅读

LlamaFactory源码解析 PPO

class CustomPPOTrainer(PPOTrainer, Trainer : r""" Inherits PPOTrainer. """ def __init__( self,...

生成式AI 2024-06-04 人工智能

1726阅读

苏妈杀疯了：移动端最强NPU算力达50TOPS，最强AI芯片挑战英伟达

一年一度的 Computex 科技大会成为了 GPU 厂商们秀肌肉的舞台，其中当属英伟达和 AMD 最为亮眼。英伟达现场拿出了量产版 Blackwell 芯片，还公布了未来三年的产品路线，包括下一代 Rubin AI 平台。 AMD 当然也不甘示弱，CE...

生成式AI 2024-06-04 人工智能

852阅读

文心一言API接入指南

一、了解文心一言文心一言是百度打造出来的人工智能大语言模型，具备跨模态、跨语言的深度语义理解与生成能力，文心一言有五大能力，文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成，其在搜索问答、内容创作生成、智能办公等众多领域都有更广阔的想象空间...

大数据 2024-06-04 人工智能

1571阅读

Mamba-2新架构出世一统江湖！普林斯顿CMU华人再出神作，性能狂飙8倍

年前，Mamba被顶会ICLR拒稿的消息曾引起轩然大波。甚至有研究人员表示：如果这种工作都被拒了，那我们这些「小丑」要怎么办？这次，新一代的Mamba-2卷土重来、再战顶会，顺利拿下了ICML 2024！仍是前作的两位大佬（换了个顺序），仍是熟...

AIGC 2024-06-04 人工智能

1243阅读