token 第36页 - AIGC资讯

4090成A100平替？token生成速度只比A100低18%，上交大推理引擎火了

不仅如此，PowerInfer 与最先进的本地LLM推理框架 llama.cpp 相比，在单个 RTX 4090 (24G 上运行 Falcon (ReLU -40B-FP16，实现了 11 倍多的加速，还能保持模型的准确性。具体来说，PowerIn...

大数据 2023-12-22 人工智能

1013阅读

本地部署 Stable Diffusion XL Gradio Demo WebUI

StableDiffusion XL Gradio Demo WebUI 0. 先展示几张 StableDiffusion XL 生成的图片 1. 什么是 Stable Diffusion XL Gradio Demo WebUI 2. Git...

大数据 2023-12-22 人工智能

886阅读

微信小程序｜ AIGC之动手实现ChatGPT法律顾问小程序

一、需求背景在资本退去后，现如今的互联网行情很差劲，很多创新业务都不得不砍除。再加上国内互联网时代进入到了一个增量犹显疲态，增量杀红了眼！阶段，各大互联网公司均有一种断臂求生的态势！各位互联网同行，大力发展第二职业已然变成了必要的生产力！我们既要...

生成式AI 2023-12-22 人工智能

854阅读

【AI大模型】Google Bard (PaLM2) 大模型写代码能力实测: LSM Tree, DAG Scheduler, AI大模型加持自然语言零代码平台设计（福利O：文末附PaLM2访问链接）

禅与计算机程序设计艺术评测结论：当前AI大模型写代码能力当之无愧的 No.1. Google Bard (PaLM2 文章目录禅与计算机程序设计艺术评测结论：当前AI大模型写代码能力当之无愧的 No.1. Google Bard...

生成式AI 2023-12-22 人工智能

965阅读

Llama 架构分析

从代码角度进行Llama 架构分析 Llama 架构分析前言 Llama 架构分析分词网络主干 DecoderLayer Attention MLP 下游任务因果推理文本分类 Llama 架构分析...

AIGC 2023-12-21 人工智能

865阅读

Stable Diffusion XL webui dreambooth插件 Linux安装，训练LoRA（保姆级教程）

文章目录 Stable Diffusion XL webui dreambooth插件 Linux安装（保姆级教程）前言安装下载dreambooth仓库下载SDXL预训练模型其他文件下载前注意下载前准备下载...

生成式AI 2023-12-21 人工智能

1381阅读

开创全新通用3D大模型，VAST将3D生成带入「秒级」时代

生成式 AI 在3D 领域在很长一段时间内都在等待自己的「ChatGPT」时刻。传统3D 建模涉及游戏、影视、建筑等多个行业，普遍依赖专业人员手动操作，生产周期短则几天，多则以月为单位，单个3D 模型的创建成本至少需要几千元。生成式 AI 技术在2D 图...

生成式AI 2023-12-21 人工智能

1011阅读

“Transformer挑战者”Mamba，用Macbook也能跑了！GitHub半天斩获500+星

“Transformer的挑战者”Mamba，用MacBook也能跑了！有大佬在GitHub上共享了一份笔记，让人们可以用最简单的方式运行Mamba。这份共享中，算上说明书一共只有三个文件，而且发布不到一天，就斩获了500+星标。图片 Mamba是...

生成式AI 2023-12-21 人工智能

846阅读

together.ai让AI模型训练快9倍，获NVIDIA参投1.025亿美元A轮融资

目前获得融资最多的两家大模型创业公司是OpenAI和Anthropic，而这两家公司最大的投资者分别是微软和亚马逊，他们投资的很大一部分不是资金，而是等值的云计算资源。这其实也就把这两家顶尖的闭源大模型公司“绑上了”科技巨头的“战车”。在闭源大模型之外，...

大数据 2023-12-21 人工智能

980阅读

【AI绘图丨 Stable_diffusion 系列教程四】— Window 环境 | Stable Diffusion入门教程及安装（全篇）

?腾小云导读最近，AI图像生成引人注目，它能够根据文字描述生成精美图像，这极大地改变了人们的图像创作方式。Stable Diffusion作为一款高性能模型，它生成的图像质量更高、运行速度更快、消耗的资源以及内存占用更小，是AI图像生成领域的里...

AIGC 2023-12-21 人工智能

1829阅读

文心一言AI大模型，前端接入

文心一言AI大模型，前端接入一、参考接口资料模型广场：https://console.bce.baidu.com/qianfan/modelcenter/model/buildIn/list 我的应用：https://console.bce.bai...

人工智能 2023-12-21 人工智能

962阅读

Stable Diffusion Windows 部署简单认知

写在前面偶然看到，简单了解博文为 SD 部署，以及简单使用，部署过程遇到问题解决理解不足小伙伴帮忙指正对每个人而言，真正的职责只有一个：找到自我。然后在心中坚守其一生，全心全意，永不停息。所有其它的路都是不完整的，是人的逃避方式，是对大...

大数据 2023-12-20 人工智能

990阅读

ggerganov/llama.cpp 编译

ggerganov/llama.cpp - 编译出main可执行程序依赖以下的源代码文件如果想在 Windows 系统编译出 llama.cpp 项目（这个是github上的仓库， ggerganov/llama.cpp ），需要在Visual St...

大数据 2023-12-20 人工智能

1161阅读

LLM实践-在Colab上使用免费T4 GPU进行Chinese-Llama-2-7b-4bit推理

一、配置环境 1、打开colab，创建一个空白notebook，在[修改运行时环境]中选择15GB显存的T4 GPU. 2、pip安装依赖python包 !pip install --upgrade accelerate !pip ins...

人工智能 2023-12-20 人工智能

855阅读

【EMNLP 2023】面向垂直领域的知识预训练语言模型

近日，阿里云人工智能平台PAI与华东师范大学数据科学与工程学院合作在自然语言处理顶级会议EMNLP2023上发表基于双曲空间和对比学习的垂直领域预训练语言模型。通过比较垂直领域和开放领域知识图谱数据结构的不同特性，发现在垂直领域的图谱结构具有全局稀疏，局部...

生成式AI 2023-12-20 人工智能

881阅读

copilot 逆向

原文： copilot-explorer | Hacky repo to see what the Copilot extension sends to the server 对我来说，Github Copilot 极其有用。它经常能神奇地读懂我的...

人工智能 2023-12-20 人工智能

882阅读

前OpenAI首席科学家Ilya: 只要能够预测下一个token，人类就能达到AGI

近日，Nature将前OpenAI首席科学家Ilya Sutskever评为「2023年10大科学人物」。这位刚刚因为OpenAI巨变而远离聚光灯的「AI技术灯塔」，似乎并没有做好准备回到公众视野之中。 Nature在介绍他的长文中说「Ilya拒绝了N...

生成式AI 2023-12-20 人工智能

812阅读

大语言模型训练数据常见的4种处理方法

本文分享自华为云社区《浅谈如何处理大语言模型训练数据之一常见的数据处理方法》，作者：码上开花_Lancer。大语言模型训练需要数万亿的各类型数据。如何构造海量“高质量”数据对于大语言模型的训练具有至关重要的作用。虽然，截止到2023 年9 月为止，还...

人工智能 2023-12-20 人工智能

1347阅读

文心一言大模型应用开发入门

大数据 2023-12-20 人工智能

1311阅读

【网安AIGC专题10.11】①代码大模型的应用：检测、修复②其安全性研究：模型窃取攻击（API和网页接口）数据窃取攻击对抗攻击（用途：漏洞隐藏）后门攻击（加触发器+标签翻转）

代码大模型的应用及其安全性研究写在最前面一些想法大型模型输出格式不受控制的解决方法大模型介绍（很有意思）GPT 模型家族的发展 Chatgpt 优点缺点 GPT4 其他模型补充：self-instruct合成数据 Cod...

人工智能 2023-12-19 人工智能

888阅读

大语言模型之四-LlaMA-2从模型到应用

最近开源大语言模型LlaMA-2火出圈，从huggingface的Open LLM Leaderboard开源大语言模型排行榜可以看到LlaMA-2还是非常有潜力的开源商用大语言模型之一，相比InstructGPT，LlaMA-2在数据质量、培训技术、能力...

大数据 2023-12-19 人工智能

1620阅读

「X」Embedding in NLP｜神经网络和语言模型 Embedding 向量入门

在「X」Embedding in NLP 进阶系列中，我们介绍了自然语言处理的基础知识——自然语言中的 Token、N-gram 和词袋语言模型。今天，我们将继续和大家一起“修炼”，深入探讨神经网络语言模型，特别是循环神经网络，并简要了解如何生成 Embe...

AIGC 2023-12-19 人工智能

869阅读

基于onnx模型和onnx runtime推理stable diffusion

直接用diffusers的pipeline: import os from diffusers import OnnxStableDiffusionPipeline, OnnxRuntimeModel from diffusers import DDIM...

人工智能 2023-12-19 人工智能

1115阅读

使用Llama.cpp在CPU上快速的运行LLM

大型语言模型(llm 正变得越来越流行，但是它需要很多的资源，尤其时GPU。在这篇文章中，我们将介绍如何使用Python中的llama.cpp库在高性能的cpu上运行llm。大型语言模型(llm 正变得越来越流行，但是它们的运行在计算上是非常消耗资...

生成式AI 2023-12-19 人工智能

847阅读

借AI之势，打破创意与想象的边界

IMMENSE、36氪｜作者 01 “未来是属于AI的” 3月2日，内容创作圈大地震。就在3月2日凌晨，OpenAI宣布开放ChatGPT本体模型API，其价格为1k tokens/$0.002。也就是说，从这一天开始，任何企业都能让ChatGPT...

人工智能 2023-12-18 人工智能

975阅读

基于 NNCF 和 Optimum 面向 Intel CPU 对 Stable Diffusion 优化

基于隐空间的扩散模型 (Latent Diffusion Model ，是解决文本到图片生成问题上的颠覆者。Stable Diffusion 是最著名的一例，广泛应用在商业和工业。Stable Diffusion 的想法简单且有效: 从噪声向量开始，多次去...

生成式AI 2023-12-18 人工智能

951阅读

保姆级讲解 Stable Diffusion

文章目录整体代码 unet解析 self.input_blocks middle_blocks self.output_blocks 保姆级讲解 Stable Diffusion： https://mp.weixin.qq.c...

大数据 2023-12-18 人工智能

833阅读

【LLM】大语言模型学习之LLAMA 2：Open Foundation and Fine-Tuned Chat Model

大语言模型学习之LLAMA 2：Open Foundation and Fine-Tuned Chat Model 快速了解预训练预训练模型评估微调有监督微调（SFT）人...

大数据 2023-12-18 人工智能

1008阅读

大模型那么火，教你一键Modelarts玩转开源LlaMA(羊驼)大模型

图1.1 GPT-2 模型结构关于训练集，其来源都是公开数据集，无任何定制数据集，保证了其工作与开源兼容和可复现。整个训练数据集在 token 化之后大约包含 1.4T 的 token。其中，LLaMA-65B 和 LLaMA-33B 是在 1.4万亿...

AIGC 2023-12-18 人工智能

988阅读

安装LLaMA-Factory微调chatglm3，修改自我认知

安装git clone https://github.com/hiyouga/LLaMA-Factory.git conda create -n llama_factory python=3.10 conda activate llama_factory...

大数据 2023-12-18 人工智能

1075阅读

GPT-4V都搞不明白的未来推理有解法了！来自华科大&上科大

多模态大语言模型展现了强大的图像理解和推理能力。但要让它们基于当前观测来对未来事件进行预测推理仍然非常困难。即便是当前最强大的GPT-4V（如下图所示），也无法很好地解决这一问题。 △ GPT-4V的错误案例现在，华科大和上科大团队提出了一个赋予...

生成式AI 2023-12-18 人工智能

878阅读

Stable Diffusion模型运算量分析

准备模型的参数量和计算量参考: ThanatosShinji/onnx-tool: ONNX model's shape inference and MACs(FLOPs counting. (github.com 这四个模型就是Stable Dif...

人工智能 2023-12-18 人工智能

1787阅读

Llama-2大模型本地部署研究与应用测试

最近在研究自然语言处理过程中，正好接触到大模型，特别是在年初chatgpt引来的一大波AIGC热潮以来，一直都想着如何利用大模型帮助企业的各项业务工作，比如智能检索、方案设计、智能推荐、智能客服、代码设计等等，总得感觉相比传统的搜索和智能化...

大数据 2023-12-18 人工智能

1025阅读

huggingface transformers库中LlamaForCausalLM

新手入门笔记。 LlamaForCausalLM 的使用示例，这应该是一段推理代码。 from transformers import AutoTokenizer, LlamaForCausalLM model = LlamaForCausalLM....

人工智能 2023-12-17 人工智能

946阅读

基于 NNCF 和 Optimum 面向 Intel CPU 对 Stable Diffusion 优化

? 宝子们可以戳阅读原文查看文中所有的外部链接哟！基于隐空间的扩散模型 (Latent Diffusion Model ，是解决文本到图片生成问题上的颠覆者。Stable Diffusion 是最著名的一例，广泛应用在商业和工...

人工智能 2023-12-17 人工智能

915阅读

Stable Diffusion Webui源码剖析

1、关键python依赖（1）xformers：优化加速方案。它可以对模型进行适当的优化来加速图片生成并降低显存占用。缺点是输出图像不稳定，有可能比不开Xformers略差。（2）GFPGAN：它是腾讯开源的人脸修复算法，利用预先训练号的面部GAN...

大数据 2023-12-17 人工智能

1344阅读

LLaMA-META发布单卡就能跑的大模型

2023年2月25日，Meta使用2048张A100 GPU，花费21天训练的Transformer大模型LLaMA开源了。 1.4T tokenstakes approximately 21 days 以下是觉得论文中重要的一些要点 1）...

大数据 2023-12-17 人工智能

887阅读

尝试 Stable Diffusion（通过Google Colab）

目标学习通过Google Colab使用 Stable Diffusion 生成图像。主要参考资料：Get Started With Stable Diffusion (Free in Google Colab for AI Generated...

大数据 2023-12-17 人工智能

961阅读

走在GPT 4.5前面？3D、视频直接扔进对话框，大模型掌握跨模态推理

给你一首曲子的音频和一件乐器的 3D 模型，然后问你这件乐器能否演奏出这首曲子。你可以通过听觉来辨认这首曲子的音色，看它是钢琴曲还是小提琴曲又或是来自吉他；同时用视觉识别那是件什么乐器。然后你就能得到问题的答案。但语言模型有能力办到这一点吗？实际上，...

大数据 2023-12-17 人工智能

870阅读

源代码is all you need！7B代码小模型同尺寸无敌，性能媲美ChatGPT和谷歌Gemini

Hugging Face 技术负责人 Philipp Schmid 表示：“代码自动补全工具，如 GitHub Copilot，已被超过一百万开发者使用，帮助他们的编码速度提高了 55%。看到像 Magicoder 和 OSS-INSTRUCT 这样的开...

AIGC 2023-12-17 人工智能

1016阅读

windows10搭建llama大模型

背景随着人工时代的到来及日渐成熟，大模型已慢慢普及，可以为开发与生活提供一定的帮助及提升工作及生产效率。所以在新的时代对于开发者来说需要主动拥抱变化，主动成长。 LLAMA介绍 llama全称：Large...

AIGC 2023-12-17 人工智能

935阅读

【文生图】Stable Diffusion XL 1.0模型Full Fine-tuning指南（U-Net全参微调）

文章目录前言重要教程链接以海报生成微调为例总体流程数据获取 POSTER-TEXT AutoPoster CGL-Dataset PKU PosterLayout PosterT80K Movie & TV Series...

大数据 2023-12-17 人工智能

1005阅读

Mistral携微软引爆「小语言模型」潮！Mistral中杯代码能力完胜GPT-4，成本暴降2/3

最近，「小语言模型」忽然成为热点。本周一，刚刚完成4.15亿美元融资的法国AI初创公司Mistral，发布了Mixtral 8x7B模型。这个开源模型尽管尺寸不大，小到足以在一台内存100GB以上的电脑上运行，然而在某些基准测试中却能和GPT-3....

人工智能 2023-12-17 人工智能

844阅读

最强文生图跨模态大模型：Stable Diffusion

文章目录一、概述二、Stable Diffusion v1 & v2 2.1 简介 2.2 LAION-5B数据集 2.3 CLIP条件控制模型 2.4 模型训练三、Stable Diffusion 发展 3.1 图形界面...

大数据 2023-12-17 人工智能

1818阅读

AIGC系列之：CLIP和OpenCLIP

目录模型背景 CLIP模型介绍相关资料原理和方法 Image Encoder Text Encoder 对比学习预训练 Zero Shot预测优势和劣势总结 OpenClip模型介绍相关资料原理结果用法...

人工智能 2023-12-17 人工智能

3170阅读

本地推理,单机运行,MacM1芯片系统基于大语言模型C++版本LLaMA部署“本地版”的ChatGPT

OpenAI公司基于GPT模型的ChatGPT风光无两，眼看它起朱楼，眼看它宴宾客，FaceBook终于坐不住了，发布了同样基于LLM的人工智能大语言模型LLaMA，号称包含70亿、130亿、330亿和650亿这4种参数规模的模型，参数是指神经网络中的权重...

大数据 2023-12-16 人工智能

782阅读

论文笔记--Llama 2: Open Foundation and Fine-Tuned Chat Models

论文笔记--Llama 2: Open Foundation and Fine-Tuned Chat Models 1. 文章简介 2. 文章概括 3 文章重点技术 3.1 预训练Pretraining 3.1.1 预训练细节 3.1.2...

AIGC 2023-12-16 人工智能

1081阅读

LLM - Chinese-Llama-2-7b 初体验

目录一.引言二.模型下载三.快速测试四.训练数据五.总结一.引言自打 LLama-2 发布后就一直在等大佬们发布 LLama-2 的适配中文版，也是这几天蹲到了一版由 LinkSoul 发布的 Chinese-Llam...

生成式AI 2023-12-16 人工智能

951阅读

LLaMA模型之中文词表的蜕变

在目前的开源模型中，LLaMA模型无疑是一颗闪亮的⭐️，但是相对于ChatGLM、BaiChuan等国产大模型，其对于中文的支持能力不是很理想。原版LLaMA模型的词表大小是32K，中文所占token是几百个左右，这将会导致中文的编解码效率低。在将LL...

生成式AI 2023-12-16 人工智能

1172阅读