code 第18页 - AIGC资讯

一文速览Llama 3及其微调：从如何把长度扩展到100万到如何微调Llama3 8B

前言 4.19日凌晨正准备睡觉时，突然审稿项目组的文弱同学说：Meta发布Llama 3系列大语言模型了，一查，还真是本文以大模型开发者的视角，基于Meta官方博客的介绍：Introducing Meta Llama 3: The most capa...

AIGC 2024-05-29 人工智能

1959阅读

OpenAI 开源的免费 AI 语音转文字工具 - Whisper，一步一步本地部署运行

Whisper 是 OpenAI 研发的一个通用的语音识别模型，可以把语音转为文本。它在大量多样化的音频数据集上进行训练，同时还是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。一、使用场景语音 => 文字是一个非常实用的功能，...

生成式AI 2024-05-29 人工智能

1957阅读

AI绘画进阶工具ComfyUI 傻瓜整合包安装教程！模型共享，一键安装！

哈喽大家好，今天给大家分享一下AI绘画工具Stable Diffusion的另一种UI界面，常见的有：窗口式界面的WebUI 节点式工作流的ComfyUI ComfyUI更加进阶一些，是一个节点式工作流的AI绘画界面，它高度可定制、自定义编辑Ai生...

人工智能 2024-05-29 人工智能

2677阅读

通俗易懂的Stable Diffusion模型结构介绍

目录 SD的发展历程 SD 模型的网络结构 ClipText 文本编码器文本向量输入Unet VAE模型总结图 SD的发展历程 Stab...

AIGC 2024-05-29 人工智能

1345阅读

Stable Diffusion基础：ControlNet之重新上色（黑白照片换新颜）

本文给大家分享 Stable Diffusion 的基础能力：ControlNet 之重新上色。这是一个最近新上的 ControlNet 模型，它可以识别图像中的不同区域，并使用不同的颜色重新绘制它们。安装 ControlNet 安装工欲善其...

AIGC 2024-05-29 人工智能

998阅读

ollama-python-Python快速部署Llama 3等大型语言模型最简单方法

ollama介绍在本地启动并运行大型语言模型。运行Llama 3、Phi 3、Mistral、Gemma和其他型号。 Llama 3 Meta Llama 3 是 Meta Inc. 开发的一系列最先进的模型，提供8B和70B参数大小（预训练或...

大数据 2024-05-29 人工智能

1455阅读

Python+whisper.cpp纯本地化语音转文字

想要用Python+whisper.cpp实现纯本地化语音转文字，我的操作环境如下： MacOS Ventura 13.0 Python3.7 conda PyAudio 一开始打算用PyAudio，解决了头文件找不到的问题（网上教程很多）之后，仍...

生成式AI 2024-05-29 人工智能

1082阅读

MIT最新力作：用GPT-3.5解决时间序列异常检测问题

今天给大家介绍一篇MIT上周发表的文章，使用GPT-3.5-turbo解决时间序列异常检测问题，初步验证了LLM在时间序列异常检测中的有效性。整个过程没有进行finetune，直接使用GPT-3.5-turbo进行异常检测，文中的核心是如何将时间序列转换...

生成式AI 2024-05-29 人工智能

1021阅读

一文教你如何调用Ascend C算子

本文分享自华为云社区《一文教你如何调用Ascend C算子》，作者：昇腾CANN。 Ascend C是CANN针对算子开发场景推出的编程语言，原生支持C和C++标准规范，兼具开发效率和运行性能。基于Ascend C编写的算子程序，通过编译器编译和运行时...

生成式AI 2024-05-29 人工智能

959阅读

Stable Diffusion AI绘画：从提示词到模型出图的全景指南

? 个人网站:【摸鱼游戏】【神级代码资源网站】【工具大全】 ? 一站式轻松构建小程序、Web网站、移动应用：?注册地址 ? 基于Web端打造的：?轻量化工具创作平台 ? 想寻找共同学习交流，摸鱼划水的小伙伴，请点击【全栈技术交流群】 Stable...

大数据 2024-05-29 人工智能

857阅读

【AIGC】Mac Intel 本地 LLM 部署经验汇总（CPU Only）

书接上文，在《【AIGC】本地部署 ollama(gguf 与项目整合》章节的最后，我在 ollama 中部署 qwen1_5-14b-chat-q4_k_m.gguf 预量化模型，在非 Stream 模式下需要 89 秒才完成一轮问答，响应速度实在是太...

人工智能 2024-05-29 人工智能

1718阅读

使用文心一言进行图像内容理解

接上篇文章，这期使用文心一言图像识别API，对本地图片以及在线视频图片进行内容理解。该请求用于图像内容理解，支持输入图片和提问信息，可对输入图片进行理解，输出对图片的一句话描述，同时可针对图片内的主体/文字等进行检测与识别，支持返回图片内多主体/文字的...

生成式AI 2024-05-29 人工智能

2157阅读

比较AI编程工具Copilot、Tabnine、Codeium和CodeWhisperer

主流的几个AI智能编程代码助手包括Github Copilot、Codeium、Tabnine、Replit Ghostwriter和Amazon CodeWhisperer。你可能已经尝试过其中的一些，也可能还在不断寻找最适合自己或公司使用的编程助手...

AIGC 2024-05-29 人工智能

1484阅读

探秘Faster Whisper：一款加速 Whisper 模型训练的高效工具

探秘Faster Whisper：一款加速 Whisper 模型训练的高效工具项目地址:https://gitcode.com/SYSTRAN/faster-whisper 在自然语言处理（NLP）领域，Transformer架构的模型如Whis...

生成式AI 2024-05-28 人工智能

1205阅读

图像生成模型浅析（Stable Diffusion、DALL-E、Imagen）

目录前言 1. 速览图像生成模型 1.1 VAE 1.2 Flow-based Model 1.3 Diffusion Model 1.4 GAN 1.5 对比速览 2. Diffusion Model 3. Stable Diffusi...

AIGC 2024-05-28 人工智能

926阅读

不影响输出质量还能追踪溯源，「大模型无偏水印」入选ICLR 2024 Spotlight

本文通讯作者为马里兰大学计算机系的博士生胡正冕，其导师为 Heng Huang。他的主要研究方向是采样与机器学习理论，曾在ICML、NeurIPS、ICLR等顶级会议上发表多篇论文。邮箱: huzhengmian@gmail.com 随着大语言模型（LL...

人工智能 2024-05-28 人工智能

1085阅读

国产开源Sora上新：全面支持国产AI算力，可用ReVideo视频编辑，北大-兔展团队出品

北大-兔展联合发起的Sora开源复现计划Open-Sora-Plan，今起可以生成最长约21秒的视频了! 生成的视频水平，如下展示。先看这个长一点的，9.2s: 当然了，老规矩，这一次的所有数据、代码和模型，继续开源。目前，Open-Sora-Plan在...

人工智能 2024-05-28 人工智能

856阅读

Llama 3 五一超级课堂中实践llama3的部署，微调，量化优化部署学习总结：第一部分llama3部署

本次学习分享基于Llama3-Tutorial（Llama 3 超级课堂）分享，git地址如下 GitHub - SmartFlowAI/Llama3-Tutorial: Llama3-Tutorial（XTuner、LMDeploy、OpenCompa...

大数据 2024-05-28 人工智能

905阅读

Llama 3 模型家族构建安全可信赖企业级AI应用之使用 Llama Guard 保护大模型对话（八）

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

大数据 2024-05-28 人工智能

917阅读

一文读懂本地运行 LLM 的优秀实践方法

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM -常见的本地运行 LLM 方法。众所周知，如今使用 ChatGPT 等大型模型工具变得异常简单，只需通过浏览器在线访问即可。然而，需要注意的是，...

大数据 2024-05-28 人工智能

840阅读

苹果的“Greymatter 项目”将是普通用户在日常中可使用的AI工具

在即将到来的苹果全球开发者大会（WWDC）上，苹果公司将重点展示其在人工智能(AI 领域的最新进展。知情人透露，苹果的焦点将是普通用户在日常生活中可以使用的AI工具。苹果的新计划被称为“Project Greymatter”，旨在将一系列AI工具整...

生成式AI 2024-05-28 人工智能

795阅读

Llama 3 实践教程（InternStudio 版）

文章目录 Llama3本地 Web Demo部署初始环境配置下载模型 Web Demo 部署 XTuner 微调 Llama3 个人小助手自我认知训练数据集准备 XTuner配置文件准备训练模型推理验证 XTuner微调Lla...

人工智能 2024-05-28 人工智能

1299阅读

AIGC系列之：DDPM原理解读（简单易懂版）

目录 DDPM基本原理 DDPM中的Unet模块 Unet模块介绍 Unet流程示意图 DownBlock和UpBlock MiddleBlock 文生图模型的一般公式总结本文部分内容参考文章：https://ju...

AIGC 2024-05-28 人工智能

1291阅读

LLaMA-Factory+qwen多轮对话微调测评

目录训练的时间和效果数据准备数据样例数据配置环境搭建模型微调训练模型预测运行成功的web UI LLaMA-Factory地址：https://github.com/hiyouga/LLaMA-Factory/blo...

大数据 2024-05-27 人工智能

1602阅读

Stable Diffusion XL优化终极指南

如何在自己的显卡上获得SDXL的最佳质量和性能，以及如何选择适当的优化方法和工具，这一让GenAI用户倍感困惑的问题，业内一直没有一份清晰而详尽的评测报告可供参考。直到全栈开发者Félix San出手。在本文中，Félix介绍了相关...

大数据 2024-05-27 人工智能

1538阅读

手把手教你如何开通GitHub Copilot并且在vscode中使用

很多小伙伴应该已经知道Copilot的鼎鼎大名了，也有一些白嫖怪白嫖了3个月免费试用期后找不到续费的渠道，今天就给大家献上一篇续费/开通Copilot的文章； 1.首先登录git: git; 以及fomepay 2.点击头像->Copil...

人工智能 2024-05-27 人工智能

871阅读

Hinton揭秘Ilya成长历程：Scaling Law是他学生时代就有的直觉

2003年夏天的一个周日，AI教父Hinton在多伦多大学的办公室里敲代码，突然响起略显莽撞的敲门声。门外站着一位年轻的学生，说自己整个夏天都在打工炸薯条，但更希望能加入Hinton的实验室工作。 Hinton问，你咋不预约呢？预约了我们才能好好谈谈。...

大数据 2024-05-27 人工智能

872阅读

多模态预训练模型在 OPPO 端云场景的落地实践

一、端侧图文检索技术研究 1. 解决了什么问题？首先来介绍图文检索技术。以前在手机端相册搜索照片，都是基于标签来搜索。从 CLIP 模型出现后开始做自然语言搜索。目前正在解决端侧性能、搜索效果、安全等问题。技术难度并不大，重点在于提高搜索速度。并...

生成式AI 2024-05-27 人工智能

958阅读

普通人如何通过AIGC逆风翻盘？

终身学习: 利用AI辅助的在线教育平台,如Coursera、edX、Khan Academy等,学习新技能或提升现有技能。尝试使用AI驱动的语言学习应用,如Duolingo、Rosetta Stone等,提高语言能力。探索AI辅助的编程学习平台...

大数据 2024-05-27 人工智能

924阅读

【带文字的图像生成-附开源代码】AIGC 如何在图像中准确生成文字？字体篇（上）

文字图像生成是什么？ “文字图像生成（Text-image generation）”即生成带有指定文字的图像。如下图所示，市面常见的通用文生图很难准确地生成带有指定文字的图像。文字图像生成也被称为文本渲染（Text rendering）。为什么重要？...

AIGC 2024-05-27 人工智能

1603阅读

港大字节提出多模态大模型新范式，模拟人类先感知后认知，精确定位图中物体

当前，多模态大模型（MLLM）在多项视觉任务上展现出了强大的认知理解能力。然而大部分多模态大模型局限于单向的图像理解，难以将理解的内容映射回图像上。比如，模型能轻易说出图中有哪些物体，但无法将物体在图中准确标识出来。定位能力的缺失直接限制了多模态...

AIGC 2024-05-27 人工智能

867阅读

CoT提出者Jason Wei：大模型评估基准的「七宗罪」

在 CV 领域，研究者一直把李飞飞等人创建的 ImageNet 奉为模型在下游视觉任务中能力的试金石。在大模型时代，我们该如何评估 LLM 性能？现阶段，研究者已经提出了诸如 MMLU、GSM8K 等一些评估基准，不断有 LLM 在其上刷新得分。但这...

生成式AI 2024-05-27 人工智能

805阅读

LLaMA-Factory微调LLama2

LLaMA-Factory(0.6.2版本微调LLama2 1.下载安装 git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory pip install -e...

生成式AI 2024-05-27 人工智能

1059阅读

百度文心一言（ERNIE bot）API接入Android应用

百度文心一言（ERNIE bot）API接入Android应用实践 - 拾一贰叁 - 博客园 (cnblogs.com 需要完整代码的话：https://gitee.com/liyizhe2002/we-are-speakers Preface:...

人工智能 2024-05-27 人工智能

900阅读

一文深度剖析 ColBERT

近年来，向量搜索领域经历了爆炸性增长，尤其是在大型语言模型（LLMs）问世后。学术界开始重点关注如何通过扩展训练数据、采用先进的训练方法和新的架构等方法来增强 embedding 向量模型。在之前的文章中，我们已经深入探讨了各种类型的 embeddin...

大数据 2024-05-27 人工智能

915阅读

AI智能体｜使用扣子Coze创建AI绘画工作流

大家好，我是无界生长。关注微信公众号：无界生长，后台发送暗号“C001”加入组织今天分享下如何使用Coze（扣子）创建AI绘画工作流，为后续通过Coze创建AI绘画助手做铺垫，学会了的话，欢迎分享转发！插件介绍扣子Coze平台集成...

生成式AI 2024-05-27 人工智能

8062阅读

手撕Llama3第1层: 从零开始实现llama3

一、Llama3的架构在本系列文章中，我们从头开始实现llama3。 Llama3的整体架构：图片 Llama3的模型参数：让我们来看看这些参数在LlaMa 3模型中的实际数值。图片 [1] 上下文窗口（context-window）在实例化Lla...

人工智能 2024-05-27 人工智能

1935阅读

为何说小语言模型是AI界的下一大热门？

译者 | 布加迪审校 | 重楼在AI领域，科技巨头们一直在竞相构建越来越庞大的语言模型，如今出现了一个令人惊讶的新趋势：小就是大。随着大语言模型（LLM）方面的进展出现了停滞的迹象，研究人员和开发人员日益开始将注意力转向小语言模型（SLM）。这种紧凑...

生成式AI 2024-05-27 人工智能

837阅读

本地环境运行Llama 3大型模型：可行性与实践指南

简介： Llama 是由 Meta（前身为 Facebook）的人工智能研究团队开发并开源的大型语言模型（LLM），它对商业用途开放，对整个人工智能领域产生了深远的影响。继之前发布的、支持4096个上下文的Llama 2模型之后，Meta 进一步推出了性...

AIGC 2024-05-27 人工智能

1191阅读

AI绘画之网上大火的 “隐藏字” 效果怎么制作？只需 5 步教会你！

大家好，我是灵魂画师向阳一、什么是“隐藏字”？废话不多说，上图！我不说，你能看出来这张图片有字吗？很多人可能觉得不可思议，这张图哪来的字啊？就一张正常的图而已。而有些人可能依稀觉得是有文字的，但是又说不出来到底是什么。让我们换种...

生成式AI 2024-05-27 人工智能

1349阅读

MacOS使用ollama部署codellama+openui以及llama.cpp部署

现在AI这么火，你是不是也渴望能够在本地部署并运行属于自己的大模型，然而，高昂的硬件成本又往往成了一大障碍，限制了你继续在AI领域去探索和创新。如果告诉你，无需换电脑，无需额外花钱买GPU或换显卡，你现在的电脑就可以本地跑一些大模型，那将是多么酷的一...

大数据 2024-05-27 人工智能

1677阅读

2023 re:Invent | Amazon Q 与 Amazon CodeWhisperer 面向企业开发者提效利器

2023 年，以 GPT 为代表的生成式 AI 引爆了新一轮技术热潮，短短一年的时间内，生成式 AI 已经成为科技世界发展的核心。作为云计算的行业风向标盛会 re ，本届: Invent 全球大会紧跟生成式 AI 浪潮，推出名为“ Amazon Q ”的生...

人工智能 2024-05-26 人工智能

856阅读

Copilot Workspace是GitHub对人工智能驱动的软件工程的诠释

软件开发的未来是人工智能驱动的集成开发环境吗？至少GitHub 是这样想的。在今年初秋于旧金山举行的 GitHub Universe 年度大会之前，GitHub 发布了 Copilot Workspace，这是一种开发环境，利用 GitHub 所称的...

大数据 2024-05-26 人工智能

895阅读

AI大模型日报#0418：Stable Diffusion 3开放API、Meta新研究让AI Agent理解物理世界

导读：欢迎阅读《AI大模型日报》，内容基于Python爬虫和LLM自动生成。目前采用“文心一言”生成了每条资讯的摘要。标题: 微软刚发布了VASA-1 这个人工智能可以让单张图像具有生动的说话和歌唱能力摘要: 微软发布了VASA-1人工智能，...

生成式AI 2024-05-26 人工智能

979阅读

探索 Obsidian Copilot：智能笔记的新里程碑

探索 Obsidian Copilot：智能笔记的新里程碑项目地址:https://gitcode.com/logancyang/obsidian-copilot 项目简介 Obsidian Copilot 是一个创新的插件，为流行的 markdo...

人工智能 2024-05-26 人工智能

1533阅读

AI绘图Stable Diffusion中关键技术：U-Net的应用

你好，我是郭震引言在人工智能和深度学习的迅猛发展下，图像生成技术已经取得了令人瞩目的进展。特别是，Stable Diffusion模型以其文本到图像的生成能力吸引了广泛关注。本文将深入探讨Stable Diffusion中一个关键技术——...

AIGC 2024-05-26 人工智能

1236阅读

深入探索：基于CodeIgniter框架的爬虫应用开发

在当今数据驱动的时代，网络爬虫作为一种高效的数据采集工具，正日益受到开发者们的青睐。而在众多开发框架中，CodeIgniter以其简洁、轻量且易于上手的特点脱颖而出，成为不少开发者构建爬虫应用的首选。本文将详细探讨基于CodeIgniter框架的爬虫应用开...

人工智能 2024-05-26 大数据

884阅读

Llama 3大模型发布！快速体验推理及微调

Meta，一家全球知名的科技和社交媒体巨头，在其官方网站上正式宣布了一款开源的大型预训练语言模型——Llama-3。据了解，Llama-3模型提供了两种不同参数规模的版本，分别是80亿参数和700亿参数。这两种版本分别针...

大数据 2024-05-26 人工智能

1141阅读

微调llama 3 — PEFT微调和全量微调

1. llama 3 微调基础 1.1 llama 3 简介官方blog llama 3 目前有两个版本：8B版和70B版。8B版本拥有8.03B参数，其尺寸较小，可以在消费者硬件上本地运行。 meta-llama/Meta-Llama-3-...

大数据 2024-05-25 人工智能

1560阅读

AIGC——ComfyUI工作流搭建、导入与常用工作流下载

工作流 ComfyUI工作流是一个基于图形节点编辑器的工作流程，通过拖拽各种节点到画布上，连接节点之间的关系，构建从加载模型到生成图像的流程。每个节点代表一个与Stable Diffusion相关的模型或功能，节点之间通过连线传递图片信息。工作流程始于...

生成式AI 2024-05-25 人工智能

2860阅读