code 第14页 - AIGC资讯

[论文阅读] (32)南洋理工大学刘杨教授——网络空间安全和AIGC整合之道学习笔记及强推（InForSec）

首先祝大家五一节快乐！《娜璋带你读论文》系列主要是督促自己阅读优秀论文及听取学术讲座，并分享给大家，希望您喜欢。由于作者的英文水平和学术能力不高，需要不断提升，所以还请大家批评指正，非常欢迎大家给我留言评论，学术路上期待与您前行，加油。本文是南洋理工大...

AIGC 2024-06-20 人工智能

1163阅读

LLM记录：五一 Llama 3 超级课堂

LLM记录：五一 Llama 3 超级课堂想玩大模型，自己又没那个环境，参加五一 Llama 3 超级课堂，简单记录一下llama3-8b的相关体验，实在是邀请不到人，还好后面开放了24G显存，好歹模型能跑起来了，只能说感谢大佬！ Llama 3...

AIGC 2024-06-20 人工智能

847阅读

InsCode Stable Diffusion使用教程（非常详细）从零基础入门到精通，看完这一篇就够了_outpainting 模型下载

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7 深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新HarmonyOS鸿蒙...

人工智能 2024-06-20 人工智能

1035阅读

LLaMA 3 源码解读-大语言模型5

本来不是很想写这一篇，因为网上的文章真的烂大街了，我写的真的很有可能没别人写得好。但是想了想，创建这个博客就是想通过对外输出知识的方式来提高自身水平，而不是说我每篇都能写得有多好多好然后吸引别人来看。那作为对整个合集内容的完善，这篇博客会解析现在最火的LL...

AIGC 2024-06-20 人工智能

1142阅读

Copilot本地部署：（1）Github学生认证

（1）Github学生认证 a.在github中补全必要信息 ①登录github账号后（没有账号可用邮箱自行注册），在https://github.com/settings/billing/payment_information中，填写好必填字段（...

人工智能 2024-06-20 人工智能

1351阅读

vscode copilot 插件连接问题解决方案

问题描述 vscode 的copilot每隔一段时间就会无法使用，每次出现的报错可能都不一样，这里记录一个可行的解决方案，值得尝试。解决方案搜索框搜索控制面板并打开第一步-打开控制面板 2. 打开网络和Int...

生成式AI 2024-06-19 人工智能

1666阅读

【全网瞩目】最强文生图模型，Stable Diffusion 3技术报告解禁

12号，终于在Hugging Face上出现了 Stable Diffusion 3 Medium。没错，正如他所承诺的，最强文生图模型真的开源了。而且此次开源不仅是以SD2的比较下性能得到了更好的升级，同时也向我们展示了最前沿的DiT技术——MMDiT。...

生成式AI 2024-06-19 人工智能

1243阅读

深入浅出完整解析Stable Diffusion XL（SDXL）核心基础知识

原文：深入浅出完整解析Stable Diffusion XL（SDXL）核心基础知识 Rocky的公众号：WeThinkIn Rocky的知乎：Rocky Ding 更多AI行业干货内容欢迎关注Rocky的CSDN、知乎、公众号～码字不易，希望大家...

大数据 2024-06-18 人工智能

5008阅读

Stable Diffusion复现——基于 Amazon SageMaker 搭建文本生成图像模型(3)

深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上鸿蒙开发知识点，真正体系化！...

大数据 2024-06-18 人工智能

1030阅读

【AI原理解析】— Meta Llama-3模型

目录一、模型架构 Transformer架构解码器（Decoder-only）设计 Group Query Attention (GQA 技术二、参数与训练参数规模训练数据集训练过程三、技术特点四、性能提升推理能力...

生成式AI 2024-06-18 人工智能

1293阅读

Whisper-AT：抗噪语音识别模型（Whisper）实现通用音频事件标记（Audio Tagger）

本文介绍一个统一音频标记（Audio Tagger）和语音识别（ASR）的模型：Whisper-AT，通过冻结Whisper的主干，并在其之上训练一个轻量级的音频标记模型。Whisper-AT在额外计算成本不到1%的情况下，可以在单次前向传递...

大数据 2024-06-18 人工智能

1440阅读

AI日报：新王诞生！Runway重磅发布Gen-3 Alpha；Luma AI发布Extend功能；DeepSeek又开源了一个模型；ElevenLabs可为视频自动配音

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、AI视频王者回归！Runway...

大数据 2024-06-18 人工智能

1817阅读

变分自编码器（VAE）在AIGC中的应用及其技术解析

本文收录于专栏：精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践...

人工智能 2024-06-18 人工智能

1122阅读

Llama Factory 笔记

本地环境：cuda 11.7 torch2.1.0 项目文件结构： 1. 项目文件结构：如果利用Llama Factory 进行微调主要会用到 LLama-Factory/src 中的文件 2. src 下的目录结构本地推理的...

生成式AI 2024-06-18 人工智能

1688阅读

利用Python与Whisper革新视频翻译：打造高精度字幕翻译流程。

实现流程需要使用以下的工具。 1.python,需要自行安装， 2.python的音视频处理库moviepy安装 pip install moviepy 3.Whisper语音识别，在我之前的文章中有：Whisper语音识别安装教程。 4.文字翻...

人工智能 2024-06-18 人工智能

1204阅读

AIGC实战测评：助力软件开发的智能神器

目录 AIGC实战测评：助力软件开发的智能神器引言 AIGC简介 AIGC的功能与优势智能代码生成代码质量保证快速问题解决知识库与API集成实战演示总结 AIGC实战测评：助力软件开发的智能神器引言在软件开...

大数据 2024-06-18 人工智能

944阅读

MetaAI发布Llama 3模型：4000亿参数的AI新标杆

开源和闭源大战前几天，百度李彦宏说闭源才有意义。周鸿祎在哈佛论坛演讲上说，别听李彦宏胡说八道，没有开源就没有Linux，就没有今天的互联网，李彦宏自己都是借助开源的力量走到今天，现在反手说开源不好了？话音刚落，Meta这个奶妈就又开源了，我们又回...

大数据 2024-06-18 人工智能

1116阅读

DeepSeek-Coder-V2代码语言模型免费吗？AI编程辅导代码生成使用方法详细教程指南

DeepSeek-Coder-V2 是一个开源的Mixture-of-Experts (MoE 代码语言模型，性能与GPT4-Turbo相当，在代码特定任务上表现卓越。它在DeepSeek-Coder-V2-Base的基础上，通过 6 万亿token的高...

AIGC 2024-06-18 人工智能

2186阅读

推荐项目：Stable Diffusion WebUI - WD14 Tagger

推荐项目：Stable Diffusion WebUI - WD14 Tagger 项目地址:https://gitcode.com/toriato/stable-diffusion-webui-wd14-tagger 项目简介 Stable Dif...

AIGC 2024-06-18 人工智能

1174阅读

Stable Diffusion初体验——基于机器学习通过神经网络的强大AI平台

文章目录前言最新热门活动！！平台介绍一.创建应用 Stable Diffusion WebUI 初始化上传模型，VAE，lora 介绍sd模型，vae，lora模型进入应用文生图工作区调参区图生图结语小程序活...

生成式AI 2024-06-18 人工智能

901阅读

从论文中看AI绘画

个人博客:Sekyoro的博客小屋个人网站:Proanimer的个人网站主要看是看Diffusion Models,CLIP,ControlNet,IP-Adapter这种经典论文,尝试总结论文写作的一些方式以及图像生成模型的一些内在思想. 对于其中的数...

AIGC 2024-06-18 人工智能

1025阅读

AIGC |「多模态模型」系列之OneChart：端到端图表理解信息提取模型

论文标题: OneChart: Purify the Chart Structural Extraction via One Auxiliary Token 论文作者: Jinyue Chen, Lingyu Kong, Haoran Wei, Chen...

人工智能 2024-06-18 人工智能

1171阅读

一周SOTA：Meta 发布 Llama 3；Mistral AI 开源 Mixtral 8x22B；阿里开源代码模型CodeQwen1.5；面壁 MiniCPM 2.0 发布

文章目录一周SOTA：Meta 发布 Llama 3；Mistral AI 开源 Mixtral 8x22B；阿里开源代码模型CodeQwen1.5；面壁 MiniCPM 2.0 发布 1.Meta 震撼发布 Llama 3，8B、70B模...

大数据 2024-06-18 人工智能

1172阅读

LLaMA: Open and Efﬁcient Foundation Language Models

*背景已有的大模型越来越多的追求更大的参数量以实现更高的性能，但有研究表明更小的模型在更大的数据集上同样可以表现良好，因此本文旨在通过大量公开可用的数据集来训练一个语言模型同时取得SOTA的性能，模型大小从7B到65B，并且开源相关模型代码。(htt...

人工智能 2024-06-17 人工智能

1172阅读

stable-diffusion 3 体验部署流程（ComfyUI)

环境准备下载及简介 git clone https://huggingface.co/stabilityai/stable-diffusion-3-medium SD3 checkpoints： sd3_medium_incl_clips.s...

大数据 2024-06-17 人工智能

1501阅读

【LLM第二篇】stable diffusion扩散模型、名词解释

最近在整理大模型的相关资料，发现了几个名词，不是很懂，这里整理一下： stable diffusion（SD 模型：扩散模型（Diffusion model）的一种，主要用于生成高质量的图像，GAN的替代者，扩散模型通过一些列学习步骤生成数据，逐渐从...

人工智能 2024-06-17 人工智能

1367阅读

【亚马逊云新春特辑③】构生成式 AI 文生图工具之借助ControlNet进行AI绘画创作【使用OpenPose优化人物二维码】

文章目录 2.1 使用OpenPose优化人物二维码 1）数据及环境准备 2）导入骨架数据并启用OpenPose控制单元 3）导入二维码并生成美化后的二维码图片 2.1 使用OpenPose优化人物二维码在上一节体验到了使用...

人工智能 2024-06-17 人工智能

1152阅读

whisper使用

whisper使用 1. 直接调用语音识别 2. 语种识别 whisper.detect_language( 和whisper.decode( 3. 指定要识别的语种做语音识别 **whisper 源码的transcribe函数** 函数解...

生成式AI 2024-06-17 人工智能

1390阅读

100% 开源 Llama 编码助手：设置 Cody 和 VSCode

好吧，今天我有一些非常令人兴奋的事情要与大家分享！我们都知道，编码助手永久地改变了我们开发软件的方式，但 GPT-4 等高级法学硕士的高昂价格一直是许多人的绊脚石。但好消息是：成本不再是障碍！有了像 Code Llama 7B 这样的法学硕士，...

人工智能 2024-06-17 人工智能

1102阅读

区分stable diffusion中的通道数与张量维度

区分stable diffusion中的通道数与张量形状 1.通道数： 1.1 channel = 3 1.2 channel = 4 2.张量形状 2.1 3D 张量 2.2 4D 张量 2.2.1 通常 2.2.2 stable d...

生成式AI 2024-06-16 人工智能

1011阅读

Llama模型家族之Stanford NLP ReFT源代码探索（三）reft_model.py代码解析

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

AIGC 2024-06-16 人工智能

1039阅读

文心一言 VS 讯飞星火 VS chatgpt （225）-- 算法导论16.3 7题

七、推广赫夫曼算法，使之能生成三进制的码字(即码字由符号0、1、2组成，并证明你的算法能生成最优三进制码。如果要写代码，请用go语言。文心一言：推广赫夫曼算法以生成三进制码字需要对算法进行一定的修改，确保在每一步选择频率最低的三个节点进行合并...

生成式AI 2024-06-16 人工智能

919阅读

五分钟上手IoT小程序

五分钟上手IoT小程序 IoT小程序框架搭建开发环境首先安装NodeJs 安装NodeJs 验证安装成功安装cnpm 安装VSCode 开发IDE 下载开发IDE 安装开发IDE 安装框架脚手架下载模拟器创建工程项目应用...

大数据 2024-06-16 人工智能

991阅读

midjourney绘画，midjourney api接口国内如何对接

项目背景众所周知，Midjourney并没有提供任何的Api服务，但是基于Midjourney目前的行业龙头位置，很多企业以及个人会有相关的需求。TTApi平台基于Midjourney现有功能整理出一套完整的可集成性高的服务，如果你有类似的需求，那么恭...

人工智能 2024-06-16 人工智能

1033阅读

苹果解释 iOS 18 中的 AI 文本生成表情符号 Genmoji 工作原理

iOS 18 中的一项 Apple Intelligence 功能是 Genmoji，它允许 iPhone 用户通过 AI 根据文本输入生成全新的表情符号角色。根据 iOS 18 在 WWDC 会议上的介绍，Genmoji 看起来类似于传统的表情符号，但它...

人工智能 2024-06-16 人工智能

966阅读

github Copilot的使用总结

1. 代码建议和补全 GitHub Copilot 的基本使用涉及编写代码时的实时代码建议和补全。一旦你已经安装并配置好 GitHub Copilot 插件，你可以在支持的编辑器（如 Visual Studio Code）中开始使用 Copilot。以下...

生成式AI 2024-06-16 人工智能

990阅读

五一超级课堂---Llama3-Tutorial（Llama 3 超级课堂）---第三节llama 3图片理解能力微调（xtuner+llava版）

课程文档： https://github.com/SmartFlowAI/Llama3-Tutorial 课程视频： https://space.bilibili.com/3546636263360696/channel/collectiondetail?...

大数据 2024-06-16 人工智能

1103阅读

百度文心一言API4.0 Python调用ERNIE-4.0-8K详细教程

ERNIE 4.0是百度自研的旗舰级超大规模⼤语⾔模型，相较ERNIE 3.5实现了模型能力全面升级，广泛适用于各领域复杂任务场景；支持自动对接百度搜索插件，保障问答信息时效，支持5K tokens输入+2K tokens输出。ERNIE-4.0-8K是模...

人工智能 2024-06-16 人工智能

1370阅读

Midjourney Imagine API 申请及使用

Midjourney Imagine API 申请及使用申请流程要使用 Midjourney Imagine API，首先可以到 Midjourney Imagine API 页面点击「Acquire」按钮，获取请求所需要的凭证：如果你尚未...

人工智能 2024-06-16 人工智能

937阅读

爬虫概念、基本使用及一个类型和六个方法（一）

目录一、爬虫简介 1.什么是爬虫 2.爬虫的核心 3.爬虫的用途 4.爬虫的分类 5.反爬手段二、Urllib基本使用 1.导入我们需要的包 2.定义一个url 3.模拟浏览器向服务器发送请求 4.获取响应中的页面的源码 5....

AIGC 2024-06-15 大数据

917阅读

Llama 3 Web Demo 部署- XTuner 小助手微调- LMDeploy 部署 Llama 3

1 Llama 3 Web Demo 部署本博客为基于机智流、Datawhale、ModelScope：Llama3-Tutorial（Llama 3 超级课堂）的作业。 1.1 环境部署使用VSCode远程连接InterStudio开发机，并配...

生成式AI 2024-06-15 人工智能

912阅读

【论文精读】DALLE2: Hierarchical Text-Conditional Image Generation with CLIP Latents

文章目录一、前言（一）DALLE2 简介（二）DALLE2和DALLE的对比（三）相关模型推出时间二、文章概要（一）标题（二）摘要（三）引言（四）模型架构三、方法（一）图像生成的相关工作（二）diffusion...

大数据 2024-06-15 人工智能

1246阅读

探秘Whisper Diarization：语音转文字与对话分割的新锐工具

探秘Whisper Diarization：语音转文字与对话分割的新锐工具项目地址:https://gitcode.com/MahmoudAshraf97/whisper-diarization 项目简介 Whisper Diarization 是...

生成式AI 2024-06-15 人工智能

1400阅读

AI绘画神器ComfyUI 整合包：工作流界面，解压即用，快速入门AI绘画

上周赛博佛祖秋葉 Aki 发布了针对 ComfyUI 的整合安装包，让这款原本偏专业的 AI 绘画工具对初学者来说更容易上手使用了，我也安装试用了一下，的确非常方便，今天就为大家详细介绍一下整合包的用法 ~ 一、ComfyUI 简介 ComfyU...

大数据 2024-06-15 人工智能

1718阅读

详细解析AI作画原理及相关理论

先来欣赏AI作画人物方面：欣赏AI作画自然意境：目录引言一、AI作画原理二、相关理论 1. 风格迁移理论 2. 生成对抗网络（GAN）三、代码示例进一步的优化和改进可能包括：总结：引言...

生成式AI 2024-06-15 人工智能

1548阅读

【腾讯云 HAI域探秘】——即时职场生存指南小游戏以及【自行搭建Stable Diffusion图片AI绘制 ChatGLM2-6B AI进行智能对话 Pytorch2

六、jupyter_lab操作步骤 1、进入jupyter_lab操作页面操作页面效果 2、面板功能介绍 3、启动服务命令如下，直接复制并【ctrl+v】即可 cd /root/stable-diffusion-webu...

大数据 2024-06-15 人工智能

1066阅读

区分LLaMA、llama.cpp和Ollama

大模型本地部署和运行中，经常遇到这三个概念，llama，ollama，llama.cpp。刚开始接触时，的确有些傻傻分不清楚。这里简单区分理解下，方便快速上手。简单来讲，llama 是一个Meta公司开源的预训练大型语言模型，llama.cpp用于加...

AIGC 2024-06-15 人工智能

2762阅读

【V831】智能语音对话：语音识别、文心一言回答、语音合成

1、实验设备 01科技的V831 2、总体概述按下按键，蓝灯亮起，开始定时录音，录音结束，蓝灯熄灭。接着，通过百度的语音识别API进行语音转文字，得到文字后通过百度的文心一言API进行回答，得到的回答通过百度的语音合成API把回答的文字合成为音...

人工智能 2024-06-15 人工智能

1211阅读

天才程序员周弈帆 | Stable Diffusion 解读（一）：回顾早期工作

本文来源公众号“天才程序员周弈帆”，仅用于学术分享，侵权删，干货满满。原文链接：Stable Diffusion 解读（一）：回顾早期工作在2022年的这波AI绘画浪潮中，Stable Diffusion无疑是最受欢迎的图像生成模型。究其原因，第一...

AIGC 2024-06-14 人工智能

1155阅读

【全网瞩目】你想知道的Llama3都在这里

Meta发布了开放式生成人工智能模型 Llama 系列的最新产品： Llama 3。或者更准确地说，该公司首次发布了其新的 Llama 3 系列中的两个模型，其余模型将在未来某个不确定的日期发布。 Meta 称，与上一代 Llama 型号 Llama 2...

人工智能 2024-06-14 人工智能

962阅读