-
陶哲轩看了都直呼内行!谷歌等用LLM自动证明定理拿顶会杰出论文,上下文越全证得越好
Transformer的技能树是越来越厉害了。 来自马萨诸塞大学、谷歌和伊利诺伊大学厄巴纳-香槟分校(UIUC)的研究人员发表了一篇论文,利用大语言模型自动生成定理的完整证明。 论文地址:https://arxiv.org/pdf/2303.04910...
-
AIGC面经大全(持续更新)
目录 DDPM算法原理部分: DDIM算法原理部分: ⾼阶采样⽅案: 特征编码篇: Stable Diffusion篇: SDXL篇: ⼤模型微调篇: 控制模型篇: 适配器篇: DDPM算法原理部分: 简述DDP...
-
【AIGC-图片生成视频系列-3】AI视频随心而动:MotionCtrl的相机运动控制和物体运动控制
目录 一. 项目简介 二. 主要贡献 三. 摘要 四. 实现方法和管线 五. 基于 LVDM [1] / VideoCrafter1 [2]的结果 (A 相机运动控制 (B 物体运动控制 (C 相机+物体运动控制 (D 与Vide...
-
智能家居:利用AIGC进行智能家居控制
1.背景介绍 1. 背景介绍 智能家居已经成为现代生活中不可或缺的一部分,它利用了人工智能、互联网和自动化技术,使得家居设备能够更加智能化、高效化和安全化。在智能家居系统中,AIGC(人工智能生成模型 技术的应用尤为重要,它可以帮助家居系统更...
-
大模型也有小偷?为保护你的参数,上交大给大模型制作「人类可读指纹」
大模型的预训练需要耗费巨量的计算资源和数据,因而预训练模型的参数也正成为各大机构重点保护的核心竞争力和资产。然而,不同于传统的软件知识产权保护可以通过比对源代码来确认是否存在代码盗用,对预训练模型参数盗用的判断存在以下两方面的新问题: 1) 预训练模型的...
-
.Net接入AzureOpenAI、OpenAI、通义千问、智谱AI、讯飞星火、文心一言大语言模型。
前言 现在在网上搜索.NET接入大模型的帖子很少,有些官方案例只提供java和python的SDK,所以有了这篇.Net的接入大模型文章,目前仅实现对话模型的调用。 这里仅举例通义千问,其他模型实现可以参考Gi他Hub 对您有帮助的话帮忙点个star...
-
「我在淘天做技术」1688的AIGC商业化落地实践探索
作者:吴越涛 近期淘天集团秋季 2024 届校园招聘正式启动,预计将发放 2000 多个 offer,其中技术类岗位占比超过 50%。为了方便大家更真实地了解淘天技术的布局和现状,我们策划了「我在淘天做技术」系列,首次全面分享淘天技术进展和创新...
-
谁能想到,一款3D建模AI工具成了Ins网红的视频创作利器
近期话题热度拉满的《幻兽帕鲁》AI抄袭瓜,想必各位一线冲浪玩家已经略有耳闻了。 背后最大的争议之一在于,无经验的小团队快速开发出3D游戏大作,遥遥领先以往同类项目的生产力。 多方争议之下,《幻兽帕鲁》AI抄袭瓜尚无定论。 但3D内容制作确实正变得前所未有的...
-
UCLA华人提出全新自我对弈机制!LLM自己训自己,效果碾压GPT-4专家指导
合成数据已经成为了大语言模型进化之路上最重要的一块基石了。 在去年底,有网友扒出前OpenAI首席科学家Ilya曾经在很多场合表示过,LLM的发展不存在数据瓶颈,合成数据可以解决大部分的问题。 图片 英伟达高级科学家Jim Fan在看了最近的一批论文后也...
-
匿名论文提出奇招!增强大模型长文本能力居然还能这么做
一提到提高大模型长文本能力,就想到长度外推或者上下文窗口扩展? 不行,这些都太费硬件资源了。 来看一个奇妙新解: 和长度外推等方法使用KV缓存的本质不同,它用模型的参数来存储大量上下文信息。 具体办法就是建一个临时Lora模块,让它仅在长文本生成过程中“...
-
DALL-E 系列:AI绘画背后的惊人真相!!【1个离奇内幕、3个意想不到、5大秘密揭示】
DALL-E 系列:AI绘图原理,根据用户给出的描述,生成与描述相匹配的图像 DALL-E 1 dVAE Transformer DALL-E 2 CLIP 先验 prior decoder(image) DALL-E 3...
-
OpenAI预警系统探索 GPT-4 在制造生物武器方面的优势
OpenAI最近着手研发GPT-4的早期预警系统,以探讨大型语言模型是否能够提高获取关于生物威胁信息的效率,相较于互联网。该系统旨在作为一种“触发器”,提示潜在存在生物武器的可能性,需要进一步调查,同时纳入OpenAI的预防框架。 研究采用了100名参与...
-
关于【Stable-Diffusion WEBUI】基础模型对应VAE的问题
文章目录 (零)前言 (一)什么是VAE (二)模型嵌入VAE了么 (三)我们能做什么 (3.1)准备常见的VAE (3.2)下载模型对应的VAE (3.3)快捷设置中打开VAE下拉列表选择 (3.4)对比不同VAE生成的效果...
-
Textual Inversion、DreamBooth、LoRA、InstantID:从低成本进化到零成本实现IP专属的AI绘画模型
2023年7月份国内有一款定制写真AI工具爆火。一款名为妙鸭相机的AI写真小程序,成功在C端消费者群体中出圈,并在微信、微博和小红书等平台迅速走红,小红书上的话题Tag获得了330多万的浏览量,相关微信指数飙升到了1800万以上。 其他能够提供类似功能例...
-
Stable Diffusion完整入门指南,保姆级教程!
SD 保姆教程,从原理功能到案例输出展示,最后简述 ControlNet 的使用技巧。 Stable Diffusion 的基本介绍 首先官方给出的解释是: 这和 MJ 有什么区别?为了更方便理解我们将 Stable Diff...
-
AIGC内容分享(六十):拆解AIGC的基础及各行业应用
目录 一、揭开AIGC的神秘面纱 二、为何2022年爆发AIGC? 1、文本类 2、图像类 3、音频类 4、视频类 三、AI对电商的影响 挖掘ChatGPT的潜力 举个例子:如果你想通过OpenAI平台创业 四、AIGC/GPT可以做什...
-
纯文本模型训出「视觉」表征!MIT最新研究:语言模型用代码就能作画
只会「看书」的大语言模型,有现实世界的视觉感知力吗?通过对字符串之间的关系进行建模,关于视觉世界,语言模型到底能学会什么? 最近,麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)的研究人员对语言模型的视觉能力进行了系统的评估,从简单形状、物体...
-
大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增
大型语言模型(LLM)通常拥有数十亿的参数,用了数万亿 token 的数据进行训练,这样的模型训练、部署成本都非常高。因此,人们经常用各种模型压缩技术来减少它们的计算需求。 一般来讲,这些模型压缩技术可以分为四类:蒸馏、张量分解(包括低秩因式分解)、剪枝...
-
Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效
随着 LLaMA、Mistral 等大语言模型的成功,各家大厂和初创公司都纷纷创建自己的大语言模型。但从头训练新的大语言模型所需要的成本十分高昂,且新旧模型之间可能存在能力的冗余。 近日,中山大学和腾讯 AI Lab 的研究人员提出了 FuseLLM,用...
-
重塑3D生成核心理论:VAST、港大、清华用「零」训练数据生成了3D模型
无需任何训练数据,只需对着模型描述一句话,如「一个做作业的香蕉人」: 或是「一只戴着 VR 眼镜的猫」: 就能生成符合描述的带有高质量纹理贴图的 3D 场景。不仅如此,还能对已有的 3D 模型进行精细化贴图。 这是港大与清华大学联合 3D 生成明星...
-
Stable Diffusion XL总结
Stable Diffusion XL是一个二阶段的级联扩散模型,包括Base模型和Refiner模型。其中Base模型的主要工作和Stable Diffusion一致,具备文生图,图生图,图像inpainting等能力。在Base模型之后,级联了Refi...
-
大语言模型部署:基于llama.cpp在Ubuntu 22.04及CUDA环境中部署Llama-2 7B
llama.cpp是近期非常流行的一款专注于Llama/Llama-2部署的C/C++工具。本文利用llama.cpp来部署Llama 2 7B大语言模型,所采用的环境为Ubuntu 22.04及NVIDIA CUDA。文中假设Linux的用户目录(一般为...
-
Llama 2: Open Foundation and Fine-Tuned Chat Models
文章目录 TL;DR Introduction 背景 本文方案 实现方式 预训练 预训练数据 训练细节 训练硬件支持 预训练碳足迹 微调 SFT SFT 训练细节 RLHF 人类偏好数据收集 奖励模型 迭代式微调(RLHF) 拒...
-
Grok犯傻自曝抄袭,ChatGPT拱火,马斯克被“插刀”!看生成式AI如何吞噬互联网
整理丨诺亚 马斯克旗下AI公司xAI推出的首款聊天机器人Grok号称“百无禁忌”,也正是这个无禁忌AI面世不久,就给马斯克捅了个大篓子! 一名安全测试员 Jax Winterbourne 上个月在推特上发布了一张 Grok 拒绝查询的屏幕截图,内容显...
-
全网最全Midjourney以图生图的详细教程 内有6种案例 小白必收藏!!!!
手把手教你入门绘图超强的AI绘画程序,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包(文末可获取) 基础介绍 本篇文章,将介绍如何利用Midjourney完成图生图的方式,简而言之,就是以我们上传的图片为基础,...
-
如何让Midjourney, Stable Diffusion XL, Dall.E根据用户中文要求生成图片
随着AIGC应用的逐步深入,大家也开始逐渐将文生图大模型集成到自家的产品中,以求让自己的产品在竞争中更加突出。其中效果最好的图文模型依然是Midjourney, Stable Diffusion XL和Dall.E-3这三个老牌的模型。...
-
一文教会你使用AI绘画利器Stable Diffusion!这可能是CSDN最全的AI绘画使用教程,建议收藏!
大家好,我是程序员晓晓 随着 stable-diffusion 的开源,让更多人有机会直接参与到 AI 绘画的创作中,相关的教程也如雨后春笋般的出现。可是目前我看到的教程同质性较高,通常只能称作为"使用流程讲解",但是通常没有对其原理和逻辑进行深入说明。...
-
怎么快速转行并学习提示工程师的方法
chatgpt的出现毫无疑问打破了原有的商业格局, 各个公司都已逐渐使用chatgpt来取代人工,反正老板总是提出各种逆天的要求,但chatgpt可不一定听得懂,雇一个翻译那可真是一个好主意 -------------提示工程师 以往要费几天功夫的...
-
stable diffusion 基础教程-文生图
置顶大模型插件资源链接 你如果没有魔法上网,请自取 百度云盘链接:链接:https://pan.baidu.com/s/1_xAu47XMdDNlA86ufXqAuQ?pwd=23wi 提取码:23wi 有疑问加微:mincarver 界...
-
Stable Diffusion 系列教程 | 文生图 - 提示词
目录 1.提示词 基本的规则 2.提示词分类 2.1内容性提示词 2.2 画风艺术派提示词 2.3 画幅视角 2.4画质提示词 3 反向提示词 3.1 内容性反向提示词 3.2 画质性反向提示词 4 实例分析 5 权重 5.1 方法...
-
如何使用AIGC进行语音识别和合成
1.背景介绍 语音识别和合成是人工智能领域的重要技术,它们有助于实现自然语言与计算机之间的有效沟通。在这篇文章中,我们将探讨如何使用人工智能生成模型(AIGC 进行语音识别和合成。 1. 背景介绍 语音识别是将声音转换为文本的过程,而语音...
-
使用推测解码 (Speculative Decoding) 使 Whisper 实现 2 倍的推理加速
Open AI 推出的 Whisper 是一个通用语音转录模型,在各种基准和音频条件下都取得了非常棒的结果。最新的 large-v3 模型登顶了 OpenASR 排行榜,被评为最佳的开源英语语音转录模型。该模型在 Common Voice 15 数据...
-
chatglm2-2b+sdxl1.0+langchain打造私有AIGC(五)
一、实现目标 上篇文章写完LLM的Agent之后,流程应该是进入到了SDXL的“文生图”“图生图”阶段了 目标很明确,使用SDXL为ChatGLM生成的内容进行配图,说明:大部分使用SD模型的大神都是使用SD模型配套的开源WebUI,因为我主打一个...
-
Stable diffusion游戏图标生成讲解
hello大家好,这里是ai绘画刚上路的萌新张怼怼,专注训练游戏图标。今天教大家如何用 stable diffusion中的模型生成游戏图标中技能图标的图片。(新手教程,如有遗漏、不足之处还望大家包涵并指出,共同完善游戏图标生成教程) 一、展示 先给...
-
大模型×文本水印:清华、港中文、港科广、UIC、北邮联合发布首个大模型时代下的文本水印综述
论文:A Survey of Text Watermarking in the Era of Large Language Models 论文链接:https://arxiv.org/abs/2312.07913 大模型时代:文本水印新纪元 文本水...
-
stable diffusion 百宝书
文章目录 0. 环境搭建 0.1 Windows 0.1.1 git环境安装 0.1.2 python 环境搭建 0.1.2.1 配置pip国内镜像源 0.1.3 stable diffusion环境搭建 0.1.3.1 远程访问Stab...
-
拳打Gen-2脚踢Pika,谷歌爆肝7个月祭出AI视频大模型,首提时空架构,时长史诗级延长
爆肝7个月,谷歌祭出了AI视频大模型Lumiere,直接改变了游戏规则!全新架构让视频时长和一致性全面飞升,时长直接碾压Gen-2和Pika。 AI视频赛道上,谷歌又再次放出王炸级更新! 这个名为Google Lumiere的模型,是个大规模视频扩散模...
-
AIGC-《林丹:羽球之王的传奇人生》
标题:《林丹:羽球之王的传奇人生》 在羽毛球的世界里,有一个名字如雷贯耳,他就是林丹。他是中国羽毛球界的骄傲,是无数球迷心中的英雄。他的每一次挥拍,每一次跳跃,都充满了力量和激情,让人热血沸腾。今天,就让我们走进这位传奇运动员的人生,感受他的激情与执着。...
-
超级逼真人脸生成,Stable Diffusion的3个关键技巧
大家好,你是否曾想过,为什么别人可以使用AI图像生成技术生成如此逼真的人脸,而自己的尝试却充满了错误和瑕疵,让人一眼看出是假的。尝试过调整提示和设置,但似乎仍无法与他人的质量相匹配。 本文将带大家了解使用Stable Diffusion生成超逼真人脸的3...
-
拳打Gen-2脚踢Pika,谷歌爆肝7个月祭出AI视频大模型!首提时空架构,时长史诗级延长
AI视频赛道上,谷歌又再次放出王炸级更新! 这个名为Google Lumiere的模型,是个大规模视频扩散模型,彻底改变了AI视频的游戏规则。 跟其他模型不同,Lumiere凭借最先进的时空U-Net架构,在一次一致的通道中生成整个视频。 具体来说,现有...
-
RadOcc:通过渲染辅助蒸馏学习跨模态Occupancy知识
原标题:Radocc: Learning Cross-Modality Occupancy Knowledge through Rendering Assisted Distillation 论文链接:https://arxiv.org/pdf/2312...
-
100天,3个版本,他们让营销AIGC起来了
“18权益加磅,省的不止一点点!”打开京东金融APP,一则热闹的营销头图跃入眼帘,你可能意识不到,这则堪比设计师水准的物料源自大模型的手笔。今年6.18和11.11,京东金融超过30%的资源位营销素材由AIGC自动生成,这一水平在亿级用户量的应...
-
用通俗易懂的方式讲解:Stable Diffusion WebUI 从零基础到入门
本文主要介绍 Stable Diffusion WebUI 的实际操作方法,涵盖prompt推导、lora模型、vae模型和controlNet应用等内容,并给出了可操作的文生图、图生图实战示例。适合对Stable Diffusion感兴趣,但又对Stab...
-
保姆级教程:从0到1搭建Stable Diffusion XL完整工作流进行AI绘画
Rocky Ding 公众号:WeThinkIn 写在前面 【人人都是算法专家】栏目专注于分享Rocky在AI行业中对业务/竞赛/研究/产品维度的思考与感悟。欢迎大家一起交流学习💪 大家好...
-
【扩散模型】12、Stable Diffusion | 使用 Diffusers 库来看看 Stable Diffusion 的结构
文章目录 一、什么是 Stable Diffusion 二、Diffusers 库 三、微调、引导、条件生成 3.1 微调 3.2 引导 3.3 条件生成 四、Stable Diffusion 4.1 以文本为条件生成 4.2 无分类器的...
-
使用SPIN技术对LLM进行自我博弈微调训练
2024年是大型语言模型(llm 的快速发展的一年,对于大语言模型的训练一个重要的方法是对齐方法,它包括使用人类样本的监督微调(SFT 和依赖人类偏好的人类反馈强化学习(RLHF 。这些方法在llm中发挥了至关重要的作用,但是对齐方法对人工注释数据有的大...
-
stable diffusion模型评价框架
GhostReview:全球第一套AI绘画ckpt评测框架代码 - 知乎大家好,我是_GhostInShell_,是全球AI绘画模型网站Civitai的All Time Highest Rated (全球历史最高评价 第二名的GhostMix的作者。在上...
-
stable diffusion模型训练时数据量
文生图模型之Stable Diffusion - 知乎通向AGI之路码字真心不易,求点赞! https://zhuanlan.zhihu.com/p/6424968622022年可谓是 AIGC(AI Generated Content)元年,上半年有文生...
-
AI作画的背后是怎么一步步实现的?一文详解AI作画算法原理+性能评测
前言 “AI作画依赖于多模态预训练,实际上各类作画AI模型早已存在,之所以近期作品质量提升很多,可能是因为以前预训练没有受到重视,还达不到媲美人类的程度,但随着数据量、训练量的增多,最终达到了现在呈现的效果。”远在AI作画还没有爆火之前,深度学习就已经...
-
LLM之RAG实战(十六)| 使用Llama-2、PgVector和LlamaIndex构建LLM Rag Pipeline
近年来,大型语言模型(LLM)取得了显著的进步,然而大模型缺点之一是幻觉问题,即“一本正经的胡说八道”。其中RAG(Retrieval Augmented Generation,检索增强生成)是解决幻觉比较有效的方法。本文,我们将深入研究使用...