-
Google Gemma Chat Free官网体验入口 AI文本生成和摘要工具免费使用地址
Google Gemma Chat Free是由Google开发的前沿轻量级开放模型。这些模型分为2B和7B参数版本,包括基础和调优版本。Gemini模型的基础技术和指令调优技术都来自Google的技术,Gemma遵循AI原则,确保安全可靠的使用,并针对G...
-
NUS尤洋团队开发扩散模型p-diff 像Sora一样直接打入AI底层
新加坡国立大学尤洋教授团队联合其他机构开发的p-diff扩散模型在AI领域引起热议。这项模型能以44倍的速度生成神经网络参数,得到了深度学习领域的重要人物LeCun的点赞。该模型的研发结合了自编码器的设计,通过正向和反向过程学习参数的分布,生成高质量的神经...
-
补齐Transformer规划短板,田渊栋团队的Searchformer火了
最近几年,基于 Transformer 的架构在多种任务上都表现卓越,吸引了世界的瞩目。使用这类架构搭配大量数据,得到的大型语言模型(LLM)等模型可以很好地泛化用于真实世界用例。 尽管有如此成功,但基于 Transformer 的架构和 LLM 依然难...
-
谷歌高管为AI模型绘制不出白人道歉:用户直呼离谱 美国国父竟是黑人
2月25日消息,据国外媒体报道称,对于用户反馈谷歌公司推出的人工智能(AI)模型Gemini在生成人物图像时出现问题,谷歌高级副总裁普拉巴卡尔拉加万进行了道歉。 谷歌公司推出的AI模型Gemini具有根据文字生成图像的功能,但尴尬的是,大多数生成的人物图像...
-
AIGC项目——Meta:根据对话音频生成带动作和手势的3d逼真数字人
From Audio to Photoreal Embodiment: Synthesizing Humans in Conversations From Audio to Photoreal Embodiment:Synthesizing Humans...
-
【AIGC】Stable Diffusion的生成参数入门
Stable Diffusion 的生成参数是用来控制图像生成过程的重要设置,下面是一些常见的生成参数及其详解 1、采样器,关于采样器的选择参照作者的上一篇文章 2、采样步数(Sampling Steps)是指在生成图像时模型执行的总步数,每一步都包含了...
-
【白话科普】10分钟从零看懂AI绘画原理
👉腾小云导读 计算机如何生成和真实图片相似的图画?模型是如何听懂我们想要它生成什么并给出对应结果?AIGC 热潮中的 Stable Diffusion、NovelAI、Latent upscale、ControlNet、LoRA等等是...
-
Stable Diffusion(SD) Lora模型
Lora模型 1. Lora模型tag 1.1 打tag路径 1.2 打tag准备 1.3 分类进行打tag 2. Lora模型训练核心参数 2.1 步数相关 repeat / epoch / batch_size 2.1.1 imag...
-
【AIGC】Stable Diffusion的ControlNet参数入门
Stable Diffusion 中的 ControlNet 是一种用于控制图像生成过程的技术,它可以指导模型生成特定风格、内容或属性的图像。下面是关于 ControlNet 的界面参数的详细解释: 低显存模式 是一种在深度学习任务中用于处理显存...
-
Midjourney重磅发布Niji 6,一文带你做全面评测
在V6模型推出一个多月之后,Midjourney终于发布了其Niji 6模型,标志着出图质量和风格表现相较于Niji 5有了显著提升。Niji模型以其“动漫风”特色而闻名,能够创造出高质量的二次元图像和插画,这是广大用户在使用过程中的普遍体验。而在处理非动...
-
【AIGC】一起学习prompt提示词(4/4)【经典】【15种提示词技巧】
写的时候并没有设计好,要做多少期,还是有始有终的比较好,为了方便阅读,我把之前的3期,改下名字,放到这里。 【AIGC】一起学习prompt提示词(1/4) 内容摘要:提示词是什么,百度文心一言的提示词是怎么定义的,创作中心如何玩。 【AIGC】一起...
-
Stable Diffusion 绘画入门教程(webui)
文章目录 一、前言 二、做出的效果 三、SD使用流程 1、大模型 2、关键字 3、调参数 一、前言 随着mj和sd绘画软件发布之后,AI绘画开始爆火,很多小伙伴已经挖掘出很多的玩法,哪怕最基础的AI美女、AI壁纸、真人漫改等等...
-
爆火Sora背后的技术,一文综述扩散模型的最新发展方向
为了使机器具有人类的想象力,深度生成模型取得了重大进展。这些模型能创造逼真的样本,尤其是扩散模型,在多个领域表现出色。扩散模型解决了其他模型的限制,如 VAEs 的后验分布对齐问题、GANs 的不稳定性、EBMs 的计算量大和 NFs 的网络约束问题。因...
-
FreeControl官网体验入口 AI文本到图像生成工具免费在线使用地址
FreeControl是一个无需训练就可以实现对文本到图像生成过程的可控制的方法。它支持对多种条件、架构和检查点的同时控制。FreeControl通过结构指导实现与指导图像的结构对齐,通过外观指导实现使用相同种子的生成图像之间的外观共享。FreeContr...
-
运行LIama2得8400万元!最快AI推理芯片成本推算引热议
想实现史上最快大模型推理,得要1171万美元(8410万元)??? 同等项目下,使用英伟达GPU成本只需30万美元…… 关于最强AI芯片易主Groq,可能得让子弹再飞一会儿了。 这两天,Groq惊艳亮相。它以号称“性价比高英伟达100倍”的芯片,实现每秒...
-
10倍英伟达GPU:大模型专用芯片一夜成名,来自谷歌TPU创业团队
我们知道,大模型到 GPT-3.5 这种千亿体量以后,训练和推理的算力就不是普通创业公司所能承担的了,人们用起来速度也会很慢。 但自本周起,这种观念已成为历史。 有名为 Groq 的初创公司开发出一种机器学习处理器,据称在大语言模型任务上彻底击败了 GP...
-
GPT-4可能也在用的推测解码是什么?一文综述前世今生和应用情况
众所周知,大型语言模型(LLM)的推理通常需要使用自回归采样,这个推理过程相当缓慢。为了解决这个问题,推测解码(Speculative Decoding)已经成为 LLM 推理的一种新型采样方法。这种方法在每个采样步骤中,会先预测几个可能的 token,...
-
AIGC实战——能量模型(Energy-Based Model)
AIGC实战——能量模型 0. 前言 1. 能量模型 1.1 模型原理 1.2 MNIST 数据集 1.3 能量函数 2. 使用 Langevin 动力学进行采样 2.1 随机梯度 Langevin 动力学 2.2 实现 Langevin...
-
如何免费访问和使用Gemini API?
Gemini是谷歌开发的一个新模型。有了Gemini可以为查询提供图像、音频和文本,获得几乎完美的答案。 我们在本教程中将学习Gemini API以及如何在机器上设置它。我们还将探究各种Python API函数,包括文本生成和图像理解。 Gemini A...
-
学习AI画画
AI画画学习 利用算法进行画画,通过文本或者以图生图等形式生成相应的图像。之前在云端服务器Linux部署过一遍,这里总结一下相关的过程。 常见AI绘画软件使用方式 方式 优势 不足 1 在线版 直接打开浏览器注册即可使用,非常方便 大部...
-
【AIGC-文本/图片生成视频系列-10】SparseCtrl:在文本生成视频的扩散模型中添加稀疏控制
目录 一. 项目概述 二. 方法详解 三. 应用结果 四.个人思考 由于扩散模型生成空间的不确定性,仅仅通过文本生成视频时,会导致模糊的视频帧生成。 今天解析的SparseCtrl,是一种有效解决上述问题的方案,通过带有附加编码器的时间稀疏条...
-
AIGC内容分享(五十二):AIGC视觉艺术创新工具之:Bing图像生成器(Bing Image Creator)
“视觉艺术工具”是指能够协助艺术家或设计师创作视觉艺术作品的一类工具。通常,这类工具的学习和使用门槛较高,往往只有专业人士能够运用。 通过AIGC生成全新的艺术品,这种创新的创作方式显著降低了艺术创作的门槛,使其变得更加平易近人、易于使用。这使得更多非专...
-
大模型开车哪家强?普渡研究给指南:GPT-4真行啊
现在一句口令,就能指挥汽车了。 比如说声“我开会要迟到了”“我不想让我朋友等太久”等等,车就能理解,并且自动加速起来。 如果这次行程有不满意的,只需要给汽车提供反馈建议:“要在充分保障安全的前提下”,汽车的自动驾驶行为就会在下次行程中进行自我修正。 这是来...
-
用通俗易懂的方式讲解:使用Llama-2、PgVector和LlamaIndex,构建大模型 RAG 全流程
近年来,大型语言模型(LLM)取得了显著的进步,然而大模型缺点之一是幻觉问题,即“一本正经的胡说八道”。其中RAG(Retrieval Augmented Generation,检索增强生成)是解决幻觉比较有效的方法。 本文,我们将深入研究使用trans...
-
循环神经网络与文本风格转移:实现创意的AI写作
1.背景介绍 文本风格转移是一种自然语言处理任务,它旨在将一种文本风格或形式转换为另一种风格。这种转换可以是语言、语法、语境或其他方面的。文本风格转移的主要应用包括文本生成、文本摘要、机器翻译、文本洗理、文本生成和其他自然语言处理任务。 在过...
-
【AIGC】Diffusers:训练扩散模型
前言 无条件图像生成是扩散模型的一种流行应用,它生成的图像看起来像用于训练的数据集中的图像。通常,通过在特定数据集上微调预训练模型来获得最佳结果。你可以在HUB找到很多这样的模型,但如果你找不到你喜欢的模型,你可以随时训练自己的模型! 本教程将教您如何...
-
羊驼2:开放的基础和微调聊天模型--Llama 2论文阅读
论文地址:https://arxiv.org/pdf/2307.09288.pdfd 代码地址:GitHub - facebookresearch/llama-recipes: Examples and recipes for Llama 2 model...
-
如何使用AIGC进行图像生成和编辑
1.背景介绍 图像生成和编辑是计算机视觉领域的重要应用,随着人工智能技术的发展,AIGC(Artificial Intelligence Generative Convolutional 已经成为了图像生成和编辑的主流方法。在本文中,我们将详细介...
-
《GitHub Copilot 操作指南》课程介绍
第1节:GitHub Copilot 概述 一、什么是 GitHub Copilot 什么是 GitHub Copilot GitHub Copilot是GitHub与OpenAI合作开发的编程助手工具,利用机器学习模型生成代码建议。它集成在开发者...
-
AIGC内容分享(五十七):AIGC:合规引领探索之路
目录 引言 01 资质合规 02 内部合规管理体系及制度 03 互联网应用关键条款完善 04 外部商业合作 结语 引言 从GPT 3.5的问世、GPT4.0的革新到Google最近推出的Gemini系列原生多模态AI基础模型,生成式人...
-
stable diffusion学习笔记——文生图(一)
模型设置 基本模型 基本模型也就是常说的checkpoint(大模型),基本模型决定了生成图片的主体风格。 如上图所示,基本模型的后缀为.safetensors。需要存放在特定的文件夹下。 如果用的是启动器,可以在启动器内直接下载。...
-
llama/llama2论文解读
llama 摘要 llama在约1.4T的token上,训练出参数量7B到65B的模型,其模型规模如下 在仅使用开源数据集的情况下,llama-13B在多数benchmarks上与GPT-3效果相当;llama-65B也与最好的模型(Chin...
-
Stable Diffusion 【通用模型】:出图效果非常惊艳的Playground美学模型
大家好,我是程序员晓晓 之前我重点介绍过一个网站:PlaygroundAI。这是一个提供一个图像专业人士创建和编辑图像的网站,它整合了图像创建和社交网络的功能。 该网站模型提供了3个大类:Stable Diffusion V1.5、Stable Diff...
-
全网最全stable diffusion模型讲解!快来!!小白必收藏!!
手把手教你入门绘图超强的AI绘画程序Stable Diffusion,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新Stable Diffusion保姆级教程资料包(文末可获取) AI模型最新展现出的图像生成能力远远超出人们的预期...
-
【AIGC】prompt工程从入门到精通
注:本文示例默认“文心大模型3.5”演示,表示为>或w>(wenxin ,有时为了对比也用百川2.0展示b>(baichuan 有时候为了模拟错误输出,会用到m>(mock 表示(因为用的大模型都会给出正确答案) 有时候直接贴网络...
-
无需RLHF显著提升GPT-4/Llama2性能,北大团队提出Aligner对齐新范式
背景 大语言模型(LLMs)虽展现出了强大的能力,但也可能产生不可预测和有害的输出,例如冒犯性回应、虚假信息和泄露隐私数据,给用户和社会造成伤害。确保这些模型的行为与人类意图和价值观相对齐,是一个紧迫的挑战。 尽管基于人类反馈的强化学习(RLHF)提供了...
-
吉他摇滚、电子音乐都能搞定,Meta开源音频生成新模型MAGNeT,非自回归7倍提速
在文本生成音频(或音乐)这个 AIGC 赛道,Meta 最近又有了新研究成果,而且开源了。 前几日,在论文《Masked Audio Generation using a Single Non-Autoregressive Transformer》中,...
-
GPT4、文心一言4、ChatGLM、Claude2.1四大语言模型生成效果对比
随着AIGC大风起,也掀起了语言模型大争之世,各种语言模型如雨后春笋,让大家眼花缭乱。周周都有新的选手入场,月月都有新的模型问世。不过其中最受人瞩目的当属GPT4、文心一言4、ChatGLM、Claude2.1四大模型。隐隐有傲视群雄之姿,...
-
AI视野:天工2.0 MoE大模型发布;智谱 AI 推出激励计划;moonshot正式开放API申请;抖音掀起龙年AI写真热
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 📰🤖📢AI新鲜事 智谱AI推出智能...
-
爆火的AI博主,是“摇钱树”还是“坑”?(附实测教程)
这段时间,平均一周就有一位虚拟博主火爆出圈。 自此前Instagram博主Emily靠堪称完美的颜值在Ins4周内涨粉超20万之后,最近,外网又有一位叫Lexi Love的AI博主火了。 Lexi Love的Ins账号数据 她的角色设定依旧是模特,背后的...
-
Stable Video Diffusion 1.1 Image-to-Video官网体验入口 AI生成视频模型免费使用地址
Stable Video Diffusion 1.1 Image-to-Video是一款先进的扩散模型,通过将静止图像作为条件帧,生成相应的视频。该潜在扩散模型经过精心训练,能够从图像生成高质量的短视频片段。在 1024x576 分辨率下,该模型训练生成...
-
iPhone动嘴10秒P图!UCSB苹果全华人团队发布多模态MGIE,官宣开源人人可玩
几天前,库克在苹果电话会上证实,「今年晚些时候会发布生成式AI」。 ChatGPT掀起全球热潮之后,苹果也在悄悄发力AI,曾曝出的大模型框架Ajax、AppleGPT等AI工具让业界充满了期待。 6月举办的WWDC上,这家曾霸占全球市值第一公司,将会宣布...
-
飞浆AI studio人工智能课程学习(1)-大模型时代&优质Prompt
文章目录 大模型时代&优质Prompt Al生成技术价值概览 开始构建你的优质prompt 近十年深度学习模型主要更迭 为什么大模型能够有如此强大的表现力 大模型与Prompt 例1: 画一幅画,呆萌的小猫躺在大泡泡中 例2:请生成...
-
如何使用单个指令微调GPT-3.5或Llama 2
由于在各种任务中的通用性,像ChatGPT和Llama 2这样的大型语言模型(LLM 广受欢迎。然而,有些应用程序需要使用自定义数据对这些模型进行微调,以获得更好的性能。 不幸的是,针对特定应用程序对大型语言模型(LLM 进行微调通常是复杂和令人沮丧的...
-
流量工程将代码生成的准确率提高一倍:由19%提高至44%
一篇新论文的作者提出了一种“强化”代码生成的方法。 代码生成是人工智能中一项越来越重要的能力。它指训练机器学习模型,基于对所需程序功能的自然语言描述自动生成计算机代码,并有许多潜在的应用,从将软件规格转换成实用代码、自动化后端开发到协助人类程序员,不一...
-
不分割成token,直接从字节中高效学习,Mamba原来还能这样用
在定义语言模型时,通常会使用一种基本分词方法,把句子分为词(word)、子词(subword)或字符(character)。其中,子词分词法一直是最受欢迎的选择,因为它在训练效率和处理词汇表外单词的能力之间实现了自然的折中。然而,一些研究指出了子词分词法...
-
中文创意写作能力超GPT-4,「最会写」的中文大模型Weaver来了
ChatGPT 等通用大模型支持的功能成百上千,但是对于普通日常用户来说,智能写作一定是最常见的,也是大模型最能真正帮上忙的使用场景之一。尽管大模型经常能写出看起来像模像样的文字,但是大多数情况下内容的创意程度和文风都经不起深究。尤其是在创作领域,大模型...
-
匿名论文提出奇招,增强大模型长文本能力居然还能这么做
一提到提高大模型长文本能力,就想到长度外推或者上下文窗口扩展? 不行,这些都太费硬件资源了。 来看一个奇妙新解: 和长度外推等方法使用KV缓存的本质不同,它用模型的参数来存储大量上下文信息。 具体办法就是建一个临时Lora模块,让它仅在长文本生成过程中“流...
-
详解“小而优”的大语言模型Zephyr 7B
Zephyr是Hugging Face发布的一系列大语言模型,使用蒸馏监督微调(dSFT 在更庞大的模型上进行训练,显著提高了任务准确性。 2023年是属于大语言模型(LLM 和开源的一年。许多初创公司和企业开放了模型和权重的源代码,以应对ChatGPT...
-
像人类一样在批评中学习成长,1317条评语让LLaMA2胜率飙升30倍
现有的大模型对齐方法包括基于示例的监督微调(SFT)和基于分数反馈的强化学习(RLHF)。然而,分数只能反应当前回复的好坏程度,并不能明确指出模型的不足之处。相较之下,我们人类通常是从语言反馈中学习并调整自己的行为模式。就像审稿意见不仅仅是一个分数,还包...