-
大模型推理效率无损提升3倍,滑铁卢大学、北京大学等机构发布EAGLE
大语言模型(LLM)被越来越多应用于各种领域。然而,它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则:每个词(token)的生成都需要进行一次前向传播,需要访问数十亿至数千亿参数的 LLM。这导致传统自回归解码的速度较慢。 近日,滑铁...
-
南洋理工发布提高AI视频生成内容一致性方法FreeInit
南洋理工大学发布了一项名为FreeInit的方法,该方法可以大幅提高人工智能视频生成的内容一致性。演示显示这一方法非常流畅,并且可以与现有的SD生态结合。此外,他们还发表了与Animatediff结合的方法,只需等待一些专业人士制作插件,就可以使用这一方法...
-
随意指定CLIP关注区域!上交复旦等发布Alpha-CLIP:同时保持全图+局部检测能力
CLIP是目前最流行的视觉基座模型,其应用场景包括但不限于: 与LLM大语言模型结合成为视觉多模态大模型; 作为图像生成(Stable Diffusion 、点云生成(Point-E 的condition model,实现image-to-3D; 用于...
-
面向 Stable Diffusion 的自动 Prompt 工程算法 BeautifulPrompt
近日,阿里云人工智能平台PAI与华南理工大学朱金辉教授团队合作在自然语言处理顶级会议EMNLP2023上发表了BeautifulPrompt的深度生成模型,可以从简单的图片描述中生成高质量的提示词,从而使文生图模型能够生成更美观的图像。BeautifulP...
-
微软提出变色龙框架,让模型自带工具箱开挂,数学推理任务准确率98%
教大模型调用工具,已经是AI圈关注度最高的话题之一了。 这不,又有一项研究登上最新NeurIPS 2023—— 它是一个叫做Chameleon(变色龙)的框架,号称能将大语言模型直接变成魔法师的工具箱,来自微软与加州大学洛杉矶分校(UCLA)。 相比其它...
-
xAI旗下聊天机器人Grok被指窃取OpenAI代码库并复制ChatGPT回应
12月12日消息,据外媒报道,近日,马斯克旗下人工智能初创公司xAI发布的首款生成式人工智能聊天机器人Grok在拒绝一名用户的请求时,引用了ChatGPT背后的开发商OpenAI的用例政策。对此,Grok被指窃取了OpenAI的代码库,并复制了ChatGP...
-
值得你收藏的几个Stable Diffusion模型
使用Stable Diffusion生成图片,模型是非常重要的,好的模型,哪怕你的提示词差一些、或者是很简单的提示词,也可以生成很不错的图片。这是我平时收藏的一些模型,分享给大家。 ChilloutMix 地址: https://civita...
-
表格数学推理准确率达98.78%!UCLA推出全新「变色龙推理框架」
在自然语言处理任务中取得显著成就的大型语言模型(LLMs)尽管表现出色,但在实时信息获取、外部工具利用和精确数学推理方面仍显不足。 为了应对这些挑战,来自UCLA等机构的研究人员打造了全新的Chameleon框架,其独特的即插即用模型融合了多种工具,包括...
-
467亿参数MoE追平GPT-3.5!爆火开源Mixtral模型细节首公开,中杯逼近GPT-4
今天,Mistral AI正式放出了Mixtral 8x7B的技术细节—— 在大多数基准测试中,Mixtral的表现不仅优于Llama 2 70B,而且推理速度提高了整整6倍! 尤其是,它在大多数标准基准测试上与GPT-3.5打平,甚至略胜一筹。 新开源...
-
马斯克的AI机器人说自己不能违反OpenAI使用政策,业界分析:可能是这样
12月12日消息,特斯拉和SpaceX首席执行官埃隆·马斯克(Elon Musk)旗下人工智能创企xAI最近发布了其聊天机器人Grok,但好像出了点问题。 上周五,安全测试员贾克斯·温特伯恩(Jax Winterbourne)在社交媒体平台X上发布了一...
-
LLM之Prompt(二):清华提出Prompt 对齐优化技术BPO
论文题目:《Black-Box Prompt Optimization: Aligning Large Language Models without Model Training》 论文链接:https://arxiv.org/abs/2311.041...
-
TTS算法笔记:MusicLM- Generating Music From Text(AI生成音乐)
1. 介绍 摘要: 介绍了一个以文本作为条件,生成高保真、长时间片的音乐音频。比如文本为“由扭曲的吉他重复段伴奏的平静的小提琴旋律”,MusicLM可以可以根据文本条件,生成24kHz采样率,分钟级别的连续音乐音频。 从摘要中可以得知,这篇文章解决的根...
-
AIGC: 关于ChatGPT中的核心API调用示例
Open AI 的 api 调用示例 API的调用的文档:https://platform.openai.com/docs/api-reference/introduction ChatGPT官方提供了 Python版的包 和 Nodejs版的包...
-
像调鸡尾酒一样调制多技能大模型,智源等机构发布LM-Cocktail模型治理策略
随着大模型技术的发展与落地,「模型治理」已经成为了目前受到重点关注的命题。只不过,在实践中,研究者往往感受到多重挑战。 一方面,为了高其在目标任务的性能表现,研究者会收集和构建目标任务数据集并对大语言模型(LLM)进行微调,但这种方式通常会导致除目标任务...
-
LLM-SFT,新微调数据集-MWP-Instruct(多步计算 + 一、二元方程),微调Bloom, ChatGLM, LlaMA(支持QLoRA, TensorBoardX)
LLM-SFT 中文大模型微调(LLM-SFT , 支持模型(ChatGLM, LlaMA, Bloom , 支持(LoRA, QLoRA, DeepSpeed, UI, TensorboardX , 支持(微调, 推理, 测评, 接口 等. 项目...
-
【AIGC核心技术剖析】Hotshot-XL 一种 AI 文本转 GIF 模型(论文 + 代码:经过训练可与Stable Diffusion XL一起使用)
Hotshot-XL 是一种 AI 文本转 GIF 模型,经过训练可与Stable Diffusion XL一起使用。 Hotshot-XL 可以使用任何经过微调的 SDXL 模型生成 GIF。这意味着两件事: 您将能够使用您可能想要使用的任何现有或...
-
基于 AIGC,RocketMQ 学习社区探索开源软件学习新范式
AIGC 持续火爆全球,越来越多的场景开始接入并体现非凡的价值。其中应用广泛的场景之一就是智能知识问答,它改变了人们学习的方式,从阅读式到问答式,让知识的获取更加精准有效。开源软件拥有着广泛的求知群体,AIGC+ 社区的结合是学习型社区未来演进...
-
Stable Diffusion 文字生成图片如何写提示词
Stable Diffusion是一种基于神经网络的技术,通过输入提示词来生成相应的图片。为了获得高质量的图片输出,您需要选择合适的提示词,并确保它们能够激发模型的想象力和创造力。 以下是一些编写提示词的建议: 确定主题:首先,确定您希望生成的图片的...
-
Koala:加州大学BAIR团队使用ChatGPT蒸馏数据和公开数据集微调LLaMA模型得到
自从Meta发布LLaMA以来,围绕它开发的模型与日俱增,比如Alpaca、llama.cpp、ChatLLaMA以及Vicuna等等,相关的博客可以参考如下: 【Alpaca】斯坦福发布了一个由LLaMA 7B微调的模型Alpaca(羊驼),训练3小时...
-
弥合化学反应预训练和条件分子生成之间的差距,北大&望石智慧提出「统一」模型
化学反应是药物设计和有机化学研究的基础。研究界越来越需要一种能够有效捕获化学反应基本规则的大规模深度学习框架。 近日,来自北京大学和望石智慧的研究团队提出了一种新方法来弥合基于反应的分子预训练和生成任务之间的差距。 受有机化学机制的启发,研究人员开发了一...
-
专用于手机、笔记本,Stability.ai开源ChatGPT基因的大模型
12月8日,著名开源生成式AI平台stability.ai在官网开源了,30亿参数的大语言模型StableLM Zephyr3B。 Zephyr3B专用于手机、笔记本等移动设备,主打参数小、性能强、算力消耗低的特点,可自动生成文本、总结摘要等,可与70亿、...
-
【AIGC】提示词 Prompt 分享
提示词工程是什么? Prompt engineering(提示词工程)是指在使用语言模型进行生成性任务时,设计和调整输入提示(prompts)以改善模型生成结果的过程。它是一种优化技术,旨在引导模型产生更加准确、相关和符合预期的输出。 在生成性任务中...
-
还在担心发抖音没素材跟文案?[腾讯云HAI] AIGC带你蹭热度“今年你失去了什么?”
目录 ?前言: ?了解高性能应用服务 HAI ?即插即用 · 轻松上手 ?横向对比 · 青出于蓝 ?应用场景-AI作画 ?应用场景-AI对话 ?应用场景-算法研发 ?使用HAI进行AI作画 ?基于 ChatGLM2-6B 创作个人专属的知...
-
更强的Llama 2开源,可直接商用:一夜之间,大模型格局变了
已上微软 Azure,即将要上 AWS、Hugging Face。 一夜之间,大模型格局再次发生巨变。 一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题,一直不可免费商用。 今日,Meta 终于发布了大家期待...
-
【InsCode Stable Diffusion 美图活动一期-关于梦里的那位古风美少女】如何快速拥有一位古风少女?一起来调试AI绘图,训练你自己的专属模型~
InsCode Stable Diffusion 美图活动一期-关于梦里的那位古风美少女 1️⃣ 工具介绍 2️⃣ 在线地址及使用教学 3️⃣ 我的模型及输出图片 3.1 模型版本及相关配置 3.2 图片生成提示词和反向提示词 3.3 种子...
-
AI - AI绘画的精准控图(ControlNet)
一、介绍 在上一篇《AI - stable-diffusion(AI 绘画 的搭建与使用》 中, 介绍了 SD 的环境搭建与使用,搭配各种特色模型文件,SD 的文生图功能就可以根据我们输入的提示词(Prompt),绘制出各种各样的精美图片。但是,在深度...
-
研究发现:ChatGPT在回答患者用药问题方面表现不佳
近期研究测试了ChatGPT回答患者关于药物问题的能力,发现这一人工智能模型的答案在大约75%的情况下是错误或不完整的。这项研究结果于本周在美国药剂师协会的年会上公布,引起了极大关注。 在该研究中,对ChatGPT的免费版本进行了测试,该版本拥有超过1亿用...
-
在 Mac M1 上运行 Llama 2 并进行训练
在 Mac M1 上运行 Llama 2 并进行训练 Llama 2 是由领先的人工智能研究公司 Meta (前Facebook)开发并发布的下一代大型语言模型 (LLM 。 它基于 2 万亿个公共数据 token 进行了预训练,旨在帮助开发人员和...
-
深度学习实战28-AIGC项目:自动生成定制化的PPT文件
大家好,我是微学AI,今天给大家介绍一下深度学习实战28-AIGC项目:自动生成定制化的PPT文件,AIGC项目是一个基于自然语言处理技术的创新性项目,旨在利用ChatGPT模型生成定制化的PPT文件。该项目主要应用于商务和教育领域,可以帮助用户快速创建具...
-
一分钟玩转Stable Diffusion
用计算机视觉模型生成各种各样的图片已经不是什么新鲜的事了,但是最近新出的一款AI绘画模型Stable Diffusion确实惊艳到了各位小伙伴,无论是从软件的使用难度还是绘画生成的结果,都有可圈可点的地方,下面我们就一起尝试用该AI绘画软件画出一幅精美的图...
-
stable diffusion使用简明教程
controlNet模块使用 Enable选项启用,使用Openpose Edito中姿势生成需要将Openpose Editor指定为none状态。 上面骨骼图是通过Openpose Editor调整姿势然后send to txt2img...
-
细数【SD-WEBUI】的模型:谁是最适合的模型&从哪里找到它们
文章目录 (零)前言 (一)基础模型(Stable-Diffusion模型) (1.1)ChilloutMix(仿真) (1.2)BasilMix(仿真) (1.3)BeautyProMix(仿真) (1.4)ChikMix(仿真) (1.5...
-
AI视野:谷歌推多模态大模型Gemini;抖音上线抖音心晴;苹果发布 MLX 模型框架;Meta推出AI图像生成器网站
????大模型动态 谷歌发布Gemini 谷歌推出多模态大模型Gemini1.0,具备处理文本、代码、音频、图像和视频等多种信息的能力,分为Ultra、Pro和Nano三种规模,性能超越领先模型,Gemini Ultra在多任务语言理解中首次超越人类专家水...
-
Meta 推出独立的 AI 图像生成器,目前免费但只支持英文提示词
IT之家 12 月 7 日消息,Meta 公司日前推出全新的、独立的 AI 图像生成器 ——Imagine with Meta,允许用户通过自然语言描述来创建图像。 据介绍,新的人工图像生成器由 Meta 现有的 Emu 图像生成模型提供支持,可根据文...
-
Stable Diffusion WebUI使用AnimateDiff插件生成动画
AnimateDiff 可以针对各个模型生成的图片,一键生成对应的动图。 配置要求 GPU显存建议12G以上,在xformers或者sdp优化下显存要求至少6G以上。 要开启sdp优化,在启动参数加上--sdp-no-mem-attention 实...
-
大模型LLaMA和微调LLaMA
1.LLaMA LLaMA的模型架构:RMSNorm/SwiGLU/RoPE/Transformer/1-1.4T tokens,和GPT一样都是基于Transformer这个架构。 1.1对transformer子层的输入归一化 与Transf...
-
AIGC产业研究报告 2023——图像生成篇
易观:今年以来,随着人工智能技术不断实现突破迭代,生成式AI的话题多次成为热门,而人工智能内容生成(AIGC)的产业发展、市场反应与相应监管要求也受到了广泛关注。为了更好地探寻其在各行业落地应用的可行性和发展趋势,易观对AIGC产业进行了探索并将发布AIG...
-
Stable-Diffusion 在线部署
Stable-Diffusion 在线部署 1. 注册 链接:https://aistudio.baidu.com/aistudio/newbie?invitation=1&sharedUserId=4982053&sharedUs...
-
借助国内ChatGPT平替+剪映/百度AIGC平台快速制作短视频
系列文章目录 借助国内ChatGPT平替+MindShow,飞速制作PPT 借助国内ChatGPT平替+markmap/Xmind飞速生成思维导图 利用ChatGPT编写Excel公式,对比讯飞星火与ChatGPT对Excel公式的回答...
-
AI绘画后面的论文——ControlNet:Adding Conditional Control to Text-to-Image Diffusion Models
AI绘画后面的论文——ControlNet:Adding Conditional Control to Text-to-Image Diffusion Models 代码:lllyasviel/ControlNet: Let us control di...
-
3张照片打造专属形象!酷蛙FaceChain解密个人写真开源项目,人人AIGC!
一、背景说明 各类AI写真软件由于其精准的个人形象+精美的生成效果引爆了朋友圈传播,证件照满足了用户刚需,古装照等风格照满足了用户“美照”的需求。 酷蛙FaceChain开源项目团队推出了开源版本,希望结合开源社区开发者的力量,可以让图片应用更有趣、更...
-
DDPM详解 AI绘画
话说DDPM DDPM模型,全称Denoising Diffusion Probabilistic Model,可以说是现阶段diffusion模型的开山鼻祖。不同于前辈GAN、VAE和flow等模型,diffusion模型的整体思路是通过一种偏...
-
开源语言大模型演进史:向LLaMA 2看齐
本文是开源 LLM 发展史系列文章的第三部分。此前,第一部分《开源语言大模型演进史:早期革新》回顾了创建开源 LLM 的最初尝试。第二部分《开源语言大模型演进史:高质量基础模型竞赛》研究了目前可用的最受欢迎的开源基础模型(即已进行预训练但尚未微...
-
AIGC专栏5——EasyPhoto AI写真照片生成器 sd-webui插件介绍、安装与使用
AIGC专栏5——EasyPhoto AI写真照片生成器 插件安装与使用 学习前言 源码下载地址 技术原理储备(SD/Control/Lora) StableDiffusion ControlNet Lora EasyPhoto插件简介 E...
-
AI研究者成功通过“诗歌攻击”揭示ChatGPT的训练数据来源
来自 Google Deepmind、华盛顿大学、康奈尔大学、卡内基梅隆大学、加州大学伯克利分校和苏黎世联邦理工学院的一组研究人员成功地让 Open AI 的聊天机器人 Chat GPT 揭示了用于训练 AI 模型的一些数据。 研究团队使用了一种创新性的手...
-
矩阵模拟!Transformer大模型3D可视化,GPT-3、Nano-GPT每一层清晰可见
「矩阵模拟」的世界或许真的存在。模拟人类神经元,不断进化的Transformer模型,一直以来都深不可测。 许多科学家都试着打开这个黑盒,看看究竟是如何工作的。 而现在,大模型的矩阵世界,真的被打开了! 一位软件工程师Brendan Bycroft制作了...
-
GPT-4在医学问题上击败了专业调优的 MedPaLM 2 模型
在研究中,微软的研究人员展示了GPT-4在医学知识测试中的卓越表现,特别是当结合先进的提示工程技术时,其性能超过了专业调整的MedPaLM2。 研究结果显示,相较于费时费力的调优和模型训练,将更有效的提示工程应用于主流通用模型可能是实现更准确结果的更好途径...
-
AI视觉字谜爆火!梦露转180°秒变爱因斯坦,英伟达高级AI科学家:近期最酷的扩散模型
AI画的玛丽莲·梦露,倒转180°后,竟然变成了爱因斯坦?! 这是最近在社交媒体上爆火的扩散模型视错觉画,随便给AI两组不同的提示词,它都能给你画出来! 哪怕是截然不同的对象也可以,例如一位男子,经过反色处理,就神奇地转变成一名女子: 就连单词也能被...
-
Midjourney, Stable XL, Dall.E-3文生图三强效果对比
AI文生图的大争之世,各种文生图的模型此起彼伏,博眼球的更是不在少数。不过目前生成效果最好的依然还是老牌的三强,Midjourney, Stable Diffusion XL,以及Dall.E -3。 我们先来对比一下这三...
-
AI绘画本地部署Stable Diffusion web UI
AI绘画本地部署Stable Diffusion web UI 一 、项目介绍 A browser interface based on Gradio library for Stable Diffusion. 项目地址:GitHub - AUTOM...