-
HumanGaussian开源:基于Gaussian Splatting,高质量 3D 人体生成新框架
在 3D 生成领域,根据文本提示创建高质量的 3D 人体外观和几何形状对虚拟试穿、沉浸式远程呈现等应用有深远的意义。传统方法需要经历一系列人工制作的过程,如 3D 人体模型回归、绑定、蒙皮、纹理贴图和驱动等。为了自动化 3D 内容生成,此前的一些典型工作...
-
大模型就是「造梦机」,Karpathy一语惊人!人类才是「幻觉问题」根本原因
幻觉,早已成为LLM老生常谈的问题。 然而,OpenAI科学家Andrej Karpathy今早关于大模型幻觉的解释,观点惊人,掀起非常激烈的讨论。 在Karpathy看来: 另外,Karpathy的另一句话,更是被许多人奉为经典。他认为,与大模型相对的...
-
如何让Midjourney角色保持一致的5个核心技巧
hi,同学们,我是赤辰,本期是赤辰第2期AI教程或推荐实用AI工具,文章底部准备了粉丝福利,看完可以领取! 今天给大家介绍Midjourney5个控制AI绘画角色一致性的技巧。 近期整理了学员在使用Midjourney生图时遇到的一些问题,看看你是否曾...
-
Learn Prompt-Midjourney 图片生成
简介 随着 ChatGPT 的爆火,越来越多的人开始关注并尝试 AI 相关的应用。而图片生成就是其中一个备受瞩目的领域。目前已经有许多图像生成工具,如 Midjourney,Stable Diffusion,DALL-E,Firefly等。本课程主要是以...
-
Koala:加州大学BAIR团队使用ChatGPT蒸馏数据和公开数据集微调LLaMA模型得到
自从Meta发布LLaMA以来,围绕它开发的模型与日俱增,比如Alpaca、llama.cpp、ChatLLaMA以及Vicuna等等,相关的博客可以参考如下: 【Alpaca】斯坦福发布了一个由LLaMA 7B微调的模型Alpaca(羊驼),训练3小时...
-
Pika 1.0首测秒杀Gen-2!网友抢先体验电影级炸裂效果,背后技术细节首公开
Pika 1.0正式上线后,拿到内测资格的网友们已经玩疯了! 有人用它生成了一个姜黄色头发女孩和她的姜黄色猫的短片。 以往,因为一致性的难题,用AI视频很难做出优秀的动漫作品。但是Pika 1.0,实在是太给人惊喜了! 更令人震惊的是,作者表示,这是10...
-
GPT3.5 VS GPT-4写领导讲话稿,谁是最强笔杆子?
正文共 1240 字,阅读大约需要 5 分钟 文秘/公务员必备技巧,您将在5分钟后获得以下超能力: 快速生成领导讲话稿 Beezy评级 :B级 *经过简单的寻找, 大部分人能立刻掌握。主要节省时间。 推荐人 | Kim 编...
-
北大等发布最新AI智能体Jarvis-1,制霸「我的世界」
智能体研究又取得了新成绩! 最近,来自北大、北邮、UCLA和BIGAI的研究团队联合发表了一篇论文,介绍了一个叫做Jarvis-1的智能体。 论文地址:https://arxiv.org/pdf/2311.05997.pdf 从论文标题来看,Jarvi...
-
AIGC-AI内容生成深度产业报告
研报地址:AIGC-AI内容生成深度产业报告 随着人工智能技术的不断发展和进步,AI内容生成已经成为了一个热门的应用领域。其中,AIGC(AI Generated Content)是最为典型的应用之一。AIGC是指通过人工智能技术生成的各...
-
【AIGC实习急招!】联想数字化转型 GenAI 实习生
题解 | #字符串最后一个单词的长度# #include <iostream>#include <string>#include <algorithm>using 题解 | 利用with as拆解题目 ---...
-
后期狂喜!一张照片丝滑替换视频主角,动作幅度再大也OK|Meta&新加坡国立大学
后期狂喜了家人们~ 现在,只需一张图片就能替换视频主角,效果还是如此的丝滑! 且看这个叫做“VideoSwap”的新视频编辑模型—— 小猫一键变小狗,基操~ 如果原物体本身扭动幅度大一些?也完全没问题: 细看俩者之间的运动轨迹,给你保持得是一毛一样:...
-
DMP技术开源,可提升AI图像预测精度
Diffusion Models as Prior (DMP)是一种新的方法,它在AI生成的图像中提高了语义预测的准确性。该创新性方法巧妙地将预先训练的文本到图像模型应用于各种任务,例如3D属性估计和语义分割,在有限的训练数据下表现优于现有技术。 项目地...
-
云上使用 Stable Diffusion ,模型数据如何共享和存储
随着人工智能技术的爆发,内容生成式人工智能(AIGC)成为了当下热门领域。除了 ChatGPT 之外,文本生成图像技术更令人惊艳。 Stable Diffusion,是一款开源的深度学习模型。与 Midjourney 提供的直接将文本转化为图像的服务不同...
-
如何在Midjourney使用种子(指南)
想知道如何在旅途中使用种子吗? 许多Midjourney初学者都在努力保持他们的提示在Midjourney的结果非常一致。如果您正在寻找特定的结果,您可能会发现Midjourney的默认随机性水平是一个障碍,因为它为图像增加了很多内容。 在这篇文章中,...
-
MagicAnimate官网体验入口 AI文生动画工具软件app免费下载
《MagicAnimate》是一款使用扩散模型实现的时域一致的人体图像动画工具。它可以通过对人体图像进行扩散模型的运算,实现高质量、自然流畅的人体动画效果。《MagicAnimate》具有高度的可控性和灵活性,可以通过微调参数来实现不同的动画效果。它适用于...
-
抖音跳舞不用真人出镜,一张照片就能生成高质量视频!字节新技术连抱抱脸CTO都下场体验了
看!现在正有四位小姐姐在你面前大秀热舞: 以为是某些主播在短视频平台发布的作品? No,No,No。 真实答案是:假的,生成的,而且还是只靠了一张图的那种! 真实的打开方式是这样的: 这就是来自新加坡国立大学和字节跳动最新的一项研究,名叫Magic...
-
Mozilla 让人们将 AI LLM 变成单文件可执行文件,简化大型语言模型的分发和运行
供本地使用的 LLM(大型语言模型)通常作为一组权重分布在数 GB 文件中。这些软件不能直接单独使用,这通常使得它们比其他软件更难分发和运行。给定的模型也可能经历了更改和调整,如果使用不同的版本,则会导致不同的结果。 Mozilla 的创新团队最近发布了...
-
AI大模型,如何破圈而出?
一年即将过去,回望整个2023,我们会觉得这是一个毫无疑问的“AI大模型之年”。这一年里,全球兴起了数百个大模型。根据相关报道,仅仅在中国就有超过200个大模型,形成了名副其实的“百模大战”。 但有个问题不知道大家注意到没有?大模型虽多,但真正用到大模型的...
-
Llama 2 云端部署与API调用【AWS SageMaker】
Meta 刚刚发布了 Llama 2 大模型。如果你和我们一样,你一定会迫不及待地想要亲自动手并用它来构建。 推荐:用 NSDT设计器 快速搭建可编程3D场景。 使用任何类型的 LLM 进行构建的第一步是将其托管在某处并通过 API 使用...
-
一篇学会AI与Go语言无缝对接
在当今应用开发领域,类似OpenAI API等生成式AI技术的蓬勃发展正在彻底改变着应用开发的格局。Python和JavaScript等语言已经拥有丰富的资源来支持这些技术,其中LangChain就是一个显著的例子。然而,Go语言开发者面临的选择却相对有...
-
chartgpt+midjourney
chatGPT程序化生成故事 英文版脚本步骤 步骤一:在chatgpt中输入以下脚本,,标红为可变的文字,输入你想要的,目前是科幻,即科幻故事,你可以改为 fairy-tale,则写的是童话故事,等待回应 You are a {Genre} au...
-
不是大模型全局微调不起,只是LoRA更有性价比,教程已经准备好了
增加数据量和模型的参数量是公认的提升神经网络性能最直接的方法。目前主流的大模型的参数量已扩展至千亿级别,「大模型」越来越大的趋势还将愈演愈烈。 这种趋势带来了多方面的算力挑战。想要微调参数量达千亿级别的大语言模型,不仅训练时间长,还需占用大量高性能的内存资...
-
21Dak攻击:计算机顶会PLDI‘23 针对语义依附代码模型的对抗攻击方法:Destroyer篡改输入程序,Finder寻找关键特征,Merger关键特征注入【网安AIGC专题11.22】
Discrete Adversarial Attack to Models of Code 写在最前面 一些对关系抽取和事件抽取相关的启发和思考 摘要 总结与展望 课堂讨论 研究背景与意义 对抗攻击 针对代码模型的对抗攻击 Semanti...
-
RabbitMQ消息顺序性解密:保证消息的正确顺序
在分布式系统中,保证消息的正确顺序对于一些应用场景至关重要。而RabbitMQ作为一种流行的消息队列系统,本身并不提供严格的消息顺序保证。下面将探讨如何在使用RabbitMQ时实现消息的正确顺序,并介绍一些常见的解决方案和注意事项。 一、引言 Rabbi...
-
DetZero:Waymo 3D检测榜单第一,媲美人工标注!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 本文提出了一套离线3D物体检测算法框架DetZero,通过在 Waymo 公开数据集上进行全面的研究和评估,DetZero可生成连续且完整的物体轨迹序列,并充分利用长时序点云特征显着提升感知结果的质...
-
驶向未来,首个多视图预测+规划自动驾驶世界模型来了
近期,世界模型的概念引发了火热浪潮,而自动驾驶领域岂能隔岸观「火」。来自中科院自动化所的团队,首次提出了一种名为 Drive-WM 的全新多视图世界模型,旨在增强端到端自动驾驶规划的安全性。 网站:https://drive-wm.github.io...
-
阿里云免费使用stable diffusion三个月【ai生成图片】详细教程【保姆级】
起因 这两天关注了ai生成图片,尝试了mijiourney服务【比较贵没入手】,结果免费的没有了,没用上,换了国内的一些小程序体验了下 综合体验式是太慢了,而他们是基于国外开源的stable diffiusion模型开发的【可以比肩mijiourne...
-
【赠书第10期】从概念到现实:ChatGPT和Midjourney的设计之旅
文章目录 前言 1 ChatGPT的崛起 2 Midjourney的探索 3 技术创新的交汇 4 对未来的影响 5 结论 6 推荐图书 7 粉丝福利 前言 在过去的几年里,自然语言处理和聊天模型的领域取得了飞速的发展。ChatGPT...
-
构建实时推荐系统:利用MongoDB和机器学习算法
实时推荐系统是当今互联网应用中十分重要的一部分,能够根据用户的兴趣和行为,实时地提供个性化的推荐内容。下面将介绍如何利用MongoDB作为数据存储和管理的基础,并结合机器学习算法来构建一个高效的实时推荐系统。主要包括数据处理与存储、特征工程、机器学习模型...
-
构建大规模数据存储解决方案:探索MongoDB的横向扩展
MongoDB是一个非常适合构建大规模数据存储解决方案的NoSQL数据库。它通过横向扩展的方式来应对不断增长的数据量和负载需求。下面将详细介绍MongoDB的横向扩展机制,并探索如何使用MongoDB来构建高性能、可伸缩的大规模数据存储解决方案。 横向扩...
-
一种新型的NeRF技术可以将视频转换成易于控制的3D模型
译者 | 布加迪 审校 | 重楼 由于人体运动的复杂性和外观在不同环境下的细微差异,由视频片段创建逼真的动画3D模型一直是计算机图形学领域面临的长期挑战。在过去,这个过程依赖成本高昂的劳动密集型技术,比如多摄像头装置和详细的手动建模,因而无法用于普通或...
-
Stable Diffusion - 真人照片的高清修复 (StableSR + GFPGAN) 最佳实践
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/132032216 GFPGAN (Generative Facial...
-
【AIGC】【AI绘画】controlNet介绍(原理+使用)
文章目录 安装教程 1.环境安装 2. 下载预训练的模型文件 3.运行(生成可视化界面) 1、ControlNet:AI绘画 1.1、ControlNet的本质是文生图(txt2img 2.2、预处理器 & 模型选择 1.3、参...
-
LCM:大大加快生成高质量图像的新方法
作者丨Mike Young 译者 | 布加迪 审校 | 重楼 出品 | 51CTO技术栈(微信号:blog51cto) 图片 得益于一种名为潜在一致性模型(LCM)的新技术,文本转换成图像的AI即将迎来重大飞跃。潜在扩散模型(LDM)等传统方法在使用...
-
22LLMSecEval数据集及其在评估大模型代码安全中的应用:GPT3和Codex根据LLMSecEval的提示生成代码和代码补全,CodeQL进行安全评估【网安AIGC专题11.22】
LLMSecEval: A Dataset of Natural Language Prompts for Security Evaluations 写在最前面 主要工作 课堂讨论 大模型和密码方向(没做,只是一个idea) 相关研究 提示集目...
-
人人都能用好大模型-结构化的Prompt让你轻松上手
Prompt,中文可以翻译为提示词,是一种用于引导大模型生成特定内容的文本输入。Prompt的作用是告诉大模型你想要它做什么,以及给它一些必要的信息和约束条件。Prompt的好坏直接影响了大模型的输出质量和效率。 Prompt的写作是一门艺术,也是一门科...
-
Midjourney 参数合集
探索Midjourney之旅,学习绘画与AI,一同成长。加入「阿杰与AI」公众号,参与内容社群建设。 1.Midjourney 新手快速起步指南 2.Prompts-提示指令 3.Explore Prompting-提示指令的探索 4.Blend-叠加...
-
AI测试|史上最全,细数AIGC在测试领域落地的困难点
一、引言&背景 自2022年由横空出世的ChatGPT引发的各类AIGC(Generative AI)爆发以来,人们对其在各个领域的应用潜力产生了极大的兴趣。在研发领域,各种研究已经证明了Github Copilot在研发效能提高上的积极作用。...
-
调教 文心一言 生成 AI绘画 提示词(Midjourney)
文章目录 第一步 第二步 第三步 第四步 第五步 第六步 第七步 第八步 文心一言支持连续对话 我瞎玩的非专业哈哈 第一步 你好,今天我们要用扩散模型创建图像。我会给你提供一些信息。行吗? 第二步...
-
亚马逊推出 AI 编程工具 CodeWhisperer 正式版,可检测代码中存在的漏洞
IT之家 11 月 29 日消息,亚马逊在去年 6 月推出了 AI 编程工具 CodeWhisperer 的预览版,而在今日的“AWS re:Invent 2023”活动中,亚马逊公布了 CodeWhisperer 的正式版本。 亚马逊声称,开发人员经...
-
斯坦福华人博士文生视频Pika 1.0爆火!4人公司估值2亿,OpenAI联创参投
【新智元导读】仅有四人的初创公司,已经融资5500万美元,融资名单几乎集齐了硅谷的半壁江山,半年用户超50万,今天,Pika1.0闪亮登场,电影级特效震撼全网。 Runway Gen-2最强竞品Pika,暌违半年忽然放出大招——Pika1.0正式发布! 仅...
-
AIGC之GPT-4:GPT-4的简介与详细攻略
AIGC之GPT-4:GPT-4的简介与详细攻略 简介 欢迎来到人工智能生成内容(AIGC)时代的新篇章!本篇博客将介绍GPT-4(Generative Pre-trained Transformer 4)的核心原理、意义、亮点、技术点、缺点以及使...
-
B站UP主用AI为文言文配图 网友直呼“蚌埠住了”
国学经典《茅屋为秋风所破歌》与人工智能(AI)的奇妙碰撞,让人期待着会迸发怎样的火花。 UP主“当铺小说家”巧妙地将文言文原文作为提示词,启动AI绘画过程,让每句古诗都在画面中得以生动展现。这一创意的封面首先引人注目,呈现了一幅茅屋,被秋风呼啸,落叶飘舞,...
-
GPT-4+物理引擎加持扩散模型,生成视频逼真、连贯、合理
扩散模型的出现推动了文本生成视频技术的发展,但这类方法的计算成本通常不菲,并且往往难以制作连贯的物体运动视频。 为了解决这些问题,来自中国科学院深圳先进技术研究院、中国科学院大学和 VIVO AI Lab 的研究者联合提出了一个无需训练的文本生成视频新框架...
-
谷歌:LLM找不到推理错误,但能纠正它
今年,大型语言模型(LLM)成为 AI 领域关注的焦点。LLM 在各种自然语言处理(NLP)任务上取得了显著的进展,在推理方面的突破尤其令人惊艳。但在复杂的推理任务上,LLM 的表现仍然欠佳。 那么,LLM 能否判断出自己的推理存在错误?最近,剑桥大学和...
-
GPT-4+物理引擎加持扩散模型,生成视频逼真、连贯、合理
扩散模型的出现推动了文本生成视频技术的发展,但这类方法的计算成本通常不菲,并且往往难以制作连贯的物体运动视频。 为了解决这些问题,来自中国科学院深圳先进技术研究院、中国科学院大学和 VIVO AI Lab 的研究者联合提出了一个无需训练的文本生成视频新框...
-
LLMLingua:集成LlamaIndex,对提示进行压缩,提供大语言模型的高效推理
大型语言模型(llm 的出现刺激了多个领域的创新。但是在思维链(CoT 提示和情境学习(ICL 等策略的驱动下,提示的复杂性不断增加,这给计算带来了挑战。这些冗长的提示需要大量的资源来进行推理,因此需要高效的解决方案,本文将介绍LLMLingua与专有的...
-
ChatGPT vs AutoGPT:比较顶级语言模型
理解 ChatGPT 由 OpenAI 开发的 ChatGPT 是一种语言模型,旨在根据接收到的输入生成类似于人类的文本。它使用一种称为 Transformer 的机器学习技术,使其能够生成连贯且与上下文相关的响应。 ChatGPT 的一个关键功能是它能...
-
Open Vocabulary Detection 开放世界目标检测竞赛 2023获胜团队方案分享
OVD技术简介 目标检测是计算机视觉领域中的一项核心任务,其主要目标是让计算机能够自动识别图片中目标的类别,并准确标示每个目标的位置。目前,主流的目标检测方法主要针对闭集目标的开发,即在任务开始之前需要对待检测目标进行类别定义,并进行人工数据标注,通...
-
六个常用的聚类评价指标
评估聚类结果的有效性,即聚类评估或验证,对于聚类应用程序的成功至关重要。它可以确保聚类算法在数据中识别出有意义的聚类,还可以用来确定哪种聚类算法最适合特定的数据集和任务,并调优这些算法的超参数(例如k-means中的聚类数量,或DBSCAN中的密度参数 ...