-
GPT成熟之路官方笔记 | OpenAI开发者日
ChatGPT产品打造的细节,现在OpenAI自己交了个底。 并且这波干货分享真是信息量满满,包括但不限于: ChatGPT背后的产品和研发团队如何协作 大模型应用如何从原型走向成熟 OpenAI如何优化大模型性能…… 以上信息,依然来自今年的新晋...
-
任务 13、MidJourney种子激发极致创作,绘制震撼连贯画作
13.1 任务概述 通过本次实验任务,学员将深入了解Midjourney种子的概念和重要性,以及种子对生成图像的影响。他们将学会在Midjourney平台中设置种子值并调整其参数,以达到所需的效果。此外,任务还详细介绍了Midjourney V4.0版本...
-
AI视野:ElevenLabs发布“语音转语音”;realme GT5Pro 12月7日发布;Claude2.1被指严重虚标;清华大学提出全新加速训练大模型方法SoT
???AI应用 ElevenLabs发布“语音转语音” ElevenLabs的语音生成式AI平台发布了“语音转语音”功能,用户可上传语音并自动转换为不同音色,实现声音的自由切换,为用户带来全新的语音生成体验。 免费体验地址:https://elevenl...
-
Stable Diffusion — ControlNet 超详细讲解
Stable Diffusion — ControlNet 超详细讲解 ControlNet 最近非常火?!ControlNet 和 Stable Diffusion 的结合使 Stable Diffusion 能够接受指导图像生成过程的条件输入,从而增...
-
视频生成新突破:PixelDance,轻松呈现复杂动作与炫酷特效
最近,除了大语言模型继续持续刷屏,视频生成技术也取得了重大进展,多家公司相继发布了新模型。 首先,作为最早探索视频生成领域的领头羊之一,Runway 升级了其 Gen-2 模型,带来了电影级别的高清晰度,令人瞩目,并称视频生成的一致性得到了重大改进。 但...
-
AI生成视频入局新卷王,上线不到48小时,网友“大片”刷屏X
AI视频生成工具卷起来了! 本周二,Stability AI低调发布了首个开源AI视频模型Stable Video Diffusion(以下简称SVD),同时还晒出测试数据称,SVD的模型性能碾压RunwayML、Pika Labs等领先的闭源商业模型。...
-
牛津大学AI研究员发出警告:大语言模型对科学真相构成风险
在最新的一篇研究中,牛津大学互联网研究所的人工智能研究员发出了对大语言模型(LLMs)对科学真相构成威胁的警告。由Brent Mittelstadt、Chris Russell和Sandra Wachter等研究员在《自然人类行为》期刊上发表的论文中,他们...
-
云平台部署Stable-Diffusion-Webui及使用手册(超详细)
目录 一、环境搭建及Stable-Diffusion-Webui 系统配置 基础环境配置 正式部署Stable Diffusion 二、Stable-Diffusion-Webui使用手册 三、参考链接 一、环境搭建及Stabl...
-
OpenAI的危机已消除,人工智能的未来何去何从?
OpenAI是一个致力于创造和推广人工智能(AI)的非营利组织,它的愿景是建立一个能够与人类智能相匹配或超越的通用人工智能(AGI),并确保它对人类和自然有益。然而近期,OpenAI的内部发生了一场震惊世界的政变,其首席执行官Sam Altman被董事会...
-
借助 ControlNet 生成艺术二维码 – 基于 Stable Diffusion 的 AI 绘画方案
背景介绍 在过去的数月中,亚马逊云科技已经推出了多篇博文,来介绍如何在亚马逊云科技上部署 Stable Diffusion,或是如何结合 Amazon SageMaker 与 Stable Diffusion 进行模型训练和推理任务。...
-
Midjourney AI绘画中文教程详解(完整版)模型、命令、参数与各种高级用法
我有一种预感,您一下子看不完这篇内容,您得【收藏】一下,以便下次接着看~~ Midjourney AI绘画中文教程,Midjourney是一款2022年3月面世的AI绘画工具,创始人是David Holz。 只要输入想到的文字,就能通过人工智能产...
-
数据分层:打造数据资产管家
一、引言 随着企业数据规模的增长,数据的价值变得越来越重要。然而,传统的数据库在承载大量数据时面临挑战,需要高效有序的维护。因此,建立高效的数据仓库成为了企业决策和管理的基石,但现代技术的背景下,数据管理和保护仍然存在着重要挑战。 为了解决这些挑战,数...
-
图片变视频只需一“指”!Gen-2运动笔刷免费上线,网友:史上最强更新
“指”哪动哪,Gen-2全新“神笔马良”功能宣布正式上线: 所有用户包含免费账户(划重点)都能体验。 它的正式名叫“运动笔刷”(Motion Brush),十天前预告的时候就爆火。 只需对着图像任意位置一刷,就能让静止的一切物体动起来。 如Runwa...
-
谷歌 Deepmind 推出 Lyria AI 音频模型,可生成带有乐器和人声的音乐
11 月 21 日消息,Deepmind 日前推出了一款名为 Lyria 的音频模型,可用于生成带有乐器和人声的音乐。此外 Deepmind 还通过与 YouTube 合作,整合 Lyria 模型开发了音乐创作工具 Dream Track,声称可令...
-
【腾讯云 HAI域探秘】探索AI绘画之路:利用腾讯云HAI服务打造智能画家
目录 前言 1 使用HAI服务作画的步骤 1.1 注册腾讯云账户 1.2 创建算力服务器 1.3 进入模型管理界面 1.4 汉化界面 1.5 探索AI绘画 2 模型参数的含义和调整建议 2.1 模型参数的含义和示例 2.2 模型参数的调整...
-
AI「cosplay」关键在人设!复旦、人大等发布大五人格+MBTI测试:特质还原率达82.8%,拒绝OOC
想和喜欢的动漫小说角色聊天?想要一个虚拟伴侣?想要自己的数字智能体? 随着大语言模型(Large Language Models, LLM)的发展,这些过去的幻想似乎越来越近了。 Character AI、Chat 凉宫春日、病娇AI女友模拟器……基于大...
-
GenAI时代的数据治理蓝图
随着我们深入ML和GenAI领域,对数据质量的重视变得至关重要。KMS Technology高级技术创新小组的首席技术官John Jeske深入研究了数据治理方法,如数据沿袭跟踪和联合学习,以确保顶级模型的性能。 数据质量是模型可持续性和利益相关者信...
-
AI视野:奥特曼重回OpenAI;魔搭社区推出开源版GPTS;谷歌Bard遭遇提示注入攻击;Meta重组并解散AI监管团队
???AI新鲜事 反转!奥特曼重回OpenAI 据报道,OpenAI 前 CEO Sam Altman与前总裁Greg Brockman在 OpenAI 旧金山总部与公司高管会面。微软和其他投资人正在努力恢复Sam Altman的职位。 Emmett...
-
真正实现一步文生图,谷歌UFOGen极速采样,生成高质量图像
最近一年来,以 Stable Diffusion 为代表的一系列文生图扩散模型彻底改变了视觉创作领域。数不清的用户通过扩散模型产生的图片提升生产力。但是,扩散模型的生成速度是一个老生常谈的问题。因为降噪模型依赖于多步降噪来逐渐将初始的高斯噪音变为图片,因...
-
智能自动化:当计算机视觉、人工智能和AR集成时
智能自动化是一个相当新的概念,各行业尚未与其业务整合。 本文讨论了构成智能自动化的几个关键点。 对于开发人员而言,最有前途的技术是增强现实(AR 、虚拟现实(VR 和人工智能(AI 。虚拟现实(VR 是由游戏玩家为游戏玩家开发的,主要用于游戏和娱乐,而...
-
复旦、人大等发布大五人格+MBTI测试 角色扮演AI特质还原率达82.8%
近期,由复旦大学和中国人民大学合作的Chat凉宫春日团队发布了一项关于AI角色扮演的研究。该研究强调了良好的人设还原度对于评价AI角色扮演的重要性,特质还原率高达82.8%。研究使用了大五人格的NEO-FFI问卷和MBTI的16Personalities测...
-
「无需配对数据」就能学习!浙大等提出连接多模态对比表征C-MCR
多模态对比表示(multi-modal contrastive representation, MCR)的目标是将不同模态的输入编码到一个语义对齐的共享空间中。 随着视觉-语言领域中CLIP模型的巨大成功,更多模态上的对比表征开始涌现出来,并在诸多下游任...
-
SDXL-Stable Diffusion改进版
文章目录 1. 摘要 2. 算法: 2.1 结构: 2.2 微小的条件机制 2.3 多宽高比训练 2.4 改进自编码器 2.5 所有组合放到一起 2.6 主流方案比较 3. 未来工作 4. 限制 论文: 《SDXL: Improv...
-
BeautifulPrompt:PAI 推出自研 Prompt 美化器,赋能 AIGC一键出美图
背景 Stable Diffusion(SD)是一种流行的AI生成内容(AI Generated Content,AIGC)模型,能在文字输入的基础上生成各种风格多样的图像。在目前的AIGC方向,SD是开源社区最热门的模型。然而,SD能够生成高颜值的图像...
-
Midjourney用户手册中文版详解模型、命令、参数与高级用法
最近正在上手体验目前网上很火的 AI 绘画工具 Midjourney,在B 站上找了很多教程来看,现在基本可以上手用它生成很多好玩的图片了。 • Midjourney 入门教程:Midjourney零基础入门指南!小白轻松上手...
-
大模型「幻觉」,看这一篇就够了
大模型“幻觉”,终于有系统综述了! 一口气49页,详细阐述了幻觉定义、分类、导致幻觉的原因,还有检测幻觉、减轻幻觉的方法。 这篇最新综述来自哈工大和华为,一po出就在网上火得不行: 具体来说,文中用一套新的范畴框架来定义模型幻觉,并将其分为事实性幻觉、...
-
让Stable Diffusion一秒出图!清华硕士加速神器爆火,已有公司接入
AI图像生成,已经进入了秒速级别,只要4步推理就能完成绘制,最快更是能在1秒之内完成。 现在,清华大学联合HuggingFace的研究人员,推出了全新的绘图模型加速模块。 作者给出的体验版当中,点击生成按钮后,模型只用了几秒钟就绘制出了4张清晰的图像。...
-
CVPR 2023 | 去雨去噪去模糊,图像low-level任务,视觉AIGC系列
Learning A Sparse Transformer Network for Effective Image Deraining 基于Transformer的方法在图像去雨任务中取得了显著的性能,因为它们可以对重要的非局部信息进行建模,这对...
-
kafka个人笔记
大部分内容源于https://segmentfault.com/a/1190000038173886, 本人手敲一边加强印象方便复习 消息系统的作用 解耦 冗余 扩展性 灵活性(峰值处理 可恢复 顺序保证 缓冲 异步 解耦:扩展两边处理过程,只需...
-
亚马逊云科技实时 AI 编程助手 Amazon CodeWhisperer,开发快人一步!
近年来,随着 AI 技术的进步、基础设施建设的不断完善,AI 应用场景不断丰富,各类 AI 产品和工具层出不穷。其中,面向开发者的 AI 编程工具也在不断迭代,并因宣称能“帮开发者写代码”而引发关注。目前,可以为开发者提供编程建议的常用工具大致有两类:一类...
-
实时文生图速度提升5-10倍,清华LCM/LCM-LoRA爆火,浏览超百万
文生图、图生图已经不是什么新鲜事。但在使用这些工具的过程中,我们发现它们通常运行缓慢,导致我们要等一段时间才能拿到生成结果。 但最近,一种名叫「LCM」的模型改变了这种情况,它甚至能做到实时的连续生图。 图源:https://twitter.com/...
-
Agent4Rec来了!大模型智能体构成推荐系统模拟器,模拟真实用户交互行为
一直以来,推荐系统领域面临模型线上线下效果差距大的痛点问题,昂贵的线上 A/B 测试成本使得广大研究人员望而却步,也造成学术界的推荐系统研究与工业界的实际应用间的巨大割裂。随着大语言模型展现出类人的逻辑推理和理解能力,基于大语言模型的智能体(Agent)...
-
SymphonyAI发布突破性AI金融犯罪调查案例管理平台
SymphonyAI Sensa-NetReveal日前宣布推出Sensa Investigation Hub,这是亚太地区首个高影响力的AI变革金融犯罪调查和检测平台。该平台利用先进的预测和生成式AI技术,结合全球领先的风险和合规专业知识,为金融机构提供...
-
新加坡推Agent4Rec 大模型智能体构成推荐系统模拟器
推荐系统领域长期存在线上线下效果差距大的问题,Agent4Rec通过构建大语言模型智能体,模拟真实用户行为,为解决这一问题提供了新的思路。在Agent4Rec中,每个用户智能体由个性化模块构成,根据用户历史交互生成电影偏好,模拟用户在推荐系统中的行为。通过...
-
大模型幻觉排行榜GPT-4夺冠,英伟达科学家强力打假!Meta版ChatGPT一作发长文鸣冤
大模型的幻觉问题,是业内老生常谈的话题了。 最近,一个名为Vectara的机构,在GitHub推出了一个大模型幻觉排行榜。 结果显示,在总结短文档方面,GPT-4的表现最为优异,而Google Palm的两款模型直接垫底! 其中GPT-4的准确率为97...
-
LLM幻觉问题全梳理!哈工大团队50页综述重磅发布
幻觉,老朋友了。 自打LLM进入我们的视野,幻觉问题就一直是一道坎,困扰着无数开发人员。 当然,有关大语言模型幻觉的问题已经有了无数研究。 最近,来自哈工大和华为的团队发表了一篇50页的大综述,对有关LLM幻觉问题的最新进展来了一个全面而深入的概述。 这...
-
如何测试生成式人工智能(AIGC)
简介:在人工智能日趋普及的今天,生成式人工智能(AIGC)已经成为不可忽视的一个分支。从自动化生成新闻、编写代码到图像和音频生成,AIGC几乎无处不在。但如何确保这些生成的内容达到预期标准、安全可靠,同时又具有高度的可用性呢?这是一个值得细细思考的问题。...
-
如何构建新一代实时湖仓?袋鼠云基于数据湖的探索升级之路
在之前的实时湖仓系列文章中,我们已经介绍了实时湖仓对于当前企业数字化转型的重要性,实时湖仓的功能架构设计,以及实时计算和数据湖结合的应用场景。 在本篇文章中,将介绍袋鼠云数栈在构建实时湖仓系统上的探索与落地实践,及未来规划。 数栈为什么选择实时湖仓...
-
第四节 如何使用Midjourney工具完成图生图
正在上一节课中,我们学会如何使用MJ生成一张自己喜欢的图片,我们可以称其为文生图,既利用文字描述来生成一张图片。但是,文生图有个致命的缺陷就是随机性太强,你无法预料MJ生成的图片将会是怎么样的,运气好的话第一次生图就能得到满意的照片,运气不好可能要一直刷新...
-
stable diffusion图片转图片(教程)
图片转图片# 一般我们有两种途径对图像进行修复:PS 和 InPaint,使用方法也十分多样。 WebUI 使用 --gradio-img2img-tool color-sketch 启动会带入一个插件对图片进行颜色涂抹(这里不是 Inpaint ...
-
大模型幻觉率排行:GPT-4 3%最低,谷歌Palm竟然高达27.2%
人工智能发展进步神速,但问题频出。OpenAI 新出的 GPT 视觉 API 前脚让人感叹效果极好,后脚又因幻觉问题令人不禁吐槽。 幻觉一直是大模型的致命缺陷。由于数据集庞杂,其中难免会有过时、错误的信息,导致输出质量面临着严峻的考验。过多重复的信息还会...
-
NeRF与自动驾驶的前世今生,近10篇论文汇总!
神经辐射场(Neural Radiance Fields)自2020年被提出以来,相关论文数量呈指数增长,不但成为了三维重建的重要分支方向,也逐渐作为自动驾驶重要工具活跃在研究前沿。 NeRF这两年异军突起,主要因为它跳过了传统CV重建pipeline的...
-
Midjourney推出5.2版本,更新zoom out功能
Midjourney是一款专业的图像处理软件,它可以让用户轻松地创造出高质量的图像。它最近宣布推出了5.2版本,这是一个重大的更新,其中最亮眼的功能就是zoom out功能。 zoom out功能可以让用户无限地缩小原始图像,同时保持图像的清晰度和细节不...
-
UNC斯坦福等曝光GPT-4V意外漏洞,被人类哄骗数出8个葫芦娃!LeCun和Jim Fan震惊了
GPT-4V诞生后,惊艳的多模态能力让网友惊呼连连,连OpenAI总裁Greg Brockman都不断在X上安利。 不过,最近大家发现,只要打乱布局,GPT-4V就会被曾经解决的著名计算机视觉难题——「吉娃娃还是松饼」,再次难倒…… UCSC教授Xin...
-
Stable Diffusion - 扩展 Roop 换脸 (Face Swapping) 插件的配置与使用
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131856141 官网:GitHub - roop,参考论文:Ro...
-
AI视野:Runway推新功能运动笔刷;iPhone16将引入生成式AI;百度AI编程工具限时免费;元象大模型向全社会开放
???AI新鲜事 Runway推新功能运动笔刷 随手一涂静图变动图 Runway推出的新功能「运动笔刷」让Gen-2视频生成工具再次颠覆AI圈,摆脱文字依赖,手势操作即可赋予静态图片动感,创造可控制生成内容的新方法。 苹果计划在iPhone16上推出i...
-
文心一言4.0内测入口 文心一言新版本有哪些功能
百度文心一言4.0版本现在已经可以申请测试,4.0版本效果全面升级,能更好地帮助您的工作和生活,同时每3小时内畅享100次问答,这里我们来看下文心一言4.0版本的申请入口。 文心一言4.0(点击进入)是百度最新推出的一款人工智能大模型,它可以在多个场景和...
-
图像涂哪就动哪!Gen-2新功能“神笔马良”爆火,网友:急急急
AI搞视频生成,已经进化到这个程度了?! 对着一张照片随手一刷,就能让被选中的目标动起来! 明明是一辆静止的卡车,一刷就跑了起来,连光影都完美还原: 原本只是一张火灾照片,现在随手一刷就能让火焰直冲天际,热度扑面而来: 这样下去,哪还分得清照片和实...
-
【AI绘画】Stable Diffusion WebUI
???欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kuan 的首页,持续学习,不断总结,共同进步,活到老学到老 导航 檀越...
-
Stable Diffusion Web UI
Stable Diffusion Web UI 是一个基于 Stable Diffusion 的基础应用,利用 gradio 模块搭建出交互程序,可以在低代码 GUI 中立即访问 Stable Diffusion Stable Diffusion...