-
数字图像处理的图像操作
图像操作在计算机视觉和图像处理中发挥着至关重要的作用。这些操作对于诸如预处理、增强图像质量和启用高级算法等任务至关重要。在计算机视觉中,诸如调整大小、裁剪、调整亮度/对比度/伽玛和几何变换等操作是基础的。它们允许进行高效的计算、提取感兴趣区域、规范化图像...
-
神经网络是如何工作的? | 京东云技术团队
作为一名程序员,我们习惯于去了解所使用工具、中间件的底层原理,本文则旨在帮助大家了解AI模型的底层机制,让大家在学习或应用各种大模型时更加得心应手,更加适合没有AI基础的小伙伴们。 一、GPT与神经网络的关系 GPT想必大家已经耳熟能详,当我们与它...
-
【AIGC】Stable Diffusion原理快速上手,模型结构、关键组件、训练预测方式
【AIGC】Stable Diffusion的建模思想、训练预测方式快速 在这篇博客中,将会用机器学习入门级描述,来介绍Stable Diffusion的关键原理。目前,网络上的使用教程非常多,本篇中不会介绍如何部署、使用或者微调SD模型。也会尽量精简...
-
你真的看懂扩散模型(diffusion model)了吗?(从DALL·E 2讲起,GAN、VAE、MAE都有)
本文全网原创于CSDN:落难Coder ,未经允许,不得转载! 扩散模型简单介绍 我们来讲一下什么是扩散模型,如果你不了解一些工作,你可能不清楚它究竟是什么。那么我举两个例子说一下:AI作画(输入一些文字就可以得到与你描述相符的图像)和抖音大火的...
-
GTA6预告片播放过亿,AI三巨头也能秒变GTA匪帮
GTA 新出的游戏预告片看了吗?据说,这个预告片已经破了三项吉尼斯世界纪录,观看次数已经破亿。 但如果告诉你,AI 三巨头也可以成为 GTA 里的人物,你还能认出他们吗? AI 三巨头:Yann LeCun、Geoffrey Hinton 和 Yos...
-
字节跳动与中科大联手提出多模态文档大模型DocPedia
字节跳动与中国科学技术大学合作研发的多模态文档大模型DocPedia已成功突破了分辨率的极限,达到了2560×2560的高分辨率。这一成果是通过研究团队采用了一种新的方法,解决了现有模型在解析高分辨文档图像方面的不足。 在此研究中,提出了DocPedia,...
-
突破分辨率极限,字节联合中科大提出多模态文档大模型
现在连文档都有大模型了,还是高分辨率、多模态的那种! 不仅能准确识别出图像里的信息,还能结合用户需求调用自己的知识库来回答问题。 比如,看到图中马里奥的界面,直接就回答出了这是任天堂公司的作品。 这款模型由字节跳动和中国科学技术大学合作研究,于2023年...
-
文心一言与GPT-4比对测试!
Waitlist了三个星期,今天下午终于拿到了百度文心一言的体验资格,于是立刻展开测试。 根据文心一言网页端信息显示,目前最新发版是4月1号的版本,版本号是v1.0.3,应该是从上个月16号发布会以后又做了两版迭代。根据文心一言自己的回答,...
-
AIGC之GPT-4:GPT-4的简介与详细攻略
AIGC之GPT-4:GPT-4的简介与详细攻略 简介 欢迎来到人工智能生成内容(AIGC)时代的新篇章!本篇博客将介绍GPT-4(Generative Pre-trained Transformer 4)的核心原理、意义、亮点、技术点、缺点以及使...
-
单个A100生成3D图像只需30秒,这是Adobe让文本、图像都动起来的新方法
2D 扩散模型极大地简化了图像内容的创作流程,2D 设计行业也因此发生了变革。近来,扩散模型已扩展到 3D 创作领域,减少了应用程序(如 VR、AR、机器人技术和游戏等)中的人工成本。有许多研究已经对使用预训练的 2D 扩散模型,生成具有评分蒸馏采样(S...
-
南开大学与字节跳动研究人员推出开源AI工具ChatAnything:用文本描述生成虚拟角色
南开大学与字节跳动研究人员合作推出了一项引人注目的研究,发布了一种名为ChatAnything的全新AI框架。该框架专注于通过在线方式生成基于大型语言模型(LLM)的角色的拟人化形象,从而创造具有定制视觉外观、个性和语调的人物。 简答的说,ChatAnyt...
-
GPT-4V在自动驾驶上应用前景如何?面向真实场景的全面测评来了
GPT-4V 的发布让许多计算机视觉(CV)应用看到了新的可能。一些研究人员开始探索 GPT-4V 的实际应用潜力。 最近,一篇题为《On the Road with GPT-4V (ision : Early Explorations of Visua...
-
Meta重组并解散AI监管团队,成员转向生成式AI和AI基础设施团队
社交媒体巨头Meta宣布解散其负责监管人工智能(AI)项目的团队,此团队负责开发和部署AI。根据报道,Meta的负责AI监管的团队的许多成员已经过渡到公司的生成式AI产品团队,并有些人加入了AI基础设施团队。 图源备注:图片由AI生成,图片授权服务商Mi...
-
Meta 介绍 AI 图像编辑工具 Emu Edit / Video:使用 1000 万个数据集训练,号称远超竞品
IT之家 11 月 20 日消息,Meta 昨日宣布为 Facebook 和 Instagram 推出两款基于 AI 的图像编辑工具,分别是“Emu Edit”和“Emu Video”,适用领域包括照片和视频,目前 Meta 公布了这两项 AI 工具的更...
-
Meta 解散其 Responsible AI 团队,成员转至生成式 AI 产品部门
Meta 公司已解散其负责人工智能(AI)安全的「Responsible AI」(RAI)团队,该团队原本专注于监管 AI 项目的安全性。 据 Meta 发言人透露,大多数 RAI 团队成员已被重新分配到公司的生成式 AI 产品部门,而其他一些成员现在将...
-
OpenAI重磅更新:人人可定制GPT!马斯克2个月打造ChatGPT竞品公开叫板
11月7日凌晨2点,人工智能初创公司 OpenAI 举办首届 DevDay 开发者大会,其首席执行官山姆•阿尔特曼(Sam Altman)宣布了GPT-4、ChatGPT等AI平台的一系列增强功能与定价变化。这些变化有望使OpenAI的技术更加强大、灵活...
-
如何免费使用ChatGPT进行学术润色?你需要这些指令...
目录 1 ChatGPT4.0上线 2 中科院ChatGPT学术版 3 学术润色Prompts 1 ChatGPT4.0上线 2023年3月14日,OpenAI发布ChatGPT4.0。ChatGPT4.0比3.5更大,拥有更多的...
-
AIGC时代,我们如何使用“黑科技”,解决图像信息安全
前言 在当今社会,图像是信息传播和表达的重要方式之一。但是,随着技术的进步,人们可以轻松使用各种图像编辑软件来篡改、伪造图片,制造出看似真实但实际上虚假的场景。 这种现象无疑是给社会带来了一系列负面影响。首先,大量基于虚假图片产生的诈骗案件层出不穷。...
-
为何GPT-4P容易受到多模态提示注入图像攻击?
OpenAI新的GPT-4V版本支持图像上传后,带来了一条全新的攻击途径,使大型语言模型(LLM)容易受到多模态注入图像攻击。攻击者可以在图像中嵌入命令、恶意脚本和代码,随后模型会遵从行事。 多模态提示注入图像攻击可以泄露数据、重定向查询、生成错误信息,...
-
高通正式发布骁龙 8 Gen 3 旗舰芯片:为 2024 年安卓旗舰手机带来生成式 AI 革命
在今天的 2023 年夏威夷 Snapdragon 峰会上,高通公司正式发布了其最新的顶级芯片组 Snapdragon 8 Gen 3。借助于这款新芯片,预计 2024 年的 Android 旗舰手机将迎来备受期待的生成型人工智能(AI)革命。 Sna...