-
ReSimAD:如何在没有真实数据的情况下,提升感知模型的泛化性能
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 自动驾驶车辆传感器层面的域变化是很普遍的现象,例如在不同场景和位置的自动驾驶车辆,处在不同光照、天气条件下的自动驾驶车辆,搭载了不同传感器设备的自动驾驶车辆,上述这些...
-
合成数据:2024年大数据行业预测
随着步入2024年,人工智能必然还是备受关注。本文围绕合成数据主题,讨论其对人工智能的影响,以及对其来年的一些技术预测。 2024年及以后,合成数据将如何影响人工智能的开发和部署? 2024年,由于现实世界图像的限制,对合成图像和训练数据的需求将不断增...
-
Stable Diffusion的模型选择,采样器选择,关键词
一、Stable Diffusion的模型选择: 模型下载地址:https://civitai.com/,需要科学上网。 Deliberate:全能模型,prompt越详细生成的图片质量越好 Realistic Vision:现实模型,生成仿真式图...
-
WAIC2023| AIGC究竟在向善还是向恶而行?
目录 一、常见图像篡改技术 二、传统篡改图像检测方法 2.1、基于光源和噪声的拼接图像篡改检测方法 2.2、基于马尔科夫特征的检测方法 三、基于深度学习的图像篡改检测方法 3.1、基于Fisher编码和SVM模型的方法 3.2、 基于...
-
AI战争迫近,ChatGPT解除军用禁令
上周末,人工智能领头羊企业OpenAI悄悄从ChatGPT使用政策中删除了禁止应用于军事用途的条款,这标志着人工智能武器化的潘多拉盒子已经打开。 值得注意的是,在OpenAI新政策曝光前不到一个月,美国国防部副部长希克斯在访问加州期间曾宣称,美国军方与...
-
哪些技术可能会在2024年重塑企业?
过去的2023年,见证了技术的快速发展,这些技术极大地改变了全球政府、公共部门、企业,甚至公众的生活。趋势表明,大型语言模型、元宇宙和生成人工智能中绿色数据中心的采用激增,这成为了人们谈论的话题,并且似乎仍然是人们关注的焦点。现在,更大的问题是,哪些技...
-
如何利用区块链技术应对Deepfake视频的威胁
在一个以数字创新为主导的时代,深度假视频的兴起已经成为一个普遍的担忧。深度造假(Deepfakes 是一种人工智能生成的视频,可以将图像操纵并叠加到现有的镜头上,它有可能以前所未有的规模欺骗和操纵观众。随着技术的进步,需要强有力的解决方案来应对日益严重...
-
AIGC之论文笔记DALL-E
文章目录 Zero-Shot Text-to-Image Generation 一. 简介 二. 方法 2.1. 第一阶段:Learning the visual codebook 2.1.1 回顾VQ-VAE 2.1.2...
-
McAfee发布“Mockingbird”计划以阻止AI语音仿冒骗局
McAfee最近推出了名为“Mockingbird”的项目,旨在应对使用人工智能生成的深度伪造技术进行音频欺诈的问题。该计划采用了McAfee的AI深度伪造音频检测技术,被命名为“Mockingbird”。 该技术是McAfee在2024年CES(消费电子...
-
AIGC之GPT-4:GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议)、使用方法、案例应用(计算能力/代码能力/看图能力等)之详细攻略
AIGC之GPT-4:GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议 、使用方法、案例应用(计算能力/代码能力/看图能力等 之详细攻略 解读:在2022年11月横空出世的ChatGPT,打遍天下无敌手的时候,就知道会有这么一天,...
-
AI平台:主页 - 一览运营宝
主页 - 一览运营宝 You need to enable JavaScript to run this app. 视频管理AI编剧AI绘图订单广场会员卡兑换注册/登录AI 编剧产生创意,搭建情节,智能生成脚本3步走,轻松g...
-
AI平台:HeyFriday - 智能AI写作工具(星期五)
HeyFriday - 智能AI写作工具(星期五) 新手教程产品价格社区企业定制Friday 101登录!!!一注册可免费试用5000字!!!Friday AI, 智能写作系统让你轻松生成高质量原创文章如此惬意,用喝一口咖啡的时间...
-
AI平台:米羊写完啦
米羊写完啦 个人身份登录微信登录请使用微信扫描二维码登录未注册过的微信号,我们将自动帮你注册账号继续扫码表示您已阅读并同意 隐私政策 和 在线服务协议Copyright © 2023 米羊科技(深圳)有限公司 粤ICP备2023103765...
-
新火种AI|抖音对AIGC亮明牌!AI虚拟人带货或将面临最大危机...
作者:小岩 编辑:小迪 12月19日,抖音官方发布了一则重要公告,宣布将严厉打击包括AIGC在内的6种新型违规行为。所谓AIGC,指的就是当下发展势头正劲的生成式人工智能。之所以要打击AIGC,其实是为了重点打击新型养号行为。 抖音志在打击黑灰产...
-
InsActor官网体验入口 AI物理模拟角色控制系统免费下载地址
InsActor是一款基于物理模拟的先进角色控制系统。它通过自然语言指令驱动角色,在复杂的环境中执行各种交互任务。这个系统结合了条件与对抗扩散模型进行多级规划,以及与低级控制器的结合,实现了流畅且鲁棒的控制。InsActor非常适合用于创意内容生成、互动娱...
-
大模型幻觉问题无解?理论证明校准的LM必然会出现幻觉
大型语言模型(LLM)虽然在诸多下游任务上展现出卓越的能力,但其实际应用还存在一些问题。其中,LLM 的「幻觉(hallucination)」问题是一个重要缺陷。 幻觉是指由人工智能算法生成看似合理但却虚假或有误导性的响应。自 LLM 爆火以来,研究人员...
-
相机制造商应对 AI 生成图片的崛起:通过嵌入数字签名来验证真实照片
随着 AI 生成图片在世界各地变得越来越普遍,相机制造商正在采取行动来应对这一挑战。他们计划通过在照片中嵌入数字签名来验证图片的真实性。 例如,尼康(Nikon)计划为摄影记者和其他专业摄影师提供带有认证技术的无反相机。据《日经亚洲》报道,这项技术将嵌...
-
昆仑万维或将引领国内 AIGC 技术发展
AIGC 发展历程 如果说 2021 年是元宇宙元年,那么 2022 年绝对可以称作 AIGC 元年。自从 Accomplice 于 2021 年 10 月推出 Disco Diffusion 以来,AIGC 受到了前所未有的关注,相关产品和技术更是以...
-
【达摩院OpenVI】AIGC技术在图像超分上的创新应用
团队模型、论文、博文、直播合集,点击此处浏览 一、背景 近10年来,深度学习技术得到了长足进步,在图像增强领域取得了显著的成果,尤其是以GAN为代表的生成式模型在图像复原、老片修复,图像超分辨率等方面大放异彩。图像超分辨率是视频增强方面,用...
-
AI视野:Midjourney V6史诗级升级;ChatGPT新增存档聊天记录功能;阿里DreaMoving开源;百度千帆AppBuilder开放
???AI新鲜事 Midjourney V6史诗级升级,网友惊呼太逼真! 网友在Midjourney V6第二次社区评价中惊叹其逼真神图,光影效果出众,上线倒计时,可能在今明两天内发布。 ChatGPT新增存档聊天记录功能 12月21日,OpenAI在...
-
创业公司推出AI圣诞老人,孩子可与之进行逼真语音通话
如果人工智能真的来抢人类的工作,那么这个星期可能是个好时机,尤其是帮助地球上最忙碌的人的时候。 总部位于西雅图的创业公司Fixie,专注于帮助企业将大型语言模型融入其软件堆栈,推出了HiSanta.ai。这是一个网络体验,让人们可以与圣诞老人、鲁道夫、圣诞...
-
DALL·E2(unCLIP)、Stable Diffusion、IS、FID要点总结
DALL·E 1 DALL·E 1可以看成是VQ-VAE和文本经过BPE编码得到的embedding AE(Auto Encoder) encoder decoder结构,AE在生成任务时只会模仿不会创造,所有有了后面的VAE VAE(Var...
-
编码碾压ChatGPT!UIUC清华联手发布7B参数Magicoder,代码数据权重全开源
开源「代码大模型」来了! UIUC清华团队的研究人员发布了Magicoder,不到7B参数,就能在代码生成领域与顶级代码模型不相上下。 值得一提的是,Magicoder的代码、权重和数据,毫无保留完全开源。 论文地址:https://arxiv.org...
-
UIUC清华联手发布全新代码大模型Magicoder 不到7B参数
在代码生成领域,UIUC和清华合作发布了Magicoder,这一全新的大型语言模型仅使用了7B参数,却能与顶级模型媲美,并以全面开源的方式分享了其代码、权重和数据。Magicoder的关键在于采用了OSS-INSTRUCT方法,该方法通过从开源代码中获取灵...
-
研究揭示如何 SEO 优化网站以提升 AI 搜索引擎中的可见性
由普林斯顿大学、佐治亚理工学院、艾伦人工智能研究所和 IIT 德里的研究人员团队进行的最新研究发现了多种提高网站在人工智能(AI)搜索引擎中可见性的方法。研究显示,这些优化方法成功使较小、排名较低的网站的可见性提高了 115%,使它们能够超越通常在搜索结果...
-
为AIGC敲响警钟!千亿级赛道为何成了作恶温床?
数据智能产业创新服务媒体 ——聚焦数智 · 改变商业 随着人工智能通用大模型的问世,全球对AIGC技术的强大潜力有了更加深刻的认识。然而,这也引发了诸多关于AIGC技术可信度、隐私保护以及知识产权等问题的争议,引起了广泛...
-
突发!GPT-4.5泄露传闻:是圣诞的礼物,还是传言的迷雾?
刚刚,一颗潜在的AI圈震撼弹——OpenAI 的 GPT-4.5版本——似乎无声地滑入公众的视线。 这份所谓的“泄露”信息,以及它预示的技术突破究竟意味着什么,目前仍是一个谜。 背景信息:GPT的演变 在深入泄露的细节之前,让我们简要回顾一下 GPT 模型...
-
还争什么「新闻女王」,AI要7x24小时播新闻了
「我要做一个星期七天的黄金时段新闻,」这是近期热播剧《新闻女王》里的一句台词。该剧讲述了几位主播在电视台内部明争暗斗的故事。人人都挖空心思,想全年无休连播七天黄金档。观众不禁感慨,他们真的太爱上班了。 不过,作为血肉之躯,哪怕再爱上班,人类主播也终究要休...
-
谷歌推出AI音乐创作工具“MusicFX”,几句话即可创作音乐
推出 MusicFX,这是一款开创性的新实验工具,让用户只需通过几句话即可生成原创的音乐作品。这项最新创新使用 Google 的 MusicLM 和 DeepMind 的水印技术 SynthID,在输出中创建独特的数字水印,确保创作的真实性和来源。 Mu...
-
四大AI视频工具“斗法” 一文教你怎么玩
AI视频工具赛道越来越卷,各种升级令人应接不暇,尤其是Gen-2、Pika1.0、Stable Video Diffusion、和Magic Animate,它们正在成为用户最常用的视频生成产品,背后有强大的AI大模型支撑。 尽管目前的视频类大模型还达不到...
-
Stable Diffusion 常用主流checkpoint模型
AbyssOrangeMix2 https://civitai.com/models/4437/abyssorangemix2-sfwsoft-nsfw dosmix https://civitai.com/models/6250/dosmix...
-
智谱AI发布中文 LLM 对齐评测基准AlignBench
智谱AI发布了专为中文大语言模型(LLM)而生的对齐评测基准AlignBench,这是目前第一个针对中文大模型的评测基准,能够在多维度上细致评测模型和人类意图的对齐水平。 AlignBench 的数据集来自于真实的使用场景,经过初步构造、敏感性筛查、参考答...
-
Meta AI 推出可重新调整光线的高保真头像生成方法 可用于制作动画生成新颖的表情
在 Meta AI 的一项开创性研究中,研究人员成功解决了动态3D 头像的高保真重新调整光线的挑战。传统方法在实时应用中捕捉面部表情的细节常常需要进行改进,尤其是对于捕捉亚毫米级细节的要求。Meta AI 的研究团队针对这一挑战提出了 “可重新调整光线的高...
-
关于AIGC的一些概念和应用
一.AIGC的技术特点以及在各个领域的应用 AIGC是指人工智能生成内容(Artificial Intelligence Generated Content)。这是一个基于人工智能技术的应用,它可以通过训练大量的数据,学习人类语言的特征和模式,并生成各种...
-
谷歌副总裁 Sissie Hsiao:Gemini AI 演示视频「完全真实」,尽管谷歌「为了简洁而缩短了部分内容」
在日益激烈的生成型 AI 市场竞争中,谷歌近期推出了其大型语言模型 Gemini 的预告视频。然而,有关该视频真实性的争议随后引发了广泛关注。 谷歌发布的演示视频展示了 Gemini 模型的多模态能力,能够巧妙地解读并处理来自实时视频和音频的信息。这对谷...
-
TTS算法笔记:MusicLM- Generating Music From Text(AI生成音乐)
1. 介绍 摘要: 介绍了一个以文本作为条件,生成高保真、长时间片的音乐音频。比如文本为“由扭曲的吉他重复段伴奏的平静的小提琴旋律”,MusicLM可以可以根据文本条件,生成24kHz采样率,分钟级别的连续音乐音频。 从摘要中可以得知,这篇文章解决的根...
-
现代技术能解决供应链危机吗?
通过利用先进技术,企业可以更好地了解和控制其供应链。 物联网、人工智能(AI 、区块链和数据分析可以帮助解决当前的供应链危机。 作为消费者,我们并不经常看到“无形”的供应链——所有人和移动部件背后的简单动作,点击购买产品,并能在家门口找到。然而,健康的...
-
开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件
大模型长期以来一直存在一个致命的问题,即生成幻觉。由于数据集的复杂性,难免会包含过时和错误的信息,这使得输出质量面临着极大的挑战。过多的重复信息还可能导致大型模型产生偏见,这也算是一种形式的幻觉。如何检测和有效缓解大模型的生成幻觉问题一直是学术界的热门课...
-
5个值得收藏的AI绘画网站,还有国产!
随着科技的发展,设计领域也迎来了科技创新,AI绘画网站便是其中的一个代表,本文精选了4个好用的AI绘画网站与大家分享,一起来看看吧! 1、即时灵感 作为一个国产的AI绘画网站,即时灵感支持设计师使用中文语言作为描述词来生成图片,它使用先进的自然语言处...
-
Stable Diffusion:开启AI魔法绘画的无限可能
? 个人网站:【 海拥】【神级代码资源网站】【办公神器】 ? 基于Web端打造的:?轻量化工具创作平台 ? 想寻找共同学习交流的小伙伴,请点击【全栈技术交流群】 随着人工智能技术的蓬勃发展,图像生成和艺术创作领域掀起了一股新的浪潮。在这股浪潮中,St...
-
抖音跳舞不用真人出镜,一张照片就能生成高质量视频!字节新技术连抱抱脸CTO都下场体验了
看!现在正有四位小姐姐在你面前大秀热舞: 以为是某些主播在短视频平台发布的作品? No,No,No。 真实答案是:假的,生成的,而且还是只靠了一张图的那种! 真实的打开方式是这样的: 这就是来自新加坡国立大学和字节跳动最新的一项研究,名叫Magic...
-
抖音AI扩图火出圈 网友:没想到是以这种奇怪的方式
近日,AI智能扩图在抖音平台掀起了一阵热潮,一位名为@占美丽的博主通过发布使用AI智能扩图生成的照片走红。在这些照片中,AI智能不仅将原有照片进行放大,还添加了月亮和具有魔幻意境的路灯,引起了近40万次的点赞和5万多次的转发。 AI智能扩图也顺势冲上热榜...
-
文献阅读:LLaMA: Open and Efficient Foundation Language Models
文献阅读:LLaMA: Open and Efficient Foundation Language Models 1. 文章简介 2. 模型训练 1. 训练数据 2. 模型结构 3. 模型训练 1. Optimiz...
-
ChatGPT一周年,Altman霸气重返OpenAI!自曝回归内幕Ilya去向待定
ChatGPT一周年之际,OpenAI发文官宣:Sam Altman重启OpenAI! 一年前的今天,他作为CEO,正在做着ChatGPT上线前最后的准备工作。他应该怎么也想不到,上线后这一年,会发生这么多事情。 今天OpenAI,也戴上了庆祝自己生...
-
Stable Diffusion - 真人照片的高清修复 (StableSR + GFPGAN) 最佳实践
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/132032216 GFPGAN (Generative Facial...
-
ChatGPT的Prompts关键词提示工程集合:包含AI绘画和GPT文本对话
文章目录 1 前言 2 Awesome ChatGPT Prompts 2.1 文本提示词 2.2 提示词汇总 2.3 绘画提示词 3 PromptBase 4 Prompt-Engineering-Guide 5 讨论 1 前...
-
AI视野:Azure AI新增40种大模型;Yi-34B-Chat微调模型开源;GPT-4在图灵测试中成功率超过41%;微软谷歌推出AI入门课程
???AI新鲜事 微软Azure AI新增40种大模型 微软宣布在Azure AI云开发平台中新增40个大模型,包括Whisper V3、Stable Diffusion、Phi、Falcon、SAM、CLIP、Code Llama等,支持文本生成、图像处...
-
索尼推出相机内真实性认证技术,应对 AI 合成图像挑战
随着人工智能(AI)图像日益逼真和 AI 图像创作门槛的降低,鉴别图像真伪变得尤为重要。索尼近日宣布推出一项新技术——相机内真实性认证技术,旨在应对这一挑战。 这项技术通过在拍摄时给图像文件添加基于机器的数字签名来解决问题。由于签名在相机内部应用,它消除...
-
通用人工智能(AGI)离我们还有多远
人工智能(AI)是当今科技领域最热门和最具影响力的话题之一,它已经渗透到了我们生活和工作的方方面面,从电影推荐和语音助手,到自动驾驶和医疗诊断。AI的发展也引发了人们对未来的想象和期待,尤其是对通用人工智能(Artificial General Inte...
-
UC伯克利研究人员推出Ghostbuster:用于检测 LLM 生成文本的最先进 AI 方法
LLM,如 ChatGPT,可以轻松地产生各种流利的文本,但是它们的准确性有多高呢?语言模型容易产生事实错误和幻觉,这让读者在决定是否相信一个信息来源时知道是否使用了这些工具来做新闻文章或其他信息文本的幽灵写作。这些模型的发展也引发了对文本的真实性和原创性...