-
GPT-4V在自动驾驶上应用前景如何?面向真实场景的全面测评来了
GPT-4V 的发布让许多计算机视觉(CV)应用看到了新的可能。一些研究人员开始探索 GPT-4V 的实际应用潜力。 最近,一篇题为《On the Road with GPT-4V (ision : Early Explorations of Visua...
-
智能自动化:当计算机视觉、人工智能和AR集成时
智能自动化是一个相当新的概念,各行业尚未与其业务整合。 本文讨论了构成智能自动化的几个关键点。 对于开发人员而言,最有前途的技术是增强现实(AR 、虚拟现实(VR 和人工智能(AI 。虚拟现实(VR 是由游戏玩家为游戏玩家开发的,主要用于游戏和娱乐,而...
-
复旦、人大等发布大五人格+MBTI测试 角色扮演AI特质还原率达82.8%
近期,由复旦大学和中国人民大学合作的Chat凉宫春日团队发布了一项关于AI角色扮演的研究。该研究强调了良好的人设还原度对于评价AI角色扮演的重要性,特质还原率高达82.8%。研究使用了大五人格的NEO-FFI问卷和MBTI的16Personalities测...
-
自动驾驶中基于深度学习的预测和规划融合方法综述
本文经自动驾驶之心公众号授权转载,转载请联系出处。 Rethinking Integration of Prediction and Planning in Deep Learning-Based Automated Driving Systems: A...
-
效果超越SDXL!港中大博士生推出超真实人像合成工具,训练用了3.4亿张图
为了让AI画出的人更加逼真,港中大博士生用了3.4亿张图像专门训练画人。 人物的表情、姿态,环境的空间关系、光线都能合理布局,可谓立体感十足。 就连爆火的SDXL也不是它的对手,话不多说,直接上图! 这个模型的名字叫HyperHuman,主打的就是一个...
-
百度文心一言怎么样?
文心一言在3月16号发布,刚发布时只有邀请码体验,没有申请体验通道。到了晚上看到申请体验通道,便提交了申请,到4月1号过了半个月终于收到短信可以体验了。 本来想看看接口,也没什么恶意,但是却遭到了拒绝,感觉是小心翼翼,生怕泄露了什么。 另外...
-
SDXL-Stable Diffusion改进版
文章目录 1. 摘要 2. 算法: 2.1 结构: 2.2 微小的条件机制 2.3 多宽高比训练 2.4 改进自编码器 2.5 所有组合放到一起 2.6 主流方案比较 3. 未来工作 4. 限制 论文: 《SDXL: Improv...
-
掌握AI助手的魔法工具:解密Prompt(提示)在AIGC时代的应用「上篇」
在当今的AIGC时代,我们面临着越来越多的人工智能技术和应用。其中一个引人注目的工具就是Prompt(提示)。它就像是一种魔法,可以让我们与AI助手进行更加互动和有针对性的对话。那么,让我们一起来了解一下Prompt,它是什么,为什么需要它,怎么使用它以及...
-
AIGC:【LLM(一)】——LoRA微调加速技术
文章目录 一.微调方法 1.1 Instruct微调 1.2 LoRA微调 二.LoRA原理 三.LoRA使用 一.微调方法 Instruct微调和LoRA微调是两种不同的技术。 1.1 Instruct微调 Instr...
-
大模型「幻觉」,看这一篇就够了
大模型“幻觉”,终于有系统综述了! 一口气49页,详细阐述了幻觉定义、分类、导致幻觉的原因,还有检测幻觉、减轻幻觉的方法。 这篇最新综述来自哈工大和华为,一po出就在网上火得不行: 具体来说,文中用一套新的范畴框架来定义模型幻觉,并将其分为事实性幻觉、...
-
GPT、Llama等大模型存在「逆转诅咒」,这个bug该如何缓解?
来自中国人民大学的研究者将 Llama 等因果语言模型所遭遇的 “逆转诅咒” 归咎于 next-token prediction + causal language model 的本质缺陷,并发现 GLM 采用的自回归填空的训练方法对这种 “逆转诅咒”...
-
13B模型全方位碾压GPT-4?这背后有什么猫腻
一个参数量为 13B 的模型竟然打败了顶流 GPT-4?就像下图所展示的,并且为了确保结果的有效性,这项测试还遵循了 OpenAI 的数据去污方法,更关键的是没有发现数据污染的证据。 如果你细细查看图中的模型,发现只要带有「rephraser」这个单词...
-
基于文档的智能问答系统
基于文档的问答系统(Document-Based Question Answering System)是一种自然语言处理技术,用于回答用户提出的问题。它的原理是通过分析文档中的内容,提取出与用户问题相关的信息,并将其转换成可回答问题的格式。 ChatGP...
-
文心一言、讯飞星火与GPT-4/3.5在回答中文历史问题的表现
最近,随着备受关注的文心一言正式免费向全社会开放,再次引起了社会层面对国产大模型的兴趣。 以文心一言为代表的国产大模型性能究竟如何?如果将它们相互比较,并且和GPT系列模型等国际前沿水平的LLM进行比较,会得到什么样的结果呢?笔者对此...
-
OpenAI CEO和马斯克在线互怼:Grok真能叫板GPT-4吗?
最近,科技界的两大顶流——OpenAI CEO和马斯克“掐”起来了。 事情的起因是,Sam Altman发了一条推文,说“GPTs可以节省很多工作”,配图充满嘲讽意味,直指马斯克的AI聊天机器人Grok。 他让GPT Builder创建一个聊天机器人,以...
-
Insight量子位智库 ✪ AIGC/Al生成内容产业展望报告
AIGC全称为 Al-Generated Content,指基于生成对抗网络GAN、大型预训练模型等人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的技术。与之相类似的概念还包括Synthetic media,合成式媒体,主要指基...
-
让Ai帮你工作(4)--锁定图片生成角色
背景: Gpt4多模态模型上来后,MJ也是紧接着发布了V5,微软发布自己Ai作图工具,Abode、unity这些传统老牌作图软件工具也是紧跟着发布自己的AI作图插件工具。这已经标志着Ai作图已经成为计算成像的另一条生成链。 各大厂都已经发布了...
-
【NLP】Llama & Alpaca大模型
?大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流? ?个人主页-Sonhhxg_柒的博客_CSDN博客 ? ?欢迎各位→点赞? + 收藏⭐️ + 留言? ?系列专栏 - 机器学习【ML】 自然语言...
-
一文盘点2023人工智能进展,不止大模型而已
2023年大模型千帆竞发,除此外AI领域还有哪些新突破? 来来来,畅销书《Python机器学习》作者Sebastian Raschka的年末总结已经准备好了。 看完才知道: RLHF今年虽然爆火,但实打实用到的模型并不多,现在还出现了替代方案,有望从开...
-
IBM 推出 Watsonx.Governance,帮助企业和政府建立对生成式AI的信任
IBM 近日宣布将于12月初正式推出 watsonx.governance 工具包,该工具包旨在帮助企业和政府在生成式人工智能模型中建立更多的信任,消除数据输入和输出的不确定性。 虽然基于大型语言模型或基础模型的生成式人工智能为企业提供了许多用例,但同时...
-
CVPR 2023 | 去雨去噪去模糊,图像low-level任务,视觉AIGC系列
Learning A Sparse Transformer Network for Effective Image Deraining 基于Transformer的方法在图像去雨任务中取得了显著的性能,因为它们可以对重要的非局部信息进行建模,这对...
-
Altman首次自曝GPT-5加急训练中!暗示比GPT-4更复杂,无法预测真实能力
「OpenAI正在开发下一代大模型GPT-5。我们的意义所在,就是打造超凡脱俗的神奇AI智能」。 这是Sam Altman最近接受FT的一次采访中,首次对外透露了更多OpenAI的计划。 这篇文章信息量巨大! 他不仅谈到了OpenAI的融资想法,英伟达...
-
ChatGPT代码生成飙升10%!北大华人一作:细化prompt,大幅改进大模型代码能力
在大模型时代,高质量的代码生成已经强大到,让人惊叹。 从通过HumEval中67%测试的GPT-4,到近来各种开源大模型,比如CodeLlama,有望成为码农编码利器。 然而,现实中,程序员们不会精炼表达需求,因此误导、限制了LLM生成优秀代码的能力。...
-
一招分辨刷榜作弊大模型,博士小哥开源AI数学“照妖镜”
如今很多大模型都声称擅长数学,谁有真才实学?谁是靠背测试题“作弊”的? 有人在今年刚刚公布题目的匈牙利全国数学期末考试上做了一把全面测试。 很多模型一下子就“现原形”了。 先看绿色部分,这些大模型在经典数学测试集GSM8k和全新卷子上取得的成绩差不多,...
-
戳穿人工智能的六个谎言:辨别真伪
译者 | 布加迪 审校 | 重楼 人工智能(AI)无疑是我们这个时代的流行语。特别是随着ChatGPT等生成式AI应用程序的出现,AI大受欢迎,成为了技术大辩论的核心话题。 所有人都在谈论像ChatGPT这样的生成式AI应用程序的影响以及利用它们的能力...
-
AIGC入门 - LLM 信息概览
在阅读本文之前,建议阅读文章:《GPT,GPT-2,GPT-3,InstructGPT的进化之路》 本文将介绍以下 LLM OPT LLaMa Alpaca Vicuna Moss chatGLM Baichuan Openbuddy 一、OPT...
-
微调Whisper语音识别模型和加速推理
前言 OpenAI在开源了号称其英文语音辨识能力已达到人类水准的Whisper项目,且它亦支持其它98种语言的自动语音辨识。Whisper所提供的自动语音识与翻译任务,它们能将各种语言的语音变成文本,也能将这些文本翻译成英文。本项目主要的目的是为了对W...
-
AIGC视频生成/编辑技术调研报告
人物AIGC:FaceChain人物写真生成工业级开源项目,欢迎上github体验。 简介: 随着图像生成领域的研究飞速发展,基于diffusion的生成式模型取得效果上的大突破。在图像生成/编辑产品大爆发的今天,视频生成/编辑技术也引起了学术界和产...
-
Google Bard VS ChatGPT:哪个是更好的AI聊天机器人?
文章目录 前言 一、Bard和ChatGPT的宏观对比 二、应用场景不同 三、知识的时效性 四、未来的归宿 总结 前言 自从 OpenAI 向公众发布ChatGPT以来的过去几个月里,我们都见证了围绕 ChatGPT 的各种测评...
-
不是LlaMa套壳!李开复麾下大模型陷套壳争议,团队二次回应来了!
整理丨诺亚、小欧 出品 | 51CTO技术栈(微信号:blog51cto) 昨天科技圈社区Hacker News突然出现一则消息,矛头直指不久前发布的大模型Yi-34B,认为其除了两个张量被重新命名外,完全使用了Llama的架构。 图片 而根据公开信息,...
-
解释:生成式 AI的工作机制与差异
像 ChatGPT 这样强大的生成式 AI 系统是如何工作的,它们与其他类型的人工智能有何不同? 快速浏览一下头条新闻,就会发现生成式人工智能如今无处不在。事实上,其中一些标题实际上可能是由生成式人工智能撰写的,例如 OpenAI 的 ChatGPT,...
-
LLM幻觉问题全梳理!哈工大团队50页综述重磅发布
幻觉,老朋友了。 自打LLM进入我们的视野,幻觉问题就一直是一道坎,困扰着无数开发人员。 当然,有关大语言模型幻觉的问题已经有了无数研究。 最近,来自哈工大和华为的团队发表了一篇50页的大综述,对有关LLM幻觉问题的最新进展来了一个全面而深入的概述。 这...
-
IBM 推出 Watsonx.governance 以提升企业 AI 模型透明度和治理能力
IBM 今日宣布,旗下产品 Watsonx.governance 将于 12 月初正式面市,旨在帮助企业提升对人工智能模型的透明度,消除数据中的神秘面纱。 在大型语言模型(LLM)或基础模型的推动下,生成式人工智能为企业带来诸多用途,但同时也引发新的风险...
-
Ghostbuster:一个准确度高的AI生成文本检测工具
大语言模型如ChatGPT,以其卓越的写作能力引发了问题。学生们纷纷利用这些模型代写作业,导致一些学校不得不采取禁止ChatGPT的措施。此外,这些模型还存在生成带有事实错误的文本的倾向,因此谨慎的读者可能想知道,在信任某些新闻文章或其他来源之前,是否有生...
-
【类ChatGPT】本地CPU部署中文羊驼大模型LLaMA和Alpaca
昨天在github上看到一个在本地部署中文大模型的项目,和大家分享一下。先把地址po出来。 项目名称:中文LLaMA&Alpaca大语言模型+本地部署 (Chinese LLaMA & Alpaca LLMs 项目地址:https://...
-
GitLab推出对话式AI工具Duo Chat 提升开发效率
在软件开发中,开发人员在处理复杂代码或高效管理项目问题时经常面临挑战。在工作流中找到正确的信息和协助可能是一项难题。为了解决这个问题,GitLab推出了一款名为Duo Chat的新工具,旨在通过将对话式AI整合到现有工作流中简化开发体验。 过去,开发人员已...
-
GPT-5 正在开发中!OpenAI:希望微软能再给资金支持
今年6月,OpenAI CEO Sam Altman 在印度经济时报主办的一场会议上表示:“在我们开始训练下一代模型之前,我们还有很多工作要做。我们正在研究我们认为需要的新想法,但我们肯定还没有准备好开始。” 仅时隔半年后,在OpenAI刚带来全新的GPT...
-
研究: AI生成的白人面孔现在“比真人还真”
根据《心理科学》杂志的一份报告,人工智能(AI)生成的白人面孔的图像如今已经达到了“超真实”的水平,甚至比真实人物的照片更加逼真。然而,该研究指出,由于算法训练数据的偏见,AI在呈现其他族裔的面孔时却表现出明显的白人特征。 图源备注:图片由AI生成,图片...
-
研究人员开发过滤器处理不安全的AI生成图像
近年来,AI图像生成器因其便捷性而变得异常受欢迎,但也引发了一系列问题。在CISPA Helmholtz信息安全中心的研究中,研究员Yiting Qu探讨了这些图像生成器中存在的不安全图像问题,并提出了一种用于解决此问题的过滤器。 她一篇论文中指出,用户...
-
中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
可以说,AI 初创公司 LinkSoul.Al 的这些开源项目让海外开源大模型在国内的普及和推广速度与国际几乎保持了一致。 7 月 19 日,Meta 终于发布了免费可商用版本 Llama 2,让开源大模型领域的格局发生了巨大变化。 Llama 2 模...
-
私人定制AI绘画——快速finetune stable diffusion教程
最近AI绘图非常火,只需要输入文本就能得到令人惊艳的图。 举个例子,输入 “photo of a gorgeous young woman in the style of stefan kostic and david la chapelle, coy,...
-
自动代码Copilot背后的模型
文章目录 1.引入 2.评估框架 3.评估数据集 4.模型方法 5.实验结果 6.总结 7.参考 之前,我已经介绍过Github发布的自动代码Copilot的使用方法,感兴趣的可以看这篇文章:Copilot要收费了? 今天主要介绍一...
-
vivo X100系列首发蓝心大模型:在多个榜单中排名第一
快科技11月13日消息,在vivo X100系列发布会上,vivo黄韬宣布X100首发vivo蓝心大模型,这将会是行业首批百亿大模型在终端调通的手机。 据悉,vivo自研蓝心大模型经历了六年研究,覆盖了十亿、百亿、千亿三个参数量级,全面覆盖了目前应用的核心...
-
ICLR 2024论文审稿结果出炉!7000+高产论文创新纪录,扩散模型占比最高
ICLR 2024审稿结果公布了! ICLR是机器学习领域重要的学术会议之一,每年举办一次。2024年是第十二届,将在奥地利维也纳5月7日-11日召开。 根据OpenReview官方放出的结果显示,今年共有7135篇投稿论文。 此外,另有国内开发者魏国...
-
UNC斯坦福等曝光GPT-4V意外漏洞,被人类哄骗数出8个葫芦娃!LeCun和Jim Fan震惊了
GPT-4V诞生后,惊艳的多模态能力让网友惊呼连连,连OpenAI总裁Greg Brockman都不断在X上安利。 不过,最近大家发现,只要打乱布局,GPT-4V就会被曾经解决的著名计算机视觉难题——「吉娃娃还是松饼」,再次难倒…… UCSC教授Xin...
-
详解超强ResNet变体NFNet:抛弃归一化后,性能却达到了最强!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 从上古时期一直到今天,Batch Norm (BN 一直都是视觉骨干架构里面很重要的一个环节。BN 使得研究人员可以训练更深的网络,并在训练集和测试集上实现更高的精度。Batch Norm 还可以平...
-
【AIGC 讯飞星火 | 百度AI|ChatGPT| 】智能对比
AI智能对比 ? 前言 ? 概念类对比 ? 讯飞 ? 百度AI ? chatGPT ? 功能类对比 ☕ 讯飞 ☕ 百度AI ☕ chatGPT ? 可输入字数对比 ? 百度AI ? 讯飞 ? chatGPT ? 总结...
-
LLaMA系列 | LLaMA和LLaMA-2精简总结
文章目录 1、LLaMA 1.1、模型结构 1.2、训练方式 1.3、结论 2、LLaMA-2 2.1、相比LLaMA1的升级 2.3、模型结构 2.3.1、MHA, MQA, GQA区别与联系 2.4、训练方式 1、L...
-
AI图像生成模型LCMs: 四个步骤就能快速生成高质量图像的新方法
在最新的AI模型和研究领域,一种名为Latent Consistency Models(LCMs)的新技术正迅速推动文本到图像人工智能的发展。与传统的Latent Diffusion Models(LDMs 相比,LCMs在生成详细且富有创意的图像方面同样...
-
语言作“纽带”,拳打脚踢各模态,超越Imagebind
北大联合腾讯打造了一个多模态15边形战士! 以语言为中心,“拳打脚踢”视频、音频、深度、红外理解等各模态。 具体来说,研究人员提出了一个叫做LanguageBind的多模态预训练框架。 用语言作为与其它模态之间的纽带,冻结语言编码器,然后用对比学习方法...