-
GPT-4无法造出生物武器!OpenAI最新实验证明:大模型杀伤力几乎为0
GPT-4会加速生物武器的发展吗?在担心AI统治世界之前,人类是否会因为打开了潘多拉魔盒而面临新的威胁? 毕竟,大模型输出各种不良信息的案例不在少数。 今天,处在风口,也是浪尖的OpenAI再次负责任地刷了一波热度。 图片 我们正在建立一个能够协助制造生...
-
人类和AI的决策协作:决策问题的表述、解释和评价
在人工智能、数据可视化等领域,如何利用信息显示来辅助人类做出更好的决策,是一个重要的研究目标。什么是一个决策问题,以及如何设计一个能够有效评估人类决策的实验,没有一个明确的共识。在这篇文章中,我将为您解读一篇最新的论文,它提出了一个基于统计决策理论和信息...
-
Stable Diffusion完整入门指南,保姆级教程!
SD 保姆教程,从原理功能到案例输出展示,最后简述 ControlNet 的使用技巧。 Stable Diffusion 的基本介绍 首先官方给出的解释是: 这和 MJ 有什么区别?为了更方便理解我们将 Stable Diff...
-
Vision Pro大卖50亿小扎狂喜!Meta烧光500亿,VR复兴的希望来了
根据外媒曝料,2月2日正式发售之前,苹果的Vision Pro已经销售已经达到20万台,销售金额突破50亿美元! 图片 虽然对于苹果帝国巨大的体量来说,这个数字简直不值一提,但至少说明,消费者是愿意为这个3500刀的玩具买单的。 Vision Pro的媒...
-
准确率不足20%,GPT-4V/Gemini竟看不懂漫画!首个图像序列基准测试开源
OpenAI的GPT-4V和谷歌最新的Gemini多模态大语言模型一经推出就得到业界和学界的热切关注: 一系列工作都从多角度展示了这些多模态大语言模型对视频的理解能力。人们似乎相信我们离通用人工智能artificial general intellige...
-
链世界:一种简单而有效的人类行为Agent模型强化学习框架
强化学习是一种机器学习的方法,它通过让智能体(Agent)与环境交互,从而学习如何选择最优的行动来最大化累积的奖励。强化学习在许多领域都有广泛的应用,例如游戏、机器人、自动驾驶等。强化学习也可以用于干预人类的行为,帮助人类实现他们的长期目标,例如戒烟、减...
-
360度无死角!UC伯克利华人发布3DHM框架:一张图片即可模仿任意视频动作
输入一张任意姿势的照片,想让照片里的人跟随「指定视频」来进行动作模仿并不简单,除了肢体动作的模仿外,模型还需要对运动过程中衣服、人物外观的变化进行建模。 如果输入图像是正面的,而模仿的视频动作包括转身的话,模型还需要「想象」出衣服的背面样子,以及衣...
-
AIGC笔记总结(一):扩散模型简介
?个人主页: GoAI |? 公众号: GoAI的学习小屋 | ?交流群: 704932595 |?个人简介 : 掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉方向导师等,专注大数...
-
【随手记录】Llama Tutorial 大语言模型实践 手把手系列带实践源码
这个tutorial的契机是yy突然看到了一个workshop 所以类似于一周大作业的形式,输入command输出使用了自动驾驶哪些模块,代码在这里 所以就干一干,顺便写一个tutorial给大家参考和教程 引申更多的应用 参考资料: https:...
-
20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结(whisper)
20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结 2024/1/22 19:52 结论:这个软件如果是习作,可以打101分,功能都实现了。 如果作为商业软件/共享软件,在易用性等方面,可能就只能有70分了。 【百分制】...
-
中文性能反超VLM顶流GPT-4V,阿里Qwen-VL超大杯限免!看图秒写编程视觉难题一眼辨出
【新智元导读】多模态大模型将是AI下一个爆点。最近,通义千问VLM模型换新升级,超大杯性能堪比GPT-4V。最最重要的是,还能限时免费用。 最近,通义千问实火。 前段时间被网友玩疯的全民舞王,让「AI科目三」频频登上热搜。 让甄嬛、慈禧、马斯克、猫主子和兵...
-
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙
GPT-4又双叒叕变强了! 今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview。 不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。 图片 与此同时,OpenAI还发布了一系列模型和API...
-
2024 年,3 项技术将为生成式人工智能提供帮助
随着 ChatGPT 惊艳的首年即将落幕,生成式人工智能(genAI)与大型语言模型(LLM)无疑已成为引人瞩目的技术焦点。然而,在企业的黄金时期,它们是否已具备投入使用的能力呢?ChatGPT 所遭遇的挑战众所周知,其在回答问题时的准确性尚待提高。尽...
-
拳打Gen-2脚踢Pika,谷歌爆肝7个月祭出AI视频大模型,首提时空架构,时长史诗级延长
爆肝7个月,谷歌祭出了AI视频大模型Lumiere,直接改变了游戏规则!全新架构让视频时长和一致性全面飞升,时长直接碾压Gen-2和Pika。 AI视频赛道上,谷歌又再次放出王炸级更新! 这个名为Google Lumiere的模型,是个大规模视频扩散模...
-
多智能体系统的合作之道:对MAS不确定性、社会机制与强化学习的探索
多智能体系统(MAS)是由多个自主智能体组成的系统,它们可以相互交互和协作,以完成一些共同或个人的目标。多智能体系统在许多领域都有广泛的应用,如机器人、交通、电力、社交网络等。但是如何促进智能体之间的合作行为一直是这一领域的难题,特别是在激励机制不确定的...
-
[IDE(AI绘画)]从零开始在本地部署AI绘画实例(2023.4)
[IDE(AI绘画 ]从零开始在本地部署AI绘画实例(2023.4) 一、前言 跟我的版本号走基本上不会出错,如果安装错误请检查自己是不是升级版本了,python 3.11.x在文章发布时并不支持 如果有稳定的节点就不需要修改镜像源,有些包镜像源的...
-
认识 AIGC ,浅淡 AIGC 的那些事—— AIGC:用 AI 创造万物
文章目录 ?关于封面 ?关于活动 ?前言 ?什么是 AIGC ? ?AIGC:用 AI 创造万物 ?AIGC 的意义与发展 ?AIGC 的发展历程 ?人工智能生成内容的发展历程与概念 ?早期萌芽阶段(1950s-990s) ?沉淀积累阶段...
-
画个圈就能搜索,谷歌Gemini Pro植入旗舰,开启手机AI大战
近日,三星在加利福尼亚州圣何塞隆重发布了最新的Galaxy S24系列手机,AI要素拉满!网友一片热情,纷纷实测 AI要素满满三星新旗舰,竟被抱怨一半功能都不太好用! 近日,在加利福尼亚州圣何塞举行的Galaxy Unpacked活动中,三星推出了最新的G...
-
[AI绘图教程]stable-diffusion webui加载模型与插件. 实战AI绘画
之前讲了stable diffusion webui搭建,这里主要介绍使用方法以及模型,扩展等. 模型下载 主要下载网址 HuggingFace:Stable Diffusion、ControlNet的官方仓库。 Civitai:里面多是Lo...
-
随心玩玩(十三)Stable Diffusion初窥门径
写在前面:时代在进步,技术在进步,赶紧跑来玩玩 文章目录 简介 配置要求 安装部署 下载模型 启动ui 插件安装教程 分区提示词插件 Adetailer插件 提示词的分步采样 采样器选择 采样器的收敛性 UniPC采样器 高分辨率修...
-
GPT-4V惨败!CV大神谢赛宁新作:V*重磅「视觉搜索」算法让LLM理解力逼近人类
Sam Altman最近在世界经济论坛上发言,称达到人类级别的AI很快就会降临。 但是,正如LeCun一直以来所言,如今的AI连猫狗都不如。现在看来的确如此。 GPT-4V、LLaVA等多模态模型图像理解力足以让人惊叹。但是,它们并非真的能够做的面面俱到。...
-
几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型
在AR、VR、3D打印、场景搭建以及电影制作等多个领域中,高质量的穿着衣服的人体3D模型非常重要。 传统的方法创建这些模型不仅需要大量时间,还需要能够捕捉多视角照片的专业设备,此外还依赖于技术熟练的专业人员。 与此相反,在日常生活中,我们最常见...
-
Stability AI发布全新代码模型Stable Code 3B,媲美70亿Code Llama,没GPU也能跑
今天,Stability AI发布了自家在2024年的第一个模型——Stable Code3B。 顾名思义,Stable Code3B专注于代码能力,实际的表现也是非常亮眼。 在仅仅3B参数的规模之下,达到了比肩Code Llama7B的效果。 相...
-
Stability AI发布全新代码模型Stable Code 3B!媲美70亿Code Llama,没GPU也能跑
今天,Stability AI发布了自家在2024年的第一个模型——Stable Code 3B。 图片 顾名思义,Stable Code 3B专注于代码能力,实际的表现也是非常亮眼。 在仅仅3B参数的规模之下,达到了比肩Code Llama 7B的效果...
-
「文生图」再升级!学习个性化参照,无限生成多样图片,轻松设计玩具建筑
最近,来自南加州大学、哈佛大学等机构的研究团队提出了一种全新的基于提示学习的方法——DreamDistribution。 这种方法可以让任何基于文字提示的生成模型(比如文生图、文生3D等),通过一组参照图片来学习对应的视觉属性共性和变化的文本提示分布。...
-
数据计算任务工具Fluid在AIGC模型推理场景中的优化方案
Fluid的介绍 Fluid是一个在Kubernetes环境中编排数据和使用数据的计算任务的工具。它的编排不仅涉及空间上的优化,还包括时间上的调度。从空间角度看,计算任务会优先被分配到存有缓存数据或靠近缓存的节点上,从而提升数据密集型应用的性能。从时间角...
-
基于llama-index对embedding模型进行微调
QA对话目前是大语言模型的一大应用场景,在QA对话中,由于大语言模型信息的滞后性以及不包含业务知识的特点,我们经常需要外挂知识库来协助大模型解决一些问题。在外挂知识库的过程中,embedding模型的召回效果直接影响到大模型的回答效果,因此,在许多场景下,...
-
揭秘硅谷巨头AI初创公司投资布局!英伟达ALL IN,微软-OpenAI式关系引反垄断调查
今年以来,一批新的人工智能初创企业震撼了硅谷乃至更广泛的商业世界: OpenAI是世界上最前沿的大模型提供商和技术灯塔。甚至OpenAI每发一篇博客,都能获得全世界大模型从业者的高度关注。 图片 来自法国,只有22名员工的Mistral AI,每次发布一...
-
Stable Diffusion WebUI 集成 LoRA模型,给自己做一张壁纸 Ubuntu22.04 rtx2060 6G
LoRA概念 LoRA的全称是LoRA: Low-Rank Adaptation of Large Language Models,可以理解为stable diffusion(SD 模型的一种插件,和hyper-network,controlNet一样,...
-
ChatGPT应用商店深夜上线!全网300万GPTs大爆发,开发者与OpenAI分钱了
上周预告之后,OpenAI今天正式官宣GPT Store上线! 图片 值得一提的是,继去年11月首届开发者大会上,Sam Altman首次向世界展示了可定制的GPTs,到现在为止,已经诞生了300万个自定义的ChatGPT! 现在,当你进入ChatGPT...
-
一文了解Copilot插件使用介绍
在软件开发的不断演进中,AI技术正逐渐渗透到我们的日常工作中。GitHub Copilot作为一个基于OpenAI Codex的插件,为程序员提供了全新的编程体验。本文将深入探讨Copilot插件的使用方法、优势特性以及如何充分发挥其潜力,助你更高效、愉悦...
-
【AI绘画 | draft意间】国产draft推荐及AI绘画背后的原理解读
写在前面: 学习人工智能?来我们的床长人工智能教程网站!全面的课程,适合任何想学习的人。基础知识到高级应用,我们都有。职场人士、学生或爱好者,都能快速提升技能水平。赶快来尝试吧! 个人名片: ?作者简介:一名大二在校生,喜欢编程?...
-
创新的AI图像生成:Midjourney与Photorealistic插件
引言 在人工智能的众多应用中,图像生成已经成为了一个热门的领域。其中,Midjourney图像创建工具和它的配套插件"photorealistic",以其独特的功能和优秀的性能,吸引了大量的用户。在这篇文章中,我们将详细介绍这两个工具,并通过实例展示它们...
-
一文速览扩散模型优化过程:从DDPM到条件生成模型Stable Diffusion
文章目录 1、扩散模型简介 - Diffusion Model 2、最简单的扩散模型 - DDPM 前向加噪过程 逆向去噪过程 训练与推理流程 模型优缺点 3、减少扩散模型的采样步骤 - DiffusionGAN 分析高斯分布、采样步长...
-
回顾精彩瞬间!IEEE Spectrum盘点2023年度热门AI故事
又是冬日,又到结尾, 气温回升了一点,苍茫天地间仍有一些尚未消融的洁白。 「雪霁银装素,桔高映琼枝」。 不知大家这一年过得怎么样呢? 2023很可能成为人工智能历史上最狂野、最戏剧性的年份之一。 Spectrum总结了本年度关于AI的最受欢迎的文章,...
-
2024 CSRankings全球计算机科学排名发布!AI领域中国高校霸榜,清华排名第一
【新智元导读】CSRankings2024结果出炉!全世界计算机科学机构的排名进行了大更新。在AI板块,清华、北大、上交分列TOP3,CMU和浙大并列第4。AI TOP10中的中国高校,还包括人大、南京大学、复旦大学、哈工大等。 2024CSRanking...
-
AI测出你几岁死亡?Transformer「算命」登Nature子刊,成功预测意外死亡
【新智元导读】AI算命将可以预测人类的意外死亡?丹麦科学家用全国600万人的公开数据训练了一个基于Transformer的模型,成功预测了意外死亡和性格特点。 AI真的可以用来科学地算命了!? 丹麦技术大学 (DTU) 的研究人员声称他们已经设计出一种人工...
-
2023 re:Invent|Amazon Q与Amazon CodeWhisperer面向企业开发者提效利器
本篇文章授权活动官方亚马逊云科技文章转发、改写权,包括不限于在 亚马逊云科技开发者社区, 知乎,自媒体平台,第三方开发者媒体等亚马逊云科技官方渠道 2023年,以GPT为代表的生成式AI引爆了新一轮技术热潮,短短一年的时间内,生成式AI已经成为科技世...
-
Google Bard初体验 - 感觉并不是很能打
写在前面:博主是一只经过实战开发历练后投身培训事业的“小山猪”,昵称取自动画片《狮子王》中的“彭彭”,总是以乐观、积极的心态对待周边的事物。本人的技术路线从Java全栈工程师一路奔向大数据开发、数据挖掘领域,如今终有小成,愿将昔日所获与大家交流一二,希望对...
-
人工智能可以像人类一样拥有创造力吗?
创造力是人类的一种独特的能力,它使我们能够创造出新颖、有价值、有意义的作品,如艺术、文学、科学、技术等。创造力也是人类社会的一种重要的驱动力,它促进了文化、经济、教育等领域的发展和进步。创造力到底是什么?它是如何产生的?它又如何被评估和提升的?这些问题一...
-
GitHub Copilot:设置、配置和故障排除
准备好使用GitHub Copilot大幅提升编程效率了吗?在本博客文章中,我们将逐步介绍如何设置、配置和故障排除GitHub Copilot。无论你是经验丰富的开发者还是刚开始编程之旅的新手,GitHub Copilot都能为你的工作效率注入动力。 ✅...
-
体验 Google Bard
环境 windows 10 64bit Google Bard python 3.8 简介 本篇介绍一个开源的 Google 聊天机器人Bard 的 API 逆向工程,使用它,可以免费的使用 Bard 服务,项目地址:https://gi...
-
谷歌家务机器人单挑斯坦福炒虾机器人!端茶倒水逗猫,连甩三连弹开打
火爆全网的斯坦福炒虾机器人,一天之内人气暴涨。 毕竟这样能炒菜能洗碗的全能机器人,谁不想带一个回家,把自己从家务中解放出来呢! 据说,这个项目是斯坦福华人团队花了三个月的时间做出来的。 今天,团队直接放出了更多细节。 这个机器人的技能多种多样,令人眼...
-
图解tinyBERT模型——BERT模型压缩精华
译者 | 朱先忠 审校 | 重楼 简介 近年来,大型语言模型的发展突飞猛进。BERT成为最受欢迎和最有效的模型之一,可以高精度地解决各种自然语言处理(NLP)任务。继BERT模型之后,一组其他的模型也先后出现并各自展示出优秀的性能。 不难看到一个明显趋势...
-
开发速率飙升20倍!GPT Pilot明星项目登Github热榜,从0开始构建AI
又一个明星项目诞生了! GPT Pilot,一个AI开发者伴侣,可以从0开始构建应用程序,可以自己编写代码、配置开发环境、管理开发任务、调试代码。 甚至,你可以随时和它聊天提问,帮你解决开发难题。 图片 项目地址:https://github.com/P...
-
北大才女如何看待AIGC?
点击下方▼▼▼▼链接直达AIPaperPass ! AIPaperPass - AI论文写作指导平台 公众号原文▼▼▼▼: 北大才女如何看待AIGC? 2024快到啦!先预祝宝子们,新的一年学业有成、工作顺利、诸事顺心! ...
-
GPT-4V开源平替!清华浙大领衔,LLaVA、CogAgent等开源视觉模型大爆发
如今,GPT-4 Vision在语言理解和视觉处理方面展现出了非凡的能力。 然而,如果想在不影响性能的前提下,寻求具有成本效益的替代方案,开源方案就蕴藏着无限可能。 国外的一位开发者Youssef Hosni为大家奉上了三种GPT-4V的开源替代方案,可...
-
GPT-4变笨!回答新问题性能太差,想保持水准只能不断训练新模型
昨天,一篇系统性地研究了GPT-4为什么会「降智」的论文,引发了AI圈的广泛讨论。 随着大家对GPT-4使用得越来越频繁,用户每过一段时间都会集中反应,GPT-4好像又变笨了。 图片 最近的情况是,如果用户不小心和GPT-4说现在是12月份,GPT-4的...
-
LLaMA模型论文《LLaMA: Open and Efficient Foundation Language Models》阅读笔记
文章目录 1. 简介 2.方法 2.1 预训练数据 2.2 网络架构 2.3 优化器 2.4 高效的实现 3.论文其余部分 4. 参考资料 1. 简介 LLaMA是meta在2023年2月开源的大模型,在这之后,很多开源模型都...
-
手把手教你通过PaddleHub快速实现输入中/英文本生成图像(Stable Diffusion)
近来,基于Diffusion的文图生成模型比较火,用户输入一句话,模型就可以生成一副对应的图像,还是很有意思的。本文记录了通过PaddleHub快速实现上述任务的过程,以供参考。 1、安装PaddlePaddle PaddleHub底层依赖于百度自研的...