-
研究称:向GPT-4等AI模型添加“情感提示词”会提高性能
最新研究发现,当用户表达紧急感或压力等情感时,AI模型如GPT-4可以表现得更好。这一发现对于在其AI应用中的开发者和企业家具有重要意义,提示了一种引入情感语境的新方法,以提高AI性能。 这项研究发现,添加情感因素的提示,被称为“情感提示”,可以提高AI在...
-
Runway的AI视频生成工具Gen-2更新 生成的视频运动更流畅、高清和逼真
总部位于纽约的生成式 AI 视频初创公司 Runway 今天更新了其标志性的文本/图像/视频到视频模型 Gen-2,其更新再度引发AI视频领域关注。 这一更新显著提高了视频的质量和一致性,有人将其称为“具有重大影响的游戏变革”,有人认为这是“生成式AI的关...
-
Gen-2颠覆AI生成视频!一句话秒出4K高清大片,网友:彻底改变游戏规则
这,绝对称得上是生成式AI进程中的里程碑。 就在深夜,Runway家标志性的AI视频生成工具Gen-2,迎来了“iPhone时刻”般的史诗级更新—— 依旧是简单一句话输入,不过这一次,视频效果一口气拉到了4K超逼真的高度! 话不多说,我们直接来看炸裂的效...
-
自动化测试有哪些缺陷?如何解决?
自动化测试是一种利用软件工具或者硬件设备来代替人工执行测试用例的方法,它可以提高测试效率和质量,但也可能存在一些缺陷,影响测试结果的准确性和可信度。 自动化测试的缺陷主要有以下几点: 自动化测试不能完全替代人工测试:自动化测试只能模拟用户操作和检查功能...
-
GPT手把手教你你回答百度面试
写在前面 大家好, 我是小牛,最近GPT让人打开眼界,我最近会出一系列利用GPT回答面试官后端面试的系列文章,希望对大家有所帮助!下面开始面试题和回答 简述Semaphore Semaphore 是一种用于控制并发访问的机制,它可以限制同时访问某个资源的...
-
AI玩推理桌游一眼识破骗局!清华通院联合推出心智理论新框架,六个指标评估表现均明显优于思维链
清华自动化系团队联合北京通用人工智能研究院,让几个AI智能体玩起了桌游! 游戏名叫阿瓦隆,是一个策略性的社交推理游戏,玩家被隐秘地分为“正义”与“邪恶”两派,通过任务投票、互相猜测与欺骗来完成或阻止任务,最终确定胜负。 为了能让AI智能体成功识别并应...
-
从单机到多机的无人机与机器人集群的SLAM综述
本文经自动驾驶之心公众号授权转载,转载请联系出处。 前言 在本系列,我将会更新我的博士毕业论文“Decentralized and Distributed Collaborative Simultaneous Localization and Mapp...
-
GPT Pilot:AI驱动的开发工具,可从零开始编写可扩展的应用程序
GPT Pilot是一种AI驱动的创新工具,旨在开发可扩展的应用程序,它能从头开始编写这些应用程序。开发人员只需提供所需应用程序的描述,GPT Pilot就会根据这些描述逐步生成应用程序代码。 当遇到复杂难题时,GPT Pilot会向开发人员询问以获得更多...
-
更高清写实的人体生成模型HyperHuman来了,基于隐式结构扩散,刷新多项SOTA
论文地址: https://arxiv.org/pdf/2310.08579.pdf Github 地址: https://github.com/snap-research/HyperHuman 1. 研究背景与动机 随着扩散模型的兴起,一些典型...
-
Agent 应用于提示工程
如果Agent模仿了人类在现实世界中的操作方式,那么,能否应用于提示工程即Prompt Engingeering 呢? 从LLM到Prompt Engineering 大型语言模型(LLM 是一种基于Transformer的模型,已经在一个巨大的语料库或...
-
OpenAI将组建新团队 以评估和减轻与人工智能相关的灾难性风险
10月27日消息,据外媒报道,当地时间周四,美国人工智能研究公司OpenAI宣布,它将组建一个名为Preparedness的新团队,以评估和减轻与人工智能(AI)相关的“灾难性风险”。 OpenAI表示,该团队将由麻省理工学院可部署机器学习中心主任亚历山大...
-
用检索增强生成技术解决人工智能幻觉问题
作者| Rahul Pradhan 来源| https://www.infoworld.com/article/3708254/addressing-ai-hallucinations-with-retrieval-augmented-generatio...
-
LLM一句话瞬间生成3D世界,未公布代码已获141星!或将引发3D建模行业革命
继火爆全网的AI文生图,文生视频之后,文生3D场景的技术也来了! 只要不到30个字的提示词,瞬间就能生成这样的3D场景。 场景效果和文字的要求几乎分毫不差——「平静如玻璃的湖面,倒映出无云的天空,周围的山和水鸟的倒影呈现在湖中。」 「烈日照耀在无垠...
-
微软更新 Skype 应用:改进通话界面、优化相机体验、增强必应聊天
10 月 25 日消息,微软近日更新了 iOS 和安卓版 Skype 应用,邀请 Skype Insider 项目成员,测试安装 Build 8.106.76.206。本次版本更新重点改善了通话界面,优化了相机体验,修复了多处错误。 IT之家在此附上...
-
首个多视角自动驾驶场景视频生成世界模型 | DrivingDiffusion: BEV数据和仿真新思路
笔者的一些个人思考 在自动驾驶领域,随着BEV-based子任务/端到端方案的发展,高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点,“高质量”可以解耦成三个方面: 不同维度上的长尾场景:如障碍物数据中近距离的车辆以及切车过程中...
-
美国码农疯狂求职,狂投250份简历!揭秘潜规则:网申填完就战胜92%对手
经济下行,科技行业各大公司降薪的降薪,裁员的裁员。 但是就业市场中最惨的却永远是那些还在找工作的人。 美国的一名软件工程师Shikhar Sachdev因为自己在找工作时被连续不断拒绝,却激发出了他不断尝试找各种工作的兴趣。 在他找到工作已经入职之后,...
-
清华新研究解密信息茧房!全新信息动力学理论,登Nature子刊
新一代信息与智能技术的迅猛发展推动着人类逐步迈入智能社会。在数字技术和智能推荐算法的加持下,媒体和平台越来越贴心,总是能最快最准的地契合人们的个性化偏好和需求。 然而,与此同时,智能精准推荐致使「信息茧房」现象不断发酵,观点相似的人群在网络空间组成团体,...
-
AIGC时代的视频扩散模型,复旦等团队发布领域首篇综述
AI 生成内容已经成为当前人工智能领域的最热门话题之一,也代表着该领域的前沿技术。近年来,随着 Stable Diffusion、DALL-E3、ControlNet 等新技术的发布,AI 图像生成和编辑领域实现了令人惊艳的视觉效果,并且在学术界和工业界...
-
AI视野:星火大模型V3.0发布;B站测试推出“AI视频总结”功能;高通发布骁龙8Gen3;苹果计划每年砸10亿美元搞AI
????大模型动态 科大讯飞星火认知大模型V3.0正式发布 在今日的2023科大讯飞全球1024开发者节上,科大讯飞宣布,讯飞星火认知大模型V3.0正式发布,目前星火大模型已整体超越ChatGPT。 ???AI应用 B站测试推出“AI视频总结”功能 近日...
-
AI视频后期制作神器ProPainter 一键即可完成视频抠图
最近,出现了一种新的视频修复技术,叫做ProPainter,它可以用画家风格的笔触来填补视频中的缺失区域。 ProPainter是一个基于深度学习的端到端的网络,它由两个模块组成:Recurrent Flow Completion Network和Pain...
-
MiniGPT-5:一种基于生成vokens 的交错视觉和语言生成模型
MiniGPT-5是一种交错视觉和语言生成模型,通过整合大型语言模型和稳定扩散技术,实现了文本和图像的协调输出。该模型采用两阶段训练策略,首先进行无图像描述的多模态数据生成,然后利用无分类器的引导系统进一步提升生成 vokens 的效果。MiniGPT-5...
-
DeepMind:大模型又曝重大缺陷,无法自我纠正推理,除非提前得知正确答案
大语言模型又一项重大缺陷被DeepMind曝光! LLM无法纠正自己推理中的错误。 「Self-Correction」作为一种让模型修正自己回答的技术,在很多类型的任务中都能明显改进模型的输出质量。 但是最近,谷歌DeepMind和UIUC的研究人员却发...
-
有了GPT-4之后,机器人把转笔、盘核桃都学会了
在学习方面,GPT-4 是一个厉害的学生。在消化了大量人类数据后,它掌握了各门知识,甚至在聊天中能给数学家陶哲轩带来启发。 与此同时,它也成为了一名优秀的老师,而且不光是教书本知识,还能教机器人转笔。 这个机器人名叫 Eureka,是来自英伟达、宾夕法...
-
评论能力强于GPT-4,上交开源13B评估大模型Auto-J
随着生成式人工智能技术的快速发展,确保大模型与人类价值(意图)对齐(Alignment)已经成为行业的重要挑战。 虽然模型的对齐至关重要,但目前的评估方法往往存在局限性,这也让开发者往往困惑:大模型对齐程度如何?这不仅制约了对齐技术的进一步发展,也引发了...