-
全球首个语音指挥FPS AI ,腾讯魔方携最新AI成果亮相科隆展
AI究竟会如何改变游戏?这应该是全球游戏行业近年最为关注的问题之一。在最近正在德国举办的全球最大游戏展—科隆游戏展上,腾讯游戏魔方工作室群技术中心联合《暗区突围:无限》项目组,首次对外公布其全球首个语音指挥FPSAIF.A.C.U.L.的技术Demo。这是...
-
GOLLIE : ANNOTATION GUIDELINES IMPROVE ZERO-SHOT INFORMATION-EXTRACTION
文章目录 题目 摘要 引言 方法 实验 消融研究 题目 Techgpt-2.0:解决知识图谱构建任务的大型语言模型项目 论文地址:https://arxiv.org/abs/2310.03668 摘要 大...
-
这个除了会表达爱什么都不会的AI,凭什么能卖到7万块?
“它毛茸茸的,渴望得到关注。但更重要的是,它爱你。” 乍一看,它就像果宝特攻里的角色,神似橙留香,或菠萝吹雪。 上为LOVOT,下为果宝特攻 所以在第一眼看到它时,会让人感到熟悉又好奇。 它既是陈冠希喜爱的陪伴机器人。 也曾出演日本已故知名演员三浦春马的...
-
Cursor有哪些功能免费吗?AI代码工具怎么使用方法详细教程指南
Cursor 是什么? Cursor是一个AI驱动的代码编辑器,旨在通过人工智能技术帮助开发者更高效地编写代码。它能够理解代码库,提供代码建议,并通过自然语言指令来编辑代码。 Cursor 有哪些功能? 理解代码库并提供代码建议 使用自然语言指令更...
-
Cursor完全指南:AI驱动的代码编辑器 - 使用方法教程与免费试用入口
探索Cursor能为你带来哪些改变 为什么选择Cursor? Cursor不仅仅是一款产品——它是一项革命性的技术,致力于通过人工智能技术帮助开发者更高效地编写代码。致力于提供代码建议、自然语言指令更新代码等功能,Cursor旨在为那些希望提高编程效率和...
-
【人工智能大模型】文心一言介绍以及基本使用指令
目录 一、产品背景与技术基础 二、主要功能与特点 基本用法 指令的使用 注意事项 文心一言(ERNIE Bot)是百度基于其文心大模型技术推出的生成式AI产品。以下是对文心一言的详细介绍: 一、产品背景与技术基础 技术背景:百度在...
-
快速上手文心一言指令:解锁智能生活与工作的新方式
在当今数字化、智能化的时代,我们越来越依赖于各种智能助手和工具来辅助我们的生活和工作。文心一言指令,作为一种先进的自然语言处理(NLP)技术,正逐渐走进人们的视野,成为我们日常生活中不可或缺的一部分。本文将带你快速上手文心一言指令,解锁智能生活与工作的新...
-
【AIGC 概念理解】Zero-Shot,One-Shot,Few-Shot,In-Context Learning,Tuning-Free/Training-Free/Inference-Only
在人工智能领域,特别是自然语言处理(NLP)和机器学习中,几个重要的概念正在推动研究和应用的前沿发展。以下是few-shot learning, zero-shot learning, in-context learning, tuning-free, t...
-
003篇 - AIGC提示词工程 - 提示词在AI模型中的作用(Prompt Engineering - Role of Prompts in AI Models)
大家好,我是元壤教育的张涛,一名知识博主,专注于生成式人工智能(AIGC)各领域的研究与实践。我喜欢用简单的方法,帮助大家轻松掌握AIGC应用技术。我的愿景是通过我的文章和教程,帮助1000万人学好AIGC,用好AIGC。 小伙伴们,上节咱们说到这个提示...
-
【AI绘画工具介绍】
AI绘画工具介绍 近年来,人工智能技术突飞猛进,AI绘画工具也应运而生,为艺术创作领域带来了前所未有的革新。这些工具以其强大的功能和易用性,吸引了越来越多的艺术家、设计师和爱好者,并正在改变着人们对艺术创作的认知和实践方式。 一、AI绘画工具的分类...
-
AI画连环画角色更一致了!人物之间的复杂互动也能处理|中山大学&联想团队出品
让AI画漫画角色保持一致的新研究来了! 创作的连环画效果belike: 频繁切换主体、人物之间复杂的互动也能保持角色一致性: 上述效果来自AutoStudio,是一个由中山大学和联想团队联合提出的无需训练的多智能体协同框架。 AutoStudio采用基...
-
Copilot实战经验分享
文章目录 Copilot是什么? Copilot的主要功能 Copilot实战代码 Copilot是什么? Copilot 是一种由 GitHub 和 OpenAI 联合开发的人工智能辅助编程工具。它可以帮助程序员更轻松地编写代码...
-
文心一言指令详解及实例分析
一、引言 文心一言,作为人工智能领域的杰出代表,以其独特的自然语言处理能力和广泛的应用场景,受到了广泛的关注。 文心一言指令,作为其核心功能之一,允许用户通过自然语言与文心一言进行交互,实现信息的查询、生成、理解和推理。 本文将详细介绍文心一言指...
-
具身智能的视觉-语言-动作模型:综述
本文经自动驾驶之心公众号授权转载,转载请联系出处。 24年5月论文“A Survey on Vision-Language-Action Models for Embodied AI”。 深度学习已在计算机视觉、自然语言处理和强化学习等许多领域取得了显著...
-
【AIGC调研系列】LLaVA++整合Phi-3和Llama-3能够实现什么
LLaVA++能够为Phi-3和Llama-3带来的主要好处包括: 视觉处理能力的增强:通过整合Phi-3和Llama-3模型,创建了具备视觉处理能力的Phi-3-V和Llama-3-V版本,这意味着这些模型现在能够理解和生成与图像相关的内容[1]。...
-
适应多形态多任务,最强开源机器人学习系统「八爪鱼」诞生
在机器人学习方面,一种常用方法是收集针对特定机器人和任务的数据集,然后用其来训练策略。但是,如果使用这种方法来从头开始学习,每一个任务都需要收集足够数据,并且所得策略的泛化能力通常也不佳。 原理上讲,从其它机器人和任务收集的经验能提供可能的解决方案,能让...
-
综述!全面概括基础模型对于推动自动驾驶的重要作用
写在前面&笔者的个人理解 近年来,随着深度学习技术的发展和突破,大规模的基础模型(Foundation Models)在自然语言处理和计算机视觉领域取得了显著性的成果。基础模型在自动驾驶当中的应用也有很大的发展前景,可以提高对于场景的理解和推理。...
-
小米小爱同学与阿里云通义大模型合作 成果已在小米汽车等落地
近日,小米旗下备受欢迎的人工智能助手“小爱同学”与阿里云通义大模型携手合作,共同探索并强化在图片生成、图片理解等多模态AI生成能力的新领域。 这一创新技术已经在小米汽车、手机等多类设备上成功落地,为用户带来前所未有的智能体验。 以小米汽车SU7为例,这款车...
-
Stylar:一站式AI图像和设计工具,提升创作效率
Stylar是一款集多功能于一体的人工智能图像和设计工具,以其全面的功能和简单易操作的特点,受到了创作者和设计师的广泛欢迎。该工具将生成式AI与编辑工具融合在一个平台上,极大地提高了从图像生成到编辑的工作效率。 产品入口:https://top.aiba...
-
新加坡国立大学 | 通过语言分割任何3D目标
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文研究了具有自由形式语言指令的开放词汇3D实例分割(OV-3DIS)。先前的作品只依赖于注释的基本类别进行训练,对看不见的长尾类别的泛化能力有限。最近的工作通过生成类...
-
等等我还没上车!LLM赋能端到端全新范式LeGo-Drive,车速拉满
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者个人理解 这篇论文介绍了一种名为LeGo-Drive的基于视觉语言模型的闭环端到端自动驾驶方法。该方法通过预测目标位置和可微分优化器规划轨迹,实现了从导航指令到目标位置的端到端闭...
-
「大模型+强化学习」最新综述!港中文深圳130余篇论文:详解四条主流技术路线
强化学习(RL)通过与环境交互的试错反馈来优化顺序决策问题。 虽然RL在允许大量试错的复杂电子游戏环境中实现了超越人类的决策能力(例如王者荣耀,Dota 2等),但很难在包含大量自然语言和视觉图像的现实复杂应用中落地,原因包括但不限于:数据获取困难、样本...
-
斯坦福团队新作:喊话就能指导机器人,任务成功率暴增,网友:特斯拉搞快点
斯坦福的ALOHA家务机器人团队,发布了最新研究成果—— 项目名为Yell At Your Robot(简称YAY),有了它,机器人的“翻车”动作,只要喊句话就能纠正了! 而且机器人可以随着人类的喊话动态提升动作水平、即时调整策略,并根据反馈持续自我改进...
-
音乐ChatGPT 2.0来了!AI作曲家被踢馆,亲测周杰伦爆款大翻车
【新智元导读】200名音乐人联名信抗议的消息刚出,Stability AI的新音乐工具就来了!刚刚发布的Stable Audio2.0,可以创作长达3分钟的音乐,哼哼几句就能给你创作出一段音乐了!不过广大网友和音乐人试用后表示:有点失望…… 200多名音乐...
-
80M参数打平GPT-4!苹果发超强上下文理解模型ReALM,聪明版Siri马上就来
【新智元导读】苹果公司发布了一款参数量仅为80M的最新模型——ReALM,能够将各种形式的上下文转换为文本进行理解,包括解析屏幕、多轮对话以及上下文引用,提升了Siri等智能助手的反应速度和智能程度。 会读心的Siri想不想要? 今天,苹果发布了自家的最新...
-
80M参数打平GPT-4!苹果发超强上下文理解模型,聪明版Siri马上就来
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 会读心的Siri想不想要? 今天,苹果发布了自家的最新模型ReALM,仅需80M参数,就能在上下文理解能力上打平甚至超越GPT-4!...
-
DeepMind首发游戏AI智能体SIMA!只用自然语言就能玩转「山羊模拟器」
谷歌DeepMind在AI和游戏方面有着悠久的历史。 从过去与Atari游戏的密切合作开始,然后发展到AlphaStar系统可以在《星际争霸II》中达到人类大师级水平,到如今,DeepMind从单个游戏转向了通用的、可指导的游戏AI代理。 SIMA,是一...
-
Code Llama 简介,一种最先进的大型编码语言模型
Code Llama 简介,一种最先进的大型编码语言模型 2023 年 8 月 24 日...
-
Stability AI开源3B代码生成模型:可补全,还能Debug
本周一,Stability AI 开源了小体量预训练模型 Stable Code Instruct 3B。 Stable Code Instruct 3B 是一个基于 Stable Code 3B 的指令调整编码语言模型(Code LM)。给出自然语言...
-
能玩3D游戏的AI玩家!谷歌新智能体SIMA发布,但水平还在“新手村”
编译 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 世界上第一位AI程序员Devin诞生,让大家纷纷转发感叹“饭碗保不住”。 一转眼,具有里程碑意义的AI玩家也来了!谷歌(Google)旗下DeepMind发布新智能体SIMA。 S...
-
谷歌推出通用AI代理:能自动执行600多种动作,游玩复杂3D游戏
谷歌DeepMind的研究人员推出了一种面向3D环境的通用AI代理——SIMA。 SIMA无需访问游戏的源代码,也不需要定制的API。只需要输入图像和用户提供的简单自然语言文本指令,SIMA就能像人类玩家一样执行走路、跑步、建造、打开地图等各种游戏中的操作...
-
免费 Copilot 用户可以访问 OpenAI 的 GPT-4 Turbo;面向 3D 虚拟环境的多面手 AI 代理
🦉 AI新闻 🚀 免费 Copilot 用户可以访问 OpenAI 的 GPT-4 Turbo 摘要:微软宣布免费版Copilot已升级到GPT-4 Turbo模型,所有用户都可以免费使用。此外,Copilot Pro新增了GPT Builder工...
-
脱单模拟挑战器网络爆火 网友怒了:我连AI都攻略不了
今年情人节,一场特殊的脱单挑战在网络上引起了热烈的讨论。这场挑战的目标很简单,就是用三句话追到一见钟情的高冷暗恋对象。 最近,一款名为“脱单模拟挑战器”的应用在网络上火爆起来,小红书平台上涌现了大量的用户挑战案例。3月14日,小红书博主“大人!看看我家呜呜...
-
谷歌通用AI智能体发布,3D游戏玩法要变天了
谷歌DeepMind号称打造出了首个能在广泛3D虚拟环境和视频游戏中遵循自然语言指令的通用AI智能体。 名为SIMA,不是NPC,是可以成为玩家拍档,帮忙干活打杂的那种。 比如,在《模拟山羊3》(Goat Simulator 3)中当司机开开车: 在...
-
SIMA官网体验入口 DeepMind游戏AI代理软件工具app免费下载地址
SIMA是DeepMind推出的一个通用AI代理,可以在广泛的游戏世界中理解并执行任务。以下是SIMA的详细介绍: 点击前往「SIMA」官网体验入口 SIMA工作原理 SIMA是一个多世界AI代理,可以接收自然语言指令在游戏环境中执行任务,而无需游戏源...
-
ShellGPT官网体验入口 AI命令行工具应用软件下载地址
ShellGPT是一个利用AI大型语言模型的强大能力,通过命令行界面提供辅助的工具,使用户能够通过自然语言指令来执行任务,提高工作效率和效率。需求人群主要适用于开发者和高级用户,特别是那些希望在命令行环境中利用AI提高生产力的用户。 点击前往ShellG...
-
开源AI框架LaVague:理解自然语言指令 实现浏览器交互自动化
LaVague 是一个旨在自动化浏览器交互的大型动作模型框架,通过将自然语言指令转化为无缝的浏览器交互,重新定义了互联网浏览体验。 该框架的设计初衷是为用户自动化繁琐的任务,节省时间,让用户能够专注于更有意义的事务。通过理解自然语言指令并与 Seleniu...
-
「人车交互」新突破!普渡大学发布Talk2Drive框架:可学习/定制的「指令识别」系统
在普渡大学数字孪生实验室的最新成果中,研究人员引入了一种革命性的技术——利用大型语言模型(LLM)为自动驾驶汽车提供智能指令解析能力。 该技术的核心为Talk2Drive框架,旨在通过理解人类的自然语言来控制自动驾驶汽车,从而实现了一种前所未有的人车交互...
-
GPT-4绝对性能暴涨74.4%!UIUC苹果华人团队提出CodeAct,用Python代码统一LLM智能体行动
一直以来,LLM智能体被众多业界AI大佬看好,甚至有望成为将人类从琐碎工作中解放出来的利器。 但是,它们该如何与世界进行最佳互动? 最近,来自UIUC和苹果的华人研究员,提出了一种全新的智能体框架——CodeAct。 它通过采用可执行的Python代码,来...
-
苹果展示 AI 新模型 MGIE,可一句话精修图片
2 月 8 日消息,相比较微软的风生水起,苹果公司在 AI 领域的布局显得低调很多,但这并不意味着苹果在该领域就没有丝毫建树。苹果公司近日发布了名为“MGIE”的新型开源人工智能模型,它可以根据自然语言指令编辑图像。 图源:VentureBeat 与...
-
斯坦福和OpenAI提出meta-prompting,最强零样本prompting技术诞生了
最新一代语言模型(尤其是 GPT-4、PaLM 和 LLaMa)已经成功拓展了自然语言处理和生成的边界。这些大规模模型可以解决许多不同任务,从写莎士比亚风格的十四行诗到总结复杂的医疗报告和解决竞赛级的编程问题。尽管这些模型可以解决多种多样的问题,但它们并...
-
iPhone AI图像编辑P图app工具免费在线使用地址 苹果MGIE开源模型官网体验入口
MGIE是一项由苹果开源的技术,利用多模态大型语言模型(MLLMs)生成图像编辑指令,通过端到端训练,捕捉视觉想象力并执行图像处理操作,使图像编辑更加智能、直观。 点击前往MGIE官网体验入口 MGIE旨在满足以下需求人群: "用户可以通过自然语言直观地...
-
MGIE官网体验入口 苹果多模态大语言模型AI图像编辑工具在线使用地址
MGIE是一项由苹果开源的技术,利用多模态大型语言模型(MLLMs)生成图像编辑指令,通过端到端训练,捕捉视觉想象力并执行图像处理操作,使图像编辑更加智能、直观。 点击前往MGIE官网体验入口 需求人群: "用户可以通过自然语言直观地描述图像编辑需求,如...
-
AI绘画关键词(咒语)分析与热点研究
语义文本图像生成技术关键词分析与热点研究 一、研究背景与研究意义 随着深度学习的发展,语义文本到图像的生成技术已经取得长足进步,AI绘画也因此快速崛起。只需输入关键词,AI系统就能自动生成符合语义描述的图像,这一技术的出现,使绘画的创作方式发生革命性变...
-
Code Llama 70B霸榜3连发,练习5个月击败GPT-4!小扎LeCun亲自官宣上新
今天,Meta正式发布了Code Llama 70B,作为Code Llama系列中规模最大,性能最强的版本,一举击败了GPT-4! 目前,模型共有三个版本,均可免费用于研究和商业目的: CodeLlama - 70B:基础代码模型; CodeLlama...
-
编程能力超GPT-4,羊驼代码版“超大杯”来了,小扎还亲自剧透Llama3
羊驼家族的“最强开源代码模型”,迎来了它的“超大杯”—— 就在今天凌晨,Meta宣布推出Code Llama的70B版本。 图片 在HumanEval测试中,Code Llama-70B的表现在开源代码模型中位列第一,甚至超越了GPT-4。 此次发布的超...
-
GPT-4准确率最高飙升64%!斯坦福OpenAI重磅研究:全新Meta-Prompting方法让LLM当老板
当你让大模型写一首「莎士比亚十四行诗」,并以严格的韵律「ABAB CDCD EFEF GG」执行。 同时,诗中还要包含提供的3个词。 对于这么高难度的创作题,LLM在收到指令后,并不一定能够按要求做出这首诗。 正所谓,人各有所长,LLM也是如此,仅凭单...
-
能做鬼脸、摇滚、自拍,听懂你说的话!GPT-4驱动的实体机器人
东京大学的研究人员将GPT-4模型,集成在实体机器人Alter3中,可将文本、语言直接转化成机器人动作,例如,做一个自拍动作;装一个“鬼样”;做一个摇滚音乐动作等,就连微笑、眨眼这样的面部表情动作也没问题。 在GPT-4的帮助下,Alter3建立了语言反馈...
-
机器人领域首个开源视觉-语言操作大模型,RoboFlamingo框架激发开源VLMs更大潜能
近年来,大模型的研究正在加速推进,它逐渐在各类任务上展现出多模态的理解和时间空间上的推理能力。机器人的各类具身操作任务天然就对语言指令理解、场景感知和时空规划等能力有着很高的要求,这自然引申出一个问题:能不能充分利用大模型能力,将其迁移到机器人领域,直接...
-
Textual Inversion: 一种精调Stable Diffusion模型的方法
引言 最近的文本到图像Stable Diffusion (SD)模型已经证明了使用文本提示合成新颖场景的前所未有的能力。这些文本到图像的模型提供了通过自然语言指导创作的自由。然而,它们的使用受到用户描述特定或独特场景、艺术创作或新物理产品的能力的限制。...