-
智能车的「ChatGPT时刻」,还有多远?| 模力时代
要说今年“科技春晚”CES上最吸引眼球的是什么,智能车当属其一。 毕竟大模型一上车,智能座舱都卷成酱婶了: 让车上的数字助手帮忙记录约饭日程,Ta能直接帮你把餐厅也给预定了。 △骁龙座舱平台效果展示 规划路线这种事儿也变得充满巧思,数字助手会根据你的习...
-
AI盒子替你操作APP Rabbit R1是神器还是鸡肋?
2024CES展上,一款可以装进衣服口袋的AI硬件火了,名叫Rabbit R1的四方小设备只有巴掌大小,能连接WiFi、接打电话、登陆手机上的APP。无需操作,只需喊话,Rabbit R1会自动为你导航、叫车、订外卖;一双“AI眼”还能帮你“看看”未尽事务...
-
AI机器人席卷CES!OpenAI暗自解除ChatGPT军事应用限制,天网来了?
前一阵的斯坦福「炒虾机器人」,让无数人感慨:2024年怕不是要成为机器人元年? 就在这几天的CES 2024上,又一大波机器人在展厅里引起了轰动! 比如这个机器人咖啡师,娴熟地将一壶光滑的泡沫牛奶倒在拿铁咖啡上。 开始,它会慢慢倒出牛奶,随后,它优雅...
-
AIGC内容分享(十三):2023年中国AIGC产业全景报告
目录 核心摘要 中国AIGC产业之“变”与"新 技术变革的原始驱力:大模型层 价值传递的实际落位:应用层 不可忽视的资源引擎:算力层 中国AIGC产业之发展趋势 核心摘要 古人有云:日就月将,学有缉熙于光明。人类对人工智能学的潜心钻研...
-
国内多所高校共建开源社区LAMM,加入多模态语言模型大家庭的时候到了
ChatGPT问世以来,大语言模型(LLM)实现了跳跃式发展,基于自然语言进行人机交互的AI范式得到广泛运用。然而,人类与世界的交互中不仅有文本,其他诸如图片、深度等模态也同样重要。然而,目前的多模态大语言模型(MLLM)研究大多数闭源,对高校和大多数研...
-
AI成CES顶流!大模型定义硬件时代来了
作为全球最大的科技盛会,CES(国际消费类电子产品展览会)无疑是观察科技行业变化最好的窗口。 今年也不例外,美国当地时间1月9日~12日,CES 在拉斯维加斯迎来了全球超过150个国家和地区的4000余家参展商,参会者超过13万人,其中就有超过1114家中...
-
AIGC会不会是下一个泡沫?!
前言 众所周知,最近两年AI领域的蓬勃发展,且来势汹汹,剑指各行各业的岗位。虽然人工智能一直都是近几年的热门技术和话题,但是今年技术圈被AI刷爆了,前有chatGPT,后有AIGC,可以说最近的技术圈很热闹,先抛开chatGPT不提,就说说AIGC...
-
AI机器人席卷CES!OpenAI暗自解除ChatGPT这项限制,天网来了?
【新智元导读】CES2024上,各路机器人又是做咖啡拉花,又是给人按摩,让人大开眼界。然而就在这时,网友却惊讶地发现,OpenAI竟然悄悄删除了ChatGPT用于*和战争的限制! 前一阵的斯坦福「炒虾机器人」,让无数人感慨:2024年怕不是要成为机器人元年...
-
单帧标注视频就能学到片段特征,达到全监督性能!华科拿下时序行为检测新SOTA
如何从一段视频中找出感兴趣的片段?时序行为检测(Temporal Action Localization,TAL)是一种常用方法。 利用视频内容进行建模之后,就可以在整段视频当中自由搜索了。 而华中科技大学与密歇根大学的联合团队最近又为这项技术带来了新的...
-
【周末闲谈】如何利用AIGC为我们创造有利价值?
个人主页:【?个人主页】 系列专栏:【❤️周末闲谈】 系列目录 ✨第一周 二进制VS三进制 ✨第二周 文心一言,模仿还是超越? ✨第二周 畅想AR 文章目录 系列目录 前言 AIGC AI写作 AI绘画 AI视频生成 AI语音...
-
英伟达推新AI语音识别模型Parakeet 号称优于Whisper
领先的开源对话 AI 工具包 NVIDIA NeMo宣布推出 Parakeet ASR 模型系列,这是一系列最先进的自动语音识别(ASR)模型,能够以出色的准确性转录英语口语。Parakeet ASR 模型与 Suno.ai 合作开发,是语音识别领域的一大...
-
2023年末人工智能领域必读好书推荐—AIGC、AGI、GhatGPT、人工智能大模型必读书单
文章目录 一.2023-人工智能领域概览 1. AIGC 2. AGI 3. GhatGPT 4. 人工智能大模型 二.AIGC、AGI、GhatGPT、人工智能大模型必读书单 01 《ChatGPT 驱动软件开发》 02 《ChatGP...
-
AI平台:OpenXLab浦源
OpenXLab浦源 开放项目应用中心模型中心数据集中心文档中心 搜索 中文EN创建登录注册人工智能开源开放体系浦源内容平台应用中心探索多领域应用,体验丰富的社区生态AIGC语音计算机视觉自然语言处理多模态技术更多在这里...
-
AI平台:米羊写完啦
米羊写完啦 个人身份登录微信登录请使用微信扫描二维码登录未注册过的微信号,我们将自动帮你注册账号继续扫码表示您已阅读并同意 隐私政策 和 在线服务协议Copyright © 2023 米羊科技(深圳)有限公司 粤ICP备2023103765...
-
东京大学开发仿人机器人Alter3 能执行ChatGPT指令
Alter3是由日本东京大学开发的一种仿人机器人。研究人员通过将Alter3与GPT-4相连接,成功实现了让机器人模仿人类行为的目标。为了让机器人执行各种动作,研究人员向Alter3发送了一系列的指令。 通过使用大型语言模型,这些书面指令被转化为机器人可以...
-
多模态运动语言模型MotionGPT 可将语言指令转换为3D人体运动
MotionGPT是一款令人惊叹的技术创新,它统一了语言和运动,将语言指令转换为引人入胜的3D人体运动。这一模型的设计灵感源于即时学习,通过混合运动语言数据进行预训练,并通过基于提示的问答任务进行微调,使其具备卓越的性能。 项目地址:https://hu...
-
让机器人感知你的「Here you are」,清华团队使用百万场景打造通用人机交接
来自清华大学交叉信息研究院的研究者提出了「GenH2R」框架,让机器人学习通用的基于视觉的人机交接策略(generalizable vision-based human-to-robot handover policies)。这种可泛化策略使得机器人能更...
-
AAAI 2024 Fellow公布,清华大学朱军教授入选
AAAI(Association for the Advancement of Artificial Intelligence)是国际人工智能领域最权威的学术组织之一,Fellow 是该学会给予会员的最高荣誉,仅颁给对人工智能做出「非同寻常的卓越贡献者」...
-
高情商的NPC来了,刚伸出手,它就做好了要配合下一步动作的准备
在虚拟现实、增强现实、游戏和人机交互等领域,经常需要让虚拟人物和屏幕外的玩家互动。这种互动是即时的,要求虚拟人物根据操作者的动作进行动态调整。有些互动还涉及物体,比如和和虚拟人物一起搬动一把椅子,这就需要特别关注操作者手部的精确动作。智能、可交互的虚拟人...
-
肖仰华:走向千行百业的大模型
现如今,我们站在了大模型技术和产业发展的中场思考阶段。这个阶段的开启源于 ChatGPT 的诞生,它引发了广泛而深入的关注。尽管这种关注对于推动技术和产业的发展起到了至关重要的作用,但同时我们也看到了一系列问题的浮现。这些问题包括成本和价值的问题以及一些...
-
InsActor官网体验入口 AI物理模拟角色控制系统免费下载地址
InsActor是一款基于物理模拟的先进角色控制系统。它通过自然语言指令驱动角色,在复杂的环境中执行各种交互任务。这个系统结合了条件与对抗扩散模型进行多级规划,以及与低级控制器的结合,实现了流畅且鲁棒的控制。InsActor非常适合用于创意内容生成、互动娱...
-
文心一言实测:什么是文心一言?
我不了解百度,能用五百字向我介绍这个公司吗? 百度是一家全球领先的互联网公司,致力于为人们提供便捷、高效、智能的信息获取和交流服务。公司成立于2000年1月,总部位于中国北京。 百度在搜索引擎、AI技术、云计算等领域拥有强大的技术实力和丰富的产...
-
打造「专属arXiv」!德国高校顶级视觉团队推出「论文定制化」推荐系统,免费开放
10毫秒生成一张图像,1分钟6000张图像,这是什么概念? 下图中,就可以深刻感受到AI的超能力。 图片 甚至,当你在二次元小姐姐图片生成的提示中,不断加入新的元素,各种风格的图片更迭也是瞬间闪过。 图片 如此惊人的图片实时生成速度,便是来自UC伯克利、...
-
单张4090,1秒100张二次元小姐姐!UC伯克利等新模型霸榜Github,吞吐量提升近60倍
10毫秒生成一张图像,1分钟6000张图像,这是什么概念? 下图中,就可以深刻感受到AI的超能力。 甚至,当你在二次元小姐姐图片生成的提示中,不断加入新的元素,各种风格的图片更迭也是瞬间闪过。 如此惊人的图片实时生成速度,便是来自UC伯克利、日本筑波大学...
-
港联证券|万亿级AIGC赛道或迎有序监管
近段时间,连续有国内外科技巨子涌入万亿级AIGC(生成式AI)赛道,A股商场上AIGC、ChatGPT等人工智能相关概念也是继续火热。但与此同时,安全隐患也如冰山一角逐渐露出。多国政府正在考虑加强对其监管,AIGC在全球范围内正在进入强监管时代。在强监管之...
-
Video-LLaMA An Instruction-tuned Audio-Visual Language Model for Video Understanding 用于视频理解的指令调谐视听语言
1.摘要 我们提出了一个多模态框架Video-LLaMA1,它使大型语言模型(LLM 能够理解视频中的视觉和听觉内容。视频-来自冻结的预训练视频和音频编码器和冻结的LLM的美洲驼引导跨模式训练。不像以前的工作,补充线性最小二乘法只处理视觉或听觉信号...
-
研究:大模型在回答中会重复有害的错误信息
对大型语言模型的新研究表明,它们重复了阴谋论、有害的刻板印象和其他形式的错误信息。 在最近的一项研究中,滑铁卢大学的研究人员系统地测试了 ChatGPT 早期版本对六类陈述的理解:事实、阴谋、争议、误解、刻板印象和虚构。这是滑铁卢研究人员研究人机交互并探索...
-
ChatGPT抢走了数据!编程语言排行榜,没法做了!
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 提及编程语言排行榜,很多人都能想到Tiobe、RedMonk、Stack Overflow等,基本上它们更新的频率也相对固定。但最近,这家号称编程语言榜单天花板的RedMonk似...
-
BlueLM蓝心大模型测试体验入口 热门手机AI大模型推荐
BlueLM蓝心大模型是vivo AI全球研究院自主研发的大规模预训练语言模型,具有 70 亿模型参数量,能处理32K上下文长度。它基于260TB的多语言训练语料,提供了强大的语言理解能力,并可广泛应用于内容创作、知识问答、逻辑推理、代码生成等场景,持续为...
-
中国版的chatGPT“文心一言“到底怎样?
GPT4的提前发布,把压力着实给到百度了!在ChatGPT引爆聊天机器人领域后的数月,我们终于迎来了国内的第一款生成式对话产品。 3月16日14:00,百度文心一言新闻发布会于百度北京总部正式召开。百度创始人、董事长兼CEO李彦宏也实现了自己此前的诺言,...
-
2023.12.12最新源码及资源:使用Python构建与百度大模型(包括文心一言在内的18个语言模型)的交互式界面!!
#ps:12.12修复bug,部分模型不能回应的问题,资源已更新! 在当前人工智能领域,通过与机器进行智能对话的能力变得越来越重要。本文将介绍如何使用Python编程语言和Tkinter库构建一个交互式界面,使用户能够与百度大模型进行智能对话,展...
-
六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革
两千年前的古人穿越到一千年前后,需要适应的东西可能不多。而一千前的古人穿越到一百年前,变化也不至于大到难以适应。但如果一百年前的古人穿越到现在,甚至只是有人“冬眠”10年、20年,面对的现实世界的变化,恐怕会是天翻地覆。日新月异的技术进步,正不断带来颠覆...
-
【AIGC】ChatGPT联动脑机接口实验,用脑电波回邮件
文章目录 前言 正文 应用场景 总结 写在最后 前言 科幻小说和电影中经常出现的场景是人类与计算机之间通过脑机接口进行交互,这种技术一直被认为是未来的发展方向。 然而,近年来,随着人工智能技术的快速发展,我们似乎离这个科幻场景越...
-
AIGC快速入门体验之虚拟对象
AIGC快速入门体验之虚拟对象 一、什么是AIGC 二、AIGC应用场景 2.1 代码生成 2.2 图片生成 2.3 对象生成 三、AIGC虚拟对象 3.1 AIGC完全免费工具 3.2 快速获取对象 3.3 给对象取名 3.4 为对象写...
-
【Video-LLaMA】增强LLM对视频内容的理解
Paper:《Video-LLaMA : An Instruction-tuned Audio-Visual Language Model for Video Understanding》 Authors: Hang Zhang, Xin Li, Lid...
-
当GPT-4V充当机器人大脑,可能你都没AI会规划
GPT-4V 已经能帮我们设计网站代码,控制浏览器,这些应用集中在虚拟数字世界中。假如我们把 GPT-4V 带入现实世界,让它作为控制机器人的大脑,会有什么有趣的结果呢? 最近,来自清华大学交叉信息研究院的研究者提出「ViLa」算法,实现了让 GPT-4...
-
Speaking AI官网体验入口 语音AI软件app免费下载地址
《Speaking AI》是一款集成了先进语音识别和自然语言处理技术的产品,旨在帮助用户通过语音与AI进行互动。这个工具的设计目的是简化人机交互,提供流畅的语音沟通体验。《Speaking AI》在哪里可以体验呢?下面就给大家带来《Speaking AI》...
-
GPT-4没通过图灵测试!60年前老AI击败了ChatGPT,但人类胜率也仅有63%
长久以来,「图灵测试」成为了判断计算机是否具有「智能」的核心命题。 上世纪60年代,曾由麻省理工团队开发了史上第一个基于规则的聊天机器人ELIZA,在这场测试中失败了。 时间快进到现在,「地表最强」ChatGPT不仅能作图、写代码,还能胜任多种复杂任务...
-
今日思考(1) — 算力对机器人的影响(基于文心一言的回答)
目录 1.高tops的算力能支持什么水平的复合机器人控制 2.什么情况下控制机器人需要更高的算力 3.为什么使用人工智能算法,例如深度学习、强化学习等,需要更多的计算资源来实现更精准的决策和控制。 4.将已经训练好的人工智能算法模型,例...
-
人工智能的博弈论——初探智能体(Agents)与人、智能体和环境之间的博弈关系
人工智能(AI)是研究如何使计算机和机器具有智能行为的学科,它涉及到多个领域和应用,如机器学习、深度学习、自然语言处理、计算机视觉、机器人、自动驾驶等。人工智能的发展和应用,不仅给人类带来了便利和效率,也带来了挑战和风险,如数据安全、隐私保护、伦理道德、...
-
人工智能ai写作系统,ai智能写作机器人
人工智能AI大数据深度:基于伪原创算法,采用神经网络算法,在超过1535000篇文章中进行自动学习、聚合算法进行人工智能的创建,内容语义不变,媒体阿里、腾讯、百度均于日前在百家号内容创作者盛典上推出人工智能创作支撑平台创作大脑。 智能助手可以为人类创作者...
-
验证码安全志:AIGC+集成环境信息信息检测
目录 知己知彼,黑灰产破解验证码的过程 AIGC加持,防范黑灰产的破解 魔高一丈,黑灰产+AIGC突破常规验证码 双重防护,保障验证码安全 黑灰产经常采用批量撞库方式登录用户账号,然后进行违法违规操作。 黑灰产将各种方式窃取账号密码导入批...
-
ChatGPT vs AutoGPT:比较顶级语言模型
理解 ChatGPT 由 OpenAI 开发的 ChatGPT 是一种语言模型,旨在根据接收到的输入生成类似于人类的文本。它使用一种称为 Transformer 的机器学习技术,使其能够生成连贯且与上下文相关的响应。 ChatGPT 的一个关键功能是它能...
-
一文读懂 AutoGPT 开源 AI Agents
Hello folks,我是 Luga,今天我们继续来聊一下人工智能(AI 生态领域相关的技术 - AutoGPT AI Agents ,本文将聚焦在针对不同类型的 AutoGPT 技术进行解析,使得大家能够了解不同 AutoGPT 实现机制以及所应...
-
BlueLM蓝心大模型官网体验入口 vivoAI免费软件app下载
《BlueLM蓝心大模型》是vivo自主研发的智能语言理解模型,具有 70 亿模型参数量,能处理32K上下文长度。它基于260TB的多语言训练语料,提供了强大的语言理解能力,并可广泛应用于内容创作、知识问答、逻辑推理、代码生成等场景,持续为用户提供安全可靠...
-
Windows Copilot官网体验入口 微软生产力免费AI软件app下载
《Windows Copilot》是微软在Windows11 中推出的一款基于AI技术的智能助手。它旨在提供智能化的帮助和提醒,从而提高用户在使用Windows时的工作效率和生产力。《Windows Copilot》在哪里可以体验呢?下面就给大家带来《Wi...
-
史上最强小爱!小爱同学大模型文章摘要来了:英文文章秒看懂
快科技11月22日消息,今日,小米澎湃OS”官微宣布,小爱同学大模型正式上线文章摘要”功能。 据悉,文章摘要具有系统级入口,支持多类应用,可节省用户的阅读时间。 另外,文章摘要功能还能让英文文章直接生成中文摘要,阅读更迅速同时,还能秒懂文章主要内容。 使用...
-
大数据&AI课程更新——6月AI绘画入门小课
在这个课程中,我们将探索人工智能在绘画领域的应用,学习如何利用AI技术创造出令人惊叹的艺术作品。无论你是对绘画有兴趣的初学者,还是已经有一定绘画基础的学生,本训练营都将为你提供一个展示创造力和实践技巧的平台。 2022年是AI绘画的元年。...
-
ai写作生成器有哪些?试试这几款工具吧
近年来,随着ai技术的飞速发展,越来越多的人开始意识到ai文本生成器的重要性和实用性。这种文本生成器可以帮助我们快速生成各种类型的文章,如报告、评论、新闻、邮件等,它的应用范围已经非常广泛了。不仅如此,随着机器学习和深度神经网络技术的不断进步,ai...
-
蓝心大模型拿到三个榜单第一 vivo X100系列率先搭载
11月13日晚19:00,vivo X100新品发布会正式开始。 根据vivo介绍,蓝心大模型在C-Eval、CMMLU、SuperCLUE三个榜单中都名列前茅,中文能力行业第一。vivo X100系列率先搭载了蓝心大模型的vivo X100系列,将会是行...