-
即插即用,完美兼容:SD社区的图生视频插件I2V-Adapter来了
图像到视频生成(I2V)任务旨在将静态图像转化为动态视频,这是计算机视觉领域的一大挑战。其难点在于从单张图像中提取并生成时间维度的动态信息,同时确保图像内容的真实性和视觉上的连贯性。大多数现有的 I2V 方法依赖于复杂的模型架构和大量的训练数据来实现这一...
-
机器人又拿下一种家务:10小时学会煮咖啡,仅需观看人类演示视频
上周斯坦福炒虾机器人炸场之后,又火了一个煮咖啡机器人。 它的厉害之处在于通过观看人类的示范视频,仅需10小时端到端训练,就能学会并完全自主搞定这一任务。 当然,更准确地来说是操作咖啡机: 只见它打开机盖、放入咖啡包,再按下开始按钮,整个过程一气呵成,无...
-
文心一言没有体验上,看看讯飞星火认知大模型
目录 前言 正文 1.简单对话环节 1.1什么是讯飞星火认知大模型 1.2你都可以干一些什么 1.3你的训练数据库还在持续更新么 1.4今天是哪一天 1.5宇宙中有哪些目前认为可能存在生命的星球 2.辅助学习对话 2.1我想完成一篇...
-
AIGC市场群雄逐鹿,阿里云发出了什么大招?
如果要评选当下IT圈最火爆的话题,相信就算生成式AI(Artificial Intelligence Generated Content,简称AIGC)甘认第二,也没有人敢认第一。 于是我们看到,在ChatGPT快速升级迭代的同时,百度、360、...
-
2024 AIGC 应用层十大趋势;iPhone 遭史上最复杂攻击!丨 RTE 开发者日报 Vol.119
开发者朋友们大家好: 这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE (Real Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的...
-
大翻车!斯坦福超火机器人自曝内幕,研究者救场还受伤了,网友:放心了
爆火的斯坦福全能家务机器人Mobile ALOHA,大!翻!!车!!! 你以为它擦个红酒轻而易举,但实际上却是这样的: 全给你弄撒喽,顺带碎个杯子 …… 你以为它能化身大厨娴熟烹炒,结果给你上演一个炒锅底: Mobile ALOHA的翻车大合集还不止...
-
2023年第十八届中国企业年终评选榜单揭晓:启明星辰盘小古安全大模型斩获2023年度中国IT行业安全创新产品奖
2023年11月,由51CTO主办,联合WOT大会往届联席主席、CTO组织共同举办的《中国企业 “IT印象◆创新驰而不息,数字时代进行时”年终评选》活动全面启动。本次评选活动主要从品牌、产品与技术、解决方案、应用服务、合作伙伴等维度进行,通过媒体曝光、微...
-
科技部发文规范AI使用 科研人员禁用AIGC直接生成申报材料
据科学技术部消息,科技部监督司近日编制印发《负责任研究行为规范指引(2023)》,提出不得使用生成式人工智能(AIGC 直接生成申报材料,不得将生成式人工智能列为成果共同完成人,同时强调科研人员应把科技伦理要求贯穿到研究活动的全过程。 《指引》适用对象包...
-
科技部发文规范 AI 使用,禁用 AIGC 直接生成申报材料
IT之家 1 月 3 日消息,科技部监督司上个月编制印发《负责任研究行为规范指引(2023)》,《指引》从研究选题与实施、数据管理、成果署名、同行评议、伦理审查、监督管理等 11 个方面,对科研人员和科研机构、高等学校、医疗卫生机构、企业等(以下统称“...
-
AIGC产业研究报告2023——视频生成篇
易观:今年以来,随着人工智能技术不断实现突破迭代,生成式AI的话题多次成为热门,而人工智能内容生成(AIGC)的产业发展、市场反应与相应监管要求也受到了广泛关注。为了更好地探寻其在各行业落地应用的可行性和发展趋势,易观对AIGC产业进行了探索并将发布AIG...
-
人工智能揭开拉斐尔名画的秘密:并非完全出自大师之手
12 月 31 日消息,最近,一个 人工智能神经网络在拉斐尔的一幅名画中发现了一个不同寻常之处:其中一幅面孔竟然不是出自拉斐尔本人之手。 这幅画名为《玫瑰圣母(Madonna della Rosa)》,长期以来,学者们一直对这幅画是否是拉斐尔原作争论不...
-
基础模型+机器人:现在已经走到哪一步了
机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑,帮助机器人感知和理解这个世界并制定决策和进行规划。近日,CMU 的 Yonatan Bisk 和 Google DeepMind...
-
一文读懂用于构建多代理的 CrewAI 开源框架
Hello folks,我是 Luga,今天我们继续来聊一下人工智能(AI 生态领域相关的技术 - AI Agents ,本文将继续聚焦在针对新型开源 AI Agents CrewAI 的技术进行解析,使得大家能够了解 CrewAI 的基本概念以及基于...
-
一篇综述,看穿基础模型+机器人的发展路径
机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑,帮助机器人感知和理解这个世界并制定决策和进行规划。 近日,CMU 的 Yonatan Bisk 和 Google DeepMind...
-
李飞飞DeepMind全新「代码链」碾压CoT!大模型用Python代码推理,性能暴涨12%
思维链(CoT),最具开拓性和影响力的提示工程技术之一,能增强LLM在推理决策中的表现。 那么,如果大模型可以在代码中「思考」,会如何呢? 最近,谷歌DeepMind、斯坦福、UC伯克利团队联手提出了全新技术——「代码链」(CoC)。 论文地址:htt...
-
百度文心一言到底咋样?科普介绍文心一言
百度文心一言 什么是文心一言? 百度文心一言是一款基于自然语言处理技术的智能对话系统。它能够与人类用户进行交互,提供问题解答、知识咨询、闲聊互动等服务。作为百度研发的重要成果之一,文心一言在行业内具有领先地位,并在多个领域得到了广泛应用。...
-
派拓网络:以AI对抗AI,是网络安全技术发展的必然趋势
“我们不可能利用人力去阻挡AI的攻击,我们必须利用AI去对抗AI,这是唯一的路。” 伴随生成式人工智能的浪潮,AI在网络安全领域的应用越来越广泛。然而,与此同时,AI技术也被不法分子利用,成为网络攻击的新手段。在派拓网络IGNITE中国2023(北京站)...
-
只需一个眼神!韩国医学院使用AI筛查自闭症:准确率100%
快科技12月21日消息,据媒体报道,韩国延世大学医学院近日发布了一项研究成果:可用深度学习后的人工智能算法,对儿童的视网膜照片进行分析,从而检测儿童是否患有自闭症谱系障碍(ASD)。 据悉,在本次实验中,研究人员共召集了900多名年龄在7-8岁的儿童,其中...
-
【兔子王赠书第13期】AI绘画实战:Midjourney从新手到高手
文章目录 写在前面 AI绘画 推荐图书 一本书读懂AI绘画 关键点 内容简介 作者简介 推荐理由 粉丝福利 写在后面 写在前面 如今AI技术已经进入了我们的日常学习生活中,如何用一本书轻松玩转AI绘画,领略无限艺术可能呢?...
-
人工智能有能力彻底改变科学研究
人工智能(AI 是一门涉及计算机科学、数学、心理学、语言学等多个学科的交叉学科,它旨在创造能够模拟或超越人类智能的系统和应用。AI的发展经历了几个阶段,从早期的符号主义、联结主义,到近年来的统计学习、深度学习等,不断地突破了理论和技术的限制,实现了许多令...
-
谷歌AI提出视觉语言模型PixelLLM:能够进行细粒度定位和视觉语言对齐
谷歌AI研究团队与加州大学圣迭戈分校的研究人员合作,提出了一种名为PixelLLM的智能模型,旨在解决大型语言模型在细粒度定位和视觉-语言对齐方面的挑战。这一模型的提出受到了人类自然行为的启发,尤其是婴儿描述其视觉环境的方式,包括手势、指向和命名。 Pix...
-
OpenAI 的超级对齐团队在做什么
今年11月17日,OpenAI 首席执行官萨姆·奥尔特曼 (Sam Altman 在首席科学家伊利亚·苏茨克韦尔 (Ilya Sutskever 的政变下被罢免,但三天后复职。不到一个月,OpenAI 宣布一切恢复正常,而这一切导火索是团队内部的有...
-
Gemini自曝中文用百度文心一言训练,网友看呆:大公司互薅羊毛??
谷歌Gemini中文语料疑似来自文心一言??? 先是有读者向我们爆料: 在谷歌Vertex AI平台使用该模型进行中文对话时,Gemini-Pro直接表示自己是百度语言大模型。 很快,有微博大V@阑夕夜也发博称: 在Poe平台上对Gemini-Pro进行...
-
2024 年的六个生成式 AI 预测
分析师迈克·莱昂内(Mike Leone)预测了生成式人工智能的下一步——从开源到监管转变——提供了对2024年行业发展方向的全面看法。 随着 2023 年接近尾声,是时候展望明年了。当涉及到生成式人工智能时,我们很容易迷失在所有的可能性中——我们在 ...
-
AI首次攻克难倒陶哲轩数学难题,DeepMind里程碑算法登Nature!LLM搜代码自我进化
上限集问题,是困扰数学家们多年的开放性问题。 著名数学家陶哲轩,就曾将上限集问题描述为自己最喜欢的开放性问题。 陶哲轩博客 而大语言模型,竟然在这个问题上做出了新发现。 今天,Google DeepMind、威斯康星大学麦迪逊分校和里昂大学的研究人员联...
-
首个GPT-4驱动的人形机器人!无需编程+零样本学习,还可根据口头反馈调整行为
让GPT-4操纵人形机器人,事先不做任何编程or训练,能搞成啥样儿? 答案是:太 猎 奇 了! 这不,要求机器人表演“在昏暗电影院里狂炫爆米花,却突然发现吃的是隔壁陌生人的?”。 在GPT-4的操纵下,机器人笑容凝固,“尴尬”得摇头扶额后仰: 但在尴尬...
-
Diffusion Model (扩散生成模型)的基本原理详解(三)Stochastic Differential Equation(SDE)
本篇是《Diffusion Model (扩散生成模型 的基本原理详解(二)Score-Based Generative Modeling(SGM 》的续写,继续介绍有关diffusion的另一个相关模型,同理,参考文献和详细内容与上一篇相同,读者可自行查...
-
当GPT-4V充当机器人大脑,可能你都没AI会规划
GPT-4V 已经能帮我们设计网站代码,控制浏览器,这些应用集中在虚拟数字世界中。假如我们把 GPT-4V 带入现实世界,让它作为控制机器人的大脑,会有什么有趣的结果呢? 最近,来自清华大学交叉信息研究院的研究者提出「ViLa」算法,实现了让 GPT-4...
-
GTA6预告片播放过亿,AI三巨头也能秒变GTA匪帮
GTA 新出的游戏预告片看了吗?据说,这个预告片已经破了三项吉尼斯世界纪录,观看次数已经破亿。 但如果告诉你,AI 三巨头也可以成为 GTA 里的人物,你还能认出他们吗? AI 三巨头:Yann LeCun、Geoffrey Hinton 和 Yos...
-
新AI技术Gaussian Avatars:让AI轻松模仿瞪眼、挑眉等表情
近期,慕尼黑工业大学等机构的研究团队成功开发了一项名为Gaussian Avatars的AI技术,能够在表情、姿态和视角上实现完全可控的逼真头部。这一技术引起了广泛关注,尤其是在复制人类面部极端表情和细节方面取得了显著进展。 张嘴、瞪眼、挑眉等表情,通过G...
-
量子计算OpenAI来了?前谷歌3人团队融资1亿元,打造AI算力芯片挑战物理极限
在生成式AI的时代,算力已经肉眼可见的成为了技术发展的天花板。 英伟达几乎是现在这个时代算力问题的唯一解。 三十年前,在那个Denny's餐厅里开会的英伟达创始团队,肯定想象不到,他们看好的计算方式,将某种程度决定30年后人类智能的上限。 而我们这个时代...
-
进亦忧,退亦忧,Github Copilot 集成进入 Visual Studio 带来的思考
开篇想到《岳阳楼记》的结尾: 不以物喜,不以己悲;居庙堂之高则忧其民;处江湖之远则忧其君。是进亦忧,退亦忧。然则何时而乐耶?其必曰:“先天下之忧而忧,后天下之乐而乐”乎。 未来30年的开发变革,与过去30年相比,是指数函数才能勉强描述的趋势。有时候回...
-
基于AI的架构优化:创新数据集构造法提升Feature envy坏味道检测与重构准确率
本文分享自华为云社区《华为云基于AI实现架构坏味道重构取得业界突破,相应文章已被软工顶会FSE 2023收录》,作者: 华为云软件分析Lab。 基于AI技术实现架构坏味道检测与重构建议是当前业界比较流行的做法,但此做法往往存在一个通病,即训练数据集的质量...
-
AI颠覆材料学!DeepMind重磅研究登Nature,预测220万晶体结构赢人类800年
陶哲轩一直看好,ChatGPT将颠覆数学证明,而如今,AI在化学领域的潜力同样深不可测。 今天,220万种晶体结构完全被AI预测出来了。 这是什么概念?相当于近800年的知识价值。 谷歌DeepMind开发全新AI工具GNoME,能够预测新材料的稳定性,...
-
ChatGPT狂吐训练数据,还带个人信息:DeepMind发现大bug引争议
如果我不停地让 ChatGPT 干一件事,直到把它「逼疯」会发生什么? 它会直接口吐训练数据出来,有时候还带点个人信息,职位手机号什么的: 本周三,Google DeepMind 发布的一篇论文,介绍了一项让人颇感意外的研究成果:使用大约 200 美元...
-
谷歌已利用 DeepMind AI 对数千种新材料进行了分析预测
IT之家 11 月 30 日消息,谷歌旗下的 DeepMind 利用人工智能(AI)预测了超过 200 万种新材料的结构,该公司表示这一突破性成果将推动现实世界的技术改进。 其相关研究成果已经在当地时间周三以题《An autonomous labora...
-
pika官网内测申请地址入口 pika AI视频生成工具怎么使用
Pika 1.0 是一个新的视频工具套件,引入了一种能够以多种风格编辑视频的生成式 AI 模型,比如「3D 动画」、「动漫」和「电影」。Pika 在今晨其网站上发布的博客文章中写道:「视频是娱乐的核心,但到目前为止,制作高质量视频的过程仍然复杂且资源密集。...
-
IDEA提出ToG思维图谱 大模型性能提升214%!
近期,由IDEA研究院、微软亚洲研究院、香港科技大学等多方研究团队合作推出的Think-on-Graph技术,在深度推理领域掀起了一场革新。这一技术通过紧耦合大模型(LLM)与知识图谱(KG ,成功弥补了大模型在金融、法律、医疗等领域幻觉问题上的能力短板。...
-
疑似威胁人类?OpenAI神秘Q*项目更多信息曝光,马斯克、Lecun下场争论…
夕小瑶科技说 原创 作者 | 王二狗大家好我是二狗 随着前天 OpenAI 官宣 Sam Altman 将回归,并继续担 CEO,OpenAI“宫斗事件”已经告一段落了。 然而,对于专业吃瓜的二狗来说,有一个核心问题还是没有搞明白: Sam Altman...
-
视频生成新突破:PixelDance,轻松呈现复杂动作与炫酷特效
最近,除了大语言模型继续持续刷屏,视频生成技术也取得了重大进展,多家公司相继发布了新模型。 首先,作为最早探索视频生成领域的领头羊之一,Runway 升级了其 Gen-2 模型,带来了电影级别的高清晰度,令人瞩目,并称视频生成的一致性得到了重大改进。 但...
-
能总结经验、持续进化,上交把智能体优化参数的成本打下来了
大模型的出现引发了智能体设计的革命性变革,在 ChatGPT 及其插件系统问世后,对大模型智能体的设计和开发吸引了极大的关注。帮助完成预订、下单等任务,协助编写文案,自主从网络上搜索最新的知识与新闻等等,这种通用、强大的智能助理,让大模型强大的语义理解、...
-
OpenAI神秘新模型Q*曝光,太强大让董事会警惕,或是奥特曼被开除导火索
OpenAI宫斗大戏刚刚落幕,马上又掀起另一场轩然大波! 路透社曝光,在奥特曼被解雇之前,几位研究人员给董事会写的警告信可能是整个事件导火索: 内部名为Q (发音为Q-Star)*的下一代AI模型,过于强大和先进,可能会威胁人类。 Q*正是由这场风暴的中...
-
ChatGPT 使用到的机器学习技术
作者 | Bright Liao 在《程序员眼中的 ChatGPT》一文中,我们聊到了开发人员对于ChatGPT的认知。本文来聊一聊ChatGPT用到的机器学习技术。 机器学习技术的发展 要聊ChatGPT用到的机器学习技术,我们不得不回顾一下机器学...
-
起底OpenAI“地震”中的焦点人物Ilya,他对AI到底有何看法?
OpenAI CEO山姆·奥特曼(Sam Altman)上周五被解雇,不再领导公司。 投资者对这种安排多有不满,尝试让奥特曼回归,但失败了。OpenAI最大的投资者微软发布消息称,已经聘请奥特曼领导微软新成立的AI研发部门。 为什么会出现人事动荡?我们不...
-
一种全新的日志异常检测评估框架:LightAD
本文分享自华为云社区《【AIOps】一种全新的日志异常检测评估框架:LightAD,相关成果已被软工顶会ICSE 2024录用》,作者: DevAI。 深度学习(DL)虽然在日志异常检测中得到了不少应用,但在实际轻量级运维模型选择中,必须仔细考虑异常检测...
-
中国科学院:已于分组加密算法的差分密码分析方面取得进展
IT之家 11 月 20 日消息,据中国科学院软件研究所官方公众号报道,近日,中国科学院软件研究所可信智能系统研究团队在分组加密算法的差分密码分析方面取得一定进展。 据悉,该工作团队设计了一个面向分组加密算法的领域编程语言 EasyBC,在此基础上提出...
-
探寻人工智能前沿 迎接AIGC时代——CSIG企业行(附一些好玩的创新点)
上周我有幸参加了由中国图像图形学会和合合信息共同举办的CSIG企业行活动。 这次活动邀请了多位来自图像描述与视觉问答、图文公式识别、自然语言处理、生成式视觉等领域的学者,他们分享了各自的研究成果和经验,并与现场观众进行了深入的交流和探讨。干货多多...
-
Luca.ai 网站利用 ChatGPT 向有阅读障碍的儿童教授阅读技能
Scott Sosso 因为儿子 Luca 被诊断出患有阅读障碍,经过十年的孜孜不倦探索,而开发了一个名为 Luca.ai 的网站,旨在帮助同样面临这一挑战的人们学习阅读。 Luca.ai 于 11 月 2 日正式上线,囊括了三大核心功能:StoryLa...
-
AI重塑媒体行业,凤凰卫视重磅入场AI数据赛道
媒体人在2023年或多或少都有点“失业”焦虑——媒体人被认为是最可能被ChatGPT取代的高危职业之一。 面对人工智能的冲击,部分媒体选择以防御之态应对,保护自己的内容不受大语言模型的“侵略”。根据《卫报》的报道,CNN、纽约时报和路透社等多个媒体巨头在...
-
最新本地大模型进展#Chinese-LLaMA-2支持16k长上下文
Hi,今天为大家介绍最新的本地中文语言模型进展。 [2023/08/25] Chinese-LLaMA-2发布了新的更新: 长上下文模型Chinese-LLaMA-2-7B-16K和Chinese-LLaMA-2-13B-16...