-
连续3天蝉联Product Hunt榜首,AI一键“魔改”短视频工具Vozo什么来路?
最近,一款名为“Vozo Rewrite & Redub”(下文简称Vozo)的AI视频工具火了,上线即登Product Hunt榜首,且已蝉联3天。 这其中甚至还有Product Hunt CEO的一票。 图源X@LightField(Voz...
-
这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单
随着大型语言模型(LLM)规模不断增大,其性能也在不断提升。尽管如此,LLM 依然面临着一个关键难题:与人类的价值和意图对齐。在解决这一难题方面,一种强大的技术是根据人类反馈的强化学习(RLHF)。 但是,随着模型越来越大,RLHF 通常需要维持多个模型...
-
高亮反光终结者?谷歌NeRF-Casting:光线追踪就能搞定!
NeRF不再“畏惧”近处高光反射 早期的NeRF变体使用多层感知器(MLPs)从三维坐标映射到体积密度和视点相关的颜色,但是表示详细的三维几何和颜色所需的大型MLPs训练和评估速度极慢。最近的工作专注于通过用类似体素网格的数据结构或网格和小型MLPs的组...
-
综述170篇「自监督学习」推荐算法,港大发布SSL4Rec:代码、资料库全面开源!
推荐系统对于应对信息过载挑战至关重要,它们根据用户的个人偏好提供定制化推荐。近年来深度学习技术极大地推动了推荐系统的发展,提升了对用户行为和偏好的洞察力。 然而,由于数据稀疏性的问题,传统的监督学习方法在实际应用中面临挑战,这限制了它们有效学习用户表示的...
-
探索使用对比损失的孪生网络进行图像相似性比较
简介 在计算机视觉领域,准确地测量图像相似性是一项关键任务,具有广泛的实际应用。从图像搜索引擎到人脸识别系统和基于内容的推荐系统,有效比较和查找相似图像的能力非常重要。Siamese网络与对比损失结合,为以数据驱动方式学习图像相似性提供了强大的框架。在...
-
OpenAI和微软将投资1000亿美元建设全球最大的数据中心
ChatGPT 的背后开发者OpenAI ,计划与微软公司合作投资100亿美元建设全球最大数据中心。这个计划旨在开发人工通用智能(AGI)技术,并将配备一个超级计算机。 根据《The Information》的消息,两家公司的管理层正在进行一个名为 “St...
-
VoiceEngine官网体验入口 OpenAI人工智能语音克隆合成工具使用地址
Voice Engine是OpenAI推出的一种先进的语音合成模型,它仅需 15 秒的语音样本,便能生成与原始说话人极为相似的自然语音。 该模型广泛应用于教育、娱乐、医疗等领域,可为非读写人群提供朗读辅助、为视频和播客内容翻译语音、为非语言人群赋予独特语...
-
GPT-5史诗级更新之前,OpenAI的“新东西”来了,曝定价百万字符15美元,语音克隆引擎让老外说“有口音的”中文
撰稿 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) OpenAI的新动作来了!此前Altman在采访中透露,在GPT-5史诗级的升级发布之前,OpenAI将在未来几个月发布许多“很酷的新东西”。 今天,OpenAI语音引擎首次亮...
-
图感知对比学习提升多变量时间序列分类效果
今天给大家介绍一篇AAAI 2024中,由新加坡科技研究局(A*STAR)和新加坡南洋理工大学联合发表的时间序列分类工作,通过图感知对比学习改善多变量时间序列分类,取得了非常显著的效果提升。 图片 论文标题:Graph-Aware Contrasting...
-
GPT-SoVITS体验入口地址 AI语音克隆软件分享
GPT-SoVITS是一个强大的语音转换软件。该产品具有零样本TTS、少样本TTS、跨语言支持和WebUI工具等功能,可用于语音转换、语音合成、语音处理等场景。GPT-SoVITS的体验下载入口在哪呢,这里我们来看GPT-SoVITS的官方体验入口。 &...
-
蚂蚁营销推荐场景上的因果纠偏方法
一、因果纠偏的背景 1、偏差的产生 推荐系统里根据收集的数据来训练推荐模型,给用户推荐一个合适的 item,当用户与这个 item 产生交互后,数据又会被收集用于继续训练模型,从而形成一个闭环。但是这个闭环当中可能会存在各种各样的影响因素,因此会产生误差...
-
【 stable diffusion LORA模型训练最全最详细教程】
个人网站:https://tianfeng.space/ 文章目录 一、前言 二、朱尼酱的赛博丹炉 1.介绍 2.解压配置 3.使用 训练准备 首页设置 上传素材 查看进度 三、秋叶的lora训练器 1.下载 2.预处理 3.参...
-
基础模型+机器人:现在已经走到哪一步了
机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑,帮助机器人感知和理解这个世界并制定决策和进行规划。近日,CMU 的 Yonatan Bisk 和 Google DeepMind...
-
处理不平衡数据的过采样技术对比总结
在不平衡数据上训练的分类算法往往导致预测质量差。模型严重偏向多数类,忽略了对许多用例至关重要的少数例子。这使得模型对于涉及罕见但高优先级事件的现实问题来说不切实际。 过采样提供了一种在模型训练开始之前重新平衡类的方法。通过复制少数类数据点,过采样平衡了训...
-
一篇综述,看穿基础模型+机器人的发展路径
机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑,帮助机器人感知和理解这个世界并制定决策和进行规划。 近日,CMU 的 Yonatan Bisk 和 Google DeepMind...
-
Output 推出 Co-Producer:AI 驱动的 Pack Generator 为音乐制作人提供探索灵感的新途径
音乐创作软件公司 Output 今天宣布推出 Co-Producer,这是一项生成式 AI 技术,旨在增强音乐制作中的人类创造力,而非取代它。Co-Producer 的首个工具是 Pack Generator,它允许任何人通过简单的文本提示创建独特的免版税...
-
ChatGPT狂吐训练数据,还带个人信息:DeepMind发现大bug引争议
如果我不停地让 ChatGPT 干一件事,直到把它「逼疯」会发生什么? 它会直接口吐训练数据出来,有时候还带点个人信息,职位手机号什么的: 本周三,Google DeepMind 发布的一篇论文,介绍了一项让人颇感意外的研究成果:使用大约 200 美元...
-
OpenAI安全系统负责人长文梳理:大模型的对抗攻击与防御
随着 ChatGPT 的发布,大型语言模型应用正在加速大范围铺开。OpenAI 的安全系统团队已经投入了大量资源,研究如何在对齐过程中为模型构建默认的安全行为。但是,对抗攻击或 prompt 越狱依然有可能让模型输出我们不期望看到的内容。 目前在对抗攻击...
-
自动驾驶端到端规划方法汇总
本文经自动驾驶之心公众号授权转载,转载请联系出处。 一、Woven Planet(丰田子公司)的方案:Urban Driver 2021 这篇文章是21年的,但一大堆新文章都拿它来做对比基线,因此应该也有必要来看看方法。 大概看了下,主要就是用Po...
-
GPT-4教会机器手转笔、玩魔方!RL社区震惊:LLM设计奖励竟能超越人类?
GPT-4,竟然教会机器人转笔了! 图片 英伟达、宾大、加州理工、德州奥斯汀等机构的专家提出一个开放式Agent——Eureka,它是一个开放式Agent,为超人类水平的机器人灵巧性设计了奖励功能。 图片 论文链接:https://arxiv.org/p...
-
用GPT-4训练机器人,英伟达最新Agent开源:任务越复杂越拿手
量子位 | 公众号 QbitAI 训练机器人,AI比人类更拿手! 英伟达最新AI AgentEureka,用GPT-4生成奖励函数,结果教会机器人完成了三十多个复杂任务。 比如,快速转个笔,打开抽屉和柜子、抛球和接球。 尤其是转笔这个技能,要知道靠人类逐...
-
有了GPT-4之后,机器人把转笔、盘核桃都学会了
在学习方面,GPT-4 是一个厉害的学生。在消化了大量人类数据后,它掌握了各门知识,甚至在聊天中能给数学家陶哲轩带来启发。 与此同时,它也成为了一名优秀的老师,而且不光是教书本知识,还能教机器人转笔。 这个机器人名叫 Eureka,是来自英伟达、宾夕法...