-
AI日报:会颠勺的国产机器人Astribot S1来了;Synthesia推能读懂文字情绪的数字人;OpenVoice V2版本发布;DeepFacelive让你在直播中实时换脸
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Synthesia推出新型数字...
-
Open-Sora全面开源升级:支持16s视频生成和720p分辨率
Open-Sora 在开源社区悄悄更新了,现在支持长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的生成需求。我们来试试效果。 生成个横屏圣诞雪景,发b站 再生成个竖屏,发...
-
全国首例“AI声音侵权案”宣判:获赔25万元
快科技4月24日消息,北京互联网法院昨日对全国首例AI生成声音人格权侵权案进行了一审判决。 该案涉及的主要问题是自然人的声音权益是否应扩展到AI生成的声音,以及如何确定AI生成声音的可识别性。 原告殷某是一名配音师,发现其配音作品在多个APP中广泛流传。这...
-
从0到1,聊聊货拉拉如何搭建数据指标体系
一、背景 指标体系是指一系列维度、有组织及结构的指标集合。构建指标体系主要是为公司业务目标落地做辅助决策,以及监控业务运行的稳定性情况等。 具体从业务、技术及产品三个视角来阐述指标体系构建中的痛点: 1. 业务视角: 可信任性:业务口径不一致,导致指...
-
大模型一对一战斗75万轮,GPT-4夺冠,Llama 3位列第五
关于Llama 3,又有测试结果新鲜出炉—— 大模型评测社区LMSYS发布了一份大模型排行榜单,Llama 3位列第五,英文单项与GPT-4并列第一。 图片 不同于其他Benchmark,这份榜单的依据是模型一对一battle,由全网测评者自行命题并打分...
-
90后二次元北大校友做出AI漫画创作工具,融资千万
AI绘画已经火了两年,但仍有一群人并不满意。 对于他们,仅仅是一张极尽精致的图片还不够,他们希望为画中的人物赋予更完善的性格、好恶、身世、人际关系、世界观,让Ta有血有肉,仿佛真实存在。 “这就是为什么我们的产品叫做‘AI驱动的角色幻想创作平台’,而非AI...
-
史上首次!AI驾驶战机成功与人类飞行员空中「狗斗」
AI 操纵的战斗机又一次进化了! 近日,美国 DARPA 透露称,去年 9 月一架由 F-16 改装而成的 AI 验证机,有史以来首次成功地在视距内与人类飞行员进行空中缠斗(俗称狗斗),让我们看到了人工智能在空战领域的应用前景。 该验证机代号为 X-62...
-
让玩家全程掌控游戏:自然语言指令驱动的游戏引擎到来了
对于每一位热爱打游戏的人而言,都曾经想过这样一个问题,「这游戏要是我来做就好了!」 可惜的是,游戏开发有很高的门槛,需要专业的编程技巧。 近日,来自上海交大的团队开展了一个名为「Instruction-Driven Game Engine, IDGE」的...
-
综述!深度模型融合(LLM/基础模型/联邦学习/微调等)
23年9月国防科大、京东和北理工的论文“Deep Model Fusion: A Survey”。 深度模型融合/合并是一种新兴技术,它将多个深度学习模型的参数或预测合并为一个模型。它结合了不同模型的能力来弥补单个模型的偏差和错误,以获得更好的性能。然而...
-
蚂蚁集团等发布开源大模型知识抽取框架OneKE
蚂蚁集团和浙江大学合作开发了一个名为 OneKE 的开源大模型知识抽取框架。该框架旨在帮助处理信息抽取、文本数据结构化和知识图谱构建等任务,为研究人员和开发者提供有力工具。 这个框架的作用是从海量数据中提取结构化知识,构建高质量的知识图谱,并建立知识要素之...
-
通透!机器学习各大模型原理的深度剖析!
通俗来说,机器学习模型就是一种数学函数,它能够将输入数据映射到预测输出。更具体地说,机器学习模型就是一种通过学习训练数据,来调整模型参数,以最小化预测输出与真实标签之间的误差的数学函数。 机器学习中的模型有很多种,例如逻辑回归模型、决策树模型、支持向量...
-
轨迹预测系列 | HiVT之进化版QCNet到底讲了啥?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 HiVT的进化版(不先看HiVT也能直接读这篇),性能和效率上大幅提升。 文章也很容易阅读。 【轨迹预测系列】【笔记】HiVT: Hierarchical Vector Transformer for...
-
从模型到部署,教你如何用Python构建机器学习API服务
本文分享自华为云社区《Python构建机器学习API服务从模型到部署的完整指南》,作者: 柠檬味拥抱。 在当今数据驱动的世界中,机器学习模型在解决各种问题中扮演着重要角色。然而,将这些模型应用到实际问题中并与其他系统集成,往往需要构建API服务。本文将介...
-
提高 AI 训练算力效率:蚂蚁 DLRover 故障自愈技术的创新实践
本文来自蚂蚁 DLRover 开源负责人王勤龙(花名长凡)在 2024 全球开发者先锋大会(GDC 的分享——《DLRover 训练故障自愈:大幅提升大规模 AI 训练的算力效率》。 王勤龙,长期在蚂蚁从事 AI 基础设施的研发,主导了蚂蚁分布式训练的弹...
-
解决AI接口调用问题,让电商更智能!
引言 各位亲爱的小米粉丝们,大家好! 随着时代的进步,人工智能(AI)技术正以前所未有的速度和规模发展,它已经深刻地改变了我们的生活和工作方式。在这个激动人心的时刻,我司也积极跟随时代的步伐,不断探索创新,努力实现与AI技术的融合,以提升我们电商服务的...
-
深度学习架构的超级英雄——BatchNorm2d
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 本文旨在探索2D批处理规范化在深度学习架构中的关键作用,并通过简单的例子来解释该技术的内部工作原理。 由作者本人创建的图像 深度学习...
-
AIGC实战——ProGAN(Progressive Growing Generative Adversarial Network)
AIGC实战——ProGAN 0. 前言 1. ProGAN 2. 渐进式训练 3. 其他技术 3.1 小批标准差 3.2 均等学习率 3.3 逐像素归一化 4. 图像生成 小结 系列链接 0. 前言 我们已经学习了使用生成对...
-
【stable diffusion扩散模型】一篇文章讲透
目录 一、引言 二、Stable Diffusion的基本原理 1 扩散模型 2 Stable Diffusion模型架构 3 训练过程与算法细节 三、Stable Diffusion的应用领域 1 图像生成与艺术创作 2 图像补全与修复...
-
刚刚发布!一键生成动漫风格图片的开源模型
向大家介绍一个最新的AIGC开源项目——Animagine XL 3.1。这个项目是动漫主题文本到图像模型的最新迭代,旨在为用户提供更加优化和强大的动漫图像生成体验。 在Animagine XL 3.1中,开发团队着重优化了几个关键方面,以确保模型...
-
为什么大型语言模型都在使用 SwiGLU 作为激活函数?
如果你一直在关注大型语言模型的架构,你可能会在最新的模型和研究论文中看到“SwiGLU”这个词。SwiGLU可以说是在大语言模型中最常用到的激活函数,我们本篇文章就来对他进行详细的介绍。SwiGLU其实是2020年谷歌提出的激活函数,它结合了SWISH和...
-
【AIGC调研系列】kimi与其他AI助手相比的优势和劣势是什么
Kimi与其他AI助手相比,具有以下优势和劣势: 优势: 服务稳定性:Kimi的服务在境内,使用稳定[2]。 多客户端支持:支持网页、APP、小程序等多个客户端,提高了用户的使用便捷性[2][4]。 中文处理能力:Kimi在中文处理方面表现出色...
-
文心一言App安装到电脑的全面指南
大家好,小发猫降ai今天来聊聊文心一言App安装到电脑的全面指南,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 文心一言App安装到电脑的全面指南 随着科技的飞速...
-
快手强化学习与多任务推荐
一、Two-Stage Constrained Actor-Critic for Short Video Recommendation 第一篇工作是快手自研的,主要针对的是带约束的多任务场景。 1. 短视频多任务推荐场景 这篇工作主要针对的是短视频的一...
-
比肩Transformer的Mamba在时间序列上有效吗?
Mamba是最近最火的模型之一,更是被业内认为可以有取代Transformer的潜力。今天介绍的这篇文章,探索了Mamba模型在时间序列预测任务上是有有效。本文首先给大家介绍Mamba的基础原理,再结合这篇文章探索在时间序列预测场景中Mamba是否有效。...
-
扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径
「扩散模型」也能攻克算法难题? 图片 一位博士研究人员做了一个有趣的实验,用「离散扩散」寻找用图像表示的迷宫中的最短路径。 图片 作者介绍,每个迷宫都是通过反复添加水平和垂直墙生成的。 其中,起始点和目标点随机选取。 从起点到目标点的最短路径中,随机采样...
-
3D视觉绕不开的点云配准!一文搞懂所有主流方案与挑战
本文经自动驾驶之心公众号授权转载,转载请联系出处。 作为点集合的点云有望在3D重建、工业检测和机器人操作中,在获取和生成物体的三维(3D)表面信息方面带来一场改变。最具挑战性但必不可少的过程是点云配准,即获得一个空间变换,该变换将在两个不同坐标中获取的...
-
LLaMA 模型中的Transformer架构变化
目录 1. 前置层归一化(Pre-normalization) 2. RMSNorm 归一化函数 3. SwiGLU 激活函数 4. 旋转位置嵌入(RoPE) 5. 注意力机制优化 6. Group Query Attention 7. 模型...
-
容器部署对比:通用容器部署 vs 使用腾讯云容器镜像服务(TCR)部署 Stable Diffusion
目录 引言 1 通用容器部署的主要步骤 1.1 准备环境 1.2 构建 Docker 镜像 1.3 上传镜像 1.4 部署容器 1.5 配置网络 1.6 监控和维护 2 使用腾讯云容器镜像服务(TCR)部署的主要步骤 2.1 下载 Sta...
-
AIGC行业趋势:Sora横空出世,向多模态应用加速迈进
文/浦银国际证券 近期,OpenAI的Sora的横空出世再一次引发市场对AIGC的关注,文生视频领域取得重大突破,效果远超预期。我们将围绕Sora的核心优势、技术特点、行业影响、未来趋势等方面进行阐述。 相较于此前的文生视频模型,Sora取得哪些突...
-
LLaMA-Factory参数的解答
打开LLaMA-Factory的web页面会有一堆参数 ,但不知道怎么选,选哪个,这个文章详细解读一下,每个参数到底是什么含义这是个人写的参数解读,我并非该领域的人如果那个大佬看到有参数不对请反馈一下,或者有补充的也可以!谢谢(后续该文章可能会持续更新)...
-
【AIGC】Animate Anyone阿里全民舞王背后的科技,基于图片高可控动画生成
在11月底,阿里巴巴集团智能计算研究院发布了一款AI动画项目:Animate Anyone。只需要一张人物静态图片,结合人物的骨骼动画(姿势控制),就能生成一段人物动画视频。 我们先通过官网放出的动画效果直观感受一下。 一. Anima...
-
Champ首发开源:人体视频生成新SOTA,5天斩获1k星,demo可玩
近日,由阿里、复旦大学、南京大学联合发布的可控人体视频生成工作 Champ 火爆全网。该模型仅开源 5 天 GitHub 即收获 1k 星,在 Twitter 更是「火出圈」,吸引了大量博主二创,浏览量总量达到 300K。 目前 Champ 已经开源...
-
Sam Altman断言:核聚变是解决AI能源需求的终极答案
整理丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 人工智能是一个能耗大户,随着各公司竞相使其变得更大、更智能、更复杂,其电力需求将进一步增加。这给一个标榜自身为强大环保工具的行业设置了一个棘手的问题:巨大的碳排放足迹。 然而,根据Op...
-
AIGC ChatGPT 4 带你了解数据仓库、数据集市、数据湖、数据中台之间的关系
1 数据仓库: 数据仓库(Data Warehouse)是一个组织为了支持决策制定而创建的主题性、集成性、时间相关性和稳定性的集中数据管理环境。数据仓库集中存储来自组织的各个业务部门的大量数据,有助于执行查询和分析操作。 数据仓库的主要特点包括:...
-
【在线回放】NVIDIA GTC 2024 大会 | 如何降低 AI 工程成本?蚂蚁从训练到推理的全栈实践
本文内容来源于蚂蚁集团 AI Infra部门负责人张科,在 GTC 2024 大会 China AI Day 线上专场的演讲。在演讲中张科分享了 AI 工程当前的现状和主要挑战,以及蚂蚁集团在 AI 工程领域的实践经验和开源项目,也欢迎 AI 工程领域的同...
-
腾讯机器人研究登顶刊!能帮程序员安显示器,像真人一样协同干活
国产机器人新突破: 两只各自独立的机械臂,已经可以丝滑地打配合了! 不信你看这双手拧瓶盖: 拧完再端起杯子倒水: 活灵活现,如真人。 呐,还能搭把手帮程序员安装好显示屏: 甚至接过“同事”手里的大箱子: 可以说是各种几何和物理特性的物体都能稳稳h...
-
【鸿蒙开发】之集成文心一言或GPT
目录 在鸿蒙应用开发中,要集成文心一言或GPT功能,可以按照以下步骤进行: 案例分析: 在鸿蒙应用开发中,要集成文心一言或GPT功能,可以按照以下步骤进行: 了解文心一言或GPT功能:首先要对文心一言或GPT功能有一定的了...
-
「量子大军」出动,中国实验室破解世界级算法难题!MRD码微秒级加密防窃听,6G无人机爆炸性飞跃
近期,「新质生产力」成为备受市场关注的热词,不仅被写入2024政府工作报告,更被列为十大任务之首。 从古至今,人类社会的发展离不开生产力的变革,每一次生产力的变革都让人类社会发生天翻地覆的变化。从工业革命、电气革命到信息革命,生产力与生产关系的变化深刻影...
-
全球建筑机器人市场呈现上升趋势
效率、安全性以及技术创新的提高继续推动全球建筑机器人市场的增长。随着3D打印和自动化等先进技术的采用,建筑行业正在经历相当大的转变,推动全球建筑机器人市场的扩张。在施工过程中整合自动化解决方案不仅可以提高生产力,同时还可以确保更高的质量和安全标准,从而为...
-
揭秘Baichuan 3超越GPT-4的中文实力!文心一言、GLM 4.0也甘拜下风?全方位对比测试大揭秘!
AI界的焦点再度聚集!1月29日,百川智能推出了超千亿参数的大语言模型Baichuan 3,瞬间在科技圈点燃了热情。不同于其他模型,Baichuan 3在中文各项评测中都有惊艳表现,甚至在任务上超越了GPT-4,成为了新的领头羊。 Baichuan 3不...
-
探索stable diffusion的奇妙世界--01
目录 1. 理解prompt提示词: 2. Prompt中的技术参数: 3. Prompt中的Negative提示词: 4. Prompt中的特殊元素: 5. Prompt在stable diffusion中的应用: 6. 作品展示:...
-
Nature重磅:AI击败最先进全球洪水预警系统,提前7天预测河流洪水,每年挽救数千人生命
洪水是最常见的自然灾害类型,全球有近 15 亿人(约占世界人口的 19%)直接面临严重洪水事件的巨大风险。洪水还造成巨大的物质损失,每年造成全球经济损失约 500 亿美元。 近年来,人类造成的气候变化进一步增加了一些地区的洪水频率。然而,目前的预报方法主...
-
AtomoVideo:AIGC赋能下的电商视频动效生成
✍🏻 本文作者:凌潼、依竹、桅桔、逾溪 1. 概述 当今电商领域,内容营销的形式正日趋多样化,视频内容以其生动鲜明的视觉体验和迅捷高效的信息传播能力,为商家创造了新的机遇。消费者对视频内容的偏好驱动了视频创意供给的持续增长,视觉内容...
-
羡慕!已有人抢先体验GPT-5 性能大飞升!
最新消息揭露,OpenAI已向客户提供GPT-5的体验版本,红队测试正在进行中,预计最快在今年夏天发布。据外媒报道,一些企业用户已经体验到最新版的ChatGPT,称其性能有了质的飞跃。 他们表示OpenAI展示了新模型如何根据特殊需求和数据进行工作,还暗示...
-
塔可商城采集插件:电商数据抓取与分析的新利器
随着电子商务的迅猛发展,各类商城平台如雨后春笋般涌现,为商家和消费者提供了丰富的交易选择。然而,这一繁荣景象背后,也带来了信息过载和数据碎片化的挑战。在这样的背景下,如何高效、准确地从海量商城数据中提取有价值的信息,成为了许多商家和数据分析师关注的焦点。塔...
-
PHP爬虫实战:探索网络数据的利器
在当今这个信息爆炸的时代,如何从海量的网络数据中提取出有价值的信息,成为了许多开发者和数据分析师关注的焦点。PHP作为一种流行的服务器端脚本语言,不仅在Web开发领域有着广泛的应用,而且在网络爬虫方面也有着不俗的表现。本文将通过实战案例,探讨如何使用PHP...
-
基于Discuz的动漫内容采集策略与实施方案
在互联网迅猛发展的时代背景下,动漫作为深受青少年及部分成年群体喜爱的文化产物,已经成为网络传播的重要内容之一。而Discuz,作为一套流行的社区论坛系统软件,提供了灵活的插件机制和丰富的数据采集接口,这使得针对特定领域的信息抓取,比如动漫内容,成为了可能。...
-
鱼跃cms采集插件:助力信息聚合的新利器
随着信息化时代的到来,互联网上每天都涌现出海量的信息。对于个人用户而言,从这些信息中筛选出有价值的内容已经成为一项艰巨的任务。而对于那些依靠内容管理系统(CMS)来运营网站的企业或机构来说,如何高效地采集、整理和发布这些信息,更是关乎其核心竞争力的关键。在...
-
狂人采集器Discuz版下载:功能、优势与使用指南
在数字化时代,信息的采集与整合成为各行各业不可或缺的一部分。随着论坛社区的兴起,如何从海量的帖子中快速提取所需信息成为许多用户和开发者关注的焦点。狂人采集器Discuz版作为一款专门针对Discuz论坛系统开发的信息采集工具,以其强大的功能和便捷的操作受到...
-
基于Discuz! X2平台的采集插件深度解析与应用实践
随着互联网的飞速发展,信息的获取与整合成为了许多网站运营者关注的重点。特别是在论坛社区领域,如何高效地收集并展示内容,对于提升用户体验和网站活跃度至关重要。Discuz! X2作为一款经典的论坛软件系统,拥有庞大的用户群体和丰富的插件资源,其中采集插件更是...