-
快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模
什么?疯狂动物城被国产AI搬进现实了? 与视频一同曝光的,是一款名为「可灵」全新国产视频生成大模型。 它采用了Sora相似的技术路线,结合多项自研技术创新,生成的视频不仅运动幅度大且合理,还能模拟物理世界特性,具备强大的概念组合能力和想象力。 数据上看...
-
eBay 推出 AI 辅助背景工具,增强产品图片
eBay 最新推出的 AI 功能允许卖家使用 AI 生成的背景替换图片背景。该工具目前已在美国、英国和德国的 iOS 用户中推出,将逐渐在未来几个月内向 Android 用户推出。 此举是继亚马逊和谷歌之后,这家电商公司宣布推出了全新的 AI 背景增强工...
-
使用Python实现深度学习模型:序列到序列模型(Seq2Seq)
本文分享自华为云社区《使用Python实现深度学习模型:序列到序列模型(Seq2Seq)》,作者: Echo_Wish。 序列到序列(Seq2Seq)模型是一种深度学习模型,广泛应用于机器翻译、文本生成和对话系统等自然语言处理任务。它的核心思想是将一个序...
-
申请 meta llama 模型权重(超详细)
文章目录 1、github访问meta的llama项目 2、查看github项目下的README.md 3、填写申请信息(注意邮箱要与huggingface账户邮箱一致) 4、查看邮箱的邮件并了解下载教程(方案一) 5、Meta website...
-
斯坦福让“GPU高速运转”的新工具火了,比FlashAttention2更快
AI算力资源越发紧张的当下,斯坦福新研究将GPU运行效率再提升一波—— 内核只有100行代码,让H100比使用FlashAttention-2,性能还要提升30%。 怎么做到的? 研究人员从“硬件实际需要什么?如何满足这些需求?”这两个问题出发,设计了...
-
可灵大模型有哪些功能免费吗?快手视频生成模型怎么使用方法详细教程指南
可灵大模型 是什么? 可灵大模型(Kling)是快手大模型团队自研打造的先进视频生成模型,具备3D时空联合注意力机制,能够生成符合运动规律的视频内容,支持长达 2 分钟的视频生成,帧率达到30fps。它基于自研模型架构和强大的Diffusion Tran...
-
简单4步,带你用华为云MetaStudio制作数字人短片
本文分享自华为云社区《使用MetaStudio生产线四步制作数字人视频》,作者: yd_298097624。 随着AIGC新技术尤其是大模型技术的发展,音视频行业、数字内容生产行业正在经历这从生产方式和生产效率上的一个巨大变化。预测到2030年有AI大模...
-
AIGC还是二刺猿会玩:捏娃社区爆火,有脑洞就能当同人大佬
衡宇 西风 发自 凹非寺量子位 | 公众号 QbitAI 原来现在的二刺猿都是这样玩的—— AIGC辅助下,0绘画基础也能轻松捏崽展开幻想,没有喜欢的角色粮,根本没在怕的! 青山刚昌28年没有让《名侦探柯南》新兰党如愿,这就速速安排...
-
OpenAI 和谷歌 DeepMind已风险重重,13位硅谷AI大厂员工联名上信:我们需要对前沿AI发出警告的权利!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto) 忍无可忍! 面对AI技术发展的各种风险隐患,这些前沿AI企业的一线员工再也不堪忍受任人捂嘴的现状了! 他们想要挣脱保密协议和公司报复的重重风险,获得对公众发出警告的权利。 昨...
-
快手发布视频生成大模型「可灵」:已开放邀测 效果对标Sora
近日,快手发布了一款名为「可灵」的视频生成大模型,该模型效果对标了之前发布的 Sora,同时已在快手旗下的快影 App 开放邀测体验。 可灵大模型具有多项优势,包括能够生成大幅度的合理运动、模拟物理世界特性、具备强大的概念组合能力和想象力,以及支持高分辨率...
-
【AI应用开发全流程】使用AscendCL开发板完成模型推理
给开发者套件上电后 Step4 登录开发者套件 通过PC共享网络联网(Windows): 控制面板 -> 网络和共享中心 -> 更改适配器设置 -> 右键“WLAN” -> 属性 ->...
-
【服务治理①】软件架构服务治理的本质,当下最火的微服务到底是什么?利用AIGC学习微服务的第①弹
【服务治理①】软件架构服务治理的本质,当下最火的微服务到底是什么?利用AIGC学习微服务的第①弹 一、什么是软件架构中的服务治理 1.1 软件架构 1.2 单体架构 1.2.1 单体架构的好处 1.2.2 单体架构的弊端 二、为什么需要...
-
一夜暴富50亿,老黄新晋「流量明星」!英伟达市值破3万亿,超越苹果成全球第二
3万亿美元,英伟达市值再次创造历史! 当地时间周三,股价涨超5%。现在的英伟达,已经成为全球第二大市值最高的公司,超越苹果,仅次微软。 距离世界第一,仅差一步之遥。 而上一次英伟达市值首超苹果,还是2002年。当时,两家公司的市值不到100亿美元。...
-
AI日报:字节推王炸级语音生成模型Seed-TTS;Suno新功能被Udio抢跑;腾讯发布开源混元DiT加速库;即梦全量上线实时画布功能
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、字节推语音生成模型Seed-T...
-
Meta推动全球AI助手革命:Llama 3引领技术前沿,Meta AI助手全面融入社交媒体平台
每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同...
-
Thoughtworks肖然:大模型走向大众,需要新的应用开发逻辑
嘉宾 | 肖然 采访 & 撰稿 | 云昭 出品 | 51CTO技术栈(微信号:blog51cto) 新年伊始,AI大佬们频繁被问及一个话题:“什么时候有杀手级AI应用”。几个月过去,诸如AI Pin、Rabbit R1、Devin等AI产品一闪...
-
美国监管机构将对微软、OpenAI和英伟达展开反垄断调查
据路透社报道,美国司法部和联邦贸易委员会(FTC)近日达成一项划分调查领域的协议,针对微软、OpenAI和英伟达在人工智能产业中的主导地位展开反垄断调查。消息人士透露,该协议预计将在未来几天内最终敲定。 根据协议,司法部将主导调查英伟达是否违反了反垄断法,...
-
首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升
在过去的几年里,Transformer架构在自然语言处理(NLP)、图像处理和视觉计算领域的深度表征学习中取得了显著的成就,几乎成为了AI领域的主导技术。 然而,虽然Transformer架构及其众多变体在实践中取得了巨大成功,但其设计大多是基于经验的,...
-
腾讯混元发布开源文生图大模型混元DiT加速库 生图时间缩短75%
腾讯混元发布了针对开源文生图大模型混元 DiT 的加速库,可将推理时间缩短75%,生图时间大幅缩短。 混元 DiT 模型也已部署至 Hugging Face Diffusers 通用模型库,用户可通过三行代码调用模型,无需下载原始代码。 通过知识蒸馏和 T...
-
Github万星!北航发布零代码大模型微调平台LlamaFactory
在人工智能领域,大语言模型(LLMs)已成为推动技术进步的关键力量。它们在理解和生成自然语言方面展现出了卓越的能力,从而在问答系统、机器翻译、信息提取等多样化任务中发挥着重要作用。然而,要将这些模型适配到特定的下游任务中,通常需要进行微调(fine-tun...
-
使用Rag和Sem-Rag提供上下文增强AI编码助手
通过将检索增强生成和语义记忆纳入 AI 编码助手,提升开发人员的生产力、效率和准确性。 译自Enhancing AI Coding Assistants with Context Using RAG and SEM-RAG,作者 Janakiram MS...
-
猿辅导旗下 AI 设计工具 Motiff 妙多全球发布 部分功能限时免费
Motiff 妙多是一款定位为 AI 时代设计工具的界面设计软件,由看云软件研发。该软件在全球发布时带来了多项创新,包括 AI 复制、AI 布局、AI 设计系统创建、AI 设计系统维护、AI 一致性检查等多个 AI 功能,还是国内首个自研图形渲染引擎的界面...
-
Stable Diffusion【应用篇】【艺术写真】:最近很火的黏土风,整合AI艺术写真效果还真不错
在五一期间,在某书上,“粘土特效”、“粘土滤镜”异常爆火,被网友们玩出了花。 恰好最近也一直在研究AI艺术写真,断断续续也写了几篇文章,看着黏土特效的火爆,我也跟风来体验一下在AI写真方面的应用。话不多说,我们直接开整。 一.黏土SDXL大模型+Inst...
-
与AI结对:一位高级开发人员构建插件的历程
作者分享了他使用 ChatGPT 学习 Go、浏览 Kolide API 以及构建一个复杂的 Steampipe 插件的经验。 译自Pairing With AI: A Senior Developer's Journey Building a Plug...
-
拍照可测脱发等级 支付宝上线AI毛发自测工具
根据国家卫健委此前公布的数据,我国超过2.5亿人有脱发困扰,平均每6人中就有1人脱发,且近些年来,脱发群体呈年轻化趋势。为了帮助应对“秃”如其来的脱发问题,今日,支付宝发布“AI毛发自测”工具,用户只需上传几张头皮照片,即可通过AI大模型能力识别脱发类型、...
-
【AIGC调研系列】基于人工智能的测试用例生成工具QAMete
百度测试平台QAMate是一个基于人工智能的测试用例生成工具。该平台利用文心大模型,支持从需求文本、表格及整份需求文档中自动生成测试用例[1][6][7]。此外,QAMate还允许用户构建专属的Prompt和业务经验知识库,以定向提升生成效果[1][6][...
-
清华大学与智谱AI重磅开源 GLM-4:掀起自然语言处理新革命
自 2023 年 3 月 14 日开源 ChatGLM-6B 以来,GLM 系列模型受到了广泛的关注和认可。特别是在 ChatGLM3-6B 开源之后,开发者对智谱 AI 推出的第四代模型充满了期待。而这一期待,随着 GLM-4-9B 的发布,终于得到了...
-
Mobile-Agent-v2:让AI学会自动刷手机
Mobile-Agent-v2是一个先进的AI系统,旨在通过自动化操作和视觉感知技术,实现对移动设备的全面控制。这一系统能够模拟真人的各种交互行为,如点击、滑动和输入等,从而自动化地完成一系列复杂的任务。 以下是Mobile-Agent-v2能够实现的一...
-
语音识别接入openai的Whisper接口,手把手保姆级教程,chatgpt的接口
据说这货已经是地表x强的语音识别了?? 有人说“在Whisper 之前,英文语音识别方面,Google说第二,没人敢说第一——当然,我后来发现Amazon的英文语音识别也非常准,基本与Google看齐。 在中文(普通话)领域,讯飞也很能打,讯飞语音输入...
-
快速学会一个算法,CNN
今天给大家分享一个超强的算法,CNN 卷积神经网络(Convolutional Neural Network,CNN)是一种深度学习模型,广泛应用于图像和视频分析、自然语言处理和其他相关领域。CNN 通过模拟生物视觉系统的处理方式,能够自动学习数据的层次...
-
将小爱音箱接入ChatGPT和豆包 一秒调教你的专属小爱
在数字化时代,家庭的概念已经扩展,不仅仅是一个居住的空间,更是数字生活的一部分。MiGPT项目通过将小爱音箱、米家智能设备与ChatGPT技术相结合,创造了一个既智能又贴心的家庭助手。这个系统不仅能够实现家庭自动化,还能与居住者建立情感联系。 项目主要亮...
-
如何在本地运行Stable Diffusion生成震撼图像
2022年AI的奇迹:如何在本地运行Stable Diffusion生成震撼图像 2022年是人工智能领域的奇迹之年。Stability.ai 开源的 Stable Diffusion 模型与 OpenAI 发布的 ChatGPT,像两颗耀眼的明星,点...
-
AI「末日」突然来临,公司同事集体变蠢!只因四大聊天机器人同时宕机
当AI崩溃失控时会发生什么? AI末日的概念一直是流行文化中反复出现的主题,其想象的核心就是AI作为一个人造物,因为过于先进而超越了人类的控制,转而反对其人类创造者。 昨日凌晨,ChatGPT、Claude、Gemini和Perplexity四大聊天机器...
-
谷歌AI概览功能触发频率大幅下降 仅出现在15%的查询结果中
根据一项新分析,谷歌的人工智能概述现在只出现在不到15% 的查询结果中。过去,谷歌的 AI 概览(以前在实验室中被称为搜索生成体验)一度出现在84% 的查询中。 从4月中旬开始,没有 AI 概览的谷歌搜索结果数量大幅增加,并持续到5月,直到 Google...
-
推荐:Lightning Whisper MLX —— 专为Apple Silicon优化的闪电般快速的Whisper实现
推荐:Lightning Whisper MLX —— 专为Apple Silicon优化的闪电般快速的Whisper实现 项目地址:https://gitcode.com/mustafaaljadery/lightning-whisper-mlx 在...
-
LightGBM实战+随机搜索调参:准确率96.67%
大家好,我是Peter~ 今天给大家分享一下树模型的经典算法:LightGBM,介绍算法产生的背景、原理和特点,最后提供一个基于LightGBM和随机搜索调优的案例。 LightGBM算法 在机器学习领域,梯度提升机(Gradient Boosting...
-
从46款AI教育产品,看全球八大市场用户学习偏好
Question AI 助力作业帮上市的传闻、字节跳动旗下 Gauth 超越多邻国登顶美国教育总榜、Answer.AI 凭借个位数成员的小团队成为北美 AI 教育第一梯队产品,让市场看到了 AI 教育的机会。 为了进一步了解 AI 教育赛道的发展情况,我们...
-
Unity接入文心一言大模型
一、百度云平台创建应用 1、创建一个自己的应用 https://console.bce.baidu.com/qianfan/ais/console/applicationConsole/application 2、获取ApiKey和Secret...
-
Zapier Central,目前最被低估的 AI 工具之一!
Zapier Central 的 Chrome 扩展程序是目前最被低估的 AI 工具之一。它会抓取您所在的任何网站,然后自动执行 6,000 多个应用程序中的操作。 开发团队为了节省时间而实施的一个简单用例:在我们深入讨论之前,先简单介绍一下背景:@th...
-
苹果WWDC发布AI新功能 或将推动iPhone等产品换机潮
据摩根大通分析师Samik Chatterjee预测,苹果在本周WWDC大会上发布的一系列AI辅助功能,有望显著提升iPhone等设备的换机周期。这位分析师认为,苹果的演讲"满足了所有条件",让投资者相信其能通过AI功能拉开iPhone16乃至后续机型与i...
-
stable diffusion最推荐安装的几个模型,大佬们都在用!
stable diffusion(稳定扩散)(简称SD 正在席卷世界,让任何人都可以使用各种风格的人工智能技术生成图像。只需点击几个按钮,您就可以生成一个人的照片级真实感图像,或一幅高精度的风景数字插图。通过使用精心制作的提示和特定的训练模型,您可以创建可...
-
LLM | Yuan 2.0-M32:带注意力路由的专家混合模型
图片 一、结论写在前面 Yuan 2.0-M32,其基础架构与Yuan-2.0 2B相似,采用了一个包含32位专家的专家混合架构,其中2位专家处于活跃状态。提出并采用了一种新的路由网络——注意力路由器,以更高效地选择专家,相比采用经典路由网络的模型,其准...
-
Stability AI发布AI音频模型Stable Audio Open:支持文本生成鼓点、乐器等音效
Stability AI 今天发布了 Stable Audio Open1.0,这是其音频领域的新一款生成 AI 模型。Stability AI 以稳定扩散文本到图像生成 AI 技术而闻名,但这只是该公司产品组合的一部分。该公司在2023年首次推出了 St...
-
双周总结#008 - AIGC
本周参与了公司同事对 AIGC 的分享会,分享了 AIGC 在实际项目中的实践经验,以及如何进行 AIGC 的落地。内容分几项内容: 什么是 AIGC AIGC 能做什么 AIGC 工具 以年终总结为例,分享了哪些过程应用了 AIGC,以及 AI...
-
马斯克旗下xAI与孟菲斯市合作 拟打造全球最大超算基地
埃隆·马斯克旗下人工智能公司xAI正与田纳西州孟菲斯市洽谈合作,拟在该市建设全球规模最大的超级计算机"算力超级工厂"。这一项目的投资规模可能高达数十亿美元。 这座超算将采用英伟达最新的H100系列GPU芯片,为xAI开发的对话AI系统Grok提供强大算力支...
-
基于机器学习的金融欺诈检测模型
作者 | 陈峻 审校 | 重楼 引言 如今,基于互联网服务的欺诈案例时常登顶媒体头条,而使用在线服务和数字交易的金融行业尤其成为了重灾区。网络洗钱、保险欺诈、网银盗用、虚假银行交易等复杂金融欺诈行为层出不穷,我们亟待通过行之有效的欺诈识别与检测的...
-
字节的AI要跳动向何方
进入2024年,字节跳动才开始围绕大模型全面摆开阵型,呈现出咄咄逼人的进攻态势。 一方面,在2023年8月上线的豆包之外,字节跳动进入2024年后开始持续爆兵,推出了AI应用开发平台扣子、AI学习伙伴河马爱学、AI剧情互动产品猫箱、AI生图产品PicPci...
-
【AI工具】使用 Whisper ASR 和 Pyannote 进行说话人分类
目录 前言 什么是说话人二值化? 什么是扬声器嵌入? 扬声器嵌入的关键作用 说话人分类系统的工作原理 执行...
-
在OpenHarmony本地部署大语言模型
本文将第二届OpenHarmony技术大会上展示的《在OpenHarmony本地部署大语言模型》成果开源,开源地址:https://gitee.com/openharmony-sig/tpc_c_cplusplus/blob/master/thirdp...
-
基于 Amazon EC2 快速部署 Stable Diffusion WebUI + chilloutmax 模型
自2023年以来,AI绘图已经从兴趣娱乐逐渐步入实际应用,在众多的模型中,作为闪耀的一颗明星,Stable diffusion已经成为当前最多人使用且效果最好的开源AI绘图软件之一。Stable Diffusion Web UI 是由AUTOMATIC11...