-
AuraFlow:超越Stable Diffusion 3,开源文生图模型的未来之星
前沿科技速递? 开源创新先锋fal.ai携手社区顶尖开发者,震撼发布AuraFlow v0.1——全球首个完全开源的大型整流流文本到图像生成模型,开启文生图领域新篇章! 极致开源精神:AuraFlow v0.1作为对Stable Diffusion...
-
多语言声音克隆,CosyVoice模型最强部署
CosyVoice是由阿里通义实验室开源的一款多语言语音理解模型,它主要聚焦于高质量的语音合成,能够生成自然且逼真的语音。 CosyVoice模型经过超过15万小时的数据训练,支持中文、英语、日语、粤语和韩语多种语言的合成,且在多语言语音生成、零样本语音...
-
谷歌发布大模型数据筛选方法:效率提升13倍,算力降低10倍
随着GPT-4o、Gemini等多模态大模型的出现,对训练数据的需求呈指数级上升。无论是自然语言文本理解、计算机视觉还是语音识别,使用精心标注的数据集能带来显著的性能提升,同时大幅减少所需的训练数据量。 但目前多数模型的数据处理流程严重依赖于人工筛选,不仅...
-
Stable Diffusion原理
一、Diffusion扩散理论 1.1、 Diffusion Model(扩散模型) Diffusion扩散模型分为两个阶段:前向过程 + 反向过程 前向过程:不断往输入图片中添加高斯噪声来破坏图像 反向过程:使用一系列马尔可夫链逐步将噪声还原...
-
港大&百度发布首个智慧城市大模型UrbanGPT,助力时空预测技术突破
香港大学与百度联合发布了首个智慧城市大模型 UrbanGPT,该模型在时空预测技术领域引发了重大突破。时空预测技术的重要性日益凸显,不仅关注交通和人流的流动,还涵盖了犯罪趋势等多个维度。然而,由于城市数据不足,传统的时空预测模型在精确预测方面受到了限制。U...
-
AI刘强东007带货,背后大模型也就10亿参数,京东:我家数字人平均水平
京东创始人刘强东啊,他昨天又加班了。 准确来说,是他的AI数字人形象“采销东哥”,昨晚开启了自己生涯第四场直播。 这次东哥干的是图书采销工作。 与上两次直播不同,这一回直播间不仅有了数字人助理,还有多机位切换等展现方式。与此同时,和留言区及屏幕前观众的互...
-
微软升级Azure AI语音服务 推出9种更真实的AI语音
微软近期对其Azure AI语音服务进行了重大升级,推出了9种新的更真实的AI语音,旨在为用户带来更加自然和沉浸式的对话体验。这次升级的核心是引入了零样本学习(Zero-shot)的文本到语音(TTS 模型,这些模型在提高合成语音自然度的同时,更好地模仿了...
-
学好线性代数,玩转推荐系统
作者 | 汪昊 审校 | 重楼 说到21 世纪互联网的技术,除了 Python / Rust / Go 等一系列新型编程语言的诞生,信息检索技术的蓬勃发展也是一大亮点。互联网上第一个纯技术商业模式就是以谷歌和百度为代表的搜索引擎技术。然而让大家臆想不到的...
-
Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试
2023年10月,我们发表了一篇关于TimeGPT的文章,TimeGPT是时间序列预测的第一个基础模型之一,具有零样本推理、异常检测和共形预测能力。 虽然TimeGPT是一个专有模型,只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了...
-
百度起诉文心一言公司 涉及不正当竞争纠纷
根据天眼查App的最新信息,近日,天津的文心一言(天津)智能科技有限公司被发现新增了一则开庭公告。这起案件涉及到北京百度网讯科技有限公司与该公司之间的不正当竞争纠纷。具体开庭日期定于3月26日,将在天津市和平区人民法院进行审理。 从天眼查的数据来看,有多家...
-
图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定
能不能有一种通用的图模型—— 它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐? 或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制? 你还真别说,被ICLR 2024接收为Spotlight的“One for All(OFA)...
-
关于推荐系统,有六大让人震惊的“秘密”
推荐系统自1992 年代诞生以来, 到2024 年的今天已经有32 年的发展历程。在这几十年的发展历程中,各个互联网和科技公司上线过数以百万计的推荐系统模型。尽管推荐系统经历过 2012 到 2014 年的发展低潮,但很快就被后起之秀快手和字节跳动一改颓...
-
【网安AIGC专题10.19】论文6(顶会ISSTA 2023):提出新Java漏洞自动修复数据集:数据集 VJBench+大语言模型、APR技术+代码转换方法+LLM和DL-APR模型的挑战与机会
How Effective Are Neural Networks for Fixing Security Vulnerabilities 写在最前面 摘要 贡献 发现 介绍 背景:漏洞修复需求和Java漏洞修复方向 动机 方法 贡献...
-
GPT与文心一言大模型的比较与展望
目录 前言 1 GPT和文心一言简介 2 GPT和文心一言的技术原理和基础架构 3 GPT和文心一言的模型规模和参数数量 4 GPT和文心一言的语言理解表现 5 展望GPT和文心一言未来的发展 5.1 技术改进 5.2 应用扩展 结语...
-
针对特定领域较小的语言模型是否与较大的模型同样有效?
经过2023年的发展,大语言模型展示出了非常大的潜力,训练越来越大的模型成为有效性评估的一个关键指标,论文《A Comparative Analysis of Fine-Tuned LLMs and Few-Shot Learning of LLMs f...
-
这是GPT-4变笨的新解释
变笨的本质是知识没进脑子。 自发布以来,曾被认为是世界上最强大的 GPT-4也经历了多场「信任危机」。 如果说今年早些时候那次「间歇式降智」与 OpenAI 重新设计 GPT-4架构有关,前段时间的「变懒」传闻就更搞笑了,有人测出只要告诉 GPT-4「现在...
-
谷歌Gemini大逆转?斯坦福Meta华人证明其推理性能强于GPT-3.5
【新智元导读】谷歌放出的Gemini,在对标GPT的道路上似乎一直处于劣势,Gemini真的比GPT-4弱吗?最近,斯坦福和Meta的学者发文为Gemini正名。 Gemini的推理能力,真的比GPT-4弱吗? 此前,谷歌憋出的重磅复仇神器Gemini P...
-
首个GPT-4驱动的人形机器人!无需编程+零样本学习,还可根据口头反馈调整行为
让GPT-4操纵人形机器人,事先不做任何编程or训练,能搞成啥样儿? 答案是:太 猎 奇 了! 这不,要求机器人表演“在昏暗电影院里狂炫爆米花,却突然发现吃的是隔壁陌生人的?”。 在GPT-4的操纵下,机器人笑容凝固,“尴尬”得摇头扶额后仰: 但在尴尬...
-
GitHub Copilot使用指南
GitHub Copilot 是由 GitHub 开发的 AI 编程插件,GitHub Copilot 由 OpenAI Codex 提供支持,OpenAI Codex 是一种由 OpenAI 创建的生成式预训练语言模型,可根据评论和代码的上下文提供上下文...
-
使用 GitHub Copilot 进行 Prompt Engineering 的初学者指南(译)
文章目录 什么是 GitHub Copilot ? GitHub Copilot 可以自己编码吗? GitHub Copilot 的底层是如何工作的? 什么是 prompt engineering? 这是 prompt engineering...
-
【NLP】Llama & Alpaca大模型
?大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流? ?个人主页-Sonhhxg_柒的博客_CSDN博客 ? ?欢迎各位→点赞? + 收藏⭐️ + 留言? ?系列专栏 - 机器学习【ML】 自然语言...
-
一篇学会大模型浪潮下的时间序列预测
今天跟大家聊一聊大模型在时间序列预测中的应用。随着大模型在NLP领域的发展,越来越多的工作尝试将大模型应用到时间序列预测领域中。这篇文章介绍了大模型应用到时间序列预测的主要方法,并汇总了近期相关的一些工作,帮助大家理解大模型时代时间序列预测的研究方法。...