transformer 第15页

OpenAI公关跳起来捂他嘴：Transformer作者公开承认参与Q*！

Transformer作者中唯一去了OpenAI的那位，公开承认了：他参与了Q*项目，是这项新技术的发明者之一。这几天除了英伟达老黄组局把Transformer作者聚齐，他们中的几位还接受了连线杂志的采访，期间出了这么一个小插曲。当记者试图询问Lu...

人工智能 2024-03-25 人工智能

863阅读

3140参数Grok-1推理加速3.8倍，PyTorch+HuggingFace版来了

马斯克说到做到开源Grok-1，开源社区一片狂喜。但基于Grok-1做改动or商用，都还有点难题： Grok-1使用Rust+JAX构建，对于习惯Python+PyTorch+HuggingFace等主流软件生态的用户上手门槛高。 △图注：Grok登...

AIGC 2024-03-25 人工智能

871阅读

LLaMA中SwiGLU的实现形式

LLaMA（Low-Level Machine Learning Architecture）是一种全新的机器学习架构，旨在提高模型的性能和效率。这种架构不仅注重模型的精度，更关注其在各种实际应用场景中的运行效率。在LLaMA中，SwiGLU作为一种新型的实...

AIGC 2024-03-24 人工智能

974阅读

视觉AIGC元年：技术大爆炸！Dalle-3、Sora、Stable Diffusion 3 掀起AIGC新浪潮，究竟有哪些模块值得借鉴！

随着科技的飞速发展，我们迎来了视觉AIGC高光时刻，一个充满无限可能与机遇的新时代。在这个时代里，三大里程碑Dalle-3、Sora和Stable Diffusion 3以其炸裂式的技术发展，引领着AIGC领域的新浪潮。文章首先做相应简要介...

人工智能 2024-03-23 人工智能

991阅读

【八股】2024春招八股复习笔记1（搜索推荐、AIGC）

【八股】2024春招八股复习笔记1（搜索推荐、AIGC）文章目录 1、推荐系统 1.1 推荐系统流程 1.2 协同过滤、矩阵分解 1.3 逻辑回归 2、算法常识（应用算法） 2.1 重点复习 xgboost 2.2 大模型 t...

大数据 2024-03-23 人工智能

3299阅读

一图揽尽全球LLM崛起之路；LLM概念速查清单；DALL·E提示词红宝书·在线版；fast.ai新课带你从零实现Stable Diffusion | ShowM

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? LLM 崛起之路：全球大语言模型「规模增长」可视化交互图 informationisbeautiful.net/visualizati…...

人工智能 2024-03-23 人工智能

1133阅读

淘天集团自研大模型“淘宝星辰”上线

淘宝天猫集团自研的大模型“淘宝星辰”官网上线，该官网不仅详细介绍了淘宝星辰大模型的功能与特点，还设置了“立即体验”与“登录/注册”的便捷入口，预计在不久后对外开放。淘宝星辰大模型基于先进的Transformer架构，结合半自研的Megatron-ama框...

大数据 2024-03-22 人工智能

946阅读

LLM、RAG虽好，但XGBoost更香！

编译 | 言征出品 | 51CTO技术栈（微信号：blog51cto）数据&AI企业家、投资人Oliver Molander 近日在LinkedIn上的帖子中打趣道：“如果你在2022年[ChatGPT推出]之前问人工智能专家什么是LL...

人工智能 2024-03-22 人工智能

956阅读

AI帮写会重复吗？探索智能写作中的重复性问题

大家好，小发猫降重今天来聊聊AI帮写会重复吗？探索智能写作中的重复性问题，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具： AI帮写会重复吗？探索智能写作中的重复性问题随着人工智能（AI）技术...

人工智能 2024-03-22 人工智能

1709阅读

Transformer七子重聚GTC，老黄亲自赠送签名版DGX-1！7年奠基之作背后佚事揭秘

GTC大会上，老黄与Transformer八位作者一场最新访谈，简直火爆了！演讲前一个半小时，现场门外就挤满了人。许多人早早排起了长队，期待着这场别致的访谈。就连老黄也提前到场，在人群中合影。老黄主旨演讲当天，现场虚无坐席，网友戏称他为AI届的...

大数据 2024-03-21 人工智能

863阅读

使用 QLoRA 进行微调Llama 2 和 Mistral的初学者指南

本指南适用于任何想要为自己的项目定制强大的语言模型（如 Llama 2 和 Mistral）的人。使用 QLoRA，我们将逐步完成...

生成式AI 2024-03-21 人工智能

1199阅读

AIGC：让生成式AI成为自己的外脑

前言在数字化浪潮席卷全球的今天，人工智能（AI）已经渗透到了我们生活的方方面面。其中，生成式AI以其独特的魅力，正逐渐改变我们与世界的交互方式。AIGC（人工智能生成内容）作为生成式AI的重要应用之一，正成为越来越多人的“外脑”，助力我们更高效...

AIGC 2024-03-21 人工智能

1075阅读

Stable Video 3D震撼登场：单图生成无死角3D视频、模型权重开放

Stability AI 的大模型家族来了一位新成员。昨日，Stability AI 继推出文生图 Stable Diffusion、文生视频 Stable Video Diffusion 之后，又为社区带来了 3D 视频生成大模型「Stable Vi...

人工智能 2024-03-20 人工智能

893阅读

DualBEV：大幅超越BEVFormer、BEVDet4D，开卷！

本文经自动驾驶之心公众号授权转载，转载请联系出处。这篇论文探讨了在自动驾驶中，从不同视角（如透视图和鸟瞰图）准确检测物体的问题，特别是如何有效地从透视图（PV）到鸟瞰图（BEV）空间转换特征，这一转换是通过视觉转换（VT）模块实施的。现有的方法大致...

人工智能 2024-03-20 人工智能

1021阅读

Stable Diffusion 3 震撼发布，采用Sora同源技术，文字终于不乱码了

Stable Diffusion 3 和 Sora 一样采用了 diffusion transformer 架构。继 OpenAI 的 Sora 连续一周霸屏后，昨晚，生成式 AI 顶级技术公司 Stability AI 也放了一个大招 ——Sta...

人工智能 2024-03-20 人工智能

976阅读

如何从头开始编写LoRA代码，这有一份教程

LoRA（Low-Rank Adaptation）作为一种用于微调 LLM（大语言模型）的流行技术，最初由来自微软的研究人员在论文《 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 》中提出。不同于其...

人工智能 2024-03-20 人工智能

937阅读

华为天才少年谢凌曦：关于视觉识别领域发展的个人观点！

本文经自动驾驶之心公众号授权转载，转载请联系出处。最近，我参加了几个高强度的学术活动，包括CCF计算机视觉专委会的闭门研讨会和VALSE线下大会。经过与其他学者的交流，我产生了许多想法，千头万绪，便希望把它们整理下来，供自己和同行们参考。当然，受限于...

AIGC 2024-03-20 人工智能

791阅读

英伟达B200打破摩尔定律！老黄顺便公开GPT-4的秘密

整个AI圈最想知道的秘密，被老黄在PPT某页的小字里写出来了？时隔两年，英伟达官宣新一代Blackwell架构，为AI带来30倍推理加速。定位直指“新工业革命的引擎” 。老黄PPT中拿了一个1.8万亿参数MoE的GPT系列大模型测试结果来证明。...

生成式AI 2024-03-20 人工智能

885阅读

Stability AI开源上新：3D生成引入视频扩散模型，质量一致性up，4090可玩

Stable Diffusion背后公司Stability AI又上新了。这次带来的是图生3D方面的新进展：基于Stable Video Diffusion的Stable Video 3D（SV3D），只用一张图片就能生成高质量3D网格。 Stab...

人工智能 2024-03-20 人工智能

836阅读

Diffusion Transformer Family：关于Sora和Stable Diffusion 3你需要知道的一切

转自知乎：叫我Alonzo就好了前言背景——Sora和Stable Diffusion 3 近期，OpenAI和Stability两大AI巨头公司在同期分别发布了它们的新作品——Sora和Stable Diffusion 3。神奇的是，这...

大数据 2024-03-19 人工智能

1645阅读

如何扩展大模型的上下文长度

一、背景大模型的上下文长度是指我们在使用大模型的时候，给大模型的输入加上输出的字符（Token）总数，这个数字会被限制，如果超过这个长度的字符会被大模型丢弃。目前开源的大模型上下文长度一般不长，比如 Llama 2 只有 4K，Code-Llama 系...

生成式AI 2024-03-19 人工智能

1150阅读

英伟达吞噬世界！新架构超级GPU问世，AI算力一步提升30倍

「这不是演唱会。你们是来参加开发者大会的！」老黄出场时，现场爆发出了巨大的欢呼声。今天凌晨四点，加州圣何塞，全球市值第三大公司英伟达一年一度的 GTC 大会开始了。今年的 GTC 大会伴随着生成式 AI 技术爆发，以及英伟达市值的暴涨。相对的是，算...

AIGC 2024-03-19 人工智能

897阅读

DECO: 纯卷积Query-Based检测器超越DETR！

本文经自动驾驶之心公众号授权转载，转载请联系出处。标题：DECO: Query-Based End-to-End Object Detection with ConvNets 论文：https://arxiv.org/pdf/2312.13735...

生成式AI 2024-03-19 人工智能

894阅读

英伟达新核弹B200发布，一台服务器顶一个超算，万亿参数大模型30倍推理加速

AI春晚GTC开幕，皮衣老黄再次燃爆全场。时隔两年，英伟达官宣新一代Blackwell架构，定位直指“新工业革命的引擎” ，“把AI扩展到万亿参数”。作为架构更新大年，本次大会亮点颇多：宣布GPU新核弹B200，超级芯片GB200 Blackw...

AIGC 2024-03-19 人工智能

1007阅读

ChatGPT参数规模被扒：只有7B

ChatGPT惨遭攻击，参数规模终于被扒出来了—— 很可能只有7B（70亿）。消息来自南加州大学最新研究，他们使用一种攻击方法，花费不到1000美元就把最新版gpt-3.5-turbo模型的机密给挖了出来。果然，OpenAI不Open，自有别人帮他...

AIGC 2024-03-19 人工智能

781阅读

从直观物理学谈到认知科学，Sora不是传统物理模拟器盖棺定论了？

本文篇幅很长，主题很多，但循序渐进，对「Sora 究竟是不是世界模拟器」这一说法给出了非常详实的解读。最近，OpenAI 的文生视频模型 Sora 爆火。除了能够输出高质量的视频之外，OpenAI 更是将 Sora 定义为一个「世界模拟器」（world...

大数据 2024-03-19 人工智能

924阅读

Stable Diffusion 3报告

报告链接：https://stability.ai/news/stable-diffusion-3-research-paper 文章目录要点表现架构细节通过重新加权改善整流流量 Scaling Rectified Flow Tr...

AIGC 2024-03-18 人工智能

1133阅读

什么情况用Bert模型，什么情况用LLaMA、ChatGLM类大模型，咋选？

选择使用哪种大模型，如Bert、LLaMA或ChatGLM，取决于具体的应用场景和需求。下面是一些指导原则： Bert模型：Bert是一种预训练的语言模型，适用于各种自然语言处理任务，如文本分类、命名实体识别、语义相似度计算等。如果你的任务是通用的文...

人工智能 2024-03-18 人工智能

1112阅读

新智元 | Stable Diffusion 3技术报告流出，Sora构架再立大功！生图圈开源暴打Midjourney和DALL·E 3？

本文来源公众号“新智元”，仅用于学术分享，侵权删，干货满满。原文链接：Stable Diffusion 3技术报告流出，Sora构架再立大功！生图圈开源暴打Midjourney和DALL·E 3？【新智元导读】Stability AI放出了号称能暴...

人工智能 2024-03-18 人工智能

1006阅读

全球首个类Sora开源复现方案来了！全面公开所有训练细节和模型权重

全球首个开源的类Sora架构视频生成模型，来了！整个训练流程，包括数据处理、所有训练细节和模型权重，全部开放。这就是刚刚发布的Open-Sora 1.0。它带来的实际效果如下，能生成繁华都市夜景中的车水马龙。还能用航拍视角，展现悬崖海岸边，海水...

生成式AI 2024-03-18 人工智能

862阅读

自适应剪枝让多模态大模型加速2-3倍，哈工大等推出SmartTrim

基于 Transformer 结构的视觉语言大模型（VLM）在各种下游的视觉语言任务上取得了巨大成功，但由于其较长的输入序列和较多的参数，导致其相应的计算开销地提升，阻碍了在实际环境中进一步部署。为了追求更为高效的推理速度，前人提出了一些针对 VLM 的...

大数据 2024-03-18 人工智能

900阅读

AI干6周=生物学家134年！斯坦福生物学基础模型开启生物学AI时代

人类花了134年才发现Norn细胞，AI用了6周就做到了！来自斯坦福大学的研究人员使用数百万个真实细胞的化学和基因组成作为原始数据训练了一个AI大模型，通过自行学习到的知识，模型可以将之前从未见过的细胞归类为1000多种类别中的某一种，Norn细胞就...

人工智能 2024-03-18 人工智能

840阅读

【Datawhale组队学习：Sora原理与技术实战】AIGC技术基础知识

AIGC是什么 AIGC全称叫做AI generated content，AlGC (Al-Generated Content，人工智能生产内容，是利用AlI自动生产内容的生产方式。在传统的内容创作领域中，PGC（Professionally-g...

生成式AI 2024-03-18 人工智能

1034阅读

马斯克开源Grok-1：3140亿参数迄今最大，权重架构全开放，磁力下载

说到做到，马斯克承诺的开源版大模型 Grok 终于来了！今天凌晨，马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家（MoE）模型「Grok-1」，以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言...

生成式AI 2024-03-18 人工智能

856阅读

没等来OpenAI，等来了Open-Sora全面开源

不久前 OpenAI Sora 以其惊人的视频生成效果迅速走红，在一众文生视频模型中突出重围，成为全球瞩目的焦点。继 2 周前推出成本直降 46% 的 Sora 训练推理复现流程后，Colossal-AI 团队全面开源全球首个类 Sora 架构视频生成模...

AIGC 2024-03-18 人工智能

949阅读

超详细！AIGC面试系列大模型基础(1)

关于我从2022年末开始接触AIGC，便一直紧跟最近技术与实践落地。期间参与copilot项目研发，落地了多个垂类AIGC大模型应用，熟悉各种AIGC相关技术如Agent，Langchain，chatdoc，向量数据库等。关于本系列请你认真看完...

生成式AI 2024-03-18 人工智能

3085阅读

时间序列预测+NLP大模型新作：为时序预测自动生成隐式Prompt

今天给大家介绍一篇最新的大模型+时间序列预测工作，由康涅狄格大学发表，提出了一种将时间序列在隐空间和NLP大模型对齐，并利用隐空间prompt提升时间序列预测效果的方法。论文标题：S2IP-LLM: Semantic Space Informed P...

生成式AI 2024-03-18 人工智能

1006阅读

Stable Diffusion 跑通总结

记录了自己跑通Stable Diffusion的过程和踩过的坑，目前只是初步跑了一下，没有很深入的使用代码，希望能有一些参考价值。在Windows系统运行，需要提前装好Conda 一、下载代码和模型 1、下载代码：代码下载：代码地址或者...

AIGC 2024-03-17 人工智能

1241阅读

与Sora同架构的Stable Diffusion 3.0 震撼发布

Stability AI 发布了 Stable Diffusion 3，这款图像生成 AI 模型再次刷新了人们的认知。这款由 Stability AI 倾力打造的文本变图模型，可是迄今为止最强大的“黑科技”！无论你想生成多主题的奇幻场景，还是高精度的风...

AIGC 2024-03-17 人工智能

989阅读

How does Stable Diffusion work?

Stable Diffusion is a latent diffusion model that generates AI images from text. Instead of operating in the high-dimensional im...

人工智能 2024-03-16 人工智能

955阅读

ChatGPT-4 VS 文心一言4.0

在线体验地址（含 gpt 3.5 / 4.0，文心 3.5 / 4.0）：https://chat.tool4j.com 点击访问文心一言和ChatGPT-4都是非常强大的自然语言处理模型，它们都能够在对话系统和其他NLP应用中发挥巨大的作用。然而，它...

人工智能 2024-03-16 人工智能

1095阅读

生数科技「多模态大模型」正式通过备案

近日，生数科技「多模态大模型」正式通过国家《生成式人工智能服务管理暂行办法》备案。成立于2023年3月，生数科技是一家全球领先的自主研发多模态通用大模型的人工智能企业，布局MaaS（模型即服务）与应用级产品，面向艺术设计、游戏制作、影视动画、社交娱乐等...

AIGC 2024-03-15 人工智能

859阅读

Stable Diffusion 3更多隐藏功能曝光：文字可更改图片细节

白交丰色发自凹非寺量子位 | 公众号 QbitAI Stable Diffusion 3，它终于来了！足足酝酿一年之多，相比上一代一共进化了三大能力。来，直接上效果！首先，是开挂的文字渲染水平。且看这黑板上的粉...

AIGC 2024-03-15 人工智能

887阅读

仅需200M参数，零样本性能超越有监督！谷歌发布时序预测基础模型TimesFM

时间序列预测在零售、金融、制造业、医疗保健和自然科学等各个领域无处不在：比如说在零售场景下中，「提高需求预测准确性」可以有显著降低库存成本并增加收入。深度学习（DL）模型基本上垄断了「多变量时间序列预测」任务，在各个竞赛、现实应用中的表现都非常好。与...

人工智能 2024-03-15 人工智能

1069阅读

Stable Diffusion 3 技术论文解读：开源能赢得文生图竞赛吗？

在大语言模型领域，闭源模型正在赢得比赛，无论是 OpenAI 还是刚刚发布新模型的 Anthropic，都是闭源模型的代表。但在文生图领域，开源模型却表现出了足够强的竞争力。 2 周前，开源模型的代表企业 Stability AI 发布了最新...

AIGC 2024-03-15 人工智能

874阅读

首次攻克「图基础模型」三大难题！港大开源OpenGraph：零样本学习适配多种下游任

图学习（Graph Learning）技术能够对复杂的关系数据进行挖掘和学习，在推荐系统、社交网络分析、引用网络和交通网络等多个领域都显示出了巨大的应用价值。图神经网络（Graph Neural Networks, GNNs）基于迭代的消息传递机制，能...

人工智能 2024-03-15 人工智能

922阅读

Stable Diffusion 3 震撼发布，采用Sora同源技术，生成图像、视频真假难辨！

ChatGPT狂飙160天，世界已经不是之前的样子。新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 ============== Stable Diffusion 3...

人工智能 2024-03-14 人工智能

912阅读

超强！深度学习Top10算法！

自2006年深度学习概念被提出以来，20年快过去了，深度学习作为人工智能领域的一场革命，已经催生了许多具有影响力的算法。那么，你所认为深度学习的top10算法有哪些呢？以下是花哥我心目中的深度学习top10算法，它们在创新性、应用价值和影响力方面都具...

生成式AI 2024-03-14 人工智能

930阅读

文生图的最新进展：从一致性模型CMs、LCM、SDXL到Stable Diffusion3、SDXL-Lightning

前言很明显，OpenAI的首个视频生成模型sora极大程度的提高了大家对文生图、文生视频的热情，也极大的扩展了大家对AIGC的想象力第一部分(选读一致性模型Consistency Model 注，本文第一部分最早写在23年11月份的这篇文...

大数据 2024-03-14 人工智能

3075阅读

大模型的DenseNet时刻！DenseMamba：精度显著提升

本文经自动驾驶之心公众号授权转载，转载请联系出处。随着 ChatGPT 的突破性进展，大型语言模型（LLMs）迎来了一个崭新的里程碑。这些模型在语言理解、对话交互和逻辑推理方面展现了卓越的性能。过去一年，人们目睹了 LLaMA、ChatGLM 等模型...

人工智能 2024-03-14 人工智能

930阅读