-
矩阵模拟!Transformer大模型3D可视化,GPT-3、Nano-GPT每一层清晰可见
「矩阵模拟」的世界或许真的存在。模拟人类神经元,不断进化的Transformer模型,一直以来都深不可测。 许多科学家都试着打开这个黑盒,看看究竟是如何工作的。 而现在,大模型的矩阵世界,真的被打开了! 一位软件工程师Brendan Bycroft制作了...
-
聊一聊大模型 | 京东云技术团队
事情还得从ChatGPT说起。 2022年12月OpenAI发布了自然语言生成模型ChatGPT,一个可以基于用户输入文本自动生成回答的人工智能体。它有着赶超人类的自然对话程度以及逆天的学识。一时间引爆了整个人工智能界,各大巨头也纷纷跟进发布了自家的大模...
-
基于元算法的通用框架,用于无监督学习问题
11 月 13 日,微软研究院(Microsoft Research)和普林斯顿大学研究人员,提出了一个通用框架,用于设计无监督学习问题的有效算法,如高斯分布和子空间聚类的混合。 研究人员所提的框架在解决噪声问题上,使用了一种下界学习计算公式的元算法。...
-
六个常用的聚类评价指标
评估聚类结果的有效性,即聚类评估或验证,对于聚类应用程序的成功至关重要。它可以确保聚类算法在数据中识别出有意义的聚类,还可以用来确定哪种聚类算法最适合特定的数据集和任务,并调优这些算法的超参数(例如k-means中的聚类数量,或DBSCAN中的密度参数 ...
-
文心一言修复了计算问题
多位数加法的计算过程 多位数加法的计算过程如下: 将两个多位数从低位到高位依次对齐,将每一位数字相加。 将相加得到的各位数字依次相加,得到最终结果。 例如,计算7654 + 321: 7 + 3 = 10,向上进位;6 + 2 = 8,...
-
【Stable Diffusion】FID、CLIP、cfg-scales都是什么
在stable-diffusion 仓库中,是这样评价模型的。 Evaluations with different classifier-free guidance scales (1.5, 2.0, 3.0, 4.0, 5.0, 6.0, 7....
-
Meta最新模型LLaMA细节与代码详解
Meta最新模型LLaMA细节与代码详解 0. 简介 1. 项目环境依赖 2. 模型细节 2.1 RMS Pre-Norm 2.2 SwiGLU激活函数 2.3 RoPE旋转位置编码 3. 代码解读 3.1 tokenizer 3.2 m...
-
文心一言 vs GPT-4 —— 全面横向比较
文心一言 vs GPT-4 —— 全面横向比较 3月15日凌晨,OpenAI发布“迄今为止功能最强大的模型”——GPT-4。我第一时间为大家奉上了体验报告《OpenAI 发布GPT-4——全网抢先体验》。 时隔一日,3月16日下午百度发布大语言模型—...
-
小白也能看懂的 AUC 详解
简介 上篇文章 小白也能看懂的 ROC 曲线详解 介绍了 ROC 曲线。本文介绍 AUC。AUC 的全名为Area Under the ROC Curve,即 ROC 曲线下的面积,最大为 1。 根据 ROC 和 AUC 的关系,我们可以得到如下结...
-
使用SpreadJS 开发在线问卷系统,构筑CCP(云数据采集)平台
什么是CCP(云数据采集)平台? 图片来自于网络 CCP(云数据采集)平台诞生于大数据时代的背景下,通过实时数据挖掘,在海量的云端数据中发现隐藏其中的价值。 在线问卷系统,作为CCP(云数据采集)平台的信息采集接口,通过网络信息收集,帮助问卷设计...
-
vivo服务端监控架构设计与实践
一、业务背景 当今时代处在信息大爆发的时代,信息借助互联网的潮流在全球自由的流动,产生了各式各样的平台系统和软件系统,越来越多的业务也会导致系统的复杂性。 当核心业务出现了问题影响用户体验,开发人员没有及时发现,发现问题时已经为时已晚,又或者当服务器的...
-
海洋工程中的生成式AI:专有数据集不足正限制其实际应用
现代计算正显著改进造船与海洋工程的设计与建造流程,但相当数据集的捉襟见肘正在阻碍其进一步融合。 造船与海洋工程(NAME)这一学科名称可能只有几百年的历史,但其起源却可以追溯至几千年之前的古代文明,当时人类就已经在建造船只来探索世界、开展商业活动。包括...