-
【论文阅读笔记 + 思考 + 总结】MoMask: Generative Masked Modeling of 3D Human Motions
创新点: VQ-VAE ? Residual VQ-VAE,对每个 motion sequence 输出一组 base motion tokens 和 v 组 residual motion tokens bidirectional 的 Masked...
-
[从0开始AIGC][LLM]:LLM中Encoder-Only or Decoder-Only?为什么主流LLM是Decoder-Only?
LLM中Encoder-Only or Decoder-Only & 为什么主流LLM是Decoder-Only? 文章目录 LLM中Encoder-Only or Decoder-Only & 为什么主流LLM是Dec...
-
LLaMa系列模型详解(原理介绍、代码解读):LLaMa_llama模型
LLaMA详解 LLaMA(Large Language Model Meta AI)是由Meta(前身为Facebook)开发的一种大规模语言模型,旨在提高自然语言处理(NLP)任务的性能。LLaMA基于变换器(Transformer)架构,并经过大...
-
【大模型】llama系列模型基础
前言:llama基于transformer架构,与GPT相似,只用了transformer的解码器部分。本文主要是关于llama,llama2和llama3的结构解读。 目录 1. llama 1.1 整体结构 1.2 RoPE 1...
-
一文彻底搞懂 Fine-tuning - 超参数(Hyperparameter)
最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。 最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。 《...
-
ACL 2024 | CoCA:自注意力的缺陷与改进
近年来,在大语言模型(LLM)的反复刷屏过程中,作为其内核的 Transformer 始终是绝对的主角。然而,随着业务落地的诉求逐渐强烈,有些原本不被过多关注的特性,也开始成为焦点。例如:在 Transformer 诞生之初,被视为天然具备的长度外推能力,...
-
视频化时代,用好AIGC产品赋能企业培训打造增效降本“最佳实践”
根据IBM的数据,85%的中国企业正在加速投资AI领域,其中超过63%的企业已积极采用生成式AI。德勤的调研进一步显示,近80%的全球受访企业高管认为,生成式AI的兴起与发展将在3年内推动组织和行业发生实质性变革,这也就意味着,企业如果不积极拥抱AI,很可...
-
Datawhale X 魔搭 AI夏令营 第四期AIGC_task03笔记
工具初探一ComfyUI 认识ComfyUI ComfyUI 是"Graphical User Interface"(图形用户界面)的缩写,简单来说,GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。ComfyUI 是GUI的一种,是...
-
小窗AI问答机有哪些功能?怎么使用方法详细教程指南
小窗AI问答机 是什么? 小窗® 对话式 AI 问答机是一款基于大语言模型(LLM)的人工智能技术产品,主要面向孩子群体,帮助他们在学习和生活中获取知识,提升独立思考、提问和语言表达能力。该产品的优点包括博学多知的超级博士、随时交谈的外语陪练、无穷创意的...
-
【多模态大模型】LLaMA in arXiv 2023
一、引言 论文: LLaMA: Open and Efficient Foundation Language Models作者: Meta AI代码: LLaMA特点: 该方法在Transformer的基础上增加了Pre-normalization (...
-
【AIGC 】一篇文章,帮你了解什么是虚拟数字人?
1.数字人的三方面特征 虚拟数字人是指具有数字化外形的虚拟人物。与具备实体的机器人不同,虚拟数字人依赖显示设备存在,我们所知的很多虚拟人都要通过手机、电脑或者智慧大屏等设备才能显示。 虚拟数字人宜具备以下三方面特征: 一是拥有人的外观,具有特...
-
AI写作不懂提示词 大象Prompt 保姆级系列教程三
一、提示词的核心价值究竟是啥? 最近跟不少业内朋友探讨这事儿,我觉得:提示词的核心价值在于对方法论的封装以及由此带来的知识传播速度加快。 通俗讲,假如你熟悉的行业里有个厉害的“老师傅”,他在核心业务上有好多心得、经验和方法,有的能量化或结构化,...
-
比OpenAI的Whisper快50%,最新开源语音模型
生成式AI初创公司aiOla在官网开源了最新语音模型Whisper-Medusa,推理效率比OpenAI开源的Whisper快50%。 aiOla在Whisper的架构之上进行了修改采用了“多头注意力”机制的并行计算方法,允许模型在每个推理步骤中预测多个t...
-
百万年轻人开始用AI「捏」角色
近日,ChinaJoy「智周万物」 论坛上,国内AIGC热门应用「捏 Ta 」再次引发关注。「捏 Ta 」创始人胡修涵,围绕 AI驱动的角色冒险平台的分享, 吸引了大批二次元用户。 「捏Ta」的名字来源于日语「梗」(Neta)的谐音,与此同时,「捏」也是二...
-
AIGC学习笔记—LLM(前言)
大语言模型本身我不是很了解,但是掌握一些基础的知识点,由于要准备某个公司的二面,所以浅学一下这个技术,也是边摸索边学习...... 首先,我先简单的解释一下大模型,大模型是指具有大规模参数和复杂计算结构的机器学习模型,通常由深度神经网络构建而成,拥有数十...
-
AI训AI惨遭投毒9次大崩溃,牛津剑桥等惊天发现登Nature封面!
9次迭代后,模型开始出现诡异乱码,直接原地崩溃!就在今天,牛津、剑桥等机构的一篇论文登上了Nature封面,称合成数据就像近亲繁殖,效果无异于投毒。有无破解之法?那就是——更多使用人类数据! 用AI生成的数据训练AI,模型会崩溃? 牛津、剑桥、帝国理工、多...
-
一次性生成5个8秒视频,用AI做抖音短视频不是梦?
最近的AI视频赛道,在玩法上“卷”出了新高度。 有用户用它完善视频细节: 还有人用它创作了科幻大片: 甚至让马斯克微笑点头: 还有大鱼吃小鱼,实现普通摄像头难以拍摄的效果: 较强的灵活性和视频可控性,一下让人难以分辨虚实,而这些镜头都是靠爱诗科技的...
-
提升AI绘画生成质量:探索与突破
本文由 ChatMoney团队出品 随着人工智能技术的蓬勃发展,AI绘画生成技术已成为艺术领域的一颗璀璨新星。然而,尽管AI绘画技术在模仿人类绘画风格、创作独特艺术作品等方面取得了显著进展,但其生成的图像质量仍有待提升。本文旨在深入探讨如何提升AI绘...
-
Meta Llama 3 残差结构
Meta Llama 3 残差结构 flyfish 在Transformer架构中,残差结构(Residual Connections)是一个关键组件,它在模型的性能和训练稳定性上起到了重要作用。残差结构最早由He et al.在ResNet中提出,并...
-
【AIGC】GPT-4o技术分析-浅谈
GPT-4o:人工智能技术的全新里程碑 一、引言 二、GPT系列版本间的对比分析 三、GPT-4o的技术能力分析 多模态处理能力 速度与性能优化 情感理解与表达能力 四、个人整体感受 五、结语 一、引言 在人工智能技术的...
-
AIGC入门(一) 从零开始搭建Transformer!(上)
前言 我记得曾经看过一篇综述,综述里曾这样讲过: 多模态使用Transformer作为基石模型的一个原因之一,就是因为它能够很好地统一视觉(ViT、DiT)和文本,并且无限制地扩大其参数。这是一个在工程上很有作用也很有实际意义的事情。 笔者...
-
论文怎么降AIGC,推荐用passyyds一键降到0%
说起论文,撰写毕业论文是本硕各专业学生毕业前必须进行的一项重要工作,因此很多学生听到毕业论文就头痛,认为本科毕业论文就是自己毕业的绊脚石。 其实要想写好论文我们得了解学校给的写作要求,这个是最基本的了,每个学校的要求都可能不太一样。毕业论文是由学校审...
-
何恺明新作再战AI生成:入职MIT后首次带队,奥赛双料金牌得主邓明扬参与
何恺明入职MIT副教授后,首次带队的新作来了! 让自回归模型抛弃矢量量化,使用连续值生成图像。并借鉴扩散模型的思想,提出Diffusion Loss。 他加入MIT后,此前也参与过另外几篇CV方向的论文,不过都是和MIT教授Wojciech Matusi...
-
Stable Diffusion教程|图生图原理和实战
Stable Diffusion凭借其卓越的图生图功能,极大地提升了图像生成的可控性与输出品质,赋予用户前所未有的个性化创作风格表达能力。这一革新特性使得Stable Diffusion不仅能精准地捕捉用户的艺术愿景,更能以数字化手段孕育出新颖且极具创意的...
-
LLaMa系列模型详解(原理介绍、代码解读):LLaMa
LLaMA详解 LLaMA(Large Language Model Meta AI)是由Meta(前身为Facebook)开发的一种大规模语言模型,旨在提高自然语言处理(NLP)任务的性能。LLaMA基于变换器(Transformer)架构,并经过大...
-
解锁AI写作新纪元的文心一言指令
解锁AI写作新纪元的文心一言指令 在人工智能(AI)飞速发展的今天,自然语言处理(NLP)技术取得了显著的进步。文心一言,作为NLP领域的一颗璀璨明星,以其强大的文本生成和指令理解能力,为写作领域带来了革命性的变革。本文主要讲解启动创新模型...
-
斯坦福让“GPU高速运转”的新工具火了,比FlashAttention2更快
AI算力资源越发紧张的当下,斯坦福新研究将GPU运行效率再提升一波—— 内核只有100行代码,让H100比使用FlashAttention-2,性能还要提升30%。 怎么做到的? 研究人员从“硬件实际需要什么?如何满足这些需求?”这两个问题出发,设计了...
-
ICML2024高分!魔改注意力,让小模型能打两倍大的模型
改进Transformer核心机制注意力,让小模型能打两倍大的模型! ICML 2024高分论文,彩云科技团队构建DCFormer框架,替换Transformer核心组件多头注意力模块(MHA),提出可动态组合的多头注意力(DCMHA)。 DCMHA解除...
-
AI绘画 究竟在哪些方面降低了门槛
AI绘画的产物是图像。图像对人类的认知、情感和文化发展起着重要的作用,包括信息传递、创造性表达、历史记录、审美享受和交流。 从原来的纸笔调色板到数字时代的数字板、绘图软件,再到AI绘画时代,任何人都可以用几行简单的文字创作出高质量的艺术作品。人类创作的门...
-
Cartesia发布低延迟语音生成模型Sonic 要复刻ChatGPT实时语音聊天?
Cartesia 发布了一个名为 Sonic 的低延迟语音生成模型,该模型以其快速的推理速度和超低的延迟引起了广泛关注。Sonic 的延迟仅为135毫秒,能够生成具有逼真情感和表达能力的语音。用户只需提供10秒的录音,Sonic 即可模仿说话者的韵律、语调...
-
文心一言智能体-心弦共鸣
文章目录 引言 文心一言智能体 小程创建的智能体——心弦共鸣 核心 设计理念 功能设计 应用场景 未来展望 引言 在数字世界的深邃海洋中,有一片由智慧与创新编织的新天地——文心一言智能体平台。在这里,每一个智能体都如同星辰般璀...
-
[从0开始AIGC][Transformer相关]:Transformer中的激活函数:Relu、GELU、GLU、Swish
[从0开始AIGC][Transformer相关]:Transformer中的激活函数 文章目录 [从0开始AIGC][Transformer相关]:Transformer中的激活函数 1. FFN 块 计算公式? 2. GeLU 计...
-
英伟达在印度招聘 AI 工程师
NVIDIA 正在印度招聘经验丰富的 AI 工程师,加入其合作伙伴公司。被选中的候选人将作为员工加入 NVIDIA 合作伙伴网络,负责推动 NVIDIA 技术的采用,并在数据中心、边缘和云部署领域获取创新设计。 这些位基于班加罗尔和新德里,专注于深度学习...
-
MLP一夜被干掉!MIT加州理工等革命性KAN破记录,发现数学定理碾压DeepMind
一夜之间,机器学习范式要变天了! 当今,统治深度学习领域的基础架构便是,多层感知器(MLP)——将激活函数放置在神经元上。 那么,除此之外,我们是否还有新的路线可走? 就在今天,来自MIT、加州理工、东北大学等机构的团队重磅发布了,全新的神经网络结构...
-
AI学会隐藏思维暗中推理!不依赖人类经验解决复杂任务,更黑箱了
AI做数学题,真正的思考居然是暗中“心算”的? 纽约大学团队新研究发现,即使不让AI写步骤,全用无意义的“……”代替,在一些复杂任务上的表现也能大幅提升! 一作Jacab Pfau表示:只要花费算力生成额外token就能带来优势,具体选择了什么token无...
-
为什么人形机器人如此受欢迎?
随着技术的快速进步和人工智能(AI 在我们生活的许多方面的结合,人形机器人已经成为一种杰出的、受欢迎的创新。由于具有自主交互、学习和执行任务的能力,这些类人机器在各种行业的需求越来越大,包括娱乐、酒店、医疗保健和教育。本文揭示了为什么需要人形机器人。...
-
爆火的AI面试,逼疯打工人
曾经出现在银行、外企、快消等领域的AI面试官,正在渗透到更多的行业。 一位应聘酒店前台客服岗位的应届毕业生告诉Tech星球,虽然已经接到通知去线下面试,但她仍需去完成企业发来的AI面试。在线下面试现场,面试官也会特地问她AI面试的使用体验,“这家酒店刚推出...
-
AITalk官网体验入口 AI语言学习助手口语练习app免费下载地址
AITalk是什么? AITalk是一款语言学习应用,提供AI助手进行口语练习,帮助用户快速提高语言流利度的工具。 点击前往AITalk官网体验入口 AITalk 的主要特点 提供与AI助手对话功能 提供IELTS口语练习 提供语法纠正功能 可进行...
-
论文怎么降AIGC:六个实用技巧助你优化学术写作
大家好,小发猫降ai今天来聊聊论文怎么降AIGC:六个实用技巧助你优化学术写作,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 论文怎么降AIGC:六个实用技巧助你优...
-
AI写作的困惑与挑战:我们如何应对?
大家好,小发猫降重今天来聊聊AI写作的困惑与挑战:我们如何应对?,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: AI写作的困惑与挑战:我们如何应对? 随着AI技术的飞速发展,AI写作助手正在...
-
文心一言指令词宝典之求职招聘篇
作者:哈哥撩编程(视频号、抖音、公众号同名) 新星计划·全栈领域优秀创作者 博客专家·全国博客之星第四名 超级个体·COC上海社区主理人 特约讲师·谷歌亚马逊演讲嘉宾 科技博主·极星会首批签约作者 ? 推荐专栏: ? 程序员:...
-
AI写作查出来高风险怎么办:七大应对策略
大家好,小发猫降ai今天来聊聊AI写作查出来高风险怎么办:七大应对策略,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: AI写作查出来高风险怎么办:七大应对策略 随...
-
LLaMA中SwiGLU的实现形式
LLaMA(Low-Level Machine Learning Architecture)是一种全新的机器学习架构,旨在提高模型的性能和效率。这种架构不仅注重模型的精度,更关注其在各种实际应用场景中的运行效率。在LLaMA中,SwiGLU作为一种新型的实...
-
AI写作查重率怎么降低:探索原创内容的新路径
大家好,小发猫降ai今天来聊聊AI写作查重率怎么降低:探索原创内容的新路径,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: AI写作查重率怎么降低:探索原创内容的新路...
-
论文怎么降AIGC:七个实用技巧助你摆脱困境
大家好,小发猫降重今天来聊聊论文怎么降AIGC:七个实用技巧助你摆脱困境,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 论文怎么降AIGC:七个实用技巧助你摆脱困境 在学术写作中,随着人工智...
-
为什么AI小模型才是最好的答案
作者 | 涂承烨 审校 | 重楼 一、AI大模型介绍与局限 AI大模型,特别是基于深度学习的模型,在许多领域都有着广泛的应用前景。这些领域包括但不限于医疗、金融、工业、教育、智慧城市等。随着技术的不断进步和应用的深入,AI大模型将在更多领域发挥重要作...
-
论文如何降低AIGC:七步走向学术诚信与独特性的巅峰
大家好,小发猫降ai今天来聊聊论文如何降低AIGC:七步走向学术诚信与独特性的巅峰,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 论文如何降低AIGC:七步走向学术...
-
论文怎么降低AIGC(人工智能生成内容)的影响?
大家好,小发猫降重今天来聊聊论文怎么降低AIGC(人工智能生成内容)的影响?,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 论文怎么降低AIGC(人工智能生成内容)的影响? 在学术界,随着人...
-
AIGC查重高怎么降:七大策略助你摆脱重复困境
大家好,小发猫降重今天来聊聊AIGC查重高怎么降:七大策略助你摆脱重复困境,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: AIGC查重高怎么降:七大策略助你摆脱重复困境 在学术研究和论文撰写...
-
AIGC时代IT人的迷茫有解(1):从“商业画布”到“个人画布”
IT人的迷茫和心态调整 最近打开新闻,各种IT老大都在说“AIGC时代,只要会说话,人人都会具备程序员的能力”,身边也有很多程序员朋友也已经在用GPT类的产品编程了。随着AIGC的发展,除了程序员,可能很多职业都会被替代或者需求量大大缩水。比如运营组,...