-
OpenAI陷巨大算力荒,国内大厂抢先破局!打破单芯片限制,算力效率提升33%
国内AI不行,是因为芯片不行? 我们跟国外的差距,是因为和英伟达芯片的差距过大? 最近,圈内有许多这样的论调。 其实深挖下去,就会发现事实完全不是这样。即使是英伟达最先进的芯片,依然无法满足当下人工智能在算力上的需求。 随着模型参数量和数据量的增加,智慧...
-
商汤发布日日新5.0大模型 综合能力全面对标GPT-4
4月23日下午,商汤科技发布了一项重磅更新——全新升级的日日新SenseNova5.0大模型。这款大模型采用了先进的MOE混合专家架构,经过超过10TB tokens的训练,其推理上下文窗口达到了惊人的200K,展现出了与GPT-4Turbo全面对标的能力...
-
首设大模型挑战赛,琶洲算法大赛为大模型应用赋能加速!
时隔一年,琶洲算法大赛再次强势如约回归。4月23日,2024年第三届琶洲算法大赛正式启动。本届大赛由广州市人民政府、中国人工智能学会联合主办,中国信息通信研究院、海珠区人民政府、广州市科学技术局、广州市工业和信息化局、广州市政务服务和数据管理局、人工智能...
-
阿里云宣布全方位支持Llama 3训练推理 帮助开发者构建自己的大模型
阿里云百炼大模型服务平台近期宣布了一项重要的支持计划,即为Meta公司最新开源的Llama3系列大语言模型提供全方位的支持。这项服务包括限时免费的模型训练、部署和推理服务,旨在帮助企业和开发者在阿里云平台上构建和优化自己的专属大模型。 主要如下: 免费...
-
4000万蛋白结构训练,西湖大学开发基于结构词表的蛋白质通用大模型,已开源
蛋白质结构相比于序列往往被认为更加具有信息量,因为其直接决定了蛋白质的功能。而随着AlphaFold2带来的巨大突破,大量的预测结构被发布出来供人研究使用。如何利用这些蛋白质结构来训练强大且通用的表征模型是一个值得研究的方向。 西湖大学的研究人员利用Fo...
-
EMNLP 2023|利用LLM合成数据训练模型有哪些坑?
大家好,我是HxShine 今天我们将介绍EMNLP2023的一篇大模型(LLMs)生成文本分类任务合成数据的文章,标题是《Synthetic Data Generation with Large Language Models for Text Cla...
-
重构、定义、引领,九章云极DataCanvas智算操作系统重磅发布
4月18日,2024九章云极DataCanvas智算操作系统新品发布会于北京隆重召开,全新产品DATACANVAS AIDC OS智算操作系统(以下简称AIDC OS)正式官宣。AIDC OS以卓越的AI技术实力和AI基础软件为根基,以重新定义和突破...
-
Meta 发布Llama 3,能力直逼GPT-4,一己之力拉高开源大模型水位
编辑|伊风、诺亚 出品 | 51CTO技术栈(微信号:blog51cto) Meta麾下“羊驼”一路狂奔在开源的大道上。 在过去的一年里,Llama系列可以说开辟了开源LLM的半壁江山。 嫌弃开源模型能力只有GPT-3.5,不够用? 如今Llam...
-
如何通过机器学习算法设计软传感器?
通过理解机器学习算法的功能,工程师可以为他们的应用生成有效的软传感器。 软传感器(soft sensor),也称为虚拟传感器,是一种可以综合处理数百个测量数据的软件。想要添加软传感器的工厂管理者可能会对使软传感器工作的机器学习的范围感到不知所措。然而,...
-
十个大型语言模型(LLM)常见面试问题和答案解析
今天我们来总结以下大型语言模型面试中常问的问题 一、哪种技术有助于减轻基于提示的学习中的偏见? A.微调 Fine-tuning B.数据增强 Data augmentation C.提示校准 Prompt calibration D.梯度裁剪 Gra...
-
7B超越百亿级,北大开源aiXcoder-7B最强代码大模型,企业部署最佳选择
当下,大语言模型集成至编程领域、完成代码生成与补全任务成为重要趋势。业界已经出现了一批引人瞩目的代码大模型,比如 OpenAI 的 CodeX、谷歌 DeepMind 的 AlphaCode、HuggingFace 的 StarCoder,帮助程序员更迅捷...
-
神仙掐架!24届视觉算法岗(AIGC方向)秋招经验分享!
节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 今天我来介绍我们星球社群一位很...
-
基于Stable Diffusion的智能绘画大模型
随着人工智能技术的不断发展,AI艺术也在逐渐崭露头角。其中,基于Stable Diffusion的智能绘画大模型更是成为了AI艺术领域的一大亮点。那么,什么是Stable Diffusion?它又是如何应用于智能绘画大模型中的呢?本文将为您一一解答。 首...
-
提高 AI 训练算力效率:蚂蚁 DLRover 故障自愈技术的创新实践
本文来自蚂蚁 DLRover 开源负责人王勤龙(花名长凡)在 2024 全球开发者先锋大会(GDC 的分享——《DLRover 训练故障自愈:大幅提升大规模 AI 训练的算力效率》。 王勤龙,长期在蚂蚁从事 AI 基础设施的研发,主导了蚂蚁分布式训练的弹...
-
深入探索AI写作:从困惑度到爆发度的挑战与机遇
大家好,小发猫降重今天来聊聊深入探索AI写作:从困惑度到爆发度的挑战与机遇,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 深入探索AI写作:从困惑度到爆发度的挑战与机遇 在AI技术飞速发展的...
-
近屿智能独家发布:AIGC大模型工程师和产品经理学习路径图,AI技术不再难懂!
随着人工智能技术的飞速发展,AI取代人工的现象在各个行业和领域变得日益普遍,不少人因此忧心忡忡,担心自己的前途受到AI的冲击。实际上,AI不会取代你的工作,会取代你的是懂AI的人,如何提升自己与他人的知识壁垒,如何学习AIGC?相信在刚刚过去2023这个A...
-
OpenAI计划建立「数据市场」,训出GPT-5短缺20万亿 token
全网高质量数据集告急!据报道,AI 公司如 OpenAI、Anthropic 等正在努力寻找足够的信息来训练下一代人工智能模型。数据短缺问题日益突出,对训练下一代强大模型至关重要。面对这一挑战,AI 初创、互联网大厂开始寻找新的方法来解决算力和数据的瓶颈问...
-
北大&火山引擎夺冠!CLIC视频压缩挑战赛结果公布,中国团队表现亮眼
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 随着以深度学习为代表的新一代人工智能技术不断取得突破,学术界与工业界逐渐意识到人工智能技术在图像、视频压缩领域的巨大应用潜力。 基于深度...
-
AI大模型对神秘学易经有什么用?
Mistral Trismegistus-7B 是一款由AI驱动的神秘学专用模型,专为那些对神秘学、玄学和灵性感兴趣的人设计,可提供从古代智慧到现代塔罗牌占卜等各种神秘主题的见解。 Mistral Trismegistus-7B 名字来源于Hermes...
-
OpenAI发布新的AI微调工具:“绝大多数组织将开发定制模型”
OpenAI宣布了对其微调API的重大增强,以及其定制模型程序的扩展。这些更新将赋予开发者前所未有的控制权,以微调AI模型,并为构建特定业务需求的定制模型提供新途径。自2023年8月推出以来,GPT-3.5的微调API已经成为组织精细化AI模型以执行特定...
-
AI公司出门问问通过港交所聆讯 有望成为AIGC第一股
据IPO早知道报道,“出门问问”日前成功通过港交所聆讯,并于4月2日公布了相关资料,旨在主板挂牌上市。本次上市由中金公司和招银国际共同担任联席保荐人,此举标志着出门问问或将引领AIGC行业,成为该领域的“第一股”。 据悉,出门问问是一家人工智能公司,专注于...
-
斯坦福团队大模型Octopus v2火了:手机就能运行 准确性超越GPT-4
近日,斯坦福大学研究人员发布的 Octopus v2模型引起了开发者社区的极大关注,其20亿参数的模型一夜下载量超过2k。 这一模型可以在智能手机、汽车、个人电脑等端侧设备上运行,并在准确性和延迟方面表现超越了 GPT-4,同时将上下文长度减少了95%。...
-
超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 在大模型落地应用的过程中,端侧 AI 是非常重要的一个方向。 近日,斯坦福大学研究人员推出的 Octopus v2 火了,受到了开发者社...
-
斯坦福推可以在手机端跑的大模型 Octopusv2超越GPT-4一夜爆火
斯坦福大学的研究团队近日推出了一款名为Octopusv2的新型人工智能模型,这款模型以其在端侧设备上的强大运行能力而受到广泛关注。 Octopusv2是一款拥有20亿参数的开源语言模型,专为在Android设备上运行而设计,同时也适用于汽车、个人电脑等其他...
-
OpenAI为开发者添加新功能 允许构建自定义模型
OpenAI为开发者添加新功能,以增强对微调的控制,并宣布新方法来构建与OpenAI的自定义模型。这意味着开发者可以开发和训练一个特定于某个组织、业务领域、任务需求的模型。如法律、医疗等特定模型! 详细内容:https://openai.com/blog...
-
OpenAI 转录了超过一百万小时的 YouTube 视频来训练 GPT-4
近日,《华尔街日报》报道称,人工智能公司在收集高质量训练数据方面遇到了困难。随后,《纽约时报》详细介绍了一些公司处理这一问题的方法,其中涉及到了人工智能版权法的模糊灰色区域。 故事从OpenAI开始。该公司迫切需要训练数据,据报道开发了Whisper音频转...
-
中科大等意外发现:大模型不看图也能正确回答视觉问题!
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 大模型不看图,竟也能正确回答视觉问题?! 中科大、香港中文大学、上海AI Lab的研究团队团队意外发现了这一离奇现象。 他们首先看到像...
-
谷歌更新Transformer架构,更节省计算资源!50%性能提升
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 谷歌终于更新了Transformer架构。 最新发布的Mixture-of-Depths(MoD),改变了以往Transformer计...
-
【小白】一文读懂AIGC模型之Stable Diffusion模型
目录 模型简介 模型结构 VAE变分编码器 VAE结构 VAE模型训练与损失函数 U-Net结构 CLIP Text Encoder 模型工作流程 参考 模型简介 Stable Diffusion(SD)模型是一种基于...
-
llama-factory简介
llamafactory是什么,能干什么 LLaMA-Factory 是一个易于使用的大规模语言模型(Large Language Model, LLM)微调框架,它支持多种模型,包括 LLaMA、BLOOM、Mistral、Baichuan、Qwen ...
-
对标GPT-4!中国移动九天大模型通过双备案
快科技4月4日消息,日前,国家网信办公布已备案大模型清单,中国移动九天自然语言交互大模型”名列其中,标志着中国移动九天AI大模型可正式对外提供生成式人工智能服务。 中国移动表示,这是同时通过国家生成式人工智能服务备案”和境内深度合成服务算法备案”双备案的首...
-
Stable Diffusion WebUI 1.8.0来了
上周 Stable Diffusion WebUI 发布了 1.8.0 版本,更新内容比较多,据说显存使用有了大幅的下降,这几天我也找时间把 AutoDL 镜像的版本做了个升级,有兴趣的同学可以去体验下新版本了。 这里分享下其中几个我认为比较重要的更新。...
-
AI绘图:Stable Diffusion WEB UI 详细操作介绍:基础篇
接上一篇《AI绘图体验:Stable Diffusion本地化部署详细步骤》本地部署完了SD后,大家肯定想知道怎么用,接下来补一篇Stable Diffusion WEB UI 详细操作,如果大家还没有完成SD的部署,请参考上一篇文章进行本地化的部署。...
-
OpenAI 宣布用户无需注册账号即可使用 ChatGPT,但有部分限制
IT之家 4 月 2 日消息,OpenAI 宣布将降低其 AI 聊天机器人 ChatGPT 的使用门槛,即使没有账号的用户也能使用,不过会有一定限制。 从即日起,部分地区的用户访问 chat.openai.com 将不再需要登录即可直接与 ChatGP...
-
好书推荐 《AIGC重塑金融》
作者:林建明 来源:IT 阅读排行榜 本文摘编自《AIGC 重塑金融:AI 大模型驱动的金融变革与实践》,机械工业出版社出版 这是最好的时代,也是最坏的时代。尽管大模型技术在金融领域具有巨大的应用潜力,但其应用也面临不容忽视的风险和挑战。本文将深入研...
-
文心一言杀疯了!大模型社区、插件系统来了,码农神器发布,AI原生时代降临
夕小瑶科技说 原创 作者 | 卖萌酱 文心一言的这波更新,是真的杀疯了。 笔者测试了刚刚更新的文心一言,发现效果相比上一版又有了一个质的飞跃,内容创作、推理、代码等诸多维度的能力都有了肉眼可见的效果提升。 更加王炸的是,文心一言领先国内一众竞品,...
-
深度学习:AIGC重塑金融大模型驱动金融变革
作者:林建明 来源:IT阅读排行榜 本文摘编自《AIGC重塑金融:AI大模型驱动的金融变革与实践》,机械工业出版社出版 这是最好的时代,也是最坏的时代。尽管大模型技术在金融领域具有巨大的应用潜力,但其应用也面临不容忽视的风险和挑战。本文将深入研究大模型...
-
LLaMA 模型中的Transformer架构变化
目录 1. 前置层归一化(Pre-normalization) 2. RMSNorm 归一化函数 3. SwiGLU 激活函数 4. 旋转位置嵌入(RoPE) 5. 注意力机制优化 6. Group Query Attention 7. 模型...
-
集体出走的Stability AI 发布全新代码大模型,3B以下性能最优,超越Code Llama和DeepSeek-Coder
Stability AI又有新动作!程序员又有危机了? 3月26日,Stability AI推出了先进的代码语言模型Stable Code Instruct 3B,该模型是在Stable Code 3B的基础上进行指令调优的Code LM。 Stab...
-
【没有哪个港口是永远的停留~论文解读】stable diffusion 总结 代码&推导&网络结构
了解整个流程: 【第一部分】输入图像 x (W*H*3的RGB图像) 【第一部分】x 经过编码器 生成 (latent 空间的表示 h*w*c (具体设置多少有实验 【第二部分】 逐步加噪得到 ,和噪声标签 【第二部分】由 Unet( )...
-
采用生成式人工智能系统可能会改变企业的云架构
从数据可用性和安全性到大型语言模型和选择和监控,企业采用生成式人工智能意味着需要重新审视自己的云架构。 所以,很多企业正在重新构建云架构,同时也在开发生成式人工智能系统。那么,这些企业需要做些什么改变?新兴的最佳实践是什么?行业专家表示,在过去的20年...
-
【粉丝福利社】《AIGC重塑金融:AI大模型驱动的金融变革与实践》(文末送书-进行中)
🏆 作者简介,愚公搬代码 🏆《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,51CTO博客专家等。 🏆《近期荣...
-
GPT-5史诗级更新之前,OpenAI的“新东西”来了,曝定价百万字符15美元,语音克隆引擎让老外说“有口音的”中文
撰稿 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) OpenAI的新动作来了!此前Altman在采访中透露,在GPT-5史诗级的升级发布之前,OpenAI将在未来几个月发布许多“很酷的新东西”。 今天,OpenAI语音引擎首次亮...
-
【AIGC】大模型在金融行业的应用场景和落地路径
这是最好的时代,也是最坏的时代。尽管大模型技术在金融领域具有巨大的应用潜力,但其应用也面临不容忽视的风险和挑战。本文将深入研究大模型在金融领域的数据隐私和安全风险、模型可解释性和透明度、监管和合 规要求,梳理中国、美国、欧洲等地 AIGC 技术的应用规则,...
-
Stable Diffusion之核心基础知识和网络结构解析
Stable Diffusion核心基础知识和网络结构解析 一. Stable Diffusion核心基础知识 1.1 Stable Diffusion模型工作流程 1. 文生图(txt2img 2. 图生图 3. 图像优化模块 1.2...
-
AIGC重塑金融:AI大模型驱动的金融变革与实践
🌈个人主页: Aileen_0v0🔥热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 💫个人格言:“没有罗马,那就自己创造罗马~” #mermaid-svg-tVrfBkGvUD0Qi13F {font-family:"trebuchet...
-
AIGC重塑金融 | 大模型在金融行业的应用场景和落地路径
作者:林建明 来源:IT阅读排行榜 本文摘编自《AIGC重塑金融:AI大模型驱动的金融变革与实践》,机械工业出版社出版 目录 01 大模型在金融领域的 5 个典型应用场景 02 大模型在金融领域应用所面临的风险及其防范 03 AIGC 技术的科...
-
LLaMA-Factory参数的解答
打开LLaMA-Factory的web页面会有一堆参数 ,但不知道怎么选,选哪个,这个文章详细解读一下,每个参数到底是什么含义这是个人写的参数解读,我并非该领域的人如果那个大佬看到有参数不对请反馈一下,或者有补充的也可以!谢谢(后续该文章可能会持续更新)...
-
基于stable diffusion的IP海报生成
【AIGC】只要10秒,AI生成IP海报,解放双手!!!在AIGC市场发展的趋势下,如何帮助设计工作者解放双手。本文将从图像生成方向切入,帮助大家体系化的学习Stable diffusion的使用,完成自有IP的训练以及生成,主要从部署、训练、生成3大核心...
-
AI写作查出来高风险怎么办:七大应对策略
大家好,小发猫降ai今天来聊聊AI写作查出来高风险怎么办:七大应对策略,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: AI写作查出来高风险怎么办:七大应对策略 随...