-
百度智能云千帆大模型平台推出千帆SDK开源版本
百度智能云千帆大模型平台再次升级,推出千帆 SDK,全面开源并免费下载使用。 该 SDK 提供了从数据集管理、模型训练、模型评估到服务部署等一系列功能,用户可以通过代码接入并调用百度智能云千帆大模型平台的能力,轻松实现 LLMOps 全流程的落地,快速构建...
-
GPT-4重磅升级!OpenAI发布GPT-4 Turbo:更强大还更便宜
快科技11月7日消息,当地时间周一,OpenAI首届开发者大会如期召开,在大会上OpenAI正式推出了GPT-4 Turbo。 据OpenAI介绍,相比于GPT-4,GPT-4 Turbo主要有6方面的提升: 第一,上下文对话长度,GPT4最大只能支持8k...
-
让大模型自主探索开放世界,北大&智源提出训练框架LLaMA-Rider
大语言模型因其强大而通用的语言生成、理解能力,展现出了成为通用智能体的潜力。与此同时,在开放式的环境中探索、学习则是通用智能体的重要能力之一。因此,大语言模型如何适配开放世界是一个重要的研究问题。 北京大学和北京智源人工智能研究院的团队针对这个问题提出了...
-
让大模型忘记哈利波特,微软新研究上演Llama 2记忆消除术,真·用魔法打败魔法(doge)
最近微软一项研究让Llama 2选择性失忆了,把哈利波特忘得一干二净。 现在问模型“哈利波特是谁?”,它的回答是这样婶儿的: 木有赫敏、罗恩,木有霍格沃茨…… 要知道此前Llama 2的记忆深度还是很给力的,比如给它一个看似非常普通的提示“那年秋天,哈...
-
李开复领队开源大模型 Yi,40万字上下文窗口破纪录
由李开复博士亲自下场创办的零一万物(01.ai),自3月底官宣成立后,于近日发布并开源了两个版本的中英文大模型 Yi-6B 和 Yi-34B。 在线上发布环节,李开复博士重点介绍了 Yi 系列大模型的三处性能亮点: 全球最长200K 上下文窗口,免费开...
-
李开复官宣全球最强开源大模型Yi-34B 一次可处理40万汉字
零一万物推出了「Yi」系列开源大模型,其中Yi-34B在全球开源大模型排行榜上取得了显著成就,击败了其他竞品模型,成为双料冠军,尤其在中文指标上表现卓越。Yi-34B的性能超越了全球其他大模型,拥有强大的语言理解和处理能力,可以满足国内市场的需求。 ht...
-
随着Gen AI采用激增,新研究报告提醒数据信任问题
企业可信人工智能(AI)数据公司Cloudera的最新研究显示,美国一半以上的机构组织(53%)目前使用生成式人工智能(Gen AI)技术,另有36%的组织正处于探索人工智能的早期阶段,准备明年实现。 但超过八成的受访数据战略和管理决策者(84%)担心...
-
国内最大开源模型发布,无条件免费商用!参数650亿,基于2.6万亿token训练
国内规模最大的开源大模型来了: 参数650亿、基于2.6-3.2万亿token训练。 排名仅次于“猎鹰”和“羊驼”,性能媲美GPT3.5,现在就能无条件免费商用。 它就是来自深圳元象公司的XVERSE。 根据算力、资源限制和具体任务需求的不同,我们能对...
-
马斯克版ChatGPT爆火来袭!不用Python,11人爆肝两个月
马斯克突然出手截胡,抢在OpenAI开发者大会前发布大模型Grok。 与其他ChatGPT类产品不同,Grok可以实时从?推文中获取最新知识,比如马斯克刚刚与Joe Rogan的最新访谈。 图片 巨量、实时且独特的?数据构成了Grok的最大护城河,早在7...
-
AI「脑补」画面太强了!李飞飞团队新作ZeroNVS,单个视图360度全场景生成
近来,利用3D感知扩散模型训练模型,然后对单个物体进行SDS蒸馏的研究数不胜数。 但是,能够真正做到「场景级」的画面生成,从未实现。 现如今,斯坦福李飞飞和谷歌团队打破了这个记录! 比如,输入一张从某个角度拍摄的客厅图片,整个客厅的样貌就出来了。 再来...
-
AI能理解自己生成的东西吗? 在GPT-4、Midjourney上实验后,有人破案了
从 ChatGPT 到 GPT4,从 DALL・E 2/3 到 Midjourney,生成式 AI 引发了前所未有的全球关注。强大的潜力让人们对 AI 产生了许多期待,但是强大的智能也会引发人们的恐惧和担忧。近期大牛们针对该问题还上演了一场激烈的论战。先...
-
AI生图太诡异?马里兰&NYU合力解剖神经网络,CLIP模型神经元形似骷髅头
AI黑盒如何才能解? 神经网络模型在训练的时,会有些ReLU节点「死亡」,也就是永远输出0,不再有用。 它们往往会被被删除或者忽略。 恰好赶上了模糊了生与死的界限的节日——万圣节,所以这是探索那些「死节点」的好时机。 对于大多数图像生成模型来说,会输出正...
-
大模型: 模型大了难在哪里?
大家好,我是Tim。 自从GPT模型诞生以来,其参数规模就在不停的扩大。但模型并非简单的直接变大,需要在数据、调度、并行计算、算法和机器资源上做相应的改变。 今天就来总结下,什么是大模型,模型变大的难在哪里以及对于CV/NLP或者搜推广场景上有什么应对策...
-
使用Ray创建高效的深度学习数据管道
用于训练深度学习模型的GPU功能强大但价格昂贵。为了有效利用GPU,开发者需要一个高效的数据管道,以便在GPU准备好计算下一个训练步骤时尽快将数据传输到GPU。使用Ray可以大大提高数据管道的效率。 1、训练数据管道的结构 首先考虑下面的模型训练伪代码。...
-
阿里云发布通义星尘、通义灵码等产品 推出大模型应用开发平台阿里云百炼
在昨日的2023云栖大会上,阿里云发布了多个重要的产品和技术。 首先是通义大模型家族的更新。阿里云发布了千亿级参数规模的大模型通义千问2.0,综合性能超过了 GPT-3.5,正在追赶 GPT-4。此外,通义千问 APP 也在各大手机应用市场上线,用户可以直...
-
给终端装上大模型,对打工人来说究竟是福还是孽?
各行业的打工人从最开始担心被AI替代,到现在的“真香”,已经开始能够利用这一“利器”在工作中不断提高效率,大胆创新。根据速途网与大模型之家联合发布的报告显示,到 2023 年,全球大模型市场规模将达到 210 亿美元,到 2028 年,其规模将增长到...
-
阿里云全面升级AI基础设施,中国大模型公司一半跑在阿里云上!
10月31日,在2023云栖大会上,阿里云CTO周靖人表示,面向智能时代,阿里云将通过从底层算力到AI平台再到模型服务的全栈技术创新,升级云计算体系,打造一朵AI时代最开放的云。在现场,周靖人公布了云计算基础能力的最新进展,升级了人工智能平台,并发布千亿...
-
通义千问2.0将带来重磅升级 通义千问app怎么注册下载安装
通义千问2.0将带来重磅升级,正式超越GPT-3.5,正在加速追赶GPT-4,成为业界的佼佼者。此次升级的核心在于其在性能上的巨大飞跃,不仅在复杂指令理解、文学创作、通用数学、知识记忆等方面有显著提升,还在幻觉抵御等能力上表现出色。 通义千问2.0将带来...
-
通义千问app下载官网 阿里通义千问app特色介绍
通义千问app是一款适用于多个垂直领域的AI助手,无论您是需要解决工作中的问题,还是在学习中寻求帮助,通义千问都能为您提供精准的答案和协助。通过通义千问app,用户可以更加便捷地体验最新的模型能力,更好地应对生活中的各种挑战。 通义千问app下载官网 首...
-
阿里云发布通义千问2.0,性能超GPT-3.5,加速追赶GPT-4
10月31日,阿里云正式发布千亿级参数大模型通义千问2.0。在10个权威测评中,通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4。当天,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。 过去6个月,通义...
-
阿里云将在11月开源通义千问720亿参数模型
在今日的2023云栖大会上,阿里云CTO周靖人宣布将在11月开源通义千问720亿参数模型。周靖人表示,通义千问72B将成为参数规模最大的中国开源大模型。 此前,阿里云已先后开源通义千问70亿参数模型Qwen7B和140亿参数模型Qwen14B,模型累计下载...
-
阿里云周靖人:阿里云今日将发布通义千问2.0
在2023年的云栖大会上,阿里巴巴集团的创始合伙人、董事长蔡崇信表示,智能化时代已经来临,人工智能将成为新的生产力,推动各行各业快速发展。 同时,他强调了算力的重要性,指出中国80%的科技企业以及一半的大模型公司都在使用阿里云作为他们的云服务提供商。 蔡...
-
Meta AI研究负责人倡导开源许可制度变革
Meta公司最近发布的大型语言模型Llama2备受争议,因其并未完全满足开源倡议的要求。尽管Llama2相对较为开放和免费,但在开源软件领域,一些人仍对该公司的开放性持有异议。 具体来说,Meta公司的许可协议使Llama2对许多人免费,但它仍然是有限的,...
-
元乘象Chatimg3.0来了,赶超GPT-4V,还给出产业升级新打法
最近,AI 领域都在思考一件事:多模态大模型落地产业,好的打法应该是什么? 通用人工智能时代正在到来,AI 大模型技术已成为数字经济下基础设施建设的重要支撑,也成为产业智能化转型的核心「引擎」,AI 大模型 + 产业应用迎来了前所未有的发展机遇。 在10月...
-
更高清写实的人体生成模型HyperHuman来了,基于隐式结构扩散,刷新多项SOTA
论文地址: https://arxiv.org/pdf/2310.08579.pdf Github 地址: https://github.com/snap-research/HyperHuman 1. 研究背景与动机 随着扩散模型的兴起,一些典型...
-
AI智能超越人类终解开!李飞飞高徒新作破圈,5万个合成数据碾压人类示例,备咖啡动作超丝滑
AI巨佬Geoffrey Hinton称,「科技公司们正在未来18个月内,要使用比现在GPT-4多100倍的算力训练新模型」。 更大参数的模型,对算力需求巨大的同时,对数据也提出了更高的要求。 但是,更多的高质量数据该从何来? 英伟达高级科学家Jim F...
-
首个人体动捕基模型面世!SMPLer-X:横扫七大榜单
人体全身姿态与体型估计(EHPS, Expressive Human Pose and Shape estimation)虽然目前已经取得了非常大研究进展,但当下最先进的方法仍然受限于有限的训练数据集。 最近,来自南洋理工大学S-Lab、商汤科技、上海人...
-
小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大
大型语言模型 (LLMs 在各种自然语言任务中展现出了卓越的性能,但是由于训练和推理大参数量模型需要大量的计算资源,导致高昂的成本,将大语言模型应用在专业领域中仍存在诸多现实问题。因此,北理团队先从轻量级别模型入手,最大程度发挥数据和模型的优势,立足更...
-
财报拆解:微软押注生成式AI已有回报,谷歌还在挣扎
微软和谷歌发布财报,一家欢喜一家忧愁。由于大胆押注AI,微软开始获得一些回报,业绩不错。反观谷歌,核心业务增长乏力,虽然它也在积极投资新技术,但业绩并没有惊艳之处。 微软Azure增速加快,生成式AI贡献约3% 最近一个季度,微软获得营收565亿美元,...
-
腾讯混元大模型再进化,文生图能力重磅上线,这里是一手实测
2023年,大模型的落地按下加速键,文生图便是最火热的应用方向之一。 自从 Stable Diffusion 诞生以来,海内外的文生图大模型不断涌现,一时有「神仙打架」之感。每一次技术迭代,都带来了模型生成效果和速度的飞速提升。 就在今天,腾讯混元大模型也...
-
AI基础软件:如何自主构建大+小模型?
一、公司介绍 九章云极DataCanvas以创造智能探索平台为使命,怀揣着助力全球企业智能升级的愿景,是中国人工智能基础软件领域的佼佼者。公司专注于自主研发的人工智能基础软件产品系列和解决方案,为用户提供全面的人工智能基础服务,旨在帮助用户在数智化转...
-
MIT等机构推出数据溯源平台 解决AI领域的数据透明危机
研究人员来自麻省理工学院(MIT)、Cohere for AI以及其他11个机构,他们共同发布了Data Provenance Platform,旨在应对AI领域的数据透明危机。这一平台的推出旨在解决AI模型训练数据集的来源和使用透明度不足的问题,这是当前...
-
AI初创公司CentML融资2700万美元 用于解决AI模型高成本问题
AI初创公司CentML最近成功完成了一轮扩展种子融资,募得2,700万美元,旨在开发能够降低机器学习模型部署成本并提高性能的工具。这次融资得到了Gradient Ventures、TR Ventures、Nvidia以及微软Azure AI副总裁Mish...
-
Nightshade 工具助力创作者保护版权 对抗 AI 训练数据的滥用
随着人工智能(AI)技术的快速发展,其训练数据的获取和使用变得日益重要,但也出现了滥用现象。为了抵御这种滥用,一款名为「Nightshade」的新工具应运而生,为创作者提供了一种保护他们创意作品不被无授权用于 AI 模型训练的方法。 Nightshade...
-
适合初学者的一些常用的机器学习库
在人工智能项目开发的过程中,我们通常会使用到很多机器学习、深度学习框架、各种数据处理库和一些工具。好用的库很多,但对于初学者来说先聚焦在一些比较常用的框架、库或者工具,有利于提高效率。下面主要分享一些常用的人工智能相关的内容,包括:模型训练、数据处理、参...
-
可令 AI 模型“输入狗生成猫”,黑客展示为训练数据集“下毒”的 Nightshade 工具
10 月 25 日消息,AI 大模型训练数据源版权问题一直是一个令业界头疼的问题,日前有黑客展示了一款名为 Nightshade 的工具,该工具可在不破坏观感的情况下轻微修改图片,若有 AI 模型在训练时使用了这些被“下毒”的图片,模型生图结果便会被毁...
-
深度学习科研,如何高效进行代码和实验管理?
回答一 作者:叶小飞 链接:https://www.zhihu.com/question/269707221/answer/2281374258 我之前在北美奔驰落地时,曾有段时间为了测试不同的结构和参数,一周能训练一百来个不同的模型,为此我结合公司前...
-
数据分析和机器学习的11个高级可视化图表介绍
可视化是一种强大的工具,用于以直观和可理解的方式传达复杂的数据模式和关系。它们在数据分析中发挥着至关重要的作用,提供了通常难以从原始数据或传统数字表示中辨别出来的见解。 可视化对于理解复杂的数据模式和关系至关重要,我们将介绍11个最重要和必须知道的图表,...
-
50张图“毒倒”Stable Diffusion,汽车和牛都分不清了
艺术家对AI侵权的反击来了—— 在画作里“投毒”,AI用了就会“中毒”出故障。 投毒工具由芝加哥大学团队打造,名为Nightshade,可以对画中像素添加隐形更改。 被下毒的画一旦被非法抓取成为训练数据被AI吃掉,模型就会生成混乱。 甚至还可能会破坏DA...
-
阿里腾讯豪华阵容参投,智谱AI投资版图曝光
【新智元导读】超25亿元融资总额,清华团队出身的智谱AI一举成为国内公开融资最高的大模型明星公司之一。 尽管Q4季才刚开始,但人工智能大模型公司智谱已公开宣布,今年累计获得超过25亿人民币融资。 这距离智谱上一次正式公布融资消息已经过去了一年多的时间。...
-
度小满自动机器学习平台实践
一、机器学习平台 首先介绍一下度小满机器学习平台的背景、发展过程以及现状。 1、业务场景 度小满是一家金融科技公司,公司内部的业务场景主要分为三个方面: 智能风控:涉及关系数据挖掘、文本数据挖掘、情感分析等 NLP 技术,及人脸识别等 CV 技术。...
-
斯坦福大学发布 AI 基础模型“透明度指标”,Llama 2 以 54% 居首但“不及格”
10 月 20 日消息,斯坦福大学日前发布了 AI 基础模型“透明度指标”,其中显示指标最高的是 Meta 的 Lama 2,但相关“透明度”也只有 54%,因此研究人员认为,市面上几乎所有 AI 模型,都“缺乏透明度”。 据悉,这一研究是由 HAI...