-
探索创新:LLAMA Index - 一个智能数据分析利器
探索创新:LLAMA Index - 一个智能数据分析利器 项目地址:https://gitcode.com/run-llama/llama_index 项目简介 LLAMA Index 是一款强大的数据预处理和分析工具,旨在简化大数据处理过程,...
-
亚马逊推出新的生成式 AI 功能,帮助卖家创建产品描述
亚马逊通过引入生成式人工智能(AI)功能,继续创新,帮助卖家成功,使他们可以提供自己网站的链接,并利用新的生成式 AI 功能,轻松在亚马逊商店中创建高质量的产品详情页。AI 技术的发展正在彻底改变各种体验,亚马逊正不断推出新功能,从而显著提高顾客在商店内的...
-
离职谷歌的Transformer作者创业,连发3个模型(附技术报告)
去年 8 月,两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI,总部位于日本东京。其中,Llion Jones 是谷歌 2017 年经典研究论文《Attention is all you n...
-
3140参数Grok-1推理加速3.8倍,PyTorch+HuggingFace版来了
马斯克说到做到开源Grok-1,开源社区一片狂喜。 但基于Grok-1做改动or商用,都还有点难题: Grok-1使用Rust+JAX构建,对于习惯Python+PyTorch+HuggingFace等主流软件生态的用户上手门槛高。 △图注:Grok登...
-
大数据 AI 一体化解读
一、AI 的“iPhone”时刻 在过去的一年中,大模型的发展非常迅速,算力和数据的堆叠使模型具备了一些通用的构造和回答问题的能力,引领人们进入了一直梦想的人工智能阶段。举个例子,在与大语言模型聊天时,会感觉面对的不是一个生硬的机器人,而是一个有血有肉的...
-
32K上下文,Mistral 7B v0.2 基模型突然开源了
刚刚,Mistral AI 的模型又更新了。 这次开源一如既往地「突然」,是在一个叫做 Cerebral Valley 的黑客松活动上公布的。 PPT 一翻页,全场都举起了手机拍照: 这次开源的 Mistral 7B v0.2 Base Mod...
-
图像生成地表最强!Playground v2.5技术报告解读重磅来袭!超越SD、DALL·E 3和 Midjourney
文章链接:https://arxiv.org/pdf/2402.17245 模型地址: https://huggingface.co/playgroundai/playground-v2.5-1024px-aesthetic 本文分享了在文本到图像生成模...
-
Stable Diffusion 模型下载和使用方法
1、Stable Diffusion模型简介 上一文中《Stable Diffusion绘图神器,2分钟极速安装教程!(提供安装包)-CSDN博客》,给大家介绍了Stable Diffusion的安装方法和简单的使用方式,有...
-
AWS、埃森哲和Anthropic合作加速企业AI采用
Anthropic的联合创始人兼总裁Daniela Amodei告诉记者,“这实际上是一个三管齐下的合作伙伴关系,我们在顶层的目标是让企业更容易为这些特定领域和行业采用和集成GenAI技术和解决方案。” AWS负责全球渠道和联盟的副总裁Ruba B...
-
吴恩达:AI智能体工作流今年将有巨大进展,可能超过下一代基础模型
随着 ChatGPT、GPT-4、Sora 的陆续问世,人工智能的发展趋势引起了广泛关注,特别是 Sora 让生成式 AI 模型在多模态方面取得显著进展。人们不禁会问:人工智能领域下一个突破方向将会是什么? 今天,人工智能著名学者、斯坦福大学教授吴恩达指...
-
符尧大佬一作发文,仅改训练数据,就让LLaMa-2上下文长度扩展20倍!
引言:探索语言模型的长上下文能力 近日,谷歌推出了Gemini Pro 1.5,将上下文窗口长度扩展到100万个tokens,目前领先世界。而其他语言模型也正在不断探索长上下文能力,也就是模型处理和理解超出其训练时所见上下文长度的能力。例如,一个模型可能...
-
AtomoVideo:AIGC赋能下的电商视频动效生成
✍? 本文作者:凌潼、依竹、桅桔、逾溪 1. 概述 当今电商领域,内容营销的形式正日趋多样化,视频内容以其生动鲜明的视觉体验和迅捷高效的信息传播能力,为商家创造了新的机遇。消费者对视频内容的偏好驱动了视频创意供给的持续增长,视觉内容...
-
Transformer七子重聚GTC,老黄亲自赠送签名版DGX-1!7年奠基之作背后佚事揭秘
GTC大会上,老黄与Transformer八位作者一场最新访谈,简直火爆了! 演讲前一个半小时,现场门外就挤满了人。许多人早早排起了长队,期待着这场别致的访谈。 就连老黄也提前到场,在人群中合影。 老黄主旨演讲当天,现场虚无坐席,网友戏称他为AI届的...
-
一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE
近年来,LLM 已经一统所有文本任务,展现了基础模型的强大潜力。一些视觉基础模型如 CLIP 在多模态理解任务上同样展现出了强大的泛化能力,其统一的视觉语言空间带动了一系列多模态理解、生成、开放词表等任务的发展。然而针对更细粒度的目标级别的感知任务,目前...
-
腾讯2023年全年研发投入640.78亿元,混元大模型能力位列国内第一梯队
3月20日,腾讯发布2023年第四季度及全年业绩报告,全年研发投入达到640.78亿元。自2018年以来,腾讯累计研发投入超过2696.54亿元。在全球范围内,腾讯专利申请总数超过7.5万件,授权专利数量超过3.7万件。 技术驱动带来的业务增长在腾讯最新财...
-
腾讯四季度营收1551.96亿元:混元大模型已在400+业务中内测
腾讯控股今日公布了其截至 12 月 31 日的 2023 年第四季度及全年财报,各项数据呈现出不同的增长态势。 在第四季度,腾讯控股的营收达到了 1552 亿元,同比增长了7%。 从第四季度各业务板块的数据来看,增值服务收入为 691 亿元,较去年同期略有...
-
HPT官网体验入口 HyperGAI多模态语言开源模型框架免费使用地址
HPT是HyperGAI研究团队推出的新型多模态大型语言模型框架。它具有高效且可扩展地训练大型多模态基础模型的能力,能够理解包括文本、图像、视频等多种输入模态。HPT框架不仅可以从头开始训练,还可以通过现有的预训练视觉编码器和/或大型语言模型进行高效适配。...
-
Google DeepMind 联合创始人加入微软,担任新 AI 部门 CEO
微软已经聘用了 Google DeepMind 联合创始人 Mustafa Suleyman。Suleyman 在 X 上发布的一篇文章中宣布,他将加入微软,担任新团队的 CEO,负责处理公司的面向消费者的人工智能产品,包括 C o pilot、Bing...
-
亚马逊云科技与英伟达扩展合作 加速超万亿参数级大模型训练
亚马逊云科技与英伟达扩展合作,加速生成式 AI 创新。双方将在亚马逊云科技上提供 NVIDIA Blackwell 架构 GPU,包括 GB200Grace Blackwell 超级芯片和 B100Tensor Core GPU,以帮助客户解锁新的生成式...
-
企业对人工智能的强烈需求推动了人工智能信任和安全市场
预计到2030年,全球人工智能信任、风险和安全管理市场规模预计将达到74.4亿美元。研究人员预计该市场从2024年到2030年的复合年增长率将达到21.3%随着组织越来越多地采用人工智能,对偏见、可解释性和安全漏洞的担忧也随之增加,这使得人工智能信任、...
-
微软在AI领域是不是大而不倒?
在2023年11月OpenAI的剧变中,联合创始人兼CEO奥特曼被解雇并重新聘用,微软CEO纳德拉接受了采访,分享了他对这一事件的两点看法,以及人工智能如何在企业中渗透。 纳德拉在谈到微软在人工智能领域的存在时表示:“我们对自己的能力非常有信心,我们拥...
-
日本政府将探讨 AI 法律监管:约束虚假信息传播,监管不力或受罚
3 月 18 日消息,据日本共同社报道,日本政府将开始探讨针对大规模人工智能(AI)开发者采取法律监管,拟对未充分完善虚假信息对策等情况设置罚则。 日本政府此前对于人工智能等领域的态度是“尊重企业的自主努力”,但由于 AI 带来虚假信息传播、侵权等多种...
-
马斯克兑现承诺,Grok模型携3140亿参数强势开源,商业用途全免费!
马斯克确实以其高效率和大胆的行动著称,最近他旗下的AI初创企业xAI宣布了一项引人注目的举措:开源了一个名为Grok-1[1]的混合专家模型。 这个模型拥有3140亿个参数,是目前参数量最大的开源大型语言模型之一,而允许商用、可修改和分发,对各种自研...
-
马斯克突然开源Grok:3140亿参数巨无霸,免费可商用
马斯克说到做到: 旗下大模型Grok现已开源! 代码和模型权重已上线GitHub。官方信息显示,此次开源的Grok-1是一个3140亿参数的混合专家模型—— 就是说,这是当前开源模型中参数量最大的一个。 消息一出,Grok-1的GitHub仓库已揽获4...
-
全球最大开源大模型!马斯克正式开源Grok AI
马斯克此前曾宣布,开源Grok的举措将于本周实施。现在,任何其他企业家、程序员、公司或个人都可以体验和测试Grok——模型的人工神经元或软件模块之间的连接强度,这些模块使模型能够做出决策、接受输入并以文本形式提供输出——以及其他相关文档,并将模型的副本...
-
迄今最大!马斯克AI大模型Grok开源:参数量达3140亿
快科技3月18日消息,据媒体报道,马斯克的AI创企xAI正式宣布其大语言模型Grok-1已实现开源,并向公众开放下载。 据了解,Grok-1是一款基于混合专家系统(Mixture-of-Experts,MoE)技术构建的大语言模型,拥有3140亿参数,远超...
-
马斯克打脸OpenAI,全球最大巨无霸模型Grok-1开源!3140亿参数8个MoE,GitHub狂揽6k星
说到做到,马斯克xAI的Grok,果然如期开源了! 就在刚刚,xAI正式发布3140亿参数混合专家模型Grok-1的权重和架构。 3140亿的参数,让Grok-1成为迄今参数量最大的开源LLM,是Llama 2的4倍。 目前,xAI关于Grok-1...
-
AI干6周=生物学家134年!斯坦福生物学基础模型开启生物学AI时代
人类花了134年才发现Norn细胞,AI用了6周就做到了! 来自斯坦福大学的研究人员使用数百万个真实细胞的化学和基因组成作为原始数据训练了一个AI大模型, 通过自行学习到的知识,模型可以将之前从未见过的细胞归类为1000多种类别中的某一种,Norn细胞就...
-
马斯克旗下xAI宣布开源Grok-1 包含3140亿参数
今日,马斯克旗下xAI宣布开源Grok-1。据悉,Grok-1基础模型基于大量文本数据训练,共有3140亿参数。该模型使用基于 JAX 和 Rust 的自定义训练堆栈进行训练。 而xAI 是埃隆・马斯克成立的人工智能公司,于2023年7月12日宣布成立。...
-
与Sora同架构的Stable Diffusion 3.0 震撼发布
Stability AI 发布了 Stable Diffusion 3,这款图像生成 AI 模型再次刷新了人们的认知。 这款由 Stability AI 倾力打造的文本变图模型,可是迄今为止最强大的“黑科技”!无论你想生成多主题的奇幻场景,还是高精度的风...
-
仅需200M参数,零样本性能超越有监督!谷歌发布时序预测基础模型TimesFM
时间序列预测在零售、金融、制造业、医疗保健和自然科学等各个领域无处不在:比如说在零售场景下中,「提高需求预测准确性」可以有显著降低库存成本并增加收入。 深度学习(DL)模型基本上垄断了「多变量时间序列预测」任务,在各个竞赛、现实应用中的表现都非常好。 与...
-
苹果大模型MM1入场:参数达到300亿 超半数作者是华人
苹果公司最新发布了一款名为MM1的大型多模态基础模型,拥有300亿参数,采用了MoE架构,并且超过一半的作者是华人。该模型在多模态领域具有重要意义,可能预示着苹果未来推出与此相关的产品。 今年以来,苹果明显加大了对生成式人工智能(GenAI)领域的投入,这...
-
2024最新版Stable Diffusion下载安装,保姆级教程指南!
2024可以称得上是Ai技术大应用的元年,目前两款Ai神器大火,一款是大名鼎鼎的Chat GPT。 另外一款大火的是本期晓晓介绍的Ai绘图软件—Stable Diffusion。 可口可乐的最新广告,据说是大量使用了 Stable Diffusio...
-
Omdia:预计2028年机器人人工智能芯片组市场价值将达8.66亿美元
市场研究公司Omdia的报告显示,预计2028年全球机器人人工智能芯片组市场规模将达到 8.66 亿美元,这将有助于 GenAI 在机器人领域的普及化。 Omdia指出,自从 Google 在 2022 年推出了用于机器人应用的变压器 RT-1 以来,...
-
企业如何快速、安全地部署GenAI
GenAI为企业提供了一个千载难逢的机会,具有在创新、增长和生产力方面产生变革性影响的潜力,这项技术现在可以产生可信的软件代码、文本、语音、高保真图像和互动视频,它已经通过晶体结构确定了数百万种新材料的潜力,甚至开发了分子模型,这些模型可以作为找到以前...
-
LLaMA-2-7B数学能力上限已达97.7%?Xwin-Math利用合成数据解锁潜力
合成数据持续解锁大模型的数学推理潜力! 数学问题解决能力一直被视为衡量语言模型智能水平的重要指标。通常只有规模极大的模型或经过大量数学相关预训练的模型才能有机会在数学问题上表现出色。 近日,一项由 Swin-Transformer 团队打造,来自西安交通...
-
论文笔记:Code Llama: Open Foundation Models for Code
导语 Code Llama是开源模型Llama 2在代码领域的一个专有模型,作者通过在代码数据集上进行进一步训练得到了了适用于该领域的专有模型,并在测试基准中超过了同等参数规模的其他公开模型。 链接:https://arxiv.org/abs/23...
-
ai作画在线生成!这8个AI生图工具一定要知道。
过去的2023年被称作AI元年,随之而来的2024,被业内人士称之为AI应用元年,即随着大模型和各类AI应用的涌现速度放缓,人们关注的焦点也从产品层面(有哪些好用的AI应用),转移到AI如何更好地赋能实际业务的应用场景。 就大多数人的日常工作而言,最常见...
-
127k引用数的AI大牛创业:为机器人造大脑!OpenAI红杉排队塞钱
谷歌学术被引数超127000的大神宣布创业,获OpenAI等机构在内投资7000万美元! 他就是来自UC伯克利的副教授Sergey Levine,创业前任职于电气工程与计算机科学系,是深度强化学习领域超受欢迎的网红老师。 他在推特上兴奋地表示,此番创业...
-
AI公司生数科技完成新一轮数亿元融资 聚焦原生多模态赛道
生数科技是一家成立于2023年的公司,专注于多模态大模型的研发,包括图像、3D 和视频等多种原生多模态大模型。他们的团队来自清华大学人工智能研究院和其他科技公司,拥有深厚的技术背景。 该公司最近完成了一轮数亿元的融资,将主要用于多模态基础大模型的研发、产品...
-
谷歌承认“窃取”OpenAI模型关键信息:成本低至150元,调用API即可得手
什么?谷歌成功偷家OpenAI,还窃取到了gpt-3.5-turbo关键信息??? 是的,你没看错。 根据谷歌自己的说法,它不仅还原了OpenAI大模型的整个投影矩阵(projection matrix),还知道了确切隐藏维度大小。 而且方法还极其简单—...
-
浙大&中科院让Agent学会自我进化,玩德州扑克心机尽显
基于大模型的Agent,已经成为了大型的博弈游戏的高级玩家,而且玩的还是德州扑克、21点这种非完美信息博弈。 来自浙江大学、中科院软件所等机构的研究人员提出了新的Agent进化策略,从而打造了一款会玩德州扑克的“狡猾”智能体Agent-Pro。 通过不断...
-
华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究
OpenAI又迎来一位AI大将。 最近,华人科学家程博文官宣离职特斯拉,即将加入OpenAI专攻多模态模型的研究。 图片 今天是我在特斯拉自动驾驶部门的最后一天,这一年半的经历真的很棒:有机会与才华横溢的同事们共事,学习了如何开发出色的产品等等。但我向通...
-
清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!
大模型只能够记忆与理解有限的上下文已经成为大模型在真实应用中的能力瓶颈,例如对话式AI系统往往无法记忆你前一天对话的内容,利用大模型构建智能体会产生前后不一致的行为与记忆。 为了让大模型能够记忆并处理更长的上下文,来自清华大学、麻省理工学院和人民大学的研...
-
LeCun最新专访:为什么物理世界终将成为LLM的「死穴」?
在人工智能领域,很少有像 Yann LeCun 这样的学者,在 65 岁的年龄还能高度活跃于社交媒体。 一直以来,Yann LeCun 都是以「直言不讳的批评者」形象活跃于人工智能领域。他始终支持开源,并带领 Meta 的团队推出了占据如今开源大模型领域...
-
AI绘画再提速-stable diffusion LCM Lora模型简书
这是基于stable diffusion webui (automatic1111项目)中安装LCM 模型的方法,可大幅提升绘图速度。 方法一:SD1.5基础模型,方法比较简单,直接从https://huggingface.co/latent-consi...
-
印度宣布向 AI 领域投资 1037 亿卢比,强化对大语言模型的开发
3 月 8 日消息,印度政府宣布已批准国家级“ IndiaAI 使命”项目,旨在实现“让 AI 在印度扎根”和“让 AI 为印度服务”两大目标,预算达 1037.192 亿卢比(当前约 90.13 亿元人民币)。 据介绍,该项目将由数字印度公司(DI...
-
Hume.AI官网体验入口 人工智能情感理解工具使用地址
Hume.AI是一家专注于开发能够理解人类情感和表情的技术的公司。他们提供表情测量API和自定义模型API,以帮助预测和改善人类福祉。无论是研究人员、开发者还是企业,都可以从Hume.AI的技术中受益。 点击前往Hume.AI官网体验入口 Hume.A...
-
创建内部大型语言模型(LLM)前必须思考的五个关键问题
译者 | 晶颜 审校 | 重楼 业务领导者一直深感压力,他们需要找到将生成式人工智能(GenAI)纳入其战略的最佳方式,以便为其组织和利益相关者带来最佳收益。根据Gartner的调查,38%的业务领导者指出,客户体验和留存率是他们投资GenAI的主要目的...
-
Haiper AI官网体验入口 人工智能文生视频重绘软件怎么使用方法教程指南
Haiper AI是构建下一代内容创作的最佳感知基础模型的使命。它提供以下主要功能:文本转视频,图片动画,视频重绘,导演视角。 点击前往Haiper AI体验入口 需求人群:适用于内容创作、设计、营销等场景 使用场景示例: 将博客文章转化为动态视频 将...