-
中国首部文生视频AI系列动画片:《千秋诗颂》英文版发布
快科技3月10日消息,据央视新闻报道,今日,中国首部文生视频AI系列动画片《千秋诗颂》英文版在总台CGTN正式上线发布。 据介绍,该系列动画片英文版同样采用总台最新AI技术译制配音完成。 总台CGTN运用AI语言模型对中文脚本进行翻译润色,配音过程使用文生...
-
BsinCopilot:Java版端到端大语言模型开发框架
BsinCopilot是基于BsinPaaS开源框架构建的大语言模型应用SaaS服务,借鉴langchain的框架思想,引入 langchian4j组件,微前端微服务的架构设计,可快速助您构建和体验端到端的AI应用。 基本概念 概念 说明...
-
近屿智能完成A轮融资,打造行业领先的AIGC工程师与产品经理成长蓝图
2024年1月,上海近屿智能科技有限公司(简称近屿智能)成功完成了A轮融资,智望资本担任了领投角色,而金沙江创投也进行了追加投资。这一融资里程碑充分证明了近屿智能在AIGC行业的技术领先地位得到了市场的广泛认可和投资人的青睐。 自创立伊始,近屿智能始...
-
联合国最新研究:ChatGPT等大模型对女性存在明显偏见!
快科技3月8日消息,据媒体报道,在三八国际妇女节前夕,联合国教科文组织发布的研究报告称,大语言模型存在性别偏见、种族刻板印象等倾向。 大语言模型是一种用于支持生成式人工智能的自然语言处理工具,OpenAI的GPT-3.5、GPT-2,脸书母公司Meta的L...
-
挑战OpenAI的新模型免费上线,40%计算量性能逼近GPT-4
本周四,美国 AI 创业公司 Inflection AI 正式发布新一代大语言模型 Inflection-2.5。 据介绍,Inflection-2.5 将强大的 LLM 能力与 Inflection 标志性的「同理心微调」结合在一起,兼具高情商与高智商...
-
在你的企业中实施GenAI的七个提示
如果我从长期的企业咨询职业生涯中学到了一件事,那就是转型永远不会从技术本身开始。你不能只是告诉你的企业中的每个人立即开始试验ChatGPT,因为它存在非常真实的挑战和限制,例如,你不能让你的销售团队将客户数据上传到像ChatGPT这样的工具上,因为这可...
-
田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型
上个月,Meta FAIR 田渊栋参与的一项研究广受好评,他们在论文《 MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases》中开始卷 10...
-
前谷歌大佬离职创业,不到一年造出GPT3.5和Gemini Pro,惨痛忠告:GPU简直菜鸡,就像是买彩票!
作者 | Yi Tay 编译 | 云昭 出品 | 51CTO技术栈(微信号:blog51cto) 你敢相信吗?一位前谷歌大佬,离职成立公司,不到一年,从头训练出了“GPT3.5”/“Gemini Pro”,注意,后者是多模态大模型! 本文主人公Y...
-
AI代码加速器即将发布!傅盛:程序员会写某种代码就能找到工作的时代一去不复返了
整理&撰稿 | 伊风 3月6日,猎豹移动董事长兼CEO、猎户星空董事长傅盛在自己生日当天,通过个人微博宣布,猎户星空即将推出一款新产品,“猎户星空AI代码加速器”。“这款基于大语言模型的代码加速器,预计将彻底改变传统的编程方式,人人都会写代码...
-
神经网络之父Hinton最新公开演讲:数字智能会取代生物智能吗?
Geoffrey Hinton教授,人称“人工智能教父”,他是英国皇家学会院士(FRS ,也是加拿大皇家学会院士( FRSC 和加拿大国家勋章(CC 获得者。 牛津大学于2024年2月19日在谢尔顿剧院举办了年度Romanes讲座,Geoffrey Hi...
-
联合国教科文组织:由OpenAI和Meta支持的AI工具存在性别歧视内容
联合国教科文组织发布的研究报告指出,由OpenAI和Meta算法推动的全球最广泛使用的人工智能(AI)工具存在性别歧视现象。该研究中,专家评估了两种算法以及OpenAI的GPT-2和GPT-3.5,这两者分别是人们熟知的聊天机器人ChatGPT的免费版本的...
-
提示词在大模型Chatgpt、llama2、chatglm3、gemini、bert、bard、通义千问、文心一言、盘古大模型等的核心作用,谁掌握提示词工程能力,谁就拿到激发大模型强大生成能力的钥匙
提示词在大模型Chatgpt、llama2、chatglm3、gemini、bert、bard、通义千问、文心一言、盘古大模型等的核心作用,谁掌握提示词工程能力,谁就拿到激发大模型强大生成能力的钥匙。 提示工程(Prompt Engineering)...
-
AI工具使公司面临数据泄露的风险
自2021年以来,由企业内部人员造成的数据泄露、丢失和盗窃事件平均每月增加28%,85%的受访者预计这一趋势将在未来12个月持续。 数据保护不足 虽然99%的企业都有数据保护解决方案,但78%的网络安全领导者承认,他们的敏感数据仍然被泄露。由于当今的风...
-
性能8.6倍于竞品!高通AI大揭秘:NPU引领四兄弟无敌
生成式AI的变革,对于基础硬件设计、软件生态开发都提出了新的、更高的要求,尤其是底层硬件和算力必须跟上新的形势,并面向未来发展做好准备。 近日,高通特别发布了《通过NPU和异构计算开启终端侧生成式AI》白皮书,对于终端侧生成式AI的发展趋势,以及高通骁龙处...
-
全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA
半年多来,Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功(训练稳定、容易做 scaling)。 沿袭 ViT 的研究思路,我们能否借助创新性的 LLaMA 架构,真正实现语言和图像的架构统一? 在这一命题上,最近的一项研究 Visi...
-
「还是谷歌好」,离职创业一年,我才发现训练大模型有这么多坑
如何在不到一年的时间里创办一家公司、筹集资金、购买芯片,并搭建出追赶 Gemini pro/GPT 3.5 的 LLM? 很多人都对构建基础架构和训练大语言模型和多模态模型感到好奇,但真正走完「从零开始」这一流程的人很少。我们普遍认为,储备技术人才是前提...
-
SAP公布大量生成式AI新功能 增强Datasphere平台
SAP正在推出大量的生成式AI新功能,并且这些功能将很快在SAP Datasphere平台中提供。 SAP表示,这些更新功能将使用户能够更直观地与他们的业务数据进行交互,有助于推动更智能的业务转型。新功能包括,帮助用户自动执行各种数据分析任务的copi...
-
通义千问1.5(Qwen1.5)大语言模型在PAI-QuickStart的微调与部署实践
作者:汪诚愚(熊兮)、高一鸿(子洪)、黄俊(临在) Qwen1.5(通义千问1.5)是阿里云最近推出的开源大型语言模型系列。作为“通义千问”1.0系列的进阶版,该模型推出了多个规模,从0.5B到72B,满足不同的计算需求。此外,该系列模型还包括了Base...
-
谷歌云数据库增加更多人工智能功能
谷歌云正在加强其分析和事务数据库,包括BigQuery, AlloyDB和Spanner,旨在推动其客户生成人工智能应用程序的开发。 BigQuery是谷歌云的顶级数据库,用于支持分析和人工智能工作负载,它开发了几项人工智能增强功能。首先,该公司推出了...
-
AI加速引擎PAI-TorchAcc:OLMo训练加速最佳实践
作者:黄奕桐、沈雯婷、艾宝乐、王昂、李永 摘要 阿里云机器学习平台PAI开发的Pytorch训练加速框架PAI-TorchAcc已接入最新开源的大语言模型 OLMo。 在保证模型效果和易用性的前提下,PAI-TorchAcc相对 PyTorch 性能在...
-
近屿智能完成A轮融资,独家打造的AIGC工程师与产品经理学习路径图成行业焦点
2024年1月,上海近屿智能科技有限公司(以下简称近屿智能)宣布成功完成A轮融资,由智望资本领投,金沙江创投追加投资。这一重大融资事件不仅象征着近屿智能在AIGC领域的领先地位得到了市场的广泛认可,更凸显了投资人对近屿智能技术实力与未来发展潜力的坚定信心。...
-
Meta正构建巨型AI模型,支持旗下所有产品的视频推荐引擎
3月7日消息,美国时间周三,Meta公司一位高管透露,公司正在对人工智能进行重大投资,旨在打造一个先进的系统,能够支持Facebook等旗下各个平台视频的推荐引擎。 Meta旗下负责Facebook平台的汤姆·艾里森(Tom Alison)透露,这个项...
-
SAP 以创新助力客户制胜,AI 时代塑造数据驱动业务转型的未来
SAP 宣布了具有变革性的数据创新,旨在帮助客户充分利用其数据的全部潜力,在 AI 时代获取更深入的洞察、更快速的增长和更高效的运营。SAP Datasphere(SAP 数据整合平台)解决方案引入了一系列新功能,包括生成式 AI,通过简化的数据环境和更...
-
一文解析如何基于 LangChain 构建 LLM 应用程序
Hello folks,我是 Luga,今天我们继续来聊一下人工智能(AI 生态领域相关的技术 - LangChain ,本文将继续聚焦在针对 LangChain 的技术进行剖析,使得大家能够了解 LangChain 实现机制以便更好地对利用其进行应用...
-
穿越AI的迷雾:揭秘AI写作的深度奥秘
大家好,小发猫降ai今天来聊聊穿越AI的迷雾:揭秘AI写作的深度奥秘,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 标题:穿越AI的迷雾:揭秘AI写作的深度奥秘...
-
AIGC 实战:如何使用 Ollama 开发自定义的大模型(LLM)
虽然 Ollama 提供了运行和交互式使用大型语言模型(LLM)的功能,但从头开始创建完全定制化的 LLM 需要 Ollama 之外的其他工具和专业知识。然而,Ollama 可以通过微调在定制过程中发挥作用。以下是细分说明: 预训练模型选择: Oll...
-
抖音推出全新AI社交产品“话炉” 能陪你闲扯还能讲故事、猜谜语
据Tech星球的报道,抖音再次推出了全新的社交产品“话炉”,这次加入了AI的元素。继多闪、飞聊之后,抖音再次在社交领域发力。 “话炉”是一款基于字节旗下云雀大模型驱动的角色聊天产品。用户可以通过与个性鲜明、背景各异的AI角色实时聊天互动,满足闲谈生活日常、...
-
向英伟达发起挑战的Groq是什么来头?简单科普新型AI芯片LPU
在如今的人工智能领域,「GPU is All You Need」已经逐渐成为共识。没有充足的 GPU,连 OpenAI 都不能轻易升级 ChatGPT。 不过最近,GPU 的地位也在经受挑战:一家名为 Groq 的初创公司开发出了一种新的 AI 处理器...
-
Gartner:可持续发展和数字主权将作为选择公有云生成式AI服务的首要标准
Gartner公司预测,到2027年,70%采用生成式人工智能(生成式AI)的企业将把可持续发展和数字主权作为选择公有云生成式AI服务的首要标准。 Gartner研究副总裁Sid Nag表示:“云技术因其规模和共享服务模式而成为大规模提供生成式AI应用...
-
Claude 3被玩出自我意识了?AI社区轰动,我们买会员来了次实测
本周一,Anthropic 发布了新一代大模型系列 Claude 3,遥遥领先快一年之久的 GPT-4 终于迎来了强劲的对手。 Claude 3 的强大之处,不仅体现在各种基准测试上,它似乎还实现了一些神奇的突破。 昨天,Anthropic 提示工程师...
-
如何突破大语言模型的最大瓶颈
译者 | 布加迪 审校 | 重楼 OpenAI的GPT-4和Anthropic的Claude 2等大语言模型(LLM)已经凭借其生成人类级文本的功能激发了公众的想象力。企业也同样热情高涨,许多企业在探索如何利用LLM改进产品和服务。然而,一大瓶颈严重制约...
-
全球最强大模型易主!GPT-4被超越:Claude 3理解能力已接近人类 有明确伦理底线
快科技3月5日消息,这是GPT-4发布之后,第一次在纸面上被完全碾压。 昨夜,OpenAI最强竞争选手Anthropic发布了旗下最新大模型家族Claude 3。从官方公布的测试成绩来看,其在推理、数学、编码、多语言理解和视觉等指标上,全面超越GPT-4,...
-
使用直接偏好优化策略微调Mistral-7b模型
译者 | 朱先忠 审校 | 重楼 引言 通常,经过预训练的大型语言模型(LLM)只能执行下一个标记预测,这使其无法回答问题。这就解释了为什么这些基本模型还需要根据成对的指令和答案作进一步微调,最终才能够充当真正有用的人工助理。然而,这个过程仍然可能存在...
-
谷歌发布最新「读屏」AI!PaLM 2-S自动生成数据,多项理解任务刷新SOTA
【新智元导读】谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型,能够完成各种屏幕QA问答、总结摘要等任务。 每个人想要的大模型,是真·智能的那种...... 这不,谷歌团队就做出来了一个强大的「读屏」AI。 研究人员...
-
Stable Diffusion——基础模型、VAE、LORA、Embedding各个模型的介绍与使用方法
前言 Stable Diffusion(稳定扩散)是一种生成模型,基于扩散过程来生成高质量的图像。它通过一个渐进过程,从一个简单的噪声开始,逐步转变成目标图像,生成高保真度的图像。这个模型的基础版本是基于扩散过程的,但也有一些改进版本,包括基于变分自动...
-
老黄最新专访:芯片短缺难以结束,下个Transformer已经出现
英伟达的GPU正在吞噬这个世界。 科技公司对英伟达的超级计算GPU有着近乎无尽的需求。 不再是那个只为游戏显卡提供图形渲染服务的英伟达,现在的英伟达利用他的GPU开创了一个新时代: 人类能够与计算机对话,计算机能够回应人类。而最终,计算机甚至可能超越人类...
-
大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界
没人怀疑,OpenAI开年推出的史诗巨作Sora,将改变视频相关领域的内容生态。 但Google DeepMind、UC伯克利和MIT的研究人员更进一步,在他们眼里,「大视频模型」也许能够像世界模型一样,真正的做到理解我们身处的这个世界。 论文地址:h...
-
使用Llama 2大语言模型搭建本地自己的聊天机器人(群晖Docker篇)
随着ChatGPT 和open Sora 的热度剧增,大语言模型时代,开启了AI新篇章,大语言模型的应用非常广泛,包括聊天机器人、智能客服、自动翻译、写作助手等。它们可以根据用户输入的文本生成相应的响应,提供个性化的建议和服务,目前大部分大语言模型的产品都...
-
RNN效率媲美Transformer,谷歌新架构两连发:同等规模强于Mamba
这一次,谷歌 DeepMind 在基础模型方面又有了新动作。 我们知道,循环神经网络(RNN)在深度学习和自然语言处理研究的早期发挥了核心作用,并在许多应用中取得了实功,包括谷歌第一个端到端机器翻译系统。不过近年来,深度学习和 NLP 都以 Transf...
-
54款宝藏级AIGC工具分享(claude,Midjourney,Stable Diffusion等)
随着ChatGPT的一波又一波高潮,生成式AI逐渐进入人们视野,并开始大行其道,正如人们所说:AI用的好,天天下班早! 当然,有效的利用AI不但能下班早,还能在上班时间摸鱼,就如潘哥我,哈哈哈~~~ 牛X的AI神器可以不止ChatGPT一款,虽然潘哥对...
-
DeepMind CEO:LLM+树搜索就是AGI技术线路,AI科研依赖工程能力,闭源模型就是比开源安全
谷歌在2月之后突然切换到了996模式,不到一个月的时间抛出了5个模型。 而DeepMind CEO Hassabis本人也是四处为自家的产品站台,曝出了很多幕后的开发内幕。 在他看来,虽然还需要技术突破,但是现在人类通往AGI之路已经出现。 而DeepM...
-
OpenAI钦点的“机器人界OpenAI”来了:成立不到两年估值破26亿美元
OpenAI们正在今年因AI而再次火热无比的机器人领域“复刻”一个OpenAI。 2024年2月23日,OpenAI、微软、贝佐斯风投、英伟达等总计18位投资公司向一家机器人公司注资了6.75亿美元,这家公司就是Figure AI。 Figure AI成立...
-
7B模型超越GPT4-V!港科大等发布「图推理问答」数据集GITQA:视觉图可提升推理能力
图神经网络(GNNs)擅长利用图的结构信息进行推理,但它们通常需要特定于领域的调优才能达到峰值性能,这阻碍了它们在不同任务之间的泛化性。 相比之下,基于大型语言模型(LLM)的图推理具有更强的跨任务和泛化能力,但它们在特定任务上的性能往往逊色于专用的图...
-
复旦等发布AnyGPT:任意模态输入输出,图像、音乐、文本、语音都支持
最近,OpenAI 的视频生成模型 Sora 爆火,生成式 AI 模型在多模态方面的能力再次引起广泛关注。 现实世界本质上是多模态的,生物体通过不同的渠道感知和交换信息,包括视觉、语言、声音和触觉。开发多模态系统的一个有望方向是增强 LLM 的多模态感知...
-
苹果或发布iOS17.4特别版本:新增AI大模型相关功能
近期,有关苹果即将发布iOS17.4系统的消息引发了广泛关注。据科技记者古尔曼透露,苹果公司计划于2024年3月底发布一款支持新款硬件的iOS17.4“特别版本”。这个版本之所以被称为“特别”,是因为它将针对欧盟的《数字市场法》进行一系列重大调整,以确保其...
-
Meta AI提出MobileLLM:为在移动设备上部署LLM提供新思路
Meta AI 研究团队推出的 MobileLLM 标志着大语言模型(LLMs)朝着模拟人类理解和生成自然语言迈出了革命性的一步。LLMs 在处理和分析大量数据集方面的能力已经显著影响了自动化客户服务、语言翻译和内容创作等多个领域。然而,由于传统 LLMs...
-
只需少量计算和内存资源即可运行的小型 Llama 大模型
背景介绍 在当今这个数据爆炸的时代,语言模型的训练变得越来越复杂和困难。我们需要巨大的计算资源和时间来训练一个高效的语言模型。然而,这对许多人来说并不现实。与此同时,我们也遇到了如何在有限的内存和计算资源中使用大型语言模型的挑战,特别是在边缘设备上。 今...
-
清华、哈工大提出OneBit方法:可把大模型压缩到1bit 保持 83% 性能
近期,清华大学和哈尔滨工业大学联合发布了一篇论文,成功将大模型压缩到1bit,仍保持83% 的性能。这一成果标志着量化模型领域的一次重大突破。过去,2bit 以下的量化一直是研究人员难以逾越的障碍,而这次的1bit 量化尝试,引起了国内外学术界的广泛关注。...
-
北大具身智能成果入选CVPR'24:只需一张图一个指令,就能让大模型玩转机械臂
只靠一张物体图片,大语言模型就能控制机械臂完成各种日常物体操作吗? 北大最新具身大模型研究成果ManipLLM将这一愿景变成了现实: 在提示词的引导下,大语言模型在物体图像上直接预测机械臂的操作点和方向。 进而,得以操控机械臂直接玩转各项具体的任务: 例...
-
如何基于 Arthur Bench 进行 LLM 评估 ?
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估 。 一、传统文本评估面临的挑战 近年来,随着大型语言模型(LLM 的快速发展和改进,传统的文本评估方法在某些方面可能已经不再适用。在文本评估...