-
探索AIGC未来:CPU源码优化、多GPU编程与中国算力瓶颈与发展
★人工智能;大数据技术;AIGC;Turbo;DALL·E 3;多模态大模型;MLLM;LLM;Agent;Llama2;国产GPU芯片;GPU;CPU;高性能计算机;边缘计算;大模型显存占用;5G;深度学习;A100;H100;A800;H800;L40...
-
谷歌AI通过图灵测试,大模型医生来了?GPT-4竟诊断出难倒17个医生的怪病
【新智元导读】AI在医疗领域再次发光!谷歌DeepMind团队发布的全新诊断对话式AI在测试中击败医生,通过了图灵测试,再次引领医疗AI的革命。 我们需要研发对人类有益AGI的原因之一: OpenAI联创Greg Brockman的一番话点明,当前先进A...
-
大模型应用实践:AIGC探索之旅
随着OpenAI推出ChatGPT,AIGC迎来了前所未有的发展机遇。大模型技术已经不仅仅是技术趋势,而是深刻地塑造着我们交流、工作和思考的方式。 本文介绍了笔者理解的大模型和AIGC的密切联系,从历史沿革到实际应用案例,再到面临的技术挑战和伦理监管问题...
-
国内多所高校共建开源社区LAMM,加入多模态语言模型大家庭的时候到了
ChatGPT问世以来,大语言模型(LLM)实现了跳跃式发展,基于自然语言进行人机交互的AI范式得到广泛运用。然而,人类与世界的交互中不仅有文本,其他诸如图片、深度等模态也同样重要。然而,目前的多模态大语言模型(MLLM)研究大多数闭源,对高校和大多数研...
-
海外骗子用 AI 合成泰勒・斯威夫特声音,伪造“厨具免费送”广告行骗
1 月 10 日消息,据《纽约时报》当地时间周二报道,最近几周在 Facebook 等平台陆续出现了美国著名歌手泰勒・斯威夫特的“代言广告”:她在这则广告中“宣布”将会为粉丝免费送出 Le Creuset 品牌的厨具套装,人们只需要点击一个按钮并回答...
-
哪些技术可能会在2024年重塑企业?
过去的2023年,见证了技术的快速发展,这些技术极大地改变了全球政府、公共部门、企业,甚至公众的生活。趋势表明,大型语言模型、元宇宙和生成人工智能中绿色数据中心的采用激增,这成为了人们谈论的话题,并且似乎仍然是人们关注的焦点。现在,更大的问题是,哪些技...
-
大模型恋爱神器!16种MBTI自由定制,北大ChatLaw团队出品
北大团队新作,让大模型拥有个性! 而且还是自定义那种,16种MBTI都能选。 图源备注:图片由AI生成,图片授权服务商Midjourney 这样一来,即便是同一个大模型,不同性格下的回答都不一样。 比如提问:你周末喜欢干什么? 这样能干啥呢?北大的童...
-
AIGC: 关于ChatGPT这个智能工具带来的几点思考
ChatGPT的出现 2022年11月底,ChatGPT 上线,引爆 AI 圈 和 科技圈,2023年春节后, 人人都开始关注并讨论这项新技术 它是 OpenAI 研发的智能聊天工具, 基于GPT语言模型,模拟人类的对话方式 默认只能用文字进行交互,...
-
使用CLIP和LLM构建多模态RAG系统
在本文中我们将探讨使用开源大型语言多模态模型(Large Language Multi-Modal 构建检索增强生成(RAG 系统。本文的重点是在不依赖LangChain或LLlama index的情况下实现这一目标,这样可以避免更多的框架依赖。 什么...
-
继copilot之后,又一款免费帮你写代码的插件
继copilot之后,又一款免费帮你写代码的插件 写在前面 一、CodeGeex简介 二、插件安装 三、帮你写代码 四、帮你添加注释 五、帮你翻译成其他语言 六 小结 写在前面 在之前的文章中推荐过一款你写注释,它就能帮你写代码的...
-
打破信息差!一款让人惊艳的大模型3D可视化工具!
近日,一位来自新西兰的小哥Brendan Bycroft在技术圈掀起了一股热潮。他创作的一项名为大模型3D可视化的项目,不仅登上了Hacker News的榜首,而且其震撼的效果更是让人瞠目结舌。通过这个项目,你将在短短几秒钟内完全理解LLM(Large...
-
一文讲清大模型AI应用架构
本文转载自微信公众号「 产品二姐」,作者产品二姐。转载本文请联系产品二姐公众号。 如果说 2023 年是大模型大爆发的一年,这一年的机会主要给了大厂或者拿到大笔融资的创业者;那么 2024 年将是 AI 应用大爆发的一年,也意味着普通人有更多的机会加入这...
-
为AI而生的超级芯片,会将云端算力遣返回企业本地吗?
近年来,IT部门对于企业采取的“一切尽在云端”做法感到失望,这已经不是什么秘密了。但总的来说,他们并没有采取任何措施加以改进或扭转。因为大多数人认为,企业可以从云计算的可扩展性和更高效率中得到好处。 那么,这种情况会在2024年或2025年发生变化吗?...
-
教育部公示中小学人工智能教育基地名单,北京宏志中学等 184 个入选
1 月 11 日消息,教育部基础教育司消息,根据《教育部办公厅关于开展中小学人工智能教育基地推荐工作的通知》(教基厅函〔2023〕29 号)要求,各省级教育行政部门共推荐 184 个中小学人工智能教育基地,现将名单予以公示。公示期为 2024 年 1...
-
LLaMA-v2-Chat vs. Alpaca:应该在什么时候使用不同的人工智能模型?
译者 | 李睿 审校 | 重楼 如今,大型语言模型(LLM)正在彻底改变人们的工作和生活,从语言生成到图像字幕软件,再到友好的聊天机器人。这些人工智能模型为解决现实世界的问题提供了强大的工具,例如生成聊天响应或遵循复杂的指令。在这篇关于LLaMA v2的...
-
LexisNexis 迎接生成式人工智能挑战
正在寻找抵御生成式人工智能破坏性威胁的突破口的 IT 领导者可能会从身为 LexisNexis 执行副总裁兼 CTO 的 Jeff Reihl 的建议中获益:快速采用该技术,以领先于潜在的破坏者。 Reih 指出,自 20 世纪 70 年代初成立以来,L...
-
大语言模型漏洞缓解指南
虽然大语言模型(LLM 应用正在全球快速普及,但企业对大语言模型的威胁态势仍然缺乏全面了解。面对大语言模型风险的不确定性,企业希望在保障其安全性的基础上加快 应用脚步,用人工智能提升企业核心竞争力,这意味着企业的CISO面临着理解和应对新兴人工智能威胁...
-
AIGC:阿里开源大模型通义千问部署与实战
1 引言 通义千问-7B(Qwen-7B)是阿里云研发的通义千问大模型系列的70亿参数规模的模型。Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代...
-
AIGC之论文笔记DALL-E
文章目录 Zero-Shot Text-to-Image Generation 一. 简介 二. 方法 2.1. 第一阶段:Learning the visual codebook 2.1.1 回顾VQ-VAE 2.1.2...
-
为什么人工智能如此需要资源?
截至2023年底,任何关于生成式人工智能需要多少能源的预测都是不准确的。 头条新闻倾向于猜测“人工智能需要5倍、10倍、30倍的电力”和“足够运行10万个家庭的电力”等。与此同时,数据中心新闻等专业出版物的报道称,功率密度将上升到每机架50千瓦或100千...
-
再薅!Pika全球开放使用;字节版GPTs免费不限量;大模型应用知识地图;MoE深度好文;2024年AIGC发展轨迹;李飞飞最新自传 | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 终于!AI视频生成平台 Pika 面向所有用户开放网页端 https://twitter.com/pika_labs Pika...
-
快GPT-4 10倍!这款卖疯的AI Agent产品,撼动大模型!
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 现在的大型语言模型(LLM)就像牙膏一样鸡贼,你必须非常用力地挤压(正确地提示)才能得到适量的牙膏(答案)。 就像奥特曼形容现在的GPT4一样:“如果你问 GPT-4 大部分...
-
AI机器人席卷CES!OpenAI暗自解除ChatGPT这项限制,天网来了?
【新智元导读】CES2024上,各路机器人又是做咖啡拉花,又是给人按摩,让人大开眼界。然而就在这时,网友却惊讶地发现,OpenAI竟然悄悄删除了ChatGPT用于*和战争的限制! 前一阵的斯坦福「炒虾机器人」,让无数人感慨:2024年怕不是要成为机器人元年...
-
小红书搜索团队提出全新框架:验证负样本对大模型蒸馏的价值
大语言模型(LLMs)在各种推理任务上表现优异,但其黑盒属性和庞大参数量阻碍了它在实践中的广泛应用。特别是在处理复杂的数学问题时,LLMs 有时会产生错误的推理链。传统研究方法仅从正样本中迁移知识,而忽略了那些带有错误答案的合成数据。 在 AAAI 2...
-
LLMs模型速览(GPTs、LaMDA、GLM/ChatGLM、PaLM/Flan-PaLM、BLOOM、LLaMA、Alpaca)
文章目录 一、 GPT系列 1.1 GPTs(OpenAI,2018——2020) 1.2 InstructGPT(2022-3) 1.2.1 算法 1.2.2 损失函数 1.3 ChatGPT(2022.11.30) 1.4 ChatG...
-
【腾讯云HAI】都2023年了,HAI没玩过AIGC?
:::info 腾讯云高性能应用服务(Hyper Application lnventor,HA ,是一款面向 Al、科学计算的 GPU 应用服务产品,为开发者量身打造的澎湃算力平台。无需复杂配置,便可享受即开即用的GPU云服务体验。在 HA] 中,根据应...
-
AIGC:【LLM(七)】——Baichuan2:真开源可商用的中文大模型
文章目录 一.模型介绍 二.模型部署 2.1 CPU部署 2.2 GPU部署 三.模型推理 3.1 Chat 模型推理 3.2 Base 模型推理 四.模型量化 4.1 量化方法 4.2 在线量化 4.3 离线量化 4.4 量化效果...
-
【AIGC工具】我找到了使用大模型问答的最短路径!
大家好,我是豆小匠~ 好久没介绍提高效率的工具啦,这次来介绍一个UTools的骚操作,可以极速打开LLM进行提问! 完成后的效果是: 快捷键调出输入框;2. 输入问题;3. 选择模型;4. 回车提问 这个流程可以大大减少软件切换,打开网站等操作造...
-
AIGC在趣丸科技广告素材场景下赋能业务的探索实践
AIGC 兴起,在各行各业得到应用。广告作为用户增长的有效手段,经久不衰,日益增长的广告创意素材素材需求与设计师人工制作素材产能不足的矛盾问题凸显,AIGC 技术的应用能够在多模态素材上发挥作用,为广告投放业务赋能。 趣丸科技资深研发工程师 阮陈贵 ...
-
Jetson Orin安装riva以及llamaspeak,使用 Riva ASR/TTS 与 Llama 进行实时交谈,大语言模型成功运行笔记
NVIDIA 的综合语音 AI 工具包 RIVA 可以处理这种情况。此外,RIVA 可以构建应用程序,在本地设备(如 NVIDIA Jetson)上处理所有这些内容。 RIVA 是一个综合性库,包括: 自动语音识别 (ASR) 文本转语音合成 (TT...
-
四行代码让大模型上下文暴增3倍,羊驼Mistral都适用
无需微调,只要四行代码就能让大模型窗口长度暴增,最高可增加3倍! 而且是“即插即用”,理论上可以适配任意大模型,目前已在Mistral和Llama2上试验成功。 有了这项技术,大模型(LargeLM)就能摇身一变,成为LongLM。 近日,来自得克萨斯农...
-
分析师:苹果计划在今年6月的WWDC 2024上发布一系列生成式AI工具
1月8日消息,据外媒报道,一位长期关注苹果的分析师表示,苹果计划在2024年6月份举办的WWDC(WWDC 2024)大会上发布一系列基于生成式人工智能(AI)的工具,包括改进版的Siri,这些新工具将是iOS 18的关键部分,代表着苹果人工智能能力的重大...
-
2024年大数据行业预测(二)
大数据 数字化转型投资将成为2024年首席信息官议程上的优先事项,特别是在通货膨胀不断上升的情况下,因为这将允许更大的风险管理、降低成本和改善客户体验。此外,根据我们今年看到的趋势,在生成人工智能方面也会有持续的投资。在评估我们最初的业务需求和目标时,...
-
在灾难推文分析场景上比较用 LoRA 微调 Roberta、Llama 2 和 Mistral 的过程及表现
引言 自然语言处理 (NLP 领域的进展日新月异,你方唱罢我登场。因此,在实际场景中,针对特定的任务,我们经常需要对不同的语言模型进行比较,以寻找最适合的模型。本文主要比较 3 个模型: RoBERTa、Mistral-7B 及 Llama-2...
-
400万token上下文、推理再加速46%!最新开源方案升级MIT成果,推理成本再降低
22倍加速还不够,再来提升46%,而且方法直接开源! 这就是开源社区改进MIT爆火项目StreamingLLM的最新成果。 StreamingLLM可以在不牺牲生成效果、推理速度的前提下,实现多轮对话共400万个token,22.2倍推理速度提升。 该项...
-
大模型无限流式输入推理飙升46%!国产开源加速「全家桶」,打破多轮对话长度限制
在大型语言模型(LLM)的世界中,处理多轮对话一直是一个挑战。前不久麻省理工Guangxuan Xiao等人推出的StreamingLLM,能够在不牺牲推理速度和生成效果的前提下,可实现多轮对话总共400万个token的流式输入,22.2倍的推理速度提升...
-
微软祭出代码大模型WaveCoder!四项代码任务两万个实例数据集,让LLM泛化能力飙升
用高质量数据集进行指令调优,能让大模型性能快速提升。 对此,微软研究团队训练了一个CodeOcean数据集,包含了2万个指令实例的数据集,以及4个通用代码相关任务。 与此同时,研究人员微调了一个代码大模型WaveCoder。 论文地址:https://...
-
法国一公司发布全球首款 AI 智能镜子:可识别用户情绪、缓解压力
1 月 8 日消息,在 CES 2024 期间,法国一家名为 Baracoda 的智慧健康科技公司发布了全球首款 AI 智能镜子 BMind,按照官方的说法,这是一款专为心理健康而设计,能够识别情绪、帮助管理压力的“健康伴侣”。 BMind 由生成式...
-
2024年大数据行业预测(四)
生成式人工智能将很快从膨胀预期的顶峰走向幻灭的低谷。委婉点,即现在有很多关于生成式人工智能的炒作。然而,所有这些炒作意味着,对于某些组织来讲,采用这项技术更多的是为了“跟上潮流”,而不是因为其是组织试图解决的特定问题的最佳解决方案。因此,我们很可能会看...
-
吃了几个原作者才能生成这么逼真的效果?文生图涉嫌视觉「抄袭」
不久之前,《纽约时报》指控 OpenAI 涉嫌违规使用其内容用于人工智能开发的事件引起了社区极大的关注与讨论。 GPT-4 输出的许多回答中,几乎逐字逐句地抄袭了《纽约时报》的报道: 图中红字是 GPT-4 与《纽约时报》报道重复的部分。 对此,各个专...
-
2024年大数据行业预测(三)
深度学习 深度伪造危险:2024年将出现一系列消费者应警惕的深度伪造危险,尤其是在虚拟客户服务环境中。身份和验证(ID&V 是大多数行业的标准做法,在这些行业中建立了客户身份和交易权。然而,如果客户生成虚假图像,暗示某企业的产品被用来犯罪,深度...
-
研究表明,2024年将是“AI眼镜”市场元年
虽然苹果的Vision Pro头显预计将于2024年第一季度上市,但行业专家预测,AI眼镜将成为2024年科技行业关注的热点。 让用户更加舒适地进行互动的AI眼镜将成为今年最热门的科技产品。事实上,已经有很多围绕AI眼镜市场领导者Meta推出AI 眼镜...
-
LLMs之RAG:LangChain-Chatchat(一款中文友好的全流程本地知识库问答应用)的简介(支持 FastChat 接入的ChatGLM-2/LLaMA-2等多款主流LLMs+多款embe
LLMs之RAG:LangChain-Chatchat(一款中文友好的全流程本地知识库问答应用 的简介(支持 FastChat 接入的ChatGLM-2/LLaMA-2等多款主流LLMs+多款embedding模型m3e等+多种TextSplitter分词...
-
轻量级模型,重量级性能,TinyLlama、LiteLlama小模型火起来了
当大家都在研究大模型(LLM)参数规模达到百亿甚至千亿级别的同时,小巧且兼具高性能的小模型开始受到研究者的关注。 小模型在边缘设备上有着广泛的应用,如智能手机、物联网设备和嵌入式系统,这些边缘设备通常具有有限的计算能力和存储空间,它们无法有效地运行大型语...
-
专为数据库打造:DB-GPT用私有化LLM技术定义数据库下一代交互方式
2023 年 6 月,蚂蚁集团发起了数据库领域的大模型框架 DB-GPT。DB-GPT 通过融合先进的大模型和数据库技术,能够系统化打造企业级智能知识库、自动生成商业智能(BI)报告分析系统(GBI),以及处理日常数据和报表生成等多元化应用场景。DB-G...
-
2024年大数据行业预测(一)
分析 随着全渠道商务的发展,广告分析领域将发生翻天覆地的变化。线上和线下消费者互动之间的传统孤岛正在瓦解,为真正的全渠道消费者铺平了道路。虽然实体/数字围墙在消费者的旅程中逐渐倒塌,但围墙花园和消费者隐私问题仍将凸显,使分析变得复杂。全渠道消费者的增长...
-
构建优秀LLM应用的四大要点,你找到哪点?
这些建议可提高LLM应用的准确率,还包含如何选择合适LLM的注意事项。 译自4 Key Tips for Building Better LLM-Powered Apps,作者 Adrien Treuille 是 Snowflake 的产品管理总监和 S...
-
【stable diffusion LORA训练】改进lora-scripts,命令行方式训练LORA,支持SDXL训练
分享下自己改进的一个lora训练脚本,在ubuntu下如果SD-WEBUI的环境已经搭好的话,只需要下载lora-script就可以支持训练了,直接命令行方式训练。 首先,我们需要克隆下项目: git clone https://github.com/...
-
评论送书:AIGC、AGI、GhatGPT、人工智能大模型必读书单
2023年是人工智能大语言模型大爆发的一年,一些概念和英文缩写也在这一年里集中出现,很容易混淆,甚至把人搞懵。 LLM:Large Language Model,即大语言模型,旨在理解和生成人类语言。LLM的特点是规模庞大,包含成百、上千亿的参数,可...
-
Llama~transformers搭建
本例从零开始基于transformers库逐模块搭建和解读Llama模型源码(中文可以翻译成羊驼 。 并且训练它来实现一个有趣的实例:两数之和。 输入输出类似如下: 输入:"12345+54321=" 输出:"66666" 我们把这个任务当做一个...