-
CodeOps:使用LLM和模块化编码加快开发进程
译者 | 布加迪 审校 | 重楼 2009年,DevOps(开发运维)作为一种运维模型而出现,适用于想要充分发挥敏捷软件开发方法潜力的团队。它使这些团队能够尽快地构建和部署,为快速、迭代的开发建立一种新的范式。 随之而来的是全球软件开发的爆炸式增长,D...
-
用通俗易懂的方式讲解:Stable Diffusion WebUI 从零基础到入门
本文主要介绍 Stable Diffusion WebUI 的实际操作方法,涵盖prompt推导、lora模型、vae模型和controlNet应用等内容,并给出了可操作的文生图、图生图实战示例。适合对Stable Diffusion感兴趣,但又对Stab...
-
ChatGPT可以帮你戒烟了!
除了找到治疗疾病的方法,人工智能现在也是帮助你戒烟的伙伴。Quitbot是一款基于LLM的聊天机器人,由Fred Hutch癌症研究中心研究团队联合微软的AI for Good合作开发。这个免费的移动应用程序,将经过科学验证的戒烟计划与ChatGPT集成...
-
AI女友陪聊月入20+万元!社交账号光发“假图”吸粉2万
AI虚拟女友究竟能带来多少实际产出? 来自英国的一家AI公司给出了最新数字: 什么概念? 根据官方统计,美国人2023年平均年薪为59428美元,平均月薪为4952美元。 这相当于,AI女友一个月就能赚人家半年工资。 有网友看完感叹道: 一年就是36万美...
-
大模型推理速度飙升3.6倍,「美杜莎」论文来了,贾扬清:最优雅加速推理方案之一
如你我所知,在大型语言模型(LLM)的运行逻辑中,随着规模大小的增加,语言生成的质量会随着提高。不过,这也导致了推理延迟的增加,从而对实际应用构成了重大挑战。 从系统角度来看,LLM 推理主要受内存限制,主要延迟瓶颈源于加速器的内存带宽而非算术计算。这一...
-
MIT和谷歌提出新AI框架Health-LLM:利用可穿戴传感器数据为健康预测任务调整LLM
近日,MIT和Google的研究人员共同提出了一种名为Health-LLM的新型人工智能框架,旨在将大语言模型(LLMs)应用于健康预测任务,利用可穿戴传感器的数据。该框架的提出标志着健康领域在可穿戴技术和人工智能的交叉点上取得了重大突破。 可穿戴传感器技...
-
使用SPIN技术对LLM进行自我博弈微调训练
2024年是大型语言模型(llm 的快速发展的一年,对于大语言模型的训练一个重要的方法是对齐方法,它包括使用人类样本的监督微调(SFT 和依赖人类偏好的人类反馈强化学习(RLHF 。这些方法在llm中发挥了至关重要的作用,但是对齐方法对人工注释数据有的大...
-
微软组建GenAI团队,专注于构建更小、更便宜的人工智能模型
据The Information报道,微软正在组建一个名为GenAI的团队,该团队的目标是开发更小、更便宜的人工智能模型。这些模型将专注于语言模型,类似于OpenAI的GPT-4等大型语言模型(LLM),但它们将使用更少的计算资源。 图源备注:图片由AI...
-
万字总结 | 2023大模型与自动驾驶论文走马观花
本文经自动驾驶之心公众号授权转载,转载请联系出处。 2023年已经匆匆过去大半,不知各位自动驾驶小伙伴今年的工作生活情况是否顺利呢?高阶ADAS方案量产了吗?新的文章和实验进展又是否顺利呢?今天给大家总结了2023年前后的一些自动驾驶结合大模型的开创性...
-
业内:过去数月老款AI芯片降价,大模型培训成本降60%
1月24日消息,众所周知,开发大语言模型(LLM)成本高昂。这不仅包括模型本身的研发,还有在云端运行这些模型的费用。以人工智能初创公司Anthropic为例,云端运行模型的成本几乎占了该公司上个月收入的一半以上,这还未算上训练模型的成本。 然而,最近的...
-
北京国际电影节AIGC电影单元;提示工程最佳实践;手把手教你构建基于RAG的LLM应用;多伦多大学AI对齐最新课程;国产大模型行研能力测评 | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? Runway AIFF 2024 | 第二届AI电影节,作品提交进入50天倒计时 https://aiff.runwayml.com...
-
三星S24手机搭载AI模型:AI大模型应用越来越广泛
手机厂商纷纷投入AI大模型的研发,标志着2018年进入快速发展阶段。预计到2027年,AI手机市场占比将达到45%,这一趋势源自智能手机行业对新技术的积极响应,尤其是生成式人工智能(GenAI)的迅猛发展。 目前,国内厂商已经推出了一系列与AI相关的硬件...
-
LLM之RAG实战(十六)| 使用Llama-2、PgVector和LlamaIndex构建LLM Rag Pipeline
近年来,大型语言模型(LLM)取得了显著的进步,然而大模型缺点之一是幻觉问题,即“一本正经的胡说八道”。其中RAG(Retrieval Augmented Generation,检索增强生成)是解决幻觉比较有效的方法。本文,我们将深入研究使用...
-
DeepSeek 发布全新开源大模型,数学推理能力超越 LLaMA-2
自从 LLaMA 被提出以来,开源大型语言模型(LLM)的快速发展就引起了广泛研究关注,随后的一些研究就主要集中于训练固定大小和高质量的模型,但这往往忽略了对 LLM 缩放规律的深入探索。 开源 LLM 的缩放研究可以促使 LLM 提高性能和拓展应用领域...
-
Chinese-llama-2部署踩坑记录
Chinese-llama-2部署踩坑记录 1. Chinese-LLaMA-Alpaca-2 A. 部署 a. inference_with_transformers_zh b. text generation webui_zh c. a...
-
Llama 2- Open Foundation and Fine-Tuned Chat Models<3>
3.4 RLHF 结果 3.4.1 基于模型的评估 评估LLMs是一个具有挑战性的开放研究问题。人类评估虽然是黄金标准,但可能会因各种 HCI 考虑因素而变得复杂(Clark 等人,2021;Gehrmann 等人,2023),并且并不总是可扩展的...
-
狂卷大模型!Canalys预测:2027年AI手机市场份额将达45%
快科技1月23日消息,据市场调研机构Canalys预测,到2027年,AI手机市场份额将达到45%。这一预测基于智能手机行业对新技术趋势的响应,特别是生成式人工智能(GenAI)的快速发展。 目前,不少手机厂商已经发布了AI相关的大模型和操作系统,并在新产...
-
AIGC介绍篇
AIGC介绍篇 AIGC 最近横空出世,对社会产生了多冲击。AIGC 发展到现在,其实也就是最近几个月被 ChatGPT (22年11月推出的)带火的,ChatGPT 你可以理解为是所有 AIGC 的一个大脑,其他各种各样的 model 都是四肢,由 C...
-
提示词(prompt)工程指南(五):ChatGPT 提示工程
在本节中,我们介绍ChatGPT的最新提示工程技术,包括提示、应用、限制、论文和其他阅读资料。 完整的中文版本指南和更丰富的参考资料在 Github 和 Gitee 中,自动持续翻译更新: ? 关于提示词工程(prompt)的指南、论文、讲座、笔记...
-
2024年人工智能领域十大预测
2023年人工智能领域如果只能筛选一个关键词的话,恐怕非“大模型”莫属。大模型的发展在过去一年中,让各行各业发生了天翻地覆的变化,有企业因大模型而新生,有企业因大模型而消亡。企业的变迁跟技术迭代息息相关,而大模型就是新一代人工智能技术下的产物,大模型已经...
-
甲骨文的 OCI 生成式 AI 服务现已推出
Oracle 宣布了 Oracle Cloud Infrastructure(OCI)Generative AI 服务的普遍可用性,以及使企业更轻松地利用生成 AI 的最新进展的新创新。 OCI Generative AI 服务是一项完全托管的服务,无缝集...
-
Yann LeCun:生成模型不适合处理视频,AI得在抽象空间中进行预测
在互联网文本数据即将枯竭之际,很多 AI 研究者将目光转向了视频。但如何让 AI 理解视频数据成了新的难题。 在 2024 世界经济论坛的一次会谈中,图灵奖得主、Meta 首席 AI 科学家 Yann LeCun 被问到了这个问题。他认为,虽然这个问题还...
-
你对AI未来的数据战略是什么?
随着企业变得更加数据驱动,古老的计算谚语垃圾输入,垃圾输出(GIGO 从未像现在这样正确。将AI应用于许多业务流程只会加速确保所用数据的准确性和及时性的需要,无论是内部生成的数据还是外部来源的数据。不良数据的代价 Gartner估计,企业因使用质量不佳...
-
LLM会写代码≠推理+规划!AAAI主席揭秘:代码数据质量太高|LeCun力赞
自从ChatGPT发布后,各种基于大模型的产品也快速融入了普通人的生活中,但即便非AI从业者在使用过几次后也可以发现,大模型经常会胡编乱造,生成错误的事实。 不过对于程序员来说,把GPT-4等大模型当作「代码辅助生成工具」来用的效果明显要比「事实检索工具...
-
OpenAI「19个黑手党」出走创业,融资近80亿美元!华人科学家占比近1/3
或许,你听说过Transformer八子叛逃谷歌,纷纷自创业。 其实,凭借着ChatGPT一夜爆红成为世界顶级明星公司的OpenAI,也诞生了「叛逃十九子」。 其中就包括,OpenAI创始人之一Matt KrisiloG、前运营主管Jeff Arnol...
-
消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型
大模型的「幻觉」问题马上要有解了? 威斯康星麦迪逊大学和谷歌的研究人员最近开发了一个名为ASPIRE的系统,可以让大模型对自己的输出给出评分。 如果用户看到模型的生成的结果评分不高,就能意识到这个回复可能是幻觉。 如果系统可以进一步筛选评分的结果进行输...
-
可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE
IT之家 1 月 23 日消息,谷歌日前发布新闻稿,介绍了一款专为大语言模型设计的 ASPIRE 训练框架,该框架号称可以增强 AI 模型的选择性预测能力。 谷歌提到,当下大语言模型在自然语言理解和生成内容方面发展迅速,已被用于构建各种创新应用,但要...
-
Code Llama: Open Foundation Models for Code
本文是LLM系列文章,针对《Code Llama: Open Foundation Models for Code》的翻译。 Code Llama:代码的开放基础模型 摘要 1 引言 2 Code Llama:专业化Llama2用于代码 3...
-
AIGC(生成式AI)试用 17 -- 续2,生成式AI是什么
还是培训资料中的内容,重读一遍。 列举内容,尝试理解的多那么一点点。 1. 生成式AI 生成式AI定义 - Generative AI, GenAI - 一种人工智能技术 - 对已经数据分类、预测 - 生成新的内容,包括文本、图像、音...
-
LLaMa 原理+源码——拆解 (KV-Cache, Rotary Positional Embedding, RMS Norm, Grouped Query Attention, SwiGLU)
原理 Vanilla Transformer 与 LLaMa 的区别 Embedding RMS Norm Rotary Positional Encodding SwiGLU Function KV-Cache Grouped Mult...
-
日本芥川奖得主坦言:小说 5% 内容由 ChatGPT 撰写
1 月 22 日消息,日本最具声望的文学奖芥川奖得主近日坦言,其获奖小说《东京同情塔(Tokyo-to Dojo-to)》约 5% 的内容由 AI 聊天机器人 ChatGPT 创作。 33 岁的日本作家 Rie Kudan 女士在获奖感言中公开表示,C...
-
清华、小米、华为、 vivo、理想等多机构联合综述,首提个人LLM智能体、划分5级智能水平
嘿 Siri、你好小娜、小爱同学、小艺小艺、OK Google、小布小布…… 想必这些唤醒词中至少有一个曾被你的嘴发出并成功呼唤出了一个能给你导航、讲笑话、添加日程、设置闹钟、拨打电话的智能个人助理(IPA)。可以说 IPA 已经成了现代智能手机不可或缺...
-
一周 AIGC 丨苹果下架多款 AIGC 应用,阿里云开源通义千问 70 亿参数模型
多个 AIGC 应用在苹果应用商店下架,包含数据采集和使用不够规范等问题。阿里云开源通义千问 70 亿参数模型,包括通用模型 Qwen-7 B 和对话模型 Qwen-7 B-Chat。腾讯混元大模型开始应用内测,内部多个业务线接入测试。百度智能...
-
OpenAI 阿尔特曼与中东投资者就芯片合作进行讨论,拟减少对英伟达的依赖
1 月 20 日消息,据英国《金融时报》报道,OpenAI 首席执行官萨姆・阿尔特曼正在与中东投资者和包括台积电在内的芯片制造商进行讨论,并计划合作成立一家新的芯片企业。 报道提到,阿尔特曼正试图满足公司对半导体与日俱增的需求,同时减少对英伟达的依赖。...
-
2023世界人工智能大会,和鲸科技入选中国信通院《2023大模型和AIGC产业图谱》
近日,2023 世界人工智能大会(WAIC)“聚焦·大模型时代 AIGC 新浪潮”论坛上,中国信息通信研究院(以下简称“中国信通院”)正式发布《2023 大模型和AIGC产业图谱》(以下称“图谱”)。和鲸作为大模型时代 AI 基础设施的入口,凭借在大模型的...
-
自然语言处理的革命:AI大模型在AIGC领域的应用
1.背景介绍 自然语言处理(NLP)是人工智能(AI)领域的一个重要分支,其主要关注于计算机理解、生成和处理人类语言。自从2012年的深度学习革命以来,NLP 领域的研究取得了巨大进展,尤其是在自然语言生成和机器翻译等方面。然而,直到2020年,GPT-...
-
针对特定领域较小的语言模型是否与较大的模型同样有效?
经过2023年的发展,大语言模型展示出了非常大的潜力,训练越来越大的模型成为有效性评估的一个关键指标,论文《A Comparative Analysis of Fine-Tuned LLMs and Few-Shot Learning of LLMs f...
-
即将到来的政府监管下的人工智能时代
斯蒂芬·霍金曾说过一句名言:“成功创造出有效的人工智能可能是我们文明史上最大的事件,但除非我们学会如何准备和避免潜在的风险,否则人工智能可能是我们文明史上最糟糕的事件。” 人工智能以LLM(大型语言模型 的形式出现爆炸式增长。基于与ChatGPT等工具...
-
OpenAI拟将ChatGPT军用?与五角大楼合作军事禁令解除,谷歌前CEO:AI会变成核弹
AI武器化? 自大语言模型诞生以来,人们对其可能带来的影响的讨论就没停过。不过,更多人还是从普通人的视角出发,从LLM能对人们的日常工作生活带来哪些变化来思考的问题。 然而从稍微宏观一点的视角,我们就会发现LLM以及AI可能对整个社会甚至国家带来一些改变...
-
Agent触摸汉堡辨冷热,首次拥有类人感官!UCLA等发布3D多模态交互具身智能大模型
具身智能,是大模型未来应用的一个重要方向。 现在,大模型加持下的智能体,能够参与3D环境,不仅有了听觉视觉,还有了触觉等多种感官能力。 卧室里有什么物体,一眼辨认。 听到门铃响了,LLM便会告诉你家里来客人了。 大模型加持的NPC,在触摸桌子的香蕉后,...
-
“AI学会欺骗,人类完蛋了”?看完Anthropic的论文,我发现根本不是这回事啊
AGI若到来,人类是否会受到威胁,是一个大众热衷讨论同时研究者们也很关注的问题,从各个角度对此的研究几乎都会引发人们的讨论。最新的一个重磅研究来自今天最重要的大模型公司之一Anthropic。 1月9号他们发布了一篇论文,提出关于“Sleeper Agen...
-
AI助力全球最大科技公司总市值突破10万亿美元 Nvidia超越Facebook、微软超越苹果领先
全球最大的科技巨头估值已超过1万亿美元,部分归功于生成式人工智能的投资和进步,估值总计超过10万亿美元,其中Nvidia超越Facebook成为新秀,而Microsoft则取代苹果领先。 目前,包括Microsoft、Apple、Google、Amazon...
-
Llama 2打败GPT-4!Meta让大模型自我奖励自迭代,再证合成数据是LLM终局
Llama 2-70B一夜之间打败GPT-4,让整个AI社区为之震惊! 甚至,在AlpacaEval 2.0排行榜中,微调后的模型胜率完全碾压Claude 2、Gemini Pro等模型。 Meta和NYU研究团队究竟提出了什么秘制配方,才能让Llam...
-
一文读懂Llama 2(从原理到实战)
文章目录 简介 实战:微调Llama 2 在线体验 参考 简介 Llama 2,是Meta AI正式发布的最新一代开源大模型。 Llama 2训练所用的token翻了一倍至2万亿,同时对于使用大模型最重要的上下文长度限制,Lla...
-
Video-LLaMA 论文精读
Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding video-LLaMA 一种用于视频理解的指令调整视听语言模型 引言 ...
-
一文了解AIGC与ChatGPT
关注微信公众号掌握更多技术动态 --------------------------------------------------------------- 一、AIGC简介 1.AIGC基础 (1 AIGC是什么 AIGC是人...
-
英伟达新对话QA模型准确度超GPT-4,却遭吐槽:无权重代码意义不大
昨天,Meta、纽约大学的研究者用「自我奖励方法」,让大模型自己生成自己的微调数据,从而在 Llama 2 70B 的迭代微调后超越了 GPT-4。今天,英伟达的全新对话 QA 模型「ChatQA-70B」在不使用任何 GPT 模型数据的情况下,在 10...
-
LLaMA Board: 通过一站式网页界面快速上手 LLaMA Factory
原文:https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md ? 加入我们的微信群。 [ English | 中文 ] LLaMA Board: 通过一站式网页界面快速上手...
-
AIGC|手把手教你进行ChatGLM模型部署实践
一、背景介绍 模型部署基本步骤分为模型选择、模型部署、运行,如果需要在特定的场景下定制化模型,则还需要进行数据集的选择、数据集格式转换、微调。 根据上述的步骤本教程选取如下的开源模型、数据集,来对医疗场景下进行定制化模型部署。当然模型部署对G...
-
AIGC中的视觉生成文献整理
文章目录 文件夹文献总览 图像生成技术 视频生成技术 Video Generation with Text Condition Video Generation with other Conditions Video Editing 生成模...