-
Altman王者归来!强势要求解散董事会,OpenAI终极宫斗一触即发
从被扫地出门到王者回归,乔布斯用了12年,而Sam Altman,仅仅用了两天。 现在,Altman已经以胜利者的姿态重返OpenAI探讨自己的去留问题,并且对董事会提出了新的要求—— 「更换现有的董事会成员,并且得到证明自己并无过错的声明。」 简单来说...
-
GPT-4充当“规划师、审计师”,颠覆性双层文生图表模型
DALL-E3、Midjourney、Stable Diffusion等模型展现出了强大的创造能力,通过文本便能生成素描、朋克、3D、二次元等多种类型的高质量图片,但在生成科学图表(柱状、直方、箱线、树状等)方面却略显不足。 这是因为模型在生成图表时会遗漏...
-
复旦、人大等发布大五人格+MBTI测试 角色扮演AI特质还原率达82.8%
近期,由复旦大学和中国人民大学合作的Chat凉宫春日团队发布了一项关于AI角色扮演的研究。该研究强调了良好的人设还原度对于评价AI角色扮演的重要性,特质还原率高达82.8%。研究使用了大五人格的NEO-FFI问卷和MBTI的16Personalities测...
-
百度文心一言怎么样?
文心一言在3月16号发布,刚发布时只有邀请码体验,没有申请体验通道。到了晚上看到申请体验通道,便提交了申请,到4月1号过了半个月终于收到短信可以体验了。 本来想看看接口,也没什么恶意,但是却遭到了拒绝,感觉是小心翼翼,生怕泄露了什么。 另外...
-
文心一言能成为中国版的ChatGPT吗?
第一个背景环境 2022年11月底,有这样一件事诞生了——人工智能聊天机器人ChatGPT,使其迅速在社交媒体上走红,短短五天之内,注册用户数就超过100万。 ChatGPT(全称:ChatGenerative Pre-trained Transfor...
-
大模型幻觉成应用落地难题 最新评测文心一言解决幻觉能力最好
大模型中的幻觉问题 “林黛玉倒拔垂杨柳”、“月球上面有桂树”、“宋江字武松”……相信经常使用大语言模型都会遇到这样“一本正经胡说八道”的情况。这其实是大模型的“幻觉”问题,是大模型行业落地的核心挑战之一。例如幻觉会影响生成内容的可靠性,对于法律、金融、...
-
AIGC提示(prompt)工程之开宗明义篇
大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机...
-
stable diffusion实践操作-常见lora模型介绍
系列文章目录 本文专门开一节写Lora相关的内容,在看之前,可以同步关注:stable diffusion实践操作 文章目录 系列文章目录 前言 一、什么是lora? 1.1 lora 定义 1.2 lora的基本原理 1.2 通...
-
重磅!清华最新报告:文心一言超越ChatGPT 3.5
点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 今年国内厂商已发布很多大语言模型,其中最具代表性的产品有:百度的文心一言、阿里巴巴的通义千问、科大讯飞的星火等,最具代表性的开源工作有:ChatGLM、MOSS、Ba...
-
【文心一言】广告文案、演讲稿与请假条自动生成
前言 作为一名大学生而言,平时参加或者举办一些学校组织的活动的时候,总是避免不了需要准备一些演讲稿、广告宣传文案等内容,甚至于在疫情十分严重的这几年内,如何跟老师“委婉的”请假,也成为了我日常头疼的事情。但在百度推出文心一言以后,我发现这些事情反...
-
GPT、Llama等大模型存在「逆转诅咒」,这个bug该如何缓解?
来自中国人民大学的研究者将 Llama 等因果语言模型所遭遇的 “逆转诅咒” 归咎于 next-token prediction + causal language model 的本质缺陷,并发现 GLM 采用的自回归填空的训练方法对这种 “逆转诅咒”...
-
文心一言 内测体验
文心一言 申请内测 弱智吧经典问题 陨石为什么每次都能精准砸到陨石坑? 我想配个6000多的电脑,大概要多少钱? 为什么我爸妈结婚的时候没邀请我参加婚礼? 我买了一斤藕,为什么半斤都是空的? 我应该怎么称呼女朋友的老公 写一篇报告,关于:吃蔬...
-
Hayo AI:国内朋友的居家旅行必备良药,融入了 ChatGPT 和绘图 Stable diffusion
“ Hayo AI 在应用内直接融入了现有的热门AI大模型工具:Stable Diffusion 和 Chat GPT-4/GPT-3.5,可直接聊天、出图。” 01 — 必备良药 最近有朋友对 ChatGPT 感兴趣,但是苦于...
-
解决LLaMA、BERT等部署难题:首个4-bit浮点量化LLM来了
大语言模型 (LLM 压缩一直备受关注,后训练量化(Post-training Quantization 是其中一种常用算法,但是现有 PTQ 方法大多数都是 integer 量化,且当比特数低于 8 时,量化后模型的准确率会下降非常多。想较于 In...
-
使用代码下载开源的大模型文件示例以及中文微调llama资源汇总:
一、下载示例 from huggingface_hub import snapshot_download repo_id = "THUDM/chatglm2-6b" local_dir = './chatglm2-6b/' cache_dir = l...
-
微软开发定制AI芯片“由软变硬”,到底打的什么算盘?
传闻是真的,微软正在开发定制AI芯片,它可以用来训练大语言模型,让微软获得更多独立,避免过度依赖英伟达。不只如此,微软还在开发Arm CPU,主要供云计算网络使用。两款芯片瞄准的都是Azure数据中心,微软企业客户可以用它们来搭建AI平台。 最新消息显...
-
文心一言、讯飞星火与GPT-4/3.5在回答中文历史问题的表现
最近,随着备受关注的文心一言正式免费向全社会开放,再次引起了社会层面对国产大模型的兴趣。 以文心一言为代表的国产大模型性能究竟如何?如果将它们相互比较,并且和GPT系列模型等国际前沿水平的LLM进行比较,会得到什么样的结果呢?笔者对此...
-
贾跃亭旗下法拉第未来宣布推出AI产品FF aiPal Beta
法拉第未来推出生成式 AI 产品 aiPal Beta,号称“极致贴心”。这是一款出行领域的生成式 AI 产品,利用大语言模型,可以为用户提供个性化的 AI 体验。 根据法拉第未来的介绍,这款产品可以在汽车屏幕侧边栏根据实时地理位置为用户提示周边的生活服...
-
C#开源项目:私有化部署LLama推理大模型
推荐一个C#大模型推理开源项目,让你轻松驾驭私有化部署! 01 项目简介 LLama是Meta发布的一个免费开源的大模型,是一个有着上百亿数量级参数的大语言模型,支持CPU和GPU两种方式。 而LLamaSharp就是针对llama.cpp封装的C#...
-
NVIDIA RTX显卡AI推理提速5倍!RTX PC轻松在本地搞定大模型
正在举行的微软Iginte全球技术大会上,微软发布一系列AI相关的全新优化模型、开发工具资源,帮助开发者更深入地释放硬件性能,拓展AI场景。 尤是对于当下在AI领域占据绝对主导地位的NVIDIA来说,微软这次送上了一份大礼包,无论是面向OpenAI Cha...
-
一文盘点2023人工智能进展,不止大模型而已
2023年大模型千帆竞发,除此外AI领域还有哪些新突破? 来来来,畅销书《Python机器学习》作者Sebastian Raschka的年末总结已经准备好了。 看完才知道: RLHF今年虽然爆火,但实打实用到的模型并不多,现在还出现了替代方案,有望从开...
-
Microsoft 365 Copilot:下一代 AI 生产力技术
微软已经向部分商业用户开放 Microsoft 365 Copilot,这是一个基于大语言模型的 AI 生产力技术,由 OpenAI 的 GPT-4 技术驱动。Copilot 可以在 Microsoft 365 应用中辅助用户生成文档、电子邮件、演示文稿等...
-
可与H100一战,微软首款5纳米自研芯片震撼发布!Copilot引爆办公全家桶,Bing Chat改名
微软深夜炸场,万物皆可Copilot! Bing Chat,从此更名Copilot。 登录微软账号,就可以在Copilot专属网站上免费使用GPT-4、DALL·E 3。 图片 OpenAI的全新王牌爆款——自定义GPT,也被塞进Copilot宇宙,变身...
-
ChatGPT代码生成飙升10%!北大华人一作:细化prompt,大幅改进大模型代码能力
在大模型时代,高质量的代码生成已经强大到,让人惊叹。 从通过HumEval中67%测试的GPT-4,到近来各种开源大模型,比如CodeLlama,有望成为码农编码利器。 然而,现实中,程序员们不会精炼表达需求,因此误导、限制了LLM生成优秀代码的能力。...
-
在低配Windows上部署原版llama.cpp
现在大语言模型的部署,通常都需要大的GPU才能实现,如果是仅仅想研究一下,大语言模型的算法,我们是很想能够直接在我们的工作电脑上就能直接运行的,llama.cpp就是很好的实现。 LLaMa.cpp使用int4这种数值格式,其显著降低了内存需求,并且在大...
-
LLMs之Vicuna:在Linux服务器系统上实Vicuna-7B本地化部署(基于facebookresearch的GitHub)进行模型权重合并(llama-7b模型与delta模型权重)、模型部
LLMs之Vicuna:在Linux服务器系统上实Vicuna-7B本地化部署(基于facebookresearch的GitHub 进行模型权重合并(llama-7b模型与delta模型权重 、模型部署且实现模型推理全流程步骤的图文教程(非常详细 ...
-
OpenAI、微软押注,大模型应用的尽头是AI Agent ?|对话面壁智能
你见过Agent们“吵架”么? “这个产品需要具备XX需求,为什么没有?”,“你提出的需求完全不合理,技术上达不到!”,现场顿时乱作一团,越来越多的“员工”也被卷进了这场大乱斗中。 激烈的争吵声越过了屏幕外,面壁智能的测试人员通过后台日志,发现Agents...
-
LLM 系列 | 21 : Code Llama实战(上篇) : 模型简介与评测
引言 小伙伴们好,我是《小窗幽记机器学习》的小编:卖热干面的小女孩。 个人CSDN首页:JasonLiu1919_面向对象的程序设计,深度学习,C++-CSDN博客 今天开始以2篇小作文介绍代码大语言模型Code Llama。上篇主要介绍Co...
-
AIGC入门 - LLM 信息概览
在阅读本文之前,建议阅读文章:《GPT,GPT-2,GPT-3,InstructGPT的进化之路》 本文将介绍以下 LLM OPT LLaMa Alpaca Vicuna Moss chatGLM Baichuan Openbuddy 一、OPT...
-
【文心一言】文心一言最近这么火,它到底是什么
前言 文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言是知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大...
-
SpeakingAI官网体验入口 SpeakingAI免费软件怎么下载
Speaking AI是一款利用先进的大语言模型技术打造的文本转语音工具,具备丰富的情感交流能力,可以逼真地模仿任何人的声音。下面就给大家带来Speaking AI免费软件下载地址和介绍,一起来看看吧! 点击前往SpeakingAI官网体验入口 需求人群...
-
文心一言官网地址入口 文心一言4.0网页版使用链接
文心一言是百度打造出来的人工智能大语言模型,具备跨模态、跨语言的深度语义理解与生成能力,文心一言有五大能力,文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成,其在搜索问答、内容创作生成、智能办公等众多领域都有更广阔的想象空间。 文心一言企业服务...
-
文心一言怎么清除记录 文心一言4.0版本收费标准
文心一言具备广泛的应用能力,涵盖了文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成等。这些能力使其在搜索问答、内容创作生成、智能办公等领域展现出广阔的应用前景。 例如,在企业服务领域,文心一言可以帮助企业进行内容创作、客服问答优化、数据分析等,极...
-
Agent4Rec来了!大模型智能体构成推荐系统模拟器,模拟真实用户交互行为
一直以来,推荐系统领域面临模型线上线下效果差距大的痛点问题,昂贵的线上 A/B 测试成本使得广大研究人员望而却步,也造成学术界的推荐系统研究与工业界的实际应用间的巨大割裂。随着大语言模型展现出类人的逻辑推理和理解能力,基于大语言模型的智能体(Agent)...
-
新加坡推Agent4Rec 大模型智能体构成推荐系统模拟器
推荐系统领域长期存在线上线下效果差距大的问题,Agent4Rec通过构建大语言模型智能体,模拟真实用户行为,为解决这一问题提供了新的思路。在Agent4Rec中,每个用户智能体由个性化模块构成,根据用户历史交互生成电影偏好,模拟用户在推荐系统中的行为。通过...
-
大模型幻觉排行榜GPT-4夺冠,英伟达科学家强力打假!Meta版ChatGPT一作发长文鸣冤
大模型的幻觉问题,是业内老生常谈的话题了。 最近,一个名为Vectara的机构,在GitHub推出了一个大模型幻觉排行榜。 结果显示,在总结短文档方面,GPT-4的表现最为优异,而Google Palm的两款模型直接垫底! 其中GPT-4的准确率为97...
-
S-LoRA:一个GPU运行数千大模型成为可能
一般来说,大语言模型的部署都会采用「预训练 — 然后微调」的模式。但是,当针对众多任务(如个性化助手)对 base 模型进行微调时,训练和服务成本会变得非常高昂。低秩适配(LowRank Adaptation,LoRA)是一种参数效率高的微调方法,通常用...
-
LLM幻觉问题全梳理!哈工大团队50页综述重磅发布
幻觉,老朋友了。 自打LLM进入我们的视野,幻觉问题就一直是一道坎,困扰着无数开发人员。 当然,有关大语言模型幻觉的问题已经有了无数研究。 最近,来自哈工大和华为的团队发表了一篇50页的大综述,对有关LLM幻觉问题的最新进展来了一个全面而深入的概述。 这...
-
Ghostbuster:一个准确度高的AI生成文本检测工具
大语言模型如ChatGPT,以其卓越的写作能力引发了问题。学生们纷纷利用这些模型代写作业,导致一些学校不得不采取禁止ChatGPT的措施。此外,这些模型还存在生成带有事实错误的文本的倾向,因此谨慎的读者可能想知道,在信任某些新闻文章或其他来源之前,是否有生...
-
最新本地大模型进展#Chinese-LLaMA-2支持16k长上下文
Hi,今天为大家介绍最新的本地中文语言模型进展。 [2023/08/25] Chinese-LLaMA-2发布了新的更新: 长上下文模型Chinese-LLaMA-2-7B-16K和Chinese-LLaMA-2-13B-16...
-
【类ChatGPT】本地CPU部署中文羊驼大模型LLaMA和Alpaca
昨天在github上看到一个在本地部署中文大模型的项目,和大家分享一下。先把地址po出来。 项目名称:中文LLaMA&Alpaca大语言模型+本地部署 (Chinese LLaMA & Alpaca LLMs 项目地址:https://...
-
OpenAI CEO确认GPT-5终极目标:相当于人脑的超级AI
快科技11月14日消息,在最近的一次采访中,OpenAI首席执行官Sam Altman表示,计划从微软获得更多资金支持,用以创造相当于人脑的超级AI通用人工智能(AGI)。 Altman表示,虽然目前OpenAI的GPT-3.5及GPT-4在消费者市场取得...
-
GPT-5已开工!奥特曼:月入7亿不够烧,希望微软再投点
月入7个亿,仍然覆盖不了训练GPT的海量投入。 这是OpenAI CEO奥特曼公开透露的最新信息。 他对《金融时报》表示,OpenAI今年收入增长良好,但公司仍未盈利。OpenAI计划继续从金主爸爸微软和其他投资者那里筹集资金—— 而就在今年初,已有微...
-
老黄深夜炸场,世界最强AI芯片H200震撼发布!性能飙升90%,Llama 2推理速度翻倍,大批超算中心来袭
英伟达的节奏,越来越可怕了。 就在刚刚,老黄又一次在深夜炸场——发布目前世界最强的AI芯片H200! 较前任霸主H100,H200的性能直接提升了60%到90%。 不仅如此,这两款芯片还是互相兼容的。这意味着,使用H100训练/推理模型的企业,可以无缝更...
-
刚刚,出行行业首个!百亿估值玩家联合国有运营商开卷大模型
首个落地的交通出行大模型,它来了! 这两年的出行行业,有的卷补贴、规模,有的卷自动驾驶、卷定制车,终于有人开始卷大模型了! 名为“阡陌”,背后是国家队级别的选手:T3出行和中国电信。 T3出行,出行领域快速崛起的明星玩家,曾创造77亿元融资业内纪录,估值早...
-
【PaLM2】PaLM2 大语言模型与 Bard 使用体验
欢迎关注【youcans的学习笔记】原创作品,火热更新中 【Google I/O 2023】PaLM2 大语言模型与 Bard 使用体验 1. PaLM2 大型语言模型 1.1 谷歌发布 PaLM2 1.2 PaLM2 的功能与性能...
-
中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
可以说,AI 初创公司 LinkSoul.Al 的这些开源项目让海外开源大模型在国内的普及和推广速度与国际几乎保持了一致。 7 月 19 日,Meta 终于发布了免费可商用版本 Llama 2,让开源大模型领域的格局发生了巨大变化。 Llama 2 模...
-
谷歌DeepMind爆火动画18秒解释LLM原理,网友蒙圈!组团求GPT-4下场分析
Google DeepMind最近在自己的视频博客上上传了一段视频,「简单明了地」演示了大语言模型的工作原理,引发了网友的激烈讨论。 网友看了之后纷纷表示: 「终于,他们发了点普通人能看懂的东西了」。 「哦豁,这下懂了」 「对,就是这么简单!」 「太...
-
谷歌DeepMind给AGI划等级,猜猜ChatGPT在哪个位置
我们到底该如何定义 AGI(通用人工智能)?如果你要求 100 位 AI 专家进行解答,你可能会得到 100 个相关但不同的定义。 现阶段,AGI 是 AI 研究中一个重要且存在争议的概念,有研究者认为 AGI 已经出现在最新一代大语言模型(LLM)中;...
-
GPT-4比你更会问问题:让大模型自主复述,打破与人类对话的壁垒
在最新的人工智能领域动态中,人工生成的提示(prompt)质量对大语言模型(LLM)的响应精度有着决定性影响。OpenAI 提出的建议指出,精确、详细且具体的问题对于这些大语言模型的表现至关重要。然而,普通用户是否能够确保他们的问题对于 LLM 来说足够...