-
开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件
大模型长期以来一直存在一个致命的问题,即生成幻觉。由于数据集的复杂性,难免会包含过时和错误的信息,这使得输出质量面临着极大的挑战。过多的重复信息还可能导致大型模型产生偏见,这也算是一种形式的幻觉。如何检测和有效缓解大模型的生成幻觉问题一直是学术界的热门课...
-
一文读懂常用的 “生成式 AI 框架”
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - Gen AI ,即“生成式 AI” 技术。 随着 AI 技术的不断发展,Gen AI 的力量超越了单纯的技术奇迹,更是一种具有变革性的动态力量,深刻地塑造了...
-
大模型就是「造梦机」,Karpathy一语惊人!人类才是「幻觉问题」根本原因
幻觉,早已成为LLM老生常谈的问题。 然而,OpenAI科学家Andrej Karpathy今早关于大模型幻觉的解释,观点惊人,掀起非常激烈的讨论。 在Karpathy看来: 另外,Karpathy的另一句话,更是被许多人奉为经典。他认为,与大模型相对的...
-
【原创】AIGC之ChatGPT工作原理
AIGC是什么 AIGC - AI Generated Content (AI生成内容),对应我们的过去的主要是 UGC(User Generated Content)和 PGC(Professional user Generated Content...
-
OpenAI 承认ChatGPT变懒惰,用户抱怨增加,正在研究修复方案
OpenAI 旗下的 ChatGPT 账号最近承认了 GPT-4变懒的问题,并表示他们正在研究修复这个问题。自11月11日以来,ChatGPT 账号没有更新过模型,导致用户的反馈数量激增。虽然这不是故意的,但大模型的行为是不可预测的。 有外界猜测认为,Op...
-
LLaMA Adapter和LLaMA Adapter V2
LLaMA Adapter论文地址: https://arxiv.org/pdf/2303.16199.pdf LLaMA Adapter V2论文地址: https://arxiv.org/pdf/2304.15010.pdf LLaMA Ada...
-
【Prompt】7 个向 chatGPT 高效提问的方法
欢迎关注【youcans的 AIGC 学习笔记】原创作品 【Prompt】7 个向 chatGPT 高效提问的方法 0. 向 chatGPT 高效提问的方法 1. 提问方法:明确问题 2. 提问方法:简洁清晰 3. 提问方法:避免歧义 4...
-
大语言模型之十六-基于LongLoRA的长文本上下文微调Llama-2
增加LLM上下文长度可以提升大语言模型在一些任务上的表现,这包括多轮长对话、长文本摘要、视觉-语言Transformer模型的高分辨4k模型的理解力以及代码生成、图像以及音频生成等。 对长上下文场景,在解码阶段,缓存先前token的Key和Value(K...
-
Google Gemini Pro版怎么申请 谷歌AI大模型聊天机器人入口
Google Gemini是一款由Google AI开发的大型语言模型聊天机器人。它采用了一种全新的语言模型技术,能够生成更加流畅、更加自然的语言。Gemini还具备更复杂的对话能力,并能够理解用户的上下文。如果你想了解Gemini软件的体验入口在哪里,我...
-
专用于手机、笔记本,Stability.ai开源ChatGPT基因的大模型
12月8日,著名开源生成式AI平台stability.ai在官网开源了,30亿参数的大语言模型StableLM Zephyr3B。 Zephyr3B专用于手机、笔记本等移动设备,主打参数小、性能强、算力消耗低的特点,可自动生成文本、总结摘要等,可与70亿、...
-
【AIGC】提示词 Prompt 分享
提示词工程是什么? Prompt engineering(提示词工程)是指在使用语言模型进行生成性任务时,设计和调整输入提示(prompts)以改善模型生成结果的过程。它是一种优化技术,旨在引导模型产生更加准确、相关和符合预期的输出。 在生成性任务中...
-
更强的Llama 2开源,可直接商用:一夜之间,大模型格局变了
已上微软 Azure,即将要上 AWS、Hugging Face。 一夜之间,大模型格局再次发生巨变。 一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题,一直不可免费商用。 今日,Meta 终于发布了大家期待...
-
“大海捞针”实验验证RAG+GPT-4 Turbo模型卓越性能 只需4%的成本
近期的“大海捞针”实验揭示了RAG+GPT-4Turbo模型的卓越性能,只需4%的成本,便能在生成响应时实现卓越的准确性。这标志着大型模型领域的一次重要突破。 在这个实验中,研究者使用了三种基本技术,包括上下文窗口填充、RAG(检索增强生成)和微调,以使L...
-
BlueLM蓝心大模型官网体验入口 vivo智能AI聊天软件app免费下载地址
《BlueLM蓝心大模型》是由vivo自主研发的智能语言理解模型,具备 70 亿模型参数量,能够处理32K上下文长度。基于260TB的多语言训练语料,这款模型拥有卓越的语言理解能力,并可广泛应用于多种场景。《BlueLM蓝心大模型》在哪里可以体验呢?下面就...
-
RAG+GPT-4 Turbo让模型性能飙升!更长上下文不是终局,「大海捞针」实验成本仅4%
RAG+GPT-4,4%的成本,便可拥有卓越的性能。 这是最新的「大海捞针」实验得出的结论。 在产品中使用LLM的下一阶段,重点是让它们生成的响应/回复更加「超前高速化」(hyper-specific 。 也就是LLM需要按照不同的使用情况,针对数据集...
-
北大等发布最新AI智能体Jarvis-1,制霸「我的世界」
智能体研究又取得了新成绩! 最近,来自北大、北邮、UCLA和BIGAI的研究团队联合发表了一篇论文,介绍了一个叫做Jarvis-1的智能体。 论文地址:https://arxiv.org/pdf/2311.05997.pdf 从论文标题来看,Jarvi...
-
re:Invent 2023 | Amazon CodeWhisperer 的最佳实践
关键字: [Amazon Web Services re:Invent 2023, CodeWhisper, Code Whisper, Code Suggestions, Prompt Engineering, Security Scanning, Cu...
-
JetBrains 推出新 AI 编码助手,结合多个大型语言模型以实现供应商中立
JetBrains 于当地时间周三发布了一款新的 AI 编码助手,这款助手能够从开发者的集成开发环境(IDE)获取信息,并将其反馈给 AI 软件,以提供编码建议、代码重构和文档支持。这家开发工具公司声称,其 AI 助手是第一个供应商中立的此类产品,因为它使...
-
微软和OpenAI联手推出了GitHub Copilot这一AI编程工具,可根据开发者的输入和上下文,生成高质量的代码片段和建议
只需要写写注释,就能生成能够运行的代码?对于程序员群体来说,这绝对是一个提高生产力的超级工具,令人难以置信。实际上,早在2021年6月,微软和OpenAI联手推出了GitHub Copilot这一AI编程工具。它能够根据开发者的输入和上下文,生成高质量的代...
-
Google Gemini Ultra版本在哪申请 谷歌AI大模型聊天机器人入口
Google Gemini是一个由 Google AI 开发的大型语言模型聊天机器人。它使用了一种新的语言模型技术,能够生成更流畅、更自然的语言。Gemini 还能够进行更复杂的对话,并理解用户的上下文。Gemini软件的体验入口在哪呢,这里我们来看下Ge...
-
思维链提出者Jason Wei:关于大模型的6个直觉
还记得 Jason Wei 吗?这位思维链的提出者还曾共同领导了指令调优的早期工作,并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 参与 ChatGPT 的开发工作。机器之心曾经报道过他为年轻 AI 研...
-
思维链提出者Jason Wei:关于大模型的六个直觉
还记得 Jason Wei 吗?这位思维链的提出者还曾共同领导了指令调优的早期工作,并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 参与 ChatGPT 的开发工作。机器之心曾经报道过他为年轻 AI...
-
必收藏!105页SD提示词手册;百度 Prompt 官方课程;7场 AIGC 免费线下活动;不懂代码的我,利用GPT做了一个微信小程序 | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 『Stable Diffusion Prompt Book』105页超详细,必收藏的AI绘画实用手册 ShowMeAI知识星球资料编号...
-
腾讯与悉尼大学联手打造GPT4Video:显著提升大语言模型视频生成能力
在多模态大型语言模型(MLLMs)领域取得显著进展的同时,尽管在输入端多模态理解方面取得了显著进展,但在多模态内容生成领域仍存在明显的空白。为填补这一空白,腾讯人工智能实验室与悉尼大学联手推出了GPT4Video,这是一个统一的多模态框架,赋予大型语言模型...
-
AIGC: 关于ChatGPT抽象Prompt提问模板的设计
为什么需要Prompt模板 基于前文我们具备了Prompt构建的基础能力,但是我们在实际编写Prompt的过程当中,可能还会存在一些的问题 比如对于背景和细节的描述还是不够 或者为了描述的清楚堆砌了大量的文字, 导致整个Prompt的结构化和...
-
Stable Diffusion WebUI使用AnimateDiff插件生成动画
AnimateDiff 可以针对各个模型生成的图片,一键生成对应的动图。 配置要求 GPU显存建议12G以上,在xformers或者sdp优化下显存要求至少6G以上。 要开启sdp优化,在启动参数加上--sdp-no-mem-attention 实...
-
大模型LLaMA和微调LLaMA
1.LLaMA LLaMA的模型架构:RMSNorm/SwiGLU/RoPE/Transformer/1-1.4T tokens,和GPT一样都是基于Transformer这个架构。 1.1对transformer子层的输入归一化 与Transf...
-
最新ChatGPT网站源码运营版+支持ai绘画(Midjourney)+GPT4.0+GPT官方3.5key绘画+实时语音识别输入+后台一键版本更新!
最新ChatGPT网站源码运营版+支持ai绘画+GPT4.0+GPT官方3.5key绘画+实时语音识别输入+后台一键版本更新! 1.网站系统源码介绍: 程序已支持ChatGPT4.0、Midjourney绘画、GPT3.5 API绘画、语音识别输入、...
-
AI视野:Copilot将可免费使用GPT-4Turbo;Bing推深度搜索功能;谷歌推桌面版Chrome“帮我写”;百度腾讯等入股无问芯穹
???AI新鲜事 微软Copilot将可免费使用GPT-4Turbo 微软宣布Copilot将集成OpenAI最新工具,特别是强化版的GPT-4Turbo。GPT-4Turbo具有更大的上下文窗口和更新的知识截止日期,提供更深入的见解。微软表示,整合后将使...
-
大模型免微调解锁对话能力,RLHF没必要了!一作上交大校友:节省大量成本和时间
要搞大模型AI助手,像ChatGPT一样对齐微调已经是行业标准做法,通常分为SFT+RLHF两步走。 来自艾伦研究所的新研究却发现,这两步都不是必要的??? 新论文指出,预训练完成刚出炉的基础模型已经掌握了遵循指令的能力,只需要提示工程就能引导出来,引起...
-
微软Copilot进化完全体,代码解释器、DALL·E 3,ChatGPT有的它都有
Copilot发布一周年之际,将迎来一系列重磅更新! 聊天将支持128k上下文,ChatGPT的代码解释器也将被引入…… 可以说,微软这次是把GPT有的功能几乎全搬进了Copilot。 不仅功能完备,Copilot的入口更加丰富多样,响应速度也更快捷,...
-
谷歌推出桌面版Chrome“帮我写”功能 AI写作助手进一步强化
近期,谷歌宣布将人工智能驱动的“帮我写”功能引入桌面版Chrome,为Windows、Mac和Linux用户提供更便捷的写作助手。这一功能已经在Google Messages、Gmail、Docs和Keep等应用中得到应用,现在进一步扩展至Chrome浏览...
-
必看![文心一言] 中国版ChatGPT“狂飙,傲视诛仙
最近,有一个叫作ChatGPT的技术产品在社交媒体上引起了热议,这是一种基于人工智能的聊天机器人,能够像人类一样进行对话。目前,它在国外的应用已经非常广泛,而中国地区也在迅速跟进。现在,中国版的文心一言来了!这是一款由百度开发的AI,采用了中国文化和语言素...
-
【GPT4】微软 GPT-4 测试报告(4)GPT4 的数学能力
**欢迎关注【youcans的AGI学习笔记】原创作品微软 GPT-4 测试报告(1)总体介绍微软 GPT-4 测试报告(2)多模态与跨学科能力微软 GPT-4 测试报告(3)编程能力微软 GPT-4 测试报告(4)数学能力微软 GPT-4 测试报告(5)...
-
颠覆Transformer霸权!CMU普林斯顿推Mamba新架构,解决致命bug推理速度暴增5倍
深度学习进入新纪元,Transformer的霸主地位,要被掀翻了? 2017年6月12日横空出世,让NLP直接变天,制霸自然语言领域多年的Transformer,终于要被新的架构打破垄断了。 Transformer虽强大,却有一个致命的bug:核心注意力...
-
GPT-4 未通过图灵测试,GPT-3.5 还败给六十年前的老 AI 系统,最新研究出炉!
过去一年间,能说会道的ChatGPT、最新的 GPT-4大模型,其能力也已超乎很多人的想象,一场由 OpenAI 引领推动的 AIGC 浪潮席卷全球各大科技公司。但是从学术研究的角度来看,其表现力距离人类智能究竟还有多远? 近日,一篇由加州大学圣迭戈分校的...
-
Transformer挑战者出现!斯坦福CMU联合团队,开源模型及代码,公司已创办
现在ChatGPT等大模型一大痛点: 处理长文本算力消耗巨大,背后原因是Transformer架构中注意力机制的二次复杂度。 FlashAttention作者Tri Dao参与提出的新架构,成为有力挑战者,引起大量关注: Mamba(曼巴,一种蛇),在语...
-
“离谱的AI扩图”火了!张张那叫一个出其不意
家人们,真的是要被抖音AI扩图给笑死了—— 主打一个看完让人“意想不到”、“一肚子气”~ 例如一对恩爱情侣的照片在AI扩图前是非常有信仰感的: △素材来源:抖音@快乐野人 但在AI扩图一通“神操作”之下,画风简直是180度大反转: △素材来源:抖音...
-
中文大模型 Chinese-LLaMA-Alpaca-2 开源且可以商用
“ Meta 开源 LLAMA2 后,国内出现了不少以此为基座模型训练的中文模型,这次我们来看看其中一个不错的中文模型:Chinese-LLaMA-Alpaca-2 。” 01 — 目前在开源大模型中,比较有名的是Meta的LLAM...
-
向“创新者”升阶,程序员当下如何应对 AI 的挑战 | 京东云技术团队
随着 AI 技术的飞速发展,特别是大模型的出现,传统的程序员角色正在经历深刻的变革,我们不得不重新对自己进行审视和思考。 通用领域大模型的“泛化能力” 在过去的二十年内,AI 领域的大部分研究和应用都集中在完成一项特定的任务中,例如:分类图片、总结...
-
微调语言大模型选LoRA还是全参数?基于LLaMA 2深度分析
本文对比了全参数微调和LoRA,并分析了这两种技术各自的优势和劣势。作者使用了三个真实用例来训练LLaMA 2模型,这提供了比较特定任务的性能、硬件要求和训练成本的基准。本文证明了使用LoRA需要在serving效率和模型质量之间做出权衡,而这...
-
Star History 九月开源精选 |开源 GitHub Copilot 替代
虽然大火了近一年,但是截至目前 AI 唯一破圈的场景是帮助写代码(谷歌云旗下的 DORA 年度报告也给 AI 泼了盆冷水)。不过对于软件开发来说,生成式人工智能绝对已经是新的标配。 本期 Star History 收集了一些开源 GitHub Copil...
-
AI作画技术实践第二期|用腾讯云智能图片融合优化AI绘画的效果
上一篇文章《AI作画技术实践第一期》提到用腾讯云智能能力如何实现简易版的AI画画,发布后受到大量网友关注,也在思考还能不能做出更好的效果。最近发现AI绘画玩法在短视频平台也掀起了一波热潮,结合在网上看到有一些很优秀的AI画画模型,也想尝试在上一篇的基础上做...
-
BlueLM蓝心大模型官网体验入口 AI聊天软件免费app下载地址
《BlueLM蓝心大模型》是vivo自主研发的智能语言理解模型,具备 70 亿模型参数量,能够处理32K上下文长度。它基于260TB的多语言训练语料,拥有强大的语言理解能力,并且可以广泛应用于多种场景。那么,想要体验《BlueLM蓝心大模型》的功能在哪里可...
-
星辰语义大模型官网体验入口 电信Ai大模型软件app下载
星辰语义是一款基于自然语言处理技术的语言模型,由中国电信推出、“文心一言”技术驱动的大模型。它具备升级后在幻觉抑制、外推窗口、交互体验和多轮理解四个方面都有显著提升的能力。那么星辰语义大模型在哪里可以体验呢?下面就给大家带来星辰语义大模型官网入口和免费ap...
-
ChatGPT:开启AI新纪元-人工智能AI
报告地址:ChatGPT:开启AI新纪元-人工智能AI 随着人工智能技术的不断发展,越来越多的领域开始应用人工智能技术来提高效率和质量。其中,自然语言处理技术的应用尤为广泛,人们使用自然语言处理技术来进行语音识别、机器翻译、文本分类等。而在这些...
-
大模型应用设计的十个思考
技术不是万能的,但没有技术却可能是万万不能的,对于大模型可能也是如此。基于大模型的应用设计需要聚焦于所解决的问题,在自然语言处理领域,大模型本身在一定程度上只是将各种NLP任务统一成了sequence 到 sequence 的模型。利用大模型, 我们是在...
-
字节跳动与中科大联手提出多模态文档大模型DocPedia
字节跳动与中国科学技术大学合作研发的多模态文档大模型DocPedia已成功突破了分辨率的极限,达到了2560×2560的高分辨率。这一成果是通过研究团队采用了一种新的方法,解决了现有模型在解析高分辨文档图像方面的不足。 在此研究中,提出了DocPedia,...
-
矩阵模拟!Transformer大模型3D可视化,GPT-3、Nano-GPT每一层清晰可见
「矩阵模拟」的世界或许真的存在。模拟人类神经元,不断进化的Transformer模型,一直以来都深不可测。 许多科学家都试着打开这个黑盒,看看究竟是如何工作的。 而现在,大模型的矩阵世界,真的被打开了! 一位软件工程师Brendan Bycroft制作了...
-
突破分辨率极限,字节联合中科大提出多模态文档大模型
现在连文档都有大模型了,还是高分辨率、多模态的那种! 不仅能准确识别出图像里的信息,还能结合用户需求调用自己的知识库来回答问题。 比如,看到图中马里奥的界面,直接就回答出了这是任天堂公司的作品。 这款模型由字节跳动和中国科学技术大学合作研究,于2023年...