-
国内百模谁第一?清华14大LLM最新评测报告出炉,GLM-4、文心4.0站在第一梯队
在2023年的「百模大战」中,众多实践者推出了各类模型,这些模型有的是原创的,有的是针对开源模型进行微调的;有些是通用的,有些则是行业特定的。如何能合理地评价这些模型的能力,成为关键问题。 尽管国内外存在多个模型能力评测榜单,但它们的质量参差不齐,排名差...
-
AI日报:最强大模型Llama 3发布;Midjourney推社交新功能Room;超强AI视频自动剪辑工具Captions;手机上可以玩大模型了
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、最强大模型Llama3 正式发...
-
OpenAI提供新的微调和定制选项
微调在构建有价值的人工智能工具中起着至关重要的作用。这种使用更有针对性的数据集精炼预训练模型的过程可以使用户大大增加模型对专业内容的理解,允许用户为特定任务的模型增加现成知识。 虽然这个过程可能需要时间,但与从头开始训练模型相比,它的成本效益通常要高三...
-
自回归超越扩散!北大、字节 VAR 范式解锁视觉生成 Scaling Law
新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了!使 GPT 风格的自回归模型在图像生成首次超越扩散模型,并观察到与大语言模型相似的 Scaling Laws 缩放定律、Zero-shot Task General...
-
大模型开源还是闭源好,周鸿祎与李彦宏针尖对麦芒
开源大模型还是闭源大模型,究竟谁才是“版本答案”?围绕这个问题,360创始人周鸿祎和百度创始人李彦宏最近就来了一次隔空论战。 先是在4月12日,有媒体曝光了李彦宏在百度内部的讲话。其中就有他认为闭源大模型在能力上会持续领先、而不是一时领先,并且开源大模型的...
-
全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用
LLM界的「真·Open AI」,又来整顿AI圈了! 业内惊呼:首个开源GPT-4级的模型,终于来了!开源模型追上闭源模型的历史性一刻,或许就在眼前了? 一石激起千层浪,Llama3才刚刚发布没几小时,就破纪录地登顶了Hugging Face排行榜。 这...
-
Meta 发布Llama 3,能力直逼GPT-4,一己之力拉高开源大模型水位
编辑|伊风、诺亚 出品 | 51CTO技术栈(微信号:blog51cto) Meta麾下“羊驼”一路狂奔在开源的大道上。 在过去的一年里,Llama系列可以说开辟了开源LLM的半壁江山。 嫌弃开源模型能力只有GPT-3.5,不够用? 如今Llam...
-
5亿个token之后,我们得出关于GPT的七条宝贵经验
自 ChatGPT 问世以来,OpenAI 一直被认为是全球生成式大模型的领导者。2023年3月,OpenAI 官方宣布,开发者可以通过 API 将 ChatGPT 和 Whisper 模型集成到他们的应用程序和产品中。在 GPT-4发布的同时 OpenA...
-
开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4
扎克伯格:「有了 Llama3,全世界就能拥有最智能的 AI。」 ChatGPT 拉开了大模型竞赛的序幕,Meta 似乎要后来居上了。 本周四,AI 领域迎来重大消息,Meta 正式发布了人们等待已久的开源大模型 Llama3。 扎克伯格在 Faceboo...
-
“百模大战” 必有一战 | 2024 中国 “百模大战” 竞争格局分析
近日,亿欧智库发布了《2024 中国 “百模大战” 竞争格局分析报告》,从 “百模大战” 的关键进程切入,分析大战爆发原因及核心竞争力,评估通用大模型厂商的综合竞争力,洞察垂类大模型的行业发展前景,最后结合技术、产品和市场走向探析 “百模大战” 的未来趋势...
-
你不知道的人工智能的五个事实!
人工智能(AI 作为一种新技术,由于其物流性能,正蓬勃发展。从IT到医疗,甚至更多领域,人工智能可以高效地工作。 尽管我们已经知道许多人工智能工具,以及它们是如何围绕这些行业运行的,但仍有一些有趣的人工智能事实,或许还不知道。本文将列出人工智能的5个未...
-
单篇赚两万,AI写短剧是噱头还是风口?
重生之我用AI写短剧故事。 打开MidReal最新网页版,页面中间偌大的标语写着“What’s your fantasy?(你的幻想是什么?)”和引导用户输入提示词的对话框。 免费体验网页版MidReal链接:https://midreal.ai/ 如果...
-
中山大学“梗王”大模型CLoT 靠讲笑话入选顶会CVPR
中山大学HCP实验室联合Sea AI Lab和哈佛大学等单位开展的一项研究,成功地让大型人工智能模型通过讲笑话的方式,探索多模态大模型的创造力,并因此获得了计算机视觉和模式识别领域的顶级会议CVPR的认可。 这项研究的关键在于使用来自日本的“大喜利”(Oo...
-
GPT-4 Turbo重回王座,ChatGPT免费升级!数学暴涨10%/上下文全面碾压
今天起,最新版的GPT-4 Turbo,正式向ChatGPT Plus用户开放了! 图片 有了GPT-4 Turbo加持后,ChatGPT写作、数学、逻辑推理和编码的能力得到提升。 小编小试,果然ChatGPT最新数据已经更新到了4月。 图片 根据基准测...
-
AI日报:GPT-4Turbo向所有付费用户开放;谷歌将推3款免费AI工具;百度将发布AI原生操作系统DuerOS X,中山大学“梗王”大模型靠讲笑话入选顶会CVPR
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI新鲜事 新版GPT-4T...
-
甲骨文宠儿力压GPT-4斩获竞技场首胜,不绑定厂商,不做聊天机器人,Transformer最年轻作者带飞大模型创业新星
编辑 |诺亚、伊风 出品 | 51CTO技术栈(微信号:blog51cto) 近日在开源模型界,Command R+风头正劲。 在Arena榜单上,Command R+凭借逾13000名支持者的票,一度跃升至第6位,其表现与GPT-4-0314旗鼓相...
-
给AI当“奶妈”,是天涯们的生路吗?
老牌中文社区天涯已经住进“ICU”整整一年,破产看来已经注定,但最近一家美国同行搭上AI 快车的消息,又给天涯带来了一丝希望。 去年4月,因拖缴数据机房费用,天涯社区遭“断网”。 症结在缺钱。天涯社区称,危机来自于近几年资金流动性困难加剧,电信IDC欠费,...
-
AI正在通过两种方式重塑数字营销的未来
在不断演变的数字营销领域中,过去三十年中出现了一些关键时刻,这些时刻定义了整个行业,例如,21世纪初的互联网热潮导致了社交媒体平台的形成,进而催生了我们今天所熟知的数十亿美元的数字广告行业。 过去十年中的一个主要转变是从桌面优先转向移动优先,我们都可以...
-
OpenAI新GPT-4 Turbo模型上线:可供付费ChatGPT用户使用
快科技4月12日消息,据媒体报道,OpenAI的全新GPT-4 Turbo模型已全面上线,并正式向付费ChatGPT用户开放。 GPT-4 Turbo更新标志着人工智能领域的又一重要进步,为用户提供了更强大、更高效的文本处理、数学计算、逻辑推理以及编码能力...
-
新版GPT-4 Turbo现已向所有付费 ChatGPT 用户开放
近日,OpenAI宣布推出最新版的GPT-4Turbo,这一消息在人工智能领域引起了广泛关注。目前新版 GPT-4Turbo 已向所有付费 ChatGPT 用户开放,这标志着人工智能技术在语言理解和生成方面的又一重大进步。 GPT-4Turbo在多个方面...
-
“梗王”大模型,靠讲笑话登上CVPR | 中山大学
谁能想到,只是让大模型讲笑话,论文竟入选了顶会CVPR! 没开玩笑,这还真真儿的是一项正儿八经的研究。 例如看下面这张图,如果让你根据它来讲个笑话或梗,你会想到什么? 现在的大模型看完后会说: 脑子短路。 再看一眼 蜘蛛侠 的海报,大模型会配一句“刚擦的...
-
国内首款AI音乐大模型一曲封神!核心技术业内首公开,爆改霉霉周杰伦效果惊艳
【新智元导读】国内首个音乐ChatGPT来了!提前试用「天工SkyMusic」后,整个编辑部暴风式哭泣:它改编的周杰伦和凤凰传奇简直封神。团队选择了一条少有人走的路,他们赌赢了:比OpenAI提前押中了Sora架构,并且首次在业内公开技术图。 最近几周的震...
-
AI日报:suno劲敌Udio上线就被挤崩;谷歌将推AI视频Google Vids;蚂蚁CodeFuse推图生代码;ChatGPT之后增长最快的AI网站竟是它
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI应用 suno劲敌!AI...
-
ChatGPT首次亮相电视剧创作名单
近日,印度泰卢固语喜剧《Save the Tigers》第二季大结局的片尾演职员表中,音乐团队部分明确标注列出了ChatGPT。这一现象引发了业界的广泛关注,因为这标志着人工智能技术在影视剧音乐制作领域的首次应用。 据了解,《Save the Tiger...
-
从AIGC到AGI,为什么我们需要更多的“技术信仰派”?
整理 | 伊风 采访 | 张晓楠 嘉宾 | 巴川、朱雷、肖然 出品 | 51CTO技术栈(微信号:blog51cto) 作为AIGC应用落地元年,2024开年就抛给我们一些不太好回答的问题: 在以探索AGI为长期目标时,我们该坚守技术信仰吗? 除了复制...
-
谷歌AI落后了 问题到底出在哪?
2023年年初,谷歌匆匆出兵,奋力开发AI模型,应对ChatGPT带来的压力。随后几个月里,谷歌加码测试生成式AI,内部出现几套模型,希望通过内部赛马拿出有竞争力的成果。 可惜,模型虽多,但没有一个可以与OpenAI CPT-4抗衡。无奈之下,谷歌只得...
-
大模型的学习 LLaMa和ChatGLM,minichatgpt4
LLaMa和ChatGLM,minichatgpt4 什么情况用Bert模型,什么情况用LLaMA、ChatGLM类大模型,咋选? 答:Bert 的模型由多层双向的Transformer编码器组成,由12层组成,768隐藏单元,12个head,总参数量...
-
研究发现,GPT-4在说服力方面比人类表现优秀82%
瑞士洛桑联邦理工学院(EPFL)的研究人员最近进行的一项研究表明,GPT-4在说服力方面比人类表现更出色,优势接近82%,准确来说是81.7%。该研究涉及820人围绕一系列主题展开辩论。这些主题包括是否应该考虑种族因素作为大学录取标准,以及像是否应该继续发...
-
为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑
几天前,前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy 发布了一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」。 llm.c 旨在让大模型(LM)训练变得简单...
-
激发大语言模型空间推理能力:思维可视化提示
大语言模型(LLMs)在语言理解和各种推理任务中展现出令人印象深刻的性能。然而,它们在人类认知的关键一面——空间推理上,仍然未被充分研究。人类具有通过一种被称为 心灵之眼 的过程创造看不见的物体和行为的心智图像的能力,从而使得对未见世界的想象成为可能。...
-
报告称:OpenAI和Meta即将发布具有人类推理能力的AI模型
OpenAI 和 Meta 据称正在准备发布更先进的 AI 模型,这些模型将能够帮助解决问题并承担更复杂的任务。OpenAI 的首席运营官 Brad Lightcap 告诉《金融时报》,公司下一个版本的 GPT 将在解决 "困难问题" 方面取得进展,例如推...
-
最新AI工具系统ChatGPT网站运营源码SparkAi系统V6.0版本,GPTs应用、AI绘画、AI换脸、垫图混图、Suno-v3-AI音乐生成大模型全支持
一、前言 SparkAi创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。本期针对源码系统整体测试下来非常完美,那么如何搭建部署AI创作ChatGPT?小编这里写一个详细...
-
大模型做时序预测也很强!华人团队激活LLM新能力,超越一众传统模型实现SOTA
大语言模型潜力被激发—— 无需训练大语言模型就能实现高精度时序预测,超越一切传统时序模型。 来自蒙纳士大学、蚂蚁、IBM研究院提出了一种通用框架,结果成功激活大语言模型跨模态处理时序数据的能力。 时序预测有益于城市、能源、交通、遥感等典型复杂系统的决策...
-
2024-03-26 AIGC-大模型学习路线
摘要: 2024-03-26 AIGC-大模型学习路线 大模型学习路线 建议先从主流的Llama开始,然后选用中文的Qwen/Baichuan/ChatGLM,先快速上手体验prompt工程,然后再学习其架构,跑微调脚本 如果要深入学习,建...
-
得物 AIGC 算法岗(日常实习生) 面经分享
节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 最大的感受就是,今年的算法面试...
-
如何写好Stable Diffusion的prompt
Stable Diffusion是一种强大的文本到图像生成模型,其效果在很大程度上取决于输入的提示词(Prompt)。以下是一些关于如何编写有效的Stable Diffusion Prompt的秘诀: 明确描述:尽量清晰地描述你想要的图像内容。使...
-
开源模型首胜GPT-4!竞技场最新战报引热议,Karpathy:这是我唯二信任的榜单
能打得过GPT-4的开源模型出现了! 大模型竞技场最新战报: 1040亿参数开源模型Command R+攀升至第6位,与GPT-4-0314打成平手,超过了GPT-4-0613。 图片 这也是第一个在大模型竞技场上击败GPT-4的开放权重模型。 大模型竞...
-
RAG 修炼手册|一文讲透 RAG 背后的技术
在之前的文章中《RAG 修炼手册|RAG敲响丧钟?大模型长上下文是否意味着向量检索不再重要》,我们已经介绍过 RAG 对于解决大模型幻觉问题的不可或缺性,也回顾了如何借助向量数据库提升 RAG 实战效果。 今天我们继续剖析 RAG,将为大家大家详细介绍...
-
英伟达竞品来了,训练比H100快70%,英特尔发最新AI加速卡
英伟达的 AI 加速卡,现在有了旗鼓相当的对手。 今天凌晨,英特尔在 Vision 2024 大会上展示了 Gaudi 3,这是其子公司 Habana Labs 的最新一代高性能人工智能加速器。 Gaudi 3 将于 2024 年第三季度推出,英特尔现...
-
AI日报:GPT-4-Turbo正式版自带读图能力;Gemini1.5Pro开放API;SD3将于4月中旬发布;抖音宫崎骏AI特效爆火
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI新鲜事 OpenAI发...
-
陈巍:LLaMA-2的多模态版本架构与训练详解(收录于GPT-4/ChatGPT技术与产业分析)
陈巍:2023年9月,Meta的研究人员推出了AnyMAL(任意模态增强语言模型,Any-Modality Augmented Language Model)。该模型能够理解多种模态信号并生成文本回应,即多模态输入,单模态输出。输入的模态可包括图像、视频、...
-
tldraw官网体验入口 免费在线AI即时协作绘图工具使用地址
tldraw是一款免费的、即时协作的绘图工具。它提供了丰富的图形元素和绘图功能,可以帮助用户快速创建各种类型的图表和流程图。tldraw 允许用户在白板上绘制 UI,并使用 GPT-4 Turbo 和 Vision 来生成由真实代码支持的工作网站。它支持多...
-
Devin背后技术浮出水面!居然是OpenAI推出新版本GPT-4 Vision!网友:这视觉版本,正是我想要的!
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 就在今天,GPT-4推出重磅更新!带视觉能力的GPT-4面向大众公开了! 图片 MiraOpenAI首席技术官Mira在推特上公布了这一消息。 图片 据OpenAI API官方介绍...
-
每周AI新闻(2024年第11周)Meta公布Llama 3集群细节 | Sora将于年内推出 | 全球首个AI软件工程师发布
这里是陌小北,一个正在研究硅基生命的碳基生命。正在努力成为写代码的里面背诗最多的,背诗的里面最会写段子的,写段子的里面代码写得最好的…厨子。 每周日解读每周AI大事件。 欢迎关注同名公众号【陌北有棵树】,关注AI最新技术与资讯。 大厂动向 M...
-
刚刚,Mistral AI最新磁力链放出!8x22B MoE模型,281GB解禁
【新智元导读】初创团队Mistral AI再次放出一条磁力链,281GB文件解禁了最新的8x22B MoE模型。 一条磁力链,Mistral AI又来闷声不响搞事情。 281.24GB文件中,竟是全新8x22B MOE模型! 全新MoE模型共有56层,...
-
Llama架构比不上GPT2?神奇token提升10倍记忆?
一个 7B 规模的语言模型 LLM 能存储多少人类知识?如何量化这一数值?训练时间、模型架构的不同将如何影响这一数值?浮点数压缩 quantization、混合专家模型 MoE、以及数据质量的差异 (百科知识 vs 网络垃圾 又将对 LLM 的知识容量...
-
美国新法案要AI公司透露用于训练AI模型受版权保护的作品
美国国会于周二提出了一项法案,旨在强制人工智能公司透露他们用于训练生成 AI 模型的受版权保护的材料。这项立法进一步加入了立法者、新闻机构和艺术家为了确定 AI 公司如何使用诸如歌曲、视觉艺术、书籍和电影等创作作品来训练他们的软件,并且这些公司是否违法侵犯...
-
GPT-5:我们期待看到的4个新功能
尽管我们不知道GPT-5何时发布,但是我们依然可以期待一下GPT-5的新功能。 OpenAI的GPT-4目前是市场上最好的生成式AI工具,但这并不意味着我们不展望未来。随着OpenAI首席执行官Sam Altman定期暗示GPT-5的信息,似乎我们不久将...
-
大概是最全的开源大模型LLM盘点了吧!
LLM(Large Language Model, 大型语言模型 是指那些规模庞大、参数数量众多的深度神经网络模型,用于理解和生成自然语言文本。在自然语言处理(NLP)领域有着广泛的应用,因其强大的语言理解和生成能力,能够处理各种复杂的文本任务,包括但不...
-
JAVA项目接入百度文心一言文本对话功能
依赖 <dependency> <groupId>com.squareup.okhttp3</groupId> <artifactId>okh...