长上下文窗口 - AIGC资讯

震撼发布 - 本地运行最强开源大模型Llama 3整合包，创作无限可能！

4月19日，全球科技、社交巨头Meta在官网，正式发布了开源大模型——Llama-3。为了让大家能更好地享受开源大模型带来的便利，今天Glen特地给大家制作并分享一个Llama-3-8B大模型整合包。 Llama 3简介 Meta本次开源了8B和7...

人工智能 2024-06-17 人工智能

883阅读

英伟达赢麻了！马斯克xAI超级算力工厂曝光，10万块H100、数十亿美元

最近几年，随着大语言模型的飞速发展与迭代，科技巨头们都竞相投入巨额财力打造超级计算机（或大规模 GPU 集群）。他们认为，更强大的计算能力是实现更强大 AI 的关键。早在 2022 年，Meta 即宣布与英伟达共同打造大型 AI 研究超级计算机「AI...

AIGC 2024-05-27 人工智能

827阅读

【AIGC调研系列】kimi与其他AI助手相比的优势和劣势是什么

Kimi与其他AI助手相比，具有以下优势和劣势：优势：服务稳定性：Kimi的服务在境内，使用稳定[2]。多客户端支持：支持网页、APP、小程序等多个客户端，提高了用户的使用便捷性[2][4]。中文处理能力：Kimi在中文处理方面表现出色...

大数据 2024-04-07 人工智能

5764阅读

OpenAI竞对用256轮对话「灌醉」大模型，Claude被骗造出炸弹！

大模型又被曝出安全问题？这次是长上下文窗口的锅！今天，Anthropic发表了自己的最新研究：如何绕过LLM的安全限制？一次越狱不够，那就多来几次！图片论文地址：https://www-cdn.anthropic.com/af5633c94ed2...

AIGC 2024-04-03 人工智能

923阅读

LLM超长上下文查询-性能评估实战

在大型语言模型（LLM）的应用中，有几个场景需要以结构化的方式呈现数据，其中信息提取和查询分析是两个典型的例子。我们最近通过更新的文档和一个专门的代码仓库强调了信息提取的重要性。对于查询分析，我们同样更新了相关文档。在这些场景中，数据字段可能包括字符串、...

生成式AI 2024-04-03 人工智能

838阅读

Mamba超强进化体一举颠覆Transformer！单张A100跑140K上下文

之前引爆了AI圈的Mamba架构，今天又推出了一版超强变体！人工智能独角兽AI21 Labs刚刚开源了Jamba，世界上第一个生产级的Mamba大模型！ Jamba在多项基准测试中表现亮眼，与目前最强的几个开源Transformer平起平坐。特别是...

大数据 2024-03-29 人工智能

924阅读

又一国产大模型火了！Kimi每天获客成本超20万元

快科技3月25日消息，近日，月之暗面推出的国产大模型Kimi爆火出圈，由于使用量激增，这家公司的网络一度陷入瘫痪。今日，据媒体报道，有投资人透露，目前Kimi用户获客成本达到12元-13元，根据下载量预估，Kimi近一个月来日均下载量为17805。按此...

大数据 2024-03-25 人工智能

789阅读

国产大模型kimi chat突然火了 Kimi概念股都有哪些？

3 月 21 日，三大指数集体高开高走。受Kimi的催化，影视院线板块在内的Kimi概念股盘中走高，影视院线板块延续昨日涨势，开盘后迅速拉升走强。影视ETF（159855）领涨，截至发稿，该ETF涨3.45%，成交额突破 810 万元，换手率13.98%...

生成式AI 2024-03-21 人工智能

808阅读

百万token上下文窗口也杀不死向量数据库？CPU笑了

“Claude 3、Gemini 1.5，是要把RAG（检索增强生成）给搞死了吗？” 随着新晋大语言模型们的上下文窗口（Context Window）变得越发得长，业界人士针对“RAG终将消亡”观点的讨论也是愈演愈烈。之所以如此，是因为它们二者都是为...

AIGC 2024-03-20 人工智能

795阅读

谷歌10M上下文窗口正在杀死RAG？被Sora夺走风头的Gemini被低估了？

要说最近最郁闷的公司，谷歌肯定算得上一个：自家的 Gemini 1.5 刚刚发布，就被 OpenAI 的 Sora 抢尽了风头，堪称 AI 界的「汪峰」。具体来说，谷歌这次推出的是用于早期测试的 Gemini 1.5 的第一个版本 ——Gemini 1...

生成式AI 2024-02-27 人工智能

856阅读

这款对标ChatGPT的国产MoE大模型重磅更新！集AI对话、AI绘画、AI阅读、AI写作于一体！

大家好，我是木易，一个持续关注AI领域的互联网技术产品经理，国内Top2本科，美国Top10 CS研究生，MBA。我坚信AI是普通人变强的“外挂”，所以创建了“AI信息Gap”这个公众号，专注于分享AI全维度知识，包括但不限于AI科普，AI工具测评，AI效...

大数据 2024-02-26 人工智能

1114阅读

「天工2.0」MoE大模型发布

2月6日，昆仑万维正式发布新版MoE大语言模型「天工2.0」与新版「天工AI智能助手」APP，这是国内首个搭载MoE架构并面向全体C端用户免费开放的千亿级参数大语言模型AI应用。用户即日起可在各手机应用市场下载「天工AI智能助手」APP，体验昆仑万维「天...

AIGC 2024-02-06 人工智能

927阅读

昆仑万维发布「天工2.0」MoE大模型新增多款 AI Agent

昆仑万维发布了新版 MoE 大语言模型「天工2.0」和新版「天工 AI 智能助手」APP。这是国内首个搭载 MoE 架构并免费向 C 端用户开放的大语言模型应用。用户可以在各手机应用市场下载「天工 AI 智能助手」APP，体验「天工2.0」的卓越性能。「...

生成式AI 2024-02-06 人工智能

1011阅读

AIGC内容分享(四十一)：国内AIGC独角兽冲出几家？

目录 2023年新晋AI独角兽智谱AI：清华计算机系KEG科研成果百川智能：原搜狗CEO王小川创业项目零一万物：李开复筹建的新项目 Minimax：前商汤副总裁创业项目结尾： 2023年新晋AI独角兽根据IT桔子数据，截...

生成式AI 2024-01-21 人工智能

913阅读

Transformer的无限之路：位置编码视角下的长度外推综述

在自然语言处理（Natural Language Processing，NLP）领域，Transformer 模型因其在序列建模中的卓越性能而受到广泛关注。然而，Transformer 及在其基础之上的大语言模型（Large Language Model...

大数据 2024-01-15 人工智能

897阅读

【LLM】大语言模型学习之LLAMA 2：Open Foundation and Fine-Tuned Chat Model

大语言模型学习之LLAMA 2：Open Foundation and Fine-Tuned Chat Model 快速了解预训练预训练模型评估微调有监督微调（SFT）人...

大数据 2023-12-18 人工智能

998阅读

【LLM系列之LLaMA2】LLaMA 2技术细节详细介绍！

Llama 2 发布！ Meta 刚刚发布了 LLaMa 2，它是 LLaMA 的下一代版本，具有商业友好的许可证。?? LLaMA 2 有 3 种不同的尺寸：7B、13B 和 70B。 7B & 13B 使用与 LLaMA 1 相同的架构，并且是...

大数据 2023-11-29 人工智能

1493阅读

百川智能发布“鹏城-百川·脑海33B”大模型具备128K长窗口

百川智能与鹏城实验室宣布合作研发基于国产算力的最长窗口大模型。该合作突破了国产算力大模型的技术限制，对国内大模型企业发展具有示范作用。合作双方将充分发挥各自优势，助力中国大模型创新，推动本土大模型开源开放，为智能化转型提供支持。合作研发的大模型 “鹏...

大数据 2023-11-17 人工智能

746阅读

李开复领队开源大模型 Yi，40万字上下文窗口破纪录

由李开复博士亲自下场创办的零一万物（01.ai），自3月底官宣成立后，于近日发布并开源了两个版本的中英文大模型 Yi-6B 和 Yi-34B。在线上发布环节，李开复博士重点介绍了 Yi 系列大模型的三处性能亮点: 全球最长200K 上下文窗口，免费开...

AIGC 2023-11-06 人工智能

983阅读

全球最强长文本大模型，一次可读35万汉字：Baichuan2-192K上线

国内大模型创业公司，正在技术前沿创造新的记录。 10 月 30 日，百川智能正式发布 Baichuan2-192K 长窗口大模型，将大语言模型（LLM）上下文窗口的长度一举提升到了 192K token。这相当于让大模型一次处理约 35 万个汉字，长度...

AIGC 2023-11-01 人工智能

947阅读

Meta普林斯顿提出LLM上下文终极解决方案！让模型化身自主智能体，自行读取上下文节点树

到底什么才是LLM长上下文模型的终极解决方案？最近由普林斯顿大学和Meta AI的研究者提出了一种解决方案，将LLM视为一个交互式智能体，让它决定如何通过迭代提示来读取文本。论文地址：https://arxiv.org/abs/2310.05029...

AIGC 2023-10-24 人工智能

962阅读