语言模型第46页

【AI项目实战】某语言模型-stable diffusion-vits-cqhttp 实现能对话能语音能绘画的Q群机器人

好久没写文章了，终于想起来我有个博客账号系列。。项目已开源在github上。文章已滤敏，一切涉及语言模型名字的内容都以某语言模型代替提示：AI绘画部分建议6G显存以上。 cqhttp 用于接收群友消息，并回复消息。某语言模型...

大数据 2023-12-22 人工智能

810阅读

我的大模型观：我眼中的LLM

文章目录大模型是有智能的。也许，大模型是一场骗局？从头训练or微调我想象中的大模型架构大厂的大模型中小厂和个人开发该何去何从？今年，大模型火的一塌糊涂。最近几个月paper with code上，前几名的论文几乎都是生成模...

人工智能 2023-12-22 人工智能

875阅读

【前沿技术】文心一言 PK Chat Gpt

目录写在前面一、文心一言二、Chat GPT 三、对比四、总结写在前面随着人工智能技术的不断发展和普及，越来越多的智能应用走入了人们的日常生活，如智能语音助手、智能客服、机器翻译等等。在这些应用...

生成式AI 2023-12-21 人工智能

1119阅读

Llama 架构分析

从代码角度进行Llama 架构分析 Llama 架构分析前言 Llama 架构分析分词网络主干 DecoderLayer Attention MLP 下游任务因果推理文本分类 Llama 架构分析...

AIGC 2023-12-21 人工智能

860阅读

Video-LLaMA An Instruction-tuned Audio-Visual Language Model for Video Understanding 用于视频理解的指令调谐视听语言

1.摘要我们提出了一个多模态框架Video-LLaMA1，它使大型语言模型(LLM 能够理解视频中的视觉和听觉内容。视频-来自冻结的预训练视频和音频编码器和冻结的LLM的美洲驼引导跨模式训练。不像以前的工作，补充线性最小二乘法只处理视觉或听觉信号...

人工智能 2023-12-21 人工智能

1137阅读

AI视野：Midjourney V6史诗级升级;ChatGPT新增存档聊天记录功能;阿里DreaMoving开源；百度千帆AppBuilder开放

???AI新鲜事 Midjourney V6史诗级升级，网友惊呼太逼真! 网友在Midjourney V6第二次社区评价中惊叹其逼真神图，光影效果出众，上线倒计时，可能在今明两天内发布。 ChatGPT新增存档聊天记录功能 12月21日，OpenAI在...

人工智能 2023-12-21 人工智能

1219阅读

开发者笑疯了！ LLaMa惊天泄露引爆ChatGPT平替狂潮，开源LLM领域变天

来源: 新智源微信号：AI-era Meta的LLaMA模型开源，让文本大模型迎来了Stable Diffustion时刻。谁都没想谁能想到，一次意外的LLaMA泄漏，竟点燃了开源LLM领域最大的创新火花。一系列表现出色的Chat...

大数据 2023-12-21 人工智能

971阅读

四分钟成功复现诺奖！CMU开发GPT-4化学家，自主编码操控机器人颠覆化学研究登Nature

ChatGPT大模型爆火这一年，没想到竟颠覆了整个化学领域。先是谷歌DeepMind的AI工具GNoME成功预测出200万种晶体结构，随后微软推出的MatterGen，大大加速了设计所需材料特性的速度。今天，CMU和Emerald Cloud Lab...

AIGC 2023-12-21 人工智能

928阅读

开源与闭源大模型之战：Llama 2 vs. GPT-4 vs. Claude-2

人工智能一直在以惊人的速度发展，特别是在自然语言处理（NLP）领域。这场革命的领跑者包括三种杰出的人工智能语言模型：Llama 2、GPT-4 和 Claude-2。在这篇博客中，我们将探索这些人工智能巨头，了解他们独特的能力以及他们对各个领域的潜在影响...

人工智能 2023-12-21 人工智能

919阅读

AIGC星辰大海：大模型工程师和产品专家深度训练营（第五期）即将开班

近屿智能OJAC第五期“AIGC星辰大海：大模型工程师和产品专家深度训练营”即将开班。近屿智能OJAC秉承着“别人教你使用AIGC工具，例如ChatGP7和MJ，我们教您预训练和微调大模型以及开发软/硬件AI产品”的服务理念，已经帮助数千位学员成功...

人工智能 2023-12-21 人工智能

1007阅读

开创全新通用3D大模型，VAST将3D生成带入「秒级」时代

生成式 AI 在3D 领域在很长一段时间内都在等待自己的「ChatGPT」时刻。传统3D 建模涉及游戏、影视、建筑等多个行业，普遍依赖专业人员手动操作，生产周期短则几天，多则以月为单位，单个3D 模型的创建成本至少需要几千元。生成式 AI 技术在2D 图...

生成式AI 2023-12-21 人工智能

1001阅读

together.ai让AI模型训练快9倍，获NVIDIA参投1.025亿美元A轮融资

目前获得融资最多的两家大模型创业公司是OpenAI和Anthropic，而这两家公司最大的投资者分别是微软和亚马逊，他们投资的很大一部分不是资金，而是等值的云计算资源。这其实也就把这两家顶尖的闭源大模型公司“绑上了”科技巨头的“战车”。在闭源大模型之外，...

大数据 2023-12-21 人工智能

977阅读

不到4分钟，这个GPT驱动的“化学家”能制造药物，还能复现诺奖研究！研究登Nature

你有没有想过，可能就在你阅读这篇文章的几分钟内，获得诺贝尔奖的化学反应就能被完美复刻出来。是的，你没有听错，现在由AI驱动的系统已经能够自主了解这些化学反应，甚至设计出了实验室程序来制造它们。人工智能在短短几分钟内就完成了这一切，并且一次尝试就...

大数据 2023-12-21 人工智能

883阅读

研究：大模型在回答中会重复有害的错误信息

对大型语言模型的新研究表明，它们重复了阴谋论、有害的刻板印象和其他形式的错误信息。在最近的一项研究中，滑铁卢大学的研究人员系统地测试了 ChatGPT 早期版本对六类陈述的理解:事实、阴谋、争议、误解、刻板印象和虚构。这是滑铁卢研究人员研究人机交互并探索...

人工智能 2023-12-21 人工智能

885阅读

11 位作家加入针对 OpenAI 和微软的诉讼

11位非虚构作家，包括普利策奖得主泰勒·布兰奇（Taylor Branch）、斯泰西·舍夫(Stacy Schiff 和凯·伯德(Kai Bird 等人，已加入了一起针对OpenAI和微软的侵权诉讼。图源备注：图片由AI生成，图片授权服务商Midjou...

AIGC 2023-12-21 人工智能

787阅读

全面合作：传媒业巨头与OpenAI寻求共赢

12月13日，OpenAI与欧洲最大的数字出版公司施普林格Axel Springer宣布战略合作。这是继媒体联盟一再发起抵制AI厂商的抗议以来，首例传媒巨头与AI厂商从版权、技术及商业模式上的全方位战略合作。本文梳理了此次合作带给新闻业的重要意义，与合作...

生成式AI 2023-12-21 人工智能

903阅读

如何用ChatGPT把控应用程序生命周期

译者 | 朱先忠审校 | 重楼简介在本文中，我们将从基础设施供应到配置管理和部署等各个环节来全方位探讨大型语言模型（LLM）是否适合应用于实际应用程序的生命周期开发。这项工作产生的源代码工程已经在GitHub上公开（［参考资料11］）。基础设施即代...

大数据 2023-12-21 人工智能

871阅读

AIGC相关知识记录-1. 上手ChatGPT

AIGC系列文章目录文章目录 AIGC系列文章目录前言一、半小时上手ChatGPT 二、行业黑话 1. LLM（大语言模型） 2. few-shot prompt（少样本提示） 3. temperature（温度）三、运用...

AIGC 2023-12-21 人工智能

789阅读

ChatGPT、文心一言、New Bing介绍，以及如何选用。新时代，起风了

这里写自定义目录标题 ChatGPT 平台介绍特点 New Bing 平台介绍特点文心一言平台介绍特点总结随着互联网、物联网技术的发展，人工智能在各行各业中的应用越来越广泛，同时也取得了突破性的进展。以微软小冰...

人工智能 2023-12-21 人工智能

1068阅读

微软Azure发布GPT-RAG，为LLM部署提供超智能解决方案

微软Azure最近推出了GPT-RAG，这是一项超智能的解决方案，旨在让大型语言模型（LLMs）在企业中更加顺畅地运行。随着人工智能的不断发展，对LLMs的需求因其理解和生成类似人类文本的能力而迅速增长。然而，在企业中使这些工具正常运行并不容易。我们需要确...

人工智能 2023-12-20 人工智能

879阅读

研究发现，GPT 和其他 AI 模型无法分析 SEC 备案文件

一家名为 Patronus AI 的初创公司的研究人员发现，大型语言模型在分析美国证券交易委员会（SEC）备案文件时经常无法正确回答问题。即使是表现最佳的人工智能模型配置 OpenAI 的 GPT-4-Turbo，当给予几乎整个备案文件的阅读能力和相关问题...

人工智能 2023-12-20 人工智能

843阅读

ggerganov/llama.cpp 编译

ggerganov/llama.cpp - 编译出main可执行程序依赖以下的源代码文件如果想在 Windows 系统编译出 llama.cpp 项目（这个是github上的仓库， ggerganov/llama.cpp ），需要在Visual St...

大数据 2023-12-20 人工智能

1155阅读

【EMNLP 2023】面向垂直领域的知识预训练语言模型

近日，阿里云人工智能平台PAI与华东师范大学数据科学与工程学院合作在自然语言处理顶级会议EMNLP2023上发表基于双曲空间和对比学习的垂直领域预训练语言模型。通过比较垂直领域和开放领域知识图谱数据结构的不同特性，发现在垂直领域的图谱结构具有全局稀疏，局部...

生成式AI 2023-12-20 人工智能

878阅读

日本初创公司 Preferred Networks 设计自己的 AI 芯片，以克服瓶颈问题

日本初创公司 Preferred Networks 正在加大对定制人工智能芯片的投资，以确保在生成式人工智能的进步中获得关键硬件。图源备注:图片由AI生成，图片授权服务商Midjourney 该公司的投资者包括丰田和发那科等大型企业。Preferred...

AIGC 2023-12-20 人工智能

880阅读

摸底谷歌Gemini：CMU全面测评，Gemini Pro不敌GPT 3.5 Turbo

前段时间，谷歌发布了对标 OpenAI GPT 模型的竞品 ——Gemini。这个大模型共有三个版本 ——Ultra（能力最强）、Pro 和 Nano。研究团队公布的测试结果显示，Ultra 版本在许多任务中优于 GPT4，而 Pro 版本与 GPT-3...

人工智能 2023-12-20 人工智能

869阅读

copilot 逆向

原文： copilot-explorer | Hacky repo to see what the Copilot extension sends to the server 对我来说，Github Copilot 极其有用。它经常能神奇地读懂我的...

人工智能 2023-12-20 人工智能

879阅读

前OpenAI首席科学家Ilya: 只要能够预测下一个token，人类就能达到AGI

近日，Nature将前OpenAI首席科学家Ilya Sutskever评为「2023年10大科学人物」。这位刚刚因为OpenAI巨变而远离聚光灯的「AI技术灯塔」，似乎并没有做好准备回到公众视野之中。 Nature在介绍他的长文中说「Ilya拒绝了N...

生成式AI 2023-12-20 人工智能

807阅读

你真的会写 Prompt ? 剖析 RAG 应用中的指代消解

随着 ChatGPT 等大语言模型(LLM 的不断发展，越来越多的研究人员开始关注语言模型的应用。其中，检索增强生成（Retrieval-augmented generation，RAG）是一种针对知识密集型 NLP 任务的生成方法，它通过在生成过程中...

AIGC 2023-12-20 人工智能

834阅读

大语言模型训练数据常见的4种处理方法

本文分享自华为云社区《浅谈如何处理大语言模型训练数据之一常见的数据处理方法》，作者：码上开花_Lancer。大语言模型训练需要数万亿的各类型数据。如何构造海量“高质量”数据对于大语言模型的训练具有至关重要的作用。虽然，截止到2023 年9 月为止，还...

人工智能 2023-12-20 人工智能

1345阅读

创业公司推出AI圣诞老人，孩子可与之进行逼真语音通话

如果人工智能真的来抢人类的工作，那么这个星期可能是个好时机，尤其是帮助地球上最忙碌的人的时候。总部位于西雅图的创业公司Fixie，专注于帮助企业将大型语言模型融入其软件堆栈，推出了HiSanta.ai。这是一个网络体验，让人们可以与圣诞老人、鲁道夫、圣诞...

人工智能 2023-12-20 人工智能

760阅读

研究人员发现，谷歌Gemini表现不如GPT-3.5 Turbo

在近期的一项研究中，来自卡内基梅隆大学和BerriAI的研究团队对Google Gemini Pro进行了深入的评估，并发现其在多项任务中表现不如OpenAI的GPT-3.5Turbo。这一发现无疑是对Google在生成式人工智能领域与OpenAI竞争的雄...

大数据 2023-12-20 人工智能

810阅读

每个开发人员都应该知道的六个生成式AI框架和工具

译者 | 晶颜审校 | 重楼在快速发展的技术领域，生成式人工智能是一股革命性的力量，它改变了开发人员处理复杂问题和创新的方式。本文深入探讨了生成式AI的世界，揭示了对每个开发人员都必不可少的框架和工具。 LangChain LangChain由H...

AIGC 2023-12-20 人工智能

1395阅读

构建企业级大语言模型应用的秘诀：GitHub Copilot 的实践之路

GitHub Copilot 的开发团队分享了他们在构建能够同时为个人和企业用户带来价值的大语言模型（LLM）应用的心得体会。本文经授权转载宝玉老师的个人博客（微博@宝玉xp），链接：https://baoyu.io/translatio...

AIGC 2023-12-20 人工智能

971阅读

MosaicML 推出 30B 模型 — 挑战 LLaMA、Falcon 和 GPT

MosaicML正在推出其第二个开源大型语言模型（LLM），称为MPT-30B，这是继五月份首次推出的较小的MPT-7B模型之后。为了讨论新模型及其对开发人员的意义，我采访了MosaicML联合创始人兼首席执行官Naveen Rao。他之前的创业公司是...

生成式AI 2023-12-20 人工智能

910阅读

ChatGPT的2023：开创人工智能的新纪元

12月16日，The Verge 根据获取的内部文件和 Lark（飞书）聊天记录报道称，字节跳动曾秘密使用 OpenAI 的模型输出文本来训练自己的大语言模型。即便中止使用 GPT 生成文本之后，代号为 Project...

人工智能 2023-12-19 人工智能

771阅读

正面刚ChatGPT，谷歌发布Bard! AI们要battle起来了？

面对ChatGPT的步步紧逼，谷歌终于做出了回应，选择了正面刚。北京时间2月7日凌晨，谷歌CEO桑达尔·皮查伊（Sundar Pichai）宣布谷歌推出了下一代对话AI系统Bard。消息一出，自然引起广泛讨论，ChatGPT的火爆程度有目共睹，...

大数据 2023-12-19 人工智能

934阅读

word2vec作者爆料：seq2seq是我的想法、GloVe抄袭技巧，反击来了

随着 NeurIPS 2023 获奖论文的公布，十年前的词嵌入技术 word2vec 可谓是实至名归的获得了时间检验奖。这篇论文「Distributed Representations of Words and Phrases and their Com...

大数据 2023-12-19 人工智能

784阅读

研究团队开发开源大模型训练框架 Oobleck 提供快速且有保障的故障修复

随着对生成式人工智能技术需求的激增，大型语言模型的训练和容错性要求也在不断增加。为应对这一挑战，密歇根大学的研究人员开发了一款名为Oobleck的开源大型模型训练框架。该框架采用管道模板的概念，为大型模型的预训练提供了快速而可靠的故障恢复机制。项目地址...

生成式AI 2023-12-19 人工智能

857阅读

微软推出机器学习库GPT-RAG

随着人工智能的增长，大型语言模型（LLMs）因其解释和生成类似人类文本的能力而日益受欢迎。然而，将这些工具整合到企业环境中并确保可用性和维护治理是一项具有挑战性的任务。为了解决这一难题，Microsoft Azure推出了GPT-RAG，这是一种专为使用...

AIGC 2023-12-19 人工智能

819阅读

如何在GenAI时代的网络军备竞赛中幸存

GenAI的迅速出现已经改变了网络安全的天平，促使各国政府采取行动，美国总统乔·拜登在10月份发布了一项全面的行政命令(EO 。关于安全、有保障和值得信赖的AI开发和使用的行政命令就如何确保这项新兴技术的安全提供了指导——这是以前的订单所缺乏的，它还...

大数据 2023-12-19 人工智能

841阅读

Gemini自曝文心一言牵出重大难题，全球陷入高质量数据荒？2024年或将枯竭

谷歌Gemini，又出丑闻了！昨天上午，网友们激动地奔走相告：Gemini承认自己是用文心一言训练中文语料的。国外大模型用中国模型产生的中文语料训练，这听起来就是个段子，结果段子竟然成现实了，简直魔幻。微博大V「阑夕」夜亲自下场，在Poe网站上实...

AIGC 2023-12-19 人工智能

812阅读

BlueLM蓝心大模型测试体验入口热门手机AI大模型推荐

BlueLM蓝心大模型是vivo AI全球研究院自主研发的大规模预训练语言模型，具有 70 亿模型参数量，能处理32K上下文长度。它基于260TB的多语言训练语料，提供了强大的语言理解能力，并可广泛应用于内容创作、知识问答、逻辑推理、代码生成等场景，持续为...

生成式AI 2023-12-19 人工智能

856阅读

丹麦 AI 模型预测死亡率准确度超保险公司，引发被滥用担忧

12 月 19 日消息，丹麦科技大学的苏尼・莱曼・乔根森及其团队开发了一款强大的人工智能模型，可以根据个人数据预测死亡率，准确度远超现有的任何模型，甚至包括保险业使用的模型。研究人员表示，该模型能提前预警健康和社会问题，也需要警惕其被大型企业滥用。乔...

AIGC 2023-12-19 人工智能

757阅读

Mistral AI CEO宣布于2024年开源GPT-4级别模型

法国初创公司Mistral AI的首席执行官Arthur Mensch在法国国家广播电台宣布，公司计划于2024年开源GPT-4级模型，引发了业界的关注。最近，Mistral AI推出了基于MoE架构的8X7B模型，与GPT3.5和Llama270B等其...

大数据 2023-12-19 人工智能

870阅读

大语言模型之四-LlaMA-2从模型到应用

最近开源大语言模型LlaMA-2火出圈，从huggingface的Open LLM Leaderboard开源大语言模型排行榜可以看到LlaMA-2还是非常有潜力的开源商用大语言模型之一，相比InstructGPT，LlaMA-2在数据质量、培训技术、能力...

大数据 2023-12-19 人工智能

1612阅读

推理性能超H100十倍！21岁华裔小哥哈佛辍学开发AI加速芯片「Sohu」，2人公司估值3400万刀

像Pika一样的神级创业故事又要再次上演了？两位哈佛退学的年轻人，想要制造一款专用于大语言模型加速的AI加速器芯片，将于2024年第三季度交付，推理性能达H100的10倍。在今年6月份，两位创始人Gavin Uberti和Chris Zhu创立了E...

大数据 2023-12-19 人工智能

809阅读

UIUC清华联手发布全新代码大模型Magicoder 不到7B参数

在代码生成领域，UIUC和清华合作发布了Magicoder，这一全新的大型语言模型仅使用了7B参数，却能与顶级模型媲美，并以全面开源的方式分享了其代码、权重和数据。Magicoder的关键在于采用了OSS-INSTRUCT方法，该方法通过从开源代码中获取灵...

大数据 2023-12-19 人工智能

858阅读

AI、零信任、边缘现代化与多云，2024这些技术趋势值得关注

事实上，在这场由ChatGPT激起的新一轮AI浪潮中，全球科技巨头、AI厂商、行业翘楚等纷纷下场，唯恐错过此番科技盛宴。同时，GenAI蓬勃发展产业规模也在高速增长，麦肯锡调查数据显示，2022年GenAI市场收入为400亿美元，预计2027年及203...

生成式AI 2023-12-19 人工智能

833阅读

谷歌AI提出视觉语言模型PixelLLM:能够进行细粒度定位和视觉语言对齐

谷歌AI研究团队与加州大学圣迭戈分校的研究人员合作，提出了一种名为PixelLLM的智能模型，旨在解决大型语言模型在细粒度定位和视觉-语言对齐方面的挑战。这一模型的提出受到了人类自然行为的启发，尤其是婴儿描述其视觉环境的方式，包括手势、指向和命名。 Pix...

生成式AI 2023-12-19 人工智能

898阅读