-
基于大模型的原神对话系统尝试
一.简介 该项目为一次大模型+游戏的尝试,成功实现了一个与原神内角色的对话系统。 演示视频:https://www.bilibili.com/video/BV1b48CeuELL github地址:https://github.com/goodlu...
-
阿里开源新语音模型,比OpenAI的Whisper更好!
阿里巴巴在Qwen-Audio基础之上,开源了最新语音模型Qwen2-Audio。 Qwen2-Audio一共有基础和指令微调两个版本,支持使用语音向音频模型进行提问并识别内容以及语音分析。 例如,让一位女生说一段话,然后识别她的年纪或解读她的心情;发布一...
-
在本地部署 Stable Diffusion:详细教程
第一步:环境准备 1、安装 Python 和 Conda 确保您的计算机上已安装 Python 3.x 版本。 如果您使用 Conda 进行环境管理,请安装 Miniconda 或 Anaconda。 2、创建和激活虚拟环境 打开命令行终端,并执...
-
大规模语言模型从理论到实践 LLaMA的模型结构
1.背景介绍 随着人工智能技术的不断发展,大规模语言模型(Large Language Models, LLMs)已经成为自然语言处理领域的热点。这些模型通过在大规模数据集上进行训练,能够生成连贯、相关且有趣的文本输出。LLaMA 是 Meta AI 开...
-
ai写作软件推荐哪个?选这6个让写作变得简单又高效
转眼间已到了四月中旬,部分大学生们还在为毕业论文犯愁。 选题、构思、撰写,每一步都充满了挑战与困扰。时间紧迫、思路枯竭、文笔不济……这些问题成了许多毕业生心中的“拦路虎”,让人望而生畏。 别担心!今天来给大家安利6款超好用的AI写作生成软件,让它们...
-
研究发现:OpenAI 的 GPT-4 在金融分析领域具有 “相对优势”:
根据芝加哥大学布斯商学院的一项研究,OpenAI 的 GPT-4在金融分析和预测方面超越了人类分析师,即使没有行业特定信息。这项研究上周公布,发现 GPT-4这一大型语言模型在分析财务报表和预测未来收益方面表现出色。研究称:“即使没有任何叙述或行业特定信息...
-
OpenAI正训练GPT-4的继任者,GPT-5或将带来三个重大升级
虽然 OpenAI 最近推出的模型 GPT-4o 在大型语言模型(LLM)领域有了重大突破,但该公司已经开始着手研发下一个旗舰模型 GPT-5。许多人在 GPT-4o 发布前期就期待着 OpenAI 推出备受瞩目的 GPT-5。为了澄清这种猜测,首席执行官...
-
时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3
这几天,全世界的目光仿佛都被OpenAI发布的GPT-4o所吸引,与此同时,OpenAI的挑战者们也在同步创造历史。 就在5月14日,阿布扎比先进技术研究委员会(ATRC)下属的技术创新研究所(TII),发布了新一代的Falcon 2模型。 Falco...
-
腾讯和字节的幽灵在中国AI的上空徘徊
2023 年 4 月,产品经理松鹅(化名)从腾讯离职两天后,就从深圳来到北京,加入一家基座大模型的初创公司。彼时,这家公司还没什么资本追捧和用户声量,只有一个听起来挺拗口的中文名字:月之暗面。 那时候这家公司的产品团队,只有松鹅一个人。 同月,曾经在字节跳...
-
Anthropic Claude 3 Opus基础模型在Amazon Bedrock上正式可用
北京——2024年4月17日 亚马逊云科技宣布,在Amazon Bedrock上正式推出来自Anthropic的Claude 3 Opus模型,该模型是Claude 3家族中最智能的模型,在高度复杂的任务上表现卓越,并拥有惊人的流畅性和类似人类的理解能力...
-
web前端框架设计第三课-基础特性
web前端框架设计第三课-基础特性 一.预习笔记 1.Vue实例 每个Vue.js的应用都需要通过构造函数创建一个Vue的实例 语法格式:var 实例名=new Vue({} 特性1–挂载元素:Vue的实例需要...
-
Claude 3 Haiku官网体验入口 企业级AI模型软件工具app免费使用地址
Claude 3 Haiku是Anthropic公司最新推出的企业级AI模型,具有出色的视觉能力和卓越的基准测试表现。以下是关于该模型的详细介绍: 点击前往「Claude 3 Haiku」官网体验入口 Claude 3 Haiku特点 快速处理和分析...
-
CIO指南:实现生成式AI“高光时刻”的五种方法
尽管目前存在各种炒作以及主流采用程度很高,但在走上生产力巅峰之路之前,生成式AI仍然需要经历幻灭的低谷期。 生成式AI的快速普及和民主化,有些类似于近150年前灯泡给电力领域带来的影响是一样的。1831年电问世,几十年之后在1879年灯泡问,与之类似的...
-
自然语言生成任务中的五种采样方法介绍和Pytorch代码实现
在自然语言生成任务(NLG 中,采样方法是指从生成模型中获取文本输出的一种技术。本文将介绍常用的5中方法并用Pytorch进行实现。 1、Greedy Decoding Greedy Decoding在每个时间步选择当前条件概率最高的词语作为输出,直到...
-
文心一言 ChatGPT 实测对比
期待已久之后,终于拿到了文心一言的邀请码,第一时间进行了测试。最后面会讲一下如何获取邀请码。 先说一下结论,很远,但是又不远。 很远是因为:我个人测试得出来的实际效果和ChatGPT差距还很大,下面我会放一些对比。当然也有很多正面例子,回答和Ch...
-
2023-12-12 AIGC-AI工具的基本工作原理
摘要: 2023-12-12 AIGC-AI工具的基本工作原理 AI工具的基本工作原理 AI工具的基本工作原理涉及到一系列复杂的技术和算法。这些原理可以根据不同类型的AI工具进行概括,包括机器学习、自然语言处理、图像识别等。以下是一些关键的A...
-
一文搞懂使用 Arthur Bench 进行 LLM 评估
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估 。 一、传统文本评估面临的挑战 近年来,随着大型语言模型(LLM 的快速发展和改进,传统的文本评估方法在某些方面可能已经不再适用。在文本评估领...
-
多模态LLM多到看不过来?先看这26个SOTA模型吧
当前 AI 领域的关注重心正从大型语言模型(LLM)向多模态转移,于是乎,让 LLM 具备多模态能力的多模态大型语言模型(MM-LLM)就成了一个备受关注的研究主题。 近日,腾讯 AI Lab、京都大学和穆罕默德・本・扎耶德人工智能大学的一个研究团队发布...
-
英伟达Jim Fan最新TED演讲上线:AI下一个前沿是「基础智能体」!
「AI的下一个前沿将是『基础智能体』(Foundation Agent)——一个掌握广泛技能,控制许多身体,并能够泛化到多个环境中的单一算法」。 等了三个月,英伟达高级科学家Jim Fan在TED AI 2023上的演讲视频终于上线了。 视频中,Jim...
-
世界顶尖多模态大模型开源!又是零一万物,又是李开复
领跑中英文两大权威榜单,李开复零一万物交出多模态大模型答卷! 距离其首款开源大模型Yi-34B和Yi-6B的发布,仅间隔不到三个月的时间。 模型名为Yi Vision Language(Yi-VL),现已正式面向全球开源。 同属Yi系列,同样具有两个版本...
-
GoVoice官网体验入口 AI语音转文本与文本生成工具在线使用地址
GoVoice是一款结合了先进人工智能技术的语音转文本和文本生成工具,特别适合个人创作者、小型企业和人手有限的团队。这款工具能够将用户的语音录制内容转换为文本,并在几分钟内完成文本生成,极大地节省了时间和提高了工作效率。GoVoice还支持文本的再利用,优...
-
ChatGPT 为 Midjourney 或 DALL-E 等 AI 艺术生成提示
人工智能为创意产业开辟了一个充满可能性的全新世界。人工智能最令人兴奋的应用之一是生成独特的原创艺术作品。Midjourney 和 DALL-E 是人工智能生成艺术的两个突出例子,它们已经引起了艺术家和艺术爱好者的关注。在本文中,将探索如何使用 ChatGP...
-
吃了几个原作者才能生成这么逼真的效果?文生图涉嫌视觉「抄袭」
不久之前,《纽约时报》指控 OpenAI 涉嫌违规使用其内容用于人工智能开发的事件引起了社区极大的关注与讨论。 GPT-4 输出的许多回答中,几乎逐字逐句地抄袭了《纽约时报》的报道: 图中红字是 GPT-4 与《纽约时报》报道重复的部分。 对此,各个专...
-
正式发布!ERNIE Bot SDK:轻松调用文心一言能力(含token福利)
ERNIE Bot SDK提供便捷易用的接口,可以调用文心一言的能力,包含文本创作、通用对话、语义向量、AI作图等,具体支持接入功能如下: 对话补全(Chat Completion) 函数调用(Function Calling) 语...
-
Video-LLaMA An Instruction-tuned Audio-Visual Language Model for Video Understanding 用于视频理解的指令调谐视听语言
1.摘要 我们提出了一个多模态框架Video-LLaMA1,它使大型语言模型(LLM 能够理解视频中的视觉和听觉内容。视频-来自冻结的预训练视频和音频编码器和冻结的LLM的美洲驼引导跨模式训练。不像以前的工作,补充线性最小二乘法只处理视觉或听觉信号...
-
ChatGPT的训练数据可以通过“偏离攻击”进行泄露
ChatGPT等大语言模型(LLM)使用来自图书、网站及其他来源的海量文本数据进行训练,通常情况下,训练它们所用的数据是一个秘密。然而,最近的一项研究揭示:它们有时可以记住并反刍训练它们所用的特定数据片段。这个现象名为“记忆”。 随后,来自谷歌Deep...
-
揭秘!我用AI写了一部精彩小说;搭建AI视频创作工作流;一键生成摘要工具清单;大模型创业生死5问 | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 『大型语言模型 (LLM 进化树』追踪近年来语言模型的发展 作者团队梳理了自2018年以来大语言模型的发展历程,并可视化成了这棵树的生长过程。对...
-
用GPT-4V和人类演示训练机器人:眼睛学会了,手也能跟上
如何将语言 / 视觉输入转换为机器人动作? 训练自定义模型的方法已经过时,基于最近大语言模型(LLM)和视觉语言模型(VLM)的技术进展,通过 prompt 工程使用 ChatGPT 或 GPT-4 等通用模型才是时下热门的方法。 这种方法绕过了海量数据...
-
AI风暴 :文心一言 VS GPT-4
?wei_shuo的个人主页 ?wei_shuo的学习社区 ?Hello World ! 文心一言 VS GPT-4 文心一言:知识增强大语言模型百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问...
-
如何使用 ChatGPT 为 Midjourney 或 DALL-E 等 AI 图片生成提示词
人工智能为创意产业开辟了一个充满可能性的全新世界。人工智能最令人兴奋的应用之一是生成独特且原创的艺术品。Midjourney 和 DALL-E 是人工智能生成艺术的两个突出例子,吸引了艺术家和艺术爱好者的注意。在本文中,我们将探索如何使用 ChatGPT...
-
研究人员教会GPT-4V使用iPhone并在亚马逊应用程序上购物
在当今智能手机技术不断发展的世界中,对能够导航和与移动应用程序复杂界面进行交互的人工智能的需求不断增加。MM-Navigator通过使用GPT-4V代理来满足这一需求,该代理结合了图像处理和文本推理,使其能够在iPhone上执行购物任务。本文将着重介绍MM...
-
谷歌DeepMind爆火动画18秒解释LLM原理,网友蒙圈!组团求GPT-4下场分析
Google DeepMind最近在自己的视频博客上上传了一段视频,「简单明了地」演示了大语言模型的工作原理,引发了网友的激烈讨论。 网友看了之后纷纷表示: 「终于,他们发了点普通人能看懂的东西了」。 「哦豁,这下懂了」 「对,就是这么简单!」 「太...
-
让大模型自主探索开放世界,北大&智源提出训练框架LLaMA-Rider
大语言模型因其强大而通用的语言生成、理解能力,展现出了成为通用智能体的潜力。与此同时,在开放式的环境中探索、学习则是通用智能体的重要能力之一。因此,大语言模型如何适配开放世界是一个重要的研究问题。 北京大学和北京智源人工智能研究院的团队针对这个问题提出了...
-
使用 Go-OpenAI 轻松调用 ChatGPT:释放无限创造力!
我今天要和大家分享一个令人兴奋的话题——使用 go-openai 调用 chatGPT。如果你是一个技术爱好者,对人工智能和自然语言处理感兴趣,那么你一定不能错过这篇文章! chatGPT:打破创造力的边界 首先,让我们来了解一下 ChatGPT 是什么...
-
多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟
视觉幻觉是常见于多模态大语言模型(Multimodal Large Language Models, MLLMs)的一个典型问题。 简单来说就是:模型输出的描述与图片内容不相符。 下图中体现了两种幻觉,红色部分错误地描述了狗的颜色(属性幻觉),蓝色部分描...
-
在视觉提示中加入「标记」,微软等让GPT-4V看的更准、分的更细
最近一段时间,我们见证了大型语言模型(LLM)的显著进步。特别是,生成式预训练 Transformer 或 GPT 的发布引领了业界和学术界的多项突破。自 GPT-4发布以来,大型多模态模型 (LMM 引起了研究界越来越多的兴趣,许多工作致力于构建多模态...