token 第26页 - AIGC资讯

Groq大模型推理芯片每秒500tokens超越GPU，喊话三年超过英伟达

Groq公司推出的大模型推理芯片以每秒500tokens的速度引起轰动，超越了传统GPU和谷歌TPU。该芯片由初创公司Groq研发，其团队成员来自谷歌TPU，包括创始人兼CEO Jonathan Ross，曾设计实现第一代TPU芯片的核心元件。 Groq采...

生成式AI 2024-02-20 人工智能

903阅读

成为AIGC大模型工程师，如何搭建你的知识体系框架？

Look！?我们的大模型商业化落地产品 ?更多AI资讯请??关注 AI是否真的会取代你的工作，或者是掌握AI技能的人将会取代你？随着2023年AI技术的爆炸式增长，许多人开始质疑，如果不掌握如ChatGPT、Midjourney或Stable Di...

AIGC 2024-02-20 人工智能

965阅读

Gemini一眼识破Sora视频是AI生成？百万token上下文能力碾压GPT-4

当谷歌Gemini 1.5，遇上抢了它头条的「罪魁祸首」Sora会怎么样？这两天，拿到内测资格的AI圈大佬们，纷纷给广大网友来了一波在线测试。这不，Gabor Cselle就让Gemini 1.5去分析了那个著名的樱花雪景视频。对此，Gemini...

AIGC 2024-02-20 人工智能

869阅读

GPT-4可能也在用的推测解码是什么？一文综述前世今生和应用情况

众所周知，大型语言模型（LLM）的推理通常需要使用自回归采样，这个推理过程相当缓慢。为了解决这个问题，推测解码（Speculative Decoding）已经成为 LLM 推理的一种新型采样方法。这种方法在每个采样步骤中，会先预测几个可能的 token，...

AIGC 2024-02-20 人工智能

861阅读

大模型幻觉的起因、评估及落地场景下基于知识图谱的缓解策略探索

针对大模型落地应用的问题，当前行业内普遍的做法是利用大模型进行问答，但在实际应用中，这种方法往往效果不佳，很多问题的答案并不具有实际参考价值。作为算法人员，我们需要深入了解问题的来源，对于大模型产生的幻觉问题，我们需要明确其定义，是主观的还是客观的，并探...

生成式AI 2024-02-20 人工智能

1126阅读

SIMPL：用于自动驾驶的简单高效的多智能体运动预测基准

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for Autonomous Driving 论文链接...

AIGC 2024-02-20 人工智能

1015阅读

【AI大模型应用开发】0.1 百度文心一言 API接入详细步骤和简单应用

大家好，我是【同学小张】。持续学习，持续干货输出，关注我，跟我一起学AI大模型技能。最近我的OpenAI的API key由于调用次数太多被封了… 不知道下个月能不能解封。而为了尽可能地不花钱，先来看下国内的大模型API怎么用。本文是百度文心一...

AIGC 2024-02-20 人工智能

1436阅读

离开OpenAI的大神卡帕西「开课了」：新项目日增千星，还是熟悉的min代码风

大神Karpathy从OpenAI离职，原本扬言要大休一周。图片但转眼，新项目就已上线GitHub，日增上千星的那种。图片还是熟悉的卡式配方： 74行Python代码搞定大模型标记化（tokenization）中常用的BPE（Byte Pair...

AIGC 2024-02-20 人工智能

873阅读

GitHub热榜第一：百万token上下文，还能生成视频，UC伯克利出品

今日GitHub热榜榜首，是最新的开源世界模型。上下文窗口长度达到了100万token，持平了谷歌同时推出的王炸Gemini 1.5，伯克利出品。强大的模型，命名也是简单粗暴——没有任何额外点缀，直接就叫LargeWorldModel（LWM）。...

AIGC 2024-02-20 人工智能

881阅读

100万token，一次能分析1小时YouTube视频，「大世界模型」火了

最近几天，我们接连被谷歌的多模态模型 Gemini 1.5 以及 OpenAI 的视频生成模型 Sora 所震撼到，前者可以处理的上下文窗口达百万级别，而后者生成的视频能够理解运动中的物理世界，被很多人称为「世界模型」。然而，这些刷屏无数的模型真的能很好...

大数据 2024-02-20 人工智能

769阅读

RNN模型挑战Transformer霸权！1%成本性能比肩Mistral-7B，支持100+种语言全球最多

在大模型内卷的同时，Transformer的地位也接连受到挑战。近日，RWKV发布了Eagle 7B模型，基于最新的RWKV-v5架构。 Eagle 7B在多语言基准测试中，击败了所有的同级别模型，在单独的英语测试中，也和表现最好的模型基本打平。同时...

人工智能 2024-02-20 人工智能

848阅读

有道ai写作，突破免费限制，无限制使用

预览效果文末提供源码包及apk下载地址有道ai写作python版 import hashlib import time import json import ssl import base64 import uuid from urlli...

生成式AI 2024-02-19 人工智能

1244阅读

自然语言生成任务中的五种采样方法介绍和Pytorch代码实现

在自然语言生成任务(NLG 中，采样方法是指从生成模型中获取文本输出的一种技术。本文将介绍常用的5中方法并用Pytorch进行实现。 1、Greedy Decoding Greedy Decoding在每个时间步选择当前条件概率最高的词语作为输出，直到...

大数据 2024-02-19 人工智能

926阅读

训不动Mixtral，要不试试LLaMA-MoE？

深度学习自然语言处理原创作者：cola 随着各种各样增强版LLaMA的出现，Mixture-of-Expert(MoE 类模型越来越受大家关注。而LLaMA-MoE正是基于LLaMA系列和SlimPajama的MoE模型。它显著的一个好处...

人工智能 2024-02-18 人工智能

1112阅读

如何免费访问和使用Gemini API？

Gemini是谷歌开发的一个新模型。有了Gemini可以为查询提供图像、音频和文本，获得几乎完美的答案。我们在本教程中将学习Gemini API以及如何在机器上设置它。我们还将探究各种Python API函数，包括文本生成和图像理解。 Gemini A...

大数据 2024-02-18 人工智能

2323阅读

关于LLaMA Tokenizer的一些坑...

使用LLaMA Tokenizer对 jsonl 文件进行分词，并将分词结果保存到 txt 文件中，分词代码如下： import jsonlines import sentencepiece as spm from tqdm import tqdm j...

人工智能 2024-02-17 人工智能

1294阅读

扩展说明: 指令微调 Llama 2

这篇博客是一篇来自 Meta AI，关于指令微调 Llama 2 的扩展说明。旨在聚焦构建指令数据集，有了它，我们则可以使用自己的指令来微调 Llama 2 基础模型。目标是构建一个能够基于输入内容来生成指令的模型。这么做背后的逻辑是，模型如此...

AIGC 2024-02-17 人工智能

1064阅读

Stable Diffusion原理详解（附代码实现）

一、前言回顾AI绘画的历史，GAN（Generative Adversarial Nets）是比较出众的一个。GAN的出现让AI绘画成为可能，当时GAN给AI绘画提供了一种新的思路，现在回顾当时的绘画可以算是相当粗糙。 gan-results....

AIGC 2024-02-17 人工智能

1545阅读

基于Python实现Midjourney集成到（个人/公司）平台中

目前Midjourney没有对外开放Api，想体验他们的服务只能在discord中进入他们的频道进行体验或者把他们的机器人拉入自己创建的服务器中；而且现在免费的也用不了了，想使用就得订阅。本教程使用midjourney-api这个开源项目，搭建Midjou...

AIGC 2024-02-17 人工智能

1040阅读

Stable Diffusion 笔记一：网络结构拆解

SD由三大组件组成：VAE，CLIP，Unet。一VAE： VAE是Variational Autoencoder的缩写，中文名变分自编码器，是一种基于深度学习的生成模型。１潜空间图片与像素图片：像素图片是正常使用的图片，通常包含主体的物体人...

人工智能 2024-02-17 人工智能

1348阅读

llama.cpp中main函数参数

使模型类gpt式交互： ./main -m .\models\llama-2-7b-chat\ggml-model-q4_0.gguf -n 256 --repeat_penalty 1.0 --color -i -r "User:" -f prompt...

AIGC 2024-02-16 人工智能

1794阅读

基本概念:什么是ChatGPT和AIGC？

1.背景介绍 1. 背景介绍自2012年的AlexNet成功地赢得了ImageNet Large Scale Visual Recognition Challenge，深度学习技术开始引以为奎。随着算法的不断发展和优化，深度学习技术已经应用...

生成式AI 2024-02-16 人工智能

1046阅读

春节大礼包！OpenAI首个视频生成模型发布，60秒高清大作，网友已叹服

欢迎来到 bling zoo! 北京时间今天凌晨，OpenAI 正式发布了文本到视频生成模型 Sora，继 Runway、Pika、谷歌和 Meta 之后，OpenAI 终于加入视频生成领域的战争。山姆・奥特曼的消息放出后，看到 OpenAI 工程师...

大数据 2024-02-16 人工智能

889阅读

【AI绘画】用张图直观理解Stable Diffusion

手把手教你入门绘图超强的AI绘画，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取）作者****｜Jay Alammar 翻译｜杨婷、徐佳渝最近，AI图像生成引人注目，它能够根据文字描述生成...

人工智能 2024-02-16 人工智能

934阅读

万元预算打造高质量13B私有模型，Colossal-AI LLaMA-2 开源方案再升级

几个月前，Colossal-AI 团队仅利用8.5B token数据、15小时、数千元的训练成本，成功构建了性能卓越的中文LLaMA-2 7B 版本模型，在多个评测榜单性能优越。在原有训练方案的基础上，Colossal-AI 团队再次迭代，并通过构建更...

大数据 2024-02-16 人工智能

1069阅读

Stable Diffusion结构解析-以图像生成图像（图生图，img2img）

手把手教你入门绘图超强的AI绘画，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取） AIGC专栏3——Stable Diffusion结构解析-以图像生成图像（图生图，img2img）为例学习...

人工智能 2024-02-16 人工智能

1497阅读

鸿蒙开发实战-手写文心一言AI对话APP

运行环境（后面附有API9版本，可修改后在HarmonyOS4设备上运行） DAYU200:4.0.10.16 SDK：4.0.10.15 IDE：4.0.600 在DAYU200:4.0.10.16上运行一、创建应用 1.点击Fi...

AIGC 2024-02-15 人工智能

1348阅读

文心一言4.0API接入指南

概述文心一言是百度打造出来的人工智能大语言模型，具备跨模态、跨语言的深度语义理解与生成能力，文心一言有五大能力，文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成，其在搜索问答、内容创作生成、智能办公等众多领域都有更广阔的想象空间。文心一言企业...

生成式AI 2024-02-15 人工智能

2191阅读

LLaMA 入门指南

LLaMA 入门指南 LLaMA 入门指南 LLaMA的简介 LLaMA模型的主要结构 Transformer架构多层自注意力层前馈神经网络 Layer Normalization和残差连接 LLaMA模型的变体 Base版本 La...

人工智能 2024-02-15 人工智能

1576阅读

CoGPT: 通过GitHub Copilot免费使用gpt-4

这次介绍项目可以把 OpenAI API 格式的请求转发到 GitHub Copilot 服务端，从而免费使用 gpt-4。当然前提是你有 GitHub Copilot。对于学生，可以通过 GitHub Education 免费使用。先上项目链接: h...

人工智能 2024-02-15 人工智能

1450阅读

基于LLaVA开源模型打造视频聊天助手

简介大型语言模型已经证明自己是一项革命性的技术。目前，人们已经开发出了许多基于大型语言模型功能的应用程序，而且预计很快还会有更多的应用程序问世。大型语言模型最有趣的应用之一是将其部署为智能助手，它们能够帮助人类用户完成各种任务。人们已经能够通过指令微...

AIGC 2024-02-15 人工智能

1016阅读

【AIGC】DreamBooth:微调文本到图像扩散模型用于主题驱动的生成

前言 DreamBooth可以让我们使用一个很小的数据集微调文生图模型，然后基于文本提示词为我们训练的的主体替换不同的场景。摘要大型文本转图像模型在人工智能的发展中实现了显著的飞跃，能够从给定的文本提示中高质量和多样化地合成图像。然而，...

AIGC 2024-02-15 人工智能

1273阅读

基于 Stable Diffusion 一键 AI 作画：什么“小镇做题家”？人人都是艺术家

文章目录前言一、西方艺术简史 1.1、古典艺术时期 1.2、现代艺术时期 1.3、后现代艺术时期二、数字艺术的诞生和发展 2.1、数字艺术的诞生 2.2、数字艺术下的行业细分 2.3、数字作品的创作过程 2.4、AI 作画诞生三...

生成式AI 2024-02-14 人工智能

1029阅读

autoDL云部署stable diffusion教程

autoDL云部署stable diffusion教程进入autoDL官网没注册的先注册，注册后点击登录充值第一次玩的话，可以先充几块钱试一下，选择其它金额，输入充值金额，选择付款方式，点击充值购买服务器最上面一排点...

AIGC 2024-02-14 人工智能

3572阅读

whisper实践--基于whisper+pyqt5开发的语音识别翻译生成字幕工具

大家新年快乐，事业生活蒸蒸日上，解封的第一个年，想必大家都回家过年，好好陪陪家人了吧，这篇文章也是我在老家码的，还记得上篇我带大家基本了解了whisper，相信大家对whisper是什么，怎么安装whisper，以及使用都有了一个认识，这次作为新年第一篇文...

AIGC 2024-02-14 人工智能

1012阅读

ChatGPT和Whisper的API基本看点

ChatGPT Official API Learning 今天 OpenAI 开放了 ChatGPT 背后的 GPT-3.5 的模型 API，模型代号为 Turbo，其定价甚至比此前的 Davinci 都要便宜，1000 tokens 仅为 0.2...

人工智能 2024-02-14 人工智能

1690阅读

Whisper

文章目录使后感 Paper Review 个人觉得有趣的 Log Mel spectrogram & STFT Training cross-atte...

AIGC 2024-02-13 人工智能

936阅读

清华系2B模型杀出，性能吊打LLaMA-13B

2 月 1 日，面壁智能与清华大学自然语言处理实验室共同开源了系列端侧语言大模型 MiniCPM，主体语言模型 MiniCPM-2B 仅有 24 亿（2.4B）的非词嵌入参数量。在综合性榜单上与 Mistral-7B 相近，在中文、数学、代码能力表现更...

人工智能 2024-02-13 人工智能

909阅读

用通俗易懂的方式讲解：使用Llama-2、PgVector和LlamaIndex，构建大模型 RAG 全流程

近年来，大型语言模型（LLM）取得了显著的进步，然而大模型缺点之一是幻觉问题，即“一本正经的胡说八道”。其中RAG（Retrieval Augmented Generation，检索增强生成）是解决幻觉比较有效的方法。本文，我们将深入研究使用trans...

AIGC 2024-02-12 人工智能

2334阅读

AIGC 后视镜：过去这一年，大家都在哪搞钱？

大家好，我是煎鱼。由于 OpenAI 的 ChatGPT-3.5、GPT-4、GPT-4V 等产品的发布和传播。过去这一年多是 AIGC 爆发的元年，这是无容置疑的。 GPT 在许多方面都是较有帮助的。像是我们所在的 IT 行业来看。著名的...

AIGC 2024-02-12 人工智能

827阅读

循环神经网络与文本风格转移：实现创意的AI写作

1.背景介绍文本风格转移是一种自然语言处理任务，它旨在将一种文本风格或形式转换为另一种风格。这种转换可以是语言、语法、语境或其他方面的。文本风格转移的主要应用包括文本生成、文本摘要、机器翻译、文本洗理、文本生成和其他自然语言处理任务。在过...

人工智能 2024-02-12 人工智能

1049阅读

【ScienceAI Weekly】AI+生物凝聚物初创公司宣布裁员15%；科技部明确科研中的AIGC红线；讯飞医疗递表港交所

AI for Science 的新成果、新动态、新视角—— 全球首家将生物分子凝聚体应用于药物发现的公司，宣布裁减 18 个职位谷歌 DeepMind 发布 AlphaGeometry Evaxion Biotech 宣布用 AI 开发定制癌症疫苗...

人工智能 2024-02-11 人工智能

967阅读

AI系统源码ChatGPT网站源码+ai绘画系统/支持GPT4.0/支持Midjourney局部编辑重绘

一、AI创作系统 SparkAi创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统，支持OpenAI-GPT全模型+国内AI全模型。本期针对源码系统整体测试下来非常完美，可以说SparkAi是目前国内一...

人工智能 2024-02-11 人工智能

859阅读

上海人工智能实验室发布LLaMA-Adapter | 如何1小时训练你的多模态大模型用于下游任务

本文首发于微信公众号 CVHub，未经授权不得以任何形式售卖或私自转载到其它平台，违者必究！ Title: LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-...

人工智能 2024-02-11 人工智能

1113阅读

通过日月摘星全面使用Midjourney

在这个信息爆炸的时代，我们每天都被无数的图文信息包围。如何在这海量的信息中脱颖而出，成为了每个品牌和个人的挑战。今天，我要为大家介绍的，是通过“日月摘星”快速便捷的使用Midjourney，让您的战斗力可以至少翻一倍！ Midjourney是一款强大的图...

人工智能 2024-02-11 人工智能

838阅读

【Unity】如何在Unity里使用文心一言AI

想要使用文心一言，首先要登录百度智能云千帆控制台 https://cloud.baidu.com/product/wenxinworkshop?track=developer_qianfan_tanchuang 1.在控制台找到应用接入 - 然后点...

生成式AI 2024-02-11 人工智能

1076阅读

AI系统ChatGPT网站系统源码AI绘画详细搭建部署教程，支持GPT语音对话+DALL-E3文生图+GPT-4多模态模型识图理解

一、前言 SparkAi创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统，支持OpenAI-GPT全模型+国内AI全模型。本期针对源码系统整体测试下来非常完美，可以说SparkAi是目前国内一款的ChatGPT对接Op...

生成式AI 2024-02-11 人工智能

1041阅读