hugging face 第6页

LLaMA模型指令微调字节跳动多模态视频大模型 Valley 论文详解

Valley: Video Assistant with Large Language model Enhanced abilitY 大家好，我是卷了又没卷，薛定谔的卷的AI算法工程师「陈城南」~ 担任某大厂的算法工程师，带来最新的前沿AI知识和工具...

大数据 2024-02-03 人工智能

1064阅读

引言:ChatGPT与AIGC技术的发展与应用

1.背景介绍 1. 背景介绍自2012年的AlexNet成功地赢得了ImageNet Large Scale Visual Recognition Challenge(ILSVRC ，深度学习技术开始引以为奉。随着算法的不断发展和优化，深度...

人工智能 2024-02-03 人工智能

1002阅读

从零开始：了解ChatGPT和AIGC基础

1.背景介绍 1. 背景介绍自2012年的AlexNet在ImageNet大赛中取得卓越成绩以来，深度学习技术已经成为人工智能领域的重要技术。随着算力的提升和模型的优化，深度学习技术已经取得了巨大的成功，应用于图像识别、自然语言处理、语音识...

AIGC 2024-02-02 人工智能

1053阅读

AI2发布开放语言模型OLMo 号称多项性能媲美Llama2

AI2最新发布的开放语言模型（OLMo）框架旨在推动大规模语言模型的研究和实验。通过在Hugging Face和GitHub上提供训练代码、模型和评估代码，AI2致力于让学术界和研究人员能够共同研究语言模型的科学，探索新的预训练数据子集对下游性能的影响，以...

大数据 2024-02-02 人工智能

804阅读

【stable diffusion】Win10部署本地教程

目录一、stable diffusion部署，不使用启动器 s1：安装git s2：anaconda配置stable diffusion环境 s3：No module 'xformers'. Proceeding without it.的处...

AIGC 2024-02-02 人工智能

1309阅读

大模型技术实践（三）｜用LangChain和Llama 2打造心灵疗愈机器人

上期文章我们实现了Llama 2-chat-7B模型的云端部署和推理，本期文章我们将用“LangChain+Llama 2”的架构打造一个定制化的心灵疗愈机器人。有相关知识背景的读者可以直接阅读「实战」部分。 01 背景...

AIGC 2024-02-01 人工智能

1497阅读

小红书开源「InstantID」效果炸裂，被Yann LeCun点赞，迅速蹿上Github热榜

最近，有一群来自小红书的 95 后神秘团队，自称 InstantX，搞了个大动作 —— 开源「InstantID」项目。 InstantID 凭借着高质量的图像生成能力，在开源界掀起了一股热潮：不仅获得了众多技术大佬的点赞，更是在 GitHub 热榜上迅...

人工智能 2024-02-01 人工智能

933阅读

Code Llama 70B霸榜3连发，练习5个月击败GPT-4！小扎LeCun亲自官宣上新

今天，Meta正式发布了Code Llama 70B，作为Code Llama系列中规模最大，性能最强的版本，一举击败了GPT-4！目前，模型共有三个版本，均可免费用于研究和商业目的： CodeLlama - 70B：基础代码模型； CodeLlama...

AIGC 2024-01-31 人工智能

864阅读

GPT-4不服被Bard反超：最新模型已入场

“大模型排位赛”权威榜单Chatbot Arena刷新：谷歌Bard超越GPT-4，排名位居第二，仅次于GPT-4 Turbo。然鹅，众多网友对此却表示“不服”、“不公平”。原来，谷歌AI掌门人Jeff Dean透露，Bard性能大幅提升，是因为...

AIGC 2024-01-30 人工智能

756阅读

轻松上手，本地运行LlaMA 2的简易指南

我们将学习一种无需设置Python或任何程序即可安装和使用LlaMA 2的简单方法。只需下载文件并在PowerShell中运行命令即可。微信搜索关注《Python学研大本营》，加入读者群，分享更多精彩图像由DALL·E 3生成一...

大数据 2024-01-30 人工智能

1307阅读

每日一看大模型新闻（2023.11.14）谷歌提出新型生成式AI模型IGN；谷歌天气预报模型GraphCast登刊Science；贾扬清吐槽国产大模型套壳Llama 假装自研，零一万物回应

1.产品发布 1.1面壁智能：发布AI Agents首个SaaS级产品ChatDev 发布日期：2023-11-15 面壁智能打造首个“大模型+Agent” SaaS级产品ChatDev 主要内容：面壁智能已经推出了基于群体智能和其新一代千...

大数据 2024-01-30 人工智能

1118阅读

AI视野：ChatGPT灰度测试多GPTs协同；百川智能发布Baichuan3；新Bard逆袭GPT-4；腾讯文档AI智能助手开启公测

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用 OpenAI最新功...

大数据 2024-01-29 人工智能

871阅读

谷歌与Hugging Face携手，共推开源模型助力AI发展

Google与Hugging Face近日宣布战略合作，旨在推动开放AI和机器学习的发展。这一合作将集成Hugging Face的平台与Google Cloud的基础设施，包括Vertex AI，旨在使生成式AI更易于开发者使用。这一合作的重要性被认为是A...

AIGC 2024-01-29 人工智能

789阅读

从零手搓MoE大模型，大神级教程来了

传说中GPT-4的“致胜法宝”——MoE（混合专家）架构，自己也能手搓了！ Hugging Face上有一位机器学习大神，分享了如何从头开始建立一套完整的MoE系统。这个项目被作者叫做MakeMoE，详细讲述了从注意力构建到形成完整MoE模型的过程。...

人工智能 2024-01-29 人工智能

831阅读

谷歌云与Hugging Face签署人工智能基础设施合作协议

谷歌公司（Google LLC）云计算部门今天宣布与Hugging Face公司建立新的合作伙伴关系，后者是一个流行的共享开源人工智能模型平台运营商。根据协议，谷歌云将成为Hugging Face人工智能训练和推理工作负载的 “首选目的地”。此外，两...

AIGC 2024-01-29 人工智能

901阅读

使用 Transformers 为多语种语音识别任务微调 Whisper 模型

本文提供了一个使用 Hugging Face ? Transformers 在任意多语种语音识别 (ASR 数据集上微调 Whisper 的分步指南。同时，我们还深入解释了 Whisper 模型、Common Voice 数据集以及微调等理论知识，并提供...

大数据 2024-01-27 人工智能

1212阅读

Stable Diffusion 学习(一)——Web UI 的安装与部署

Stable Diffusion作为一款开源的AIGC项目受到众多人的欢迎，掀起了一大波AI绘画的浪潮。通过它我们可以将我的想法变成现实，并且随时调整，也可以让AI生成不同于人类角度的照片，接下来我们将进入到StableDiffusion的学习中去，今天的...

大数据 2024-01-27 人工智能

978阅读

使用推测解码 (Speculative Decoding) 使 Whisper 实现 2 倍的推理加速

Open AI 推出的 Whisper 是一个通用语音转录模型，在各种基准和音频条件下都取得了非常棒的结果。最新的 large-v3 模型登顶了 OpenASR 排行榜，被评为最佳的开源英语语音转录模型。该模型在 Common Voice 15 数据...

人工智能 2024-01-27 人工智能

947阅读

Oracle推出云生成式AI服务帮助企业部署和微调语言模型

数据库巨头Oracle近日推出了Oracle Cloud Infrastructure Generative AI服务，发布的同时推出了各种创新技术，使大型企业能够利用生成式AI技术的最新成果。这次推出的OCI Generative AI服务是一项全...

生成式AI 2024-01-26 人工智能

979阅读

超级逼真人脸生成，Stable Diffusion的3个关键技巧

大家好，你是否曾想过，为什么别人可以使用AI图像生成技术生成如此逼真的人脸，而自己的尝试却充满了错误和瑕疵，让人一眼看出是假的。尝试过调整提示和设置，但似乎仍无法与他人的质量相匹配。本文将带大家了解使用Stable Diffusion生成超逼真人脸的3...

生成式AI 2024-01-25 人工智能

1011阅读

2024年1月11日最热AI论文Top5：开源界Stable Diffusion杀手、Prompt-tuning、零和游戏博弈

本文整理了今日发表在ArXiv上的AI论文中最热门的 TOP5。以下内容由赛博马良-「AI论文解读达人」智能体生成，人工整理排版。「AI论文解读达人」智能体可提供每日最热论文推荐、AI论文解读等功能。如需查看其他热门论文，欢迎移步saibo...

人工智能 2024-01-23 人工智能

1008阅读

世界顶尖多模态大模型开源！又是零一万物，又是李开复

领跑中英文两大权威榜单，李开复零一万物交出多模态大模型答卷! 距离其首款开源大模型Yi-34B和Yi-6B的发布，仅间隔不到三个月的时间。模型名为Yi Vision Language（Yi-VL），现已正式面向全球开源。同属Yi系列，同样具有两个版本...

生成式AI 2024-01-23 人工智能

846阅读

深度学习关于stable diffusion官方模型下载，并附上：Stable Diffusion下载+安装+使用教程，保证你能学会！

下载地址：自用备份，有需要的人请拿去，不客气！！ 1.4版本下载： CompVis/stable-diffusion-v-1-4-original · Hugging Face 1.5版本下载： runwayml/stable-diffusio...

人工智能 2024-01-23 人工智能

3486阅读

LLaMa 原理+源码——拆解 (KV-Cache, Rotary Positional Embedding, RMS Norm, Grouped Query Attention, SwiGLU)

原理 Vanilla Transformer 与 LLaMa 的区别 Embedding RMS Norm Rotary Positional Encodding SwiGLU Function KV-Cache Grouped Mult...

大数据 2024-01-22 人工智能

2196阅读

LLaMA Board: 通过一站式网页界面快速上手 LLaMA Factory

原文：https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md ? 加入我们的微信群。 [ English | 中文 ] LLaMA Board: 通过一站式网页界面快速上手...

大数据 2024-01-21 人工智能

1110阅读

Dreambooth Stable Diffusion始化训练环境（AutoDL）

以AutoDL为例以下代码源自：赛博华佗——秋叶： Akegarasu 环境选择 Miniconda: Miniconda是一个轻量级的Conda环境管理系统。它包含了conda、Python和一些常用...

大数据 2024-01-21 人工智能

1483阅读

AIGC内容分享(四十一)：国内AIGC独角兽冲出几家？

目录 2023年新晋AI独角兽智谱AI：清华计算机系KEG科研成果百川智能：原搜狗CEO王小川创业项目零一万物：李开复筹建的新项目 Minimax：前商汤副总裁创业项目结尾： 2023年新晋AI独角兽根据IT桔子数据，截...

生成式AI 2024-01-21 人工智能

913阅读

如何部署Stable Diffusion WebUI Windows + 无科学上网版

如何部署Stable Diffusion WebUI 无科学上网版一些背景一些需求硬件需求（可选）软件需求一些细节检查nvidia driver查看对应cuda版本安装cuda 安装cuDNN 安装GPU版pytorch 安...

人工智能 2024-01-21 人工智能

1134阅读

LLaMA模型泄露 Meta成最大受益者

一份被意外泄露的谷歌内部文件，将Meta的LLaMA大模型“非故意开源”事件再次推到大众面前。“泄密文件”的作者据悉是谷歌内部的一位研究员，他大胆指出，开源力量正在填平OpenAI与谷歌等大模型巨头们数年来筑起的护城河，而最大的受益者是Meta，因为该公司...

人工智能 2024-01-20 人工智能

795阅读

小扎砸数百亿美元猛攻开源AGI！狂掷60万块H100，爆50倍GPT-4算力

【新智元导读】今天，小扎正式宣战「开源AGI」!下一代大模型Llama3正在训练，年底将拥有35万块H100，届时算力总和达60万块H100。为了追赶OpenAI，成立十年的FAIR团队纳入GenAI，全力奔赴AGI。自Llama2、Code Llama...

大数据 2024-01-19 人工智能

935阅读

吞吐量提升5倍，联合设计后端系统和前端语言的LLM接口来了

大型语言模型 (LLM 越来越多地用于需要多个链式生成调用、高级 prompt 技术、控制流以及与外部环境交互的复杂任务。然而，用于编程和执行这些应用程序的现有高效系统存在着明显的缺陷。现在，开源社区的研究者们面向 LLM 提出了一种结构化生成语言（...

人工智能 2024-01-19 人工智能

866阅读

Stable Diffusion with Diffusers 学习笔记: 原理+完整pipeline代码

文章目录 01 使用 02 Stable Diffusion 的工作原理 The autoencoder (VAE The U-Net The Text-encoder Latent Diffusion 又快又高效的原因 Stable Di...

大数据 2024-01-18 人工智能

1680阅读

使用 Transformers 为多语种语音识别任务微调 Whisper 模型

本文提供了一个使用 Hugging Face ? Transformers 在任意多语种语音识别 (ASR 数据集上微调 Whisper 的分步指南。同时，我们还深入解释了 Whisper 模型、Common Voice 数据集以及微调等理论知识，...

AIGC 2024-01-18 人工智能

1204阅读

七个值得关注的优秀大语言模型（LLM）

在LLM领域我们了解最多的很可能是OpenAI的ChatGPT，以及最近在多模态表现非常出色的Google Gemini，这些都是AI大模型的领头羊，代表着AI大模型发展的先进成果。然而，在大模型的实际应用中必须要综合考虑成本、信息安全等内容，因此，开源...

生成式AI 2024-01-17 人工智能

1820阅读

ICLR 2024接收率31％，清华LCM论文作者：讲个笑话，被拒了

ICLR 2024 国际学习表征会议已经来到了第十二届，将于今年 5 月 7 日 - 11 日在奥地利维也纳会展中心举行。在机器学习社区中，ICLR 是较为「年轻」的学术顶会，它由深度学习巨头、图灵奖获得者 Yoshua Bengio 和 Yann L...

生成式AI 2024-01-17 人工智能

1093阅读

Tokenization 指南：字节对编码，WordPiece等方法Python代码详解

在2022年11月OpenAI的ChatGPT发布之后，大型语言模型(llm 变得非常受欢迎。从那时起，这些语言模型的使用得到了爆炸式的发展，这在一定程度上得益于HuggingFace的Transformer库和PyTorch等库。计算机要处理语言，...

AIGC 2024-01-17 人工智能

900阅读

AI绘画资源分享

Midjourney Midjourney是一款强大的AI绘画工具，被誉为目前最强的AI绘画软件之一。它采用了先进的深度学习技术，拥有广泛的绘画功能，支持多种风格和主题的创作。用户只需通过简单的操作，即可轻松创建高质量的艺术作品。Midjourney的算...

大数据 2024-01-17 人工智能

2087阅读

请查收使用OpenAI的Whisper进行语音识别的攻略

Whisper是一种令人激动的新型语言模型，采用了全新的语音识别方法，即使是低质量的音频，Whisper也能产生高质量的结果，并且对各种声音和语言的适应性极强，无需进行微调。 Whisper是开源的，有一系列可用的模型尺寸，可以作为众多语音转文字应用的有...

AIGC 2024-01-16 人工智能

1420阅读

Stable Diffusion VAE：改善图像质量的原理、选型与使用指南

VAE Stable Diffusion（稳定扩散）是一种用于生成模型的算法，结合了变分自编码器（Variational Autoencoder，VAE）和扩散生成网络（Diffusion Generative Network）的思想。它通过对变分自编码器...

大数据 2024-01-16 人工智能

1500阅读

LLama Factory 实操记录（一）

1. api端口参数说明： src/api -h, --help 显示帮助信息并退出 --model_name_or_path MODEL_NAME_OR_PATH 模型权重的路径或标识...

人工智能 2024-01-16 人工智能

2525阅读

Stable diffusion 简介

Stable diffusion 是 CompVis、Stability AI、LAION、Runway 等公司研发的一个文生图模型，将 AI 图像生成提高到了全新高度，其效果和影响不亚于 Open AI 发布 ChatGPT。Stable diffusi...

生成式AI 2024-01-16 人工智能

2367阅读

使用Gradio搭建Stable Diffusion模型生成图像：简单快捷的图像生成体验

目录 0 开发环境 1 介绍 1.1 Gradio简介 1.2 Stable Diffusion模型简介 2 使用Gradio搭建基本界面 2.1 安装依赖库 2.2 加载预训练模型 2.3 解析返回的数据 2.4 构建图像字幕应用程序...

人工智能 2024-01-16 人工智能

1933阅读

我们是怎么一步步被Hugging Face收购的：开源库Gradio构建者分享背后故事

不知大家是否还记得 2021 年年末，Hugging Face 宣布收购 Gradio 一事。两年过去了，Gradio 是如何成长起来的，又是如何被收购的，Gradio CEO 兼联合创始人 Abubakar Abid 说出了一些内幕故事。图源：ht...

AIGC 2024-01-15 人工智能

884阅读

LLM AutoEval:AI平台自动评估Google Colab中的LLM

在自然语言处理领域，语言模型的评估对于开发人员推动语言理解和生成的边界至关重要。LLM AutoEval是一款旨在简化和加速语言模型（LLMs）评估过程的工具，专为寻求快速高效评估LLM性能的开发者定制。 LLM AutoEval具有以下关键特点: 1....

人工智能 2024-01-15 人工智能

900阅读

揭秘硅谷巨头AI初创公司投资布局！英伟达ALL IN，微软-OpenAI式关系引反垄断调查

今年以来，一批新的人工智能初创企业震撼了硅谷乃至更广泛的商业世界： OpenAI是世界上最前沿的大模型提供商和技术灯塔。甚至OpenAI每发一篇博客，都能获得全世界大模型从业者的高度关注。图片来自法国，只有22名员工的Mistral AI，每次发布一...

大数据 2024-01-15 人工智能

927阅读

Stable Diffusion最详细教程（总版）

Stable Diffusion教程本文是我在B站学习SD时做的笔记，大家有时间的话可以去学习一下这个教程，讲的很详细，是一个比较系统的教学，UP：Nenly同学 stable diffusion的安装 stable diffusion 百宝书...

AIGC 2024-01-15 人工智能

1342阅读

AI数字绘画 stable-diffusion 保姆级教程

简介近段时间来，你可能在不少地方都看到了非常多这样的好看的画。比如这样的赛博朋克风 prompt: Cyberpunk, 8k resolution, castle, the rose sea, dream 水墨画风格 prompt:...

大数据 2024-01-14 人工智能

858阅读

LLMs之LLaMA-2：LLaMA-2的简介(技术细节)、安装、使用方法(开源-免费用于研究和商业用途)之详细攻略

LLMs之LLaMA-2：LLaMA-2的简介(技术细节、安装、使用方法(开源-免费用于研究和商业用途之详细攻略导读：2023年7月18日，Meta重磅发布Llama 2！这是一组预训练和微调的大型语言模型（LLM），规模从70亿到700亿个...

AIGC 2024-01-14 人工智能

1211阅读

Stable Diffusion的入门介绍和使用教程

Stable Diffusion是一个文本到图像的潜在扩散模型，由CompVis、Stability AI和LAION的研究人员和工程师创建。它使用来自LAION-5B数据库子集的512x512图像进行训练。使用这个模型，可以生成包括人脸在内的任何图...

AIGC 2024-01-14 人工智能

1066阅读

2024年AIGC趋势展望：视频生成的“百模大战”

2023年底发布的svd(stabilityai/stable-video-diffusion-img2vid · Hugging Face 、EMU(https://ai.meta.com/blog/emu-text-to-video-generatio...

生成式AI 2024-01-14 人工智能

755阅读