cto 第5页 - AIGC资讯

部署微调框架LLaMA-Factory

LLaMA Factory 1.我们在ChatGLM3的github官方页面上能看到对LLaMA-Factory的推荐 2.LLaMA Factory github链接 hiyouga/LLaMA-Factory: Unify Efficien...

大数据 2024-08-05 人工智能

1219阅读

LLaMA-Factory：大语言模型微调框架（大模型）

简介： LLaMA-Factory 是一个国内北航开源的低代码大模型训练框架，专为大型语言模型（LLMs）的微调而设计 LLaMA-Factory：大语言模型微调框架一、功能特点 LLaMA-Factory 是一个国内北航开源的低代码大模...

AIGC 2024-08-05 人工智能

1466阅读

安装和微调大模型（基于LLaMA-Factory）2-补充资料

安装代码 https://github.com/echonoshy/cgft-llm/blob/master/llama-factory/README.md https://github.com/hiyouga/LLaMA-Factory/tree/m...

AIGC 2024-08-05 人工智能

952阅读

谷歌想蹭奥运热度却惨遭翻车！AI广告上线仅一周就被撤下

快科技8月4日消息，谷歌近期尝试借助奥运会推广其聊天机器人Gemini，却因一则广告引发广泛争议，不得不在广告上线仅一周后撤下。这则名为亲爱的悉尼”的广告，讲述了一个父亲让AI帮助女儿写信给她最喜欢的运动员。广告中，Gemini代替女孩完成了本应由她...

人工智能 2024-08-04 人工智能

711阅读

部署LLaMA-Factory及微调大模型测试

安装过程安装依赖按照GitHub上介绍的过程安装即可GitHub - hiyouga/LLaMA-Factory: Unify Efficient Fine-Tuning of 100+ LLMshttps://github.com/hiyouga...

生成式AI 2024-08-04 人工智能

1210阅读

Llama 3 图片理解能力微调（XTuner+LLaVA 版）实践笔记

基于 Llama3-8B-Instruct 和 XTuner 团队预训练好的 Image Projector 微调自己的多模态图文理解模型 LLaVA。环境、模型、数据准备 conda create -n llama3 python=3....

生成式AI 2024-08-03 人工智能

981阅读

安装llama_factory

第一版： nvidia-smi git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory/ llamafactory-cli train examples/tr...

人工智能 2024-08-03 人工智能

906阅读

最大405B：Llama-3.1 发布，第一时间详解

在这篇文章发出时 Meta 发布了 Llama 3.1 这次发布北京时间，2024 年 7 月 23 日 23 点，Meta 正式发布了其最新的开源模型 - Llama 3.1, 包含8B、70B 和 405B 三个尺寸，最大上下文提升到了...

人工智能 2024-08-03 人工智能

1159阅读

LLaMA-Factory：手把手教你从零微调大模型！

引言随着人工智能技术的飞速发展，大型语言模型（LLM）在自然语言处理（NLP）领域扮演着越来越重要的角色。然而，预训练的模型往往需要针对特定任务进行微调，以提高其在特定领域的性能。LLaMA-Factory作为一个高效、易用的微调工具，为广大开发者提...

生成式AI 2024-08-02 人工智能

1115阅读

山大软院创新实训之大模型篇（二）——Llama Factory微调Qwen实践

山大软院创新实训之大模型篇（二）——Llama Factory微调Qwen实践 LLaMA Factory 是一个用于微调和部署 LLaMA (Large Language Model Applications 模型的框架。它旨在简化大语言模型的使用...

生成式AI 2024-08-02 人工智能

1350阅读

LLama-Factory使用教程

本文是github项目llama-factory的使用教程注意，最新的llama-factory的github中训练模型中，涉及到本文中的操作全部使用了.yaml配置。新的.yaml的方式很简洁但不太直观，本质上是一样的。新的readme中的.yam...

人工智能 2024-08-01 人工智能

2505阅读

4轮暴训，Llama 7B击败GPT-4！Meta等让LLM「分饰三角」自评自进化

【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型，给「超级对齐」指条明路:让AI自己当裁判，自我改进对齐，效果秒杀自我奖励模型。 LLM对数据的大量消耗，不仅体现在预训练语料上，还体现在RLHF、DPO等对齐阶段。后者不仅依赖昂贵的人工标...

人工智能 2024-07-31 人工智能

1016阅读

【07】LLaMA-Factory微调大模型——微调模型导出与微调参数分析

上文介绍了如何对微调后的模型进行使用与简单评估。本文将介绍对微调后的模型进行导出的过程。一、llama-3微调后的模型导出首先进入虚拟环境，打开LLaMA-Factory的webui页面 conda activate GLM cd LLaMA-F...

生成式AI 2024-07-31 人工智能

1901阅读

使用LLaMA-Factory对Llama3-8B-Chinese-Chat进行微调

文章目录模型及数据：模型下载数据 LLaMA-Factory启动拉取代码启动webui 模型训练数据导入数据预览设置模型路径配置参数及参数的保存开始训练过程观察加载模型、对话模型导出、再次加载...

人工智能 2024-07-31 人工智能

1263阅读

华为Pura 70 Pro发布鸿蒙OS 4.2 172版更新：支持AI扩图一键拯救废片！

快科技7月28日消息，日前，华为Pura 70 Pro推送鸿蒙OS 4.2.0.172（SP2C00E170R4P7）版本更新，新增AI扩图功能。更新后，图库的AI修图新增AI扩图功能，可基于AI构图算法与图像生成式技术，理解图片内容的细节和结构，分析推...

人工智能 2024-07-28 人工智能

810阅读

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

编者注：之前一直用firefly做微调，最近切换到LLaMA-Factory，发现不但简单易用，而且非常全面，有点相见恨晚的感觉。使用过程中我主要参考2个文档，一个是github上的官方中文文档： https://github.com/hiyouga/L...

AIGC 2024-07-27 人工智能

1360阅读

ChatGLM3-6B使用lora微调实体抽取，工具LLaMA-Factory，医学数据集CMeEE

一、下载ChatGLM3-6B 下载地址，需要魔法测试模型：新建文件predict.py。运行下面测试代码。建议这里的transformers包最好和LLaMA-Factory环境的transformers包版本保持一致或者直接用LLaMA-Fa...

AIGC 2024-07-26 人工智能

1352阅读

AI绘画ComfyUI 进阶教程 | 字节最强换脸插件PuLID 详解，还请收藏！

大家好，我是小强这应当算作是小编分享的换脸工具系列中的又一力作，从最初的roop，到之后的ReActor，再到备受欢迎的InstantID，以及今日重点介绍的字节开源产品——PuLID。提及PuLID，首要原因并非仅仅在于它强大的换脸技术，实际上，...

生成式AI 2024-07-25 人工智能

1745阅读

一次性生成5个8秒视频，用AI做抖音短视频不是梦？

最近的AI视频赛道，在玩法上“卷”出了新高度。有用户用它完善视频细节: 还有人用它创作了科幻大片: 甚至让马斯克微笑点头: 还有大鱼吃小鱼，实现普通摄像头难以拍摄的效果: 较强的灵活性和视频可控性，一下让人难以分辨虚实，而这些镜头都是靠爱诗科技的...

大数据 2024-07-24 人工智能

1145阅读

【大模型】微调实战—使用 ORPO 微调 Llama 3

ORPO 是一种新颖微调（fine-tuning）技术，它将传统的监督微调（supervised fine-tuning）和偏好对齐（preference alignment）阶段合并为一个过程。这减少了训练所需的计算资源和时间。此外，实证结果表明，ORP...

大数据 2024-07-24 人工智能

1124阅读

Stable Diffusion工作原理一篇文章带你详解！

前言翻译自How does Stable Diffusion work? 1. SD能做什么最基本的功能是：文生图（text-to-image） SD以文字提示为输入，输出与提示相配的图像 2. 扩散模型 SD属于扩散模...

大数据 2024-07-24 人工智能

1091阅读

基于Llama Index构建RAG应用(Datawhale AI 夏令营)

前言 Hello，大家好，我是GISer Liu?，一名热爱AI技术的GIS开发者，本文参与活动是2024 DataWhale AI夏令营；? 在本文中作者将通过： Gradio、Streamlit和LlamaIndex介绍 Ll...

AIGC 2024-07-24 人工智能

1611阅读

使用LLaMA-Factory微调大模型

使用LLaMA-Factory微调大模型 github 地址https://github.com/hiyouga/LLaMA-Factory 搭建环境 git clone --depth 1 https://github.com/hiyouga/...

人工智能 2024-07-23 人工智能

1003阅读

OpenAI CTO 剧透AGI关键词：十年内出现、极其先进、智能系统

7月初，在约翰霍普金斯大学，资深科技记者、播客Pivot的联合主持人Kara Swisher与OpenAI CTOMira Murati展开了一场火药味十足的对话，计算机科学家、斯坦福大学教授李飞飞也加入了提问阵营，他的另一个身份是Google云人工智能和...

生成式AI 2024-07-23 人工智能

754阅读

【05】LLaMA-Factory微调大模型——初尝微调模型

上文【04】LLaMA-Factory微调大模型——数据准备介绍了如何准备指令监督微调数据，为后续的微调模型提供高质量、格式规范的数据支撑。本文将正式进入模型微调阶段，构建法律垂直应用大模型。一、硬件依赖 LLaMA-Factory框架对硬件和软件的...

AIGC 2024-07-23 人工智能

1552阅读

[AIGC] Spring Boot 整合 ClickHouse：优雅使用的指南

在大数据处理的场景中，ClickHouse的极高效率和强大功能使其在众多数据库系统中脱领而出。而Spring Boot作为流行的Java框架，与ClickHouse的结合，将使得数据分析如虎添翼。文章目录 1. 添加依赖 2. 配...

人工智能 2024-07-23 人工智能

1234阅读

Windows下安装LLama-Factory

在进行安装前，请先确认你的GPU能支撑起训练的显存。如果和可怜的我一样是4GB可以选择上云或者换一个好一点的显卡。并且确定你安装了显卡驱动版本在官方给的版本以上，如果没有安装，详细参考我的另一篇文章：LLama-Factory运行异常，CU...

大数据 2024-07-22 人工智能

2453阅读

华为Pura 70 Pro /Ultra上线图片AI扩图功能李小龙实测：手机会给碗里加菜

快科技7月22日消息，近日，华为Pura70Pro 和Pura70Ultra上线了图片AI扩图功能。今日，华为终端BG CTO晒出两张照片称:图1是原图，图2是扩出来的，还帮我在空碗里添加了点菜。” 有网友问道:哈哈问题来了，盘子里是什么菜”，吃之前长这样...

人工智能 2024-07-22 人工智能

954阅读

LLaMa-Factory微调chatglm3实战

文章目录算力机器准备 LLMa-Factory环境搭建克隆项目创建环境（可省略）遇到问题解决方法安装依赖启动web UI页面设置代理（本地浏览器访问）下载模型准备数据集微调加载新模型成果测试算力机...

人工智能 2024-07-22 人工智能

821阅读

自动炼丹基于Llama-factory改写--学习记录

最近在使用llama-factory微调LLM，但是一个个手动修改基本的学习率，学习轮次有太麻烦了。在寻找有没有什么自动调参的办法，在github上看到Llama-factory支持Weights & Biases 记录实验数据自动微调，尝试了一下...

人工智能 2024-07-22 人工智能

1286阅读

llama_index.core没办法导入向量

from llama_index.core import VectorStoreIndex, SimpleDirectoryReader 报错：error msg: ImportError: cannot import name 'VectorStore...

生成式AI 2024-07-22 人工智能

1625阅读

GPT-4和Whisper从长视频生成短视频；AI治好了我的拖延症；GraphRAG技术集成到Open WebUI；两个开源LivePortrait实现

✨ 1: AI Youtube Shorts Generator AI Youtube Shorts Generator是一款利用GPT-4和Whisper从长视频生成短视频的Python工具。 AI YouTube Shorts Gene...

人工智能 2024-07-22 人工智能

956阅读

llama-factory微调工具使用入门

一、定义环境配置案例： https://zhuanlan.zhihu.com/p/695287607 chatglm3 案例多卡训练deepspeed llama factory 案例Qwen1.5 报错二、实现环境配置 git cl...

人工智能 2024-07-21 人工智能

1352阅读

AFAC2024-基于保险条款的问答比赛日记 llamafactory qwen npu 910B1

AFAC2024: 基于保险条款的问答挑战——我的实战日记概述在最近的AFAC2024竞赛中，我参与了基于保险条款的问答赛道。这是一次深度学习与自然语言处理的实战演练，旨在提升模型在复杂保险文本理解与问答生成方面的能力。本文将分享我的参赛过程，...

大数据 2024-07-21 人工智能

1007阅读

LLaMA-Factory：开源的低代码大模型训练框架

LLaMA-Factory 是一个由零隙智能（SeamLessAI）开源的低代码大模型训练框架，它集成了业界最广泛使用的微调方法和优化技术，并支持众多开源模型的微调和二次训练。一、功能特点支持多种开源模型：LLaMA-Factory支持包括...

大数据 2024-07-20 人工智能

2338阅读

天才程序员周弈帆 | Stable Diffusion 解读（四）：Diffusers实现源码解读

本文来源公众号“天才程序员周弈帆”，仅用于学术分享，侵权删，干货满满。原文链接：Stable Diffusion 解读（四）：Diffusers实现源码解读接上一篇文章[天才程序员周弈帆 | Stable Diffusion 解读（三）：原版实现源...

AIGC 2024-07-17 人工智能

2391阅读

七月论文审稿GPT第5版：拿我司七月的早期paper-7方面review数据集微调LLama 3

前言 llama 3出来后，为了通过paper-review的数据集微调3，有以下各种方式不用任何框架工具技术，直接微调原生的llama 3，毕竟也有8k长度了效果不期望有多高，纯作为baseline 通过PI，把llama 3的8K长度扩展...

大数据 2024-07-17 人工智能

859阅读

山东大学项目实训（十六）:基于LLaMA-Factory的微调模型评估和测试

在LLaMA-Factory的Evaluate & Predict界面进行评测原始模型评测微调后模型评测可以看到，微调之后的模型在各个指标上有了显著提升在完成大型语言模型（如 ChatGLM）的微调后，对模型进行全面评估...

生成式AI 2024-07-16 人工智能

1736阅读

LLama Factory微调模型全流程，与peft库调用训练的adapter

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录 LLama Factory微调流程一、准备微调的数据集和模型二、读取模型和数据进行训练 1.使用web ui 2.修改官方脚本（推荐）第三，加载与推...

人工智能 2024-07-15 人工智能

1305阅读

LLaMA-Factory在华为显卡上的实验记录

如何判断目前所选择的模型是否支持 LLaMA-Factory/src/llamafactory/data/template.py 在项目的这个地址中会有不同模型的支持模版。这里用目前我最常用的两个模型举例子一个是智谱的glm4-9B模型 _regi...

生成式AI 2024-07-15 人工智能

1401阅读

Fastgpt接入Whisper本地模型实现语音输入

前言 FastGPT 默认使用了 OpenAI 的 LLM 模型和语音识别模型，如果想要私有化部署的话，可以使用openai 开源模型Whisper。参考文章《openai 开源模型Whisper语音转文本模型下载使用》开源项目地址：兼容op...

人工智能 2024-07-15 人工智能

1868阅读

Llama 3 基于知识库应用实践（一）

一、概述 Llama 3 是Meta最新推出的开源大语言模型，其8B和13B参数的模型的性能与之前的Llama 2相比实现了质的飞跃。以下是官方给出的模型性能评测对比结果（引自：https://ai.meta.com/blog/meta-llama-3/...

生成式AI 2024-07-14 人工智能

854阅读

全网最全提示词教程—手把手教你用Stable Diffusion写好提示词！

前言导语 Stable Diffusion 技术把 AI 图像生成提高到了一个全新高度，文生图 Text to image 生成质量很大程度上取决于你的提示词 Prompt 好不好。本文从“如何写好提示词”出发，从提示词构成、调整规则和 cha...

人工智能 2024-07-13 人工智能

5284阅读

llama-factory学习使用笔记

想要对开源的llama大模型，针对自己的数据进行微调，这里推荐llama-factory项目，LLama Factory，这个工具能够高效且低成本地支持对 100 多个模型进行微调。LLama Factory 简化了模型微调的过程，并且易于访问...

生成式AI 2024-07-13 人工智能

2000阅读

一款基于百度文心一言的商品评论智能回复Chrome插件

一、引言在上次小弟发布了一款基于openai大模型的Chrome网页插件后，有许多朋友向我提意见，表示这个插件需要翻墙，对于真正的小白还是有些不友好。因此这次我花了两个通宵，完成了一款基于百度文心一言大模型的网页插件的创作。本文将以作为一款商品评论的智...

人工智能 2024-07-13 人工智能

1006阅读

python 调用 llama

参考： https://blog.51cto.com/u_16175437/9317548 方法一：要在Python中调用Llama.ai模型来生成回答，你可以使用transformers库，它提供了调用不同的预训练模型的接口。以下是一个简单的例子，展...

大数据 2024-07-13 人工智能

879阅读

深入了解语音识别：Distil-Whisper

Distil-Whisper模型概述 1.1 Distil-Whisper的背景与意义随着语音识别技术的不断发展，模型的大小和计算复杂度成为了制约其广泛应用的重要因素。特别是在边缘设备和实时应用场景中，对模型的效率和性能提出了更高的要求。Dist...

生成式AI 2024-07-12 人工智能

2101阅读

Stable Diffusion / huggingface 相关配置问题汇总

目录 1 `OSError: Can't load tokenizer for 'openai/clip-vit-large-patch14'.` 报错解决方法方法1——手动下载方法2——自动下载其他方法（待研究） 2 `hug...

AIGC 2024-07-12 人工智能

2442阅读

OpenAI穿着「皇帝的新衣」；扒了数万条帖子汇总100种AIGC玩法；北美出海的财务避坑指南；我创业「如」有CTO | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ 1. 我扒了 Reddit 论坛数万条帖子，汇总了 GenAI 的 100 种玩法 ChatGPT 已经问世一年半了。这期间诞生了很多大语言模型和生成式人工...

人工智能 2024-07-12 人工智能

895阅读

谁才是大模型“四小龙”？

这两年热闹的大模型创业潮，被业内称为“AI2.0”。与之对应的“AI1.0”，指的是2015年左右开始的那一波AI创业潮，当时诞生了商汤、旷视、云从、依图等明星创业公司，它们以CV技术（计算机视觉）为主导，大量融资，风头无两。这四家公司，是公认的“AI四...

大数据 2024-07-12 人工智能

829阅读