cto 第9页 - AIGC资讯

3B模型新SOTA！开源AI让日常调用不同大模型更简单

大模型，大，能力强，好用！但单一大模型在算力、数据和能耗方面面临巨大的限制，且消耗大量资源。而且目前最强大的模型大多为闭源，对AI开发的速度、安全性和公平性有所限制。 AI大模型的未来发展趋势，需要怎么在单一大模型和多个专门化小模型之间做平衡和选择？...

AIGC 2024-06-04 人工智能

827阅读

训练Stable Diffusion(XL) Lora的图片是否需要caption？

intro 目前很多风格lora模型的训练都会对图片进行caption，训练风格lora时使用image caption步骤是否能带来正向的效果? 在sdxl的代码实现中，lora插入的位置为unet中cross attention的QKV的线性投影部...

生成式AI 2024-06-04 人工智能

928阅读

Ilya离开后，8位OpenAI新安全与保密委员会领军人物，你认识几位？

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto） OpenAI宣布成立新的安全与保密委员会，该委员会负责OpenAI项目和运营中的关键决策制定，这引发了互联网的广泛讨论，因为CEO山姆·阿尔特曼（Sam Altman）也是委员会成...

生成式AI 2024-06-04 人工智能

873阅读

实时局部建图的深入思考 | MapTR继往开来的18篇论文剖析！

本文经自动驾驶之心公众号授权转载，转载请联系出处。实时局部建图领域自从端到端方案MapTR(2023.1 [1]问世后已经又涌现出非常多优秀的工作,基本是在MapTR基本框架的基础上进行一系列改进,包括原班人马的升级作品MapTRv2(2023.8 ...

人工智能 2024-06-04 人工智能

1651阅读

意外！老黄剧透下一代GPU芯片，新演讲又把摩尔定律按在地上摩擦

刚刚，中国台湾大学体育场，欢呼阵阵如同演唱会，但这次“摇滚巨星”，其实是英伟达创始人黄仁勋，再次回到学校，带来Computex重磅演讲，以及英伟达的新一代GPU。是的，英伟达新架构Blackwell宣布不过3个月，老黄就把后三代路线图全公开了： 20...

人工智能 2024-06-03 人工智能

855阅读

Llama-Factory 简介二，脚本详解 LLaMA-Factory/src/train_bash.py LLaMA-Factory/src/llmtuner/train/pt/workfl

examples/ ├── lora_single_gpu/ │ ├── pretrain.sh: 基于 LoRA 进行增量预训练 │ ├── sft.sh: 基于 LoRA 进行指令监督微调 │ ├── reward.sh: 基于 LoRA...

生成式AI 2024-06-03 人工智能

1715阅读

腾讯元宝全面测评！国产AI“看剧”时代开启！读懂《庆余年》范闲，揭秘奥特曼宫斗！打通腾讯生态“全村的希望”！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）腾讯在大模型上的动作姗姗来迟。对于“后发”的抉择，腾讯想得很清楚。在“腾讯元宝”上线的发布会上，腾讯云副总裁、腾讯混元大模型负责人刘煜宏说，“虽然行业内看起来火热，但是中国移动...

生成式AI 2024-06-03 人工智能

1030阅读

大模型微调之使用 LLaMA-Factory 微调 Llama3

大模型微调之使用 LLaMA-Factory 微调 Llama3 使用 LLaMA Factory 微调 Llama-3 中文对话模型安装 LLaMA Factory 依赖 %cd /content/ %rm -rf LLaMA-Factory...

AIGC 2024-06-03 人工智能

2106阅读

老黄一口气解密三代GPU！粉碎摩尔定律打造AI帝国，量产Blackwell解决ChatGPT全球耗电难题

想了解更多AIGC的内容，请访问：51CTO AI.x社区 https://www.51cto.com/aigc/ 就在刚刚，老黄手持Blackwell向全世界展示的那一刻，全场的观众沸腾了。它，是迄今为止世界最大的芯片！眼前的这块产品，凝聚着数...

大数据 2024-06-03 人工智能

822阅读

超越Devin！姚班带队，他们创大模型编程新世界纪录

超越Devin!SWEBench排行榜上迎来了新玩家—— StarShip CodeGen Agent，姚班带队初创公司OpenCSG出品，以23.67%的成绩获得全球第二名的成绩。同时创造了非GPT-4o基模的最高纪录（SOTA）。我们都知道，SW...

生成式AI 2024-06-03 人工智能

928阅读

大模型“分区”部署在云和边缘更合适？

作者 | David Linthicum 出品 | 51CTO技术栈（微信号：blog51cto）众所周知，大型语言模型（LLMs）需要大量的计算资源。这意味着开发和部署主要集中在强大的集中式系统上，如公共云提供商。然而，尽管许多人认为我们需要大量的...

生成式AI 2024-06-03 人工智能

881阅读

使用 Springboot3.x 实现考试系统中接打电话的识别与处理

本专题将深入探讨考试系统中常见的复杂技术问题，并提供基于Spring Boot 3.x的解决方案。涵盖屏幕切换检测与防护、接打电话识别处理、行为监控摄像头使用、网络不稳定应对等，每篇文章详细剖析问题并提供实际案例与代码示例，帮助开发者应对挑战，提升考试系...

生成式AI 2024-06-03 人工智能

989阅读

【Stable Diffusion】ModuleNotFoundError: No module named ‘ifnude‘ and roop v0.0.2

提示：ModuleNotFoundError: No module named ‘ifnude’ 一、issues/299：ModuleNotFoundError: No module named ‘ifnude’ 路径 cmd 中也可以看到，...

AIGC 2024-06-03 人工智能

1251阅读

llama_factory微调QWen1.5

GitHub - hiyouga/LLaMA-Factory: Unify Efficient Fine-Tuning of 100+ LLMsUnify Efficient Fine-Tuning of 100+ LLMs. Contribute to...

生成式AI 2024-06-03 人工智能

1363阅读

使用LLaMA Factory来训练智谱ChatGLM3-6B模型

使用LLaMA Factory来训练智谱ChatGLM3-6B模型时，以下是一个训练过程： 1. 环境搭建 a. 安装Python和Anaconda 下载并安装适合你操作系统的Python版本（推荐Python 3.10或更高版本）。安装Anac...

AIGC 2024-06-03 人工智能

1268阅读

在autodl平台使用llama-factory微调Qwen1.5-7B

1 部署环境 step 1. 使用24GB显存以上的显卡创建环境 step 2. 创建好环境之后，关闭环境，使用无卡模式开机（有钱可忽略） step 3. 安装LLaMA-Factory git clone https://github.com/...

生成式AI 2024-06-02 人工智能

1370阅读

时间序列模型：lag-Llama

项目地址：GitHub - time-series-foundation-models/lag-llama: Lag-Llama: Towards Foundation Models for Probabilistic Time Series Foreca...

大数据 2024-06-02 人工智能

1239阅读

llama-factory学习个人记录

框架、模型、数据集准备 1.llama-factory部署 # 克隆仓库 git clone https://github.com/hiyouga/LLaMA-Factory.git # 创建虚拟环境 conda create --name llama...

人工智能 2024-06-02 人工智能

2326阅读

10 分钟，教你如何用 LLama-Factory 训练和微调 LLama3 模型

本文将探讨于2024年3月21日发布的LLama-Factory，并学习如何使用 DigitalOcean 旗下的 Paperspace平台对 LLama 3 进行微调。为了完成我们的任务，我们将使用 NVIDIA A4000 GPU，它被认为是功能最强大...

大数据 2024-06-02 人工智能

1468阅读

AIGC、LLM 加持下的地图特征笔记内容生产系统架构设计

文章目录背景构建自动化内容生产平台系统架构设计架构详细设计流程介绍笔记来源笔记抓取干预笔记 AIGC 赋能笔记 Rule 改写笔记特征库构建附录 Bash Cron 定时任务 Golang 与 Pyhon AIG...

AIGC 2024-06-02 人工智能

876阅读

基于 Llama-Index、Llama 3 和 Qdrant，构建一个 RAG 问答系统！

构建一个使用Llama-Index、Llama 3和Qdrant的高级重排-RAG系统尽管大型语言模型（LLMs）有能力生成有意义且语法正确的文本，但它们面临的一个挑战是幻觉。在LLMs中，幻觉指的是它们倾向于自信地生成错误答案，制造出看似令人信...

生成式AI 2024-06-02 人工智能

1378阅读

007-Wsl-Ubuntu上LLaMA-Factory如何下载、部署、运行【AI超车B计划】

一、目标了解什么是LLaMA-Factory；成功在Wsl-Ubuntu环境下安装并运行LLaMA-Factory；二、路径学习笔记中关于LLaMA-Factory的简介，了解什么是LLaMA-Factory；在Ubun...

生成式AI 2024-06-01 人工智能

1769阅读

AI智能体研发之路-模型篇（一）：大模型训练框架LLaMA-Factory在国内网络环境下的安装、部署及使用

博客导读：《AI—工程篇》 AI智能体研发之路-工程篇（一）：Docker助力AI智能体开发提效 AI智能体研发之路-工程篇（二）：Dify智能体开发平台一键部署 AI智能体研发之路-工程篇（三）：大模型推理服务框架Ollama...

大数据 2024-06-01 人工智能

1480阅读

LLaMA-Factory 微调训练

LLaMA-Factory 微调训练该框架功能，标注-微调-导出-合并-部署，一整条流程都有，而且训练时消耗的gpu算力也会小一些一，安装（推荐在linux中训练，win可以用wsl+docker） git clone https:...

大数据 2024-06-01 人工智能

1743阅读

真实对比kimi、通义千问、文心一言的写代码能力，到底谁强？

?AI改变生活：最近都在说月之暗面的kimi的各项能力吊打国内其他大模型，今天我们真实感受下 kimi、通义千问、文心一言的根据需求写代码的能力。测评结果让人震惊！ kimi kimi编程过程我们先看一下热捧的月之暗面的kimi模型。...

生成式AI 2024-06-01 人工智能

2461阅读

LLMs之FineTuning：Alpaca格式/Vicuna的sharegpt 格式数据集简介、利用多种方式构造或转换指令微调格式数据集实战——利用LLaMA-Factory框架的dataset_i

LLMs之FineTuning：常用指令微调格式数据集的简介(Alpaca格式/Vicuna的sharegpt 格式、利用多种方式构造或转换指令微调格式数据集实战——利用LLaMA-Factory框架的dataset_info.json 中通过指定 --...

人工智能 2024-06-01 人工智能

1170阅读

基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）

基于LlaMA 3 + LangGraph 在windows本地部署大模型（一） RAG 是未来人工智能应用的基石。大家并不是在寻求仅仅产生无意义反应的人工智能。而目标是人工智能能够从特定文档集中检索答案，理解查询的上下文，指导自己搜索其嵌入内容...

大数据 2024-06-01 人工智能

1435阅读

肝了三天，完成了AIGC工具网站大全，建议收藏再看

说是肝了三天，其实远远不止，前前后后，从资料搜集到最后整理成文，有近一个月了，大家看在整理不易的份上，给点个赞吧，不要光顾着收藏呀！国内网站 AIGC 导航 https://www.aigc.cn 网站很全面，而且可以看出商业化也比...

生成式AI 2024-05-31 人工智能

993阅读

TikTok被曝正在代码拆分，欲复制核心算法打造美国独立版抖音！最新回应：误导，不准确！

出品 | 51CTO技术栈（微信号：blog51cto） 5月30日，路透社报道了一则“TikTok正准备复制其核心算法打造美国版抖音”的消息，引起了国内外大众的关注。路透社称，据直接了解情况的消息人士透露，TikTok 正在为其 1.7 亿美国用户...

大数据 2024-05-31 人工智能

842阅读

音乐界的GPT免费！Suno v3.5全部开放，歌曲长达4分钟！未来敲敲塑料壶就能成天籁

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto） Suno清晨干大事，宣布此前只对高级版和专业版用户开放的v3.5版本，所有用户都可用了！图片简单说，Suno生成的歌曲变长了也变强了。作为音乐界的Cha...

生成式AI 2024-05-31 人工智能

846阅读

CIO可以做的三件事，使GenAI与可持续性同步

去年，随着许多CIO首次准备进行范围3(Scope 3 报告，GenAI几乎渗透到了每一个办公室。有时它是通过正门进来的，但在大多数情况下，它是悄悄渗入的，因为知识工作者在编写文档和电子邮件时试验了它，而不一定承认他们在这样做。在许多企业中，使用案...

人工智能 2024-05-31 人工智能

847阅读

Spring Boot与百度AI语音识别API集成实践

本专题系统讲解了如何利用SpringBoot集成音频识别技术，涵盖了从基础配置到复杂应用的方方面面。通过本文，读者可以了解到在智能语音填单、智能语音交互、智能语音检索等场景中，音频识别技术如何有效提升人机交互效率。无论是本地存储检索，还是云服务的集成，丰...

AIGC 2024-05-31 人工智能

1209阅读

GitHub Copilot Workspace：欢迎进入原生Copilot开发环境

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同...

人工智能 2024-05-31 人工智能

1015阅读

北航发布LlamaFactory，零代码大模型微调平台，一键快速实现大模型训练/微调/评估

“LLAMAFACTORY: Unified Efficient Fine-Tuning of 100+ Language Models” 在大模型发展如火如荼的今天，训练和微调一个大模型对于绝大部分普通工程师来说仍然是一个难题。为了降低大模型训练、...

生成式AI 2024-05-31 人工智能

1798阅读

MonoDETRNext：下一代准确高效的单目3D检测方法！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解基于单目视觉的3D目标检测在各个领域都至关重要，但现有方法在准确性和计算效率方面面临着重大挑战。在2D检测和深度估计的成功策略的基础上，本文提出了MonoDETRNe...

人工智能 2024-05-30 人工智能

1070阅读

AWS X 易点天下|共启生成式AI合作伙伴计划，对话GenAI原生企业的机遇与挑战

5月29日，2024亚马逊云科技中国峰会在上海·世博中心盛大开幕。易点天下受邀出席，并与全球顶尖的云计算及人工智能技术专家、业界领袖和企业高管，围绕生成式AI全球前沿创新与本地实践、生成式AI赋能十大行业全价值链创新、创新架构和跨代技术革新云上实践三大主...

人工智能 2024-05-30 人工智能

841阅读

【记录】LangChain｜Ollama结合LangChain使用的速通版（包含代码以及切换各种模型的方式）

官方教程非常长，我看了很认可，但是看完了之后呢就需要一些整理得当的笔记让我自己能更快地找到需求。所以有了这篇文章。【写给自己看的，里面半句废话的解释都没有，如果看不懂的话直接看官方教程再看我的】 ollama是个平台，里面一大堆开源模型，llama...

生成式AI 2024-05-30 人工智能

1294阅读

阅读llama源码笔记_1

文章目录总体逻辑 1 构造模型 2 定义数据 3 处理下游任务 1.构造模型 1.1构造分词器tokenizer 1.2构造Transformer 2.定义数据 3.处理下游任务 3.1分词（编码） 3.2 generate...

大数据 2024-05-30 人工智能

806阅读

AI绘画SDXL【插件篇】：风格插件StyleSelectorXL，灵活自由切换画风

大家好，我是程序员晓晓。在传统的SD1.5中，不同的绘画风格需要选择不同的大模型或者LORA，而现在SDXL，我们可以在同一个模型中绘制各种不同风格的图像，那么我们如何来绘制我们想要风格的图像呢？今天给大家介绍的这款插件，主要就是用于来帮助我们快速实现...

人工智能 2024-05-30 人工智能

1124阅读

通过强化学习策略进行特征选择

特征选择是构建机器学习模型过程中的决定性步骤。为模型和我们想要完成的任务选择好的特征，可以提高性能。如果我们处理的是高维数据集，那么选择特征就显得尤为重要。它使模型能够更快更好地学习。我们的想法是找到最优数量的特征和最有意义的特征。在本文中，我们将...

人工智能 2024-05-30 人工智能

874阅读

蚂蚁集团CTO称大模型还在钻木取火阶段：仍未找到AI的本质

快科技5月30日消息，在近日的在第九届蚂蚁技术日上，蚂蚁集团CTO（首席技术官）何征宇提出了对当前大模型技术发展的深刻见解。何征宇比喻说，尽管大模型技术有其用处，但目前的发展阶段还类似于原始人钻木取火，尽管我们能够利用AI技术，但还没有找到最高效的方法，...

AIGC 2024-05-30 人工智能

752阅读

Mistral 开源代码模型夺得王座！Codestral疯狂训练超80种语言，国内通义开发者请求出战！

出品 | 51CTO技术栈（微信号：blog51cto） Mistral 发布了首个代码模型 Codestral-22B！该模型的疯狂之处不仅在于训练了80多种编程语言，包括许多代码模型忽略的Swift等。还在于他非同一般的速度。要求用Go语言编...

大数据 2024-05-30 人工智能

900阅读

Llama3-Tutorial（Llama 3 超级课堂）作业

1.Llama 3 Web Demo 部署 cd ~ git clone https://github.com/SmartFlowAI/Llama3-Tutorial 安装 XTuner 时会自动安装其他依赖 cd ~ git clone -b...

大数据 2024-05-30 人工智能

3245阅读

深入探索令牌桶限流的原理与实践

在当今的互联网时代，随着用户数量和请求量的不断增加，系统的性能和稳定性面临着巨大的挑战。限流算法作为保障系统稳定性的重要手段之一，被广泛应用于各种服务和应用中。限流的核心目的是对某一时间窗口内的请求数进行限制，保持系统的可用性和稳定性，防止因流量暴增而导致...

大数据 2024-05-30 人工智能

900阅读

保姆级零基础微调大模型（LLaMa-Factory，多卡版）

此处非常感谢https://github.com/hiyouga/LLaMA-Factory这个项目。看到网上的教程很多都是教如何用webui来微调的，这里出一期命令行多卡微调教程~ 1. 模型准备模型下载比较方便的方法： 1. modelsc...

大数据 2024-05-30 人工智能

1798阅读

Spring Boot3.x与阿里云人脸识别服务对接实现人脸识别

本专题致力于深入探讨如何通过SpringBoot3.x框架与OpenCV库实现高效的人脸检测和人脸识别系统。通过系统化的10篇文章，从基础概念到高级应用，结合代码示例和实战案例，逐步引导大家掌握从零开始构建完整人脸检测与识别系统的全过程。阿里云人脸识别...

人工智能 2024-05-30 人工智能

935阅读

如何将大型语言模型（LLM）转换为嵌入模型

译者 | 李睿审校 | 重楼实验证明，LLM2Vec模型在嵌入任务上具有更好的性能，它可以为组织开辟新的场所，并以非常低的成本快速创建专门的嵌入模型。嵌入模型已经成为大型语言模型(LLM 应用的重要组成部分，可以实现检测文本相似度、信息检索和聚类...

大数据 2024-05-30 人工智能

907阅读

Stable Diffusion教程：提示词（模型、插件、安装包可分享）

什么是提示词文章提到的模型、插件、安装包都可分享，需要的小伙伴文末领取！你可能没写过提示词，但是一定听说过“提示词”这几个字，也大概能知道它的重要性。没听说过也没关系，下面我就带你认识认识。提示词就是我们给AI模型下发的指令。提示词写对了...

大数据 2024-05-30 人工智能

976阅读

AI绘画：使用Stable Diffusion ComfyUI进行换脸：IPAdapter FaceID全面教程

在数字艺术和媒体编辑领域，换脸技术已经成为一种流行且强大的工具。它允许创作者将一个人物的面部特征无缝地转移到另一个人物上，创造出令人信服的视觉作品。Stable Diffusion ComfyUI提供了一个高效的平台，让用户能够轻松地实现换...

AIGC 2024-05-29 人工智能

4255阅读

一文速览Llama 3及其微调：从如何把长度扩展到100万到如何微调Llama3 8B

前言 4.19日凌晨正准备睡觉时，突然审稿项目组的文弱同学说：Meta发布Llama 3系列大语言模型了，一查，还真是本文以大模型开发者的视角，基于Meta官方博客的介绍：Introducing Meta Llama 3: The most capa...

AIGC 2024-05-29 人工智能

1947阅读