流水线 - AIGC资讯

ai失业潮：人类如何与机器共存而非竞争？

标题：AI失业潮：探索人类与机器的和谐共存之道随着人工智能（AI）技术的飞速发展，我们正站在一个历史性的转折点上。AI的广泛应用不仅极大地提高了生产效率，也为社会带来了前所未有的变革。然而，这一进程也引发了广泛的社会担忧，尤其是关于AI可能导致的失业潮问题...

人工智能 2025-06-28 人工智能

679阅读

数据挖掘中的自动化流水线构建

数据挖掘中的自动化流水线构建：提升效率与精度的关键路径在当今数据驱动的时代，数据挖掘已成为企业决策、市场分析、科学研究等多个领域不可或缺的工具。随着数据量的爆炸式增长和复杂性的增加，传统的手动数据挖掘方法已难以满足高效、准确处理大量数据的需求。因此，自动化...

大数据 2025-06-22 大数据

616阅读

数据挖掘在2030年的发展趋势

标题：数据挖掘在2030年的发展趋势：智能、融合与伦理并重随着科技的飞速进步，我们正步入一个数据为王的时代。到了2030年，数据挖掘作为连接大数据与智能决策的桥梁，其重要性将更加凸显。在这一未来愿景中，数据挖掘技术不仅将实现前所未有的精度与效率，还将在智能...

生成式AI 2025-06-20 大数据

572阅读

数据清洗工具：自动化处理脏数据

在当今信息爆炸的时代，数据已成为企业决策与业务优化的核心驱动力。然而，在实际应用中，数据质量往往参差不齐，存在着缺失、错误、重复等多种问题，这些问题数据被形象地称为“脏数据”。脏数据的存在不仅会降低数据分析的准确性，还可能误导决策，造成不可估量的经济损失。...

人工智能 2025-06-17 大数据

583阅读

实时数据处理：kafka与flink的应用

标题：实时数据处理：Kafka与Flink的协同应用在大数据时代的浪潮中，实时数据处理已成为企业数字化转型的关键一环。随着数据量的爆炸式增长，如何高效、准确地处理和分析这些数据，以支持业务决策和智能化应用，成为了一个亟待解决的问题。在这一背景下，Apach...

生成式AI 2025-06-13 大数据

578阅读

数据仓库架构性能优化建议更新：支持业务发展

标题：数据仓库架构性能优化策略：赋能业务发展在当今数据驱动的商业环境中，数据仓库作为企业数据分析与决策的核心，其性能优化直接关系到业务发展的速度和效率。随着企业业务的不断扩展和复杂化，数据仓库面临着前所未有的挑战，包括数据量激增、查询响应时间延长、资源分配...

大数据 2025-06-07 大数据

556阅读

数据清洗工具创新应用案例更新：提升处理效率

标题：数据清洗工具的创新应用案例：提升处理效率的新篇章在数据驱动的时代，数据质量直接关系到企业决策的有效性和准确性。然而，原始数据中往往充斥着缺失值、异常值、重复数据等问题，这些数据“噪音”若不经有效清洗，将严重影响数据分析的准确性和效率。近年来，随着大数...

人工智能 2025-06-07 大数据

528阅读

什么是Agentic RAG？

Agentic RAG是检索增强生成(Retrieval-Augmented Generation, RAG 技术的一种高级形式,它通过引入人工智能代理(Agent 的概念,为语言模型赋予了更高层次的智能和自主性。以下是Agentic RAG的主要特点和优...

人工智能 2024-10-02 人工智能

1746阅读

Stable Diffusion 3「精神续作」FLUX.1 源码深度前瞻解读

前言前几个月，推出了著名文生图模型 Stable Diffusion 的 Stability AI 公司曝出了核心团队集体离职的消息。一时间，AI 从业者们议论纷纷，不知道这究竟是团队出现了矛盾，还是这些员工觉得文生图模型做下去没有前途了。而近期，该...

大数据 2024-09-17 人工智能

1693阅读

开源项目教程：Llama

开源项目教程：Llama llama项目地址:https://gitcode.com/gh_mirrors/llam/llama 项目介绍此教程基于GitHub上的开源项目 nelhage/llama，不过请注意，上述提供的链接并非真实的项目地...

大数据 2024-09-14 人工智能

941阅读

关于大模型和AIGC的36条笔记和真话

行业到底有多卷？最新统计，中国已有130多个大模型问世，在网信办备案的算法模型也超过70多家。BAT等互联网巨头悉数下场发布AI大模型，仅2023年就有超60家创业公司拿到融资，产品更是布满了基础层、模型层和应用层。新一代生成式AI，可能要回头看看上一...

人工智能 2024-09-10 人工智能

901阅读

openai whisper使用

whisper使用介绍 Whisper是一种通用的语音识别模型。它是在大量不同音频数据集上训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。 GitHub：https://github.com/openai/whisper...

生成式AI 2024-09-10 人工智能

1220阅读

Llama 3.1：开源LLM新突破

在人工智能的浩瀚星海中，每一颗新星的诞生都预示着科技的一次飞跃。Meta 的 Llama 3.1，携带着 4050 亿个参数的庞大身躯，以其卓越的准确性、速度和多模态能力，正引领我们进入一个全新的 AI 时代。这不仅是技术的突破，更是对未来无限可能的一次大...

生成式AI 2024-09-07 人工智能

1114阅读

RAG 入门指南：从零开始构建一个 RAG 系统

本文正文字数约 3300 字，阅读时间 10 分钟。从零开始构建一个应用可以让我们快速理解应用的各个部分。这个方法其实非常适用于 RAG。我在以前的文章中有介绍过 RAG 的概念、原理以及应用等，但其实，亲自动手来构建一个 RAG 系统或许能够...

大数据 2024-09-03 人工智能

1271阅读

【大模型理论篇】关于LLaMA 3.1 405B以及小模型的崛起

前不久，Meta开源了LLaMA 3.1 405B【1】，模型扩展了上下文长度至 128K，支持八种语言，效果非常惊艳，是首个在通用知识、可操控性、数学、工具使用和多语言翻译方面能够与最先进闭源 AI 模型媲美的公开可用模型，已经赶上截至目...

生成式AI 2024-08-31 人工智能

1157阅读

深度解读 Llama 3.1 技术报告：从405B参数到24000块H100集群

Meta在最近发布了他们的开源大模型Llama 3.1，引起了广泛的关注和讨论。随着热度逐渐退潮，Llama 3.1 的详细技术报告也公开了。这份报告揭示了很多关于Llama 3.1 的技术细节和实现原理。本文将从模型参数、基础设施、预训练、后训练等方面，...

大数据 2024-08-27 人工智能

1412阅读

英伟达最新技术分享：手把手教你用Llama 3.1合成数据改进模型！附代码

【导读】适逢Llama 3.1模型刚刚发布，英伟达就发表了一篇技术博客，手把手教你如何好好利用这个强大的开源模型，为领域模型或RAG系统的微调生成合成数据。 Epoch AI上个月刚刚发文[预言数据墙」迫近，结果英伟达转头就甩出了340B开源巨兽Ne...

生成式AI 2024-08-24 人工智能

1019阅读

WhisperS2T：加速语音转文本的高效解决方案

WhisperS2T：加速语音转文本的高效解决方案 WhisperS2TAn Optimized Speech-to-Text Pipeline for the Whisper Model Supporting Multiple Inference E...

生成式AI 2024-08-24 人工智能

1090阅读

最强模型Llama 3.1 405B正式发布，扎克伯格：开源引领新时代

刚刚，大家期待已久的 Llama 3.1 官方正式发布了！ Meta 官方发出了「开源引领新时代」的声音。在官方博客中，Meta 表示：「直到今天，开源大语言模型在功能和性能方面大多落后于封闭模型。现在，我们正在迎来一个开源引领的新时代。我们公开...

人工智能 2024-08-20 人工智能

941阅读

Mistral新旗舰决战Llama 3.1，最强开源Large 2 123B，扛鼎多语言编程全能王

【新智元导读】紧跟着Meta的重磅发布，Mistral Large 2也带着权重一起上新了，而且参数量仅为Llama 3.1 405B的三分之一。不仅在编码、数学和多语言等专业领域可与SOTA模型直接竞争，还支持单节点部署。昨天正式发布的Llama 3...

大数据 2024-08-19 人工智能

948阅读

【史上最强的AIGC的使用场景和具体案例分析】

AIGC（Artificial Intelligence in Game Creation）是一种利用人工智能技术辅助游戏开发的方法。它可以用于游戏中的各个方面，包括游戏设计、关卡设计、角色设计、AI行为设计等。以下是一些AIGC的使用场景和具体案例...

人工智能 2024-08-19 人工智能

1461阅读

LLM大模型：一文彻底搞定 RAG、知识库、 Llama-3

简介： Llama-3 用于 RAG，增强大语言模型的性能，整合外部知识。关键组件包括：1 自定义知识库，存储更新的信息；2 分块处理，拆解文本便于管理；3 嵌入模型，转化多模态数据为数值向量；4 向量数据库，快速检索相似性；5 用户聊天界面，交...

生成式AI 2024-08-14 人工智能

1111阅读

LLaMA.cpp 是什么？与 GPT 哪个效果更好？

LLaMA.cpp 概述 LLaMA.cpp 是 Facebook LLaMA 模型的 C/C++ 端口，LLaMA 模型是一种大型语言模型 (LLM ，可以生成文本、翻译语言、编写不同类型的创意内容，并以信息丰富的方式回答您的问题。它仍在开发中，但它...

AIGC 2024-08-13 人工智能

1385阅读

AIGC大模型面经汇总，太全了！

字节暑期实习多模态算法 (二面凉经一面 2024/3/28 下午17:00-18:00 1.上来没有自我介绍 2.直接介绍NeurIPS论文，中间穿插着一些提问 3.说一下Transformer的整体结构 4.了解有哪些位置编码方式吗 5.说一...

大数据 2024-08-13 人工智能

1690阅读

从LLaMa 3 技术报告，再看LLM构建过程 ——《带你自学大语言模型》系列（番外）

本系列目录《带你自学大语言模型》系列部分目录及计划，完整版目录见：带你自学大语言模型系列 —— 前言第一部分走进大语言模型（科普向）第一章走进大语言模型 1.1 从图灵机到GPT，人工智能经历了什么？——《带你自学大语言模型...

人工智能 2024-08-09 人工智能

1344阅读

Llama 3.1：Meta迄今为止规模最大、质量最高的开源模型

早在今年4月，Meta就曾透露正在为AI行业开发一项首创技术：一种性能足以与OpenAI等厂商的最强私有模型相媲美的开源模型。现如今，这套模型已经问世。Meta发布了有史以来体量最大的开源AI模型Llama 3.1。该公司声称该模型在多项基准测试中优于...

大数据 2024-08-08 人工智能

1108阅读

如何定量分析 Llama 3，大模型系统工程师视角的 Transformer 架构

读完全文后，你将获得回答以下问题的能力（参考答案，请见最后一章节）： Llama 3 技术博客说 70B 模型、最长序列 8K、15T Tokens，训练了 640w GPU 时，这发挥了 H100 理论算力（989TFlops）的百分之多少?...

大数据 2024-08-05 人工智能

922阅读

LLM大语言模型-ChatGPT、LLaMA、ChatGLM、文心一言、通义千问

LLM大语言模型-ChatGPT、LLaMA、ChatGLM、文心一言、通义千问一、LLM与PLM主要区别： LLM表现出PLM所没有的Emergent Abilities（涌现能力）,这些能力是LLM在复杂任务上表现惊人的关键，使得得人工智能算...

人工智能 2024-08-03 人工智能

1346阅读

一文速览Llama 3.1——对其92页paper的全面细致解读：涵盖语言、视觉、语音的架构、原理

前言按我原本的计划，我是依次写这些文章：解读mamba2、解读open-television、我司7方面review微调gemma2，再接下来是TTT、nature审稿微调、序列并行、Flash Attention3.. 然TTT还没写完，7.23日...

人工智能 2024-07-29 人工智能

1216阅读

【AIGC】Llama-3 官方技术报告

Llama-3 技术报告（中文翻译）欢迎关注【youcans的AGI学习笔记】原创作品 0. 简介现代人工智能（AI）系统的核心驱动力来自于基础模型。本文介绍了一组新的基础模型，称为 Llama 3。它是一个语言模型系列，原生支持多语言...

大数据 2024-07-29 人工智能

1476阅读

LLama 405B 技术报告解读

LLama 405B 技术报告解读果然传的消息都是真的，meta在24号凌晨发布了llama 3的405B版本，这次还是做一个技术报告解读。值得一提的是，在技术报告的开头，meta特意强调了一个 Managing complexity，大意是管控...

生成式AI 2024-07-27 人工智能

1002阅读

横店，到底相不相信AI？

横店，一个被竖屏短剧占领的地方，正在被AI分成两半。一半是对AI兴趣缺缺的短剧制造者们。在横店的各种拍摄招募信息中，周期为3~ 7 天的项目占去了大部分的版面，数不清的演员、导演、摄影师、化妆师组成了稳定的生产流水线，把扇巴掌、下跪、撒钞票这些程序化的...

人工智能 2024-07-25 人工智能

951阅读

Stable Diffusion 3 论文及源码概览

天才程序员周弈帆 2024年07月13日 23:30 近期，最受开源社区欢迎的文生图模型 Stable Diffusion 的最新版本 Stable Diffusion 3 开放了源码和模型参数。开发者宣称，Stable Diffusion 3 使用了...

大数据 2024-07-23 人工智能

1033阅读

大模型应用开发之业务架构和技术架构（从AI Embedded 到 Copilot,再到Agent）_embedding、copilot、agents

前言截止到目前，我们已经从大模型的定义概念，应用层涉及的一些概念做了些了解。在大模型的应用开发中，RAG、Agent等概念我们之前也做了些简述，没有看过的可以粗略回顾一下：[大模型06-大模型应用开发之准备篇。本文我们重点讲的就是伴随着大模型的广...

AIGC 2024-07-20 人工智能

1778阅读

本地私有化部署开源大模型完整教程：LangChain + Streamlit+ Llama 【LLM大模型】

在过去的几个月里，大型语言模型(llm 获得了极大的关注，这些模型创造了令人兴奋的前景，特别是对于从事聊天机器人、个人助理和内容创作的开发人员。大型语言模型(llm 是指能够生成与人类语言非常相似的文本并以自然方式理解提示的机器学习模型。这些模型使...

生成式AI 2024-07-19 人工智能

1583阅读

不用翻墙，手把手教你用MAC本地版免费ComfyUI搭建Stable Diffusion工作流，让出图效率起飞

AI绘图如火如荼发展了这么久，从mj到SD webUI,再到时下最热门的Comfy UI。因为显存的问题对Mac用户一直不是很友好，阻碍了大部分设计师上手学习的道路。但是Comflowy解决了这个痛点。这是一款Mac系统可用本地版的sd，一键安装，让苹果用...

大数据 2024-07-17 人工智能

2415阅读

揭秘！FFmpeg+Whisper双剑合璧：解锁视频到文本的二阶段奇迹

解锁视频到文本的二阶段奇迹一、引言二、视频音频提取与处理视频音频提取与处理 2.1 环境搭建 2.2 视频音频提取 2.3 音频预处理示例代码：三、语音识别与翻译 3.1 加载Whisper模型 3.2 语音识别 3.3 语言检...

人工智能 2024-07-15 人工智能

1124阅读

高质量AIGC/ChatGPT/大模型资料分享

2023年要说科技圈什么最火爆，一定是ChatGPT、AIGC（人工智能生成内容）和大型语言模型。这些技术前沿如同科技世界的新潮流，巨浪拍岸，引发各界关注。ChatGPT的互动性和逼真度让人们瞠目，它能与用户展开流畅对话，回答问题，乃至创作文章和诗歌，展现...

大数据 2024-07-12 人工智能

988阅读

嵌入式期末复习--补充（答案来自文心一言）

一、第一章 1、常见的RTOS，嵌入式操作系统的特点 RTOS就是实时操作系统。根据响应时间的不同，可分为以下3类：（1）强实时嵌入式操作系统响应时间：微妙或毫秒（2）一般实时嵌入式操作系统响应时间：毫秒...

生成式AI 2024-06-27 人工智能

921阅读

【推理优化】超详细！AIGC面试系列大模型推理系列(2)

本期问题聚焦于大模型的推理优化技术本期问题快览有哪些常见的大模型推理优化技术介绍下通过流水线处理技术来加速大模型推理方案介绍下并行计算技术来加速大模型推理的方案有哪些通过硬件来加速大模型推理的方式？模型量化是如何加速大模型推理的？...

生成式AI 2024-06-20 人工智能

2834阅读

Prompt提示词助力AI写作

AI以极高的效率和还可以的输出质量，得到了许多写作人的青睐，Prompt作为AI写作的核心，通过简短的提示来引导AI生成文本，让写作新手也能轻松自如。 1. 看不下去的行业乱状让人不禁遗憾的是，国外的开发者都在忙着搞AI科研或者做各种AI应用，而国...

生成式AI 2024-06-20 人工智能

927阅读

AI下的首批失业者：60余人采编团队被裁只剩一个与AI合作

快科技6月20日消息，据国外媒体报道，人工智能技术的飞速发展，也带来了职业岗位的剧烈变动。作家本杰明米勒领导着一个60多人的团队，为科技公司撰写文章和专栏，然而，公司为降低成本引入AI技术，导致团队成员相继被裁，最终只留下米勒一人与AI合作。米勒的团队...

AIGC 2024-06-20 人工智能

774阅读

AI鬼畜攻占B站：一条视频播放数百万，UP主年更变月更

B站鬼畜区正在掀起一阵新的风潮:AI鬼畜。先请大家欣赏一条视频: （来源:B站UP主“鸽潭一姐”）在AI音乐创作神器Suno的加持下，UP主“鸽潭一姐”今年4月在B站发布首条视频《Suno AI热唱【萨菲罗斯男人中的男人】》，就斩获了近500万播放量...

大数据 2024-06-17 人工智能

1583阅读

【多线程】进程与线程

???来都来了，不妨点个关注叭！?博客主页：欢迎各位大佬!? 文章目录 1. 操作系统 2. 进程 2.1 进程是什么 2.2 进程管理 2.3 进程调度 2.3 内存管理 2.4 进程间通信 3. 线程 3.1 线程是什么 3...

生成式AI 2024-06-13 人工智能

859阅读

手机流畅运行470亿大模型：上交大发布LLM手机推理框架PowerInfer-2，提速29倍

苹果一出手，在手机等移动设备上部署大模型不可避免地成为行业关注焦点。然而，目前在移动设备上运行的模型相对较小（苹果的是3B，谷歌的是2B），并且消耗大量内存，这在很大程度上限制了其应用场景。即使是苹果，目前也需要与OpenAI合作，通过将云端GPT-4...

AIGC 2024-06-12 人工智能

888阅读

Yolov10：详解、部署、应用一站式齐全！

一、前言在过去的几年里，YOLOs由于其在计算成本和检测性能之间的有效平衡，已成为实时目标检测领域的主导范式。研究人员探索了YOLO的架构设计、优化目标、数据扩充策略等，取得了显著进展。然而，依赖非极大值抑制（NMS）进行后处理阻碍了YOLO的...

生成式AI 2024-05-29 人工智能

1713阅读

探秘Faster Whisper：一款加速 Whisper 模型训练的高效工具

探秘Faster Whisper：一款加速 Whisper 模型训练的高效工具项目地址:https://gitcode.com/SYSTRAN/faster-whisper 在自然语言处理（NLP）领域，Transformer架构的模型如Whis...

生成式AI 2024-05-28 人工智能

1185阅读

我们一起聊聊AI模型组合指南

实施需要周密的计划、资源管理以及采用现代部署实践和工具。译自A Guide to Model Composition，作者 Sherlock Xu。考虑一款旨在识别和分类野生动物照片的 AI 驱动的图像识别应用程序。您上传一张远足时拍摄的照片，几分钟...

大数据 2024-05-20 人工智能

891阅读

腾讯 PCG 搜广推机器学习框架GPU 性能优化实践

一、为什么 GPU 推荐模型训练框架是刚需 1. PCG 算力集群缺点最开始的时候，腾讯 PCG 所有的推荐模型训练都是使用 CPU。但随着业务的深入，以及深度学习模型的发展，PCG 算力集群在做下一代推荐模型时会遇到各种问题：首先，系统网络带宽...

AIGC 2024-05-20 人工智能

890阅读

Deepseek-V2技术报告解读！全网最细！

深度求索Deepseek近日发布了v2版本的模型，沿袭了1月发布的 Deepseek-MoE（混合专家模型）的技术路线，采用大量的小参数专家进行建模，同时在训练和推理上加入了更多的优化。沿袭了一贯的作风，Deepseek对模型（基座和对话对齐版本）进行了...

生成式AI 2024-05-09 人工智能

4103阅读