处理文本 - AIGC资讯

爬虫中的数据爬取目标定位

在数据科学和互联网信息获取的领域中，爬虫技术扮演着至关重要的角色。它允许我们自动化地从网站上收集信息，这对于市场分析、学术研究、竞争情报等多个领域都极为有价值。然而，爬虫技术的核心在于如何精准地定位数据爬取目标，即确定从哪个网站、哪个页面以及具体哪些数据元...

生成式AI 2025-06-16 大数据

669阅读

数据清洗工具发展趋势分析：智能化与自动化

标题：数据清洗工具的发展趋势：智能化与自动化的深度融合随着大数据时代的到来，数据已成为企业决策、科学研究乃至日常生活不可或缺的重要资源。然而，海量数据中往往混杂着噪声、缺失值、异常值等问题，这些问题数据若未经处理直接使用，将严重影响数据分析的准确性和效率。...

生成式AI 2025-06-15 大数据

646阅读

数据采集在智能运维中的应用

标题：数据采集在智能运维中的应用探索随着信息技术的飞速发展，企业IT系统日益复杂，运维管理面临着前所未有的挑战。传统的人工运维模式已难以满足高效、精准、实时的需求，智能运维（AIOps，Artificial Intelligence for IT Oper...

大数据 2025-06-12 大数据

574阅读

数据清洗工具选型建议更新：根据业务需求选择

在数据驱动的时代，数据清洗作为数据分析与机器学习流程中的关键环节，其重要性不言而喻。高效、准确的数据清洗能够显著提升数据质量，为后续的建模、预测和决策奠定坚实的基础。然而，面对市场上琳琅满目的数据清洗工具，如何根据业务需求做出明智的选择，成为了许多数据从业...

生成式AI 2025-06-10 大数据

534阅读

[从0开始AIGC][LLM]：LLM中Encoder-Only or Decoder-Only？为什么主流LLM是Decoder-Only？

LLM中Encoder-Only or Decoder-Only & 为什么主流LLM是Decoder-Only？文章目录 LLM中Encoder-Only or Decoder-Only & 为什么主流LLM是Dec...

大数据 2024-09-28 人工智能

1777阅读

PyTorch-LLaMA 项目使用教程

PyTorch-LLaMA 项目使用教程 pytorch-llama LLaMA 2 implemented from scratch in PyTorch 项目地址: https://gitcode.com/gh_mirrors/py/pyt...

生成式AI 2024-09-21 人工智能

1112阅读

Stable Diffusion Fooocus批量绘图脚本

当当当挡~，流动传热数值计算之余发布点AIGC相关文章，希望大家能喜欢~ 1 Stable Diffusion各种UI分析对比提示：此部分主要是对SD各种界面的简要介绍和对比，只关注Fooocus批量绘图的读者可直接跳到第二部分。 Stable D...

AIGC 2024-09-20 人工智能

1207阅读

SD原班人马发布FLUX.1：打开AI绘画新世界

Black Forest Labs 旗下产品 AI 绘画工具如雨后春笋般涌现，让我们对创作的理解不断刷新。就在大家以为已经见识了 AI 绘画的天花板时，FLUX.1 出现了！这款由 Black Forest Labs 推出的 AI 绘画...

AIGC 2024-08-13 人工智能

945阅读

Stable Diffusion 使用详解（2）---- 图生图原理，操作，参数

目录背景图生图原理基本原理 1. 扩散模型基础 2. 图生图的具体流程 3. 关键技术点 4. 应用实例 CLIP 原理 1.基本概念 2. 核心特点使用及参数随机种子重绘幅度图像宽高采样方法 1. DPM（...

AIGC 2024-08-04 人工智能

1149阅读

文心一言答案会重复吗

大家好，今天来聊聊文心一言答案会重复吗，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具：文心一言答案会重复吗?✨ 在学术界和写作领域，重复率是一个非常重要的问题。为了确保我们的文章或论文的独特...

AIGC 2024-07-31 人工智能

1798阅读

文心一言对GPT-4o的评价与分析

在人工智能的浪潮中，大型语言模型（LLM）的发展日新月异，为自然语言处理（NLP）领域带来了诸多突破。GPT系列模型作为其中的佼佼者，其每一次更新都牵动着业界的目光。近日，GPT-4o的发布更是引发了广泛的讨论。本文将从文心一言的视角出发，对GPT-4o进...

大数据 2024-07-10 人工智能

824阅读

开源大模型 Llama 3

开源大模型Llama 3是一个在多个领域都展现出卓越性能的大模型。下面将为您介绍Llama 3的特性和一些简单的使用案例。一、Llama 3介绍 Llama 3在Meta自制的两个24K GPU集群上进行预训练，使用了超...

大数据 2024-07-04 人工智能

1132阅读

超简单！用AWS的Bedrock对Llama进行微调

哎，微调？听起来超难的！对吧。不过，用Amazon Bedrock的话，其实挺简单的。 Customize models in Amazon Bedrock with your own data using fine-tuning and conti...

生成式AI 2024-07-04 人工智能

1087阅读

【AI原理解析】— 文心一言模型

目录模型架构 Transformer模型编码器-解码器结构训练过程预训练微调关键技术知识增强上下文感知个性化生成推理与生成应用场景问答系统文本生成对话系统模型架构 Trans...

人工智能 2024-07-04 人工智能

1253阅读

Stable Diffusion 3 文本生成图像在线体验原理分析

前言本文分享使用Stable Diffusion 3实现文本生成图像，可以通过在线网页中免费使用的，也有API等方式访问。同时结合论文和开源代码进行分析，理解其原理。 Stable Diffusion 3是Stability AI开发的最新、最先...

大数据 2024-07-04 人工智能

1332阅读

llama factory 是如何加载数据集通过对数据集加载的代码的理解编写自定义数据集训练代码

第一层从训练代码追踪到以下代码 def get_dataset( tokenizer: "PreTrainedTokenizer", model_args: "ModelArguments", data_args: "DataAr...

生成式AI 2024-06-26 人工智能

2159阅读

AI根据文本语义实现AI绘画出图

引言当谈到人工智能（AI）和艺术的结合时，我们经常会想到生成对抗网络（GANs）和图像生成。然而，很少有人了解到AI也可以通过文本语义生成绘画作品。在本文中，我将详细介绍如何使用深度学习和自然语言处理技术，使AI能够根据给定的文本语义生成绘画作品。...

生成式AI 2024-06-23 人工智能

866阅读

跟AI做搭子，还是这届年轻人会玩儿

这届年轻人越来越喜欢跟AI做搭子。比如跟AI做生活搭子，让它帮自己挑水果，X平台网友“Cydiar”前不久发文，说自己用GPT-4o选出了水果店里薄皮沙瓤的一个甜西瓜。对此，有超70万网友在线围观，还有不少人在评论区用AI选起了各种水果。除了让...

大数据 2024-06-20 人工智能

876阅读

ChatGPT等模型疯狂训练，最快2026年消耗尽公开文本数据

AI发展科研机构Epochai在官网发布了一项，关于大模型消耗训练数据的研究报告。目前，人类公开的高质量文本训练数据集大约有300万亿tokens。但随着ChatGPT等模大型的参数、功能越来越强以及过度训练，对训练数据的需求呈指数级增长，预计将在202...

AIGC 2024-06-19 人工智能

1174阅读

AIGC中多模态Embedding技术的前沿进展与代码实战

AIGC中多模态Embedding技术的前沿进展与代码实战作者：禅与计算机程序设计艺术 1. 背景介绍 1.1 AIGC的兴起与多模态技术的必要性近年来，人工智能生成内容（AIGC）技术的飞速发展，掀起了一场内容生产方式的革命。从文本生成、图像...

人工智能 2024-06-11 人工智能

910阅读

AIGC从入门到实战：AI 生成思维导图，一分钟完成原先需要一个月才能完成的任务

AIGC从入门到实战：AI生成思维导图，一分钟完成原先需要一个月才能完成的任务 1.背景介绍 1.1 思维导图的重要性思维导图是一种将信息以图像和关键词的形式进行可视化表达的有效工具。它能够帮助我们梳理思路、组织知识、激发创意,并且易于记忆和理解。...

生成式AI 2024-06-07 人工智能

1366阅读

马斯克的Grok已经可以在xAI网站上单独访问

马斯克开发的Grok现在已经可以在xAI网站上单独访问。这个工具在xAI平台上的功能比之前在推特上展示的版本更加丰富。特别值得一提的是它的分支树模式，这个模式允许用户观察多轮对话中可能产生的不同回答路径，这对于分析和理解对话流程非常有用。如果你对使用Gr...

生成式AI 2024-06-05 人工智能

1246阅读

【AIGC调研系列】GPT-4O比GPT-4强在哪

GPT-4O与GPT-4在多个方面有所不同，主要体现在性能、响应速度、成本效益以及多模态处理能力上。性能提升：GPT-4O在文本分析、推理和编程能力上相较于GPT-4有显著提升。特别是在视觉和音频理解能力上，GPT-4O表现出更优越的性能[3][8...

生成式AI 2024-05-30 人工智能

1103阅读

解读注意力机制原理，教你使用Python实现深度学习模型

本文分享自华为云社区《使用Python实现深度学习模型：注意力机制（Attention）》，作者：Echo_Wish。在深度学习的世界里，注意力机制（Attention Mechanism）是一种强大的技术，被广泛应用于自然语言处理（NLP）和计算机视...

AIGC 2024-05-28 人工智能

847阅读

每周节省7800万工时！ChatGPT等成美国降本增效利器

5月23日，全球最大教育、商业出版社之一的Pearson plc在官网发布了，ChatGPT等生成式AI如何帮助人们提升工作效率节省时间的深度研究报告。该报告一共分析了美国、英国、澳大利亚、巴西和印度5个国家。到2026年，美国节省的时间最多，每周高达7...

生成式AI 2024-05-24 人工智能

853阅读

Meta发布类GPT-4o多模态模型Chameleon

Meta最近发布了一个名为Chameleon的多模态模型，它在多模态模型发展中设立了新的标杆。Chameleon是一个早期融合的基于token的混合模态模型家族，能够理解并生成任意顺序的图像和文本。它通过一个统一的Transformer架构，使用文本、图像...

人工智能 2024-05-21 人工智能

803阅读

OpenAI“杀疯了”，GPT–4o模型保姆级使用教程！一遍就会！

5月14日凌晨1点，OpenAI发布了名为GPT-4o 最新的大语言模型，再次引领了人工智能领域的又一创新浪潮，让整个行业都为之震动。据OpenAI首席技术官穆里-穆拉提（Muri Murati）表示，GPT-4o是在继承GPT-4智能的基础上，对文本...

人工智能 2024-05-20 人工智能

1034阅读

OpenAI 首次推出 GPT-4o“全能”模型，干翻所有语音助手

OpenAI 在本周一(2024年5月13号推出了一款名为 GPT-4o 的新旗舰级生成式AI模型。这里的“o”代表“全能”，因为这款模型能够处理文本、语音和视频三种不同的输入。在未来几周内，GPT-4o 将逐步应用于公司针对开发者和消费者的各类产品。...

AIGC 2024-05-15 人工智能

866阅读

OpenAI模型终于更新！强大视听能力的GPT-4o将面向所有用户，其前身正是神秘的gpt2！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）春季终于如约而至！GPT系列的模型终于等到了久违的更新——GPT-4o浮出水面。而且此前颇具神秘气息的“im-also-a-good-gpt2-chatbot”，正是其测试版...

人工智能 2024-05-14 人工智能

847阅读

人工客服要被取代？用GPT-4o模拟处理客服事务，100%流畅毫无AI味

OpenAI于2024年5月13日推出了GPT-4o模型，其中的“O”代表全能（Omni），在人机互动的自然度上取得了显著进步。GPT-4o支持多模态输入和输出，包括语音、视频、图像和代码，能够实时与用户进行无缝交流，理解情感，并展现出幽默个性。该模型的...

人工智能 2024-05-14 人工智能

808阅读

斯坦福20亿参数端测多模态AI Agent模型大升级，手机汽车机器人都能用

全球首个超小型多模态AI Agent模型Octopus V3，来自斯坦福大学的NEXA AI团队，让Agent更加智能、快速、能耗及成本降低。今年四月份初，NEXA AI推出了备受瞩目的Octopus V2，该模型在函数调用性能上超越了GPT-4，减...

生成式AI 2024-05-07 人工智能

955阅读

Meta AI推MA-LMM:用于长视频理解的记忆增强多模态大模型

Meta AI近日推出了一种名为MA-LMM的新型模型，旨在解决长期视频理解中的挑战。LLMs在处理文本数据时表现出了令人印象深刻的能力，但在处理视频输入方面存在一些限制，例如上下文长度限制和GPU内存限制。为了克服这些限制，研究人员提出了MA-LMM，...

生成式AI 2024-04-12 人工智能

1137阅读

大模型融合！最新「进化算法」全自动组合开源模型，刷榜多项基准测试

人类智慧的基础并不在于单个聪明的个体，而在于集体智慧。比如说，我们的社会和经济体系就是建立在由具有不同专业和专长的不同个人组成的许多机构的基础上的。 Sakana AI团队相信，人工智能的发展也将遵循类似的集体道路。人工智能的未来不会是一个单一的、巨...

人工智能 2024-04-08 人工智能

850阅读

【爬虫实战】使用Python获取花粉俱乐部中Mate60系列的用户发帖数据

?‍♂️ 个人主页：@艾派森的个人主页 ✍?作者简介：Python学习者 ? 希望大家多多支持，我们一起进步！? 如果文章对你有帮助的话，欢迎评论 ?点赞?? 收藏 ?加关注+ 目录一、Python编写爬虫的优势二、实验过程 2.1...

人工智能 2024-04-05 大数据

891阅读

新智元 | Stable Diffusion 3技术报告流出，Sora构架再立大功！生图圈开源暴打Midjourney和DALL·E 3？

本文来源公众号“新智元”，仅用于学术分享，侵权删，干货满满。原文链接：Stable Diffusion 3技术报告流出，Sora构架再立大功！生图圈开源暴打Midjourney和DALL·E 3？【新智元导读】Stability AI放出了号称能暴...

人工智能 2024-03-18 人工智能

995阅读

基于帝国CMS的采集过滤机制深度解析

在当今信息爆炸的时代，内容管理系统（CMS）扮演着至关重要的角色，它们使得信息的发布、管理和维护变得异常简便。帝国CMS作为国内知名的内容管理系统之一，其强大的功能和灵活的定制性受到了广大用户的青睐。其中，帝国CMS的采集过滤功能更是其独特之处，它能够帮助...

人工智能 2024-03-18 大数据

929阅读

Stable Diffusion 3 技术论文解读：开源能赢得文生图竞赛吗？

在大语言模型领域，闭源模型正在赢得比赛，无论是 OpenAI 还是刚刚发布新模型的 Anthropic，都是闭源模型的代表。但在文生图领域，开源模型却表现出了足够强的竞争力。 2 周前，开源模型的代表企业 Stability AI 发布了最新...

AIGC 2024-03-15 人工智能

863阅读

“羊驼“入侵CV，美团&浙大沈春华团队将LLaMA向CV扩展，构建全新基础模型VisionLLaMA

本文首发:AIWalker https://arxiv.org/abs/2403.00522 https://github.com/Meituan-AutoML/VisionLLaMA 本文概述大型语言模型构建在基于Transf...

AIGC 2024-03-10 人工智能

864阅读

Stable Diffusion 3技术报告流出，Sora构架再立大功！生图圈开源暴打Midjourney和DALL·E 3？

Stability AI在发布了Stable Diffusion 3之后，今天公布了详细的技术报告。论文深入分析了Stable Diffusion 3的核心技术——改进版的Diffusion模型和一个基于DiT的文生图全新架构！报告地址： http...

生成式AI 2024-03-06 人工智能

908阅读

Llama3将于7月发布！当下处于微调中！

整理 | 言征出品 | 51CTO技术栈（微信号：blog51cto）据一位熟悉Llama 3人士透露，Meta计划于7月发布Llama 3。据悉，Llama 3的最大版本可能会超过1400亿个参数，超过其前身Llama 2。 Meta希望Llama...

大数据 2024-03-05 人工智能

895阅读

Stable Diffusion官网体验入口 AI图像生成工具网页版免费使用地址

Stable Diffusion是一个深度学习模型，可根据用户输入的文本描述生成高质量的逼真图像。用户可以免费在线使用 Stable Diffusion，生成各种类型的艺术图像。点击前往Stable Diffusion官网体验入口谁可以从Stable...

AIGC 2024-03-02 人工智能

1610阅读

金融分析多模态LLM FinTral:基于Mistral-7B模型得分接近GPT-4

近日，来自不列颠哥伦比亚大学和Invertible AI的研究人员推出了一款具有突破性的大型语言模型（LLM）——FinTral，专为金融领域量身定制。FinTral采用了多模态方法，能够处理文本、数字、表格和视觉数据，以应对金融文件的复杂性。该模型引入了...

生成式AI 2024-02-29 人工智能

1062阅读

微软推出用于发现AI模型风险的工具PyRIT

微软公司一个负责利用黑客手段发现网络安全问题的团队开源了一个内部工具PyRIT，该工具可以帮助开发人员发现人工智能模型中的风险。研究人员于本周四发布了该框架的代码。微软表示，PyRIT可以自动生成数以千计的对抗性人工智能提示，来测试神经网络能否有效抵...

大数据 2024-02-27 人工智能

824阅读

如何系统的自学Python？通义千问、讯飞星火、文心一言及ChatGPT的回答

如何系统的自学Python？来看看通义千问、讯飞星火、文心一言及ChatGPT的回答. 第一个是马老师的通义千问系统地自学Python是一个循序渐进的过程，从基础语法到实践项目，再到专业领域的深入学习。下面是一个详细的步骤指南：了解Pyt...

大数据 2024-02-18 人工智能

989阅读

LLM是世界模型的新证据？ChatGPT能理解WiFi等物理信号，并猜出你的位置

大语言模型是否是世界模型? 大语言模型除了在数字世界完成如写作或翻译等任务，它们能否理解并处理物理世界中的信息并进而完成更广泛的任务呢? 最近来自香港科技大学（HKUST）、南洋理工大学(NTU 与加利福尼亚大学洛杉矶分校(UCLA 的研究者们提供了新的思...

生成式AI 2024-02-13 人工智能

949阅读

苹果展示 AI 新模型 MGIE，可一句话精修图片

2 月 8 日消息，相比较微软的风生水起，苹果公司在 AI 领域的布局显得低调很多，但这并不意味着苹果在该领域就没有丝毫建树。苹果公司近日发布了名为“MGIE”的新型开源人工智能模型，它可以根据自然语言指令编辑图像。图源：VentureBeat 与...

生成式AI 2024-02-08 人工智能

819阅读

把图像视为外语，快手、北大多模态大模型媲美DALLE-3

当前的大型语言模型如 GPT、LLaMA 等在自然语言处理领域取得了显著进展，能够理解和生成复杂的文本内容。但你是否想过，如果能够将大语言模型这强大的理解和生成能力迁移到多模态数据上，就可以轻松理解海量的图像与视频，并辅助创作图文并茂的内容。近期，来自快...

大数据 2024-01-30 人工智能

881阅读

三星与百度合作，为Galaxy S24系列创造AI体验

三星在中国选择了一个合法的替代方案，即与百度AI Cloud展开合作。这一战略伙伴关系的宣布意味着三星电子中国和百度将共同创造一种AI体验，以提升三星Galaxy S24系列的功能。在这次合作中，百度的文心一言基础模型将与Galaxy AI深度集成，为...

AIGC 2024-01-29 人工智能

825阅读

AIGC时代-GPT-4和DALL·E 3的结合

在当今这个快速发展的数字时代，人工智能（AI）已经成为了我们生活中不可或缺的一部分。从简单的自动化任务到复杂的决策制定，AI的应用范围日益扩大。而在这个广阔的领域中，有两个特别引人注目的名字：GPT-4和DALL·E 3。这两个AI系统在各自的领域内都取得...

生成式AI 2024-01-29 人工智能

966阅读

论文智能降重翻车 ai写作

大家好，今天来聊聊论文智能降重翻车 ai写作，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具：论文智能降重翻车事件分析随着智能降重工具的普及，越来越多的学者和研究人员选择使用这些工具来辅助论...

人工智能 2024-01-27 人工智能

793阅读