服务器第33页 - AIGC资讯

【AI绘画】《超入门级教程：训练自己的LORA模型》，MM超爱的萌宠图片实战

目录前言一、SD-Trainer webui使用介绍二、准备工作 2-1、登录在线训练平台 2-2、购买算力并创建工作空间 2-3、启动工作空间三、开始训练 3-1、打开终端 3-2、准备训练数据 3-3、准备模型文件 3-3-...

生成式AI 2023-11-09 人工智能

1980阅读

ChatGPT崩了服务器达到极限容量

据Downdector这个网站监测网络状况的数据显示，从周三晚上22点左右开始，有很多网友反映OpenAI的ChatGPT和API（开发者用来构建第三方服务的应用程序接口）都出现了故障。这次故障大概持续了100分钟左右。 OpenAI的首席执行官山姆·奥...

生成式AI 2023-11-09 人工智能

790阅读

OpenAI大佬甩出「喵喵GPT」调戏黑客！分享ChatGPT成功的秘密：极限压榨GPU资源

一个30人的团队，完成了这个地球上最受欢迎的产品的发布和维护。他们成功的经验和失败的教训，简直如金子一般珍贵。 OpenAI的工程团队经理（Engineering Manager）EvanMorikawa在一个开发者社区的活动中，分享了OpenAI发布Ch...

AIGC 2023-11-09 人工智能

849阅读

python爬虫入门教程(非常详细)

1、什么是爬虫爬虫指的是一种自动化程序，能够模拟人类在互联网上的浏览行为，自动从互联网上抓取、预处理并保存所需要的信息。爬虫运行的过程一般是先制定规则（如指定要抓取的网址、要抓取的信息的类型等），紧接着获取该网址的HTML源代码，根据规则对源代码进...

大数据 2023-11-09 大数据

881阅读

Midjourney V5太炸裂：逼真到颤抖！“有图有真相”时代彻底过去画画创作者模特一键淘汰

** ** 文章目录 1、Midjourney V5 1.1、许多人纷纷惊呼：人类画师别活了。 1.2、通用模型 2、midjourney是什么 3、midjourney 的使用方式 4、Midjourney新手入门描述词 5、一些疑难杂...

大数据 2023-11-09 人工智能

931阅读

全网最全ChatGPT/AIGC报告分析（365份）

本星球整理了365份ChatGPT/AIGC重磅专业报告（更新中…），部分目录如下，请读者搜索关键字，获取报告，学习参阅。 https://mp.weixin.qq.com/s/hvI2Hupjx_mnPh3YGyobww 1、计算机研究报告：Chat...

生成式AI 2023-11-08 人工智能

1011阅读

姚班天才开发《完蛋！我被大模型包围了》游戏爆火，一日用户过万挤爆服务器

什么样的“大模型原生”游戏，让各大算法竞赛群里都在玩，还把服务器挤爆了? 这款突然爆火的《完蛋!LLM》，让你在解谜挑战之中轻松学会大模型提示词技巧，达成1日用户破万的成就。难度循序渐进，比如第一题初来乍到只是“请你构造一个问题，使模型的回答是一字不...

生成式AI 2023-11-08 人工智能

768阅读

PHP PHP_EOL 换行符

换行符unix系列用 \nwindows系列用 \r\nmac用 \rPHP中可以用PHP_EOL来替代，以提高代码的源代码级可移植性如： <?php echoPHP_EOL; //windows平台相当于 echo "\r\n"...

人工智能 2023-11-08 大数据

870阅读

Stable Diffusion WebUI linux部署问题

当我部署好环境后，准备大张旗鼓开搞时，进入项目地址运行python launch.py后发现下面连接着的报错是 OSError: Can't load tokenizer for 'openai/clip-vit-large-patch14'....

AIGC 2023-11-08 人工智能

1990阅读

中文大语言模型 Llama-2 7B（或13B）本地化部署（国内云服务器、GPU单卡16GB、中文模型、WEB页面TextUI、简单入门）

本文目的是让大家先熟悉模型的部署，简单入门；所以只需要很小的算力，单台服务器单GPU显卡（显存不低于12GB），操作系统需要安装 Ubuntu 18.04。 1 服务器&操作系统 1.1服务器的准备...

生成式AI 2023-11-08 人工智能

1446阅读

MoE：LLM终身学习的可能性

性质说明知识记忆（knowledge retention） √ LLM预训练后，具备世界知识，小规模finetune不易对LLM造成遗忘灾难。但大规模数据续训会造成。前向迁移（forward...

大数据 2023-11-08 人工智能

928阅读

PHP使用三种方法实现数据采集

从底层的socket到高层的文件操作函数，一共有3种方法可以实现采集。 1. 使用socket技术采集： socket采集是最底层的，它只是建立了一个长连接，然后我们要自己构造http协议字符串去发送请求。例如要想获取这个页面的内容，http:...

生成式AI 2023-11-08 大数据

848阅读

【腾讯云 HAI域探秘】——自行搭建Stable Diffusion模型服务用于生成AI图片 | 自行搭建ChatGL M26BAI模型服务用于AI对话

自行搭建Stable Diffusion模型服务用于生成AI图片一、服务创建 1、服务地址：高性能应用服务HAI 新品内测 2、等待审核(大概24小时二、创建服务 1、新建服务 2、选择AI模型：Stable Diffus...

AIGC 2023-11-08 人工智能

920阅读

让大模型分析csdn文章质量 —— 提取csdn博客评论在文心一言分析评论区内容

文章目录 ⭐前言 ⭐技术栈选择 ⭐前端页面搭建 ⭐后端获取数据暴露接口 ?requests获取数据 ? django 抛出api 接口 ⭐效果 ⭐结束 ⭐前言大家好，我是yma16，本文分享关于让大模型分析csdn文章质量...

AIGC 2023-11-08 人工智能

880阅读

数栈技术分享：带你详解数栈FlinkX实时采集原理与使用

一、FlinkX实时采集功能的基本介绍首先为大家介绍下FlinkX实时模块的分类，如下图所示： 1、实时采集模块(CDC 1）MySQL Binlog插件利用阿里开源的Canal组件实时从MySQL中捕获变更数据。 2）PostgreS...

AIGC 2023-11-08 大数据

861阅读

数栈技术分享：详解FlinkX中的断点续传和实时采集

如果是第一次运行，或者上一次任务失败时还没有触发checkpoint，那么offset就不存在，根据offset和通道可以确定具体的查询sql: offset存在时第一个通道： select * from data_test where i...

人工智能 2023-11-08 大数据

1012阅读

MySQL server has gone away 问题的解决方法

我的原因是数据库导出之后，从新导入新库sql语句太长 set interactive_timeout=24*3600 mysql出现ERROR : (2006, 'MySQL server has gone away' 的问题意思就是指clien...

人工智能 2023-11-08 大数据

1109阅读

基于TableStore/MaxCompute的数据采集分析系统介绍

摘要在互联网高度发达的今天，ipad、手机等智能终端设备随处可见，运行在其中的APP、网站也非常多，如何采集终端数据进行分析，提升软件的品质非常重要，例如PV/UV统计、用户行为数据统计与分析等。虽然场景简单，但是数据量大，对系统的吞吐量、实时性、分析...

大数据 2023-11-08 大数据

793阅读

IPIDEA代理IP：稳定性、可用性、响应速度的保证

在数据采集中，代理IP的重要性不可忽视。因为如果采集工具连续使用同一个IP地址对目标网站进行请求，或者请求过于频繁，那么该网站可能会将程序或应用判定为恶意的，可能会不允许该IP地址再次使用，后续也无法抓取更多信息。这种情况对采集效率造成很大影响，因此解决这...

生成式AI 2023-11-08 大数据

886阅读

抖音数据采集教程，一例APK脱壳反编译寻找AES密钥过程记录

数据采集教程，一例APK脱壳反编译寻找AES密钥过程记录应客户需求对一款名为“**主治医师总题库”包名为com.zitibaohe.zhuzhiyishierke）的APP进行采集可行性分析。这款APP和服务器的通信使用的是HTTP协议，很容易抓到...

AIGC 2023-11-08 大数据

957阅读

别说不会微服务了，五分钟教你巧妙玩转分布式下链路追踪！

本篇文章我将给大家介绍“分布式链路追踪”的内容，对于目前大部分采用微服务架构的公司来说，分布式链路追踪都是必备的，无论它是传统微服务体系亦或是新一代Service Mesh的微服务架构！而具体介绍的内容，本文不是完全讲理论，而是希望从理论到实践，引导大家去...

大数据 2023-11-08 大数据

903阅读

漏刻有时数据可视化大屏核心完整版框架PHP后台数据管理 API数据接口 Echarts图表库自带电脑端和手机端两套模版且支持自定义前端模版开发

漏刻有时数据可视化大屏前端密码登录保护界面漏刻有时数据可视化大屏核心展示大屏漏刻版本：漏刻有时数据可视化v2.0 扎根版开发语言： php（数据采集、数据管理、API接口对接）+Echarts（百度开源商业图表库）+l...

生成式AI 2023-11-08 大数据

849阅读

恶意爬虫防护 | 京东云技术团队

引言如果您仔细分析过任何一个网站的请求日志，您肯定会发现一些可疑的流量，那可能就是爬虫流量。根据Imperva发布的《2023 Imperva Bad Bot Report》在2022年的所有互联网流量中，47.4%是爬虫流量。与2021年的42.3%...

AIGC 2023-11-08 大数据

859阅读

爬虫使用HTTP爬虫IP误区大盘点

误区一：只关注免费爬虫ip 免费的东西总是吸引人，但只关注免费的选项可能会导致在选择HTTP爬行动物ip时出现问题。免费爬行动物ip往往很慢，容易滥用和被禁，稳定性不佳。支付的爬行动物ip通常提供更快、更稳定的通信，并为供应商提...

人工智能 2023-11-08 大数据

768阅读

采集快手APP的10个经典方法

快手APP的数据采集、APP数据抓包、APP数据采集、网页抓取数据、网页爬虫、采集网站数据、网页数据采集软件、python爬虫、HTM网页提取、一站式网站采集技术、BI数据的数据分析、数据标注等成为大数据发展中的热门技术关键词。那么采集快手APP的方法有哪...

AIGC 2023-11-08 大数据

935阅读

分布式ELK日志采集系统

文章目录 1. 传统日志采集存在哪些优缺点 2. Elk采集日志的原理 3. 为什么需要将日志存储在ElasticSeach 而不是mysql中呢 4. 为什么需要使用elk+kafka 5. elk+kafka原理 6. elk+kafka...

人工智能 2023-11-08 大数据

846阅读

微博数据采集的10个经典方法

微博数据采集的微博数据分析的工具，微博粉丝、微博评论、网页抓取数据、网页爬虫、采集网站数据、网页数据采集软件、python爬虫、HTM网页提取、APP数据抓包、APP数据采集、一站式网站采集技术、BI数据的数据分析、数据标注等成为大数据发展中的热门技术关键...

大数据 2023-11-08 大数据

820阅读

采集京东网数据的10个经典方法

京东网数据采集全网抓取网页数据、商品销量、全网搜索、网页爬虫、采集网站数据、网页数据采集软件、python爬虫、HTM网页提取、APP数据抓包、APP数据采集、一站式网站采集技术、BI数据的数据分析、数据标注等成为大数据发展中的热门技术关键词。那么采集京东...

AIGC 2023-11-08 大数据

864阅读

采集新闻数据的10个经典方法

采集新闻数据的10个经典方法新闻数据采集全网抓取网页数据、新闻搜索全网搜索、网页爬虫、采集网站数据、网页数据采集软件、python爬虫、HTM网页提取、APP数据抓包、APP数据采集、一站式网站采集技术、BI数据的数据分析、数据标注等成为大数据发展中...

人工智能 2023-11-08 大数据

982阅读

#研发解决方案介绍#基于StatsD+Graphite的智能监控解决方案

本文档适用人员：研发和运维员工提纲：监控平台要做到什么程度？为什么要自己做？几个通用技术问题绘图所依赖的数据如何收集？如何加工？如何存储？图形...

大数据 2023-11-08 大数据

864阅读

直播数据采集的10个经典方法

直播数据采集、直播峰值、直播销量、直播销售额、主流直播平台数据,直播带货量和爆款数据、粉丝数据、竞品分析，采集网站数据、网页数据采集软件、python爬虫、APP数据采集、一站式网站采集技术、BI数据的数据分析、数据标注等成为大数据发展中的热门技术关键词。...

人工智能 2023-11-08 大数据

1051阅读

企业数据采集的10个经典方法

企业数据采集的企业信息采集,企业名录、法人号码、企业采集软件,网页抓取数据、网页爬虫、采集网站数据、网页数据采集软件、python爬虫、HTM网页提取、APP数据抓包、APP数据采集、一站式网站采集技术、BI数据的数据分析、数据标注等成为大数据发展中的热门...

人工智能 2023-11-08 大数据

859阅读

可观测数据采集端的管控方案的简单对比

概述当前，主流的日志采集产品除了SLS的ilogtail，还有Elastic Agent、Fluentd、Telegraf、Sysdig、Logkit、Loggie、Flume等。详细的对比结果见下表：备注：集群监控：表示工具可以查看管理采集...

生成式AI 2023-11-08 大数据

1022阅读

基于Flume+Log4j+Kafka的日志采集架构方案（上）

Flume是一个完善、强大的日志采集工具，关于它的配置，在网上有很多现成的例子和资料，这里仅做简单说明不再详细赘述。 Flume包含Source、Channel、Sink三个最基本的概念： Source——日志来源，其中包括：Avro Source、...

AIGC 2023-11-08 大数据

899阅读

第二章西门子数控机床采集方案

第二章西门子数控机床采集方案前言一、西门子官方网站介绍二、828D与840D SL介绍三、OPC UA采集方案四、机床端设置 4.1 数控软件版本确认 4.2 V4.05的OPC UA激活设置 4.2.1 设置系统选项 4.2....

生成式AI 2023-11-08 大数据

2179阅读

数仓项目之用户行为数据采集

一、什么是数据仓库数据仓库是为企业制定决策，提供数据支持的。可以帮助企业改进业务流程，提高产品质量。数据仓库的输入数据通常包括：业务数据、用户行为数据和爬虫数据等。二、项目需求分析 1、用户行为数据采集平台搭建 2、业务数据采集平台...

生成式AI 2023-11-08 大数据

876阅读

数据采集及采集工具八爪鱼的使用

数据采集及采集工具八爪鱼的使用一个数据的走势是由多个维度影响的，因此我们需要通过多源的数据采集，尽可能收集到更多的数据维度，公司保证数据质量，才能得到高质量的数据挖掘结果。数据源分类：开放数据源：政府、企业、高校等爬虫获取：网页、APP...

生成式AI 2023-11-08 大数据

1058阅读

PHP问题 —— failed to open stream: HTTP request faile

1.1 failed to open stream: HTTP request failed! 1.1.1 现象当使用php5自带的file_get_contents方法来获取远程文件的时候，有时候会出现file_get_contents(...

大数据 2023-11-08 大数据

770阅读

服务器反爬虫攻略：Apache/Nginx/PHP禁止某些User Agent抓取网站

我们都知道网络上的爬虫非常多，有对网站收录有益的，比如百度蜘蛛（Baiduspider），也有不但不遵守robots规则对服务器造成压力，还不能为网站带来流量的无用爬虫，比如宜搜蜘蛛（YisouSpider）。最近张戈发现nginx日志中出现了好多宜搜等垃...

生成式AI 2023-11-08 大数据

964阅读

采集，PHP与ASP.NET混搭

概况：服务器IIS2003（IIS6）+PHP5.2.17，实际上为某一PHP系统做二次开发。采集内容：RAR文件。采集要求：将采集的RAR文件解压，然后替换里面的相关内容，再压缩（ZIP，7Z，RAR都可），做到的效果和原系统添加内容一致，即：...

AIGC 2023-11-08 大数据

800阅读

初识爬虫—URL

网络爬虫，一门被认为是偷偷摸摸拿人家东西的技术，实则不然，其实爬虫是光明正大的拿人家东西的技术。理直气壮对不对，我喜欢。网络爬虫，也叫网络蜘蛛。它可以根据网页地址（URL）爬取你想要的数据。 URL 专业一些的叫法是统一资源定位符（Uniform R...

AIGC 2023-11-08 大数据

831阅读

php采集类库：Snoopy.class.php

Snoopy的一些特点：抓取网页的内容 fetch抓取网页的文本内容 (去除HTML标签 fetchtext抓取网页的链接，表单 fetchlinks fetchform支持代理主机支持基本的用户名/密码验证支持设置 user_agent, refere...

生成式AI 2023-11-08 大数据

730阅读

PHP 采集大全采集原理分析禁用采集各种采集方法详解采集的攻于防采集性能应用协议分析

做了N年的PHP，采集了N家数据，由初学者菜鸟，到现在的熟手，采集天猫、淘宝、腾讯、京东、敦煌、Lightinthebox、大龙、zencart、magento、prestashop、opencart、xcart、踏踏。。。。对采集颇有诸多的理解。现在...

AIGC 2023-11-08 大数据

848阅读

关于PHP批量采集----采集小说站有感

概况：帮周同学做小说采集做了有一段时间了。一开始是从其它网站的页面上直接写正则去采集，然后慢慢的转为采集别人提供的API。环境：CENTOS+NGINX+PHP5.2.17。基于JIEQI小说管理系统。直接采集其它网站页面的时候，主要改的...

AIGC 2023-11-08 大数据

849阅读

国内最具影响力科技创投媒体36Kr的容器化之路

本文由1月19日晚36Kr运维开发工程师田翰明在Rancher技术交流群的技术分享整理而成。微信搜索rancher2，添加Rancher小助手为好友，加入技术群，实时参加下一次分享~ 田翰明，36Kr 运维开发工程师，在 36Kr 主要负责运维...

AIGC 2023-11-08 大数据

897阅读

python爬虫代理ip

代理ip 爬虫去爬取网站数据的数据的时候，如果单位时间内爬取频次过高，或者其他的原因，被对方识别出来，ip可能会被封禁。这种情况下，通过使用代理ip来解决，作为反爬的策略。代理ip匿名度：透明的：服务器知道了你使用代理ip，也知道你真实的ip...

AIGC 2023-11-08 大数据

771阅读

Python—WebSocket爬虫实战

1. WebSocket WebSocket 是 HTML5 开始提供的一种在单个 TCP 连接上进行全双工通讯的协议。在 WebSocket API 中，浏览器和服务器只需要做一个握手的动作，然后，浏览器和服务器之间就形成了一条快速通道。两者之间...

大数据 2023-11-08 大数据

885阅读

网络爬虫：Python如何从网上爬取数据？

网络爬虫，就是按照一定规则自动访问互联网上的信息并把内容下载下来的程序或脚本。在整个的Python爬虫架构里，从基础到深入我分为了10个部分：HTTP、网页、基本原理、静态网页爬取、动态网页爬取、APP爬取、多协程、爬虫框架、分布式爬虫以及反爬虫机制与...

大数据 2023-11-08 大数据

1027阅读

在代码中如何使用账密形式爬虫ip

随着人工智能与大数据技术的快速发展，大数据作为智能时代的产物，他能帮助各行各业分析解决问题。网络爬虫应运而生，帮助更多企业更高效的采集数据，那么在数据采集中如何使用账密形式的爬虫ip？当您选择了“用户名+密码”授权模式，希望这篇帮助文档能对您有所帮助。...

人工智能 2023-11-08 大数据

847阅读