sql 第11页 - AIGC资讯

[算法前沿]--000-大模型LLaMA在docker环境搭建以及运行教程（含模型压缩）

文章目录 LLaMA 论文步骤搭建步骤运行7B模型运行13B模型未来已来,大模型依据压缩模型的方式,可以在普通的PC上运行. LLaMA Facebook的LLaMA 模型和Georgi Gerganov 的ll...

大数据 2023-11-15 人工智能

970阅读

深入AIGC：工具、技术和编程语言

深入AIGC：工具、技术和编程语言深入AIGC：工具、技术和编程语言摘要引言词汇解释详细介绍：深入AIGC的工具、技术和编程语言 AIGC的关键技术和工具 AIGC的编程语言实际应用和未来趋势结论博...

大数据 2023-11-14 人工智能

812阅读

为什么说百度下个月推出文心一言会被ChatGPT完全碾压

作者，姚远： Oracle ACE（Oracle和MySQL数据库方向）华为云MVP 《MySQL 8.0运维与优化》的作者中国唯一一位Oracle高可用大师拥有包括 Oracle 10g和12c OCM在内的20+数据库相关认证。曾任IBM公...

AIGC 2023-11-13 人工智能

801阅读

集成AIGC能力的多数据库客户端工具Chat2DB免费试用

一、简介 Chat2DB一款由阿里巴巴开源免费的多数据库客户端工具，支持windows、mac本地安装，也支持服务器端部署，web网页访问。和传统的数据库客户端软件Navicat、DBeaver 相比Chat2DB集成了AIGC的能力，能够将自然语言转换...

人工智能 2023-11-13 人工智能

1432阅读

Stable Diffusion云端部署流程与注意点

前言在今天的大数据时代，AI绘图是企业必备的重要工具之一。而Stable Diffusion作为一款部署的AI绘图，得到了很多企业和团队的认可。在使用Stable Diffusion的过程中，云部署是一个非常重要的话题，本文将详细介绍Stable Di...

人工智能 2023-11-13 人工智能

911阅读

Text-to-SQL小白入门（五）开源最强代码大模型Code Llama

摘要本文介绍了Code Llama大模型的基本概括，包含了论文的摘要、结果、结论以及核心方法，对于了解和实践Code Llama有一定帮助。论文概述上一篇介绍了指令进化大模型WizardLM，留了一个坑，补上Code Llama论文学习，...

大数据 2023-11-12 人工智能

1112阅读

文心一言眼里的Java世界

目录一、Java基础教程系列二、先听听文心一言怎么说？三、话不多说，开干。 1、要有一个正确的Java学习路线，做一个细致的Java学习规划。 2、学习资料推荐 3、书中自有黄金屋，书中自有颜如玉 4、自学周期推荐 5、效率为先 6...

AIGC 2023-11-11 人工智能

855阅读

【AI绘画】Stable Diffusion WebUI

???欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kuan 的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越...

生成式AI 2023-11-11 人工智能

900阅读

AI工具 ChatGPT-4 vs Google Bard ， PostgreSQL 开发者会pick谁？

在人工智能 (AI 进步的快节奏世界中，开发人员正在寻找最高效和突破性的解决方案来加快和提高他们的工作质量。对于 PostgreSQL 开发人员来说，选择理想的 AI 支持的工具以最专业的方式解决他们的查询至关重要。近年来，人工智能工具的普及率飙升，...

人工智能 2023-11-11 人工智能

1189阅读

全面对比GPT-3.5与LLaMA 2微调

通用大模型虽好，但通过微调得到一个专属大模型不仅可以提高模型的可操控性、输出格式的可靠性和语气的一致性，还能让用户缩短提示长度，加速API调用，降低成本。本文作者Sam L'Huillier对GPT-3.5与LLaMA 2的微调进行了基准...

大数据 2023-11-10 人工智能

901阅读

【云栖2023】王峰：开源大数据平台3.0技术解读

本文根据2023云栖大会演讲实录整理而成，演讲信息如下：演讲人：王峰 | 阿里云研究员，阿里云计算平台事业部开源大数据平台负责人演讲主题：开源大数据平台3.0技术解读实时化与Serverless是开源大数据3.0时代的必然选择阿里云开源...

生成式AI 2023-11-10 人工智能

990阅读

python爬虫从入门到精通

目录一、正确认识Python爬虫二、了解爬虫的本质 1. 熟悉Python编程 2. 了解HTML 3. 了解网络爬虫的基本原理 4. 学习使用Python爬虫库三、了解非结构化数据的存储 1. 本地文件 2. 数据库四、掌...

生成式AI 2023-11-10 大数据

980阅读

探索人工智能的世界：构建智能问答系统之环境篇

引言在之前的一篇文章中，我们已经对项目所需的知识点进行了简单的了解。今天，我们将开始搭建整个项目的环境。在接下来的文章中，我们将详细介绍如何配置项目所需的各种工具和环境，以确保项目的顺利进行。部署接下来，你可能需要多次重启电脑来确保环境变量的生效。...

大数据 2023-11-09 人工智能

893阅读

python爬虫入门教程(非常详细)

1、什么是爬虫爬虫指的是一种自动化程序，能够模拟人类在互联网上的浏览行为，自动从互联网上抓取、预处理并保存所需要的信息。爬虫运行的过程一般是先制定规则（如指定要抓取的网址、要抓取的信息的类型等），紧接着获取该网址的HTML源代码，根据规则对源代码进...

大数据 2023-11-09 大数据

909阅读

1个APP的生产过程

数据准备可以手动录入可以从其他采集scrapy 数据存储，关系型mysql,sqlite,非关系型redis,mongodb 接口准备开发接口，用熟悉的语言node，php，python。熟悉的架构express,fla...

大数据 2023-11-08 大数据

823阅读

数栈技术分享：带你详解数栈FlinkX实时采集原理与使用

一、FlinkX实时采集功能的基本介绍首先为大家介绍下FlinkX实时模块的分类，如下图所示： 1、实时采集模块(CDC 1）MySQL Binlog插件利用阿里开源的Canal组件实时从MySQL中捕获变更数据。 2）PostgreS...

AIGC 2023-11-08 大数据

882阅读

使用docker搭建在线网课系统

今天介绍一款在线教育相关的软件：酷瓜云课堂-腾讯云版，目前还在不断的迭代当中，从他们的GIT提交来看，那是相当的活跃，基本每天都有提交。 GITEE仓库地址 GITHUB仓库地址对于熟悉 docker 的同学来说，安装是非常的便利的，也可以在...

大数据 2023-11-08 大数据

920阅读

数栈技术分享：详解FlinkX中的断点续传和实时采集

如果是第一次运行，或者上一次任务失败时还没有触发checkpoint，那么offset就不存在，根据offset和通道可以确定具体的查询sql: offset存在时第一个通道： select * from data_test where i...

人工智能 2023-11-08 大数据

1038阅读

MySQL server has gone away 问题的解决方法

我的原因是数据库导出之后，从新导入新库sql语句太长 set interactive_timeout=24*3600 mysql出现ERROR : (2006, 'MySQL server has gone away' 的问题意思就是指clien...

人工智能 2023-11-08 大数据

1138阅读

基于TableStore/MaxCompute的数据采集分析系统介绍

摘要在互联网高度发达的今天，ipad、手机等智能终端设备随处可见，运行在其中的APP、网站也非常多，如何采集终端数据进行分析，提升软件的品质非常重要，例如PV/UV统计、用户行为数据统计与分析等。虽然场景简单，但是数据量大，对系统的吞吐量、实时性、分析...

大数据 2023-11-08 大数据

812阅读

别说不会微服务了，五分钟教你巧妙玩转分布式下链路追踪！

本篇文章我将给大家介绍“分布式链路追踪”的内容，对于目前大部分采用微服务架构的公司来说，分布式链路追踪都是必备的，无论它是传统微服务体系亦或是新一代Service Mesh的微服务架构！而具体介绍的内容，本文不是完全讲理论，而是希望从理论到实践，引导大家去...

大数据 2023-11-08 大数据

922阅读

漏刻有时数据可视化大屏核心完整版框架PHP后台数据管理 API数据接口 Echarts图表库自带电脑端和手机端两套模版且支持自定义前端模版开发

漏刻有时数据可视化大屏前端密码登录保护界面漏刻有时数据可视化大屏核心展示大屏漏刻版本：漏刻有时数据可视化v2.0 扎根版开发语言： php（数据采集、数据管理、API接口对接）+Echarts（百度开源商业图表库）+l...

生成式AI 2023-11-08 大数据

868阅读

Python3 多线程数据采集中的一些坑

采集数据的准备： 1.网页解析：Requests 这个是Python中的Python HTTP 神库 2.threading,queue,re,time 等系统模块并没有使用采集框架，除Requests模块以外，其它完全使用标准库模块。伪代码...

大数据 2023-11-08 大数据

758阅读

数据的增量采集与全量采集

文章目录前言 1. 传统数据库的增量与全量 1.1 Oracle 1.2 Mysql 2. 大数据框架的增量与全量 2.1 业务数据 2.2 日志数据前言本文简单示例传统数据库与大数据系统下数据的增量采集与全量采集...

生成式AI 2023-11-08 大数据

879阅读

分布式ELK日志采集系统

文章目录 1. 传统日志采集存在哪些优缺点 2. Elk采集日志的原理 3. 为什么需要将日志存储在ElasticSeach 而不是mysql中呢 4. 为什么需要使用elk+kafka 5. elk+kafka原理 6. elk+kafka...

人工智能 2023-11-08 大数据

870阅读

#研发解决方案介绍#基于StatsD+Graphite的智能监控解决方案

本文档适用人员：研发和运维员工提纲：监控平台要做到什么程度？为什么要自己做？几个通用技术问题绘图所依赖的数据如何收集？如何加工？如何存储？图形...

大数据 2023-11-08 大数据

884阅读

数仓项目之用户行为数据采集

一、什么是数据仓库数据仓库是为企业制定决策，提供数据支持的。可以帮助企业改进业务流程，提高产品质量。数据仓库的输入数据通常包括：业务数据、用户行为数据和爬虫数据等。二、项目需求分析 1、用户行为数据采集平台搭建 2、业务数据采集平台...

生成式AI 2023-11-08 大数据

905阅读

如何自动化采集数据？

举个例子，你做量化投资，基于大数据预测未来股票的波动，根据这个预测结果进行买卖。你当前能够拿到以往股票的所有历史数据，是否可以根据这些数据做出一个预测率高的数据分析系统呢？实际上，如果你只有股票历史数据，你仍然无法理解股票为什么会产生大幅的波动。比如，...

人工智能 2023-11-08 大数据

924阅读

数据采集及采集工具八爪鱼的使用

数据采集及采集工具八爪鱼的使用一个数据的走势是由多个维度影响的，因此我们需要通过多源的数据采集，尽可能收集到更多的数据维度，公司保证数据质量，才能得到高质量的数据挖掘结果。数据源分类：开放数据源：政府、企业、高校等爬虫获取：网页、APP...

生成式AI 2023-11-08 大数据

1084阅读

服务器反爬虫攻略：Apache/Nginx/PHP禁止某些User Agent抓取网站

我们都知道网络上的爬虫非常多，有对网站收录有益的，比如百度蜘蛛（Baiduspider），也有不但不遵守robots规则对服务器造成压力，还不能为网站带来流量的无用爬虫，比如宜搜蜘蛛（YisouSpider）。最近张戈发现nginx日志中出现了好多宜搜等垃...

生成式AI 2023-11-08 大数据

990阅读

大数据导论（三：大数据的采集及预处理）

1、大数据采集 1.1 大数据采集概念数据采集（DAQ）又称数据获取，通过RFID射频数据、传感器数据、社交网络数据、移动互联网数据等方式获得各种类型的结构化、半结构化及非结构化的海量数据。 1.2 常用的数据采集方式大数据的采集通常采用...

大数据 2023-11-08 大数据

1218阅读

java爬虫实时采集小说+springboot推荐算法+实现在线小说免费阅读推荐系统

总结，本文从系统建设涉及到的技术介绍到框架搭建，对系统涉及到的商品推荐算法给出了详细的设计流程及核心代码块，从整体上完成了本应用商品推荐系统的开发过程。如何针对互联网各大小说阅读网站的小说数据进行实时采集更新，建立自己的小说资源库，针对海量的小说数据开...

生成式AI 2023-11-08 大数据

920阅读

云原生应用 Kubernetes 监控与弹性实践

前言云原生应用的设计理念已经被越来越多的开发者接受与认可，而Kubernetes做为云原生的标准接口实现，已经成为了整个stack的中心，云服务的能力可以通过Cloud Provider、CRD Controller、Operator等等的方式从K...

生成式AI 2023-11-08 大数据

855阅读

网络爬虫：Python如何从网上爬取数据？

网络爬虫，就是按照一定规则自动访问互联网上的信息并把内容下载下来的程序或脚本。在整个的Python爬虫架构里，从基础到深入我分为了10个部分：HTTP、网页、基本原理、静态网页爬取、动态网页爬取、APP爬取、多协程、爬虫框架、分布式爬虫以及反爬虫机制与...

大数据 2023-11-08 大数据

1056阅读

【监控体系】全面系统的Zabbix讲解 | 含源码&监控类型整理

主讲人：王鸿杰，云智慧/企业效能部/架构师讲师简介：云智慧架构师，PHP/PECL 开发组成员，PECL/SeasClick、PECL/SeasLog Maintainer。6 年研发经验，2018 年加入透视宝团队，致力于 APM 产品的架构与研发...

人工智能 2023-11-08 大数据

952阅读

使用SkyWalking监控MySQL（一）工具与方案

本文分享自微信公众号 - GreatSQL社区（GreatSQL）。如有侵权，请联系 support@oschina.cn 删除。本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一起分享。...

AIGC 2023-11-08 大数据

722阅读

爬虫知识超详细讲解(零基础入门，老年人都看的懂)

1.爬虫是什么？网络爬虫是一种按照一定的规则、自动的抓取万维网信息的脚本或者程序简单来说：爬虫是用事先写好的程序去抓取网络上的数据，这样的程序叫爬虫 2.爬虫的分类按照使用场景来分，可以分为两类：通用爬虫和聚焦爬虫通用爬虫：搜...

人工智能 2023-11-08 大数据

863阅读

搞不清 TDengine 的“复杂”查询？一文让它变简单

小 T 导读：作为一款专业的时序数据库（Time Series Database，TSDB），为满足用户在不同场景下的查询需求，TDengine 提供了丰富的查询功能。除了一些主要的查询外，还包括多表聚合查询、降采样查询及连续查询，本文将从实际操作层面对这...

大数据 2023-11-08 大数据

1304阅读

Python爬虫代理池

爬虫代理IP池在公司做分布式深网爬虫，搭建了一套稳定的代理池服务，为上千个爬虫提供有效的代理，保证各个爬虫拿到的都是对应网站有效的代理IP，从而保证爬虫快速稳定的运行，当然在公司做的东西不能开源出来。不过呢，闲暇时间手痒，所以就想利用一些免费的资...

AIGC 2023-11-08 大数据

827阅读

爬虫技术浅析

在WEB2.0时代，动态网页盛行起来。那么爬虫就应该能在页面内爬到这些有javascript生成的链接。当然动态解析页面只是爬虫的一个技术点。下面，我将按照如下顺序分享下面的这些内容的一些个人经验（编程语言为Python）。 1，爬虫架构。 2，页面下...

大数据 2023-11-08 大数据

892阅读

数据采集及预处理——针对“数据”“采集”“预处理”的理解与解析

数据采集及预处理——大数据的关键技术之一文章目录数据采集及预处理——大数据的关键技术之一前言数据采集与预处理是大数据学习的重要部分；本篇笔记是对《数据采集与预处理》这个标题的解析，我将它分为三个词语进行了详细的理解；因为...

AIGC 2023-11-08 大数据

1109阅读

服务器反爬虫攻略：Nginx禁止某些User Agent抓取网站

网络上的爬虫非常多，有对网站收录有益的，比如百度蜘蛛（Baiduspider），也有不但不遵守robots规则对服务器造成压力，还不能为网站带来流量的无用爬虫，比如宜搜蜘蛛（YisouSpider）。下面介绍怎么禁止这些无用的user agent访问网...

人工智能 2023-11-08 大数据

944阅读

毕业设计-分布式爬虫系统（干货）

前言很多同学会问：“为什么我的毕业设计总是过不了？为什么我的毕设分数很低？”这种情况要么就是你的毕设做得过于粗糙，要么就是功能过于简单，给导师的感觉就是很容易就能实现，你小子压根没花时间去做。你们说是不是这个理儿？本期案例分享，学长给大家上点干货，...

人工智能 2023-11-08 大数据

1000阅读

BS1071-基于javaweb+springboot实现医疗健康档案大数据采集清洗数据分析可视化系统

本医疗健康档案大数据采集清洗数据分析可视化的设计与实现，系统主要采用java，springboot，动态图表echarts，vue，mysql，mybatisplus，医疗健康档案数据分析，html，css，javascript等技术实现，主要通过互联网采...

AIGC 2023-11-08 大数据

817阅读

python爬虫大作业

Python爬虫大作业一、大作业要求结合所选专业方向（信息处理、嵌入式、人工智能、大数据处理），用所学Python技术设计并实现一个与专业方向技术相关的、功能完整的系统，并撰写总结报告。 实现要求：（1）实现时必须涵盖以下技术：图形界面、...

大数据 2023-11-08 大数据

900阅读

爬虫的基本原理：爬虫概述及爬取过程

一、什么是爬虫爬虫就是获取网页并提取和保存信息的自动化程序。 1）我们可以把互联网比作一张大网，而爬虫（网络爬虫）便是在网上爬行的蜘蛛。把网的节点比作一个个网页，爬虫爬到这就相当于访问了该页面，获取了其信息。可以把节点间的连线比作网页与网页之间的链...

人工智能 2023-11-08 大数据

831阅读

Prometheus的架构及持久化

##Prometheus是什么 Prometheus是一个开源的系统监控和报警工具，特点是多维数据模型（时序列数据由metric名和一组key/value组成）在多维度上灵活的查询语言(PromQl 不依赖分布式存储，单主节点工作....

生成式AI 2023-11-08 大数据

950阅读