光学字符识别 - AIGC资讯

如何处理数据采集中的反爬机制？

在大数据与人工智能日益普及的今天，数据采集成为许多企业和研究机构获取有价值信息的关键手段。然而，随着网络技术的不断进步，许多网站为了保护自身数据资源不被恶意抓取，设置了复杂的反爬机制。这些机制通过识别并阻止异常访问行为，有效维护了网站的安全与稳定。面对这样...

生成式AI 2025-06-28 大数据

2044阅读

ai与历史学：大数据如何重构历史叙事？

标题：AI与历史学：大数据如何重构历史叙事在21世纪的科技浪潮中，人工智能（AI）与大数据技术的飞速发展正以前所未有的方式影响着各行各业，历史学也不例外。传统上，历史研究依赖于珍贵的文献、考古发现以及历史学家的深厚学识与洞察力。然而，随着大数据时代的到来，...

AIGC 2025-06-27 人工智能

895阅读

数据采集如何优化电子病历管理？

在医疗信息化快速发展的今天，电子病历（EMR）已成为现代医疗体系不可或缺的一部分。它不仅极大地提高了医疗记录的效率与准确性，还为临床决策支持、医疗质量监控及科研分析提供了宝贵的数据资源。然而，要充分发挥电子病历的潜力，高效、准确的数据采集是基石。本文将探讨...

人工智能 2025-06-13 大数据

675阅读

爬虫中的反反爬虫策略

在互联网信息爆炸的时代，数据成为了企业决策、市场分析、学术研究等领域不可或缺的资源。爬虫技术作为一种自动化数据抓取手段，被广泛应用于各行各业。然而，随着数据价值的日益凸显，网站运营者为了保护自身数据资源不被恶意采集，纷纷采取了一系列反爬虫措施。面对这些挑战...

生成式AI 2025-06-11 大数据

932阅读

爬虫在娱乐网站数据采集中的应用

标题：爬虫技术在娱乐网站数据采集中的应用探索在数字化时代，互联网已成为信息传播的主要渠道，其中娱乐网站作为大众获取娱乐资讯、明星动态、影视资源等信息的重要平台，蕴含着海量的数据资源。这些数据不仅对于娱乐行业内部的市场分析、趋势预测具有极高的价值，也是广大网...

生成式AI 2025-06-09 大数据

727阅读

谷歌Chrome新增三大AI功能！轻松找到访问过但未保存网站

快科技8月2日消息，谷歌宣布将为Chrome浏览器引入三项全新的AI驱动功能，旨在提升用户的浏览体验。这些新功能包括桌面版Google Lens（圈选搜索）、标签页对比以及回顾浏览历史，都是基于谷歌最新的AI和Gemini模型。桌面版Google Le...

大数据 2024-08-02 人工智能

952阅读

Meta首席科学家：大模型永远达不到人类智力

快科技5月23日消息，据媒体报道，Meta的首席人工智能科学家、深度学习领域的先驱杨立昆（Yann LeCun）近日对ChatGPT等生成式AI产品背后的大语言模型的能力提出了质疑。他表示，大模型永远无法实现像人类一样的推理和规划能力。杨立昆明确指出，...

人工智能 2024-05-23 人工智能

744阅读

探秘防爬虫破解之道：技术高手的攻略指南

在当今的数字化时代，互联网信息的获取变得异常重要。然而，随着反爬虫技术的日益成熟，直接获取网络数据也变得越来越困难。那么，如何破解这些防爬虫措施，成为数据获取中的关键环节。本文将为您深入剖析破解防爬虫的策略和方法，帮助您更好地应对挑战、提升数据获取效率。一...

人工智能 2024-05-19 大数据

950阅读

GPT-4o被全球网友玩坏了谷歌：终究是错付了！

在社交软件上，OpenAI的GPT-4o成为了热议的焦点。这款最新旗舰产品以其全能的特性——接受文字、音频、图像的任意组合输入，并生成相应的文字、音频、图像输出——迅速吸引了全球网友的关注。GPT-4o的免费特性更是让其成为了互联网上的新宠。在5月14日...

AIGC 2024-05-16 人工智能

790阅读

苹果推出理解、转化模型ReALM，性能超GPT-4

苹果的研究人员推出了一种创新模型ReALM，可将参考解析问题转化为语言建模问题，能极大提升AI助手处理很多描述复杂或模糊不清的内容。例如，我们网购时选好了橘子、鸭梨、苹果、橘子汽水、洗发水、短袖、拖鞋等物品，然后告诉AI助手只结算水果。这时传统的AI助手...

人工智能 2024-04-30 人工智能

897阅读

Image-Manga Translator官网体验入口 AI漫画图像翻译工具免费在线使用地址

Image-Manga Translator是一款能够将漫画或图片中的文字进行多语言翻译和图像处理的工具。它具有文本检测、光学字符识别(OCR 、机器翻译和图像修补等功能，支持多种语言如日语、中文、英语和韩语等，能够实现近乎完美的翻译效果。主要面向漫画爱好...

AIGC 2024-03-21 人工智能

1539阅读

基于Discuz论坛的帖子采集与爬虫自创建账号策略

随着网络信息的爆炸式增长，数据采集技术日益受到重视。论坛作为互联网上的重要信息交流平台，蕴含了大量有价值的数据。Discuz作为一款广受欢迎的论坛软件，其数据采集对于研究者、企业乃至个人而言都具有重要意义。然而，在进行数据采集时，往往会遇到反爬虫机制、登录...

大数据 2024-03-18 大数据

902阅读

ImagenATexto官网体验入口 AI图像转换为可编辑文本工具

ImagenATexto是一个在线工具，可以将图像转换为可编辑的文本。它使用先进的OCR技术，确保准确提取图像中的文本。用户只需上传图像，工具会自动识别并提取文本。适用于转换文件、书籍、引用等。它支持多种图像格式，界面简单易用。点击前往ImagenAT...

生成式AI 2024-03-12 人工智能

931阅读

AI破译2000年前「上古卷轴」登Nature头版！21岁计算机天才，谷歌华人工程师共获大奖

2000年前碳化的古卷轴，如今成功被AI破译！背后三人团队还拿下70万美元大奖！ AI在考古领域的重大进步，甚至登上了今天Nature的头版。要说这件事的起源，还得追溯到公元79年一次火山爆发，直接将一座珍藏古老的纸莎草卷轴——Herculaneu...

人工智能 2024-02-06 人工智能

804阅读

机器人和人工智能如何实现供应链的自动化

自动化技术如今正在进入各个行业领域，这在供应链中尤为明显。事实上，正如人们所知，自动化技术的未来进步可能会重塑整个供应链和供应链管理软件。有远见的供应链参与者已经在为新形势做好准备。首席信息官应该带头为他们的组织带来最好的结果，但首先了解供应链中机器...

人工智能 2024-02-05 人工智能

965阅读

GPT-4V只能排第二！华科大等发布多模态大模型新基准：五大任务14个模型全面测评

近期，多模态大模型（LMMs）在视觉语言任务方面展示了令人印象深刻的能力。然而，由于多模态大模型的回答具有开放性，如何准确评估多模态大模型各个方面的性能成为一个迫切需要解决的问题。目前，一些方法采用GPT对答案进行评分，但存在着不准确和主观性的问题。另...

大数据 2024-02-02 人工智能

988阅读

华科大发布多模态大模型新基准覆盖五大任务

近期，华中科技大学等机构发布了一项关于多模态大模型（LMMs）的全面评估新基准，旨在解决多模态大模型性能评估的问题。这项研究涉及了14个主流多模态大模型，包括谷歌Gemini、OpenAI GPT-4V等，覆盖了五大任务、27个数据集。然而，由于多模态大模...

生成式AI 2024-02-02 人工智能

1001阅读

推翻Transformer奠基之作疑被拒收，ICLR评审遭质疑！网友大呼黑幕，LeCun自曝类似经历

去年12月，CMU和普林斯顿的2位研究者发布了Mamba架构，瞬间引起AI社区震动！结果，这篇被众人看好有望「颠覆Transformer霸权」的论文，今天竟曝出疑似被顶会拒收？！今早，康奈尔大学副教授Sasha Rush最先发现，这篇有望成为奠基之作...

AIGC 2024-01-26 人工智能

868阅读

攻克图像「文本生成」难题，碾压同级扩散模型！两代TextDiffuser架构深度解析

近年来，文本生成图像领域取得了显著进展，尤其是基于扩散（Diffusion）的图像生成模型在细节层面上展现出逼真的效果。然而，一个挑战仍然存在：如何将文本准确地融入图像。生活中存在大量的「含文本图像」，从广告海报到书籍封面，再到路牌指示，都包含了重要...

生成式AI 2024-01-06 人工智能

918阅读

ocr识别原理和场景应用浅析

Labs 导读日常生活的截图提取、拍照搜题，都用到了文字识别领域占据重要地位的OCR（光学字符识别）技术。 Part 01、什么是OCR OCR（光学字符识别）是计算机文字识别的一种方法，利用光学技术和计算机技术将印刷或手写在纸张等介质的文...

生成式AI 2023-12-25 人工智能

1190阅读

到2030年，六项技术工作将由AI/自动化终结

译者 | 晶颜审校 | 重楼如今，人工智能和自动化已进入高速发展阶段，很多人都在担心它们将会取代部分专业角色。虽然预测某些工作将彻底消失似乎有些夸张，但明智的做法是，对未来可能发生的情况保持现实视角，以便为接下来发生的任何事情做好准备。考虑到这一...

人工智能 2023-12-25 人工智能

977阅读

文字识别表格识别，这个库直接调用

PaddleOCR是一个基于PaddlePaddle深度学习框架开发的开源OCR（Optical Character Recognition）工具。除了光学字符识别（OCR）功能外，最新版本的PaddleOCR还引入了表格识别功能。表格识别是一种将图像...

人工智能 2023-12-24 人工智能

1155阅读

人工智能在供应链中有哪些应用？

应用人工智能(AI 是供应链专业人士解决关键问题和改善全球运营的一种方式。人工智能增强工具正在整个供应链中使用，以提高效率，减少全球工人短缺的影响，并发现更好、更安全的方式将货物从一个地方转移到另一个地方。为什么企业应该使用人工智能? 人工智能的应...

大数据 2023-12-04 人工智能

1542阅读

最强的GPT-4V都考不过？基于大学考试的测试基准MMMU诞生了

目前最好的大型多模态模型 GPT-4V 与大学生谁更强？我们还不知道，但近日一个新的基准数据集 MMMU 以及基于其的基准测试或许能给我们提供一点线索，如下排行榜所示。看起来，GPT-4V 在一些科目上已经强过挂科的大学生了。当然这个数据集的创造目的...

AIGC 2023-12-01 人工智能

888阅读

研究人员开发自动识别古代楔形文字片的AI软件

一项由马丁·路德大学哈勒-维滕贝格（MLU）、约翰内斯·古腾堡大学迈因茨分校和迈因茨应用科学大学团队开发的新型人工智能软件如今能够解读难以辨认的楔形文字。与以往依赖照片的方法不同，该AI系统利用楔形文字片的3D模型，传递的结果比先前的方法更加可靠。这使得能...

AIGC 2023-11-24 人工智能

828阅读

Stable Video Diffusion来了，代码权重已上线

AI 画图的著名公司 Stability AI，终于入局 AI 生成视频了。本周二，基于 Stable Diffusion 的视频生成模型 Stable Video Diffusion 来了，AI 社区马上开始了热议。很多人都表示「我们终于等到了」...

AIGC 2023-11-22 人工智能

826阅读

如何利用人工智能释放非结构化数据的力量

随着几乎所有垂直行业都走向数字化，人们常说“数据就是新石油”。然而，人们往往没有足够重视的是，石油在经过精炼并以柴油、汽油、天然气或航空燃料等所需形式存在之前，不适合驱动我们的机器，非结构化数据的情况几乎相同。据估计，非结构化数据约占全球组织生成和存...

大数据 2023-11-15 人工智能

876阅读

解锁 PaddleOCR 的超能力

光学字符识别（OCR）是一项强大的技术，使机器能够从图像或扫描文档中识别和提取文本。OCR 在各个领域都有应用，包括文件数字化、从图像中提取文本以及基于文本的数据分析。在本文中，我们将探讨如何使用 PaddleOCR，一款基于深度学习的先进OCR工具包，...

生成式AI 2023-11-12 人工智能

997阅读

OpenAI与第三方机构合作，构建新的AI训练数据集

OpenAI最近宣布了Data Partnerships计划，旨在与第三方机构合作，创建用于AI模型训练的公共和私有数据集。这一举措旨在解决现有AI模型训练数据集中存在的问题，其中包含有毒语言和偏见。 OpenAI的目标是培养更安全、更有益于全人类的AI。...

生成式AI 2023-11-10 人工智能

797阅读

如何为制造业和自动化应用选择人工智能技术

在工业自动化领域的生产和实验室之外的日常生活中，人工智能(AI 的定义差异很大。 “人工智能”指的是一门包含了几种不同技术和工程学科的科学，包括机器视觉、计算机视觉、机器学习和深度学习。当一个基于这些技术组合的系统设计得当时（从应用分析到最终验证），它...

生成式AI 2023-11-10 人工智能

883阅读

OpenAI 寻求合作伙伴生成用于训练 AI 模型的数据集

IT之家 11 月 10 日消息，OpenAI 发文宣布，将与组织合作生成用于训练 AI 模型的公共 / 私有数据集，数据合作伙伴关系旨在“让更多组织能够帮助引导 AI 的未来”并“从更有用的模型中受益”。 IT之家从博客获悉，OpenAI 称：“为了...

大数据 2023-11-10 人工智能

865阅读

AIGC时代，我们如何使用“黑科技”，解决图像信息安全

前言在当今社会，图像是信息传播和表达的重要方式之一。但是，随着技术的进步，人们可以轻松使用各种图像编辑软件来篡改、伪造图片，制造出看似真实但实际上虚假的场景。这种现象无疑是给社会带来了一系列负面影响。首先，大量基于虚假图片产生的诈骗案件层出不穷。...

大数据 2023-11-09 人工智能

967阅读