-
图像相似度比较之 CLIP or DINOv2
在人工智能领域,计算机视觉的两大巨头是CLIP和DINOv2。CLIP改变了图像理解的方式,而DINOv2为自监督学习带来了新的方法。在本文中,我们将探索定义CLIP和DINOv2的强项和微妙之处的旅程。我们旨在发现这些模型中哪一个在图像相似度任务的世界...
-
研究人员使用特殊图像“毒害”人工智能
DALL-E、Midjourney和Stable Diffusion等人工智能生成艺术工具的兴起引发了激烈的辩论和争议。这些系统可以通过在互联网上收集的大量数据集上进行训练,简单地根据文本提示创建真实感图像和艺术。然而,这引发了人们对侵犯版权、滥用艺术家...
-
研究证实,最好的 ChatGPT 提示是高度情绪化的
一组研究人员发现,充满情感的LLM输入始终会产生更有用的反应。 对不同大型语言模型响应输入方式的新研究表明,确保您的ChatGPT 提示足够情绪化将帮助您从聊天机器人中提取最高质量的响应。 这些发现提出了一个问题,即ChatGPT是否已经发展成为通用人...
-
OpenAI创始人Sam Altman被解雇后的24小时
ChatGPT背后的公司OpenAI周五解雇了其首席执行官兼创始人Sam Altman,他惊人的离职给新兴的人工智能行业带来了冲击波。 该公司在一份声明中表示,内部调查发现,阿尔特曼并不总是对董事会诚实。 该公司在声明中表示:“阿尔特曼先生的离职是在董...
-
一文读懂 AI Agents 技术
想象一下:软件实体能够自主地与环境交互,根据收集的数据做出决策,并以最少的人为干预执行基于特定场景。幸好,借助 AI Agents 技术,这个现实比你想象的更接近了。这些智能代理正在彻底改变行业,并改变我们的生活方式。但是,大家可能会好奇:AI Agen...
-
大语言模型量化方法对比:GPTQ、GGUF、AWQ
在过去的一年里,大型语言模型(llm 有了飞速的发展,在本文中,我们将探讨几种(量化 的方式,除此以外,还会介绍分片及不同的保存和压缩策略。 说明:每次加载LLM示例后,建议清除缓存,以防止出现OutOfMemory错误。 del model, tok...
-
如何有效减少 AI 模型的数据中心能源消耗?
在让人工智能变得更好的竞赛中,麻省理工学院(MIT)林肯实验室正在开发降低功耗、高效训练和透明能源使用的方法。 在 Google 上搜索航班时,您可能已经注意到,现在每个航班的碳排放量估算值都显示在其成本旁边。这是一种告知客户其对环境影响的方式,并让他...
-
AI领域29个必须知道的统计和趋势数据
ChatGPT 在 2022 年 11 月爆炸性推出后风靡全球,而在 2023 年,人工智能 (AI) 革命当然没有任何放缓的迹象。每一天,企业都在寻找使用人工智能来节省时间和金钱的新方法,最新的人工智能统计数据反映了该技术的迅速崛起。 在过去的12个...
-
新技术有效加速大规模人工智能模型的处理性能
麻省理工学院和英伟达的研究人员开发了两种技术来加速稀疏张量的处理,稀疏张量是一种用于高性能计算任务的数据结构。这些技术可以显著提高系统的性能和能效,例如驱动生成式人工智能的大规模机器学习模型。 张量(Tensors)是机器学习模型使用的数据结构。这两种...
-
Yolo V8:深入探讨其高级功能和新特性
Yolo是一种计算机视觉模型,被广泛认为是目前最强大和最知名的模型之一。这一突破性技术被称为Yolo,它是“You Only Look Once”的缩写,是一种以几乎瞬间处理速度检测物体的方法。Yolo V8技术是这一技术的最新版本,也是对之前版本的一种...
-
解释:生成式 AI的工作机制与差异
像 ChatGPT 这样强大的生成式 AI 系统是如何工作的,它们与其他类型的人工智能有何不同? 快速浏览一下头条新闻,就会发现生成式人工智能如今无处不在。事实上,其中一些标题实际上可能是由生成式人工智能撰写的,例如 OpenAI 的 ChatGPT,...
-
使用Python从图像中提取表格
大约一年前,我被分配任务从文件中提取和结构化数据,主要是包含在表格中的数据。我之前对计算机视觉没有了解,并且很难找到一个合适的“即插即用”的解决方案。当时可选的方案要么是基于最新神经网络(NN)的解决方案,这些解决方案庞大而繁琐,要么是基于OpenCV的...
-
未来AI将有五大发展趋势?2024年将进入“有意义的人工智能时代”
由于生成式人工智能的出现,人们与人工智能的距离逐渐缩短。过去很少关注相关技术的人们,今年可能已经成为人工智能工具的用户。眼看着2023年即将结束,新的一年里,人工智能会有怎样的发展呢? 企业将通过开源模型提升人工智能能力 美国研究公司Forrester...
-
神经网络中的量化与蒸馏
本文将深入研究深度学习中精简模型的技术:量化和蒸馏 深度学习模型,特别是那些具有大量参数的模型,在资源受限环境中的部署几乎是不可能的。所以就出现了两种流行的技术,量化和蒸馏,它们都是可以使模型更加轻量级,而不会对性能造成太大影响。但是它们需要什么,它们又...
-
在 Visual Studio 2022 中使用 GitHub Copilot chat
本文通过实际应用场景和示例代码展示了 GitHub Copilot Chat 在 Visual Studio 2022 中的优势和特点。最后,鼓励读者在实际工作中尝试使用 Copilot Chat,以提升开发效率和代码质量。希望这些信息和经验能为你在使用G...
-
LoRAShear:微软在LLM修剪和知识恢复方面的最新研究
LoRAShear是微软为优化语言模型模型(llm 和保存知识而开发的一种新方法。它可以进行结构性修剪,减少计算需求并提高效率。 LHSPG技术( Lora Half-Space Projected Gradient)支持渐进式结构化剪枝和动态知识恢复...
-
解锁AI和ML在医疗保健领域潜力
在医疗保健领域,人工智能(AI 和机器学习(ML 逐渐为患者护理、诊断和治疗带来了显著的进步。这些尖端技术彻底改变了医疗保健行业,提高了准确性、效率和个性化护理。早期疾病检测、精准医疗、医学成像进步、虚拟健康助手和药物发现就是这些技术如何重塑医疗保健实践...
-
无监督学习的集成方法:相似性矩阵的聚类
在机器学习中,术语Ensemble指的是并行组合多个模型,这个想法是利用群体的智慧,在给出的最终答案上形成更好的共识。 这种类型的方法已经在监督学习领域得到了广泛的研究和应用,特别是在分类问题上,像RandomForest这样非常成功的算法。通常应用一...
-
为什么说百度下个月推出文心一言会被ChatGPT完全碾压
作者,姚远: Oracle ACE(Oracle和MySQL数据库方向) 华为云MVP 《MySQL 8.0运维与优化》的作者 中国唯一一位Oracle高可用大师 拥有包括 Oracle 10g和12c OCM在内的20+数据库相关认证。 曾任IBM公...
-
解锁 PaddleOCR 的超能力
光学字符识别(OCR)是一项强大的技术,使机器能够从图像或扫描文档中识别和提取文本。OCR 在各个领域都有应用,包括文件数字化、从图像中提取文本以及基于文本的数据分析。在本文中,我们将探讨如何使用 PaddleOCR,一款基于深度学习的先进OCR工具包,...
-
AI —— 一看就懂的代码助手Copilot获取教程
背景 随着chatgpt的发布,人工智能领域近期站上了风口浪尖。GitHub Copilot由github与 OpenAI 合作创建,是世界上第一个使用 OpenAI 的 Codex 模型(GPT-3 的后代)制作的大规模生成式 AI 开...
-
人工智能推动“电脑嗅觉”用于昆虫控制
机器嗅觉初创公司Osmo于2023年1月成立,获得由Lux Capital和Google Ventures领投的 6000万美元A轮资金。Osmo将机器学习、数据科学、心理物理学、嗅觉神经科学、电气工程和化学融合在一种多学科的气味数字化方法中。 Osm...
-
大语言模型的七大网络安全热门应用
在这个网络威胁攻防日益失衡的时代,飞速发展的人工智能和大型语言模型(LLM 正成为推动网络安全变革的颠覆性力量。 面对新兴威胁,人工智能正推动网络安全转向主动、智能防御。人工智能与人类专业知识的结合才是打造下一代网络安全防御的最佳方式。 今天,人工智能...
-
2023年初学者入门 CV 指南概述
计算机视觉,是一个迅速发展的领域,将让你大开眼界。它的核心是教计算机像我们人类一样看和理解视觉信息。这份全面指南,将为我们揭示计算机视觉的基本概念,探索流行的应用程序,并瞥见计算机视觉的未来趋势。 计算机视觉简介:科学和艺术的奇妙交汇 好的,让我们...
-
AIGC远不止是代码辅助
生成式人工智能(AIGC)对于软件开发人员的生产力有重要的潜力。但要成功利用它,需要将其视为不仅仅是代码生成工具而已。 生成式人工智能(AIGC)可以彻底改变软件开发。它具有驱动软件开发人员显著提高生产力的能力,可以加快创新周期和上市时间。然而,如果将其...
-
如何高效率采集并分析数据
一、数据采集的三大要点 1、全面性 数据量足够具有分析价值、数据面足够支撑分析需求。 比如对于“查看商品详情”这一行为,需要采集用户触发时的环境信息、会话、以及背后的用户id,最后需要统计这一行为在某一时段触发的人数、次数、人均次数、活跃比等。...
-
目标检测标注的时代已经过去了?
在快速发展的机器学习领域,有一个方面一直保持不变:繁琐和耗时的数据标注任务。无论是用于图像分类、目标检测还是语义分割,长期以来人工标记的数据集一直是监督学习的基础。 然而,由于一个创新性的工具 AutoDistill,这种情况可能很快会发生改变。 G...
-
这些浏览器中的 AI 扩展太香了
众所周知,浏览器只有添加了扩展才能让其火力全开,效率翻倍,而当有了AI的加持后,直接起飞。 本期将整理一些目前非常火的基于AI语言模型的扩展程序,大大提高生产力,一起看看吧! ChatGPT for Google https://chrome.go...
-
交叉验证太重要了!
首先需要搞明白,为什么需要交叉验证? 交叉验证是机器学习和统计学中常用的一种技术,用于评估预测模型的性能和泛化能力,特别是在数据有限或评估模型对新的未见数据的泛化能力时,交叉验证非常有价值。 那么具体在什么情况下会使用交叉验证呢? 模型性能评估:交叉...
-
用AI整顿AI?这些检测工具了解了解
自生成式AI创作机器人出现以来,各行各业都开始用来撰写文章甚至学术论文,针对该情况,一些AI内容检测工具也随之诞生,一起看看吧。 1.Copyleaks AI Content Detector https://copyleaks.com/ai-co...
-
马斯克xAI公布大模型详细进展,Grok只训练了2个月
近几日,马斯克的人工智能公司 xAI 公布了他们用来对标 OpenAI ChatGPT 的产品 ——Grok ,直接把网友的好奇心拉满。 和总是一本正经回答问题的 ChatGPT 不同,Grok 自带幽默和嘲讽技能。 就像下图所展示的,Grok 在被...
-
随着Gen AI采用激增,新研究报告提醒数据信任问题
企业可信人工智能(AI)数据公司Cloudera的最新研究显示,美国一半以上的机构组织(53%)目前使用生成式人工智能(Gen AI)技术,另有36%的组织正处于探索人工智能的早期阶段,准备明年实现。 但超过八成的受访数据战略和管理决策者(84%)担心...
-
生成式 AI 如何支撑当前的 DevOps 和 SRE 工作体系?
Hello folks,我是 Luga,今天我们来聊一下人工智能生态核心技术—— GAI,即 “生成式人工智能” 。 在信息技术(IT)和系统可靠性的不断发展领域中,DevOps(开发和运营)和 SRE (站点可靠性工程)已经成为不可或缺的方法。这些实践...
-
使用LIME解释各种机器学习模型代码示例
机器学习模型变得越来越复杂和准确,但它们的不透明性仍然是一个重大挑战。理解为什么一个模型会做出特定的预测,对于建立信任和确保它按照预期行事至关重要。在本文中,我们将介绍LIME,并使用它来解释各种常见的模型。 LIME LIME (Local Inter...
-
2024年人工智能安全发展十大预测
本周三,包括英国、美国和中国在内的近30个国家(以及欧盟)在人工智能安全峰会上达成首个全球性人工智能安全协议,并发布了《人工智能安全宣言》,这标志着人工智能正式进入安全发展的强监管时代。 峰会期间,人工智能意见领袖们就人工智能安全风险的严重性判断产生重...
-
人工智能进入强监管时代
以ChatGPT为代表的基于LLM(大语言模型 的生成式人工智能应用正风靡全球,各行各业都在争先恐后将其集成到前端和后端的各种系统中,与此同时生成式人工智能面临的安全风险也正随着其热度上升而凸显。 生成式人工智能自身正面临提示注入等多种攻击,很可能给企...
-
网络安全行业需要借鉴“马斯克算法”
今天,我们已经进入一个人工智能和数字化转型驱动的颠覆式创新时代,网络安全不再是企业IT的“成本和摩擦”,相反,网络安全是构建下一代数字基础设施和信息秩序的支点,也是所有科技创新(从药品研发到军工智造)的要素。这意味着传统网络安全技术研发、方案实施、防御体...
-
机器学习 | PyTorch简明教程上篇
前面几篇文章介绍了特征归一化和张量,接下来开始写两篇PyTorch简明教程,主要介绍PyTorch简单实践。 1、四则运算 import torch a = torch.tensor([2, 3, 4] b = torch.tensor([3, 4,...
-
美国公布人工智能总统行政命令
人工智能具有巨大的潜力,既有希望,也有危险。负责任地使用人工智能可以帮助解决全球一些最具挑战性的问题,但它也可以用于危害社会和大规模破坏。由于其巨大的好与坏潜力,像人工智能这样强大的技术受到监管只是时间问题。 美国总统拜登公布了一项人工智能政令,该政令...
-
机器学习|PyTorch简明教程下篇
接着上篇《PyTorch简明教程上篇》,继续学习多层感知机,卷积神经网络和LSTMNet。 1、多层感知机 多层感知机通过在网络中加入一个或多个隐藏层来克服线性模型的限制,是一个简单的神经网络,也是深度学习的重要基础,具体图如下: import num...
-
用于科学数据研究的人工智能助理MATA获得专利
南卫理公会大学(SMU 和美国国家航空航天局(NASA 的研究人员宣布MATA获得了专利,MATA是一种人工智能研究助理,可以回答科学数据问题。 消费者已经习惯于向由亚马逊和苹果开发的Alexa和Siri等对话式人工智能助理提问。这些聊天机器人接受了关...
-
使用Llama index构建多代理 RAG
检索增强生成(RAG 已成为增强大型语言模型(LLM 能力的一种强大技术。通过从知识来源中检索相关信息并将其纳入提示,RAG为LLM提供了有用的上下文,以产生基于事实的输出。 但是现有的单代理RAG系统面临着检索效率低下、高延迟和次优提示的挑战。这些问题...
-
使用Panda-Gym的机器臂模拟进行Deep Q-learning强化学习
强化学习(RL 是一种机器学习方法,它允许代理通过试错来学习如何在环境中表现。行为主体因采取行动导致预期结果而获得奖励,因采取行动导致预期结果而受到惩罚。随着时间的推移,代理学会采取行动,使其预期回报最大化。 RL代理通常使用马尔可夫决策过程(MDP ...
-
MLCommons宣布成立人工智能安全工作组
人工智能基准组织MLCommons宣布成立人工智能安全(AIS:AI Safety)工作组。AIS将开发一个平台和来自许多贡献者的测试库,以支持不同用例的人工智能安全基准。 人工智能系统为社会提供了巨大利益的潜力,但它们并非没有风险,如有害性、错误信息...
-
IDC FutureScape:人工智能将重塑IT行业和商业运营方式
IDC发布了其对2024年及以后全球信息技术行业的预测——FutureScape(未来景象)报告。这份报告揭示了IDC对IT行业未来的十大预测,以及随着组织寻求扩展其数字业务,“无处不在的人工智能”将如何影响技术决策。 今年的预测主要集中在人工智能(A...
-
人工智能安全成热点
2023年人工智能安全峰会(AI Safety Summit)将于11月1日和2日在英国标志性的布莱切利公园举行。一些世界领先的科技公司、人工智能专家、政府官员和民间社会团体将参加此次峰会。峰会的主要议程是强调人工智能的风险,重点关注人工智能前沿,并讨论...
-
五个优秀开源RPA框架
这两年,RPA+AI(智能自动化流程)经常被提及,在企业/机构数字化转型过程中,自动化和智能化是提升效能的重要方式,而迈向自动化和智能化的第一步则是机器人流程自动化(RPA)。 什么是RPA?什么是RPA+AI? 如果把RPA比作人的躯干神经,那么AI...
-
适合初学者的一些常用的机器学习库
在人工智能项目开发的过程中,我们通常会使用到很多机器学习、深度学习框架、各种数据处理库和一些工具。好用的库很多,但对于初学者来说先聚焦在一些比较常用的框架、库或者工具,有利于提高效率。下面主要分享一些常用的人工智能相关的内容,包括:模型训练、数据处理、参...
-
iOS 18 新功能曝光,终于来了!
今年生成式 AI 技术非常火爆,自 ChatGPT 问世,众多生成式 AI 大模型便如同雨后春笋般纷纷冒了出来,作为科技巨头的苹果却迟迟没有动静。 据 Jeff Pu 最新的报告,苹果计划最早在 2024 年年底开始在 iPhone 和 iPad 上推...
-
数据分析和机器学习的11个高级可视化图表介绍
可视化是一种强大的工具,用于以直观和可理解的方式传达复杂的数据模式和关系。它们在数据分析中发挥着至关重要的作用,提供了通常难以从原始数据或传统数字表示中辨别出来的见解。 可视化对于理解复杂的数据模式和关系至关重要,我们将介绍11个最重要和必须知道的图表,...