-
从 HPC 到 AI:探索文件系统的发展及性能评估
随着 AI 技术的迅速发展,模型规模和复杂度以及待处理数据量都在急剧上升,这些趋势使得高性能计算(HPC)变得越来越必要。HPC 通过集成强大的计算资源,比如 GPU 和 CPU 集群,提供了处理和分析大规模数据所需的算力。 然而,这也带来了新的挑战,尤...
-
AIGC下一步:如何用AI再度重构或优化媒体处理?
让媒资中“沉默的大多数”再次焕发光彩。 邹娟|演讲者 编者按 AIGC时代下,媒体内容生产领域随着AI的出现也涌现出更多的变化与挑战。面对AI的巨大冲击,如何优化或重构媒体内容生产技术架构?在多样的应用场景中媒体内容生产技术又有着怎样的实践效...
-
OpenAI和微软被The Intercept等三家新闻机构起诉,指控侵犯版权
《The Intercept》,《Raw Story》和《AlterNet》三家新闻机构在纽约南区分别提起诉讼,指控OpenAI和Microsoft存在侵权行为,包括在培训AI模型时删除作者、标题和其他版权信息。这三起案件均由同一律师事务所代理。 这些媒体...
-
千卡利用率超98%,详解JuiceFS在权威AI测试中的实现策略
2023 年 9 月,AI 领域的权威基准评测 MLPerf 推出了 Storage Benchmark。该基准测试通过模拟机器学习 I/O 负载的方法,在不需要 GPU 的情况下就能进行大规模的性能压测,用以评估存储系统的在 AI 模型训练场景的适用性。...
-
[AIGC] 利用 ChatGpt 深入理解 Java 虚拟机(JVM)的内存分布
深入理解 Java 虚拟机(JVM)的内存分布 Java 虚拟机(JVM)是 Java 编程语言的核心运行环境,它负责解释和执行 Java 字节码。在 JVM 中,内存被划分为几个不同的区域,每个区域都有特定的用途。了解这些区域的功能和限制对于优化 J...
-
AIGC基础:大型语言模型 (LLM) 为什么使用向量数据库,嵌入(Embeddings)又是什么?
嵌入: 它是指什么?嵌入是将数据(例如文本、图像或代码)转换为高维向量的数值表示。这些向量捕捉了数据点之间的语义含义和关系。可以将其理解为将复杂数据翻译成 LLM 可以理解的语言。 为什么有用?原始数据之间的相似性反映在高维空间中对应向量之间的距离上。...
-
OpenAI推出文本到视频AI生成器Sora
OpenAI推出了Sora,加入了文本到视频的人工智能内容生成竞赛。Sora可以根据用户的提示生成长达一分钟的视频。 该公司展示了几段用Sora制作的令人印象深刻的视频,包括一名女子走在东京的街道上,以及淘金热时代加利福尼亚的历史镜头。 目前推出的是面...
-
Windows 上线魔术橡皮擦功能,用AI功能辅助修改照片
微软今天宣布为 Windows 照片应用程序推出新的“生成擦除”功能。该功能使用人工智能可以从照片中删除不需要的物体或人物。 该功能类似于谷歌 Pixel 和三星 Galaxy 手机上的“魔术橡皮擦”功能。它可以用来删除照片中的路人、电线、水印等。 微软...
-
whisper实践--基于whisper+pyqt5开发的语音识别翻译生成字幕工具
大家新年快乐,事业生活蒸蒸日上,解封的第一个年,想必大家都回家过年,好好陪陪家人了吧,这篇文章也是我在老家码的,还记得上篇我带大家基本了解了whisper,相信大家对whisper是什么,怎么安装whisper,以及使用都有了一个认识,这次作为新年第一篇文...
-
文心一言插件开发(第三篇
目录 1. 从0到1开发自己的插件: 1.1 插件描述文件(ai-plugin.json) 1.2 服务描述文件(openapi.yaml) 1.2.1 数据类型: 1.2.1 OpenAPI 对象: 1.3 示例描述文件(example...
-
新添“代理”概念,用 GitHub Copilot 追求极致编码智能
企业申请Azure OpenAI绿色通道 →记得评论私信~还可加入交流群~ 如果您前段时间关注了 GitHub Universe,您应该看到了人工智能在整个开发者工作流程中取得的巨大进展、创新和愿景。在这篇文章中,我们将专注于介绍过去几个月以来在...
-
AI视野:通义千问发布Qwen1.5;背景分割开源模型RMBG v1.4来了;OpenAI 为 DALL-E3添加新水印;苹果图片项目MGIE上线试玩
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI应用 通义千问团队发布...
-
Meta承诺在Facebook和Instagram上标注AI生成的图像
Meta近日宣布,将在其旗下社交媒体平台Facebook和Instagram上标注由人工智能生成的图像,作为科技行业倡议的一部分,旨在帮助用户区分真实和虚假信息。据Meta表示,他们正与行业合作伙伴一同制定技术标准,以更容易识别由人工智能工具生成的图像,并...
-
新型IT运维管理,基础设施和数据两手都要硬
AI大模型时代,数据赋予IT人“新使命” 当下IT人在企业中扮演着运营支撑的角色。说到运维管理,相信每人都是一把辛酸泪,每天承担着繁琐、高负荷且又高风险的运维工作,但在业务规划和职业发展时又成为了“透明人”。业内有句调侃的话:“只花钱的人,不配拥有发...
-
极限挑战:使用 Go 打造百亿级文件系统的实践之旅
JuiceFS 企业版是一款为云环境设计的分布式文件系统,单命名空间内可稳定管理高达百亿级数量的文件。 构建这个大规模、高性能的文件系统面临众多复杂性挑战,其中最为关键的环节之一就是元数据引擎的设计。JuiceFS 企业版于 2017 年上线,经过几年的...
-
大模型系列——解读RAG
RAG 是2023年最流行的基于 LLM 的应用系统架构。有许多产品几乎完全建立在 RAG 之上,覆盖了结合网络搜索引擎和 LLM 的问答服务,到成千上万个数据聊天的应用程序。很多人将RAG和Agent 作为大模型应用的两种主流架构,但什么是RAG呢?R...
-
[AIGC 大数据基础] 浅谈hdfs
HDFS介绍 什么是HDFS? HDFS(Hadoop Distributed File System)是Apache Hadoop生态系统的一部分,是一个分布式文件系统。它被设计用于存储和处理大规模数据集,并且能够容错、高可靠和高性能地处理文...
-
Galaxy S24系列AI编辑功能引发争议 三星回应:正与监管机构合作
近日,三星正面临的挑战不仅仅局限于智能手机的新功能开发,而是涉及到生成式人工智能的监管问题。三星客户体验主管帕特里克·乔梅特表示,政府对生成式人工智能能力的担忧是正当的,需要加强监管。 在今年的首届Unpacked活动上,三星展示了一系列以人工智能驱动的软...
-
阿里北交大实习生论文火了!MobileAgent 可模拟人类玩转手机,网友:加速剁手、吃土!
编辑 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) “太酷了,以后就靠AI帮我加速剁手吃土了。”近日一款名为MobileAgent的移动智能代理引起了圈内人的注意。 一个惊艳之处在于,这款Agent为“手机+GPT4”结合,做出...
-
Mobile-Agent: 具有视觉感知 可以像人类样操作手机的自主多模态AI代理
Mobile-Agent是一款具有视觉感知的自主多模式移动设备代理,由北京交通大学联合阿里巴巴团队共同开发。简单的说,Mobile-Agent相当于一个可以模拟人类操作手机的自主多模态AI代理。 该代理采用纯视觉解决方案,独立于XML和系统元数据,不需要...
-
Mobile-Agent官网体验入口 自主多模移动设备AI在线使用地址
Mobile-Agent是一款自主多模移动设备代理,采用先进的多模大语言模型(MLLM)技术。该代理利用视觉感知工具准确识别和定位应用程序前端界面的视觉和文字元素,实现了自主规划和分解复杂操作任务,通过逐步操作导航移动应用程序。与以往依赖应用程序的XML文...
-
RAG高阶技巧-如何实现窗口上下文检索
在本文中,我们将介绍一种提高RAG(Retrieval-Augmented Generation)模型检索效果的高阶技巧,即窗口上下文检索。我们将首先回顾一下基础RAG的检索流程和存在的问题,然后介绍窗口上下文检索的原理和实现方法,最后通过一个实例展...
-
让知识图谱成为大模型的伴侣
大型语言模型(LLM 能够在短时间内生成非常流畅和连贯的文本,为人工智能的对话、创造性写作和其他广泛的应用开辟了新的可能性,然而,LLM也有着一些关键的局限性。它们的知识仅限于从训练数据中识别出的模式,这意味着缺乏对世界的真正理解。同时,推理能力也是有限...
-
Salesforce生成式AI聊天机器人「Einstein Copilot」,将于2月发布!
Spring '24宣布,期待已久的Einstein Copilot将于2024年2月落地Salesforce。该生成式AI聊天机器人将用于整个Salesforce产品套件,帮助企业做出更明智的决策,从而改善客户体验。 Einstein Copilot应...
-
2024 年,3 项技术将为生成式人工智能提供帮助
随着 ChatGPT 惊艳的首年即将落幕,生成式人工智能(genAI)与大型语言模型(LLM)无疑已成为引人瞩目的技术焦点。然而,在企业的黄金时期,它们是否已具备投入使用的能力呢?ChatGPT 所遭遇的挑战众所周知,其在回答问题时的准确性尚待提高。尽...
-
人工智能教程(六):Keras 和第一个数据集
在本系列的 上一篇文章中,我们学习了使用 Anaconda,加强了概率论的知识。在本文中我们将继续学习概率论的知识,学习使用 seaborn 和 Pandas 进行数据可视化,并进一步介绍 TensorFlow 和 Keras 的使用。 让我们从增长人...
-
GitHub 数据库 15 年进化史:幕后英雄如何成就 Copilot 传奇
自 2008 年成立以来,GitHub 的数据库系统经历了多次重大的演变,以适应不断增长的用户基础和不断变化的技术需求。GitHub 一直使用 MySQL 数据库,其中保存了除了 git 代码仓库以外的其他所有元数据,诸如用户,issue,PR, Gist...
-
copilot插件全解
COPILOT是一个基于AI的编程辅助工具,它可以帮助程序员自动编写代码,提高开发效率。COPILOT的插件主要是为了将其功能集成到不同的编程环境中,方便程序员使用。 目前,COPILOT支持多种编程环境,包括Visual Studio Code、Vis...
-
LLM会写代码≠推理+规划!AAAI主席揭秘:代码数据质量太高|LeCun力赞
自从ChatGPT发布后,各种基于大模型的产品也快速融入了普通人的生活中,但即便非AI从业者在使用过几次后也可以发现,大模型经常会胡编乱造,生成错误的事实。 不过对于程序员来说,把GPT-4等大模型当作「代码辅助生成工具」来用的效果明显要比「事实检索工具...
-
部署新思路 | Minuet:在 GPU 上加速 3D 稀疏卷积
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:Minuet: Accelerating 3D Sparse Convolutions on GPUs 论文链接:https://arxiv.org/pdf/2401.06145.pdf 代码...
-
Movievanders官网体验入口 AI电影推荐平台在线使用地址
Movievanders是一款利用AI技术推动的电影搜索和推荐平台。它利用最新的人工智能技术,包括OpenAI开发的先进语言模型,为您提供电影发现和推荐的未来体验。无论您是在寻找特定电影还是根据个人兴趣和偏好获取推荐,Movievanders都能满足您的需...
-
【慕伏白】stable diffusion webui 使用手册
文章目录 Global Parameters 1. Stable Diffusion checkpoint 2. Functions text2img 1. Prompt Prompt Editing 2. Negative prompt...
-
OpenAI像素级抄袭好莱坞IP,反手开撕《纽约时报》,LeCun舌战网友疑似站队支持
去年底AI行业最爆炸性的事件要算是纽约时报和OpenAI的官司了。 在《纽约时报》一纸诉状将OpenAI告到法院,要求OpenAI要么关闭ChatGPT,要么赔偿几十亿美元。 这个新闻在国内外媒体上发酵了2周之后,OpenAI官方终于下场回怼了。 Op...
-
在灾难推文分析场景上比较用 LoRA 微调 Roberta、Llama 2 和 Mistral 的过程及表现
引言 自然语言处理 (NLP 领域的进展日新月异,你方唱罢我登场。因此,在实际场景中,针对特定的任务,我们经常需要对不同的语言模型进行比较,以寻找最适合的模型。本文主要比较 3 个模型: RoBERTa、Mistral-7B 及 Llama-2...
-
AIGC实战——自回归模型(Autoregressive Model)
AIGC实战——自回归模型 0. 前言 1. 长短期记忆网络基本原理 2. Recipes 数据集 3. 处理文本数据 3.1 文本与图像数据处理的差异 3.2 文本数据处理步骤 4. 构建 LSTM 模型 4.1 模型架构 4.2 LS...
-
2024年大数据展望:数据满足GenAI
去年初,谁能想到GenAI和ChatGPT会抢占先机? 一年前,我们预测数据、分析和AI提供商最终会抽出时间来简化和重新思考现代数据堆栈,这是一个我们已经接近和热爱了一段时间的话题。作为分布式企业中数据治理的解决方案,也有很多关于数据网格的讨论和担忧,...
-
专补大模型短板的RAG有哪些新进展?这篇综述讲明白了
大型语言模型(LLMs)已经成为我们生活和工作的一部分,它们以惊人的多功能性和智能化改变了我们与信息的互动方式。 然而,尽管它们的能力令人印象深刻,但它们并非无懈可击。这些模型可能会产生误导性的 “幻觉”,依赖的信息可能过时,处理特定知识时效率不高,缺乏...
-
嵌入和矢量数据库实操指南
译者 | 布加迪 审校 | 重楼 这场革命的核心是矢量数据库概念,这一突破性发展正在重塑我们处理复杂数据的方式。与传统的关系数据库不同,这种数据库具有管理和处理高维矢量数据的独特功能,这种数据是许多AI 和机器学习应用所固有的。随着我们更深入研究先进AI...
-
百度文心一言文心千帆大模型 ERNIE-Bot-turbo调用示例(golang版本)
百度的文心一言推出来也有一段时间了,但是接口部分一直没有公开,需要进行申请 最近,有朋友提供了文心千帆大模型的api权限,拿到了必须的参数,现在就来测试一下 下面是使用golang封装的文心千帆 ERNIE-Bot-turbo模型的调用示例...
-
2024年非结构化数据管理将以四种方式发生变化
如果说经济好的时候、坏的时候、不确定的时候、稳定的时候有一个不变的东西的话,那就是我们对大多数非结构化数据的依赖,以及我们从海量数据收集中得出的分析。非结构化数据是指当今公司的文档、图像、音频和视频文件、传感器数据和研究数据。 想想监控和车载摄像头视频...
-
四分钟成功复现诺奖!CMU开发GPT-4化学家,自主编码操控机器人颠覆化学研究登Nature
ChatGPT大模型爆火这一年,没想到竟颠覆了整个化学领域。 先是谷歌DeepMind的AI工具GNoME成功预测出200万种晶体结构,随后微软推出的MatterGen,大大加速了设计所需材料特性的速度。 今天,CMU和Emerald Cloud Lab...
-
Meta发布全新AI翻译大模型,实时语音转换不超2秒
Meta最新发布了一系列AI翻译大模型,标志性地实现了实时语音转换延迟不超过2秒的能力。这一系列模型名为Seamless Communication,包括SeamlessExpressive、SeamlessStreaming、SeamlessM4T v2...
-
用于备份和灾难恢复的生成式 AI 工具仍处于早期阶段
备份软件供应商已经推出了用于自动化和虚拟助手的生成式 AI 工具,但这些新增功能如何增强企业工作流程还有待观察。 数据备份和灾难恢复供应商希望他们的生成式 AI 助手成为您企业最好的朋友,但即使经过近一年的炒作和销售,其好处也不明显。 这些用于备份和灾...
-
实时湖仓技术选型,企业如何借实时湖仓赢在“数据驱动”时代
在之前三期的实时湖仓系列文章中,我们从业务侧、产品侧、应用侧等几个方向,为大家介绍了实时湖仓方方面面的内容,包括实时湖仓对于企业数字化布局的重要性以及如何进行实时湖仓的落地实践等。 本文将从纯技术的角度,为大家解析实时湖仓的存储原理以及生态选型,为企业建...
-
谁能更好地检测深度伪造?人还是机器?
译者 | 陈峻 审校 | 重楼 不知您是否听说过深度伪造(Deepfakes)这种欺诈应用?由它产生的各种虚假信息已威胁到了人类社会的方方面面。随着人工智能技术的进步,我们亟待提升识别虚假内容的能力。那么在实际检测假新闻可信度等用例时,到底是人类还是机器...
-
谷歌AI联合佛罗里达高校发布开源虚拟人物库“VALID” 含210个全套虚拟人物
谷歌AR&VR与佛罗里达中央大学的研究团队合作,发布了一项名为“VALID”的虚拟人物库,旨在促进多样性和包容。该库包含210个经过验证的、完全配备的虚拟人物,代表七个不同的种族,其中包括亚洲、黑人和白人等。研究采用了全球参与者,并通过数据驱动的面...
-
低代码!小白用10分钟也能利用flowise构建AIGC| 业务问答 | 文本识别 | 网络爬虫
一、与知识对话 二、采集网页问答 三、部署安装flowise flowise工程地址:https://github.com/FlowiseAI/Flowise flowise 官方文档:https://docs.flowiseai.co...
-
ChatGPT与Google Bard那个更好?
AIGC 行业最大的两个竞争对手:ChatGPT vs Google Bard! 本文介绍这两个人工智能引擎之间的技术差异。 截至目前Google Bard和ChatGPT之间最大的区别是:Bard知道ChatGPT,但ChatGPT却对Bard懵然不知。...
-
一条磁力链接席卷AI圈,87GB种子直接开源8x7B MoE模型
「高端」的开源,往往采用最朴素的发布方式。 昨天,Mistral AI 在 X 平台甩出一条磁力链接,宣布了新的开源动作。 没有长篇官方博客,没有刻意加速的 Demo,这家公司算是当下大模型领域的「一股清流」。 打开一看,发现是接近 87 GB 的种子...
-
使用Stable Diffusion进行Ai+艺术设计(以智慧灯杆为例)
目录 一. 安装环境 二. 配置模型 2.1 stable diffusion v1 2.2 运行并测试生成效果 Stable Diffusion 是一种以 CLIP ViT-L/14 文本编码器的(非池化)文本嵌入为条件的潜在扩散...