-
Gartner揭示2024年GenAI网络安全主要趋势
组织、政府、学者和无数其他人都在寻找利用GenAI技术的变革力量的方法。大多数IT领导者(67% 将在未来18个月内优先考虑GenAI。虽然人们对GenAI的前景感到非常兴奋,但也有一些担忧,包括GenAI对多个方面的网络安全影响的不确定性。 为了帮助...
-
Meta AI 发布开源基准数据集OpenEQA 促进AI代理的 “体验智能”
Meta AI 研究人员今天发布了 OpenEQA,这是一个新的开源基准数据集,旨在衡量人工智能系统对 “体验式问答”(embodied question answering)的能力 —— 这种能力使人工智能系统能够理解现实世界,从而回答有关环境的自然语言...
-
大模型加持后,数字人“更像人”了吗?
北京冬奥运AI 虚拟人手语主播、杭州亚运会数字人点火、新华社数字记者、数字航天员小诤......当随着越来越多数字人出现在人们生活中,整个数字人行业也朝着多元化且广泛的应用方向发展,快速拓展到不同行业、不同场景。 面向C端,数字人帮助用户生产内容和辅...
-
AI延时视频生成工具MagicTime在线体验地址放出
MagicTime是一款创新的在线工具,它能够根据用户提供的文本描述生成展示真实世界物理变化过程的时间延迟视频。这种技术的应用范围非常广泛,可以用于记录和展示各种自然和人为引起的变化过程。 体验地址:https://huggingface.co/spac...
-
新加坡国立大学 | 通过语言分割任何3D目标
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文研究了具有自由形式语言指令的开放词汇3D实例分割(OV-3DIS)。先前的作品只依赖于注释的基本类别进行训练,对看不见的长尾类别的泛化能力有限。最近的工作通过生成类...
-
Gartner预计2028 年75% 的企业软件工程师将使用 AI 代码助手
根据Gartner的数据,到2028年,75%的企业软件工程师将使用AI代码助手,而2023年初这一比例还不到10%。63%的组织目前正在试验、部署或已经部署AI代码助手。 Gartner高级首席分析师Philip Walsh表示:"软件工程领导者在扩展...
-
面向AI的数据治理体系如何构建?
近年来,随着新技术模型出现、各行业应用场景价值打磨与海量数据积累下的产品效果提升,人工智能应用已从消费、互联网等泛C端领域,向制造、能源、电力等传统行业辐射。各行业企业在设计、采购、生产、管理、营销等经济生产活动主要环节的人工智能技术与应用成熟度在不断...
-
AI人工智能如何助推数字化转型?
人工智能从提出到现在已经有几十年的时间,而为什么只在近些年,该技术才获得爆发式增长? 这一现象绝非偶然,正是得益于云计算、物联网和大数据等数字技术的日趋成熟,人工智能才取得实质性进展:云计算为人工智能提供了开放平台,物联网确保数据的实时分享,而大数据则...
-
一文搞懂Tokenization!
语言模型是对文本进行推理,文本通常是字符串形式,但是模型的输入只能是数字,因此需要将文本转换成数字形式。 Tokenization是NLP的基本任务,按照特定需求能把一段连续的文本序列(如句子、段落等)切分为一个字符串序列(如单词、短语、字符、标点等多个...
-
新版GPT-4 Turbo现已向所有付费 ChatGPT 用户开放
近日,OpenAI宣布推出最新版的GPT-4Turbo,这一消息在人工智能领域引起了广泛关注。目前新版 GPT-4Turbo 已向所有付费 ChatGPT 用户开放,这标志着人工智能技术在语言理解和生成方面的又一重大进步。 GPT-4Turbo在多个方面...
-
福布斯发布人工智能50强榜单 OpenAI、Anthropic等霸榜
福布斯发布了备受瞩目的第六届人工智能50强榜单,从1900家申请公司中精选出顶级的人工智能企业,展现了该行业的蓬勃发展和创新活力。评选过程严格,结合了算法分析和专家评审,突显了人工智能在提升生产力、推动创意应用和改善实体运营方面的日益重要性。 完整榜单点...
-
Next ’24 - 踏上云端新旅程
作者 | Google Cloud CEO, Thomas Kurian 去年,全世界才开始想象生成式 AI 将为企业带来怎样的转变,如今这些转变正在逐步展开。 而 Google 一直遵循着相同的原则:打造人人都能受益的 AI 技术,尽力为更多人带来更...
-
等等我还没上车!LLM赋能端到端全新范式LeGo-Drive,车速拉满
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者个人理解 这篇论文介绍了一种名为LeGo-Drive的基于视觉语言模型的闭环端到端自动驾驶方法。该方法通过预测目标位置和可微分优化器规划轨迹,实现了从导航指令到目标位置的端到端闭...
-
基于因果推断的推荐系统:回顾和前瞻
本次分享的主题为基于因果推断的推荐系统,回顾过去的相关工作,并提出本方向的未来展望。 为什么在推荐系统中需要使用因果推断技术?现有的研究工作用因果推断来解决三类问题(参见 Gao et al.的 TOIS 2023 论文 Causal Inference...
-
人工智能驱动的工作空间:是福还是祸?
人工智能驱动的工作空间:是福还是祸? 人工智能(AI 在各个行业中都取得了重大进展,其与工作空间的集成也不例外。人工智能驱动的工作空间有望彻底改变我们提高生产力和协作的方式,但也引发了人们对隐私、安全和未来工作的担忧。本文探讨了人工智能驱动的工作...
-
ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验
一、ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验 ROCm:一个可移植、高性能的GPU计算平台 随着AI时代的来临,显卡的作用不再仅仅只局限于游戏,特别是在Stable Diffusion火爆全网之后,越来越多的玩家...
-
VQAScore官网体验入口 AI文本到视觉生成评估工具使用地址
VQAScore是一种新的评估指标,旨在更好地评估复杂的文本到视觉生成效果。这一指标结合了CLIP-FlanT5 模型,能够在文本到图像/视频/3D生成评估中实现最佳性能,是评估和优化文本到视觉生成模型的强大工具。同时,VQAScore引入了GenAI-B...
-
从AIGC到AGI,为什么我们需要更多的“技术信仰派”?
整理 | 伊风 采访 | 张晓楠 嘉宾 | 巴川、朱雷、肖然 出品 | 51CTO技术栈(微信号:blog51cto) 作为AIGC应用落地元年,2024开年就抛给我们一些不太好回答的问题: 在以探索AGI为长期目标时,我们该坚守技术信仰吗? 除了复制...
-
aiXcoder-7B官网体验入口 AI代码大模型使用地址
aiXcoder-7B是一个拥有 70 亿参数的代码大模型,专为企业级软件开发设计。其性能超越 340 亿参数的Codellama模型,在真实开发场景下表现卓越。支持算法题和多文件复杂代码场景,生成完整代码块、偏好短小代码,提升维护成本、代码质量。开源且可...
-
知识图谱的演进与基于 OpenSPG+TuGraph 的推理实践
本文为蚂蚁集团开发工程师王少飞在TuGraph Meetup北京站的演讲,主要介绍了蚂蚁知识图谱平台经过多年金融领域业务沉淀的知识语义增强可编程框架SPG,及TuGraph作为执行引擎在图谱推理过程的作用。 作者介绍: 王少飞,蚂蚁知识图谱推理开发工程师...
-
AI安全公司TrojAI获得种子轮追加融资
加拿大AI安全解决方案提供商TrojAI本周宣布获得575万美元的种子轮追加融资。 TrojAI提供的企业AI安全平台可帮助客户保护AI模型和应用程序远离风险和攻击。其平台可以在部署前测试AI模型并保护应用程序免于敏感数据泄露等问题,来帮助企业遵守OW...
-
探索网络爬虫:技术演进与学习之路
网络爬虫及IP代理池 前言 爬虫技术的演进 最新的爬虫技术 爬虫技术学习路线 前言 在信息时代,网络爬虫技术作为获取和处理网络数据的重要手段,已经成为数据科学、机器学习和许多商业应用的基石。从简单的HTML页面抓取到复杂的动态内容...
-
为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑
几天前,前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy 发布了一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」。 llm.c 旨在让大模型(LM)训练变得简单...
-
「大模型+强化学习」最新综述!港中文深圳130余篇论文:详解四条主流技术路线
强化学习(RL)通过与环境交互的试错反馈来优化顺序决策问题。 虽然RL在允许大量试错的复杂电子游戏环境中实现了超越人类的决策能力(例如王者荣耀,Dota 2等),但很难在包含大量自然语言和视觉图像的现实复杂应用中落地,原因包括但不限于:数据获取困难、样本...
-
开源大模型食用指南官网地址入口 详细环境配置、模型部署、高效微调方法教程
开源大模型食用指南是一个旨在帮助用户学习和应用开源大模型的全流程指导教程。它提供了详细的环境配置、模型部署、高效微调等方法,以简化开源大模型的使用和应用,让更多普通学习者能够轻松上手。该项目面向对开源大模型感兴趣且想自主上手的学习者,为他们提供了详尽的环境...
-
巧用Stable Diffusion,实现不同风格的LOGO设计|实战篇幅,建议收藏!
大家好,我是程序员晓晓 Logo,作为品牌的视觉核心,其重要性不言而喻。它不仅是品牌的标识,更是品牌精神和文化的体现。一个成功的Logo能够简洁而有力地传达品牌的信息和特质,使消费者在短时间内就能对品牌产生深刻的印象。 在Logo的设计过程中,极简与象...
-
探索智能体的边界:AgentQuest,一个全面衡量和提升大型语言模型智能体性能的模块化基准框架
随着大模型的不断进化,LLM智能体——这些强大的算法实体已经展现出解决复杂多步骤推理任务的潜力。从自然语言处理到深度学习,LLM智能体正逐渐成为研究和工业界的焦点,它们不仅能够理解和生成人类语言,还能在多变的环境中制定策略、执行任务,甚至使用API调用和...
-
探索ChatGLM-LLaMA-chinese:新一代AI聊天机器人与多语言建模的创新实践
探索ChatGLM-LLaMA-chinese:新一代AI聊天机器人与多语言建模的创新实践 项目地址:https://gitcode.com/27182812/ChatGLM-LLaMA-chinese-insturct 在人工智能领域,语言模型的...
-
得物 AIGC 算法岗(日常实习生) 面经分享
节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 最大的感受就是,今年的算法面试...
-
文生图——stable diffusion生成有趣的动漫图像
Stable Diffusion是一个文本转图像的模型,由CompVis、Stability AI和LAION共同开发。它能够从一段简单的文本输入中快速生成相应的图像。此外,它还可以导入图像并配合文本对其进行处理。从技术角度来看,Stable Diffus...
-
AI写作查出来高风险怎么办?七步策略助你应对
大家好,小发猫降ai今天来聊聊AI写作查出来高风险怎么办?七步策略助你应对,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: AI写作查出来高风险怎么办?七步策略助你应...
-
谷歌向微软英特尔全面宣战:首款自研Arm CPU,最强大模型公测,AI视频对垒Sora
昨晚的Google Cloud Next2024大会上,谷歌接连放出一堆模型和产品王炸:Gemini1.5Pro公开可用、上线音频处理能力;代码模型CodeGemma上新,首款自研Arm处理器Axion正式向微软和亚马逊宣战……这次,谷歌要以量取胜。 昨天...
-
谷歌将推全新AI视频工具Google Vids 集多种功能一体
近日,有消息称Google将推出一款集多种功能于一体的AI视频工具——Google Vids。这款工具旨在帮助用户轻松创作故事板,并通过AI技术协助编辑内容,选择适合的场景、图片和音乐,自动生成一个完整的类似PPT的宣讲视频。 使用Google Vids...
-
CodeGemma官网体验入口 谷歌AI代码生成辅助工具使用地址
CodeGemma是谷歌公司推出的先进大语言模型,专注于生成代码、理解和追踪指令,旨在为全球开发人员提供高质量的代码辅助工具。包括 20 亿参数的基础模型, 70 亿参数的基础模型和用于指导追踪的 70 亿参数模型,针对代码开发场景进行优化和微调。在各种编...
-
如何写好Stable Diffusion的prompt
Stable Diffusion是一种强大的文本到图像生成模型,其效果在很大程度上取决于输入的提示词(Prompt)。以下是一些关于如何编写有效的Stable Diffusion Prompt的秘诀: 明确描述:尽量清晰地描述你想要的图像内容。使...
-
神仙掐架!24届视觉算法岗(AIGC方向)秋招经验分享!
节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 今天我来介绍我们星球社群一位很...
-
Healthify官网体验入口 AI健康营养助手人工智能app下载地址
Healthify是一款智能健康助手,由专业营养师和认证教练团队提供个性化餐食计划和运动计划。该APP可以跟踪您的每日卡路里摄入、体重目标、锻炼情况、手洗、水分摄入、睡眠监测、膳食日记和步数。Healthify可以帮助您更快实现健身目标。 点击前往Hea...
-
小米 14 / Pro 获得大师人像、AISP 功能更新推送
今日,小米14和小米14Pro手机迎来了重要的系统更新。此次更新的一大亮点在于,小米14Ultra的出色影像功能被下放至这两款手机上,为用户带来了更为卓越的拍照体验。 更新内容中,新增的大师人像功能备受瞩目,它提供了大师人像和徕卡人像两种画质风格,为用户的...
-
tldraw官网体验入口 免费在线AI即时协作绘图工具使用地址
tldraw是一款免费的、即时协作的绘图工具。它提供了丰富的图形元素和绘图功能,可以帮助用户快速创建各种类型的图表和流程图。tldraw 允许用户在白板上绘制 UI,并使用 GPT-4 Turbo 和 Vision 来生成由真实代码支持的工作网站。它支持多...
-
AI绘图:Stable Diffusion ComfyUI局部重绘与智能扩图全面教程
前言 在数字艺术创作中,局部重绘和智能扩图是两个非常重要的功能。局部重绘允许我们在保留原有图像的基础上,对特定区域进行修改或创新。而智能扩图则能够帮助我们在图像的边缘添加新的元素,从而扩展图像的内容。本文将详细介绍如何在Stable Diffusion...
-
基于数据正则化自博弈强化学习的人类兼容型自动驾驶
自动驾驶汽车面临的一个核心挑战是如何与人类合作。因此,在模拟环境中,将现实中的人类代理纳入到自主驾驶系统的可扩展训练和评估中至关重要。模拟代理通常是通过模仿大规模、高质量的人类驾驶数据集来开发的。然而,纯粹的模仿学习代理在多代理闭环环境中执行时经验上具...
-
生物识别技术是访问控制的未来吗?
在人类历史上,很难想象我们进入建筑物时不需要安全入口。从雕刻的木棒到无处不在的金属工具,再到更现代的钥匙卡,甚至更先进的密码,钥匙已经为这一目的服务了千万年。然而,在过去的几年里,随着生物识别技术在建筑环境中作为“虚拟钥匙”的使用变得越来越普遍,高科技...
-
facet ai怎么用?AI图片编辑修图工具Facet AI详细使用教程(附产品入口)
产品简介: FacetAI是一款创新的图像编辑工具,以实时图像生成和精确控制图像元素为核心优势,为广告制作和产品图像设计领域带来革命性变化。用户可通过直观的画布操作实现对图像元素的精准控制,提高工作效率。 Fac...
-
构建数字化、脱碳能源未来:技术驱动的绿色转型
在全球气候变化日益严峻的背景下,人类面临着严重的气候和能源危机。为了实现可持续发展和保护地球家园,我们需要采取积极的行动,转向数字化、脱碳的能源未来。今天,我们简要探讨如何利用人工智能、物联网、大数据等技术,解决当前的气候和能源挑战,打造绿色、低碳的未...
-
MagicTime官网体验入口 AI生成延时视频软件使用地址
MagicTime是一种基于文本描述生成高质量变化视频的模型。它通过学习时间流逝视频中的物理知识,实现了高度逼真的变化过程模拟。该模型包括MagicAdapter、Dynamic Frames Extraction和Magic Text-Encoder三个...
-
Claude 3 横空出世,亚马逊云科技携手Anthropic引领企业级生成式 AI 新纪元
2024 年 3 月,OpenAI 的主要竞争对手之一 Anthropic 推出最新的 Claude 3 大语言模型系列:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。自从 GPT-3.5 推出以来,业界对...
-
苹果新AI模型研究Ferret-UI:或将提升Siri,读懂屏幕内容
尽管苹果在生成式 AI 热潮开始后并未推出任何 AI 模型,但近期公司正在着手一些 AI 项目。上周,苹果研究人员分享了一篇揭示公司正在研发的新语言模型的论文,内部消息称苹果正在研发两款 AI 驱动的机器人。 如今,又一份研究论文的发布显示苹果才刚刚开始。...
-
利用人工智能对文本内容进行自动摘要
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 随着互联网上各种 UGC 越来越多,各种原创性的长文本内容也不断地涌现出来。例如,在人工智能领域的三大顶会之一的 ICML,许多论文...
-
半年融资1.6亿美金,AI学语言又来敲Duolingo的门了
在11月的选题《卷起来了,网易和谷歌都想抢Duolingo的生意》中,我们观察到了谷歌和网易等公司都基于 AI 开发了语言学习产品,市面上也充斥着同类产品。但测试后发现,AI 在语言学习产品中的作用主要在“练口语”这个层面,解决“开口难”问题,相比于 Du...
-
使用 MacBook Pro M1 16G 运行 Llama 2 7B (Apple Silicon 通用方法)
原文地址: 使用 MacBook Pro M1 16G 运行 Llama 2 7B (Apple Silicon 通用方法 这篇文章用于记录我在 MacBook Pro M1 16G 中配置 Llama 2 7B 环境的全流程。这一方法适用于所有 Ap...