-
科学家开发出BrainGPT:可将思想转化为文本
快科技12月26日消息,据国内媒体报道,澳大利亚悉尼科技大学科学家开发出一种便携式、非侵入性的人工智能读心”头戴设备BrainGPT,可将思想转化成文本。 据了解,BrainGPT把脑电波信号分割成不同的单元,从中捕获特定的特征和模式。模型通过从大量脑电数...
-
AI视野:Pika1.0正式向所有人开放;阿里开源文生3D模型;Midjourney V6涉嫌侵权;谷歌推出新AI SDK
新鲜AI产品点击了解:https://top.aibase.com/ ???AI应用 Pika1.0正式向所有人开放 Pika1.0官方宣布正式向所有人开放网页版本试用资格,每个用户都可免费体验该创意视频制作平台。该版本以文生成视频为特色,提供3秒视频快速...
-
ocr识别原理和场景应用浅析
Labs 导读 日常生活的截图提取、拍照搜题,都用到了文字识别领域占据重要地位的OCR(光学字符识别)技术。 Part 01、 什么是OCR OCR(光学字符识别)是计算机文字识别的一种方法,利用光学技术和计算机技术将印刷或手写在纸张等介质的文...
-
挑战Transformer的Mamba是什么来头?作者博士论文理清SSM进化路径
在大模型领域,Transformer 凭一己之力撑起了整个江山。但随着模型规模的扩展和需要处理的序列不断变长,Transformer 的局限性也逐渐凸显,比如其自注意力机制的计算量会随着上下文长度的增加呈平方级增长。为了克服这些缺陷,研究者们开发出了很多...
-
李飞飞DeepMind全新「代码链」碾压CoT!大模型用Python代码推理,性能暴涨12%
思维链(CoT),最具开拓性和影响力的提示工程技术之一,能增强LLM在推理决策中的表现。 那么,如果大模型可以在代码中「思考」,会如何呢? 最近,谷歌DeepMind、斯坦福、UC伯克利团队联手提出了全新技术——「代码链」(CoC)。 论文地址:htt...
-
机器学习模型性能的十个指标
尽管大模型非常强大, 但是解决实践的问题也可以不全部依赖于大模型。一个不太确切的类比,解释现实中的物理现象,未必要用到量子力学。有些相对简单的问题,或许一个统计分布就足够了。对机器学习而言, 也不用言必深度学习与神经网络,关键在于明确问题的边界。 那么在...
-
CMU权威对比Gemini,GPT-3和Mistral8×7B!GPT-3.5依旧拿捏Gemini,开源模型差距依然不小
谷歌最近发布的Gemini掀起了不小的波澜。 毕竟,大语言模型领域几乎是OpenAI的GPT一家独大的局面。 不过作为吃瓜群众,当然希望科技公司都卷起来,大模型都打起来! 所以,作为科技巨无霸谷歌的亲儿子,Gemini自然承受了很高的期待。 虽然Gemi...
-
测试时领域适应的鲁棒性得以保证,TRIBE在多真实场景下达到SOTA
测试时领域适应(Test-Time Adaptation)的目的是使源域模型适应推理阶段的测试数据,在适应未知的图像损坏领域取得了出色的效果。然而,当前许多方法都缺乏对真实世界场景中测试数据流的考虑,例如: 测试数据流应当是时变分布(而非传统领域适应中...
-
一个算命准确度高达78%的AI,让网友都当上了赛博阎王
咱中国人爱算命这事,是刻在骨子里的执念。 出门前要看看黄历、办公室要讲风水、就连谈恋爱换工作也要算算领导和对象的星座和八字合不合适。 算命姿势也是无奇不有,用八字星座塔罗牌已属过去式,寺庙求签不够潮。 这不,有位中国人就在ChatGPT上训练了一个“算命专...
-
只需一张图片、一句动作指令,Animate124轻松生成3D视频
近一年来,DreamFusion 引领了一个新潮流,即 3D 静态物体与场景的生成,这在生成技术领域引发了广泛关注。回顾过去一年,我们见证了 3D 静态生成技术在质量和控制性方面的显著进步。技术发展从基于文本的生成起步,逐渐融入单视角图像,进而发展到整合...
-
只需一个眼神!韩国医学院使用AI筛查自闭症:准确率100%
快科技12月21日消息,据媒体报道,韩国延世大学医学院近日发布了一项研究成果:可用深度学习后的人工智能算法,对儿童的视网膜照片进行分析,从而检测儿童是否患有自闭症谱系障碍(ASD)。 据悉,在本次实验中,研究人员共召集了900多名年龄在7-8岁的儿童,其中...
-
摸底谷歌Gemini:CMU全面测评,Gemini Pro不敌GPT 3.5 Turbo
前段时间,谷歌发布了对标 OpenAI GPT 模型的竞品 ——Gemini。这个大模型共有三个版本 ——Ultra(能力最强)、Pro 和 Nano。研究团队公布的测试结果显示,Ultra 版本在许多任务中优于 GPT4,而 Pro 版本与 GPT-3...
-
你真的会写 Prompt ? 剖析 RAG 应用中的指代消解
随着 ChatGPT 等大语言模型(LLM 的不断发展,越来越多的研究人员开始关注语言模型的应用。 其中,检索增强生成(Retrieval-augmented generation,RAG)是一种针对知识密集型 NLP 任务的生成方法,它通过在生成过程中...
-
斯坦福大学研究生开发名为PIGEON的AI模型 仅通过几张照片找到你的位置
斯坦福大学的研究生们开发了一款名为 PIGEON 的应用程序,可以仅仅通过查看 Google 街景图像或其他图像来确定具体位置,其准确率令人印象深刻。 根据预印本论文的数据,PIGEON 可以以92%的准确率预测所拍摄国家,并且在40%的猜测中可以将位置定...
-
数据治理与大模型一体化实践
降本增效方面,以机器学习团队的构成为例,滴普科技Deepexi产品线总裁柏海峰介绍道:“传统机器学习或者说小模型的技术落地,对人才的要求很高,但企业往往没有意识到这个问题。具体来说,一般需要构建一个综合性的团队即数据科学团队,团队中需要数据开发工程师、...
-
深度学习之目标检测中的常用算法
随着深度学习的不断发展,深度卷积神经网络在目标检测领域中的应用愈加广泛,现已被应用于农业、交通和医学等众多领域。 与基于特征的传统手工方法相比,基于深度学习的目标检测方法可以学习低级和高级图像特征,有更好的检测精度和泛化能力。 什么是目标检测? 目标检测...
-
丹麦 AI 模型预测死亡率准确度超保险公司,引发被滥用担忧
12 月 19 日消息,丹麦科技大学的苏尼・莱曼・乔根森及其团队开发了一款强大的人工智能模型,可以根据个人数据预测死亡率,准确度远超现有的任何模型,甚至包括保险业使用的模型。研究人员表示,该模型能提前预警健康和社会问题,也需要警惕其被大型企业滥用。 乔...
-
AI 筛选的视网膜图像诊断儿童自闭症的准确率达 100%
由儿童和青少年心理学家、行为科学家、眼科医生和生物医学系统信息学专家组成的韩国多机构团队发现,基于深度学习的人工智能系统能准确诊断患有自闭症的儿童。在发表于《JAMA Network Open》期刊的研究中,该团队使用基于学习的 AI 系统创建了一个自闭症...
-
阿里「通义千问」大战百度「文心一言」15个回合后,GPT4沉默了
文|卖萌酱 这几天风闻阿里的AI大模型要发布,我刷了这把老脸,成功成为了第一批吃到螃蟹的人! 测试界面长这样: 传送门:https://tong...
-
华人团队用大模型实现“读心术”:大脑活动直接变文字
NeurIPS收录的一项新研究,让大模型也学会“读心术”了! 通过学习脑电波数据,模型成功地把受试者的脑电图信号翻译成了文本。 而且整个过程不需要大型设备,只要一块特制的“头巾”就能实现。 这项成果名为DeWave,能在不通过侵入式设备和MRI的情况下...
-
OpenAI 的超级对齐团队在做什么
今年11月17日,OpenAI 首席执行官萨姆·奥尔特曼 (Sam Altman 在首席科学家伊利亚·苏茨克韦尔 (Ilya Sutskever 的政变下被罢免,但三天后复职。不到一个月,OpenAI 宣布一切恢复正常,而这一切导火索是团队内部的有...
-
AI视野:OpenAI灰度测试GPT4.5;Midjourney V6模型下周发布;Gemini自曝中文用文心一言训练;LeCun提出AGI七阶段路线图
???AI新鲜事 openAI灰度测试GPT4.5 近日,OpenAI正在对最新的GPT4.5turbo模型进行灰度测试,该模型在文本生成质量、效率、上下文理解、多模态能力、编程和代码生成、安全性、个性化定制等七个方面都取得显著进展。 Gemini自曝...
-
华人团队用大模型实现“读心术”:大脑活动直接变文字 | NeurIPS 2023
NeurIPS收录的一项新研究,让大模型也学会“读心术”了! 通过学习脑电波数据,模型成功地把受试者的脑电图信号翻译成了文本。 而且整个过程不需要大型设备,只要一块特制的“头巾”就能实现。 这项成果名为DeWave,能在不通过侵入式设备和MRI的情况下解...
-
哀悼!55岁商汤科技创始人汤晓鸥突然离世,他撑起中国计算机视觉研究半壁江山
沉痛悼念! 2023年12月15日23时45分,商汤科技创始人汤晓鸥教授因病救治无效不幸离世,终年55岁。 天妒英才,继孙剑博士2年前意外辞世后,中国AI界再失一位领军人物。 计算机视觉的开拓者 毫不夸张地说,汤晓鸥教授是中国计算机视觉的开拓者和探路...
-
亚马逊云科技Amazon CodeWhisperer 极客之选!
使用了一段时间的Amazon CodeWhisperer,直接作为插件搭配VS Code,安装很方便。 在平常写代码的时候使用率很高,个人使用过最近的语言大模型,感觉这个CodeWhisperer像是专门是在代码数据上训练的模型,但是又不止是会写代码,还会...
-
AIGC系列之:CLIP和OpenCLIP
目录 模型背景 CLIP模型介绍 相关资料 原理和方法 Image Encoder Text Encoder 对比学习 预训练 Zero Shot预测 优势和劣势 总结 OpenClip模型介绍 相关资料 原理 结果 用法...
-
中国版的chatGPT“文心一言“到底怎样?
GPT4的提前发布,把压力着实给到百度了!在ChatGPT引爆聊天机器人领域后的数月,我们终于迎来了国内的第一款生成式对话产品。 3月16日14:00,百度文心一言新闻发布会于百度北京总部正式召开。百度创始人、董事长兼CEO李彦宏也实现了自己此前的诺言,...
-
谁能更好地检测深度伪造?人还是机器?
译者 | 陈峻 审校 | 重楼 不知您是否听说过深度伪造(Deepfakes)这种欺诈应用?由它产生的各种虚假信息已威胁到了人类社会的方方面面。随着人工智能技术的进步,我们亟待提升识别虚假内容的能力。那么在实际检测假新闻可信度等用例时,到底是人类还是机器...
-
人工智能改变牙科服务的六大趋势
难道已经有机器人牙医了吗?还没有……。但是,牙科诊所已经加快了将新兴技术融入常规诊疗的步伐。人工智能也不例外。事实上,人工智能正在显著改变牙科行业,牙科行业提供的一系列创新技术正在改善患者护理和提高诊断准确性及运营效率。我们已经看到了以下的六大趋势。...
-
好用到爆!10个你可能不知道的VSCode开源工具神器
作为一款广受欢迎的开源IDE,VSCode凭借其轻量级和高度可扩展的特性,成为了越来越多开发者的首选工具。但是,VSCode的强大功能并不仅限于其本身,是可以通过插件、主题和其他扩展来进一步扩展其功能。在本篇文章中,我将介绍10个原先你可能根本不知道的开源...
-
python训练ai作画的代码
你可以使用 Python 来训练一个 AI 来进行绘画。这里是一个基本的代码示例: ``` import tensorflow as tf 定义输入和输出的占位符 inputs = tf.placeholder(shape=...
-
《AI上字幕》基于openAI研发的whisper模型,语音(视频)一键转文本/字幕/带时间轴/支持多语言/自带翻译《桌面版教程》
简介: OpenAI的chatGPT非常火爆,其实OpenAI旗下的另一个模型实力也十分强大,它就是开源免费的Whisper语音转文本模型,目前为止它是较为顶尖的语音转文本模型 当前github上也有许多出色的开发者根据此模型开发出桌面版语音转文字...
-
【AIGC】ChatGPT联动脑机接口实验,用脑电波回邮件
文章目录 前言 正文 应用场景 总结 写在最后 前言 科幻小说和电影中经常出现的场景是人类与计算机之间通过脑机接口进行交互,这种技术一直被认为是未来的发展方向。 然而,近年来,随着人工智能技术的快速发展,我们似乎离这个科幻场景越...
-
微软小模型击败大模型:27亿参数,手机就能跑
上个月,微软 CEO 纳德拉在 Ignite 大会上宣布自研小尺寸模型 Phi-2 将完全开源,在常识推理、语言理解和逻辑推理方面的性能显著改进。 今天,微软公布了 Phi-2 模型的更多细节以及全新的提示技术 promptbase。这个仅 27 亿参...
-
随意指定CLIP关注区域!上交复旦等发布Alpha-CLIP:同时保持全图+局部检测能力
CLIP是目前最流行的视觉基座模型,其应用场景包括但不限于: 与LLM大语言模型结合成为视觉多模态大模型; 作为图像生成(Stable Diffusion 、点云生成(Point-E 的condition model,实现image-to-3D; 用于...
-
微软提出变色龙框架,让模型自带工具箱开挂,数学推理任务准确率98%
教大模型调用工具,已经是AI圈关注度最高的话题之一了。 这不,又有一项研究登上最新NeurIPS 2023—— 它是一个叫做Chameleon(变色龙)的框架,号称能将大语言模型直接变成魔法师的工具箱,来自微软与加州大学洛杉矶分校(UCLA)。 相比其它...
-
RayDF:实时渲染!基于射线的三维重建新方法
本文经自动驾驶之心公众号授权转载,转载请联系出处。 图片 论文链接:https://arxiv.org/pdf/2310.19629 代码链接:https://github.com/vLAR-group/RayDF 主页:https://vlar-gro...
-
用活人脑细胞构建AI系统,语音识别准确率提升至78%
近期一项前沿的类脑研究登上了Nature子刊,研究人员利用活人脑细胞构建了一个新型AI系统,这一突破意味着语音识别准确率有望大幅提升。这个系统可以进行无监督学习,并具有类似神经网络的功能。此外,研究人员还发现,系统的学习能力取决于脑类器官中神经细胞之间的连...
-
避免踩坑,教给你VSCode中最常用到的6项功能
这里为程序员介绍VSCode中包含的许多令人兴奋的Tips。 1. 插件市场中免费下载使用CodeGeeX插件 AI辅助编程工具CodeGeeX,是完全免费,开源开放给所有开发者使用。程序员普遍反应使用这个插件后,代码编写效率提升2倍以上。 Code...
-
CIO如何解决实施AI过程中面临的伦理问题
AI几乎满足了几乎每个行业组织的胃口。随着AI试点转向实际应用,关于道德AI必要性的讨论也在增加,同时也出现了“公平”、“隐私”、“透明”、“责任”和最大的术语——“偏见”。 随着AI成为人们工作和开展业务的不可或缺的一部分,确保这些措施和其他措施得到...
-
AI视野:Pika1.0首批用户资格揭晓;Runway官宣下场通用世界模型;妙鸭相机推出AI修图;抖音正式上线AI创作功能
???AI新鲜事 Pika1.0首批用户资格揭晓 Pika Labs最新视频生成产品Pika1.0引起轰动,已开始向候补名单用户发放使用资格。Pika1.0以文生成视频为特色,提供3秒视频快速生成、背景修改等功能。用户可在推特或邮箱确认是否成为首批体验者。...
-
用活人脑细胞造AI系统!语音识别已成功,可无监督学习
由真实人脑细胞构建的“迷你大脑”和微电极组成的AI系统,已经能够进行语音识别—— 从数百个声音片段中准确认出某个特定人的声音的那种。 最近,一项颇为前沿的类脑研究登上了Nature子刊。 这个特别的AI系统甚至可以进行无监督学习: 研究人员只是一遍遍...
-
UCLA推出Chameleon框架 大模型表格数学推理准确率达98.78%
在NeurIPS2023上,UCLA等机构发布的Chameleon框架吸引了广泛关注。该框架通过融合多种工具,包括LLMs、视觉模型、搜索引擎、Python功能及基于规则的模块,解决了大型语言模型在实时信息获取和数学推理方面的不足。 Chameleon的核...
-
表格数学推理准确率达98.78%!UCLA推出全新「变色龙推理框架」
在自然语言处理任务中取得显著成就的大型语言模型(LLMs)尽管表现出色,但在实时信息获取、外部工具利用和精确数学推理方面仍显不足。 为了应对这些挑战,来自UCLA等机构的研究人员打造了全新的Chameleon框架,其独特的即插即用模型融合了多种工具,包括...
-
中国版chatGPT【文心一言】
文心一言是一款基于人工智能技术的中文自然语言处理工具,它可以用于文本生成、情感分析、关键词提取等多种应用场景。相比于GPT等其他自然语言处理模型,文心一言有着更多的优势。 首先,文心一言具有更高的准确率和可靠性。它采用了最新的深度学习算法和大规模数据集...
-
Copilot 保姆级使用指南
大家好,我是木川 一、介绍 GitHub Copilot是 GitHub和OpenAI合作开发的一个 AI 辅助编程工具 官网地址:https://github.com/features/copilot 官方文档:https://do...
-
大模型就是「造梦机」,Karpathy一语惊人!人类才是「幻觉问题」根本原因
幻觉,早已成为LLM老生常谈的问题。 然而,OpenAI科学家Andrej Karpathy今早关于大模型幻觉的解释,观点惊人,掀起非常激烈的讨论。 在Karpathy看来: 另外,Karpathy的另一句话,更是被许多人奉为经典。他认为,与大模型相对的...
-
弥合化学反应预训练和条件分子生成之间的差距,北大&望石智慧提出「统一」模型
化学反应是药物设计和有机化学研究的基础。研究界越来越需要一种能够有效捕获化学反应基本规则的大规模深度学习框架。 近日,来自北京大学和望石智慧的研究团队提出了一种新方法来弥合基于反应的分子预训练和生成任务之间的差距。 受有机化学机制的启发,研究人员开发了一...
-
更强的Llama 2开源,可直接商用:一夜之间,大模型格局变了
已上微软 Azure,即将要上 AWS、Hugging Face。 一夜之间,大模型格局再次发生巨变。 一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题,一直不可免费商用。 今日,Meta 终于发布了大家期待...
-
高级勒索软件活动突出了对AI网络防御的需求
Deep Instinct的CIO Carl Froggett在访谈中谈到了2024年预算重点向勒索软件预防技术转变,他预计AI,特别是深度学习,将更多地融入业务流程,自动化工作流,并塑造工作场所体验。 勒索软件攻击的新趋势是什么,企业应该如何使用A...