-
AIGC:使用生成对抗网络GAN实现MINST手写数字图像生成
1 生成对抗网络 生成对抗网络(Generative Adversarial Networks, GAN)是一种非常经典的生成式模型,它受到双人零和博弈的启发,让两个神经网络在相互博弈中进行学习,开创了生成式模型的新范式。从 2017 年以后,GAN相...
-
ConvNet与Transformer谁更强?Meta评测4个领先视觉模型,LeCun转赞
如何根据特定需求选择视觉模型? ConvNet/ViT、supervised/CLIP模型,在ImageNet之外的指标上如何相互比较? 来自MABZUAI和Meta的研究人员发表的最新研究,在「非标准」指标上全面比较了常见的视觉模型。 论文地址:ht...
-
一文读懂大型语言模型参数高效微调:Prefix Tuning与LLaMA-Adapter
芝士AI吃鱼 在快速发展的人工智能领域中,高效、有效地使用大型语言模型变得日益重要,参数高效微调是这一追求的前沿技术,它允许研究人员和实践者在最小化计算和资源占用的同时,重复使用预训练模型。这还使我们能够在更广泛的硬件范围内训练...
-
如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!
目录 一.前言 二.本机环境 三.安装步骤: 步骤1:下载Git并添加环境变量 步骤2:下载ffmpeg并添加环境变量 步骤3:安装pytorch 步骤4:安装whisper 四.whisper的应用 应用1:识别mp3歌曲中的歌词 应用...
-
七个值得关注的优秀大语言模型(LLM)
在LLM领域我们了解最多的很可能是OpenAI的ChatGPT,以及最近在多模态表现非常出色的Google Gemini,这些都是AI大模型的领头羊,代表着AI大模型发展的先进成果。然而,在大模型的实际应用中必须要综合考虑成本、信息安全等内容,因此,开源...
-
书生·浦语2.0体验入口 AI聊天InternLM2模型在线使用地址
「InternLM2」书生·浦语2.0是一款面向中文和英文的大型多语言预训练语言模型,标志着自然语言处理技术的新时代。它不仅在语言理解和生成方面有着出色的表现,还能够进行多模式推理和代码理解。这种基于Transformer架构的模型通过海量数据的预训练,在...
-
200亿「书生·浦语2.0」正式开源!数推性能比肩ChatGPT,200K超长上下文完美召回
就在今天,上海人工智能实验室与商汤科技联合香港中文大学和复旦大学,正式发布新一代大语言模型书⽣·浦语2.0(InternLM2)。 Github:https://github.com/InternLM/InternLM HuggingFace:https...
-
Checker AI官网体验入口 AI作业论文检测工具免费使用地址
Checker AI是EduLink AI家族的核心成员,旨在通过AI创新提升教育水平。Checker AI专注于维护学术诚信,可以验证学生作业的真实性,准确率高达99.7%。欲了解更多,可参阅我们的白皮书,了解我们是如何改变教育格局的。我们欢迎各教育机构...
-
使用 DPO 微调 Llama 2
简介 基于人类反馈的强化学习 (Reinforcement Learning from Human Feedback,RLHF 事实上已成为 GPT-4 或 Claude 等 LLM 训练的最后一步,它可以确保语言模型的输出符合人类在闲聊或安全...
-
【AIGC】医疗界的革命者,颠覆你的健康认知!
AIGC数字化和技术革新全新时代 在当今数字化和技术革新的时代,人工智能和机器学习正在改变我们的生活方式和健康状况。这些技术不仅在改善医疗保健的效率和质量方面发挥着越来越重要的作用,而且正在成为医学界的一种重要工具,帮助医生和研究人员更好地了解和...
-
AI视野:智谱AI发布大模型GLM-4;腾讯发布PhotoMaker;GPT Store现多款违规AI女友;Deepfake音视频检测技术亮相CES
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ????大模型动态 智谱AI发布大...
-
检测文本是否由AI生成,GPT、文心一言等均能被检测
背景 目前很多机构推出了ChatGPT等AI文本检测工具,但是准确率主打一个模棱两可,基本和抛硬币没啥区别。 先说结论,我们对比了常见的几款AI检测工具,copyleaks检测相比较而言最准确。 检测文本 AI文本片段1 来源:GPT3.5 提...
-
全新免费编程神器!比Copilot快两倍,准确率高20% | 非十科技发布
一款国产编程神器,秒杀了微软GitHub Copilot。 有多快? 比GitHub Copilot快两倍的同时,准确度还提高了约20%。 不仅如此,在做到“快”、“准”的情况下,功能上也是比较全面,包括: 代码自动补全、自然语言生成代码、自动添加注释、...
-
WAIC2023| AIGC究竟在向善还是向恶而行?
目录 一、常见图像篡改技术 二、传统篡改图像检测方法 2.1、基于光源和噪声的拼接图像篡改检测方法 2.2、基于马尔科夫特征的检测方法 三、基于深度学习的图像篡改检测方法 3.1、基于Fisher编码和SVM模型的方法 3.2、 基于...
-
Speaking AI体验入口地址 AI语音生成软件推荐
Speaking AI 是一个语音合成工具。它使用了最新的人工智能技术,可以生成高质量的语音。Speaking AI的体验下载入口在哪呢,这里我们来看下Speaking AI的官方体验入口。 >>>点击前往 Speaking AI 官方...
-
AI视野:阿里推ReplaceAnything框架;OpenAI取消军用禁令;Pika推视频画面扩充功能;SD推图生视频插件I2V-Adapter
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ????聚焦开发者 阿里推Rep...
-
AI研究称人类指纹并非独一无二
近期一项研究表明,人类指纹可能并非如传统法医学所认为的那样独一无二。该研究使用了一种常用于面部识别的AI模型,通过对超过60,000个指纹的训练,发现了被忽视的相似性。这一研究结果发表在《Science Advances》杂志上,引起了对法庭科学长期支柱的...
-
【网安AIGC专题10.11】论文1:生成式模型GPT\CodeX填充式模型CodeT5\INCODER+大模型自动程序修复(生成整个修复函数、修复代码填充、单行代码生产、生成的修复代码排序和过滤)
论文1:Automated Program Repair in the Era of Large Pre-trained Language Models 写在最前面 论文总结 背景知识介绍 语言模型 双向语言模型 单向语言模型 自动程序修复(...
-
AI看图猜位置,准确率超90%!斯坦福最新PIGEON模型:40%预测误差不到25公里
随手在网络上发布的一张照片,能暴露多少信息? 外国的一位博主@rainbolt就长年接受这种「照片游戏」的挑战,网友提供照片,他来猜测照片的具体拍摄地,有些照片甚至还能猜到具体的航班细节。 是不是细思极恐? 但「照片挑战」也同样抚慰了很多人心中的遗憾,...
-
一文读懂 LLM 可观测性
Hello folks,我是 Luga,今天我们继续来聊一下人工智能(AI 生态领域相关的技术 - LLM (大型语言模型 可观测性 ,本文将继续聚焦在针对 LLM 的可观测性进行解析,使得大家能够了解 LLM 的可观测性的必要性以及其核心的生态体系知...
-
谷歌AI通过图灵测试,大模型医生来了?GPT-4竟诊断出难倒17个医生的怪病
【新智元导读】AI在医疗领域再次发光!谷歌DeepMind团队发布的全新诊断对话式AI在测试中击败医生,通过了图灵测试,再次引领医疗AI的革命。 我们需要研发对人类有益AGI的原因之一: OpenAI联创Greg Brockman的一番话点明,当前先进A...
-
新研究:医用AI评估精神分裂新患者治疗效果近乎盲猜
1月12日消息,一项最新研究发现,用于协助医生治疗精神分裂症患者的计算机算法不能很好适应之前开发过程中未见过的新鲜数据。因此这种医用人工智能在评估未曾接触过的患者的治疗效果时,表现十分糟糕。 这些医用工具利用人工智能来发现大数据集中的特征,并预测个体对...
-
CES2024年AI智能家居亮点产品
自ChatGPT将人工智能变成热议话题以来,已经过去了一年多,而今年的消费电子展(Consumer Electronics Show 确实见证了人工智能的回归。 具体来说,在拉斯维加斯举行的国际消费电子展(CES 上,从喂鸟器到户外烤架,大量支持人工...
-
谷歌MIT最新研究证明:高质量数据获取不难,大模型就是归途
获取高质量数据,已经成为当前大模型训练的一大瓶颈。 前几天,OpenAI被《纽约时报》起诉,并要求索赔数十亿美元。诉状中,列举了GPT-4抄袭的多项罪证。 甚至,《纽约时报》还呼吁摧毁几乎所有的GPT等大模型。 一直以来,AI界多位大佬认为「合成数据」...
-
快GPT-4 10倍!这款卖疯的AI Agent产品,撼动大模型!
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 现在的大型语言模型(LLM)就像牙膏一样鸡贼,你必须非常用力地挤压(正确地提示)才能得到适量的牙膏(答案)。 就像奥特曼形容现在的GPT4一样:“如果你问 GPT-4 大部分...
-
Whisper OpenAI开源语音识别模型
介绍 Whisper 是一个自动语音识别(ASR,Automatic Speech Recognition)系统,OpenAI 通过从网络上收集了 68 万小时的多语言(98 种语言)和多任务(multitask)监督数据对 Whisper 进行了训练...
-
McAfee发布“Mockingbird”计划以阻止AI语音仿冒骗局
McAfee最近推出了名为“Mockingbird”的项目,旨在应对使用人工智能生成的深度伪造技术进行音频欺诈的问题。该计划采用了McAfee的AI深度伪造音频检测技术,被命名为“Mockingbird”。 该技术是McAfee在2024年CES(消费电子...
-
AI解读视频张口就来?这种「幻觉」难题Vista-LLaMA给解决了
近年来,大型语言模型如 GPT、GLM 和 LLaMA 等在自然语言处理领域取得了显著进展,基于深度学习技术能够理解和生成复杂的文本内容。然而,将这些能力扩展到视频内容理解领域则是一个全新的挑战 —— 视频不仅包含丰富多变的视觉信息,还涉及时间序列的动态...
-
FamousFace免费体验入口地址 AI换脸软件推荐
FamousFace是一款人工智能软件,能够识别和感知人脸,并提供相关信息。FamousFace的体验入口在哪呢,这里我们来看下FamousFace的官方体验入口。 >>>点击前往 FamousFace 官方体验入口<<&l...
-
轻量级模型,重量级性能,TinyLlama、LiteLlama小模型火起来了
当大家都在研究大模型(LLM)参数规模达到百亿甚至千亿级别的同时,小巧且兼具高性能的小模型开始受到研究者的关注。 小模型在边缘设备上有着广泛的应用,如智能手机、物联网设备和嵌入式系统,这些边缘设备通常具有有限的计算能力和存储空间,它们无法有效地运行大型语...
-
构建优秀LLM应用的四大要点,你找到哪点?
这些建议可提高LLM应用的准确率,还包含如何选择合适LLM的注意事项。 译自4 Key Tips for Building Better LLM-Powered Apps,作者 Adrien Treuille 是 Snowflake 的产品管理总监和 S...
-
AIGC之GPT-4:GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议)、使用方法、案例应用(计算能力/代码能力/看图能力等)之详细攻略
AIGC之GPT-4:GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议 、使用方法、案例应用(计算能力/代码能力/看图能力等 之详细攻略 解读:在2022年11月横空出世的ChatGPT,打遍天下无敌手的时候,就知道会有这么一天,...
-
基于Stable Diffusion的AIGC服饰穿搭实践
本文主要介绍了基于Stable Diffusion技术的虚拟穿搭试衣的研究探索工作。文章展示了使用LoRA、ControlNet、Inpainting、SAM等工具的方法和处理流程,并陈述了部分目前的实践结果。通过阅读这篇文章,读者可以了...
-
研究称:ChatGPT临床决策中取得显著成绩,准确率高达71.7%
美国最大非营利医疗机构之一,麻省布里格姆医院,近日发布了一份关于ChatGPT在临床医疗决策中应用的研究论文。该研究显示,ChatGPT在整个临床决策中的准确率达到了惊人的71.7%。 研究人员通过细致的评估,涵盖了从提出诊断、推荐诊断检查到最终诊断和护理...
-
OpenAI又一神器!Whisper 语音转文字手把手教程
语音转文字在许多不同领域都有着广泛的应用。以下是一些例子: 1.字幕制作:语音转文字可以帮助视频制作者快速制作字幕,这在影视行业和网络视频领域非常重要。通过使用语音转文字工具,字幕制作者可以更快地生成字幕,从而缩短制作时间,节省人工成本,并提高制...
-
首创pix2emb范式!NUS清华联合发布NExT-Chat:对话/检测/分割全能多模态大模型
随着ChatGPT的爆红,多模态领域也涌现出一大批可以处理多种模态输入的对话模型,如LLaVA, BLIP-2等等。 为了进一步扩展多模态大模型的区域理解能力,近期新加坡国立大学NExT++实验室和清华大学的研究人员联手打造了一个可以同时进行对话和检测、...
-
模型A:幸亏有你,我才不得0分,模型B:俺也一样
琳琅满目的乐高积木,通过一块又一块的叠加,可以创造出各种栩栩如生的人物、景观等,不同的乐高作品相互组合,又能为爱好者带来新的创意。 我们把思路打开一点,在大模型(LLM)爆发的当下,我们能不能像拼积木一样,把不同的模型搭建起来,而不会影响原来模型的功能,...
-
大翻车!斯坦福超火机器人自曝内幕,研究者救场还受伤了,网友:放心了
爆火的斯坦福全能家务机器人Mobile ALOHA,大!翻!!车!!! 你以为它擦个红酒轻而易举,但实际上却是这样的: 全给你弄撒喽,顺带碎个杯子 …… 你以为它能化身大厨娴熟烹炒,结果给你上演一个炒锅底: Mobile ALOHA的翻车大合集还不止...
-
谷歌研究团队推新AI方法SynCLR:从合成图像和字幕中学习视觉表征
近期,Google Research和MIT CSAIL共同推出了一项名为SynCLR的新型人工智能方法,该方法旨在通过使用合成图像和字幕,实现对视觉表征的学习,摆脱对真实数据的依赖。 SynCLR的工作原理 研究团队首先提出了一个三阶段的方法。首先,在...
-
2023-12-27 语音转文字的whisper应用部署
点击 <C 语言编程核心突破> 快速C语言入门 语音转文字的whisper应用部署 前言 一、部署`whisper` 二、部署`whisper.cpp` 总结 前言 要解决问题: 需要一款开源的语音转文字...
-
谷歌家务机器人单挑斯坦福炒虾机器人!端茶倒水逗猫,连甩三连弹开打
火爆全网的斯坦福炒虾机器人,一天之内人气暴涨。 毕竟这样能炒菜能洗碗的全能机器人,谁不想带一个回家,把自己从家务中解放出来呢! 据说,这个项目是斯坦福华人团队花了三个月的时间做出来的。 今天,团队直接放出了更多细节。 这个机器人的技能多种多样,令人眼...
-
谷歌DeepMind机器人成果三连发!两大能力全提升,数据收集系统可同时管理20个机器人
几乎是和斯坦福“炒虾洗碗”机器人同一时间,谷歌DeepMind也发布了最新具身智能成果。 并且是三连发: 先是一个主打提高决策速度的新模型,让机器人的操作速度(相比原来的Robotics Transformer)提高了14%——快的同时,质量也没有下滑...
-
用 ChatGPT 诊断儿科疾病?新研究泼冷水:准确率仅 17%
1 月 4 日消息,纽约科恩儿童医学中心的三位儿科医生最近对大型语言模型 ChatGPT 的儿科疾病诊断能力进行了评估,结果令人失望。他们让 ChatGPT 诊断了 100 个随机的儿科病例,结果发现其准确率仅有 17%。IT之家注意到,这项研究发...
-
突破Pytorch核心点,优化器 !!
嗨,我是小壮! 今儿咱们聊聊Pytorch中的优化器。 优化器在深度学习中的选择直接影响模型的训练效果和速度。不同的优化器适用于不同的问题,其性能的差异可能导致模型更快、更稳定地收敛,或者在某些任务上表现更好。 因此,选择合适的优化器是深度学习模型调优中...
-
AI视野:通义千问上线通义舞王;斯坦福炒虾机器人爆火;Midjourney艺术家数据库泄露;Meta发布AI调试工具HawkEye;小冰大模型获备案
新鲜AI产品点击了解:https://top.aibase.com/ ???AI应用 通义千问上线通义舞王 阿里云通义千问APP近日上线了一项名为“通义舞王”的免费功能,用户只需在APP内输入相应口令并上传照片,系统即可生成个性化的舞蹈视频。 Meta发...
-
ChatGPT在儿科疾病诊断中错误率高达83%
发表在《美国医学会儿科杂志》上的一项研究表明,ChatGPT-4在儿科医学病例的诊断方面的准确率仅为17%,较去年一般医学病例的39%更低。 这一低成功率显示出人类儿科医生在短时间内不太可能失业的现实,研究强调了临床经验在医学领域的不可替代性。研究人员指出...
-
探索Whisper语音识别
问题一:python多版本切换 背景:有了anaconda环境 还有一个c盘的不知道什么东西 我准备下载一个python3.9.9 去官网 然后安装,安装之前一定要把原来的python卸载干净。 3.9.9安装不上,我用3.10...
-
突破Pytorch核心点,CNN !!!
哈喽,我是小壮! 创建卷积神经网络(CNN),很多初学者不太熟悉,今儿咱们来大概说说,给一个完整的案例进行说明。 CNN 用于图像分类、目标检测、图像生成等任务。它的关键思想是通过卷积层和池化层来自动提取图像的特征,并通过全连接层进行分类。 原理 1.卷...
-
智能编程助手!华为云CodeArts Snap免费公测:基于盘古研发大模型
快科技1月3日消息,据华为云”公众号介绍,近日,华为云CodeArts Snap正式开启公测。 这是一款基于华为云研发大模型的智能化编程助手,旨在为开发者提供高效且智能的编程体验,提升研发人员的单兵作战能力。 该服务公测期间免费,不向用户收取任何费用,商用...
-
最强开源大模型?Llama 2论文解读
标题 简介 模型预训练 预训练设置 硬件资源与碳排放 模型评估 模型微调 有监督微调 基于人工反馈的强化学习(RLHF) 人类偏好数据的收集 奖励模型 迭代微调过程 多轮对话控制 RLHF 结果 模型回答的安全性 一直...