欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
????大模型动态
智谱AI发布大模型GLM-4
智谱AI发布GLM-4大模型,具有媲美GPT-4的中文能力,支持更长上下文、多模态能力,2024被称为AGI元年。
开源语音超分辨率AI模型Resemble Enhance 可有效去除噪音杂音
ResembleEnhance是一款令人印象深刻的语音处理技术,专为将嘈杂的音频转换为清晰有力的语音设计。
智源推3D模型GeoDream
近日,智源研究院联合清华和北邮团队推出text-to-3D生成模型GeoDream,能够将输入的文字描述转化为高质量和多视角一致性的3D资产。
元象开源大模型XVERSE-Long-256K
元象发布全球首个上下文窗口长度为256K的开源大模型XVERSE-Long-256K,支持输入25万汉字,无条件免费商用。
哈佛大学推文生图模型DreamDistribution
来自南加州大学、哈佛大学等机构的研究团队最近提出了一项创新性的生成模型方法,名为DreamDistribution。这一方法基于提示学习,能够通过仅有的几张参照图片学习文本提示分。
???AI应用
腾讯发布PhotoMaker,一张照片即可生成个性化人物形象
这种新型的技术利用多张照片作为身份ID,获取人物特征,然后创造出一个新的、个性化的人物图像,可根据文字描述制作照片、混合多个人的特征、改变年龄或性别、添加艺术风格以及将艺术品或旧照片中的人物带入现代。
国产编程神器Fitten Code来了 准确率更高
Fitten Code超越Copilot,速度更快、准确率更高,支持80多种编程语言。
???AI新鲜事
GPT Store现多款违规“女友”机器人
首席执行官萨姆·奥特曼最近在一次会议上表示,尽管GPT Store规定明文禁止,但新商店似乎正面临着内容管理问题。
阿里云:通义系列产品所有功能全部免费 收费充值都是山寨应用
阿里云表示,真正的通义千问APP中的“全民舞王”应用是免费的。阿里云呼吁大家下载正版通千问 APP,以保护自己的权益。
AI女友上架淘宝
和偶像进行视频通话曾经是一种遥不可及的奢望,但如今这已经变成了一项有明确价格标签的服务。虚拟陪伴服务在在线平台上逐渐成为受欢迎的业务。
B站UP主开了一家全员AI的炒股公司
B站UP主“林亦LYi”近期引起了广泛关注,因其创办了一家全员AI的炒股公司,为其团队提供一笔资金用于真实炒股实验。然而,没想到的是,才刚开始,这些AI员工就“造反”了。
Deepfake音视频检测技术亮相CES,准确率超90%
迈克菲推出的Deepfake音视频检测技术能准确识别AI伪造音视频,解决网络上音视频信息真假难辨的问题。
阿布扎比大学研究揭示:AI可逼真模仿人的手写风格
近日,阿布扎比的莫哈默德·本·扎耶德人工智能大学(MBZUAI)的研究人员表示,他们已成功开发出一项技术,仅凭几段文字即可模仿某人的手写风格。
马斯克展示机器人“擎天柱”叠衣服
近日,特斯拉CEO埃隆·马斯克发布了一段特斯拉“擎天柱(Optimus)”人形机器人自己叠衬衫的视频,引发网友热议。
????聚焦开发者
华为开源GenImage数据集 轻松识别Midjourney等AI生成图片
华为诺亚方舟实验室开源了百万量级的GenImage数据集,帮助企业、开发者快速构建区分AI生成的图像和真实图像的检测器和评估工具,致力于构建AIGC时代的ImageNet。
Anim400K:一个针对视频自动配音设计的数据集
Anim400K数据集包含超过425,000个对齐音视频剪辑,支持多种视频相关任务,如同步翻译、引导式视频概括和类型/主题/风格分类。
开源项目Open Interpreter:让AI在操作系统中自我复制
近日,一篇关于AI在操作系统中复制自己的文章引起了广泛关注。通过开源项目Open Interpreter,AI实现了在操作系统级别启动自身副本的雏形。
Portkey AI Gateway:一个连接多种人工智能模型的开源工具
Portkey AI Gateway是一个连接多种人工智能模型的开源工具,允许开发者通过简单的API接口访问超过100种不同的大语言模型,包括OpenAI、Anthropic、Mistral、LLama2等。