当前位置:AIGC资讯 > AIGC > 正文

AI视野:百川发布Baichuan2-192K大模型;DALL·E3新增种子功能;ChatGPT Plus会员可上传和分析文件;谷歌Bard支持实时生成回复

????大模型动态

百川智能发布Baichuan2-192K大模型,可处理35万汉字

百川智能发布了Baichuan2-192K大模型,拥有全球最长的上下文窗口,处理约35万个汉字,超越了Claude2。

百川大模型官网:https://top.aibase.com/tool/baichuandamoxing

昆仑万维开源百亿级大语言模型「天工」Skywork-13B 系列

昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,提供超大规模中文数据集,包括两个模型,以支持大模型的商用应用和降低商业门槛。

???AI新鲜事

DALL·E3更新,新增种子功能允许用户精修生成图片

OpenAI悄悄更新了DALL·E3,增加了一种种子功能,允许用户精细编辑生成的图像,包括添加元素、改变视角和调整光线和颜色。

ChatGPT Plus会员可上传和分析文件,实现多模态支持

ChatGPT Plus会员在最新测试版中可上传和分析文件,不再需要手动切换模式,同时引入多模态支持,提供更多应用场景。

谷歌Bard升级,实时生成回复不用等待

谷歌的聊天机器人Bard升级,提供更快速的实时回复选项,改进了用户的互动体验,同时允许用户自定义回答风格。

英国皇家天文学家称外星生命可能是超级智能AI

英国的皇家天文学家警告,外星生命可能是高度智能的AI,而非有机生命,这与人工智能时代的来临有关。

谷歌向AI初创公司Anthropic投资20亿美元

谷歌投资20亿美元巩固在人工智能领域的地位,与Anthropic建立战略伙伴关系,加速AI创新,竞争激烈,亚马逊等巨头也重大投资。

???AI应用

图库巨头Getty Images拥抱AI技术 推出生成式AI服务

Getty Images采取双重策略,起诉侵权AI图像生成公司,并推出名为“Generative AI”的新服务,以为商业客户提供AI图像生成,避免知识产权风险。

3D产品预览应用React Native3d Store 线上购物更立体了

React Native3d Store是一款先进的React Native应用,通过沉浸式3D预览展示产品,提供互动购物体验,利用现代技术如three.js、react-three-fiber、expo-gl等,使用户能旋转、缩放和平移3D模型,提升在线购物的互动性。

项目地址:https://github.com/alexandrius/react-native_3d_store

GPT Pilot:AI驱动的开发工具,可从零开始编写可扩展的应用程序

GPT Pilot是一款AI驱动的工具,能从开发人员提供的应用描述中生成可扩展的应用程序代码,支持需求澄清、技术选择、任务拆解、代码实现以及持续审核与修复。

项目地址:https://github.com/Pythagora-io/gpt-pilot

?‍???聚焦开发者

首个人体动捕基模型SMPLer-X面世

SMPLer-X是首个人体动捕基模型,通过训练450万实例,实现了人体全身姿态与体型估计,同时能捕捉身体和面部动作,对数据缩放和模型缩放进行了探索,在学术数据集上表现出强大性能。

项目地址:https://caizhongang.github.io/projects/SMPLer-X/

苹果研究人员推出Ferret:多模态语言模型突破性进展

苹果与哥伦比亚大学的研究人员合作开发了Ferret多模态语言模型,解决了地理信息和语义知识融合问题,实现了引用和定位图像中元素的能力,性能优于传统模型。

Monarch Mixer(M2):比Transformer更低成本的模型架构

Monarch Mixer(M2)是一种新的模型架构,通过采用Monarch矩阵替代传统Transformer的注意力和MLP,实现更低成本取得更优的性能,挑战了传统Transformer的优越性。

论文地址:https://arxiv.org/abs/2310.12109

代码地址:https://github.com/HazyResearch/m2

多模态LLM幻觉问题降低30%!业内首个“啄木鸟”免重训方法诞生

中科大研究提出“啄木鸟”框架,可降低多模态大模型的“幻觉”问题,提高准确性,无需重训,为解决大模型问题提供了新方法。

项目地址:https://github.com/BradyFU/Woodpecker

更新时间 2023-10-30