????大模型动态
百川智能发布Baichuan2-192K大模型,可处理35万汉字
百川智能发布了Baichuan2-192K大模型,拥有全球最长的上下文窗口,处理约35万个汉字,超越了Claude2。
百川大模型官网:https://top.aibase.com/tool/baichuandamoxing
昆仑万维开源百亿级大语言模型「天工」Skywork-13B 系列
昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,提供超大规模中文数据集,包括两个模型,以支持大模型的商用应用和降低商业门槛。
???AI新鲜事
DALL·E3更新,新增种子功能允许用户精修生成图片
OpenAI悄悄更新了DALL·E3,增加了一种种子功能,允许用户精细编辑生成的图像,包括添加元素、改变视角和调整光线和颜色。
ChatGPT Plus会员可上传和分析文件,实现多模态支持
ChatGPT Plus会员在最新测试版中可上传和分析文件,不再需要手动切换模式,同时引入多模态支持,提供更多应用场景。
谷歌Bard升级,实时生成回复不用等待
谷歌的聊天机器人Bard升级,提供更快速的实时回复选项,改进了用户的互动体验,同时允许用户自定义回答风格。
英国皇家天文学家称外星生命可能是超级智能AI
英国的皇家天文学家警告,外星生命可能是高度智能的AI,而非有机生命,这与人工智能时代的来临有关。
谷歌向AI初创公司Anthropic投资20亿美元
谷歌投资20亿美元巩固在人工智能领域的地位,与Anthropic建立战略伙伴关系,加速AI创新,竞争激烈,亚马逊等巨头也重大投资。
???AI应用
图库巨头Getty Images拥抱AI技术 推出生成式AI服务
Getty Images采取双重策略,起诉侵权AI图像生成公司,并推出名为“Generative AI”的新服务,以为商业客户提供AI图像生成,避免知识产权风险。
3D产品预览应用React Native3d Store 线上购物更立体了
React Native3d Store是一款先进的React Native应用,通过沉浸式3D预览展示产品,提供互动购物体验,利用现代技术如three.js、react-three-fiber、expo-gl等,使用户能旋转、缩放和平移3D模型,提升在线购物的互动性。
项目地址:https://github.com/alexandrius/react-native_3d_store
GPT Pilot:AI驱动的开发工具,可从零开始编写可扩展的应用程序
GPT Pilot是一款AI驱动的工具,能从开发人员提供的应用描述中生成可扩展的应用程序代码,支持需求澄清、技术选择、任务拆解、代码实现以及持续审核与修复。
项目地址:https://github.com/Pythagora-io/gpt-pilot
????聚焦开发者
首个人体动捕基模型SMPLer-X面世
SMPLer-X是首个人体动捕基模型,通过训练450万实例,实现了人体全身姿态与体型估计,同时能捕捉身体和面部动作,对数据缩放和模型缩放进行了探索,在学术数据集上表现出强大性能。
项目地址:https://caizhongang.github.io/projects/SMPLer-X/
苹果研究人员推出Ferret:多模态语言模型突破性进展
苹果与哥伦比亚大学的研究人员合作开发了Ferret多模态语言模型,解决了地理信息和语义知识融合问题,实现了引用和定位图像中元素的能力,性能优于传统模型。
Monarch Mixer(M2):比Transformer更低成本的模型架构
Monarch Mixer(M2)是一种新的模型架构,通过采用Monarch矩阵替代传统Transformer的注意力和MLP,实现更低成本取得更优的性能,挑战了传统Transformer的优越性。
论文地址:https://arxiv.org/abs/2310.12109
代码地址:https://github.com/HazyResearch/m2
多模态LLM幻觉问题降低30%!业内首个“啄木鸟”免重训方法诞生
中科大研究提出“啄木鸟”框架,可降低多模态大模型的“幻觉”问题,提高准确性,无需重训,为解决大模型问题提供了新方法。
项目地址:https://github.com/BradyFU/Woodpecker