AI视野：百川发布Baichuan2-192K大模型；DALL·E3新增种子功能；ChatGPT Plus会员可上传和分析文件；谷歌Bard支持实时生成回复

????大模型动态

百川智能发布Baichuan2-192K大模型，可处理35万汉字

百川智能发布了Baichuan2-192K大模型，拥有全球最长的上下文窗口，处理约35万个汉字，超越了Claude2。

百川大模型官网:https://top.aibase.com/tool/baichuandamoxing

昆仑万维开源百亿级大语言模型「天工」Skywork-13B 系列

昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列，提供超大规模中文数据集，包括两个模型，以支持大模型的商用应用和降低商业门槛。

???AI新鲜事

DALL·E3更新，新增种子功能允许用户精修生成图片

OpenAI悄悄更新了DALL·E3，增加了一种种子功能，允许用户精细编辑生成的图像，包括添加元素、改变视角和调整光线和颜色。

ChatGPT Plus会员可上传和分析文件，实现多模态支持

ChatGPT Plus会员在最新测试版中可上传和分析文件，不再需要手动切换模式，同时引入多模态支持，提供更多应用场景。

谷歌Bard升级，实时生成回复不用等待

谷歌的聊天机器人Bard升级，提供更快速的实时回复选项，改进了用户的互动体验，同时允许用户自定义回答风格。

英国皇家天文学家称外星生命可能是超级智能AI

英国的皇家天文学家警告，外星生命可能是高度智能的AI，而非有机生命，这与人工智能时代的来临有关。

谷歌向AI初创公司Anthropic投资20亿美元

谷歌投资20亿美元巩固在人工智能领域的地位，与Anthropic建立战略伙伴关系，加速AI创新，竞争激烈，亚马逊等巨头也重大投资。

???AI应用

图库巨头Getty Images拥抱AI技术推出生成式AI服务

Getty Images采取双重策略，起诉侵权AI图像生成公司，并推出名为“Generative AI”的新服务，以为商业客户提供AI图像生成，避免知识产权风险。

3D产品预览应用React Native3d Store 线上购物更立体了

React Native3d Store是一款先进的React Native应用，通过沉浸式3D预览展示产品，提供互动购物体验，利用现代技术如three.js、react-three-fiber、expo-gl等，使用户能旋转、缩放和平移3D模型，提升在线购物的互动性。

项目地址:https://github.com/alexandrius/react-native_3d_store

GPT Pilot:AI驱动的开发工具，可从零开始编写可扩展的应用程序

GPT Pilot是一款AI驱动的工具，能从开发人员提供的应用描述中生成可扩展的应用程序代码，支持需求澄清、技术选择、任务拆解、代码实现以及持续审核与修复。

项目地址:https://github.com/Pythagora-io/gpt-pilot

?‍???聚焦开发者

首个人体动捕基模型SMPLer-X面世

SMPLer-X是首个人体动捕基模型，通过训练450万实例，实现了人体全身姿态与体型估计，同时能捕捉身体和面部动作，对数据缩放和模型缩放进行了探索，在学术数据集上表现出强大性能。

项目地址:https://caizhongang.github.io/projects/SMPLer-X/

苹果研究人员推出Ferret:多模态语言模型突破性进展

苹果与哥伦比亚大学的研究人员合作开发了Ferret多模态语言模型，解决了地理信息和语义知识融合问题，实现了引用和定位图像中元素的能力，性能优于传统模型。

Monarch Mixer（M2）:比Transformer更低成本的模型架构

Monarch Mixer（M2）是一种新的模型架构，通过采用Monarch矩阵替代传统Transformer的注意力和MLP，实现更低成本取得更优的性能，挑战了传统Transformer的优越性。

论文地址:https://arxiv.org/abs/2310.12109

代码地址:https://github.com/HazyResearch/m2

多模态LLM幻觉问题降低30%!业内首个“啄木鸟”免重训方法诞生

中科大研究提出“啄木鸟”框架，可降低多模态大模型的“幻觉”问题，提高准确性，无需重训，为解决大模型问题提供了新方法。

项目地址:https://github.com/BradyFU/Woodpecker