AI视野：OpenAI成全球第三最有价值初创公司；SDXL推精简版本；小米14将搭载WPS AI功能；Bing AI拒绝生成女性逼真图像

???AI应用

SDXL推精简版本SSD-1B 推理速度提升60%

Segmind Stable Diffusion1B（SSD-1B）是一款高效、高速的文本生成图像AI模型，为图像生成提供广泛可能性，它是稳定扩散XL的精简版本，体积减小50%，但速度提升60%。

《福布斯》推出新型人工智能搜索工具Adelaide 测试版

福布斯杂志发布了Adelaide，一款人工智能搜索工具，可根据读者提出的问题生成相关文章和答案，提高用户参与度和搜索创新应用。

AudioSep:可以从音频剪辑中仅分离出特定的声音

AudioSep是一款创新的AI模型，能够通过自然语言查询，精确从音频中分离特定声音，提供训练和微调功能、内存效率以及强大的分离性能。

???AI新鲜事

OpenAI估值飙升，成为全球第三最有价值初创公司

OpenAI的估值预计将达到800亿美元，使其成为全球第三最有价值的初创公司，仅次于TikTok的字节跳动和Elon Musk的SpaceX。

Bing AI图片生成器拒绝生成女性的逼真图像，称其“不安全”

微软的Bing AI图片生成器在生成逼真男性图像方面表现出色，但拒绝生成逼真女性图像，声称这不符合其内容政策，引发了性别相关问题的讨论。

小米14手机深度合作金山办公，搭载WPS AI功能

小米14手机宣布与金山办公深度合作，推出搭载WPS AI功能的专属版WPS，旨在提供更智能的移动办公体验。

OpenAI成立准备组以评估和防范人工智能带来的灾难性风险

OpenAI成立名为「准备组」的团队，由麻省理工学院的亚历山大·马德里领导，旨在评估、检测并预防人工智能模型可能导致的「灾难性风险」。

英特尔数据中心和人工智能业务收入38亿美元

英特尔公司在第三季度实现142亿美元的营收，数据中心和人工智能业务收入为38亿美元，尽管同比下降，但超过了市场预期。

微软必应聊天将非Edge浏览器的文本输入量提升至4000个

微软最近扩大了非Edge浏览器用户在必应聊天中的文本输入量，从2000个提高到4000个，但每个主题对话仍限制在5轮内。这可能会给一些用户带来不便，但微软考虑根据反馈和市场需求进一步增加对话轮次的限制。需要注意的是，历史记录和个性化答案仍仅在Edge浏览器中可用。

联合国成立39人人工智能国际治理咨询团队

联合国秘书长安东尼奥·古特雷斯成立39人咨询顾问团队，以解决人工智能国际治理问题，包括技术公司高管、政府官员和学者，该团队将发布初步和最终建议，加强国际合作。

机器人替身!远程机器人VRoxy可在VR中模仿你的动作

康奈尔大学和布朗大学的研究人员开发了名为VRoxy的远程机器人系统，它能够实时响应虚拟现实中用户的动作和手势，允许用户在小空间中与远程团队协作。

论文网址:https://infosci.cornell.edu/~mose/papers/UIST2023_VRoxy.pdf

扎克伯格:到2024年AI将成为Meta最大的投资领域

Meta公司股价下跌3%后，扎克伯格强调到2024年AI将成为其最大投资领域，发布开源AI模型，并招聘员工以推动元宇宙发展。

????大模型动态

谷歌发布PaLI-3视觉语言模型，小体量达到SOTA!

谷歌最新发布的PaLI-3视觉语言模型以更小的体量和更快的推理速度，在多个任务中实现了SOTA性能，引起广泛关注，为视觉语言领域带来新的可能性。

论文地址:https://arxiv.org/pdf/2310.09199.pdf

【AiBase提要】

?‍???聚焦开发者

NYU重磅发现登Nature:AI神经网络具有类人泛化能力

研究人员通过Meta-Learning for Compositionality（MLC）方法，成功培养神经网络实现「举一反三」能力，甚至超越人类思维。

论文链接:https://www.nature.com/articles/s41586-023-06668-3#auth-Brenden_M_-Lake-Aff1

FreeU:无需额外训练或微调即可提高图像生成质量

一句话总结核心内容: FreeU是一种新的人工智能技术，使用概率扩散模型，能够提高生成模型的图像质量，无需额外的训练或微调，广泛应用于计算机视觉任务。