???AI应用
ElevenLabs发布“语音转语音”
ElevenLabs的语音生成式AI平台发布了“语音转语音”功能,用户可上传语音并自动转换为不同音色,实现声音的自由切换,为用户带来全新的语音生成体验。
免费体验地址:https://elevenlabs.io/voice-changer
WhatsApp 的人工智能助手向部分 iOS 用户开放
Meta旗下的WhatsApp在最新的iOS测试版中引入了人工智能助手,用户可通过快捷方式在聊天中进行自然对话,获取实时信息和自动建议。
视频生成新突破!PixelDance还可以做复杂动作和特殊效果
近期,视频生成技术PixelDance引起广泛关注,相较于其他模型,它在生成高度一致性和丰富动态性的视频方面取得显著进展,采用文本和图片指导方法,令模型更专注学习视频动态信息。
体验地址:https://top.aibase.com/tool/make-pixels-dance
???AI新鲜事
realme GT5Pro 将于12月7日发布
真我(realme)宣布将于12月7日发布GT5Pro旗舰新品,搭载第三代骁龙8,CPU性能提升30%、GPU提升25%。配备IMX890超光影潜望长焦、全球首发京东方定制旗舰屏,1.5K分辨率,峰值亮度超过3000nit。
200K上下文的Claude2.1被指严重虚标
大神Greg Kamradt对Anthropic最新更新的Claude2.1进行实测,发现在上下文长度达到90K后,性能急剧下降,引发了对其「虚标」的争议。
西班牙AI模特月入1万欧元
西班牙设计机构推出的AI模特Aitana在Instagram上迅速走红,每月通过代言赚取高达1万欧元,引发了对AI生成模特伦理和美丽标准的担忧。
Google Assistant 即将集成 Bard AI
Google计划在移动设备的Assistant中集成名为“Classic Assistant”的AI功能,用户可以选择使用集成了Bard的AI增强版本或经典版本。
研究人员开发自动识别古代楔形文字片的AI软件
新型人工智能软件利用楔形文字片的3D模型,比以往的照片方法更可靠地解读古代楔形文字,为研究提供了新的途径。
牛津大学警告:大语言模型对科学真相构成风险
牛津大学AI研究员在最新研究中指出,大型语言模型(LLMs)可能对科学完整性构成威胁,呼吁改变使用方式以确保准确性。
????大模型动态
日本电信巨头NTT将推商用AI模型tsuzumi
日本电信巨头NTT计划在三月推出商业用途的生成式人工智能平台,新模型名为“tsuzumi”,日语处理能力据称超越了ChatGPT。该模型以日本传统手鼓命名,可阅读包含图表和图解的文档,目标是到2027年实现年销售额超过1000亿日元。
????聚焦开发者
清华大学提出全新加速训练大模型方法SoT
微软研究和清华大学合作提出了名为“Skeleton-of-Thought”的全新人工智能方法,通过不对大型语言模型进行复杂修改,而是优化输出内容的组织结构,成功提高了生成速度,为解决处理速度较慢的问题提供了前景性解决方案。
项目地址:https://github.com/imagination-research/sot/
英伟达提出新技术Tied-LoRA 减少模型训练参数
英伟达研究人员提出的Tied-LoRA技术通过权重绑定和选择性训练,有效改善低秩适应方法,在保持性能的同时减少了13%的可训练参数。
论文地址:https://arxiv.org/pdf/2311.09578.pdf
Meta引入全新注意力机制Sytem2Attention
Meta的最新研究引入了名为System2Attention的全新注意力机制,旨在提高大型语言模型的推理能力,通过调整注意力解决传统Transformer架构在处理复杂任务时可能出现的问题。
论文地址:https://arxiv.org/pdf/2311.11829.pdf
低位量化技术Atom 提高LLM服务吞吐量
研究引入了Atom,一种低比特量化技术,通过细粒度和混合精度量化提高大型语言模型服务吞吐量,最多可达7.73倍,同时保持准确性。
Windmill:快速自托管的开源工作流引擎 比Airflow快10倍!
Windmill是一款经过基准测试证明速度超越Airflow、Prefect、Temporal的自托管工作流引擎,最高性能提升可达10倍,得益于简单设计、系统架构和对Postgresql、Rust的充分利用。
项目地址:https://github.com/windmill-labs/windmill