当前位置:AIGC资讯 > AIGC > 正文

国内首个!端到端语音大模型心辰Lingo在外滩大会正式发布上线

9月5日,在外滩大会“大模型的创造力边界与应用想象力”论坛上,大模型创业企业西湖心辰正式发布并上线国内首个端到端语音大模型“心辰Lingo”。

“心辰Lingo”实现了端到端语音技术,在处理对话时直接理解语音,捕捉语气、节奏和情绪,并进行语音回复,减少了信息处理过程中的损失,让“机器”更懂人。作为国内首个端到端语音大模型,它开创了人机交互新方式。

(西湖心辰CEO发布国内首个端到端语音大模型心辰Lingo)

全球权威咨询机构IDC分析预测,到2030年,全球智能语音服务市场的价值将达到约731.6亿美元,年复合增长率预计将达27%。全球范围内的科技公司都敏锐地捕捉到了这一领域的增长潜力,纷纷投身智能语音技术的开发,一场全新的人机交互革命正在被点燃。

“心辰Lingo能捕捉到语音中的细微变化,不仅能理解你说了什么,还能理解更想表达什么,真正做到了为AI赋予‘高情商’,使其能够精准洞察言外之意。这也是西湖心辰作为持续深耕大模型情商能力又一个重要技术突破。”西湖心辰CEO醒辰在发布会现场表示。

据介绍,心辰Lingo语音大模型的能力在多个领域和中文上进行增强,使得心辰Lingo的中文语音效果,相较GPT4o更为出色。主要有三个技术特征。

一是原生的语音理解。作为端到端模型,心辰Lingo不仅能够识别语音中的文字信息,还能精确捕捉其他重要特征,如情感、语气、音调,甚至环境音,更全面地理解语音内容,从而提供更加自然和生动的交互体验。二是多种语音风格表达。心辰Lingo可以根据上下文和用户指令,自适应调整语音的速度、高低、噪声强度,并能够生成对话、歌唱、相声等多种风格的语音响应,有效提升了模型在不同应用场景下的灵活性和适应性。三是,语音模态超级压缩。心辰Lingo采用具有数百倍压缩率的语音编解码器,能够将语音压缩至极短的长度,在显著降低计算和存储成本的同时帮助模型生成高质量语音内容。

心辰Lingo开放内测预约不到10天,已经有超千家企业用户预约测试,包括了教育、金融、医疗健康、政府与公共服务、媒体与娱乐、零售与商业服务、制造与工程等八大行业,数十个实际使用场景。

市场层面对心辰Lingo的应用空间作出了积极反馈。在心理健康咨询场景下,某医院拟运用心辰Lingo的语音技术提供患者心理咨询和干预,通过AI智能对话系统,为患者提供情绪支持,帮助他们应对疾病带来的心理压力;在客户服务与支持场景下,某知名产险企业,希望利用心辰Lingo的语音技术进行客户服务和外呼,针对退保挽留和续保挽留等自动外呼场景,通过智能语音系统提高服务效率和客户满意度。此外,陪伴领域还涌现出一系列个性化需求,如游戏语音陪伴、社交辅助助手、语音母婴看护等,这些需求的多样性和创新性为心辰Lingo提供了广阔的应用前景。

发布现场,醒辰透露,西湖心辰即将在10月份发布基于心辰Lingo进行领域深度训练的儿童陪伴、心理疏导、销售服务3大垂类语音模型,与更多行业领袖携手,共同推动AI技术的创新和应用,开启智能服务的新篇章。

西湖心辰是一家致力于人工智能多模态大模型技术研究及产业化应用的创新企业,背靠中国新型研究性大学“西湖大学”。外滩大会期间,西湖心辰创始人蓝振忠还获得了首届蚂蚁InTech科技奖。目前,西湖心辰已获得汤姆猫、蓝驰创投、凯泰资本、百度风投、西湖科创投,西湖教育基金会可持续发展平台等知名机构数千万美金投资。

总结

**心辰Lingo:国内首个端到端语音大模型震撼发布**
9月5日,西湖心辰在外滩大会“大模型的创造力边界与应用想象力”论坛上隆重推出了国内首个端到端语音大模型——心辰Lingo,正式开启人机交互的新篇章。
**技术革新:端到端语音技术,赋予AI“高情商”**
心辰Lingo实现了端到端语音技术,能够直接理解和处理对话中的语音内容,精准捕捉语气、节奏和情绪,极大地减少了信息处理过程中的损耗,使“机器”更加贴近人性,理解人类言下之意。这一技术突破,不仅标志着国内首个端到端语音大模型的诞生,更为人机交互方式带来了革命性的创新。
**市场前景广阔:智能语音服务市场持续高涨**
随着全球智能语音服务市场的迅猛发展,预计未来几年内将呈现爆发式增长态势。IDC预测,到2030年,该市场价值将达到约731.6亿美元,年复合增长率高达27%。在此背景下,心辰Lingo的推出恰逢其时,其独特的技术优势和广泛的应用前景,正吸引着来自各行各业的关注和追捧。
**技术亮点:三大特征引领行业潮流**
1. **原生的语音理解**:心辰Lingo不仅能够识别语音中的文字信息,还能敏锐捕捉到情感、语气、音调等细微特征,提供更为全面和生动的交互体验。
2. **多种语音风格表达**:支持对话、歌唱、相声等多种语音风格的生成,大幅增加模型在不同应用场景下的灵活性和适用性。
3. **语音模态超级压缩**:采用高效编解码器,实现数百倍压缩比,有效降低计算和存储成本,同时保证语音内容的高质量输出。
**广泛应用:超千家企业用户预约测试**
自开放内测预约以来,心辰Lingo凭借其卓越的技术性能和广泛的应用潜力,迅速吸引了众多企业的关注。目前,已有超千家企业用户预约测试,覆盖教育、金融、医疗健康、政府与公共服务、媒体与娱乐、零售与商业服务、制造与工程等八大行业,以及数十个实际使用场景。
**未来展望:深化领域应用,推动AI创新**
西湖心辰计划在10月份基于心辰Lingo发布儿童陪伴、心理疏导、销售服务等三大垂类语音模型,与行业领袖携手共同推动AI技术的创新应用。通过不断探索和实践,心辰Lingo有望在未来为更多行业和用户带来智能化的语音服务体验,开启智能服务新篇章。
**企业背景雄厚:西湖大学支持,资本青睐**
西湖心辰作为一家依托西湖大学强大科研实力的创新企业,在人工智能多模态大模型技术领域展现出强大的研发能力和产业化应用前景。目前,公司已获得多家知名投资机构的数千万美金投资支持,包括汤姆猫、蓝驰创投、凯泰资本、百度风投等,为心辰Lingo的未来发展提供了坚实的资本保障和市场信心。

更新时间 2024-09-05