科大讯飞近日宣布对开源深度学习框架PyTorch进行重大更新,推出稳定版并集成多模态处理能力赋能开发者,轻松实现模型云端部署。新版本还强化代码生成与优化机制,显著提升模型预测效率。此外,命名张量功能得到优化,前端开发者得以享受更简洁的代码编写体验,通过内联注解清晰阐述逻辑,促进AI项目的高效开发与维护。

比如讯飞星火可以根据用户的语言描述,结合空间和常识推断描述对象所在的位置,这些能力的进步对于未来的机器人等具身智能产品都有意义。

在图文识别上,讯飞星火大模型V4.0的能力也进一步升级,在科研、金融、医疗、司法、办公等场景的应用效果已领先GPT-4o。

从国内外12项大模型主流测试集的结果来看,讯飞星火在8个测试集中排名第一,在七大核心能力上全面超越了GPT-4 Turbo。

自去年9月全面开放以来,讯飞星火APP在安卓公开市场累计下载量达1.31亿次。科大讯飞方面公布的数据显示,今年618期间星火大模型加持的智能硬件销量同比增长超70%,月均使用次数超4000万。

面向未来的人工智能新生态,科大讯飞董事长刘庆峰强调要关注源头技术生态、智能体生态、应用生态和行业生态,实现自主可控和软硬一体,才能实现大模型的深度落地。

基于讯飞星火大模型V4.0的能力,科大讯飞同时发布并升级了多款应用。

在个人领域,科大讯飞推出了“个人空间”。用户可以上传自己的工作、学习、生活、健康等各类资料,形成每个人的专属知识库,再结合人设,让大模型生成更个性化内容。

在教育领域,科大讯飞发布了首款星火智能批阅机。这款机器集智能批改、精准学情、个性学习于一体,在支持多学科多题型智能批改的同时,还能即时生成多维学情报告,为老师作业讲评和面批辅导提供了素材。

科大讯飞研究院院长刘聪现场演示了星火智能批阅机批改作业的全流程,15份学生作业半分钟就能批改完成,批改模拟了真人笔迹,和老师平时批改作业几乎一样。

通过自动化识别,星火智能批阅机试题解析的准确率大于99%,学生可以随便涂抹,自由排版不限格式。原先要90分钟才能批改完的作业,现在只要5分钟就能完成,学生的错题解决率也从50%提升到73%。

面向万物互联时代,星火语音大模型发布国际领先的多语种多方言免切换语音识别技术,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAI whisper-V3,37个方言识别效果平均提升30%。现场,科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果,输入效率大大提高。

基于星火V4.0强大的多语种支持能力,科大讯飞发布软硬件一体化讯飞同传系统,可支持大会同传、会议同传、展厅同传、旅游同传等多场景使用。针对强干扰场景下的语音识别难题,科大讯飞突破了多人混叠场景下的极复杂场景语音转写的困难,即使在三人混叠说话场景也能实现86%的语音识别准确率。未来基于多模态的声音识别技术,将应用在讯飞听见智慧办公、智慧屏等会议办公产品中。

同时赋能行业,发布星火企业智能体平台。围绕搭建智能体的三大关键能力,当前企业智能体平台已覆盖400+AI原子能力,集成90+外部信源,打通100+内部IT系统,可供企业结合业务场景快速构建可落地的智能体应用。平台围绕生产域、科创域、办公域、管理域上线32个企业智能体,供企业即插即用。

讯飞星火大模型带来行业赋能的同时,也在助力开发者生态蓬勃发展。自今年1月30日讯飞星火V3.5发布以来,短短5个月,星火开发者生态加速增长,开发者数从598万增长到702万,新增超104万;海外开发者数超40万;大模型开发者达57万。越来越多开发者正加入星火生态,释放更多刚需场景的应用价值。

星火致力于构建开放协作的生态环境,这是数字产业化转型的必由之路。携手客户与伙伴,在行业应用、平台体系及基础设施三大层面共筑星火生态,汇聚百万生态伙伴与广泛用户。唯有如此,方能加速释放数字化潜能,共创未来新篇章。


推荐内容