商汤科技发布日日新5.0大模型 全面对标GPT-4

2024-04-23 16:48:46 来源:上海证券报·中国证券网 作者:王凯丰 记者 罗茂林

  上证报中国证券网讯(王凯丰 记者 罗茂林)4月23日下午,在上海商汤临港AIDC举行的“2024年商汤技术交流日”活动现场,商汤科技宣布发布全新升级的日日新SenseNova5.0大模型——采用MOE混合专家架构,基于超过10TB tokens训练,推理上下文窗口200K,全面对标GPT-4 Turbo。

  “日日新5.0大模型体系综合能力全面对标GPT-4,技术领跑加速生成式AI向产业落地的全面跃迁,实现大模型按需所取。”商汤科技董事长兼首席执行官徐立介绍。

  据了解,商汤“日日新SenseNova”大模型体系提供自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及能力。同时,商汤自研了中文语言大模型应用平台,以及包括AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用,带来强大而易用的内容生成能力。