实时
躬行求知诸暨振兴,守护乡村幸福“食”光 两部门紧急预拨5.4亿元支持湖南等省份做好抢险救灾工作 国家外汇局新开通部分行政许可网上办理功能 内地对港供电保障能力持续提升 节气播报:夏至 节气播报:小暑 新瑞鹏集团“爱猫项目组”成功举办猫宠主沙龙:为南京“猫宠主们” 【京津冀协同发展】津承协同发展促就业,人才共育共享迎新篇 国际癫痫关爱日——汇承脑科在行动 高骼乳业5周年丨行业大咖现身说法 儿童粉市场潜力巨大 暑期档开场!这份爱奇艺儿童、动漫、纪录片超豪华片单“硬控”你 FlyDeliver(FD配送):以创新引领全球即时配送新篇章 江西农业大学竹林研究团队赴瑞昌市嵋荣村开展创新施肥实验与野外 陵水影黎万像数字传媒产业有限公司第二部出品短剧开机 “韶山红·长征”,传承红色精神 赛德房车:坚决捍卫自主知识产权 收获成长 乐迎未来 廖家中学2023——2024学年度下期散学典礼 德琪医药希维奥®新适应症在华获批上市,为中国DLBCL患者带来新选 FlyDeliver(FD配送)品牌副总裁刘品恒受邀出席2024中国企业家峰会 追光逐梦 点亮未来 金堂奖奢居里携手意大利瑞加涂料,引领中国建博会新航向 2024中国家居荣耀红榜|东鹏整装卫浴荣获“智能卫浴智享空间先锋品 重磅荣誉|东鹏斩获2024中国家居荣耀红榜两项大奖 蒙城县三义路中学召开优秀学生座谈会 助力学生梦想启航 蒙城县三义路中学举行散学典礼 共迎暑假新起点 “光影颂华章·同心庆华诞”江西省庆祝中华人民共和国成立75周年 《诗画中国》着墨丹青山河,追觅诗情画意 宿迁市卫健委党委书记、主任张岩一行莅临泗阳康达医院调研指导 倒计时20天|东鹏瓷砖,为奥运喝彩 邛崃:“一桶好酒,等你好久”邛酒促销 活动即将闪亮登场 “救”得安心,“助”得贴心 湘潭医疗救助惠民生 湘潭市益智中学隆重召开第一届第三次教代会 筑牢师德 依法执教 湘潭市益智中学召开2024年春季学期期末教职工大会暨暑假安全工作 再创生命奇迹,湘潭760克早产儿顺利出院了! 中阿经贸投资(大湾区)交流活动举办 蔡冠深:推动更多港企参与中阿经 创意大咖与盛夏清凉碰撞 深圳首家肯悦咖啡落地光明 彭州市北君平中学党支部表彰大会暨在党50年纪念章颁发仪式 生态创新,智在必行——“智旋绿筑”为可持续发展贡献青春力量 樊登阳城行:走进神话之乡 领略阳城风华 张璐茗应邀参加旬邑县与西安交通大学人居学院政校联合科技创新赋 属于“胜利”的夏天,上海街头成索康尼主场 乌镇植材小学举行:追光逐梦 点亮未来活动 古林茂新焕生机 乡村振兴显成效 泰康HWP精英团队亮相上海,以“笑对未来”精神传递行业新标准 FlyDeliver(FD配送)副总裁刘品恒出席中外企业合作交流座谈会 ​神经外科领域的新星——黄彬医生 阶跃星辰闪耀WAIC:万亿参数与多模融合引领AGI之路 阶跃星辰:万亿参数+多模态,引领AGI之路 阶跃星辰:以万亿参数和多模融合叩响AGI大门
躬行求知诸暨振兴,守护乡村幸福“食”光 两部门紧急预拨5.4亿元支持湖南等省份做好抢险救灾工作 国家外汇局新开通部分行政许可网上办理功能 内地对港供电保障能力持续提升 节气播报:夏至 节气播报:小暑 新瑞鹏集团“爱猫项目组”成功举办猫宠主沙龙:为南京“猫宠主们” 【京津冀协同发展】津承协同发展促就业,人才共育共享迎新篇 国际癫痫关爱日——汇承脑科在行动 高骼乳业5周年丨行业大咖现身说法 儿童粉市场潜力巨大 暑期档开场!这份爱奇艺儿童、动漫、纪录片超豪华片单“硬控”你 FlyDeliver(FD配送):以创新引领全球即时配送新篇章 江西农业大学竹林研究团队赴瑞昌市嵋荣村开展创新施肥实验与野外 陵水影黎万像数字传媒产业有限公司第二部出品短剧开机 “韶山红·长征”,传承红色精神 赛德房车:坚决捍卫自主知识产权 收获成长 乐迎未来 廖家中学2023——2024学年度下期散学典礼 德琪医药希维奥®新适应症在华获批上市,为中国DLBCL患者带来新选 FlyDeliver(FD配送)品牌副总裁刘品恒受邀出席2024中国企业家峰会 追光逐梦 点亮未来 金堂奖奢居里携手意大利瑞加涂料,引领中国建博会新航向 2024中国家居荣耀红榜|东鹏整装卫浴荣获“智能卫浴智享空间先锋品 重磅荣誉|东鹏斩获2024中国家居荣耀红榜两项大奖 蒙城县三义路中学召开优秀学生座谈会 助力学生梦想启航 蒙城县三义路中学举行散学典礼 共迎暑假新起点 “光影颂华章·同心庆华诞”江西省庆祝中华人民共和国成立75周年 《诗画中国》着墨丹青山河,追觅诗情画意 宿迁市卫健委党委书记、主任张岩一行莅临泗阳康达医院调研指导 倒计时20天|东鹏瓷砖,为奥运喝彩 邛崃:“一桶好酒,等你好久”邛酒促销 活动即将闪亮登场 “救”得安心,“助”得贴心 湘潭医疗救助惠民生 湘潭市益智中学隆重召开第一届第三次教代会 筑牢师德 依法执教 湘潭市益智中学召开2024年春季学期期末教职工大会暨暑假安全工作 再创生命奇迹,湘潭760克早产儿顺利出院了! 中阿经贸投资(大湾区)交流活动举办 蔡冠深:推动更多港企参与中阿经 创意大咖与盛夏清凉碰撞 深圳首家肯悦咖啡落地光明 彭州市北君平中学党支部表彰大会暨在党50年纪念章颁发仪式 生态创新,智在必行——“智旋绿筑”为可持续发展贡献青春力量 樊登阳城行:走进神话之乡 领略阳城风华 张璐茗应邀参加旬邑县与西安交通大学人居学院政校联合科技创新赋 属于“胜利”的夏天,上海街头成索康尼主场 乌镇植材小学举行:追光逐梦 点亮未来活动 古林茂新焕生机 乡村振兴显成效 泰康HWP精英团队亮相上海,以“笑对未来”精神传递行业新标准 FlyDeliver(FD配送)副总裁刘品恒出席中外企业合作交流座谈会 ​神经外科领域的新星——黄彬医生 阶跃星辰闪耀WAIC:万亿参数与多模融合引领AGI之路 阶跃星辰:万亿参数+多模态,引领AGI之路 阶跃星辰:以万亿参数和多模融合叩响AGI大门

您的位置:首页 > 滚动资讯

国产大模型的“阶跃速度”:阶跃星辰发布万亿MoE大模型

国产大模型的“阶跃速度”:阶跃星辰发布万亿MoE大模型

  在2024年的世界人工智能大会(WAIC)上,大模型成为了备受关注的焦点。其中,国产大模型公司阶跃星辰在短短100多天的时间里,以惊人的速度发布了三款大模型,包括Step-2万亿MoE语言大模型正式版、Step-1.5V多模态大模型和Step-1X图像生成大模型。

  阶跃星辰的Step系列通用大模型因其出色的性能和创新的应用,荣获了WAIC 2024 SAIL之星奖项。同时,阶跃星辰还与上影合作,在WAIC现场发布了基于《大闹天宫》的AI互动体验——“测测你是哪路神仙”。

国产大模型的“阶跃速度”:阶跃星辰发布万亿MoE大模型

  通过这些举措,阶跃星辰成为了国内极少数同时布局大语言模型和多模态大模型,并且已经正式发布模型产品的AI公司之一。多模态理解和生成的统一布局被包括阶跃星辰在内的许多AI从业者视为通往AGI(通用人工智能)的必经之路。

  从首次亮相至今,阶跃星辰以“阶跃速度”迅速崛起,成为国产大模型的第一梯队。

  万亿模型俱乐部

  阶跃星辰本次发布的万亿参数大模型是其重要成果之一。在全球范围内,这样的大模型也屈指可数。今年3月首次亮相的Step-1是一个千亿参数的稠密(Dense)模型,而本次发布的Step-2则是一个万亿参数的MoE模型。

  “稠密”和“MoE”是描述大模型参数的两种技术路径。稠密模型的参数量与实际运行参数是1:1的关系,在推理时会运行所有参数;而MoE模型的实际运行参数只有总参数的1/4或1/8,以提高推理效率。

  关于两者的更细微区别,可以直接向阶跃星辰推出的对话助手产品“跃问”提问。

  在Scaling Law的指导下,大模型的参数量越来越大已成为确定性趋势。然而,从千亿到万亿的跨越,究竟应该采用稠密模型还是MoE模型?阶跃星辰CEO姜大昕认为,如果要将模型参数扩大到万亿级别,MoE几乎是一个必选项。这就像在科研或工程中,许多决策就是在各个维度之间寻找最佳平衡点,MoE也是在性能、参数量、训练成本和推理成本等维度权衡下的最佳选择。

  法国的Mistral、马斯克的xAI都发布了MoE架构的千亿级别大模型。今年3月,黄仁勋在GTC大会上透露了OpenAI最大的模型参数为1.8万亿,这侧面证实了GPT-4的参数量,也意味着GPT-4是一个MoE架构的大模型。

  多模态是通往AGI的必经之路

  除了语言大模型,阶跃星辰还发布了两款多模态大模型,同样表现出色。

  Step-1.5V是一款千亿参数多模态大模型。相比三个月前发布的Step-1V,Step-1.5V不仅在图像感知和理解能力上全面提升,还具备了出色的视频理解能力。目前,除了OpenAI的GPT-4o和谷歌的Gemini,很少有其他大模型具备视频理解能力。

  与仅使用图像数据进行训练不同,Step-1.5V采用了图文混排的训练方法,使其能够理解复杂的图表、流程图,并准确感知物理空间中复杂的几何位置。它还能处理高分辨率和极限长宽比的图像。

  在视频理解能力方面,Step-1.5V不仅能准确识别视频中的物体、人物和环境,还能理解视频的整体氛围和人物情绪。

  Step-1.5V大幅提升的推理能力得益于将万亿参数的语言大模型作为其“老师”。Step-1.5V可以根据图像内容进行各种高级推理任务,如解答数学题、编写代码、创作诗歌等。

国产大模型的“阶跃速度”:阶跃星辰发布万亿MoE大模型

  除了升级版的Step-1.5V,阶跃星辰还首次发布了图像生成大模型Step-1X,补充了理解之外的生成能力。

  Step-1X图像生成大模型采用全链路自研的DiT(Diffusion Models with transformer)模型架构,这也是OpenAI的视频大模型Sora所采用的技术路线。

  Step-1X支持600M、2B、8B三种不同的参数量,以满足不同场景的需求。600M模型适用于对速度敏感的轻量级场景;2B模型是日常使用的主力模型,在效果和速度之间达到了完美的平衡;8B模型则是追求更高效果的更极致的模型。

  Step-1X具有更好的文本prompt和生成图片的语义对齐能力、指令遵循能力,同时针对中国元素进行了深度优化,更符合国人的审美风格。在WAIC现场,阶跃团队还展示了针对中国动画风格《大闹天宫》的视频生成能力。

  在互动中,用户需要上传一张个人照片并与大模型生成的剧情进行选择和交谈。算法 会识别照片的特征,将特征结合《大闹天宫》的画风和角色进行风格迁移,生成新的肖像。同时,根据用户的选择和回答,进一步分析用户的“MBTI”人格,并在天庭为用户“安排”一个差事。整个交互过程有趣且极具个人特色。

  《大闹天宫》AI互动体验的背后调用了多个阶跃星辰自研的Step系列大模型,融合了图像理解、风格迁移、图像生成、剧情创作等多种能力。例如,在初始角色生成时,系统首先会判断用户上传的照片是否符合“捏脸”要求,然后用非常符合《大闹天宫》语言风格的方式灵活地给予反馈。这体现了模型的图片理解能力和大语言模型的能力。

  阶跃星辰与上海电影共同推出的这款AI互动游戏,将最先进的AI大模型技术与《大闹天宫》的情境深度融合,用当代全新的视角领略中国传统文化的魅力,回顾经典动画作品的艺术成就,同时也为广大创作者打开了无限的想象空间。

  基于Step系列大模型,阶跃星辰通过自研产品和生态合作产品逐渐形成了丰富的产业应用生态圈。除了内容领域,阶跃星辰还在金融、网络文学、知识服务、游戏、数字人、影视等领域与合作伙伴达成了深度合作,共同探索面向C端用户的创新应用。

  通过自研产品和生态合作,阶跃星辰正在走出一条独具特色的国产AGI之路。


责任编辑:柯鹏

推荐阅读
2024年暑运7月1日正式开启,为期62天。全国铁路预计发送旅客8.6亿人次,日均发送旅客1387万人次。

2024-07-05 22:05:12

点一杯以年画为拉花的“财神拿铁”,漫步赏景,一面是山花烂漫,一面是徽式古趣,好不自在。

2024-07-03 20:54:50

记者3日从山东省防汛抗旱指挥部办公室了解到,经会商研判,山东省防汛抗旱指挥部决定于7月2日18时终止抗旱四级应急响应。

2024-07-03 16:21:33

根据报告,当前,从国际形势看,全球数字化变革浪潮涌现,各国深入推进数字化发展战略,推动国际数字领域竞争日趋激烈,数字时代的国际格局正在加速重塑。

2024-07-01 18:24:33

“三伏”将至,全国多地正经历高温“炙烤”,而在青藏高原可可西里,这里的夏季最高温度常年低于10摄氏度。

2024-06-27 10:39:24

中国旅游研究院25日在三亚发布了《中国入境旅游发展报告(2023-2024)》。报告显示,2024年我国入境旅游市场发展态势持续向好。

2024-06-25 18:25:28