首页 实时讯息

国内首个!移动端视觉生成大模型上线,名叫“橘洲”……

长沙星上数星星,汇视威算力天团

“少年心事当拏云,长沙星上,数尽满天繁星……”伴随着一首充满青春活力的《长沙星上数星星》,5月21日,“橘洲”V1端侧版在长沙上线!这是国内首个基于国产算力预训练的视觉基座大模型,能在手机端实现1024×1024分辨率图像的秒级生成,具有成本低、质量高、速度快、轻量级、可离线的特点。

当全球AI竞赛进入“端侧部署”新阶段之际,这款纯国产、手机就能畅玩的“橘洲”视觉生成大模型,相当硬核。“橘洲”大模型由湖南汇视威智能科技有限公司(以下简称“汇视威”)自主研发,依托中科曙光算力,在较短时间完成了近4000万张图片训练,成为全国首个在国产算力上完成整体训练和推理过程,并实现移动端部署的视觉基座大模型。

特别值得一提的是,汇视威在长沙成立仅3年,公司研发团队平均年龄不到30岁,最年轻的算力工程师年仅21岁。这群“算力追光者”花费近半年的时间进行国产算力的科技攻坚,书写国产AI从“可用”到“可轻”的突破密码。将指针拨回24小时前,笔者与汇视威团队并肩作战,共同见证这个大模型诞生前夕的关键时刻。

早上9点的长沙智谷略显宁静,21岁的李诗佳穿过林语路,从公司公寓步行10分钟到达汇视威办公室,工位上的咖啡热气未散,她已专注敲起代码,与团队冲刺大模型“橘洲”V1版本的上线。

“00”后李诗佳主要负责大模型的数据预处理和模型转换。除署名外均为邹麟 摄

李诗佳与汇视威的缘分始于一场“双向奔赴”。2024年9月保研成功后,李诗佳进入导师的课题组线上“练兵”,凭借处理海量数据的细致与高效,被同处课题组的汇视威创始人顾善植看中。今年2月,她以见习算法工程师身份加入汇视威。

“我的工作其实主要是两个部分,数据预处理和模型转换。”只见她的工位左侧屏幕滚动着海量图像数据,右侧显示着PC端向手机端转换的一些代码。

“我现在已经自主处理超2000万张图像数据,剔除重复、模糊、图文不匹配的‘杂质’,让大模型的‘食粮’更精纯。”李诗佳说,而在模型转换环节,她需要将训练好的PC端模型“瘦身”轻量化,转换成手机端适配格式。“就像把厚字典压缩成口袋书,既要体积小,还得知识不丢分毫。”

这款完全基于国产算力训练的大模型,从框架适配到算法调优,每一步都是“无人区”探索。而作为团队最年轻成员,她的成长轨迹与“橘洲”V1大模型的进化同频共振。第一次看到国产算力集群跑起自己的代码,李诗佳眼里闪着光。

中午12点,在汇视威的茶水间,“芝麻团”和“虎妞”正趴在咖啡机上看工程师们调试代码。这两只美短猫是2023年顾善植带来的,他说希望它们能在工作之余,为大家提供情绪上的安慰。

这种“撸猫+敲代码”的工作节奏曾是江西小伙彭英麒的日常。和李诗佳相比,这几天他终于可以稍稍松口气了——数据前期的归纳、整理、储存基本已经结束。这不,刚从附近湘菜馆饱餐一顿,他又来到茶水间给虎妞喂饭。

“数据供应链跑完了,终于有空当‘猫保姆’!”彭英麒边逗猫咪边惬意地说道。

“00”后彭英麒主要负责大模型数据的归纳、整理、存储。

“机缘巧合。”作为一名见习数据工程师,彭英麒这样形容自己与汇视威的初遇。“记得在大学的计算机视觉课上,我的课设就是与文生图有关,于是自己主动联系、申请,今年1月份参与到顾师兄的‘橘洲’V1大模型的研发中。”

“就像给食材分类装盒,既要新鲜又要拿取方便。”彭英麒这样形容自己的工作。他主要负责大模型数据的归纳、整理、存储,需要将公开数据集与自产数据统一打包,整理成方便调用的格式。“这是一个比较关键的一步,因为后续进行大模型训练的时候,必须要以最快的速度来读取这些图片,这样就能节省时间。”彭英麒说。

最考验耐力的是数据集初筛阶段。连续好几周,他像个“数据质检员”般盯着屏幕,对数十个公开数据集进行“望闻问切”。彭英麒展示了最耗时的环节——连续两周人工筛查上百个公开数据集,给每个图像集打上“清晰度”“标注完整度”“场景多样性”的评分标签。“那段时间抬头看天花板都是浮动的图片小方块。”彭英麒笑着说。

“专业但又不失风趣,”在彭英麒眼里,汇视威是个“反刻板印象”的存在。团队成员学历背景都是博士、硕士,却没人端着“学术架子”。午休时的台球局是常态,周末的聚餐更像老友聚会,从冬瓜山的烤牛油聊到模型训练的趣事,松弛感拉满。

彭英麒曾有过一段“提问焦虑期”。初入团队时,他总习惯把问题藏在心里:“怕被说水平不够,也怕打扰同事,宁愿自己工作到凌晨。”直到某次绕了三天弯路被团队的王聪睿博士发现,“下次犯错记得叫上我观摩。”一句玩笑话化解了彭英麒的“社恐”,王博士手把手教他逐帧分析数据流,工作效率肉眼可见提升,团队融洽的氛围让彭英麒觉得紧张的工作顿时舒缓了不少。

“顾总更是一个非典型CEO。”彭英麒说,“印象中,理科生应该是理性思维偏多,但顾总却是感性的,他能照顾到每一个员工的情绪。他批评人从不摆架子,总会给个台阶下。他还像带着我们打副本的老玩家,他在前面冲锋陷阵,在他的带动下,我也获得了参与多个高精尖项目的宝贵机会,在实战中不断成长。”

夜色降临,汇视威的办公间逐渐沉寂,只有“咔哒咔哒”的键盘敲击声回响。王聪睿从工位直起身,揉了揉泛红的眼角,端起微凉的咖啡抿了一口。自从大模型研发进入冲刺期,这位95后 CTO(首席技术官)每天都要奋战到凌晨3、4点钟。

王聪睿正在攻克的,是大模型落地的“最后一公里”:让算法脱离云端算力,用户无需联网也能调用大模型功能。“我们的大模型是在国产GPU上面部署、训练的,之前从没有人这样做过,我们算是第一批‘吃螃蟹的人’!”工作量大、充满不确定性,他坦言,每天睁开眼都是“新的战场”。

“调试-创新-再调试”,为了最完美的部署迁移方案,王聪睿一头扎进工作里,披星戴月近半个月终于拿下。部署成功的前一个晚上令他格外难忘,“虽然还没有成功,但已经有了70%以上的把握!”王聪睿兴奋地告诉笔者,在不断的调试中,他找到了适配国产硬件的部署方案,现在大模型已经可以在手机上正常运行。

5月20日凌晨1点,汇视威董事长顾善植(左)和首席技术官王聪睿(右)还在为“橘洲”视觉大模型做测试和优化。

将指针拨回4年前,任职于某互联网大厂的王聪睿,在晋升前夕接到研究生室友顾善植的来电,毅然辞去工作奔赴AI赛道。从打工仔到创业者,促使他迈出这一步的是信任与坚持,“当时很激动,想着能够和以前的同学一起创业,有了目标之后就一直锲而不舍地努力。”

见证了大模型从0到1的成长过程,如今即将开花结果,王聪睿心中倍感欣慰,“它就像我的孩子一样,现在也是期待怎么向观众发布。”说罢,他放下手中的空咖啡杯,清脆的键盘声再度填满空间。

“穿过一串串星座,掠过一窟窟黑洞,不辞长做长沙追星人……”湘江畔的夜风再次卷起《长沙星上数星星》的旋律,凌晨3点,加班的伙伴陆陆续续离开公司,顾善植微笑着向他们挥手。关掉最后一盏灯,他乘电梯下楼,迎面与清冽的夏风撞了个满怀。

“等风来,不如追风去!”顾善植临时调转方向,驱车朝着湘江边驶去。“很亢奋”,他如此形容最近的工作状态,“不止是我,大家一起熬了这半年,都希望进行第一次的整体亮相!”

顾善植所追的,不止这一缕清风,更是百年难得的行业机遇。

汇视威这家初创公司刚迈入第4个年头,却在去年经历了一次深刻的赛道更迭,“我们之前3年多全部是在做To B端,订单、产品已相对成熟,后续不需要过多的研发投入。”作为公司创始人,顾善植开始寻找下一个可关注的领域,文生图大模型进入了视野。虽然彼时业内不太看好这一赛道,玩家也寥寥,但顾善植选择“逆流而上”,“一方面是勇气,另一方面是底气。”

勇气是来自于团队拥有一群平均年龄不到30岁的年轻人;底气,是团队成员大多是来自国内名校的博导、博士、硕士,再加头部大厂、实验室经验累积的满满自信。

除此之外,还有那么一点可遇而不可求的运气。

顾善植坦言,正是因为有长沙作为坚强后盾,团队才有更多底气奋力去闯去拼。受访者供图

“第4年的时候能够遇上这样一个风口和契机,这是我们没法预料的!”在顾善植看来,公司去年年底决定向大模型进军,今年初便迎来AI应用的浪潮,再次提升了整个行业的关注度,也为其产品推广营造了良好氛围。

当大势如湘江的潮水般涌上来,是被浪花吞噬还是御浪而行?稳扎稳打的汇视威给出了答案——17名成员组成的核心小组,合作单位中科曙光接近1:1的人员支持,从一周一次到两天一次、甚至一天一次的例会讨论……随着7个创新点逐一攻破,团队的信心与日俱增。

“我们还在攻关图片生成效果,希望质量更高,速度更快!”顾善植告诉笔者,256像素的图片,他的预期是0.5秒出图,512像素也要控制到1秒以内。

经过上百次实验,这张知更鸟的图片是“橘洲”大模型当时成功生成的第一张图片,代表这次实验的技术路线终于打通了,这对于汇视威团队来说是意义非凡的一张图片。受访者供图

看万山红遍,层林尽染,漫江碧透,百舸争流——每当想起橘子洲头,顾善植脑海中总浮现这样一幅立体而动态的画面,“我觉得这其实很符合我们大模型的效果。”在一次团队的深夜谈心后,大家很有默契地为大模型定下了“橘洲”这个名字。八年前站在橘子洲头仰望毛泽东青年艺术雕塑时,顾善植就默默地想:“百年前,青年毛泽东在这里中流击水;今天,我们这群‘吃得苦、耐得烦’的长沙伢子,也要在算力的浪潮里闯出一片天!”

“别总问长沙有多长,让我算算永远有多远。长沙星上数星星,看最闪亮的夜……”顾善植用耳机听着这首《长沙星上数星星》,感受“少年心事当拏云,唱给茫茫宇宙听”的豪情。5月20日,“汇视威算力天团”发布的这首歌,将他们这群被烟火气留住的AI追梦人的“520”,献给长沙。在这座“周六最晚的夜,就是周七最早的晨”的城市,永远有少年仰望星空,永远有代码在编织银河。

公司墙上挂着两张特别的地图:一张标记着团队“嗦”过的57家长沙米粉店,另一张记录着算法在十二大领域上百个落地场景。“长沙少年嗦粉粉,数星星,唱摇滚,发布大模型……”创业路上,长沙从没让顾善植感受到孤单。2021年公司刚起步时,汇视威就从相关部门获得了资金、培训、导师、市场全链条支持,“柳枝行动”“红枫计划”“小荷”项目助力了产品快速孵化。如今,他们的AI技术早已走出实验室,融入长沙的城市血脉:从岳麓山客流预警到社区独居老人守护;从车企生产线的瑕疵检测,到化工燃气作业的风险预判——代码不是冰冷符号,而是万家灯火的温度!

在顾善植看来,在中科曙光(湖南)的国产算力芯片上训练的新一代大模型“橘洲”,承载着五一广场的深夜灵感、岳麓书院的智慧滋养,更承载着一个朴素的信念:“中国AI的未来,必须握在自己手里!”这支“95”后长沙团队,用“橘洲”大模型在文生图赛道划出一道耀眼的“湘”字轨迹。以算力为笔,以山河为纸,在这片诞生过《沁园春·长沙》的土地上,正写下属于中国智造的新篇章!

相关推荐