最新消息,阿里大模子 元老杨红霞入职香港理工大学,任电子盘算 机系传授 。
杨红霞是 AI 范畴 着名 科学家。她曾在 IBM T.J.沃森研究中心 担当 研究职员 ,并在雅虎担当 首席科学家。2016 年参加 阿里巴巴,就职于达摩院智能盘算 实行 室;2023 年 3 月入职字节跳动。
她在达摩院期间领导 了通义千问前身 M6 大模子 的研发,是 M6 大模子 从百亿、千亿参数量 进化到万亿规模的重要 功臣,并领导 通义大模子 核心 技能 “同一 学习范式 OFA-M6”的开辟 。
任职字节期间,她重要 负责大模子 研发,向字节 AML 和豆包大模子 Foundation 团队负责人项亮报告 。
本年 5 月,杨红霞被曝从字节跳动离职 ,有听说 称她将举行 大模子 范畴 创业。如今 ,更先一步曝光了她进军学术圈的消息。此前杨红霞未曾在高校内有正式任职,仅担当 过浙江大学上海高级研究院兼职传授 。
通义千问奠定 人物
杨红霞本科毕业 于南开大学统计学专业。博士就读于杜克大学。在顶级集会 会议 和期刊上发表论文 100 余篇,在美国和中国拥有 50 多项专利。重要 研究方向为贝叶斯统计、时间序列分析、时空建模、生存分析、呆板 学习、数据发掘 及其在贸易 分析和大数据中的应用。
博士毕业 后,她开始 在 IBM T.J.沃森研究中心 担当 研究职员 。之厥后 到雅虎担当 盘算 广告首席数据科学家,负责开辟 广告投放猜测 相干 算法。
2016 年,杨红霞返国 入职阿里巴巴,就职于达摩院智能盘算 实行 室。在此期间她最紧张 的工作是推动了 M6 大模子 的研发和扩展。这一多模态模子 是通义千问的前身,也是构建阿里当下大模子 竞争力的关键底子 工作。
M6 项目在启动研发 1 年时间左右,快速完成从亿级到十万亿级规模扩展。2020 年 6 月项目启动,2021 年 5 月发布万亿参数规模 M6 并投入利用 ,2021 年 10 月 M6 正式成为环球 首个 10 万亿参数多模态大模子 。
不但 成为当时 天下 上最大的中文多模态模子 ,而且 快速追赶上谷歌的发展脚步,在文生图、贸易 化等范畴 到达 天下 一流程度 。而且在绿色低碳方面,相比 GPT-3,M6 实现了划一 参数规模下所需能耗仅为 1%。
这项工作由阿里和清华共同开辟 ,杨红霞、唐杰共同担当 通讯作者。
其他重要 成员,正是通义千问研发的核心 成员,比如 An Yang、Rui Men。M6 的共同一作林俊旸是如今 通义千问开源负责人。
2022 年 9 月,达摩院正式发布“通义”大模子 系列,打造业界首个 AI 通义底座,并构建了巨细 模子 协同的条理 化人工智能体系 。此中 同一 底座的 M6-OFA 模子 由杨红霞领导 完成。它在业界初次 实现模态表现 、任务 表现 、模子 布局 同一 。不引入新增布局 ,单一模子 就可以同时处理 惩罚 高出 10 项跨模态任务 ,升级后可以处理 惩罚 高出 30 种。这项工尴尬刁难 外开源,如今 被引用数高出 900+,GitHub 星标 2.4k。
而就在这项重磅发布 1 个月后,杨红霞被曝因家庭缘故起因 从达摩院离职 。
下一次新动向已是 2023 年 3 月。消息称她已参加 字节 AML(呆板 学习体系 )团队,任字节跳动大语言模子 研发技能 专家,在美国西雅图从事大语言模子 的研发。
不外 短短 1 年时间,她就又从字节离职 。与此同时,行业的风向也从底子 大模子 开辟 ,渐渐 转向更细分的应用落地方向。
同步筹办 环球 化 AI 项目
值得一提的是,此前杨红霞的下一站被推测 是“端侧模子 创业”,布局 AI Agent。5 月消息称,团队正在筹办 组建中,已得到 3000-4000 万美元投资,投后估值 1.5 亿美元。
近来 量子位从知恋人 士处获悉,杨红霞前不久还在西雅图筹办 环球 化 AI 项目。综合来看,杨红霞入职香港理工大学,大概 和创业动作并不辩论 。
值得一提的是,从事更具体 的 AI 细分范畴 大展拳脚,确实是如今 AI 人才再创业比力 会合 的选择。比如 漆远的创业方向选择了可信大模子 。从蚂蚁团体 副总裁任上离职 后,漆远先是重返学界,在复旦担当 教职,而后又产学研并行地创建 了大模子 公司无穷 光年。
此前,量子位从市场获悉更多消息如下:
如上或有罅漏 与误传,欢迎 批评 区留言指正、分享更多行业信息。
参考链接:
https://www.polyu.edu.hk/comp/people/academic-staff/prof-yang-hongxia/
本文来自微信公众号:量子位(ID:QbitAI),作者:明敏
广告声明:文内含有的对外跳转链接(包罗 不限于超链接、二维码、口令等情势 ),用于转达 更多信息,节流 甄选时间,结果 仅供参考,IT之家全部 文章均包罗 本声明。