- 深度学习
- 模型加速/性能优化
- C/C++
- Python
- 分布式训练
- 算法工程化经验
- GPU
- CUDA
- 训练引擎
AML是公司的机器学习中台,为推荐/广告/搜索等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。
1、负责字节跳动 AML 机器学习训练框架的研究与开发,服务于全公司各个产品;
2、参与机器学习训练框架底层组件的抽象,设计,优化与落地;
3、与全公司算法部门深度合作,为重点项目进行算法与系统的联合优化。
职位要求
1、熟练掌握Linux环境下的C/C++与Python语言;
2、接触过至少一种机器学习框架(Tensorflow / PyTorch / MxNet 或其他自研框架);
3、有以下至少一项的背景知识与经验:GPU编程,编译器,高性能网络,分布式存储,集群调度;
4、具有独立解决问题的能力,良好的团队合作精神;
5、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力;
6、有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档。
加分项
1、深入研究过至少一种机器学习框架(Tensorflow / PyTorch / MxNet 或其他自研框架)的底层架构和机制;
2、熟悉至少一种经典深度学习模型及其应用场景,如ResNet50,BERT,或者了解GAN,强化学习,图神经网络,AutoML等;
3、有研究生或博士阶段的计算机系统方向(包含分布式系统,并行计算,编程语言与编译器,网络,存储等)研究背景;
4、有软硬件联合设计的经验;
5、能使用数学工具分析深度学习训练中的优化算法。