- 搜索/推荐
- Hadoop/Hive/Spark
- TensorFlow/PyTorch
- Python
- 计算机相关专业
- 机器学习算法/工程化经验
工作职责:
负责超大规模分布式机器学习等场景下,离线高性能训练平台的开发与调优
负责云原生环境下离线训练平台的资源调度与优化工作
服务公司个性化推荐等核心业务线
任职要求:
本科及以上学历,计算机或相关专业,基础扎实,代码能力强;
对开源深度学习框架的实现原理有了解,如 PyTorch、TensorFlow ,MxNet、Caffe等,或者有兴趣深入研究;
对 MKL 、CUDA、BLAS等高性能计算方案有了解;了解 TVM、ONNX、TensorRT 等框架,有GPU性能调优优先
对系统底层,包括网络、存储等有浓厚兴趣;对性能分析和调优有经验;对分布式系统、并行计算有浓厚兴趣;
熟悉 Linux 开发环境,扎实的工程代码能力,熟练掌握 C/C++开发调试,了解 Python 跨语言调用;
思维敏捷,有较强的钻研学习能力和自我驱动力,较好的沟通和团队合作能力。