职责:
• 设计和开发深度学习模型和算法,用于各种应用,如计算机视觉、自然语言处理和语音识别。
• 收集、预处理和分析大规模数据集,用于训练深度神经网络。
• 实现和优化深度学习架构,包括卷积神经网络(CNN)、循环神经网络(RNN)和Transformer模型。
• 与跨职能团队合作,包括数据科学家、软件工程师和领域专家,定义项目需求和目标。
• 保持对深度学习研究和技术的最新进展的了解,并应用它们来提高模型性能。
• 进行实验和进行严格测试,以评估和改善深度学习模型的准确性和效率。
• 针对生产系统优化和微调深度学习模型,考虑计算资源和实时约束等因素。
• 使用Python等语言编写干净、高效和易维护的代码,并利用TensorFlow、PyTorch或Keras等深度学习库和框架。
• 应用迁移学习、数据增强和正则化等技术,以改善模型的泛化能力和减少过拟合。
• 与数据工程团队合作,确保数据管道和基础设施支持深度学习模型的高效训练和部署。
• 向利益相关者和团队成员记录和沟通研究结果、方法和最佳实践。
• 指导和提供初级团队成员的指导,并为深度学习团队的持续学习和发展做出贡献。
要求:
• 计算机科学、电气工程或相关领域的学士或硕士学位。博士学位是一个加分项。
• 扎实的机器学习原理和算法的理解,特别是深度学习技术。
• 熟练掌握编程语言,如Python,并有使用深度学习框架(如TensorFlow、PyTorch、Keras)的经验。
• 有开发和训练深度神经网络解决各种任务的经验,如图像分类、目标检测、序列建模或自然语言理解。
• 熟悉线性代数、微积分、概率和统计学,以及它们在深度学习中的应用。
• 熟悉数据预处理、特征工程和数据可视化技术。
• 最好具有云计算平台(如AWS、Azure、Google Cloud)和分布式计算框架(如TensorFlow Distributed、Horovod)的实际经验。
• 出色的问题解决能力和在开发创新深度学习解决方案时进行批判性和创造性思考的能力。
• 出色的沟通和团队合作能力,能够与技术和非技术利益相关者有效合作。
• 有深度学习项目、研究论文或对深度学习社区的贡献的强大作品集或记录是一个加分项。