大模型研发工程师
No. 322151
招聘单位
招聘人数
1 人
工作地点
武汉市
用工方式
未说明
年龄要求
未说明
学历要求
大学本科及以上学历
专业要求
计算机、人工智能等相关专业
工作经验
一般应具有3年及以上在NLP、大语言模型、强化学习等领域的相关工作和项目落地经验,并且有扎实的研究积累,有银行业大模型项目实施经验或智能客服、个人助手、文本挖掘领域相关经验者优先
时间安排
报名时间
截止 2025.07.22
截止 2025.07.22
技能要求
对Query分析、大数据分析、自然语言处理、文本相关性有一定的技术积累;熟练掌握TensorFlow、PyTorch、Megatron、DeepSpeed等框架,了解各种并行策略,并具备大规模分布式训练的经验;具备千亿量级大模型的预训练、微调和强化学习等方向的技术应用经验;有扎实的机器学习实践经验,熟悉一种主流的机器学习框架(PyTorch、TensorFlow、MXNet、 PaddlePaddle);了解大模型基本知识及常见微调手段,熟悉ChatGLM、MOSS、LLaMA等模型微调训练、优化方案的优先;熟练使用Pytorch、Huggingface Transformer、DeepSpeed等深度学习工具, 熟练掌握 Python 编程语言,有Linux下的开发经验,有良好的数据结构和算法基础,具备扎实的编程功底。熟悉 C/C++ 编程语言和CUDA编程者优先。
岗位职责
负责跟进大模型研究最新进展,结合业务领域特点,训练垂类大模型;使用NLP、大数据、机器学习、深度学习等技术,稳定提升搜索与推荐效果;追踪搜索与推荐前沿技术,进行模型创新并在业务中合理运用,优化业务指标;参与LLM和AIGC核心算法工作,基于海量的内容(文本、图像、视频)及前沿的大模型,支持文教互娱的算法工作,提高业务效果;负责AI内容生成和编辑(Prompt设计、大模型SFT和预训练、大模型强化学习等)、内容理解和质量识别(质量分级、内容结构化、智能标签/摘要、优质文案等)、场景应用(需求理解、用户刻画、 个性化推荐)等;负责结合大模型和AIGC技术,支撑对话系统等多模态场景;完成交办的其他工作。