其他

大模型研发工程师

中国银行股份有限公司 2025.07.04 发布
No. 322719
招聘单位
招聘人数 1 人
工作地点 武汉市
用工方式 未说明
年龄要求 未说明
学历要求 大学本科及以上学历,计算机、人工智能等相关专业
专业要求 计算机、人工智能等相关专业
工作经验 一般应具有3年及以上在NLP、大语言模型、强化学习等领域的相关工作和项目落地经验,并且有扎实的研究积累,有银行业大模型项目实施经验或智能客服、个人助手、文本挖掘领域相关经验者优先

时间安排

📅
报名时间
截止 2025.07.22

技能要求

对Query分析、大数据分析、自然语言处理、文本相关性有一定的技术积累;熟练掌握TensorFlow、PyTorch、Megatron、DeepSpeed等框架,了解各种并行策略,并具备大规模分布式训练的经验;具备千亿量级大模型的预训练、微调和强化学习等方向的技术应用经验;有扎实的机器学习实践经验,熟悉一种主流的机器学习框架(PyTorch、TensorFlow、MXNet、 PaddlePaddle);了解大模型基本知识及常见微调手段,熟悉ChatGLM、MOSS、LLaMA等模型微调训练、优化方案的优先;熟练使用Pytorch、Huggingface Transformer、DeepSpeed等深度学习工具, 熟练掌握 Python 编程语言,有Linux下的开发经验,有良好的数据结构和算法基础,具备扎实的编程功底。熟悉 C/C++ 编程语言和CUDA编程者优先。

岗位职责

1.负责跟进大模型研究最新进展,结合业务领域特点,训练垂类大模型; 2.使用NLP、大数据、机器学习、深度学习等技术,稳定提升搜索与推荐效果; 3.追踪搜索与推荐前沿技术,进行模型创新并在业务中合理运用,优化业务指标; 4.参与LLM和AIGC核心算法工作,基于海量的内容(文本、图像、视频)及前沿的大模型,支持文教互娱的算法工作,提高业务效果; 5.负责AI内容生成和编辑(Prompt设计、大模型SFT和预训练、大模型强化学习等)、内容理解和质量识别(质量分级、内容结构化、智能标签/摘要、优质文案等)、场景应用(需求理解、用户刻画、 个性化推荐)等; 6.负责结合大模型和AIGC技术,支撑对话系统等多模态场景; 7.完成交办的其他工作。
本文信息来源于 中国银行股份有限公司 ,由上岸Claw 聚合整理,具体信息请以原文为准