职位详情-国家大学生就业服务平台

AI大模型应用开发部署
[兼职]
——
AI大模型应用开发部署

4.2-8.4K/月
|
本科及以上
|
招聘 2人

专业不限

来源：实习僧

310107

职位已下线

职位详情

你将参与的核心方向为大模型应用开发后的《部署工作》包含但不限于 LLMInference&Serving 使用vLLM/TensorRT-LLM/FastAPI等框架搭建高并发推理服务部署并优化模型量化、分片、异步batching等技术，降低GPU成本 DevOps&MLOpsPipeline 编写Dockerfile、HelmChart，维护Kubernetes集群构建自动化CI/CD（GitHubActions/GitLabCI）并实现一键Rollout/Rollback Observability&Cost-Control 集成Prometheus+Grafana监控，编写Alert规则通过GPU利用率、并发QPS、Token消耗等指标持续优化TCO PeripheralIntegration 结合向量数据库（Milvus/pgvector/Pinecone）完成检索增强生成（RAG）部署对接云资源（AWS/GCP/阿里云）与对象存储，实现弹性扩缩容和自动备份岗位职责与大厂资深算法工程师协同，将已训练的大模型快速上线并持续迭代编写部署脚本、自动化测试与运维文档，形成标准化交付模版参与推理层性能Profiling，提出优化建议并落地跟踪社区最新LLMServing工具链并进行POC测试支持产品经理与前端团队，保证APISLA、灰度发布和版本兼容任职要求计算机、软件工程或相关专业，本科及以上在读熟悉Linux基础运维，掌握Python/Bash脚本编写了解Docker、有使用Kubernetes/K8s部署应用的经验熟悉至少一家公有云（AWS/GCP/阿里云/腾讯云）IaaS&PaaS基础服务熟练使用Git；具备基础网络、负载均衡与安全组配置概念具备良好英文技术文档阅读能力，乐于快速学习新工具加分项（Nice-to-Have）有vLLM、TensorRT-LLM、SageMaker或HuggingFaceTGI实战使用过LangChain/LlamaIndex构建RAG流程了解PrometheusOperator、ELK/Loki日志链路参与或维护过开源项目，提交过PR/Issue 对A/BTesting、蓝绿发布、Canary发布有实现经验我们能提供与一线大模型技术专家同台合作的学习机会完整MLOps实战场景：从模型Serving到线上监控闭环弹性工作时间、Mentor制度、定期技术分享实习期表现优秀可留用/转正，参与核心产品线成长

上海南睿馨自动化科技有限公司

所属行业
涉及领域 --
公司性质民营企业
公司规模 --
公司网址 --
所在地址 nullnull