• AI大模型应用开发部署
  • [兼职]
  • ——
  • AI大模型应用开发部署
  • 4.2-8.4K/月
  • |
  • 本科及以上
  • |
  • 招聘 2
专业不限
来源: 实习僧
2xy7zytm7pt75iz09glwxs5554t621uf
  • 310107
职位已下线

职位详情

你将参与的核心方向为大模型应用开发后的《部署工作》 包含但不限于 LLMInference&Serving 使用vLLM/TensorRT-LLM/FastAPI等框架搭建高并发推理服务 部署并优化模型量化、分片、异步batching等技术,降低GPU成本 DevOps&MLOpsPipeline 编写Dockerfile、HelmChart,维护Kubernetes集群 构建自动化CI/CD(GitHubActions/GitLabCI)并实现一键Rollout/Rollback Observability&Cost-Control 集成Prometheus+Grafana监控,编写Alert规则 通过GPU利用率、并发QPS、Token消耗等指标持续优化TCO PeripheralIntegration 结合向量数据库(Milvus/pgvector/Pinecone)完成检索增强生成(RAG)部署 对接云资源(AWS/GCP/阿里云)与对象存储,实现弹性扩缩容和自动备份 岗位职责 与大厂资深算法工程师协同,将已训练的大模型快速上线并持续迭代 编写部署脚本、自动化测试与运维文档,形成标准化交付模版 参与推理层性能Profiling,提出优化建议并落地 跟踪社区最新LLMServing工具链并进行POC测试 支持产品经理与前端团队,保证APISLA、灰度发布和版本兼容 任职要求 计算机、软件工程或相关专业,本科及以上在读 熟悉Linux基础运维,掌握Python/Bash脚本编写 了解Docker、有使用Kubernetes/K8s部署应用的经验 熟悉至少一家公有云(AWS/GCP/阿里云/腾讯云)IaaS&PaaS基础服务 熟练使用Git;具备基础网络、负载均衡与安全组配置概念 具备良好英文技术文档阅读能力,乐于快速学习新工具 加分项(Nice-to-Have) 有vLLM、TensorRT-LLM、SageMaker或HuggingFaceTGI实战 使用过LangChain/LlamaIndex构建RAG流程 了解PrometheusOperator、ELK/Loki日志链路 参与或维护过开源项目,提交过PR/Issue 对A/BTesting、蓝绿发布、Canary发布有实现经验 我们能提供 与一线大模型技术专家同台合作的学习机会 完整MLOps实战场景:从模型Serving到线上监控闭环 弹性工作时间、Mentor制度、定期技术分享 实习期表现优秀可留用/转正,参与核心产品线成长

上海南睿馨自动化科技有限公司

  • 所属行业
  • 涉及领域 --
  • 公司性质 民营企业
  • 公司规模 --
  • 公司网址 --
  • 所在地址 nullnull

投诉
举报

意见
反馈

false
false