- AI大模型应用开发部署
- [兼职]
- ——
- AI大模型应用开发部署
- 4.2-8.4K/月
- |
- 本科及以上
- |
- 招聘 2人
专业不限
来源:
实习僧
2xy7zytm7pt75iz09glwxs5554t621uf
-
310107
职位已下线
职位详情
你将参与的核心方向为大模型应用开发后的《部署工作》
包含但不限于
LLMInference&Serving
使用vLLM/TensorRT-LLM/FastAPI等框架搭建高并发推理服务
部署并优化模型量化、分片、异步batching等技术,降低GPU成本
DevOps&MLOpsPipeline
编写Dockerfile、HelmChart,维护Kubernetes集群
构建自动化CI/CD(GitHubActions/GitLabCI)并实现一键Rollout/Rollback
Observability&Cost-Control
集成Prometheus+Grafana监控,编写Alert规则
通过GPU利用率、并发QPS、Token消耗等指标持续优化TCO
PeripheralIntegration
结合向量数据库(Milvus/pgvector/Pinecone)完成检索增强生成(RAG)部署
对接云资源(AWS/GCP/阿里云)与对象存储,实现弹性扩缩容和自动备份
岗位职责
与大厂资深算法工程师协同,将已训练的大模型快速上线并持续迭代
编写部署脚本、自动化测试与运维文档,形成标准化交付模版
参与推理层性能Profiling,提出优化建议并落地
跟踪社区最新LLMServing工具链并进行POC测试
支持产品经理与前端团队,保证APISLA、灰度发布和版本兼容
任职要求
计算机、软件工程或相关专业,本科及以上在读
熟悉Linux基础运维,掌握Python/Bash脚本编写
了解Docker、有使用Kubernetes/K8s部署应用的经验
熟悉至少一家公有云(AWS/GCP/阿里云/腾讯云)IaaS&PaaS基础服务
熟练使用Git;具备基础网络、负载均衡与安全组配置概念
具备良好英文技术文档阅读能力,乐于快速学习新工具
加分项(Nice-to-Have)
有vLLM、TensorRT-LLM、SageMaker或HuggingFaceTGI实战
使用过LangChain/LlamaIndex构建RAG流程
了解PrometheusOperator、ELK/Loki日志链路
参与或维护过开源项目,提交过PR/Issue
对A/BTesting、蓝绿发布、Canary发布有实现经验
我们能提供
与一线大模型技术专家同台合作的学习机会
完整MLOps实战场景:从模型Serving到线上监控闭环
弹性工作时间、Mentor制度、定期技术分享
实习期表现优秀可留用/转正,参与核心产品线成长