1.专业背景:
1)生物信息学、生物统计学、计算生物学、医学信息学或生命科学相关专业,硕士及以上学历。
2)对生物医学数据的类型(基因组、转录组、蛋白质组、代谢组、临床影像、电子病历等)及其数据格式(FASTQ、VCF、BAM、BED、DICOM、HL7等)有系统性了解。
2.核心技术能力:
1)数据审编经验: 具有2年以上生物医学数据审编、数据清洗或数据标准化相关经验,熟悉数据质量评估流程。
2)数据库与查询能力: 熟练使用SQL进行复杂数据查询与校验;熟悉至少一种主流关系型数据库(如MySQL、PostgreSQL)的基本操作。
3)脚本语言能力: 掌握Python/R/Perl中至少一种脚本语言,能够编写自动化脚本来辅助数据校验、格式转换与批量处理。
4)术语与标准: 熟悉生物医学领域常用术语标准与本体(如GO、HPO、ICD、UMLS、SNOMED CT),理解FAIR数据原则。
5)文档与沟通: 具备优秀的文档撰写能力与跨团队沟通协调能力,能够清晰地向技术人员传达用户需求,向用户解释数据规范。
3.深度技能(符合者优先):
1)有国家级或大型科研项目数据汇交、审编与管理经验。
2)熟悉数据隐私与安全法规(如《个人信息保护法》、《人类遗传资源管理条例》),了解数据脱敏与合规审查流程。
3)有用户支持、产品运营或科研服务相关经验。
4)具备基础的数据可视化能力(如Tableau、ECharts、Matplotlib)。
1.数据库需求调研与规划
1)深入科研一线与临床场景,主动调研用户(科研人员、生物信息分析师等)的数据使用习惯与痛点,收集并分析平台功能需求。
2)参与数据库产品迭代规划,从数据视角提出索引设计、字段定义、关联关系等优化建议,确保平台功能贴合真实科研需求。
3)跟踪国内外同类数据平台(如UK Biobank、EBI、NCBI等)的发展动态,撰写竞品分析报告,为平台功能升级提供参考。
2.数据汇交与审编
1)制定并执行数据汇交规范与质控标准,指导数据提交方按要求上传数据,确保数据格式、元数据描述、伦理合规等符合平台要求。
2)负责多模态生物医学数据(基因组、转录组、影像、临床表型等)的接收、标准化处理、质量审核与异常数据追踪。
3)开展数据的深度审编工作:对数据进行清洗、去重、术语映射(如ICD、HPO、SNOMED CT等)、语义标注与版本管理,提升数据的可发现性与可互操作性。
3.数据库测试与用户服务
1)负责平台新功能上线前的数据端验收测试,从用户视角模拟数据检索、下载与分析场景,确保数据准确、功能流畅。
2)担任平台数据服务的“第一响应人”,为用户提供专业的数据查询、使用指导与问题解答,及时响应数据相关的咨询与工单。
3)收集用户反馈与常见问题,定期输出数据质量报告与用户行为分析,驱动平台与数据集的持续优化。
4)编写并维护数据字典、用户手册、FAQ 等文档,降低用户使用门槛,提升平台易用性。
**具体岗位结合和候选人实际情况确定。
请有意应聘者点击下方职位申请,填写个人简历并提交。经资格审查,择优确定面试人员,面试时间和地点另行通知。