• 在统计学和机器学习方面有坚实的基础(评估、泄漏预防、偏差检查、校准、实验)。 • 拥有图数据库和图概念的实际操作经验: • 模式/设计:节点/边类型、属性、约束、索引、基数、时间建模 • 查询:Cypher(Neo4j)和/或 Gremlin/SPARQL • 图算法:PageRank、介数、连通分量、社区检测、相似性 • 精通用于数据科学的 Python(pandas、numpy、scikit-learn;能够编写可用于生产的代码)。