上次的那家还有个任务,就是要分析不同格式,差不多内容的卷子。这些卷子主要有比如市场调研,或者客户满意度调查什么的。问题是前面提到过,之前的程序员是不管3721,都存在数据库一个字段里的。另外呢,还有大量的Word,Excel文件。
这些数据表格呢,格式不太统一,但是累计的格式又多。之前呢,是人工获取数据,再做进Excel,做统计的。问题是时间长了很
多统计也不知道哪里去了。而且也无法校验,除非再组织人力。
他们也有一些小工具对一些格式的卷子做调查,问题是不统一。他们提出来能不能有个比较智能点程序可以把不同格式但是大致相同样子的卷子都给识别出来。
这样的需求他们很大,包括他们的人力部门,现在他们收到的会是几种格式的简历,有国内51,智联的,也有国外类似网站的。
因为格式不同,所以很难入库,虽然他们也找了一些工具,可以帮助他们识别简历,但是经常是顾上一部分网站又少了另外一部分网站。
这个事情在可做可不做之间,我总觉得这种活,他们应该去找IBM什么的,狠宰他们一顿,找我完全就是欺负我们价格便宜到底线了。所以我也挺犹豫的。再说我也只是想了个眉目具体的还没想好。所以没完全答应,对方倒是很兴奋的样子。