一年时间一晃而过,在这一年里由于自己的原因基本没有再写博客,在2017年写这篇博客一方面是为了给2016做一个总结,另一方面是希望有一个好的开头,在2017里多做总结,写一些经过自己思考实践的博客。2016经历了大四毕业季,同时也迎来了研究僧生涯的第一学期,这之中变化还是挺大的。
大四毕业季毕业论文(上半年)
本科毕业论文选择的题目是“分布式地理计算框架的设计与实现”,为了完成毕业论文,学习了很多新的知识。
首先,该框架以一个web平台的形式体现,关于web项目的开发,没有选择自己较为熟悉的Java web开发技术,而是学洗了使用Node.js进行整个网站的开发语言,优点是可以快速构建一个web网站,开发起来较为快速。遇到的主要坑是服务器端代码都是并行执行而不是传统的从上到下顺序执行,需要用回调函数的方法实现同步。
然后学习了许多与大数据有关的技术,包括:Hadoop相关知识,如:HDFS、MapReduce、Hadoop高可用集群搭建;HBase数据库;MongoDB数据库;Spark RDD等。在这个过程中不可避免的对Linux系统熟悉了很多,这点对之后的学习也很有帮助。
采用了Redis分布式内存数据库构建优先队列,来控制任务调度的优先级。采用Ngix反向代理实现负载均衡。
一个夭折项目(暑假)
2016暑期老师和一个企业进行大数据方面的合作,看能不能搞个与大数据有关的项目做一做。在这过程中,用Java搭建了一个简单数据挖掘框架,包括数据清洗模块、数据转换模块、数据存储模块、挖掘算法模块。由于合作公司的主要业务是进行各种机器的运维(银行ATM机运维、电信服务商终端机运维等),结合该公司在运维业务方面积累的部分数据,在该框架上开发了一个运维人员推荐系统,主要采用了模糊综合评判方法,在发布一个维修订单后,综合考虑运维人员当前位置、服务状态、熟悉维修的故障类别等信息综合计算出一个值,根据这个值的大小给出运维人员推荐列表。
研究僧第一学期课程(第一学期)
计算几何、先进软件技术与开发工具、大数据应用这三门课程印象较深,计算几何完全是讲几何算法,每节课烧脑。先进软件技术与开发工具这门课采用了Storm+Kafka+MongoDB搭建了一个实时计算框架,来进行海量数据的实时处理,解决的问题参考的是2016阿里中间件大赛提出的问题,对淘宝双11数据进行实时的统计与计算。大数据这门课主要学习了几种常用的机器学习算法,包括朴素贝叶斯、SVM、线性回归、决策树等算法,并做了两个简单的例子:基于朴素贝叶斯的垃圾邮件分类,用回归算法做犯罪预测。
面基撰写的参与
本文发布于:2024-02-03 03:59:46,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170690398448506.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |