有几种监控Spark应用的手段: WEB UI, metrics和外部手段
Spark 配置指南
Spark可以在三个地方配置系统:
- Spark属性控制大部分的应用参数。 这些属性可以通过SparkConf对象, 或者Java系统属性.
- 环境变量可以为每台机器配置,比如IP地址, 通过每个节点上的conf/spark-env.sh脚本.
- 可同通过log4j.properties配置日志.
Spark 应用提交指南
Spark bin文件夹下的spark-submit脚本用来启动集群中的应用。 它使用统一的提交接口支持各种类型的集群服务器, 这样你你就不必为每种类型都配置自己的应用.
Spark 开发指南
本文档由colobu翻译自Spark官方文档 Spark Programming Guide,当前版本是1.1.1。
0.8.1版本由taobao技术部团队的月禾mm初审,以及微博上的Spark达人@crazyjvm复审。 0.8.1译文链接
Spring Data for Mongo 介绍
本文将快速介绍Spring Data for Mongo的使用。
Spring Data for MongoDB是Spring Data的一个子模块。 目标是为MongoDB提供一个相近的一致的基于Spring的编程模型。
Spring Data for MongoDB核心功能是映射POJO到Mongo的DBCollection中的文档,并且提供Repository 风格数据访问层。
相似的ORM/持久化框架还有
- morphia: MongoDB官方支持的ORM框架,可以很好的和Spring, Guice等DI框架集成,使用起来很方便。
- Hibernate OGM: Hibernate提供了Hibernate风格的NoSql ORM框架。
- jongo: 提供Mongo shell一样灵活的查询,并且提供ORM by Jackson,和Mongo java driver一样快。
MongoDB 陷阱与诀窍
本文收集了应用MongoDB(以及Spring-data-mongo)的一些技巧,坑和诀窍。 排名不分先后,文末附有出处。