RDD是无结构的,Spark 1.6引入了Structured API,后者是多数场景下更为适用。
Spark SQL基于Spark Core,包含两部分:
- DataFrame & Dataset
- Catalyst optimizer
结构化数据结构具有schema
定义。
no math, little hacker
RDD是无结构的,Spark 1.6引入了Structured API,后者是多数场景下更为适用。
Spark SQL基于Spark Core,包含两部分:
结构化数据结构具有schema
定义。