变量var声明可变变量;val声明不可变变量。val声明的不可变变量,不希望数据被改变,RDD内部的数据都是不可变,所以在Spark中一般都是使用val。//下面声明了一个不可变变量result,result的值不可改变。scala> val result=2+10result: Int = 12//假若修改result的值,会提示出错,如下:scala> result=13
基本数据类型的自动转换操作Scala自己可以完成基本数据类型的自动转换操作。//输入整数10,按Tab键盘,可以看见它本身的很多方法:scala> 10.totoByte toChar toDouble toFloat toInt toLong toShort toStringscala> 10.toStringres5: String = 10scala> 0.to(5)res6:scala.collection.immutable.Range.Inclusive = Range(0, 1, 2, 3, 4, 5)给了我们一个不可变的集合,获得的结果是:0~5,所以Scala一切皆对象!
Scala隐式转换当类型本身没有没有这个方法,但是又需要调用这个方法时,内部就会自动触发隐式转换。刚才的示例中,Int本身没有to这样的方法,Scala引擎内部会隐式自动转换成RichInt,就像上面0.to(5)这样的调用,RichInt对象类型才有to这样的函数。scala> 1+1res7: Int = 2//因为Scala一切皆对象,所以以上示例又可以写成:scala> 1.+(1)res9: Double = 2.0//这个示例,内部其实就是Int的一个隐式转换,+是类的一个方法。//Scala没有++、---操作运算:scala> var age=10age: Int = 10scala> age++
求最大、最小值 scala> min(20,4)
apply工厂构造实现方法在Spark中,大量的实例的构造都是使用了apply方式。scala> Array(1,2,3,4)res15: Array[Int] = Array(1, 2, 3, 4)scala> val array=Array(1,2,3,4)array: Array[Int] = Array(1, 2, 3, 4)//array是一个声明整数类型的数组变量, 其实内部是自动调用了Array.apply方法,等同如下:scala> val array =Array.apply(1,2,3,4)array: Array[Int] = Array(1, 2, 3, 4)
条件控制、循环// if表达式示例:scala> if(age>=18) '成年人' else '小孩'res16: String = 成年人scala> val result=if(age>=18) '成年人'else '小孩'result: String = 成年人scala> resultres17: String = 成年人scala> val result = if(age>=18){ | 'adult' | buffered=10 | buffered | }//以上一个代码块,代码块后面有个返回值buffered,代码块的返回值就是最后一行的值。
填充占位符scala>printf('%s是大数据框架的未来', 'Spark') //%s是占位符Spark是大数据框架的未来
读取内容readLine用于读取输入的内容scala> readLine //此时敲入Scala之后,然后回车res28: String =Scalascala> res28res29: String =Scala//补充说明,readLine是一个方法,如果方法如果没有参数,那么可以不带括号,readLine()跟readLine效果一样。
循环//声明一个可变变量,初始值为100scala> var element=100 element: Int = 100//while循环示例:scala> while(element>90){ | println(element) | element -= 1 | }194939291scala> 0 to elementres32:scala.collection.immutable.Range.Inclusive = Range(0, 1, 2, 3, 4, 5, 6, 7, 8,9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28,29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48,49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68,69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88,89, 90)//for循环遍历并打印scala> for(i<-80 to element)println(i) 8//循环并增加条件判断scala> for(i<-0 to element ifi%2==0) print(i+' ') 0 2 4 6 8 10 12 14 16 18 20 22 24 26 2830 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 8082 84 86 88 90//for循环,并break退出scala> importscala.util.control.Breaks._ //添加break引用importscala.util.control.Breaks._scala> for(i<-1 to 10){ | if(i==4) break | println(i) | }123scala.util.control.BreakControl//循环,并returnscala> val n=5n: Int = 5scala> def f1:Any = { | for(i <-1 to 10){ | if(i==n) return i | println(i) | } | }f1: Anyscala> f11234res1: Any = 5//解释以上代码块,def是定义一个函数。f1就是一个函数。
Scala函数入门实战函数示例函数的定义使用def关键字,并且函数体最后有返回值。//声明了一个函数f3,两个参数:param1是String类型,param2为Int类型。param2默认值为30,因为有了默认值,那么在调用上可以不传param2。scala> deff3(param1:String, param2:Int=30) = param1 + param2f3: (param1: String, param2: Int)String//调用函数f3,传入第一个参数param1值为Spark,没有传入第二个参数,默认为30。scala> f3('Spark')res4: String = Spark30//带名参数调用,即在函数调用时,显示指定参数名,并不按顺序传入。scala> f3(param2=100, param1='Scala')res5: String = Scala100//变长参数, 定义了一个sum函数,参数numbers是变成参数,即传入的Int变量个数不定。在函数体中,对传入的全部Int变量进行循环遍历并累计求和,最后把结果返回。scala> def sum(numbers: Int*)={varresult=0; for(element<-numbers)result +=element; result}sum: (numbers: Int*)Intscala> sum(1,2,3,4,5,6,7,8,9,10)res1: Int = 55//下面示例是一个非常经典的语法scala> sum(1 to 10: _*) // _* 表示提取里面的每个元素,然后作为变长参数传递res3: Int = 55过程——没有返回值的函数就是过程。//这是一个函数scala> def morning(content:String) = 'Good' +contentmorning: (content: String)String//这是一个过程scala> def morning(content:String) { println('Good' + content)}morning: (content: String)Unit//强制声明一个过程scala> def morning(content:String):Unit = 'Good' + contentmorning: (content: String)Unit声明lazy类型scala> import scala.io.Source._ //导入引用库import scala.io.Source._//声明一个lazy类型的变量content,打开一个不存在的文件。scala> lazy val content = fromFile('/root/txt')content: scala.io.BufferedSource =