簡潔方便的集合處理:Java 8 stream流
java 8已經(jīng)發(fā)行好幾年了,前段時間java 12也已經(jīng)問世,但平時的工作中,很多項目的環(huán)境還停留在java1.7中。而且java8的很多新特性都是革命性的,比如各種集合的優(yōu)化、lambda表達式等,所以我們還是要去了解java8的魅力。
今天我們來學習java8的Stream,并不需要理論基礎(chǔ),直接可以上手去用。
我接觸stream的原因,是我要搞一個用戶收入消費的數(shù)據(jù)分析。起初的統(tǒng)計篩選分組都是打算用sql語言直接從mysql里得到結(jié)果來展現(xiàn)的。但在操作中我們發(fā)現(xiàn)這樣頻繁地訪問數(shù)據(jù)庫,性能會受到很大的影響,分析速度會很慢。所以我們希望能通過訪問一次數(shù)據(jù)庫就拿到所有數(shù)據(jù),然后放到內(nèi)存中去進行數(shù)據(jù)分析統(tǒng)計過濾。
接著,我看了stream的API,發(fā)現(xiàn)這就是我想要的。
在java中我們稱Stream為『流』,我們經(jīng)常會用流去對集合進行一些流水線的操作。stream就像工廠一樣,只需要把集合、命令還有一些參數(shù)灌輸?shù)?/span>流水線中去,就可以加工成得出想要的結(jié)果。這樣的流水線能大大簡潔代碼,減少操作。
原集合 —> 流 —> 各種操作(過濾、分組、統(tǒng)計) —> 終端操作
Stream流的操作流程一般都是這樣的,先將集合轉(zhuǎn)為流,然后經(jīng)過各種操作,比如過濾、篩選、分組、計算。***的終端操作,就是轉(zhuǎn)化成我們想要的數(shù)據(jù),這個數(shù)據(jù)的形式一般還是集合,有時也會按照需求輸出count計數(shù)。下文會一一舉例。
首先,定義一個用戶對象,包含姓名、年齡、性別和籍貫四個成員變量:
- import lombok.AllArgsConstructor;
- import lombok.Builder;
- import lombok.Data;
- import lombok.NoArgsConstructor;
- import lombok.extern.log4j.Log4j;
- @Data
- @NoArgsConstructor
- @AllArgsConstructor
- @Log4j
- @Builder
- public class User {
- //姓名
- private String name;
- //年齡
- private Integer age;
- //性別
- private Integer sex;
- //所在省市
- private String address;
- }
這里用lombok簡化了實體類的代碼。
然后創(chuàng)建需要的集合數(shù)據(jù),也就是源數(shù)據(jù):
- //1.構(gòu)建我們的list
- List<User> list= Arrays.asList(
- new User("鋼鐵俠",40,0,"華盛頓"),
- new User("蜘蛛俠",20,0,"華盛頓"),
- new User("趙麗穎",30,1,"湖北武漢市"),
- new User("詹姆斯",35,0,"洛杉磯"),
- new User("李世民",60,0,"山西省太原市"),
- new User("蔡徐坤",20,1,"陜西西安市"),
- new User("葫蘆娃的爺爺",70,0,"山西省太原市")
- );
3.1 過濾
1)創(chuàng)建流 stream() / parallelStream()
-
stream() : 串行流
-
parallelStream(): 并行流
2)filter 過濾(T-> boolean)
比如要過濾年齡在40歲以上的用戶,就可以這樣寫:
- List<User> filterList = list.stream().filter(user -> user.getAge() >= 40)
- .collect(toList());
filter里面,->箭頭后面跟著的是一個boolean值,可以寫任何的過濾條件,就相當于sql中where后面的東西,換句話說,能用sql實現(xiàn)的功能這里都可以實現(xiàn)
打印結(jié)果:
3)distinct 去重
和sql中的distinct關(guān)鍵字很相似。為了看到效果,此處在原集合中加入一個重復的人,就選擇鋼鐵俠吧,復聯(lián)4鋼鐵俠不幸遇害,大家還是比較傷心的。
- List<User> list= Arrays.asList(
- new User("鋼鐵俠",40,0,"華盛頓"),
- new User("鋼鐵俠",40,0,"華盛頓"),
- new User("蜘蛛俠",20,0,"華盛頓"),
- new User("趙麗穎",30,1,"湖北武漢市"),
- new User("詹姆斯",35,0,"洛杉磯"),
- new User("李世民",60,0,"山西省太原市"),
- new User("蔡徐坤”,18,1,"陜西西安市"),
- new User("葫蘆娃的爺爺",70,0,"山西省太原市")
- );
- //distinct 去重
- List<User> distinctList = filterList.stream().distinct()
- .collect(toList());
打印結(jié)果:
4)sorted排序
如果流中的元素的類實現(xiàn)了 Comparable 接口,即有自己的排序規(guī)則,那么可以直接調(diào)用 sorted() 方法對元素進行排序,如:
- Comparator.comparingInt
反之, 需要調(diào)用 sorted((T, T) -> int) 實現(xiàn) Comparator 接口。
- //sorted()
- List<User> sortedList = distinctList.stream().sorted(Comparator.comparingInt(User::getAge))
- .collect(toList());
打印結(jié)果:
結(jié)果按照年齡從小到大進行排序。
5)limit() 返回前n個元素
如果想知道這里面年齡最小的是誰,可作如下操作:
- //limit 返回前n個元素
- List<User> limitList = sortedList.stream().limit(1)
- .collect(toList());
6)skip()
與limit恰恰相反,skip的意思是跳過,也就是去除前n個元素。
打印結(jié)果:
果然,前兩個人都被去除了,只剩下最老的葫蘆娃爺爺。
3.2 映射
1)map(T->R)
map是將T類型的數(shù)據(jù)轉(zhuǎn)為R類型的數(shù)據(jù),比如我們想要設置一個新的list,存儲用戶所有的城市信息。
- //map(T->R)
- List<String> cityList = list.stream().map(User::getAddress).distinct().collect(toList());
打印結(jié)果:
2)flatMap(T -> Stream)
將流中的每一個元素 T 映射為一個流,再把每一個流連接成為一個流。
- //flatMap(T -> Stream<R>)
- List<String> flatList = new ArrayList<>();
- flatList.add("唱,跳");
- flatList.add("rape,籃球,music");
- flatList = flatList.stream().map(s -> s.split(",")).flatMap(Arrays::stream).collect(toList());
打印結(jié)果:
這里原集合中的數(shù)據(jù)由逗號分割,使用split進行拆分后,得到的是Stream<string[] style="text-align: justify;-webkit-print-color-adjust: exact;">,字符串數(shù)組組成的流,要使用flatMap的</string[]>
Arrays::stream
將Stream<string[] style="-webkit-print-color-adjust: exact;">轉(zhuǎn)為Stream,然后把流相連接,組成了完整的唱、跳、rap、籃球和music。</string[]>
3.3 查找
1)allMatch(T->boolean)
檢測是否全部滿足參數(shù)行為,假如這些用戶是網(wǎng)吧上網(wǎng)的用戶名單,那就需要檢查是不是每個人都年滿18周歲了。
- boolean isAdult = list.stream().allMatch(user -> user.getAge() >= 18);
打印結(jié)果:
- true
2)anyMatch(T->boolean)
檢測是否有任意元素滿足給定的條件,比如,想知道同學名單里是否有女生。
- //anyMatch(T -> boolean) 是否有任意一個元素滿足給定的條件
- boolean isGirl = list.stream().anyMatch(user -> user.getSex() == 1);
打印結(jié)果:
- true
說明集合中有女生存在。
3)noneMatch(T -> boolean)
流中是否有元素匹配給定的 T -> boolean 條件。
比如檢測有沒有來自巴黎的用戶。
- boolean isLSJ = list.stream().noneMatch(user -> user.getAddress().contains("巴黎"));
打印結(jié)果:
- true
打印true說明沒有巴黎的用戶。
4)findFirst( ):找到***個元素
- Optional<User> fristUser = list.stream().findFirst();
打印結(jié)果:
- User(name=鋼鐵俠, age=40, sex=0, address=華盛頓)
5)findAny():找到任意一個元素
- Optional<User> anyUser = list.stream().findAny();
打印結(jié)果:
- User(name=鋼鐵俠, age=40, sex=0, address=華盛頓)
這里我們發(fā)現(xiàn)findAny返回的也總是***個元素,那么為什么還要進行區(qū)分呢?因為在并行流 parallelStream() 中找到的確實是任意一個元素。
- Optional<User> anyParallelUser = list.parallelStream().findAny();
打印結(jié)果 :
- Optional[User(name=李世民, age=60, sex=0, address=山西省太原市)]
3.4 歸納計算
1)求用戶的總?cè)藬?shù)
- long count = list.stream().collect(Collectors.counting());
我們可以簡寫為:
- long count = list.stream().count();
運行結(jié)果:
- 8
2)得到某一屬性的***最小值
- // 求***年齡
- Optional<User> max = list.stream().collect(Collectors.maxBy(
- Comparator.comparing(User::getAge)));
- // 求最小年齡
- Optional<User> min = list.stream().collect(Collectors.minBy(
- Comparator.comparing(User::getAge)));
運行結(jié)果
3)求年齡總和是多少
- // 求年齡總和
- int totalAge = list.stream().collect(Collectors.summingInt(User::getAge));
運行結(jié)果:
- 313
我們經(jīng)常會用BigDecimal來記錄金錢,假設想得到BigDecimal的總和:
- // 獲得列表對象金額, 使用reduce聚合函數(shù),實現(xiàn)累加器
- BigDecimal sum = myList.stream() .map(User::getMoney)
- .reduce(BigDecimal.ZERO,BigDecimal::add);
4)求年齡平均值
- //求年齡平均值
- double avgAge = list.stream().collect(
- Collectors.averagingInt(User::getAge));
運行結(jié)果:
- 39.125
5)一次性得到元素的個數(shù)、總和、***值、最小值
- IntSummaryStatistics statistics = list.stream().collect(
- Collectors.summarizingInt(User::getAge));
運行結(jié)果:
6)字符串拼接
要將用戶的姓名連成一個字符串并用逗號分割。
- String names = list.stream().map(User::getName)
- .collect(Collectors.joining(", "));
運行結(jié)果:
- 鋼鐵俠, 鋼鐵俠, 蜘蛛俠, 趙麗穎, 詹姆斯, 李世民, 蔡徐坤, 葫蘆娃的爺爺
3.5 分組
在數(shù)據(jù)庫操作中,我們經(jīng)常通過GROUP BY關(guān)鍵字對查詢到的數(shù)據(jù)進行分組,java8的流式處理也提供了分組的功能。使用Collectors.groupingBy來進行分組。
1)可以根據(jù)用戶所在城市進行分組
- Map<String, List<User>> cityMap = list.stream()
- .collect(Collectors.groupingBy(User::getAddress));
結(jié)果是一個map,key為不重復的城市名,value為屬于該城市的用戶列表。已經(jīng)實現(xiàn)了分組。
2)二級分組,先根據(jù)城市分組再根據(jù)性別分組
- Map<String, Map<Integer, List<User>>> group = list.stream().collect(
- Collectors.groupingBy(User::getAddress, // 一級分組,按所在地區(qū)
- Collectors.groupingBy(User::getSex))); // 二級分組,按性別
運行結(jié)果:
3)如果僅僅想統(tǒng)計各城市的用戶個數(shù)是多少,并不需要對應的list
按城市分組并統(tǒng)計人數(shù):
- Map<String, Long> cityCountMap = list.stream()
- .collect(Collectors.groupingBy(User::getAddress,Collectors.counting()));
運行結(jié)果:
4)當然,也可以先進行過濾再分組并統(tǒng)計人數(shù)
- Map<String,Long> map = list.stream().filter(user -> user.getAge() <= 30)
- .collect(Collectors.groupingBy(User::getAddress,Collectors.counting()));
運行結(jié)果:
5)partitioningBy 分區(qū)
分區(qū)與分組的區(qū)別在于,分區(qū)是按照 true 和 false 來分的,因此partitioningBy 接受的參數(shù)的 lambda 也是 T -> boolean
- //根據(jù)年齡是否小于等于30來分區(qū)
- Map<Boolean, List<User>> part = list.stream()
- .collect(partitioningBy(user -> user.getAge() <= 30));
運行結(jié)果:
到目前為止,stream的功能我們已經(jīng)用了很多了,感覺有點眼花繚亂卻無所不能,stream能做的事情遠遠不止這些。
我們可以多學習使用stream,把原來復雜的sql查詢,一遍又一遍地for循環(huán)的復雜代碼重構(gòu),讓代碼更簡潔易懂,可讀性強。
【本文是51CTO專欄機構(gòu)宜信技術(shù)學院的原創(chuàng)文章,微信公眾號“宜信技術(shù)學院( id: CE_TECH)”】