自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

淺談Java讀取Csv實(shí)踐

開發(fā) 后端
CSV是逗號(hào)分隔型取值格式的英文簡(jiǎn)稱(英文全稱為Comma Separated Values),是一種純文本格式,用來存儲(chǔ)數(shù)據(jù)。本文主要介紹Java讀取Csv的方法。

CSV中,數(shù)據(jù)的字段由逗號(hào)分開,程序通過讀取文件重新創(chuàng)建正確的字段,方法是每次遇到逗號(hào)時(shí)開始新一段數(shù)據(jù)。CSV文件是一個(gè)計(jì)算機(jī)數(shù)據(jù)文件用于執(zhí)行審判和真正的組織工具,逗號(hào)分隔的清單。CSV文件是用于數(shù)字存儲(chǔ)的數(shù)據(jù)結(jié)構(gòu)表的形式列出,每個(gè)相關(guān)的項(xiàng)目(會(huì)員)的一組是與他人也由逗號(hào)隔開的規(guī)定。中的每一行都CSV文件對(duì)應(yīng)表中的行。在一條線,字段用逗號(hào)分隔,每一個(gè)領(lǐng)域?qū)儆谝粋€(gè)表列。CSV文件常常被用于移動(dòng)表格數(shù)據(jù)之間的兩個(gè)不同的計(jì)算機(jī)程序,例如關(guān)系數(shù)據(jù)庫程序和電子表格程序。讓我們一起來探討Java是怎樣讀取CSV的??

看項(xiàng)目中以前的處理方式是直接用用java IO類庫讀取Csv文件,實(shí)際處理中發(fā)現(xiàn)Csv文件本身包含了對(duì)各種特殊字符的處理信息。最常見的比如:

1. 對(duì)包含特殊字符的字符串?dāng)?shù)據(jù)首尾加雙引號(hào)

2. 對(duì)數(shù)據(jù)中的單個(gè)雙引號(hào)前加單個(gè)雙引號(hào)

其它...

所以用Java IO讀到的字符串全是經(jīng)過處理后的字符串,在某些場(chǎng)景下是不符合預(yù)期需求的。比如我需要的是不做任何處理的原始內(nèi)容。

項(xiàng)目中另一種常見的文件格式Excel用了POI來處理,但是POI不支持Csv格式,于是找到了javacsv。

代碼很簡(jiǎn)單:

Java代碼

 

  1. public List importCsv(String file)   
  2. {  
  3. List list = new ArrayList();  
  4. CsvReader reader = null;  
  5. try   
  6. {  
  7. //初始化CsvReader并指定列分隔符和字符編碼  
  8. reader = new CsvReader(file, ',', Charset.forName("GBK"));  
  9. while (reader.readRecord())   
  10. {  
  11. //讀取每行數(shù)據(jù)以數(shù)組形式返回  
  12. String[] str = reader.getValues();  
  13. if (str != null && str.length > 0)   
  14. {  
  15. if (str[0] != null && !"".equals(str[0].trim()))   
  16. {  
  17. list.add(str);  
  18. }  
  19. }  
  20. }  
  21. }   
  22. catch (FileNotFoundException e) {  
  23. log.error("Error reading csv file.",e);  
  24. }   
  25. catch (IOException e)   
  26. {  
  27. log.error("",e);  
  28. }  
  29. finally 
  30. {  
  31. if(reader != null)  
  32. //關(guān)閉CsvReader  
  33. reader.close();  
  34. }  
  35. return list;  

 

以上代碼有幾個(gè)要點(diǎn):

1 初始化CsvReader時(shí)指定分隔符和字符編碼,如果不指定,默認(rèn)分別為逗號(hào)和ISO-8859-1,我用了GBK,具體使用時(shí)要看當(dāng)時(shí)的字符編碼而定。

2 讀取每行數(shù)據(jù),返回字符串?dāng)?shù)組,數(shù)組內(nèi)的順序即文件數(shù)據(jù)列的順序

3 ***記得關(guān)閉CsvReader

是不是很簡(jiǎn)單,返回的數(shù)組格式也正好是我想要的,而且拿到是原始的數(shù)據(jù),沒有經(jīng)過特殊字符處理。

有些同學(xué)質(zhì)疑特殊字符未經(jīng)處理,插到數(shù)據(jù)庫會(huì)出錯(cuò),其實(shí)大可不必我們手工處理,一些基礎(chǔ)組件比如JDBC的preparedstatement已經(jīng)包含了對(duì)特殊字符的處理,我們只要以綁定參數(shù)的形式來傳送這些包含特殊字符的數(shù)據(jù)就可以。常用的持久化框架底層也封裝了JDBC,自然也對(duì)特殊字符做了處理。

【編輯推薦】

  1. 學(xué)習(xí)java編程的八大優(yōu)勢(shì)
  2. 解析Java平臺(tái)的構(gòu)架與版本
  3. 體驗(yàn)Hyper-V 2.0中的CSV功能
  4. Java架構(gòu)設(shè)計(jì)和開發(fā)中的小技巧
責(zé)任編輯:于鐵 來源: 中國(guó)IT實(shí)驗(yàn)室
相關(guān)推薦

2011-04-02 09:30:46

JavaIO

2009-07-09 14:56:23

Servlet讀取

2017-11-10 13:02:44

iOSUI代碼

2016-08-31 09:58:55

JavascriptFlux架構(gòu)

2009-08-20 09:41:36

2021-07-28 13:29:57

大數(shù)據(jù)PandasCSV

2023-06-12 15:43:44

鴻蒙智能家居開發(fā)

2010-02-01 13:26:58

C++讀取CSV文件

2023-12-05 13:47:00

Java開發(fā)

2018-08-29 13:57:40

前端性能測(cè)試Html5

2015-01-15 17:41:54

soa云計(jì)算BPEL

2023-03-28 07:42:03

2011-07-28 18:11:18

Objective-C Cocoa 編程

2024-06-25 09:08:24

.NETCSV文件

2019-01-02 13:45:19

2022-12-14 10:09:44

研發(fā)效能

2024-10-23 21:21:32

2009-08-21 11:02:55

C#異步調(diào)用

2025-02-17 01:00:00

.NET性能服務(wù)器

2022-07-11 12:14:56

Pandashtmljson
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)