自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<abbr id="hdfo0"></abbr>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

用Python詞法分析Parser中tokenizer.h的實際應(yīng)用

作者：佚名 2010-03-25 15:10:07

開發(fā) 后端

這里閑談在Python詞法分析的實現(xiàn)在Parser目錄下的tokenizer.h和tokenizer.cpp。也包括介紹Python是用C語言實現(xiàn)的，其實現(xiàn)方式借鑒了很多面對對象的思想。

如果你在對Python詞法分析的實際操作中，你對其有不解之處時，你就可以點擊以下的文章對其進行了解，希望你對相關(guān)Python詞法分析的實現(xiàn)在Parser目錄下的tokenizer.h和tokenizer.cpp的內(nèi)容有所了解。

在Python詞法分析的實現(xiàn)在Parser目錄下的tokenizer.h和tokenizer.cpp。Python的其他部分會直接調(diào)用tokenizer.h中定義的函數(shù)，如下：

extern struct tok_state *PyTokenizer_FromString
(const char *);   
extern struct tok_state *PyTokenizer_FromFile
(FILE *, char *, char *);   
extern void PyTokenizer_Free(struct tok_state *);   
extern int PyTokenizer_Get(struct tok_state *,
 char **, char **);

這些函數(shù)均以PyTokenizer開頭。這是Python源代碼中的一個約定。雖然Python是用C語言實現(xiàn)的，其實現(xiàn)方式借鑒了很多面對對象的思想。拿詞法分析來說，這四個函數(shù)均可以看作PyTokenizer的成員函數(shù)。頭兩個函數(shù)PyTokenizer_FromXXXX可以看作是構(gòu)造函數(shù)，返回PyTokenizer的instance。

PyTokenizer對象內(nèi)部狀態(tài)，也就是成員變量，儲存在tok_state之中。PyTokenizer_Free可以看作是析構(gòu)函數(shù)，負(fù)責(zé)釋放PyTokenizer，也就是tok_state所占用的內(nèi)存。PyTokenizer_Get則是PyTokenizer的一個成員函數(shù)，負(fù)責(zé)取得在字符流中下一個Token。

Python詞法分析中這兩個函數(shù)均需要傳入tok_state的指針，和C++中需要隱含傳入this指針給成員函數(shù)的道理是一致的?？梢钥吹?，OO的思想其實是和語言無關(guān)的，即使是C這樣的結(jié)構(gòu)化的語言，也可以寫出面對對象的程序。

tok_state

tok_state等價于PyTokenizer這個class本身的狀態(tài)，也就是內(nèi)部的私有成員的集合。部分定義如下：

/* Tokenizer state */   
struct tok_state {   
/* Input state; buf <= cur <= inp <= end */   
/* NB an entire line is held in the buffer */   
char *buf; /* Input buffer, or NULL; malloc'ed if 
fp != NULL */   
char *cur; /* Next character in buffer */   
char *inp; /* End of data in buffer */   
char *end; /* End of input buffer if buf != NULL */   
char *start; /* Start of current token if not NULL */   
int done; /* E_OK normally, E_EOF at EOF, otherwise 
error code   
/* NB If done != E_OK, cur must be == inp!!! */   
FILE *fp; /* Rest of input; NULL if tokenizing a 
string */   
int tabsize; /* Tab spacing */   
int indent; /* Current indentation index */   
int indstack[MAXINDENT]; /* Stack of indents */   
int atbol; /* Nonzero if at begin of new line */   
int pendin; /* Pending indents (if > 0) or dedents 
(if < 0) */   
char *prompt, *nextprompt; /* For interactive 
prompting */   
int lineno; /* Current line number */   
int level; /* () [] {} Parentheses nesting level */   
/* Used to allow free continuations inside them */   
};

最重要的是buf, cur, inp, end, start。這些field直接決定了緩沖區(qū)的內(nèi)容：

buf是緩沖區(qū)的開始。假如PyTokenizer處于字符串模式，那么buf指向字符串本身，否則，指向文件讀入的緩沖區(qū)。cur指向緩沖區(qū)中下一個字符。inp指向緩沖區(qū)中有效數(shù)據(jù)的結(jié)束位置。PyTokenizer是以行為單位進行處理的，每一行的內(nèi)容存入從buf到inp之間，包括\n。一般情況下，PyTokenizer會直接從緩沖區(qū)中取下一個字符，一旦到達inp所指向的位置，就會準(zhǔn)備取下一行。

當(dāng)PyTokenizer處于不同模式下面，具體的行為會稍有不同。end是緩沖區(qū)的結(jié)束，在字符串模式下沒有用到。start指向當(dāng)前token的開始位置，如果現(xiàn)在還沒有開始分析token，start為NULL。以上就是對在Python詞法分析的實現(xiàn)在Parser目錄下的tokenizer.h和tokenizer.cpp相關(guān)的內(nèi)容的介紹，忘你會有所收獲。

【編輯推薦】

Python中文轉(zhuǎn)換url編碼的實際操作步驟介紹
Python學(xué)習(xí)入門中的先搭環(huán)境的具體應(yīng)用的方法介紹
Python源碼分析的實際相關(guān)操作步驟解析
Python安裝的步驟操作其實是件很容易的事
對Python源代碼組織的相關(guān)實際操作步驟解析

責(zé)任編輯：佚名來源：博客園

Python詞法分析

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營