2012年1月13日 星期五

[ The python tutorial ] 7. Input and Output


翻譯自 這裡
Input and Output :
這裡將介紹 Python 的 IO 操作, 包括顯示訊息到 Console 與 檔案操作等.

Fancier Output Formatting :
到目前為止我們都是使用函式 print() 來將訊息輸出到 Console. 有時你可能希望能針對輸出進行類似其他語言 printf() 的功能, 幸運的是 Python 的 string 物件本身就提供類似的函式如str.format(). 透過他你可以使用類似 printf() 的功能. 接著你可能會遇到如何將其他物件轉成 string 物件, 則可以使用函式 repr() 或 str(). 至於這兩個函式使用差別可以參考下面說明 :
The str() function is meant to return representations of values which are fairly human-readable, while repr() is meant to generate representations which can be read by the interpreter (or will force a SyntaxError if there is not equivalent syntax). For objects which don’t have a particular representation for human consumption,str() will return the same value as repr(). Many values, such as numbers or structures like lists and dictionaries, have the same representation using either function. Strings, in particular, have two distinct representations.

底下為範例說明 :


底下是兩種輸出 squares and cubes 表格方式 :


上面用到一個不錯的函式 str.rjust(), 你可以將輸出文字向右靠齊並設定 column 的寬度為某個長度. 事實上類似的還有 str.ljust() (向左靠齊) 與 str.center() (置中). 當你的實際字串比設定的 column 寬度還要大時, 則字串會原封不動的輸出, 並不會有 truncation 發生. 還有一個實用的函式 str.zfill(), 他可以把你不夠的位數補 0 :
>>> '12'.zfill(5) # 字串只有兩位, 故補 3 個前置 0
'00012'
>>> '-3.14'.zfill(7) # 負數會被保留在最前面, 另外 '.' 也佔一個位數.
'-003.14'
>>> '3.1415926'.zfill(5) # 字串位數比設定的多, 保留原字串
'3.1415926'

底下是字串函式 str.format() 用法 :
>>> print('We are the {} who say "{}!"'.format('knights', 'Ni')) # {} 會依序替換成後面給的 arguments
We are the knights who say "Ni!"
>>> print('We are the {0} who say "{1}!"'.format('knights', 'Ni')) # 你也可以給定數字說明對應後面第幾個參數. 從 0 開始
We are the knights who say "Ni!"
>>> print('We are the {1} who say "{2}!"'.format('knights', 'Ni'))
Traceback (most recent call last):
File "", line 1, in
IndexError: tuple index out of range
>>> print('We are the {} who say "Ni!"'.format('knights', 'Ni')) # {} 的個數比後面參數少沒關係
We are the knights who say "Ni!"
>>> print('We are the {} who say "{}!" {}'.format('knights', 'Ni')) # 但是 {} 個數不能比後面參數多 !
Traceback (most recent call last):
File "", line 1, in
IndexError: tuple index out of range

str.format() 用法也可以結合key/value pair :
>>> print('The story of {0}, {1}, and {other}.'.format('Bill', 'Manfred',
other='Georg'))
The story of Bill, Manfred, and Georg.

'!a' (apply ascii()), '!s' (apply str()) and '!r' (apply repr()) can be used to convert the value before it is formatted :
>>> import math
>>> print('The value of PI is approximately {}.'.format(math.pi))
The value of PI is approximately 3.14159265359.
>>> print('The value of PI is approximately {!r}.'.format(math.pi))
The value of PI is approximately 3.141592653589793.

另外你可以使用 ':' 將數字格式做更細緻的設定 :
>>> import math
>>> print('The value of PI is approximately {0:.3f}.'.format(math.pi)) # .3f 取小數後三位.
The value of PI is approximately 3.142.

另外 ':' 可以用來設定欄位的寬度, 在製作表格時會很方便 :
>>> table = {'John': 7810, 'Jack': 1234, 'Ken': 7676}
>>> for name, phone in table.items():
... print('{0:10} ==> {1:10d}'.format(name, phone)) :10 設定 欄位寬度為 10. 
...
Ken ==> 7676
John ==> 7810
Jack ==> 1234

上面的用法透過 ‘**’ 可以更簡潔 :
>>> table = {'John': 7810, 'Jack': 1234, 'Ken': 7676}
>>> print('John: {John:d}; Jack: {Jack:d}; Ken: {Ken:d}'.format(**table))
John: 7810; Jack: 1234; Ken: 7676

其實更早 Python 版本是使用 '%' 來達到上述的功能. 底下是官網對這兩個用法定位的說明 :
Since str.format() is quite new, a lot of Python code still uses the % operator. However, because this old style of formatting will eventually be removed from the language, str.format() should generally be used. More information can be found in the Old String Formatting Operations section.

- Old string formatting
這邊稍微提一下舊版本的 Python 是使用 % 運算子來模擬類似 sprintf()-style format. 底下為其範例說明 :
>>> import math
>>> print('The value of PI is approximately %5.3f.' % math.pi)
The value of PI is approximately 3.142.

Reading and Writing Files :
我們使用函式 open() 來開啟檔案, 該函式會返回一個 file object. 並且通常該函式使用會用到兩個參數 open(filename, mode) :
>>> f = open('/tmp/workfile', 'w') #使用 write mode 打開 /tmp/workfile

由上可以知道第一個參數為檔案路徑, 第二個參數為操作模式 :
'r' (default) : when the file will only be read.
'w' : for only writing (an existing file with the same name will be erased)
'a' : opens the file for appending; any data written to the file is automatically added to the end
'r+' : opens the file for both reading and writing. The mode argument is optional;
'b' : appended to the mode opens the file in binary mode

預設檔案打開是使用 text mode, 讀寫檔案預設使用 UTF-8 encoding. 另外有 Platform dependency 的換行 (\n on Unix, \r\n on Windows) 也會被統一成 '\n'. 這個行為對 binary mode 有可能會造成 corrupt, 使用上要特別注意.

- Methods of File Objects
底下的範例操作會假設你已經開啟一個文件並以變數 f 作為你的 file object. 首先你可以使用 f.read(size) 來讀取檔案內容, 如果沒有給參數 size 或是 size 為負值則會讀出檔案所有內容並返為一個 string 或 bytes 物件. 如果 size 為正數, 則會讀取 size bytes 的內容, 如果已經讀到檔案結尾, 則會返回空字串 '' :
>>> f = open('test.txt', 'r') # 以 read mode 打開檔案 test.txt
>>> f.read(11) # 讀取 11 bytes 內容
'test line 1'
>>> f.read() # 讀取剩下的內容
'\ntest line 2'
>>> f.read(-1) # 因為已經到檔案結尾, 接著讀取會返回 ''
''

如果你想一次讀一行內容, 你可以使用函式 f.readline(). 要注意的是每一行的換行字元 '\n' 還是會被讀進來 (除了最後一行外). 一樣的是如果你已經讀到檔案結尾, 接著讀出來的會是空字串 :
>>> f.readline() # 讀出檔案第一行
'test line 1\n'
>>> f.readline() # 讀出檔案第二行
'test line 2\n'
>>> f.readline() # 讀出檔案第三行; 空白行
'\n'
>>> f.readline() # 讀出檔案最後一行
'test line 4'
>>> f.readline() # 結尾後讀出來的都是 ''
''

如果要將檔案讀出並一行行存放在串列中, 可以使用 f.readlines(), 它提供一個參數 sizehint 讓你可以決定讀出內容最多不超過指定大小, 但是讀出來的行並不會被 truncate. 通常用在讀大檔案時 :
>>> f.readlines()
['test line 1\n', 'test line 2\n', '\n', 'test line 4']

另外你也可以使用 for loop 一行行讀出檔案內容 (因為 end='', 此時換行符號為檔案中的換行而不會有 print() 函式的換行) :
>>> for line in f:
... print(line, end='')
...
test line 1
test line 2

test line 4

如果要寫資料到檔案, 可以使用函式 f.write(string). 返回值為寫了多少 bytes 到檔案 :
>>> f = open('test1.txt', 'w')
>>> f.write('This is a test\n')
15

要注意的是如果你要寫到檔案的物件不是 string, 請先使用 str() 函式轉換 (否則會出現 TypeError) :
>>> value = ('the answer', 42)
>>> s = str(value)
>>> f.write(s)
18

使用函式 f.tell() 可以讓你知道目前指標在檔案的哪個位置 (目前讀了多少 bytes). 如果你要變更指標位置可以使用函式 f.seek(offset, from_what). offset 是從參數 from_what 開始計算, 另外在 text mode 你只能使用 from_what=0 (唯一的例外就是可以使用 f.seek(0,2) 跳到檔案結尾處, 否則會出現 io.UnsupportedOperation:). 底下是參數 from_what 說明 :
from_what value of 0 measures from the beginning of the file, 1 uses the current file position, and 2 uses the end of the file as the reference point. from_what can be omitted and defaults to 0

範例說明 :
>>> f = open('binary','rb+')
>>> f.write(b'0123456789abcdef')
16
>>> f.seek(5) # Go to the 6th byte in the file
5
>>> f.read(1)
b'5'
>>> f.seek(-3, 2) # Go to the 3rd byte before the end
13
>>> f.read(1)
b'd'

如果你要關閉檔案讀寫可以使用 f.close() :
>>> f.close()
>>> f.read()
Traceback (most recent call last):
File "", line 1, in ?
ValueError: I/O operation on closed file

另外你可以使用關鍵字 with 在你離開程式或是發生 exception 時自動幫你關閉開啟的 io. 類似的功能也可以使用 try-finally 完成 :
>>> with open('/tmp/workfile', 'r') as f:
... read_data = f.read()
>>> f.closed
True

file object 還可使用函式 isatty() 與 truncate(). 用法可以到 Library Reference 找到詳細說明.

- The pickle Module
前面說明我們知道使用 file object 的函式 write() 必須傳入 string 物件, 也就是說如果你要寫入其他物件如 tuple, 字典物件或串列, 則必須進行轉換. 在 Python 提供標準模組 pickle 來幫你將物件轉換成對應 string 物件的映射關係, 這樣的動作稱為 pickling ; 甚至透過剛剛建立的 string 物件映射, 你可以重建原來的物件, 這樣的動作稱為 unpickling. 透過這樣的動作你可以將物件存放在檔案或是在網路中傳遞. 假設你有一個物件 x ; 以及一個 file object 的變數 f, 則你可以如下將物件 x 寫到 f 中 :
pickle.dump(x, f)

如果你要從 f 中載回原物件, 則可以如下操作 :
x = pickle.load(f)

底下是官網對該模組的簡介 :
pickle is the standard way to make Python objects which can be stored and reused by other programs or by a future invocation of the same program; the technical term for this is a persistent object. Because pickle is so widely used, many authors who write Python extensions take care to ensure that new data types such as matrices can be properly pickled and unpickled.
This message was edited 38 times. Last update was at 13/01/2012 18:56:46

沒有留言:

張貼留言

[Git 常見問題] error: The following untracked working tree files would be overwritten by merge

  Source From  Here 方案1: // x -----删除忽略文件已经对 git 来说不识别的文件 // d -----删除未被添加到 git 的路径中的文件 // f -----强制运行 #   git clean -d -fx 方案2: 今天在服务器上  gi...