python에서 작성된 데이터들을 파일에 저장할 필요가 있다. 저장할 파일을 생성하고 그 파일을 열수 있기 위해 사용되는 방법들이다.
우선 파일을 생성하고 열 경우 그 방식을 정해주어야 하는데 이것을 모드라고 한다. 예로서 저장할 파일이 텍스트 파일이라면 텍스트모드, 그림(바이너리)파일이면 바이너리모드를 설정해야 한다. 다음의 표는 모드를 정한 것이다.
기호
|
모드
|
t
|
텍스트(디폴트)
|
r
|
읽기(디폴트)
|
w
|
쓰기
|
a
|
이어쓰기
|
+
|
읽기, 쓰기
|
*디폴트는 지정을 하지 않을 경우 자동으로 지정되는 방식임을 나타낸다.
1 쓰기모드
파일을 열고 쓰기를 할 경우 기존에 있는 파일의 경우 새로 쓴 내용은 기존 내용을 덮어쓴다.
import os
os.path.isfile('test.txt')
False
f=open('test.txt', 'w')
f.write("""open()함수는 python이 지정한 파일에 접근할 수 있게 한다.
그러나 isfile에 의해 test.txt의 유무를 파악한 결과 이러한 파일이 없다.
이 경우 지정된 이름의 파일이 생성된다. 또한 그 파일에 데이터를 쓰기 위해 쓰기 모드로 지정한다.""")
144
위의 144 문자 수를 나타낸다.
파일을 열고 작업한후 반드시 그 파일을 닫아 주어야 한다. 그래야 후속작업이 원활해진다.
즉, 파일의 내용을 저장하는 순서는 open → write →close 순서로 이루어진다.
f.close()
f=open('test.txt', 'w')
f.write('기존에 있는 파일의 경우 이 방식이면 덮어쓰기 된다.')
f.close()
f=open('test.txt','r')
저장한 파일을 읽기모드로 열어 내용을 확인하면 기존의 내용을 덮어쓰기 한것을 알 수 있다.
f.readlines()
['기존에 있는 파일의 경우 이 방식이면 덮어쓰기 된다.']
위의 표에서 나타낸것과 같이 덮어쓰지 않고 이어쓰기를 하기 위해서는 이어쓰기 모드 "a"로 지정해 주어야 한다.
또한 파일을 열고 작업한 후 다시 닫는 방식을 한번에 하기 위해서는 with 구문을 사용하면 별도로 close()함수 사용없이 자동 저장 후 파일을 닫는 과정이 일괄적으로 시행된다. 다음을 보자.
with open('test.txt','a') as f:
f.write('a로 지정하여 이어쓰기 모드이기 때문에 기전의 데이터가 보존된다.')
f=open('test.txt', 'r')
f.readlines()
['기존에 있는 파일의 경우 이 방식이면 덮어쓰기 된다.a로 지정하여 이어쓰기 모드이기 때문에 기전의 데이터가 보존된다.']
2 읽기모드
위에서와 같이 'r' 로 지정하여 파일을 열면된다. 이 지정은 디폴트로 open('파일명') 이면 읽기 모드로 진행된다.
읽기모드인 경우 두 가지 방식으로 그 내용을 읽는다. 먼저 한 줄씩 읽는 방식과 그 파일을 한번에 모두 읽는 방식이 있다.
즉, readline()은 한 줄 씩 읽고 readlines()은 모두 읽기 위한 함수이다. 이를 테스트하기 위해 여러줄의 내용을 가진 파일을 만들어 보자.
with open('test.txt','w') as f:
f.write("""t: 텍스트 모드로 디폴트
b: 바이너리 모드
w: 쓰기모드
r: 읽기모드로 디폴트
a:이어쓰기 모드
+:읽고 쓰기 모드 """ )
f=open('test.txt')
f.readlines()
['t: 텍스트 모드로 디폴트\n',
' b: 바이너리 모드\n',
' w: 쓰기모드\n',
' r: 읽기모드로 디폴트\n',
' a:이어쓰기 모드\n',
' +:읽고 쓰기 모드 ']
realine()은 한 줄씩 읽는다.
f=open('test.txt')
f.readline()
't: 텍스트 모드로 디폴트\n'
f.readline()
' b: 바이너리 모드\n'
f.readline()
' w: 쓰기모드\n'
위 과정에서 readlines()와 readline(), 그리고 for문을 적용하여 보자.
결과를 리스트로 저장하면 한 줄이 리스트의 원소가 되어 추후 데이터의 조작에 유리한 경우가 많다.
f=open('test.txt')
total=f.readlines()
re=[]
for i in total:
re.append(i)
re
['t: 텍스트 모드로 디폴트\n',
' b: 바이너리 모드\n',
' w: 쓰기모드\n',
' r: 읽기모드로 디폴트\n',
' a:이어쓰기 모드\n',
' +:읽고 쓰기 모드 ']
re[0]
't: 텍스트 모드로 디폴트\n'
readline()으로 읽을 경우 이 함수를 연속적으로 적용하여야 하는데 현재 읽는 위치가 어디인지 알려주는 함수가 필요한데 이러한 작용은 tell()함수에 의해 시행되고 파일포인터라고 한다. 이 함수는 1바이트 간격으로 읽는 위치를 알려준다.
영문은 1개의 문자가 1바이트이지만 한글의 경우 1문자가 2바이트이다.
f=open('test.txt')
f.readline()
't: 텍스트 모드로 디폴트\n'
f.tell()
25
또한 seek()함수는 전달된 인수의 위치(파일포인터)로 이동시켜 준다. 이 함수의 시행후에 readline()함수는 전달된 인수의 위치부터 읽는다.
댓글
댓글 쓰기