sons dataStory

글

라벨이 regular_expression인 게시물 표시

정규표현식(Regular Expression)

내용 python 주요 메소드와 주요 함수 정규식의 기호 정규식(Regular Expression, RE) python 주요 메소드와 주요 함수 정규식은 특정한 패턴 을 가진 문자열을 표현하기 위한 표현식(expression)으로 특정 규칙의 텍스트를 검색하거나 치환하기 위해 사용합니다. 즉, 여러개의 문자를 표현하거나 패턴을 찾기 위한 특수한 심벌들과 문자들을 이용하는 문자열입니다. 정규표현식은 간단히 정규식 또는 regex 로 나타냅니다. python 라이브러리 re 모듈을 사용합니다. 패턴과 검색할 문자열은 유니코드 문자열과 8 bit 문자열이 될 수 있습니다. 그러나 상호간의 검색과 패턴을 검사할 수 없습니다. 즉, 치환 또는 검색문자(열)와 대상 문자열은 동일한 형이어야 합니다. 모듈 re에서 일치하는 문자열을 찾기 위한 기본적인 메소드들은 다음과 같습니다. 메소드 내용 obj=re.compile(x) 검색할 대상인 x를 정규식 객체로 변환합니다. 즉, 파이썬 인식할 수 있는 개체로 인코딩합니다. obj.search(y) 검색할 대상인 x를 y에서 검색합니다. 최초로 매칭된 결과만을 객체의 인덱스 구간과 문자를 반환 obj.findall(y) 검색할 대상인 x를 y에서 검색합니다. 매칭된 모든 결과를 리스트 형식으로 반환 결과.group() search()등의 메서드를 적용한 결과 중 매칭된 문자만을 반환하기 위해 사용 import re txt="""행복을 추구하는 우리 삶의 많은 부분은 경제적 의사결정과 밀접하게 관련되어 있습니다. 우리는 일상생활에서 의사결정을 계속하지 않을 수 없 습니다. """ trg=re.compile("결정") result=trg.search(txt) result <re.Match object; span=(28, 30), match='결정...

정규식_python

주요 정규식의 기호와 의미 정규식(Regular Expression, RE)는 문자열 등에 대응되는 일련의 문자열, 패턴등을 특정화시킨다. 정규식은 'A', 'a', '0'과 같은 일반적인 문자와 '|', '('와 같은 특정한 문자들을 포함할 수 있다. 문법 설명 . 임의의 한 문자가 존재 ? 바로 앞의 문자가 존재하거나 존재하지 않음 * 바로 앞의 문자가 존재하지 않거나 무한대로 존재 + 바로 앞의 문자가 한번이상 존재 ^ 바로 뒤의 문자로 문자열이 시작 $ 바로 앞의 문자로 문자열이 끝남 {숫자} 숫자만큼 반복 {숫자,} 숫자 이상 만큼 반복 {숫자1, 숫자2} 숫자1 이상, 숫자 2 이하만큼 반복 (문자열) 문자나 문자열을 묶음 [문자1, 문자2, ...] 대괄호 안의 문자들이 존재하는지 검색 [^] '^' 기호 바로 뒤의 문자가 존재하지 않음 [:alpha:] 알파벳만 검색 [:alnum:] 알파벳, 숫자 검색 [:digit:] 숫자만 검색 [:upper:] 대문자만 검색 \ (역슬래시) 글자 자체를 검색 \d 모든 숫자를 검색, [0-9]와 동일 \D 숫자를 제외한 모든 문자를 검색 [^0-9] \s 공백을 검색 \S 공백이 아닌 문자를 검색 \w 숫자 또는 문자를 검색 [a-zA-Z0-9] \W 숫자 또는 문자가 아닌 것을 검색 [ ] 기호는 그 안에 들어 있는 글자중 하나라는 의미 지정된 문자, 패턴을 찾는데는 search(), match() 함수가 사용되는데 search()는 객체의 모든 부분에서 일치하는 부분을 찾지만 match()는 문자열의 시작부분에서만 일치하는 문자, 패턴을 찾는다는 차이가 있다. 이 함수 역시 pytho...

sons dataStory

이 블로그 검색

글

[matplotlib]quiver()함수

정규표현식(Regular Expression)

정규식_python