반응형
이전 포스팅에서 정규 표현식에 대한 글을 다룬적이 있다.
자세한 사항은 아래 참고 포스팅을 확인해보는것을 추천한다.
이번 포스팅에서는 파이선에서 re 를 import하여 정규표현식을 통해서 한글과 특수문자를 지우는 법을 정리할 것이다.
코드는 다음과 같고 코드를 직접 확인.
import re text = "abcd가나다라!@#!@#1234" korean = re.compile('[\u3131-\u3163\uac00-\ud7a3]+') #한글삭제 parseText= re.sub(korean, '', testText) #특수문자 삭제 parseText= re.sub('[-=.#/?:$}]', '', text) |
참고 포스팅
https://thenicesj.tistory.com/334
정규 표현식 정리(Regex)
정규표현식은 사용을 할때마다 검색하는것 같아서 이참에 직접 정리를 해보려고 포스팅을 작성해본다. 정규표현식에서 사용되는 기호를 Meta 문자라고 하는데 표현식에서 내부적으로 특정 의미
thenicesj.tistory.com
반응형
'IT > Python' 카테고리의 다른 글
read_csv() (38) | 2022.11.08 |
---|---|
반복문 역순으로 돌기 (43) | 2022.10.28 |
list 안에서 최소 최대값 (42) | 2022.10.20 |
파이썬에서 문자열 내에서 여러 문자열 찾기 (32) | 2022.10.19 |
sleep() / driver.implicitly_wait() 차이 (44) | 2022.09.29 |
댓글