정규표현식을 사용해서 re.search 를 이용했는데 간혹 re.search 에서 TypeError: expected string or bytes-like object 라고 뜨면서 돌아가지 않을 때가 있다.
에러 메세지를 잘 보면, string 이나 bytes 형태의 input이 들어와야 한다는데, 그렇지 않은 것이다.
데이터를 다시 보니 NaN이 꽤 있는 데이터였다.
즉, 정규표현식으로 함수를 쓰기 전에 NA/NaN을 미리 처리해줘야한다는 얘기다.
pandas를 쓴다면, DataFrame.fillna 를 사용해 처리한 후 re.search 를 사용해보자.
'Computer > Python' 카테고리의 다른 글
Anaconda 에서 KoNLPy 설치하기 (1) | 2019.01.04 |
---|---|
[Python/Pandas] loc 과 iloc 은 다르게 반응한다? (0) | 2018.12.12 |
[sklearn] fetch_mldata 는 이제 그만. openml로 갈아타요 (0) | 2018.12.04 |