홈>
df로 작업하고 numpy를 사용하여 공백 (또는``) 설정을 포함하여 데이터를 NaN으로 변환합니다. 그러나 df를 csv에 쓸 때 출력에는 NULL이 아닌 'nan'문자열이 포함됩니다.
둘러 보았지만 실행 가능한 솔루션을 찾을 수 없습니다. 기본적인 문제는 다음과 같습니다.
df
index x y z
0 1 NaN 2
1 NaN 3 4
CSV 출력 :
index x y z
0 1 nan 2
1 nan 3 4
'nan'을 NULL로 설정하기 위해 몇 가지 시도를했지만 csv 출력은 NULL이 아닌 'blank'가됩니다.
dfDemographics = dfDemographics.replace('nan', np.NaN)
dfDemographics.replace(r'\s+( +\.)|#', np.nan, regex=True).replace('',
np.nan)
dfDemographics = dfDemographics.replace('nan', '') # of course, this wouldn't work, but tried it anyway.
도움을 주시면 감사하겠습니다.
-
답변 # 1
-
답변 # 2
df.replace를 사용하면 도움이 될 수 있습니다-
df = df.replace(np.nan, '', regex=True) df.to_csv("df.csv", index=False)
(이것은 모든 null 값을 ''즉 빈 문자열로 설정합니다.)
-
답변 # 3
@coldspeed 사용자는 pd.DataFrame을 저장할 때 nan 값을 NULL로 바꾸는 방법을 보여줍니다. 데이터 분석을 위해 pd.DataFrame의 "NULL"값을 np.NaN 값으로 바꾸려는 경우 다음 코드가 수행됩니다.
import numpy as np, pandas as pd # replace NULL values with np.nan colNames = mydf.columns.tolist() dfVals = mydf.values matSyb = mydf.isnull().values dfVals[matSyb] = np.NAN mydf = pd.DataFrame(dfVals, columns=colNames) #np.nansum(mydf.values, axis=0 ) #np.nansum(dfVals, axis=0 )
관련 자료
- python pandas - 그룹화 된 값 x의 처음 n 개 행 합계
- python - Pandas에서 증가하는 값으로 누락 된 값 채우기
- python - 목록 및 필터의 Pandas groupby 열 값
- python - Pandas 데이터 프레임의 각 행을 복제하고 목록을 기반으로 일부 열의 값을 변경합니다
- Pandas Dataframe - pandas 데이터 프레임 - 열 값을 기준으로 그룹화하고 다른 열의 값을 조회합니다
- python - 판다 - 새 열 데이터를 기반으로 열 값을 찾는 방법
- python - Pandas에서 idxmax로 중복 값 유지
- python 3.x - pandas df에서 삭제하지 않고 하나의 열을 제외하고 pandas의 열 값을 바꿉니다
- python - 수정되는 유일한 시간이 append ()를 통하기 때문에이 목록이 모든 값을 변경하는 이유는 무엇입니까?
- python - 모든 행 값 양수, 한 행 값 음수, 두 행 값 음수… 및 모든 행 값 음수를 기준으로 Pandas 데이터 프레임을 정렬하는 방법,
- python 3.x - Pandas datetime 열의 값 사이의 중간 점을 찾고 중간 점을 기반으로 시작 및 종료 기간 열 만들기
- python - 동적으로 생성 된 폴더에 팬더 데이터 프레임 저장
- python - 숫자를 Pandas 열의 True 값으로 변환
- python - 목록의 값을 사용하여 팬더 열 채우기
- python - 두 열의 값이 서로 가까운 지 판다로 확인
- dataframe - pandas DF의 모든 날을 하나씩 변경
- Pandas를 사용하여 Python에서 문자별로 행 값을 정렬하는 방법
- Pandas 데이터 프레임에서 누락 된 값 수정
- python 3.x - Pandas는 개수가있는 결 측값이있는 열을 분포로 변환합니다
- javascript - Mongoose에서 순간 형식 저장
관련 질문
- python - 데이터의 두 변수에서 특정 정보 시각화
- python - csv 파일에 완전한 데이터를 쓰는 방법
- python - 여러 구분 기호가 포함 된 텍스트 파일을 CSV로 변환
- python - ioerror - 파일 이동 후 [errno 2]
- python - 더 큰 파일의 여러 csv 파일을 코드로 여는 방법은 무엇입니까?
- python - 피클 데이터가로드되지 않음
- python - Pandas Groupby의 겹치지 않는 롤링 창
- python - Pandas에서 for 루프 병렬화
- python - Pandas에서 특정 열의 빈 값을 특정 값으로 바꾸는 방법은 무엇입니까?
- pandas - raise ValueError python을 사용하여 두 개의 datetime 형식 허용
구조에 대한 팬더,
na_rep
사용 NaN에 대한 자신의 표현을 고치기 위해.file.csv