>

df.na().drop() 사이에 의미론에 차이가 있습니까?  그리고 df.filter(df.col("onlyColumnInOneColumnDataFrame").isNotNull() && !df.col("onlyColumnInOneColumnDataFrame").isNaN())  어디 df  아파치 스파크 Dataframe ?

아니면 첫 번째 버그가 나중에 반환되지 않으면 버그로 간주하겠습니다. null  (String null이 아니라 단순히 null  값 onlyColumnInOneColumnDataFrame 에서  두 번째는?

수정 : !isNaN() 추가  게다가. onlyColumnInOneColumnDataFrame  주어진 Dataframe 의 유일한 열입니다 . 유형이 Integer 라고 가정 해 봅시다. .


  • 답변 # 1

    df.na.drop() 와 함께  모든null 또는 NaN 값이 포함 된 행을 삭제합니다.

    df.filter(df.col("onlyColumnInOneColumnDataFrame").isNotNull()) 와 함께  열 onlyColumnInOneColumnDataFrame 에만 null이있는 행을 삭제하십시오. .

    같은 것을 이루고 싶다면 df.na.drop(["onlyColumnInOneColumnDataFrame"]) .

  • 답변 # 2

    답을 받았는지 모르겠습니다. 그러나 이것은 작동해야합니다 :

    df.na.drop(subset=["onlyColumnInOneColumnDataFrame"])
    
    

    또는 심지어 :

    df.na.drop(how = 'any')
    
    

  • 이전 sql - Oracle에서 하나의 결과로 여러 쿼리의 결과
  • 다음 버튼에 ID가없는 경우 Selenium을 사용하여 버튼을 누르거나 클릭하는 방법은 무엇입니까?