>source

데이터 프레임이 있습니다. df :

    Rank                                              Name Platform  ...  JP_Sales Other_Sales Global_Sales
0          1                                        Wii Sports      Wii  ...      3.77        8.46        82.74
1          2                                 Super Mario Bros.      NES  ...      6.81        0.77        40.24
2          3                                    Mario Kart Wii      Wii  ...      3.79        3.31        35.82
3          4                                 Wii Sports Resort      Wii  ...      3.28        2.96        33.00
4          5                          Pokemon Red/Pokemon Blue       GB  ...     10.22        1.00        31.37
...      ...                                               ...      ...  ...       ...         ...          ...
16593  16596                Woody Woodpecker in Crazy Castle 5      GBA  ...      0.00        0.00         0.01
16594  16597                     Men in Black II: Alien Escape       GC  ...      0.00        0.00         0.01
16595  16598  SCORE International Baja 1000: The Official Game      PS2  ...      0.00        0.00         0.01
16596  16599                                        Know How 2       DS  ...      0.00        0.00         0.01
16597  16600                                  Spirits &
 Spells      GBA  ...      0.00        0.00         0.01

사용했습니다df.describe.그리고 그 해의 수는 다른 것보다 적음을 보여줍니다.

그래서 나는 몇 년 동안의 일부가 비어 있다고 생각했습니다. 시도했다df.dropna ()그러나 그것은 일이 없었습니다.

i 그런 다음이 code가 아닌 숫자가 아닌 열년의 값을 인쇄하려고 시도했습니다 (아마도 최상의 code는 아니지만 작동하지만 작동합니다).유형():

with open("vgsales.csv", "r") as csv_file:
    rows= csv_file.read().split("\n")
    row_components= [row.split(",") for row in rows if len(row) > 0]
    data_dict= {header:[] for header in row_components[0]}
    for header_index, header in enumerate(row_components[0]):
        print("header_index: ", header_index)
        for row_index, row in enumerate(row_components[1:]):
            data_dict[header].append(row[header_index])
    for i in data_dict["Year"]:
        if not i.isdigit():
            print(i, type(i))

출력 (동일한 출력 반복) :

N/A <class 'str'>

이 질문에 내가이 질문에있는 답변을 시도했습니다.df= df [df.year!= "n /a"]그리고 그것은 일도하지 않았습니다

도 시도했습니다df= df.drop (df [(df.year== "n /a")]. 색인)그것은 일하지 않았다

그래서 나는 왜 내가 Excel에서 그것을 열지 않는 이유를 생각하고 일 년이 아닐 때 어떤 가치가 있는지 보지 못한다고 생각했습니다. 실제로 그것은였습니다n /a

내가 할 수있는 아이디어는 무엇입니까? 나는 모든 열이 기계 학습 프로젝트에 동일한 수를 가지고 있도록 데이터를 청소하고 싶습니다.

  • 이전 nginx : AutoIndex를 강제하고 index.html 파일을 무시할 수 있습니까?
  • 다음 uint8List 이미지 데이터를 imageGallerySaver SaveFile 문자열로 변환합니다