홈>
파일 이름이 날짜 인 날짜 스탬프 파일이 많이 있습니다. 각 파일에는 동일한 구조의 레코드 세트가 있으며, 이는
dataframe
에 있습니다.
.
이것들을 하나의
dataframe
로 만들고 싶습니다
파일 이름을 열로 사용합니다.
샘플 코드는 다음과 같습니다.
import pandas as pd
import numpy as np
df1 = pd.DataFrame({
'a': np.random.rand(6),
'b': np.random.choice([4,9,np.nan], 6),
})
df2 = df1*3
df3 = np.sqrt(df2)
df4 = df1*df3
df5 = df2*0.5
df6 = df2*df2
df = pd.DataFrame({
'fname': pd.date_range('1/1/2018', periods=6, freq='D'),
'df': [df1, df2, df3, df4, df5, df6]
})
예상 df 출력은 다음과 같습니다 :
a b fname
0 0.634776 NaN 2018-01-01
1 0.616349 NaN 2018-01-02
2 0.502559 NaN 2018-01-03
3 0.545378 4.0 2018-01-04
4 0.658668 4.0 2018-01-05
5 0.822417 9.0 2018-01-06
0 1.904328 NaN 2018-01-01
1 1.849046 NaN 2018-01-02
2 1.507678 NaN 2018-01-03
3 1.636133 2.0 2018-01-04
4 1.976004 2.0 2018-01-05
5 2.467252 3.0 2018-01-06
...and so on...
- 답변 # 1
- 답변 # 2
데이터 프레임을 모으려면
pd.Concat
를 사용해야한다고 생각합니다 : https : //pandas.pydata.org/pandas-docs/stable/generated/pandas.concat.html데이터를 읽을 때 어떤 코드를 사용합니까? 이것이 이와 같은 경우
file_name = os.listdir(path) file_name = [file_name for file_name in glob.glob('* *')] df = pd.DataFrame() dfs = [] for file_name in file_name: data = pd.read_csv(file_name, 'Sheet1') data['DateTime'] = pd.to_datetime(file_name[:10]) dfs.append(data) df = pd.concat(dfs, ignore_index=True)
file_name [: 10]은 문자 수를 기준으로 파일에서 날짜를 가져옵니다
관련 자료
- r - 열 이름이 다른 dbWriteTable 일 때 SQLite 테이블에 데이터 프레임을 삽입 할 수 없습니다
- python - pandas 데이터 프레임 열을 정규식으로 2로 분할
- regex - 스파크 데이터 프레임 열을 \가 아닌에서 분할합니다
- python - 데이터 프레임의 한 열에서 정보를 추출하고 오른쪽 열에 삽입하는 방법
- python - 하나의 데이터 프레임 열을 여러 열로 분할하는 방법
- python - 다중 인덱스 데이터 프레임에서 인덱스 열을 제거하는 방법
- python 3.x - 데이터 프레임에 누락 된 행 삽입
- python - 열의 데이터 프레임에 둘 이상의 값이있는 경우 여러 행 생성
- python - 사전 목록 인 데이터 프레임 열에서 각 중첩 키를 새 열로 갖는 쉼표로 값을 조인하는 방법은 무엇입니까?
- pandas - 다중 인덱스 데이터 프레임 분할 및 스택
- sql server - python 및 sql - dataframe의 빈 문자열을 sql의 "null"값으로 대체하여 형식 오류없이 데이터베이스에 데이터를 삽입합니다
- bash - 열의 일부를 기준으로 CSV 파일 분할
- list - 열 이름을 하드 코딩하지 않고 pyspark 데이터 프레임에서 열의 고유 값을 얻는 방법은 무엇입니까?
- sql - 데이터 프레임의 datetime 열에 대해 둘 이상의 범주에 대한 시간을 계산하는 방법
- python - 팬더 열을 n 길이의 청크로 분할하는 방법은 무엇입니까?
- apache spark sql - sql - b 열에 누락 된 각 고유 요소의 a 열에있는 각 고유 요소에 대해 값이 0 인 행을 삽입합니다
- java - 미리 채워진 sqlite 데이터베이스에 정보의 단일 열을 삽입하는 방법
- python - 다른 열의 숨겨진 값으로 Pandas 데이터 프레임에 새 열을 추가 하시겠습니까?
- sql server - C #을 사용하는 "테이블의 ID 열에 대한 명시 적 값을 삽입 할 수 없습니다"오류
- python - DataFrame Pandas를 전치하고 새 열 추가
관련 질문
- python : matplotlib 그림을 사용하여 동일한 신호에 여러 시작 및 끝 세그먼트 플로팅
- python : Dataframe의 문자열에서 원하지 않는 부분 제거
- python : 데이터 프레임의 for 루프에서 유클리드 거리 개발
- python : pandas Dataframe을 자동으로 생성하는 기능
- python : 사전을 사용하여 토큰화된 판다 시리즈에서 정확한 용어 찾기/바꾸기
- Python DataFrame에 Excel 파일 추가
- python : 팬더의 동일한 Excel 시트에서 2개의 열 비교
- python : 어떻게 하면 사전을 엑셀로 추출할 수 있나요?
- python : 두 번째 데이터 프레임을 데이터로 사용하여 총 열을 얻기 위해 데이터 프레임을 반복하는 것을 피하십시오.
- python : 다른 데이터 프레임의 데이터를 사용하여 데이터 프레임의 열에 대한 계산 수행
dict
를 만드는 것이 더 좋다고 생각합니다 이므로concat
를 사용할 수 있습니다 :또는
concat
에 DataFrames 전달 목록 매개 변수keys
: