아무거나노트

많은 "파일"의 엑셀 칼럼(열) 헤더 정보 한꺼번에 보기 본문

파이썬

많은 "파일"의 엑셀 칼럼(열) 헤더 정보 한꺼번에 보기

축적의힘 2021. 1. 5. 13:01

한 폴더 안에 유사한 데이터프레임이 있고 해당 데이터프레임의 헤더정보를 한꺼번에 보고 싶은 경우

import glob
import pandas as pd
import os

#폴더에 들어있는 xlsx파일을 리스트 업
files= glob.glob("*.xlsx") 
files

#data라는 리스트형성
data=[]

# 위의 files의 file(변수)에 대하여 file 이름 헤더 정보를 덧붙여 리스트를 만들고 그것을 data라는 리스트에 넣음
# 여기까지 하면 각 파일의 헤더정보가 하나의리스트로 묶여 다시 data라는 리스트로 들어가게됨.
for file in files :
    df =  [os.path.basename(file)] + pd.read_excel(file, encoding = "cp949",sheet_name="시트이름").columns.to_list()
    data.append(df)
data

# 해당 리스트를 표로 만듦
df1 = pd.DataFrame(data)
df1

# 해당 리스트를 저장
df1.to_excel("Header정보확인.excel", encoding='cp949', index=False)

주의.

- 불러오는 파일이 csv인지 xlsx인지 확인할 것.

- encoding 정보 cp949 확인

- 시트가 여러가지 일 경우 해당 시트 이름 확인 할 것. 시트 미지정할 경우 가장 먼저의 시트만 복사됨.