Python 抓台股數據

1.找到公開數據庫:https://www.twse.com.tw/zh/page/trading/exchange/MI_INDEX.html

2.從inspect-network抓request網址:https://www.twse.com.tw/exchangeReport/MI_INDEX?response=json&date=20201105&type=MS&_=1604581411340

3.用.text將檔案轉成文字

4.轉成dataframe

s=’\n’.join(newline) #轉換成可以讀的CSV格式

df = pd.read_csv(StringIO(s))

要轉成dataframe,要確保檔案內的格式是csv檔,在 CSV 檔案中,資料「欄位」是以逗號分隔,軟體程式讀取檔案時,每遇到逗號便會另起新的欄位。文件中的各条记录必须位于不同行,其间以换行符\n分隔

5.整理資料表

不是數值,基本上用不到,將全部轉成數值,不是數值轉成nan

df = df.apply(lambda s: pd.to_numeric(s, errors=’coerce’))

刪除沒有用的欄位

df.dropna(axis=1, how=’all’, inplace=True)

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *