Shopping Cart

購物車內沒有任何商品。

爬蟲第三步:坐而言不如起而行

因為我們使用的是 Python 去實作這部分,所以如果不確定應該怎麼開始 Python 沒關係,筆者我也是先東抄抄西寫寫,拼拼湊湊把東西做出來後,久了就會漸漸對於正在做的事情有感覺,進而漸漸學習起來的。

如果對於網頁架構不熟悉的朋友,可以先參考看看「第一篇:認識網頁的基本架構」的文章哦!而如果不知道解析出來的網頁怎麼看得朋友,也可以先看看 「 第二篇:解析網頁」。

所以不要怕做錯或是不知道怎麼做,直接動手就是最正確的,讓我們直接開始吧!

立即訂閱電子報,掌握最新資訊!

    稱呼

    電子郵件

    以下非必填,但若您願意分享,我們將能推送更精準的內容給您

    投資經驗

    是否為理工科背景、工程師或有寫程式的經驗?

    有興趣的主題
    量化交易台股期貨海外期貨虛擬貨幣美股

    有興趣的量化交易軟體/平台
    不清楚MultiChartsTradingViewPythonXQ

    想透過量化交易達成甚麼目的?
    不確定自動交易選股回測投資績效量化自己的投資方法想找現成的策略套用

    還有什麼想詢問的?


    第一步:安裝Python Coding環境

    工欲善其事,必先利其器!

    這邊我們使用 Pycharm 來當作 coding 工具哦!

    Py 101209161710
    Py 101209161711

    第二步:認識爬蟲初步套件

    1. Request

    把它想成網路世界的的自己,所有需要跟網路上任何對象互動的動作,基本上都可以藉由這個套件來完成,隨著未來課程越來越深,這工具的使用也會越來越多元哦!

    2. BeautifulSoup

    可以快速解析網頁 HTML 碼,基本上算是特別針對爬蟲所設計的套件,所以功能當然會是以解析網頁內容為主囉!

    第三步:留下自己想要的內容

    將爬蟲爬下來的網站內容,經由 BeautifulSoup 的篩選功能只留下自己想要的部分內容後,藉著python 存成 list 或是甚至轉成 dictionary 後,將其資料去蕪存菁,整理成自己想要的格式就完成第三步囉!

    第四步:儲存自己想要的資料

    最後再將整理好的格式,看是要使用 csv 套件逐行儲存不用管內容,或是用pandas.to_csv 去將整份表格資料依序存進去。

    無論是那種,抓好的資料先存起來,都可以讓未來想要使用時不用重新抓囉!


    加入LINE社群量化交易討論群」無壓力討論與分享!

    加入Discord 「量化交易討論群」即時獲取實用的資源!

    Write Together 101306261122
    Write Together 101306261121
    RoWay
    RoWay

    多年投資經驗的兩岸三地操盤手,曾任海外資產管理公司交易平台的產品經理、與各外商投資公司合作開發各式交易策略與系統。

    擅長用Python執行資料蒐集、整理、分析與交易;也善於用Multicharts、MetaTrader等系統建構並回測期貨、期權、區塊鏈策略進而完成投資組合管理。

    文章: 28

    發佈留言

    發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *